klasifikasi citra aksara jawa menggunakan metode
TRANSCRIPT
KLASIFIKASI CITRA AKSARA JAWA MENGGUNAKAN METODE
MODIFIED K-NEAREST NEIGHBOR
TUGAS AKHIR
Diajukan Untuk Memenuhi Salah Satu Syarat
Memperoleh Gelar Sarjana Komputer
Program Studi Informatika
Oleh :
Atanasius Ivannoel Rio Aji
175314060
Program Studi Informatika
Fakultas Sains dan Teknologi
Universitas Sanata Dharma
Yogyakarta
2021
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
ii
CLASSIFICATION OF JAVANESE CHARACTERS
USING THE MKNN METHOD
THESIS
Present as Partial Fulfillment of The Requirements
to Obtain Sarjana Komputer Degree
in Informatics Study Program
Created By :
Atanasius Ivannoel Rio Aji
175314060
INFORMATICS STUDY PROGRAM
INFORMATICS DEPARTMENT
FACULTY OF SCIENCE OF TECHNOLOGY
SANATA DHARMA UNIVERSITY
YOGYAKARTA
2021
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
iii
HALAMAN PERSETUJUAN PEMBIMBING
SKRIPSI
KLASIFIKASI CITRA AKSARA JAWA MENGGUNAKAN
METODE MODIFIED K-NEAREST NEIGHBOR
Oleh :
Atanasius Ivannoel Rio Aji
175314060
Telah Disetuji oleh :
Pembimbing
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
iv
HALAMAN PENGESAHAN
TUGAS AKHIR
KLASIFIKASI CITRA AKSARA JAWA MENGGUNAKAN METODE
MODIFIED K-NEAREST NEIGHBOR
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
v
HALAMAN PERSEMBAHAN
“Keberhasilan saya merupakan buah dari doa yang selalu dilambungkan oleh kedua
orang hebat dalam hidup saya yaitu orang tua. Perjuangan saya pada titik ini
merupakan ungkapan terimakasih yang sebesar – besarnya kepada orang tua yang
selalu mendoakan dan mendukung apa yang saya lakukan, terimakasih bapak dan
ibu”
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
vi
PERNYATAAN KEASLIAN KARYA
Saya menyatakan dengan sesungguhnya bahwa tugas akhir yang saya tulis tidak
mengandung atau memuat karya orang lain, kecuali yang telah disebutkan dalam
daftar pustaka dan kutipan selayaknya karya ilmiah.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
vii
LEMBAR PERNYATAAN PERSETUJUAN PUBLIKASI KARYA ILMIAH
Yang bertanda tangan dibawah ini, saya mahasiswa Universitas Sanata Dharma:
Nama : Atanasius Ivannoel Rio Aji
NIM : 175314060
Demi pengembangan ilmu pengetahuan, saya memberikan kepada perpustakan
Universitas Sanata Dharma karya ilmiah yang berjudul:
KLASIFIKASI CITRA AKSARA JAWA MENGGUNAKAN METODE
MODIFIED K-NEAREST NEIGHBOR
Dengan demikian saya memberikan kepada perpustakaan Universitas Sanata Dharma
hak untuk menyimpan, mengalihkan dalam bentuk media lain, mengelolanya dalam
bentuk pangkalan data mendistribusikan secara terbatas, dan mempublikasikannya di
internet atau media lain untuk kepentingan akademis tanpa perlu meminta ijin dari saya
maupun memberikan royalty kepada saya selama tetap mencantumkan nama saya
sebagai penulis.
Demikian pernyataan ini saya buat dengan sebenarnya.
Dibuat di Yogyakarta,
Pada tanggal: 14 Juli 2021
Yang menyatakan,
Atanasius Ivannoel Rio Aji
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
viii
ABSTRAK
Aksara Jawa merupakan salah satu ragam budaya Indonesia yang saat ini
masih dikenal oleh banyak orang. Dibeberapa daerah , aksara Jawa masih digunakan
pada fasilitas umum, seperti papan nama jalan di sudut-sudut Kota Yogyakarta.
Namun, meski aksara Jawa dikenal oleh banyak orang, masih ada beberapa orang
yang tidak mengetahui arti atau cara membaca aksara Jawa. Peran teknologi sangat
dibutuhkan dalam pengenalan Aksara Jawa, yaitu dengan menggunakan klasifikasi
Modified K-Nearest Neighbor dalam klasifikasi aksara Jawa.
Metode ini merupakan perkembangan dari metode K-Nearest Neighbor,
dimana terdapat dua tambahan proses yaitu menghitung nilai Validitas dan
menghitung Wieght Voting. Evaluasi pada metode Modified K-Nearest Neighbor
menggunakan metode Cross Validation. Selain itu juga menggunakan variasi nilai
K pada Modified K-Nearest Neighbor, variasi ukuran Ekstraksi Ciri IoC, dan variasi
pada nilai K-Fold dalam Cross Validation. Dari penelitian ini didapatkan akurasi
terbaik sebesar 75,37% dengan mengguanakan nilai K-Fold 7.
Kata Kunci : Modified K-Nearest Neighbor, Klasifikasi, Aksara Jawa, Cross
Validation, Intensity of Character.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
ix
ABSTRACT
Javanese script is one of the various Indonesian cultures that is still known
by many people. In some areas, Javanese script is still used in public facilities,
such as street signboards in the corners of the city of Yogyakarta. However,
although Javanese script is known by many people, there are still some people who
do not know the meaning or how to read Javanese script. The role of technology
is needed in the introduction of Javanese script, namely by using the Modified K-
Nearest Neighbor classification in the classification of Javanese characters.
This method is a development of the K-Nearest Neighbor method, where
there are two additional processes, namely calculating the Validity value and
calculating the Wieght Voting. Evaluation of the Modified K-Nearest Neighbor
method using the Cross Validation method. In addition, it also uses variations in
the value of K in the Modified K-Nearest Neighbor, variations in the size of IoC
Feature Extraction, and variations in the value of K-Fold in Cross Validation. From
this study, the best accuracy was obtained at 75.37% by using the K-Fold 7 value.
Keywords: Modified K-Nearest Neighbor, Classification, Javanese Script, Cross
Validation, Intensity of Character.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
x
KATA PENGANTAR
Puji syukur penulis panjatkan kepada Tuhan Yang Maha Esa, atas berkat serta
rahmat karunianya penulis dapat menyelesaikan tugas akhir dengan judul “Klasifikasi
Citra Aksara Jawa Menggunakan Metode Modified K-Nearest Neighbor”. Tugas Akhir
ini merupakan syarat wajib untuk penulis agar mendapatkan gelar sarjana computer
program studi Informatika Universitas Sanata Dharma.
Penyelesaian tugas akhir ini tidak lepas dari dukungan oleh beberapa pihak
kepada penulis, oleh karena itu sudah layak dan sepantasnya penulis mengucapkan
terimakasih kepada :
1. Ibu Dr. Anastasia Rita Widiarti, M.kom. selakuk dosen pembimbing dalam
penyelesain tugas akhir yang selalu meluangkan waktunya untuk
memberikan semangat kepada penulis dalam mengerjakan tugas akhir serta
memberikan saran dan masukan dalam penyelesain tugas akhir penulis.
2. Bapak Sudi Mungkasi , S.Si., M.Math.Sc., Ph.D. selakuk dekan Fakultas
Sains dan Teknologi Universitas Sanata Dharma.
3. Seluruh dosen prodi Informatika Universitas Sanata Dharma serta dosen –
dosen yang terlibat dalam perkuliahan dengan mahasiswa prodi Informatika
Angkatan 2017 yang telah mendidik serta memberikan bekal ilmu untuk
penulis.
4. Kedua orang tua saya, Bapak Suyatno dan Ibu Sekolastika Ely Fajar Arianti
yang selalu mendukung serta selalu mendoakan penulis hingga penulis
dapat menyelesaikan Tugas Akhir dengan tepat waktu.
5. Kedua saudara saya, Kakak RD. Robertus Theo Elno Respati dan Adik
Veronika Ivannalia Aninda Putri yang selalu memberikan semangat dalam
proses penulis mengerjakan tugas akhir.
6. Saudari Bernadeta Rima Wulandari yang selalu menemani dalam
pengerjaan tugas akhir dan selalu memberi semangat dalam penyelesaian
tugas akhir penulis.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
xi
7. Saudari Katharina Anggun yang selalu memberi saran masukan serta
mendegarkan keluh kesan penulis dalam pengerjaan tugas akhir.
8. Saudara Gabriel Ryan Prima, Joseph Hutagalung, Edrick Hernando, Agung
Krisnanto, dan Fransiska Apri Wulandari yang telah bersedia meluangkan
waktunya untuk berdiskusi tentang berbagai masalah dalam pengerjaan
tugas akhir penulis.
9. Teman – teman kluster Mesin Cerdas , “Jos Plo”, dan Campus Ministry
yang selalu memberikan hiburan dan dorongan agar segera menyelesaikan
tugas akhir.
10. Semua pihak yang tidak bisa disebutkan satu – satu yang telah membantu
atau terlibat dalam penulisan tugas akhir ini.
Penulis menyadari bahwa masih banyak kekurangan dalam tugas akhir ini, oleh
karena itu saran serta kritik yang membangun sangat penulis harapkan.
Akhirnya, semoga tugas akhir ini dapat bermanfaat bagi para pembaca dan
terkhusus kepada saya sebagai penulis.
Yogyakarta, 14 Juli 2021
Penulis
Atanasius Ivannoel Rio Aji
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
xii
DAFTAR ISI
HALAMAN PERSEMBAHAN ................................................................................... v
PERNYATAAN KEASLIAN KARYA ...................................................................... vi
LEMBAR PERNYATAAN PERSETUJUAN PUBLIKASI KARYA ILMIAH ....... vii
ABSTRAK ................................................................................................................. viii
ABSTRACT ................................................................................................................. ix
KATA PENGANTAR .................................................................................................. x
DAFTAR ISI ............................................................................................................... xii
DAFTAR TABEL ...................................................................................................... xiv
DAFTAR GAMBAR .................................................................................................. xv
BAB I PENDAHULUAN ........................................................................................... 16
Latar Belakang ............................................................................................. 16
Rumusan Masalah ........................................................................................ 18
Tujuan ........................................................................................................... 18
Manfaat Penelitian ........................................................................................ 18
Batasan Masalah ........................................................................................... 18
Sistematika Penulisan ................................................................................... 19
BAB 2 LANDASAN TEORI ...................................................................................... 21
Aksara Jawa .................................................................................................. 21
Pengertian Citra ............................................................................................ 21
Pemrosesan Citra Digital .............................................................................. 21
Preprocessing ................................................................................................ 22
Binarisasi Citra ...................................................................................... 22
Rotasi Citra ........................................................................................... 22
Penipisan Citra ...................................................................................... 22
Resize Citra ........................................................................................... 23
Ekstraksi Ciri ................................................................................................ 23
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
xiii
Modified K-Nearest Neighbor ...................................................................... 24
Perhitungan Jarak Euclidean ................................................................. 24
Perhitungan Nilai Validitas ................................................................... 25
Perhitungan Weighted Voting ............................................................... 27
Evaluasi ........................................................................................................ 29
Cross Validation .................................................................................... 29
BAB 3 METODOLOGI PENELITIAN ..................................................................... 30
Cara Mendapatkan Data ............................................................................... 30
Kebutuhan perangkat Hardware dan Software ............................................ 31
Validitas Data ............................................................................................... 32
Pemodelan Klasifikasi .................................................................................. 33
Preprocessing ........................................................................................ 34
Ekstraksi Ciri ......................................................................................... 36
Klasifikasi ............................................................................................. 37
Cara Analisis Data ........................................................................................ 45
Desain User Interface ................................................................................... 46
Input Tampilan ...................................................................................... 46
Output Tampilan ................................................................................... 46
BAB 4 HASIL PENELITIAN DAN ANALISIS ....................................................... 47
Peprocessing ................................................................................................. 47
Binerisasi ............................................................................................... 47
Rotasi Citra ........................................................................................... 47
Cropping ................................................................................................ 48
Resize Citra ........................................................................................... 49
Thinning ................................................................................................ 50
Ekstraksi Ciri dan Pembagian data ............................................................... 51
Pengujian dan Evaluasi ................................................................................ 53
Hasil pengujian dengan 3 fold Cross Validation .................................. 53
Hasil pengujian dengan 5 fold Cross Validation .................................. 54
Hasil pengujian dengan 7 fold Cross Validation .................................. 56
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
xiv
Data Uji Tunggal ................................................................................... 57
Perbandingan Hasil Akurasi ......................................................................... 60
Merubah Preprocessing dan Ekstraksi Ciri ........................................... 60
Hasil perbandingan dengan merubah nilai a ................................................ 61
Hasil Perbandingan dengan KNN ................................................................ 62
Pembahasan .................................................................................................. 62
BAB 5 PENUTUP ...................................................................................................... 64
Kesimpulan ................................................................................................... 64
Saran ............................................................................................................. 64
DAFTAR PUSTAKA ................................................................................................. 66
LAMPIRAN ................................................................................................................ 67
DAFTAR TABEL
Tabel 3. 1 Data Aksara Jawa ....................................................................................... 30
Tabel 3. 2 Hasil Ekstraksi Ciri .................................................................................... 37
Tabel 3. 3 Tabel Data Latih Data Citra ....................................................................... 39
Tabel 3. 4 Tabel Data Uji Data Citra .......................................................................... 39
Tabel 3. 5 Hasil Perthitungan Jarak Euclidean data Citra ........................................... 41
Tabel 3. 6 Hasil Nilai Validitas data latih ................................................................... 43
Tabel 3. 7 Hasil Eucliean data uji citra ....................................................................... 44
Tabel 3. 8 Hasil Weight Voting .................................................................................. 44
Tabel 3. 9 Hasil Penentuan Tetangga .......................................................................... 45 Tabel 4. 1 Kelas Aksara Jawa ..................................................................................... 51
Tabel 4. 2 Hasil Pengujian 3 fold ................................................................................ 53
Tabel 4. 3 Hasil pengujian 5 fold ................................................................................ 54
Tabel 4. 4 Hasil pengujian 7 fold ................................................................................ 56
Tabel 4. 5 Tabel Data Uji ............................................................................................ 57
Tabel 4. 6 Tabel Hasil Uji Tunggal ............................................................................. 59
Tabel 4. 7 Tabel Hasil Perbandingan Akurasi ............................................................ 60
Tabel 4. 8 Hasil Perbandingan Nilai a ........................................................................ 61
Tabel 4. 9 Hasil Perbandingan MKNN dan KNN....................................................... 62
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
xv
DAFTAR GAMBAR
Gambar 2. 1 3 Fold Cross Validation ......................................................................... 29
Gambar 3. 1 Salah Satu Sampel Data Aksara ............................................................. 31
Gambar 3. 2 Gambar Aksara Jawa .............................................................................. 32
Gambar 3. 3 Folder Kelas Citra Aksara Na ................................................................ 33
Gambar 3. 4 Pemodelan Klasifikasi Metode Modified K-Nearest Neighbor ............. 34
Gambar 3. 5 Desain alat uji Preprocessing ................................................................. 34
Gambar 3. 6 Alur MKNN ........................................................................................... 38
Gambar 4. 1 Hasil Binerisasi ...................................................................................... 47
Gambar 4. 2 Hasil Rotasi Citra ................................................................................... 48
Gambar 4. 3 Hasil Cropping ....................................................................................... 49
Gambar 4. 4 Hasil Resize ............................................................................................ 50
Gambar 4. 5 Hasil penipisan citra ............................................................................... 51
Gambar 4. 6 Pembagian data latih dengan 3 fold ....................................................... 52
Gambar 4. 7 Hasil pembagian data uji dengan 3 fold ................................................. 52
Gambar 4. 8 Grafik Akurasi 3 fold. ............................................................................ 54
Gambar 4. 9 Grafik Akurasi 5 fold. ............................................................................ 55
Gambar 4. 10 Grafik Akurasi 7 fold ........................................................................... 56
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
BAB I PENDAHULUAN
Latar Belakang
Indonesia terkenal dengan ragam budayanya, salah satunya adalah aksara. Hampir
seluruh suku di Indonesia memiliki aksaranya masing – masing. Salah satu aksara yang
cukup dikenal oleh banyak orang adalah Aksara Jawa. Aksara Jawa merupakan aksara
yang dimiliki oleh Suku Jawa. Aksara Jawa juga dikenal dengan sebutan Hanacaraka.
Pada aksara Jawa terdapat 20 aksara dasar, antara lain : Ha, Na, Ca, Ra, Ka, Da, Ta,
Sa, Wa, La, Pa, Dha, Ja, Nya, Ma, Ga, Ba, Tha, Nga.
Selain aksara dasar, aksara Jawa juga terdiri dari beberapa aksara lain , seperti
: Aksara Carakan, Aksara Pasangan, Aksara Swara, Aksara Rekan, Aksara Murda,
Aksara Wilangan, dan Sandangan. Setiap aksara tersebut memiliki fungsi tersendiri
dalam penyusunan sebuah kalimat dalam bentuk Aksara Jawa.
Aksara Jawa saat ini masih digunakan di beberapa daerah yang masih memegang
erat Budaya Jawa seperti Yogyakarta dan Solo. Di Yogyakarta, aksara Jawa dapat
dijumpai pada papan – papan nama jalan yang ada di Kota Yogyakarta. Selepas dari
penggunaannya pada fasilitas umum, aksara Jawa sendiri pada jaman dulu digunakan
pula untuk menulis perihal sistem pemerintahan jaman dahulu, sehingga saat ini masih
digunakan oleh kalangan tertentu seperti kalangan Kraton Yogyakarta. Biasanya,
aksara Jawa disimpan di museum – museum sebagai bentuk kekayaan budaya
nusantara, dan masih sedikit orang yang tau arti atau terjemahan dari setiap aksara
Jawa.
Oleh karena itu, peran teknologi sangat dibutuhkan dalam pengenalan aksara Jawa
dengan menggunakan metode klasifikasi. Pada penelitian tentang klasifikasi aksara
Jawa, penulis menggunakan metode klasifikasi Modified K-Nearest Neighbor
(MKNN). Metode MKNN merupakan metode klasifikasi pengembangan dari metode
K-Nearest Neighbor (KNN). Terdapat dua proses yang ditambahkan dalam metode
KNN sehingga menjadi MKNN yaitu perhitungan nilai validitas dan Weight Voting.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
17
Penelitian terkait klasifikasi aksara Jawa sebelumnya sudah dilakukan oleh
Widiarti (2020) dengan menggunakan metode KNN dengan hasil rata – rata akurasi
bernilai 50% - 60%. Unjuk kerja dari metode MKNN sudah dilakukan oleh Ravi, dkk
(2019) telah melakukan perbandingan hasil akurasi dari metode MKNN dan KNN
dalam penelitian Implementasi Algoritme Modified K-Nearest Neighbor (MKNN)
Untuk Mengidentifikasi Penyakit Gigi Dan Mulut yang dimana hasil akurasi tertinggi
didapatkan dari metode MKNN dengan nilai sebesar 86,6% dan 76,66%. Pada
penelitian lain, Wafiyah, dkk (2017) juga mendapatkan akurasi sebesar 88,55% dalam
Implementasi Algoritma Modified K-Nearest Neighbor (MKNN) untuk Klasifikasi
Penyakit Demam. Bela, dkk (2017) pada penelitian Diagnosis Penyakit Kulit Pada
Kucing Menggunakan Metode Modified K- Nearest Neighbor juga mendapatkan hasil
akurasi terendah yang cukup baik yaitu sebesar 89.668%. Berdasarkan hasil akurasi
dari beberapa penelitian tentan metode MKNN tersebut, penulis ingin
mengimplementasikan metode tersebut pada kasus klasifikasi aksara Jawa.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
18
Rumusan Masalah
1. Bagaimana mengimplementasikan metode klasifikasi Modified K-Nearest
Neighbor untuk sistem klasifikasi aksara Jawa?
2. Berapa besar tingkat akurasi metode klasifikasi Modified K-Nearest Neighbor
dalam proses klasifikasi aksara Jawa?
Tujuan
1. Mengimplementasi metode klasifikasi Modified K-Nearest Neighbor untuk
sistem klasifikasi aksara Jawa.
2. Mengetahui akurasi dari metode klasifikasi Modified K-Nearest Neighbor pada
proses klasifikasi aksara Jawa.
Manfaat Penelitian
1. Bagi peneliti, menambah pengetahuan peneliti tentang bagaimana penerapan
metode klasifikasi Modified K-Nearest Neigbor untuk sistem klasifikasi aksara
Jawa.
2. Bagi pihak – pihak yang bergerak pada pengembangan sistem klasifikasi atau
pengenalan aksara Jawa. Penelitian ini memberikan pandangan akan sebuah
metode yang dapat dipergunakan dalam membangun sebuah sistem klasifikasi
aksara Jawa.
Batasan Masalah
1. Data yang digunakan adalah citra dengan jumlah data 2.144 aksara.
2. Nilai k yang digunakan adalah K=1, K=3, K=5, K=7, K=9.
3. Nilai K-fold yang digunakan adalah K-fold=3, K-fold=5 , K-fold = 7.
4. Ekstraksi Ciri yang digunakan adalah metode IoC.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
19
Sistematika Penulisan
BAB I : PENDAHULUAN
Pada bab ini berisikan tentang latar belakang penelitian, rumusan
masalah penelitian, tujuan masalah penelitian, batasan masalah
penelitian dan sistematika penulisan.
BAB 2 : LANDASAN TEORI
Pada bab ini berisikan tentang teori – teori yang digunakan peneliti yang
memiliki keterkaitan dengan penelitian yang dilakukan penulis. Seperti
pengertian proses – proses pengolahan citra yang digunakan dari
preprocessing hingga ekstraksi ciri, teori dasar dari metode Modified K-
Nearest Neighbor, hingga teori pengujian yang menggunakan K-fold
Cross Validation.
BAB 3 : METODOLOGI PENELITIAN
Pada bab ini berisikan penguraian dari metodologi penelitian yang
digunakan. Dari sumber data yang berasal dari mana hingga bagaimana
data tersebut diolah agar dapat diproses pada metode klasifikasi. Serta
terdapat contoh perhitungan manual dari metode klasifikasi MKNN
dengan data citra itu sendiri.
BAB 4 : HASIL PENELITIAN DAN ANALISIS
Pada bab ini berisikan penerapan sistem yang telah dirancang. Selain itu
menampilkan hasil pengujian dari beberapa metode pengujian yang
telah dirancang. Serta memberikan analisis dari hasil penelitian yang
sudah didapat.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
20
BAB 5 : PENUTUP
Pada bab ini berisikan kesimpulan yang didapat dari penelitian dan
saran yang diberikan penulis agar penelitian ini dapat dikembangkan
lagi.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
BAB 2 LANDASAN TEORI
Pada bab ini akan dipaparkan teori – teori yang digunakan dalam penelitian
ini. Mulai dari pengertian aksara jawa , pengertian citra, teori – teori pemrosesan citra
dari tahap pengolahan citra hingga ekstraksi ciri serta teori yang digunakan dalam
tahap klasifikasi MKNN itu sendiri.
Aksara Jawa
Aksara Jawa merupakan salah satu kekayaan Budaya Nusantara yang lahir dan
berkembang di Pulau Jawa. Aksara Jawa juga dikenal dengan Hanacaraka, Carakan,
atau Dentawyanjana (Wikipedia, 2020). Aksara ini memiliki 20 aksara dasar yaitu Ha,
Na, Ca, Ra, Ka, Da, Ta, Sa, Wa, La, Pa ,Dha, Ja, Ya, Nya, Ma, Ga, Ba, Tha, Nga.
Aksara ini pada jaman dulu aktif digunakan oleh masyarakat secara luas untuk tulisan
sehari - hari maupun sastra.
Pengertian Citra
Citra atau yang sering dikenal dengan gambar merupakan sebuah komponen
multimedia yang memberikan informasi dalam bentuk visual. Dalam matematis , citra
dinyatakan sebagai 0 < f (x,y) < karena citra merupakan fungsi kontinu dari intensitas
bidang dua dimensi (2D). Dalam dunia digital , citra didefinisikan sebagai citra f(x,y)
dengan nilai dalam koordinat bidang merupakan nilai diskrit. Citra digital tersusun dari
kumpulan titik atau elemen - elemen gambar yang disebut dengan piksel(picture
element) (Gonzalez, R.C. & Woods, R.E., 1992).
Pemrosesan Citra Digital
Pemrosesan Citra Digital atau Pengolahan Citra Digital merupakan suatu
pengolahan terhadap sebuah citra dengan menggunakan komputer. Pemrosesan Citra
dilakukan untuk memperbaiki sebuah citra agar mudah dimengerti atau diinterpretasi
oleh manusia atau mesin. Dasar dari pemrosesan citra adalah memodifikasi setiap titik
atau piksel pada citra sesuai dengan kebutuhan (Gonzalez, R.C. & Woods, R.E., 1992).
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
22
Preprocessing
Preprocessing adalah proses mempersiapkan data untuk bisa diolah sesuai
kebutuhan. Proses ini diperlukan karena tidak semua data yang disiapkan sudah bisa
digunakan sesuai kebutuhan.
Binarisasi Citra
Binarisasi merupakan tahap pengolahan pada tingkat piksel dimana terjadi
proses pemisahan antara objek pada citra dengan latar belakang yang tidak dibutuhkan.
Proses ini secara otomatis menentukan nilai ambang threshold yang berfungsi untuk
membagi citra menjadi dua bagian. Dua bagian tersebut adalah kelompok obyek dan
kelompok latar.
Rotasi Citra
Rotasi Citra merupakan proses untuk mengkoreksi kemiringan dari sebuah
citra. Sebuah citra yang akan dikoreksi kemiringannya akan dideteksi terlebih dahulu
tingkat kemiringannya (skew-detection). Proses deteksi kemiringan (skew-detection)
merupakan salah satu proses pengolahan citra untuk mendeteksi sudut kemiringan dari
suatu citra dokumen masukan sehingga dokumen tersebut dapat diperbaiki
kemiringannya berdasarkan sudut kemiringan yang didapatkan. Salah satu metode
dalam mendeteksi sudut kemiringan sebuah citra adalah metode pendekatan momen.
Pendekatan momen adalah pendekatan di mana untuk mengetahui seberapa besar
penyimpangan orientasi suatu obyek dengan sumbu utama dilakukan dengan
mempergunakan orientasi momen. Apabila besar sudut kemiringan (𝜃) citra dokumen
teks masukan sudah diperoleh, maka langkah selanjutnya adalah rotasi citra dengan
sudut rotasi sama dengan sudut (𝜃) (Widiarti & Himamunanto, 2013).
Penipisan Citra
Penipisan citra atau thinning merupakan proses reduksi sebuah citra menjadi
garis yang kira - kira merupakan garis tengah sehingga menghasilkan sebuah rangka
(skeleton). Tujuan dari penipisan adalah mereduksi komponen obyek citra menjadi
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
23
suatu informasi yang sifatnya esensial atau mendasar sehingga proses analisis lebih
lanjut dapat terfasilitasi. Ada beberapa algoritma dalam penerapan thinning salah
satunya adalah Algoritma Rosenfeld.
Resize Citra
Resize Citra merupakan proses pengubahan ukuran citra sesuai kebutuhan.
Tujuan dari proses ini adalah untuk menyamakan semua ukuran data dalam satu
ukuran, sehingga mempermudah dalam proses selanjutnya.
Ekstraksi Ciri
Ekstraksi ciri citra merupakan tahapan mengekstrak ciri / informasi dari objek di
dalam citra yang ingin dikenali / dibedakan dengan objek lainya. Proses mengekstrak
ciri berarti mencari sifat pola atribut dari setiap kelas (Widiarti & Himamunanto, 2013).
Salah metode ekstraksi ciri adalah Intensity of Character (IoC). IoC merupakan
metode ekstraksi ciri dengan membuat sebuah matriks dengan ukuran N x N, Dimana
setiap unit 1x1 nya berisikan n pixel hasil penjumlahan pixel yang bernilai 0 atau
berwarna hitam (Nugroho & Widiarti, 2016).
Berikut algoritma dari Ekstraksi Ciri :
• Input : citra hasil preprocessing, ukuran ciri
• Algoritma :
1. Baca ukuran dari data yang masuk
2. Set Variabel kolom dari lebar ukuran data
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
24
3. Baca ukuran dari data yang masuk
4. Set variabel kolom dari lebar ukuran data
5. Set variabel baris dari tinggi ukuran data
6. Bagi data sesuai ukuran ciri yang diinginkan
7. Cari piksel dengan nilai 0 disetiap bagian dan jumlahkan
8. Ulangi langkah 5 disetiap bagian , hingga mendapatkan
sejumlah n (ukuran ciri) ciri.
• Output : Matriks ciri NxN
Modified K-Nearest Neighbor
Algoritma Modified K-Nearest Neighbor (MKNN) merupakan pengembangan
dari algoritma KNN. Pengembangannya terletak pada penambahan beberapa proses
yaitu perhitungan nilai validitas dan perhitungan bobot.
Perhitungan Jarak Euclidean
Euclidean merupakan metode untuk mendefinisikan jarak antara dua titik yaitu
titik pada data training (x) dan titik pada data testing (y). Untuk mendapatkan jarak
Euclidean digunakan rumus seperti pada persamaan (2.1).
𝑑 (𝑥𝑖, 𝑦𝑖) = √∑ (𝑥𝑖 − 𝑦𝑖)2𝑛
𝑖=0
(2.1)
Dimana :
d(xi,yi) = Jarak Euclidean data xi dengan data yi.
xi = Data training ke – i.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
25
yi = Data testing ke – i.
i = titik atau posisi data.
Berikut algoritma dari Jarak Euclidean :
• Input : data latih.
• Algoritma :
1. Lakukan perulangan untuk i = 1 sampai total data latih.
2. Lakukan perulangan untuk j = 1 sampai total data latih.
3. Buat variabel untuk menyimpan hasil jumlah euclidean = 0.
4. Lakukan perulangan untuk k = 1 sampai banyaknya atribut
pada data latih.
5. Set variabel jumlaheuclidean = jumlah euclidean ditambah
dengan kuadrat penjumlahan daru datalatih pada baris i dan
kolom j dikurangi datalatih pada baris j dan kolom y.
6. Buat variabel untuk menyimpan hasil Euclidean = akar jumlah
euclidean.
• Output : hasil nilai euclidean data latih
Perhitungan Nilai Validitas
Perhitungan nilai validitas merupakan tahap untuk mengvalidasi data training
dengan data tetangganya dengan melihat kesamaan kelas antara data training dengan
data tetangganya. Nilai Validitas didapat dengan persamaan 2.2.
𝑉𝑎𝑙𝑖𝑑𝑖𝑡𝑦(𝑥) =1
𝐻∑ 𝑆 (𝑙𝑏𝑙(𝑥), 𝑙𝑏𝑙(𝑁𝑖(𝑥)))
𝑛
𝑖=0
(2.2)
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
26
Dimana :
H : jumlah tetangga terdekat.
lbl x : kelas x.
lbl (Ni(x)) : label kelas titik terdekat dengan x.
Fungsi S digunakan untuk menghitung kesamaan antara titik x dan data
ke – i dari tetangga terdekat. Seperti terlihat pada persamaan 2.3
𝑆(𝑎, 𝑏) = {1, 𝑎 = 𝑏
0, 𝑎 ≠ 𝑏
(2.3)
Keterangan :
a = kelas a pada data training
b = kelas lain selain a pada data training
Berikut algoritma dari Nilai Validitas :
• Input : data euclidean data latih dan nilai k
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
27
• Algoritma :
1. Lakukan perulangan untuk i = 1 sampai jumlah data euclidean
data latih.
2. Lakukan sorting terhadap data euclidean data latih.
3. Lakukan perulangan untuk j = 1 sampai nilai k – 1,
4. Lakukan perulangan untuk x= j+1 sampai nilai k.
5. Cek apakah Datalatih [indexurutvalidataslatih[j]] [diagnosis] =
datalatih [indexurutvaliditaslatih[x]] [diagnosis].
6. Set K [ j ] = 1.
7. Set K [ x ] = 1.
8. Jumlahkan seluruh nilai pada variable K.
9. Buat variabel validitas ke I = sum/nilai k.
• Output : Nilai validitas data latih.
Perhitungan Weighted Voting
Perhitungan Weighted Voting merupakan tahap untuk mencari bobot masing –
masing tetangga yang dihitung dengan menggunakan rumus 1 / (de + 0.5). Kemudian,
validitas dari tiap data pada data training dikalikan dengan bobot berdasarkan pada
jarak Euclidian, sehingga Weighted Voting didapat dengan menggunakan persamaan
2.4.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
28
𝑊(𝑖) = 𝑉𝑎𝑙𝑖𝑑𝑖𝑡𝑦(𝑖)𝑥 1
𝑑𝑒 + 𝑎
(2.4)
Dimana :
W(i) = Perhitungan bobot atau Weight Voting
Validity(i) = Nilai Validitas
de = Jarak Euclidian
𝑎 = 0.5
Hasil perhitungan Weighted Voting memiliki peran yang terpenting
terhadap klasifikasi data uji dengan data training yang memiliki nilai validitas
lebih tinggi dan dekat dengan data.
Berikut algoritma dari Weighted Voting :
• Input : Data euclidean data uji dan Nilai validitas data latih
• Algoritma :
1. Lakukan perulangan untuk i = 1 sampai dengan jumlah data
latih.
2. Lakukan perulangan unutk j = 1 sampai dengan jumlah data
uji.
3. Buat variabel untuk menyimpan Weight Voting kemudian set
variabel tersebut dengan nilai validitas data pada baris ke i dan
kolom j dikalikan satu per nilai euclidean data uji pada baris ke
i dan kolom j.
• Output : Weight Voting.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
29
Evaluasi
Evaluasi merupakan sebuah proses penilain suatu kinerja algoritma. Terdapat dua
hal yang dinilai yaitu penilaian hasil kinerja algoritma dan hasil akurasi algoritma.
Dalam penilaian hasil kinerja algortima menggunakan metode Cross Validation.
Cross Validation
Cross validation merupakan salah satu metode untuk mengevaluasi dan
membandingkan proses belajar (learning) dari sebuah algoritma. Metode ini membagi
data menjadi dua bagian , yaitu data training dan data testing. Cross validation serupa
dengan metode subsampling acak yang diulang, tetapi pengambilan sampel dilakukan
sedemikian rupa sehingga tidak ada dua set pengujian yang tumpang tindih. Dalam k-
fold cross-validation, set pembelajaran yang tersedia dipartisi menjadi k subset yang
terpisah dengan ukuran yang kira-kira sama (Berrar, 2018). Berikut adalah gambaran
dari k-fold cross validation dengan k = 3.
Gambar 2. 1 3 Fold Cross Validation
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
BAB 3 METODOLOGI PENELITIAN
Pada bab ini akan dipaparkan tentang metodologi penelitian yang dilakukan.
Dari bagaimana mendapatkan data, kebutuhan perangkat yang digunakan baik
perangkat keras maupun lunak, proses pengolahan data dari validasi data hinnga data
bisa diolah pada klasifikasi, skenario pengujian, hingga rancangan desain antar muka
yang akan digunakan dalam penelitian ini.
Cara Mendapatkan Data
Dalam penelitian ini, data Aksara Jawa diperoleh dari
https://www.kaggle.com/phiard/aksara-Jawa . Jumlah data yang tersedia sebanyak
2.154 data Aksara Jawa tulis tangan, dengan setiap aksara memiliki jumlah data yang
berbeda – beda. Berikut adalah rincian data dari Kaggle :
Tabel 3. 1 Data Aksara Jawa
Aksara Jumlah Data
Ha 102
Na 108
Ca 108
Ra 108
Ka 108
Da 108
Ta 108
Sa 108
Wa 108
La 108
Pa 108
Dha 108
Ja 108
Ya 108
Nya 108
Ma 108
Ga 108
Ba 114
Tha 108
Nga 102
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
31
Gambar 3. 1 Salah Satu Sampel Data Aksara
Kebutuhan perangkat Hardware dan Software
a) Spesifikasi Hardware
1. Processor AMD A9-9420 RADEON R5
2. RAM 8 Gb
3. Hardisk 1 Terra (HDD) + 120 Gb (SDD)
b) Spesifikasi Software
1. Sistem Operasi Windows 10
2. MATLAB R2014b
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
32
Validitas Data
Tahap validitas data dilakukan untuk mengecek validitas dari data aksara disetiap
kelas. Pengecekan ini dilakukan secara manual yaitu dengan menggunakan indra
penglihatan peneliti. Pengecekan dilakukan dengan membandingkan citra aksara Jawa
dari data penelitian dengan gambar aksara Jawa dari Buku Pepak Basa Jawa. Berikut
adalah gambar aksara Jawa dari Buku Pepak Basa Jawa.
Gambar 3. 2 Gambar Aksara Jawa pada Buku Pepak Basa Jawa (Iskandar &
Sariyun,2014)
Dari pengecekan melaui pengamatan secara manual, didapati ada citra aksara
Jawa yang tidak sesuai kelas aksaranya dengan nama folder kelas aksara Jawa. Folder
kelas tersebut adalah aksara Na. Berikut isi dari folder kelas aksara Na.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
33
Gambar 3. 3 Folder Kelas Citra Aksara Na
Terdapat 6 data Aksara Jawa Ka pada folder kelas aksara Na seperti yang terlihat
pada kotak bergaris merah. Aksara yang berbeda tersebut tidak digunakan pada
penelitian, sehingga total data yang digunakan pada penelitian ini yang mulanya 2.154
aksara menjadi 2.148 data aksara Jawa.
Pemodelan Klasifikasi
Metode klasifikasi MKNN berjalan dengan menyiapkan data latih dengan
diberikan proses perhitungan jarak euclidean dan nilai validitas. Setelah mendapatkan
nilai validitas dari setiap data latih, proses akan berlanjut untuk data uji yaitu dengan
mecari jarak euclidean data uji dengan data latih serta menghitung nilai weight voting.
Sebelum data uji maupun data latih bisa diolah pada MKNN , data – data tersebut harus
diproses pada tahap preprocessing hingga ekstraksi ciri. Secara garis besar, model dari
proses klasifikasi MKNN dari data yang berupa citra hingga muncul akurasi seperti
pada gambar 3.4.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
34
Gambar 3. 4 Pemodelan Klasifikasi Metode Modified K-Nearest Neighbor
Pada Gambar 3.4 terlihat ada proses model yang mana pada menghasilkan nilai
validitas dari setiap data latih. Kemudian hasil dari model tersebut digunakan untuk
proses klasifikasi data citra uji dan selanjutnya dicari akurasi dengan menghitung
berapa data citra uji yang diklasifikasikan dengan benar.
Preprocessing
Data Aksara Jawa yang berupa citra akan masuk pada proses Preprocessing
agar data bisa diolah untuk diambil ekstraksi ciri sebelum dibagi menjadi data training
dan data testing. Berikut adalah alur dari proses Preprocessing.
Gambar 3. 5 Desain alat uji Preprocessing
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
35
• Binerisasi
Citra yang masuk merupakan citra dengan jenis citra gambar
atau citra RGB (Red Green Blue). Citra RGB tersebut harus diubah
menjadi citra biner agar dapat diolah pada proses selanjutnya. Citra
biner akan menghasilkan dua nilai pada setiap pixelnya yaitu bernilai
1 untuk warna putih dan bernilai 0 unutk warna hitam. Dalam
penelitian ini, data Aksara Jawa yang digunakan sudah memiliki
warna hitam dan putih. Namun, Citra dari aksara tersebut masih
termasuk citra RGB. Oleh karena itu perlu proses Binerisasi. Penulis
akan menggunakan fungsi binerisasi dari MATLAB yaitu im2bw.
• Rotate Image
Rotate image bertujuan untuk memperbaiki data citra yang
miring. Sehingga citra yang dihasilkan pada tahap ini sudah pada
posisi lurus. Proses Rotate image menggunakan Proses Normalisasi
Orientasi. Proses Normalisasi Orientasi bertujuan mendeteksi sudut
kemiringan dari sebuah citra. Kemudian memperbaiki citra tersebut
denga melihat sudut kemiringan yang sudah didapat.
• Cropping
Setelah diolah pada tahap Binerisasi tahap Preprocessing
selanjutnya adalah Cropping. Pada tahap ini, citra akan memotong
bagian yang kosong sehingga objek pada citra lebih menonjol.
Metode cropping yang digunakan dalam penelitian ini menggunakan
fungsi MATLAB yaitu imcrop.
• Resize Citra
Citra yang sudah melalui tahap Cropping akan diubah
ukurannya dengan tujuan agar memiliki ukuran yang sama. Pada
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
36
penelitian ini, penulis menggunakan fungsi resize citra dari
MATLAB yaitu imresize.
• Thinning
Pada tahap ini citra akan ditipiskan dengan menggunakan
algoritma Rosenfeld. Rosenfeld bekerja dengan menghilangkan garis
bagian tepi (edge) pada citra.
Ekstraksi Ciri
Tahap Ekstraksi Ciri merupakan tahap untuk mendapatkan ciri dari setiap citra
aksara yang telah diproses pada preproccesing. Ciri inilah yang akan membantu proses
pengenalan aksara pada tahap klasifikasi aksara. Metode ekstraksi ciri yang digunakan
adalah Intensity of Character(Ioc). Berikut adalah algoritma dari metode IoC.
Penelitian tentang klasifikasi aksara Jawa ini hanya menggunakan IoC dengan ukuran
3x3 piksesl.
Metode IoC menghitung piksel yang berwarna hitam atau bernilai 0 pada setiap
bagian citra. Bagian citra tersebut dibagi berdasarkan ukuran ioc yang dimasukan. Jika
ukuran IoC yang dimasukan adalah 3, maka citra akan dibagi menjadi 9 bagian.
Ekstraksi ciri IoC akan menghasilkan sebuah matriks dengan ukuran NxN. Agar bisa
digunakan pada tahap selanjutnya yaitu tahap klasifikasi, matriks yang awalnya
berukuran NxN harus diubah menjadi matriks dengan ukuran 1xN. Berikut representasi
dari hasil IoC dari data citra aksara Jawa yang sudah berukuran 1x9 (karena
menggunakan IoC berukuran 3x3).
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
37
Tabel 3. 2 Hasil Ekstraksi Ciri
Ciri Kelas
1 2 3 4 5 6 7 8 9
41 40 28 23 20 37 42 40 21 1
42 37 18 20 23 35 37 41 37 1
36 40 18 23 20 14 48 40 30 1
29 32 20 19 46 27 26 32 30 2
29 33 21 19 44 27 26 32 30 2
9 34 12 29 41 21 8 34 6 2
22 22 30 23 23 47 25 40 22 3
19 24 27 23 24 44 23 40 20 3
9 32 22 41 17 37 14 40 30 3
Tabel diatas merupakan representasi dari hasil ekstraksi ciri IoC dari aksara Ha yang
ditunjukan dengan kelas 1, aksara Na yang ditunjukan dengan kelas 2, dan aksara Ca
yang ditunjukan dengan kelas 3. Hasil Ekstraksi Ciri yang berupa angka inilah yang
akan digunakan untuk tahap klasifikasi.
Klasifikasi
Melakukan klasifikasi data dengan menggunakan metode klasifikasi Modified
K – Nearest Neighbor. Disini ada dua data yang digunakan yaitu data uji dan data latih.
Data uji merupakan data yang belum memiliki label aksara. Sehingga pada tahap ini,
data uji tersebut diklasifikasi dengan data latih yang sudah memiliki label aksara.
Kemudian didapatkan hasil klasifikasi yang berupa label aksara dari data uji. Pada
gambar 3.4 sudah terlihat alur dari klasifikasi metode MKNN dari data berupa citra
hingga akurasi. Namun secara lebih detail, alur dari metode MKNN dapat dilihat pada
gambar 3.6
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
38
Gambar 3. 6 Alur MKNN
Dari Gambar 3.6 metode MKNN mendapat inputan data latih citra yang merupakan
data hasil ekstraksi ciri. Data latih yang sudah berupa angka tersebut dihitung jaraknya
antar data latih dengan metode jarak euclidean. Setiap data latih akan mendapatkan
hasil jarak dengan data latih lainnya, dimana akan diambil sejumlah k tetangga
terdekat. K merupakan variabel untuk menentukan berapa jumlah tetangga yang harus
diambil. Setelah mendapatkan sejumlah k tetangga dilakukanlah perhitungan nilai
validitas.
Nilai validitas yang dijelaskan pada bab 2.6.2 akan melihat kesamaan kelas data
latih dengan kelas tetangga terdekatnya, jika kelas sama akan mendapat nilai 1 dan jika
kelasnya berbeda akan mendapat nilai 0. Setelah berproses pada data latih, metode
MKNN akan memulai menghitung jarak antar data latih dengan data uji. Hasil dari
perhitungan jarak tersebut digunakan untuk mencari Weight Voting. Pada persamaan
2.4 terlihat bahwa weight voting didapatkan dari perhitungan hasil jarak euclidean data
latih dan data uji serta nilai validitas data latih.
Setelah mendapatkan nilai weight voting akan dicari sejumlah k tetangga dengan
nilai weight voting paling tinggi. Penentuan kelas data uji didapatkan dengan melihat
kelas dominan yang ada pada sejumlah k data dengan nilai weight voting tertinggi.
Berikut adalah contoh perhitungan manual metode Modified K-Nearest Neighbor
dengan data dummy.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
39
Tabel 3. 3 Tabel Data Latih Data Citra
Citra Ciri Kelas
1 2 3 4 5 6 7 8 9
41 40 28 23 20 37 42 40 21 1
42 37 18 20 23 35 37 41 37 1
29 32 20 19 46 27 26 32 30 2
29 33 21 19 44 27 26 32 30 2
22 22 30 23 23 47 25 40 22 3
19 24 27 23 24 44 23 40 20 3
Tabel 3. 4 Tabel Data Uji Data Citra
Citra Ciri
Kelas 1 2 3 4 5 6 7 8 9
36 40 18 23 20 14 48 40 30 1
Pada tabel diatas terdapat 9 ciri dari setiap data yang akan digunakan sebagai data
dummy untuk perhitungan manual MKNN. Terdapat 3 kelas yang digunakan yaitu
kelas 1 untuk aksara Ha, kelas 2 untuk aksara Na, dan kelas 3 untuk aksara Ca.
1. Menghitung Jarak Euclidean data latih
Perhitungan Jarak Euclidean antar data latih menggunakan rumus seperti
persamaan (2.1). Proses perhitungan jarak Euclidean dimulai dengan :
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
40
• Menghitung jarak Data latih 1 dengan 6 data latih lainya :
D(1,1)
=√
(41 − 41)2 + (40 − 40)2 + (28 − 28)2
+(23 − 23)2 + (20 − 20)2
+(37 − 37)2 + (42 − 42)2 + (40 − 40)2 + (21 − 21)2
= 0
D (1,2)
=√
(41 − 42)2 + (40 − 37)2 + (28 − 18)2
+(23 − 20)2 + (20 − 23)2
+(37 − 35)2 + (42 − 37)2 + (40 − 41)2 + (21 − 37)2
= 20,3470
D (1,3)
=√
(41 − 29)2 + (40 − 32)2 + (28 − 20)2
+(23 − 19)2 + (20 − 46)2
+(37 − 27)2 + (42 − 26)2 + (40 − 32)2 + (21 − 30)2
= 38,2753
D (1,4)
=√
(41 − 29)2 + (40 − 33)2 + (28 − 21)2
+(23 − 19)2 + (20 − 44)2
+(37 − 27)2 + (42 − 26)2 + (40 − 32)2 + (21 − 30)2
= 36,5377
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
41
D (1,5)
=√
(41 − 22)2 + (40 − 22)2 + (28 − 30)2
+(23 − 23)2 + (20 − 23)2
+(37 − 47)2 + (42 − 25)2 + (40 − 40)2 + (21 − 22)2
= 32,9848
D (1,6)
=√
(41 − 19)2 + (40 − 24)2 + (28 − 27)2
+(23 − 23)2 + (20 − 24)2
+(37 − 44)2 + (42 − 23)2 + (40 − 40)2 + (21 − 20)2
= 34,1760
Untuk data latih ke 2 hingga data latih ke 6 diperlakukan cara yang sama seperti data
latih 1, sehingga didapatkan hasil jarak Euclidean untuk data latih seperti tabel 3.5.
Tabel 3. 5 Hasil Perthitungan Jarak Euclidean data Citra
Pada tabel 3.5 terlihat bahwa terdapat hasil yang bernilai 0. Hasil 0 tersebut
menunjukan perhitungan jarak data latih terhadap dirinya sendiri, sehingga bernilai 0.
Data ke 1 2 3 4 5 6 Kelas
1 0,0000 20,3470 38,2753 36,5377 32,9848 34,1760 1
2 20,3470 0,0000 32,2955 30,8383 35,9444 36,8239 1
3 38,2753 32,2955 0,0000 2,4495 36,3731 34,2783 2
4 36,5377 30,8383 2,4495 0,0000 35,1710 33,0908 2
5 32,9848 35,9444 36,3731 35,1710 0,0000 6,3246 3
6 34,1760 36,8239 34,2783 33,0908 6,3246 0,0000 3
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
42
Selain itu hasil untuk jarak Euclidean data latih ke 1 dengan 2 akan sama hasilnya
dengan jarak Euclidean data latih ke 2 dengan 1. Hal ini berlaku ke semua data latih.
2. Mencari nilai validitas data latih
Nilai validitas didapatkan dengan persamaan (2.2). Sebelum menghitung nilai
validitas, langkah sebelumnya adalah mencari tetangga terdekat dari setiap data latih.
Tetangga terdekat merupakan data dengan jarak Euclidean yang nilainya mendekati 0.
Jumlah tetannga yang dipilih tergantung dengan nilai K. Pada contoh ini , nilai K yang
digunakan adalah 3. Jadi, akan diambil 3 data yang memiliki nilai Euclidean mendekati
0 untuk setiap data latih.
• 3 tetangga terdekat data pertama adalah 2, 5, 6
• 3 tetangga terdekat data kedua adalah 1, 4, 3
• 3 tetangga terdekat data ketiga adalah 4, 2, 6
• 3 tetangga terdekat data keempat adalah 3, 2, 6
• 3 tetangga terdekat data kelima adalah 6, 1, 4
• 3 tetangga terdekat data keenam adalah 5, 4, 1
Setelah mendapatkan 3 tetangga untuk setiap data latih, selanjutnya masuk
ketahap mencari nilai validitas dengan melihat kelas dari setiap data tetangga yang ada.
Jika kelas data latih sama dengan kelas tetangganya akan mendapatkan nilai 1, jika
berbeda akan mendapatkan nilai 0, sehingga hasil dari perhitungan nilai validitas
seperti tabel 3.6.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
43
Tabel 3. 6 Hasil Nilai Validitas data latihD
Data K = 1 K = 2 K = 3 Nilai Validitas
1 1 0 0 0.333
2 1 0 0 0.333
3 1 0 0 0.333
4 1 0 0 0.333
5 1 0 0 0.333
6 1 0 0 0.333
Pada tabel 3.6 nilai validitas untuk semua datalatih adalah 0.333. Hal ini menunjukan
bahwa hanya ada 1/3 dari tetangga untuk setiap data latih yang kelas tetangga
terdekatnya sama dengan data latih itu sendiri.
3. Menghitung Jarak Euclidean data uji dengan data latih
Perhitungan jarak Euclidean data uji dengan data latih sama dengan perhitungan jarak
Euclidean data latih. Perbedaanya terletak pada data yang digunakan yaitu data uji
dengan data latih. Hasil yang didapat dari perhitungan tahap ini terlihat pada tabel
3.7.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
44
Tabel 3. 7 Hasil Eucliean data uji citra
Data Uji
Latih 1 27,7669
Latih 2 25,9808
Latih 3 39,0640
Latih 4 37,6298
Latih 5 48,5283
Latih 6 47,6130
Hasil pada tabel 3.6 dan 3.7 diatas akan digunakan untuk menghitung weight voting
pada tahap berikutnya.
4. Menghitung Weight Voting
Perhitungan Weight Voting menggunakan persamaan 2.4, sehingga diperoleh hasil
seperti tabel 3.8.
Tabel 3. 8 Hasil Weight Voting
Data Weight Voting
1 0,01167
2 0,01246
3 0,00834
4 0,00865
5 0,00673
6 0,00686
5. Menentukan label dari data uji
Penentuan label dilakukan dengan mencari nilai terbesar dari hasil Weight
Voting. Banyaknya nilai terbesar bergantung pada nilai k, misal nilai k = 3 jumlah
data terbesar yang diambil adalah tiga nilai Weight Voting terbesar.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
45
Tabel 3. 9 Hasil Penentuan Tetangga
Data Tetangga Weight Voting Kelas
1 0,01246 1
2 0,01167 1
3 0,00865 2
Dari hasil tetangga terdekat tersebut, terlihat dari 3 tetangga yang mendominasi
adalah kelas 1, sehingga klasifikasi aksara untuk data uji tersebut adalah kelas 1.
Dimana kelas 1 merupakan kelas untuk aksara Jawa Ha. Jadi, aksara prediksi dari hasil
klasifikasi adalah Ha. Hasil prediksi aksara uji ini sesuai dengan kelas aksara asalnya
yaitu Ha (Tabel 3.4).
Cara Analisis Data
Analisis data yang dilakukan yaitu dengan melihat hasil akurasi terbaik. Hasil
akurasi didapatkan dengan metode Cross fold Validation. Metode ini akan membagi
data menjadi dua data yaitu data latih dan data uji seperti pada penjelasan bab 2.7.1.
Pada pengujian ini akan menggunakan 3 nilai fold yaitu 3 fold, 5 fold, dan 7 fold.
Sedangkan untuk nilai k pada metode Modified K-Nearest Neighbor yang dilakukan
menggunakan 4 nilai k antara lain K=1, K=3, K=5, K=7, dan K=9.
Sesudah mendapatkan akurasi terbaik dari nilai K dan k-fold, hasil tersebut
dibandingkan dengan akurasi dari hasil klasifikasi dengan menambahkan 2 ciri yaitu
ukuran citra pada proses ekstraksi ciri, hasil klasifikasi tanpa adanya proses thinning
dan hasil klasifikasi dengan mengubah nilai 𝑎 dengan nilai 0,25 dan 0,75. Hasil
klasifikasi terbaik dari skenario tersebut akan digunaakn untuk pegujian data tunggal
dan hasil klasifikasi dari skenario terbaik akan dibandingkan dengan hasil klasifikasi
menggunakan metode KNN.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
46
Desain User Interface
Desain user interface ini digunakan untuk melihat kinerja metode MKNN pada
kasus klasifikasi aksara Jawa dengan data tunggal. Desain dapat dilihat pada gambar
3.9.
Gambar 3.9 Desain UI Uji
Input Tampilan
3.1.1. Langkah awal dalam penggunaan interface ini adalah mengklik button
Input Data Citra untuk memasuk data citra yang akan diklasifikasi.
3.1.2. Klik Mulai Klasifikasi untuk memulai proses klasifikasi Aksara Jawa
pada sistem.
Output Tampilan
Output dari tampilan adalah klasfikasi dari aksara Jawa yang berupa teks
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
BAB 4 HASIL PENELITIAN DAN ANALISIS
Pada bab Hasil Penelitian dan Analisis akan memaparkan hasil dari pemrosesan
citra aksara Jawa dari preprocessing hingga pengujian Klasifikasi Aksara Jawa dengan
menggunakan metode Modified K-Nearest Neighbor.
Peprocessing
Seperti yang dijelaskan pada bab sebelumnya bahwa preprocessing merupakan
tahap untuk menyipakan data agar dapat menghasilkan data yang mudah diolah
saat klasifikasi.
Binerisasi
Binerisasi dilakukan menggunakan fungsi dari MATLAB yaitu im2bw().
Berikut adalah gambar sebelum dan sesudah citra mendapatkan proses binerisasi:
Citra asli
Citra hasil biner
Gambar 4. 1 Hasil Binerisasi
Pada gambar 4.1 jika dilihat tidak ada perubahan yang mencolok dari citra asli
menjadi citra biner. Namun, jika dilihat dari keterangan value, nampak bahwa citra asli
yang awalnya berupa uint 8 ketika diproses binerisasi menjadi citra logical.
Rotasi Citra
Pada tahap ini citra yang telah diubah menjadi citra biner akan dideteksi
kemiringannya. Hasil deteksi kemiringan atau yang disebut teta akan digunakan
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
48
sebagai sudut acuan dalam melakukan rotasi citra. Rotasi citra dilakukan menggunakan
fungsi dari MATLAB yaitu imrotate(). Berikut hasil dari proses rotasi image:
Citra Sebelum Rotasi
Citra Sesudah Rotasi
Gambar 4. 2 Hasil Rotasi Citra
Pada gambar 4.2 terlihat bahwa citra sebelum rotasi terlihat lebih naik dibagian
kanan. Setelah dilakukan proses rotasi citra terlihat citra aksara sudah lebih lebih sejajar
dari pada citra sebelum dirotasi.
Cropping
Croping merupakan tahap untuk membuang ruang yang kosong pada citra hasil
rotasi, dengan tujuan agar menonjolkan objek yang ada pada citra. Proses Cropping
menggunakan metode proyeksi profile. Hasil dari proses cropping terlihat pada gambar
4.3.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
49
Citra sebelum cropping
Citra sesudah cropping
Gambar 4. 3 Hasil Cropping
Gambar 4.3 menunjukkan hasil dari cropping citra, dimana citra yang awalnya
memiliki ruang putih yang cukup banyak dihilangkan hingga hanya tersisa objek citra
aksara itu sendiri. Ruang putih atau pixel putih yang hilang pada citra akan berpengaruh
pada ukuran citra itu sendiri, seperti yang ditunjukan pada value masing – masing citra
pada Gambar 4.3. Value tersebut menunjukan informasi ukuran citra sebelum cropping
dan sesudah cropping, dimana ukuran setelah dicropping menjadi lebih kecil dari pada
ukuran awalnya.
Resize Citra
Tahap Resize Citra merupakan kelanjutan dari tahap cropping, dimana citra
yang sudah di cropping akan diubah ukurannya. Perubahan ukuran pada tahap ini
bertujuan agar semua citra memiliki ukuran citra yang sama. Resize Citra
menggunakan fungsi dari MATLAB yaitu imresize. Ukuran yang dipilih adalah 60 x
60 pixel. Hasilnya terlihat seperti pada Gambar 4.4
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
50
Citra Sebelum Resize memiliki
ukuran 129x159 pixel
Citra Sesudah Cropping
dengan ukuran 60x60 pixel
Gambar 4. 4 Hasil Resize
Hasil resize pada gambar 4.4 menunjukan ukuran dari citra asli yang diubah
menjadi 60 x 60 piksel. Perubahan ini juga diberlakukan sama ke semua data citra,
sehingga pada akhirnya seluruh data citra yang diolah pada proses preproccesing
memiliki ukuran yang sama yaitu 60 x 60 piksel.
Thinning
Setelah citra mendapatkan proses resize, maka selanjutnya masuk pada proses
Thinning atau penipisan. Proses ini merupakan proses untuk medapatkan kerangka dari
citra dengan membuang pixel bagian tepi dari citra tersebut. Proses Thinning pada
proses ini menggunakan metode Rosenfeld. Hasil dari penipisan terlihat pada gambar
4.5.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
51
Citra awal
Citra hasil penipisan
Gambar 4. 5 Hasil penipisan citra
Setelah didapatkan kerangka citra pada proses ini, data citra akan masuk pada
proses ekstrasi ciri.
Ekstraksi Ciri dan Pembagian data
Proses ekstraksi ciri dengan metode IoC yang menggunakan ukuran 3 x 3 piksel.
Hasil dari ekstraksi ciri akan sama seperti pada Tabel 3.2, dimana akan ada 9 ciri yang
digunakan dalam proses klasifikasi. Perbedaannya pada kolom kelas akan ada 20 kelas
aksara Jawa yang misalkan dalam bentuk angka. Angka tersebut menunjukan urutan
dari Aksara Jawa itu sendiri. Pemilihan angka sebagai kelas bertujuan untuk
mempermudah nanti ketika melakukan perbandingan kelas hasil prediksi dengan kelas
asal.
Tabel 4. 1 Kelas Aksara Jawa
Kelas Nama
Aksara
Kelas Nama
Aksara
Kelas Nama
Aksara
Nama Kelas
Aksara
1 Ha 6 Da 11 Pa 16 Ma
2 Na 7 Ta 12 Dha 17 Ga
3 Ca 8 Sa 13 Ja 18 Ba
4 Ra 9 Wa 14 Ya 19 Tha
5 Ka 10 La 15 Nya 20 Nga
Data ekstraksi ciri itulah yang akan dibagi menjadi data latih dan data uji.
Pembagian data menggunakan metode k-fold cross validation dimana jumlah data latih
dan data uji sesuai dengan nilai fold yang digunakan. Misal nilai fold yang digunakan
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
52
adalah 3, maka data ekstraksi ciri yang berjumlah 2148 akan dibagi menjadi 3 fold
untuk data latih dan data uji. Data yang masuk ke dalam data latih adalah 2/3 data yang
berarti data latih akan memiliki data berjumlah 1432 data. Data yang masuk ke dalam
data uji adalah 1/3 data yang berarti jumlah data ujinya adalah 713. Berikut adalah hasil
pembagian data menggunakan 3 fold:
Gambar 4. 6 Pembagian data latih dengan 3 fold
Gambar 4. 7 Hasil pembagian data uji dengan 3 fold
Gambar 4.6 menunjukan data latih 3 fold dimana untuk setiap fold memiki 1432
data latih. Begitu juga dengan Gambar 4.2 menunjukan data uji 3 fold dimana setiap
fold memiliki 716 data uji.
Untuk nilai fold 5 dan 7 juga sama aturanya yaitu membagi data sebanyak nilai
fold yang dimasukan. Misal fold 5 maka data akan dibagi menjadi 1/5 dari jumlah
seluruh data. Begitu juga dengan nilai fold 7, data akan dibagi menjadi 1/7 dari jumlah
seluruh data. Pada pembagian dengan menggunakan k fold Cross Validation ini setiap
fold akan menyimpan lebih dari 2 data untuk setiap kelas aksara. Sehingga ketika
melakukan pengujian dapat dipastikan semua kelas aksara ada didalam data uji maupun
didalam data latih.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
53
Pengujian dan Evaluasi
Pengujian pada klasifikasi Modified K-Nearest Neighbor menggunakan beberapa
variasi pengujian. Untuk nilai K pada Modified K-Nearest Neighbor menggunakan
nilai K = 1,3,5,7, dan 9. Penentuan K didasarkan pada jumlah data untuk setiap kelas
yang di range 102 – 115. Sehingga diambil nilai akar 100 yang hasilnya adalah 10.
Maka, nilai K yang digunakan hanya mencapai 9. Ukuran citra aksara Jawa yang
digunakan berukuan 60 x 60 piksel. Ekstraksi ciri dari IoC hanya menggunakan ukuran
3x3. Kemudian untuk fold yang digunakan adalah 3-fold, 5-fold, dan 7-fold.
Hasil pengujian dengan 3 fold Cross Validation
Pada pengujian 3 fold cross validation dengan 1432 data latih dan 716 data uji
untuk setiap foldnya menunjukan hasil seperti pada tabel 4.2 :
Tabel 4. 2 Hasil Pengujian 3 fold
Nilai K Hasil Pengujian
Rata - rata Data uji 1 Data uji 2 Data uji 3
1 72,486 63,9665 68,1564 68,2029
3 72,3464 63,4075 68,1564 67,9701
5 69,9721 62,2905 66,7598 66,3408
7 63,2682 60,3352 63,5475 62,3836
9 62,1508 59,6369 60,7542 60,8473
Pada tabel 4.2 terlihat hasil rata – rata akurasi tertinggi pada nilai k = 1 dengan
nilai 68,2029 %. Untuk hasil rata – rata akurasi terendah berada pada nilai k = 9 dengan
nilai 60,8473%. Dari tabel 4.2 juga terlihat bahwa nilai k semakin tinggi akan
mengurangi nilai rata – rata akurasi. Hal ini bisa dilihat lebih jelas pada gambar grafik
4.8.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
54
Gambar 4. 8 Grafik Akurasi 3 fold.
Dari gambar grafik 4.8 lebih jelas penurunan nilai akurasi ketika nilai k bertambah.
Pada pengujian 3 fold ini rentang dari akurasi berkisar 60 % hingga 68 %.
Hasil pengujian dengan 5 fold Cross Validation
Pada pengujian 5 fold cross validation jumlah data untuk data latih dan data uji
disetiap foldnya berbeda. Fold data 1 sampai 4 memiliki jumlah data latih sebanyak
1713 dan jumlah data uji sebanyak 435. Sedangkan fold data 5 memiliki jumlah data
latih sebanyak 1740 dan data uji sebanyak 408. Dari pengujian menggunakan 5 fold
tersebut didapati hasil seperti pada tabel 4.3.
Tabel 4. 3 Hasil pengujian 5 fold
Nilai K Hasil Pengujian
Rata - rata Data Uji 1 Data Uji 2 Data Uji 3 Data Uji 4 Data Uji 5
1 72,8736 74,2529 70,5747 69,4253 74,0196 72,2292
3 73,3333 69,4253 69,8851 70,3448 70,5882 70,7153
5 76,3218 63,2184 69,4253 68,2579 65,9314 68,6310
7 72,1839 66,4368 70,5747 68,5057 63,7255 68,2853
9 67,3563 61,1494 69,8851 65,0575 57,1078 64,1112
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
55
Dari tabel 4.3 terlihat bahwa nilai akurasi tertinggi berada pada k 1 dan pada data
uji 5 dengan nilai 76,3218 %. Sedangkan nilai akurasi terendah berada pada k 9 pada
data uji 5 dengan nilai 57,1078%. Representasi lain dari hasil akurasi fold 5 tampak
pada gambar grafik 4.9
Gambar 4. 9 Grafik Akurasi 5 fold.
Dari pengujian dengan 5 fold masih terlihat bahwa semakin besar nilai k semakin
menurun pula hasil akurasinya. Namun, pada grafik rata – rata terlihat bahwa nilai rata
– rata akurasi dari k 5 ke k 7 mengalami perubahan yang tidak terlalu signifikan. Hal
ini berbeda dengan pengujian 3 fold. Dimana pada 3 fold grafik rata – rata akurasi
terlihat turun jauh dari setiap hasil pengujian untuk nilai k nya, sedangkan pada 5 fold
terjadi penurunan dari k 1 sampai k 5 namun pada hasil akurasi k 7 tidak begitu turun
jauh dari hasil akurasi pada k 5. Secara keseluruhan , hasil dari setiap pengujian untuk
nilai k pada fold 5 ini menunjukan penurunan ketika nilai k nya semakin naik.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
56
Hasil pengujian dengan 7 fold Cross Validation
Pada pengujian 7 fold cross validation jumlah data untuk data latih dan data uji
disetiap foldnya berbeda. Fold data 1 sampai 6 memiliki jumlah data latih sebanyak
1847 dan jumlah data uji sebanyak 301. Sedangkan fold data 5 memiliki jumlah data
latih sebanyak 1806 dan data uji sebanyak 342. Dari pengujian menggunakan 7 fold
tersebut didapati hasil sebagai berikut :
Tabel 4. 4 Hasil pengujian 7 fold
Nilai
K
Hasil Pengujian Rata -
rata 1 2 3 4 5 6 7
1 75,75 76,74 67,11 73,09 73,75 85,38 75,73 75,37
3 78,41 70,43 67,11 73,75 72,09 81,06 75,15 74,00
5 75,75 65,45 67,44 73,42 68,77 78,41 71,93 71,60
7 73,75 63,46 70,10 74,75 69,77 72,76 67,25 70,26
9 69,44 64,12 62,46 76,41 67,77 70,10 63,45 67,68
Dari tabel 4.12 terlihat bahwa nilai akurasi tertinggi berada pada k 1 dan pada data
uji 6 dengan nilai 85,38%. Sedangkan nilai akurasi terendah berada pada k 9 pada data
uji 3 dengan nilai 62,46%. Representasi dari hasil akurasi pengujian dengan 7 fold
tampak gambar grafik 4.10.
Gambar 4. 10 Grafik Akurasi 7 fold
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
57
Dari pengujian dengan 7 fold masih terlihat bahwa semakin besar nilai k semakin
menurun pula hasil akurasinya. Namun, pada fold 7 ini terjadi peningkatan hasil rata
– rata akurasi dari pengujian fold sebelumnya. Dimana, pada fold 7 ini hanya ada satu
hasil rata – rata akurasi dibawah 70%. Selain itu, juga terlihat hasil akurasi pengujian
banyak yang bernilai diatas 70%. Hal ini juga diperkuat dari hasil rata – rata akurasi
yang ditunjukan pada grafik 4.5. Dimana nilai rata – rata akurasi mencapai 75,37% dan
rata – rata akurasi terendah 67,68%.
Data Uji Tunggal
Berdasarkan pengujian dengan menggunakan Cross Fold Validation yang
menunnjukan bahwa hasil akurasi terbaik menggunakan nilai k sama dengan 1. Oleh
karena itu, dilakukanlah uji tunggal menggunakan GUI dengan data uji sebagai berikut
:
Tabel 4. 5 Tabel Data Uji
No. Aksara Citra Aksara
1 Ha
2 Na
3 Ca
4 Ra
5 Ka
6 Da
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
58
No. Aksara Citra Aksara
7 Ta
8 Sa
9 Wa
10 La
11 Pa
12 Dha
13 Ja
14 Ya
15 Nya
16 Ma
17 Ga
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
59
No. Aksara Citra Aksara
18 Ba
19 Tha
20 Nga
Dari data uji diatas didapatkan hasil sebagai berikut:
Tabel 4. 6 Tabel Hasil Uji Tunggal
Data Uji Label Citra Label Prediksi Keterangan
1 Ha Ha Benar
2 Na Na Benar
3 Ca Ca Benar
4 Ra Ra Benar
5 Ka Ta Salah
6 Da Na Salah
7 Ta Ha Salah
8 Sa Ca Salah
9 Wa Dha Salah
10 La Ta Salah
11 Pa Wa Salah
12 Dha Dha Benar
13 Ja Da Salah
14 Ya Ya Benar
15 Nya Nya Benar
16 Ma Wa Salah
17 Ga Ga Benar
18 Ba Ba Benar
19 Tha Tha Benar
20 Nga Nga Benar
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
60
Berdasarkan Tabel 4.6 menunjukan bahwa 11 data uji dapat diprediksi dengan
benar dan 9 data uji diprediksi salah. Akurasi yang didapatkan untuk data uji tunggal
ini sebesar 55%, dengan hasil seperti itu metode MKNN ini hanya mampu mengenali
11 citra aksara jawa dalam data uji.
Perbandingan Hasil Akurasi
Rata – rata akurasi tertinggi dari percobaan dengan menggunakan Cross Fold
Validataion mendapatkan rata – rata 75,3655 dengan nilai K = 1 dan k-fold = 7. Hasil
ini dibandingkan dengan hasil dari klasifikasi menggunakan tambahan ciri ukuran,
tanpa menggunakan thinning, ,mengubah nilai a, dan dengan hasil klasifikasi KNN.
Merubah Preprocessing dan Ekstraksi Ciri
Hasil akurasi perbandingan dari hasil akurasi terbaik pada poin 4.3.3
dibandingkan dengan hasil akurasi klasifikasi dengan tambahan ciri, hasil akurasi
klasifikasi tanpa thining, dan hasil akurasi klasifikasi tanpa thining serta tambahan ciri.
Hasilnya terlihat pada Tabel 4.7.
Tabel 4. 7 Tabel Hasil Perbandingan Akurasi
Hasil Pengujian
Pengujian 1 2 3 4 5 6 7 Rata -
Rata
A 75,7475 76,7442 67,1096 73,0897 73,7542 85,3821 75,731 75,3655
B 79,7342 75,4153 65,1163 65,7807 71,0963 76,7442 71,0526 72,1342
C 76,7442 78,7375 66,4452 67,1096 77,4086 82,0598 69,883 74,05541
D 77,7409 80,3987 61,794 68,1063 77,7409 81,7276 71,345 74,1219
Pengujian A merupakan pengujian dengan menggunakan skenario awal. Pengujian
B merupakan proses klasifikasi MKNN sama dengan pengujian A namun pada ada
penambahan ciri pada ekstraksi ciri, dimana ekstraksi ciri yang awalnya hanya
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
61
memiliki 9 ciri ditambah 2 ciri yang didapatkan dari ukuran citra sehingga menjadi 11
ciri. Pengujian C merupakan pengujian sama dengan pengujian A namun terdapat
penghilangan proses thinning pada tahap preprocessing. Pengujian D merupakan
pengujian dengan skenario gabungan dari pengujian A, B, dan C, dimana ada
penambahan ciri pada ekstraksi ciri dan tidak menggunakan proses thinning pada tahap
preprocessing.
Dari hasil perbandingan pengujian pada Tabel 4.7 terlihat bahwa pengujian A
memiliki akurasi yang lebih tinggi dari pada pengujian lain. Hal ini menunjukkan
bahwa dalam penelitian ini penambahan ciri ukuran dan penghilangan proses thinning
pada preprocessing membuat akurasi dari klasifikasi ini turun.
Hasil perbandingan dengan merubah nilai 𝒂
Nilai 𝑎 merupakan nilai pembagi dalam perhitungan bobot atau Weight Voting.
Nilai 𝑎 yang digunakan di hasil klasifikasi terbaik pada poin 4.3.3 yaitu 0,5. Hasil
tersebut dibandingkan dengan hasil klasifikasi jika nilai 𝑎 0,25 dan nilai 𝑎 0,75,
sehingga hasilnya perbandingannya terlihat pada Tabel 4.8
Tabel 4. 8 Hasil Perbandingan Nilai 𝑎
Hasil Pengujian
Pengujian
Nilai 𝑎 1 2 3 4 5 6 7
Rata -
Rata
0,5 75,7475 76,7442 67,1096 73,0897 73,7542 85,3821 75,731 75,3655
0,25 75,7475 76,7442 67,1096 73,0897 73,7542 85,3821 75,731 75,3655
0,75 75,7475 76,7442 67,1096 73,0897 73,7542 85,3821 75,731 75,3655
Dari Tabel 4.8 terlihat bahwa perubahan nilai 𝑎 pada proses pembobotan / Weight
Voting tidak menunjukkan perubahan yang signifikan bahkan bisa dikatakan sama.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
62
Hasil Perbandingan dengan KNN
Hasil perbandingan klasifikasi MKNN dan KNN untuk kasus klasifikasi aksara
jawa ini terlihat pada Tabel 4.9
Tabel 4. 9 Hasil Perbandingan MKNN dan KNN
Hasil Pengujian
Pengujian 1 2 3 4 5 6 7 Rata -
Rata
MKNN 75,7475 76,7442 67,1096 73,0897 73,7542 85,3821 75,731 75,3655
KNN 76,0797 79,4020 76,4120 74,4186 81,0631 86,7110 75,7310 78,5453
Dari Tabel 4.9 terlihat bahwa hasil klasifikasi KNN menunjukan akurasi yang
lebih baik daripada hasil MKNN. Dari setiap pengujian fold juga terlihat bahwa hasil
akurasi yang lebih tinggi pada hasil klasifikasi KNN.
Pembahasan
Tahap ini akan membahas hasil dari pengujian dan evaluasi klasifikasi aksara Jawa
dengan menggunakan metode modified k nearest neighbor. Bisa dilihat pada point 4.4
dimana hasil rata – rata akurasi pengujian tertinggi berada pada pengujian di 7 fold
dengan nilai rata – rata 75,37%. Jumlah data latih pada 7 fold lebih banyak
dibandingkan dengan jumlah data latih pada fold lainnya yang membuat hasil rata –
rata akurasinya lebih baik dari hasil rata – rata fold lainya. Hal ini sejalan dengan
penelitian yang dilakukan oleh Bela,dkk (2017) yang menyatakan bahwa banyaknya
data latih akan mempengaruhi akurasi. Dimana, semakin banyak data latih akan
membuat hasil akurasi semakin tinggi.
Pada hasil pengujian dan evaluasi juga terlihat pengaruh dari nilai K yang
digunakan. Pada setiap hasil pengujian untuk seluruh fold , terlihat bahwa semakin
tinggi nilai k hasil akurasinya semakin menurun. Hal ini sejalan dengan penelitian yang
dilakukan oleh Bela, dkk (2017) yang menyatakan bahwa banyaknya K akan
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
63
berdampak pada hasil akurasi klasifikasi. Dimana , semakin kecil nilai K maka hasil
akurasi semakin baik. Sedangkan semakin besar nilai K maka hasil akurasi semakin
menurun. Hal ini terjadi karena, nilai K yang merupakan nilai tetangga jika semakin
banyak akan membuat memunculkan banyak pertimbangan dalam penentuan kelas.
Jika tetangga semakin sedikit maka jumlah tetangga yang dipertimbangkan semakin
sedikit. Pada representasi dengan menggunakan grafik untuk setiap pengujian, terlihat
bahwa hasil selalu konsisten menurun jika nilai k yang digunakan semakin tinggi.
Dalam perbandingan hasil akurasi terbaik dari MKNN dengan hasil akurasi
klasifikasi MKNN penambahan ciri dan tidak menggunakan thinning menunjukan hasil
bahwa akurasi tertinggi tetap didapatkan dari proses tanpa penambahan ciri dan
menggunakan thinning. Perubahan nilai a pada pembobotan / weight voting dengan
nilai a = 0,25 dan a=0,75 tidak menunjukkan perubahan yang signifikan. Hasil
perbandingan dari akurasi terbaik MKNN dengan KNN menunjjukan bahwa hasil
KNN pada kasus klasifikasi citra aksara jawa dengan ioc 3x3 piksel lebih tinggi dari
pada hasil MKNN. Hal ini tidak sejalan dengan penelitian yang dilakukan oleh Ravi,
dkk(2019) yang menunjukkan bahwa hasil MKNN lebih baik dari pada KNN.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
BAB 5 PENUTUP
Kesimpulan
Berdasarkan penelitian mengenai klasifikasi aksara Jawa menggunakan metode k-
nearest neighbor, dapat ditarik kesimpulan sebagai berikut:
1. Dalam klasifikasi aksara Jawa menggunakan metode k-nearest neighbor
dengan hasil akurasi 60% - 75% relatif cukup baik digunakan untuk
pengenalan aksara Jawa.
2. Hasil rata – rata akurasi terbaik didapatkan pada pengujian menggunakan k-
fold 7 dengan nilai 75,37%. Untuk rata – rata akurasi terendah berada pada k-
fold 3 dengan nilai 60,8473%.
3. Pada seluruh pengujian dengan k-fold 3, k-fold 5, dan k-fold 7, rata – rata hasil
dari setiap pengujian meningkat dari k-fold 3 hingga k-fold 7. Hal ini
menunjukkan bahwa semakin tinggi nilai k-fold yang digunakan akan
semakin baik hasil yang didapatkan.
4. Dari seluruh hasil akurasi dari setiap pengujian menggunakan nilai k tetangga
1, 3, 5, 7, dan 9. Terlihat bahwa akurasi tertinggi berada pada nilai k tetangga
= 1. Hal ini menunjukan bahwa semakin kecil nilai k tetangga akan
memberikan hasil yang lebih baik.
Saran
Untuk mengembangkan sistem klasifikasi aksara Jawa menggunakan metode k-
nearest neighbor agar semakin baik kedepan, maka perlu adanya saran sebagi berikut
:
1. Menambah beberapa proses tambahan pada preprocessing citra aksara Jawa
ini, karena masih ada beberapa citra yang memiliki hasil preprocessing kurang
maksimal.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
65
2. Mencoba menggunakan ekstraksi ciri selain IoC atau menggunakan ukuran
IoC lain seperti 4x4 piksel atau 5x5 piksel untuk mendapatkan nilai ciri yang
lebih baik.
3. Mengembangkan lagi sistem klasifikasi aksara Jawa ini ke aplikasi mobile
agar bisa digunakan secara umum oleh banyak orang
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
DAFTAR PUSTAKA
Bela, M., Putri, P., & Santoso, E. (2017). Diagnosis Penyakit Kulit Pada Kucing
Menggunakan Metode Modified K- Nearest Neighbor. 1(12), 1797–1803.
Berrar, D. (2018). Cross-validation. Data Science Laboratory, Tokyo Institute of
Technology, 1, 542–545.
Fakihatin, W., Nurul, H., & Perdana, R. S. (2017). Implementasi Algoritma Modified
K-Nearest Neighbor ( MKNN ) untuk Klasifikasi Penyakit Demam. Jurnal
Pengembangan Teknologi Informasi Dan Ilmu Komputer (J-PTIIK) Universitas
Brawijaya, 1(10), 1210–1219. http://j-ptiik.ub.ac.id/index.php/j-
ptiik/article/view/364/156
Iskandar, A. K., & Sariyun. (2014). Pepak basa Jawa : cara gampang sinau cepet lan
tuntas basa Jawa (Sariyun (ed.); Edisi Revi). Aswaja Pressindo.
Ravi, M. R., Indriati, & Adinugroho, S. (2019). Implementasi Algoritme Modified K-
Nearest Neighbor (MKNN) Untuk Mengidentifikasi Penyakit Gigi Dan Mulut.
Jurnal Pengembangan Teknologi Informasi Dan Ilmu Komputer, Vol. 3, 2596–
2602.
Widiarti, A. R. (2020). Unjuk kerja k-nearest neighbor untuk alihaksara citra aksara
Nusantara. Jurnal Teknologi Dan Sistem Komputer, 8.
Widiarti, A. R., & Himamunanto, A. R. (2013). Teori Dan Aplikasi Pengolahan Citra
Digital Transliterasi Otomatis Citra Dokumen Teks Aksara Jawa. In Lintang
Pustaka Utama.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
LAMPIRAN
• Sourcode Rotasi
- Deteksi Kemiringan
function [citraRotasi,teta] = deteksi_kemiringan
(aksara)
%UNTITLED3 Summary of this function goes here
% Detailed explanation goes here
tic
% data = crop_aksara(aksara);
teta = 0;
teta = cek_teta(aksara);
%
% %imcomplement
data_imcomplement = imcomplement(aksara);
% %rotasi
citra_rotasi = imrotate(data_imcomplement,-teta);
% %citra baru
citraRotasi = imcomplement(citra_rotasi);
%
toc
end
- Cek Teta
function teta = cek_teta( data)
%UNTITLED2 Summary of this function goes here
% Detailed explanation goes here
%crop gambar binner
%mencari sudut kemiringan
%baca tinggi dan lebar
brs = size(data,1);
klm = size(data,2);
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
68
%membuat variabel N,m,n
jum_N = 0;
jum_m = 0;
jum_n = 0;
%menentukan nilai m dan N
for i=1 : brs
for j=1 : klm
if data(i,j) == 0
jum_N = jum_N+1;
jum_m = jum_m+i;
jum_n = jum_n+j;
end
end
end
m_aksen = jum_m/jum_N;
n_aksen = jum_n/jum_N;
miu_11 = 0;
miu_20 = 0;
miu_02 = 0;
for i = 1:brs
for j = 1:klm
if data(i,j) == 0
miu_11 = miu_11+(i-m_aksen)*(j-n_aksen);
miu_20 = miu_20+(i-m_aksen)*(i-m_aksen);
miu_02 = miu_02+(j-n_aksen)*(j-n_aksen);
end
end
end
%menghitung teta
teta = 0.5*atand(2*miu_11/(miu_20 - miu_02));
% % imcomplement
% data_imcomplement = imcomplement(data);
% %rotasi
% citra_rotasi = imrotate(data_imcomplement,-teta);
% %citra baru
% citraRotasi = imcomplement(citra_rotasi);
end
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
69
• Sourcode Cropping
function char_baru=crop_aksara(char1)
hc=HorProj(char1); %%potong baris
vc=VerProj(char1); %%potong kolom
ulang=0;
i=1;
while (ulang==0 && i<size(vc,1))
if vc(i)>0
ulang=1;
atas=i;
end
i=i+1;
end
ulang=0;
i=size(vc,1);
while (ulang==0 && i>1)
if vc(i)>0
ulang=1;
bawah=i;
end
i=i-1;
end
ulang=0;
i=1;
while (ulang==0 && i<size(hc,1))
if hc(i)>0
ulang=1;
kiri=i;
end
i=i+1;
end
ulang=0;
i=size(hc,1);
while (ulang==0 && i>1)
if hc(i)>0
ulang=1;
kanan=i;
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
70
end
i=i-1;
end
%char_baru=char1(kiri:kanan+3,atas+3:bawah+3);
char_baru=char1(kiri:kanan,atas:bawah);
• Sourcode Rosenfeld
function thin=Rosenfeld(newImage)
%Modul untuk penipisan dengan metode NWG
citra=newImage;
citras=citra;%citras adalah citra yang dibuang pixel2nya,kmudian akan
dijadikan masukkan pada iterasi berikutnya
[baris,kolom]=size(citra);
objek=0; %objek=hitam=0
latar=1; %latar=putih=1
bantu_point_dihapus=0;
tic
N = 1; %var N merupakan var bantu untuk memutuskan apakah iterasi tetap
dilakukan, jika ada pixel yang diubah dari hitam ke putih maka nilai n akan
bertambah, maka jika n=0 iterasi dihentikan
while(N>0)
N=0;
bantu_point_dihapus=bantu_point_dihapus+1;
for i=1+1:baris-1
for j=1+1:kolom-1
if (citra(i,j)==objek & citra(i-1,j)==latar)%north, first subiteration
xhp=0; %nilai dari perhitungan xhp
b=0;
mat_xh(2,2)=citra(i,j); %p
mat_xh(2,3)=citra(i,j+1); %x1
mat_xh(3,3)=citra(i+1,j+1); %x2
mat_xh(3,2)=citra(i+1,j); %x3
mat_xh(3,1)=citra(i+1,j-1); %x4
mat_xh(2,1)=citra(i,j-1); %x5
mat_xh(1,1)=citra(i-1,j-1); %x6
mat_xh(1,2)=citra(i-1,j); %x7
mat_xh(1,3)=citra(i-1,j+1); %x8
xhp=simple(mat_xh);
b=bp(mat_xh);
if(b>1 & xhp==1)
citras(i,j)=latar;
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
71
N=N+1;
end
end
end
end
citra=citras;%isi citra kemudian diganti dengan citras yaitu citra yang udah
dibuang north bordernya, jadi inputan iterasi pada east border merupakan hasil
dari iterasi north border
for i=1+1:baris-1
for j=1+1:kolom-1
if (citra(i,j)==objek & citra(i,j+1)==latar)%east, second subiteration
xhp=0; %nilai dari perhitungan xhp
b=0;
mat_xh(2,2)=citra(i,j); %p
mat_xh(2,3)=citra(i,j+1); %x1
mat_xh(3,3)=citra(i+1,j+1); %x2
mat_xh(3,2)=citra(i+1,j); %x3
mat_xh(3,1)=citra(i+1,j-1); %x4
mat_xh(2,1)=citra(i,j-1); %x5
mat_xh(1,1)=citra(i-1,j-1); %x6
mat_xh(1,2)=citra(i-1,j); %x7
mat_xh(1,3)=citra(i-1,j+1); %x8
xhp=simple(mat_xh);
b=bp(mat_xh);
if(b>1 & xhp==1)
citras(i,j)=latar;
N=N+1;
end
end
end
end
citra=citras;%isi citra kemudian diganti dengan citras yaitu citra yang udah
dibuang north+east bordernya, jadi inputan iterasi pada south border merupakan
hasil dari iterasi north+east border
for i=1+1:baris-1
for j=1+1:kolom-1
if (citra(i,j)==objek & citra(i+1,j)==latar)%south, third subiteration
xhp=0; %nilai dari perhitungan xhp
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
72
b=0;
mat_xh(2,2)=citra(i,j); %p
mat_xh(2,3)=citra(i,j+1); %x1
mat_xh(3,3)=citra(i+1,j+1); %x2
mat_xh(3,2)=citra(i+1,j); %x3
mat_xh(3,1)=citra(i+1,j-1); %x4
mat_xh(2,1)=citra(i,j-1); %x5
mat_xh(1,1)=citra(i-1,j-1); %x6
mat_xh(1,2)=citra(i-1,j); %x7
mat_xh(1,3)=citra(i-1,j+1); %x8
xhp=simple(mat_xh);
b=bp(mat_xh);
if(b>1 & xhp==1)
citras(i,j)=latar;
N=N+1;
end
end
end
end
citra=citras;%isi citra kemudian diganti dengan citras yaitu citra yang udah
dibuang north+east+west bordernya, jadi inputan iterasi pada south border
merupakan hasil dari iterasi north+east+west border
for i=1+1:baris-1
for j=1+1:kolom-1
if (citra(i,j)==objek & citra(i,j-1)==latar)%west, fourth subiteration
xhp=0; %nilai dari perhitungan xhp
b=0;
mat_xh(2,2)=citra(i,j); %p
mat_xh(2,3)=citra(i,j+1); %x1
mat_xh(3,3)=citra(i+1,j+1); %x2
mat_xh(3,2)=citra(i+1,j); %x3
mat_xh(3,1)=citra(i+1,j-1); %x4
mat_xh(2,1)=citra(i,j-1); %x5
mat_xh(1,1)=citra(i-1,j-1); %x6
mat_xh(1,2)=citra(i-1,j); %x7
mat_xh(1,3)=citra(i-1,j+1); %x8
xhp=simple(mat_xh);
b=bp(mat_xh);
if(b>1 & xhp==1)
citras(i,j)=latar;
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
73
N=N+1;
end
end
end
end
citra=citras;%isi citra kemudian diganti dengan citras yaitu citra yang udah
dibuang north+east+west bordernya, jadi inputan iterasi pada south border
merupakan hasil dari iterasi north+east+west border
total_N(bantu_point_dihapus)=N;
end
toc
waktu=toc;
hapus=cumsum(total_N);
point_dihapus=hapus(end);
thin=citras;
runningTime=waktu;
• Sourcode MKNN
function hasilklasifikasi = mknn( datalatih,datauji,nilaik)
%UNTITLED3 Summary of this function goes here
% Detailed explanation goes here
%pemrosesan data latih
[baris, kolom] = size(datalatih);
hasil_euclideandatalatih = zeros(0,0);
for i=1:baris
for j=1:baris
hasil = 0;
for k=1:kolom-1
hasil = hasil + ((datalatih(i,k)-datalatih(j,k))^2);
end
hasil_euclideandatalatih(i,j) = sqrt(hasil);
end
end
hasil_euclideandatalatih;
[hasil_sorting,label] = sort(hasil_euclideandatalatih,2);
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
74
index = zeros(0,0);
baru = zeros(0,0);
for i = 1 : baris
for j = 1 : nilaik
index(i,1) = label(i,1);
baru(i,j) = label(i,(j+1));
end
end
kelas = datalatih(:,kolom).';
%menghitung validitas
validity = zeros(0,0);
for i = 1 : baris
for j = 1 : nilaik
label1 = index(i,1);
label2 = baru(i,j);
if(kelas(label1) == kelas(label2))
validity(i,j) = 1;
else
validity(i,j) = 0;
end
end
end
[brs klm] = size(validity);
nilaivalidity = zeros(0,0);
for i=1:brs
itungan = 0;
for j=1:klm
itungan = itungan + (1/nilaik*validity(i,j));
end
nilaivalidity(i,1) = itungan;
end
% %data latih dengan data uji
[bUji kUji] = size(datauji);
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
75
label = [];
for i=1:bUji
for j=1:baris
hasil = 0;
for k=1:kUji
data1 = datauji(i,k);
data2 = datalatih(j,k);
hasil = hasil + ((datauji(i,k)-datalatih(j,k))^2);
end
hasil_euclideandatauji(j,i) = sqrt(hasil);
end
end
%
%
% %weight voting
[bW kW] = size(hasil_euclideandatauji);
[bV kV] = size(nilaivalidity);
for i=1:bW
for j=1:kW
nk = hasil_euclideandatauji(i,j)+0.5;
wv(i,j) = nilaivalidity(i,j)* 1/nk;
end
end
[hasil_sortingakhir,labelakhir] = sort(wv,'descend');
[bL kL] = size(labelakhir);
for ii=1:nilaik
for jj=1:kL
nb_terdekat(jj,ii) = labelakhir(ii,jj);
%cekkelas
nb_kelas(ii,jj) = kelas(nb_terdekat(jj,ii));
end
end
labelbaru = mode(nb_kelas);
switch(labelbaru)
case 1
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
76
hasilklasifikasi = 'Data uji merupakan aksara Ha';
case 2
hasilklasifikasi = 'Data uji merupakan aksara Na';
case 3
hasilklasifikasi = 'Data uji merupakan aksara Ca';
case 4
hasilklasifikasi = 'Data uji merupakan aksara Ra';
case 5
hasilklasifikasi = 'Data uji merupakan aksara Ka';
case 6
hasilklasifikasi = 'Data uji merupakan aksara Da';
case 7
hasilklasifikasi = 'Data uji merupakan aksara Ta';
case 8
hasilklasifikasi = 'Data uji merupakan aksara Sa';
case 9
hasilklasifikasi = 'Data uji merupakan aksara Wa';
case 10
hasilklasifikasi = 'Data uji merupakan aksara La';
case 11
hasilklasifikasi = 'Data uji merupakan aksara Pa';
case 12
hasilklasifikasi = 'Data uji merupakan aksara Dha';
case 13
hasilklasifikasi = 'Data uji merupakan aksara Ja';
case 14
hasilklasifikasi = 'Data uji merupakan aksara Ya';
case 15
hasilklasifikasi = 'Data uji merupakan aksara Nya';
case 16
hasilklasifikasi = 'Data uji merupakan aksara Ma';
case 17
hasilklasifikasi = 'Data uji merupakan aksara Ga';
case 18
hasilklasifikasi = 'Data uji merupakan aksara Ba';
case 19
hasilklasifikasi = 'Data uji merupakan aksara Tha';
case 20
hasilklasifikasi = 'Data uji merupakan aksara Nga';
end
end
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
77
• Sourcode KNN
- runKNN
numfold = 7;
outputFinal=0;
for i = 1 : numfold
DataTr1 = datalatih{i};
DataTr = DataTr1(:,1:9);
LabelTr = DataTr1(:,10);
DataTest2 = datauji{i};
DataTest = DataTest2(:,1:9);
LabelTest = DataTest2(:,10);
[pjg,lwn]=size(DataTest);
tic;
for j = 1 : pjg
[output{i}(j),model{j}] = knn_Classification
(DataTr,LabelTr,DataTest(j,:),1);
end
toc;
[output2(i),Hasil{i}] = confusion_matrix(LabelTest,output{i}');
end
for i=1:7
outputFinal=outputFinal+output2(i);
end
outputFinal=outputFinal/7;
disp(outputFinal);
- knn_Classification
function [hasil,model] = knn_Classification(training,label,testing,k)
model=fitcknn(training,label,'NumNeighbors',k);
hasil=predict(model,testing);
end
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI