klasifikasi citra aksara jawa menggunakan metode

KLASIFIKASI CITRA AKSARA JAWA MENGGUNAKAN METODE

MODIFIED K-NEAREST NEIGHBOR

TUGAS AKHIR

Diajukan Untuk Memenuhi Salah Satu Syarat

Memperoleh Gelar Sarjana Komputer

Program Studi Informatika

Oleh :

Atanasius Ivannoel Rio Aji

175314060

Program Studi Informatika

Fakultas Sains dan Teknologi

Universitas Sanata Dharma

Yogyakarta

2021

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

ii

CLASSIFICATION OF JAVANESE CHARACTERS

USING THE MKNN METHOD

THESIS

Present as Partial Fulfillment of The Requirements

to Obtain Sarjana Komputer Degree

in Informatics Study Program

Created By :


175314060

INFORMATICS STUDY PROGRAM

INFORMATICS DEPARTMENT

FACULTY OF SCIENCE OF TECHNOLOGY

SANATA DHARMA UNIVERSITY

YOGYAKARTA

2021


iii

HALAMAN PERSETUJUAN PEMBIMBING

SKRIPSI

KLASIFIKASI CITRA AKSARA JAWA MENGGUNAKAN

METODE MODIFIED K-NEAREST NEIGHBOR

Oleh :


175314060

Telah Disetuji oleh :

Pembimbing


iv

HALAMAN PENGESAHAN

TUGAS AKHIR




v

HALAMAN PERSEMBAHAN

“Keberhasilan saya merupakan buah dari doa yang selalu dilambungkan oleh kedua

orang hebat dalam hidup saya yaitu orang tua. Perjuangan saya pada titik ini

merupakan ungkapan terimakasih yang sebesar – besarnya kepada orang tua yang

selalu mendoakan dan mendukung apa yang saya lakukan, terimakasih bapak dan

ibu”


vi

PERNYATAAN KEASLIAN KARYA

Saya menyatakan dengan sesungguhnya bahwa tugas akhir yang saya tulis tidak

mengandung atau memuat karya orang lain, kecuali yang telah disebutkan dalam

daftar pustaka dan kutipan selayaknya karya ilmiah.


vii

LEMBAR PERNYATAAN PERSETUJUAN PUBLIKASI KARYA ILMIAH

Yang bertanda tangan dibawah ini, saya mahasiswa Universitas Sanata Dharma:

Nama : Atanasius Ivannoel Rio Aji

NIM : 175314060

Demi pengembangan ilmu pengetahuan, saya memberikan kepada perpustakan

Universitas Sanata Dharma karya ilmiah yang berjudul:



Dengan demikian saya memberikan kepada perpustakaan Universitas Sanata Dharma

hak untuk menyimpan, mengalihkan dalam bentuk media lain, mengelolanya dalam

bentuk pangkalan data mendistribusikan secara terbatas, dan mempublikasikannya di

internet atau media lain untuk kepentingan akademis tanpa perlu meminta ijin dari saya

maupun memberikan royalty kepada saya selama tetap mencantumkan nama saya

sebagai penulis.

Demikian pernyataan ini saya buat dengan sebenarnya.

Dibuat di Yogyakarta,

Pada tanggal: 14 Juli 2021

Yang menyatakan,



viii

ABSTRAK

Aksara Jawa merupakan salah satu ragam budaya Indonesia yang saat ini

masih dikenal oleh banyak orang. Dibeberapa daerah , aksara Jawa masih digunakan

pada fasilitas umum, seperti papan nama jalan di sudut-sudut Kota Yogyakarta.

Namun, meski aksara Jawa dikenal oleh banyak orang, masih ada beberapa orang

yang tidak mengetahui arti atau cara membaca aksara Jawa. Peran teknologi sangat

dibutuhkan dalam pengenalan Aksara Jawa, yaitu dengan menggunakan klasifikasi

Modified K-Nearest Neighbor dalam klasifikasi aksara Jawa.

Metode ini merupakan perkembangan dari metode K-Nearest Neighbor,

dimana terdapat dua tambahan proses yaitu menghitung nilai Validitas dan

menghitung Wieght Voting. Evaluasi pada metode Modified K-Nearest Neighbor

menggunakan metode Cross Validation. Selain itu juga menggunakan variasi nilai

K pada Modified K-Nearest Neighbor, variasi ukuran Ekstraksi Ciri IoC, dan variasi

pada nilai K-Fold dalam Cross Validation. Dari penelitian ini didapatkan akurasi

terbaik sebesar 75,37% dengan mengguanakan nilai K-Fold 7.

Kata Kunci : Modified K-Nearest Neighbor, Klasifikasi, Aksara Jawa, Cross

Validation, Intensity of Character.


ix

ABSTRACT

Javanese script is one of the various Indonesian cultures that is still known

by many people. In some areas, Javanese script is still used in public facilities,

such as street signboards in the corners of the city of Yogyakarta. However,

although Javanese script is known by many people, there are still some people who

do not know the meaning or how to read Javanese script. The role of technology

is needed in the introduction of Javanese script, namely by using the Modified K-

Nearest Neighbor classification in the classification of Javanese characters.

This method is a development of the K-Nearest Neighbor method, where

there are two additional processes, namely calculating the Validity value and

calculating the Wieght Voting. Evaluation of the Modified K-Nearest Neighbor

method using the Cross Validation method. In addition, it also uses variations in

the value of K in the Modified K-Nearest Neighbor, variations in the size of IoC

Feature Extraction, and variations in the value of K-Fold in Cross Validation. From

this study, the best accuracy was obtained at 75.37% by using the K-Fold 7 value.

Keywords: Modified K-Nearest Neighbor, Classification, Javanese Script, Cross

Validation, Intensity of Character.


x

KATA PENGANTAR

Puji syukur penulis panjatkan kepada Tuhan Yang Maha Esa, atas berkat serta

rahmat karunianya penulis dapat menyelesaikan tugas akhir dengan judul “Klasifikasi

Citra Aksara Jawa Menggunakan Metode Modified K-Nearest Neighbor”. Tugas Akhir

ini merupakan syarat wajib untuk penulis agar mendapatkan gelar sarjana computer

program studi Informatika Universitas Sanata Dharma.

Penyelesaian tugas akhir ini tidak lepas dari dukungan oleh beberapa pihak

kepada penulis, oleh karena itu sudah layak dan sepantasnya penulis mengucapkan

terimakasih kepada :

1. Ibu Dr. Anastasia Rita Widiarti, M.kom. selakuk dosen pembimbing dalam

penyelesain tugas akhir yang selalu meluangkan waktunya untuk

memberikan semangat kepada penulis dalam mengerjakan tugas akhir serta

memberikan saran dan masukan dalam penyelesain tugas akhir penulis.

2. Bapak Sudi Mungkasi , S.Si., M.Math.Sc., Ph.D. selakuk dekan Fakultas

Sains dan Teknologi Universitas Sanata Dharma.

3. Seluruh dosen prodi Informatika Universitas Sanata Dharma serta dosen –

dosen yang terlibat dalam perkuliahan dengan mahasiswa prodi Informatika

Angkatan 2017 yang telah mendidik serta memberikan bekal ilmu untuk

penulis.

4. Kedua orang tua saya, Bapak Suyatno dan Ibu Sekolastika Ely Fajar Arianti

yang selalu mendukung serta selalu mendoakan penulis hingga penulis

dapat menyelesaikan Tugas Akhir dengan tepat waktu.

5. Kedua saudara saya, Kakak RD. Robertus Theo Elno Respati dan Adik

Veronika Ivannalia Aninda Putri yang selalu memberikan semangat dalam

proses penulis mengerjakan tugas akhir.

6. Saudari Bernadeta Rima Wulandari yang selalu menemani dalam

pengerjaan tugas akhir dan selalu memberi semangat dalam penyelesaian

tugas akhir penulis.


xi

7. Saudari Katharina Anggun yang selalu memberi saran masukan serta

mendegarkan keluh kesan penulis dalam pengerjaan tugas akhir.

8. Saudara Gabriel Ryan Prima, Joseph Hutagalung, Edrick Hernando, Agung

Krisnanto, dan Fransiska Apri Wulandari yang telah bersedia meluangkan

waktunya untuk berdiskusi tentang berbagai masalah dalam pengerjaan

tugas akhir penulis.

9. Teman – teman kluster Mesin Cerdas , “Jos Plo”, dan Campus Ministry

yang selalu memberikan hiburan dan dorongan agar segera menyelesaikan

tugas akhir.

10. Semua pihak yang tidak bisa disebutkan satu – satu yang telah membantu

atau terlibat dalam penulisan tugas akhir ini.

Penulis menyadari bahwa masih banyak kekurangan dalam tugas akhir ini, oleh

karena itu saran serta kritik yang membangun sangat penulis harapkan.

Akhirnya, semoga tugas akhir ini dapat bermanfaat bagi para pembaca dan

terkhusus kepada saya sebagai penulis.

Yogyakarta, 14 Juli 2021

Penulis



xii

DAFTAR ISI

HALAMAN PERSEMBAHAN ................................................................................... v

PERNYATAAN KEASLIAN KARYA ...................................................................... vi

LEMBAR PERNYATAAN PERSETUJUAN PUBLIKASI KARYA ILMIAH ....... vii

ABSTRAK ................................................................................................................. viii

ABSTRACT ................................................................................................................. ix

KATA PENGANTAR .................................................................................................. x

DAFTAR ISI ............................................................................................................... xii

DAFTAR TABEL ...................................................................................................... xiv

DAFTAR GAMBAR .................................................................................................. xv

BAB I PENDAHULUAN ........................................................................................... 16

Latar Belakang ............................................................................................. 16

Rumusan Masalah ........................................................................................ 18

Tujuan ........................................................................................................... 18

Manfaat Penelitian ........................................................................................ 18

Batasan Masalah ........................................................................................... 18

Sistematika Penulisan ................................................................................... 19

BAB 2 LANDASAN TEORI ...................................................................................... 21

Aksara Jawa .................................................................................................. 21

Pengertian Citra ............................................................................................ 21

Pemrosesan Citra Digital .............................................................................. 21

Preprocessing ................................................................................................ 22

Binarisasi Citra ...................................................................................... 22

Rotasi Citra ........................................................................................... 22

Penipisan Citra ...................................................................................... 22

Resize Citra ........................................................................................... 23

Ekstraksi Ciri ................................................................................................ 23


xiii

Modified K-Nearest Neighbor ...................................................................... 24

Perhitungan Jarak Euclidean ................................................................. 24

Perhitungan Nilai Validitas ................................................................... 25

Perhitungan Weighted Voting ............................................................... 27

Evaluasi ........................................................................................................ 29

Cross Validation .................................................................................... 29

BAB 3 METODOLOGI PENELITIAN ..................................................................... 30

Cara Mendapatkan Data ............................................................................... 30

Kebutuhan perangkat Hardware dan Software ............................................ 31

Validitas Data ............................................................................................... 32

Pemodelan Klasifikasi .................................................................................. 33

Preprocessing ........................................................................................ 34

Ekstraksi Ciri ......................................................................................... 36

Klasifikasi ............................................................................................. 37

Cara Analisis Data ........................................................................................ 45

Desain User Interface ................................................................................... 46

Input Tampilan ...................................................................................... 46

Output Tampilan ................................................................................... 46

BAB 4 HASIL PENELITIAN DAN ANALISIS ....................................................... 47

Peprocessing ................................................................................................. 47

Binerisasi ............................................................................................... 47

Rotasi Citra ........................................................................................... 47

Cropping ................................................................................................ 48

Resize Citra ........................................................................................... 49

Thinning ................................................................................................ 50

Ekstraksi Ciri dan Pembagian data ............................................................... 51

Pengujian dan Evaluasi ................................................................................ 53

Hasil pengujian dengan 3 fold Cross Validation .................................. 53




xiv

Data Uji Tunggal ................................................................................... 57

Perbandingan Hasil Akurasi ......................................................................... 60

Merubah Preprocessing dan Ekstraksi Ciri ........................................... 60

Hasil perbandingan dengan merubah nilai a ................................................ 61

Hasil Perbandingan dengan KNN ................................................................ 62

Pembahasan .................................................................................................. 62

BAB 5 PENUTUP ...................................................................................................... 64

Kesimpulan ................................................................................................... 64

Saran ............................................................................................................. 64

DAFTAR PUSTAKA ................................................................................................. 66

LAMPIRAN ................................................................................................................ 67

DAFTAR TABEL

Tabel 3. 1 Data Aksara Jawa ....................................................................................... 30

Tabel 3. 2 Hasil Ekstraksi Ciri .................................................................................... 37

Tabel 3. 3 Tabel Data Latih Data Citra ....................................................................... 39

Tabel 3. 4 Tabel Data Uji Data Citra .......................................................................... 39

Tabel 3. 5 Hasil Perthitungan Jarak Euclidean data Citra ........................................... 41

Tabel 3. 6 Hasil Nilai Validitas data latih ................................................................... 43

Tabel 3. 7 Hasil Eucliean data uji citra ....................................................................... 44

Tabel 3. 8 Hasil Weight Voting .................................................................................. 44

Tabel 3. 9 Hasil Penentuan Tetangga .......................................................................... 45 Tabel 4. 1 Kelas Aksara Jawa ..................................................................................... 51

Tabel 4. 2 Hasil Pengujian 3 fold ................................................................................ 53

Tabel 4. 3 Hasil pengujian 5 fold ................................................................................ 54

Tabel 4. 4 Hasil pengujian 7 fold ................................................................................ 56

Tabel 4. 5 Tabel Data Uji ............................................................................................ 57

Tabel 4. 6 Tabel Hasil Uji Tunggal ............................................................................. 59

Tabel 4. 7 Tabel Hasil Perbandingan Akurasi ............................................................ 60

Tabel 4. 8 Hasil Perbandingan Nilai a ........................................................................ 61

Tabel 4. 9 Hasil Perbandingan MKNN dan KNN....................................................... 62


xv

DAFTAR GAMBAR

Gambar 2. 1 3 Fold Cross Validation ......................................................................... 29

Gambar 3. 1 Salah Satu Sampel Data Aksara ............................................................. 31

Gambar 3. 2 Gambar Aksara Jawa .............................................................................. 32

Gambar 3. 3 Folder Kelas Citra Aksara Na ................................................................ 33

Gambar 3. 4 Pemodelan Klasifikasi Metode Modified K-Nearest Neighbor ............. 34

Gambar 3. 5 Desain alat uji Preprocessing ................................................................. 34

Gambar 3. 6 Alur MKNN ........................................................................................... 38

Gambar 4. 1 Hasil Binerisasi ...................................................................................... 47

Gambar 4. 2 Hasil Rotasi Citra ................................................................................... 48

Gambar 4. 3 Hasil Cropping ....................................................................................... 49

Gambar 4. 4 Hasil Resize ............................................................................................ 50

Gambar 4. 5 Hasil penipisan citra ............................................................................... 51

Gambar 4. 6 Pembagian data latih dengan 3 fold ....................................................... 52

Gambar 4. 7 Hasil pembagian data uji dengan 3 fold ................................................. 52

Gambar 4. 8 Grafik Akurasi 3 fold. ............................................................................ 54

Gambar 4. 9 Grafik Akurasi 5 fold. ............................................................................ 55

Gambar 4. 10 Grafik Akurasi 7 fold ........................................................................... 56


BAB I PENDAHULUAN

Latar Belakang

Indonesia terkenal dengan ragam budayanya, salah satunya adalah aksara. Hampir

seluruh suku di Indonesia memiliki aksaranya masing – masing. Salah satu aksara yang

cukup dikenal oleh banyak orang adalah Aksara Jawa. Aksara Jawa merupakan aksara

yang dimiliki oleh Suku Jawa. Aksara Jawa juga dikenal dengan sebutan Hanacaraka.

Pada aksara Jawa terdapat 20 aksara dasar, antara lain : Ha, Na, Ca, Ra, Ka, Da, Ta,

Sa, Wa, La, Pa, Dha, Ja, Nya, Ma, Ga, Ba, Tha, Nga.

Selain aksara dasar, aksara Jawa juga terdiri dari beberapa aksara lain , seperti

: Aksara Carakan, Aksara Pasangan, Aksara Swara, Aksara Rekan, Aksara Murda,

Aksara Wilangan, dan Sandangan. Setiap aksara tersebut memiliki fungsi tersendiri

dalam penyusunan sebuah kalimat dalam bentuk Aksara Jawa.

Aksara Jawa saat ini masih digunakan di beberapa daerah yang masih memegang

erat Budaya Jawa seperti Yogyakarta dan Solo. Di Yogyakarta, aksara Jawa dapat

dijumpai pada papan – papan nama jalan yang ada di Kota Yogyakarta. Selepas dari

penggunaannya pada fasilitas umum, aksara Jawa sendiri pada jaman dulu digunakan

pula untuk menulis perihal sistem pemerintahan jaman dahulu, sehingga saat ini masih

digunakan oleh kalangan tertentu seperti kalangan Kraton Yogyakarta. Biasanya,

aksara Jawa disimpan di museum – museum sebagai bentuk kekayaan budaya

nusantara, dan masih sedikit orang yang tau arti atau terjemahan dari setiap aksara

Jawa.

Oleh karena itu, peran teknologi sangat dibutuhkan dalam pengenalan aksara Jawa

dengan menggunakan metode klasifikasi. Pada penelitian tentang klasifikasi aksara

Jawa, penulis menggunakan metode klasifikasi Modified K-Nearest Neighbor

(MKNN). Metode MKNN merupakan metode klasifikasi pengembangan dari metode

K-Nearest Neighbor (KNN). Terdapat dua proses yang ditambahkan dalam metode

KNN sehingga menjadi MKNN yaitu perhitungan nilai validitas dan Weight Voting.


17

Penelitian terkait klasifikasi aksara Jawa sebelumnya sudah dilakukan oleh

Widiarti (2020) dengan menggunakan metode KNN dengan hasil rata – rata akurasi

bernilai 50% - 60%. Unjuk kerja dari metode MKNN sudah dilakukan oleh Ravi, dkk

(2019) telah melakukan perbandingan hasil akurasi dari metode MKNN dan KNN

dalam penelitian Implementasi Algoritme Modified K-Nearest Neighbor (MKNN)

Untuk Mengidentifikasi Penyakit Gigi Dan Mulut yang dimana hasil akurasi tertinggi

didapatkan dari metode MKNN dengan nilai sebesar 86,6% dan 76,66%. Pada

penelitian lain, Wafiyah, dkk (2017) juga mendapatkan akurasi sebesar 88,55% dalam

Implementasi Algoritma Modified K-Nearest Neighbor (MKNN) untuk Klasifikasi

Penyakit Demam. Bela, dkk (2017) pada penelitian Diagnosis Penyakit Kulit Pada

Kucing Menggunakan Metode Modified K- Nearest Neighbor juga mendapatkan hasil

akurasi terendah yang cukup baik yaitu sebesar 89.668%. Berdasarkan hasil akurasi

dari beberapa penelitian tentan metode MKNN tersebut, penulis ingin

mengimplementasikan metode tersebut pada kasus klasifikasi aksara Jawa.


18

Rumusan Masalah

1. Bagaimana mengimplementasikan metode klasifikasi Modified K-Nearest

Neighbor untuk sistem klasifikasi aksara Jawa?

2. Berapa besar tingkat akurasi metode klasifikasi Modified K-Nearest Neighbor

dalam proses klasifikasi aksara Jawa?

Tujuan

1. Mengimplementasi metode klasifikasi Modified K-Nearest Neighbor untuk

sistem klasifikasi aksara Jawa.

2. Mengetahui akurasi dari metode klasifikasi Modified K-Nearest Neighbor pada

proses klasifikasi aksara Jawa.

Manfaat Penelitian

1. Bagi peneliti, menambah pengetahuan peneliti tentang bagaimana penerapan

metode klasifikasi Modified K-Nearest Neigbor untuk sistem klasifikasi aksara

Jawa.

2. Bagi pihak – pihak yang bergerak pada pengembangan sistem klasifikasi atau

pengenalan aksara Jawa. Penelitian ini memberikan pandangan akan sebuah

metode yang dapat dipergunakan dalam membangun sebuah sistem klasifikasi

aksara Jawa.

Batasan Masalah

1. Data yang digunakan adalah citra dengan jumlah data 2.144 aksara.

2. Nilai k yang digunakan adalah K=1, K=3, K=5, K=7, K=9.

3. Nilai K-fold yang digunakan adalah K-fold=3, K-fold=5 , K-fold = 7.

4. Ekstraksi Ciri yang digunakan adalah metode IoC.


19

Sistematika Penulisan

BAB I : PENDAHULUAN

Pada bab ini berisikan tentang latar belakang penelitian, rumusan

masalah penelitian, tujuan masalah penelitian, batasan masalah

penelitian dan sistematika penulisan.

BAB 2 : LANDASAN TEORI

Pada bab ini berisikan tentang teori – teori yang digunakan peneliti yang

memiliki keterkaitan dengan penelitian yang dilakukan penulis. Seperti

pengertian proses – proses pengolahan citra yang digunakan dari

preprocessing hingga ekstraksi ciri, teori dasar dari metode Modified K-

Nearest Neighbor, hingga teori pengujian yang menggunakan K-fold

Cross Validation.

BAB 3 : METODOLOGI PENELITIAN

Pada bab ini berisikan penguraian dari metodologi penelitian yang

digunakan. Dari sumber data yang berasal dari mana hingga bagaimana

data tersebut diolah agar dapat diproses pada metode klasifikasi. Serta

terdapat contoh perhitungan manual dari metode klasifikasi MKNN

dengan data citra itu sendiri.

BAB 4 : HASIL PENELITIAN DAN ANALISIS

Pada bab ini berisikan penerapan sistem yang telah dirancang. Selain itu

menampilkan hasil pengujian dari beberapa metode pengujian yang

telah dirancang. Serta memberikan analisis dari hasil penelitian yang

sudah didapat.


20

BAB 5 : PENUTUP

Pada bab ini berisikan kesimpulan yang didapat dari penelitian dan

saran yang diberikan penulis agar penelitian ini dapat dikembangkan

lagi.


BAB 2 LANDASAN TEORI

Pada bab ini akan dipaparkan teori – teori yang digunakan dalam penelitian

ini. Mulai dari pengertian aksara jawa , pengertian citra, teori – teori pemrosesan citra

dari tahap pengolahan citra hingga ekstraksi ciri serta teori yang digunakan dalam

tahap klasifikasi MKNN itu sendiri.

Aksara Jawa

Aksara Jawa merupakan salah satu kekayaan Budaya Nusantara yang lahir dan

berkembang di Pulau Jawa. Aksara Jawa juga dikenal dengan Hanacaraka, Carakan,

atau Dentawyanjana (Wikipedia, 2020). Aksara ini memiliki 20 aksara dasar yaitu Ha,

Na, Ca, Ra, Ka, Da, Ta, Sa, Wa, La, Pa ,Dha, Ja, Ya, Nya, Ma, Ga, Ba, Tha, Nga.

Aksara ini pada jaman dulu aktif digunakan oleh masyarakat secara luas untuk tulisan

sehari - hari maupun sastra.

Pengertian Citra

Citra atau yang sering dikenal dengan gambar merupakan sebuah komponen

multimedia yang memberikan informasi dalam bentuk visual. Dalam matematis , citra

dinyatakan sebagai 0 < f (x,y) < karena citra merupakan fungsi kontinu dari intensitas

bidang dua dimensi (2D). Dalam dunia digital , citra didefinisikan sebagai citra f(x,y)

dengan nilai dalam koordinat bidang merupakan nilai diskrit. Citra digital tersusun dari

kumpulan titik atau elemen - elemen gambar yang disebut dengan piksel(picture

element) (Gonzalez, R.C. & Woods, R.E., 1992).

Pemrosesan Citra Digital

Pemrosesan Citra Digital atau Pengolahan Citra Digital merupakan suatu

pengolahan terhadap sebuah citra dengan menggunakan komputer. Pemrosesan Citra

dilakukan untuk memperbaiki sebuah citra agar mudah dimengerti atau diinterpretasi

oleh manusia atau mesin. Dasar dari pemrosesan citra adalah memodifikasi setiap titik

atau piksel pada citra sesuai dengan kebutuhan (Gonzalez, R.C. & Woods, R.E., 1992).


22

Preprocessing

Preprocessing adalah proses mempersiapkan data untuk bisa diolah sesuai

kebutuhan. Proses ini diperlukan karena tidak semua data yang disiapkan sudah bisa

digunakan sesuai kebutuhan.

Binarisasi Citra

Binarisasi merupakan tahap pengolahan pada tingkat piksel dimana terjadi

proses pemisahan antara objek pada citra dengan latar belakang yang tidak dibutuhkan.

Proses ini secara otomatis menentukan nilai ambang threshold yang berfungsi untuk

membagi citra menjadi dua bagian. Dua bagian tersebut adalah kelompok obyek dan

kelompok latar.

Rotasi Citra

Rotasi Citra merupakan proses untuk mengkoreksi kemiringan dari sebuah

citra. Sebuah citra yang akan dikoreksi kemiringannya akan dideteksi terlebih dahulu

tingkat kemiringannya (skew-detection). Proses deteksi kemiringan (skew-detection)

merupakan salah satu proses pengolahan citra untuk mendeteksi sudut kemiringan dari

suatu citra dokumen masukan sehingga dokumen tersebut dapat diperbaiki

kemiringannya berdasarkan sudut kemiringan yang didapatkan. Salah satu metode

dalam mendeteksi sudut kemiringan sebuah citra adalah metode pendekatan momen.

Pendekatan momen adalah pendekatan di mana untuk mengetahui seberapa besar

penyimpangan orientasi suatu obyek dengan sumbu utama dilakukan dengan

mempergunakan orientasi momen. Apabila besar sudut kemiringan (𝜃) citra dokumen

teks masukan sudah diperoleh, maka langkah selanjutnya adalah rotasi citra dengan

sudut rotasi sama dengan sudut (𝜃) (Widiarti & Himamunanto, 2013).

Penipisan Citra

Penipisan citra atau thinning merupakan proses reduksi sebuah citra menjadi

garis yang kira - kira merupakan garis tengah sehingga menghasilkan sebuah rangka

(skeleton). Tujuan dari penipisan adalah mereduksi komponen obyek citra menjadi


23

suatu informasi yang sifatnya esensial atau mendasar sehingga proses analisis lebih

lanjut dapat terfasilitasi. Ada beberapa algoritma dalam penerapan thinning salah

satunya adalah Algoritma Rosenfeld.

Resize Citra

Resize Citra merupakan proses pengubahan ukuran citra sesuai kebutuhan.

Tujuan dari proses ini adalah untuk menyamakan semua ukuran data dalam satu

ukuran, sehingga mempermudah dalam proses selanjutnya.

Ekstraksi Ciri

Ekstraksi ciri citra merupakan tahapan mengekstrak ciri / informasi dari objek di

dalam citra yang ingin dikenali / dibedakan dengan objek lainya. Proses mengekstrak

ciri berarti mencari sifat pola atribut dari setiap kelas (Widiarti & Himamunanto, 2013).

Salah metode ekstraksi ciri adalah Intensity of Character (IoC). IoC merupakan

metode ekstraksi ciri dengan membuat sebuah matriks dengan ukuran N x N, Dimana

setiap unit 1x1 nya berisikan n pixel hasil penjumlahan pixel yang bernilai 0 atau

berwarna hitam (Nugroho & Widiarti, 2016).

Berikut algoritma dari Ekstraksi Ciri :

• Input : citra hasil preprocessing, ukuran ciri

• Algoritma :

1. Baca ukuran dari data yang masuk

2. Set Variabel kolom dari lebar ukuran data


24

3. Baca ukuran dari data yang masuk

4. Set variabel kolom dari lebar ukuran data

5. Set variabel baris dari tinggi ukuran data

6. Bagi data sesuai ukuran ciri yang diinginkan

7. Cari piksel dengan nilai 0 disetiap bagian dan jumlahkan

8. Ulangi langkah 5 disetiap bagian , hingga mendapatkan

sejumlah n (ukuran ciri) ciri.

• Output : Matriks ciri NxN

Modified K-Nearest Neighbor

Algoritma Modified K-Nearest Neighbor (MKNN) merupakan pengembangan

dari algoritma KNN. Pengembangannya terletak pada penambahan beberapa proses

yaitu perhitungan nilai validitas dan perhitungan bobot.

Perhitungan Jarak Euclidean

Euclidean merupakan metode untuk mendefinisikan jarak antara dua titik yaitu

titik pada data training (x) dan titik pada data testing (y). Untuk mendapatkan jarak

Euclidean digunakan rumus seperti pada persamaan (2.1).

𝑑 (𝑥𝑖, 𝑦𝑖) = √∑ (𝑥𝑖 − 𝑦𝑖)2𝑛

𝑖=0

(2.1)

Dimana :

d(xi,yi) = Jarak Euclidean data xi dengan data yi.

xi = Data training ke – i.


25

yi = Data testing ke – i.

i = titik atau posisi data.

Berikut algoritma dari Jarak Euclidean :

• Input : data latih.

• Algoritma :

1. Lakukan perulangan untuk i = 1 sampai total data latih.

2. Lakukan perulangan untuk j = 1 sampai total data latih.

3. Buat variabel untuk menyimpan hasil jumlah euclidean = 0.

4. Lakukan perulangan untuk k = 1 sampai banyaknya atribut

pada data latih.

5. Set variabel jumlaheuclidean = jumlah euclidean ditambah

dengan kuadrat penjumlahan daru datalatih pada baris i dan

kolom j dikurangi datalatih pada baris j dan kolom y.

6. Buat variabel untuk menyimpan hasil Euclidean = akar jumlah

euclidean.

• Output : hasil nilai euclidean data latih

Perhitungan Nilai Validitas

Perhitungan nilai validitas merupakan tahap untuk mengvalidasi data training

dengan data tetangganya dengan melihat kesamaan kelas antara data training dengan

data tetangganya. Nilai Validitas didapat dengan persamaan 2.2.

𝑉𝑎𝑙𝑖𝑑𝑖𝑡𝑦(𝑥) =1

𝐻∑ 𝑆 (𝑙𝑏𝑙(𝑥), 𝑙𝑏𝑙(𝑁𝑖(𝑥)))

𝑛

𝑖=0

(2.2)


26

Dimana :

H : jumlah tetangga terdekat.

lbl x : kelas x.

lbl (Ni(x)) : label kelas titik terdekat dengan x.

Fungsi S digunakan untuk menghitung kesamaan antara titik x dan data

ke – i dari tetangga terdekat. Seperti terlihat pada persamaan 2.3

𝑆(𝑎, 𝑏) = {1, 𝑎 = 𝑏

0, 𝑎 ≠ 𝑏

(2.3)

Keterangan :

a = kelas a pada data training

b = kelas lain selain a pada data training

Berikut algoritma dari Nilai Validitas :

• Input : data euclidean data latih dan nilai k


27

• Algoritma :

1. Lakukan perulangan untuk i = 1 sampai jumlah data euclidean

data latih.

2. Lakukan sorting terhadap data euclidean data latih.

3. Lakukan perulangan untuk j = 1 sampai nilai k – 1,

4. Lakukan perulangan untuk x= j+1 sampai nilai k.

5. Cek apakah Datalatih [indexurutvalidataslatih[j]] [diagnosis] =

datalatih [indexurutvaliditaslatih[x]] [diagnosis].

6. Set K [ j ] = 1.

7. Set K [ x ] = 1.

8. Jumlahkan seluruh nilai pada variable K.

9. Buat variabel validitas ke I = sum/nilai k.

• Output : Nilai validitas data latih.

Perhitungan Weighted Voting

Perhitungan Weighted Voting merupakan tahap untuk mencari bobot masing –

masing tetangga yang dihitung dengan menggunakan rumus 1 / (de + 0.5). Kemudian,

validitas dari tiap data pada data training dikalikan dengan bobot berdasarkan pada

jarak Euclidian, sehingga Weighted Voting didapat dengan menggunakan persamaan

2.4.


28

𝑊(𝑖) = 𝑉𝑎𝑙𝑖𝑑𝑖𝑡𝑦(𝑖)𝑥 1

𝑑𝑒 + 𝑎

(2.4)

Dimana :

W(i) = Perhitungan bobot atau Weight Voting

Validity(i) = Nilai Validitas

de = Jarak Euclidian

𝑎 = 0.5

Hasil perhitungan Weighted Voting memiliki peran yang terpenting

terhadap klasifikasi data uji dengan data training yang memiliki nilai validitas

lebih tinggi dan dekat dengan data.

Berikut algoritma dari Weighted Voting :

• Input : Data euclidean data uji dan Nilai validitas data latih

• Algoritma :

1. Lakukan perulangan untuk i = 1 sampai dengan jumlah data

latih.

2. Lakukan perulangan unutk j = 1 sampai dengan jumlah data

uji.

3. Buat variabel untuk menyimpan Weight Voting kemudian set

variabel tersebut dengan nilai validitas data pada baris ke i dan

kolom j dikalikan satu per nilai euclidean data uji pada baris ke

i dan kolom j.

• Output : Weight Voting.


29

Evaluasi

Evaluasi merupakan sebuah proses penilain suatu kinerja algoritma. Terdapat dua

hal yang dinilai yaitu penilaian hasil kinerja algoritma dan hasil akurasi algoritma.

Dalam penilaian hasil kinerja algortima menggunakan metode Cross Validation.

Cross Validation

Cross validation merupakan salah satu metode untuk mengevaluasi dan

membandingkan proses belajar (learning) dari sebuah algoritma. Metode ini membagi

data menjadi dua bagian , yaitu data training dan data testing. Cross validation serupa

dengan metode subsampling acak yang diulang, tetapi pengambilan sampel dilakukan

sedemikian rupa sehingga tidak ada dua set pengujian yang tumpang tindih. Dalam k-

fold cross-validation, set pembelajaran yang tersedia dipartisi menjadi k subset yang

terpisah dengan ukuran yang kira-kira sama (Berrar, 2018). Berikut adalah gambaran

dari k-fold cross validation dengan k = 3.

Gambar 2. 1 3 Fold Cross Validation


BAB 3 METODOLOGI PENELITIAN

Pada bab ini akan dipaparkan tentang metodologi penelitian yang dilakukan.

Dari bagaimana mendapatkan data, kebutuhan perangkat yang digunakan baik

perangkat keras maupun lunak, proses pengolahan data dari validasi data hinnga data

bisa diolah pada klasifikasi, skenario pengujian, hingga rancangan desain antar muka

yang akan digunakan dalam penelitian ini.

Cara Mendapatkan Data

Dalam penelitian ini, data Aksara Jawa diperoleh dari

https://www.kaggle.com/phiard/aksara-Jawa . Jumlah data yang tersedia sebanyak

2.154 data Aksara Jawa tulis tangan, dengan setiap aksara memiliki jumlah data yang

berbeda – beda. Berikut adalah rincian data dari Kaggle :

Tabel 3. 1 Data Aksara Jawa

Aksara Jumlah Data

Ha 102

Na 108

Ca 108

Ra 108

Ka 108

Da 108

Ta 108

Sa 108

Wa 108

La 108

Pa 108

Dha 108

Ja 108

Ya 108

Nya 108

Ma 108

Ga 108

Ba 114

Tha 108

Nga 102


https://www.kaggle.com/phiard/aksara-jawa

31

Gambar 3. 1 Salah Satu Sampel Data Aksara

Kebutuhan perangkat Hardware dan Software

a) Spesifikasi Hardware

1. Processor AMD A9-9420 RADEON R5

2. RAM 8 Gb

3. Hardisk 1 Terra (HDD) + 120 Gb (SDD)

b) Spesifikasi Software

1. Sistem Operasi Windows 10

2. MATLAB R2014b


32

Validitas Data

Tahap validitas data dilakukan untuk mengecek validitas dari data aksara disetiap

kelas. Pengecekan ini dilakukan secara manual yaitu dengan menggunakan indra

penglihatan peneliti. Pengecekan dilakukan dengan membandingkan citra aksara Jawa

dari data penelitian dengan gambar aksara Jawa dari Buku Pepak Basa Jawa. Berikut

adalah gambar aksara Jawa dari Buku Pepak Basa Jawa.

Gambar 3. 2 Gambar Aksara Jawa pada Buku Pepak Basa Jawa (Iskandar &

Sariyun,2014)

Dari pengecekan melaui pengamatan secara manual, didapati ada citra aksara

Jawa yang tidak sesuai kelas aksaranya dengan nama folder kelas aksara Jawa. Folder

kelas tersebut adalah aksara Na. Berikut isi dari folder kelas aksara Na.


33

Gambar 3. 3 Folder Kelas Citra Aksara Na

Terdapat 6 data Aksara Jawa Ka pada folder kelas aksara Na seperti yang terlihat

pada kotak bergaris merah. Aksara yang berbeda tersebut tidak digunakan pada

penelitian, sehingga total data yang digunakan pada penelitian ini yang mulanya 2.154

aksara menjadi 2.148 data aksara Jawa.

Pemodelan Klasifikasi

Metode klasifikasi MKNN berjalan dengan menyiapkan data latih dengan

diberikan proses perhitungan jarak euclidean dan nilai validitas. Setelah mendapatkan

nilai validitas dari setiap data latih, proses akan berlanjut untuk data uji yaitu dengan

mecari jarak euclidean data uji dengan data latih serta menghitung nilai weight voting.

Sebelum data uji maupun data latih bisa diolah pada MKNN , data – data tersebut harus

diproses pada tahap preprocessing hingga ekstraksi ciri. Secara garis besar, model dari

proses klasifikasi MKNN dari data yang berupa citra hingga muncul akurasi seperti

pada gambar 3.4.


34

Gambar 3. 4 Pemodelan Klasifikasi Metode Modified K-Nearest Neighbor

Pada Gambar 3.4 terlihat ada proses model yang mana pada menghasilkan nilai

validitas dari setiap data latih. Kemudian hasil dari model tersebut digunakan untuk

proses klasifikasi data citra uji dan selanjutnya dicari akurasi dengan menghitung

berapa data citra uji yang diklasifikasikan dengan benar.

Preprocessing

Data Aksara Jawa yang berupa citra akan masuk pada proses Preprocessing

agar data bisa diolah untuk diambil ekstraksi ciri sebelum dibagi menjadi data training

dan data testing. Berikut adalah alur dari proses Preprocessing.

Gambar 3. 5 Desain alat uji Preprocessing


35

• Binerisasi

Citra yang masuk merupakan citra dengan jenis citra gambar

atau citra RGB (Red Green Blue). Citra RGB tersebut harus diubah

menjadi citra biner agar dapat diolah pada proses selanjutnya. Citra

biner akan menghasilkan dua nilai pada setiap pixelnya yaitu bernilai

1 untuk warna putih dan bernilai 0 unutk warna hitam. Dalam

penelitian ini, data Aksara Jawa yang digunakan sudah memiliki

warna hitam dan putih. Namun, Citra dari aksara tersebut masih

termasuk citra RGB. Oleh karena itu perlu proses Binerisasi. Penulis

akan menggunakan fungsi binerisasi dari MATLAB yaitu im2bw.

• Rotate Image

Rotate image bertujuan untuk memperbaiki data citra yang

miring. Sehingga citra yang dihasilkan pada tahap ini sudah pada

posisi lurus. Proses Rotate image menggunakan Proses Normalisasi

Orientasi. Proses Normalisasi Orientasi bertujuan mendeteksi sudut

kemiringan dari sebuah citra. Kemudian memperbaiki citra tersebut

denga melihat sudut kemiringan yang sudah didapat.

• Cropping

Setelah diolah pada tahap Binerisasi tahap Preprocessing

selanjutnya adalah Cropping. Pada tahap ini, citra akan memotong

bagian yang kosong sehingga objek pada citra lebih menonjol.

Metode cropping yang digunakan dalam penelitian ini menggunakan

fungsi MATLAB yaitu imcrop.

• Resize Citra

Citra yang sudah melalui tahap Cropping akan diubah

ukurannya dengan tujuan agar memiliki ukuran yang sama. Pada


36

penelitian ini, penulis menggunakan fungsi resize citra dari

MATLAB yaitu imresize.

• Thinning

Pada tahap ini citra akan ditipiskan dengan menggunakan

algoritma Rosenfeld. Rosenfeld bekerja dengan menghilangkan garis

bagian tepi (edge) pada citra.

Ekstraksi Ciri

Tahap Ekstraksi Ciri merupakan tahap untuk mendapatkan ciri dari setiap citra

aksara yang telah diproses pada preproccesing. Ciri inilah yang akan membantu proses

pengenalan aksara pada tahap klasifikasi aksara. Metode ekstraksi ciri yang digunakan

adalah Intensity of Character(Ioc). Berikut adalah algoritma dari metode IoC.

Penelitian tentang klasifikasi aksara Jawa ini hanya menggunakan IoC dengan ukuran

3x3 piksesl.

Metode IoC menghitung piksel yang berwarna hitam atau bernilai 0 pada setiap

bagian citra. Bagian citra tersebut dibagi berdasarkan ukuran ioc yang dimasukan. Jika

ukuran IoC yang dimasukan adalah 3, maka citra akan dibagi menjadi 9 bagian.

Ekstraksi ciri IoC akan menghasilkan sebuah matriks dengan ukuran NxN. Agar bisa

digunakan pada tahap selanjutnya yaitu tahap klasifikasi, matriks yang awalnya

berukuran NxN harus diubah menjadi matriks dengan ukuran 1xN. Berikut representasi

dari hasil IoC dari data citra aksara Jawa yang sudah berukuran 1x9 (karena

menggunakan IoC berukuran 3x3).


37

Tabel 3. 2 Hasil Ekstraksi Ciri

Ciri Kelas

1 2 3 4 5 6 7 8 9

41 40 28 23 20 37 42 40 21 1

42 37 18 20 23 35 37 41 37 1

36 40 18 23 20 14 48 40 30 1

29 32 20 19 46 27 26 32 30 2

29 33 21 19 44 27 26 32 30 2

9 34 12 29 41 21 8 34 6 2

22 22 30 23 23 47 25 40 22 3

19 24 27 23 24 44 23 40 20 3

9 32 22 41 17 37 14 40 30 3

Tabel diatas merupakan representasi dari hasil ekstraksi ciri IoC dari aksara Ha yang

ditunjukan dengan kelas 1, aksara Na yang ditunjukan dengan kelas 2, dan aksara Ca

yang ditunjukan dengan kelas 3. Hasil Ekstraksi Ciri yang berupa angka inilah yang

akan digunakan untuk tahap klasifikasi.

Klasifikasi

Melakukan klasifikasi data dengan menggunakan metode klasifikasi Modified

K – Nearest Neighbor. Disini ada dua data yang digunakan yaitu data uji dan data latih.

Data uji merupakan data yang belum memiliki label aksara. Sehingga pada tahap ini,

data uji tersebut diklasifikasi dengan data latih yang sudah memiliki label aksara.

Kemudian didapatkan hasil klasifikasi yang berupa label aksara dari data uji. Pada

gambar 3.4 sudah terlihat alur dari klasifikasi metode MKNN dari data berupa citra

hingga akurasi. Namun secara lebih detail, alur dari metode MKNN dapat dilihat pada

gambar 3.6


38

Gambar 3. 6 Alur MKNN

Dari Gambar 3.6 metode MKNN mendapat inputan data latih citra yang merupakan

data hasil ekstraksi ciri. Data latih yang sudah berupa angka tersebut dihitung jaraknya

antar data latih dengan metode jarak euclidean. Setiap data latih akan mendapatkan

hasil jarak dengan data latih lainnya, dimana akan diambil sejumlah k tetangga

terdekat. K merupakan variabel untuk menentukan berapa jumlah tetangga yang harus

diambil. Setelah mendapatkan sejumlah k tetangga dilakukanlah perhitungan nilai

validitas.

Nilai validitas yang dijelaskan pada bab 2.6.2 akan melihat kesamaan kelas data

latih dengan kelas tetangga terdekatnya, jika kelas sama akan mendapat nilai 1 dan jika

kelasnya berbeda akan mendapat nilai 0. Setelah berproses pada data latih, metode

MKNN akan memulai menghitung jarak antar data latih dengan data uji. Hasil dari

perhitungan jarak tersebut digunakan untuk mencari Weight Voting. Pada persamaan

2.4 terlihat bahwa weight voting didapatkan dari perhitungan hasil jarak euclidean data

latih dan data uji serta nilai validitas data latih.

Setelah mendapatkan nilai weight voting akan dicari sejumlah k tetangga dengan

nilai weight voting paling tinggi. Penentuan kelas data uji didapatkan dengan melihat

kelas dominan yang ada pada sejumlah k data dengan nilai weight voting tertinggi.

Berikut adalah contoh perhitungan manual metode Modified K-Nearest Neighbor

dengan data dummy.


39

Tabel 3. 3 Tabel Data Latih Data Citra

Citra Ciri Kelas

1 2 3 4 5 6 7 8 9

41 40 28 23 20 37 42 40 21 1

42 37 18 20 23 35 37 41 37 1

29 32 20 19 46 27 26 32 30 2

29 33 21 19 44 27 26 32 30 2

22 22 30 23 23 47 25 40 22 3

19 24 27 23 24 44 23 40 20 3

Tabel 3. 4 Tabel Data Uji Data Citra

Citra Ciri

Kelas 1 2 3 4 5 6 7 8 9

36 40 18 23 20 14 48 40 30 1

Pada tabel diatas terdapat 9 ciri dari setiap data yang akan digunakan sebagai data

dummy untuk perhitungan manual MKNN. Terdapat 3 kelas yang digunakan yaitu

kelas 1 untuk aksara Ha, kelas 2 untuk aksara Na, dan kelas 3 untuk aksara Ca.

1. Menghitung Jarak Euclidean data latih

Perhitungan Jarak Euclidean antar data latih menggunakan rumus seperti

persamaan (2.1). Proses perhitungan jarak Euclidean dimulai dengan :


40

• Menghitung jarak Data latih 1 dengan 6 data latih lainya :

D(1,1)

=√

(41 − 41)2 + (40 − 40)2 + (28 − 28)2

+(23 − 23)2 + (20 − 20)2

+(37 − 37)2 + (42 − 42)2 + (40 − 40)2 + (21 − 21)2

= 0

D (1,2)

=√

(41 − 42)2 + (40 − 37)2 + (28 − 18)2

+(23 − 20)2 + (20 − 23)2

+(37 − 35)2 + (42 − 37)2 + (40 − 41)2 + (21 − 37)2

= 20,3470

D (1,3)

=√

(41 − 29)2 + (40 − 32)2 + (28 − 20)2

+(23 − 19)2 + (20 − 46)2

+(37 − 27)2 + (42 − 26)2 + (40 − 32)2 + (21 − 30)2

= 38,2753

D (1,4)

=√

(41 − 29)2 + (40 − 33)2 + (28 − 21)2

+(23 − 19)2 + (20 − 44)2

+(37 − 27)2 + (42 − 26)2 + (40 − 32)2 + (21 − 30)2

= 36,5377


41

D (1,5)

=√

(41 − 22)2 + (40 − 22)2 + (28 − 30)2

+(23 − 23)2 + (20 − 23)2

+(37 − 47)2 + (42 − 25)2 + (40 − 40)2 + (21 − 22)2

= 32,9848

D (1,6)

=√

(41 − 19)2 + (40 − 24)2 + (28 − 27)2

+(23 − 23)2 + (20 − 24)2

+(37 − 44)2 + (42 − 23)2 + (40 − 40)2 + (21 − 20)2

= 34,1760

Untuk data latih ke 2 hingga data latih ke 6 diperlakukan cara yang sama seperti data

latih 1, sehingga didapatkan hasil jarak Euclidean untuk data latih seperti tabel 3.5.

Tabel 3. 5 Hasil Perthitungan Jarak Euclidean data Citra

Pada tabel 3.5 terlihat bahwa terdapat hasil yang bernilai 0. Hasil 0 tersebut

menunjukan perhitungan jarak data latih terhadap dirinya sendiri, sehingga bernilai 0.

Data ke 1 2 3 4 5 6 Kelas

1 0,0000 20,3470 38,2753 36,5377 32,9848 34,1760 1

2 20,3470 0,0000 32,2955 30,8383 35,9444 36,8239 1

3 38,2753 32,2955 0,0000 2,4495 36,3731 34,2783 2

4 36,5377 30,8383 2,4495 0,0000 35,1710 33,0908 2

5 32,9848 35,9444 36,3731 35,1710 0,0000 6,3246 3

6 34,1760 36,8239 34,2783 33,0908 6,3246 0,0000 3


42

Selain itu hasil untuk jarak Euclidean data latih ke 1 dengan 2 akan sama hasilnya

dengan jarak Euclidean data latih ke 2 dengan 1. Hal ini berlaku ke semua data latih.

2. Mencari nilai validitas data latih

Nilai validitas didapatkan dengan persamaan (2.2). Sebelum menghitung nilai

validitas, langkah sebelumnya adalah mencari tetangga terdekat dari setiap data latih.

Tetangga terdekat merupakan data dengan jarak Euclidean yang nilainya mendekati 0.

Jumlah tetannga yang dipilih tergantung dengan nilai K. Pada contoh ini , nilai K yang

digunakan adalah 3. Jadi, akan diambil 3 data yang memiliki nilai Euclidean mendekati

0 untuk setiap data latih.

• 3 tetangga terdekat data pertama adalah 2, 5, 6

• 3 tetangga terdekat data kedua adalah 1, 4, 3

• 3 tetangga terdekat data ketiga adalah 4, 2, 6

• 3 tetangga terdekat data keempat adalah 3, 2, 6

• 3 tetangga terdekat data kelima adalah 6, 1, 4

• 3 tetangga terdekat data keenam adalah 5, 4, 1

Setelah mendapatkan 3 tetangga untuk setiap data latih, selanjutnya masuk

ketahap mencari nilai validitas dengan melihat kelas dari setiap data tetangga yang ada.

Jika kelas data latih sama dengan kelas tetangganya akan mendapatkan nilai 1, jika

berbeda akan mendapatkan nilai 0, sehingga hasil dari perhitungan nilai validitas

seperti tabel 3.6.


43

Tabel 3. 6 Hasil Nilai Validitas data latihD

Data K = 1 K = 2 K = 3 Nilai Validitas

1 1 0 0 0.333

2 1 0 0 0.333

3 1 0 0 0.333

4 1 0 0 0.333

5 1 0 0 0.333

6 1 0 0 0.333

Pada tabel 3.6 nilai validitas untuk semua datalatih adalah 0.333. Hal ini menunjukan

bahwa hanya ada 1/3 dari tetangga untuk setiap data latih yang kelas tetangga

terdekatnya sama dengan data latih itu sendiri.

3. Menghitung Jarak Euclidean data uji dengan data latih

Perhitungan jarak Euclidean data uji dengan data latih sama dengan perhitungan jarak

Euclidean data latih. Perbedaanya terletak pada data yang digunakan yaitu data uji

dengan data latih. Hasil yang didapat dari perhitungan tahap ini terlihat pada tabel

3.7.


44

Tabel 3. 7 Hasil Eucliean data uji citra

Data Uji

Latih 1 27,7669

Latih 2 25,9808

Latih 3 39,0640

Latih 4 37,6298

Latih 5 48,5283

Latih 6 47,6130

Hasil pada tabel 3.6 dan 3.7 diatas akan digunakan untuk menghitung weight voting

pada tahap berikutnya.

4. Menghitung Weight Voting

Perhitungan Weight Voting menggunakan persamaan 2.4, sehingga diperoleh hasil

seperti tabel 3.8.

Tabel 3. 8 Hasil Weight Voting

Data Weight Voting

1 0,01167

2 0,01246

3 0,00834

4 0,00865

5 0,00673

6 0,00686

5. Menentukan label dari data uji

Penentuan label dilakukan dengan mencari nilai terbesar dari hasil Weight

Voting. Banyaknya nilai terbesar bergantung pada nilai k, misal nilai k = 3 jumlah

data terbesar yang diambil adalah tiga nilai Weight Voting terbesar.


45

Tabel 3. 9 Hasil Penentuan Tetangga

Data Tetangga Weight Voting Kelas

1 0,01246 1

2 0,01167 1

3 0,00865 2

Dari hasil tetangga terdekat tersebut, terlihat dari 3 tetangga yang mendominasi

adalah kelas 1, sehingga klasifikasi aksara untuk data uji tersebut adalah kelas 1.

Dimana kelas 1 merupakan kelas untuk aksara Jawa Ha. Jadi, aksara prediksi dari hasil

klasifikasi adalah Ha. Hasil prediksi aksara uji ini sesuai dengan kelas aksara asalnya

yaitu Ha (Tabel 3.4).

Cara Analisis Data

Analisis data yang dilakukan yaitu dengan melihat hasil akurasi terbaik. Hasil

akurasi didapatkan dengan metode Cross fold Validation. Metode ini akan membagi

data menjadi dua data yaitu data latih dan data uji seperti pada penjelasan bab 2.7.1.

Pada pengujian ini akan menggunakan 3 nilai fold yaitu 3 fold, 5 fold, dan 7 fold.

Sedangkan untuk nilai k pada metode Modified K-Nearest Neighbor yang dilakukan

menggunakan 4 nilai k antara lain K=1, K=3, K=5, K=7, dan K=9.

Sesudah mendapatkan akurasi terbaik dari nilai K dan k-fold, hasil tersebut

dibandingkan dengan akurasi dari hasil klasifikasi dengan menambahkan 2 ciri yaitu

ukuran citra pada proses ekstraksi ciri, hasil klasifikasi tanpa adanya proses thinning

dan hasil klasifikasi dengan mengubah nilai 𝑎 dengan nilai 0,25 dan 0,75. Hasil

klasifikasi terbaik dari skenario tersebut akan digunaakn untuk pegujian data tunggal

dan hasil klasifikasi dari skenario terbaik akan dibandingkan dengan hasil klasifikasi

menggunakan metode KNN.


46

Desain User Interface

Desain user interface ini digunakan untuk melihat kinerja metode MKNN pada

kasus klasifikasi aksara Jawa dengan data tunggal. Desain dapat dilihat pada gambar

3.9.

Gambar 3.9 Desain UI Uji

Input Tampilan

3.1.1. Langkah awal dalam penggunaan interface ini adalah mengklik button

Input Data Citra untuk memasuk data citra yang akan diklasifikasi.

3.1.2. Klik Mulai Klasifikasi untuk memulai proses klasifikasi Aksara Jawa

pada sistem.

Output Tampilan

Output dari tampilan adalah klasfikasi dari aksara Jawa yang berupa teks


BAB 4 HASIL PENELITIAN DAN ANALISIS

Pada bab Hasil Penelitian dan Analisis akan memaparkan hasil dari pemrosesan

citra aksara Jawa dari preprocessing hingga pengujian Klasifikasi Aksara Jawa dengan

menggunakan metode Modified K-Nearest Neighbor.

Peprocessing

Seperti yang dijelaskan pada bab sebelumnya bahwa preprocessing merupakan

tahap untuk menyipakan data agar dapat menghasilkan data yang mudah diolah

saat klasifikasi.

Binerisasi

Binerisasi dilakukan menggunakan fungsi dari MATLAB yaitu im2bw().

Berikut adalah gambar sebelum dan sesudah citra mendapatkan proses binerisasi:

Citra asli

Citra hasil biner

Gambar 4. 1 Hasil Binerisasi

Pada gambar 4.1 jika dilihat tidak ada perubahan yang mencolok dari citra asli

menjadi citra biner. Namun, jika dilihat dari keterangan value, nampak bahwa citra asli

yang awalnya berupa uint 8 ketika diproses binerisasi menjadi citra logical.

Rotasi Citra

Pada tahap ini citra yang telah diubah menjadi citra biner akan dideteksi

kemiringannya. Hasil deteksi kemiringan atau yang disebut teta akan digunakan


48

sebagai sudut acuan dalam melakukan rotasi citra. Rotasi citra dilakukan menggunakan

fungsi dari MATLAB yaitu imrotate(). Berikut hasil dari proses rotasi image:

Citra Sebelum Rotasi

Citra Sesudah Rotasi

Gambar 4. 2 Hasil Rotasi Citra

Pada gambar 4.2 terlihat bahwa citra sebelum rotasi terlihat lebih naik dibagian

kanan. Setelah dilakukan proses rotasi citra terlihat citra aksara sudah lebih lebih sejajar

dari pada citra sebelum dirotasi.

Cropping

Croping merupakan tahap untuk membuang ruang yang kosong pada citra hasil

rotasi, dengan tujuan agar menonjolkan objek yang ada pada citra. Proses Cropping

menggunakan metode proyeksi profile. Hasil dari proses cropping terlihat pada gambar

4.3.


49

Citra sebelum cropping

Citra sesudah cropping

Gambar 4. 3 Hasil Cropping

Gambar 4.3 menunjukkan hasil dari cropping citra, dimana citra yang awalnya

memiliki ruang putih yang cukup banyak dihilangkan hingga hanya tersisa objek citra

aksara itu sendiri. Ruang putih atau pixel putih yang hilang pada citra akan berpengaruh

pada ukuran citra itu sendiri, seperti yang ditunjukan pada value masing – masing citra

pada Gambar 4.3. Value tersebut menunjukan informasi ukuran citra sebelum cropping

dan sesudah cropping, dimana ukuran setelah dicropping menjadi lebih kecil dari pada

ukuran awalnya.

Resize Citra

Tahap Resize Citra merupakan kelanjutan dari tahap cropping, dimana citra

yang sudah di cropping akan diubah ukurannya. Perubahan ukuran pada tahap ini

bertujuan agar semua citra memiliki ukuran citra yang sama. Resize Citra

menggunakan fungsi dari MATLAB yaitu imresize. Ukuran yang dipilih adalah 60 x

60 pixel. Hasilnya terlihat seperti pada Gambar 4.4


50

Citra Sebelum Resize memiliki

ukuran 129x159 pixel

Citra Sesudah Cropping

dengan ukuran 60x60 pixel

Gambar 4. 4 Hasil Resize

Hasil resize pada gambar 4.4 menunjukan ukuran dari citra asli yang diubah

menjadi 60 x 60 piksel. Perubahan ini juga diberlakukan sama ke semua data citra,

sehingga pada akhirnya seluruh data citra yang diolah pada proses preproccesing

memiliki ukuran yang sama yaitu 60 x 60 piksel.

Thinning

Setelah citra mendapatkan proses resize, maka selanjutnya masuk pada proses

Thinning atau penipisan. Proses ini merupakan proses untuk medapatkan kerangka dari

citra dengan membuang pixel bagian tepi dari citra tersebut. Proses Thinning pada

proses ini menggunakan metode Rosenfeld. Hasil dari penipisan terlihat pada gambar

4.5.


51

Citra awal

Citra hasil penipisan

Gambar 4. 5 Hasil penipisan citra

Setelah didapatkan kerangka citra pada proses ini, data citra akan masuk pada

proses ekstrasi ciri.

Ekstraksi Ciri dan Pembagian data

Proses ekstraksi ciri dengan metode IoC yang menggunakan ukuran 3 x 3 piksel.

Hasil dari ekstraksi ciri akan sama seperti pada Tabel 3.2, dimana akan ada 9 ciri yang

digunakan dalam proses klasifikasi. Perbedaannya pada kolom kelas akan ada 20 kelas

aksara Jawa yang misalkan dalam bentuk angka. Angka tersebut menunjukan urutan

dari Aksara Jawa itu sendiri. Pemilihan angka sebagai kelas bertujuan untuk

mempermudah nanti ketika melakukan perbandingan kelas hasil prediksi dengan kelas

asal.

Tabel 4. 1 Kelas Aksara Jawa

Kelas Nama

Aksara

Kelas Nama

Aksara

Kelas Nama

Aksara

Nama Kelas

Aksara

1 Ha 6 Da 11 Pa 16 Ma

2 Na 7 Ta 12 Dha 17 Ga

3 Ca 8 Sa 13 Ja 18 Ba

4 Ra 9 Wa 14 Ya 19 Tha

5 Ka 10 La 15 Nya 20 Nga

Data ekstraksi ciri itulah yang akan dibagi menjadi data latih dan data uji.

Pembagian data menggunakan metode k-fold cross validation dimana jumlah data latih

dan data uji sesuai dengan nilai fold yang digunakan. Misal nilai fold yang digunakan


52

adalah 3, maka data ekstraksi ciri yang berjumlah 2148 akan dibagi menjadi 3 fold

untuk data latih dan data uji. Data yang masuk ke dalam data latih adalah 2/3 data yang

berarti data latih akan memiliki data berjumlah 1432 data. Data yang masuk ke dalam

data uji adalah 1/3 data yang berarti jumlah data ujinya adalah 713. Berikut adalah hasil

pembagian data menggunakan 3 fold:

Gambar 4. 6 Pembagian data latih dengan 3 fold

Gambar 4. 7 Hasil pembagian data uji dengan 3 fold

Gambar 4.6 menunjukan data latih 3 fold dimana untuk setiap fold memiki 1432

data latih. Begitu juga dengan Gambar 4.2 menunjukan data uji 3 fold dimana setiap

fold memiliki 716 data uji.

Untuk nilai fold 5 dan 7 juga sama aturanya yaitu membagi data sebanyak nilai

fold yang dimasukan. Misal fold 5 maka data akan dibagi menjadi 1/5 dari jumlah

seluruh data. Begitu juga dengan nilai fold 7, data akan dibagi menjadi 1/7 dari jumlah

seluruh data. Pada pembagian dengan menggunakan k fold Cross Validation ini setiap

fold akan menyimpan lebih dari 2 data untuk setiap kelas aksara. Sehingga ketika

melakukan pengujian dapat dipastikan semua kelas aksara ada didalam data uji maupun

didalam data latih.


53

Pengujian dan Evaluasi

Pengujian pada klasifikasi Modified K-Nearest Neighbor menggunakan beberapa

variasi pengujian. Untuk nilai K pada Modified K-Nearest Neighbor menggunakan

nilai K = 1,3,5,7, dan 9. Penentuan K didasarkan pada jumlah data untuk setiap kelas

yang di range 102 – 115. Sehingga diambil nilai akar 100 yang hasilnya adalah 10.

Maka, nilai K yang digunakan hanya mencapai 9. Ukuran citra aksara Jawa yang

digunakan berukuan 60 x 60 piksel. Ekstraksi ciri dari IoC hanya menggunakan ukuran

3x3. Kemudian untuk fold yang digunakan adalah 3-fold, 5-fold, dan 7-fold.

Hasil pengujian dengan 3 fold Cross Validation

Pada pengujian 3 fold cross validation dengan 1432 data latih dan 716 data uji

untuk setiap foldnya menunjukan hasil seperti pada tabel 4.2 :

Tabel 4. 2 Hasil Pengujian 3 fold

Nilai K Hasil Pengujian

Rata - rata Data uji 1 Data uji 2 Data uji 3

1 72,486 63,9665 68,1564 68,2029

3 72,3464 63,4075 68,1564 67,9701

5 69,9721 62,2905 66,7598 66,3408

7 63,2682 60,3352 63,5475 62,3836

9 62,1508 59,6369 60,7542 60,8473

Pada tabel 4.2 terlihat hasil rata – rata akurasi tertinggi pada nilai k = 1 dengan

nilai 68,2029 %. Untuk hasil rata – rata akurasi terendah berada pada nilai k = 9 dengan

nilai 60,8473%. Dari tabel 4.2 juga terlihat bahwa nilai k semakin tinggi akan

mengurangi nilai rata – rata akurasi. Hal ini bisa dilihat lebih jelas pada gambar grafik

4.8.


54

Gambar 4. 8 Grafik Akurasi 3 fold.

Dari gambar grafik 4.8 lebih jelas penurunan nilai akurasi ketika nilai k bertambah.

Pada pengujian 3 fold ini rentang dari akurasi berkisar 60 % hingga 68 %.


Pada pengujian 5 fold cross validation jumlah data untuk data latih dan data uji

disetiap foldnya berbeda. Fold data 1 sampai 4 memiliki jumlah data latih sebanyak

1713 dan jumlah data uji sebanyak 435. Sedangkan fold data 5 memiliki jumlah data

latih sebanyak 1740 dan data uji sebanyak 408. Dari pengujian menggunakan 5 fold

tersebut didapati hasil seperti pada tabel 4.3.

Tabel 4. 3 Hasil pengujian 5 fold

Nilai K Hasil Pengujian

Rata - rata Data Uji 1 Data Uji 2 Data Uji 3 Data Uji 4 Data Uji 5

1 72,8736 74,2529 70,5747 69,4253 74,0196 72,2292

3 73,3333 69,4253 69,8851 70,3448 70,5882 70,7153

5 76,3218 63,2184 69,4253 68,2579 65,9314 68,6310

7 72,1839 66,4368 70,5747 68,5057 63,7255 68,2853

9 67,3563 61,1494 69,8851 65,0575 57,1078 64,1112


55

Dari tabel 4.3 terlihat bahwa nilai akurasi tertinggi berada pada k 1 dan pada data

uji 5 dengan nilai 76,3218 %. Sedangkan nilai akurasi terendah berada pada k 9 pada

data uji 5 dengan nilai 57,1078%. Representasi lain dari hasil akurasi fold 5 tampak

pada gambar grafik 4.9

Gambar 4. 9 Grafik Akurasi 5 fold.

Dari pengujian dengan 5 fold masih terlihat bahwa semakin besar nilai k semakin

menurun pula hasil akurasinya. Namun, pada grafik rata – rata terlihat bahwa nilai rata

– rata akurasi dari k 5 ke k 7 mengalami perubahan yang tidak terlalu signifikan. Hal

ini berbeda dengan pengujian 3 fold. Dimana pada 3 fold grafik rata – rata akurasi

terlihat turun jauh dari setiap hasil pengujian untuk nilai k nya, sedangkan pada 5 fold

terjadi penurunan dari k 1 sampai k 5 namun pada hasil akurasi k 7 tidak begitu turun

jauh dari hasil akurasi pada k 5. Secara keseluruhan , hasil dari setiap pengujian untuk

nilai k pada fold 5 ini menunjukan penurunan ketika nilai k nya semakin naik.


56


Pada pengujian 7 fold cross validation jumlah data untuk data latih dan data uji

disetiap foldnya berbeda. Fold data 1 sampai 6 memiliki jumlah data latih sebanyak

1847 dan jumlah data uji sebanyak 301. Sedangkan fold data 5 memiliki jumlah data

latih sebanyak 1806 dan data uji sebanyak 342. Dari pengujian menggunakan 7 fold

tersebut didapati hasil sebagai berikut :

Tabel 4. 4 Hasil pengujian 7 fold

Nilai

K

Hasil Pengujian Rata -

rata 1 2 3 4 5 6 7

1 75,75 76,74 67,11 73,09 73,75 85,38 75,73 75,37

3 78,41 70,43 67,11 73,75 72,09 81,06 75,15 74,00

5 75,75 65,45 67,44 73,42 68,77 78,41 71,93 71,60

7 73,75 63,46 70,10 74,75 69,77 72,76 67,25 70,26

9 69,44 64,12 62,46 76,41 67,77 70,10 63,45 67,68

Dari tabel 4.12 terlihat bahwa nilai akurasi tertinggi berada pada k 1 dan pada data

uji 6 dengan nilai 85,38%. Sedangkan nilai akurasi terendah berada pada k 9 pada data

uji 3 dengan nilai 62,46%. Representasi dari hasil akurasi pengujian dengan 7 fold

tampak gambar grafik 4.10.

Gambar 4. 10 Grafik Akurasi 7 fold


57

Dari pengujian dengan 7 fold masih terlihat bahwa semakin besar nilai k semakin

menurun pula hasil akurasinya. Namun, pada fold 7 ini terjadi peningkatan hasil rata

– rata akurasi dari pengujian fold sebelumnya. Dimana, pada fold 7 ini hanya ada satu

hasil rata – rata akurasi dibawah 70%. Selain itu, juga terlihat hasil akurasi pengujian

banyak yang bernilai diatas 70%. Hal ini juga diperkuat dari hasil rata – rata akurasi

yang ditunjukan pada grafik 4.5. Dimana nilai rata – rata akurasi mencapai 75,37% dan

rata – rata akurasi terendah 67,68%.

Data Uji Tunggal

Berdasarkan pengujian dengan menggunakan Cross Fold Validation yang

menunnjukan bahwa hasil akurasi terbaik menggunakan nilai k sama dengan 1. Oleh

karena itu, dilakukanlah uji tunggal menggunakan GUI dengan data uji sebagai berikut

:

Tabel 4. 5 Tabel Data Uji

No. Aksara Citra Aksara

1 Ha

2 Na

3 Ca

4 Ra

5 Ka

6 Da


58


7 Ta

8 Sa

9 Wa

10 La

11 Pa

12 Dha

13 Ja

14 Ya

15 Nya

16 Ma

17 Ga


59


18 Ba

19 Tha

20 Nga

Dari data uji diatas didapatkan hasil sebagai berikut:

Tabel 4. 6 Tabel Hasil Uji Tunggal

Data Uji Label Citra Label Prediksi Keterangan

1 Ha Ha Benar

2 Na Na Benar

3 Ca Ca Benar

4 Ra Ra Benar

5 Ka Ta Salah

6 Da Na Salah

7 Ta Ha Salah

8 Sa Ca Salah

9 Wa Dha Salah

10 La Ta Salah

11 Pa Wa Salah

12 Dha Dha Benar

13 Ja Da Salah

14 Ya Ya Benar

15 Nya Nya Benar

16 Ma Wa Salah

17 Ga Ga Benar

18 Ba Ba Benar

19 Tha Tha Benar

20 Nga Nga Benar


60

Berdasarkan Tabel 4.6 menunjukan bahwa 11 data uji dapat diprediksi dengan

benar dan 9 data uji diprediksi salah. Akurasi yang didapatkan untuk data uji tunggal

ini sebesar 55%, dengan hasil seperti itu metode MKNN ini hanya mampu mengenali

11 citra aksara jawa dalam data uji.

Perbandingan Hasil Akurasi

Rata – rata akurasi tertinggi dari percobaan dengan menggunakan Cross Fold

Validataion mendapatkan rata – rata 75,3655 dengan nilai K = 1 dan k-fold = 7. Hasil

ini dibandingkan dengan hasil dari klasifikasi menggunakan tambahan ciri ukuran,

tanpa menggunakan thinning, ,mengubah nilai a, dan dengan hasil klasifikasi KNN.

Merubah Preprocessing dan Ekstraksi Ciri

Hasil akurasi perbandingan dari hasil akurasi terbaik pada poin 4.3.3

dibandingkan dengan hasil akurasi klasifikasi dengan tambahan ciri, hasil akurasi

klasifikasi tanpa thining, dan hasil akurasi klasifikasi tanpa thining serta tambahan ciri.

Hasilnya terlihat pada Tabel 4.7.

Tabel 4. 7 Tabel Hasil Perbandingan Akurasi

Hasil Pengujian

Pengujian 1 2 3 4 5 6 7 Rata -

Rata

A 75,7475 76,7442 67,1096 73,0897 73,7542 85,3821 75,731 75,3655

B 79,7342 75,4153 65,1163 65,7807 71,0963 76,7442 71,0526 72,1342

C 76,7442 78,7375 66,4452 67,1096 77,4086 82,0598 69,883 74,05541

D 77,7409 80,3987 61,794 68,1063 77,7409 81,7276 71,345 74,1219

Pengujian A merupakan pengujian dengan menggunakan skenario awal. Pengujian

B merupakan proses klasifikasi MKNN sama dengan pengujian A namun pada ada

penambahan ciri pada ekstraksi ciri, dimana ekstraksi ciri yang awalnya hanya


61

memiliki 9 ciri ditambah 2 ciri yang didapatkan dari ukuran citra sehingga menjadi 11

ciri. Pengujian C merupakan pengujian sama dengan pengujian A namun terdapat

penghilangan proses thinning pada tahap preprocessing. Pengujian D merupakan

pengujian dengan skenario gabungan dari pengujian A, B, dan C, dimana ada

penambahan ciri pada ekstraksi ciri dan tidak menggunakan proses thinning pada tahap

preprocessing.

Dari hasil perbandingan pengujian pada Tabel 4.7 terlihat bahwa pengujian A

memiliki akurasi yang lebih tinggi dari pada pengujian lain. Hal ini menunjukkan

bahwa dalam penelitian ini penambahan ciri ukuran dan penghilangan proses thinning

pada preprocessing membuat akurasi dari klasifikasi ini turun.

Hasil perbandingan dengan merubah nilai 𝒂

Nilai 𝑎 merupakan nilai pembagi dalam perhitungan bobot atau Weight Voting.

Nilai 𝑎 yang digunakan di hasil klasifikasi terbaik pada poin 4.3.3 yaitu 0,5. Hasil

tersebut dibandingkan dengan hasil klasifikasi jika nilai 𝑎 0,25 dan nilai 𝑎 0,75,

sehingga hasilnya perbandingannya terlihat pada Tabel 4.8

Tabel 4. 8 Hasil Perbandingan Nilai 𝑎

Hasil Pengujian

Pengujian

Nilai 𝑎 1 2 3 4 5 6 7

Rata -

Rata

0,5 75,7475 76,7442 67,1096 73,0897 73,7542 85,3821 75,731 75,3655

0,25 75,7475 76,7442 67,1096 73,0897 73,7542 85,3821 75,731 75,3655

0,75 75,7475 76,7442 67,1096 73,0897 73,7542 85,3821 75,731 75,3655

Dari Tabel 4.8 terlihat bahwa perubahan nilai 𝑎 pada proses pembobotan / Weight

Voting tidak menunjukkan perubahan yang signifikan bahkan bisa dikatakan sama.


62

Hasil Perbandingan dengan KNN

Hasil perbandingan klasifikasi MKNN dan KNN untuk kasus klasifikasi aksara

jawa ini terlihat pada Tabel 4.9

Tabel 4. 9 Hasil Perbandingan MKNN dan KNN

Hasil Pengujian

Pengujian 1 2 3 4 5 6 7 Rata -

Rata

MKNN 75,7475 76,7442 67,1096 73,0897 73,7542 85,3821 75,731 75,3655

KNN 76,0797 79,4020 76,4120 74,4186 81,0631 86,7110 75,7310 78,5453

Dari Tabel 4.9 terlihat bahwa hasil klasifikasi KNN menunjukan akurasi yang

lebih baik daripada hasil MKNN. Dari setiap pengujian fold juga terlihat bahwa hasil

akurasi yang lebih tinggi pada hasil klasifikasi KNN.

Pembahasan

Tahap ini akan membahas hasil dari pengujian dan evaluasi klasifikasi aksara Jawa

dengan menggunakan metode modified k nearest neighbor. Bisa dilihat pada point 4.4

dimana hasil rata – rata akurasi pengujian tertinggi berada pada pengujian di 7 fold

dengan nilai rata – rata 75,37%. Jumlah data latih pada 7 fold lebih banyak

dibandingkan dengan jumlah data latih pada fold lainnya yang membuat hasil rata –

rata akurasinya lebih baik dari hasil rata – rata fold lainya. Hal ini sejalan dengan

penelitian yang dilakukan oleh Bela,dkk (2017) yang menyatakan bahwa banyaknya

data latih akan mempengaruhi akurasi. Dimana, semakin banyak data latih akan

membuat hasil akurasi semakin tinggi.

Pada hasil pengujian dan evaluasi juga terlihat pengaruh dari nilai K yang

digunakan. Pada setiap hasil pengujian untuk seluruh fold , terlihat bahwa semakin

tinggi nilai k hasil akurasinya semakin menurun. Hal ini sejalan dengan penelitian yang

dilakukan oleh Bela, dkk (2017) yang menyatakan bahwa banyaknya K akan


63

berdampak pada hasil akurasi klasifikasi. Dimana , semakin kecil nilai K maka hasil

akurasi semakin baik. Sedangkan semakin besar nilai K maka hasil akurasi semakin

menurun. Hal ini terjadi karena, nilai K yang merupakan nilai tetangga jika semakin

banyak akan membuat memunculkan banyak pertimbangan dalam penentuan kelas.

Jika tetangga semakin sedikit maka jumlah tetangga yang dipertimbangkan semakin

sedikit. Pada representasi dengan menggunakan grafik untuk setiap pengujian, terlihat

bahwa hasil selalu konsisten menurun jika nilai k yang digunakan semakin tinggi.

Dalam perbandingan hasil akurasi terbaik dari MKNN dengan hasil akurasi

klasifikasi MKNN penambahan ciri dan tidak menggunakan thinning menunjukan hasil

bahwa akurasi tertinggi tetap didapatkan dari proses tanpa penambahan ciri dan

menggunakan thinning. Perubahan nilai a pada pembobotan / weight voting dengan

nilai a = 0,25 dan a=0,75 tidak menunjukkan perubahan yang signifikan. Hasil

perbandingan dari akurasi terbaik MKNN dengan KNN menunjjukan bahwa hasil

KNN pada kasus klasifikasi citra aksara jawa dengan ioc 3x3 piksel lebih tinggi dari

pada hasil MKNN. Hal ini tidak sejalan dengan penelitian yang dilakukan oleh Ravi,

dkk(2019) yang menunjukkan bahwa hasil MKNN lebih baik dari pada KNN.


BAB 5 PENUTUP

Kesimpulan

Berdasarkan penelitian mengenai klasifikasi aksara Jawa menggunakan metode k-

nearest neighbor, dapat ditarik kesimpulan sebagai berikut:

1. Dalam klasifikasi aksara Jawa menggunakan metode k-nearest neighbor

dengan hasil akurasi 60% - 75% relatif cukup baik digunakan untuk

pengenalan aksara Jawa.

2. Hasil rata – rata akurasi terbaik didapatkan pada pengujian menggunakan k-

fold 7 dengan nilai 75,37%. Untuk rata – rata akurasi terendah berada pada k-

fold 3 dengan nilai 60,8473%.

3. Pada seluruh pengujian dengan k-fold 3, k-fold 5, dan k-fold 7, rata – rata hasil

dari setiap pengujian meningkat dari k-fold 3 hingga k-fold 7. Hal ini

menunjukkan bahwa semakin tinggi nilai k-fold yang digunakan akan

semakin baik hasil yang didapatkan.

4. Dari seluruh hasil akurasi dari setiap pengujian menggunakan nilai k tetangga

1, 3, 5, 7, dan 9. Terlihat bahwa akurasi tertinggi berada pada nilai k tetangga

= 1. Hal ini menunjukan bahwa semakin kecil nilai k tetangga akan

memberikan hasil yang lebih baik.

Saran

Untuk mengembangkan sistem klasifikasi aksara Jawa menggunakan metode k-

nearest neighbor agar semakin baik kedepan, maka perlu adanya saran sebagi berikut

:

1. Menambah beberapa proses tambahan pada preprocessing citra aksara Jawa

ini, karena masih ada beberapa citra yang memiliki hasil preprocessing kurang

maksimal.


65

2. Mencoba menggunakan ekstraksi ciri selain IoC atau menggunakan ukuran

IoC lain seperti 4x4 piksel atau 5x5 piksel untuk mendapatkan nilai ciri yang

lebih baik.

3. Mengembangkan lagi sistem klasifikasi aksara Jawa ini ke aplikasi mobile

agar bisa digunakan secara umum oleh banyak orang


DAFTAR PUSTAKA

Bela, M., Putri, P., & Santoso, E. (2017). Diagnosis Penyakit Kulit Pada Kucing

Menggunakan Metode Modified K- Nearest Neighbor. 1(12), 1797–1803.

Berrar, D. (2018). Cross-validation. Data Science Laboratory, Tokyo Institute of

Technology, 1, 542–545.

Fakihatin, W., Nurul, H., & Perdana, R. S. (2017). Implementasi Algoritma Modified

K-Nearest Neighbor ( MKNN ) untuk Klasifikasi Penyakit Demam. Jurnal

Pengembangan Teknologi Informasi Dan Ilmu Komputer (J-PTIIK) Universitas

Brawijaya, 1(10), 1210–1219. http://j-ptiik.ub.ac.id/index.php/j-

ptiik/article/view/364/156

Iskandar, A. K., & Sariyun. (2014). Pepak basa Jawa : cara gampang sinau cepet lan

tuntas basa Jawa (Sariyun (ed.); Edisi Revi). Aswaja Pressindo.

Ravi, M. R., Indriati, & Adinugroho, S. (2019). Implementasi Algoritme Modified K-

Nearest Neighbor (MKNN) Untuk Mengidentifikasi Penyakit Gigi Dan Mulut.

Jurnal Pengembangan Teknologi Informasi Dan Ilmu Komputer, Vol. 3, 2596–

2602.

Widiarti, A. R. (2020). Unjuk kerja k-nearest neighbor untuk alihaksara citra aksara

Nusantara. Jurnal Teknologi Dan Sistem Komputer, 8.

Widiarti, A. R., & Himamunanto, A. R. (2013). Teori Dan Aplikasi Pengolahan Citra

Digital Transliterasi Otomatis Citra Dokumen Teks Aksara Jawa. In Lintang

Pustaka Utama.


LAMPIRAN

• Sourcode Rotasi

- Deteksi Kemiringan

function [citraRotasi,teta] = deteksi_kemiringan

(aksara)

%UNTITLED3 Summary of this function goes here

% Detailed explanation goes here

tic

% data = crop_aksara(aksara);

teta = 0;

teta = cek_teta(aksara);

%

% %imcomplement

data_imcomplement = imcomplement(aksara);

% %rotasi

citra_rotasi = imrotate(data_imcomplement,-teta);

% %citra baru

citraRotasi = imcomplement(citra_rotasi);

%

toc

end

- Cek Teta

function teta = cek_teta( data)



%crop gambar binner

%mencari sudut kemiringan

%baca tinggi dan lebar

brs = size(data,1);

klm = size(data,2);


68

%membuat variabel N,m,n

jum_N = 0;

jum_m = 0;

jum_n = 0;

%menentukan nilai m dan N

for i=1 : brs

for j=1 : klm

if data(i,j) == 0

jum_N = jum_N+1;

jum_m = jum_m+i;

jum_n = jum_n+j;

end

end

end

m_aksen = jum_m/jum_N;

n_aksen = jum_n/jum_N;

miu_11 = 0;

miu_20 = 0;

miu_02 = 0;

for i = 1:brs

for j = 1:klm

if data(i,j) == 0

miu_11 = miu_11+(i-m_aksen)*(j-n_aksen);

miu_20 = miu_20+(i-m_aksen)*(i-m_aksen);

miu_02 = miu_02+(j-n_aksen)*(j-n_aksen);

end

end

end

%menghitung teta

teta = 0.5*atand(2*miu_11/(miu_20 - miu_02));

% % imcomplement

% data_imcomplement = imcomplement(data);

% %rotasi

% citra_rotasi = imrotate(data_imcomplement,-teta);

% %citra baru

% citraRotasi = imcomplement(citra_rotasi);

end


69

• Sourcode Cropping

function char_baru=crop_aksara(char1)

hc=HorProj(char1); %%potong baris

vc=VerProj(char1); %%potong kolom

ulang=0;

i=1;

while (ulang==0 && i<size(vc,1))

if vc(i)>0

ulang=1;

atas=i;

end

i=i+1;

end

ulang=0;

i=size(vc,1);

while (ulang==0 && i>1)

if vc(i)>0

ulang=1;

bawah=i;

end

i=i-1;

end

ulang=0;

i=1;

while (ulang==0 && i<size(hc,1))

if hc(i)>0

ulang=1;

kiri=i;

end

i=i+1;

end

ulang=0;

i=size(hc,1);

while (ulang==0 && i>1)

if hc(i)>0

ulang=1;

kanan=i;


70

end

i=i-1;

end

%char_baru=char1(kiri:kanan+3,atas+3:bawah+3);

char_baru=char1(kiri:kanan,atas:bawah);

• Sourcode Rosenfeld

function thin=Rosenfeld(newImage)

%Modul untuk penipisan dengan metode NWG

citra=newImage;

citras=citra;%citras adalah citra yang dibuang pixel2nya,kmudian akan

dijadikan masukkan pada iterasi berikutnya

[baris,kolom]=size(citra);

objek=0; %objek=hitam=0

latar=1; %latar=putih=1

bantu_point_dihapus=0;

tic

N = 1; %var N merupakan var bantu untuk memutuskan apakah iterasi tetap

dilakukan, jika ada pixel yang diubah dari hitam ke putih maka nilai n akan

bertambah, maka jika n=0 iterasi dihentikan

while(N>0)

N=0;

bantu_point_dihapus=bantu_point_dihapus+1;

for i=1+1:baris-1

for j=1+1:kolom-1

if (citra(i,j)==objek & citra(i-1,j)==latar)%north, first subiteration

xhp=0; %nilai dari perhitungan xhp

b=0;

mat_xh(2,2)=citra(i,j); %p

mat_xh(2,3)=citra(i,j+1); %x1

mat_xh(3,3)=citra(i+1,j+1); %x2

mat_xh(3,2)=citra(i+1,j); %x3

mat_xh(3,1)=citra(i+1,j-1); %x4

mat_xh(2,1)=citra(i,j-1); %x5

mat_xh(1,1)=citra(i-1,j-1); %x6

mat_xh(1,2)=citra(i-1,j); %x7

mat_xh(1,3)=citra(i-1,j+1); %x8

xhp=simple(mat_xh);

b=bp(mat_xh);

if(b>1 & xhp==1)

citras(i,j)=latar;


71

N=N+1;

end

end

end

end

citra=citras;%isi citra kemudian diganti dengan citras yaitu citra yang udah

dibuang north bordernya, jadi inputan iterasi pada east border merupakan hasil

dari iterasi north border

for i=1+1:baris-1

for j=1+1:kolom-1

if (citra(i,j)==objek & citra(i,j+1)==latar)%east, second subiteration


b=0;










xhp=simple(mat_xh);

b=bp(mat_xh);

if(b>1 & xhp==1)

citras(i,j)=latar;

N=N+1;

end

end

end

end


dibuang north+east bordernya, jadi inputan iterasi pada south border merupakan

hasil dari iterasi north+east border

for i=1+1:baris-1

for j=1+1:kolom-1

if (citra(i,j)==objek & citra(i+1,j)==latar)%south, third subiteration



72

b=0;










xhp=simple(mat_xh);

b=bp(mat_xh);

if(b>1 & xhp==1)

citras(i,j)=latar;

N=N+1;

end

end

end

end


dibuang north+east+west bordernya, jadi inputan iterasi pada south border

merupakan hasil dari iterasi north+east+west border

for i=1+1:baris-1

for j=1+1:kolom-1

if (citra(i,j)==objek & citra(i,j-1)==latar)%west, fourth subiteration


b=0;










xhp=simple(mat_xh);

b=bp(mat_xh);

if(b>1 & xhp==1)

citras(i,j)=latar;


73

N=N+1;

end

end

end

end


dibuang north+east+west bordernya, jadi inputan iterasi pada south border

merupakan hasil dari iterasi north+east+west border

total_N(bantu_point_dihapus)=N;

end

toc

waktu=toc;

hapus=cumsum(total_N);

point_dihapus=hapus(end);

thin=citras;

runningTime=waktu;

• Sourcode MKNN

function hasilklasifikasi = mknn( datalatih,datauji,nilaik)



%pemrosesan data latih

[baris, kolom] = size(datalatih);

hasil_euclideandatalatih = zeros(0,0);

for i=1:baris

for j=1:baris

hasil = 0;

for k=1:kolom-1

hasil = hasil + ((datalatih(i,k)-datalatih(j,k))^2);

end

hasil_euclideandatalatih(i,j) = sqrt(hasil);

end

end

hasil_euclideandatalatih;

[hasil_sorting,label] = sort(hasil_euclideandatalatih,2);


74

index = zeros(0,0);

baru = zeros(0,0);

for i = 1 : baris

for j = 1 : nilaik

index(i,1) = label(i,1);

baru(i,j) = label(i,(j+1));

end

end

kelas = datalatih(:,kolom).';

%menghitung validitas

validity = zeros(0,0);

for i = 1 : baris

for j = 1 : nilaik

label1 = index(i,1);

label2 = baru(i,j);

if(kelas(label1) == kelas(label2))

validity(i,j) = 1;

else

validity(i,j) = 0;

end

end

end

[brs klm] = size(validity);

nilaivalidity = zeros(0,0);

for i=1:brs

itungan = 0;

for j=1:klm

itungan = itungan + (1/nilaik*validity(i,j));

end

nilaivalidity(i,1) = itungan;

end

% %data latih dengan data uji

[bUji kUji] = size(datauji);


75

label = [];

for i=1:bUji

for j=1:baris

hasil = 0;

for k=1:kUji

data1 = datauji(i,k);

data2 = datalatih(j,k);

hasil = hasil + ((datauji(i,k)-datalatih(j,k))^2);

end

hasil_euclideandatauji(j,i) = sqrt(hasil);

end

end

%

%

% %weight voting

[bW kW] = size(hasil_euclideandatauji);

[bV kV] = size(nilaivalidity);

for i=1:bW

for j=1:kW

nk = hasil_euclideandatauji(i,j)+0.5;

wv(i,j) = nilaivalidity(i,j)* 1/nk;

end

end

[hasil_sortingakhir,labelakhir] = sort(wv,'descend');

[bL kL] = size(labelakhir);

for ii=1:nilaik

for jj=1:kL

nb_terdekat(jj,ii) = labelakhir(ii,jj);

%cekkelas

nb_kelas(ii,jj) = kelas(nb_terdekat(jj,ii));

end

end

labelbaru = mode(nb_kelas);

switch(labelbaru)

case 1


76

hasilklasifikasi = 'Data uji merupakan aksara Ha';

case 2

hasilklasifikasi = 'Data uji merupakan aksara Na';

case 3

hasilklasifikasi = 'Data uji merupakan aksara Ca';

case 4

hasilklasifikasi = 'Data uji merupakan aksara Ra';

case 5

hasilklasifikasi = 'Data uji merupakan aksara Ka';

case 6

hasilklasifikasi = 'Data uji merupakan aksara Da';

case 7

hasilklasifikasi = 'Data uji merupakan aksara Ta';

case 8

hasilklasifikasi = 'Data uji merupakan aksara Sa';

case 9

hasilklasifikasi = 'Data uji merupakan aksara Wa';

case 10

hasilklasifikasi = 'Data uji merupakan aksara La';

case 11

hasilklasifikasi = 'Data uji merupakan aksara Pa';

case 12

hasilklasifikasi = 'Data uji merupakan aksara Dha';

case 13

hasilklasifikasi = 'Data uji merupakan aksara Ja';

case 14

hasilklasifikasi = 'Data uji merupakan aksara Ya';

case 15

hasilklasifikasi = 'Data uji merupakan aksara Nya';

case 16

hasilklasifikasi = 'Data uji merupakan aksara Ma';

case 17

hasilklasifikasi = 'Data uji merupakan aksara Ga';

case 18

hasilklasifikasi = 'Data uji merupakan aksara Ba';

case 19

hasilklasifikasi = 'Data uji merupakan aksara Tha';

case 20

hasilklasifikasi = 'Data uji merupakan aksara Nga';

end

end


77

• Sourcode KNN

- runKNN

numfold = 7;

outputFinal=0;

for i = 1 : numfold

DataTr1 = datalatih{i};

DataTr = DataTr1(:,1:9);

LabelTr = DataTr1(:,10);

DataTest2 = datauji{i};

DataTest = DataTest2(:,1:9);

LabelTest = DataTest2(:,10);

[pjg,lwn]=size(DataTest);

tic;

for j = 1 : pjg

[output{i}(j),model{j}] = knn_Classification

(DataTr,LabelTr,DataTest(j,:),1);

end

toc;

[output2(i),Hasil{i}] = confusion_matrix(LabelTest,output{i}');

end

for i=1:7

outputFinal=outputFinal+output2(i);

end

outputFinal=outputFinal/7;

disp(outputFinal);

- knn_Classification

function [hasil,model] = knn_Classification(training,label,testing,k)

model=fitcknn(training,label,'NumNeighbors',k);

hasil=predict(model,testing);

end


klasifikasi citra aksara jawa menggunakan metode

Documents