pengembangan sistem pengenalan huruf arab dengan ekstraksi fitur morfologi
DESCRIPTION
PENGEMBANGAN SISTEM PENGENALAN HURUF ARAB DENGAN EKSTRAKSI FITUR MORFOLOGI. M. ALBADR LUTAN NASUTION 13508011. Pendahuluan. Latar Belakang. Aplikasi pengenalan huruf sangat praktikal Bahasa arab dipakai oleh 50 negara - PowerPoint PPT PresentationTRANSCRIPT
PENGEMBANGAN SISTEM PENGENALAN HURUF ARABDENGAN EKSTRAKSI FITUR MORFOLOGI
M. ALBADR LUTAN NASUTION13508011
1
Latar Belakang
• Aplikasi pengenalan huruf sangat praktikal• Bahasa arab dipakai oleh 50 negara• Riset untuk huruf Arab cenderung masih
sedikit dibanding huruf latin dan Asia lain• Pembahasan fitur morfologis dan
segmentasi huruf Arab masih sedikit
3
Rumusan Masalah
1. Proses segmentasi yang mendukung2. Fitur-fitur yang menjadi karakteristik huruf3. Kepentingan tiap fitur4. Kombinasi fitur dengan akurasi terbaik
4
Batasan Masalah
• Bentuk citra : pindaian dokumen• Hanya huruf dan angka arab saja• Tidak mengenali angka arab internasional• Ligatur, harakat, dan tanda baca tajwid
tidak ditangani pada tugas akhir
6
Sistem Tulisan Arab
• Terdapat 28 huruf dan hamzah• Tulisan selalu kursif• Terdapat komponen sekunder• Bentuk huruf berubah sesuai posisi• Kata terpisah oleh upakata• Sering terdapat ligatur• Terkadang terdapat diakritik (harakat - tanda
baca vokal) 8
Contoh Tulisan Arab
9
1 kata1 kata
ligatur
1 upakata
baseline
Al-Mamlakah al-'Arabiyah as-Sa'udiyah – Kerajaan Arab Saudi
Pengenalan Huruf
Praproses Segmentasi RepresentasiPelatihan
dan Pengenalan
Pascaproses
10
Piksel Fitur Huruf
Praproses Citra
bertujuan untuk mengolah data citra mentah menjadi data yang lebih berguna.• Normalisasi histogram• Reduksi noise• Deteksi tepi• Penulangan/ penipisan• Skala dan rotasi• Deteksi garis dasar (baseline)
11
Segmentasi
bertujuan untuk memisahkan antar huruf dalam kata atau memisahkan citra per baris atau per kata
12
Ekstraksi Fitur
• Fitur level rendah• Diperoleh tanpa ada informasi tentang bentuk• Misalnya batas tepi, dan rasio piksel
• Fitur level tinggi• Fitur terkait dengan bentuk pada citra• Misalnya bentuk persegi, elips, dan mata
13
Penelitian Terkait (1/4)
1. Pengenalan pelat nomor kendaraan oleh Sarfraz dkk. (2003)• Fitur perbandingan piksel dengan templat• Akurasi hingga 95% dengan font tunggal
2. Pengenalan huruf arab secara online oleh Al-Taani & Al-Haj (2010)• Fitur rasio persebaran densitas huruf• Akurasi hingga 90%
14
Penelitian Terkait (2/4)
3. Pengenalan huruf arab multifont oleh Izakian dkk. (2008)• Fitur kode rantai • Fitur kode posisi komponen sekunder• Pengujian dengan 3 font• Akurasi hingga 97%
15
Penelitian Terkait (3/4)
4. Pengenalan huruf arab multifont oleh Zidouri (2010)• Dua level pengenalan bentuk upakata lalu
huruf • Fitur perbandingan piksel• Jaringan saraf tiruan• Usulan teknik segmentasi baru
16
Penelitian Terkait (4/4)
5. Pengujian berbagai fitur huruf arab oleh Abandah dkk. (2005, 2008, 2009)• Empat fitur utama:
1. Komponen sekunder2. Fitur badan utama3. Fitur tulang4. Fitur perbatasan
• Implementasi 95 fitur huruf arab• Perbandingan akurasi antar fitur 17
Implementasi Tahapan Pengenalan Huruf
19
Praproses Citra Dokumen
Segmentasi
Penipisan dan Praposes Lanjutan
Ekstraksi Fitur
Klasifikasi
Fitur Huruf
1. Fitur badan utama hurufRasio pesebaran, bentuk lengkung, aspek rasio, arah lengkung, jumlah lubang, dll
2. Fitur komponen sekunder hurufJumlah, posisi, dan bentuk komponen, dll
3. Fitur tulangTitik minat, kode rantai, dll
20
Pelatihan dan Pengujian
Data latih dan uji :• Dokumen cetak dengan ragam font• Basis data IFN/ENIT
Persentase data latih dan uji : 50% - 50%
21