pengembangan sistem pengenalan huruf arab dengan ekstraksi fitur morfologi

22
PENGEMBANGAN SISTEM PENGENALAN HURUF ARAB DENGAN EKSTRAKSI FITUR MORFOLOGI M. ALBADR LUTAN NASUTION 13508011 1

Upload: tanaya

Post on 25-Feb-2016

112 views

Category:

Documents


6 download

DESCRIPTION

PENGEMBANGAN SISTEM PENGENALAN HURUF ARAB DENGAN EKSTRAKSI FITUR MORFOLOGI. M. ALBADR LUTAN NASUTION 13508011. Pendahuluan. Latar Belakang. Aplikasi pengenalan huruf sangat praktikal Bahasa arab dipakai oleh 50 negara - PowerPoint PPT Presentation

TRANSCRIPT

PENGEMBANGAN SISTEM PENGENALAN HURUF ARABDENGAN EKSTRAKSI FITUR MORFOLOGI

M. ALBADR LUTAN NASUTION13508011

1

PENDAHULUAN 2

Latar Belakang

• Aplikasi pengenalan huruf sangat praktikal• Bahasa arab dipakai oleh 50 negara• Riset untuk huruf Arab cenderung masih

sedikit dibanding huruf latin dan Asia lain• Pembahasan fitur morfologis dan

segmentasi huruf Arab masih sedikit

3

Rumusan Masalah

1. Proses segmentasi yang mendukung2. Fitur-fitur yang menjadi karakteristik huruf3. Kepentingan tiap fitur4. Kombinasi fitur dengan akurasi terbaik

4

Tujuan

Berhasil dibangunnya perangkat lunak yang dapat mengenali huruf Arab.

5

Batasan Masalah

• Bentuk citra : pindaian dokumen• Hanya huruf dan angka arab saja• Tidak mengenali angka arab internasional• Ligatur, harakat, dan tanda baca tajwid

tidak ditangani pada tugas akhir

6

STUDI LITERATUR 7

Sistem Tulisan Arab

• Terdapat 28 huruf dan hamzah• Tulisan selalu kursif• Terdapat komponen sekunder• Bentuk huruf berubah sesuai posisi• Kata terpisah oleh upakata• Sering terdapat ligatur• Terkadang terdapat diakritik (harakat - tanda

baca vokal) 8

Contoh Tulisan Arab

9

1 kata1 kata

ligatur

1 upakata

baseline

Al-Mamlakah al-'Arabiyah as-Sa'udiyah – Kerajaan Arab Saudi

Pengenalan Huruf

Praproses Segmentasi RepresentasiPelatihan

dan Pengenalan

Pascaproses

10

Piksel Fitur Huruf

Praproses Citra

bertujuan untuk mengolah data citra mentah menjadi data yang lebih berguna.• Normalisasi histogram• Reduksi noise• Deteksi tepi• Penulangan/ penipisan• Skala dan rotasi• Deteksi garis dasar (baseline)

11

Segmentasi

bertujuan untuk memisahkan antar huruf dalam kata atau memisahkan citra per baris atau per kata

12

Ekstraksi Fitur

• Fitur level rendah• Diperoleh tanpa ada informasi tentang bentuk• Misalnya batas tepi, dan rasio piksel

• Fitur level tinggi• Fitur terkait dengan bentuk pada citra• Misalnya bentuk persegi, elips, dan mata

13

Penelitian Terkait (1/4)

1. Pengenalan pelat nomor kendaraan oleh Sarfraz dkk. (2003)• Fitur perbandingan piksel dengan templat• Akurasi hingga 95% dengan font tunggal

2. Pengenalan huruf arab secara online oleh Al-Taani & Al-Haj (2010)• Fitur rasio persebaran densitas huruf• Akurasi hingga 90%

14

Penelitian Terkait (2/4)

3. Pengenalan huruf arab multifont oleh Izakian dkk. (2008)• Fitur kode rantai • Fitur kode posisi komponen sekunder• Pengujian dengan 3 font• Akurasi hingga 97%

15

Penelitian Terkait (3/4)

4. Pengenalan huruf arab multifont oleh Zidouri (2010)• Dua level pengenalan bentuk upakata lalu

huruf • Fitur perbandingan piksel• Jaringan saraf tiruan• Usulan teknik segmentasi baru

16

Penelitian Terkait (4/4)

5. Pengujian berbagai fitur huruf arab oleh Abandah dkk. (2005, 2008, 2009)• Empat fitur utama:

1. Komponen sekunder2. Fitur badan utama3. Fitur tulang4. Fitur perbatasan

• Implementasi 95 fitur huruf arab• Perbandingan akurasi antar fitur 17

DESKRIPSI SOLUSI 18

Implementasi Tahapan Pengenalan Huruf

19

Praproses Citra Dokumen

Segmentasi

Penipisan dan Praposes Lanjutan

Ekstraksi Fitur

Klasifikasi

Fitur Huruf

1. Fitur badan utama hurufRasio pesebaran, bentuk lengkung, aspek rasio, arah lengkung, jumlah lubang, dll

2. Fitur komponen sekunder hurufJumlah, posisi, dan bentuk komponen, dll

3. Fitur tulangTitik minat, kode rantai, dll

20

Pelatihan dan Pengujian

Data latih dan uji :• Dokumen cetak dengan ragam font• Basis data IFN/ENIT

Persentase data latih dan uji : 50% - 50%

21

Terima Kasih

22