pengenalan document image understanding · pdf filedokumen = struktur + isi • struktur...
TRANSCRIPT
DOCUMENT IMAGEUNDERSTANDING
Peb Ruswono Aryan
Pengenalan
Ikhtisar
• Dokumen• Contoh Aplikasi• Akuisisi Citra• Rumusan Image Understanding• Tahapan• Penutup
Dokumen
• Medium PemuatInformasi– Tulisan– Gambar
• Wujud– Fisik– Abstrak
• 2 Dimensi– Dinding– Tablet– Perkamen– Buku– Kertas
Dokumen = Struktur + Isi• Struktur
– Peran secara logis• mis. Judul
– Informasi Geometri• Posisi• Skala• Orientasi
– Styling• Font• Arsiran
• Isi– Teks
• PengenalanHuruf
– Tabel– Diagram– Gambar
• Grafik• Natural Image
Proses Pembuatan Dokumen
• Tangan– Tulisan– Ilustrasi / Tanda
• Mesin– Mekanik– Digital
• Tata Letak• Komposisi• Efek tambahan
Akuisisi Citra
• Perangkat Akuisisi– Kamera
• Resolusi terbatas• Perspektif• Multispektrum
– Cahaya Tampak– Infra Merah– UV, X-Ray
– Pemindai (Scanner)• Flatbed• Automatic Document Feeder• Resolusi besar
Otomasi Formulir• Scanner ADF• Formulir berdesain
khusus• Pemeriksaan Ujian• Entri Data
Tes Pauli
Pemilu 2009• Ekstraksi Informasi
Tulisan Tangan (angka)• Sensitivitas Kesalahan
Manusia– Isu Politis
• Mitigasi Risiko Kesalahan– Identifikasi Kesalahan– Pemanduan Proses
Verifikasi
Target Scoring• Kamera, gelap (low-
light)• Real-time, video
processing• getaran, hentakan,
pencahayaan
Citra Geologi .
Document Image Understanding
• Kebalikan dari Document Authoring
Rumusan Image Understanding• Identifikasi / Klasifikasi• Pengolahan
– Normalisasi• Distorsi, Orientasi, Pencahayaan
– Perbaikan• Analisis
– Ekstraksi Informasi• Tata Letak (Layout Analysis)
• Pemahaman– Pemetaan ke Struktur Logis (Judul, Nomor Halaman,
footnote)
Normalisasi
• Terbalik (up-down)• Skew / Miring• Properti Global diestimasi dari elemen
penyusun (lokal)
Normalisasi
• Terbalik (up-down)• Skew / Miring• Properti Global diestimasi dari elemen
penyusun (lokal)
Analisis Layout
• Dekomposisi Citra jadi subarea (ROI)• Pendekatan
– Top-Down : mulai dari keseluruhan citra; partisi– Bottom-Up : mulai dari piksel lalu gabung– Hibrid
• Pengetahuan a priori– berbasis model : struktur dokumen sudah
diketahui– berbasis data : struktur diestimasi berdasarkan
data
Pemetaan ke Struktur
Ekstraksi Teks
• Pengenalan Karakter (Huruf / Angka /Simbol)– Machine Printed– Handwriting
• Persoalan Klasifikasi+ (disambiguasi)– k Nearest-Neighbor– ANN– SVM– ...
Penutup
• Persoalan tampak sederhana• Teknologi Matang• Tahapan banyak• Titik berat pada Pengolahan & Domain
Knowledge• Perkembangan Teknologi• Ruang kontribusi untuk kondisi akuisisi yg
kurang terkendali