pengenalan document image understanding · pdf filedokumen = struktur + isi • struktur...

Post on 07-Mar-2018

257 Views

Category:

Documents

16 Downloads

Preview:

Click to see full reader

TRANSCRIPT

DOCUMENT IMAGEUNDERSTANDING

Peb Ruswono Aryan

Pengenalan

Ikhtisar

• Dokumen• Contoh Aplikasi• Akuisisi Citra• Rumusan Image Understanding• Tahapan• Penutup

Dokumen

• Medium PemuatInformasi– Tulisan– Gambar

• Wujud– Fisik– Abstrak

• 2 Dimensi– Dinding– Tablet– Perkamen– Buku– Kertas

Dokumen = Struktur + Isi• Struktur

– Peran secara logis• mis. Judul

– Informasi Geometri• Posisi• Skala• Orientasi

– Styling• Font• Arsiran

• Isi– Teks

• PengenalanHuruf

– Tabel– Diagram– Gambar

• Grafik• Natural Image

Proses Pembuatan Dokumen

• Tangan– Tulisan– Ilustrasi / Tanda

• Mesin– Mekanik– Digital

• Tata Letak• Komposisi• Efek tambahan

Akuisisi Citra

• Perangkat Akuisisi– Kamera

• Resolusi terbatas• Perspektif• Multispektrum

– Cahaya Tampak– Infra Merah– UV, X-Ray

– Pemindai (Scanner)• Flatbed• Automatic Document Feeder• Resolusi besar

Otomasi Formulir• Scanner ADF• Formulir berdesain

khusus• Pemeriksaan Ujian• Entri Data

Tes Pauli

Pemilu 2009• Ekstraksi Informasi

Tulisan Tangan (angka)• Sensitivitas Kesalahan

Manusia– Isu Politis

• Mitigasi Risiko Kesalahan– Identifikasi Kesalahan– Pemanduan Proses

Verifikasi

Target Scoring• Kamera, gelap (low-

light)• Real-time, video

processing• getaran, hentakan,

pencahayaan

Citra Geologi .

Document Image Understanding

• Kebalikan dari Document Authoring

Rumusan Image Understanding• Identifikasi / Klasifikasi• Pengolahan

– Normalisasi• Distorsi, Orientasi, Pencahayaan

– Perbaikan• Analisis

– Ekstraksi Informasi• Tata Letak (Layout Analysis)

• Pemahaman– Pemetaan ke Struktur Logis (Judul, Nomor Halaman,

footnote)

Normalisasi

• Terbalik (up-down)• Skew / Miring• Properti Global diestimasi dari elemen

penyusun (lokal)

Normalisasi

• Terbalik (up-down)• Skew / Miring• Properti Global diestimasi dari elemen

penyusun (lokal)

Analisis Layout

• Dekomposisi Citra jadi subarea (ROI)• Pendekatan

– Top-Down : mulai dari keseluruhan citra; partisi– Bottom-Up : mulai dari piksel lalu gabung– Hibrid

• Pengetahuan a priori– berbasis model : struktur dokumen sudah

diketahui– berbasis data : struktur diestimasi berdasarkan

data

Pemetaan ke Struktur

Ekstraksi Teks

• Pengenalan Karakter (Huruf / Angka /Simbol)– Machine Printed– Handwriting

• Persoalan Klasifikasi+ (disambiguasi)– k Nearest-Neighbor– ANN– SVM– ...

Penutup

• Persoalan tampak sederhana• Teknologi Matang• Tahapan banyak• Titik berat pada Pengolahan & Domain

Knowledge• Perkembangan Teknologi• Ruang kontribusi untuk kondisi akuisisi yg

kurang terkendali

top related