ocr

3
OCR OCR (Optical Character Recognition) memudahkan untuk men-scan dokumen kertas ke komputer sebagai dokumen berbasis teks yang bisa dibuka di perangkat lunak pengolah (word processor) atau pengedit teks. Men-scan secara OCR membantu Anda secara cepat merubah menjadi bentuk digital dokumen - tanpa harus mengetiknya secara manual ke d dokumen pengolah kata. Pertimbangkan keuntungannya: OCR menghemat tempat. Sekarang arsip Anda yang berukuran besar bisa lebih sedikit. dokumen kertas bisa digantikan dengan dokumen digital yang mudah untuk disimpan. OCR menghemat waktu. tidak perlu menghabiskan waktu untuk mengetik ulang dokumen ya panjang. Lagipula, waktu ingin mengarsipkan dan mengambil bahan, yang perlu Anda la hanya menyiapkan dan menjaga konvensi pengarsipan dan penamaan secara konsisten. OCR menghilangkan rasa khawatir. Anda dapat membuat dan menyimpan cadangan dari dokumen penting secara digital. Hal ini meyakinkan bahwa walaupun lokasi kantor And di jalur angin puyuh, banjir, atau di negara bagian yang sering terjadi kebakaran, Anda tidak akan hilang ketika terjadi bencana alam. Belakangan ini, kemajuan dalam perangkat lunak OCR telah membuat pen-scan-an sebuah bagian penting dari semua bagian kerja yang efisien. Pertimbangkan keuntungannya: Cara pengaturan yang benar Perangkat lunak OCR khusus dapat merubah teks yang dicetak ke teks dalam format dig menjadi nyata. Banyak scanner yang digabungkan dengan perangkat lunak OCR, atau And dapat membeli paket dari pihak ketiga seperti ReadlRIS. Berikut adalah beberapa tip memanfaatkan perangkat lunak OCR Anda secara maksimum. Mari kita mulai dengan pengaturan yang ideal settings ideal untuk pen-scan-an OCR. Format File.TIFF, BMP, atau JPEG adalah pilihan terbaik untuk format. TIFF menawark sedikit kompresi, tetapi file-file ini ukurannya dapat diubah secara efisien jika p resolusi dan warna yang tepat digunakan. Cara lainnya, jika sumber alatnya terbatas BMP atau JPEG. Resolusi.Memilih resolusi yang lebih rendah seperti 150 dpi menghemat waktu dan men file lebih mudah untuk digunakan. Warna.Saat men-scan dokumen pada umumnya tidak membutuhkan warna. Scan-lah dalam 25 shades of grey (8 bit) atau hitam dan putih. Kualitas.Mulailah selalu dengan dokumen asli berkualitas tinggi. Sobekan, kerutan, dapat membingungkan perangkat lunak OCR dan dapat mengakibatkan kesalahan pada hasi akhirnya. Bersihkan kotoran di dokumen asli dengan sedikit cairan pengoreksi (corre atau fotokopi dulu untuk meningkatkan tingkat kekontrasan dokumen asli itu. Kesederhanaan.Perangkat lunak OCR pada umumnya lebih menyukai teks bersih yang jumlahnya banyak karena ia tidak perlu mempertimbangkan layout, dan tidak ada kolo garis yang perlu diperhatikan. Parameter.Men-scan teks dari sebuah halaman dengan banyak kolom juga menjadi mudah. Program perangkat lunak OCR pada umumnya memudahkan Anda untuk menentukan bagian tertentu dari halaman teks untuk di-scan. Jika Anda menentukan setiap kolom sebagai teks yang berbeda, proses OCR akan mulai dengan kolom pertama, lalu pindah ke kolom dan seterusnya.

Upload: nurul-kholifah

Post on 22-Jul-2015

57 views

Category:

Documents


0 download

TRANSCRIPT

OCROCR (Optical Character Recognition) memudahkan untuk men-scan dokumen kertas ke komputer sebagai dokumen berbasis teks yang bisa dibuka di perangkat lunak pengolah kata (word processor) atau pengedit teks. Men-scan secara OCR membantu Anda secara cepat untuk merubah menjadi bentuk digital dokumen - tanpa harus mengetiknya secara manual ke dalam dokumen pengolah kata. Pertimbangkan keuntungannya: OCR menghemat tempat. Sekarang arsip Anda yang berukuran besar bisa lebih sedikit. Setiap dokumen kertas bisa digantikan dengan dokumen digital yang mudah untuk disimpan. OCR menghemat waktu. tidak perlu menghabiskan waktu untuk mengetik ulang dokumen yang panjang. Lagipula, waktu ingin mengarsipkan dan mengambil bahan, yang perlu Anda lakukan hanya menyiapkan dan menjaga konvensi pengarsipan dan penamaan secara konsisten. OCR menghilangkan rasa khawatir. Anda dapat membuat dan menyimpan cadangan dari dokumen penting secara digital. Hal ini meyakinkan bahwa walaupun lokasi kantor Anda berada di jalur angin puyuh, banjir, atau di negara bagian yang sering terjadi kebakaran, file penting Anda tidak akan hilang ketika terjadi bencana alam. Belakangan ini, kemajuan dalam perangkat lunak OCR telah membuat pen-scan-an sebuah bagian penting dari semua bagian kerja yang efisien. Pertimbangkan keuntungannya: Cara pengaturan yang benar Perangkat lunak OCR khusus dapat merubah teks yang dicetak ke teks dalam format digital menjadi nyata. Banyak scanner yang digabungkan dengan perangkat lunak OCR, atau Anda dapat membeli paket dari pihak ketiga seperti ReadlRIS. Berikut adalah beberapa tip untuk memanfaatkan perangkat lunak OCR Anda secara maksimum. Mari kita mulai dengan pengaturan yang ideal settings ideal untuk pen-scan-an OCR. Format File.TIFF, BMP, atau JPEG adalah pilihan terbaik untuk format. TIFF menawarkan sedikit kompresi, tetapi file-file ini ukurannya dapat diubah secara efisien jika pengaturan resolusi dan warna yang tepat digunakan. Cara lainnya, jika sumber alatnya terbatas, gunakan BMP atau JPEG. Resolusi.Memilih resolusi yang lebih rendah seperti 150 dpi menghemat waktu dan menmbuat file lebih mudah untuk digunakan. Warna.Saat men-scan dokumen pada umumnya tidak membutuhkan warna. Scan-lah dalam 256 shades of grey (8 bit) atau hitam dan putih. Kualitas.Mulailah selalu dengan dokumen asli berkualitas tinggi. Sobekan, kerutan, dan kotoran dapat membingungkan perangkat lunak OCR dan dapat mengakibatkan kesalahan pada hasil akhirnya. Bersihkan kotoran di dokumen asli dengan sedikit cairan pengoreksi (correction fluid), atau fotokopi dulu untuk meningkatkan tingkat kekontrasan dokumen asli itu. Kesederhanaan.Perangkat lunak OCR pada umumnya lebih menyukai teks bersih yang jumlahnya banyak karena ia tidak perlu mempertimbangkan layout, dan tidak ada kolom atau garis yang perlu diperhatikan. Parameter.Men-scan teks dari sebuah halaman dengan banyak kolom juga menjadi mudah. Program perangkat lunak OCR pada umumnya memudahkan Anda untuk menentukan bagian tertentu dari halaman teks untuk di-scan. Jika Anda menentukan setiap kolom sebagai bagian teks yang berbeda, proses OCR akan mulai dengan kolom pertama, lalu pindah ke kolom kedua, dan seterusnya.

Cek Keamanan. Beberapa jenis teks tertentu dapat menimbulkan masalah bagi perangkat lunak OCR Anda. Teks yang digarisbawahi, ditebalkan, dan dimiringkan dapat membuatnya tidak bisa dibaca oleh scanner. Teks yang digabung atau kerned text (Ketika spasi antar huruf telah disesuaikan agar bisa pas secara efisien) dapat juga menimbulkan kesulitan untuk program OCR. Hal ini membuat pengecekan (proofreading) menjadi penting. Pengecekan ejaan saja tidak akan mengetahui semua kesalahan. Cek Keamanan Lainnya.Anda dapat menghemat waktu dan masalah dengan menandai huruf yang tidak bisa diproses oleh perangkat lunak Anda. Hal ini sangat membantu ketika pengecekan (proofreading) dilakukan. Trial and Error.Bila Anda ingin men-scan sebuah dokumen yang besar atau panjang, coba menscan halaman pertama dan kemudian teruskan hingga ke teks paling akhir. Hal ini akan memberikan Anda banyak kesempatan untuk menemukan dan membetulkan kesalahan atau kekurangan yang ada. Perlengkapan.Lebih cepat prosesor dan scanner Anda, lebih sedikit juga waktu menunggu Anda. Anda membutuhkan RAM paling sedikit sebesar 32MB (walaupun 64MB lebih baik) untuk fungsi dasar seperti membedakan gambar dari teks, mengidentifikasikan huruf, dan menerjemahkan layout dokumen ke dalam bentuk elektronis. Selain itu, jika Anda ingin menscan beberapa halaman secara langsung, sebuah automatic document feeder (ADF) mungkin bisa menjadi sebuah investasi yang baik. Kemampuan yang dimiliki program khusus untuk membaca dan mengubah materi teks pada file objek gambar menjadi file teks biasa. Kemampuan yang dimiliki program khusus untuk membaca dan mengubah materi teks pada file objek gambar menjadi file teks biasa. Jika sebuah dokumen di-scan, maka output yang diperoleh di komputer adalah file gambar. Program OCR berfungsi membantu Anda mengubah secara otomatis materi teks di dalam gambar hasil scan agar menjadi file teks yang bisa diolah. Tujuannya agar sumber teks dapat diambil tanpa harus menulis ulang secara manual. Tingkat ketelitian dan keakuratan hasil pembacaan program OCR sangat beragam dan tergantung juga pada sumber dokumen. Jika teks pada gambar terlalu kecil, buram, atau tidak bersih, maka kesalahan pembacaan mungkin saja terjadi. Meskipun demikian, pengeditan hasil OCR dianggap tetap lebih efisien dibandingkan jika menulis ulang sejumlah dokumen atau lembar kiriman fax secara manual. Contoh software OCR adalah ReadIris dan OmniPage. OCR yang Sangat AkuratSalah satu parameternya adalah soal kecepatan. Saat bekerjasama dengan komputer uji kami (prosesor AMD AthlonXP 2200+, memori DDR PC2100 256MB), waktu yang ditorehkan termasuk cepat. Contohnya saat menscan foto ukuran 3R pada resolusi 300dpi, waktu yang dibutuhkan cuma 17 detik. Angka ini memang belum mengalahkan HP ScanJet 4500 sebagai yang tercepat (10 detik), tetapi masih lebih cepat dibandingkan sebagian besar scanner yang berbasis USB 2.0 sekalipun.Kualitas yang diperagakan juga terbilang bagus. Scanner ini mampu menangkap detail gambar dengan tajam, disertai akurasi warna yang cukup akurat. Warnanya terlihat agak kekuningan dari seharusnya, tetapi tidak sampai merusak komposisi warna secara keseluruhan. Yang juga layak digarisbawahi, ketajaman gambar ini tetap dipertahankan pada resolusi tertinggi 600dpi.Akan tetapi yang paling kami suka dari scanner ini adalah kemampuan OCR-nya. OCR (Optical Character Recognition) adalah sebuah fungsi yang mentransformasikan hasil scan menjadi teks yang bisa disunting. Contoh, saat Anda menscan selembar koran, hasilnya dapat ditransfer menjadi teks biasa yang dapat disunting di Word.Untuk menjalankan fungsi OCR, sebuah scanner membutuhkan bantuan software. Umax 3600 sendiri menggunakan software ABBYY Fine Reader versi 5. Program ini memang terkenal karena

kualitasnya, dan dikombinasikan dengan ketajaman scan Astra 3600, hasilnya menjadi sangat memuaskan. Saat kami uji menggunakan lembaran teks hasil print, hasilnya sempurna tanpa ada kesalahan baca sedikit pun. Saat kami naikkan tingkat kesulitannya dengan menscan lembaran hasil fax yang sudah buram, Astra 3600 dan Fine Reader berhasil mempertahankan akurasinya sampai 95%.Namun sebagai scanner yang membidik kalangan rumahan, ada beberapa hal yang seharusnya dapat ditingkatkan. Instalasi dan penggunaannya sebenarnya mudah, tetapi fasilitas untuk membantu penggunaannya agak terbatas. Contoh, tidak adanya fasilitas multiframe yang dapat menscan beberapa obyek sekaligus. Selain itu, fungsi auto crop-nya (yang akan secara otomatis menentukan area yang akan discan) kurang akurat. Alhasil, setiap gambar hasil scan menyisakan area putih di sekelilingnya yang harus dicrop ulang. *** Menilik performa Umax Astra 3600 secara keseluruhan, yang paling layak mendapat kredit terbaik adalah kemampuan OCR-nya. Apapun medianya, apakah itu hasil print fax atau koran sekalipun, mampu diolah dengan akurasi yang mendekati sempurna. Jadi bagi Anda yang malas mengetik ulang surat atau suatu artikel, scanner ini adalah kabar baik bagi Anda. Kabar lebih baik lagi, kemampuan tersebut dikombinasikan dengan harga yang tidak membuat kantong jebol. (Majalah InfoKomputer edisi Oktober 2003) Perangkat OCR, Optical Character Recognition, memerlukan alat scan. Teks di suatu halaman di-scan kedalam komputer. Gambar yang di-scan dalam hal ini adalah gambar 'grafik'. Perangkat OCR mengecek gambar dalam kamus yang sudah terpasang untuk menemukan kesesuaian yang terdekat dengan bentuk karakter atau huruf. Dengan kecepatan tinggi, perangkat ini akan memerintahkan kode komputer yang sesuai dan meneruskannya sampai selesai. OCR tersedia dalam banyak bahasa dan bahkan tersedia dalam bentuk alat genggam yang terpasang di atau terpisah dari komputer. Metoda pembacaan data oleh scanner optik dan menterjemahkan data tersebut ke dalam bentuk data biner yang dapat dibaca oleh komputer.