presentasi tugas akhir -...
TRANSCRIPT
Presentasi Tugas Akhir
“Rancang Bangun Aplikasi Sistem Validasi Data Berkas Beasiswa”
Jurusan Teknik Informatika
Fakultas Teknologi Informasi
Institut Teknologi Sepuluh Nopember
2014
Oleh :Artha PradytaNRP. 5110100109
Latar Belakang
PengunggahanBerkas Persyaratan
Beasiswa
Validasi Berkas OlehManusia
Proses SeleksiPemberian Beasiswa
nextback
• Harus menungguvalidasi oleh manusia
• Jenis berkas yang divalidasi cukup banyak
Lamanyaproses seleksi
pemberianbeasiswa
menyebabkan
• Salah mengenali jenisberkas
• Salah mengenalipemilik berkas
Terjadinya“Human Error”
sering memicu
Tujuan
– Membuat sistem yang dapat melakukan validasi jenis berkas dan pemilik berkasyang diunggah oleh mahasiswa.
– Mengimplementasikan penerapan algoritma Levenshtein Distance, Longest Common Subsequence, dan Soundex untuk membandingkan data nama pemilikberkas.
– Mengimplementasikan penerapan teknologi Optical Character Recognition untuk ekstraksi data dari berkas persyaratan yang diunggah ke dalam sistem.
nextback
Rumusan Permasalahan(1)
▪ Cara memvalidasi data berkas persyaratan beasiswa yang diunggah olehmahasiswa melalui layanan Web Service.
nextback
SI Beasiswa Sistem Validasi Berkas
Web Service
Rumusan Permasalahan(2)
▪ Menerapkan metode Optical Character Recognition pada sistem validasi data berkas persyaratan beasiswa untuk mendapatkan kumpulan kata nama besertakata kunci setiap berkas.
rincian iagihan dapat diakses di unn.b1n.co}id informasi hubungi call center : 123 atau hub. pln terdekat : 'ii _ ()();;(3451;j7?;;1 ttd-hart pryment 9820456authorized pt.pos indonesia (persero) ktanggal : 2012-12-15 09:25:05 v tno.resi : 9820456-01/2012/003724 petugas : 68204560& Ipembayaran pln pznpsr zona-z' ridpel : 1830901149690 tnama : maryonotarif/daya : r1/2200 vabl/th : des 2012stand meter : 03868200 * 03896600non subsidi . i rp. t 0rp tag pln : rp. 241.585nurahrref : l850101850189817720l2l2150925050pln menyatakan struk ini sebagai bukti pembayaran yang san,admin pos : rp. 1.900total bayar : rp. 243.4851 dinnian tanihan danat diakses di nnn.n1n.co.id inform&
nextback
Rumusan Permasalahan(3)
▪ Menerapkan algoritma Levenshtein Distance, Longest Common Subsequence, danSoundex pada sistem validasi data berkas persyaratan beasiswa untuk melakukanpencocokan kumpulan kata nama.
▪ Menentukan hasil validasi jenis dan nama yang tertera di dalam berkas.
Artha Pradyta Bachruddin
nextback
Batasan Permasalahan
▪ Studi kasus yang dibahas adalah SI Beasiswa di Perguruan Tinggi X.
▪ Data uji yang digunakan adalah data sekunder (dummy).
▪ Aplikasi ini dibangun dengan menggunakan bahasa pemrograman ASP.NET.
▪ Tingkat keberhasilan validasi tergantung dari kejelasan gambar yang diunggah.
▪ Banyaknya gangguan (noise) pada gambar akan mempengaruhi lamanya proses validasi.
▪ Algoritma pencocokan kumpulan kata yang digunakan adalah algoritma LevenshteinDistance, Longest Common Subsequence, dan Soundex.
▪ Metode untuk pengurangan gangguan pada gambar berupa penambahan skala (rezise), pengubahan ke dalam bentuk skala abu (gray-scale), dan penambahan kontras (contrast).
▪ Aplikasi validasi berkas ini tidak bisa mendeteksi adanya berkas palsu yang dimanipulasidatanya.
nextback
Optical Character Recognition
▪ Merupakan sebuah teknologi konversi dari gambar ke bentuk teks. Teknologi ini biasanya digunakan untuk mengambil data dari berkas-berkasberbentuk gambar seperti dokumen paspor, faktur, laporan bank, kartunama, dan sebagainya.
▪ Dalam pemrosesan OCR, gambar dianalisis pada daerah terang dan gelapdalam rangka mengidentifikasi setiap huruf abjad maupun angka numeric. Ketika karakter sudah diketahui, maka setiap kata tersebut dirubah kedalam bentuk ASCII. Dalam hal ini mesin komputer merubah kode ASCII tersebut menjadi berupa karakter maupun angka.
▪ Karena kemampuannya dalam hal ekstraksi data dari gambar inilah, makateknologi ini digunakan untuk mengambil data-data dari berkaspersyaratan beasiswa yang telah diunggah ke sistem seperti suratketerangan miskin, rekening listrik, rekening air dan sebagainya
nextback
Algoritma Soundex & NormalisasiString(1)
▪ Algoritma Soundex mengambil masukanberupa sebuah kumpulan kata yang mengidentifikasi apakah sepasang kata tersebut mirip secara fonetik. Fonetik sendirimerupakan ilmu yang menyelidiki bunyibahasa tanpa melihat fungsi bunyi itu sebagaipembeda makna dalam suatu bahasa.
▪ Sebuah kumpulan kata yang berbeda namunmempunyai cara pengucapan yang sama, akan memiliki kode fonetis yang sama. Contohnya adalah “Djono” dan “Jono”.
▪ Algoritma Soundex dibuat berdasarkanpengucapan dalam bahasa Inggris. Untukmendukung pencocokan kumpulan kata berdasarkan bahasa Indonesia, sekaligusmelakukan optimasi terhadap algoritmatersebut, diperlukan suatu proses normalisasi. Salah satu cara untuk proses normalisasiadalah dengan menggunakan aturan translasiq-gram.
nextback
Q-Gram ContohAwal Translasi Awal TranslasiKH HH Rakhmat RahhmatDJ JJ Endjang EnjjangTJ CC Itjang IccangCQ, CK KK Erick ErikkPH FF Philip FfilipDZ ZZ Dzikri ZzikriSJ SY Sjahrir SyahrirSY SS Syifa SsifaBH, DH,GH, JH, SH,TH, ZH
BB, DD, GG,JJ, SS, TT,ZZ
Ardhi Arddi
V F Saviena SafienaKS XX Wicaksono WicaxxonoOE UU Wahyoedi WahyuudiIE II Arie AriiY I Donny Donni
Algoritma Soundex & NormalisasiString(2)
▪ Berikut ini merupakan langkah-langkah algoritma Soundex dalammenghasilkan kode fonetis darisebuah kumpulan kata masukan.– Mengubah semua huruf menjadi huruf
kapital, dan hilangkan tanda baca.– Mempertahankan huruf pertama pada
kata tersebut.– Mengubah huruf lainnya menjadi kode
fonetis berdasarkan aturan yang berlaku.– Menghapus semua pasangan dari kode
fonetis yang berurutan.– Menghapus semua kode fonetis yang
bernilai 0.– Menulis empat posisi pertama yang
mengikuti pola: <uppercase letter><digit><digit><digit>. Inimerupakan keluaran dari kode fonetis. Jika kode fonetis tidak sampai empatkarakter, maka ditambahkan angka 0 sampai menjadi empat karakter.
nextback
Huruf Kode Klasifikasi FonetisA,E,H,I,O,U,W,Y 0 Diperlukan sebagai bunyi vokalB,F,P,V 1 Labial dan labio-dentalC,G,J,K,Q,S,X,Z 2 GlottalD,T 3 Dental-muteL 4 Palatal fricativeM,N 5 Labio-nasal dan dentalR 6 Dental fricative
Jono Djono
jono jono
J050 J050
String awal
Translasi q-gram
Kode fonetis
Algoritma Levenshtein Distance
▪ Levenshtein Distance adalah jumlah minimal operasi yang dibutuhkan untuk mengubahsuatu kumpulan kata ke kumpulan kata yang lain. Dengan algoritma ini, dapat diketahuitingkat perbedaan dua buah kumpulan kata dalam representasi angka.
▪ Berikut ini operasi yang dilakukan dalamalgoritma Levenshtein Distance.– Penyisipan (Insertion)
▪ Merupakan proses penyisipan sebuah karakterke dalam sebuah kumpulan kata tertentu.
– Penghapusan (Deletion)▪ Merupakan proses penghapusan sebuah
karakter dari sebuah kumpulan kata tertentu.
– Penggantian (Substitution)▪ Merupakan proses penggantian sebuah
karakter dari sebuah kumpulan kata dengankarakter lain.
nextback
Djono Jono
Jono Jono Penghapusan
Nilai Levenshtein Distance = 1
String yang dibandingkan String pembanding
Algoritma Longest Common Subsequence
▪ Subsequence adalah sebuah rangkaian yang dapat diperoleh dari rangkaianlain dengan cara menghapus beberapa elemen tertentu tanpa mengubahurutan dari elemen lain yang tersisa. Misalkan ada rangkaian X danY, rangkaian S dikatakan sebuah common subsequence dari X danY apabila S adalah subsequence dari keduanya. Longest Common Subsequence (LCS) merupakan common subsequence terpanjang dari seluruh common subsequence. Contohnya adalah sebagai berikut.
▪ X = {M,A,K,A,N}.
▪ Y = {M,A,L,A,M}.
▪ Contoh common subsequence dari X danY adalah S = {M,A,A} dan T = {M,A}. Karena S merupakan subsequence yang lebih panjang, maka longest common subsequence dari X danY adalah S
nextback
Web Service
▪ Web Service adalah suatu sistem perangkat lunak yang dirancang untukmendukung interaksi mesin ke mesin pada suatu jaringan. Sistem lain yang berinteraksi dengan Web Service dilakukan melalui antar muka menggunakanpesan seperti pada SOAP. Pada umumnya pesan ini melalui HTTP dan XML yang merupakan salah satu standar situs web. Perangkat lunak aplikasi yang ditulisdalam berbagai bahasa pemrograman dan berjalan pada berbagai platform dapatmenggunakan Web Service untuk pertukaran data pada jaringan komputer sepertiInternet dalam cara yang serupa dengan komunikasi antar proses pada komputertunggal.
▪ Dalam hal ini Web Service digunakan sebagai perantara pertukaran data berkasantara SI Beasiswa dengan aplikasi validasi berkas beasiswa.
nextback
Precision & Recall
▪ Untuk menghitung tingkat performansi suatu sistem yang memiliki kemampuan untuk mendapatkan kembali informasi-informasi tertentu dapat menggunakan perhitungan precisiondan recall.
▪ Precision adalah tingkat ketepatan antara informasi yang diminta oleh pengguna dengan jawabanyang diberikan oleh sistem.
▪ Recall adalah tingkat keberhasilan sistem dalam menemukan kembali sebuah informasi.
▪ Secara matematis, rumus untuk menghitung presisi dan recall dapat dilihat pada Persamaan 1dan Persamaan 2.
nextback
𝑝𝑟𝑒𝑐𝑖𝑠𝑖𝑜𝑛 =𝑟𝑒𝑙𝑒𝑣𝑎𝑛𝑡 𝑖𝑡𝑒𝑚𝑠 𝑟𝑒𝑡𝑟𝑖𝑒𝑣𝑒𝑑
𝑟𝑒𝑡𝑟𝑖𝑒𝑣𝑒𝑑 𝑖𝑡𝑒𝑚𝑠
𝑟𝑒𝑐𝑎𝑙𝑙 =𝑟𝑒𝑙𝑒𝑣𝑎𝑛𝑡 𝑖𝑡𝑒𝑚𝑠 𝑟𝑒𝑡𝑟𝑖𝑒𝑣𝑒𝑑
𝑟𝑒𝑙𝑒𝑣𝑎𝑛𝑡 𝑖𝑡𝑒𝑚𝑠
Deskripsi Umum Sistem(1)
nextback
Ekstraksi
kumpulan
kata
Optical Character
Recognition (OCR)
Aplikasi Validator
Pencocokan
kumpulan kata
nama mahasiswa
SI Beasiswa Aplikasi Validasi Berkas
Mahasiswa Administrator
SI Beasiswa
Web Service
Berkas
Persyaratan
Beasiswa
Pendeteksian kata
kunci berkas
Alur Proses Validasi Berkas
Sistem Validasi BerkasSistem Beasiswa
Ph
ase
Mulai
Mengirim Data Berkas Yang
Akan Divalidasi Melalui
Web Service Berupa Data
Jenis Berkas, Alamat Url
Berkas, Nama Yang
Divalidasi
Menerima Permintaan
Validasi Berkas Gambar
Dengan Ekstensi JPG, JPEG,
TIF, GIF, PNG
Melakukan Ekstraksi
Informasi Dari Gambar
Menggunakan Optical
Character Recognition
Melakukan Pencarian Kata
Kunci Berkas
Terdapat Kata Kunci
Berkas
Melakukan Pencarian
Karakter Nama Pemilik
Berkas
Melakukan Pencocokan
Karakter Nama Pemilik
Berkas Menggunakan
Algoritma Soundex
Ya
Selesai
Tidak
Terdapat Karakter
Nama Pemilik Berkas
Ya
Melakukan Pencocokan
Karakter Nama Pemilik
Berkas Menggunakan
Algoritma Longest Common
Subsequences
Melakukan Pencocokan
Karakter Nama Pemilik
Berkas Menggunakan
Algoritma Levenshtein
Distance
Hasil Validitas
Berkas Dalam
Bentuk XML
Informasi
Kegagalan
Proses Validasi
Berkas
nextback
Langkah Proses Validasi Berkas
Proses Ekstraksi BerkasGambar Menggunakan
Optical Character Recognition
Proses Pengenalan JenisBerkas
Proses Pencarian NamaPemilik Berkas
Proses PencocokanKumpulan Kata
Menggunakan AlgoritmaSoundex
Proses PencocokanKumpulan Kata
Menggunakan AlgoritmaLevenshtein Distance
Proses PencocokanKumpulan Kata
Menggunakan AlgoritmaLongest Common
Subsequence
nextback
Proses Ekstraksi Berkas Gambar MenggunakanOptical Character Recognition
▪ Proses ekstraksi berkas berupaberkas gambar merupakantahap awal yang harus dilakukanuntuk mendapatkan semuainformasi data yang terdapatpada berkas gambar.
▪ Diperlukan teknologi Optical Character Recognition untukmelakukan ekstraksi informasipada sebuah gambar.
▪ Proses ekstraksi denganmenggunakan Optical Character Recognition ini menghasilkansekumpulan kumpulan kata.
nextback
Mulai
Berkas
gambar
Pengurangan
noise
dengan
teknik resize,
gray-scale
dan contrast
Berkas
gambar
dengan
noise
yang
diminim
alisir
Proses
ekstraksi
berkas
gambar
Kumpul
an kata
Pencarian baris kumpulan
kata yang mengandung
nama mahasiswa
Baris string
ada yang
mengandung
nama
mahasiswa?
Simpan dalam
variabel nama
mahasiswa
SelesaiYa
Tidak
Proses Pengenalan Jenis Berkas
nextback
▪ Proses ini berfungsi untukmengenali jenis berkas yang diunggah oleh pengguna.
▪ Proses utama yang dilakukanyaitu mencari kumpulan kata kunci berkas dari basis data, lalumembandingkannya dengankumpulan kata yang didapatdari hasil ekstraksi.
▪ Proses pencarian kata kunciberkas ini dilakukan pada setiapbaris kumpulan kata yang didapatkan dari ekstraksiOptical Character Recognition.
Mulai
Data
kumpulan kata
hasil ekstraksi
Proses pencarian kata
kunci pada kumpulan
kata
Terdapat kata
kunci pada
kumpulan data
Simpan dalam
variabelSelesai
Ya
Tidak
Proses pengambilan
kata kunci dari basis
data
Terdapat data
ekstraksi dan
kata kunciYa
Tidak
Proses Pencarian Nama Pemilik Berkas
nextback
▪ Proses ini berfungsi untukmengenali nama pemilik berkasyang diunggah oleh pengguna.
▪ Proses utama yang dilakukanyaitu mencari kumpulan kata yang mengandung kata “Nama”, “Nama Lengkap”, danlain sebagainya dari kumpulankata yang didapat dari hasilekstraksi.
▪ Proses pencarian nama pemilikberkas ini dilakukan pada setiapbaris kumpulan kata yang didapatkan dari ekstraksiOptical Character Recognition.
Mulai
Data
kumpulan kata
hasil ekstraksi
Proses pemisahan
data nama dengan
data lain
Proses
pemisahan
berhasil
Simpan dalam
variabelSelesai
Ya
Tidak
Proses pencarian baris
kumpulan kata yang
mengandung Nama
Terdapat nama
dalam sebuah
baris kumpulan
kata
Ya
Tidak
Proses Pencocokan Kumpulan Kata Menggunakan Algoritma Soundex
nextback
▪ Proses ini mempunyai tugas untukmembandingkan kumpulan kata nama yang didapat dari proses ekstraksi dengan kumpulan kata nama yang ingin dibandingkanberdasarkan nada pengucapan(fonetis) yang dimiliki oleh manusia.
▪ Misalkan terdapat dua buahkumpulan kata nama yang dibandingkan yaitu “Bachruddin” dengan “Bahrudin”. Keduakumpulan kata nama tersebutdianggap mempunyai kodepengucapan yang sama olehalgoritma Soundex.Algoritma inibisa menjadi solusi darikemungkinan kesalahan pengejaannama yang tertera pada berkasyang diunggah oleh mahasiswa.
Mulai
Variabel nama
mahasiswa yang
dibandingkan
Proses
pengkodean
string nama
mahasiswa
menggunakan
algoritma
Soundex
Kode fonetis
nama yang
dibandingkan
Proses
perbandingan
kode fonetis
nama yang
dibandingkan
Kode fonetis
mempunyai
kemiripan?
Simpan dalam variabel
nama mahasiswaSelesai
Ya
Tidak
Proses Pencocokan Kumpulan Kata MenggunakanAlgoritma Levenshtein Distance
nextback
▪ Proses pencocokan kumpulan kata dengan menggunakan algoritmaLevenshtein Distance ini mempunyaitugas untuk membandingkan kumpulankata nama yang didapat dari proses ekstraksi dengan kumpulan kata namayang ingin dibandingkan berdasarkanperbedaan karakter di antara keduanya.
▪ Algoritma Levenshtein Distance sendiribisa menjadi solusi dari kekuranganalgoritma Soundex dimana algoritma inimempunyai kemampuan untuk mencarijumlah perbedaan karakter antara duabuah kumpulan kata yang dibandingkan.
▪ Semakin banyak jumlah karakter yang berbeda, maka bisa diasumsikan jikakedua nama yang dibandingkanmemang benar-benar orang berbeda.
Mulai
Variabel nama
mahasiswa
yang
dibandingkan
Proses pencarian perbedaan
karakter string nama mahasiswa
menggunakan algoritma
Levenshtein Distance
Jumlah
perbedaan
karakter yang
dibandingkan
sangat rendah?
Simpan dalam
variabel nama
mahasiswa
Selesai
Ya
Tidak
Proses Pencocokan Kumpulan Kata MenggunakanAlgoritma Longest Common Subsequence
nextback
▪ Proses pencocokan kumpulankata dengan menggunakanalgoritma Longest Common Subsequence ini mempunyaitugas untuk membandingkankumpulan kata nama yang didapat dari proses ekstraksidengan kumpulan kata namayang ingin dibandingkanberdasarkan jumlah rangkaiankarakter terpanjang.
▪ Semakin panjang rangkaiankarakter yang didapat darikedua perbandingan, maka bisadiasumsikan jika kedua namayang dibandingkan memangbenar-benar orang yang sama.
Mulai
Variabel nama
mahasiswa
yang
dibandingkan
Proses pencarian rangkaian karakter
terpanjang dari string nama
mahasiswa menggunakan algoritma
Longest Common Subsequences
Rangkaian
karakter yang
didapat sangat
sedikit
Simpan dalam
variabel nama
mahasiswa
Selesai
Tidak
Ya
Contoh Pemakaian Layanan Web Service Validasi Berkas
http://localhost/TA_FileValidation/WebServiceFileValidation.asmx/FileValidation?filetype=Rekening%20Listrik&urlimagefile=http://www.alhiraindonesia.com/userfiles/ImageBulan1(1).jpg&nametovalidate=maryono
Lingkungan Pengujian
▪ Prosesor : Intel Core i5-M430 @ 2,27 GHz (4CPU)
▪ Memori : 4.00 GB
▪ Jenis Device : Laptop
▪ Sistem Operasi : Microsoft Windows 8.1 Enterprise 64 bit
▪ Visual Studio : Visual Studio 2012
▪ Framework : ASP.NET 4.5
nextback
Data Uji Coba Pengujian
▪ Persentase kualitas berkas yang terdapat pada tabel merupakan tingkat kejelasandata pada berkas gambar saat dilakukan pembesaran gambar pada komputerdilihat dari sudut pandang mata manusia. Sedangkan kata kunci berkas dan namadari berkas yang terdapat pada tabel merupakan data kata kunci dan nama pemilikberkas yang didapatkan dari berkas gambar yang divalidasi dengan menggunakanmata manusia.
NamaBerkasGambar
Persentase Kualitas Berkas
Kata Kunci Berkas
Nama Dari Berkas
Nama Yang Dibandingkan
Validitas Berkas
Berkas1 > 80% Ditemukan Slamet Syamsudiman
Slamet Syamsudiman
Valid
Berkas2 < 60% Ditemukan Nengah Widiada Nengah Widiada
Valid
Berkas3 > 80% Ditemukan Maryono Maryono Valid
Berkas4 < 40% Ditemukan Nengah Widiada Nengah Widiada
Valid
Berkas5 > 70% Ditemukan Machmud Machmud Valid nextback
Validitas Berkas(1)
▪ Terdapat 3 level keketatan (strictness) dalam proses validasi yaitu:
– Rendah (Low)
▪ Terdeteksi kata kunci berkas >= 1
▪ Tingkat kemiripan kode Soundex >= 75%.
▪ Nilai Levenshtein Distance < 40% dari jumlah kata yang dibandingkan
▪ Nilai Longest Common Subsequence > 20% dari jumlah kata yang dibandingkan
nextback
Validitas Berkas(2)
– Sedang (Intermediate)
▪ Terdeteksi kata kunci berkas >= 1
▪ Tingkat kemiripan kode Soundex = 100%.
▪ Nilai Levenshtein Distance < 30% dari jumlah kata yang dibandingkan
▪ Nilai Longest Common Subsequence > 30% dari jumlah kata yang dibandingkan
– Tinggi (High)
▪ Terdeteksi kata kunci berkas >= 1
▪ Tingkat kemiripan kode Soundex = 100%.
▪ Nilai Levenshtein Distance < 20% dari jumlah kata yang dibandingkan
▪ Nilai Longest Common Subsequence > 40% dari jumlah kata yang dibandingkan
nextback
Uji Coba Skenario 2
nextback
Sistem tidak bisa menemukan kata kunciberkas maupun nama pemilik berkas
Daftar Precision dan Recall dari Hasil PengujianPencarian Kata Kunci Berkas
Data Uji Retrieve Relevant Relevant Retrieve
Precision Recall
Berkas1 1 1 1 1 1
Berkas2 0 2 0 1 0
Berkas3 4 5 4 1 0.8
Berkas4 0 6 0 1 0
Berkas5 2 3 2 1 0.67
Average 1 0.494
nextback
Daftar Precision dan Recall dari Hasil PengujianPencarian Karakter Nama Pemilik Berkas
Data Uji Retrieve Relevant Relevant Retrieve
Precision Recall
Berkas1 18 18 18 1 1
Berkas2 17 20 17 1 0.85
Berkas3 7 7 7 1 1
Berkas4 0 14 0 1 0
Berkas5 7 7 7 1 1
Average 1 0.77
nextback
Evaluasi Hasil Validasi
Berkas1 Kata kunciditemukan
Karakternama
ditemukan
Berkas2Kata kunci
tidakditemukan
Karakternama
ditemukan
Berkas3 Kata kunciditemukan
Karakternama
ditemukan
Berkas4Kata kunci
tidakditemukan
Karakternama tidakditemukan
Berkas5 Kata kunciditemukan
Karakternama
ditemukan
Kualitas buruk gambardisebabkan noise
berlebihan
disebabkan
nextback
Kesimpulan
▪ Sistem dapat melakukan validasi berkas persyaratan beasiswa dengan caramendeteksi kata kunci berkas dan nama pemilik berkas memanfaatkanteknologi Optical Character Recognition.
▪ Hasil validasi berkas tergantung dengan kualitas gambar yang divalidasi. Semakin rendah kualitas gambar, maka kumpulan kata yang didapat darihasil ekstraksi akan tidak utuh sehingga data kata kunci berkas dan namapemilik berkas tidak dapat ditemukan. Hal ini ditunjukkan dengan rata-rata nilai recall dari sistem sebesar 0.494 pada pendeteksian kata kunci berkasdan 0.77 pada pendeteksian karakter nama pemilik berkas.
▪ Sistem dapat mendeteksi dengan benar data kata kunci berkas maupunkarakter nama pemilik berkas dari berkas yang divalidasi. Hal iniditunjukkan dengan rata-rata nilai precision sebesar 1.
▪ Sistem dapat digunakan oleh sistem lain dengan menggunakan layananWeb Service validasi berkas.
nextback
Saran
▪ Mengembangkan proses pengurangan gangguan pada berkasgambar yang divalidasi guna menambah tingkat keutuhan data yang diperoleh dari hasil ekstraksi Optical Character Recognition.
▪ Menambahkan proses optimasi validasi berkas guna menambahtingkat kecepatan dan ketepatan validasi.
▪ Menambahkan proses pendeteksian berkas gambar palsu yang dimanipulasi datanya.
nextback