presentasi tugas akhir -...

45
Presentasi Tugas Akhir “Rancang Bangun Aplikasi Sistem Validasi Data Berkas BeasiswaJurusan Teknik Informatika Fakultas Teknologi Informasi Institut Teknologi Sepuluh Nopember 2014 Oleh : Artha Pradyta NRP. 5110100109

Upload: vulien

Post on 14-Mar-2019

225 views

Category:

Documents


0 download

TRANSCRIPT

Presentasi Tugas Akhir

“Rancang Bangun Aplikasi Sistem Validasi Data Berkas Beasiswa”

Jurusan Teknik Informatika

Fakultas Teknologi Informasi

Institut Teknologi Sepuluh Nopember

2014

Oleh :Artha PradytaNRP. 5110100109

Pendahuluan

Latar Belakang

PengunggahanBerkas Persyaratan

Beasiswa

Validasi Berkas OlehManusia

Proses SeleksiPemberian Beasiswa

nextback

• Harus menungguvalidasi oleh manusia

• Jenis berkas yang divalidasi cukup banyak

Lamanyaproses seleksi

pemberianbeasiswa

menyebabkan

• Salah mengenali jenisberkas

• Salah mengenalipemilik berkas

Terjadinya“Human Error”

sering memicu

Tujuan

– Membuat sistem yang dapat melakukan validasi jenis berkas dan pemilik berkasyang diunggah oleh mahasiswa.

– Mengimplementasikan penerapan algoritma Levenshtein Distance, Longest Common Subsequence, dan Soundex untuk membandingkan data nama pemilikberkas.

– Mengimplementasikan penerapan teknologi Optical Character Recognition untuk ekstraksi data dari berkas persyaratan yang diunggah ke dalam sistem.

nextback

Rumusan Permasalahan(1)

▪ Cara memvalidasi data berkas persyaratan beasiswa yang diunggah olehmahasiswa melalui layanan Web Service.

nextback

SI Beasiswa Sistem Validasi Berkas

Web Service

Rumusan Permasalahan(2)

▪ Menerapkan metode Optical Character Recognition pada sistem validasi data berkas persyaratan beasiswa untuk mendapatkan kumpulan kata nama besertakata kunci setiap berkas.

rincian iagihan dapat diakses di unn.b1n.co}id informasi hubungi call center : 123 atau hub. pln terdekat : 'ii _ ()();;(3451;j7?;;1 ttd-hart pryment 9820456authorized pt.pos indonesia (persero) ktanggal : 2012-12-15 09:25:05 v tno.resi : 9820456-01/2012/003724 petugas : 68204560& Ipembayaran pln pznpsr zona-z' ridpel : 1830901149690 tnama : maryonotarif/daya : r1/2200 vabl/th : des 2012stand meter : 03868200 * 03896600non subsidi . i rp. t 0rp tag pln : rp. 241.585nurahrref : l850101850189817720l2l2150925050pln menyatakan struk ini sebagai bukti pembayaran yang san,admin pos : rp. 1.900total bayar : rp. 243.4851 dinnian tanihan danat diakses di nnn.n1n.co.id inform&

nextback

Rumusan Permasalahan(3)

▪ Menerapkan algoritma Levenshtein Distance, Longest Common Subsequence, danSoundex pada sistem validasi data berkas persyaratan beasiswa untuk melakukanpencocokan kumpulan kata nama.

▪ Menentukan hasil validasi jenis dan nama yang tertera di dalam berkas.

Artha Pradyta Bachruddin

nextback

Batasan Permasalahan

▪ Studi kasus yang dibahas adalah SI Beasiswa di Perguruan Tinggi X.

▪ Data uji yang digunakan adalah data sekunder (dummy).

▪ Aplikasi ini dibangun dengan menggunakan bahasa pemrograman ASP.NET.

▪ Tingkat keberhasilan validasi tergantung dari kejelasan gambar yang diunggah.

▪ Banyaknya gangguan (noise) pada gambar akan mempengaruhi lamanya proses validasi.

▪ Algoritma pencocokan kumpulan kata yang digunakan adalah algoritma LevenshteinDistance, Longest Common Subsequence, dan Soundex.

▪ Metode untuk pengurangan gangguan pada gambar berupa penambahan skala (rezise), pengubahan ke dalam bentuk skala abu (gray-scale), dan penambahan kontras (contrast).

▪ Aplikasi validasi berkas ini tidak bisa mendeteksi adanya berkas palsu yang dimanipulasidatanya.

nextback

Tinjauan Pustaka

Optical Character Recognition

▪ Merupakan sebuah teknologi konversi dari gambar ke bentuk teks. Teknologi ini biasanya digunakan untuk mengambil data dari berkas-berkasberbentuk gambar seperti dokumen paspor, faktur, laporan bank, kartunama, dan sebagainya.

▪ Dalam pemrosesan OCR, gambar dianalisis pada daerah terang dan gelapdalam rangka mengidentifikasi setiap huruf abjad maupun angka numeric. Ketika karakter sudah diketahui, maka setiap kata tersebut dirubah kedalam bentuk ASCII. Dalam hal ini mesin komputer merubah kode ASCII tersebut menjadi berupa karakter maupun angka.

▪ Karena kemampuannya dalam hal ekstraksi data dari gambar inilah, makateknologi ini digunakan untuk mengambil data-data dari berkaspersyaratan beasiswa yang telah diunggah ke sistem seperti suratketerangan miskin, rekening listrik, rekening air dan sebagainya

nextback

Algoritma Soundex & NormalisasiString(1)

▪ Algoritma Soundex mengambil masukanberupa sebuah kumpulan kata yang mengidentifikasi apakah sepasang kata tersebut mirip secara fonetik. Fonetik sendirimerupakan ilmu yang menyelidiki bunyibahasa tanpa melihat fungsi bunyi itu sebagaipembeda makna dalam suatu bahasa.

▪ Sebuah kumpulan kata yang berbeda namunmempunyai cara pengucapan yang sama, akan memiliki kode fonetis yang sama. Contohnya adalah “Djono” dan “Jono”.

▪ Algoritma Soundex dibuat berdasarkanpengucapan dalam bahasa Inggris. Untukmendukung pencocokan kumpulan kata berdasarkan bahasa Indonesia, sekaligusmelakukan optimasi terhadap algoritmatersebut, diperlukan suatu proses normalisasi. Salah satu cara untuk proses normalisasiadalah dengan menggunakan aturan translasiq-gram.

nextback

Q-Gram ContohAwal Translasi Awal TranslasiKH HH Rakhmat RahhmatDJ JJ Endjang EnjjangTJ CC Itjang IccangCQ, CK KK Erick ErikkPH FF Philip FfilipDZ ZZ Dzikri ZzikriSJ SY Sjahrir SyahrirSY SS Syifa SsifaBH, DH,GH, JH, SH,TH, ZH

BB, DD, GG,JJ, SS, TT,ZZ

Ardhi Arddi

V F Saviena SafienaKS XX Wicaksono WicaxxonoOE UU Wahyoedi WahyuudiIE II Arie AriiY I Donny Donni

Algoritma Soundex & NormalisasiString(2)

▪ Berikut ini merupakan langkah-langkah algoritma Soundex dalammenghasilkan kode fonetis darisebuah kumpulan kata masukan.– Mengubah semua huruf menjadi huruf

kapital, dan hilangkan tanda baca.– Mempertahankan huruf pertama pada

kata tersebut.– Mengubah huruf lainnya menjadi kode

fonetis berdasarkan aturan yang berlaku.– Menghapus semua pasangan dari kode

fonetis yang berurutan.– Menghapus semua kode fonetis yang

bernilai 0.– Menulis empat posisi pertama yang

mengikuti pola: <uppercase letter><digit><digit><digit>. Inimerupakan keluaran dari kode fonetis. Jika kode fonetis tidak sampai empatkarakter, maka ditambahkan angka 0 sampai menjadi empat karakter.

nextback

Huruf Kode Klasifikasi FonetisA,E,H,I,O,U,W,Y 0 Diperlukan sebagai bunyi vokalB,F,P,V 1 Labial dan labio-dentalC,G,J,K,Q,S,X,Z 2 GlottalD,T 3 Dental-muteL 4 Palatal fricativeM,N 5 Labio-nasal dan dentalR 6 Dental fricative

Jono Djono

jono jono

J050 J050

String awal

Translasi q-gram

Kode fonetis

Algoritma Levenshtein Distance

▪ Levenshtein Distance adalah jumlah minimal operasi yang dibutuhkan untuk mengubahsuatu kumpulan kata ke kumpulan kata yang lain. Dengan algoritma ini, dapat diketahuitingkat perbedaan dua buah kumpulan kata dalam representasi angka.

▪ Berikut ini operasi yang dilakukan dalamalgoritma Levenshtein Distance.– Penyisipan (Insertion)

▪ Merupakan proses penyisipan sebuah karakterke dalam sebuah kumpulan kata tertentu.

– Penghapusan (Deletion)▪ Merupakan proses penghapusan sebuah

karakter dari sebuah kumpulan kata tertentu.

– Penggantian (Substitution)▪ Merupakan proses penggantian sebuah

karakter dari sebuah kumpulan kata dengankarakter lain.

nextback

Djono Jono

Jono Jono Penghapusan

Nilai Levenshtein Distance = 1

String yang dibandingkan String pembanding

Algoritma Longest Common Subsequence

▪ Subsequence adalah sebuah rangkaian yang dapat diperoleh dari rangkaianlain dengan cara menghapus beberapa elemen tertentu tanpa mengubahurutan dari elemen lain yang tersisa. Misalkan ada rangkaian X danY, rangkaian S dikatakan sebuah common subsequence dari X danY apabila S adalah subsequence dari keduanya. Longest Common Subsequence (LCS) merupakan common subsequence terpanjang dari seluruh common subsequence. Contohnya adalah sebagai berikut.

▪ X = {M,A,K,A,N}.

▪ Y = {M,A,L,A,M}.

▪ Contoh common subsequence dari X danY adalah S = {M,A,A} dan T = {M,A}. Karena S merupakan subsequence yang lebih panjang, maka longest common subsequence dari X danY adalah S

nextback

Web Service

▪ Web Service adalah suatu sistem perangkat lunak yang dirancang untukmendukung interaksi mesin ke mesin pada suatu jaringan. Sistem lain yang berinteraksi dengan Web Service dilakukan melalui antar muka menggunakanpesan seperti pada SOAP. Pada umumnya pesan ini melalui HTTP dan XML yang merupakan salah satu standar situs web. Perangkat lunak aplikasi yang ditulisdalam berbagai bahasa pemrograman dan berjalan pada berbagai platform dapatmenggunakan Web Service untuk pertukaran data pada jaringan komputer sepertiInternet dalam cara yang serupa dengan komunikasi antar proses pada komputertunggal.

▪ Dalam hal ini Web Service digunakan sebagai perantara pertukaran data berkasantara SI Beasiswa dengan aplikasi validasi berkas beasiswa.

nextback

Precision & Recall

▪ Untuk menghitung tingkat performansi suatu sistem yang memiliki kemampuan untuk mendapatkan kembali informasi-informasi tertentu dapat menggunakan perhitungan precisiondan recall.

▪ Precision adalah tingkat ketepatan antara informasi yang diminta oleh pengguna dengan jawabanyang diberikan oleh sistem.

▪ Recall adalah tingkat keberhasilan sistem dalam menemukan kembali sebuah informasi.

▪ Secara matematis, rumus untuk menghitung presisi dan recall dapat dilihat pada Persamaan 1dan Persamaan 2.

nextback

𝑝𝑟𝑒𝑐𝑖𝑠𝑖𝑜𝑛 =𝑟𝑒𝑙𝑒𝑣𝑎𝑛𝑡 𝑖𝑡𝑒𝑚𝑠 𝑟𝑒𝑡𝑟𝑖𝑒𝑣𝑒𝑑

𝑟𝑒𝑡𝑟𝑖𝑒𝑣𝑒𝑑 𝑖𝑡𝑒𝑚𝑠

𝑟𝑒𝑐𝑎𝑙𝑙 =𝑟𝑒𝑙𝑒𝑣𝑎𝑛𝑡 𝑖𝑡𝑒𝑚𝑠 𝑟𝑒𝑡𝑟𝑖𝑒𝑣𝑒𝑑

𝑟𝑒𝑙𝑒𝑣𝑎𝑛𝑡 𝑖𝑡𝑒𝑚𝑠

Analisis & Perancangan

Deskripsi Umum Sistem(1)

nextback

Ekstraksi

kumpulan

kata

Optical Character

Recognition (OCR)

Aplikasi Validator

Pencocokan

kumpulan kata

nama mahasiswa

SI Beasiswa Aplikasi Validasi Berkas

Mahasiswa Administrator

SI Beasiswa

Web Service

Berkas

Persyaratan

Beasiswa

Pendeteksian kata

kunci berkas

Alur Proses Validasi Berkas

Sistem Validasi BerkasSistem Beasiswa

Ph

ase

Mulai

Mengirim Data Berkas Yang

Akan Divalidasi Melalui

Web Service Berupa Data

Jenis Berkas, Alamat Url

Berkas, Nama Yang

Divalidasi

Menerima Permintaan

Validasi Berkas Gambar

Dengan Ekstensi JPG, JPEG,

TIF, GIF, PNG

Melakukan Ekstraksi

Informasi Dari Gambar

Menggunakan Optical

Character Recognition

Melakukan Pencarian Kata

Kunci Berkas

Terdapat Kata Kunci

Berkas

Melakukan Pencarian

Karakter Nama Pemilik

Berkas

Melakukan Pencocokan

Karakter Nama Pemilik

Berkas Menggunakan

Algoritma Soundex

Ya

Selesai

Tidak

Terdapat Karakter

Nama Pemilik Berkas

Ya

Melakukan Pencocokan

Karakter Nama Pemilik

Berkas Menggunakan

Algoritma Longest Common

Subsequences

Melakukan Pencocokan

Karakter Nama Pemilik

Berkas Menggunakan

Algoritma Levenshtein

Distance

Hasil Validitas

Berkas Dalam

Bentuk XML

Informasi

Kegagalan

Proses Validasi

Berkas

nextback

Langkah Proses Validasi Berkas

Proses Ekstraksi BerkasGambar Menggunakan

Optical Character Recognition

Proses Pengenalan JenisBerkas

Proses Pencarian NamaPemilik Berkas

Proses PencocokanKumpulan Kata

Menggunakan AlgoritmaSoundex

Proses PencocokanKumpulan Kata

Menggunakan AlgoritmaLevenshtein Distance

Proses PencocokanKumpulan Kata

Menggunakan AlgoritmaLongest Common

Subsequence

nextback

Proses Ekstraksi Berkas Gambar MenggunakanOptical Character Recognition

▪ Proses ekstraksi berkas berupaberkas gambar merupakantahap awal yang harus dilakukanuntuk mendapatkan semuainformasi data yang terdapatpada berkas gambar.

▪ Diperlukan teknologi Optical Character Recognition untukmelakukan ekstraksi informasipada sebuah gambar.

▪ Proses ekstraksi denganmenggunakan Optical Character Recognition ini menghasilkansekumpulan kumpulan kata.

nextback

Mulai

Berkas

gambar

Pengurangan

noise

dengan

teknik resize,

gray-scale

dan contrast

Berkas

gambar

dengan

noise

yang

diminim

alisir

Proses

ekstraksi

berkas

gambar

Kumpul

an kata

Pencarian baris kumpulan

kata yang mengandung

nama mahasiswa

Baris string

ada yang

mengandung

nama

mahasiswa?

Simpan dalam

variabel nama

mahasiswa

SelesaiYa

Tidak

Proses Pengenalan Jenis Berkas

nextback

▪ Proses ini berfungsi untukmengenali jenis berkas yang diunggah oleh pengguna.

▪ Proses utama yang dilakukanyaitu mencari kumpulan kata kunci berkas dari basis data, lalumembandingkannya dengankumpulan kata yang didapatdari hasil ekstraksi.

▪ Proses pencarian kata kunciberkas ini dilakukan pada setiapbaris kumpulan kata yang didapatkan dari ekstraksiOptical Character Recognition.

Mulai

Data

kumpulan kata

hasil ekstraksi

Proses pencarian kata

kunci pada kumpulan

kata

Terdapat kata

kunci pada

kumpulan data

Simpan dalam

variabelSelesai

Ya

Tidak

Proses pengambilan

kata kunci dari basis

data

Terdapat data

ekstraksi dan

kata kunciYa

Tidak

Proses Pencarian Nama Pemilik Berkas

nextback

▪ Proses ini berfungsi untukmengenali nama pemilik berkasyang diunggah oleh pengguna.

▪ Proses utama yang dilakukanyaitu mencari kumpulan kata yang mengandung kata “Nama”, “Nama Lengkap”, danlain sebagainya dari kumpulankata yang didapat dari hasilekstraksi.

▪ Proses pencarian nama pemilikberkas ini dilakukan pada setiapbaris kumpulan kata yang didapatkan dari ekstraksiOptical Character Recognition.

Mulai

Data

kumpulan kata

hasil ekstraksi

Proses pemisahan

data nama dengan

data lain

Proses

pemisahan

berhasil

Simpan dalam

variabelSelesai

Ya

Tidak

Proses pencarian baris

kumpulan kata yang

mengandung Nama

Terdapat nama

dalam sebuah

baris kumpulan

kata

Ya

Tidak

Proses Pencocokan Kumpulan Kata Menggunakan Algoritma Soundex

nextback

▪ Proses ini mempunyai tugas untukmembandingkan kumpulan kata nama yang didapat dari proses ekstraksi dengan kumpulan kata nama yang ingin dibandingkanberdasarkan nada pengucapan(fonetis) yang dimiliki oleh manusia.

▪ Misalkan terdapat dua buahkumpulan kata nama yang dibandingkan yaitu “Bachruddin” dengan “Bahrudin”. Keduakumpulan kata nama tersebutdianggap mempunyai kodepengucapan yang sama olehalgoritma Soundex.Algoritma inibisa menjadi solusi darikemungkinan kesalahan pengejaannama yang tertera pada berkasyang diunggah oleh mahasiswa.

Mulai

Variabel nama

mahasiswa yang

dibandingkan

Proses

pengkodean

string nama

mahasiswa

menggunakan

algoritma

Soundex

Kode fonetis

nama yang

dibandingkan

Proses

perbandingan

kode fonetis

nama yang

dibandingkan

Kode fonetis

mempunyai

kemiripan?

Simpan dalam variabel

nama mahasiswaSelesai

Ya

Tidak

Proses Pencocokan Kumpulan Kata MenggunakanAlgoritma Levenshtein Distance

nextback

▪ Proses pencocokan kumpulan kata dengan menggunakan algoritmaLevenshtein Distance ini mempunyaitugas untuk membandingkan kumpulankata nama yang didapat dari proses ekstraksi dengan kumpulan kata namayang ingin dibandingkan berdasarkanperbedaan karakter di antara keduanya.

▪ Algoritma Levenshtein Distance sendiribisa menjadi solusi dari kekuranganalgoritma Soundex dimana algoritma inimempunyai kemampuan untuk mencarijumlah perbedaan karakter antara duabuah kumpulan kata yang dibandingkan.

▪ Semakin banyak jumlah karakter yang berbeda, maka bisa diasumsikan jikakedua nama yang dibandingkanmemang benar-benar orang berbeda.

Mulai

Variabel nama

mahasiswa

yang

dibandingkan

Proses pencarian perbedaan

karakter string nama mahasiswa

menggunakan algoritma

Levenshtein Distance

Jumlah

perbedaan

karakter yang

dibandingkan

sangat rendah?

Simpan dalam

variabel nama

mahasiswa

Selesai

Ya

Tidak

Proses Pencocokan Kumpulan Kata MenggunakanAlgoritma Longest Common Subsequence

nextback

▪ Proses pencocokan kumpulankata dengan menggunakanalgoritma Longest Common Subsequence ini mempunyaitugas untuk membandingkankumpulan kata nama yang didapat dari proses ekstraksidengan kumpulan kata namayang ingin dibandingkanberdasarkan jumlah rangkaiankarakter terpanjang.

▪ Semakin panjang rangkaiankarakter yang didapat darikedua perbandingan, maka bisadiasumsikan jika kedua namayang dibandingkan memangbenar-benar orang yang sama.

Mulai

Variabel nama

mahasiswa

yang

dibandingkan

Proses pencarian rangkaian karakter

terpanjang dari string nama

mahasiswa menggunakan algoritma

Longest Common Subsequences

Rangkaian

karakter yang

didapat sangat

sedikit

Simpan dalam

variabel nama

mahasiswa

Selesai

Tidak

Ya

Contoh Proses Validasi

nextback

Contoh Pemakaian Layanan Web Service Validasi Berkas

http://localhost/TA_FileValidation/WebServiceFileValidation.asmx/FileValidation?filetype=Rekening%20Listrik&urlimagefile=http://www.alhiraindonesia.com/userfiles/ImageBulan1(1).jpg&nametovalidate=maryono

Pengujian & Evaluasi

Lingkungan Pengujian

▪ Prosesor : Intel Core i5-M430 @ 2,27 GHz (4CPU)

▪ Memori : 4.00 GB

▪ Jenis Device : Laptop

▪ Sistem Operasi : Microsoft Windows 8.1 Enterprise 64 bit

▪ Visual Studio : Visual Studio 2012

▪ Framework : ASP.NET 4.5

nextback

Data Uji Coba Pengujian

▪ Persentase kualitas berkas yang terdapat pada tabel merupakan tingkat kejelasandata pada berkas gambar saat dilakukan pembesaran gambar pada komputerdilihat dari sudut pandang mata manusia. Sedangkan kata kunci berkas dan namadari berkas yang terdapat pada tabel merupakan data kata kunci dan nama pemilikberkas yang didapatkan dari berkas gambar yang divalidasi dengan menggunakanmata manusia.

NamaBerkasGambar

Persentase Kualitas Berkas

Kata Kunci Berkas

Nama Dari Berkas

Nama Yang Dibandingkan

Validitas Berkas

Berkas1 > 80% Ditemukan Slamet Syamsudiman

Slamet Syamsudiman

Valid

Berkas2 < 60% Ditemukan Nengah Widiada Nengah Widiada

Valid

Berkas3 > 80% Ditemukan Maryono Maryono Valid

Berkas4 < 40% Ditemukan Nengah Widiada Nengah Widiada

Valid

Berkas5 > 70% Ditemukan Machmud Machmud Valid nextback

Validitas Berkas(1)

▪ Terdapat 3 level keketatan (strictness) dalam proses validasi yaitu:

– Rendah (Low)

▪ Terdeteksi kata kunci berkas >= 1

▪ Tingkat kemiripan kode Soundex >= 75%.

▪ Nilai Levenshtein Distance < 40% dari jumlah kata yang dibandingkan

▪ Nilai Longest Common Subsequence > 20% dari jumlah kata yang dibandingkan

nextback

Validitas Berkas(2)

– Sedang (Intermediate)

▪ Terdeteksi kata kunci berkas >= 1

▪ Tingkat kemiripan kode Soundex = 100%.

▪ Nilai Levenshtein Distance < 30% dari jumlah kata yang dibandingkan

▪ Nilai Longest Common Subsequence > 30% dari jumlah kata yang dibandingkan

– Tinggi (High)

▪ Terdeteksi kata kunci berkas >= 1

▪ Tingkat kemiripan kode Soundex = 100%.

▪ Nilai Levenshtein Distance < 20% dari jumlah kata yang dibandingkan

▪ Nilai Longest Common Subsequence > 40% dari jumlah kata yang dibandingkan

nextback

Uji Coba Skenario 1

nextback

Uji Coba Skenario 2

nextback

Sistem tidak bisa menemukan kata kunciberkas maupun nama pemilik berkas

Uji Coba Skenario 3

nextback

Uji Coba Skenario 4

nextback

Sistem tidak bisamenemukan kata kunciberkas maupun nama

pemilik berkas

Uji Coba Skenario 5

nextback

Daftar Precision dan Recall dari Hasil PengujianPencarian Kata Kunci Berkas

Data Uji Retrieve Relevant Relevant Retrieve

Precision Recall

Berkas1 1 1 1 1 1

Berkas2 0 2 0 1 0

Berkas3 4 5 4 1 0.8

Berkas4 0 6 0 1 0

Berkas5 2 3 2 1 0.67

Average 1 0.494

nextback

Daftar Precision dan Recall dari Hasil PengujianPencarian Karakter Nama Pemilik Berkas

Data Uji Retrieve Relevant Relevant Retrieve

Precision Recall

Berkas1 18 18 18 1 1

Berkas2 17 20 17 1 0.85

Berkas3 7 7 7 1 1

Berkas4 0 14 0 1 0

Berkas5 7 7 7 1 1

Average 1 0.77

nextback

Evaluasi Hasil Validasi

Berkas1 Kata kunciditemukan

Karakternama

ditemukan

Berkas2Kata kunci

tidakditemukan

Karakternama

ditemukan

Berkas3 Kata kunciditemukan

Karakternama

ditemukan

Berkas4Kata kunci

tidakditemukan

Karakternama tidakditemukan

Berkas5 Kata kunciditemukan

Karakternama

ditemukan

Kualitas buruk gambardisebabkan noise

berlebihan

disebabkan

nextback

Kesimpulan & Saran

Kesimpulan

▪ Sistem dapat melakukan validasi berkas persyaratan beasiswa dengan caramendeteksi kata kunci berkas dan nama pemilik berkas memanfaatkanteknologi Optical Character Recognition.

▪ Hasil validasi berkas tergantung dengan kualitas gambar yang divalidasi. Semakin rendah kualitas gambar, maka kumpulan kata yang didapat darihasil ekstraksi akan tidak utuh sehingga data kata kunci berkas dan namapemilik berkas tidak dapat ditemukan. Hal ini ditunjukkan dengan rata-rata nilai recall dari sistem sebesar 0.494 pada pendeteksian kata kunci berkasdan 0.77 pada pendeteksian karakter nama pemilik berkas.

▪ Sistem dapat mendeteksi dengan benar data kata kunci berkas maupunkarakter nama pemilik berkas dari berkas yang divalidasi. Hal iniditunjukkan dengan rata-rata nilai precision sebesar 1.

▪ Sistem dapat digunakan oleh sistem lain dengan menggunakan layananWeb Service validasi berkas.

nextback

Saran

▪ Mengembangkan proses pengurangan gangguan pada berkasgambar yang divalidasi guna menambah tingkat keutuhan data yang diperoleh dari hasil ekstraksi Optical Character Recognition.

▪ Menambahkan proses optimasi validasi berkas guna menambahtingkat kecepatan dan ketepatan validasi.

▪ Menambahkan proses pendeteksian berkas gambar palsu yang dimanipulasi datanya.

nextback

Sekian & Terima kasih

Semoga diluluskan… amin…