lisensi ini mengizinkan setiap orang untuk menggubah ...kc.umn.ac.id/1737/1/halaman awal.pdf ·...
TRANSCRIPT
Team project ©2017 Dony Pratidana S. Hum | Bima Agus Setyawan S. IIP
Hak cipta dan penggunaan kembali:
Lisensi ini mengizinkan setiap orang untuk menggubah, memperbaiki, dan membuat ciptaan turunan bukan untuk kepentingan komersial, selama anda mencantumkan nama penulis dan melisensikan ciptaan turunan dengan syarat yang serupa dengan ciptaan asli.
Copyright and reuse:
This license lets you remix, tweak, and build upon work non-commercially, as long as you credit the origin creator and license it on your new creations under the identical terms.
IMPLEMENTASI ALGORITMA NAZIEF – ADRIANI PADA APLIKASI
RELEVANSI KATA DALAM DOKUMEN DIGITAL
SKRIPSI
diajukan guna memenuhi sebagian persyaratan memperoleh
gelar Sarjana Komputer (S.Kom)
Diajukan oleh :
Paulus Maria Bodhi Dirma Kusumadi
10110110040
PROGRAM STUDI TEKNIK INFORMATIKA
FAKULTAS TEKNOLOGI INFORMASI DAN KOMUNIKASI
UNIVERSITAS MULTIMEDIA NUSANTARA
TANGERANG
2014
ii
HALAMAN PERSETUJUAN
Skripsi dengan judul
IMPLEMENTASI ALGORITMA NAZIEF – ADRIANI PADA
APLIKASI RELEVANSI KATA DALAM DOKUMEN DIGITAL
Oleh
Paulus Maria Bodhi Dirma Kusumadi
10110110040
telah disetujui untuk diajukan pada
Sidang Ujian Skripsi Universitas Multimedia Nusantara
Tangerang , 7 Juli 2014
Menyetujui,
Dosen Pembimbing Ketua Program Studi
Adhi Kusnadi, S.T., M.Si. Maria Irmina P. S.Kom, M.T.
Implementasi Algoritma ..., Paulus Maria Bodhi Dirma Kusumadi, FTI UMN, 2014
iii
HALAMAN PERSEMBAHAN
“Manusia tak selamanya benar dan tak selamanya salah, kecuali ia
yang selalu mengoreksi diri dan membenarkan kebenaran orang lain
atas kekeliruan diri sendiri”
PERSEMBAHAN :
Karya Tulis ini kupersembahkan kepada :
1. Bapak dan Ibu tercinta
2. Teman-teman seperjuangan
3. Almamater
4. Semua pembaca yang budiman
Implementasi Algoritma ..., Paulus Maria Bodhi Dirma Kusumadi, FTI UMN, 2014
iv
PERNYATAAN TIDAK MELAKUKAN PLAGIAT
Dengan ini saya:
Nama : Paulus Maria Bodhi Dirma Kusumadi
NIM : 10110110040
Fakultas : Teknologi Informasi dan Komunikasi
Program Studi : Teknik Informatika
Menyatakan bahwa skripsi ini adalah karya ilmiah saya sendiri, bukan hasil
plagiat dari karya ilmiah yang ditulis oleh orang lain atau lembaga lain, dan
semua karya ilmiah orang lain atau lembaga lain yang dirujuk dalam skripsi
ini telah disebutkan sumber kutipannya seta dicatumkan di Daftar Pustaka
Tangerang, 7 Juli 2014
Paulus M. Bodhi
Implementasi Algoritma ..., Paulus Maria Bodhi Dirma Kusumadi, FTI UMN, 2014
v
IMPLEMENTASI ALGORITMA NAZIEF-ADRIANI PADA APLIKASI
RELEVANSI KATA DALAM DOKUMEN DIGITAL
ABSTRAKSI
Skripsi ini memaparkan pengembangan dari penggunaan Algoritma Nazief
Adriani sebagai algoritma stemming yang berguna untuk mengubah bentuk kata
berimbuhan menjadi kata dasar yang digabungkan dengan aturan Cosine
Similaritydan digunakan untuk menghitung persentase kemiripan dari dokumen
digital yang akan dibandingkan berdasarkan susunan kata didalamnya. Dalam
aplikasi ini algoritma ini digunakan untuk meningkatkan hasil relevansi isi dari
kedua dokumen digital yang akan dihitung persentasi kemiripan isinya
berdasarkan kata dasarnya. Algoritma ini berdasarkan pada aturan morfologi
Bahasa Indonesia yang merupakan bagian dari Information Retrieval. Dokumen
yang akan dihitung relevansinya dapat berupa dokumen yang berbeda tipe /
ekstensi seperti dokumen berekstensi txt, docx dan rtf. Konten yang akan dinilai
relevansi nya dari dokumen digital tersebut ialah konten teks dan hasil relevansi
nya ialah berupa persentase dan statistik kata dasar yang telah di stemm.Setelah
dilakukan ujicoba, relevansi antar dua dokumen digital dapat dihitung
relevansinya dalam satuan presentase, serta algoritma stemming yang digunakan
berhasil melakukan stemming dengan index Understemming sebesar 13.5 x
dan Overstemming sebesar 2.473 x .
Kata kunci : stemming, Cosine Similarity, Evaluasi Paice ,algoritma Nazief-
Adriani.
Implementasi Algoritma ..., Paulus Maria Bodhi Dirma Kusumadi, FTI UMN, 2014
vi
IMPLEMENTATION OF NAZIEF-ADRIANI ALGORITHM AT
RELEVANCE WORDS APPLICATION ON DIGITAL
DOCUMENT
ABSTRACT
This thesis describes development of the use of Nazief Adriani Algorithm as a
useful stemming algorithm for translating words to its root words and combined
with Cosine Similarity Rules that used to calculate relevance percentage of two
digital documents. This algorithm in this application used to improve relevance
result from those both digital document that will be calculated based from its root
words. This algorithm based on morphology of Indonesian language, which its
part of Information Retrieval. Digital Documents that will be calculate its
relevance is document can be different document type such as txt, docx and rtf
files. Content which will be calculate its relevance is a text type and its relevance
result is a percentage and root words statistics as a result of stemming process.
After testing period, digital documents relevance can be calculated in percentage.
Stemming algorithm that used has 13.5 x understemming index and 2.473 x
of overstemming index
Keywords : stemming, Cosine Similarity, Paice Evaluation , Nazief-Adriani
algorithm.
Implementasi Algoritma ..., Paulus Maria Bodhi Dirma Kusumadi, FTI UMN, 2014
vii
KATA PENGANTAR
Segala pengetahuan yang ada di dunia ini berasal dari Tuhan Yang
Mahakasih, dan hal tersebut telah menjadikan suatu sumber inspirasi yang
membantu penulis dalam menyelesaikan laporan tugas akhir. Laporan tugas akhir
yang berjudul “IMPLEMENTASI ALGORITMA NAZIEF-ADRIANI PADA
APLIKASI RELEVANSI KATA DALAM DOKUMEN DIGITAL” diajukan
kepada Program Studi Teknik Informatika, Fakultas Teknologi Informatika dan
Komunikasi, Universitas Multimedia Nusantara.
Selama penulis melaksanakan tugas akhir, tentunya tidak pernah terlepas
daripada semua orang-orang yang berada di sekitar penulis. Rasa terima kasih
penulis ditujukan kepada:
1. Dr. Ninok Leksono, selaku Rektor Universitas Multimedia Nusantara,
2. Dr. Rer. Nat. P. Y. Topo Suprihadi, Dipl. Phys., selaku Wakil Rektor I,
3. Ir. Andrey Andoko, M.Sc., selaku Wakil Rektor II,
4. Hira Meidia, B.Eng., Ph.D., selaku Wakil Rektor III,
5. Prof. Dr. Muliawati G. Siswanto, M.Eng.Sc., selaku Wakil Rektor IV,
6. Maria Irmina Prasetiyowati, S.Kom., M.T. selaku Ketua Program Studi
Teknik Informatika di Universitas Multimedia Nusantara,
7. Adhi Kusnadi, S.T., M.Si.. selaku Dosen Pembimbing,
8. Jansen yang senantiasa membantu penulis dalam memahami dan
memberikan pengetahuan-pengetahuan dalam pembuatan laporan tugas
akhir,
Implementasi Algoritma ..., Paulus Maria Bodhi Dirma Kusumadi, FTI UMN, 2014
viii
9. Yansen, Hadi Hartono, Kencana Wulan, Jeffry Steward dan kerabat
penulis lainnya yang telah mendukung penulis untuk menyelesaikan
laporan tugas akhir,
10. Keluarga penulis yang senantiasa menyokong dan mendukung penulis
dalam menyelesaikan proses pembuatan laporan skripsi ini,
Semoga laporan tugas akhir karya penulis ini dapat bermanfaat sebagai
sumber informasi maupun sumber inspirasi bagi para pembaca, terutama para
mahasiswa UMN dalam mengembangkan fakultas teknologi informasi dan
komunikasi.
Tangerang, 7 Juli2014
Paulus M. Bodhi
Implementasi Algoritma ..., Paulus Maria Bodhi Dirma Kusumadi, FTI UMN, 2014
ix
DAFTAR ISI
HALAMAN PERSETUJUAN ................................................................................ ii
HALAMAN PERSEMBAHAN ............................................................................ iii
PERNYATAAN TIDAK MELAKUKAN PLAGIAT .......................................... iv
ABSTRAKSI .......................................................................................................... v
ABSTRACT ............................................................................................................. vi
KATA PENGANTAR .......................................................................................... vii
DAFTAR ISI .......................................................................................................... ix
DAFTAR TABEL .................................................................................................. xi
DAFTAR GAMBAR ............................................................................................ xii
DAFTAR RUMUS .............................................................................................. xiv
BAB I PENDAHULUAN ....................................................................................... 1
1.1 Latar Belakang ......................................................................................... 1
1.2 Rumusan Masalah .................................................................................... 3
1.3 Batasan Masalah ....................................................................................... 3
1.4 Tujuan Penelitian ...................................................................................... 3
1.5 Manfaat Penelitian .................................................................................... 4
BAB IILANDASAN TEORI .................................................................................. 5
2.1 Dokumen Digital ...................................................................................... 5
2.2 Information Retrieval (IR) ........................................................................ 6
2.3 Stemming .................................................................................................. 7
2.4 Pencarian / Searching ............................................................................... 7
2.5 Algoritma Stemming Nazief Adriani ....................................................... 9
2.6 Relevansi ................................................................................................ 13
2.6 .1 Cosine Similarity .................................................................................... 13
Implementasi Algoritma ..., Paulus Maria Bodhi Dirma Kusumadi, FTI UMN, 2014
x
2.7 Metode Evaluasi Paice ........................................................................... 14
BAB III METODE PENELITIAN........................................................................ 20
3.1 Metode Penelitian ................................................................................... 20
3.2 Perancangan ............................................................................................ 21
3.2.1 Diagram Sistem / Flowchart .................................................................. 22
3.2.2 Flowchart Algoritma Nazief – Adriani .................................................. 23
3.2.3 Data Flow Diagram ............................................................................... 23
3.2.4 Struktur Tabel ......................................................................................... 26
3.2.5 Fungsionalitas Sistem ............................................................................. 27
3.2.6 Masukkan dan keluaran sistem ............................................................... 27
3.2.7 Hierarki Menu Aplikasi .......................................................................... 28
3.3 Desain Tampilan Antar Muka ................................................................ 29
BAB IV IMPLEMENTASI DAN UJI COBA ...................................................... 34
4.1 Implementasi Sistem .............................................................................. 34
4.1.1 Hierarki Menu Aplikasi .......................................................................... 34
4.1.2 Hasil Implementasi ................................................................................. 35
4.2 Uji Coba ................................................................................................. 41
BAB V SIMPULAN DAN SARAN ..................................................................... 54
5.1 Simpulan ................................................................................................. 54
5.2 Saran ....................................................................................................... 55
DAFTAR PUSTAKA ........................................................................................... 56
LAMPIRAN .......................................................................................................... 56
Implementasi Algoritma ..., Paulus Maria Bodhi Dirma Kusumadi, FTI UMN, 2014
xi
DAFTAR TABEL
Tabel 2.1 : Kombinasi Awalan Akhiran yang tidak diijinkan .............................. 11
Tabel 2.2 : Aturan pemenggalan Awalan Stemmer Nazief Adriani ...................... 12
Tabel 2.3 Contoh kelompok kata semantik ........................................................... 18
Tabel 2.4 Hasil setelah proses stemming, UI = 0,6 ............................................... 19
Tabel 3.1 Tabel Entitas DFD ................................................................................ 24
Tabel 3.1 Tabel Entitas DFD (Lanjutan)............................................................... 25
Tabel 3.2 Proses Dalam Level 1 ........................................................................... 26
Tabel 3.3 Tabel Database Kata Dasar ................................................................... 26
Tabel 4.1 Tabel Bobot Vektor ............................................................................... 44
Tabel 4.2 Tabel Ujicoba Relevansi ....................................................................... 49
Tabel 4.3 Semantik group dan hasil stemming ..................................................... 50
Tabel 4.4 Tabel stemmed words hasil susun ulang ............................................... 52
Implementasi Algoritma ..., Paulus Maria Bodhi Dirma Kusumadi, FTI UMN, 2014
xii
DAFTAR GAMBAR
Gambar 3.1 FlowChart Aplikasi RelevanceDoc ................................................... 22
Gambar 3.3 FlowChart Algoritma Nazief - Adriani ............................................. 23
Gambar 3.2 Diagram Context atau Diagram Level 0 ............................................ 24
Gambar 3.2 Diagram Level 1 ................................................................................ 25
Gambar 3.4 Hierarki Menu Aplikasi ..................................................................... 28
Gambar 3.5 Wellcome Screen ............................................................................... 29
Gambar 3.6 Menu Utama Program Relevance Doc .............................................. 30
Gambar 3.7 Tampilan Hasil Relevansi ................................................................. 31
Gambar 3.8 Statistik Kata ..................................................................................... 32
Gambar 3.9 Statistik Perbandingan ....................................................................... 33
Gambar 4.1 Jendela Wellcome Screen .................................................................. 35
Gambar 4.2 Jendela Utama Program Relevance Doc ........................................... 36
Gambar 4.3 Jendela Program Utama Tersambung ............................................... 37
Gambar 4.4 Jendela Program Utama Preview ...................................................... 37
Gambar 4.5 Jendela Program Utama Stemm ......................................................... 38
Gambar 4.6 Jendela Hasil Relevansi ..................................................................... 39
Gambar 4.7 Jendela Statistik Dokumen ................................................................ 39
Gambar 4.8 Jendela Statistik Relevansi ................................................................ 40
Gambar 4.9 Jendela Stemmer ................................................................................ 41
Gambar 4.10 Ujicoba Dokumen Manual .............................................................. 42
Gambar 4.11 Statistik Ujicoba Manual ................................................................. 42
Gambar 4.12 Hasil Ujicoba Manual...................................................................... 43
Gambar 4.13 Hasil Statistik Manual ..................................................................... 43
Implementasi Algoritma ..., Paulus Maria Bodhi Dirma Kusumadi, FTI UMN, 2014
xiii
Gambar 4.14 Ujicoba Dokumen ........................................................................... 47
Gambar 4.15 Ujicoba Relevansi ........................................................................... 47
Gambar 4.16 Ujicoba statistik hasil ...................................................................... 48
Gambar 4.17 Uji coba stemm kata ‟terprosesnyalah‟ ........................................... 51
Gambar 4.18 Uji coba stemm kata „bersekolah‟ ................................................... 51
Implementasi Algoritma ..., Paulus Maria Bodhi Dirma Kusumadi, FTI UMN, 2014
xiv
DAFTAR RUMUS
Rumus 2.1 Cosine Similarity ........................................................................................ 14
Rumus 2.2 DMT / Desired Merge Total ..................................................................... 16
Rumus 2.3 GDMT / Global Desired Merge Total ..................................................... 16
Rumus 2.4 UMT / Unachieved Merge Total .............................................................. 16
Rumus 2.5GUMT / Global Unachieved Merge Total ............................................... 17
Rumus 2.6 UI / UnderStemming Index ....................................................................... 17
Rumus 2.8GWMT / Global Wrongly Merge Total .................................................... 17
Rumus 2.9DNT / Desired Non Merge Total .............................................................. 18
Rumus 2.10GDNT / Global Desired Non Merge Total ............................................ 18
Rumus 2.11OI / Overstemming Index ......................................................................... 18
Implementasi Algoritma ..., Paulus Maria Bodhi Dirma Kusumadi, FTI UMN, 2014