klasifikasi teks berbasis ontologi untuk dokumen...
Post on 24-Dec-2020
19 Views
Preview:
TRANSCRIPT
KLASIFIKASI TEKS BERBASIS ONTOLOGI UNTUK
DOKUMEN TUGAS AKHIR BERBAHASA
INDONESIA
TUGAS AKHIR
Persyaratan Guna Meraih Gelar Sarjana Strata I
Teknik Informatika Universitas Muhammadiyah Malang
Nama : Ayu Puji Lestari
NIM : 201310370311163
JURUSAN TEKNIK INFORMATIKA
FAKULTAS TEKNIK
UNIVERSITAS MUHAMMADIYAH MALANG
2017
KATA PENGANTAR
Segala puji bagi Allah SWT, yang telah memberikan Rahmat dan Karunianya,
sehingga penulis dapat menyelesaikan skripsi yang berjudul:
“KLASIFIKASI TEKS BERBASIS ONTOLOGI UNTUK DOKUMEN
TUGAS AKHIR BERBAHASA INDONESIA”
Skripsi ini merupakan salah satu syarat studi yang harus ditempuh oleh
seluruh mahasiswa Universitas Muhammadiyah Malang, guna menyelesaikan akhir
studi pada jenjang program Strata 1.
Peneliti menyadari masih banyak kekurangan dan keterbatasan dalam
penulisan tugas akhir ini. Untuk itu, penulis sangat mengharapkan saran yang
membangun agar tulisan ini dapat berguna untuk perkembangan ilmu pengetahuan
kedepan.
Malang, 17 Oktober 2017
Penulis
DAFTAR ISI
LEMBAR PERSETUJUAN……………………………………………………... II
LEMBAR PENGESAHAN…………………………………………………..… III
LEMBAR PERNYATAAN…………………………………………………….. IV
ABSTRAK………………………………………………………………………. V
ABSTRACT……………………………………………………………………. VI
LEMBAR PERSEMBAHAN………………………………………………..... VII
KATA PENGANTAR………………………………………………………….. IX
DAFTAR ISI…………………………………………………………………….. X
DAFTAR GAMBAR………………………………………………………..... XIII
DAFTAR TABEL……………………………………………………………. XIV
BAB I PENDAHULUAN………………………………………………………. 1
1.1 Latar Belakang………………………………………………………… 1
1.2 Rumusan Masalah……………………………………………………... 3
1.3 Batasan Masalah……………………………………………………….. 3
1.4 Tujuan………………………………………………………………..... 3
1.5 Metodologi…………………………………………………………….. 3
1.5.1 Studi Pustaka………………………………………………………... 4
1.5.2 Analisa Data dan Desain Sistem……………………………………. 4
1.5.3 Implementasi Sistem………………………………………………... 4
1.5.4 Pengujian dan Evaluasi……………………………………………... 4
1.5.5 Penyusunan Laporan………………………………………………... 4
1.6 Sistematika Penulisan………………………………………………….. 5
BAB II LANDASAN TEORI…………………………………………………… 6
2.1 Literatur Review……………………………………………………….. 6
2.2 Klasifikasi Dokumen…………………………………………………... 9
2.3 Ontologi………………………………………………………………... 9
2.3.1 Komponen Ontologi……………………………………………….. 10
2.4 RDF…………………………………………………………………... 11
2.5 SPARQL……………………………………………………………... 11
2.6 Term frequency- Inversed document frequency (TF-IDF)…………... 12
2.7 Metode Dao…………………………………………………………... 13
2.8 Pengantar Preprocessing Data………………………………………... 14
2.8.1 Case Folding……………………………………………………….. 14
2.8.2 Stopwords Removal……………………………………………….. 14
2.9 Metode Pengujian…………………………………………………….. 15
2.9.1 Akurasi…………………………………………………………….. 15
BAB III ANALISA DAN PERANCANGAN SISTEM……………………….. 16
3.1 Analisa Masalah…………………………………………………….... 16
3.2 Data Penelitian……………………………………………………….. 16
3.3 Analisa Sistem………………………………………………………... 18
3.3.1 Usecase Diagram…………………………………………………... 18
3.3.2 Flowchart…………………………………………………………... 19
3.4 Perancangan Fitur…………………………………………………….. 20
3.4.1 Preprocessing Data………………………………………………… 20
3.4.2 Pembobotan TF-IDF………………………………………………. 23
3.4.3 Permutasi Data Uji……………………………………………….... 24
3.4.4 Desain Ontologi………………………………………………........ 25
3.4.5 Desain Sparql…………………………………………………….... 28
3.4.6 Pencarian Kata Dalam Ontologi…………………………………… 29
3.4.7 Perhitungan Jarak Dengan Metode Dao…………………………… 30
3.5 Skenario Pengujian…………………………………………………… 31
BAB IV IMPLEMENTASI DAN PENGUJIAN……………………………….. 33
4.1 Implementasi Perangkat Lunak………………………………………. 33
4.2 Implezmentasi Desain Antarmuka…………………………………… 33
4.3 Pengujian Sistem……………………………………………………... 35
4.3.1 Nilai Threshold…………………………………………………….. 35
4.3.2 Pengujian Akurasi…………………………………………………. 36
BAB V………………………………………………………………………….. 41
KESIMPULAN DAN SARAN………………………………………………… 41
5.1 Kesimpulan…………………………………………………………... 41
5.2 Saran…………………………………………………………………. 41
DAFTAR PUSTAKA…………………………………………………………... 43
LAMPIRAN
DAFTAR GAMBAR
Gambar 2.1 Panjang Jarak antar 2 Node………………………………………… 13
Gambar 2.2 Case Folding ………………………………………………………. 14
Gambar 2.3 Stopword Removal ………………………………………………… 14
Gambar 3.1 Usecase Diagram…………………………………………………... 19
Gambar 3.2 Flowchart Sistem Klasifikasi………………………………………. 19
Gambar 3.3 Rancangan Ontologi Main Class…………………………………… 26
Gambar 3.4 Rancangan Ontologi Bidang Minat Informatika…………………… 27
Gambar 4.1 Halaman Utama……………………………………………………. 34
Gambar 4.2 Halaman Klasifikasi……………………………………………….. 34
Gambar 4.3 Halaman Hasil Klasifikasi…………………………………………. 35
Gambar 4.4 Hasil Pengujian Sistem…………………………………………….. 39
DAFTAR TABEL
Tabel 2.1 Hasil Penelitian Sebelumnya………………………………………..... 7
Tabel 3.1 Sample Data Tugas Akhir…………………………………………… 16
Tabel 3.2 Sample Data ACM…………………………………………………... 17
Tabel 3.3 Sample Data Kurikulum……………………………………………... 18
Tabel 3.4 Data yang belum dilakukan preprocessing…………………………... 20
Tabel 3.5 Hasil Case Folding…………………………………………………… 21
Tabel 3.6 Daftar Stopword……………………………………………………… 22
Tabel 3.7 Hasil Stopword Removal……………………………………………... 22
Tabel 3.8 Pembobotan TF-IDF………………………………………………….. 23
Tabel 3.9 Permutasi Kata……………………………………………………….. 24
Tabel 3.10 Pencarian Current Class……………………………………………... 28
Tabel 3.11 Pencarian Parrent Class……………………………………………... 28
Tabel 3.12 Pencarian Child Class……………………………………………….. 29
Tabel 3.13 Pencarian Dalam Ontologi…………………………………………... 29
Tabel 3.14 Pencarian Jarak Dalam Ontologi……………………………………. 30
Tabel 3.15 Hasil Metode Dao…………………………………………………… 31
Tabel 4.1 Hasil Pengujian Iterasi-1……………………………………………… 36
DAFTAR PUSTAKA
[1] P. Wira, D. Indra, F. I. Komputer, and U. Indonesia, “ARTIKEL BERITA
BERBAHASA INDONESIA,” vol. 14, no. 1, pp. 29–35, 2010.
[2] R. B. Riwanto, “Klasifikasi Judul Tugas akhir Teknik Informatika
Berdasarkan Bidang Minat Menggunakan Algoritma Naive Bayes
Classifier(Studi Kasus : Ruang Baca Fakultas Teknik UMM),” Universitas
Muhammadiyah Malang, 2010.
[3] I. Destuardi and S. Sumpeno, “Klasifikasi Emosi Untuk Teks Bahasa
Indonesia Menggunakan Metode Naive Bayes,” 2009.
[4] J. Samodra, S. Sumpeno, and M. Hariadi, “Klasifikasi Dokumen Teks
Berbahasa Indonesia dengan Menggunakan Naïve Bayes,” Seminar, pp. 1–
4, 2009.
[5] N. Cahyono, E. Utami, and A. Amborowati, “Konseptualisasi Ontologi Iklan
Website,” pp. 275–282, 2016.
[6] P. Widodo, J. A. Putra, S. Afiadi, A. Z. Arifin, and D. Herumurti,
“KLASIFIKASI KATEGORI DOKUMEN BERITA BERBAHASA
INDONESIA DENGAN METODE KATEGORISASI MULTI- LABEL
BERBASIS DOMAIN SPECIFIC ONTOLOGY,” vol. II, no. 2, 2016.
[7] F. R. Andriansyah, “IMPLEMENTASI WEB SEMANTIK UNTUK
APLIKASI PENCARIAN,” vol. 2, no. 1, pp. 11–18, 2015.
[8] M. B. Septian, “Implementasi model ontologi untuk pencarian informasi
berita berbasis semantik,” Universitas Muhammadiyah Malang, 2012.
[9] A. N. Cahyana, “RELEVANSI HASIL PENCARIAN PADA MESIN
MENGGUNAKAN SEMANTIK WEB.pdf,” Universitas Muhammdiyah
Malang, 2014.
[10] A. Achmad and A. A. Ilham, “Implementasi Algoritma Term Frequency –
Inverse Document Frequency dan Vector Space Model untuk Klasifikasi
Dokumen Naskah Dinas A . Text Mining B . Term frequency – Inversed
frequency Algoritm ( TF-IDF ) document Nilai N adalah jumlah dokumen
yang terdap,” vol. 257, pp. 88–92.
[11] A. Maedche and S. Staab, “Measuring similarity between ontologies,” Proc
Ekaw, pp. 15--21, 2002.
top related