klasifikasi teks berbasis ontologi untuk dokumen...

12
KLASIFIKASI TEKS BERBASIS ONTOLOGI UNTUK DOKUMEN TUGAS AKHIR BERBAHASA INDONESIA TUGAS AKHIR Persyaratan Guna Meraih Gelar Sarjana Strata I Teknik Informatika Universitas Muhammadiyah Malang Nama : Ayu Puji Lestari NIM : 201310370311163 JURUSAN TEKNIK INFORMATIKA FAKULTAS TEKNIK UNIVERSITAS MUHAMMADIYAH MALANG 2017

Upload: others

Post on 24-Dec-2020

19 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: KLASIFIKASI TEKS BERBASIS ONTOLOGI UNTUK DOKUMEN …eprints.umm.ac.id/36146/1/jiptummpp-gdl-ayupujiles-50388... · 2018. 1. 3. · “KLASIFIKASI TEKS BERBASIS ONTOLOGI UNTUK DOKUMEN

KLASIFIKASI TEKS BERBASIS ONTOLOGI UNTUK

DOKUMEN TUGAS AKHIR BERBAHASA

INDONESIA

TUGAS AKHIR

Persyaratan Guna Meraih Gelar Sarjana Strata I

Teknik Informatika Universitas Muhammadiyah Malang

Nama : Ayu Puji Lestari

NIM : 201310370311163

JURUSAN TEKNIK INFORMATIKA

FAKULTAS TEKNIK

UNIVERSITAS MUHAMMADIYAH MALANG

2017

Page 2: KLASIFIKASI TEKS BERBASIS ONTOLOGI UNTUK DOKUMEN …eprints.umm.ac.id/36146/1/jiptummpp-gdl-ayupujiles-50388... · 2018. 1. 3. · “KLASIFIKASI TEKS BERBASIS ONTOLOGI UNTUK DOKUMEN
Page 3: KLASIFIKASI TEKS BERBASIS ONTOLOGI UNTUK DOKUMEN …eprints.umm.ac.id/36146/1/jiptummpp-gdl-ayupujiles-50388... · 2018. 1. 3. · “KLASIFIKASI TEKS BERBASIS ONTOLOGI UNTUK DOKUMEN
Page 4: KLASIFIKASI TEKS BERBASIS ONTOLOGI UNTUK DOKUMEN …eprints.umm.ac.id/36146/1/jiptummpp-gdl-ayupujiles-50388... · 2018. 1. 3. · “KLASIFIKASI TEKS BERBASIS ONTOLOGI UNTUK DOKUMEN
Page 5: KLASIFIKASI TEKS BERBASIS ONTOLOGI UNTUK DOKUMEN …eprints.umm.ac.id/36146/1/jiptummpp-gdl-ayupujiles-50388... · 2018. 1. 3. · “KLASIFIKASI TEKS BERBASIS ONTOLOGI UNTUK DOKUMEN

KATA PENGANTAR

Segala puji bagi Allah SWT, yang telah memberikan Rahmat dan Karunianya,

sehingga penulis dapat menyelesaikan skripsi yang berjudul:

“KLASIFIKASI TEKS BERBASIS ONTOLOGI UNTUK DOKUMEN

TUGAS AKHIR BERBAHASA INDONESIA”

Skripsi ini merupakan salah satu syarat studi yang harus ditempuh oleh

seluruh mahasiswa Universitas Muhammadiyah Malang, guna menyelesaikan akhir

studi pada jenjang program Strata 1.

Peneliti menyadari masih banyak kekurangan dan keterbatasan dalam

penulisan tugas akhir ini. Untuk itu, penulis sangat mengharapkan saran yang

membangun agar tulisan ini dapat berguna untuk perkembangan ilmu pengetahuan

kedepan.

Malang, 17 Oktober 2017

Penulis

Page 6: KLASIFIKASI TEKS BERBASIS ONTOLOGI UNTUK DOKUMEN …eprints.umm.ac.id/36146/1/jiptummpp-gdl-ayupujiles-50388... · 2018. 1. 3. · “KLASIFIKASI TEKS BERBASIS ONTOLOGI UNTUK DOKUMEN

DAFTAR ISI

LEMBAR PERSETUJUAN……………………………………………………... II

LEMBAR PENGESAHAN…………………………………………………..… III

LEMBAR PERNYATAAN…………………………………………………….. IV

ABSTRAK………………………………………………………………………. V

ABSTRACT……………………………………………………………………. VI

LEMBAR PERSEMBAHAN………………………………………………..... VII

KATA PENGANTAR………………………………………………………….. IX

DAFTAR ISI…………………………………………………………………….. X

DAFTAR GAMBAR………………………………………………………..... XIII

DAFTAR TABEL……………………………………………………………. XIV

BAB I PENDAHULUAN………………………………………………………. 1

1.1 Latar Belakang………………………………………………………… 1

1.2 Rumusan Masalah……………………………………………………... 3

1.3 Batasan Masalah……………………………………………………….. 3

1.4 Tujuan………………………………………………………………..... 3

1.5 Metodologi…………………………………………………………….. 3

1.5.1 Studi Pustaka………………………………………………………... 4

1.5.2 Analisa Data dan Desain Sistem……………………………………. 4

1.5.3 Implementasi Sistem………………………………………………... 4

1.5.4 Pengujian dan Evaluasi……………………………………………... 4

1.5.5 Penyusunan Laporan………………………………………………... 4

1.6 Sistematika Penulisan………………………………………………….. 5

BAB II LANDASAN TEORI…………………………………………………… 6

2.1 Literatur Review……………………………………………………….. 6

2.2 Klasifikasi Dokumen…………………………………………………... 9

2.3 Ontologi………………………………………………………………... 9

Page 7: KLASIFIKASI TEKS BERBASIS ONTOLOGI UNTUK DOKUMEN …eprints.umm.ac.id/36146/1/jiptummpp-gdl-ayupujiles-50388... · 2018. 1. 3. · “KLASIFIKASI TEKS BERBASIS ONTOLOGI UNTUK DOKUMEN

2.3.1 Komponen Ontologi……………………………………………….. 10

2.4 RDF…………………………………………………………………... 11

2.5 SPARQL……………………………………………………………... 11

2.6 Term frequency- Inversed document frequency (TF-IDF)…………... 12

2.7 Metode Dao…………………………………………………………... 13

2.8 Pengantar Preprocessing Data………………………………………... 14

2.8.1 Case Folding……………………………………………………….. 14

2.8.2 Stopwords Removal……………………………………………….. 14

2.9 Metode Pengujian…………………………………………………….. 15

2.9.1 Akurasi…………………………………………………………….. 15

BAB III ANALISA DAN PERANCANGAN SISTEM……………………….. 16

3.1 Analisa Masalah…………………………………………………….... 16

3.2 Data Penelitian……………………………………………………….. 16

3.3 Analisa Sistem………………………………………………………... 18

3.3.1 Usecase Diagram…………………………………………………... 18

3.3.2 Flowchart…………………………………………………………... 19

3.4 Perancangan Fitur…………………………………………………….. 20

3.4.1 Preprocessing Data………………………………………………… 20

3.4.2 Pembobotan TF-IDF………………………………………………. 23

3.4.3 Permutasi Data Uji……………………………………………….... 24

3.4.4 Desain Ontologi………………………………………………........ 25

3.4.5 Desain Sparql…………………………………………………….... 28

3.4.6 Pencarian Kata Dalam Ontologi…………………………………… 29

3.4.7 Perhitungan Jarak Dengan Metode Dao…………………………… 30

3.5 Skenario Pengujian…………………………………………………… 31

BAB IV IMPLEMENTASI DAN PENGUJIAN……………………………….. 33

4.1 Implementasi Perangkat Lunak………………………………………. 33

4.2 Implezmentasi Desain Antarmuka…………………………………… 33

4.3 Pengujian Sistem……………………………………………………... 35

4.3.1 Nilai Threshold…………………………………………………….. 35

4.3.2 Pengujian Akurasi…………………………………………………. 36

Page 8: KLASIFIKASI TEKS BERBASIS ONTOLOGI UNTUK DOKUMEN …eprints.umm.ac.id/36146/1/jiptummpp-gdl-ayupujiles-50388... · 2018. 1. 3. · “KLASIFIKASI TEKS BERBASIS ONTOLOGI UNTUK DOKUMEN

BAB V………………………………………………………………………….. 41

KESIMPULAN DAN SARAN………………………………………………… 41

5.1 Kesimpulan…………………………………………………………... 41

5.2 Saran…………………………………………………………………. 41

DAFTAR PUSTAKA…………………………………………………………... 43

LAMPIRAN

Page 9: KLASIFIKASI TEKS BERBASIS ONTOLOGI UNTUK DOKUMEN …eprints.umm.ac.id/36146/1/jiptummpp-gdl-ayupujiles-50388... · 2018. 1. 3. · “KLASIFIKASI TEKS BERBASIS ONTOLOGI UNTUK DOKUMEN

DAFTAR GAMBAR

Gambar 2.1 Panjang Jarak antar 2 Node………………………………………… 13

Gambar 2.2 Case Folding ………………………………………………………. 14

Gambar 2.3 Stopword Removal ………………………………………………… 14

Gambar 3.1 Usecase Diagram…………………………………………………... 19

Gambar 3.2 Flowchart Sistem Klasifikasi………………………………………. 19

Gambar 3.3 Rancangan Ontologi Main Class…………………………………… 26

Gambar 3.4 Rancangan Ontologi Bidang Minat Informatika…………………… 27

Gambar 4.1 Halaman Utama……………………………………………………. 34

Gambar 4.2 Halaman Klasifikasi……………………………………………….. 34

Gambar 4.3 Halaman Hasil Klasifikasi…………………………………………. 35

Gambar 4.4 Hasil Pengujian Sistem…………………………………………….. 39

Page 10: KLASIFIKASI TEKS BERBASIS ONTOLOGI UNTUK DOKUMEN …eprints.umm.ac.id/36146/1/jiptummpp-gdl-ayupujiles-50388... · 2018. 1. 3. · “KLASIFIKASI TEKS BERBASIS ONTOLOGI UNTUK DOKUMEN

DAFTAR TABEL

Tabel 2.1 Hasil Penelitian Sebelumnya………………………………………..... 7

Tabel 3.1 Sample Data Tugas Akhir…………………………………………… 16

Tabel 3.2 Sample Data ACM…………………………………………………... 17

Tabel 3.3 Sample Data Kurikulum……………………………………………... 18

Tabel 3.4 Data yang belum dilakukan preprocessing…………………………... 20

Tabel 3.5 Hasil Case Folding…………………………………………………… 21

Tabel 3.6 Daftar Stopword……………………………………………………… 22

Tabel 3.7 Hasil Stopword Removal……………………………………………... 22

Tabel 3.8 Pembobotan TF-IDF………………………………………………….. 23

Tabel 3.9 Permutasi Kata……………………………………………………….. 24

Tabel 3.10 Pencarian Current Class……………………………………………... 28

Tabel 3.11 Pencarian Parrent Class……………………………………………... 28

Tabel 3.12 Pencarian Child Class……………………………………………….. 29

Tabel 3.13 Pencarian Dalam Ontologi…………………………………………... 29

Tabel 3.14 Pencarian Jarak Dalam Ontologi……………………………………. 30

Tabel 3.15 Hasil Metode Dao…………………………………………………… 31

Tabel 4.1 Hasil Pengujian Iterasi-1……………………………………………… 36

Page 11: KLASIFIKASI TEKS BERBASIS ONTOLOGI UNTUK DOKUMEN …eprints.umm.ac.id/36146/1/jiptummpp-gdl-ayupujiles-50388... · 2018. 1. 3. · “KLASIFIKASI TEKS BERBASIS ONTOLOGI UNTUK DOKUMEN

DAFTAR PUSTAKA

[1] P. Wira, D. Indra, F. I. Komputer, and U. Indonesia, “ARTIKEL BERITA

BERBAHASA INDONESIA,” vol. 14, no. 1, pp. 29–35, 2010.

[2] R. B. Riwanto, “Klasifikasi Judul Tugas akhir Teknik Informatika

Berdasarkan Bidang Minat Menggunakan Algoritma Naive Bayes

Classifier(Studi Kasus : Ruang Baca Fakultas Teknik UMM),” Universitas

Muhammadiyah Malang, 2010.

[3] I. Destuardi and S. Sumpeno, “Klasifikasi Emosi Untuk Teks Bahasa

Indonesia Menggunakan Metode Naive Bayes,” 2009.

[4] J. Samodra, S. Sumpeno, and M. Hariadi, “Klasifikasi Dokumen Teks

Berbahasa Indonesia dengan Menggunakan Naïve Bayes,” Seminar, pp. 1–

4, 2009.

[5] N. Cahyono, E. Utami, and A. Amborowati, “Konseptualisasi Ontologi Iklan

Website,” pp. 275–282, 2016.

[6] P. Widodo, J. A. Putra, S. Afiadi, A. Z. Arifin, and D. Herumurti,

“KLASIFIKASI KATEGORI DOKUMEN BERITA BERBAHASA

INDONESIA DENGAN METODE KATEGORISASI MULTI- LABEL

BERBASIS DOMAIN SPECIFIC ONTOLOGY,” vol. II, no. 2, 2016.

[7] F. R. Andriansyah, “IMPLEMENTASI WEB SEMANTIK UNTUK

APLIKASI PENCARIAN,” vol. 2, no. 1, pp. 11–18, 2015.

[8] M. B. Septian, “Implementasi model ontologi untuk pencarian informasi

berita berbasis semantik,” Universitas Muhammadiyah Malang, 2012.

[9] A. N. Cahyana, “RELEVANSI HASIL PENCARIAN PADA MESIN

MENGGUNAKAN SEMANTIK WEB.pdf,” Universitas Muhammdiyah

Malang, 2014.

[10] A. Achmad and A. A. Ilham, “Implementasi Algoritma Term Frequency –

Inverse Document Frequency dan Vector Space Model untuk Klasifikasi

Dokumen Naskah Dinas A . Text Mining B . Term frequency – Inversed

frequency Algoritm ( TF-IDF ) document Nilai N adalah jumlah dokumen

yang terdap,” vol. 257, pp. 88–92.

[11] A. Maedche and S. Staab, “Measuring similarity between ontologies,” Proc

Ekaw, pp. 15--21, 2002.

Page 12: KLASIFIKASI TEKS BERBASIS ONTOLOGI UNTUK DOKUMEN …eprints.umm.ac.id/36146/1/jiptummpp-gdl-ayupujiles-50388... · 2018. 1. 3. · “KLASIFIKASI TEKS BERBASIS ONTOLOGI UNTUK DOKUMEN