klasifikasi teks berbasis ontologi untuk dokumen...

Post on 24-Dec-2020

19 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

KLASIFIKASI TEKS BERBASIS ONTOLOGI UNTUK

DOKUMEN TUGAS AKHIR BERBAHASA

INDONESIA

TUGAS AKHIR

Persyaratan Guna Meraih Gelar Sarjana Strata I

Teknik Informatika Universitas Muhammadiyah Malang

Nama : Ayu Puji Lestari

NIM : 201310370311163

JURUSAN TEKNIK INFORMATIKA

FAKULTAS TEKNIK

UNIVERSITAS MUHAMMADIYAH MALANG

2017

KATA PENGANTAR

Segala puji bagi Allah SWT, yang telah memberikan Rahmat dan Karunianya,

sehingga penulis dapat menyelesaikan skripsi yang berjudul:

“KLASIFIKASI TEKS BERBASIS ONTOLOGI UNTUK DOKUMEN

TUGAS AKHIR BERBAHASA INDONESIA”

Skripsi ini merupakan salah satu syarat studi yang harus ditempuh oleh

seluruh mahasiswa Universitas Muhammadiyah Malang, guna menyelesaikan akhir

studi pada jenjang program Strata 1.

Peneliti menyadari masih banyak kekurangan dan keterbatasan dalam

penulisan tugas akhir ini. Untuk itu, penulis sangat mengharapkan saran yang

membangun agar tulisan ini dapat berguna untuk perkembangan ilmu pengetahuan

kedepan.

Malang, 17 Oktober 2017

Penulis

DAFTAR ISI

LEMBAR PERSETUJUAN……………………………………………………... II

LEMBAR PENGESAHAN…………………………………………………..… III

LEMBAR PERNYATAAN…………………………………………………….. IV

ABSTRAK………………………………………………………………………. V

ABSTRACT……………………………………………………………………. VI

LEMBAR PERSEMBAHAN………………………………………………..... VII

KATA PENGANTAR………………………………………………………….. IX

DAFTAR ISI…………………………………………………………………….. X

DAFTAR GAMBAR………………………………………………………..... XIII

DAFTAR TABEL……………………………………………………………. XIV

BAB I PENDAHULUAN………………………………………………………. 1

1.1 Latar Belakang………………………………………………………… 1

1.2 Rumusan Masalah……………………………………………………... 3

1.3 Batasan Masalah……………………………………………………….. 3

1.4 Tujuan………………………………………………………………..... 3

1.5 Metodologi…………………………………………………………….. 3

1.5.1 Studi Pustaka………………………………………………………... 4

1.5.2 Analisa Data dan Desain Sistem……………………………………. 4

1.5.3 Implementasi Sistem………………………………………………... 4

1.5.4 Pengujian dan Evaluasi……………………………………………... 4

1.5.5 Penyusunan Laporan………………………………………………... 4

1.6 Sistematika Penulisan………………………………………………….. 5

BAB II LANDASAN TEORI…………………………………………………… 6

2.1 Literatur Review……………………………………………………….. 6

2.2 Klasifikasi Dokumen…………………………………………………... 9

2.3 Ontologi………………………………………………………………... 9

2.3.1 Komponen Ontologi……………………………………………….. 10

2.4 RDF…………………………………………………………………... 11

2.5 SPARQL……………………………………………………………... 11

2.6 Term frequency- Inversed document frequency (TF-IDF)…………... 12

2.7 Metode Dao…………………………………………………………... 13

2.8 Pengantar Preprocessing Data………………………………………... 14

2.8.1 Case Folding……………………………………………………….. 14

2.8.2 Stopwords Removal……………………………………………….. 14

2.9 Metode Pengujian…………………………………………………….. 15

2.9.1 Akurasi…………………………………………………………….. 15

BAB III ANALISA DAN PERANCANGAN SISTEM……………………….. 16

3.1 Analisa Masalah…………………………………………………….... 16

3.2 Data Penelitian……………………………………………………….. 16

3.3 Analisa Sistem………………………………………………………... 18

3.3.1 Usecase Diagram…………………………………………………... 18

3.3.2 Flowchart…………………………………………………………... 19

3.4 Perancangan Fitur…………………………………………………….. 20

3.4.1 Preprocessing Data………………………………………………… 20

3.4.2 Pembobotan TF-IDF………………………………………………. 23

3.4.3 Permutasi Data Uji……………………………………………….... 24

3.4.4 Desain Ontologi………………………………………………........ 25

3.4.5 Desain Sparql…………………………………………………….... 28

3.4.6 Pencarian Kata Dalam Ontologi…………………………………… 29

3.4.7 Perhitungan Jarak Dengan Metode Dao…………………………… 30

3.5 Skenario Pengujian…………………………………………………… 31

BAB IV IMPLEMENTASI DAN PENGUJIAN……………………………….. 33

4.1 Implementasi Perangkat Lunak………………………………………. 33

4.2 Implezmentasi Desain Antarmuka…………………………………… 33

4.3 Pengujian Sistem……………………………………………………... 35

4.3.1 Nilai Threshold…………………………………………………….. 35

4.3.2 Pengujian Akurasi…………………………………………………. 36

BAB V………………………………………………………………………….. 41

KESIMPULAN DAN SARAN………………………………………………… 41

5.1 Kesimpulan…………………………………………………………... 41

5.2 Saran…………………………………………………………………. 41

DAFTAR PUSTAKA…………………………………………………………... 43

LAMPIRAN

DAFTAR GAMBAR

Gambar 2.1 Panjang Jarak antar 2 Node………………………………………… 13

Gambar 2.2 Case Folding ………………………………………………………. 14

Gambar 2.3 Stopword Removal ………………………………………………… 14

Gambar 3.1 Usecase Diagram…………………………………………………... 19

Gambar 3.2 Flowchart Sistem Klasifikasi………………………………………. 19

Gambar 3.3 Rancangan Ontologi Main Class…………………………………… 26

Gambar 3.4 Rancangan Ontologi Bidang Minat Informatika…………………… 27

Gambar 4.1 Halaman Utama……………………………………………………. 34

Gambar 4.2 Halaman Klasifikasi……………………………………………….. 34

Gambar 4.3 Halaman Hasil Klasifikasi…………………………………………. 35

Gambar 4.4 Hasil Pengujian Sistem…………………………………………….. 39

DAFTAR TABEL

Tabel 2.1 Hasil Penelitian Sebelumnya………………………………………..... 7

Tabel 3.1 Sample Data Tugas Akhir…………………………………………… 16

Tabel 3.2 Sample Data ACM…………………………………………………... 17

Tabel 3.3 Sample Data Kurikulum……………………………………………... 18

Tabel 3.4 Data yang belum dilakukan preprocessing…………………………... 20

Tabel 3.5 Hasil Case Folding…………………………………………………… 21

Tabel 3.6 Daftar Stopword……………………………………………………… 22

Tabel 3.7 Hasil Stopword Removal……………………………………………... 22

Tabel 3.8 Pembobotan TF-IDF………………………………………………….. 23

Tabel 3.9 Permutasi Kata……………………………………………………….. 24

Tabel 3.10 Pencarian Current Class……………………………………………... 28

Tabel 3.11 Pencarian Parrent Class……………………………………………... 28

Tabel 3.12 Pencarian Child Class……………………………………………….. 29

Tabel 3.13 Pencarian Dalam Ontologi…………………………………………... 29

Tabel 3.14 Pencarian Jarak Dalam Ontologi……………………………………. 30

Tabel 3.15 Hasil Metode Dao…………………………………………………… 31

Tabel 4.1 Hasil Pengujian Iterasi-1……………………………………………… 36

DAFTAR PUSTAKA

[1] P. Wira, D. Indra, F. I. Komputer, and U. Indonesia, “ARTIKEL BERITA

BERBAHASA INDONESIA,” vol. 14, no. 1, pp. 29–35, 2010.

[2] R. B. Riwanto, “Klasifikasi Judul Tugas akhir Teknik Informatika

Berdasarkan Bidang Minat Menggunakan Algoritma Naive Bayes

Classifier(Studi Kasus : Ruang Baca Fakultas Teknik UMM),” Universitas

Muhammadiyah Malang, 2010.

[3] I. Destuardi and S. Sumpeno, “Klasifikasi Emosi Untuk Teks Bahasa

Indonesia Menggunakan Metode Naive Bayes,” 2009.

[4] J. Samodra, S. Sumpeno, and M. Hariadi, “Klasifikasi Dokumen Teks

Berbahasa Indonesia dengan Menggunakan Naïve Bayes,” Seminar, pp. 1–

4, 2009.

[5] N. Cahyono, E. Utami, and A. Amborowati, “Konseptualisasi Ontologi Iklan

Website,” pp. 275–282, 2016.

[6] P. Widodo, J. A. Putra, S. Afiadi, A. Z. Arifin, and D. Herumurti,

“KLASIFIKASI KATEGORI DOKUMEN BERITA BERBAHASA

INDONESIA DENGAN METODE KATEGORISASI MULTI- LABEL

BERBASIS DOMAIN SPECIFIC ONTOLOGY,” vol. II, no. 2, 2016.

[7] F. R. Andriansyah, “IMPLEMENTASI WEB SEMANTIK UNTUK

APLIKASI PENCARIAN,” vol. 2, no. 1, pp. 11–18, 2015.

[8] M. B. Septian, “Implementasi model ontologi untuk pencarian informasi

berita berbasis semantik,” Universitas Muhammadiyah Malang, 2012.

[9] A. N. Cahyana, “RELEVANSI HASIL PENCARIAN PADA MESIN

MENGGUNAKAN SEMANTIK WEB.pdf,” Universitas Muhammdiyah

Malang, 2014.

[10] A. Achmad and A. A. Ilham, “Implementasi Algoritma Term Frequency –

Inverse Document Frequency dan Vector Space Model untuk Klasifikasi

Dokumen Naskah Dinas A . Text Mining B . Term frequency – Inversed

frequency Algoritm ( TF-IDF ) document Nilai N adalah jumlah dokumen

yang terdap,” vol. 257, pp. 88–92.

[11] A. Maedche and S. Staab, “Measuring similarity between ontologies,” Proc

Ekaw, pp. 15--21, 2002.

top related