peringkasan teks secara otomatis berbasis mobile

17
PERINGKASAN TEKS SECARA OTOMATIS BERBASIS MOBILE MENGGUNAKAN METODE TF-ISF PADA BERITA ONLINE BERBAHASA INDONESIA TUGAS AKHIR Sebagai Persyaratan Guna Meraih Sarjana Strata 1 Teknik Informatika Universitas Muhammadiyah Malang Oleh: AGUS AKHYARI 07560437 JURUSAN TEKNIK INFORMATIKA FAKULTAS TEKNIK UNIVERSITAS MUHAMMADIYAH MALANG 2014

Upload: others

Post on 24-Nov-2021

13 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: PERINGKASAN TEKS SECARA OTOMATIS BERBASIS MOBILE

PERINGKASAN TEKS SECARA OTOMATIS BERBASIS

MOBILE MENGGUNAKAN METODE TF-ISF PADA

BERITA ONLINE BERBAHASA INDONESIA

TUGAS AKHIR

Sebagai Persyaratan Guna Meraih Sarjana Strata 1

Teknik Informatika Universitas Muhammadiyah Malang

Oleh:

AGUS AKHYARI

07560437

JURUSAN TEKNIK INFORMATIKA

FAKULTAS TEKNIK

UNIVERSITAS MUHAMMADIYAH MALANG

2014

Page 2: PERINGKASAN TEKS SECARA OTOMATIS BERBASIS MOBILE
Page 3: PERINGKASAN TEKS SECARA OTOMATIS BERBASIS MOBILE
Page 4: PERINGKASAN TEKS SECARA OTOMATIS BERBASIS MOBILE
Page 5: PERINGKASAN TEKS SECARA OTOMATIS BERBASIS MOBILE

LEMBAR PERSEMBAHAN

Tugas Akhir ini penulis menyadarai bahwa penyusunan dan pembuatan karya

sederhana ini tidak lepas dari bantuan berbagai pihak, oleh karena itu dengan segala

kerendahan hati, penulis menyampaikan terima kasih kepada:

1. Allah Subhanahu Wa Ta’ala yang tiada henti memberikan rahmat dan hidayah-

Nya serta menerangi setiap langkah saya.

2. Rasulullah Muhammad SAW, suri tauladanku, panutan terbaikku, dan tokoh

idolaku.

3. Ibu dan Ayah yang saya sayangi, doa tulus kepada ananda seperti air dan tak

pernah berhenti yang terus mengalir, pengorbanan, motivasi, kesabaran,

ketabahan dan tetes air matamu yang terlalu mustahil untuk dinilai,

walaupun jauh, engkaulah sebaik – baik panutan meski tidak selalu sempurna.

4. Bapak Yuda Munarko, S,Kom., MSc. selaku dosen pembimbing I dan Gita

Indah Martahasari, ST. selaku dosen pembimbing II yang senantiasa telah

banyak memberikan pengarahan dan bimbingannya selama dalam penyelesaian

penulisan Tugas Akhir ini.

5. Seluruh dosen pengajar di Jurusan Teknik Informatika yang telah membimbing

saya dalam menuntut ilmu sehingga saya bisa menjadi seseorang yang lebih

baik.

6. Regina Septiningsih selaku pemberi semangat, motivasi, pengingat sekaligus

pendamping setia dalam saya mengerjakan Tugas Akhir ini.

7. Keluarga Kontrakan Villa Sengakaling Gg J No.95. Ian Pratiko, Hendry Tri

Jatmiko yang selalu memberikan motivasi dan dorongan untuk menyelesaikan

skripsi yang saya susun.

8. Keluarga Besar Kost Zam Zam, Budhe selaku pemilik kost, Septian Andhika,

Kiki, Ogis, Bayu, Aces, Anwari, dan semua sesepuh kost yang masih di Zam-

Page 6: PERINGKASAN TEKS SECARA OTOMATIS BERBASIS MOBILE

Zam dan yang sudah melanjutkan kehidupan di luar, kebahagiaan dan keluh

kesah yang selalu saya bagikan dan saya dapatkan dikeluarga besar kost.

9. Teman-teman seperjuangan di Universitas Muhammadiyah Malang, khususnya

jurusan Teknik Informatika.

Page 7: PERINGKASAN TEKS SECARA OTOMATIS BERBASIS MOBILE

KATA PENGANTAR

Assalamu'alaikum Wr. Wb.

Dengan memanjatkan puji syukur kehadirat Allah SWT atas limpahan rahmat yang

telah diberikan sehingga Penulis dapat menyelesaikan Tugas Akhir yang berjudul

“Peringkasan Teks Secara Otomatis Bebasis Mobile Menggunakan Metode TS-

ISF Pada Berita Online Berbahasa Indonesia”.

Pada penelitian ini dibuat sebuah sistem peringkasan teks otomatis pada berita

online yang diimplementasikan pada mobile device. Dengan menggunakan sistem ini

user/pembaca dapat membaca berita/artikel secara ringkas dan praktis.

Penulis menyadari sepenuhnya bahwa penulis Tugas Akhir ini masih banyak

kekurangan, oleh karena itu penulis mengharapkan saran dan kritik yang membangun

agar tulisan ini bermanfaat bagi perkembangan ilmu kedepannya.

Akhir kata penulis mengucapkan terima kasih kepada semua pihak yang telah

membantu sehingga tugas akhir ini terselesaikan.

Wassalamu’alaikum Wr. Wb

Malang, 15 Juli 2014

Penulis

Agus akhyari

Page 8: PERINGKASAN TEKS SECARA OTOMATIS BERBASIS MOBILE

DAFTAR ISI

Halaman Judul

Lembar Persetujuan

Lembar Pengesahan

Lembar Pernyataan

Abstraksi ........................................................................................................... i

Abstract ............................................................................................................. ii

Lembar Persembahan ...................................................................................... iii

Kata Pengantar ................................................................................................ v

Daftar Isi ........................................................................................................... vi

Daftar Gambar ................................................................................................. x

Daftar Tabel ...................................................................................................... xii

Daftar Lampiran .............................................................................................. xiii

BAB I PENDAHULUAN ................................................................................ 1

1.1 Latar Belakang ................................................................................... 1

1.2 Rumusan Masalah ............................................................................. 3

1.3 Tujuan Penelitian ................................................................................ 3

1.4 Batasan Masalah ................................................................................ 3

1.5 Metodologi ........................................................................................ 4

1.6 Sistematika Pembahasan .................................................................... 6

BAB II TINJAUAN PUSTAKA ...................................................................... 8

2.1 Konsep Automated Text Summarization ............................................ 8

2.1.1 Pendekatan Ekstraksi .................................................................. 9

2.1.2 Pendekatan Abstraksi .................................................................. 9

2.1.3 Proses Text Summarization.......................................................... 10

2.1.3.1 Topic Identification ......................................................... 10

2.1.3.2 Interpretation ................................................................... 10

2.1.3.3 Generation ....................................................................... 11

Page 9: PERINGKASAN TEKS SECARA OTOMATIS BERBASIS MOBILE

2.1.4 Tipe Evaluasi ............................................................................... 11

2.2 Morfologi Bahasa Indonesia .............................................................. 13

2.3 Pengertian Kata................................................................................... 15

2.4 Pengertian Kalimat ............................................................................. 16

2.5 Paragraf dalam Bahasa Indonesia ....................................................... 17

2.2.1 Macam-macam Paragraf ............................................................. 18

2.5.1.1 Paragraf Deduktif ............................................................ 18

2.5.1.2 Paragraf Induktif .............................................................. 19

2.5.1.3 Paragraf Campuran .......................................................... 19

2.6 Berita .................................................................................................. 20

2.7 Text Preprocessing ............................................................................. 21

2.7.1 HTML Parsing ........................................................................... 22

2.7.2 Pemcehan Kalimat (Split Into Sentence) ................................... 22

2.7.3 Case Folding ............................................................................. 23

2.7.4 Tokening Kata ............................................................................ 23

2.7.5 Filteringk Kata ........................................................................... 24

2.7.6 Stemming ................................................................................... 24

2.8 Confix Striping Stemmer ..................................................................... 25

2.9 Enhanced Confix Striping Stemmer .................................................... 29

2.10 Pembobotan Kata dan Kalimat .......................................................... 31

2.10.1 TF-IDF (Term Frequecy-Invesrse Dokument Frequency) ...... 31

2.10.2 TF-ISF (Term Frequency-Inverse Sentence Frequency) ......... 32

2.10.3 Pembobotan TF Kalimat .......................................................... 32

2.11 Android .............................................................................................. 35

2.11.1 The Dalvik Virtual Machine (DVM) ....................................... 36

2.11.2 Android SDK (Software Development Kit) .............................. 37

2.11.3 Arsitektur Android .................................................................. 38

BAB III ANALISA DAN PERANCANGAN SISTEM ................................. 41

3.1 Analisa Sistem ................................................................................... 41

Page 10: PERINGKASAN TEKS SECARA OTOMATIS BERBASIS MOBILE

3.1.1 Deskripsi Umum Sistem ............................................................ 41

3.1.2 Analisa Use Cace ...................................................................... 43

3.1.3 Lingkungan Operasi ................................................................. 45

3.1.4 Analisa Perangkat Lunak .......................................................... 46

3.2 Perancangan Sistem ........................................................................... 46

3.2.2 Activity Diagram ..................................................................... 46

3.2.2.1 Activity Diagram HTML Parsing ................................. 47

3.2.2.2 Activity Diagram Text Preprocessing ........................... 47

3.2.2.3 Activity Diagram Pemecahan Kalimat ......................... 48

3.2.2.4 Activity Diagram Case Folding .................................... 49

3.2.2.5 Activity Diagram Filtering .......................................... 50

3.2.2.6 Activity Diagram Tokening ........................................... 51

3.2.2.7 Activity Diagram Stemming .......................................... 52

3.2.2.8 Activity Diagram Pembobotan Kalimat ........................ 53

3.2.2.9 Activity Diagram Sorting Lima Kalimat Tertinggi ....... 54

3.2.2.10 Activity Diagram Pengurutan Kalimat ....................... 55

3.2.3 Sequence Diagram .................................................................... 55

3.2.3.1 Sequence Diagram Level Analisis Input/Load Web Page

Berita Online ................................................................. 56

3.2.3.2 Sequence Diagram Level Analisis Summarization

(Meringkas Berita) ........................................................ 57

3.2.4 Class Diagram .......................................................................... 58

3.3 Perancangan Antar Muka .................................................................. 61

3.4 Perancangan Uji Coba ....................................................................... 61

3.4.1 Bahan Pengujian ....................................................................... 62

3.4.2 Tujuan Pengujian ...................................................................... 62

3.4.3 Skenario dan Kriteria Pengujian ............................................... 62

3.4.3.1 Pengujian Fungsional Sistem ........................................ 62

3.4.3.2 Evaluasi Hasil Ringkasan ............................................. 62

Page 11: PERINGKASAN TEKS SECARA OTOMATIS BERBASIS MOBILE

BAB IV IMPLEMENTASI DAN PENGUJIAN ........................................... 64

4.1 Implementasi Software pada Device................................................... 64

4.1.1 Implementasi Desain di Android atau Layout ........................... 64

4.1.2 Implementasi Kode di Android ................................................ 66

4.1.2.1 HTML Parsing ............................................................... 67

4.1.2.2 Pemecahan Kalimat ....................................................... 68

4.1.2.3 Class Case Folding ........................................................ 69

4.1.2.4 Tokening Kata ................................................................ 69

4.1.2.5 Class Filtering ............................................................... 70

4.1.2.6 Class Stemming.............................................................. 71

4.1.2.7 Class EnhancedCS ......................................................... 72

4.1.2.8 Pembobotan Kalimat ..................................................... 74

4.1.2.9 Sorting Bobot ................................................................. 78

4.1.2.10 Sorting Urutan Kalimat ............................................... 79

4.2 Pengujian ............................................................................................ 80

4.3.1 Pengujian Aplikasi .................................................................... 80

4.2.1.1 Fitur Share Into pada Android ....................................... 81

4.2.1.2 Halam Awal Interface Untuk Informasi Teks

(HTML Parsing) ............................................................ 82

4.2.1.3 Proses Summarization.................................................... 82

4.2.1.4 Halaman hasil Ringkasan .............................................. 83

4.3.2 Pengujian Fungsional ................................................................ 84

4.3.3 Evaluasi Hasil Ringkasan .......................................................... 87

BAB V KESIMPULAN DAN SARAN .......................................................... 89

5.1 Kesimpulan ........................................................................................ 89

5.2 Saran .................................................................................................. 89

DAFTAR PUSTAKA ....................................................................................... 90

Page 12: PERINGKASAN TEKS SECARA OTOMATIS BERBASIS MOBILE

DAFTAR GAMBAR

Gambar 2.1 : Matrix Perhitungan Recall dan Precision .................................... 12

Gambar 2.2 : Diagram Alur Preprocessing ....................................................... 22

Gambar 3.1 : Gambaran Umum Sistem .............................................................. 43

Gambar 3.2 : Use Case Diagram ATS................................................................ 43

Gambar 3.3 : Activity Diagram HTML Parsing ................................................ 47

Gambar 3.4 : Activity Diagram Text Preprocessing .......................................... 48

Gambar 3.5 : Activity Diagram Pemecahan Kalimat .......................................... 48

Gambar 3.6 : Activity Diagram Case Folding .................................................... 49

Gambar 3.7: Activity Diagram Filtering ............................................................. 50

Gambar 3.8 : Activity Diagram Tokenizing......................................................... 51

Gambar 3.9 : Activity Diagram Stemming .......................................................... 52

Gambar 3.10 : Activity Diagram Pembobotan Kalimat ...................................... 53

Gambar 3.11 : Activity Diagram Sorting Lima Kalimat ..................................... 54

Gambar 3.12 : Activity Diagram Pengurutan Kalimat ........................................ 55

Gambar 3.13 : Squence Diagram Level Analisis Input/Load Web Page Berita.. 56

Gambar 3.14 : Sequence Diagram Level Analisis Summarization (Meringkas

Berita) .......................................................................................... 57

Gambar 3.15 : Class Diagram ............................................................................ 60

Gambar 3.16 : Desain Interface aplikasi ............................................................. 61

Gambar 4.1 : Outline Layout activity_main.xml ................................................. 64

Gambar 4.2 : Tampilan Interface Aplikasi ......................................................... 66

Gambar 4.3 : Method DownloadWebPageTask (HTML Parsing) ...................... 67

Gambar 4.4 : Class PemecahanKalimat .............................................................. 68

Gambar 4.5 : Method CaseFolding ..................................................................... 69

Gambar 4.6 : Method TokenizingKata ................................................................ 69

Gambar 4.7 : Class Filtering ............................................................................... 70

Gambar 4.8 : Class Stemming ............................................................................. 71

Gambar 4.9 : Class EnchantedCS ....................................................................... 72

Page 13: PERINGKASAN TEKS SECARA OTOMATIS BERBASIS MOBILE

Gambar 4.10 : Class Kalimat .............................................................................. 74

Gambar 4.11 : Class Utility ................................................................................. 76

Gambar 4.12 : Method Compare (Kalimat, Kalimat) ........................................ 78

Gambar 4.13 : Web Page Percobaan Fungsi ....................................................... 80

Gambar 4.14 : Menu Fitur Share Into Pada Browser ........................................ 81

Gambar 4.15 : Aplikasi ATS di Menu Share Into ............................................... 81

Gambar 4.16 : Halaman Awal Interface ATS...................................................... 82

Gambar 4.17 : Button Summarize ....................................................................... 83

Gambar 4.18 : Halaman Hasil Ringkasan ........................................................... 84

Page 14: PERINGKASAN TEKS SECARA OTOMATIS BERBASIS MOBILE

DAFTAR TABEL

Tabel 2.1 : Pembentukan konfiks yang tidak diperbolehkan .............................. 14

Tabel 2.2 : Aturan Pembentukan Prefiks Ganda ................................................. 15

Tabel 2.3 : Contoh Pemecahan Kalimat .............................................................. 23

Tabel 2.4 : Contoh Case Folding ........................................................................ 23

Tabel 2.5 : Contoh Tokening Kata ...................................................................... 24

Tabel 2.6 : Contoh Filtering Kalimat .................................................................. 24

Tabel 2.7 : Contoh Stemming .............................................................................. 25

Tabel 2.8 : Kombinasi Imbuhan Terlarang ......................................................... 28

Tabel 2.9 : Aturan Pemenggalan Awalan ........................................................... 28

Tabel 2.10 : Revisi untuk Tabel 2.9 .................................................................... 30

Tabel 3.1 : Skenario Load Web Page Berita ....................................................... 44

Tabel 3.2 : Skenario Meringkas Dokumen ......................................................... 45

Tabel 4.1 : Use Case Load Web Page Berita ...................................................... 85

Tabel 4.2 : Use Case Summarize......................................................................... 86

Tabel 4.3 : Hasil Recall dan Precison ................................................................. 88

Page 15: PERINGKASAN TEKS SECARA OTOMATIS BERBASIS MOBILE

DAFTAR LAMPIRAN

Lampiran : Lembar Uji Coba Perbandingan Ringkasan Antara Manual

Dengan Sistem ................................................................................. 92

Page 16: PERINGKASAN TEKS SECARA OTOMATIS BERBASIS MOBILE

DAFTAR PUSTAKA

[1]. Arifin, A. Zainal., Mahendra, I Putu A.K., dan Ciptaningtyas, Henning Titi.

2009. “Enhanced Confix Stripping Stemmer And Ants Algorithm For

Classifying News Document In Indonesian.

[2]. Arifin, Zaenal, dan Junaiyah. 2009. “Morfologi Bentuk dan Fungsi”.

Jakarta : Gramedia Widiasarana Indonesia.

[3]. Asian, Jelita. 2007. “Effective Techniques for Indonesian Text Retrieval”.

Australia : School of Computer Science and Information Technology,

Science, Engineering, and Technology Portfolio, RMIT University.

[4]. Budiman, K. 2005. “Dasar-Dasar Jurnalistik. Pelatihan Jurnalistik-info

jawa 12-15 Desember 2005”. http://pelitaku.sabda.org/dasar-dasar

jurnalistik. Diakses tanggal 1 Juni 2014.

[5]. Gorys, Keraf. Dr. 1984. “Diksi dan Gaya Bahasa”. Jakarta : PT Gramedia

Pustaka Utama.

[6]. Hovy. 2001. “Automated Text Summarization in SUMMARIST”.

Information Sciences Institute of the University of Southern California

4676 Admiralty Way Marina del Rey, CA 90292-6695 U.S.A.

[7]. Kadhim, Alaa. “Personal text summarization in mobile device”.

[8]. Kridalaksana. (2001 : 92). “Pengertian Kalimat Menurut Para Ahli”.

http://www.trigonalworld.com/2013/07/pengertian-kalimat-menurut-para

ahli.html. Diakses tanggal 1 juni 2014.

[9]. Ladekar, A., Mujumdar, A., Nipane, P., Titar, S., Guide Mrs. Kavitha S.

2012. “Automatic Text Summarization Using Fuzzy GA-GP”. International

Journal of Engineering Research and Applications (IJERA).

[10]. Micheal, Siregar Ivan. “Membongkar Source Code berbagai Aplikasi

Android”. Gava Media.

Page 17: PERINGKASAN TEKS SECARA OTOMATIS BERBASIS MOBILE

[11]. Mine, B., Gungor, Tunga. “Using Genetic Algorithms with Lexical Chains

for Automatic Text Summarization”. Spain : Universitat Politècnica de

Catalunya, TALP Research Center, Barcelona.

[12]. Mustaqhfiri, Muhammad. 2011. “Peringkasan Teks Otomatis Berita

Berbahasa Indonesia”. Jurusan Teknik Informatika, Fakultas Sains dan

Teknologi Universitas Islam Negeri Maulana Malik Ibrahim Malang.

[13]. Purnanto, Danang Arif. “Peringkasan Dokumen Berita Bahasa Indonesia

Menggunakan Algoritma Genetika”. Ilmu Komputer Universitas

Brawijaya.

[14]. Purwasih, Nurzaitun. “Sistem Peringkas Teks Otomatis Untuk Dokumen

Tunggal Berita Berbahasa Indonesia dengan Menggunakan Graph-based

Summarization Algorithm dan Similarity”. Departemen Teknik Informatika

Institut Teknologi Telkom Bandung.

[15]. Rosidi, Imron. 2009. “Menulis Siapa Takut”. Yogyakarta : Kasnisius.

[16]. Safaat, H. Nazruddin. 2011. “Pemrograman Aplikasi Mobile Smartphone

[17]. Tala, Fadzila Z. “A Study of Stemming Effects on Information Retrieval in

Bahasa Indonesia Institute for Logic”. Language and Computation

Universiteit van Amsterdam The Netherlands.

[18]. Tan, Pang Ning., Steinbach, Michael., Kumar, Vipin. 2006. “Introduction

to Data Mining”. Boston : Pearson Education, Inc.

[19]. Yu, Lei. “A Chinese Automatic Text Summarization system for mobile

devices”.