plagiat merupakan tindakan tidak terpuji - core.ac.uk filei peringkasan teks otomatis pada dokumen...

128
i PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu Syarat Memperoleh Gelar Sarjana Teknik Informatika (S.Kom) Program Studi Teknik Informatika Oleh AGUSTINUS WIDIANTORO 105314062 PROGRAM STUDI TEKNIK INFORMATIKA FAKULTAS SAINS DAN TEKNOLOGI UNIVERSITAS SANATA DHARMA YOGYAKARTA 2014 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Upload: others

Post on 13-Sep-2019

6 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

i

PERINGKASAN TEKS OTOMATIS

PADA DOKUMEN BERBAHASA JAWA

MENGGUNAKAN METODE TF-IDF

SKRIPSI

Diajukan Untuk Memenuhi Salah Satu Syarat

Memperoleh Gelar Sarjana Teknik Informatika (S.Kom)

Program Studi Teknik Informatika

Oleh

AGUSTINUS WIDIANTORO

105314062

PROGRAM STUDI TEKNIK INFORMATIKA

FAKULTAS SAINS DAN TEKNOLOGI

UNIVERSITAS SANATA DHARMA

YOGYAKARTA

2014

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 2: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

ii

AUTOMATIC TEXT SUMMARY

IN JAVANESE LANGUAGE DOCUMENT

USING TF-IDF METHOD

THESIS

Presented as Partial Fullfilment of the Requirements

To Obtain the Computer Bachelor Degree

In Informatics Engineering

By

AGUSTINUS WIDIANTORO

105314062

INFORMATICS ENGINEERING STUDY PROGRAM

FACULTY OF SCIENCE AND TECHNOLOGY

SANATA DHARMA UNIVERSITY

YOGYAKARTA

2014

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 3: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

iii

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 4: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

iv

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 5: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

v

PERNYATAAN KEASLIAN KARYA

Saya menyatakan dengan sesungguhnya bahwa skripsi yang saya tulis ini

tidak memuat karya atau bagian karya orang lain, kecuali yang telah disebutkan

dalam kutipan dan daftar pustaka sebagaimana layaknya karya ilmiah.

Yogyakarta, 10 November 2014

Penulis

Agustinus Widiantoro

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 6: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

vi

HALAMAN MOTTO

"Musuh yang paling berbahaya di atas dunia ini adalah penakut dan bimbang.

Teman yang paling setia, hanyalah keberanian dan keyakinan yang teguh."

(Andrew Jackson)

"Pendidikan merupakan perlengkapan paling baik untuk hari tua."

(Aristoteles)

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 7: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

vii

HALAMAN PERSEMBAHAN

Hasil karya skripsi ini, kupersembahakan kepada :

Tuhan Yesus dan Bunda Maria

Alm. F.X.Susilo S.Pd

Christiana Wagiyem S.Pd

Veronika Suci Anggraeni S.Pd

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 8: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

viii

ABSTRAKSI

Membaca keseluruhan dokumen membutuhkan waktu yang lama, apalagi

dokumen yang dibaca adalah dokumen berbahasa Jawa. Bagi pembaca yang

belum paham tentang bahasa Jawa, membaca keseluruhan dokumen untuk

memahaminya akan sangat melelahkan. Namun jika terdapat ringkasan pendek

dari sebuah dokumen, maka akan membantu pembaca dalam memahami isi

dokumen berbahasa Jawa.

Membuat ringkasan secara manual akan membutuhkan waktu yang lama.

Oleh karena itu untuk mengatasi masalah waktu baca, akan dibuat sistem

peringkasan teks otomatis. Peringkasan ini akan secara otomatis meringkas

keseluruhan isi dari sebuah dokumen untuk mendapatkan intisari dari dokumen

berbahasa Jawa, sehingga pembaca dapat memahami isi dokumen tanpa harus

membaca keseluruhan dokumen berbahasa Jawa.

Pada penelitian ini metode yang digunakan untuk peringkasan teks

otomatis adalah TF-IDF, dimana metode ini menggunakan cara pembobotan

untuk setiap kata dalam kalimat. Sehingga kata dengan kemunculan terbanyak

merupakan sebuah kalimat yang penting. Dari perhitungan tersebut akan

menghasilkan kumpulan kalimat yang berisi bagian penting dari keseluruhan

dokumen berbahasa Jawa.

Pengujian sistem dilakukan kepada 3 responden, dimana responden harus

mengoreksi secara manual ringkasan yang dihasilkan oleh sistem termasuk

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 9: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

ix

relevan atau tidak relevan. Terdapat 50 dokumen berbahasa Jawa yang akan

diujikan ke dalam sistem, dokumen tersebut bersumber dari DjakaLodang.

Dari hasil pengujian sistem yang telah dilakukan kepada 3 responden

secara manual, menghasilkan nilai rata-rata akurasi sebesar 64%. Dengan

demikian diketahui nilai rata-rata akurasi sistem ini dalam membantu pembaca

untuk memperoleh intisari dari dokumen berbahasa Jawa, sehingga dapat

membuat keputusan melanjutkan membaca keseluruhan dokumen atau cukup

dengan mambaca ringkasan.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 10: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

x

ABSTRACT

Reading a whole content of a document will take a long time, moreover

the document that is being read is Javanese document. For the readers who have

not really understand Javanese language well, reading and understanding a whole

document will be really tiring. However, if there is a summary of a document, it

will be helpful for the readers to understand the content of Javanese document.

Making a summary in a manual way will take a long time. Therefore, to

solve the problem of timing, itwill be made the system of summarizing the text

automatically. This program will summarize the whole content of Javanese

documentautomatically and get the main idea from the document, so the readers

will understand the content of the Javanese document without reading a whole of

it.

In this research, the method that is used in the program of summary is TF-

IDF which means this method use weighting way in every word. So, the word

with the highest appearances areconsidered as the important sentence. The

calculation will produce the document compilation containing the important part

from the whole Javanese document.

The system of examination is done by three respondents, which the

respondents should check the summary result of the system manually whether the

result is the relevant or not relevant. There are 50 Javanese documents which will

be examined to the system, the source of those documents is DjakaLodang.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 11: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

xi

From the result of examination that was done by 3 respondents manually

and it brings out the average value of 64%. Thus, it is known how much the level

of accuracy in helping the readers to get the main idea of the Javanese document

so that they can make the decision to continue reading a whole document or just

read the summary of the document.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 12: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

xii

LEMBAR PERNYATAAN PERSETUJUAN

PUBLIKASI KARYA ILMIAH UNTUK KEPENTINGAN AKADEMIS

Yang bertanda tangan dibawah ini, saya mahasiswa Universitas Sanata

Dharma :

Nama : Agustinus Widiantoro

NIM : 105314062

Demi pengembangan ilmu pengetahuan, saya memberikan kepada

Perpustakaan Universitas Sanata Dharma karya ilmiah yang berjudul :

PERINGKASAN TEKS OTOMATIS

PADA DOKUMEN BERBAHASA JAWA

MENGGUNAKAN METODE TF-IDF

Beserta perangkat yang diperlukan. Dengan demikian saya memberikan

kepada Perpustakaan Universitas Sanata Dharma hak untuk menyimpan,

mengalihkan dalam bentuk media lain, mengolahnya dalam bentuk pangkalan

data, mendistribusikan secara terbatas dan mempublikasikannya di internet atau

media lain untuk kepentingan akademis tanpa perlu meminta izin dari saya

maupun memberikan royalti kepada saya selama tetap mencantumkan nama saya

sebagai penulis.

Demikian pernyataan ini saya buat dengan sebenarnya.

Yogyakarta, 10 November 2014

Penulis

Agustinus Widiantoro

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 13: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

xiii

KATA PENGANTAR

Puji dan syukur penulis panjatkan ke hadirat Tuhan Yang Maha Esa atas

segala berkat dan karunianya yang melimpah sehingga penulis dapat

menyelesaikan skripsi ini dengan baik. Adapun tujuan penulis adalah untuk

memenuhi persyaratan dalam memperoleh gelar Sarjana Teknik Informatika

(S.Kom) Universitas Sanata Dharma.

Penyusun skripsi ini tidak terlepas dari bantuan, bimbingan, dan peran

berbagai pihak. Oleh karena itu pada kesempatan ini penulis mengucapkan terima

kasih kepada pihak-pihak berikut :

1. Tuhan Yesus Kristus dan Bunda Maria yang selalu membimbing dan menuntun

untuk menyelesaikan skripsi ini.

2. Ibu Paulina Heruningsih Prima Rosa, S.Si., M.Sc., selaku Dekan Fakultas Sains

dan Teknologi Universitas Sanata Dharma.

3. Ibu Sri Hartati Wijono, S.Si., M.Kom., selaku Dosen Pembimbing yang telah

meluangkan banyak waktu untuk membimbing dengan sabar, memberikan

masukan, saran dan memotivasi selama mengerjakan skripsi ini.

4. Ibu Ridowati Gunawan, S.Kom., M.T., selaku Dosen sekaligus Kepala Program

Studi Teknik Informatika.

5. Bapak JB. Budi Darmawan, S.T., M.Sc., dan bapak Puspaningtyas Sanjoyo

Adi, S.T., M.T., sebagai Dosen Penguji.

6. Seluruh Staff dan Dosen Program Studi Teknik Informatika Universitas Sanata

Dharma yang telah memberikan bekal ilmu kepada penulis.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 14: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

xiv

7. Ketiga responden kuesioner yang telah memberikan waktu luang dalam

melakukan proses pengujian.

8. Alm. F.X. Susilo S.Pd, Ibu Christiana Wagiyem S.Pd, Kakak Veronika Suci

Anggraeni S.Pd serta seluruh keluarga besar yang terus memberikan doa,

dukungan dan semangat sehingga dapat menyelesaikan skripsi ini.

9. Sahabat-sahabat, teman-teman Teknik Informatika angkatan 2010 atas

kekompakan serta kebersamaan selama ini.

10. Semua pihak yang tidak dapat disebutkan satu per satu yang terlibat dalam

penyusunan skripsi ini sehingga dapat selesai dengan baik.

Dengan rendah hati penulis menyadari bahwa skripsi ini masih belum

sempurna, oleh karena itu berbagai kritik dan saran untuk perbaikan skripsi ini

sangat penulis harapkan. Akhir kata, semoga penyusunan skripsi ini bermanfaat

bagi pengembangan ilmu pengetahuan. Terima kasih.

Yogyakarta, 10 November 2014

Penulis

Agustinus Widiantoro

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 15: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

xv

DAFTAR ISI

HALAMAN JUDUL BAHASA INDONESIA ............................................. i

HALAMAN JUDUL BAHASA INGGRIS ................................................. ii

HALAMAN PERSETUJUAN ................................................................... iii

HALAMAN PENGESAHAN .................................................................... iv

HALAMAN KEASLIAN KARYA ............................................................. v

HALAMAN MOTTO ................................................................................ vi

HALAMAN PERSEMBAHAN ................................................................ vii

ABSTRAKSI ........................................................................................... viii

ABSTRACT ............................................................................................... x

LEMBAR PERNYATAAN PERSETUJUAN........................................... xii

KATA PENGANTAR ............................................................................. xiii

DAFTAR ISI ............................................................................................ xv

DAFTAR TABEL .................................................................................... xx

DAFTAR GAMBAR ............................................................................... xxi

DAFTAR LISTING ............................................................................... xxiii

BAB I PENDAHULUAN ........................................................................... 1

1.1 Latar Belakang ............................................................................. 1

1.2 Rumusan Masalah ........................................................................ 3

1.3 Tujuan Penalitian ......................................................................... 3

1.4 Manfaat Penelitian ....................................................................... 3

1.5 Batasan Masalah .......................................................................... 4

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 16: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

xvi

1.6 Metodologi Penelitian .................................................................. 4

1.7 Sistematika Penulisan ................................................................... 6

BAB II LANDASAN TEORI ..................................................................... 8

2.1 Pemerolehan Informasi ................................................................. 8

2.1.1 Konsep Pemerolehan Informasi ........................................... 8

2.1.2 Langkah Pemerolahan Informasi.......................................... 8

2.1.2.1 Text Preprocessing ........................................................... 8

2.1.2.1.1 Tokenizing ......................................................... 8

2.1.2.1.2 Stopword ............................................................ 9

2.1.2.1.3 Stemming ......................................................... 10

2.1.2.2 Indexing ......................................................................... 14

2.1.2.3 LinkedList ...................................................................... 15

2.1.2.4 ArrayList ........................................................................ 16

2.2 Peringkasan Otomatis ................................................................. 16

2.3 Metode Peringkasan Teks Otomatis ............................................ 17

2.3.1 Metode Pembobotan TF-IDF ............................................. 17

2.3.1.1 Langkah Pengerjaan ............................................... 20

2.3.1.2 Contoh Pengerjaan ................................................. 21

BAB III ANALISIS DAN PERANCANGAN SISTEM ............................ 33

3.1 Gambaran Sistem Penelitian ....................................................... 33

3.2 Analisis Kebutuhan .................................................................... 35

3.3 Perancangan Sistem.................................................................... 36

3.3.1 Diagram Use Case ............................................................. 36

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 17: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

xvii

3.3.1.1 Skenario Use Case ....................................................... 37

3.3.1.1.1 Skenario Login ....................................................... 37

3.3.1.1.2 Skenario Memasukkan Data Koleksi Dokumen ...... 38

3.3.1.1.3 Skenario Logout ..................................................... 39

3.3.1.1.4 Skenario Memasukkan Data Dokumen ................... 39

3.3.1.1.5 Skenario Melihat Hasil Ringkasan.......................... 40

3.3.1.1.6 Skenario Melihat Data Koleksi Dokumen............... 41

3.3.2 Diagram Aktifitas .............................................................. 42

3.3.2.1 Diagram Aktifitas Login .............................................. 42

3.3.2.2 Diagram Aktifitas Memasukkan Data

Koleksi Dokumen ........................................................ 43

3.3.2.3 Diagram Aktifitas Logout ............................................ 44

3.3.2.4 Diagram Aktifitas Memasukkan Data Dokumen .......... 45

3.3.2.5 Diagram Aktifitas Melihat Hasil Ringkasan ................. 46

3.3.2.6 Diagram Aktifitas Melihat Data Koleksi Dokumen ..... 47

3.3.3 Diagram Sekuensial ........................................................... 48

3.3.3.1 Diagram Sekuensial Login ........................................... 48

3.3.3.2 Diagram Sekuensial Memasukkan Data

Koleksi Dokumen ....................................................... 49

3.3.3.3 Diagram Sekuensial Logout ......................................... 50

3.3.3.4 Diagram Sekuensial Memasukkan Data Dokumen ....... 51

3.3.3.5 Diagram Sekuensial Melihat Hasil Ringkasan .............. 52

3.3.3.6 Diagram Sekuensial Melihat Data Koleksi Dokumen ... 53

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 18: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

xviii

3.3.4 Diagram MVC (Model View Control) ............................... 54

3.3.4.1 Struktur Kelas MVC .................................................... 54

3.3.4.2 Diagram Analisis Kelas MVC ...................................... 54

3.3.4.3 Diagram Kelas Model .................................................. 56

3.4 Perancangan Antar Muka (User Interface) ................................. 57

3.4.1 Halaman Utama ................................................................ 58

3.4.2 Halaman Memasukkan Data Koleksi Dokumen ................. 59

3.4.3 Halaman Melihat Data Koleksi Dokumen .......................... 50

3.4.4 Halaman Peringkasan Teks Otomatis ................................. 61

3.4.5 Halaman Melihat Hasil Ringkasan ..................................... 62

3.5 Skenario Pengujian Sistem ......................................................... 63

3.6 Data ........................................................................................... 65

BAB IV IMPLEMENTASI....................................................................... 66

4.1 Spesifikasi Software dan Hardware yang Digunakan .................. 66

4.1.1 Spesifikasi Software .......................................................... 66

4.1.2 Spesifikasi Hardware ......................................................... 66

4.2 Implementasi Program ............................................................... 67

4.2.1 Implementasi Text Preprocessing ...................................... 67

4.2.2 Implementasi Penghapusan Kata Umum (Stopword) ......... 69

4.2.3 Implementasi Pengembalian Kata Dasar (Stemming) ......... 70

4.2.4 Implementasi Term Frequency (TF)................................... 76

4.2.5 Implementasi Document Frequency (df) ............................ 77

4.2.6 Implementasi Inverse Document Frequency (IDF) ............. 77

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 19: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

xix

4.2.7 Implementasi Bobot Kata (W) ........................................... 78

4.2.8 Implementasi Bobot Total Kalimat (D) .............................. 79

4.2.9 Implementasi Pengambilan Kalimat (D) ............................ 79

4.2.10 Implementasi Menampilkan Hasil Ringkasan................... 81

4.3 Implementasi Antar Muka (User Interface) ................................. 82

4.3.1 Halaman Utama ................................................................ 82

4.3.2 Halaman Memasukkan Data Koleksi Dokumen ................. 83

4.3.3 Halaman Melihat Data Koleksi Dokumen ......................... 84

4.3.4 Halaman Peringkasan Teks Otomatis ................................. 86

4.3.5 Halaman Melihat Hasil Ringkasan ..................................... 87

BAB V ANALISIS HASIL DAN PEMBAHASAN .................................. 88

5.1 Analisis Pengujian Sistem .......................................................... 88

5.1.1 Pengujian Kepada Responden ............................................ 88

5.1.2 Hasil Pengujian Sistem ...................................................... 91

5.2 Pembahasan Pengujian Sistem .................................................... 92

BAB VI KESIMPULAN DAN SARAN ................................................. 102

6.1 Kesimpulan .............................................................................. 102

6.2 Saran ........................................................................................ 102

DAFTAR PUSTAKA ............................................................................ 103

LAMPIRAN .......................................................................................... 105

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 20: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

xx

DAFTAR TABEL

Tabel 2.1 Aturan Subtitusi/Penghapusan .................................................. 10

Tabel 2.2 Tabel Rule Untuk Suffix ........................................................... 10

Tabel 2.3 Tabel Rule Untuk Prefix ........................................................... 11

Tabel 2.4 Tabel Rule Untuk Infix ............................................................. 12

Tabel 2.5 Tabel Perhitungan TF dan df ................................................. 25

Tabel 2.6 Tabel Perhitungan Bobot Kata (W) ........................................... 28

Tabel 3.1 Tabel Analisis Kebutuhan ......................................................... 35

Tabel 3.2 Skenario Login ......................................................................... 37

Tabel 3.3 Skenario Memasukkan Data Koleksi Dokumen ................................ 38

Tabel 3.4 Skenario Logout ....................................................................... 39

Tabel 3.5 Skenario Memasukkan Data Dokumen .................................... 39

Tabel 3.6 Skenario Melihat Hasil Ringkasan ............................................ 40

Tabel 3.7 Skenario Melihat Data Koleksi Dokumen ................................. 41

Tabel 3.8 Struktur Kelas MVC ................................................................. 54

Tabel 3.9 Diagram Kelas ......................................................................... 56

Tabel 3.10 Contoh Pengujian Sistem ....................................................... 63

Tabel 5.1 Hasil Pengujian Kepada Responden ......................................... 89

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 21: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

xxi

DAFTAR GAMBAR

Gambar 2.1 Proses Tokenizing .................................................................. 9

Gambar 2.2 Proses Pengindeksan ............................................................ 15

Gambar 2.3 Perhitungan RIDF ................................................................ 17

Gambar 2.4 Perhitungan Wik ................................................................... 19

Gambar 2.5 Perhitungan ntfik ................................................................... 19

Gambar 2.6 Perhitungan nidfk ................................................................. 19

Gambar 3.1 Gambaran Sistem Keseluruhan ............................................. 34

Gambar 3.2 Diagram Use Case ................................................................ 36

Gambar 3.3 Diagram Aktifitas Login ..................................................... 42

Gambar 3.4 Diagram Aktifitas Memasukkan Data Koleksi Dokumen ............ 43

Gambar 3.5 Diagram Aktifitas Logout..................................................... 44

Gambar 3.6 Diagram Aktifitas Memasukkan Data Dokumen................... 45

Gambar 3.7 Diagram Aktifitas Melihat Hasil Ringkasan ......................... 46

Gambar 3.8 Diagram Aktifitas Melihat Data Koleksi Dokumen .............. 47

Gambar 3.9 Diagram Sekuensial Login ................................................... 48

Gambar 3.10 Diagram Sekuensial Memasukkan Data Koleksi Dokumen ...... 49

Gambar 3.11 Diagram Sekuensial Logout ............................................... 50

Gambar 3.12 Diagram Sekuensial Memasukkan Data Dokumen ............. 51

Gambar 3.13 Diagram Sekuensial Melihat Hasil Ringkasan .................... 52

Gambar 3.14 Diagram Sekuensial Melihat Data Koleksi Dokumen ......... 53

Gambar 3.15 Diagram Kelas Admin ........................................................ 54

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 22: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

xxii

Gambar 3.16 Diagram Kelas Pengguna ................................................... 55

Gambar 3.17 Halaman Utama ................................................................. 57

Gambar 3.18 Halaman Memasukkan Data Koleksi Dokumen ......................... 58

Gambar 3.19 Halaman Melihat Data Koleksi Dokumen .......................... 59

Gambar 3.20 Halaman Melihat Ringkasan Data Koleksi Dokumen ......... 60

Gambar 3.21 Halaman Peringkasan Teks Otomatis ................................. 61

Gambar 3.22 Halaman Melihat Hasil Ringkasan ..................................... 62

Gambar 3.23 Rumus Perhitungan Rata-rata ............................................. 64

Gambar 3.24 Contoh Perhitungan Rata-rata ............................................. 64

Gambar 4.1 Rangkain Proses Text Preprocessing .................................... 67

Gambar 4.2 Halaman Utama ................................................................... 82

Gambar 4.3 Halaman Memasukkan Data Koleksi Dokumen ........................... 83

Gambar 4.4 Halaman Melihat Data Koleksi Dokumen ............................ 84

Gambar 4.5 Halaman Melihat Ringkasan Data Koleksi Dokumen ........... 85

Gambar 4.6 Halaman Peringkasan Teks Otomatis ................................... 86

Gambar 4.7 Halaman Melihat Hasil Ringkasan ....................................... 87

Gambar 5.1 Hasil Perhitungan Rata-rata .................................................. 91

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 23: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

xxiii

DAFTAR LISTING

Listing Program 4.1 Implementasi Text Preprocessing ............................ 67

Listing Program 4.2 Implementasi Penghapusan Kata Umum ................. 69

Listing Program 4.3 Implementasi Pengembalian Kata Dasar ................. 70

Listing Program 4.4 Implementasi Method delSuffix() ........................... 71

Listing Program 4.5 Implementasi Method delPrefix() ............................ 73

Listing Program 4.6 Implementasi Method delDuplikasi() ...................... 75

Listing Program 4.7 Implementasi Term Frequency (TF) ........................ 76

Listing Program 4.8 Implementasi Document Frequency (df) ................. 77

Listing Program 4.9 Implementasi Inverse Document Frequency (IDF) .. 77

Listing Program 4.10 Implementasi Bobot Kata (Wtd)............................. 78

Listing Program 4.11 Implementasi Bobot Total Kalimat (D) ................. 79

Listing Program 4.12 Implementasi Pengambilan Kalimat (D) ................ 79

Listing Program 4.13 Implementasi Menampilkan Hasil Ringkasan ........ 81

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 24: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

1

BAB I

PENDAHULUAN

1.1 Latar Belakang

Saat ini, kita dapat mengakses dokumen berbahasa Jawa melalui situs-situs

di internet dan banyak juga dokumen, buku dan majalah berbahasa Jawa yang

dapat kita peroleh di perpustakaan-perpustakaan. Sementara itu, banyak generasi

muda yang berasal dari Jawa tidak memahami bahasa Jawa. Sayang sekali jika

bahasa Jawa semakin lama semakin tidak digunakan dan akhirnya punah.

Membuat dan membaca dokumen berbahasa Jawa merupakan salah satu

cara melestarikan penggunaan bahasa Jawa. Bagi mereka yang belum paham

tentang bahasa Jawa, membaca keseluruhan dokumen untuk memahaminya akan

sangat melelahkan. Namun jika terdapat ringkasan pendek dari sebuah dokumen,

maka akan membantu pembaca mendapatkan intisari dari sebuah dokumen

berbahasa Jawa.

Membuat ringkasan secara manual membutuhkan waktu lama jika

dokumen yang diringkas berjumlah sangat banyak. Maka membutuhkan

peringkasan teks otomatis untuk membantu proses ekstraksi dalam penyusunan

kalimat mengenai intisari dari dokumen serta menggabungkan menjadi suatu

ringkasan (Jezek, Steinberger, 2008). Diharapkan dari membaca ringkasan, akan

menumbuhkan niat membaca dokumen berbahasa Jawa menjadi lebih meningkat.

Membuat peringkasan teks otomatis dilakukan dengan cara pemberian

bobot untuk setiap kata dalam kalimat. Dalam penelitian ini ringkasan yang

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 25: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

2

dihasilkan merupakan kumpulan kalimat dari hasil perhitungan dengan metode

TF-IDF (Savoy, 1993). Metode ini bertujuan untuk mengambil sebagian kalimat

dari keseluruhan dokumen berbahasa Jawa yang penting, ditandai dengan bobot

tinggi dari hasil perhitungan dengan metode TF-IDF. Ringkasan yang dihasilkan

tersebut akan menampilkan sebuah ringkasan dokumen yang diharapkan sesuai

dengan kebutuhan pembaca. Hasil ringkasan dari sistem secara otomatis tersebut

akan dilakukan pengujian kepada 3 responden berbahasa Jawa secara manual.

Dokumen yang akan diujikan ke dalam sistem berjumlah 50 dokumen berbahasa

Jawa yang bersumber dari DjakaLodang. Dari hasil pengujian akan dilakukan

perhitungan nilai rata-rata untuk mendapatkan hasil akurasinya. Dengan demikian

diketahui nilai rata-rata akurasi sistem ini dalam membantu pembaca untuk

memperoleh intisari dari dokumen berbahasa Jawa, sehingga dapat membuat

keputusan untuk melanjutkan membaca keseluruhan dokumen atau cukup dengan

mambaca ringkasan.

Pada penelitian ini akan dibangun sebuah website majalah bahasa Jawa

yang berisi kumpulan dokumen berbahasa Jawa serta dapat melakukan

peringkasan teks otomatis dokumen berbahasa Jawa secara cepat dan akurat,

sehingga dapat menghasilkan ringkasan yang sesuai dengan kebutuhan pengguna.

Diharapkan website majalah bahasa Jawa ini dapat diakses secara umum oleh

pengguna agar dapat digunakan untuk melakukan peringkasan teks dokumen

secara otomatis.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 26: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

3

1.2 Rumusan Masalah

Berdasarkan latar belakang di atas maka terdapat rumusan masalah

sebagai berikut :

1. Bagaimana menggunakan metode TF-IDF pada program aplikasi

peringkasan teks otomatis pada dokumen berbahasa Jawa?

2. Bagaimana mengukur akurasi sistem peringkasan teks otomatis

menggunakan metode TF-IDF pada dokumen berbahasa jawa?

1.3 Tujuan Penelitian

Tujuan dari penelitian ini adalah membuat sebuah website majalah bahasa

Jawa yang dapat melakukan peringkasan teks otomatis pada dokumen berbahasa

Jawa dengan metode TF-IDF, serta dapat menghasilkan ringkasan dari dokumen

berbahasa Jawa yang sesuai dengan kebutuhan pengguna.

1.4 Manfaat Penelitian

Manfaat dari penelitian ini adalah menghasilkan ringkasan yang berisi

kumpulan kalimat mengenai intisari dari keseluruhan dokumen berbahasa Jawa.

Ringkasan tersebut akan membantu pembaca dalam memahami intisari dari

dokumen tanpa harus membaca keseluruhan dokumen berbahasa Jawa. Dengan

membaca ringkasan, pembaca dapat membuat keputusan untuk melanjutkan

membaca keseluruhan dokumen atau cukup dengan membaca ringkasan.

Membaca ringkasan berbahasa Jawa diharapkan dapat meningkatkan minat

pembacaan bahasa Jawa, sehingga bahasa Jawa akan semakin di lestarikan.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 27: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

4

1.5 Batasan Masalah

Ruang lingkup dibatasi pada :

1. Ekstraksi teks yang digunakan adalah pada dokumen berbahasa Jawa.

2. Dokumen yang digunakan bersumber dari Djakalodang tahun 1978,

2002 dan 2003.

3. Teks input diambil dari file teks.

4. Pengujian sistem akan dilakukan kepada 3 responden secara manual

dengan dokumen berjumlah 50, dari hasil pengujian tersebut akan

dihitung nilai rata-rata untuk mendapatkan hasil akurasi peringkasan

teks otomatis pada dokumen berbahasa Jawa.

5. Sistem berbasis web dengan menggunakan jsp.

6. Pembuatan program aplikasi peringkasan teks otomatis menggunakan

java dengan IDE Netbeans 6.9.1.

1.6 Metodologi Penelitian

Pada penelitian ini akan dilakukan dengan beberapa tahap sebagai berikut :

1. Studi Pustaka

Pada tahap ini dilakukan pengumpulan informasi dengan cara

membaca buku referensi, jurnal dan mencari informasi di internet

mengenai pemerolehan informasi serta metode TF-IDF yang

menunjang pembuatan skripsi.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 28: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

5

2. Pengumpulan Dokumen Berbahasa Jawa

Pada tahap ini dilakukan pengumpulan data dokumen berbahasa

Jawa, dimana data dokumen tersebut akan digunakan untuk pengujian

sistem peringkasan teks otomatis. Dokumen berbahasa Jawa yang

digunakan bersumber dari DjokoLodang, mengenai cerita wayang atau

artikel berita.

3. Perancangan Sistem

Pada tahap ini dilakukan proses perancangan sistem atau rancangan

alur jalannya program. Perancangan akan dilakukan secara terstruktur

dengan langkah pembuatan diagram use case, diagram aktifitas,

diagram sekuensial, diagram kelas untuk memprosesnya, merancang

setiap proses dengan algoritma, serta merancang user interface.

4. Implementasi Perangkat Lunak

Pada tahap ini membangun sistem berbasis komputer berdasarkan

hasil perancangan yang telah dibuat. Sehingga implementasi rancangan

ke dalam program komputer dapat menghasilkan perangkat lunak yang

sesuai dengan kebutuhan.

5. Pengujian Perangkat lunak

Pada tahap ini akan dilakukan analisa perangkat lunak. Apakah

luaran yang dihasilkan sudah sesuai dengan rancangan sistem?

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 29: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

6

6. Pengujian Sistem

Pada tahap ini perangkat lunak yang sudah jadi akan dilakukan

pengujian sistem. Pengujian dilakukan kepada 3 responden secara

manual dengan dokumen berbahasa Jawa berjumlah 50.

7. Evaluasi Pengujian Sistem

Pada tahap ini dilakukan penghitungan dari pengujian sistem yang

sudah dilakukan. Dari hasil pengujian tersebut akan dihitung nilai rata-

rata untuk mendapatkan hasil akurasi sistem. Mengapa hasil dari sistem

sesuai? dan Mengapa hasil dari sistem tidak sesuai? akan dianalisa.

1.7 Sistematika Penulisan

Sistematika penulisan pada penelitian ini dibagi menjadi beberapa bagian

sebagai berikut :

BAB I PENDAHULUAN

Bab ini berisi gambaran umum permasalahan yang akan diteliti,

meliputi : latar belakang, rumusan masalah, tujuan penelitian,

manfaat penelitian, batasan masalah, metodologi penelitian dan

sistematika penulisan.

BAB II LANDASAN TEORI

Bab ini berisi konsep pemerolehan informasi, langkah-langkah

pemerolehan informasi, metode yang digunakan dalam penelitian

ini, serta langkah-langkah pengerjaan metode tersebut.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 30: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

7

BAB III ANALISIS DAN PERANCANGAN SISTEM

Bab ini berisi gambaran umum sistem, analisis kebutuhan,

perancangan sistem meliputi : diagram use case, diagram aktifitas,

diagram sekuensial, diagram kelas, user interface dan skenario

pengujian.

BAB IV IMPLEMENTASI

Bab ini berisi implementasi dan penjelasan fungsi program yang

dibuat berdasarkan analisis dan perancangan sistem.

BAB V ANALISIS HASIL DAN PEMBAHASAN

Bab ini berisi analisis hasil pengujian sistem dan pembahasan

pengujian sistem.

BAB VI KESIMPULAN DAN SARAN

Bab ini berisi kesimpulan dan saran dari hasil analisis sistem,

implementasi sistem dan pengujian sistem.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 31: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

8

BAB II

LANDASAN TEORI

2.1 Pemerolehan Informasi ( Information Retrieval )

2.1.1 Konsep Pemerolehan Informasi

Pemerolehan informasi (Information Retrieval) adalah menemukan bahan

(biasanya dokumen) dari sesuatu tidak terstruktur (biasanya teks) yang memenuhi

kebutuhan informasi dari koleksi besar (biasanya disimpan pada komputer)

(Manning, 2009).

Adapun tahap dalam memproses data untuk mendapatkan informasi

mengenai kalimat penting dalam sebuah dokumen berbahasa Jawa, yaitu

pemisahan setiap kata dalam kalimat (tokenizing), penghapusan kata umum

(stopword), pemisahan imbuhan kata untuk mendapatkan kata dasar (stemming),

dan penataan data (indexing).

2.1.2 Langkah Pemerolehan Informasi

2.1.2.1 Text Preprocessing

2.1.2.1.1 Tokenizing

Tokenizing adalah proses pemisahan setiap kata dalam kalimat menjadi

kata tunggal. Setiap kata dalam kalimat dipisahkan menggunakan karakter spasi.

Pada langkah ini juga menghilangkan tanda baca dan mengubah semua token ke

dalam bentuk huruf kecil (lower case). Contoh proses pemotongan kata :

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 32: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

9

Input :

Output :

Gambar 2.1 Proses Tokenizing

Pada Gambar 2.1, masukkan dari sebuah dokumen adalah berbentuk

kalimat, kemudian kalimat tersebut dilakukan proses tokenizing maka akan

didapat potongan kata tunggal. Dari proses pemisahan inilah yang nantinya

digunakan untuk menghitung bobot setiap kata, sehingga dapat menghasilkan

hitungan setiap kata dalam kalimat. Langkah berikutnya akan dilakukan proses

stopword.

2.1.2.1.2 Stopword

Beberapa kata umum yang digunakan akan mengakibatkan suatu nilai

menjadi kecil dalam membantu memilih dokumen yang sesuai dengan kebutuhan

pengguna. Kata umum tersebut adalah stopword. (Manning, 2009).

Contoh stopword dalam bahasa Jawa : "apa", "ana", "amarga", "dadi",

"dudu", "gawe", "iki", "iku", "ing", "kabeh", "kalebu", "kang", "kanggo", "karo",

"kowe", "lagi", "lan", "mau", "nalika", "nanging", "nganti", "ora", "padha",

"punika", "sami", "saka", "sang", "tetep", "utawa", "wae", "yaiku", dll. Pada

langkah ini akan dilakukan proses penghapusan kata umum untuk mengurangi

jumlah kemunculan kata yang tidak memiliki makna berarti. Setelah proses

tokenizing dan stopword selesai maka dilanjutkan dengan proses stemming.

Mataram iku negara kondhang

mataram iku negara kondhang

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 33: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

10

2.1.2.1.3 Stemming

Stemming adalah proses pengembalian sebuah kata yang terdapat dalam

suatu dokumen ke dalam bentuk kata dasar. Proses penghilangan semua imbuhan

(affix) yang terdiri dari awalan (prefix), sisipan (infix), akhiran (suffix) dan

duplikasi. Dalam stemming untuk bahasa Jawa, sebelumnya terlebih dahulu

membuat stemmer rule dengan menggunakan simbol sebagai berikut (Wijono,

2011) :

1. Aturan substitusi/ penghapusan menggunakan tanda =>.

Tabel 2.1 Aturan Substitusi/ Penghapusan

2. Simbol <> digunakan untuk menyatakan tingkat (affix) yang

mempengaruhi urutan pengecekan pada algoritma stemming.

Rule yang digunakan adalah sebagai berikut :

Tabel 2.2 Tabel Rule Untuk Suffix

SUFFIX

<1> e=>"",n=>"",a=>"",i=>"",ing=>"", ku=>"",mu=>""

<2> ke=>"", ki=>"",wa=>"", ya=>"",na=>"",ne=>"",en=>"",an=>"",ni=>"",nira=>"", ipun=>"",

on=>"u", ning=>""

<3> ake=>"", en=>"i", kna=>"n", kno=>"n", ana=>"", ono=>"", ane=>"", kne=>"", nan=>"",

yan=>"", nipun=>"", oni=>"u", eni=>"i"

ny =>”” (ny dihapus)

ny => s (ny diganti s)

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 34: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

11

<4> kake=>"n", ken=>"" ,kke=>"",nana=>"",nono=>"", nane=>"", nen=>"",kna=>"",kno=>"",

ekne=>"i", onan=>"u",enan=>"i"

<5> kake=>"",kken=>"",aken=>"",kke=>"n",enana=>"i",enono=>"i",onen=>"u",enen=>"i",onana=>

"u",onono=>"u", ekna=>"i",ekno=>"i",okno=>"u",okna=>"u"

<6> ekken=>"i",kaken=>"n",okken=>"u",ekake=>"i",ekke=>"i",okake=>"u",okke=>"u",

kaken=>"", kken=>"n"

<7> ekaken=>"i",okaken=>"u"

Tabel 2.3 Tabel Rule Untuk Prefix

PREFIX

<1> dipun=>"",peng=>"",peny=>"",pem=>"",pam=>"",pany=>"",pra=>"",kuma=>"",kapi=>"",

bok=>"",mbok=>"",dak=>"",tak=>"",kok=>"",tok=>"",ing=>"",ang=>"",any=>"", am=>"",

sak=>"",

se=>"",su=>"",mang=>"",meng=>"",nge=>"",nya=>"",pi=>"",ge=>"",ke=>"",u=>"",

po=>"u",ke=>"u"

<2> mer=>"",mra=>"",mi=>"",sa=>"",ku=>"",an=>"",ka=>"",ny=>"s",ng=>"k",di=>"",peng=>"

k",pang=>"k",pany=>"c", pam=>"p",ke=>"i",mang=>"k",meng=>"k"

<3> a=>"",k=>"",pam=>"w",pan=>"t", pen=>"t",mang=>"w",meng=>"w", ny=>"c",ng=>""

<4> n=>"t", pan=>"s", pen=>"s",man=>"s",men=>"s"

<5> pan=>"",pen=>"",man=>"t",men=>"t",n=>""

<6> pa=>"",pe=>"",man=>"",men=>""

<7> p=>"",ma=>"",me=>""

<8> m=>"w"

<9> m=>"p"

<10> m=>""

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 35: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

12

Tabel 2.4 Tabel Rule Untuk Infix

INFIX

<1> gum=>"b",gem=>"b",kum=>"p",kem=>"p"

<2> kum=>"w", kem=>”w”

Algoritma untuk melakukan proses stemming terhadap kata tunggal atau

duplikasi.

1. Kata berimbuhan adalah word. Kata sebagai hasil adalah stemW

2. Cek jumlah karakter word, jika < 2. Keluar.

3. Jika word mengandung “-“, maka pecah kata berdasar “-“ menjadi w1 dan w2.

Dan lakukan langkah 4-13

4. w11 = w1 tanpa vokal dan w21 = w2 tanpa vokal.

5. Jika w11 = w21 dan panjang w1=w2 maka lakukan langkah 6-8

6. Jika w2 ada di kamus maka stemW=w2 dan keluar.

7. Jika w2 tidak ada di kamus, w22= hilangkan imbuhan(w2).

8. Jika w22 ada di kamus maka stemW=w22, jika tidak stemW=w1-w2 dan

keluar.

9. Jika w11 != w21, lakukan langkah 10-13

10. ws11=hilangkan imbuhan(w1) dan ws21 = hilangkan imbuhan(w2).

11. Cek ws21 di kamus, jika ada maka stemW=ws21 dan keluar.

12. Cek ws11 di kamus, jika ada maka stemW=ws11 dan keluar.

13. Jika tidak maka stemW=ws11-ws21 dan keluar.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 36: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

13

14. stemW = hilangkan imbuhan(stemW). Cek stemW di dictionary. Jika ada

stemW dikembalikan dan keluar.

Algoritma untuk menghilangkan afiks pada kata berimbuhan.

1. Kata yang akan dihilangkan imbuhan adalah word.

2. ws1=hapus suffix (word). Cek di dictionary. Jika ada kembalikan kata.

3. ws1s2=hapus suffix (ws1). Cek di dictionary. Jika ada kembalikan kata.

4. ws1i1=hapus infix (ws1). Cek di dictionary. Jika ada kembalikan kata.

5. dws1= pengulangan parsial (ws1). Cek di dictionary. Jika ada kembalikan

kata.

6. dws1s2= pengulangan parsial (ws1s2). Cek di dictionary. Jika ada kembalikan

kata.

7. wp1=hapus prefix (word). Cek di dictionary. Jika ada kembalikan kata.

8. dwp1= pengulangan parsial (wp1). Cek di dictionary. Jika ada kembalikan

kata.

9. wp1s1=hapus suffix(wp1). Cek di dictionary. Jika ada kembalikan kata.

10. dwp1s1= pengulangan parsial (wp1s1). Cek di dictionary. Jika ada

kembalikan kata.

11. wp1s1s2=hapus suffix (wp1s1). Cek di dictionary. Jika ada kembalikan kata.

12. wp1p2=hapus prefix (wp1). Cek di dictionary. Jika ada kembalikan kata.

13. wp1p2s1=hapus suffix (wp1p2). Cek di dictionary. Jika ada kembalikan kata.

14. wp1p2s1s2=hapus suffix (wp1p2s1). Cek di dictionary. Jika ada kembalikan

kata.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 37: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

14

15. wi1=hapus infix (word). Cek di dictionary. Jika ada kembalikan kata.

16. wi1s1=hapus suffix (wi1). Cek di dictionary. Jika ada kembalikan kata.

2.1.2.2 Indexing

Indexing (pengindeksan) adalah proses penyimpanan kembali dokumen

secara urut dengan aturan tertentu. Proses penyimpanan tersebut berguna untuk

mempercepat proses pencarian dokumen yang sesuai dengan kebutuhan

pengguna. Langkah-langkah dalam membuat indeks adalah sebagai berikut

(Manning, 2009) :

1. Kumpulkan dokumen yang akan di indeks.

Friends, Romans, countrymen. So let it be with Caesar

2. Lakukan proses pemisahan kata untuk mendapatkan daftar token.

Friends Romans countrymen So

3. Dapat dilakukan aturan tertentu untuk mendapatkan daftar token yang sudah

dinormalisasi sebelum dilakukan pengindeksan.

friend roman countrymen so

4. Indeks dokumen untuk setiap daftar token akan membuat Inverted Index.

Pada Gambar 2.2 berikut adalah proses membuat indeks pada kumpulan

dokumen. Terdapat 2 bagian yaitu (Doc 1 dan Doc 2). Bagian Doc 1

menggambarkan setiap dokumen telah dipecah menjadi kata (term) tunggal,

kemudian dilakukan pengurutan berdasarkan abjad (a-z). Bagian Doc 2

menggambarkan kemunculan setiap kata (term) dan menuliskannya kembali

jumlah kemunculan kata (term) dengan menunjuk posting lists.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 38: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

15

Gambar 2.2 Proses Pengindeksan

2.1.2.3 LinkedList

LinkedList adalah stuktur data yang berbentuk node dimana node lainnya

menunju dengan menggunakan pointer. Ukuran LinkedList menjadi dinamis

karena ukurannya bertambah mengikuti jumlah node yang dimasukkan ke dalam

rantai node (Kruse, 1994).

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 39: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

16

2.1.2.4 ArrayList

Objek ArrayList adalah perkembangan dari larik (array) satu dimensi.

Objek ArrayList mendukung untuk melakukan akses elemen secara acak, dimana

setiap elemen dapat diakses dalam waktu yang konstan. Tidak seperti larik

(array), objek ArrayList ukurannya dapat dikelola secara otomatis saat program

sedang berjalan (Sommerville, 2009).

2.2 Peringkasan Teks Otomatis

Ringkasan adalah suatu teks yang dihasilkan dari satu atau lebih teks yang

berisi bagian informasi yang signifikan dalam teks asal, dan yang tidak lebih dari

setengah teks aslinya (Hovy, Mitkov, 2005). Ringkasan teks (text summarization)

adalah suatu proses penyulingan sebagian besar infromasi penting dari sumber

(beberapa sumber) untuk menghasilkan suatu ringkasan bagi pengguna (Mani,

House, Klein, 1999). Terdapat 2 teknik kriteria peringkasan teks yaitu

peringkasan teks berdasarkan ekstraksi dan abstraksi (Jezek, Steinberger, 2008).

Teknik ekstraksi adalah teknik penyusunan kalimat mengenai intisari dari

dokumen serta menggabungkan menjadi suatu ringkasan. Sedangkan teknik

abstraksi adalah teknik pengambilan intisari dari dokumen serta membuat kalimat

dalam bentuk lain sesuai dengan intisari dokumen (Jezek, Steinberger, 2008).

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 40: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

17

2.3 Metode Peringkasan Teks Otomatis

2.3.1 Term Frequency-Inverse Document Frequency (TF-IDF)

Banyak sekali metode yang digunakan untuk menghasilkan suatu

ringkasan. Metode yang sudah pernah dilakukan adalah dengan menggunakan

metode Maximum Marginal Relevance. Data uji coba diambil dari surat kabar

berbahasa Indonesia online berjumlah 30 berita. Hasil pengujian dibandingkan

dengan ringkasan manual yang menghasilkan rata-rata recall 60%, precision 77%

dan f-measure 66% (Mustaqhfitri, Abidin, Kusumawati, 2009).

Peringkasan teks otomatis dengan menggunakan metode TF-IDF pada

dokumen berbahasa Indonesia. Data yang diujikan berjumlah 50 dokumen teks

berbahasa Indonesia. Dari hasil pengujian sistem secara manual terdapat 31 hasil

peringkasan yang sesuai. Sehingga nilai akurasinya adalah 62% (Mulyana,

Ramadona, Herfina, 2012).

Berdasarkan (Orasan, Pekar, Hasler, 2004) metode TF-RIDF adalah salah

satu varian dari metode TF-IDF dalam peringkasan teks. Residual IDF, disebut

sebagai RIDF (Manning, Schutze, 1999) adalah fungsi yang menjelaskan ke

dalam estimasi IDF yaitu bagian dari skema TF-IDF, berikut rumus yang

digunakan :

RIDF (t) = IDF - log (1 - p (0; λt))

Gambar 2.3 Perhitungan RIDF

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 41: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

18

| D | Dimana IDF adalah log | Dt |, dan p adalah Poisson distribusi dengan

parameter λt, jumlah rata-rata kata (t) per dokumen dan 1 - p (0; λt) adalah

kemungkinan kata (t) muncul dalam dokumen. Pada percobaan evaluasi, data

yang digunakan dari corpus berjumlah 147 teks Newsware (Rose, 2002). Evaluasi

dari 15 mahasiswa dengan menerima satu ringkasan dari setiap teks dan diminta

untuk menjawab pertanyaan tentang teks tersebut menghasilkan akurasi sebesar

69%.

Dalam penelitian ini, metode yang digunakan untuk peringkasan teks

otomatis adalah menggunakan metode TF-IDF (Mulyana, Ramadona, Herfina,

2012). Metode ini dilakukan dengan cara pemberian bobot hubungan suatu kata

(t) terhadap dokumen (D). Untuk dokumen tunggal, setiap kalimat dianggap

sebagai dokumen. Metode ini menggunakan 2 konsep perhitungan bobot yaitu

term frequency (TF) dan inverse document frequency (IDF). Term frequency (TF)

adalah jumlah frekuensi kemunculan kata (t) pada kalimat (D). Inverse document

frequency (IDF) dihitung menggunakan document frequency (df). Document

frequency adalah jumlah kalimat (D) yang mengandung kata (t).

Pada metode ini pembobotan kata dalam sebuah dokumen dilakukan

dengan mengalikan nilai TF dan IDF. Bobot suatu istilah semakin besar jika

istilah tersebut sering muncul dalam suatu dokumen dan semakin kecil jika istilah

tersebut muncul dalam banyak dokumen (Grossman, 1998). Skema normalisasi

pembobotan TF-IDF dihitung menggunakan rumus 1 sebagai berikut (Savoy,

1993) :

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 42: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

19

Wik = ntfik * nidfk (1)

Gambar 2.4 Perhitungan Wik

Dimana aturan ntfik dan nidfk terdapat pada rumus 2 dan rumus 3 berikut :

tfik ntfik = (2)

Maxjtfij

Gambar 2.5 Perhitungsn ntfik

n log dfk

nidfk = (3)

log (n)

Gambar 2.6 Perhitungsn nidfk

Keterangan :

Wik = bobot istilah k pada dokumen i.

tfik = frekuensi dari istilah k pada dokumen i.

n = jumlah dokumen dalam koleksi dokumen.

dfk = jumlah dokumen yang mengandung istilah k.

Maxj tfij = frekuensi istilah terbesar pada satu dokumen.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 43: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

20

2.3.2 Langkah Pengerjaan

Langkah-langkah pengerjaan peringkasan teks otomatis dengan

menggunakan metode TF-IDF yang dilakukan dalam penelitian ini adalah sebagai

berikut :

1. Menghitung jumlah kalimat (D) pada dokumen berbahasa Jawa.

2. Proses penghapusan kata umum (stopword) untuk mengurangi jumlah

kemunculan kata yang tidak memiliki makna berarti.

3. Proses pengembalian sebuah kata (stemming) yang terdapat dalam suatu

kalimat (D) ke dalam bentuk kata (t) dasar.

4. Menghitung term frequency (TF) yaitu jumlah frekuensi kemunculan

kata (t) pada kalimat (D).

5. Menghitung document frequency (df) yaitu jumlah frekuensi kalimat (D)

yang mengandung kata (t).

6. Menghitung inverse document frequency (IDF) dengan cara log dari

jumlah total kalimat (D) dalam dokumen berbahasa Jawa dibagi

document frequency (df).

7. Menghitung (W) bobot setiap kata (t) dalam kalimat (D) dengan cara

mengalikan term frequency (TF) dengan inverse document frequency

(IDF).

8. Menghitung bobot total kalimat (D) dengan cara menjumlahkan (W)

bobot setiap kata (t) dalam kalimat (D).

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 44: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

21

9. Berdasarkan hasil perhitungan bobot total kalimat (D), akan diambil

40% (Hovy, Mitkov, 2005) dari jumlah bobot kalimat (D) yang

memiliki score paling tinggi .

10. Dari langkah-langkah tersebut maka menghasilkan kumpulan kalimat

(D) yang berisi bagian penting dari dokumen berbahasa Jawa.

2.3.3 Contoh Pengerjaan

<Djaka Lodhang No 01 Tahun XXXIII 7 Juni 2003>

<Hal 4>

Ora Kena Mlebu Aceh

(Dening RS Rudatan)

Indonesia lagi ribet. Propinsi Aceh lagi panas. Perang TNI lumawan

kelompok mbalela separatis GAM. Sing dha gugur wis akeh, kejaba wong-wong

GAM, anggota TNI utawa Polri wis ana sing dadi tumbal kelangan nyawa.

Nalare, tumrape TNI lan pemerintah, mbrasta kaum pemberontakan kaya GAM

kuwi mau dudu barang sing gampang. Ragade bisa nyandhak milyaran rupiah lan

nyawa para prajurit dinggo totohan mung pamrih NKRI tetep wutuh. Pokoke

ribet, tur ya ora gampang.

Ing tengah kahanan ngono mau, akeh LSM (Lembaga Swadaya

Masarakat) sing bengok-bengok protes tekan luwar negeri. Alesane arep mbiyantu

masarakat Aceh sing lagi keterak perang, kok dielikke (dilarang) dening

pemerintah. LSM mau, klebu LSM Indonesia lan LSM manca sing ora seneng.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 45: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

22

Mula banjur nyuwara sing tundhone mung mojokke pemerintah Indonesia Lan

mojokke TNI.

Langkah 1. Menghitung jumlah kalimat (D) pada dokumen berbahasa Jawa.

Indonesia lagi ribet(D1). Propinsi Aceh lagi panas(D2). Perang TNI

lumawan kelompok mbalela separatis GAM(D3). Sing dha gugur wis akeh, kejaba

wong-wong GAM, anggota TNI utawa Polri wis ana sing dadi tumbal kelangan

nyawa(D4). Nalare, tumrape TNI lan pemerintah, mbrasta kaum pemberontakan

kaya GAM kuwi mau dudu barang sing gampang(D5). Ragade bisa nyandhak

milyaran rupiah lan nyawa para prajurit dinggo totohan mung pamrih NKRI tetep

wutuh(D6). Pokoke ribet, tur ya ora gampang(D7).

Ing tengah kahanan ngono mau, akeh LSM (Lembaga Swadaya

Masarakat) sing bengok-bengok protes tekan luwar negeri(D8). Alesane arep

mbiyantu masarakat Aceh sing lagi keterak perang, kok dielikke (dilarang) dening

pemerintah(D9). LSM mau, klebu LSM Indonesia lan LSM manca sing ora

seneng(D10). Mula banjur nyuwara sing tundhone mung mojokke pemerintah

Indonesia Lan mojokke TNI(D11).

Langkah 2. Proses penghapusan kata umum (stopword)

Proses :

indonesia lagi ribet. propinsi aceh lagi panas. perang tni lumawan

kelompok mbalela separatis gam. sing dha gugur wis akeh, kejaba wong-wong

gam, anggota tni utawa polri wis ana sing dadi tumbal kelangan nyawa. nalare,

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 46: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

23

tumrape tni lan pemerintah, mbrasta kaum pemberontakan kaya gam kuwi mau

dudu barang sing gampang. ragade bisa nyandhak milyaran rupiah lan nyawa

para prajurit dinggo totohan mung pamrih nkri tetep wutuh. pokoke ribet, tur ya

ora gampang.

ing tengah kahanan ngono mau, akeh lsm (lembaga swadaya masarakat)

sing bengok-bengok protes tekan luwar negeri. alesane arep mbiyantu masarakat

aceh sing lagi keterak perang, kok dielikke (dilarang) dening pemerintah. lsm

mau, klebu lsm indonesia lan lsm manca sing ora seneng. mula banjur nyuwara

sing tundhone mung mojokke pemerintah indonesia lan mojokke tni.

Hasil :

indonesia ribet. propinsi aceh panas. perang tni lumawan kelompok

mbalela separatis gam. dha gugur akeh, kejaba gam, anggota tni polri tumbal

kelangan nyawa. nalare, tumrape tni pemerintah, mbrasta kaum pemberontakan

gam kuwi barang gampang. ragade nyandhak milyaran rupiah nyawa prajurit

dinggo totohan pamrih nkri wutuh. pokoke ribet, tur gampang.

tengah, akeh lsm (lembaga swadaya masarakat) bengok-bengok protes

tekan luwar negeri. alesane arep mbiyantu masarakat aceh keterak perang,

dielikke (dilarang) dening pemerintah. lsm, klebu lsm indonesia lsm manca

seneng. mula nyuwara tundhone mojokke pemerintah indonesia mojokke tni.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 47: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

24

Langkah 3. Proses pengembalian kata dasar (stemming)

Proses :

indonesia ribet. propinsi aceh panas. perang tni lumawan kelompok

mbalela separatis gam. dha gugur akeh, kejaba gam, anggota tni polri tumbal

kelangan nyawa. nalare, tumrape tni pemerintah, mbrasta kaum

pemberontakan gam kuwi barang gampang. ragade nyandhak milyaran rupiah

nyawa prajurit dinggo totohan pamrih nkri wutuh. pokoke ribet, tur gampang.

tengah, akeh lsm (lembaga swadaya masarakat) bengok-bengok protes

tekan luwar negeri. alesane arep mbiyantu masarakat aceh keterak perang,

dielikke (dilarang) dening pemerintah. lsm, klebu lsm indonesia lsm manca

seneng. mula nyuwara tundhone mojokke pemerintah indonesia mojokke tni.

Hasil :

indonesia ribet. propinsi aceh panas. perang tni lumawan kelompok

mbalela separatis gam. dha gugur akeh, jaba gam, anggota tni polri tumbal

langan nyawa. nalar, tumrap tni pemerintah, brasta kaum pemberontakan gam

kuwi barang gampang. ragad nyandhak milyar rupiah nyawa prajurit dinggo

totoh pamrih nkri wutuh. pokok ribet, tur gampang.

tengah, akeh lsm (lembaga swadaya masarakat) bengok protes tekan luwar

negeri. alesan arep biyantu masarakat aceh terak perang, dielikke (larang)

dening pemerintah. lsm, klebu lsm indonesia lsm manca seneng. mula nyuwara

tundho mojok pemerintah indonesia mojok tni.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 48: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

25

Langkah 4. Menghitung term frequency (TF) yaitu jumlah frekuensi kemunculan

kata (t) pada kalimat (D).

Langkah 5. Menghitung document frequency (df) yaitu jumlah frekuensi kalimat

(D) yang mengandung kata (t).

Tabel 2.5 Tabel Perhitungan TF dan df

Kata (t) D1 D2 D3 D4 D5 D6 D7 D8 D9 D10 D11 df

indonesia 1 1 1 3

ribet 1 1 2

propinsi 1 1

aceh 1 1 2

panas 1 1

perang 1 1 2

tni 1 1 1 1 4

lumawan 1 1

kelompok 1 1

mbalela 1 1

separatis 1 1

gam 1 1 1 3

dha 1 1

gugur 1 1

akeh 1 1 2

jaba 1 1

anggota 1 1

polri 1 1

tumbal 1 1

langan 1 1

nyawa 1 1 2

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 49: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

26

Kata (t) D1 D2 D3 D4 D5 D6 D7 D8 D9 D10 D11 df

nalar 1 1

tumrap 1 1

pemerintah 1 1 1 3

brasta 1 1

kaum 1 1

pemberontakan 1 1

kuwi 1 1

barang 1 1

gampang 1 1 2

ragad 1 1

nyandhak 1 1

milyar 1 1

rupiah 1 1

prajurit 1 1

dinggo 1 1

totoh 1 1

pamrih 1 1

nkri 1 1

wutuh 1 1

pokok 1 1

tur 1 1

tengah 1 1

lsm 1 1 2

lembaga 1 1

swadaya 1 1

masarakat 1 1 2

bengok 1 1

protes 1 1

tekan 1 1

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 50: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

27

Kata (t) D1 D2 D3 D4 D5 D6 D7 D8 D9 D10 D11 df

luwar 1 1

negeri 1 1

alesan 1 1

arep 1 1

biyantu 1 1

terak 1 1

dielikke 1 1

larang 1 1

dening 1 1

klebu 1 1

manca 1 1

seneng 1 1

mula 1 1

nyuwara 1 1

tundho 1 1

mojok 1 1

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 51: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

28

Langkah 6. Menghitung inverse document frequency (IDF) dengan cara log dari jumlah total kalimat (D) dalam dokumen berbahasa

Jawa dibagi document frequency (df).

Langkah 7. Menghitung (W) bobot setiap kata (t) dalam kalimat (D) dengan cara mengalikan term frequency (TF) dengan inverse

document frequency (IDF).

Langkah 8. Menghitung bobot total kalimat (D) dengan cara menjumlahkan (W) bobot setiap kata (t) dalam kalimat (D).

Tabel 2.6 Tabel Perhitungan Bobot Kata (W)

Kata (t)

D1

D2

D3

D4

D5

D6

D7

D8

D9

D10

D11

df

IDF

TF * IDF D1 D2 D3 D4 D5 D6 D7 D8 D9 D10 D11

indonesia 1 1 1 3 0.564 0.564 0.564 0.564

ribet 1 1 2 0.740 0.740 0.740

propinsi 1 1 1.041 1.041

aceh 1 1 2 0.740 0.740 0.740

panas 1 1 1.041 1.041

perang 1 1 2 0.740 0.740 0.740

tni 1 1 1 1 4 0.439 0.439 0.439 0.439 0.439

lumawan 1 1 1.041 1.041

kelompok 1 1 1.041 1.041

mbalela 1 1 1.041 1.041

separatis 1 1 1.041 1.041

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 52: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

29

Kata (t)

D1

D2

D3

D4

D5

D6

D7

D8

D9

D10

D11

df

IDF

TF * IDF D1 D2 D3 D4 D5 D6 D7 D8 D9 D10 D11

gam 1 1 1 3 0.564 0.564 0.564 0.564

dha 1 1 1.041 1.041

gugur 1 1 1.041 1.041

akeh 1 1 2 0.740 0.740 0.740

jaba 1 1 1.041 1.041

anggota 1 1 1.041 1.041

polri 1 1 1.041 1.041

tumbal 1 1 1.041 1.041

langan 1 1 1.041 1.041

nyawa 1 1 2 0.740 0.740 0.740

nalar 1 1 1.041 1.041

tumrap 1 1 1.041 1.041

pemerintah 1 1 1 3 0.564 0.564 0.564 0.564

brasta 1 1 1.041 1.041

kaum 1 1 1.041 1.041

pemberontakan 1 1 1.041 1.041

kuwi 1 1 1.041 1.041

barang 1 1 1.041 1.041

gampang 1 1 2 0.740 0.740 0.740

ragad 1 1 1.041 1.041

nyandhak 1 1 1.041 1.041

milyar 1 1 1.041 1.041

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 53: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

30

Kata (t)

D1

D2

D3

D4

D5

D6

D7

D8

D9

D10

D11

df

IDF

TF * IDF D1 D2 D3 D4 D5 D6 D7 D8 D9 D10 D11

prajurit 1 1 1.041 1.041

dinggo 1 1 1.041 1.041

totoh 1 1 1.041 1.041

pamrih 1 1 1.041 1.041

nkri 1 1 1.041 1.041

wutuh 1 1 1.041 1.041

pokok 1 1 1.041 1.041

tur 1 1 1.041 1.041

tengah 1 1 1.041 1.041

lsm 1 1 2 0.740 0.740 0.740

lembaga 1 1 1.041 1.041

swadaya 1 1 1.041 1.041

masarakat 1 1 2 0.740 0.740 0.740

bengok 1 1 1.041 1.041

protes 1 1 1.041 1.041

tekan 1 1 1.041 1.041

luwar 1 1 1.041 1.041

negeri 1 1 1.041 1.041

alesan 1 1 1.041 1.041

arep 1 1 1.041 1.041

biyantu 1 1 1.041 1.041

terak 1 1 1.041 1.041

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 54: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

31

Kata (t)

D1

D2

D3

D4

D5

D6

D7

D8

D9

D10

D11

df

IDF

TF*IDF D1 D2 D3 D4 D5 D6 D7 D8 D9 D10 D11

dielikke 1 1 1.041 1.041

larang 1 1 1.041 1.041

dening 1 1 1.041 1.041

klebu 1 1 1.041 1.041

manca 1 1 1.041 1.041

seneng 1 1 1.041 1.041

mula 1 1 1.041 1.041

nyuwara 1 1 1.041 1.041

tundho 1 1 1.041 1.041

mojok 1 1 1.041 1.041

JUMLAH 1.305 2.823 5.909 9.774 9.598 11.154 3.563 10.552 10.075 4.428

5.733

URUTAN 11 10 6 4 5 1 9 2 3 8 7

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 55: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

32

Langkah 9. Berdasarkan hasil perhitungan bobot total kalimat (D), akan diambil

40% (Hovy, Mitkov, 2005) dari jumlah bobot kalimat (D) yang

memiliki score paling tinggi.

Langkah 10. Dari langkah-langkah tersebut maka menghasilkan kumpulan

kalimat (D) yang berisi bagian penting dari dokumen berbahasa

Jawa.

Hasil :

- Sing dha gugur wis akeh, kejaba wong-wong GAM, anggota TNI utawa Polri

wis ana sing dadi tumbal kelangan nyawa.

- Ragade bisa nyandhak milyaran rupiah lan nyawa para prajurit dinggo totohan

mung pamrih NKRI tetep wutuh.

- Ing tengah kahanan ngono mau, akeh LSM (Lembaga Swadaya Masarakat) sing

bengok-bengok protes tekan luwar negeri.

- Alesane arep mbiyantu masarakat Aceh sing lagi keterak perang, kok dielikke

(dilarang) dening pemerintah.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 56: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

33

BAB III

ANALISIS DAN PERANCANGAN SISTEM

3.1 Gambaran Sistem Penelitian

Pada penelitian ini akan dibangun sistem peringkasan teks otomatis pada

dokumen berbahasa Jawa. Sistem ini bertujuan untuk menghasilkan sebuah

ringkasan yang berisi bagian penting dari keseluruhan dokumen berbahasa Jawa.

Ringkasan tersebut akan membantu pembaca dalam memahami isi dari dokumen

tanpa harus membaca keseluruhan dokumen berbahasa Jawa.

Untuk arsitektur sistem ini ditunjukan pada Gambar 3.1. Pada sistem ini

terdapat 2 aktor yaitu admin dan pengguna. Admin bertujuan untuk memasukkan

data dokumen. Data dokumen tersebut akan ditampilkan pada halaman utama

sebagai data koleksi dokumen. Sedangkan pengguna dapat melakukan

peringkasan teks otomatis dengan cara memasukkan data dokumen berbahasa

Jawa. Data dokumen tersebut akan diproses oleh sistem menjadi sebuah

ringkasan. Untuk menjadi sebuah ringkasan, sistem akan memprosesnya dengan

melakukan preprocessing yaitu pemisahan kata (tokenizing), penghapusan kata

umum (stopword), pengembalian kata dasar (stemming). Kemudian sistem akan

melakukan perhitungan TF-IDF untuk mendapatkan jumlah bobot kalimat. Bobot

kalimat dengan score tinggi merupakan kalimat penting dalam sebuah dokumen

berbahasa Jawa. Berdasarkan perhitungan TF-IDF, kalimat-kalimat tersebut yang

akan dijadikan sebagai sebuah ringkasan.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 57: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

34

Ringkasan adalah suatu teks yang dihasilkan dari satu atau lebih teks yang

berisi bagian informasi yang signifikan dalam teks asal, dan yang tidak lebih dari

setengah teks aslinya (Hovy, Mitkov, 2005). Maka pada penelitian ini kalimat-

kalimat yang diambil untuk dijadikan sebuah ringkasan adalah sebesar 40% dari

total kalimat yang ada dalam sebuah dokumen. Misalkan ada 50 kalimat dalam

sebuah dokumen, maka dalam penelitian ini akan diambil sekitar 20 kalimat yang

memiliki score tinggi. Karena jika kalimat yang diambil dalam sebuah dokumen

terlalu sedikit maka hasil ringkasan menjadi tidak sesuai dengan isi dokumen, hal

ini yang menyebabkan ringkasan tidak relevan.

Pengguna Sistem Admin

Pengguna

Admin

Gambar 3.1 Gambaran Sistem Keseluruhan

Koleksi Data Dokumen

Prepocessing : Tokenizing.

Stopword, Stemming

Perhitungan

TF-IDF

Hasil Ringkasan

Input Data Dokumen

Input Data Dokumen

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 58: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

35

3.2 Analisis Kebutuhan

Dalam sistem ini terdapat 2 aktor yaitu admin dan pengguna. Tabel berikut

menjelaskan kebutuhan setiap aktor :

Tabel 3.1 Tabel Analisis Kebutuhan

Pengguna Sistem Kebutuhan

Admin 1. Dapat memasukkan data dokumen ke

dalam sistem.

Pengguna 1. Dapat melakukan peringkasan teks

otomatis dengan dokumen berbahasa

Jawa sesuai kebutuhan.

2. Dapat melihat hasil ringkasan dari

sistem.

3. Dapat melihat data koleksi dokumen

dan ringkasan dari sistem yang telah

dimasukkan Admin.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 59: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

36

<<include>>

<<include>>

<<include>>

3.3 Perancangan Sistem

3.3.1 Diagram Use Case

Diagram use case menjelaskan alur penggunaan sistem peringkasan teks

otomatis dokumen berbahasa Jawa. Dalam sistem ini terdapat 2 aktor yaitu admin

dan pengguna. Admin bertujuan untuk memasukkan data dokumen. Data

dokumen tersebut akan ditampilkan pada halaman utama sebagai data koleksi

dokumen. Sedangkan pengguna dapat melihat data koleksi dokumen serta dapat

melakukan peringkasan teks otomatis dengan cara memasukkan data dokumen

berbahasa Jawa yang ingin diringkas.

Pengguna

Admin

Gambar 3.2. Diagram Use case

Subsistem Peringkasan Teks Otomatis

Memasukkan data dokumen

Melihat hasil ringkasan

Melihat data koleksi dokumen

Subsistem Operasi Teks

Memasukkan data koleksi dokumen

Login

Logout

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 60: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

37

3.3.1.1 Skenario Use Case

3.3.1.1.1 Skenario Login

Tabel 3.2 Skenario Login

Nama use case Login

Aktor Admin

Diskripsi Admin memasukkan username dan password untuk masuk dan

menggunakan sistem.

Prakondisi Admin mempunyai username dan password.

Langkah kerja Aksi aktor Reaksi sistem

1. Admin memasukkan

username dan password.

2. Admin menekan tombol

"Login".

3. Sistem memverifikasi

kebenaran username dan

password.

4. Jika benar maka sistem

menampilkan halaman

Admin.

Alternatif 4. Jika salah sistem

menampilkan halaman utama

untuk login kembali.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 61: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

38

3.3.1.1.2. Skenario Memasukkan Data Koleksi Dokumen

Tabel 3.3 Skenario Memasukkan Data Koleksi Dokumen

Nama use case Memasukkan Data Koleksi Dokumen

Aktor Admin

Diskripsi Admin memasukkan data dokumen ke dalam sistem, data dokumen

tersebut akan ditampilkan pada halaman utama sebagai data koleksi

dokumen.

Prakondisi Admin sudah melakukan login dan masuk ke dalam sistem.

Langkah kerja Aksi aktor Reaksi sistem

1. Sistem menampilkan form

untuk memasukkan data

dokumen.

2. Admin memasukkkan data

dokumen ke dalam sistem.

3. Admin menekan tombol

"Simpan".

4. Sistem menyimpan data

dokumen ke dalam sistem

sebagai data koleksi dokumen.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 62: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

39

3.3.1.1.3. Skenario Logout

Tabel 3.4 Skenario Logout

3.3.1.1.4. Skenario Memasukkan Data Dokumen

Tabel 3.5 Skenario Memasukkan Data Dokumen

Nama use case Memasukkan Data Dokumen

Aktor Pengguna

Diskripsi Pengguna memasukkan data dokumen berbahasa Jawa yang ingin

diringkas.

Prakondisi Pengguna memiliki data dokumen yang ingin diringkas

Langkah kerja Aksi aktor Reaksi sistem

1. Aktor menekan tombol

"Summarization".

Nama use case Logout

Aktor Admin

Diskripsi Admin menekan tombol logout.

Prakondisi Admin sudah melakukan login dan masuk ke dalam sistem.

Langkah kerja Aksi aktor Reaksi sistem

1. Admin menekan tombol

“logout”.

2. Akan keluar dari sistem dan

menampilkan halaman utama.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 63: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

40

2. Sistem menampilkan form

untuk memasukkan data

dokumen.

3. Aktor memasukkan data

dokumen yang ingin

diringkas pada sistem.

4. Aktor menekan tombol "Ok".

5. Sistem memproses dokumen

menjadi ringkasan serta

menampilkan hasil ringkasan.

3.3.1.1.5. Skenario Melihat Hasil Ringkasan

Tabel 3.6 Skenario Melihat Hasil Ringkasan

Nama use case Melihat Hasil Ringkasan

Aktor Pengguna

Diskripsi Penggina melihat hasil ringkasan dari data dokumen yang

dimasukkan ke dalam sistem.

Prakondisi Pengguna sudah memasukkan data dokumen untuk diringkas.

Langkah kerja Aksi aktor Reaksi sistem

1. Sistem menampilkan hasil

ringkasan dokumen.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 64: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

41

3.3.1.1.6. Skenario Melihat Data Koleksi Dokumen

Tabel 3.7 Skenario Melihat Data Koleksi Dokumen

Nama use case Melihat Data Koleksi Dokumen

Aktor Pengguna

Diskripsi Pengguna melihat data koleksi dokumen yang ada pada sistem,

terdapat pada halaman utama.

Prakondisi Pengguna berada pada halaman utama.

Langkah kerja Aksi aktor Reaksi sistem

1. Aktor berada pada halaman

utama.

2. Aktor menekan tombol

“Continue Reading”.

3. Sistem menampilkan data

koleksi dokumen.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 65: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

42

valid

invalid

Benar

Salah

3.3.2 Diagram Aktifitas

3.3.2.1. Diagram Aktifitas Login

Admin dapat melakukan login dengan cara memasukkan username dan

password yang sudah ditentukan. Namun jika username dan password tidak

sesuai maka sistem akan kembali ke halaman utama. Berikut adalah Diagram

Aktifitas Login, Gambar 3.3.

Aktor Sistem

Gambar 3.3 Diagram Aktifitas Login

Masukkan username dan password

Verifikasi username dan password

Masuk ke sistem

Menekan tombol “Login”

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 66: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

43

ya

tidak

TIDAK

3.3.2.2. Diagram Aktifitas Memasukkan Data Koleksi Dokumen

Setelah melakukan login, admin dapat memasukkan data dokumen sesuai

dengan form inputan pada sistem. Data dokumen tersebut akan ditampilkan dalam

halaman utama sebagai data koleksi dokumen. Berikut adalah Diagram Akrifitas

Memasukkan Data Koleksi Dokumen, Gambar 3.4.

Aktor Sistem

Gambar 3.4 Diagram Aktifitas Memasukkan Data Koleksi Dokumen

Login Sistem menampilkan form inputan data koleksi dokumen

Sistem menyimpan dalam data koleksi dokumen

Memasukkan data koleksi dokumen

Menekan tombol "Simpan"

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 67: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

44

3.3.2.3. Diagram Aktifitas Logout

Admin dapat menghentikan tugasnya memasukkan data koleksi dokumen

dengan cara menekan tombol "Logout". Berikut adalah Diagram Aktifitas Logout,

Gambar 3.5.

Aktor Sistem

Gambar 3.5 Diagram Aktifitas Logout

Akan keluar dari halaman admin

Menekan tombol “Logout”

Menampilkan halaman utama

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 68: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

45

ya

tidak

YA

TIDAK

3.3.2.4. Diagram Aktifitas Memasukkan Data Dokumen

Pengguna dapat memasukkan data dokumen berbahasa Jawa untuk

dijadikan sebuah ringkasan. Kemudian sistem akan menampilkan hasil

ringkasannya. Berikut adalah Diagram Aktifitas Memasukkan Data Dokumen,

Gambar 3.6.

Aktor Sistem

Gambar 3.6 Diagram Aktifitas Memasukkan Data Dokumen

Menekan tombol "Summarization"

Sistem menampilkan form inputan data dokumen

Sistem memproses menjadi ringkasan

Memasukkan data dokumen yang diringkas

Menekan tombol "Ok"

Sistem menampilkan hasil ringkasan

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 69: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

46

3.3.2.5. Diagram Aktifitas Melihat Hasil Ringkasan

Setelah pengguna memasukkan data dokumen berbahasa Jawa, maka

sistem akan menampilkan hasil ringkasan dari dokumen tersebut. Berikut adalah

Diagram Aktifitas Melihat Hasil Ringkasan. Gambar 3.7.

Aktor Sistem

Gamabr 3.7 Diagram Aktifitas Melihat Hasil Ringkasan

Memasukkan data dokumen yang

diringkas

Sistem menampilkan hasil

ringkasan

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 70: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

47

3.3.2.6. Diagram Aktifitas Melihat Data Koleksi Dokumen

Selain dapat memasukkan dokumen berbahasa Jawa untuk diringkas,

Pengguna juga dapat melihat data koleksi dokumen yang terdapat pada halaman

utama. Berikut adalah Diagram Aktifitas Melihat Data Koleksi Dokumen,

Gambar 3.8.

Aktor Sistem

Gambar 3.8 Diagram Aktifitas Melihat Data Koleksi Dokumen

Menekan tombol “Continue Reading”

pada halaman utama

Sistem menampilkan data koleksi dokumen

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 71: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

48

username & password getParameter

(username, password)

Invalid

Request page

cekValidasi (username, password)

3.3.3 Diagram Sekuensial

Diagram Sekuensial adalah suatu diagram yang menjelaskan bagaimana

suatu operasi atau sistem dijalankan secara bertahap.

3.3.3.1. Diagram Sekuensial Login

Username dan password yang sudah dimasukkan akan divalidasi oleh

sistem. Jika sesuai maka admin akan masuk pada halaman inputDataMajalah.jsp,

sedangkan jika salah maka akan kembali pada halaman utama (index.jsp) serta

menampilkan pesan invalid. Berikut adalah proses Login, Gambar 3.9.

<Kontroler> <Model> <View>

index.jsp ProcessLoginServlet.java LoginModel.java inputDataMajalah.jsp

Admin

Gambar 3.9 Diagram Sekuensial Login

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 72: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

49

tanggal, sumber, judul, data majalah getParameter

(tanggal, sumber, judul, data majalah)

)

Request page

input (tanggal, sumber, judul, data majalah)

3.3.3.2. Diagram Sekuensial Memasukkan Data Koleksi Dokumen

Setelah Login, admin dapat memasukkan data koleksi dokumen yang

berisi tanggal, sumber majalah, judul majalah dan data majalah. Data dokumen

akan disimpan oleh sistem dan ditampilkan pada halaman utama (index.jsp)

sebagai data koleksi dokumen. Berikut adalah proses Memasukkan Data Koleksi

Dokumen, Gambar 3.10.

<View> <Kontroler> <Model>

inputDataMajalah.jsp ProcessInputMajalah.java MajalahModel.java

Admin

Gambar 3.10 Diagram Sekuensial Memasukkan Data Koleksi Dokumen

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 73: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

50

Request Logout

Request page

3.3.3.3. Diagram Sekuensial Logout

Admin dapat menghentikan tugasnya memasukkan data koleksi dokumen

pada halaman inputDataMajalah.jsp dengan cara menekan tombol "Logout".

Kemudian admin akan kembali pada halaman utama (index.jsp). Berikut adalah

proses Logout, Gambar 3.11.

<View>

inputDataMajalah.jsp index.jsp

Admin

Gambar 3.11 Diagram Sekuensial Logout

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 74: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

51

data dokumen getParameter (data dokumen)

sendRedirect

isStopword (tempKata[j])

setWord (tempKata[j])

summarization (data dokumen)

Hasil Proprocessing

Hasil perhitungan tf-idf

Request page

3.3.3.4. Diagram Sekuensial Memasukkan Data Dokumen

Pengguna dapat memasukkan data dokumen berbahasa Jawa pada halaman inputDataDokumen.jsp untuk dijadikan sebuah

ringkasan. Kemudian sistem akan menampilkan hasil ringkasannya pada halaman viewDataDokumen.jsp. Berikut adalah proses

Memasukkan Data Dokumen, Gambar 3.12. <View> <Kontroler> <Model> <Model> <Model> <View>

inputDataDokumen.jsp ProcessSummarization.java TF-IDFl.java Stopword Stemming viewDataDokumen.java

Pengguna

Gambar 3.12 Diagram Sekuensial Memasukkan Data Dokumen

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 75: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

52

data dokumen

Request page

3.3.3.5. Diagram Sekuensial Melihat Hasil Ringkasan

Setelah pengguna memasukkan data dokumen berbahasa Jawa pada

halaman inputDataDokumen.jsp, maka sistem akan menampilkan hasil ringkasan

dari dokumen tersebut pada halaman viewDataDokumen.jsp. Berikut adalah

proses Melihat Hasil Ringkasan. Gambar 3.13.

<View> <View>

inputDataDokumen.jsp viewDataDokumen.jsp

Pengguna

Gambar 3.13 Diagram Sekuensial Melihat Hasil Ringkasan

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 76: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

53

Request data koleksi dokumen

Request page

3.3.3.6. Diagram Sekuensial Melihat Data Koleksi Dokumen

Selain dapat memasukkan dokumen berbahasa Jawa untuk diringkas,

pengguna juga dapat melihat data koleksi dokumen yang terdapat pada halaman

utama (index.jsp). Berikut adalah proses Melihat Data Koleksi Dokumen, Gambar

3.14.

<View> <View>

index.jsp viewDataMajalah.jsp

Pengguna

Gambar 3.14 Diagram Sekuensial Melihat Data Koleksi Dokumen

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 77: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

54

3.3.4 Diagram MVC (Model View Control)

Diagram MVC adalah diagram yang menjelaskan bagaimana suatu operasi

dijalankan dengan melihat kelas MVC (Model View Control).

3.3.4.1. Struktur Kelas MVC (Model View Control)

Tabel 3.8 Struktur Kelas Model View Control

Model View Control

LoginModel.java

MajalahModel.java

StemWord.java

StopWord.java

TF-IDF.java

index.jsp

inputDataDokumen.jsp

inputDataMajalah.jsp

viewDataDokumen.jsp

viewDataMajalah.jsp

viewRingkasanMajalah.jsp

ProcessInputMajalah.java

ProcessLoginServlet.java

ProcessSummarization.java

3.3.4.1.1. Diagram Analisis Kelas MVC (Model View Control)

index.jsp ProcessLoginServlet.java LoginModel.java

Admin inputDataMajalah.jsp ProcessInputMajalah.java

MajalahModel.java

Gambar 3.15 Diagram Kelas Admin

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 78: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

55

index.jsp viewDataMajalah.jsp viewRingkasanMajalah.jsp

Pengguna inputDataDokumen.jsp ProcessSummarization.java TF-IDF.java StopWord.java

viewDataDokumen.jsp StemWord.java

Gambar 3.16 Diagram Kelas Pengguna

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 79: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

56

Tabel 3.9 Diagram Kelas

3.3.4.3. Diagram Kelas Model

MajalahModel.java LoginModel.java

- tanggalMajalah : String

- sumberMajalah : String

- judulMajalah : String

- dataMajalah : String

- username : String

- password : String

<<constructor>> LoginModel()

+ setUsername (String) : void

+ getUsername : String

+ setPassword (String) : void

+ getPassword : String

+ getAdmin()

<<constructor>> MajalahModel()

+ setTanggalMajalah (String) : void

+ getTanggalMajalah : String

+ setSumberMajalah (String) : void

+ getSumberMajalah : String

+ setJudulMajalah (String) : void

+ getJudulMajalah : String

+ setDataMajalah (String) : void

+ getDataMajalah : String

+ inputMajalah()

+ readMajalah()

+ viewMajalah()

TF_IDF.java StopWord.java

<<constructor>>TF_IDF()

+ summarization() - stopword : List<String>

<<constructor>>StopWord()

+ isStopword () : boolean

StemWord.java

- word : String

- directory : List<String>

<<constructor>>StemWord()

+ setWord (String) : void

+ getWord : String

+ delSuffix () : String

+ delPrefix () : String

+ delDuplikasi () : String

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 80: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

57

MAJALAH BAHASA JAWA username password

Home Summarization

3.4 Perancangan Antar Muka (User Interface)

3.4.1. Halaman Utama

Pada halaman utama terdapat 2 aktor yang menggunakan yaitu admin dan

pengguna. Admin dapat melakukan "Login" dengan cara memasukkan username

dan password terlebih dahulu. Setelah Login admin dapat memasukkan data

dokumen sebagai data koleksi dokumen, kemudian akan disimpan oleh sistem dan

akan ditampilkan pada halaman utama. Sedangkan pengguna dapat melihat data

koleksi dokumen yang sudah dimasukkan admin sebelumnya. Desain Halaman

Utama seperti Gambar 3.17.

Gambar 3.17 Halaman Utama

MeLorot Maneh

- Tanggal 2 Mei wis wiwit kesilep,

nanging kegiyatan Hardhiknas (Hari

Pendhidhikan) isih katon marak ing saben

dhaerah. - Lan ing tengah kahanan

Ora Kena Mlebu Aceh

- Sing dha gugur wis akeh, kejaba wong-

wong GAM, anggota TNI utawa Polri

wis ana sing dadi tumbal kelangan

nyawa. - Nalare, tumrape TNI

"BAYANG-BAYANG"

DISINTEGRASI RI

-Sawise ambruke Uni Soviet utawa USSR

(Uni Soviet Sosialis Republik) taun 1991

sing ditututi negara-negara uni ing laladan

Balkan (Eropa Tenggara) kaya

Ngilangi Pornografi lan Pornoaksi

-Majelis Agama-agama DIY wiwit

Romadhon taun iki netepake bakal

ngadani upaya ngilangi pornografi lan

pornoaksi sing dianggep saya ngrembrah

lan nggladrah.- Rembug bab

login

Continue Reading Continue Reading

Continue Reading Continue Reading

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 81: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

58

3.4.2. Halaman Memasukkan Data Koleksi Dokumen

Setelah Login, maka admin dapat memasukkan data koleksi dokumen

yang berisi tanggal, sumber majalah, judul majalah, dan input data majalah.

Kemudian tekan tombol "Simpan" untuk menyimpan ke dalam sistem dan

menampilkan pada halaman utama. Desain Halaman Memasukkan Data Koleksi

Dokumen seperti pada Gambar 3.18.

c. Halaman Pengguna

Gambar 3.14 Halaman Pengguna

Gambar 3.13 Halaman Ad

Gambar 3.18 Halaman Memasukkan Data Koleksi Dokumen

MAJALAH BAHASA JAWA

Home Summarization Logout Tanggal : Sumber Majalah : Judul Majalah : Input Data Majalah :

SIMPAN

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 82: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

59

3.4.3. Halaman Melihat Data Koleksi Dokumen

Pada halaman utama pengguna dapat melihat data koleksi dokumen yang

sudah dimasukkan oleh admin. Ketika pengguna menekan tombol "Continue

Reading" maka sistem akan menampilkan data koleksi dokumen. Pada halaman

ini pengguna juga dapat melihat ringkasan dari data koleksi dokumen tersebut

dengan cara menekan link “Ringkasan Dokumen”. Desain Halaman Melihat Data

Koleksi Dokumen seperti pada Gambar 3.19.

Gambar 3.19 Halaman Melihat Data Koleksi Dokumen

Home Peringkas Otomatis

Data Dokumen Majalah : Ringkasan Dokumen

Indonesia lagi ribet. Propinsi Aceh lagi panas. Perang TNI lumawan kelompok

mbalela separatis GAM. Sing dha gugur wis akeh, kejaba wong-wong GAM,

anggota TNI utawa Polri wis ana sing dadi tumbal kelangan nyawa. Nalare, tumrape

TNI lan pemerintah, mbrasta kaum pemberontakan kaya GAM kuwi mau dudu

barang sing gampang. Ragade bisa nyandhak milyaran rupiah lan nyawa para prajurit

dinggo totohan mung pamrih NKRI tetep wutuh. Pokoke ribet, tur ya ora gampang.

bengok-bengok protes tekan luwar negeri.

Ing tengah kahanan ngono mau, akeh LSM (Lembaga Swadaya Masarakat) sing bengok-bengok protes tekan luwar negeri. Alesane arep mbiyantu masarakat Aceh sing lagi keterak perang, kok dielikke (dilarang) dening pemerintah. LSM mau, klebu

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 83: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

60

Home Peringkas Otomatis

Data Ringkasan Majalah :

Ketika pengguna menekan link “Ringkasan Dokumen” maka akan terdapat

halaman yang menampilkan ringkasan berdasarkan data koleksi dokumen

tersebut. Seperti pada Gambar 3.20.

\

Gambar 3.20 Halaman Melihat Ringakasan Data Koleksi Dokumen

- Sing dha gugur wis akeh, kejaba wong-wong GAM, anggota TNI utawa Polri wis

ana sing dadi tumbal kelangan nyawa.

- Nalare, tumrape TNI lan pemerintah, mbrasta kaum pemberontakan kaya GAM

kuwi mau dudu barang sing gampang.

- Ragade bisa nyandhak milyaran rupiah lan nyawa para prajurit dinggo totohan

mung pamrih NKRI tetep wutuh.

- Ing tengah kahanan ngono mau, akeh LSM (Lembaga Swadaya Masarakat) sing

bengok-bengok protes tekan luwar negeri.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 84: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

61

3.4.4. Halaman Peringkasan Teks Otomatis (Summarization)

Pada halaman peringkasan teks otomatis (summarization) pengguna dapat

melakukan peringkasan teks otomatis dengan cara memasukkan data dokumen

berbahasa Jawa. Kemudian menekan tombol "OK" maka sistem akan memproses

menjadi sebuah ringkasan. Desain Peringkasan Teks Otomatis (Summarization)

seperti Gambar 3.21.

Gambar 3.21 Halaman Peringkasan Teks Otomatis (Summarization)

Home Peringkas Otomatis

Input Data Dokumen :

OK

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 85: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

62

3.4.5. Halaman Melihat Hasil Ringkasan

Setelah pengguna memasukkan data dokumen berbahasa Jawa, maka

sistem akan memproses sehingga menghasilkan sebuah ringkasan. Desain

Halaman Melihat Hasil Ringkasan seperti pada Gambar 3.22.

\

Gambar 3.22 Halaman Melihat Hasil Ringkasan

Home Peringkas Otomatis

Hasil Ringkasan :

- Sing dha gugur wis akeh, kejaba wong-wong GAM, anggota TNI utawa Polri wis

ana sing dadi tumbal kelangan nyawa.

- Nalare, tumrape TNI lan pemerintah, mbrasta kaum pemberontakan kaya GAM

kuwi mau dudu barang sing gampang.

- Ragade bisa nyandhak milyaran rupiah lan nyawa para prajurit dinggo totohan

mung pamrih NKRI tetep wutuh.

- Ing tengah kahanan ngono mau, akeh LSM (Lembaga Swadaya Masarakat) sing

bengok-bengok protes tekan luwar negeri.

- Alesane arep mbiyantu masarakat Aceh sing lagi keterak perang, kok dielikke

(dilarang) dening pemerintah.

- Terus terange, sing akeh malah masarakat, rakyat dha dinggo kudhung kanggo

golek dana saka negara asing.

- Lan saka kehe kedadeyan kaya sing tau dumadi ing Maluku, Manado, Papua (Irian

Jaya), lan uga ing dhaerah-dhaerah ing Jawa LSM kaya ngono mau malah mung

manas-manasi.

- Kejaba kuwi sing paling gawe rugi nalikane ana anggota LSM asing tiwas merga

kerusuhan, beritane sumebar cepet tekan ngendi-endi lan Indonesia banjur diuman-

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 86: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

63

3.5. Skenario Pengujian Sistem

Pada pengujian sistem akan dilakukan dengan cara mengoreksi secara

manual ringkasan yang dihasilkan oleh sistem. Yang dimaksud mengoreksi secara

manual adalah penguji menilai apakah ringkasan dari sistem termasuk relevan

atau tidak relevan. Pengujian ini akan dilakukan kepada 3 responden bahasa Jawa,

dengan dokumen berjumlah 50. Dokumen yang digunakan dalam sistem ini

bersumber dari Djakalodang tahun 1978, 2002 dan 2003.

Berikut adalah contoh pengujian sistem yang dilakukan secara manual

kepada responden. Jika dokumen 1 relevan makan nilai yang dihasilkan adalah 1

dan jika tidak relevan bernilai 0 begitu seterusnya. Dapat dilihat pada Tabel 3.10.

Tabel 3.10 Contoh Pengujian Sistem

Dokumen Relevan Tidak Relevan

1 1 0

2 1 0

3 1 0

4 0 1

5 1 0

6 0 1

7 1 0

8 0 1

9 1 0

10 1 0

Jumlah 7 3

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 87: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

64

Setelah mengisikan kuesioner untuk pengujian sistem, maka akan

dilakukan perhitungan jumlah dokumen yang relevan. Dari jumlah dokumen yang

relevan akan lakukan perhitungan nilai rata-rata untuk mendapatkan nilai akurasi

yang dihasilkan oleh sistem. Berikut adalah cara menghitung nilai rata-rata

terdapat pada rumus (1), Gambar 3.23.

Jumlah dokumen yang relevan Rata-rata = x 100% (1) Jumlah keseluruhan dokumen

Gambar 3.23 Rumus Perhitungan Rata-rata

Dari contoh pengujian sistem diatas terdapat 10 dokumen yang relevan.

Berikut adalah contoh menghitung nilai rata-rata, Gambar 3.24.

7 Rata-rata = x 100%

10

= 70 %

Gambar 3.24 Contoh Perhitungan Rata-rata

Maka dari contoh pengujian sistem dengan dokumen berjumlah 10

terdapat nilai rata-rata akurasi yang dihasilkan oleh sistem sebesar 70%. Dengan

demikian akan diketahui nilai rata-rata akurasi sistem ini dalam membantu

pengguna untuk memperoleh intisari dari dokumen berbahasa Jawa sehingga

dapat membuat keputusan melanjutkan membaca keseluruhan dokumen atau

cukup dengan membaca ringkasan.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 88: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

65

3.6 Data

Ketika admin memasukkan data koleksi dokumen ke dalam sistem, data

tersebut akan disimpan ke dalam database. Hal ini dikarenakan banyaknya

inputan yang dimasukkan admin, seperti tanggal, judul majalah, sumber majalah,

serta data majalah. Dengan menggunakan database penyimpanan data menjadi

lebih mudah serta data mudah untuk diolah.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 89: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

66

BAB IV

IMPLEMENTASI

4.1. Spesifikasi Software dan Hardware yang Digunakan

4.1.1. Spesifikasi Software

Spesifikasi software yang digunakan untuk implementasi Sistem

Peringkasan Teks Otomatis Pada Dokumen Berbahasa Jawa Menggunakan

Meotde TF-IDF adalah sebagai berikut :

1. Sistem operasi : Windows 7 Ultimate 64 bit

2. Netbeans IDE 6.9.1

3. SQLyog

4. Browser : Mozilla Firefox

4.1.2. Spesifikasi Hardware

Spesifikasi hardware yang digunakan untuk implementasi Sistem

Peringkasan Teks Otomatis Pada Dokumen Berbahasa Jawa Menggunakan

Meotde TF-IDF adalah sebagai berikut :

1. Prosesor : AMD A8-5550M APU with Radeon(tm) HD Graphics

(4CPUs), 2,1GHz

2. Memori RAM : 4096MB DDR3

3. Harddisk : 500 GB

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 90: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

67

ArrayList<String>

4.2. Implementasi Program

4.2.1 Implementasi Text Preprocessing

Text Preprocessing memiliki 3 tahap yaitu pemisahan kata (tokenizing

atau split), penghapusan kata umum (stopword), dan pengembalian kata dasar

(stemming). Setiap dokumen yang dimasukkan pengguna akan melalui proses ini

untuk mendapatkan full text yang dimiliki. Hasil full text tersebut akan disimpan

dalam bentuk ArrayList<String>. Pada Gambar 4.1 adalah rangkaian bagaimana

proses text preprocessing dilakukan oleh sistem. Berikut Implementasi Text

Preprocessing, Listing Program 4.1.

Tokenizing/Split Stopword Stemming

Gambar 4.1 Rangkaian Proses Text Preprocessing

public String summarization(String teksAsli) {

String[] kalimatAsli = teksAsli.split("\\.");

String[] tempKalimat = teksAsli.split("\\.");

ArrayList<String> teks_lengkap = new ArrayList<String>();

StopWord stopword = new StopWord();

StemWord stemming = new StemWord();

for (int i = 0; i < tempKalimat.length; i++) {

if (tempKalimat[i].startsWith(" ")) {

tempKalimat[i] = tempKalimat[i].substring(1);

}

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 91: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

68

String[] tempKata = tempKalimat[i].split(" ");

for (int j = 0; j < tempKata.length; j++) {

tempKata[j] = tempKata[j].replaceAll("[!@#$%&*,_'?\"()\n/;:-=]", "");

if (stopword.isStopword(tempKata[j].toLowerCase())) {

continue;

}

stemming.setWord(tempKata[j].toLowerCase());

tempKata[j] = stemming.getWord();

if (!teks_lengkap.contains(tempKata[j])) {

teks_lengkap.add(tempKata[j]);

}

}

}

}

Listing Program 4.1 Implementasi Text Preprocessing

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 92: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

69

4.2.2 Implementasi Penghapusan Kata Umum (Stopword)

Setelah proses pemisahan kata (tokenizing atau split), akan dilakukan

proses penghapusan kata umum (stopword). Kata umum adalah kata yang tidak

memiliki maka berarti dalam sebuah kalimat. Dalam sistem ini daftar kata umum

disimpan dalam bentuk file .txt, kemudian akan dipanggil dalam sistem. Hasil dari

penghapusan kata akan disimpan sementara dalam bentuk List<String>. Berikut

adalah Implementasi Penghapusan Kata Umum, Listing Program 4.2.

public class StopWord {

List<String> stopword;

public StopWord() {

try {

Scanner file = new Scanner(new File("e:/stopword.txt"));

stopword = new LinkedList<String>();

while (file.hasNext()) {

stopword.add(file.nextLine());

}

} catch (FileNotFoundException ex) {

Logger.getLogger(StopWord.class.getName()).log(Level.SEVERE, null, ex);

}

}

public boolean isStopword(String word) {

return stopword.contains(word);

}

}

Listing Program 4.2 Implementasi Penghapusan Kata Umum (Stopword)

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 93: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

70

4.2.3 Implementasi Pengembalian Kata Dasar (Stemming)

Kemudian akan dilakukan proses pengembalian kata dasar (stemming)

dengan cara mencari kata yang sesuai daftar kata dasar (dictionary). Dalam sistem

ini daftar kata dasar disimpan dalam bentuk file .txt, kemudian akan dipanggil

dalam sistem. Hasil dari pengembalian kata akan disimpan sementara dalam

bentuk List<String>. Berikut adalah Implementasi Pengembalian Kata Dasar,

Listing Program 4.3.

public class StemWord {

String word;

List<String> directory;

public StemWord() {

try {

Scanner file = new Scanner(new File("e:/dictionary.txt"));

directory = new LinkedList<String>();

while (file.hasNext()) {

String kata = file.nextLine();

directory.add(kata);

}

} catch (FileNotFoundException ex) {

Logger.getLogger(StemWord.class.getName()).log(Level.SEVERE, null, ex);

}

}

}

Listing Program 4.3 Implementasi Pengembalian Kata Dasar (Stemming)

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 94: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

71

Method delSuffix() ini mengimplementasikan aturan untuk menghapus

akhiran, "-e", "-n", "-a", "-i", "-ing" dll. Berikut adalah Implementasi Method

delSuffix(), Listing Program 4.4.

public String delSuffix() {

if (directory.contains(word)) {

return word; }

String kataAwal = word;

if (word.endsWith("e")) {

word = word.substring(0, word.length() - 1);

if (directory.contains(word)) {

return word;

} else {

word = kataAwal;

}

}

if (word.endsWith("n")) {

word = word.substring(0, word.length() - 1);

if (directory.contains(word)) {

return word;

} else {

word = kataAwal;

}

}

if (word.endsWith("a")) {

word = word.substring(0, word.length() - 1);

if (directory.contains(word)) {

return word;

} else {

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 95: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

72

word = kataAwal;

}

}

if (word.endsWith("i")) {

word = word.substring(0, word.length() - 1);

if (directory.contains(word)) {

return word;

} else {

word = kataAwal;

}

}

if (word.endsWith("ing")) {

word = word.substring(0, word.length() - 3);

if (directory.contains(word)) {

return word;

} else {

word = kataAwal;

}

}

return word;

}

Listing Program 4.4 Implementasi Method delSuffix()

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 96: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

73

Method delPrefix() ini mengimplementasikan aturan untuk menghapus

awalan, "dipun-", "peng-", "peny-", "pem-", dll. Berikut adalah Implementasi

Method delPrefix(), Listing Program 4.5.

private String delPrefix() {

if (directory.contains(word)) {

return word;

}

String kataAwal = word;

if (word.startsWith("dipun")) {

word = word.substring(5);

if (directory.contains(word)) {

return word;

} else {

word = kataAwal;

}

}

if (word.startsWith("peng")) {

word = word.substring(4);

if (directory.contains(word)) {

return word;

} else {

word = kataAwal;

}

}

if (word.startsWith("peny")) {

word = word.substring(4);

if (directory.contains(word)) {

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 97: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

74

return word;

} else {

word = kataAwal;

}

}

if (word.startsWith("pem")) {

word = word.substring(3);

if (directory.contains(word)) {

return word;

} else {

word = kataAwal;

}

}

if (word.startsWith("pam")) {

word = word.substring(3);

if (directory.contains(word)) {

return word;

} else {

word = kataAwal;

}

}

return word;

}

Listing Program 4.5 Implementasi Method delPrefix()

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 98: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

75

Method delDuplikasi() ini mengimplementasikan aturan untuk menghapus

kata yang sama. Berikut adalah Implementasi Method delDuplikasi(), Listing

Program 4.6.

private String delDuplikasi() {

String kataPertama = null;

String kataKedua = null;

if (word.contains("-")) {

kataPertama = word.substring(0, word.indexOf("-"));

kataKedua = word.substring(word.indexOf("-") + 1);

if (directory.contains(kataKedua)) {

word = kataKedua;

} else if (directory.contains(kataPertama)) {

word = kataPertama;

} else {

word = kataKedua;

}

}

return word;

}

Listing Program 4.6 Implementasi Method delDuplikasi()

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 99: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

76

4.2.4 Implementasi Term Frequency (TF)

Setelah text preprocessing selesai, akan dilakukan perhitungan jumlah

frekuensui kemunculan kata (t) pada kalimat (D). Pada tahap ini akan dibuat

tabelTF dalam array 2 dimensi dengan baris merupakan list kata (teks_lengkap)

dan kolom merupakan list kalimat (tempKalimat). Jika kata (t) yang terkandung

dalam kalimat (D) maka bernilai 1, sedangkan kata (t) yang tidak terkandung

dalam kalimat (D) maka bernilai 0. Berikut adalah Implementasi Term Frequency

(TF), Listing Program 4.7.

int[ ][ ] tabelTF = new int[tempKalimat.length][teks_lengkap.size()];

for (int i = 0; i < tempKalimat.length; i++) {

if (tempKalimat[i].startsWith(" ")) {

tempKalimat[i] = tempKalimat[i].substring(1);

}

String[] tempKata = tempKalimat[i].split(" ");

for (int j = 0; j < tempKata.length; j++) {

tempKata[j] = tempKata[j].replaceAll("[!@#$%&,_'?\"()\n/;:-=]", "");

if (stopword.isStopword(tempKata[j].toLowerCase())) {

continue;

}

stemming.setWord(tempKata[j].toLowerCase());

tempKata[j] = stemming.getWord();

int index = teks_lengkap.indexOf(tempKata[j]);

tabelTF[i][index] = 1;

}

}

Listing Program 4.7 Implementasi Term Frequency (TF)

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 100: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

77

4.2.5 Implementasi Document Frequency (df)

Pada tahap ini akan dilakukan perhitungan jumlah frekuensi kalimat (D)

yang mengandung kata (t) dengan cara membuat tabelDF dalam array. Berikut

adalah Implementasi Document Frequency, Listing Program 4.8.

int[ ] tabelDF = new int[teks_lengkap.size()];

for (int i = 0; i < teks_lengkap.size(); i++) {

for (int j = 0; j < tempKalimat.length; j++) {

tabelDF[i] += tabelTF[j][i];

}

}

Listing Program 4.8 Implementasi Document Frequency (df)

4.2.6 Implementasi Inverse Document Frequency (IDF)

Pada tahap ini akan dilakukan perhitungan (IDF) dengan membuat

tabelIDF dalam array. Dengan cara Log dari jumlah total kalimat (D) dibagi hasil

perhitungan (df) yang sudah dilakukan sebelumnya . Berikut adalah Implementasi

Inverse Document Frequency, Listing Program 4.9.

float[ ] tabelIDF = new float[teks_lengkap.size()];

for (int i = 0; i < teks_lengkap.size(); i++) {

tabelIDF[i] = (float) tempKalimat.length / tabelDF[i];

tabelIDF[i] = (float) Math.log10(tabelIDF[i]);

}

Listing Program 4.9 Implementasi Inverse Document Frequency (IDF)

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 101: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

78

4.2.7 Implementasi Bobot Kata (W)

Pada tahap ini akan dilakukan perhitungan bobot kata dengan cara

mengalikan hasil perhitungan TF dan perhitungan IDF. Akan dibuat tabelTFIDF

dalam array 2 dimensi dengan baris merupakan list kata (teks_lengkap) dan kolom

merupakan list kalimat (tempKalimat). Berikut adalah Implementasi Bobot Kata,

Listing Program 4.10.

float[ ][ ] tabelTFIDF = new float[tempKalimat.length][teks_lengkap.size()];

for (int i = 0; i < tempKalimat.length; i++) {

for (int j = 0; j < teks_lengkap.size(); j++) {

tabelTFIDF[i][j] = tabelTF[i][j] * tabelIDF[j];

}

}

Listing Program 4.10 Implementasi Bobot Kata (W)

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 102: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

79

4.2.8 Implementasi Bobot Total Kalimat (D)

Pada tahap ini akan dilakukan perhitungan bobot total kalimat (D) dengan

cara menjumlahkan bobot kata (W) dengan cara membuat jumlah dalam array.

Berikut adalah Implementasi Bobot Total Kalimat, Listing Program 4.11.

float jumlah[ ] = new float[tempKalimat.length];

for (int i = 0; i < tempKalimat.length; i++) {

for (int j = 0; j < teks_lengkap.size(); j++) {

jumlah[i] += tabelTFIDF[i][j];

}

}

Listing Program 4.11 Implementasi Bobot Total Kalimat (D)

4.2.9 Implementasi Pengambilan Kalimat (D)

Pada tahap ini akan dilakukan pengambilan kalimat (D) dengan jumlah

bobot total kalimat (D) yang memiliki score paling tinggi. Pada sistem ini akan

diambil 40% (Hovy, Mitkov, 2005) dari keseluruhan kalimat, untuk dijadikan

ringkasan. Hasil dari pengambilan kalimat akan disimpan sementara dalam bentuk

LinkedList<Integer>. Berikut adalah Implemenasi Pengambilan Kalimat, Listing

Program 4.12.

LinkedList<Float> list1 = new LinkedList<Float>();

LinkedList<Integer> list2 = new LinkedList<Integer>();

for (int i = 0; i < 40 * jumlah.length / 100; i++) {

list1.add(jumlah[i]);

list2.add(i);

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 103: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

80

}

for (int i = 40 * jumlah.length / 100; i < jumlah.length; i++) {

float min = list1.get(0);

int index = 0;

for (int j = 1; j < list2.size(); j++) {

if (min > list1.get(j)) {

min = list1.get(j);

index = j;

}

}

if (jumlah[i] > min) {

list1.remove(index);

list2.remove(index);

list1.add(jumlah[i]);

list2.add(i);

}

}

Listing Program 4.12 Implementasi Pengambilan Kalimat (D)

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 104: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

81

4.2.10 Implementasi Menampilkan Hasil Ringkasan

Pada tahap ini sistem akan menampilkan hasil ringkasan berdasarkan

perhitungan sebelumnya. Berikut adalah Implementasi Menampilkan Hasil

Ringkasan, Listing Program 4.13.

String hasil = "";

for (int i = 0; i < list1.size(); i++) {

int indexAwal = list2.get(i);

hasil = hasil + "-" + kalimatAsli[indexAwal] + ".\n";

}

return hasil;

}

Listing Program 4.13 Implementasi Menampilkan Hasil Ringkasan

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 105: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

82

4.3 Implementasi Antar Muka (User Interface)

Implementasi antar muka ini digunakan untuk mempermudah pengguna

dalam berinteraksi dengan sistem, maka GUI (Graphical User Interface) dibuat

berdasarkan perancangan sistem yang sudah dibuat sebelumnya.

4.3.1 Halaman Utama

Pada halaman utama terdapat 2 aktor yang menggunakan yaitu admin dan

pengguna. Admin dapat melakukan "Login" dengan cara memasukkan username

dan password terlebih dahulu. Setelah Login admin dapat memasukkan data

koleksi dokumen, kemudian akan disimpan oleh sistem dan akan ditampilkan

pada halaman utama. Sedangkan pengguna dapat melihat data koleksi dokumen

yang sudah dimasukkan admin sebelumnya. Seperti pada Gambar 4.2.

Gambar 4.2 Halaman Utam

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 106: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

83

4.3.2 Halaman Memasukkan Data Koleksi Dokumen

Setelah Login berhasil, maka admin dapat memasukkan data koleksi

dokumen yang berisi tanggal, sumber majalah, judul majalah, dan input data

majalah. Kemudian tekan tombol "Simpan" untuk menyimpan ke dalam sistem

dan menampilkan pada halaman utama. Seperti pada Gambar 4.3.

Gambar 4.3 Halaman Memasukkan Data Koleksi Dokumen

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 107: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

84

4.3.3 Halaman Melihat Data Koleksi Dokumen

Pada halaman utama pengguna dapat melihat data koleksi dokumen yang

sudah dimasukkan oleh admin. Pengguna juga dapat melihat ringkasan dari data

koleksi dokumen tersebut dengan cara menekan link “Ringkasan Dokumen”.

Seperti pada Gambar 4.4.

Gambar 4.4 Halaman Melihat Data Koleksi Dokumen

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 108: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

85

Ketika pengguna menekan link “Ringkasan Dokumen” maka akan terdapat

halaman yang menampilkan ringkasan berdasarkan data koleksi dokumen

tersebut. Seperti pada Gambar 4.5.

Gambar 4.5 Halaman Melihat Ringkasan Data Koleksi Dokumen

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 109: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

86

4.3.4 Halaman Peringkasan Teks Otomatis (Summarization)

Pada halaman peringkasan otomatis (summarization) Pengguna dapat

melakukan peringkasan teks otomatis dengan cara memasukkan data dokumen

berbahasa Jawa. Kemudian menekan tombol "OK" maka sistem akan memproses

menjadi sebuah ringkasan. Seperti pada Gambar 4.6.

Gambar 4.6 Halaman Peringkasan Teks Otomatis (Summarization)

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 110: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

87

4.3.5 Halaman Melihat Hasil Ringkasan

Setelah pengguna memasukkan data dokumen berbahasa Jawa, maka

sistem akan memproses sehingga menghasilkan sebuah ringkasan. Seperti pada

Gambar 4.7.

Gambar 4.7 Halaman Melihat Hasil Ringkasan

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 111: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

88

BAB V

ANALISIS HASIL DAN PEMBAHASAN

5.1 Analisis Pengujian Sistem

Pengujian sistem akan dilakukan dengan cara memasukkan data dokumen

berbahasa jawa. Dokumen yang dimasukkan berjumlah 50 yang bersumber dari

Djakalodhang. Sedangkan pengujian secara manual akan dilakukan kepada 3

responden yang sudah memiliki pengetahuan atau mengerti tentang Bahasa Jawa.

Responden menguji secara manual dengan cara membaca dokumen berbahasa

Jawa dan membandingkan ringkasan yang dihasilkan sistem. Responden akan

mengisikan kuesioner untuk menentukan apakah dokumen yang diuji secara

manual menghasilkan ringkasan yang relevan atau tidak relevan.

Tujuan dari pengujian ini adalah mencoba fungsi sistem, menghitung nilai

rata-rata untuk mengetahui nilai akurasi yang dihasilkan sistem. Diharapkan hasil

keluaran dari penelitian ini dapat membantu pengguna dalam memperoleh intisari

dari dokumen berbahasa Jawa sehingga dapat membantu membuat keputusan

melanjutkan membaca keseluruhan dokumen atau cukup dengan membaca

ringkasan.

5.1.1 Pengujian Kepada Responden

Berikut adalah hasil pengisian kuisoner yang dilakukan kepada responden

secara manual terdapat pada Tabel 5.1, berikut :

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 112: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

89

- Responden 1

Nama : Viktor Bayu Wisnu Brata

Dokumen yang relevan : 30

Dokumen yang tidak relevan : 20

- Responden 2

Nama : Hanang Candra

Dokumen yang relevan : 34

Dokumen yang tidak relevan : 16

- Responden 3

Nama : Bimantara Putra

Dokumen yang relevan : 32

Dokumen yang tidak relevan : 18

Tabel 5.1 Hasil Pengujian Kepada Responden

DOKUMEN RESPONDEN 1 RESPONDEN 2 RESPONDEN 3

1 1 1 1

2 0 1 1

3 0 1 0

4 0 0 1

5 1 1 0

6 1 0 1

7 1 1 0

8 1 0 1

9 1 1 1

10 1 1 1

11 0 1 0

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 113: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

90

12 0 0 1

13 0 1 0

14 0 1 1

15 0 0 1

16 0 0 0

17 0 0 0

18 1 1 1

19 1 1 1

20 1 1 1

21 1 1 0

22 1 0 1

23 0 1 1

24 1 1 1

25 1 0 1

26 1 1 1

27 0 0 0

28 1 1 1

29 1 1 1

30 1 0 1

31 1 0 1

32 1 1 0

33 1 0 1

34 0 1 1

35 1 1 1

36 1 0 0

37 1 1 0

38 0 1 1

39 0 1 0

40 1 1 1

41 1 1 1

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 114: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

91

42 1 0 0

43 1 1 1

44 0 1 0

45 0 1 1

46 0 1 0

47 0 0 1

48 1 1 1

49 0 1 0

50 1 1 0

JUMLAH 30 34 32

5.1.2 Hasil Pengujian Sistem

Berdasarkan hasil pengujian sistem secara manual kepada 3 responden

dengan dokumen berjumlah 50, maka akan terdapat hasil sebagai berikut :

Responden 1 : 30 dokumen yang relevan

Responden 2 : 34 dokumen yang relevan

Responden 3 : 32 dokumen yang relevan

Kemudian akan dilakukan perhitungan nilai rata-rata untuk mendapatkan

nilai akurasi yang dihasilkan oleh sistem. Berikut adalah hasil perhitungan nilai

rata-rata, Gambar 5.1.

30 + 34 + 32 Rata-rata = x 100%

150 = 64%

Gambar 5.1 Hasil Perhitungan Rata-rata

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 115: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

92

Dari pengujian sistem yang telah dilakukan kepada 3 responden secara

manual dengan dokumen berjumlah 50. Maka terdapat nilai rata-rata yang

dihasilkan oleh sistem sebesar 64%. Pada penelitian ini nilai perhitungan rata-rata

tersebut akan menjadi acuan nilai akurasi yang dihasilkan sistem peringkasan teks

otomatis pada dokumen berbahasa Jawa menggunakan metode TF-IDF.

5.2 Pembahasan Pengujian Sistem

Berdasarkan pengujian sistem yang telah dilakukan kepada 3 responden

secara manual, terdapat beberapa penilaian dokumen yang berbeda. Berikut

pembahasannya :

DOKUMEN RESPONDEN 1 RESPONDEN 2 RESPONDEN 3

1 1 1 1

2 0 1 1

3 0 1 0

Pada dokumen 1, ketiga responden menilai bahwa dokumen tersebut

adalah relevan. Yang dimaksud relevan adalah ringkasan yang dihasilkan oleh

sistem sudah sesuai dengan kebutuhan pengguna.

Pada dokumen 2 dan dokumen 3, terdapat responden dengan penilaian

berbeda. Yang dimaksud tidak relevan meliputi banyak hal bisa dokumennya

yang tidak baik atau memang ringkasan yang dihasilkan sistem tidak sesuai

dengan kebutuhan pengguna. Hal ini tidak dapat diteliti lebih lanjut dikarenakan

tidak ada konsisten atau kesesuaian antar responden.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 116: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

93

DOKUMEN RESPONDEN 1 RESPONDEN 2 RESPONDEN 3

16 0 0 0

17 0 0 0

Pada dokumen 16 dan 17, ketiga responden menilai bahwa dokumen

tersebut tidak relevan. Karena adanya kesamaan dalam penilaian tersebut maka

ringkasan yang dihasilkan sistem tidak sesuai dengan kebutuhan pengguna.

Berikut pembahasannya :

Dokumen 16 :

<Djaka Lodhang No 29 Tahun XXXII 14 Desember 2002>

<Hal 20>

MODHEL SINAU MANDHIRI

Bocah ora Bosen, Prestasine Bisa Luwih Apik

Modhel sinau Mandhiri wektu saiki lagi dadi trend ing laladan Kabupaten

Banyumas. Modhel sinau Mandhiri nggugah semangate siswa SD supaya bisa

nyecep ngelmu kanthi cara sing nyenengake, ora mboseni kaya modhel sinau cara

lawas. Modhel sinau cara lawas guru ana kelas mulang nerangake bahan

wulangan muride supaya nggatekake. Angger ana sing ribut bakal disentak. Guru

terus ngethuprus kaya lagi pidhato. Bab iki njalari murid SD akeh sing bosen.

Nalika guru mulang malah nggambar nyoreti buku paket utawa nulis sakarepe

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 117: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

94

dhewe supaya bisa mbuwang rasa sing mboseni. Cara mulang modhel lawas

pancen wis ora trep menawa terus-terusan digunakake. Cara iki nyebabake murid

aras-arasen sinau. Luwih-luwih angger gurune sering aweh tugas nulis terus-

terusan. Bocah-bocah tambah bosen nampa wulangan.

Menawa tes asile kurang apik, akeh guru malah mojokake muride. "Bocah saiki

diwulangake wingi bae wis lali. Apamaneh wulangan sing wis lawas, pokoke

wes.... ewes..... bablas ora ana sing nyanthel. Wis diprentah sinau padha kesed,

dikon nyathet wegah, mbuh arep padha dadi apa muridku. Ana ngomah ndeleng

TV bae, ora mikir sinaune," ngono grenenge Guru-guru saiki sing ndelok tes

muride bijine elek.

Apa ya bener mangkono? Bisa uga bener. Sebab bocah kakehan nonton TV,

sinaune arang aja digadhang-gadhang bijine bagus. Bisa bae marga cara mulange

kleru. Bocah kurang diwenehi kalodhangan kanggo nyuntak kreasine. Bocah

dianggep ora perlu takon, sing penting lungguh anteng, ngrungokake, wis bakal

dadi cah pinter temenan. Iki sing dadi sebab akeh cah ngerti apalan nanging

prakteke bingung. Upamane teori nyangkok wit buah-buahan, ora nate

digambarake nganggo praktek nek dikon njelasake mesthi bingung. apamaneh

supaya praktek tambah olehe bingung.

Kanthi modhel sinau mandhiri bocah bakal seneng nampa wulangan.

Pengalamane Mohammad Durori (36) Guru SDN 2 Kecila Kec. Kemranjen Kab.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 118: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

95

Banyumas kena kanggo kaca benggala. Moh. Durori kasil mraktekake modhel

belajar mandhiri. Modhel iki kasil menang nalika presentasi lomba keberhasilan

Guru ing Jakarta taun 2001. Malah pihak Unicef (PBB) sing lagi mbantu

ningkatake mutu pendhidhikan ing Jawa Tengah nambah dana bantuwan sing

cukup kanggo ningkatake programe Moh. Durori. Mulane Moh. Durori tambah

semangate. Menu pagi tansah disiyapake supaya bocah-bocah padha mangkat

gasik. Nyatane tekan saiki bocah-bocah SDN 2 Kecila padha balapan mangkat

gasik-gasikan perlune arep njupuk tiket (karcis) mlebu kelas. Bubar njupuk tiket

nuli nggarap lembar kerja (menu pagi). Bocah sing mangkate dhisik dhewe bakal

aweh pitakon marang kancane nomer loro sadurunge mlebu kelas. Angger bisa

njaga ngganti nakoni nomer telu. Sing mangkat gasik nuli lungguh sebab

diganteni tugase dening nomer loro. Nek nomer loro gagal, ora bisa njawab

diprentah mundur mburine nomer sing keri. Mangkono sateruse saben esuk.

Wayahe mulih sing mangkat gasik mulihe paling dhisik. Kapan, jam pira muride

mangkat, guru kelase ngerti. Sebab saben bocah duwe jam pribadi sing dipajang

ana kelas. Saben njupuk tiket bocah mau ngatur wektu sarana muter jam cocog

karo wektu mlebu kelas. Akeh bocah sadurunge jam nem padha teka sekolahan

saperlu njupuk tiket lan tugas paling dhisik.

Kelas modhel sinau mandhiri kena diarani ora temata. Karyane siswa wujud

gambar, puisi, garapan, pating trempel ing ruwangan kelas. Olehe lungguh uga

bisa pindhah-pindhah sasenenge bocah nalika dhiskusi utawa nggarap tugas.

Tugas saka guru kelase modhele werna-werna. Ana gambar komik, ana TTS,

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 119: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

96

Piramida, lan dolanan ular tangga. Khusus etungan matematika murid sing cerdas

dadi dhokter. Pasiene cah sing ora mudheng nalika nampa wulangan. Kanthi

dhokter matematika cah sing kethether bisa ngimbangi kapinterane kanca-

kancane. Bukti wis dilakoni Moh. Durori. Sadurunge nemokake modhel iki nalika

Ebtanas bocahe bijine ambruk. Sing bijine rata-rata nem ora ana 10 persene.

Bareng nganggo modhel anyar bijine rata-rata apik tenan. 99 persen kasil

ngranggeh biji rata-rata pitu ing Ebtanas. Mulane SDN 2 Kecila sing lokasine ing

desa dadi kembang lambe. Prestasi mau lawase rong taun tetep ngetop. Mulane

Moh. Durori dianggep kasil nemokake modhel sinau sing bisa nyenengake siswa

SD. PBB sing duwe proyek MBS (Manajemen Berbasis Sekolah) mbantu dana

kanggo ningkatake mutu pendhidhikan ing SDN 2 Kecila.

"Angger guru kreatif, ora wedi kesel, senajan ibarate gaji ora cukup, babagan

prestasi ora angel olehe ngranggeh," kandhane Moh. Durori.

Ngendikane Moh. Durori, wis wektune guru-guru saiki padha nggolek rekadaya,

nyipta modhel anyar piye bisane muride pinter, seneng ana sekolahan, lan

tamatane mumpuni trep karo mutu lulusane.

Ndelok kelas Moh. Durori pancen nyleneh. Ana pohon ilmu. Pohon ilmu gawe

saka pang wit sing dicet nuli diwenehi canthelan. Gunane angger bocah sing

garapane entuk biji paling dhuwur kertase dipasang ing pang pucuk. Sing bijine

paling elek dicanthelake paling ngisor. Ana kothak ajaib. Isine cara mecahake

soal, ana jawabane. Bocah sing ora bisa njawab soal supaya nggolek jawaban sing

bener ing kothak ajaib sawise garapane dibiji. Bocah-bocah sing diwulang ing

kelas jan semangat temenan. Nanging guru kudu tansah nyiapake menu garapan

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 120: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

97

sing bisa gawe swasana sinaune bocah tansah grengseng, ora mboseni. Modhel

Sinau Mandhiri iki nyebabake Moh. Durori dihadhiyahi bebungah Rp 14 juta saka

Dinas Pendhidhikan. Ditambah hadhiyah liyane saka Unicef. Guru-guru kang

pengin mbuktekake bisa teka dhewe menyang SDN 2 Kecila Kec. Kemranjen,

Banyuumas. Arahe saka Yogyakarta nuju Purwokerto, mudhun Kantor Dinas

Pendhidhikan Kec. Kemranjen. Kabeh sopir bus umum wis apal. Sumangga.*

(Siswandi Dh/DL)

Hasil ringkasan dari sistem :

<Djaka Lodhang No 29 Tahun XXXII 14 Desember 2002>

<Hal 20>

MODHEL SINAU MANDHIRI

Bocah ora Bosen, Prestasine Bisa Luwih Apik

- Modhel sinau Mandhiri nggugah semangate siswa SD supaya bisa nyecep

ngelmu kanthi cara sing nyenengake, ora mboseni kaya modhel sinau cara lawas.

- Modhel sinau cara lawas guru ana kelas mulang nerangake bahan wulangan

muride supaya nggatekake.

- Nalika guru mulang malah nggambar nyoreti buku paket utawa nulis sakarepe

dhewe supaya bisa mbuwang rasa sing mboseni.

- Luwih-luwih angger gurune sering aweh tugas nulis terus-terusan.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 121: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

98

- Menawa tes asile kurang apik, akeh guru malah mojokake muride.

- Wis diprentah sinau padha kesed, dikon nyathet wegah, mbuh arep padha dadi

apa muridku.

- Ana ngomah ndeleng TV bae, ora mikir sinaune," ngono grenenge Guru-guru

saiki sing ndelok tes muride bijine elek.

- Sebab bocah kakehan nonton TV, sinaune arang aja digadhang-gadhang bijine

bagus.

- Bocah dianggep ora perlu takon, sing penting lungguh anteng, ngrungokake, wis

bakal dadi cah pinter temenan.

- Upamane teori nyangkok wit buah-buahan, ora nate digambarake nganggo

praktek nek dikon njelasake mesthi bingung.

- Pengalamane Mohammad Durori (36) Guru SDN 2 Kecila Kec.

- Modhel iki kasil menang nalika presentasi lomba keberhasilan Guru ing Jakarta

taun 2001.

- Malah pihak Unicef (PBB) sing lagi mbantu ningkatake mutu

pendhidhikan ing Jawa Tengah nambah dana bantuwan sing cukup kanggo

ningkatake programe Moh.

- Nyatane tekan saiki bocah-bocah SDN 2 Kecila padha balapan mangkat gasik-

gasikan perlune arep njupuk tiket (karcis) mlebu kelas.

- Bubar njupuk tiket nuli nggarap lembar kerja (menu pagi).

- Bocah sing mangkate dhisik dhewe bakal aweh pitakon marang kancane nomer

loro sadurunge mlebu kelas.

- Angger bisa njaga ngganti nakoni nomer telu.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 122: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

99

- Sing mangkat gasik nuli lungguh sebab diganteni tugase dening nomer loro.

- Nek nomer loro gagal, ora bisa njawab diprentah mundur mburine nomer sing

keri.

- Kapan, jam pira muride mangkat, guru kelase ngerti.

- Saben njupuk tiket bocah mau ngatur wektu sarana muter jam cocog karo wektu

mlebu kelas.

- Akeh bocah sadurunge jam nem padha teka sekolahan saperlu njupuk tiket lan

tugas paling dhisik.

- Kelas modhel sinau mandhiri kena diarani ora temata.

- Karyane siswa wujud gambar, puisi, garapan, pating trempel ing ruwangan

kelas.

- Olehe lungguh uga bisa pindhah-pindhah sasenenge bocah nalika dhiskusi utawa

nggarap tugas.

- Ana gambar komik, ana TTS, Piramida, lan dolanan ular tangga.

- Kanthi dhokter matematika cah sing kethether bisa ngimbangi kapinterane

kanca-kancane.

- Bareng nganggo modhel anyar bijine rata-rata apik tenan.

- 99 persen kasil ngranggeh biji rata-rata pitu ing Ebtanas.

- Mulane SDN 2 Kecila sing lokasine ing desa dadi kembang lambe.

- Durori dianggep kasil nemokake modhel sinau sing bisa nyenengake siswa

SD.

- PBB sing duwe proyek MBS (Manajemen Berbasis Sekolah) mbantu dana

kanggo ningkatake mutu pendhidhikan ing SDN 2 Kecila.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 123: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

100

- "Angger guru kreatif, ora wedi kesel, senajan ibarate gaji ora cukup,

babagan prestasi ora angel olehe ngranggeh," kandhane Moh.

- Durori, wis wektune guru-guru saiki padha nggolek rekadaya, nyipta

modhel anyar piye bisane muride pinter, seneng ana sekolahan, lan tamatane

mumpuni trep karo mutu lulusane.

- Pohon ilmu gawe saka pang wit sing dicet nuli diwenehi canthelan.

- Gunane angger bocah sing garapane entuk biji paling dhuwur kertase dipasang

ing pang pucuk.

- Bocah sing ora bisa njawab soal supaya nggolek jawaban sing bener ing kothak

ajaib sawise garapane dibiji.

- Nanging guru kudu tansah nyiapake menu garapan sing bisa gawe swasana

sinaune bocah tansah grengseng, ora mboseni.

- Durori dihadhiyahi bebungah Rp 14 juta saka Dinas Pendhidhikan.

- Arahe saka Yogyakarta nuju Purwokerto, mudhun Kantor Dinas

Pendhidhikan Kec.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 124: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

101

Berdasarkan ringkasan yang dihasilkan sistem, ada beberapa kalimat yang

tidak sesuai dengan isi dokumen. Misalnya dalam kalimat pertama sedang

membahas 1 topik kemudian pada kalimat kedua membahas topik lain, jadi

kalimat-kalimat tersebut tidak ada kesesuaian. Kemudian untuk ringkasan yang

bercetak tebal, ada beberapa kata yang berisi singkatan. Misalnya kata

“Kecamatan” disingkat “Kec” dan kata “Mohamad” disingkat “Moh”. Karena

perhitungan bobot kalimat dalam penelitian ini menggunakan karakter titik “.”

untuk memisah antar kalimat. Singkatan-singkatan kata tersebut juga

menyebabkan ringkasan menjadi tidak relevan.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 125: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

102

BAB VI

KESIMPULAN DAN SARAN

6.1 Kesimpulan

Berdasarkan penelitian yang telah dilakukan dapat disimpulkan bahwa :

1. Penerapan metode TF-IDF pada peringkasan teks otomatis dengan

dokumen berbahasa Jawa terdapat nilai rata-rata akurasi yang

dihasilkan oleh sistem sebesar 64%.

2. Karena perhitungan bobot kalimat dalam penelitian ini menggunakan

karakter titik “.” untuk memisah antar kalimat. Maka penulisan kata

dalam dokumen yang berisi singkatan-singkatan, seperti alamat dan

nama gelar sebaiknya dituliskan lengkap. Hal ini menjadi penting

karena penulisan kata yang baik akan mempengaruhi relevan atau

tidaknya ringkasan yang dihasilkan oleh sistem.

6.2 Saran

Berdasarkan hasil pengujian yang sudah dilakukan dapat dilihat bahwa

sistem masih belum sempurna. Saran dari penulis untuk penelitian selanjutnya :

1. Sistem perlu penambahan daftar kata umum (stopword) berbahasa Jawa

yang lengkap.

2. Sistem mampu menangani dokumen yang berisi singkatan-singkatan

alamat dan nama gelar.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 126: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

103

DAFTAR PUSTAKA

Grossman D, Ophir F. Information Retrieval : Algorithm and Heuristics. Kuwer

Academic Publisher. (1998).

Hovy, E. H. 2005. Automated Text Summarization. In.R. Mitkov (ed), The Oxford

Handbook of Computational Linguistics, chapter 32, page 583-598. Oxford

University Press.

Jazek K, Steinberger J. 2008. Automatic text summarization (The state of the art

2007 and new challenges). Znalosti 2008, page 1-12.

Kruse, Robert L, Data Stucture and Program Design Third Edition. Prentice Hall

International, Inc, London (1994).

Mani, I., House, D., Klein, G., et al. 1999. The TIPSTER SUMMAC Text

Summarization Evaluation. Proceedings of EACL.

Manning, Christopher D., Hinrich Schutze, 1999. Foundations of statistical

natural language processing. The MIT Press.

Manning, Christopher, D., Raghavan, Prabhakar., Schutze, Hinrich. (2009). An

Introduction to Information Retrieval. England : Cambridge University

Press.

Mulyana I, Ramadona S, Herfina. 2012. Penerapan Terms Frequency-Inverse

Document Frequency Pada Sistem Peringkasan Teks Otomatis Dokumen

Tunggal Berbahasa Indonesia. Jurnal.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 127: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

104

Mustaqhfitri M, Abidin Z, Kusumawati R. 2009. Peringkasan Teks Otomatis

Berita Berbahasa Indonesia Menggunakan Metode Maximum Marginal

Relevance. Jurnal MATICS (Vol. 4 No. 4; 09-2011)

Orasan, C., Pekar, V. and Hasler, L. 2004. A comparison of summarisation

methods based on term specificity estimation. University of

WolverHampton.

Rose, T. G., M. Stevenson, and M. Whitehead. 2002. The Reuters corpus volume

1 – from yesterday’s news to tommorow’s language resources. In

Proceedings of LREC2004. Las Palmas de Gran Canaria, Spain.

Savoy J. “A Learning Scheme for Information Retrieval in Hypertext”.

Information Processing & Management. (1993)

Sommerville, Ian. Software Engineering, 9th Edition. Pearson Education. United

States of America. (2011).

Wijono, Sri Hartati, et al. 2011. Studi Pengaruh Stemming untuk Pemerolehan

Informasi dalam Bahasa Jawa. Laporan Penelitian. Hibah Pekerti DIKTI.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 128: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk filei PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERBAHASA JAWA MENGGUNAKAN METODE TF-IDF SKRIPSI Diajukan Untuk Memenuhi Salah Satu

105

LAMPIRAN

KUESIONER

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI