deteksi conversation pada media sosial twitter filepercobaan pengambilan dengan dua forum online dan...

16
DETEKSI CONVERSATION PADA MEDIA SOSIAL TWITTER LaporanTugasAkhir SebagaiPersyaratanGunaMeraihGelarSarjana Strata 1 TeknikInformatikaUniversitasMuhammadiyah Malang Disusun Oleh: ISRAN RIVALTO 201010370311215 JURUSAN TEKNIK INFORMATIKA FAKULTAS TEKNIK UNIVERSITAS MUHAMMADIYAH MALANG 2015

Upload: trankhanh

Post on 18-Apr-2019

217 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: DETEKSI CONVERSATION PADA MEDIA SOSIAL TWITTER filepercobaan pengambilan dengan dua forum online dan satu arsip email. Hasil kami menunjukkan bahwa menggunakan struktur thread yang

DETEKSI CONVERSATION PADA MEDIA SOSIAL

TWITTER

LaporanTugasAkhir

SebagaiPersyaratanGunaMeraihGelarSarjana Strata 1

TeknikInformatikaUniversitasMuhammadiyah Malang

Disusun Oleh:

ISRAN RIVALTO

201010370311215

JURUSAN TEKNIK INFORMATIKA

FAKULTAS TEKNIK

UNIVERSITAS MUHAMMADIYAH MALANG

2015

Page 2: DETEKSI CONVERSATION PADA MEDIA SOSIAL TWITTER filepercobaan pengambilan dengan dua forum online dan satu arsip email. Hasil kami menunjukkan bahwa menggunakan struktur thread yang
Page 3: DETEKSI CONVERSATION PADA MEDIA SOSIAL TWITTER filepercobaan pengambilan dengan dua forum online dan satu arsip email. Hasil kami menunjukkan bahwa menggunakan struktur thread yang
Page 4: DETEKSI CONVERSATION PADA MEDIA SOSIAL TWITTER filepercobaan pengambilan dengan dua forum online dan satu arsip email. Hasil kami menunjukkan bahwa menggunakan struktur thread yang
Page 5: DETEKSI CONVERSATION PADA MEDIA SOSIAL TWITTER filepercobaan pengambilan dengan dua forum online dan satu arsip email. Hasil kami menunjukkan bahwa menggunakan struktur thread yang

ABSTRAK

Komunitas online merupakan sumber informasi berharga di mana pengetahuan

dikumpulkan oleh interaksi antara orang-orang. Layanan pencarian yang di

sediakan oleh komunitas online situs seperti forum sharing, bagaimanapun, sangat

lemah. Untuk mengatasi hal ini, kita menyelidiki teknik pengambilan yang

mengeksploitas istruktur benang hirarkis di masyarakat situs. Karena struktur ini

kadang-kadang tidak eksplisit atau akurat dijelaskan, kami memperkenalkan

teknik struktur penemuan yang menggunakan berbagai fitur untuk model

hubungan antara posting. Kami kemudian menggunakan struktur thread dalam

percobaan pengambilan dengan dua forum online dan satu arsip email. Hasil kami

menunjukkan bahwa menggunakan struktur thread yang telah secara akurat

dijelaskan dapat menyebabkan peningkatan yang signifikan dalam pengambilan

kinerja dibandingkan dengan baseline yang kuat.

Kata Kunci : Komunitas Online, cari forum, struktur thread

Page 6: DETEKSI CONVERSATION PADA MEDIA SOSIAL TWITTER filepercobaan pengambilan dengan dua forum online dan satu arsip email. Hasil kami menunjukkan bahwa menggunakan struktur thread yang

ABSTRACT

Online communities are valuable information sources where knowledge is

accumulated by interactions between people. Search services provided by online

community sites such as forums are often, however, quite poor. To address this,

we investigate retrieval techniques that exploit the hierarchical thread structures

in community sites. Since these structures are sometimes not explicit or accurately

annotated, we introduce structure discovery techniques that use a variety of

features to model relations between posts. We then make use of thread structures

in retrieval experiments with two online forums and one email archive. Our

results show that using thread structures that have been accurately annotated can

lead to significant improvements in retrieval performance compared to strong

baselines.

Keywords : Online Community, forum search, thread structure

Page 7: DETEKSI CONVERSATION PADA MEDIA SOSIAL TWITTER filepercobaan pengambilan dengan dua forum online dan satu arsip email. Hasil kami menunjukkan bahwa menggunakan struktur thread yang

KATA PENGANTAR

Dengan memanjatkan puji syukur kehadirat Allah SWT. Atas segala

limpahan rahmat dan hidayah-NYA sehingga saya dapat menyelesaikan Tugas

Akhir yang berjudul :

“DETEKSI CONVERSATION PADA MEDIA SOSIAL TWITTER”

Di dalam tulisan ini disajikan pokok-pokok bahasan yang meliputi :

1. Perancangan dan implementsi pembuatan sistem pendeteksian conversation

dengan metode cosine similairy sebagai fitur intrinsik serta fitur ekstrinsik.

2. Melakukan pengujian dengan melakukan proses deteksi dokumen

berdasarkan tingkat kemiripan dengan querydengan menggabungkan nilai

dari fitur intrinsik dan ekstrinsik.

3. Membandingkan hasil pendeteksian conversation dengan nilai persentase

fitur intrinsik dan ekstrinsik yang berbeda-beda dengan tujuan untuk ditarik

sebuah kesimpulan dari keseluruhan kegiatan.

Saya menyadari sepenuhnya bahwa dalam penulisan Tugas Akhir ini

masih banyak kekurangan dan keterbatasan. Oleh karena itu saya mengharapkan

saran yang membangun agar tulisan ini bermanfaat bagi perkembangan ilmu

pengetahuan kedepan.

Malang, 16 Juli 2015

Penulis

Page 8: DETEKSI CONVERSATION PADA MEDIA SOSIAL TWITTER filepercobaan pengambilan dengan dua forum online dan satu arsip email. Hasil kami menunjukkan bahwa menggunakan struktur thread yang

DAFTAR ISI

LEMBAR PERSETUJUAN................................... Error! Bookmark not defined.

LEMBAR PENGESAHAAN ................................................................................. 1

LEMBAR PERNYATAAN ................................... Error! Bookmark not defined.

ABSTRAK .............................................................................................................. 3

ABSTRACT .............................................................................................................. 5

KATA PENGANTAR ............................................................................................ 6

DAFTAR ISI ........................................................................................................... 7

LEMBAR PERSEMBAHAN ............................................................................... 10

DAFTAR GAMBAR ............................................................................................ 12

DAFTAR TABEL ................................................................................................. 13

BAB I PENDAHULUAN ...................................... Error! Bookmark not defined.

1.1 Latar Belakang Masalah .......................... Error! Bookmark not defined.

1.2 Rumusan Masalah ................................... Error! Bookmark not defined.

1.3 Batasan Masalah ...................................... Error! Bookmark not defined.

1.4 Tujuan Penelitian ..................................... Error! Bookmark not defined.

1.5 Metodologi .............................................. Error! Bookmark not defined.

1.5.1 Studi Pustaka .................................... Error! Bookmark not defined.

1.5.2 Rancangan Desain Sistem ................ Error! Bookmark not defined.

1.5.3 Implementasi .................................... Error! Bookmark not defined.

1.5.4 Ujicoba ............................................. Error! Bookmark not defined.

1.5.5 Penyusunan Laporan ........................ Error! Bookmark not defined.

1.6 Sistematika Penulisan .............................. Error! Bookmark not defined.

BAB II LANDASAN TEORI ................................ Error! Bookmark not defined.

2.1 Pengertian Conversation .......................... Error! Bookmark not defined.

2.2 Komunitas ............................................... Error! Bookmark not defined.

2.2.1 Definisi Komunitas .......................... Error! Bookmark not defined.

2.2.2 Komunikasi Virtual .......................... Error! Bookmark not defined.

2.2.3 Jenis jenis komunitas online............. Error! Bookmark not defined.

2.2.4 Bentuk-bentuk komunitas online di internet .. Error! Bookmark not

defined.

Page 9: DETEKSI CONVERSATION PADA MEDIA SOSIAL TWITTER filepercobaan pengambilan dengan dua forum online dan satu arsip email. Hasil kami menunjukkan bahwa menggunakan struktur thread yang

2.3 Struktur Thread pada Komunitas online . Error! Bookmark not defined.

2.3.1 Konteks pada struktur thread ........... Error! Bookmark not defined.

2.3.2 Penemuan struktur Thread ............... Error! Bookmark not defined.

BAB III ANALISA DAN PERANCANGAN ....... Error! Bookmark not defined.

3.1 Perancangan Alur Sistem ........................ Error! Bookmark not defined.

3.1.1 Proses similarity ............................... Error! Bookmark not defined.

3.1.2 Proses Quote .................................... Error! Bookmark not defined.

3.1.3 Proses AuthorReference ................... Error! Bookmark not defined.

3.1.4 Proses Same Author ......................... Error! Bookmark not defined.

3.1.5 Proses Lokasi Waktu ........................ Error! Bookmark not defined.

3.2 Metodologi .............................................. Error! Bookmark not defined.

3.2.1 Fitur Pendeteksian Conversation ..... Error! Bookmark not defined.

3.2.2 Gruping Fitur .................................... Error! Bookmark not defined.

3.2.3 Restrukturisasi ke Bentuk tree ......... Error! Bookmark not defined.

3.3 Desain Interface ....................................... Error! Bookmark not defined.

3.3.1 Tampilan form Utama ...................... Error! Bookmark not defined.

3.3.2 Tampilan form Lihat Percakapan ..... Error! Bookmark not defined.

BAB IV IMPLEMENTASI DAN PENGUJIAN ... Error! Bookmark not defined.

4.1 Kebutuhan Sistem .................................... Error! Bookmark not defined.

4.2 Implementasi Database ............................ Error! Bookmark not defined.

4.2.1 Tabel Query ...................................... Error! Bookmark not defined.

4.2.2 Tabel Dokumen ............................... Error! Bookmark not defined.

4.2.3 Tabel Intrinsik .................................. Error! Bookmark not defined.

4.2.4 Tabel Ekstrinsik ............................... Error! Bookmark not defined.

4.2.5 Tabel Grouping ................................ Error! Bookmark not defined.

4.3 Implementasi Sistem ............................... Error! Bookmark not defined.

4.3.1 Menu Twitter Conversation ............. Error! Bookmark not defined.

4.3.2 Menu Proses ..................................... Error! Bookmark not defined.

4.3.3 Menu Lihat Hasil.............................. Error! Bookmark not defined.

4.4 Metode Deteksi Conversation ................. Error! Bookmark not defined.

4.4.1 Implementasi Fitur Intrinsik ............. Error! Bookmark not defined.

4.4.2 Implementasi Fitur Ekstrinsik .......... Error! Bookmark not defined.

Page 10: DETEKSI CONVERSATION PADA MEDIA SOSIAL TWITTER filepercobaan pengambilan dengan dua forum online dan satu arsip email. Hasil kami menunjukkan bahwa menggunakan struktur thread yang

4.4.3 Grouping .......................................... Error! Bookmark not defined.

4.5 Pengujian Sistem ..................................... Error! Bookmark not defined.

4.5.1 Pengujian Fungsionalitas ................. Error! Bookmark not defined.

4.5.2 Pengujian Sistem .............................. Error! Bookmark not defined.

BAB V KESIMPULAN DAN SARAN ................. Error! Bookmark not defined.

5.1 Kesimpulan .............................................. Error! Bookmark not defined.

5.2 Saran ........................................................ Error! Bookmark not defined.

Daftar Pustaka ........................................................ Error! Bookmark not defined.

Page 11: DETEKSI CONVERSATION PADA MEDIA SOSIAL TWITTER filepercobaan pengambilan dengan dua forum online dan satu arsip email. Hasil kami menunjukkan bahwa menggunakan struktur thread yang

LEMBAR PERSEMBAHAN

Alhamdulillahirabilalamin, puji syukur kehadirat Allah SWT atas rahmat

dan karunia-Nya sehingga pada saat kata ini tertulis, saya telah dapat

menyelesaikan Tugas Akhir saya yang berjudul “Deteksi Conversation pada

media sosial Twitter”.

Dengan penuh rasa sadar, saya menyatakan bahwa tugas akhir ini tidak

dapat benar benar terselesaikan tanpa adanya bimbingan, dorongan, arahan dari

kedua dosen pembimbing, teman, serta orang-orang terdekat yang selalu

memberikat motivasi serta asupan semangat yang cukup. Maka dari itu, selaku

penulis saya menyampaikan ucapan terima kasih yang sebesar-besarnya kepada :

1. Pak Yufis Azhar M.Kom dan Pak Yuda Munarko, S.Kom, M.Sc selaku dosen

pembimbing tugas akhir, yang telah bersedia menjadi pembimbing dari mulai

pengerjaan sampai penyelesaian tugas akhir saya.

2. Ibu Nur Alif Mardiyah, Ir, M.T selaku dosen wali, yang telah menjadi orang

tua saya di Universitas Muhammadiyah Malang, terima kasih telah

mendengar keluhan saya selama 10 semester ini.

3. Bapak/Ibu Dosen Fakultas Teknik Informatika.

4. Ny. Mariani Lena yang telah melahirkan saya ke dunia, yang selalu sabar dan

mendoakan anaknya, yang selalu mengingatkan jangan nakal di kampung

orang, jangan banyak jalan, jangan pulang malam-malam.

5. Alm Bpk. Ipda Sukardi yang telah menjadi sosok pahlawan penjaga selama

saya kecil sampai beranjak dewasa, terima kasih sudah mengajarkan banyak

hal, mulai dari yang kecil sampai yang besar. Maaf, anakmu ini kurang

disiplin.

6. Om Agus dan Tante Rattin yang sudah berbaik hati menampung saya

dirumahnya selama masa perkuliahan.

7. Anak-anak “Kontrakan Tirto, Embong Anyar dan Kenikir”, Ipit, Apis, Eng,

Repi, Tiara, Oon, Mahmud, Kiki, yang sudah menjadi sahabat dan saudara

baru di perantauan.

Page 12: DETEKSI CONVERSATION PADA MEDIA SOSIAL TWITTER filepercobaan pengambilan dengan dua forum online dan satu arsip email. Hasil kami menunjukkan bahwa menggunakan struktur thread yang

8. Siti Nurhidayah a.k.a NONA, gadis manis, imut, unyu-unyu yang bikin gagal

Move On. Lopeee you pulllll.

9. Member of UNITED INDONESIA MALANG.

10. Tim Sirkus UIM, Timnas Remi UIM, Pengisi waktu kalo otak lagi buntu.

11. Anak-anak Kelas E Informatika 2010. Kalian istimewa. Buat seseorang

anggota kelas ini, terima kasih dulu sudah mati-matian membantu dan

meyakinkan saya agar tetap bertahan di Informatika.

12. Teman teman seperjuangan yang sudah turut serta membantu menyelesaikan

tugas akhir ini.

13. Dan semua pihak yang telah membantu dalam terselesaikannya tugas akhir

ini.

Page 13: DETEKSI CONVERSATION PADA MEDIA SOSIAL TWITTER filepercobaan pengambilan dengan dua forum online dan satu arsip email. Hasil kami menunjukkan bahwa menggunakan struktur thread yang

DAFTAR GAMBAR

Gambar 2.1 : Contoh struktur thread....................................................................... 8

Gambar 2.2 : Konteks struktur thread ..................................................................... 8

Gambar 3.1 : Flowchart deteksi conversation....................................................... 12

Gambar 3.2 : Proses similarity .............................................................................. 13

Gambar 3.3 : Proses Quote.................................................................................... 14

Gambar 3.4 : Proses Author Reference ................................................................. 15

Gambar 3.5 : Proses Same Author ..................... Error! Bookmark not defined.16

Gambar 3.6 : Proses Lokasi Waktu ....................................................................... 17

Gambar 3.7 : Form Utama .................................................................................... 28

Gambar 3.8 : Form Lihat Percakapan ................................................................... 28

Gambar 4.1 : Tabel Query ..................................................................................... 29

Gambar 4.2 : Tabel Dokumen ............................................................................... 30

Gambar 4.3 : Tabel Instrintsik .............................................................................. 30

Gambar 4.4 : Tabel Ekstrinsik .............................................................................. 30

Gambar 4.5 : Tabel Grouping ............................................................................... 31

Gambar 4.6 : Menu Twitter Conversation ............................................................ 31

Gambar 4.7 : Menu Proses .................................................................................... 32

Gambar 4.8 : Menu Lihat hasil ............................................................................. 32

Gambar 4.9 :Code program similarity .................................................................. 33

Gambar 4.10 : Code program fitur ekstrinsik ....................................................... 34

Gambar 4.11 : Code program grouping ................................................................ 34

Page 14: DETEKSI CONVERSATION PADA MEDIA SOSIAL TWITTER filepercobaan pengambilan dengan dua forum online dan satu arsip email. Hasil kami menunjukkan bahwa menggunakan struktur thread yang

DAFTAR TABEL

Tabel 2.1 : Tipe-tipe dari komunitas online ............................................................ 6

Tabel 3.1 : Tabel Data Tweet dan Tweet Reply ..................................................... 18

Tabel 3.2 : Tabel Dokumen ssetelah di Tokenisasi ............................................... 19

Tabel 3.3 : Perhitungan Bobot .............................................................................. 20

Tabel 3.4 : Perhitungan Nilai Wdt ......................................................................... 21

Tabel 3.5 : Perhitungan Nilai kemiripan Vector ................................................... 22

Tabel 3.6 : Pehitungan Panjang Vektor................................................................. 23

Tabel 3.7 : Hasil Perhitungan ................................................................................ 25

Tabel 3.8 : Pengurutan Hasil Perhitungan............................................................. 25

Tabel 3.9 : Pembobotan Ekstrinsik Fitur............................................................... 26

Tabel 3.10 : Hasil penghitungan ekstrinsik Fitur .................................................. 27

Tabel 3.11 : Hasil Grouping .................................................................................. 27

Tabel 4.1 : Hasil Perhitungan Similarity ............................................................... 33

Tabel 4.2 : Pengujian Tombol Menu .................................................................... 35

Tabel 4.3 : Pengujian Q1 100% Eks ..................................................................... 36

Tabel 4.4 : Pengujian Q1 75% Eks + 25% Int ...................................................... 36

Tabel 4.5 : Pengujian Q1 50% Eks + 50% Int ...................................................... 36

Tabel 4.6 : Pengujian Q1 25% Eks + 75% Int ...................................................... 37

Tabel 4.7 : Pengujian Q1 75% Eks + 25% Int ...................................................... 37

Tabel 4.8 : Pengujian Q2 100% Eks ..................................................................... 38

Tabel 4.9 Pengujian Q2 75% Eks + 25% Int ........................................................ 38

Tabel 4.10 Pengujian Q2 50% Eks + 50% Int ...................................................... 38

Tabel 4.11 Pengujian Q2 25% Eks + 75% Int ...................................................... 39

Tabel 4.12 Pengujian Q2 100% Int ....................................................................... 39

Tabel 4.13 Pengujian Q3 100% Eks ..................................................................... 40

Tabel 4.14 Pengujian Q3 75% Eks + 25% Int ...................................................... 40

Tabel 4.15 Pengujian Q3 50% Eks + 25% Int ...................................................... 40

Tabel 4.16 Pengujian Q3 50% Eks + 50% Int ...................................................... 40

Tabel 4.17 Pengujian Q3 100% Int ....................................................................... 41

Tabel 4.18 Pengujian Q4 100% Eks ..................................................................... 41

Page 15: DETEKSI CONVERSATION PADA MEDIA SOSIAL TWITTER filepercobaan pengambilan dengan dua forum online dan satu arsip email. Hasil kami menunjukkan bahwa menggunakan struktur thread yang

Tabel 4.19 Pengujian Q4 75% Eks + 25% Int ...................................................... 41

Tabel 4.20 Pengujian Q4 50% Eks + 50% Int ...................................................... 42

Tabel 4.21 Pengujian Q4 25% Eks + 75% Int ...................................................... 42

Tabel 4.22 Pengujian Q4 100Int ........................................................................... 43

Tabel 4.23 Pengujian Q5 100% Eks ..................................................................... 43

Tabel 4.24 Pengujian Q5 75% Eks + 25% Int ...................................................... 43

Tabel 4.25 Pengujian Q5 50% Eks + 50% Int ...................................................... 44

Tabel 4.26 Pengujian Q5 25% Eks + 75% Int ...................................................... 44

Tabel 4.27 Pengujian Q5 100% Int ....................................................................... 44

Tabel 4.28 Pengujian Sistem ................................................................................. 45

Tabel 4.29 Pengujian threshold ............................................................................. 46

Page 16: DETEKSI CONVERSATION PADA MEDIA SOSIAL TWITTER filepercobaan pengambilan dengan dua forum online dan satu arsip email. Hasil kami menunjukkan bahwa menggunakan struktur thread yang

1

Daftar Pustaka

[1] Jangwon Seo W.Bruce Croft David A.SmithOnline, Community Search

Using Conversational Structure. University of Massachusetts, Amherst

[2] http://www.romelteamedia.com/2014/04/media-sosial-pengertian-

karakteristik.html (diakses 29 juni 2014)

[3] Ainul Yaqin, “Deteksi Dialog pada Forum Komunitas”, University of

Muhammadiyah Malang, Malang

[4] Walter V.Hobbs “RDB”: a Relation Database Management System”

(Online) http://compbio.coe.ucsc.edu/rdb/ (diakses 6 Februari 2015)

[5] Rustono, 1999, Pokok Pokok Pragmatik. Semarang: CV. IKIP Semarang

Press

[6] Jangwon Seo W.Bruce Croft David A.SmithOnline, Online Community

Search Using Thread Structure. University of Massachusetts, Amherst

[7] https://komputasi.files.wordpress.com/2011/01/cosine-similarity-antar-

dokumen-sebuah-contoh.pdf (diakses 24 November 2014)