klasifikasi surat masuk berdasarkan program studi fakultas...
TRANSCRIPT
Klasifikasi Surat Masuk Berdasarkan Program Studi
Fakultas Kedokteran Universitas Lambung Mangkurat
Banjarmasin Menggunakan Metode Naive Bayes Text Classifier
COVERGAS AKHIR
TUGAS AKHIR
Diajukan Untuk Memenuhi
Persyaratan Guna Meraih Gelar Sarjana Strata 1
Teknik Informatika Universitas Muhammadiyah Malang
Disusun Oleh:
Auni Aulia Muftiany
NIM : 201610370312231
Rekayasa Perangkat Lunak
JURUSAN TEKNIK INFORMATIKA
FAKULTAS TEKNIK
UNIVERSITAS MUHAMMADIYAH MALANG
2018
iv
v
iii
viii
KATA PENGANTAR
Dengan memanjatkan puji dan syukur kehadirat Allah SWT yang telah
melimpahkan rahmat dan hidayah-Nya, tak lupa shalawat dan salam kepada
junjungan Nabi Besar Muhammad SAW, sehingga skripsi yang berjudul
“Klasifikasi Surat Masuk Berdasarkan Program Studi Fakultas Kedokteran
Universitas Lambung Mangkurat Banjarmasin Menggunakan Metode Naive Bayes
Text Classifier ” akhirnya dapat terselesaikan.
Skripsi ini ditulis dalam rangka memenuhi syarat untuk memperoleh gelar
sarjana komputer bagi mahasiswa program S1 pada studi Teknik Informatika
Universitas Muhammadiyah Malang. Penulis menyadari bahwa tugas akhir ini
masih banyak terdapat kekurangan, oleh sebab itu penulis mengharapkan kritik dan
saran yang bersifat membangun dari semua pihak demi kesempurnaan tugas akhir
ini.
Penyelesaian penulisan skripsi ini tidak lepas dari dukungan dan bantuan
berbagai pihak, baik secara langsung maupun tidak langsung. Oleh karena itu, pada
kesempatan ini penulis dengan segala kerendahan hati mengucapkan terima kasih
dan penghargaan yang sebesar-besarnya kepada:
1. Orang Tua saya, Bapak Drs. M. Yusuf, M.Pd dan Ibu Rohana Nurhayati, S.Pd
atas segala doa, semangat, dukungan, bimbingan dan nasehat yang membuat
saya selalu bersemangat dalam penulisan skripsi ini.
2. Suami saya Muhamad Andri Wijaya, Ibu Bapak Mertua Saya, Anak yang
sedang dalam kandungan saya dan Seluruh keluarga saya yang selalu
mengingatkan, mendoakan dan memberikan semangat untuk menyelesaikan
skripsi ini.
3. Dosen pembimbing saya, Ibu Gita Indah M., ST, M.Kom dan Bapak Yuda
Munarko, S.Kom, M.Sc yang hampir disetiap harinya saya temui sudah
memberikan waktunya untuk membimbing dan memberi masukan terkait
skripsi saya.
ix
4. Seluruh Dosen dan seluruh civitas akademika Jurusan Teknik Informatika yang
telah banyak memberi bantuan dan dukungan selama penulis menempuh studi
di Universitas Muhammadiyah Malang.
5. Sahabat saya Shanaz Onecha Z. S.Kom yang sudah saya anggap sebagai
saudara saya sendiri dan adik-adik saya temen seperjuangan Alih Jenjang D3
Politeknik Negeri Banjarmasin Vinna Utami Putri, Izmi Adistia, Risdalita,
Novinta, Ghina Arih yang selalu memberikan semangatnya.
6. Sahabat saya yang selalu mendoakan saya dimanapun mereka berada Adelia
Damayanti dan Husnul Khatimah. Terimakasih banyak atas dukungan dan doa
kalian semua.
7. Teman-Teman seperjuangan dari D3 POLIBAN, terimakasih banyak atas
doanya, see you on top guys.
8. Semua pihak yang tidak dapat disebutkan namanya satu per satu yang telah
memberikan bantuan kepada penulis dalam penyusanan skripsi ini.
Akhir kata, penulis berharap semoga skripsi ini dapat memberikan informasi
yang bermanfaat bagi siapa saja yang memerlukan skripsi ini.
Malang, 14 Juli 2018
Penulis
x
DAFTAR ISI
COVER .................................................................................................. ....... i
HALAMAN JUDUL .............................................................................. ....... ii
LEMBAR PERSETUJUAN .................................................................. ....... iii
LEMBAR PENGESAHAN ................................................................... ....... iv
LEMBAR PERNYATAAN ................................................................... ....... v
ABSTRAK ............................................................................................. ....... vi
ABSTRACT ........................................................................................... ....... vii
KATA PENGANTAR ........................................................................... ....... viii
DAFTAR ISI .......................................................................................... ....... x
DAFTAR GAMBAR ............................................................................. ....... xiii
DAFTAR TABEL .................................................................................. ....... xiv
DAFTAR LAMPIRAN .......................................................................... ....... xvii
BAB I PENDAHULUAN .............................................................................. 1
1.1. Latar Belakang ........................................................................................ 1
1.2. Rumusan Masalah ................................................................................... 4
1.3. Batasan Masalah ..................................................................................... 4
1.4. Tujuan .................................................................................................... 5
1.5. Metodologi Penelitian ............................................................................. 5
1.6. Sistematika Penulisan .............................................................................. 7
BAB II LANDASAN TEORI DAN TINJAUAN PUSTAKA ...................... 9
2.1. Email ...................................................................................................... 9
2.1.1. Pentingnya Pengelolaan Email ...................................................11
2.2. Naive Bayes .............................................................................................11
xi
2.3. Text Mining .............................................................................................14
2.3.1. Preprocessing Data .....................................................................15
2.3.2. Confusion Matrix ........................................................................18
2.4. Tinjauan Pustaka ......................................................................................20
BAB III ANALISA DAN PERANCANGAN SISTEM ...............................22
3.1. Metode Penelitian .....................................................................................22
3.1.1. Identifikasi Masalah ..................................................................22
3.1.2. Pengumpulan Data ....................................................................23
3.1.3. Alur Penelitian ..........................................................................24
3.2. Perancangan Sistem .................................................................................26
3.2.1 Use Case Diagram .....................................................................26
3.2.2 Activity Diagram .......................................................................27
3.2.3 Class Diagram ............................................................................28
3.2.4 Diagram Konteks.......................................................................... 29
3.2.5 Entity Relationship Diagram (ERD) ............................................ 30
3.3. Alur Data dan Klasifikasi ..........................................................................31
3.4. Perancangan Alur Kerja Program ............................................................... 32
3.5. Flowchart Program ..................................................................................... 33
3.6. Rancangan Database ................................................................................... 37
3.7. Rancangan Interface .................................................................................38
BAB IV IMPLEMENTASI DAN PENGUJIAN ...........................................39
4.1. Implementasi Sistem .................................................................................39
4.2. Struktur File ..............................................................................................40
4.3. Alur Kerja Framework Codeigniter ...........................................................41
4.4. Implementasi Desain .................................................................................42
4.5. Code Program ...........................................................................................46
4.6. Pengujian ..................................................................................................48
4.7. Hasil dan Kesimpulan ...............................................................................56
xii
BAB V KESIMPULAN ................................................................................57
5.1. Kesimpulan ...............................................................................................57
5.2. Saran ........................................................................................................58
DAFTAR PUSTAKA.....................................................................................59
xiii
DAFTAR GAMBAR
Gambar 2.1 Cara Kerja Email ............................................................................. 9
Gambar 3.1 Alur Penelitian ................................................................................ 25
Gambar 3.2 Use Case Diagram .......................................................................... 26
Gambar 3.3 Activity Diagram ........................................................................... 27
Gambar 3.4 Class Diagram ................................................................................ 28
Gambar 3.5 Diagram Konteks ........................................................................... 29
Gambar 3.6 Entity Relationship Diagram (ERD) ................................................ 30
Gambar 3.7 Alur Data dan Klasifikasi ................................................................ 31
Gambar 3.8 Perancangan Alur Kerja Program .................................................... 32
Gambar 3.9 Flowchart........................................................................................ 33
Gambar 3.10 Interface Awal ............................................................................. 37
Gambar 3.11 Form Login .................................................................................. 37
Gambar 3.12 Menu Utama ................................................................................ 38
Gambar 3.13 Interface Klasifikasi ...................................................................... 38
Gambar 4.1 Alur Kerja Framework Codeigniter ................................................ 41
Gambar 4.2 Halaman Awal ............................................................................... 42
Gambar 4.3 Halaman Login .............................................................................. 43
Gambar 4.4 Halaman Cek Inbox ........................................................................ 44
Gambar 4.5 Tombol Klasifikasi ......................................................................... 45
Gambar 4.6 Hasil Klasifikasi ............................................................................. 46
Gambar 4.7 Source Code Menampilkan Inbox ................................................... 46
Gambar 4.8 Source Code Naive Bayes ............................................................... 47
Gambar 4.9 Source Code Pemberian Label Email .............................................. 48
xv
DAFTAR TABEL
Tabel 2.1 Bentuk Confusion Matrix ........................................................... 18
Tabel 3.1 Model Pengklasifikasian Pesan ................................................... 23
Tabel 3.2 Surat Belum Terlabel ................................................................. 34
Tabel 3.3 Surat Terlabel ............................................................................ 35
Tabel 3.4 Data Admin ............................................................................... 35
Tabel 3.5 Token ......................................................................................... 36
Tabel 3.6 Stopword .................................................................................... 36
Tabel 3.7 Stemming .................................................................................. 36
Tabel 4.1 Struktur File Codeigniter ........................................................... 40
Tabel 4.2 Hasil Percobaan ......................................................................... 50
Tabel 4.3 Confusion Matrix Dekan ........................................................... 50
Tabel 4.4 Confusion Matrix PSPD ............................................................ 50
Tabel 4.5 Confusion Matrix PSIK .............................................................. 51
Tabel 4.6 Confusion Matrix Wakil Dekan 1 ............................................... 51
Tabel 4.7 Confusion Matrix Wakil Dekan 2 ............................................... 51
Tabel 4.8 Confusion Matrix Wakil Dekan 3 ............................................... 52
Tabel 4.9 Hasil Confusion Matrix ............................................................. 52
Tabel 4.10 Hasil Percobaan Iterasi ke 1 ..................................................... 53
Tabel 4.11 Hasil Percobaan Iterasi ke 2 ..................................................... 53
Tabel 4.12 Hasil Percobaan Iterasi ke 3 ..................................................... 53
Tabel 4.13 Hasil Percobaan Iterasi ke 4 .................................................... 54
Tabel 4.14 Hasil Percobaan Iterasi ke 5 ..................................................... 54
Tabel 4.15 Hasil Percobaan Iterasi ke 6 ..................................................... 54
Tabel 4.16 Hasil Percobaan Iterasi ke 7 ..................................................... 55
xv
Tabel 4.17 Hasil Percobaan Iterasi ke 8 ..................................................... 55
Tabel 4.18 Hasil Percobaan Iterasi ke 9 ..................................................... 55
Tabel 4.19 Hasil Percobaan Iterasi ke 10 ................................................... 56
59
DAFTAR PUSTAKA
[1] Herrick, Dan R. "Google this!: using Google apps for collaboration and
productivity." Proceedings of the 37th annual ACM SIGUCCS fall conference:
communication and collaboration. ACM, 2009.
[2] Khairina, Dyna Marisa, et al. "Department recommendations for prospective
students Vocational High School of information technology with Naïve Bayes
method." Information Technology, Computer, and Electrical Engineering
(ICITACEE), 2015 2nd International Conference on. IEEE, 2015.
[3] Husnun Nashir, Dwisunaryono, Abdul Munir. "Perancangan dan Pembuatan
Perangkat Lunak Pengelompokan Email Secara Otomatis Memakai Single Pass
Clustering Berbasis Kerangka Kerja Play!." JURNAL TEKNIK POMITS Vol. 1,
No 1, (2012) 1-6.
[4] Anugroho, Prasetyo, Idris Winarno, and N. M. Rosyid. "Klasifikasi Email Spam
Dengan Metode Naive Bayes Classifier Menggunakan Java Programming."
(2009).
[5] Samodra, Joko, Surya Sumpeno, and Mochamad Hariadi. "Klasifikasi dokumen
teks berbahasa Indonesia dengan menggunakan naive bayes." dalam Seminar
Nasional Electrical, Informatics, and IT's Education. 2009.
[6] I. Winarno, “Klasifikasi Spam Email Dengan Metode Naive Bayes Classifier,”
no. July, 2015.
[7] Prasetyo Anugroho, “Klasifikasi Email Spam Dengan Metode Klasifikasi Naïve
Bayes,” PENS.ac.id , vol. 11, no. 3, pp. 2011.
60
[8] Budi Siswanto,"Sistem Pengolahan Data Surat Masuk dan Keluar Berbasis
Web." (2012)
[9] Xhemali, Daniela, Chris J. Hinde, and Roger G. Stone. “Naive Bayes vs.
decision trees vs. neural networks in the classification of training web pages.”
(2009)
[10] Informatikalogi,"Pembobotan Kata atau Term Weighting TF-IDF." (2016)
[11] W. N. Chandra, G. Indrawan, and I. N. Sukajaya, “Spam Filtering Dengan
Metode Pos Tagger Dan Klasifikasi Naïve Bayes,” J. Ilm. Teknol. Inf. Asia, vol.
10, no. 1, pp. 47–55, 2016.
[12] B. Kurniawan, S. Effendi, and O. S. Sitompul, “Klasifikasi Konten Berita
Dengan Metode Text Mining,” J. Dunia Teknol. Inf., vol. 1, no. 1, pp. 14–19,
2012.
[13] Informatikalogi,"Text Preprocessing."(2016)
[14] T. Rosandy, “PERBANDINGAN METODE NAIVE BAYES CLASSIFIER
DENGAN METODE DECISION TREE ( C4 . 5 ) UNTUK MENGANALISA
KELANCARAN PEMBIAYAAN ( Study Kasus : KSPPS / BMT AL-
FADHILA ),” J. TIM Darmajaya, vol. 2, no. 1, pp. 52–62, 2016.
[15] Surya Arditian Prakasa,"Text Mining." (2015)