sistem collecting file skripsi berbasis web …lib.unnes.ac.id/31712/1/5302412041.pdf · dengan...
Post on 18-Mar-2019
233 Views
Preview:
TRANSCRIPT
SISTEM COLLECTING FILE SKRIPSI BERBASIS WEB
DENGAN PENGKLASIFIKASIAN DOKUMEN
OTOMATIS MENGGUNAKAN ALGORITMA COSINE
SIMILARITY DI TEKNIK ELEKTRO UNIVERSITAS
NEGERI SEMARANG
Skripsi
Skripsi diajukan sebagai salah satu persyaratan untuk memperoleh gelar Sarjana
Pendidikan Program Studi Pendidikan Teknik Informatika dan Komputer
Oleh
Rizki Tri Wahyuni NIM.5302412041
JURUSAN TEKNIK ELEKTRO
FAKULTAS TEKNIK
UNIVERSITAS NEGERI SEMARANG
2017
MOTTO DAN PERSEMBAHAN
� Sesungguhnya setiap perbuatan tergantung niatnya, dan sesungguhnya semua
orang (akan dibalas) berdasarkan apa yang dia niatkan (HR Bukhari Muslim)
� Dalam setiap masalah yang kita hadapi terdapat suatu pelajaran yang dapat
kita ambil, jangan terpaku pada masalahnya, namun pikirkan apa hikmahnya.
� Selembar daun tidak jatuh dari pohon dengan sia-sia, begitu pula dengan
usaha kita. Tidak ada usaha yang sia-sia, itu semua akan berpengaruh pada
setiap langkah yang kita ambil.
Persembahan:
Skripsi ini saya persembahkan untuk:
1. Ibu dan ayah tercinta Ibu Sunartin dan Bapak Supatmo
2. Kedua kakak tercinta (Yuliati dan Heri Purwanto)
3. Keluarga besar desa Pungpungan Kecamatan Kalitidu Kabupaten Bojonegoro
4. Keluarga besar Kos Latansa
5. Sahabat setia saya
6. Teman-teman PTIK Rombel 1 angkatan 2012
7. Almamaterku UNNES
v
ABSTRAK
Rizki Tri Wahyuni. 2017. Sistem Collecting File Skripsi Berbasis Web dengan Pengklasifikasian Dokumen Otomatis menggunakan Algoritma Cosine Similarity di Teknik Elektro Universitas Negeri Semarang. Skripsi. Pembimbing Dr-Ing.
Dhidik Prastiyanto, S.T.,M.T. dan Dr. H. Eko Supraptono, M.Pd. Pendidikan
Teknik Informatika dan Komputer. Universitas Negeri Semarang.
Kegiatan collecting file skripsi menggunakan CD/DVD drive di jurusan
Teknik Elektro menghasilkan limbah elektronik yang semakin bertambah tiap
tahun. Ruang penyimpanan yang terbatas serta kurangnya pengelolaan limbah
elektronik membuat CD/DVD drive bekas pakai terbengkalai begitu saja. Sistem
penyimpanan yang tidak terpusat juga menjadi kendala dalam pengelolaan soft file skripsi. Diperlukan klasifikasi dokumen secara otomatis dalam menghemat waktu
dan tenaga. Oleh karena itu peneliti membangun sistem collecting file skripsi
dengan database terpusat serta pengkasifikasian secara otomatis.
Jenis metode penelitian yang digunakan adalah metode “Penelitian dan
Pengembangan” (R&D). Merupakan metode penelitian yang digunakan untuk
menghasilkan sebuah produk baru, dan selanjutnya menguji keefektifan produk
tersebut. Analisis data yang digunakan adalah analisis data deskriptif persentase.
Hasil dari penelitian ini adalah sebuah sistem collecting file skripsi
berbasis web yang dibangun menggunakan bahasa pemrograman PHP dan HTML.
Sistem ini mampu mengklasifikasikan skripsi kedalam beberapa kategori
menggunakan algoritma cosine similarity. Hasil pengujian black-box pada sistem
menunjukkan bahwa sistem mampu menjalankan seluruh fungsi-fungsinya
dengan baik. Hasil pengujian ahli sistem memperoleh persentase kelayakan
sebesar 88,3%, hasil pengujian ahli kearsipan memperoleh persentase sebesar
87,5%, hasil pengujian user responsive memperoleh persentase sebesar 85,3% dan
hasil persentase ketepatan klasifikasi sebesar 98%. Maka dapat disimpulkan
bahwa sistem collecting file skripsi sangat layak digunakan dengan hasil
persentase ketepatan klasifikasi sangat tinggi.
Kata Kunci: collecting skripsi, cosine similarity, klasifikasi dokumen, arsip
vi
KATA PENGANTAR
Segala puji dan syukur penulis ucapkan kehadirat Allah SWT dan
mengharapkan ridho yang telah melimpahkan rahmat-Nya sehingga penulis dapat
meneyelesaikan skripsi yang berjudul " Sistem Collecting File Skripsi Berbasis
Web dengan Pengklasifikasian Dokumen Otomatis menggunakan Algoritma
Cosine Similarity di Teknik Elektro Universitas Negeri Semarang ". Skripsi ini
disusun sebagai salah satu persyaratan meraih gelar Sarjana Pendidikan pada
Program Studi S-1 Pendidikan Teknik Informatika dan Komputer Universitas
Negeri Semarang. Shalawat serta salam senantiasa disampaikan kepada junjungan
alam Nabi Muhammad SAW, mudah-mudahan kita semua mendapatkan safaat di
yaumil akhir nanti, Aamiin. Penyelesaian skripsi ini tidak lepas dari bantuan
berbagai pihak, oleh karena itu pada kesempatan ini penulis menyampaikan
ucapan terima kasih serta penghargaan kepada :
1. Bapak Dr-Ing. Dhidik Prastiyanto, S.T.,M.T. selaku pembimbing pertama dan
bapak Dr. H. Eko Supraptono, M.Pd. atas bimbingan, arahan dan motivasinya
dalam penyusunan skripsi ini.
2. Bapak Dr. H. Noor Hudallah, M.T selaku penguji 1 yang telah memberikan
bimbingan dan arahan dalam menyempurnakan skripsi ini.
3. Bapak Drs. R. Kartono M. Pd selaku dosen wali
4. Ketua Jurusan Teknik Elektro Fakultas Teknik Universitas Negeri Semarang,
Bapak Dr. Ing. Dhidik Prastiyanto S.T., M.T.
5. Dekan Fakultas Teknik Universitas Negeri Semarang, Dr. Nur Qudus M.T.
vii
6. Bapak/Ibu Dosen Program Studi Pendidikan Teknik Informatika dan
Komputer yang telah memberikan ilmu serta bimbingannya selama ini.
7. Ibuku, Bapakku, Kedua kakak ku di kota Surabaya dan Jakarta, sehingga
skripsi ini dapat terselesaikan.
8. Teman-teman Pendidikan Teknik Informatika dan Komputer angkatan 2012.
9. Semua pihak yang telah membantu peneliti dalam menyelesaikan skripsi ini
yang tidak dapat penyusun sebutkan satu persatu.
Semoga amal baik dari semua pihak mendapat imbalan yang berlipat
ganda dari Allah SWT. Diharapkan skripsi ini dapat bermanfaat, Aamiin.
Semarang, Juli 2017
Peneliti
viii
DAFTAR ISI
Halaman Judul ......................................................................................................... i
Pernyataan ............................................................................................................... ii
Persetujuan Pembimbing........................................................................................ iii
Perngesahan............................................................................................................ iv
Motto dan Persembahan .......................................................................................... v
Abstrak ................................................................................................................... vi
Kata Pengantar ...................................................................................................... vii
Daftar Isi ................................................................................................................ ix
Daftar Tabel .......................................................................................................... xii
Daftar Gambar...................................................................................................... xiv
Daftar Lampiran ................................................................................................... xvi
BAB I PENDAHULUAN
1.1 Latar Belakang ...................................................................................... 1
1.2 Rumusan Masalah ................................................................................. 6
1.3 Batasan Masalah ................................................................................... 7
1.4 Tujuan Penelitian ................................................................................. 7
1.5 Manfaat Penelitian ............................................................................... 8
1.6 Sistematika Penulisan .......................................................................... 9
BAB II KAJIAN PUSTAKA
2.1 Penelitian Terdahulu .......................................................................... 11
2.2 Landasan Teori .................................................................................... 13
2.2.1 Sistem ............................................................................................ 13
2.2.2 Database ........................................................................................ 15
2.2.3 Perangkat Analisis dan Perancangan Sistem................................. 16
2.2.4 Perangkat Pendukung .................................................................... 20
ix
2.2.5 Pengujian Perangkat Lunak........................................................... 22
2.2.6 Pengarsipan Dokumen................................................................... 23
2.2.7 Pengklasifikasian Dokumen .......................................................... 24
2.2.8 Text Mining ................................................................................... 25
2.2.9 Pembobotan TF-IDF ..................................................................... 27
2.2.10 Cosine Similarity ......................................................................... 27
BAB III METODE PENELITIAN
3.1 Waktu dan Tempat Penelitian ............................................................. 29
3.2 Teknik Pengumpulan Data .................................................................. 30
3.2.1 Observasi ....................................................................................... 30
3.2.2 Studi Pustaka ................................................................................. 31
3.2.3 Dokumentasi.................................................................................. 31
3.3 Desain Penelitian ................................................................................. 31
3.3.1 Tahap Studi Pendahuluan .............................................................. 33
3.3.2 Tahap Pengembangan Produk ....................................................... 33
3.3.3 Tahap Analisis ............................................................................... 34
3.3.3.1 Analisis Kebutuhan Sistem ..................................................... 34
3.3.3.2 Analisis Kebutuhan Input ........................................................ 34
3.3.3.3 Analisis Kebutuhan Output ..................................................... 34
3.3.4 Perancangan Produk ...................................................................... 35
3.3.4.1 Use Case Diagram ................................................................... 35
3.3.4.2 Activity Diagram ..................................................................... 36
3.3.4.3 Flowchart................................................................................. 52
3.3.4.4 Diagram Konteks..................................................................... 54
3.3.4.5 DFD Level 1 ............................................................................ 54
3.3.4.6 Perancangan Basis Data .......................................................... 55
3.3.4.7 Desain Tampilan Sistem.......................................................... 56
3.3.5 Pengujian Produk .......................................................................... 61
3.3.5.1 Pengujian Black-box ............................................................... 61
3.3.5.2 Pengujian Ahli Sistem ............................................................. 61
3.3.5.3 Pengujian Ahli Kepustakaan ................................................... 62
x
3.3.5.4 Pengujian User Skala Terbatas ................................................ 62
3.4 Alat dan Bahan Penelitian ................................................................... 63
3.4.1 Perangkat Keras (Hardware) ......................................................... 63
3.4.2 Perangkat Lunak (Software).......................................................... 63
3.5 Instrumen Penelitian............................................................................ 64
3.5.1 Instrumen Kuisioner ...................................................................... 64
3.6 Teknik Pengambilan Sampel .............................................................. 66
3.7 Teknik Analisis Data ........................................................................... 66
BAB IV HASIL DAN PEMBAHASAN
4.1 Hasil Penelitian ................................................................................... 70
4.1.1 Implementasi Komponen Sistem Collecting File Skripsi ............. 70
4.1.2 Hasil Pengujian Black-box ............................................................ 74
4.1.3 Hasil Pengujian Ahli Sistem ......................................................... 91
4.1.4 Hasil Pengujian Ahli Kearsipan .................................................. 101
4.1.5 Hasil Pengujian User Responsive ............................................... 107
4.1.6 Hasil Perhitungan Data Mining ................................................... 110
4.1.2 Pembahasan .................................................................................... 112
BAB V PENUTUP
5.1 Simpulan............................................................................................ 116
5.2 Saran .................................................................................................. 118
DAFTAR PUSTAKA ....................................................................................... 119
xi
DAFTAR TABEL
Halaman
Tabel 3.1 Struktur Tabel user ................................................................................ 55
Tabel 3.2 Struktur Tabel admin ............................................................................ 56
Tabel 3.3 Struktur Tabel skripsi............................................................................ 56
Tabel 3.4 Struktur Tabel klasifikasi ...................................................................... 57
Tabel 3.5 Struktur Tabel status_upload ................................................................ 57
Tabel 3.6 Spesifikasi Kebutuhan Hardware .......................................................... 63
Tabel 3.7 Spesifikasi Kebutuhan Software ........................................................... 63
Tabel 3.8 Kisi-kisi Umum Instrumen Pakar Sistem.............................................. 65
Tabel 3.9 Kisi-kisi Umum Instrumen Pakar Kearsipan ........................................ 65
Tabel 3.10 Kisi-kisi Umum Instrumen Pakar User (Mahasiswa) ......................... 65
Tabel 3.11 Skala Likert ......................................................................................... 67
Tabel 3.12 Kategori Kelayakan Sistem................................................................. 69
Tabel 4.1 Implementasi Komponen Sistem Level User........................................ 70
Tabel 4.2 Implementasi Komponen Sistem Level Administrator......................... 72
Tabel 4.3 Uji Black-box Sistem Level Administrator .......................................... 74
Tabel 4.4 Uji Black-box Sistem Level User ......................................................... 85
Tabel 4.5 Hasil Pengujian Ahli Sistem ................................................................. 91
Tabel 4.6 Hasil Penilaian Aspek Performace........................................................ 92
Tabel 4.7 Hasil Penilaian Aspek Information ....................................................... 93
Tabel 4.8 Hasil Penilaian Aspek Control .............................................................. 93
Tabel 4.9 Hasil Penilaian Aspek Efficiency ......................................................... 94
Tabel 4.10 Hasil Penilaian Aspek Service ............................................................ 95
Tabel 4.11 Daftar Saran Validator Sistem ............................................................ 96
Tabel 4.12 Hasil Pengujian Ahli Kearsipan ........................................................ 102
Tabel 4.13 Hasil Penilaian Aspek Information ................................................... 103
Tabel 4.14 Hasil Penilaian Aspek Service .......................................................... 103
xii
Tabel 4.15 Daftar Saran Validator Kearsipan ..................................................... 104
Tabel 4.16 Hasil Uji Pengguna ........................................................................... 107
Tabel 4.17 Hasil Penilaian Aspek Isi Perangkat Lunak ...................................... 108
Tabel 4.18 Hasil Penilaian Aspek Kemudahan dalam Penggunaan ................... 109
Tabel 4.19 Hasil Penilaian Aspek Tampilan Aplikasi ........................................ 109
Tabel 4.20 Hasil Penilaian Aspek Kelayakan Aplikasi ...................................... 110
Tabel 4.21 Hasil Pelatihan Data dengan Algoritma ............................................ 111
xiii
DAFTAR GAMBAR
Halaman
Gambar 2.1 Simbol Proses .................................................................................... 17
Gambar 2.2 Simbol Aliran Data ........................................................................... 17
Gambar 2.3 Simbol Penyimpanan Data ................................................................ 18
Gambar 2.4 Simbol Entitas ................................................................................... 18
Gambar 2.5 Simbol Entitas ................................................................................... 19
Gambar 2.6 Simbol Relasi .................................................................................... 19
Gambar 3.1 Diagram Langkah-langkah Penelitian ............................................... 32
Gambar 3.2 Diagram Model Waterfall ................................................................. 33
Gambar 3.3 Use Case Diagram Level User .......................................................... 35
Gambar 3.4 Use Case Diagram Level Administrator ........................................... 36
Gambar 3.5 Activity Diagram Menu Upload Skripsi ........................................... 37
Gambar 3.6 Activity Diagram Menu Ubah Password .......................................... 38
Gambar 3.7 Activity Diagram Menu Referensi Berdasarkan Kata Kunci ............ 39
Gambar 3.8 Activity Diagram Menu Referensi Berdasarkan Kategori ................ 40
Gambar 3.9 Activity Diagram Menu Data Upload Personal ................................ 41
Gambar 3.10 Activity Diagram Menu Rekap User............................................... 42
Gambar 3.11 Activity Diagram Menu Tambah User ............................................ 43
Gambar 3.12 Activity Diagram Menu Rekap Skripsi ........................................... 44
Gambar 3.13 Activity Diagram Menu Klasifikasi File Skripsi............................. 45
Gambar 3.14 Activity Diagram Menu Validasi Upload Skripsi ........................... 46
Gambar 3.15 Activity Diagram Menu Administrator ........................................... 47
Gambar 3.16 Activity Diagram Menu Laporan Keseluruhan ............................... 48
Gambar 3.17 Activity Diagram Menu Laporan Tahunan ..................................... 49
Gambar 3.18 Activity Diagram Menu Hapus Akun Mahasiswa .......................... 50
Gambar 3.19 Activity Diagram Menu Hapus Data Upload Skripsi ..................... 51
Gambar 3.20 Flowchart Prepocessing .................................................................. 52
xiv
Gambar 3.21 Flowchart Klasifikasi Judul Skripsi ................................................ 53
Gambar 3.22 Diagram Konteks Sistem Collecting File Skripsi ........................... 54
Gambar 3.23 DFD Level 1 Sistem Collecting File Skripsi................................... 55
Gambar 3.24 Desain Tampilan Halaman Login ................................................... 58
Gambar 3.25 Desain Tampilan Halaman Muka User ........................................... 58
Gambar 3.26 Desain Tampilan Halaman Input Data ............................................ 59
Gambar 3.27 Desain Tampilan Halaman Pencarian Referensi ............................. 59
Gambar 3.28 Desain Tampilan Halaman Administrator....................................... 60
Gambar 3.29 Desain Tampilan Halaman Rekap User .......................................... 60
Gambar 4.1 Menu Laporan Sebelum Perbaikan ................................................... 96
Gambar 4.2 Menu Laporan Setelah Perbaikan ..................................................... 97
Gambar 4.3 Kode simpan_pendaftaran.php Sebelum Perbaikan.......................... 97
Gambar 4.4 Kode simpan_pendaftaran.php Setelah Perbaikan ............................ 98
Gambar 4.5 Penyimpanan File Sebelum Perbaikan .............................................. 98
Gambar 4.6 Penyimpanan File Setelah Perbaikan ................................................ 99
Gambar 4.7 Halaman Login Sebelum Perbaikan .................................................. 99
Gambar 4.8 Penyimpanan File Setelah Perbaikan .............................................. 100
Gambar 4.9 Data Upload Skripsi Sebelum Perbaikan ........................................ 100
Gambar 4.10 Data Upload Skripsi Setelah Perbaikan ........................................ 101
Gambar 4.11 Data Upload Skripsi Sebelum Perbaikan ...................................... 105
Gambar 4.12 Data Upload Skripsi Setelah Perbaikan ........................................ 105
Gambar 4.13 Menu Pada Halaman Admin Sebelum Perbaikan ......................... 106
Gambar 4.14 Menu Pada Halaman Admin Setelah Perbaikan ........................... 106
xv
DAFTAR LAMPIRAN
Halaman
Lampiran 1. SK Dosen Pembimbing .................................................................. 122
Lampiran 2. Hasil Klasifikasi Judul Skripsi dengan Algoritma ......................... 123
Lampiran 3. Tampilan Antarmuka Sistem .......................................................... 135
Lampiran 4. Lembar Pengujian Ahli Sistem ....................................................... 152
Lampiran 5. Lembar Pengujian Ahli Kearsipan ................................................. 155
Lampiran 6. Lembar Pengujian User Skala Terbatas.......................................... 158
Lampiran 7. Usulan Pembimbing ....................................................................... 161
Lampiran 8. Permohonan Uji Ahli...................................................................... 162
Lampiran 9. Dokumentasi Penelitian .................................................................. 164
xvi
1
BAB I
PENDAHULUAN
1.1 Latar Belakang
Kehadiran teknologi informasi dan komunikasi (TIK) merupakan suatu
kemajuan pesat dalam peradapan manusia. Teknologi informasi dan komunikasi
memberikan banyak manfaat bagi masyarakat, baik manfaat secara langsung
maupun tidak langsung. Teknologi informasi dan komunikasi tidak dapat terlepas
dari kehidupan masyarakat, terlebih di era yang serba canggih seperti saat ini.
Perubahan model dan teknologi yang begitu cepat juga telah merubah gaya hidup
masyarakat untuk selalu mengikuti teknologi terbaru.
Salah satu bentuk teknologi informasi dan komunikasi yang berkembang
pesat adalah internet. Internet dapat menyampaikan informasi dalam jarak yang
sangat jauh seperti lintas benua. Salah satu kegiatan yang berubah seiring adanya
teknologi internet adalah kegiatan surat menyurat. Jika dahulu mengirim surat
menggunakan media kertas, maka sekarang media kertas diubah menjadi media
digital yang langsung dikirim menggunakan teknologi internet. Internet dapat
digunakan untuk berbagai macam kegiatan, seperti mengakses informasi,
mengirim informasi, neyimpan informasi dan masih banyak yang lainnya.
Selain memiliki banyak dampak postif ternyata perkembangan teknologi
informasi dan komunikasi juga memiliki dampak negatif, salah satunya adalah
dampak negatif bagi lingkungan. Banyaknya peralatan elektronik yang digunakan
menghasilkan banyak limbah elektronik. Limbah elektronik digolongkan kedalam
2
limbah Bahan Berhaya dan Beracun (B3) karena sifat, konsentrasi, atau
jumlahnya baik secara langsung atau tidak langsung dapat mencemarkan dan
mambahayakan lingkungan hidup manusia dan makhluk lainnya. Hal ini
berdasarkan penelitian yang dilakukan oleh Sri Wahyono (2012) dengan judul
“Kebijakan Pengelolaan Limbah Elektronik dalam Lingkup Global dan Lokal”.
Universitas Negeri Semarang sebagai salah satu universitas konservasi di
Indonesia memiliki program untuk menyelaraskan kedua permasalahan di atas
melalui pilar-pilar konservasi. Unnes sudah menjalankan kebijakan nirkertas guna
mengurangi penggunaan kertas. Sesuai dengan Peraturan Rektor Universitas
Negeri Semarang No.27 Tahun 2012 tentang Tata Kelola Kampus Berbasis
Konservasi pada Pasal 7 program pilar kebijakan nirkertas diterapkan melalui
optimalisasi sistem berbasis teknologi informasi, efisien penggunaan kertas,
pemanfaatan kertas daur ulang, dan penggunaan kertas ramah lingkungan.
Beberapa teknologi informasi berbasis web sebagai penunjang pilar
kebijakan nirkertas juga telah dikembangkan oleh Unnes, diantaranya Sikadu
(Sistem Akademik Terpadu), Simawa (Sistem Informasi Mahasiswa), Simpeg
(Sistem Informasi Kepegawaian), Sibima (Sistem Informasi Bimbingan
Mahasiswa) dan masih banyak sistem informasi yang lainnya. Sistem yang
dikembangkan memiliki manfaat memudahkan mahasiswa maupun sivitas
akademika dalam mengakses maupun mengirim informasi.
Jurusan Teknik Elektro sebagai bagian dari Universitas Negeri Semarang
memiliki peran untuk ikut andil melaksanakan pilar-pilar konservasi. Di Jurusan
Teknik Elektro kebijakan nirkertas sendiri sudah terlaksana, contohnya adalah
3
adanya mata kuliah e-learning, pengumpulan tugas lewat e-mail, pengumpulan
arsip skripsi dengan CD/DVD drive, adanya sistem informasi pengajuan skripsi
berbasis web dan lain sebagainya.
Kegiatan yang rutin dilakukan oleh jurusan Teknik Elektro adalah
mengoleksi dokumen skripsi dari calon wisudawan sebagai arsip jurusan. Dari
tahun ke tahun jumlah koleksi selalu bertambah seiring bertambahnya jumlah
mahasiswa yang telah lulus mata kuliah skripsi, hal ini membuat pihak jurusan
harus menyiapkan ruang penyimpanan yang lebih besar untuk arsip dokumen
skripsi. Sampai saat ini metode pengumpulan dokumen arsip skripsi dilakukan
dengan dua cara yaitu dengan menggunakan hard file dan soft file dalam bentuk
CD/DVD drive.
Berdasarkan pengamatan dari peneliti, hal ini menimbulkan masalah baru.
Menumpuknya CD/DVD yang sudah tak terpakai menjadi limbah elektronik,
limbah elektronik ini tidak dikelola secara maksimal dan hanya dikumpulkan
dalam ruangan. Selain itu arsip yang telah terkumpul tersebar dalam beberapa
database komputer. Hal ini menjadi kendala dalam pengelolaan arsip. Arsip soft
file tidak dipublikasikan kepada mahasiswa karena sudah tersedia arsip dalam
bentuk hard file di perpustakaan Teknik Elektro. Namun arsip di perpustakaan
tidak terklasifikasi dengan baik sehingga pengunjung perpustakaan sulit untuk
menemukan referensi yang sedang dicari.
Sistem pengarsipan berbasis web sendiri sudah banyak dikembangkan di
Indonesia. Salah satunya adalah penelitian yang dilakukan oleh Bambang Panji
Asmara (2014) dengan judul “Digitalisasi Arsip Dokumen Penting Sebagai File
4
Lokal Interest (LI) Dengan Soft Komputing Sebagai Daya Dukung Informasi
Berbasis ICT”. Menurut Bambang (2014: 9) menyatakan sistem digitalisasi
dokumen membantu memperpanjang ketersediaan dokumen karena tidak akan
mengalami kerusakan secara fisik seiring berjalannya waktu serta mempermudah
penggunanya untuk memperoleh data yang dibutuhkan.
Mengacu pada permasalahan yang ada, cara tradisional dalam
pengumpulan data dan informasi dapat diubah menggunakan teknologi yang baru
dan lebih efisien seperti teknologi web. Penggunaan web dapat mengurangi
penggunaan media penyimpanan seperti CD/DVD drive sekali pakai. Sehingga
banyaknya limbah sisa penggunaan CD/DVD drive dapat berkurang. Karena web
menggunakan teknologi internet yang dapat melakukan pengiriman data secara
real time. Selain itu web juga memiliki model basisdata yang terpusat sehingga
mudah dalam melakukan pengelolaan data. Dari segi user atau pengguna web juga
akan merasa dimudahkan dengan adanya sistem berbasis web.
Untuk mengelola dokumen elektronik dengan jumlah yang banyak,
diperlukan suatu metode agar data dapat diproses menjadi informasi yang tepat.
Selain itu dengan banyaknya dokumen proses pengklasifikasian tidak mungkin
dilakukan secara manual karena memerlukan banyak waktu dan tenaga. Salah satu
metode yang dapat digunakan adalah dengan pengklasifikasian secara otomatis
dengan text mining. Banyak metode text mining yang digunakan dalam
mengklasifikasikan dokumen atau teks, salah satunya adalah algoritma cosine
similarity.
5
Algoritma cosine similarity telah diterapkan pada penelitian Diki dkk
(2016), Ogie dkk (2016), Radiant dkk (2014), Andry dkk (2014), Sugiyamta
(2014), Anubhuti dkk (2016) dan Vicas dkk (2013). Diki dkk (2016)
menggunakan algoritma cosine similarity untuk membandingkan pembobotan
yang lebih efisien antara TF-IDF dan WIDF. Hasilnya adalah pembobotan TF-
IDF dengan cosine similarity menghasilkan ketepatan klasifikasi sebesar 70,7%
sedangkan pembobotan WIDF menghasilkan ketepatan klasifikasi sebesar 70,6%.
Ogie dkk (2016) membandingkan algoritma cosine similaity, jaccard similarity
dan KNN dalam aplikasi pencarian terjemahan Al-Qur’an. Hasilnya adalah
algoritma cosine similarity memiliki ketepatan pencarian sebesar 41%, jaccard
similarity sebesar 19% dan KNN sebesar 40%.
Radiant dkk (2014) membandingkan dua dokumen untuk mendeteksi
plagiarisme menggunakan algoritma cosine similarity dan smith waterman.
Hasilnya adalah Radiant dkk berhasil membuat aplikasi pendeteksi plagiarisme
menggunakan algoritma cosine similarity dan smith waterman dengan akurasi
yang cukup tinggi. Andry dkk (2014) membuat aplikasi pencarian informasi
beasiswa berbasis web menggunakan algoritma cosine similarity. Dan hasilnya
adalah aplikasi ini memiliki persentase keakuratan sebesar 49,1%. Sugiyamta
(2014) membuat sistem deteksi kemiripan teks menggunakan algoritma cosine
similarity dan single pass clustering. Hasilnya adalah pengukuran dengan cosine
similarity pada sistem ini menghasilkan persentase keakuratan sebesar 99%.
Anubhuti dkk (2016) membuat aplikasi klastering dokumen menggunakan
algoritma cosine similarity dengan centroid implication. Hasilnya adalah
6
algoritma cosine similarity mampu untuk mengklasifikasikan dokumen dalam
penelitian Anubhuti dkk kedalam 13 klaster dengan tepat. Vicas dkk (2013)
membandingkan algoritma cosine similarity, jaccard similarity dan dice similarity
untuk pencarian teks pada internet. Hasilnya adalah algoritma cosine similarity
memiliki nilai akurasi tertinggi, kemudian yang kedua adalah dice similarity dan
yang terakhir adalah jaccard similarity.
Oleh karena itu penulis akan mengadakan penelitian dengan judul “Sistem
Collecting File Skripsi Berbasis Web dengan Pengklasifikasian Dokumen
Otomatis menggunakan Algoritma Cosine Similarity di Teknik Elektro
Universitas Negeri Semarang”. Diharapkan penelitian ini dapat membantu jurusan
Teknik Elektro untuk melakukan kegiatan pengarsipan data yang lebih efektif dan
efisien. Serta dapat membantu mahasiswa untuk memudahkan kegiatan collecting
file skripsi ke jurusan Teknik Elektro.
1.2 Rumusan Masalah
Berdasarkan latar belakang di atas, maka dapat dirumuskan permasalahan
sebagai berikut :
1. Bagaimana membangun sistem collecting file skripsi berbasis web?
2. Bagaimana kelayakan sistem collecting file skripsi berbasis web berdasarkan
pengujian ahli dan black-box testing?
3. Seberapa tinggi keakuratan pengklasifikasian file skripsi menggunakan
algoritma cosine similarity?
7
1.3 Batasan Masalah
Batasan masalah dalam sistem yang dibuat dari hasil penelitian yang
dilakukan dan dengan cakupan data serta informasi maka dapat dibuat perumusan
masalah diatas, diantaranya adalah sebagai berikut:
1. Sistem collecting file skripsi berbasis web ini dibuat khusus untuk jurusan
Teknik Elektro Universitas Negeri Semarang.
2. Sistem ini hanya membahas tentang proses collecting file skripsi oleh
mahasiswa serta proses pengklasifikasian file skripsi dengan algoritma cosine
simialrity dalam kegiatan pengarsipan data.
3. Pengguna dari sistem ini hanya mahasiswa jurusan Teknik Elektro serta
kepala laboratorium atau administrator jurusan Teknik Elektro.
4. Dalam pembuatan sistem ini hanya menggunakan bahasa pemrograman
HTML, PHP, MySQL, Database dan Bootsrap dengan berbasis web.
5. Sistem ini hanya mengklasifikasikan dokumen kedalam 9 kategori, yaitu
sistem pakar, sistem berbasis web, sistem berbasis android, jaringan
komputer, model metode dan media pembelajaran, ketenagaan, elektronika
dan komunikasi, instrumentasi dan kendali, serta lainnya.
1.4 Tujuan Penelitian
Berdasarkan rumusan masalah yang telah dikemukakan di atas, tujuan dari
penelitian ini adalah:
8
1. Merancang dan membangun sistem collecting file skripsi berbasis web yang
dapat digunakan di Teknik Elektro Fakultas Teknik Universitas Negeri
Semarang.
2. Menguji kelayakan sistem collecting file skripsi berbasis web berdasarkan
pengujian ahli dan black-box testing.
3. Menganalisis tingkat keakuratan pengklasifikasian file mengguanakan
algoritma cosine similarity.
1.5 Manfaat Penelitian
Penelitian ini dilakukan dengan harapan dapat memberikan manfaat,
diantaranya :
1.5.1 Manfaat Bagi Peneliti
Untuk meningkatkan keterampilan dan memperluas pandangan penulis
dalam mempraktikan teori tentang sistem informasi web yang telah
diterima selama di bangku kuliah.
1.5.2 Manfaat Bagi Instansi (Jurusan Teknik Elektro UNNES)
a. Memudahkan administrasi arsip jurusan dalam pengelolaan data file
skripsi.
b. Memudahkan pengelolaan data oleh kepala laboratorium maupun
pimpinan lainnya.
c. Mengurangi banyaknya limbah elektronik yang ada di Teknik Elektro.
9
1.5.3 Manfaat Bagi Pengguna
a. Penelitian ini diharapkan dapat mempermudah calon wisudawan
sebagai pengguna dalam melakukan pengumpulan dokumen skripsi ke
Jurusan Teknik Elektro.
b. Mempermudah pengguna khususnya mahasiswa dalam mengakses
referensi yang dibutuhkan.
1.6 Sistematika Penulisan
Secara keseluruhan, sistematika penulisan pada penelitian ini adalah
sebagai berikut:
1. Bab I Pendahuluan
Berisi latar belakang masalah, rumusan masalah, pembatasan masalah,
tujuan penelitian, manfaat penelitian dan sistematika penulisan penelitian.
2. Bab II Landasan Teori
Berisi penjabaran teori, dan telaah pustaka berdasarkan teori yang relevan
untuk digunakan sebagai bahan acuan dalam penelitian serta kerangka berfikir
dalam penelitian.
3. Bab III Metode Penelitian
Bab ini menjabarkan model pengembangan sistem yang akan dibuat, serta
sistematika perancangan dan pembuatan sistem dan pengolahan data klasifikasi
file skripsi dengan algoritma cosine simialrity.
10
4. Bab IV Hasil dan Pembahasan
Bab ini akan membahas tentang hasil dari model pengembangan yang
digunakan dalam perancangan dan pembuatan sistem serta data perhitungan
pengolahan file skripsi dengan algoritma cosine simialrity.
5. Bab V Simpulan dan Saran
Berisi tentang kesimpulan dari hasil penelitian dan saran.
11
BAB II KAJIAN
PUSTAKA
2.1 Penelitian Terdahulu
Penelitian terdahulu yang relevan merupakan hal yang cukup penting
untuk dijadikan data pendukung dalam melaksanakan penelitian karena
didalamnya terdapat acuan yang merupakan teori atau hasil dari bagian penelitian.
Penelitian tentang sistem digitalisasi dalam pengarsipan sudah banyak dilakukan.
Kemudian penelitian tentang penggunaan algoritma Cosine Similarity dalam
berbagai model juga sudah dilakukan. Namun penelitian sistem digitalisasi
dokumen arsip dengan pengklasifikasian dokumen menggunakan algoritma
Cosine Similarity belum pernah dilakukan. Untuk itu peneliti ingin melakukan
penelitian tersebut.
Sutirman (2015) melakukan penelitian dengan judul “Urgensi Menejemen
Arsip Elektronik”. Penelitian ini menjelaskan tentang pentingnya menjaga
keutuhan arsip karena arsip sangat penting bagi sebuah organisasi sebagai bahan
pengambilan keputusan dan informasi oleh organisasi. Penggunaan arsip
elektronik memudahkan pencarian file, mengurangi resiko kerusakan file dan
mempermudah kegiatan berbagi arsip. Sutirman mengemukakan bahwa
pengarsipan secara elektronik dapat mengurangi persoalan arsip yang tiap waktu
semakin bertambah banyak jumlahnya.
Bambang (2014) melakukan penelitian yang berjudul “Digitalisasi File
Dokumen Penting Sebagai File Local Interest Dengan Soft Komputing Sebagai
12
Daya Dukung Informasi Berbasis ICT”. Penelitian ini menjelaskan tentang
pentingnya menjaga ketersediaan data-data yang urgent. Dengan mengubah
dokumen dalam bentuk kertas menjadi bentuk digital karena bentuk digital tidak
akan mengalami kerusakan fisik seperti dokumen dalam bentuk kertas. Bambang
melakukan konversi kertas menjadi dokumen dengan melakukan proses scanning
serta mengkonversikan kedalam bentuk PDF. Kemudian data tersebut disimpan
dan dikelola dalam satu database yang terpadu guna mempermudah pengelolaan
data.
Rangga dkk (2015) dengan penelitiannya yang berjudul “Desain Sistem
Informasi Perpustakaan Digital” menjelaskan bahwa banyaknya referensi dalam
bentuk cetak membuat calon pembaca memerlukan waktu lama dalam pencarian
fererensi. Selain itu seiring bertambahnya buku juga akan mempengaruhi
kebutuhan luas ruangan penyimpanan. Akses pengguna pada perpustakaan juga
akan terbatas pada waktu-waktu tertentu saja. Maka dari itu Rangga dkk membuat
sistem perpustakaan digital untuk memudahkan calon pembaca serta pengelola
perpustakaan dalam pengolahan data.
Ogie dkk (2016) dengan penelitiannya yang berjudul “Perbandingan
Metode Cosine Similarity dengan Metode Jaccard Similarity pada Aplikasi
Pencarian Terjemahan Al-Qur’an dalam Bahasa Indonesia” menjelaskan bahawa
metode cosine similarity mempunyai konsep normalisasi panjang vektor data
dengan membandingkan N-gram yang sejajar satu sama lain dari 2 pembanding
sehingga menghasilkan persentase ketepatan pencarian yang tinggi. Data latih
yang digunakan adalah sejumlah 6236 dokumen dan 30 kata kunci untuk
13
kemudian diuji coba pada masing-masing algoritma. Ogie dkk menyimpulkan
berdasarkan penelitian yang dilakukannya bahwa pencarian dengan metode cosine
similarity memiliki nilai kemiripan 41%, metode jaccard similarity 19%, dan
metode KNN 40%.
Diki dkk (2016) dengan penelitiannya yang berjudul “Pemanfaatan Vector
Space Model pada Penerapan Algoritma Nazief Adriani, KNN dan Fungsi
Similarity Cosine untuk Pembobotan IDF dan WIDF pada Prototype Sistem
Klasifikasi Teks Bahasa Indonesia”. Diki dkk membandingkan keefektifan antara
pembobotan IDF dan WIDF dengan menggunakan algoritma cosine similarity
serta KNN. Data latih yang digunakan adalah teks berita yang terbagi atas 3
kategori. Masing-masing kategori terdiri atas 3 dokumen. Hasil dari penelitian ini
adalah persentase ketepatan pembobotan dengan IDF adalah sebesar 70,7% dan
pembobotan dengan WIDF sebesar 70,6%.
2.2 Landasan Teori
2.2.1 Sistem
a. Definisi Sistem
Pengertian sistem menurut beberapa ahli yaitu, Menurut Tata Sutabri
(2012:6) pada buku Konsep Sistem Informasi, pada dasarnya sistem adalah
sekelompok unsur yang erat hubungannya satu dengan yang lain, yang berfungsi
bersama-sama untuk mencapai tujuan tertentu.
Selanjutnya Menurut McLeod (2004) dikutip oleh Yakub dalam buku
Pengantar Sistem Informasi (2012:1) mendefiniskan sistem adalah Sekelompok
14
elemen-elemen yang terintegrasi dengan tujuan yang sama untuk mencapai tujuan.
Sistem juga merupakan suatu jaringan kerja dari prosedur-prosedur yang saling
berhubungan, terkumpul bersama-sama untuk melakukan suatu kegiatan atau
untuk tujuan tertentu.
b. Perancangan Sistem
Aktivitas perancangan sistem secara terstruktur menurut Husni dkk
(1997:6) dalam bukunya yang berjudul Pengantar Perancangan Sistem
melingkupi:
1. Survey; berfungsi untuk mengetahui kebutuhan kesalahan-kesalahan dalam
sistem lama, menetapkan tujuan perancangan, mengajukan usulan otomasi
sistem yang layak dan dapat diterima, dan menyiapkan laporan survey.
2. Analisa sistem; menggabungkan saporan survey dan kebijakan pemakai
menjadi spesifikasi yang terstruktur dengan menggunakan pemodelan.
3. Desain; mengimplementasikan model yang diinginkan pemakai.
4. Implementasi; merepresentasikan hasil desain kedalam pemrograman.
5. Uji coba desain; mrngujicoba seluruh spesifikasi terstruktur.
6. Testing akhir; mengujicoba sistem secara keseluruhan.
7. Deskripsi prosedur; pembuatan laporan teknis tertulis seperti petunjuk
pemakaian dan pengoperasian.
8. Konversi database; mengkonversi data.
9. Instalasi; mencakup serah terima manual book, perangkat serta pelatihan
pemakaian.
15
2.2.2 Basis Data
a. Konsep Dasar Basis Data
Basisdata adalah data-data yang diolah dalam SIBK disimpan dalam media
penyimpan sekunder dengan cara-cara tertentu sehingga mudah untuk digunakan
dan ditampilkan kembali (Edhy, 2011:2).
Basisdata adalah kumpulan data yang secara logik berkaitan dalam
merepresentasikan fenomena/fakta secara terstruktur dalam domian tertentu dalam
mendukung aplikasi pada sistem tertentu. Basisdata merupakan komponen utama
sistem informasi karena semua informasi untuk pengambilan keputusan berasal
dari data di basisdata (Bambang, 20014:4). Basisdata memiliki peran penting bagi
suatu organisasi karena basisdata menyimpan data-data dan informasi yang
penting dan urgent mengenai organisasi tersebut.
b. Komponen Dasar Basis Data
1. Data
Data di dalam sebuah basisdata dapat disimpan secara terintegrasi
(integrated) dan data dapat dipakai secara bersama-sama (shared).
2. Hardware
Terdiri dari semua perangkat komputer yang digunakan untuk pengolahan
sistem basisdata, berupa peralatan untuk penyimpanan basisdata (secondary
storage) dan peralatan input serta output.
16
3. Software
Berfungsi sebagai perantara (interface) antara pemakai dengan data fisik
pada basisdata. Software pada basisdata dapat berupa DBMS (Database
Management System) ataupun program-program aplikasi dan prosedur-prosedur.
4. User atau pemakai
a) Database Administrator, seseorang ataupun tim yang bertugas mengelola
sistem basisdata secara keseluruhan.
b) Programmer, seseorang atau tim yang bertugas membuat program
aplikasi.
c) End User, orang yang mengakses basisdata melalui terminal dengan
bahasa pemrograman atau program aplikasi yang dibuat oleh programmer.
2.2.3 Perangkat Analisis dan Perancangan Sistem
Perangkat yang digunakan dalam analisis dan perancangan sistem yaitu
Activity Diagram, Use Case Diagram, DFD dan Flowchart.
a. DFD
DFD adalah model dari sistem untuk menggambarkan pembagian sistem
ke modul yang lebih kecil. Salah satu keuntungan menggunakan DFD adalah
memudahkan pemakai atau user yang kurang menguasai bidang komputer untuk
mengerti sistem yang akan dikerjakan (Edhy, 2011:2).
Tingkatan DFD dimulai dari diagram konteks yang menjelaskan secara
umum suatu sistem atau batasan sistem aplikasi yang akan dikembangkan.
Kemudian DFD dikembangkan menjadi DFD tingkat 0 atau level 0 dan kemudian
17
DFD level 0 dikembangkan lagi menjadi level 1 dan selanjutnya sampai sistem
tersebut tergambarkan secara rinci menjadi tingkatan-tingkatan lebih rendah lagi.
Simbol-simbol yang digunakan dalam Data Flow Diagram menurut notasi
Yourdan adalah sebagai berikut :
1. Proses
Proses dilambangkan dengan lingkaran, dimana proses ini menunjukan
bagian dari sistem yang mengubah satu atau lebih input dan output. Nama proses
dituliskan dengan satu kata, singkatan atau kalimat sederhana.
Gambar 2.1 Simbol Proses
2. Aliran Data
Aliran data direpresentasikan dengan menggunakan panah yang menuju ke
atau dari proses. Aliran data juga digunakan untuk menunjukan bagian-bagian
informasi dari satu bagian ke bagian lain. Pembagian nama untuk aliran ini
menunjukan sebuah arti untuk sebuah aliran. Untuk kebanyakan sistem yang
dibuat, aliran data sebenarnya mengambarkan data yakni angka, huruf, pesan,
floating point, dan macam-macam informasi lainnya.
Gambar 2.2 Simbol Aliran Data
18
3. Penyimpanan Data
Simpanan data digunakan sebagai penyimpanan bagi paket-paket data.
Notasi penyimpanan data digambarkan dengan garis horizontal yang pararel.
Simpanan data merupakan simpanan data dari data yang berupa suatu file atau
database di sistem komputer ataupun berupa arsip atau catatan manual. Nama dari
simpanan data menunjukan nama filenya.
Gambar 2.3 Simbol Penyimpanan Data
4. Entitas Luar
Entitas luar digambarkan dengan sebuah kotak yang menggambarkan
kesatuan luar (eksternal entitty) yang berhungan dengan sistem. Kesatuan luar
merupakan kesatuan dilingkungan luar sistem yang dapat berupa orang, organisasi
atau sistem lainnya yang berada di lingkungan luarnya yang akan memberikan
input atau output dari sistem.
Gambar 2.4 Simbol Entitas
b. ERD
Entity Relationship Diagram atau biasa dikenal dengan diagram E-R
secara grafis menggambarkan isi sebuah database. Diagram ini memiliki dua
19
komponen utama yaitu entity dan relasi. Untuk melambangkan fungsi diatas maka
digunakan simbol-simbol yang bisa dilihat pada daftar simbol. Elemen-elemen
Entity Relationship Diagram adalah sebagai berikut:
1. Entitas (Entity)
Pada E-R diagram, entitas digambarkan dengan sebuah bentuk persegi
panjang. Entitas adalah sesuatu apa saja yang ada didalam sistem, nyata maupun
abstrak dimana data tersimpan. Entitas diberi nama dengan kata benda dan dapat
dikelompokan dalam empat jenis nama, yaitu : orang, benda, lokasi kejadian
(terdapat unsur waktu didalamnya).
Entitas
Gambar 2.5 Simbol Entitas
2. Relasi
Pada E-R diagram, relasi dapat digambarkan dengan sebuah bentuk belah
ketupat. Relasi adalah hubungan alamiah yang terjadi antara entitas. Pada
umumnya relasi diberi nama dengan kata kerja dasar, sehinga memudahkan untuk
melakukan pembacaan relasinya.
Relasi
Gambar 2.6 Simbol Relasi
20
2.2.4 Perangkat Pendukung
a. XAMPP
XAMPP merupakan sebuah tool yang beberapa paket perangkat lunak ke
dalam satu buah paket. Dengan menginstall XAMPP maka tidak perlu lagi
melakukan instalasi dan konfigurasi web server Apache, PHP dan MySQL secara
manual. XAMPP akan menginstalasi dan mengkonfigurasikannya secara otomatis
untuk anda. XAMPP terdiri dari:
1. Apache
Apache bersifat open source, artinya setiap orang boleh menggunakannya,
mengambil dan bahkan mengubah kode programnya. Tugas utama apache adalah
menghasilkan halaman web yang benar kepada user, berdasarkan kode PHP yang
dituliskan oleh pembuat halaman web. Jika diperlukan juga berdasarkan kode
PHP yang dituliskan, maka dapat saja suatu database diakses terlebih dahulu
untuk mendukung halaman web yang dihasilkan.
2. PHP
PHP merupakan bahasa pemrograman untuk mebuat web yang bersifat
server-side scripting. PHP memungkinkan kita untuk membuat halaman web yang
bersifat dinamis. PHP dapat dijalankan pada berbagai macam Operating System
(OS), misalnya Windows, Linux dan Mac OS. Selain Apache, PHP juga
mendukung beberapa web server lain, misalnya Microsoft IIS, Caudium, PWS
dan lain-lain. Sistem manajemen database yang sering digunakan bersama PHP
adalah MySQL. Namun PHP juga mendukung sistem manajemen Database
Oracle, Microsoft Acces, Interbase, d-Base, PostgreSQL dan sebagainya.
21
Hingga kini PHP sudah berkembang hingga versi ke 5. PHP 5 mendukung
penuh Object Oriented Programing(OOP), integrasi XML, mendukung semua
ekstensi terbaru MySQL, pengembangan web services dengan SOAP dan REST,
serta ratusan peningkatan kemampuan lainnya dibandingkan versi sebelumnya.
Sama dengan web server lainnya PHP juga bersifat open source sehingga setiap
orang dapat menggunakannya dengan gratis.
3. MySQL
Pada awal perkembangannya disebut SQL yang merupakan kepanjangan
dari Structured Query Language. SQL merupakan bahasa terstruktur yang khusus
digunakan untuk mengolah database. SQL pertama kali didefinisikan oleh
American National Standards Institute (ANSI) pada tahun 1986. MySQL adalah
sebuah sistem manajemen database yang bersifat open source. MySQL adalah
pasangan serasi dari PHP. MySQL dibuat dan dikembangkan oleh MySQL AB
yang berada di Swedia.
MySQL dapat digunakan untuk membuat dan mengola database beserta
isinya. Kita dapat memanfaatkan MySQL untuk menambahkan, mengubah dan
menghapus data yang berada dalam database. MySQL merupakan sisitem
manajemen database yang bersifat at relational. Artinya data-data yang dikelola
dalam database akan diletakkan pada beberapa tabel yang terpisah sehingga
manipulasi data akan menjadi jauh lebih cepat.
MySQL dapat digunakan untuk mengelola database mulai dari yang kecil
sampai dengan yang sangat besar. MySQL juga dapat menjalankan perintah-
perintah Structured Query Language (SQL) untuk mengelola database-database
22
yang ada di dalamnya. Hingga kini, MySQL sudah berkembang hingga versi 5.
MySQL 5 sudah mendukung trigger untuk memudahkan pengelolaan tabel dalam
database.
4. PHP My Admin
Pada dasarnya mengelola database dengan MYSQL harus dilakukan
dengan mengetikkan baris-baris perintah yang sesuai (command line) untuk setiap
maksud tertentu. Saat ini banyak sekali perangkat lunak yang dapat dimanfaatkan
untuk mengelola database dalam MySQL, salah satunya adalah phpMyAdmin.
Dengan phpMyAdmin kita dapat membuat tabel, mengisi data dan lain-lain
dengan mudah tanpa harus hafal perintahnya.
2.2.5 Metode Pengujian Perangkat Lunak
a. Pengujian Black-Box
Pengujian black-box berfokus padapersyaratan fungsional perangkat lunak.
Dengan demikian, pengujian black-box memungkinkan perekayasa perangkat
lunak mendapatkan serangkaian kondisi input yang sepenuhnya menggunakan
semua persyaratan fungsional untuk suatu program. Pengujian black-box bukan
merupakan alternatif dari teknik pengujian white box, tetapi merupakan
pendekatan yang mampu mengungkapkan kelas kesalahan daripada metode
pengujian white-box. (Pressman, 2002: 551).
Pengujian black-box berusaha menemukan kesalahan dalam kategori
sebagai berikut:
1. Fungsi-fungsi yang tidak benar atau hilang
2. Kesalahan interface
23
3. Kesalahan dalam struktur data atau akses database eksternal
4. Kesalahan kinerja
5. Instalasi dan kesalahan terminasi
2.2.6 Pengarsipan Dokumen
Arsip adalah rekaman kegiatan atau peristiwa dalam berbagai bentuk
media sesuai dengan perkembangan teknologi informasi dan komunikasi dibuat
dan diterima oleh lembaga negara, pemerintah daerah, lembaga pendidikan,
perusahaan, organisasi politik, organisasi kemasyarakatan, dan perseorangan
dalam pelaksanaan kehidupan bermasyarakat, berbangsa, dan bernegara ( UU
No.43 Tahun 2009 Tentang Kearsipan). Suatu arsip harus dikelola dengan baik
karena nilai dan tingkat kepentingannya berbeda-beda, baik untuk kepentingan
yuridis, bukti historis, maupun kepentingan transaksi bisnis (Sutirman, 2015:99).
Salah satu solusi untuk meningkatkan efektivitas dan efisiensi manajemen
arsip pada suatu organisasi adalah dengan menerapkan sistem manajemen arsip
elektronik (Sutirman, 2015:13). Dokumen dalam bentuk elektronika digital sudah
menjadi kebutuhan dan tuntutan dijaman era teknologi sistem informasi.
Kelebihan dokumen digital disbanding dengan analaog adalah sistem digital lebih
mudah dirancang, informasi lebih mudah disimpan, lebih menghemat ruangan,
dapat diakses oleh banyak orang dalam waktu yang bersamaan, tidak dibatasi oleh
ruang dan waktu, dokumen yang tersimpan dapat diakses dengan cepat dan
akurat, dan yang terakhir dokumen dapat berbentuk file multimedia (Bambang,
2014:3).
24
Pengarsipan dokumen elektronik perlu dikelola secara elektronik untuk
mendapatkan manfaat yang maksimal, antara lain :
1. Pengumpulan informasi yang lebih baik, konsisten dan mudah dicari kembali
2. Memudahkan penggunaan dokumen secara bersama antar unit organisasi
3. Memudahkan penyusunan informasi organisasi secara terstruktur
4. Memudahkan pengambilan keputusan yang lebih cepat dan akurat
5. Meningkatkan kualitas layanan.
6. Mengelola informasi sebagai suatu aset yang tumbuh dan berkembang
7. Lebih responsif pada perubahan (Miftakhul, 2010)
2.2.7 Pengklasifikasian Dokumen
Salah satu permasalahan yang muncul dengan semakin banyaknya
informasi yang ada di dalam situs adalah bagaimana mengorganisasi dan
mengolah data dan konten yang ada menjadi informasi yang dapat digunakan oleh
pengguna. Oleh karena itu, diperlukan aplikasi yang dapat membantu pengunjung
sebuah situs web untuk mencari konten yang sesuai dengan keinginan pengguna.
Salah satu metode yang digunakan adalah dengan klasifikasi dokumen atau
klastering dokumen.
Clustering dokumen adalah proses pengelompokan dataset dokumen yang
merujuk pada similarity (kemiripan) pola data dokumen ke dalam suatu cluster,
sedangkan yang tidak memiliki kemiripan akan dikelompokkan ke dalam cluster
yang lain (Ardytha dkk, 2014). Terdapat beberapa teknik untuk pengklasifikasian
teks, antara lain NaïveBayes, K-Nearest Neighbor, Decision Tree,dan vector space
25
model. Dengan menggunakan Text Classification and Mining dan teknik temu
kembali informasi diharapkan dapat membantupengguna mendapatkan informasi
implisit yang ada pada data konten teks (Favorisen, 2013).
Sistem pencarian informasi secara tradisional yang tidak menggunakan
klastering dokumen tidak akan cukup untuk menangani sejumlah dokumen
dengan volume yang besar. Pengklasteran dokumen berguna untuk melengkapi
sistem pencarian informasi secara tradisional dengan cara mengelompokkan
dokumen berdasarkan topik.
2.2.8 Text Mining
Text Mining adalah sebuah penerapan yang berasal dari information
retrieval (IR) dan natural language processing (NLP). Definisi text mining secara
sempit hanya berupa metode yang dapat menemukan informasi baru yang tidak
jelas atau mudah diketahui dari sebuah kumpulan dokumen. Sedangkan secara
lebih luas, text mining mencakup teknik text-processing yang lebih umum, seperti
pencarian, pengambilan intisari, dan pengkategorian (Radiant dkk, 2014).
Dalam text mining, data teks akan diproses menjadi data numerik agar
dapat dilakukan proses lebih lanjut. Sehingga dalam text mining ada istilah
preprocessing data, yaitu proses pendahulu yang diterapkan terhadap data teks
yang bertujuan untuk menghasilkan data numerik. Pada proses preprosesing
merupakan tahap dimana deskripsi di tangani untuk dapat siap diproses memasuki
tahap text mining (Ogie dkk, 2016). Tahap-tahap tersebut adalah sebagai berikut :
26
1. Parsing/Tokenizing
Parsing yaitu sebuah proses yang dilakukan seseorang untuk menjadikan
sebuah kalimat menjadi lebih bermakna atau berada dengan cara memecah
kalimat tersebut menjadi kata-kata atau frase-frase (“Parsing”).
2. Stopwords Removal/Filtering
Stopwords removal merupakan proses penghilangan kata tidak penting
pada deskripsi melalui pengecekan kata-kata hasil parsing deskripsi apakah
termasuk di dalam daftar kata tidak penting (stoplist) atau tidak. Jika termasuk di
dalam stoplist maka kata-kata tersebut akan di-remove dari deskripsi sehingga
kata-kata yang tersisa di dalam deskripsi di anggap sebagai kata-kata penting atau
keywords.
3. Stemming
Stemming digunakan untuk mengurangi ukuran dari suatu ukuran index
file. Misalnya dalam suatu deskripsi terdapat variant kata “memberikan”,
“diberikan”, “memberi” dan “diberi” hanya memiliki akar kata (stem) yaitu
“beri”. Ukuran file daftar index yang semula berjumlah lima record akan di-
reduce sehingga menjadi satu record saja.
4. Tagging
Tahap tagging merupakan tahap mencari bentuk awal atau root dari tiap
kata lampau atau kata hasil stemming yang bukan bahasa indonesia.
5. Analyzing
Tahap analyzing merupakan tahap penentuan seberapa jauh keterhubungan
antara kata-kata dengan dokumen yang ada.
27
2.2.9 Pembobotan Term Frequency – Invers Document Frequency (TF-IDF)
Tf-Idf yaitu perhitungan yang menggambarkan seberapa pentingnya kata
(term) dalam sebuah dokumen. Proses ini digunakan untuk menilai bobot
relevansi term dari sebuah dokumen terhadap seluruh dokumen. Term frequency
adalah ukuran seringnya kemunculan sebuah term dalam sebuah dokumen. IDF
merupakan banyaknya istilah tertentu dalam keseluruhan dokumen (Ogie dkk,
2016). Rumus Pembobotan TF-IDF yang dikemukakan oleh Musfiroh dkk (2013)
adalah sebagai berikut :
t f = 0,5 + 0,5 x
= log ( )
= x
Keterangan:
D = dokumen ke-d
t = term ke-t dari dokumen
W = bobot dokumen ke-d terhadap term ke-t
tf = banyaknya term i pada sebuah dokumen
idf = Inversed Document Frequency
df = banyak dokumen yang mengandung term i
2.2.10 Cosine Similarity
Consine Similarity digunakan untuk melakukan perhitungan kesamaan dari
dokumen. Rumus yang digunakan oleh consine similarity adalah (Jun Ye, 2014) :
28
Cos α =
=
Keterangan :
A : Vektor A, yang akan dibandingkan kemiripannya
B : Vektor B, yang akan dibandingkan kemiripannya
: dot produk antara vektor A dan vektor B
: panjang vektor A
|B| : panjang vektor B
|A||B| : cross product antara |A| dan |B|
116
BAB V
PENUTUP
5.1 Kesimpulan
Berdasarkan hasil penelitian dan pengembangan Sistem Collecting File
Skripsi di jurusan Teknik Elektro Universitas Negeri Semarang, maka dapat
diperoleh kesimpulan sebagai berikut :
1. Sistem Collecting File Skripsi telah berhasil dibangun menggunakan
algoritma cosine similarity untuk klasifikasi dokumen secara otomatis. Sistem
ini dibangun dengan dua level pengguna, yaitu level user dan level
administrator. Fitur yang diberikan untuk masing-masing level berbeda-beda,
user hanya dapat menginputkan data diri dan data skripsinya saja, sedangkan
administrator dapat melakukan rekapitulasi data dan pengelolaan data seperti
menambah (input), mengubah (edit) dan menghapus (delete) data dan
mencetak laporan.
2. Berdasarkan beberapa pengujian yang telah dilakukan pada sistem, hasil
pengujian black-box menunjukkan bahwa sistem dapat menjalankan fungsi-
fungsi dan fiturnya dengan sukses. Sedangkan berdasarkan uji validasi ahli
sistem diperoleh persentase kelayakan sebesar 88,3% yang berarti bahwa
sistem masuk dalam kriteria “sangat layak”. Berdasarkan hasil uji validasi
ahli kearsipan diperoleh persentase kelayakan sebesar 87,5% yang berarti
bahwa sistem masuk dalam kriteria “sangat layak”. Berdasarkan hasil uji user
responsive diperoleh persentase kelayakan sebesar 85,3% yang berarti bahwa
sistem masuk dalam kriteria “sangat layak”.
117
3. Berdasarkan hasil perbandingan klasifikasi yang dilakukan oleh sistem dan
klasifikasi secara manual, diperoleh sebesar 49 dari total 50 data yang
berhasil diklasifikasikan secara tepat oleh Sistem Collecting File Skripsi.
Data tersebut menunjukkan persentase ketepatan klasifikasi sebesar 98%
yang berarti sistem masih dianggap dapat mengklasifikasikan dokumen
secara “sangat tepat”.
118
5.2 Saran
Sistem Collecting File Skripsi ini masih memiliki kekurangan, bebrapa hal
yang disarankan untuk penelitian yang selanjutnya adalah sebagai berikut :
1. Apabila sistem ini benar-benar diterapkan di jurusan Teknik Elektro, maka
disarankan instansi terkait dapat menyediakan server untuk menyimpan data
arsip elektronik dokumen skripsi yang cukup memadai. Karena kapasitas data
mungkin akan memerlukan banyak ruang dalam database.
2. Sistem yang dikembangkan belum memiliki fasilitas publish / unpublish
sehingga semua dokumen skripsi yang diunggah oleh mahasiswa ditampilkan
seluruhnya oleh sistem. Untuk penelitian selanjutnya sebaiknya ditambah
fasilitas publish / unpublish pada halaman admin untuk menentukan dokumen
mana yang akan ditampilkan di halaman user. Fasilitas ini digunakan untuk
memfilter dokumen yang bagus dan berkualitas dalam aspek tata penulisan
dan kualitas penelitian yang dilakukan agar mahasiswa selanjutnya dapat
menghasilkan karya ilmiah yang baik pula.
3. Untuk penelitian selanjutnya, disarankan dapat mempertimbangkan pemilihan
kata kunci yang digunakan sebagai term agar dapat meningkatkan kinerja
klasifikasi sistem nantinya. Selain itu perlu diperhatikan dalam pengolahan
kata dengan bahasa asing, sebaiknya diterjemahkan terlebih dahulu sebelum
diolah dengan algoritma cosine similarity.
119
DAFTAR PUSTAKA
Wahyono, S. 2013. Kebijakan Pengelolaan Sampah Elektronik dalam Lingkup
Global dan Lokal. Jurnal Teknologi dan Lingkungan Volume 14, Nomor
1.
Peraturan Rektor Universitas Negeri Semarang Nomor 27 Tahun 2012 Tata Kelola Kampus Berbasis Konservasi. 28 September 2012. Universitas
Negeri Semarang. Semarang.
Asmara, B. Panji. 2014. Digitalisasi Arsip Dokumen Penting sebagai File Local Interest (LI) dengan Soft Komputing Sebagai Daya Dukung Informasi Berbasis ICT. Jurnal Informatika Volume 2, Nomor 2.
Susandi, D. dan Sholahudin, U. 2016. Pemanfaatan Vector Space Model pada Penerapan Algoritma Nazief Adriani, KNN dan Fungsi Similarity Cosine untuk Pembobotan IDF dan WIDF pada Prototipe Sistem Klasifikasi Teks Bahasa Indonesia. Jurnal Teknologi Informasi Volume 3, Nomor 1.
Nurdiana, O., Jumadi., dan Nursantika, D. 2016. Perbandingan Metode Cosine Similarity dengan Metode Jaccard Similarity pada Aplikasi Pencarian Terjemahan Al-Qur’an dalam Bahasa Indonesia. Jurnal Online
Informatika Volume 1, Nomor 1.
Imbar, V., Radiant. Adelia, Ayub, M., dan Rehatta, A. 2014. Implementasi Cosine Similarity dan Algoritma Smith Waterman untuk Mendeteksi Kemiripan Teks. Jurnal Informatika Volume 10, Nomor 1.
Kurniawan, A. Solihin, F., dan Hastarita, F. 2014. Perancangan dan Pembuatan Aplikasi Pencarian Informasi Beasiswa dengan Menggunakan Cosine Similarity. Jurnal SimanteC Volume 4, Nomor 2.
Sugiyamta. 2015. Sistem Deteksi Kemiripan Dokumen dengan Algoritma Cosine Similarity dan Single Pass Clustering. Jurnal Informatika Volume 7,
Nomor 2.
Thada, V. dan Jaglan, V. 2013. Comparison of Jaccard, Dice, Cosine Similarity Coefficient To Find Best Fitness Value for Web Retrieved Documents Using Genetic Algorithm. International Journal of Innovation in
Engineering and Technology Volume 2, Issue 4.
120
Singh, A. Dabas, C., dan Gupta, J., P. 2016. Cosine Similarity with Centroid Implication for Text Clustering of Document Files. Indian Journal of
Science and Technology Volume 9.
Sutirman. 2015. Urgensi Menejemen Arsip Elektronik. Jurnal Efisiensi Volume 8,
Nomor 1.
Hikmawan, A., Rangga. Astuti, S., Endang., dan Riyadi. 2015. Desain Sistem Informasi Perpustakaan Digital (Studi Kasus SMA Negeri 1 Pasuruan). Jurnal Administrasi Bisnis Volume 28, Nomor 2.
Sutabri, T. 2012. Konsep Sistem Informasi (Buku 1). Yogyakarta : Andi.
Yakub. 2012. Pengantar Sistem Informasi, Yogyakarta : Graha Ilmu.
Sutamta, E. 2011. Model Integrasi Database Penduduk Indonesia dengan
Berbagai Sistem Informasi Berbasis Komputer. Jurnal Informatika Volume
5, Nomor 2.
Undang-Undang Republik Indonesia Nomor 43 Tahun 2009 Kearsipan.
Amin, M. Miftakhul. 2010. Pengembangan Electronic Document Management System (EDMS) Sebagai Alternatif Pengarsipan di Perguruan Tinggi. Jurnal Informatika Volume 10, Nomor 2.
Luthfiartha, A. Zeniarja, J., dan Salam, A. 2014. Integrasi Peringkas Dokumen Otomatis dengan Algoritma Latent Semantic Analysis pada Peringkas Dokumen Otomatis untuk Proses Clustering Dokumen. Jurnal Teknologi
Informasi Volume 13, Nomor 1.
Kurniawan, B. Effendi, S. dan Sitompul, O. Salim. 2012. Klasifikasi Konten Berita dengan Metode Text Mining. Jurnal Teknologi Informasi Volume 1,
Nomor 1.
Nurjanah, M. Hamdani. dan Astuti, I. Fitri. 2013. Penerapan Algoritma Term Frequency-Inverse Document Frequency (TF-IDF) untuk Text Mining. Jurnal Informatika Volume 8, Nomor 3.
Ye, J. 2014. Vector Similarity Measures of Simplified Neutroshopic Sets and Their Application in Multicriteria Decision Making. Internasional Journal of
Fuzzy Systems Volume 16, Nomor 2.
Pramanik, S., dan Mondal, K. 2015. Cosine Similarity Measure of Rough Neutroshopic Sets and Its Application in Medical Diagnosis. Global
Journal of Advanced Research Volume 2, Issue 1.
121
Nnorom, I. Chidi, dan Osibanjo, O. 2008. Electronik Waste (e-waste): Material Flows and Management Practices in Nigeria. Journal Waste Management.
Endra, R. Yuli., Rizal, U., dan Ariyani, F. 2016. E-Arsip Berbasis Image Archives
Management Process Model untuk Meningkatkan Efektifitas Pengelolaan Arsip. Jurnal Sistem Informasi dan Telematika.
Pressman, Roger S. 1997. Software Engineering: A Practitioner’s Approach.
McGraw-Hill. Terjemahan LN. Harnaningrum. 2002. Rekayasa Perangkat Lunak Pendekatan Praktisi (Buku I). Edisi II. Andi. Yogyakarta.
Sugiyono. 2015. Metode Penelitian Pendidikan (Pendekatan Kuantitatif,
Kualitatif, dan R&D). Bandung. Alfabeta.
top related