Download - ANALISA PENENTUAN STATUS PRODUK NOT GOOD
i
ANALISA PENENTUAN STATUS PRODUK NOT GOOD
PADA PT ARIMURAYA INDONESIA MENGGUNAKAN
ALGORITMA NAIVE BAYES
Oleh:
SITI MASITOH NUR AZIZAH
311410623
PROGRAM STUDI TEKNIK INFORMATIKA
SEKOLAH TINGGI TEKNOLOGI PELITA BANGSA
BEKASI
2018
ii
ANALISA PENENTUAN STATUS PRODUK NOT GOOD
PADA PT ARIMURAYA INDONESIA MENGGUNAKAN
ALGORITMA NAIVE BAYES
Diajukan Sebagai Salah Satu Syarat Untuk Menyelesaikan
Program Strata Satu (S1) pada Program Studi Teknik Informatika
Oleh:
SITI MASITOH NUR AZIZAH
311410623
PROGRAM STUDI TEKNIK INFORMATIKA
SEKOLAH TINGGI TEKNOLOGI PELITA BANGSA
BEKASI
2018
iii
iv
v
vi
KATA PENGANTAR
Puji syukur penulis panjatkan ke hadiran Allah SWT. yang telah
melimpahkan segala rahmat dan hidayah-Nya, sehingga tersusunlah Skripsi yang
berjudul “ANALISA PENENTUAN STATUS PRODUK NOT GOOD PADA PT
ARIMURAYA INDONESIA MENGGUNAKAN ALGORITMA NAIVE
BAYES”.
Skripsi tersusun dalam rangka melengkapi salah satu persyaratan dalam
rangka menempuh ujian akhir untuk memperoleh gelar Sarjana Komputer
(S.Kom) pada Program Studi Teknik Informatika di Sekolah Tinggi Teknologi
(STT) Pelita Bangsa.
Penulis sungguh sangat menyadari, bahwa penulisan Skripsi ini tidak akan
terwujud tanpa adanya dukungan dan bantuan dari berbagai pihak. Sudah
selayaknya, dalam kesempatan ini penulis menghaturkan penghargaan dan ucapan
terima kasih yang sebesar-besarnya kepada:
1. Bapak Dr. Ir. Suprianto, M.P selaku Ketua STT Pelita Bangsa
2. Bapak Aswan Supriadi Sunge, S.Kom., M.Kom selaku Ketua Program Studi
Teknik Informatika STT Pelita Bangsa.
3. Bapak Elkin Rilvani, S.Kom., M.M selaku dosen pembimbing 1 yang telah
banyak memberikan arahan dan bimbingan kepada penulis dalam penyusunan
Skripsi ini.
4. Bapak Ir. Tri Ngudi Wiyatno., M.T Selaku dosen pembimbing 2 yang telah
memberikan saran dan bantuan selama penulisan pada penyusunan skripsi ini.
vii
5. Seluruh Dosen STT Pelita Bangsa yang telah membekali penulis dengan
wawasan dan ilmu di bidang teknik informatika.
6. Seluruh staf STT Pelita Bangsa yang telah memberikan pelayanan terbaiknya
kepada penulis selama perjalanan studi jenjang Strata 1.
7. Rekan-rekan mahasiswa STT Pelita Bangsa, khususnya angkatan 2014, yang
telah banyak memberikan inspirasi dan semangat kepada penulis untuk dapat
menyelesaikan studi jenjang Strata 1.
8. Bapak, Ibu, dan keluarga tercinta yang senantiasa mendo’akan dan
memberikan semangat dalam perjalanan studi Strata 1 maupun dalam
kehidupan penulis.
9. Semua pihak yang tidak dapat penulis sebut satu persatu, yang telah
memberikan bantuan moral dan spiritual, atas keikhlasannya penulis ucapkan
terima kasih.
Akhir kata, penulis mohon maaf atas kekeliruan dan kesalahan yang
terdapat dalam Skripsi ini dan berharap semoga Skripsi ini dapat memberikan
manfaat bagi khasanah pengetahuan Teknologi Informasi di lingkungan STT
Pelita Bangsa khususnya dan Indonesia pada umumnya.
Bekasi, November 2018
Penulis
viii
ABSTRACT
Not Good product status category data. This happened repeatedly and
caused a buildup of Not Good product data which affected the uncertainty of
product status. This study aims to classify the Okay or Not Good product category
data by utilizing the data mining process using classification techniques. The
method used is CRISP-DM through the process of business understanding,
understanding data, data preparation, modeling, evaluation and deployment. The
algorithm used for graduation classification is the Naïve Bayes algorithm. Naïve
Bayes is a simple probabilistic based prediction technique based on the
application of Bayes theorems or rules assuming strong independence in features,
meaning that a feature in a data is not related to the presence or absence of other
features in the same data. Implementation using RapidMiner 8.2 is used to help
find accurate values. The attributes used are Product Name, Color, Cooking
Time, Type, Cooking Tools, Weight, and Status. The results of this study are used
as one of the basis for making decisions to determine Not Good products by Pt
Arimuraya Indonesia.
Keywords: data mining, category, classification, Naive Bayes algorithm
ix
ABSTRAK
Data kategori status produk Not Good. Hal tersebut terjadi secara berulang
dan menimbulkan penumpukan terhadap data produk Not Good sehingga
mempengaruhi ketidakpastian status produk. Penelitian ini bertujuan untuk
melakukan klasifikasi terhadap data kategori produk Oke atau Not Gooddengan
memanfaatkan proses data mining dengan menggunakan teknik klasifikasi.
Metode yang digunakan adalah CRISP-DM dengan melalui proses business
understanding, data understanding, data preparation, modeling, evaluation dan
deployment. Algoritma yang digunakan untuk klasifikasi kelulusan adalah
algoritma Naïve Bayes. Naïve Bayes merupakan teknik prediksi berbasis
probabilistik sederhana yang berdasar pada penerapan teorema atau aturan bayes
dengan asumsi independensi yang kuat pada fitur, artinya bahwa sebuah fitur pada
sebuah data tidak berkaitan dengan ada atau tidaknya fitur lain dalam data yang
sama. Implementasi menggunakan RapidMiner 8.2 digunakan untuk membantu
menemukan nilai yang akurat. Atribut yang digunakan adalah Nama Produk,
Warna, Waktu Pemasakan, Jenis, Alat Pemasakan, Berat, dan Status. Hasil dari
penelitian ini digunakan sebagai salah satu dasar pengambilan keputusan untuk
menentukan produk Not Good oleh Pt Arimuraya Indonesia.
Kata Kunci : data mining, kategori, klasifikasi, algoritma Naive Bayes
x
DAFTAR ISI
PERSETUJUAN .................................................... Error! Bookmark not defined.
PENGESAHAN ..................................................................................................... iii
PERNYATAAN KEASLIAN PENELITIAN ....... Error! Bookmark not defined.
KATA PENGANTAR ........................................................................................... vi
DAFTAR ISI .......................................................................................................... ix
DAFTAR TABEL ................................................................................................. xii
DAFTAR GAMBAR ........................................................................................... xiii
BAB IPENDAHULUAN ........................................................................................ 1
1.1 Latar Belakang ......................................................................................... 1
1.2 Masalah Penelitian ................................................................................... 3
1.2.1 Identifikasi Masalah .......................................................................... 3
1.2.2 Pembatasan masalah.......................................................................... 4
1.2.3 Rumusan Masalah ............................................................................. 4
1.3 Tujuan dan Manfaat Penelitian ................................................................. 4
1.3.1 Tujuan Penelitian .............................................................................. 4
1.3.2 Manfaat Penelitian ............................................................................ 4
1.4 Sistematika Penulisan ............................................................................... 5
BAB IITINJAUAN PUSTAKA .............................................................................. 7
2.1 Tinjauan Objek Penelitian ........................................................................ 7
2.1.1 Analisa............................................................................................... 7
2.1.2 Produk ............................................................................................... 7
2.2 Tinjauan Penelitian ................................................................................... 8
2.3 Tinjuan Studi .......................................................................................... 13
2.3.1 Pengertian Data mining ................................................................... 13
2.3.2 Fungsi Data Mining ........................................................................ 15
2.3.3 Model Data Mining ......................................................................... 17
2.3.4 Klasifikasi ....................................................................................... 17
2.3.5 Algoritma Naive Bayes ................................................................... 17
2.4 Tinjauan Perusahaan ............................................................................... 22
2.4.1 Gambaran Umum PT. Arimuraya Indonesia .................................. 22
xi
2.4.2 Visi dan Misi ................................................................................... 22
2.4.3 Kebijakan PT. Arimuraya Indonesia ............................................... 22
2.4.4 Struktur Organisasi ......................................................................... 23
2.5 Kerangka Pemikiran ............................................................................... 24
BAB IIIMETODOLOGI PENELITIAN............................................................... 25
3.1 Metode Penelitian ................................................................................... 25
3.2 Metode Pengumpulan Data .................................................................... 25
3.3 Teknik Analsisis Data ............................................................................ 27
3.4 Tahapan Penelitian ................................................................................. 32
3.5 Peralatan ................................................................................................. 34
3.6 Jadwal Penelitian .................................................................................... 35
BAB IVHASIL DAN PEMBAHASAN ............................................................... 38
4.1 Hasil ........................................................................................................ 38
4.2 Analisa algoritma Naive Bayes Implementasi dengan RapidMiner ....... 44
4.3 Evaluasi (Evaluation) ............................................................................. 47
BAB VPENUTUP ............................................................................................... 506
5.1 Kesimpulan ........................................................................................... 506
5.2 Saran ..................................................................................................... 506
DAFTAR PUSTAKA ......................................................................................... 517
LAMPIRAN .......................................................................................................... 58
xii
DAFTAR TABEL
Tabel 2.1 Literatur riview ................................................................................. 12
Tabel 2.2 Klasifikasi data mining, algoritma dan penerapannya. ..................... 16
Tabel 3.1 Data yang digunakan penelitian ........................................................ 28
Tabel 3.2 Atribut penelitian ............................................................................... 29
Tabel 3.3 Kegiatan penelitian ........................................................................... 35
Tabel 4.1 Data testing (random) ........................................................................ 39
Tabel 4.2 Penghitungan class atau label ............................................................ 40
Tabel 4.3 Penghitungan X1 ................................................................................ 41
Tabel 4.4 Penghitungan X2 ................................................................................ 42
Tabel 4.5 Penghitungan X3 ................................................................................ 43
Tabel 4.6 Penghitungan X4 ................................................................................ 43
Tabel 4.7 Penghitungan X5 ................................................................................ 44
Tabel 4.9 Penghitungan X7 ................................................................................ 46
Tabel 4.10 Penghitungan atribut Ok .................................................................. 41
Tabel 4.11 Penghitungan Variabel Ng .............................................................. 42
Tabel 4.13 Penghitungan Accuracy .................................................................. 44
xiii
DAFTAR GAMBAR
Gambar 2. 1 Data Mining in the Business Intelligence Context ........................... 15
Gambar 2.2 Skema Naive Bayes ........................................................................... 21
Gambar 2. 3 Struktur Organisasi ........................................................................... 23
Gambar 2. 4 Kerangka Pemikiran ......................................................................... 24
Gambar 3. 1 Siklus hidup CRISP-DM .................................................................. 27
Gambar 3. 2 Langkah Pengujian Metode .............................................................. 30
Gambar 3. 3 Tahapan Penelitian ........................................................................... 32
Gambar 4. 1 Import data kategori status produk ................................................... 44
Gambar 4. 2 Import data testing kategori status produk ....................................... 45
Gambar 4. 3 Proses permodelan Naive Bayes pada data kategori status produk .. 46
Gambar 4. 4 Proses apply model pada data kategori status produk ...................... 46
Gambar 4. 5 Hasil Performance Vektor ................................................................ 47
Gambar 4. 6 Hasil Accuracy ................................................................................. 48
Gambar 4. 7 Hasil Precision ................................................................................. 48
Gambar 4. 8 Hasil Recall ...................................................................................... 49
1
BAB I
PENDAHULUAN
1.1 Latar Belakang
PT. Arimuraya Indonesiaadalah perusahaan industri yang bergerak
dibidang makanan ini merupakan cabang perusahaan yang berpusat di Jepang.
“Menteri Perindustrian, Airlangga Hartarto, mengatakan pertumbuhan industri
makanan dan minuman (mamin) naik terus meningkat. Sebagai contoh di 2017
pertumbuhannya mencapai 9,23% atau naik dari 2016 yang sebesar 8,46%”
(Detik.com, 2018).
Perusahaan makanan dan minuman merupakan salah satu kategori sektor
industri di Bursa Efek Indonesia (BEI) yang mempunyai peluang untuk tumbuh
dan berkembang. Pengukuran tingkat efektifitas manajemen yang ditunjukkan
oleh laba yang dihasilkan dari penjualan dan dari pendapatan investasi, dapat
dilakukan dengan mengetahui seberapa besar rasioprofitabilitas yang dimiliki.
PT. Arimuraya Indonesia menghasilkan produk barang yang diproduksi
dan di setiap prosesnya maka ditemukan juga produk yang hasilnya tidak sesuai
dengan yang diharapkan dan akan menjadi produk gagal. Ketidaksesuaian dapat
diartikan sebagai suatu penyimpangan yang muncul dari standar yang sudah
ditetapkan. Ketidaksesuaian ini paling sering terjadi pada produk atau jasa baik
yang berasal dari supplier maupun dari sistem internal.
Ketidaksesuain terjadi karena tidak terpenuhinya spesifikasi dan
persyaratan yang telah ada. Persyaratan ini bisa datang dari pelanggan, badan
1
pengawas eksternal atau prosedur internal perusahaan sendiri.Dalam
mengidentifikasi ketidaksesuain dapat diketahui melalui keluhan pelanggan,
audit internal, audit eksternal, pemeriksaan bahan masuk atau selama kegiatan
pengujian dan inspeksi.
Di dalam standar sistem manajemen mutu ISO 9001:2008 klausul 8.3
disebutkan:”Organisasi harus memastikan bahwa produk yang tidak sesuai
dengan persyaratan produk diidentifikasi dan dikendalikan untuk mencegah
penggunaan atau penyerahan yang tidak dikehendaki. Prosedur
terdokumentasi harus ditetapkan untuk mendefinisikan pengendalian dan
tanggung jawab terkait kewenangan untuk menangani produk yang tidak sesuai”
Pengendalian produk tidak sesuai termasuk salah satu dari enam kegiatan
pooyang harus dibuatkan prosedur kerjanya atau lebih sering dikenal sebagai 6
prosedur wajib ISO 9001. Pada prosedur ini harus diatur apa yang perusahaan
anda lakukan apabila terjadi produk tidak sesuai.
Hal yang harus diperhatikan dalam pengendalian produk tidak sesuai
adalah sesuai dengan yang disebutkan dalam klausul “produk diidentifikasi dan
dikendalikan untuk mencegah penggunaan atau penyerahan yang tidak
dikehendaki”. Artinya, harus ada mekanisme identifikasi produk tidak sesuai
misalkan dengan cara pemberian “tag” atau label Not Good (NG), label Non-
Conforming Product (NCP), label “Reject”, atau dengan cara disediakan area
khusus produk tidak sesuai, atau pada beberapa perusahaan manufaktur dan
produksi disediakan keranjang khusus untuk produk tidak sesuai. Semua itu
1
dilakukan untuk menjamin barang rusak tidak sampai ke tangan pelanggan(
Konsultaniso, 2013).
Dalam penelitian ini digunakan metode Naive Bayes, Naives Bayes
menggunakan teori probabilitas sebagai dasar teori. Metode Naive Bayes juga
memiliki kinerja yang baik terhadap pengklasifikasikan data dokumen yang
mengandung angka maupun teks. Penelitian ini diharapkan mampu
menghasilkan klasifikasi yang akurat agar dapat dijadikan bahan penelitian lebih
lanjut karena tingkat akurasi yang tinggi.
Melihat latar belakang tersebut, dibuatlah sebuah penelitian dengan
algoritma Naive Bayes, dengan judul: "Analisa penentuan status produk Not
Good pada PT Arimuraya Indonesia menggunakan Algoritma Naive Bayes
".
1.2 Masalah Penelitian
1.2.1 Identifikasi Masalah
Permasalahan penelitian yang penulis ajukan ini dapat diidentifikasi
permasalahannya sebagai berikut:
1. Data penentuan barang Not Good belum tersedia hanya secara visual
dan catatan.
2. Karyawan sulit dalam menentukan barang Not Good.
3. Perusahaan membutuhkan sebuah dokumen tertulis sebagai patokan
kategori produk Not Good.
1
1.2.2 Pembatasan masalah
Adapun yang menjadi pembatasan masalah dari penelitian ini adalah
sebagai berikut :
1. Penelitian ini menggunakan klasifikasi data mining algoritma Naive
Bayes.
2. Penginputan data dan pengolahan data kategori penerapan produk Not
Good atau tidak dengan data yang didapat dari pencatatan tiap kali
produksi dan dirangkum menjadi data training.
1.2.3 Rumusan Masalah
Rumusan masalah dalam penelitian ini adalahbagaimana cara untuk
menentukankeputusan status produk Not Goodpada PT Arimuraya Indonesia.
1.3 Tujuan dan Manfaat Penelitian
1.3.1 Tujuan Penelitian
Tujuan dari dilakukannya penulisan penelitian ini sebagai alat untuk
menentukankeputusan status produk Not Goodpada PT Arimuraya Indonesia.
1.3.2 Manfaat Penelitian
Berikut manfaat penelitian:
1. Membantu perusahaan dalam status produk Not Good produksi.
2. Memudahkan perusahaan dalam penimbangan produk Not Good.
3. Menjadi pengetahuan terhadap karyawan.
1
1.4 Sistematika Penulisan
Adapun tata urut penulisan dan gambaran umum setiap bab dalam penulisan
ini adalah sebagai berikut:
BAB I PENDAHULUAN
Dalam bab ini dibahas secara umum tentang tentang Latar
Belakang,Masalah Penelitian, Pembatasan Masalah, Rumusan Masalah,
Tujuan dan Manfaat Penelitian, dan Tata-Urut Penulisan.
BAB II TINJAUAN PUSTAKA
Dalam bab ini berisi Pada bab ini berisi pembahasan tinjauan penelitian,
tinjauan studi, tinjauan objek penelitian, kerangka konsep/pola pikir
pemecahan masalah, serta hipotesis atau jawaban sementara dari penelitian
yang dilakukan.
BAB III METODOLOGI PENELITIAN
Pada bab ini berisi tentang Pembahasan Metode Penelitian, Metode
Pengumpulan Data, Teknik Analisis Data, Variabel yang digunakan,
Tahapan Penelitian, Peralatan, dan Jadwal Penelitian.
BAB IV HASIL DAN PEMBAHASAN
Pada bab ini berisi pembahasan tentang klasifikasi dengan algoritma Naive
Bayes, serta diuji dengan menggunakan Rapid Miner. Kemudian akan
dilakukan analisa terhadap hasil klasifikasi serta akurasi yang didapatkan.
1
BAB V PENUTUP
Pada bab ini berisi kesimpulan serta saran dari penelitian yang telah
dilakukan.
DAFTAR PUSTAKA
49
BAB II
TINJAUAN PUSTAKA
2.1 Tinjauan Objek Penelitian
2.1.1 Analisa
Analisa adalah sebuah kegiatan untuk mencari suatu pola selain itu analisis
merupakan cara berpikir yang berkaitan dengan pengujian secara sistematis
terhadap sesuatu untuk menentukan bagian, hubungan antar bagian dan
hubungannya dengan keseluruhan. Analisa adalah suatu usaha untuk mengurai
suatu masalah atau fokus kajian menjadi bagian-bagian (decomposition) sehingga
susunan/tatanan bentuk sesuatu yang diurai itu tampak dengan jelas dan
karenanya bisa secara lebih terang ditangkap maknanya atau lebih jernih
dimengerti duduk perkaranya (Satori dan Komariyah, 2014).
2.1.2 Produk
Kegiatan suatu perusahaan pasti memiliki produk tertentu yang dapat
ditawarkan kepada konsumen. Berikut adalah penjelasan lebih lengkap mengenai
produk. Produk adalah segala sesuatu yang dapat ditawarkan kepasar untuk
memenuhi kebutuhan dan keinginan konsumen.Produk yang dipasarkan meliputi
barang fisik, misalnya mobil makanan, pakaian, perumahan, barang elektronik dan
sebagainya. Produk yang ditawarkan juga bisa berupa orang, organisasi, dan
sebagainya (Sangadji ,2013).
Produk memiliki arti penting bagi perusahaan karena tanpa adanya produk,
perusahaan tidak akan dapat melakukan apapun dari usahanya. Konsumen akan
1
membeli produk bila merasa cocok, karena itu produk harus di sesuaikan dengan
keinginan ataupun kebutuhan pembeli agar pemasaran produk berhasil. Dengan
kata lain, pembuatan produk lebi baik diorientasikan pada keinginan pasar atau
selera konsumen. Kualitas produk merupakan seluruh gabungan karakteristik
produk dari pemasaran, rekayasa (perencanaan), pembuatan (produk) dan
pemeliharaan yang membuat produk yang digunakan memenuhi harapan harapan
pelanggan(Feingenbaum dalam Marwanto,2015).
2.2 Tinjauan Penelitian
Pada bab ini menjelaskan tentang tinjauan penelitian dari beberapa jurnal
yang terkait dengan penelitian serupa yang akan dilakukan oleh penulis. Sebelum
melakukan penelitian penulis terlebih dahulu melakukan tinjauan studi dari
penelitian lain dan penelitian tentang penentuan keputusan status produk Not
Good pada Pt Arimuraya Indonesia menggunakan Naive Bayes. Berikut adalah
beberapa penelitian yang terkait dengan masalah tersebut.
Penelitian yang pertama adalah penelitian yang berjudul algoritma Naive
Bayes untuk mencari perkiraan waktu studi mahasiswa. Lama studi dari
mahasiswa ini sangatlah penting bagi mahasiswa, program studi serta perguruan
tinggi. Permasalahan lama studi setiap mahasiswa bisa disebabkan atau
dipengaruhi oleh banyak faktor. Hal tersebut telah dibuktikan dengan beberapa
penelitian pada permasalahan tersebut yang mendapati sejumlah faktor yang
berpengatuh terhadap lama studi mahasiswa. Dengan menggunakan teknik data
mining khususnya klasifikasi untuk prediksi dengan algoritma Naive Bayes dapat
dilakukan prediksi terhadap ketepatan waktu studi dari mahasiswa berdasarkan
1
data training yang ada. Data training dan testing yang digunakan diambil secara
random pada tabel data master yang digunakan. Algoritma Naive Bayes,
menghitung perbandingan peluang antara jumlah dari masing- masng kriteria nilai
fields terhadap nilai hasil prediksi sesunggunya. Fungsi untuk prediksi dibuat
menggunakan Query pada MySql dalam bentuk function(fbayesian). Dari hasil uji
coba diperoleh tingkat kesalahan prediksi berkisar 20% sampai dengan 50%
dengan data training dan testing yang diambil secara random. Namun rata-rata
tingkat kesalahan berkisar 20 % hingga 34%. Tinggi rendahnya tingkat kesalahan
dapat disebabkan oleh jumlah record data dan tingkat konsistensi dari data
training yang dgunakan. Sedangkan hasil prediksi dari ketepatan lama studi dari
mahasiswa angkatan 2008 adalah sebesar 254 mahasiswa diprediksi ”Tepat
Waktu” dan sisanya yaitu 4 orang diprediksi ”Tidak Tepat Waktu” (Jananto,
2013).
Penelitian yang kedua adalah peneltian yang berjudul data mining
menggunakan algoritma Naive Bayes untuk klasifikasi kelulusan mahasiswa
Universitas Dian Nuswantoro. Data mahasiswa dan data kelulusan mahasiswa
Universitas Dian Nuswantoro menghasilkan data yang sangat berlumpah berupa
data profil mahasiswa dan data akademik. Hal tersebut terjadi secara berulang dan
menimbulkan penumpukan terhadap data mahasiswa sehinggu mempengaruhi
pencarian informasi terhadap data tersebut. Penelitian bertujuan untuk melakukan
klasifikasi terhadap data mahasiswa Universiteas Dian Nuswantoro Fakultas Ilmu
Konputer Angkatan 2009 berjenjang DIII dan S1 dengan memanfaatkan proses
data minng dengan menggunakan teknik klasfikasi. Metode yang digunkaan
1
adalah CRIPS-DM dengan melalui proses business understanding, data
understanding, data preparation, modeling, evaluation dan deplloyment.
algoritma yang digunakan untuk klasifikasi kelulusan adalah algoritma Naive
Bayes. Naive Bayes merupakan teknik prediksi berbasis probabilistik sederhana
yang berdasar pada penerapan teorema atau aturan bayes dengan asumsi
independensi yang kuat pada fitur, atrinya bahwa sebuah fitur pada sebuah data
tidak berkaitan dengan ada atau tidaknya fitur lain dalam data yang sama.
Implementasi menggunakan RapinMider 5.3 digunakan membantu menemukan
nilai yang akurat. Atribut yang digunakan adalah NIM, Nama, Jenjang, Progdi,
Provinsi Asal, Jenis Kelamin, SKS, IPK, dan Tahun Lulus. Hasil dari penelitian
ini digunakan sebagai salah satu dasar pengambilan keputusan untuk menentukan
kebijakan oleh pihak Fasilkom (Nugroho, 2013).
Penelitian yang ketiga adalah penelitian yang berjudul penerapan algoritma
Naive Bayes untuk mengklasifikasi data nasabah asuransi. Metode yang
digunakan pada penelitian ini adalah Algoritma Naive Bayes. Data mining adalah
teknik yang memanfaatkan data dalam jumlah yang besar untuk memperoleh
informasi berharga yang sebelumnya tidak diketahui dan dapat dimanfaatkan
untuk pengambilan keputusan penting. Pada penelitian ini, penulis berusaha
menambang data (data mining) nasabah sebuah perusahaan asuransi untuk
mengetahui lancar, kurang lancar atau tidak lancarnya nasabah tersebut. Data
yang ada dianalisis menggunakan algoritma Naive Bayes. Naive Bayes merupakan
salah satu meode pada probabilistic reasoning. Algoritma Naive Bayes bertujuan
untuk melakukan klasifikasi data pada kelas tertentu, kemudian pola tersebut
1
dapat digunakan untuk memperkirakan nasabah yang bergabung, sehingga
perusahaan bisa mengambil keputusan menerima atau menolak calon nasabah
tersebut (Bustami, 2014).
Penelitian yang ke empat adalah penelitian yang dilakukan oleh Naparin
yang berjudul Klasifikasi Peminatan Siswa SMA Menggunakan Naive Bayes.
Pilihan kelompok peminatan merupakan bagian penting dalam upaya pencapaian
SKL, KI, dan KD oleh peserta didik. Untuk membantu peserta didik mencapai
berbagai kompetensi yang diharapkan, pemilihan kelompok peminatan menjadi
bagian penting diusahakan setepat mungkin. Dengan demikian, proses
pengklasifikasian mengggunakan metode Naive Bayes yang memegang asumsi
akan hubungan antar fitur atau atributnya yang independen sehingga
menjadikannya lebih efektif untuk kategorisasi, sederhana, cepat dan
menghasilkan tingkat akurasi yang tinggi (Naparin,2016).
Penelitian yang ke lima adalah penelitian yang dilakukan oleh Bustami yang
berjudul penerapan algoritma Naive Bayes untuk mengklasifikasi data nasabah
asuransi. Metode yang digunakan pada penelitian ini adalah Algoritma Naive
Bayes.Papa dan Mama merupakan sebuah perusahaan yang bergerak pada bidang
industri pembuatan kue dan roti serta memasarkan hasil-hasil produksi tersebut ke
berbagai tempat. CV. Papa dan Mama Pastries mengalami kesulitan dalam
mengelola data-data mengenai persediaan roti dan penerimaan pesanan roti yang
sering kelebihan produksi dan kekurangan produksi karena data yang kurang
akurat. Untuk mendukung persediaan roti yang efektif perlu dirancang suatu
sistem berbasis Visual Basic 2010 yang dapat mengatasi masalah tersebut. Penulis
1
menerapkan metode Naive Bayes untuk memberikan solusi dalam memprediksi
persediaan roti dan penerimaan pesanan roti yang diambil berdasarkan data pada
tahun lalu. Sehingga, dapat membantu dalam menentukan persediaan stok roti
sesuai dengan kebutuhan dan keinginan serta menghasilkan alternatif pilihan stok
roti (Manalu et al, 2017).
Tabel 2.1 Literatur riview
No Peneliti Tahun Judul Metode Hasil
1 Jananto 2013 Algoritma Naive
Bayes untuk
Mencari
Perkiraan Waktu
Studi
Algoritma
Naive
Bayes
Hasil
dari prediksi
menggunakan algoritma
Naive Bayes ini adalah
diprediksi 254 mahasiswa
“Tepat Waktu” dan
diprediksi 4 mahasiswa
“Tidak Tepat Waktu”.
2 Nugroho
2014 Data Mining
Menggunakan
Algoritma Naive
bayes
Untuk Klasifikasi
Kelulusan
Mahasiswa
Universitas Dian
Nuswantoro
Algoritma
Naive
Bayes
Hasil dari penelitian
mendapatkan
hasil akurasi kelulusan
sebesar 82.08%. Data
yang kurang kompleksitas
menyebabkan model
dapat memprediksi cukup
akurat.
3 Bustami 2014 Penerapan
Algoritma Naive
Bayes untuk
Mengklasifikasi
Data Nasabah
Asuransi
Algoritma
Naive
Bayes
Penelitian ini
menghasilkan bukti
bahwa algoritma Naive
Bayes bisa diterapkan
dalam perusahaan
mengambil keputusan
untuk menerima atau
menolak calon nasabah.
4 Naparin 2016 Klasifikasi
Peminatan Siswa
SMA
Menggunakan
Algoritma
Naive
Bayes
Penelitian ini
Secara umum hasil
penerapan Naive Bayes
mempunyai nilai akurasi
1
Naive Bayes yang sangat tinggi dan
keunggulan dalam hal
kehandalan dalam
klasifikasi.
5 Manaluet al
2017 Penerapan
Algoritma Naive
Bayes Untuk
Memprediksi
Jumlah Produksi
Barang
Berdasarkan Data
Persediaan Dan
Jumlah Pemesanan
Pada Cv . Papadan
Mama Pastries
Algoritma
Naïve
Bayes
Hasil dari penerapan
Algoritma Naive Bayes
untuk Memprediksi
Jumlah Produksi Barang
Berdasarkan Data
Persediaan dapat
membantu dalam
menentukan persediaan
stok roti sesuai dengan
kebutuhan.
Dari literatur riview diatas dapat disimpulkan bahwa penggunaan metode
klasifikasi dapat mengatasi masalah prediksi terhadap algoritma Naive Bayes,
meski penggunaan algoritma Naive Bayes masih memiliki beberapa kekurangan
salah satunya mengansumsikan variable dengan bebas tetapi mudah
diimplementasikan dan hasil baik dalam banyak kasus penelitian. Maka dari itu
penulis akan menggunkan algoritma Naive Bayesdengan metode klasifikasi.
2.3 Tinjuan Studi
2.3.1 Pengertian Data mining
Data mining adalah suatu proses pencarian pola, karakteristik didalam data
yang berkapasitas besar dengan tujuan utama mendapatkan suatu informasi yang
baru. Informasi tersebut didapatkan dengan mengelola datanya terlebih dahulu.
“Data mining merupakan suatu konsep yang digunakan untuk mencari nilai
tambah yang tersembunyi dalam database” (Wicaksono, 2016)
1
Data mining adalah suatu proses yang menggunakan statistical,
mathematical, artificial intelligence dan machine learning tecniques untuk
mengekstrak dan mengidentifikasi informasi penting dan subsequence knowledge
dari database yang besar (Meilani et al, 2015). Dimana informasi yang di ekstrak
digunakan dalam mengambil keputusan bisnis yang cukup krusial (crucial
business decision)
Data mining juga merupakan proses penemuan pengetahuan (knowledge
discovery) dengan mencari pola dan struktur pada sekumpulan data (Jiaweiet al,
2012). Data mining adalah teknologi yang powerfull dengan kemampuan
penemuan usefull knowledge, yang semuanya itu diperoleh dari sumber data yang
besar dan cukup kompleks untuk di ketahui (Patil, 2013).
Teknik data mining dapat di aplikasikan dalam berbagi bidang bisnis
seperti bidang medicine, statistical analysis, engeneering, education, banking,
marketing, sale dan lain-lainnya (Permata & Ayu, 2015).
Dari teori di atas dapat disimpulkan bahwa data mining adalah sebuah
ilmu atau teknologi terkini yang berguna untuk mengetahui pola-pola baru atau
pengetahuan baru data-data yang tersimpan di sebuah big data dan database yang
besar.
Pada gambar 1.1 berikut adalah gambaran dari posisi data mining dalam
konteksi business intelligence. Data mining merupakan tahapan analisis yang
bertujuan pada penemuan pengetahuan.
1
Gambar 2. 1Data Mining in the Business Intelligence Context
2.3.2 Fungsi Data Mining
Data mining memiliki kemampuan cepat dalam melakukan analisis dan
sangat fokus pada variabel-variabel penting. patterns (pola) dan rules (aturan,
kaidah) yang dapat digunakan dalam membuat keputusan dan forecast
(meramalkan) dampak dari keputusan tersebut. Intelligent data mining meliputi
informasi dalam data warehouse dimana querydan laporan biasa tidak bisa
mengungkapkan informasi secara efektif. Data mining tools mampu menemukan
pola dalam data dan memberi dugaan berupa rules(Jananto, 2013)
Ada tiga metode yang digunakan dalam mengidentifikasi pola dalam data
yaitu: simple model (contoh, SQL berbasis query yang merupakan cara sederhana
dalam menarik data, online analytical processing (OLAP), human judgement);
1
Intermediate models (contoh, regression, decision trees, clustering); complex
models (contoh, neural networks, other rule induction). Algoritma data mining
tradisional juga membagi empat kategori besar, yakni classification, regression,
anomaly detection, time series, clustering, association analysis.
Pada tabel 2.2 dibawah ini mengklasifikasikan model data mining
berdasarkan fungsi dan algoritma yang digunakan.
Tabel 2.2 Klasifikasi data mining, algoritma dan penerapannya.
Fungsi data mining Algoritma Penerapan
Association Apriori algorithm, Frequent
pattern growth algorithm
Market basket analysis, cross
selling
Classification Descision trees, neural
netwoks, Bayesian models,
K-NN
Target marketing quality,
assigning voters into known
bucket by political paties.
Clustering K-mean, density-based
clustering
Finding customer segmens in
a company based on
transaction, web and
customer call data.
Regression Linear regression, logistic
regression
Estimating insurance
premium, predicting
unemployment for next year.
Anomaly detection Distance based, density
based, local outlier factor
(LOF)
Fraud tranaction detection in
credit cards
Time series ARIMA Sales forecasting, production
forecasting
1
2.3.3 Model Data Mining
Ada berbagai model dalam data mining atau sering di sebut teknik data
mining, secara umum model data mining dibagi dalam tiga kelompok berdasarkan
pada tugas atau fungsi yang terdiri dari classification, clustering, association.
2.3.4 Klasifikasi
Klasifikasi melakukan analisa pada sejarah yang tersimpan dalam
database dan meregenerate otomatis model yang dapat memprediksi perilaku
masa depan. Dengan melakukan redefined class, model dapat memprediksi
sebuah kelas atau membuat kelas pada record-record data yang terklasifikasi.
Klasifikasi menemukan pola data yang digunakan untuk mengklasifikasi dalam
kategori tertentu, contohnya pada aplikasi email yang dapat menglasifikasi email
yang bukan spam dan email spam. Contoh lain klasifikasi pelanggan yang
membeli produk terbanyak dengan pelanggan membeli produk dalam jumlah
sedikit. Informasi ini misalnya bisa digunakan dalam melakukan iklan, tentu iklan
akan di fokuskan kepada pelanggan yang memiliki jumlah pembelian paling
banyak, karena besar peluang pelanggan tersebut untuk membeli kembali.
Algoritma yang biasa digunakan dalam klasifikasi adalah Neural network,
decision trees, naive bayes, dan if then else rules (Jiaweiet al,2012).
2.3.5 Algoritma Naive Bayes
Algoritma Naive Bayesmerupakan salah satu algoritma yang terdapat pada
teknik klasifikasi. Naive Bayes merupakan pengklasifikasi dengan metode
probabilitas dan statistik yang dikemukakan oleh ilmuan Inggris Thomas Bayes.
Menjelaskan Naive Bayes untuk setiap kelas keputusan, menghitung
1
probabilitasdengan syarat bahwa kelas keputusan adalah benar, mengingat vektor
informasi obyek. Algoritma ini mengasumsikan bahwa atribut obyek adalah
independen. Probabilitas yang terlibat dalam memproduksi perkiraan akhir
dihitung sebagai jumlah frekuensi dari “master” tabel keputusan. Sedangkan
algoritma Naive Bayesclassifer merupakan algoritma yang digunakan untuk
mencari nilai probabilitas tertinggi untuk mengklasifikasi data uji pada kategori
yang paling tepat.
Algoritma Naive Bayes akan mengevaluasi setiap atribut yang
mengkontribusi prediksi pada atribut target. Naive Bayes tidak memperhitungkan
relasi antar atribut-atribut kontributor prediksi, tidak seperti Decision Tree yang
memperhitungkan relasi antar atribut. Bentuk tugas dasar yang dilakukan oleh
algoritma Naive Bayes adalah hanyalah kalsifikasi (Jiawei et al, 2012). Naive
Bayes merupakan teknik data mining dengan pendekatan teori probabilitas untuk
membangun sebuah model klasifikasi berdasarkan pada kejadian masa lalu yang
mempunyai potensi membentuk sebuah objek baru yang dikategorikan sebagai
kelas yang memiliki probabilitas terbaik.
Naive Bayes memiliki kemampuan yang cepat dalam membuat model,
mempunyai kemampuan memprediksi dan juga menyediakan metode baru dalam
mengekspor dan memahami data. Algoritma Naive Bayes hanya mendukung pada
atribut yang bertipe data discrete atau discretized, atau tidak mendukung atribut
yang bernilai continuous(numerik) dan semua atribut dapat menjadi independen,
menjadi atribut yang memberi kontribusi kepada atribut yang diprediksi.
1
Klasifikasi Bayesian adalah klasifikasi statistik yang bisa mempredikasi
probabilitas sebuah kelas. Kalsifikasi Bayesian ini dihitung berdasarakan Teorema
Bayes berikut ini :
𝑃(𝐻(𝑋) =𝑃(𝑋|𝐻)𝑃(𝐻)
𝑃(𝐻)
X : Data dengan class yang belum diketahui
H : Hipotesis data merupakan suatu class spesifik
P(H(X): Probabilitas hipotesis berdasar kondisi
P(H) : Probabilitas hipotesis
P(X(H): Probabilitas berdasarkan kondisi pada hipotesis
P(X) : Probabilitas H
Berdasarkan rumus diatas kejadian H merepresentasikan sebuah kelas dan X
merepresentasikan sebuah atribut. P(H) disebut prior probability H, contoh dalam
kasus ini adalah probabilitas kelas yang mendeklarasikan normal.
Untuk menjelaskan teorema Naive Bayes, perlu diketahui bahwa proses
klasifikasi memerlukan sejumlah petunjuk untuk menentukan kelas apa yang
cocok bagi sampel yang dianalisis tersebut. Karena itu, teorema bayes di atas
disesuaikan sebagai berikut :
1
𝑃(𝐶|𝐹₁…𝐹𝑛) =𝑃(𝐶)𝑃(𝐹₁…𝐹𝑛|𝐶)
𝑃(𝐹₁…𝐹𝑛)
Dimana Variabel C merepresentasikan kelas, sementara variabel 𝐹₁…𝐹𝑛
merepresentasikan karakteristik petunjuk yang dibutuhkan untuk melakukan
klasifikasi. Maka rumus tersebut menjelaskan bahwa peluang masuknya sampel
karakteristik tertentu dalam kelas C (Posterior) adalah peluang munculnya kelas C
(sebelum masuknya sampel tersebut, seringkali disebut prior), dikali dengan
peluang kemunculan karakteristik karakteristik sampel pada kelas C (disebut juga
likelihood), dibagi dengan peluang kemunculan karakteristik karakteristik sampel
secara global ( disebut juga evidence). Karena itu, rumus diatas dapat pula ditulis
secara sederhana sebagai berikut :
𝑃𝑜𝑠𝑡𝑒𝑟𝑖𝑜𝑟 =𝑃𝑟𝑖𝑜𝑟 × 𝑙𝑖𝑘𝑒𝑙𝑖ℎ𝑜𝑜𝑑
𝑒𝑣𝑖𝑑𝑒𝑛𝑐𝑒
Nilai Evidence selalu tetap untuk setiap kelas pada satu sampel. Nilai dari
posterior tersebut nantinya akan dibandingkan dengan nilai nilai posterior kelas
lainnya untuk menentukan ke kelas apa suatu sampel akan diklasifikasikan.
Adapun alur dari metode Naive Bayes adalah sebagai berikut :
1. Baca data training
2. Hitung Jumlah dan probabilitas, namun apabila data numerik maka:
a. Cari nilai mean dan standar deviasi dari masing masing parameter
yang merupakan data numerik.
1
b. Cari nilai probabilistik dengan cara menghitung jumlah data yang
sesuai dari kategori yang sama dibagi dengan jumlah data pada
kategori tersebut.
3. Mendapatkan nilai dalam tabel mean, standart deviasi dan probabilitas.
Gambar 2.2 Skema Naive Bayes
1
2.4 Tinjauan Perusahaan
2.4.1 Gambaran Umum PT. Arimuraya Indonesia
PT. Arimuraya Indonesia berdiri sejak 20 April 2012 di Jl. Cempaka.
No.12, Blok G Rt 003 / Rw 002 Jatimulya, Tambun Selatan, Bekasi, Jawa Barat
17510.Perusahaan swasta yang bergerak dibidang makanan ini merupakan cabang
perusahaan yang berpusat di Jepang. Perusahaan ini memproduksi Satsuma Age
(makanan olahan ikan).
2.4.2 Visi dan Misi
Visi PT. Arimuraya Indonesia :
“Menjadi Perusahaan makanan yang menghasilkan produk denganmutu
terjaminbersertifikat halal dan dapat diterima masyarakat”.
Misi PT. Arimuraya Indonesia :
“Menaikan penjualan produk dan meningkatkan kesejahteraan karyawan serta
terdepan dibidang keselamatan dan kesejahteraan kerja, perlindungan lingkungan
dan tanggung jawab sosial”.
2.4.3 Kebijakan PT. Arimuraya Indonesia
PT. Arimuraya Indonesia untuk memastikan terpenuhinya komitmen
tersebut, perusahaan melaksanakan program yang terfokus pada :
1. Peningkatan kualitas produk melalui upaya peningkatan keterampilan
dan perbaikan berkelanjutan.
2. Pencegahan pencemaran lingkunagan sedini mungkin dengan
meminimalisasi dampak pencemaran lingkungan dan pengelolaan bahan-
1
bahan kimia berbahaya yang dipersyaratkan pelanggan, serta melakukan
penghematan energi dan sumber daya lainnya.
3. Pemenuhan peraturan dan persyaratan lainnya yang berhubungan dengan
kegiatan perusahaan.
4. Penegakan kode etik perusahaan menjamin terselenggarakannnya
hubungan yang baik antara management dan seluruh karyawan serta
menghargai dan mengedapnkan Hak Asasi Manusia didalam seluruh
aspek kegiatan perusahaan.
2.4.4 Struktur Organisasi
Gambar 2. 3 Struktur Organisasi
1
2.5 Kerangka Pemikiran
Pada penyusunan penelitian ini tersusun atas kerangka pemikiran dengan
konsep dan tujuan alur penelitian. Adapun kerangka pemikiran yang diusulkan
dan akan dilakukan adalah sebagai berikut :
Gambar 2. 4 Kerangka Pemikiran
2.6 Hipotesis
Hipotesis merupakan jawaban sementara dari pertanyaan penelitian.
Hipotesis berfungsi untuk menentukan arah pembuktian, dengan maksud
hipotesis merupakan pernyataan yang harus dibuktikan pada proses penelitian.
Maka pada hipotesis ini, diduga bahwa penggunaan metode klasifikasi
pada konsep data mining dapat menyelesaikan masalah penentuan keputusan
status produk Not Good berdasarkan hasil tabel keterangan produk di Pt
Arimuraya Indonesia menggunakan algoritma Naive Bayes.
Dataset hasil keterangan
produk Ng dan Ok
Teori & Tinjuan Studi terkait
klasifikasi
Melakukan Pengelompokkan
& Pengujian dengan Naive
Bayes
Informasi hasil temuan produk
Ng
Penentuan Barang Ng berdasarkan pada tabel kategori Produk
1
BAB III
METODOLOGI PENELITIAN
3.1 Jenis Penelitian
Dilihat dari jenis informasi yang dikelola maka jenis penelitian ini
terbagi menjadi :
1. Pendekatan Penelitian
Pada penelitian ini dibangun dengan pendekatan kuantitatif dimana
pendekatan penelitian ini menggunakan skala numerik,berbasis pola alur
Kumpulkan teori, Hasilkan konsep, Rumuskan hipotesis,Uji hipotesis,
TarikKesimpulan dan banyak mengunakan angka, mulai dari pengumpulan
data,penafsiran terhadap data tersebut, serta penampilan hasilnya.
2. Jenis Penelitian
Dalam penelitian ini termasuk kedalam penelitian ekperimental karena
merupakan penelitian yang bersifat uji coba, mempengaruhi hal-hal yang terkait
dengan seluruh variabel atau atribut dan melibatkan pengembangan dan evaluasi.
3.2 Metode Pengumpulan Data
Pengumpulan data merupakan bagian paling penting dalam sebuah
penelitian. Ketersediaan data akan sangat menentukan dalam proses
pengolahan dan analisa selanjutnya.Pada tahapan pengumpulan data, dalam
melakukan penelitian digunakan data sekunder berupa hasil temuan produk NG.
Dengan isi data sebanyak 500, yang meliputi semua produk yang di produksi di Pt
Arimuraya Indonesia. Tahapan pengumpulan data sebagai berikut :
1
1. Riset Lapangan
Untuk memperoleh data yang diperlukan dalam rangka melakukan analisis
terhadap pembuktian jawaban sementara atau hipotesis dari permasalahan yang
dikemukakan, maka metode yang penulis lakukan adalah:
a. Observasi
Yaitu teknik pengumpulan data yang dilakukan dengan mengadakan
pengamatan langsung terhadap proses penginputan data hasil barang NG
disetiap hasil produksinya. Kata lain observasi adalah suatu teknik mencari
atau menbumpulkan data dengan jalan mengamati dan terjun langsung ke
lapangan, melihat secara nyata keadaan dan kondisi lapangan dengan segala
aspek yang berhubungan langsung dengan peleliti.
b. Wawancara
Yaitu teknik pengumpulan data yang dilakukan dengan mengadakan tanya
jawab langsung dengan responden dan pihak-pihak yang ada kaitanya dengan
maslah yang diteliti.
2. Library research (Penelitian kepustakaan)
Adalah penelitian yang dilakukan dengan mengumpulkan bahan-bahan
pustaka, literature, dan karangan ilmiah yang ada kaitanya dengan penelitian ini.
Library research dibutuhkan untuk membahas permasalahan yang bersifat teori.
Dalam hal ini penulis membaca, mengumpulkan dan mengambil kesimpulan baik
dari buku maupun artikel penerbit lainnya.
1
3.3 Teknik Analisis Data
Pada penelitian ini menggunakan metodologi pengembangan data mining
yaitu CRISP-DM (Cross Standart Industries for Data mining),yang memiliki
siklus hidup terdiri dari 6 tahap.
Gambar 3. 1Siklus hidup CRISP-DM
Sumber : Setiawan (2016)
Keseluruhan fase berurutan yang ada dan bersifat adaptif. Berikut ini
merupakan langkah-langkah yang dilakukan peneliti berdasarkan darifase CRISP-
DM :
1. Business Understanding
Pada tahapan pertama Peneliti mencoba untuk memahami permasalahan
yangada dalam peningkatan mutu dan kualitas produk di Pt Arimuraya
Indonesia. Sehingga dapat menentukan tujuan dan polayang akan
1
didapatkan dengan data mining. Data didapat dari pihak perusahaan dan
merupakan data internal dengan alur sebagai berikut :
2. Data UnderstandingPhase (Fase Pemahaman Data)
Pada tahap ini data yang sebelumnya didapat dalam bentuk print out maka
dikonversi kedalam bentuk digital yang disimpan dalam format excel
dengan tujuan memudahkan pengumpulan awal data, deskripsi data,
eksplorasi data dan verifikasi dari kualitas data. Maka contoh sampel data
sebagai berikut :
Tabel 3.1 Data yang digunakan penelitian
3. Data Preparation Phase (Fase Pengolahan Data)
Pengolahan data awal perlu dilakukan untuk menyiapkan data yang benar-
benar valid sebelum diproses. Data hasil kategori produk Ok atau Not
1
Good yang telah didapatkan kemudian dilakukan kegiatan preprocessing
data yaitu pengseleksian atribut-atribut dan cleansing data. Pengseleksian
atribut yang ada dilakukan untuk dijadikan atribut penentu dalam
penelitian ini. Jumlah atribut keseluruhan dalam data hasil kategori produk
Ok atau Not Good kurang lebih ada 7 atribut, kemudian dilakukan seleksi
atribut yang diperlukan untuk proses analisis selanjutnya, maka didapat
atribut-atribut yang akan digunakan sebagai berikut :
Tabel 3.1 Atribut penelitian
Atribut Variable Type
Nama Produk Y Varchar
Warna X1 Varchar
Waktu Pemasakan X2 Numeric
Jenis X3 Varchar
Alat Pemasakan X4 Varchar
Kematangan X5 Varchar
Berat X6 Numeric
Status Produk X7 Char
1
4. Modeling Phase (Fase Pemodelan)
Dalam penelitian ini akan dilakukan analisa menggunakan metode
klasifikasi dengan algoritma Naïve Bayes. Data dihitung dengan algoritma
ini sesuai dengan metodenya kemudian di cari hasil akurasinya. Dalam
tahapan ini akan dilakukan beberapa langkah pengujian data yaitu seperti
berikut.
Gambar 3. 1 Langkah Pengujian Metode
Data hasil produk Not Good dan OK akan di olah dengan algoritma Naïve
Bayes, kemudian dilihat tingkat akurasinya dari algoritma ini dan
keterkaitan antara setiap atribut. Algoritma Naïve Bayes akan
mengevaluasi setiap atribut yang mengkontribusi prediksi pada atribut
target. Naïve Bayes tidak memperhitungkan relasi antar atribut-atribut
kontributor prediksi, tidak seperti Decision Tree yang memperhitungkan
1
relasi antara atribut. Bentuk tugas dasar yang dilakukan oleh algoritma
Naïve Bayes adalah hanyalah klasifikasi.
5. Evaluation Phase (Fase Evaluasi)
Melakukan pengecekan terhadap setiap nilai atribut dan model yang sudah
dibangun. Kemudian melakukan evaluasi terhadap hasil dengan
melakukan analisis dari setiap variable output atau karakteristik informasi
yang dihasilkan oleh model data mining. Pada tahap ini juga merupakan
tahapan dimana dilakukan perbaikan kembali bila terjadi kekurangan. Pada
tahapan ini bisa saja kembali lagi ke tahap yang pertama dan kemudian ke
tahap berikutnya dengan tujuan perbaikan, sampai sesuai dengan
kebutuhan. Seterusnya adalah tahapan deployment yang merupakan
tahapan akhir dalam pengembangan data mining.
6. Deployment Phase (Fase Penyebaran)
Pembentukan model selanjutnya melakukan analisa dan pengukuran pada
tahap sebelumnya, pada tahap ini diterapkan model atau rule yang paling
akurat dan selanjutnya dapat digunakan untuk mengevaluasi data baru.
1
3.4 Tahapan Penelitian
Gambar 3. 2 Tahapan Penelitian
1. Tahap pertama yang dilakukan dalam melakukan penelitian ini adalah
melakukan studi literatur dengan cara mempelajari teori dan
1
pengetahuan dasar-dasar dan konsep-konsep yang mendukung
penelitian.
2. Tahap kedua yaitu identifikasi masalah, pada tahap ini proses yang
dilakukan adalah mengggali permasalahan yang di temukan pada objek
yang di teliti serta mengidentifikasi kebutuhan yang di butuhkan oleh
pengguna guna mencari alternatif solusi yang terkait dengan
permasalahan tersebut.
3. Tahap ketiga yaitu pengumpulan data, setelah tahap identfifikasi
masalah dilakukan dan semua kebutuhan sudah di dapatkan maka tahap
selanjutnya yang harus dilakukan adalah mengumpulkan data. Data yang
di butuhkan adalah kategori produk. Sumber data di dapatkan dari Pt
Arimuraya Indonesia.
4. Tahap keempat yaitu membuat data training /latih dari data-data yang
sudah di kumpulkan, karena tidak semua data di butuhkan untuk
pengujian model.
5. Tahap kelima yaitu membuat data mining yang digunakan untuk
memilih teknik dan algoritma yang sesuai untuk menemukan pola yang
berharga dan tersembunyi dari data kategori produk dengan algoritma
naive bayes.
6. Tahap ke enam adalah hasil prediksi dan penerapan data mining dengan
algoritma naive bayes.
7. Tahap ketujuh yaitu Evaluasi, pada tahap ini dilakukannya evaluasi
untuk mengetahui apakah teknik dan algoritma yang digunakan sudah
1
sesuai untuk digunakan dalam penelitian sehingga bisa menemukan pola
hubungan antar nilai.
3.5 Peralatan
Penelitian ini memerlukan dukungan peralatan untuk pelaksanaan
penelitian. Peralatan tersebut terbagi menjadi 2, yaitu kebutuhan
software(perangkat lunak) dan hardware (perangkat keras). Berikut ini kebutuhan
peralatan yang dibutuhkan antara lain :
1. Kebutuhan software
Kebutuhan software yang diperlukan pada adalah sebagai berikut :
a. Sistem operasi windows 7 versi 64 bit
Pada penelitian ini penulis menggunakan sistem operasi windows 7
versi 64 bit sebagai platform untuk menjalankan program data mining
tools
b. Rapidminer .
Program ini digunakan sebagai data mining tools untuk menjalankan
tahap-tahap data mining, implementasi algoritma, melakukan metode
optimasi, serta hasil akurasi yang didapat.
c. Microsoft Excel
Program ini digunakan sebagai tools untuk menghitung Naive Bayes
secara manual dengan mengambil beberapa sampel untuk dijadikan
sampling dari keseluruhan data yang ada.
2. Kebutuhan Hardware
1
Kebutuhan hardware yang diperlukan dalam penelitian ini dalah sebagai
berikut :
a. Laptop intel core-i3
b. RAM 6 GB
c. Hardisk 500 MB
d. Printer
e. Flashdisk
3.6 Jadwal Penelitian
Tahap-tahap dalam kegiatan penelitian ini meliputi, tahap persiapan, tahap
pelaksanaan,tahap penyelesaian, dan tahapan akhir. Berikut adalah tabel kegiatan
penelitian :
Tabel 3.3 Kegiatan penelitian
No Kegiatan
Bulan Pelaksanaan tahun 2018
Juli Agustus September Oktober November
1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4
1.
Pencarian dan
Pemilihan Obyek
Penelitian
2. Perumusan Masalah
Penelitian
3. Penentuan Topik
penelitian
4. Pengumpulan Bahan
Literatur/Referensi
1
5.
Penyusunan
Kerangka/Landasan
Pemikiran (Tinjauan
Pustaka/Studi/Organis
asi sampai dengan
Kerangka Konsep dan
Hipotesis)
6.
Penyusunan
Metodologi Penelitian
(Jenis Penelitian,
Metode Pengumpulan
Data,
Teknik Analisis
7. Penyusunan Naskah
Proposal Skripsi
8.
Pelaksanaan
Pengumpulan Data
Sampel
9.
Analisis Data,
Implementasi,
Pengujian
10. Penyusunan Naskah
Akhir Skripsi
11.
Penyerahan Formulir
Pendaftaran Sidang
Akhir Skripsi
1
12. Sidang Akhir Skripsi
13. Penyempurnaan
Naskah Akhir Skrispi
14.
Penggandaan Naskah
Akhir Skripsi dan
Paper
15.
Pembuatan CD berisi
Naskah Akhir Skripsi,
Paper, dan Slide
Presentasi
16. Penyerahan Naskah
Akhir Skripsi, Paper
dan CD
1
BAB IV
HASIL DAN PEMBAHASAN
4.1 Hasil
Hasil pada penelitian ini dilakukan dengan perhitungan manual dengan
menggunakan microsoft excel, kemudian diuji dengan tool bantu aplikasi
Rapidminer dengan dataset yang telah dipersiapkan. Pengujian pada penelitian ini
dilakukan dengan menggunakan algoritma Naive Bayes.
Tahap awal cara kerja dari proses perhitungan Naive Bayes adalah dengan
melakukan pengambilan data training dari data kategori produk Ok atau Ng.
Adapun variabel penentu yang digunakan dalam mengklasifikasikan data produk
yaitu :
1. Nama Produk
Merupakan variabel yang terdiri dari beberapa jenis produk di PT
Arimuraya Indonesia.
2. Warna
Merupakan variabel dari salah satu penentu bahwa produk layak atau tidak
(NG) dengan warna putih, coklat, pink, kuning dan hitam.
3. Waktu Pemasakan
Merupakan variabel ketentuan waktu disetiap proses pemasakan produk
tertentu, ada dua kategori dalam waktu pemasakan yaitu 5 menit dan 60
menit.
4. Jenis
1
Merupakan variabel ketentuan jenis produk dengan dua kategori yaitu
kukus dan goreng.
5. Alat Pemasakan
Merupakan variabel ketentuan produk di masak atau di produksi dengan
alat yang sesuai yaitu Boiler, Fryer, dan Steamer.
6. Kematangan
Merupakan variabel dari salah satu penentu produk layak atau tidak
dengan beberapa kategori yaitu padat, lembek, keras, dan gosong.
7. Berat
Merupakan variabel dari salah satu penentu produk layak atau tidak
dengan ukuran 8 gr sampai dengan 221 grsesuai data training.
Tabel 4.1 Data testing (random)
Berdasarkan tabel diatas dapat dihitung klasifikasi data kategori produk Oke
atau Not Good apabila diberikan input berupa nama produk, warna, waktu
No Nama Produk Warna Waktu
Pemasakan Jenis
Alat
Pemasakan Kematangan Berat Status
1 Shaburi Shiro Putih 5 Menit Kukus Boiler Padat 8 Gr Ok
2 Shaburi Shiro Putih 5 Menit Kukus Boiler Padat 9 Gr Ok
3 Shaburi Shiro Putih 5 Menit Kukus Boiler Padat 10 Gr Ok
4 Shaburi Shiro Putih 5 Menit Kukus Boiler Padat 11 Gr Ok
5 Shaburi Shiro Putih 5 Menit Kukus Boiler Padat 12 Gr Ok
- - - - - - - -
- - - - - - - -
- - - - - - - -
496 Tamanegi Ten Coklat 5 Menit Goreng Fryer Padat 53 Gr Ng
497 Tamanegi Ten Coklat 5 Menit Goreng Fryer Padat 54 Gr Ng
498 Tamanegi Ten Coklat 5 Menit Goreng Fryer Padat 55 Gr Ng
499 Tamanegi Ten Coklat 5 Menit Goreng Fryer Padat 56 Gr Ng
500 Tamanegi Ten Coklat 5 Menit Goreng Fryer Padat 57 Gr Ng
1
pemasakan, jenis, alat pemasakan, kematangan dan berat. Menggunkan Naive
Bayes.
Apabila diberikan input baru, maka klasifikasi data kategori produk dapat
ditentukan melalui langkah berikut :
Keterangan :
Y : Status
X1 : Nama Produk
X2 : Warna
X3 : Waktu Pemasakan
X4 : Jenis
X5 : Alat pemasakan
X6 : Kematangan
X7 : Berat
Penghitungan Naive Bayesmanual menggunakan Microsoft Excel:
1. Menghitung jumlah class/label
Tabel 4.2 Penghitungan class atau label
P(Y=Ok) P(Y=Ng)
122/500=0,244 378/500=0,756
1
Dari hasil penghitungan ini maka di dapat jika jumlah class/labelOk pada
data testing sebanyak 122 dibagi dengan keseluruhan jumlah Y sebanyak 500
maka hasil Ok= 0,224 dan jumlah data Ng pada data sebanyak 378 dibagi dengan
keseluruhan jumlah Y sebanyak 500 maka hasil Ng=0,756.
2. Mencari peluang
Tabel 4.3 Penghitungan X1
X1 Ok Ng P X1(Ok) P X1(Ng)
Shaburi Shiro 5 15 0,040983607 0,03968254
Shaburi Age 4 16 0,032786885 0,042328042
Boten 4 16 0,032786885 0,042328042
Kamaboko
Shiro
3 27
0,024590164 0,071428571
Kamaboko Aka 6 19 0,049180328 0,05026455
Tokudai Maru 4 21 0,032786885 0,055555556
Jumbo 7 13 0,057377049 0,034391534
Mini Maru 6 24 0,049180328 0,063492063
Mini Ten 6 14 0,049180328 0,037037037
Stick Plan 5 15 0,040983607 0,03968254
Gobo FS 7 23 0,057377049 0,060846561
Gobo Retail 5 15 0,040983607 0,03968254
Tokudai Gobo 6 14 0,049180328 0,037037037
Edamame FS 6 24 0,049180328 0,063492063
Edamame
Retail
6 14
0,049180328 0,037037037
Mix Yasai Ball 6 14 0,049180328 0,037037037
Satai Yasai 6 14 0,049180328 0,037037037
Komugi 6 14 0,049180328 0,037037037
Naruto 6 14 0,049180328 0,037037037
Yasai Ten 6 24 0,049180328 0,063492063
Cheese Ten 6 14 0,049180328 0,037037037
Tamanegi Ten 6 14 0,049180328 0,037037037
Total 122 378
1
Dari perhitungan mencari probabilitas X1 =
Jumlah X1(Ok) Pada setiap nama produk di bagi total Ok keseluruhan data X1
menghasilkan PX1(Ok).
Shaburi Shiro (Ok) = 5/122 = 0,040983607
Jumlah X1(Ng) Pada setiap nama produk di bagi total Ok keseluruhan data X1
menghasilkan P X1(Ng).
Shaburi Shiro (Ng) = 15/378 = 0,03968254
Tabel 4.4 Penghitungan X2
X2 Ok Ng P X2(Ok) P X2(Ng)
Putih 14 51 0,114754098 0,134920635
Kuning 0 5 0 0,013227513
Coklat 102 231 0,836065574 0,611111111
Hitam 0 72 0 0,19047619
Pink 6 19 0,049180328 0,047619048
Total 122 378
Dari perhitungan mencari probabilitas X2=
Jumlah X2(Ok) Pada warna produk di bagi total Ok keseluruhan data
X2menghasilkan PX2(Ok).
Contoh :
Putih (Ok) = 14/122 = 0,114754098
Jumlah X2(Ng) Pada warna produk di bagi total Ok keseluruhan data
X2menghasilkan P X2(Ng).
1
Contoh :
Putih (Ng) = 51/378 = 0,134920635
Tabel 4.5 Penghitungan X3
X3 Ok Ng P X3(Ok) P X3(Ng)
5 Menit 107 318 0,87704918 0,841269841
60 Menit 15 60 0,12295082 0,158730159
Total 122 378
Dari perhitungan mencari probabilitas X3 =
Jumlah X3(Ok) Pada waktu produk di bagi total Ok keseluruhan data
X3menghasilkan PX3(Ok).
Contoh :
5 Menit (Ok) = 107/122 = 0,87704918
Jumlah X3(Ng) Pada waktu produk di bagi total Ok keseluruhan data
X3menghasilkan P X3(Ng).
Contoh :
5 Menit (Ng) = 318/378 = 0,841269841
Tabel 4.6 Penghitungan X4
X4 Ok Ng P X4(Ok) P X4(Ng)
Kukus 20 75 0,163934426 0,198412698
Goreng 102 303 0,836065574 0,801587302
Total 122 378
1
Dari perhitungan mencari probabilitas X4 =
Jumlah X4(Ok) Pada setiap jenis produk di bagi total Ok keseluruhan data
X4menghasilkan PX4(Ok).
Contoh:
Kukus (Ok) = 20/122 = 0,163934426
Jumlah X2(Ng) Pada setiap jenis produk di bagi total Ok keseluruhan data
X2menghasilkan P X2(Ng).
Contoh:
Kukus (Ng) = 75/378 = 0,198412698
Tabel 4.7 Penghitungan X5
X5 Ok Ng P X5(Ok) P X5(Ng)
Boiler 5 15 0,040983607 0,03968254
Fryer 102 303 0,836065574 0,801587302
Steamer 15 60 0,12295082 0,158730159
Total 122 378
Dari perhitungan mencari probabilitas X5=
Jumlah X5(Ok) Pada setiap alat pemasakan produk di bagi total Ok keseluruhan
data X5menghasilkan PX5(Ok).
Contoh :
Boiler (Ok) = 5/122 = 0,040983607
1
Jumlah X5(Ng) Pada setiap alat pemasakan produk di bagi total Ok keseluruhan
data X5menghasilkan P X5(Ng).
Contoh :
Boiler (Ng) = 15/378 = 0,03968254
Tabel 4.8 Penghitungan X6
X6 Ok Ng P X6(Ok) P X6(Ng)
Lembek 0 36 0 0,095238095
Padat 107 216 0,87704918 0,571428571
Kenyal 15 47 0,12295082 0,124338624
Keras 0 10 0 0,026455026
Gosong 0 69 0 0,182539683
Total 122 378
Dari perhitungan mencari probabilitas X6=
Jumlah X6(Ok) Pada setiap kematangan produk di bagi total Ok keseluruhan data
X6menghasilkan PX6(Ok).
Contoh :
Lembek (Ok) = 0/122 = 0
Jumlah X6(Ng) Pada setiap kematangan produk di bagi total Ok keseluruhan data
X6menghasilkan P X6(Ng).
Contoh :
Lembek (Ng) = 36/378 = 0,095238095
1
Tabel 4.9 Penghitungan X7
X7 Ok Ng P X7(Ok) P X7(Ng)
8 Gr 2 7 0,016393443 0,018518519
9 Gr 2 4 0,016393443 0,010582011
10 Gr 2 4 0,016393443 0,010582011
11 Gr 2 3 0,016393443 0,007936508
12 Gr 1 3 0,008196721 0,007936508
- - - - -
- - - - -
- - - - -
53 Gr 2 8 0,016393443 0,021164021
54 Gr 2 8 0,016393443 0,021164021
55 Gr 4 9 0,032786885 0,023809524
56 Gr 2 9 0,016393443 0,023809524
57 Gr 2 9 0,016393443 0,023809524
Total 122 378
Dari perhitungan mencari probabilitas X7=
Jumlah X7(Ok) Pada setiap berat produk di bagi total Ok keseluruhan data
X7menghasilkan PX7(Ok).
Contoh :
8 Gr (Ok) = 2/122 = 0,016393443
Jumlah X7(Ng) Pada setiap berat produk di bagi total Ok keseluruhan data
X7menghasilkan P X7(Ng).
Contoh :
8 Gr (Ng) = 7/378 = 0,018518519
49
3. Kalikan semua hasil atribut Ok
Tabel 4.10 Penghitungan atribut Ok
Dari Penghitungan ini dikalikan semua hasil probabilitas Ok pada data testing yang diuji
Contoh : 0,040983607 x 0,114754098 x 0,87704918 x 0,163934426 x 0,040983607 x 0,87704918 x 0,016393443 x 0,244 = 9,72225E-
08
P(X1)* P(X2)* P(X3)* P(X4)* P(X4)* P(X5)* P(X6)* P(X7)= P(X) P(X)*Y(Ok)
No Y(Ok) X1 X2 X3 X4 X5 X6 X7 Ok
1 0,244 0,040983607 0,114754098 0,87704918 0,163934426 0,040983607 0,87704918 0,016393443 9,72225E-08
2 0,244 0,040983607 0,114754098 0,87704918 0,163934426 0,040983607 0,87704918 0,016393443 9,72225E-08
3 0,244 0,040983607 0,114754098 0,87704918 0,163934426 0,040983607 0,87704918 0,016393443 9,72225E-08
4 0,244 0,040983607 0,114754098 0,87704918 0,163934426 0,040983607 0,87704918 0,016393443 9,72225E-08
5 0,244 0,040983607 0,114754098 0,87704918 0,163934426 0,040983607 0,87704918 0,008196721 4,86112E-08
- - - - - - - - - -
- - - - - - - - - -
- - - - - - - - - -
496 0,244 0,049180328 0,836065574 0,87704918 0,836065574 0,836065574 0,87704918 0,016393443 8,84342E-05
497 0,244 0,049180328 0,836065574 0,87704918 0,836065574 0,836065574 0,87704918 0,016393443 8,84342E-05
498 0,244 0,049180328 0,836065574 0,87704918 0,836065574 0,836065574 0,87704918 0,032786885 0,000176868
499 0,244 0,049180328 0,836065574 0,87704918 0,836065574 0,836065574 0,87704918 0,016393443 8,84342E-05
500 0,244 0,049180328 0,836065574 0,87704918 0,836065574 0,836065574 0,87704918 0,016393443 8,84342E-05
1
4. Kalikan semua hasil variabel Ng
Tabel 4.11 Penghitungan Variabel Ng
Dari Penghitungan ini dikalikan semua hasil probabilitas Ng pada data testing yang diuji.
Contoh : 0,03968254 x 0,134920635 x 0,841269841 x 0,198412698 x 0,040983607 x 0,571428571 x 0,018518519x 0,756 = 2,83708E-07
P(X1)* P(X2)* P(X3)* P(X4)* P(X4)* P(X5)* P(X6)* P(X7)= P(X) P(X)*Y(Ng)
No Y(Ng) X1 X2 X3 X4 X5 X6 X7 Ng
1 0,756 0,03968254 0,134920635 0,841269841 0,198412698 0,03968254 0,571428571 0,018518519 2,83708E-07
2 0,756 0,03968254 0,134920635 0,841269841 0,198412698 0,03968254 0,571428571 0,010582011 1,62119E-07
3 0,756 0,03968254 0,134920635 0,841269841 0,198412698 0,03968254 0,571428571 0,010582011 1,62119E-07
4 0,756 0,03968254 0,134920635 0,841269841 0,198412698 0,03968254 0,571428571 0,007936508 1,21589E-07
5 0,756 0,03968254 0,134920635 0,841269841 0,198412698 0,03968254 0,571428571 0,007936508 1,21589E-07
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
496 0,756 0,037037037 0,611111111 0,841269841 0,801587302 0,801587302 0,571428571 0,021164021 0,00011186
497 0,756 0,037037037 0,611111111 0,841269841 0,801587302 0,801587302 0,571428571 0,021164021 0,00011186
498 0,756 0,037037037 0,611111111 0,841269841 0,801587302 0,801587302 0,571428571 0,023809524 0,000125843
499 0,756 0,037037037 0,611111111 0,841269841 0,801587302 0,801587302 0,571428571 0,023809524 0,000125843
500 0,756 0,037037037 0,611111111 0,841269841 0,801587302 0,801587302 0,571428571 0,023809524 0,000125843
49
Maka dapat di tentukan hasil prediksi :
Tabel 4.12 Penghitungan Prediction
Jika Hasil Ok > dari Ng Maka menjadi hasil Class Prediction
Accuracy = 85%
No Ok Ng Class Prediction
1 9,72225E-08 2,83708E-07 Ng
2 9,72225E-08 1,62119E-07 Ng
3 9,72225E-08 1,62119E-07 Ng
4 9,72225E-08 1,21589E-07 Ng
5 4,86112E-08 1,21589E-07 Ng
- - - -
- - - -
- - - -
496 8,84342E-05 0,00011186 Ng
497 8,84342E-05 0,00011186 Ng
498 0,000176868 0,000125843 Ok
499 8,84342E-05 0,000125843 Ng
500 8,84342E-05 0,000125843 Ng
Tabel 4.13PenghitunganAccuracy
CLASS
Predicted ↓ Ok Ng
Ok 72 25
Ng 50 353
1
4.2 Analisa algoritma Naive Bayes Implementasi dengan RapidMiner
RapidMiner Studio 8.2 adalah salah satu tooluntuk melakukan prediksidan
analisa data mining. Berikut adalah tahapan pengolahan data dengan
menggunakanRapidMiner Studio 8.2 :
1. Pada tahap ini data training kategori status produk di import kedalam
toolRapidMiner Studio 8.2
Gambar 4. 1Import data kategori status produk
2. Pada tahap kedua data testing kategori status produk di import kedalam
toolRapidMiner Studio 8.2
1
Gambar 4. 2Import data testing kategori status produk
3. Proses Training yaitu melakukan proses pelatihan data pada model
NaïveBayes. Sedangkan proses testing yaitu melakukan pengujian data
yang akanmenghasilkan grafik dan pola.
Pada gambar 4.3 dijelaskan bahwa proses training di gunakan untuk
blokmodel naive bayes, di hubungkan dengan garis penghubung pada blok
applymodel dan blok performance dengan bagian testing sebagai penampil
informasihasil dari pengujian data, hasil dari pengujian ini akan
menghasilkan arsitekturnaive bayes. Dengan menggunakan Rapidminer
dapat menganalisis dataset datamahasiswa menggunakan metode naive
1
bayes. Untuk menghindari kesalahankarena terdapat hasil 0 (nol) maka
bagian laplace correction di parameter harus dichecklist.
Gambar 4. 3 Proses permodelan Naive Bayes pada data kategori status produk
4. Pada tahap ini hasil dari apply model sebagai berikut :
Gambar 4. 4 Proses apply model pada data kategori status produk
1
4.3 Evaluasi (Evaluation)
Gambar 4. 5 Hasil Performance Vektor
Proses klasifikasi dengan Rapidminer dengan metode naive bayes yang
digunakan mengklasifikasi data kategori status produk pada penelitian ini
sehingga diperoleh nilai Accuracy, Precision, dan Recall.
a. Accuracy/akurasi
Dengan mengetahui jumlah data yang di klasifikasikan secara benarmaka
dapat di ketahui akurasi hasil prediksi yaitu 85% dari hasil datatesting.
1
Gambar 4. 6 Hasil Accuracy
b. Precision
Precision adalah jumlah data yang true positive (jumlah data positifyang di
kenali secara benar sebagai positif) di bagi dengan jumlah datadikenali
sebagai positif. Dari hasil pengujian nilai precision yaitu 74,23%untuk class
Ok dan 87.59% untuk class Ng.
Gambar 4. 7 Hasil Precision
c. Recall
1
Recall adalah jumlah data yang true positive di bagi dengan jumlahdata yang
sebenarnya positive (true positive – true negative). Untuk nilaiRecall yaitu
59,02% untuk class Ok dan 100% untuk class Ng.
Gambar 4. 8 Hasil Recall
1
BAB V
PENUTUP
5.1 Kesimpulan
Metode Naive Bayes memanfaatkan data training untuk menghasilkan
probabilitas setiap kriteria untuk class yang berbeda, sehingga nilai-nilai
probabilitas dari kriteria tersebut dapat dioptimalkan untuk menentukan produk
Not Good berdasarkan klasifikasi yang dilakukan oleh metode naive bayes itu
sendiri.
Dari hasil pengujian yang telah dilakukan maka hasil penelitian dengan
algoritma naive bayes didapatkan sebuah hasil bahwa nilai akurasinya adalah 85%
ini adalah termasuk akurasi yang excellent classification (klasifikasi yang sangat
baik) pada grafik probabilitas Not Goodmenunjukan bahwa class dapat digunakan
sebagai acuan status produk Not Good.
5.2 Saran
Perlu dilakukan pengembangan metode klasifikasi seperti klastering dan
asosiasi. Setiap metode diuji tingkat akurasinya baik dari akurasi metode pada
data mining dan pada uji akurasi antara actual dan prediksi. Perlu dilakukan studi
lebih lanjut dalam kakus penentuan status produk Not Goodserta melakukan
perbandingan dengan algoritma lain sehingga dapat diperoleh algoritma dengan
tingkat akurasi yang baik.
1
DAFTAR PUSTAKA
Aan Komariyah & Djam’an Satori (2014). Metodologi Penelitian Kualitatif
Bandung : Alfabeta,(1), 102-107.
Bustami. (2014). Penerapan Algoritma Naive Bayes untuk Mengklasifikasi Data
Nasabah Asuransi. Jurnal Penelitian Teknik Informatika Universitas Ahmad
Dahlan (TECHSI), (1), 128–146.
Jananto, A. (2013). Algoritma Naive Bayes untuk Mencari Perkiraan Waktu
Studi Mahasiswa. Teknologi Informasi DINAMIK, 18(1), 9–16.
Jiawei, H., Kamber, M., Han, J., Kamber, M., & Pei, J. (2012). Data mining:
Concepts and Techniques. San Francisco, CA, itd: Morgan Kaufmann.
Manalu, E., Sianturi, F. A., & Manalu, M. R. (2017). Penerapan Algoritma Naive
Bayes Untuk Memprediksi Jumlah Produksi Barang Berdasarkan Data
Persediaan Dan Jumlah Pemesanan Pada Cv . Papadan Mama Pastries.
Mantik Penusa, 1(2), 16–21. Retrieved from
https://ejurnal.pelitanusantara.ac.id/index.php/mantik/article/view/257
Marwanto, Aris. (2015). Marketing Sukses. Yogjakarta: KOBIS.
Meilani, B. D., Susanti (2015). Aplikasi data mining untuk menghasilkan pola.
Jurnal Ilmiah NERO, Vol.1, Page 182-189.
Patil, T. R. (2013). Performance Analysis of Naive Bayes and J48 Classication
algorithm for Data Classification. Internasional Journal Of Computer
Science And Applications, ISSN: 0974-1011, Vol 6, Page 256-261.
1
Permata , A. & Ayu, F.(2015). Mapping Student's Performance Based on Data
Mining Approach (A Case Study). Italian Oral Surgery, Vol.3, Page 173-
177. http://doi.org/10.1016/j.aaspro.2015.01.034
Sangadji, E.M., (2013). Prilaku Konsumen: Pendekatan Praktis
Disertai:Himpunan Jurnal Penelitian. Yogyakarta: Penerbit Andi.
Wicaksono, A. E. (2016). Implementasi data mining dalam pengelompokan data
peserta didik di sekolah untuk memprediksi calon penerima beasiswa
dengan menggunakan algoritma k- means (studi kasus sman 16 bekasi).
Jurusan Teknik Informatika, Universitas Gunadarma, 21(3), 208.
Yuda Septian, N. (2013). Data Mining Menggunakan Algoritma Naïve Bayes
Untuk Klasifikasi Kelulusan Mahasiswa Universitas Dian Nuswantoro.
Jurnal Semantik 2013, 1–11. https://doi.org/10.13140/RG.2.1.4204.3923
1
1
49