analisa penentuan status produk not good

74
i ANALISA PENENTUAN STATUS PRODUK NOT GOOD PADA PT ARIMURAYA INDONESIA MENGGUNAKAN ALGORITMA NAIVE BAYES Oleh: SITI MASITOH NUR AZIZAH 311410623 PROGRAM STUDI TEKNIK INFORMATIKA SEKOLAH TINGGI TEKNOLOGI PELITA BANGSA BEKASI 2018

Upload: others

Post on 18-Oct-2021

7 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: ANALISA PENENTUAN STATUS PRODUK NOT GOOD

i

ANALISA PENENTUAN STATUS PRODUK NOT GOOD

PADA PT ARIMURAYA INDONESIA MENGGUNAKAN

ALGORITMA NAIVE BAYES

Oleh:

SITI MASITOH NUR AZIZAH

311410623

PROGRAM STUDI TEKNIK INFORMATIKA

SEKOLAH TINGGI TEKNOLOGI PELITA BANGSA

BEKASI

2018

Page 2: ANALISA PENENTUAN STATUS PRODUK NOT GOOD

ii

ANALISA PENENTUAN STATUS PRODUK NOT GOOD

PADA PT ARIMURAYA INDONESIA MENGGUNAKAN

ALGORITMA NAIVE BAYES

Diajukan Sebagai Salah Satu Syarat Untuk Menyelesaikan

Program Strata Satu (S1) pada Program Studi Teknik Informatika

Oleh:

SITI MASITOH NUR AZIZAH

311410623

PROGRAM STUDI TEKNIK INFORMATIKA

SEKOLAH TINGGI TEKNOLOGI PELITA BANGSA

BEKASI

2018

Page 3: ANALISA PENENTUAN STATUS PRODUK NOT GOOD

iii

Page 4: ANALISA PENENTUAN STATUS PRODUK NOT GOOD

iv

Page 5: ANALISA PENENTUAN STATUS PRODUK NOT GOOD

v

Page 6: ANALISA PENENTUAN STATUS PRODUK NOT GOOD

vi

KATA PENGANTAR

Puji syukur penulis panjatkan ke hadiran Allah SWT. yang telah

melimpahkan segala rahmat dan hidayah-Nya, sehingga tersusunlah Skripsi yang

berjudul โ€œANALISA PENENTUAN STATUS PRODUK NOT GOOD PADA PT

ARIMURAYA INDONESIA MENGGUNAKAN ALGORITMA NAIVE

BAYESโ€.

Skripsi tersusun dalam rangka melengkapi salah satu persyaratan dalam

rangka menempuh ujian akhir untuk memperoleh gelar Sarjana Komputer

(S.Kom) pada Program Studi Teknik Informatika di Sekolah Tinggi Teknologi

(STT) Pelita Bangsa.

Penulis sungguh sangat menyadari, bahwa penulisan Skripsi ini tidak akan

terwujud tanpa adanya dukungan dan bantuan dari berbagai pihak. Sudah

selayaknya, dalam kesempatan ini penulis menghaturkan penghargaan dan ucapan

terima kasih yang sebesar-besarnya kepada:

1. Bapak Dr. Ir. Suprianto, M.P selaku Ketua STT Pelita Bangsa

2. Bapak Aswan Supriadi Sunge, S.Kom., M.Kom selaku Ketua Program Studi

Teknik Informatika STT Pelita Bangsa.

3. Bapak Elkin Rilvani, S.Kom., M.M selaku dosen pembimbing 1 yang telah

banyak memberikan arahan dan bimbingan kepada penulis dalam penyusunan

Skripsi ini.

4. Bapak Ir. Tri Ngudi Wiyatno., M.T Selaku dosen pembimbing 2 yang telah

memberikan saran dan bantuan selama penulisan pada penyusunan skripsi ini.

Page 7: ANALISA PENENTUAN STATUS PRODUK NOT GOOD

vii

5. Seluruh Dosen STT Pelita Bangsa yang telah membekali penulis dengan

wawasan dan ilmu di bidang teknik informatika.

6. Seluruh staf STT Pelita Bangsa yang telah memberikan pelayanan terbaiknya

kepada penulis selama perjalanan studi jenjang Strata 1.

7. Rekan-rekan mahasiswa STT Pelita Bangsa, khususnya angkatan 2014, yang

telah banyak memberikan inspirasi dan semangat kepada penulis untuk dapat

menyelesaikan studi jenjang Strata 1.

8. Bapak, Ibu, dan keluarga tercinta yang senantiasa mendoโ€™akan dan

memberikan semangat dalam perjalanan studi Strata 1 maupun dalam

kehidupan penulis.

9. Semua pihak yang tidak dapat penulis sebut satu persatu, yang telah

memberikan bantuan moral dan spiritual, atas keikhlasannya penulis ucapkan

terima kasih.

Akhir kata, penulis mohon maaf atas kekeliruan dan kesalahan yang

terdapat dalam Skripsi ini dan berharap semoga Skripsi ini dapat memberikan

manfaat bagi khasanah pengetahuan Teknologi Informasi di lingkungan STT

Pelita Bangsa khususnya dan Indonesia pada umumnya.

Bekasi, November 2018

Penulis

Page 8: ANALISA PENENTUAN STATUS PRODUK NOT GOOD

viii

ABSTRACT

Not Good product status category data. This happened repeatedly and

caused a buildup of Not Good product data which affected the uncertainty of

product status. This study aims to classify the Okay or Not Good product category

data by utilizing the data mining process using classification techniques. The

method used is CRISP-DM through the process of business understanding,

understanding data, data preparation, modeling, evaluation and deployment. The

algorithm used for graduation classification is the Naรฏve Bayes algorithm. Naรฏve

Bayes is a simple probabilistic based prediction technique based on the

application of Bayes theorems or rules assuming strong independence in features,

meaning that a feature in a data is not related to the presence or absence of other

features in the same data. Implementation using RapidMiner 8.2 is used to help

find accurate values. The attributes used are Product Name, Color, Cooking

Time, Type, Cooking Tools, Weight, and Status. The results of this study are used

as one of the basis for making decisions to determine Not Good products by Pt

Arimuraya Indonesia.

Keywords: data mining, category, classification, Naive Bayes algorithm

Page 9: ANALISA PENENTUAN STATUS PRODUK NOT GOOD

ix

ABSTRAK

Data kategori status produk Not Good. Hal tersebut terjadi secara berulang

dan menimbulkan penumpukan terhadap data produk Not Good sehingga

mempengaruhi ketidakpastian status produk. Penelitian ini bertujuan untuk

melakukan klasifikasi terhadap data kategori produk Oke atau Not Gooddengan

memanfaatkan proses data mining dengan menggunakan teknik klasifikasi.

Metode yang digunakan adalah CRISP-DM dengan melalui proses business

understanding, data understanding, data preparation, modeling, evaluation dan

deployment. Algoritma yang digunakan untuk klasifikasi kelulusan adalah

algoritma Naรฏve Bayes. Naรฏve Bayes merupakan teknik prediksi berbasis

probabilistik sederhana yang berdasar pada penerapan teorema atau aturan bayes

dengan asumsi independensi yang kuat pada fitur, artinya bahwa sebuah fitur pada

sebuah data tidak berkaitan dengan ada atau tidaknya fitur lain dalam data yang

sama. Implementasi menggunakan RapidMiner 8.2 digunakan untuk membantu

menemukan nilai yang akurat. Atribut yang digunakan adalah Nama Produk,

Warna, Waktu Pemasakan, Jenis, Alat Pemasakan, Berat, dan Status. Hasil dari

penelitian ini digunakan sebagai salah satu dasar pengambilan keputusan untuk

menentukan produk Not Good oleh Pt Arimuraya Indonesia.

Kata Kunci : data mining, kategori, klasifikasi, algoritma Naive Bayes

Page 10: ANALISA PENENTUAN STATUS PRODUK NOT GOOD

x

DAFTAR ISI

PERSETUJUAN .................................................... Error! Bookmark not defined.

PENGESAHAN ..................................................................................................... iii

PERNYATAAN KEASLIAN PENELITIAN ....... Error! Bookmark not defined.

KATA PENGANTAR ........................................................................................... vi

DAFTAR ISI .......................................................................................................... ix

DAFTAR TABEL ................................................................................................. xii

DAFTAR GAMBAR ........................................................................................... xiii

BAB IPENDAHULUAN ........................................................................................ 1

1.1 Latar Belakang ......................................................................................... 1

1.2 Masalah Penelitian ................................................................................... 3

1.2.1 Identifikasi Masalah .......................................................................... 3

1.2.2 Pembatasan masalah.......................................................................... 4

1.2.3 Rumusan Masalah ............................................................................. 4

1.3 Tujuan dan Manfaat Penelitian ................................................................. 4

1.3.1 Tujuan Penelitian .............................................................................. 4

1.3.2 Manfaat Penelitian ............................................................................ 4

1.4 Sistematika Penulisan ............................................................................... 5

BAB IITINJAUAN PUSTAKA .............................................................................. 7

2.1 Tinjauan Objek Penelitian ........................................................................ 7

2.1.1 Analisa............................................................................................... 7

2.1.2 Produk ............................................................................................... 7

2.2 Tinjauan Penelitian ................................................................................... 8

2.3 Tinjuan Studi .......................................................................................... 13

2.3.1 Pengertian Data mining ................................................................... 13

2.3.2 Fungsi Data Mining ........................................................................ 15

2.3.3 Model Data Mining ......................................................................... 17

2.3.4 Klasifikasi ....................................................................................... 17

2.3.5 Algoritma Naive Bayes ................................................................... 17

2.4 Tinjauan Perusahaan ............................................................................... 22

2.4.1 Gambaran Umum PT. Arimuraya Indonesia .................................. 22

Page 11: ANALISA PENENTUAN STATUS PRODUK NOT GOOD

xi

2.4.2 Visi dan Misi ................................................................................... 22

2.4.3 Kebijakan PT. Arimuraya Indonesia ............................................... 22

2.4.4 Struktur Organisasi ......................................................................... 23

2.5 Kerangka Pemikiran ............................................................................... 24

BAB IIIMETODOLOGI PENELITIAN............................................................... 25

3.1 Metode Penelitian ................................................................................... 25

3.2 Metode Pengumpulan Data .................................................................... 25

3.3 Teknik Analsisis Data ............................................................................ 27

3.4 Tahapan Penelitian ................................................................................. 32

3.5 Peralatan ................................................................................................. 34

3.6 Jadwal Penelitian .................................................................................... 35

BAB IVHASIL DAN PEMBAHASAN ............................................................... 38

4.1 Hasil ........................................................................................................ 38

4.2 Analisa algoritma Naive Bayes Implementasi dengan RapidMiner ....... 44

4.3 Evaluasi (Evaluation) ............................................................................. 47

BAB VPENUTUP ............................................................................................... 506

5.1 Kesimpulan ........................................................................................... 506

5.2 Saran ..................................................................................................... 506

DAFTAR PUSTAKA ......................................................................................... 517

LAMPIRAN .......................................................................................................... 58

Page 12: ANALISA PENENTUAN STATUS PRODUK NOT GOOD

xii

DAFTAR TABEL

Tabel 2.1 Literatur riview ................................................................................. 12

Tabel 2.2 Klasifikasi data mining, algoritma dan penerapannya. ..................... 16

Tabel 3.1 Data yang digunakan penelitian ........................................................ 28

Tabel 3.2 Atribut penelitian ............................................................................... 29

Tabel 3.3 Kegiatan penelitian ........................................................................... 35

Tabel 4.1 Data testing (random) ........................................................................ 39

Tabel 4.2 Penghitungan class atau label ............................................................ 40

Tabel 4.3 Penghitungan X1 ................................................................................ 41

Tabel 4.4 Penghitungan X2 ................................................................................ 42

Tabel 4.5 Penghitungan X3 ................................................................................ 43

Tabel 4.6 Penghitungan X4 ................................................................................ 43

Tabel 4.7 Penghitungan X5 ................................................................................ 44

Tabel 4.9 Penghitungan X7 ................................................................................ 46

Tabel 4.10 Penghitungan atribut Ok .................................................................. 41

Tabel 4.11 Penghitungan Variabel Ng .............................................................. 42

Tabel 4.13 Penghitungan Accuracy .................................................................. 44

Page 13: ANALISA PENENTUAN STATUS PRODUK NOT GOOD

xiii

DAFTAR GAMBAR

Gambar 2. 1 Data Mining in the Business Intelligence Context ........................... 15

Gambar 2.2 Skema Naive Bayes ........................................................................... 21

Gambar 2. 3 Struktur Organisasi ........................................................................... 23

Gambar 2. 4 Kerangka Pemikiran ......................................................................... 24

Gambar 3. 1 Siklus hidup CRISP-DM .................................................................. 27

Gambar 3. 2 Langkah Pengujian Metode .............................................................. 30

Gambar 3. 3 Tahapan Penelitian ........................................................................... 32

Gambar 4. 1 Import data kategori status produk ................................................... 44

Gambar 4. 2 Import data testing kategori status produk ....................................... 45

Gambar 4. 3 Proses permodelan Naive Bayes pada data kategori status produk .. 46

Gambar 4. 4 Proses apply model pada data kategori status produk ...................... 46

Gambar 4. 5 Hasil Performance Vektor ................................................................ 47

Gambar 4. 6 Hasil Accuracy ................................................................................. 48

Gambar 4. 7 Hasil Precision ................................................................................. 48

Gambar 4. 8 Hasil Recall ...................................................................................... 49

Page 14: ANALISA PENENTUAN STATUS PRODUK NOT GOOD

1

BAB I

PENDAHULUAN

1.1 Latar Belakang

PT. Arimuraya Indonesiaadalah perusahaan industri yang bergerak

dibidang makanan ini merupakan cabang perusahaan yang berpusat di Jepang.

โ€œMenteri Perindustrian, Airlangga Hartarto, mengatakan pertumbuhan industri

makanan dan minuman (mamin) naik terus meningkat. Sebagai contoh di 2017

pertumbuhannya mencapai 9,23% atau naik dari 2016 yang sebesar 8,46%โ€

(Detik.com, 2018).

Perusahaan makanan dan minuman merupakan salah satu kategori sektor

industri di Bursa Efek Indonesia (BEI) yang mempunyai peluang untuk tumbuh

dan berkembang. Pengukuran tingkat efektifitas manajemen yang ditunjukkan

oleh laba yang dihasilkan dari penjualan dan dari pendapatan investasi, dapat

dilakukan dengan mengetahui seberapa besar rasioprofitabilitas yang dimiliki.

PT. Arimuraya Indonesia menghasilkan produk barang yang diproduksi

dan di setiap prosesnya maka ditemukan juga produk yang hasilnya tidak sesuai

dengan yang diharapkan dan akan menjadi produk gagal. Ketidaksesuaian dapat

diartikan sebagai suatu penyimpangan yang muncul dari standar yang sudah

ditetapkan. Ketidaksesuaian ini paling sering terjadi pada produk atau jasa baik

yang berasal dari supplier maupun dari sistem internal.

Ketidaksesuain terjadi karena tidak terpenuhinya spesifikasi dan

persyaratan yang telah ada. Persyaratan ini bisa datang dari pelanggan, badan

Page 15: ANALISA PENENTUAN STATUS PRODUK NOT GOOD

1

pengawas eksternal atau prosedur internal perusahaan sendiri.Dalam

mengidentifikasi ketidaksesuain dapat diketahui melalui keluhan pelanggan,

audit internal, audit eksternal, pemeriksaan bahan masuk atau selama kegiatan

pengujian dan inspeksi.

Di dalam standar sistem manajemen mutu ISO 9001:2008 klausul 8.3

disebutkan:โ€Organisasi harus memastikan bahwa produk yang tidak sesuai

dengan persyaratan produk diidentifikasi dan dikendalikan untuk mencegah

penggunaan atau penyerahan yang tidak dikehendaki. Prosedur

terdokumentasi harus ditetapkan untuk mendefinisikan pengendalian dan

tanggung jawab terkait kewenangan untuk menangani produk yang tidak sesuaiโ€

Pengendalian produk tidak sesuai termasuk salah satu dari enam kegiatan

pooyang harus dibuatkan prosedur kerjanya atau lebih sering dikenal sebagai 6

prosedur wajib ISO 9001. Pada prosedur ini harus diatur apa yang perusahaan

anda lakukan apabila terjadi produk tidak sesuai.

Hal yang harus diperhatikan dalam pengendalian produk tidak sesuai

adalah sesuai dengan yang disebutkan dalam klausul โ€œproduk diidentifikasi dan

dikendalikan untuk mencegah penggunaan atau penyerahan yang tidak

dikehendakiโ€. Artinya, harus ada mekanisme identifikasi produk tidak sesuai

misalkan dengan cara pemberian โ€œtagโ€ atau label Not Good (NG), label Non-

Conforming Product (NCP), label โ€œRejectโ€, atau dengan cara disediakan area

khusus produk tidak sesuai, atau pada beberapa perusahaan manufaktur dan

produksi disediakan keranjang khusus untuk produk tidak sesuai. Semua itu

Page 16: ANALISA PENENTUAN STATUS PRODUK NOT GOOD

1

dilakukan untuk menjamin barang rusak tidak sampai ke tangan pelanggan(

Konsultaniso, 2013).

Dalam penelitian ini digunakan metode Naive Bayes, Naives Bayes

menggunakan teori probabilitas sebagai dasar teori. Metode Naive Bayes juga

memiliki kinerja yang baik terhadap pengklasifikasikan data dokumen yang

mengandung angka maupun teks. Penelitian ini diharapkan mampu

menghasilkan klasifikasi yang akurat agar dapat dijadikan bahan penelitian lebih

lanjut karena tingkat akurasi yang tinggi.

Melihat latar belakang tersebut, dibuatlah sebuah penelitian dengan

algoritma Naive Bayes, dengan judul: "Analisa penentuan status produk Not

Good pada PT Arimuraya Indonesia menggunakan Algoritma Naive Bayes

".

1.2 Masalah Penelitian

1.2.1 Identifikasi Masalah

Permasalahan penelitian yang penulis ajukan ini dapat diidentifikasi

permasalahannya sebagai berikut:

1. Data penentuan barang Not Good belum tersedia hanya secara visual

dan catatan.

2. Karyawan sulit dalam menentukan barang Not Good.

3. Perusahaan membutuhkan sebuah dokumen tertulis sebagai patokan

kategori produk Not Good.

Page 17: ANALISA PENENTUAN STATUS PRODUK NOT GOOD

1

1.2.2 Pembatasan masalah

Adapun yang menjadi pembatasan masalah dari penelitian ini adalah

sebagai berikut :

1. Penelitian ini menggunakan klasifikasi data mining algoritma Naive

Bayes.

2. Penginputan data dan pengolahan data kategori penerapan produk Not

Good atau tidak dengan data yang didapat dari pencatatan tiap kali

produksi dan dirangkum menjadi data training.

1.2.3 Rumusan Masalah

Rumusan masalah dalam penelitian ini adalahbagaimana cara untuk

menentukankeputusan status produk Not Goodpada PT Arimuraya Indonesia.

1.3 Tujuan dan Manfaat Penelitian

1.3.1 Tujuan Penelitian

Tujuan dari dilakukannya penulisan penelitian ini sebagai alat untuk

menentukankeputusan status produk Not Goodpada PT Arimuraya Indonesia.

1.3.2 Manfaat Penelitian

Berikut manfaat penelitian:

1. Membantu perusahaan dalam status produk Not Good produksi.

2. Memudahkan perusahaan dalam penimbangan produk Not Good.

3. Menjadi pengetahuan terhadap karyawan.

Page 18: ANALISA PENENTUAN STATUS PRODUK NOT GOOD

1

1.4 Sistematika Penulisan

Adapun tata urut penulisan dan gambaran umum setiap bab dalam penulisan

ini adalah sebagai berikut:

BAB I PENDAHULUAN

Dalam bab ini dibahas secara umum tentang tentang Latar

Belakang,Masalah Penelitian, Pembatasan Masalah, Rumusan Masalah,

Tujuan dan Manfaat Penelitian, dan Tata-Urut Penulisan.

BAB II TINJAUAN PUSTAKA

Dalam bab ini berisi Pada bab ini berisi pembahasan tinjauan penelitian,

tinjauan studi, tinjauan objek penelitian, kerangka konsep/pola pikir

pemecahan masalah, serta hipotesis atau jawaban sementara dari penelitian

yang dilakukan.

BAB III METODOLOGI PENELITIAN

Pada bab ini berisi tentang Pembahasan Metode Penelitian, Metode

Pengumpulan Data, Teknik Analisis Data, Variabel yang digunakan,

Tahapan Penelitian, Peralatan, dan Jadwal Penelitian.

BAB IV HASIL DAN PEMBAHASAN

Pada bab ini berisi pembahasan tentang klasifikasi dengan algoritma Naive

Bayes, serta diuji dengan menggunakan Rapid Miner. Kemudian akan

dilakukan analisa terhadap hasil klasifikasi serta akurasi yang didapatkan.

Page 19: ANALISA PENENTUAN STATUS PRODUK NOT GOOD

1

BAB V PENUTUP

Pada bab ini berisi kesimpulan serta saran dari penelitian yang telah

dilakukan.

DAFTAR PUSTAKA

Page 20: ANALISA PENENTUAN STATUS PRODUK NOT GOOD

49

BAB II

TINJAUAN PUSTAKA

2.1 Tinjauan Objek Penelitian

2.1.1 Analisa

Analisa adalah sebuah kegiatan untuk mencari suatu pola selain itu analisis

merupakan cara berpikir yang berkaitan dengan pengujian secara sistematis

terhadap sesuatu untuk menentukan bagian, hubungan antar bagian dan

hubungannya dengan keseluruhan. Analisa adalah suatu usaha untuk mengurai

suatu masalah atau fokus kajian menjadi bagian-bagian (decomposition) sehingga

susunan/tatanan bentuk sesuatu yang diurai itu tampak dengan jelas dan

karenanya bisa secara lebih terang ditangkap maknanya atau lebih jernih

dimengerti duduk perkaranya (Satori dan Komariyah, 2014).

2.1.2 Produk

Kegiatan suatu perusahaan pasti memiliki produk tertentu yang dapat

ditawarkan kepada konsumen. Berikut adalah penjelasan lebih lengkap mengenai

produk. Produk adalah segala sesuatu yang dapat ditawarkan kepasar untuk

memenuhi kebutuhan dan keinginan konsumen.Produk yang dipasarkan meliputi

barang fisik, misalnya mobil makanan, pakaian, perumahan, barang elektronik dan

sebagainya. Produk yang ditawarkan juga bisa berupa orang, organisasi, dan

sebagainya (Sangadji ,2013).

Produk memiliki arti penting bagi perusahaan karena tanpa adanya produk,

perusahaan tidak akan dapat melakukan apapun dari usahanya. Konsumen akan

Page 21: ANALISA PENENTUAN STATUS PRODUK NOT GOOD

1

membeli produk bila merasa cocok, karena itu produk harus di sesuaikan dengan

keinginan ataupun kebutuhan pembeli agar pemasaran produk berhasil. Dengan

kata lain, pembuatan produk lebi baik diorientasikan pada keinginan pasar atau

selera konsumen. Kualitas produk merupakan seluruh gabungan karakteristik

produk dari pemasaran, rekayasa (perencanaan), pembuatan (produk) dan

pemeliharaan yang membuat produk yang digunakan memenuhi harapan harapan

pelanggan(Feingenbaum dalam Marwanto,2015).

2.2 Tinjauan Penelitian

Pada bab ini menjelaskan tentang tinjauan penelitian dari beberapa jurnal

yang terkait dengan penelitian serupa yang akan dilakukan oleh penulis. Sebelum

melakukan penelitian penulis terlebih dahulu melakukan tinjauan studi dari

penelitian lain dan penelitian tentang penentuan keputusan status produk Not

Good pada Pt Arimuraya Indonesia menggunakan Naive Bayes. Berikut adalah

beberapa penelitian yang terkait dengan masalah tersebut.

Penelitian yang pertama adalah penelitian yang berjudul algoritma Naive

Bayes untuk mencari perkiraan waktu studi mahasiswa. Lama studi dari

mahasiswa ini sangatlah penting bagi mahasiswa, program studi serta perguruan

tinggi. Permasalahan lama studi setiap mahasiswa bisa disebabkan atau

dipengaruhi oleh banyak faktor. Hal tersebut telah dibuktikan dengan beberapa

penelitian pada permasalahan tersebut yang mendapati sejumlah faktor yang

berpengatuh terhadap lama studi mahasiswa. Dengan menggunakan teknik data

mining khususnya klasifikasi untuk prediksi dengan algoritma Naive Bayes dapat

dilakukan prediksi terhadap ketepatan waktu studi dari mahasiswa berdasarkan

Page 22: ANALISA PENENTUAN STATUS PRODUK NOT GOOD

1

data training yang ada. Data training dan testing yang digunakan diambil secara

random pada tabel data master yang digunakan. Algoritma Naive Bayes,

menghitung perbandingan peluang antara jumlah dari masing- masng kriteria nilai

fields terhadap nilai hasil prediksi sesunggunya. Fungsi untuk prediksi dibuat

menggunakan Query pada MySql dalam bentuk function(fbayesian). Dari hasil uji

coba diperoleh tingkat kesalahan prediksi berkisar 20% sampai dengan 50%

dengan data training dan testing yang diambil secara random. Namun rata-rata

tingkat kesalahan berkisar 20 % hingga 34%. Tinggi rendahnya tingkat kesalahan

dapat disebabkan oleh jumlah record data dan tingkat konsistensi dari data

training yang dgunakan. Sedangkan hasil prediksi dari ketepatan lama studi dari

mahasiswa angkatan 2008 adalah sebesar 254 mahasiswa diprediksi โ€Tepat

Waktuโ€ dan sisanya yaitu 4 orang diprediksi โ€Tidak Tepat Waktuโ€ (Jananto,

2013).

Penelitian yang kedua adalah peneltian yang berjudul data mining

menggunakan algoritma Naive Bayes untuk klasifikasi kelulusan mahasiswa

Universitas Dian Nuswantoro. Data mahasiswa dan data kelulusan mahasiswa

Universitas Dian Nuswantoro menghasilkan data yang sangat berlumpah berupa

data profil mahasiswa dan data akademik. Hal tersebut terjadi secara berulang dan

menimbulkan penumpukan terhadap data mahasiswa sehinggu mempengaruhi

pencarian informasi terhadap data tersebut. Penelitian bertujuan untuk melakukan

klasifikasi terhadap data mahasiswa Universiteas Dian Nuswantoro Fakultas Ilmu

Konputer Angkatan 2009 berjenjang DIII dan S1 dengan memanfaatkan proses

data minng dengan menggunakan teknik klasfikasi. Metode yang digunkaan

Page 23: ANALISA PENENTUAN STATUS PRODUK NOT GOOD

1

adalah CRIPS-DM dengan melalui proses business understanding, data

understanding, data preparation, modeling, evaluation dan deplloyment.

algoritma yang digunakan untuk klasifikasi kelulusan adalah algoritma Naive

Bayes. Naive Bayes merupakan teknik prediksi berbasis probabilistik sederhana

yang berdasar pada penerapan teorema atau aturan bayes dengan asumsi

independensi yang kuat pada fitur, atrinya bahwa sebuah fitur pada sebuah data

tidak berkaitan dengan ada atau tidaknya fitur lain dalam data yang sama.

Implementasi menggunakan RapinMider 5.3 digunakan membantu menemukan

nilai yang akurat. Atribut yang digunakan adalah NIM, Nama, Jenjang, Progdi,

Provinsi Asal, Jenis Kelamin, SKS, IPK, dan Tahun Lulus. Hasil dari penelitian

ini digunakan sebagai salah satu dasar pengambilan keputusan untuk menentukan

kebijakan oleh pihak Fasilkom (Nugroho, 2013).

Penelitian yang ketiga adalah penelitian yang berjudul penerapan algoritma

Naive Bayes untuk mengklasifikasi data nasabah asuransi. Metode yang

digunakan pada penelitian ini adalah Algoritma Naive Bayes. Data mining adalah

teknik yang memanfaatkan data dalam jumlah yang besar untuk memperoleh

informasi berharga yang sebelumnya tidak diketahui dan dapat dimanfaatkan

untuk pengambilan keputusan penting. Pada penelitian ini, penulis berusaha

menambang data (data mining) nasabah sebuah perusahaan asuransi untuk

mengetahui lancar, kurang lancar atau tidak lancarnya nasabah tersebut. Data

yang ada dianalisis menggunakan algoritma Naive Bayes. Naive Bayes merupakan

salah satu meode pada probabilistic reasoning. Algoritma Naive Bayes bertujuan

untuk melakukan klasifikasi data pada kelas tertentu, kemudian pola tersebut

Page 24: ANALISA PENENTUAN STATUS PRODUK NOT GOOD

1

dapat digunakan untuk memperkirakan nasabah yang bergabung, sehingga

perusahaan bisa mengambil keputusan menerima atau menolak calon nasabah

tersebut (Bustami, 2014).

Penelitian yang ke empat adalah penelitian yang dilakukan oleh Naparin

yang berjudul Klasifikasi Peminatan Siswa SMA Menggunakan Naive Bayes.

Pilihan kelompok peminatan merupakan bagian penting dalam upaya pencapaian

SKL, KI, dan KD oleh peserta didik. Untuk membantu peserta didik mencapai

berbagai kompetensi yang diharapkan, pemilihan kelompok peminatan menjadi

bagian penting diusahakan setepat mungkin. Dengan demikian, proses

pengklasifikasian mengggunakan metode Naive Bayes yang memegang asumsi

akan hubungan antar fitur atau atributnya yang independen sehingga

menjadikannya lebih efektif untuk kategorisasi, sederhana, cepat dan

menghasilkan tingkat akurasi yang tinggi (Naparin,2016).

Penelitian yang ke lima adalah penelitian yang dilakukan oleh Bustami yang

berjudul penerapan algoritma Naive Bayes untuk mengklasifikasi data nasabah

asuransi. Metode yang digunakan pada penelitian ini adalah Algoritma Naive

Bayes.Papa dan Mama merupakan sebuah perusahaan yang bergerak pada bidang

industri pembuatan kue dan roti serta memasarkan hasil-hasil produksi tersebut ke

berbagai tempat. CV. Papa dan Mama Pastries mengalami kesulitan dalam

mengelola data-data mengenai persediaan roti dan penerimaan pesanan roti yang

sering kelebihan produksi dan kekurangan produksi karena data yang kurang

akurat. Untuk mendukung persediaan roti yang efektif perlu dirancang suatu

sistem berbasis Visual Basic 2010 yang dapat mengatasi masalah tersebut. Penulis

Page 25: ANALISA PENENTUAN STATUS PRODUK NOT GOOD

1

menerapkan metode Naive Bayes untuk memberikan solusi dalam memprediksi

persediaan roti dan penerimaan pesanan roti yang diambil berdasarkan data pada

tahun lalu. Sehingga, dapat membantu dalam menentukan persediaan stok roti

sesuai dengan kebutuhan dan keinginan serta menghasilkan alternatif pilihan stok

roti (Manalu et al, 2017).

Tabel 2.1 Literatur riview

No Peneliti Tahun Judul Metode Hasil

1 Jananto 2013 Algoritma Naive

Bayes untuk

Mencari

Perkiraan Waktu

Studi

Algoritma

Naive

Bayes

Hasil

dari prediksi

menggunakan algoritma

Naive Bayes ini adalah

diprediksi 254 mahasiswa

โ€œTepat Waktuโ€ dan

diprediksi 4 mahasiswa

โ€œTidak Tepat Waktuโ€.

2 Nugroho

2014 Data Mining

Menggunakan

Algoritma Naive

bayes

Untuk Klasifikasi

Kelulusan

Mahasiswa

Universitas Dian

Nuswantoro

Algoritma

Naive

Bayes

Hasil dari penelitian

mendapatkan

hasil akurasi kelulusan

sebesar 82.08%. Data

yang kurang kompleksitas

menyebabkan model

dapat memprediksi cukup

akurat.

3 Bustami 2014 Penerapan

Algoritma Naive

Bayes untuk

Mengklasifikasi

Data Nasabah

Asuransi

Algoritma

Naive

Bayes

Penelitian ini

menghasilkan bukti

bahwa algoritma Naive

Bayes bisa diterapkan

dalam perusahaan

mengambil keputusan

untuk menerima atau

menolak calon nasabah.

4 Naparin 2016 Klasifikasi

Peminatan Siswa

SMA

Menggunakan

Algoritma

Naive

Bayes

Penelitian ini

Secara umum hasil

penerapan Naive Bayes

mempunyai nilai akurasi

Page 26: ANALISA PENENTUAN STATUS PRODUK NOT GOOD

1

Naive Bayes yang sangat tinggi dan

keunggulan dalam hal

kehandalan dalam

klasifikasi.

5 Manaluet al

2017 Penerapan

Algoritma Naive

Bayes Untuk

Memprediksi

Jumlah Produksi

Barang

Berdasarkan Data

Persediaan Dan

Jumlah Pemesanan

Pada Cv . Papadan

Mama Pastries

Algoritma

Naรฏve

Bayes

Hasil dari penerapan

Algoritma Naive Bayes

untuk Memprediksi

Jumlah Produksi Barang

Berdasarkan Data

Persediaan dapat

membantu dalam

menentukan persediaan

stok roti sesuai dengan

kebutuhan.

Dari literatur riview diatas dapat disimpulkan bahwa penggunaan metode

klasifikasi dapat mengatasi masalah prediksi terhadap algoritma Naive Bayes,

meski penggunaan algoritma Naive Bayes masih memiliki beberapa kekurangan

salah satunya mengansumsikan variable dengan bebas tetapi mudah

diimplementasikan dan hasil baik dalam banyak kasus penelitian. Maka dari itu

penulis akan menggunkan algoritma Naive Bayesdengan metode klasifikasi.

2.3 Tinjuan Studi

2.3.1 Pengertian Data mining

Data mining adalah suatu proses pencarian pola, karakteristik didalam data

yang berkapasitas besar dengan tujuan utama mendapatkan suatu informasi yang

baru. Informasi tersebut didapatkan dengan mengelola datanya terlebih dahulu.

โ€œData mining merupakan suatu konsep yang digunakan untuk mencari nilai

tambah yang tersembunyi dalam databaseโ€ (Wicaksono, 2016)

Page 27: ANALISA PENENTUAN STATUS PRODUK NOT GOOD

1

Data mining adalah suatu proses yang menggunakan statistical,

mathematical, artificial intelligence dan machine learning tecniques untuk

mengekstrak dan mengidentifikasi informasi penting dan subsequence knowledge

dari database yang besar (Meilani et al, 2015). Dimana informasi yang di ekstrak

digunakan dalam mengambil keputusan bisnis yang cukup krusial (crucial

business decision)

Data mining juga merupakan proses penemuan pengetahuan (knowledge

discovery) dengan mencari pola dan struktur pada sekumpulan data (Jiaweiet al,

2012). Data mining adalah teknologi yang powerfull dengan kemampuan

penemuan usefull knowledge, yang semuanya itu diperoleh dari sumber data yang

besar dan cukup kompleks untuk di ketahui (Patil, 2013).

Teknik data mining dapat di aplikasikan dalam berbagi bidang bisnis

seperti bidang medicine, statistical analysis, engeneering, education, banking,

marketing, sale dan lain-lainnya (Permata & Ayu, 2015).

Dari teori di atas dapat disimpulkan bahwa data mining adalah sebuah

ilmu atau teknologi terkini yang berguna untuk mengetahui pola-pola baru atau

pengetahuan baru data-data yang tersimpan di sebuah big data dan database yang

besar.

Pada gambar 1.1 berikut adalah gambaran dari posisi data mining dalam

konteksi business intelligence. Data mining merupakan tahapan analisis yang

bertujuan pada penemuan pengetahuan.

Page 28: ANALISA PENENTUAN STATUS PRODUK NOT GOOD

1

Gambar 2. 1Data Mining in the Business Intelligence Context

2.3.2 Fungsi Data Mining

Data mining memiliki kemampuan cepat dalam melakukan analisis dan

sangat fokus pada variabel-variabel penting. patterns (pola) dan rules (aturan,

kaidah) yang dapat digunakan dalam membuat keputusan dan forecast

(meramalkan) dampak dari keputusan tersebut. Intelligent data mining meliputi

informasi dalam data warehouse dimana querydan laporan biasa tidak bisa

mengungkapkan informasi secara efektif. Data mining tools mampu menemukan

pola dalam data dan memberi dugaan berupa rules(Jananto, 2013)

Ada tiga metode yang digunakan dalam mengidentifikasi pola dalam data

yaitu: simple model (contoh, SQL berbasis query yang merupakan cara sederhana

dalam menarik data, online analytical processing (OLAP), human judgement);

Page 29: ANALISA PENENTUAN STATUS PRODUK NOT GOOD

1

Intermediate models (contoh, regression, decision trees, clustering); complex

models (contoh, neural networks, other rule induction). Algoritma data mining

tradisional juga membagi empat kategori besar, yakni classification, regression,

anomaly detection, time series, clustering, association analysis.

Pada tabel 2.2 dibawah ini mengklasifikasikan model data mining

berdasarkan fungsi dan algoritma yang digunakan.

Tabel 2.2 Klasifikasi data mining, algoritma dan penerapannya.

Fungsi data mining Algoritma Penerapan

Association Apriori algorithm, Frequent

pattern growth algorithm

Market basket analysis, cross

selling

Classification Descision trees, neural

netwoks, Bayesian models,

K-NN

Target marketing quality,

assigning voters into known

bucket by political paties.

Clustering K-mean, density-based

clustering

Finding customer segmens in

a company based on

transaction, web and

customer call data.

Regression Linear regression, logistic

regression

Estimating insurance

premium, predicting

unemployment for next year.

Anomaly detection Distance based, density

based, local outlier factor

(LOF)

Fraud tranaction detection in

credit cards

Time series ARIMA Sales forecasting, production

forecasting

Page 30: ANALISA PENENTUAN STATUS PRODUK NOT GOOD

1

2.3.3 Model Data Mining

Ada berbagai model dalam data mining atau sering di sebut teknik data

mining, secara umum model data mining dibagi dalam tiga kelompok berdasarkan

pada tugas atau fungsi yang terdiri dari classification, clustering, association.

2.3.4 Klasifikasi

Klasifikasi melakukan analisa pada sejarah yang tersimpan dalam

database dan meregenerate otomatis model yang dapat memprediksi perilaku

masa depan. Dengan melakukan redefined class, model dapat memprediksi

sebuah kelas atau membuat kelas pada record-record data yang terklasifikasi.

Klasifikasi menemukan pola data yang digunakan untuk mengklasifikasi dalam

kategori tertentu, contohnya pada aplikasi email yang dapat menglasifikasi email

yang bukan spam dan email spam. Contoh lain klasifikasi pelanggan yang

membeli produk terbanyak dengan pelanggan membeli produk dalam jumlah

sedikit. Informasi ini misalnya bisa digunakan dalam melakukan iklan, tentu iklan

akan di fokuskan kepada pelanggan yang memiliki jumlah pembelian paling

banyak, karena besar peluang pelanggan tersebut untuk membeli kembali.

Algoritma yang biasa digunakan dalam klasifikasi adalah Neural network,

decision trees, naive bayes, dan if then else rules (Jiaweiet al,2012).

2.3.5 Algoritma Naive Bayes

Algoritma Naive Bayesmerupakan salah satu algoritma yang terdapat pada

teknik klasifikasi. Naive Bayes merupakan pengklasifikasi dengan metode

probabilitas dan statistik yang dikemukakan oleh ilmuan Inggris Thomas Bayes.

Menjelaskan Naive Bayes untuk setiap kelas keputusan, menghitung

Page 31: ANALISA PENENTUAN STATUS PRODUK NOT GOOD

1

probabilitasdengan syarat bahwa kelas keputusan adalah benar, mengingat vektor

informasi obyek. Algoritma ini mengasumsikan bahwa atribut obyek adalah

independen. Probabilitas yang terlibat dalam memproduksi perkiraan akhir

dihitung sebagai jumlah frekuensi dari โ€œmasterโ€ tabel keputusan. Sedangkan

algoritma Naive Bayesclassifer merupakan algoritma yang digunakan untuk

mencari nilai probabilitas tertinggi untuk mengklasifikasi data uji pada kategori

yang paling tepat.

Algoritma Naive Bayes akan mengevaluasi setiap atribut yang

mengkontribusi prediksi pada atribut target. Naive Bayes tidak memperhitungkan

relasi antar atribut-atribut kontributor prediksi, tidak seperti Decision Tree yang

memperhitungkan relasi antar atribut. Bentuk tugas dasar yang dilakukan oleh

algoritma Naive Bayes adalah hanyalah kalsifikasi (Jiawei et al, 2012). Naive

Bayes merupakan teknik data mining dengan pendekatan teori probabilitas untuk

membangun sebuah model klasifikasi berdasarkan pada kejadian masa lalu yang

mempunyai potensi membentuk sebuah objek baru yang dikategorikan sebagai

kelas yang memiliki probabilitas terbaik.

Naive Bayes memiliki kemampuan yang cepat dalam membuat model,

mempunyai kemampuan memprediksi dan juga menyediakan metode baru dalam

mengekspor dan memahami data. Algoritma Naive Bayes hanya mendukung pada

atribut yang bertipe data discrete atau discretized, atau tidak mendukung atribut

yang bernilai continuous(numerik) dan semua atribut dapat menjadi independen,

menjadi atribut yang memberi kontribusi kepada atribut yang diprediksi.

Page 32: ANALISA PENENTUAN STATUS PRODUK NOT GOOD

1

Klasifikasi Bayesian adalah klasifikasi statistik yang bisa mempredikasi

probabilitas sebuah kelas. Kalsifikasi Bayesian ini dihitung berdasarakan Teorema

Bayes berikut ini :

๐‘ƒ(๐ป(๐‘‹) =๐‘ƒ(๐‘‹|๐ป)๐‘ƒ(๐ป)

๐‘ƒ(๐ป)

X : Data dengan class yang belum diketahui

H : Hipotesis data merupakan suatu class spesifik

P(H(X): Probabilitas hipotesis berdasar kondisi

P(H) : Probabilitas hipotesis

P(X(H): Probabilitas berdasarkan kondisi pada hipotesis

P(X) : Probabilitas H

Berdasarkan rumus diatas kejadian H merepresentasikan sebuah kelas dan X

merepresentasikan sebuah atribut. P(H) disebut prior probability H, contoh dalam

kasus ini adalah probabilitas kelas yang mendeklarasikan normal.

Untuk menjelaskan teorema Naive Bayes, perlu diketahui bahwa proses

klasifikasi memerlukan sejumlah petunjuk untuk menentukan kelas apa yang

cocok bagi sampel yang dianalisis tersebut. Karena itu, teorema bayes di atas

disesuaikan sebagai berikut :

Page 33: ANALISA PENENTUAN STATUS PRODUK NOT GOOD

1

๐‘ƒ(๐ถ|๐นโ‚โ€ฆ๐น๐‘›) =๐‘ƒ(๐ถ)๐‘ƒ(๐นโ‚โ€ฆ๐น๐‘›|๐ถ)

๐‘ƒ(๐นโ‚โ€ฆ๐น๐‘›)

Dimana Variabel C merepresentasikan kelas, sementara variabel ๐นโ‚โ€ฆ๐น๐‘›

merepresentasikan karakteristik petunjuk yang dibutuhkan untuk melakukan

klasifikasi. Maka rumus tersebut menjelaskan bahwa peluang masuknya sampel

karakteristik tertentu dalam kelas C (Posterior) adalah peluang munculnya kelas C

(sebelum masuknya sampel tersebut, seringkali disebut prior), dikali dengan

peluang kemunculan karakteristik karakteristik sampel pada kelas C (disebut juga

likelihood), dibagi dengan peluang kemunculan karakteristik karakteristik sampel

secara global ( disebut juga evidence). Karena itu, rumus diatas dapat pula ditulis

secara sederhana sebagai berikut :

๐‘ƒ๐‘œ๐‘ ๐‘ก๐‘’๐‘Ÿ๐‘–๐‘œ๐‘Ÿ =๐‘ƒ๐‘Ÿ๐‘–๐‘œ๐‘Ÿ ร— ๐‘™๐‘–๐‘˜๐‘’๐‘™๐‘–โ„Ž๐‘œ๐‘œ๐‘‘

๐‘’๐‘ฃ๐‘–๐‘‘๐‘’๐‘›๐‘๐‘’

Nilai Evidence selalu tetap untuk setiap kelas pada satu sampel. Nilai dari

posterior tersebut nantinya akan dibandingkan dengan nilai nilai posterior kelas

lainnya untuk menentukan ke kelas apa suatu sampel akan diklasifikasikan.

Adapun alur dari metode Naive Bayes adalah sebagai berikut :

1. Baca data training

2. Hitung Jumlah dan probabilitas, namun apabila data numerik maka:

a. Cari nilai mean dan standar deviasi dari masing masing parameter

yang merupakan data numerik.

Page 34: ANALISA PENENTUAN STATUS PRODUK NOT GOOD

1

b. Cari nilai probabilistik dengan cara menghitung jumlah data yang

sesuai dari kategori yang sama dibagi dengan jumlah data pada

kategori tersebut.

3. Mendapatkan nilai dalam tabel mean, standart deviasi dan probabilitas.

Gambar 2.2 Skema Naive Bayes

Page 35: ANALISA PENENTUAN STATUS PRODUK NOT GOOD

1

2.4 Tinjauan Perusahaan

2.4.1 Gambaran Umum PT. Arimuraya Indonesia

PT. Arimuraya Indonesia berdiri sejak 20 April 2012 di Jl. Cempaka.

No.12, Blok G Rt 003 / Rw 002 Jatimulya, Tambun Selatan, Bekasi, Jawa Barat

17510.Perusahaan swasta yang bergerak dibidang makanan ini merupakan cabang

perusahaan yang berpusat di Jepang. Perusahaan ini memproduksi Satsuma Age

(makanan olahan ikan).

2.4.2 Visi dan Misi

Visi PT. Arimuraya Indonesia :

โ€œMenjadi Perusahaan makanan yang menghasilkan produk denganmutu

terjaminbersertifikat halal dan dapat diterima masyarakatโ€.

Misi PT. Arimuraya Indonesia :

โ€œMenaikan penjualan produk dan meningkatkan kesejahteraan karyawan serta

terdepan dibidang keselamatan dan kesejahteraan kerja, perlindungan lingkungan

dan tanggung jawab sosialโ€.

2.4.3 Kebijakan PT. Arimuraya Indonesia

PT. Arimuraya Indonesia untuk memastikan terpenuhinya komitmen

tersebut, perusahaan melaksanakan program yang terfokus pada :

1. Peningkatan kualitas produk melalui upaya peningkatan keterampilan

dan perbaikan berkelanjutan.

2. Pencegahan pencemaran lingkunagan sedini mungkin dengan

meminimalisasi dampak pencemaran lingkungan dan pengelolaan bahan-

Page 36: ANALISA PENENTUAN STATUS PRODUK NOT GOOD

1

bahan kimia berbahaya yang dipersyaratkan pelanggan, serta melakukan

penghematan energi dan sumber daya lainnya.

3. Pemenuhan peraturan dan persyaratan lainnya yang berhubungan dengan

kegiatan perusahaan.

4. Penegakan kode etik perusahaan menjamin terselenggarakannnya

hubungan yang baik antara management dan seluruh karyawan serta

menghargai dan mengedapnkan Hak Asasi Manusia didalam seluruh

aspek kegiatan perusahaan.

2.4.4 Struktur Organisasi

Gambar 2. 3 Struktur Organisasi

Page 37: ANALISA PENENTUAN STATUS PRODUK NOT GOOD

1

2.5 Kerangka Pemikiran

Pada penyusunan penelitian ini tersusun atas kerangka pemikiran dengan

konsep dan tujuan alur penelitian. Adapun kerangka pemikiran yang diusulkan

dan akan dilakukan adalah sebagai berikut :

Gambar 2. 4 Kerangka Pemikiran

2.6 Hipotesis

Hipotesis merupakan jawaban sementara dari pertanyaan penelitian.

Hipotesis berfungsi untuk menentukan arah pembuktian, dengan maksud

hipotesis merupakan pernyataan yang harus dibuktikan pada proses penelitian.

Maka pada hipotesis ini, diduga bahwa penggunaan metode klasifikasi

pada konsep data mining dapat menyelesaikan masalah penentuan keputusan

status produk Not Good berdasarkan hasil tabel keterangan produk di Pt

Arimuraya Indonesia menggunakan algoritma Naive Bayes.

Dataset hasil keterangan

produk Ng dan Ok

Teori & Tinjuan Studi terkait

klasifikasi

Melakukan Pengelompokkan

& Pengujian dengan Naive

Bayes

Informasi hasil temuan produk

Ng

Penentuan Barang Ng berdasarkan pada tabel kategori Produk

Page 38: ANALISA PENENTUAN STATUS PRODUK NOT GOOD

1

BAB III

METODOLOGI PENELITIAN

3.1 Jenis Penelitian

Dilihat dari jenis informasi yang dikelola maka jenis penelitian ini

terbagi menjadi :

1. Pendekatan Penelitian

Pada penelitian ini dibangun dengan pendekatan kuantitatif dimana

pendekatan penelitian ini menggunakan skala numerik,berbasis pola alur

Kumpulkan teori, Hasilkan konsep, Rumuskan hipotesis,Uji hipotesis,

TarikKesimpulan dan banyak mengunakan angka, mulai dari pengumpulan

data,penafsiran terhadap data tersebut, serta penampilan hasilnya.

2. Jenis Penelitian

Dalam penelitian ini termasuk kedalam penelitian ekperimental karena

merupakan penelitian yang bersifat uji coba, mempengaruhi hal-hal yang terkait

dengan seluruh variabel atau atribut dan melibatkan pengembangan dan evaluasi.

3.2 Metode Pengumpulan Data

Pengumpulan data merupakan bagian paling penting dalam sebuah

penelitian. Ketersediaan data akan sangat menentukan dalam proses

pengolahan dan analisa selanjutnya.Pada tahapan pengumpulan data, dalam

melakukan penelitian digunakan data sekunder berupa hasil temuan produk NG.

Dengan isi data sebanyak 500, yang meliputi semua produk yang di produksi di Pt

Arimuraya Indonesia. Tahapan pengumpulan data sebagai berikut :

Page 39: ANALISA PENENTUAN STATUS PRODUK NOT GOOD

1

1. Riset Lapangan

Untuk memperoleh data yang diperlukan dalam rangka melakukan analisis

terhadap pembuktian jawaban sementara atau hipotesis dari permasalahan yang

dikemukakan, maka metode yang penulis lakukan adalah:

a. Observasi

Yaitu teknik pengumpulan data yang dilakukan dengan mengadakan

pengamatan langsung terhadap proses penginputan data hasil barang NG

disetiap hasil produksinya. Kata lain observasi adalah suatu teknik mencari

atau menbumpulkan data dengan jalan mengamati dan terjun langsung ke

lapangan, melihat secara nyata keadaan dan kondisi lapangan dengan segala

aspek yang berhubungan langsung dengan peleliti.

b. Wawancara

Yaitu teknik pengumpulan data yang dilakukan dengan mengadakan tanya

jawab langsung dengan responden dan pihak-pihak yang ada kaitanya dengan

maslah yang diteliti.

2. Library research (Penelitian kepustakaan)

Adalah penelitian yang dilakukan dengan mengumpulkan bahan-bahan

pustaka, literature, dan karangan ilmiah yang ada kaitanya dengan penelitian ini.

Library research dibutuhkan untuk membahas permasalahan yang bersifat teori.

Dalam hal ini penulis membaca, mengumpulkan dan mengambil kesimpulan baik

dari buku maupun artikel penerbit lainnya.

Page 40: ANALISA PENENTUAN STATUS PRODUK NOT GOOD

1

3.3 Teknik Analisis Data

Pada penelitian ini menggunakan metodologi pengembangan data mining

yaitu CRISP-DM (Cross Standart Industries for Data mining),yang memiliki

siklus hidup terdiri dari 6 tahap.

Gambar 3. 1Siklus hidup CRISP-DM

Sumber : Setiawan (2016)

Keseluruhan fase berurutan yang ada dan bersifat adaptif. Berikut ini

merupakan langkah-langkah yang dilakukan peneliti berdasarkan darifase CRISP-

DM :

1. Business Understanding

Pada tahapan pertama Peneliti mencoba untuk memahami permasalahan

yangada dalam peningkatan mutu dan kualitas produk di Pt Arimuraya

Indonesia. Sehingga dapat menentukan tujuan dan polayang akan

Page 41: ANALISA PENENTUAN STATUS PRODUK NOT GOOD

1

didapatkan dengan data mining. Data didapat dari pihak perusahaan dan

merupakan data internal dengan alur sebagai berikut :

2. Data UnderstandingPhase (Fase Pemahaman Data)

Pada tahap ini data yang sebelumnya didapat dalam bentuk print out maka

dikonversi kedalam bentuk digital yang disimpan dalam format excel

dengan tujuan memudahkan pengumpulan awal data, deskripsi data,

eksplorasi data dan verifikasi dari kualitas data. Maka contoh sampel data

sebagai berikut :

Tabel 3.1 Data yang digunakan penelitian

3. Data Preparation Phase (Fase Pengolahan Data)

Pengolahan data awal perlu dilakukan untuk menyiapkan data yang benar-

benar valid sebelum diproses. Data hasil kategori produk Ok atau Not

Page 42: ANALISA PENENTUAN STATUS PRODUK NOT GOOD

1

Good yang telah didapatkan kemudian dilakukan kegiatan preprocessing

data yaitu pengseleksian atribut-atribut dan cleansing data. Pengseleksian

atribut yang ada dilakukan untuk dijadikan atribut penentu dalam

penelitian ini. Jumlah atribut keseluruhan dalam data hasil kategori produk

Ok atau Not Good kurang lebih ada 7 atribut, kemudian dilakukan seleksi

atribut yang diperlukan untuk proses analisis selanjutnya, maka didapat

atribut-atribut yang akan digunakan sebagai berikut :

Tabel 3.1 Atribut penelitian

Atribut Variable Type

Nama Produk Y Varchar

Warna X1 Varchar

Waktu Pemasakan X2 Numeric

Jenis X3 Varchar

Alat Pemasakan X4 Varchar

Kematangan X5 Varchar

Berat X6 Numeric

Status Produk X7 Char

Page 43: ANALISA PENENTUAN STATUS PRODUK NOT GOOD

1

4. Modeling Phase (Fase Pemodelan)

Dalam penelitian ini akan dilakukan analisa menggunakan metode

klasifikasi dengan algoritma Naรฏve Bayes. Data dihitung dengan algoritma

ini sesuai dengan metodenya kemudian di cari hasil akurasinya. Dalam

tahapan ini akan dilakukan beberapa langkah pengujian data yaitu seperti

berikut.

Gambar 3. 1 Langkah Pengujian Metode

Data hasil produk Not Good dan OK akan di olah dengan algoritma Naรฏve

Bayes, kemudian dilihat tingkat akurasinya dari algoritma ini dan

keterkaitan antara setiap atribut. Algoritma Naรฏve Bayes akan

mengevaluasi setiap atribut yang mengkontribusi prediksi pada atribut

target. Naรฏve Bayes tidak memperhitungkan relasi antar atribut-atribut

kontributor prediksi, tidak seperti Decision Tree yang memperhitungkan

Page 44: ANALISA PENENTUAN STATUS PRODUK NOT GOOD

1

relasi antara atribut. Bentuk tugas dasar yang dilakukan oleh algoritma

Naรฏve Bayes adalah hanyalah klasifikasi.

5. Evaluation Phase (Fase Evaluasi)

Melakukan pengecekan terhadap setiap nilai atribut dan model yang sudah

dibangun. Kemudian melakukan evaluasi terhadap hasil dengan

melakukan analisis dari setiap variable output atau karakteristik informasi

yang dihasilkan oleh model data mining. Pada tahap ini juga merupakan

tahapan dimana dilakukan perbaikan kembali bila terjadi kekurangan. Pada

tahapan ini bisa saja kembali lagi ke tahap yang pertama dan kemudian ke

tahap berikutnya dengan tujuan perbaikan, sampai sesuai dengan

kebutuhan. Seterusnya adalah tahapan deployment yang merupakan

tahapan akhir dalam pengembangan data mining.

6. Deployment Phase (Fase Penyebaran)

Pembentukan model selanjutnya melakukan analisa dan pengukuran pada

tahap sebelumnya, pada tahap ini diterapkan model atau rule yang paling

akurat dan selanjutnya dapat digunakan untuk mengevaluasi data baru.

Page 45: ANALISA PENENTUAN STATUS PRODUK NOT GOOD

1

3.4 Tahapan Penelitian

Gambar 3. 2 Tahapan Penelitian

1. Tahap pertama yang dilakukan dalam melakukan penelitian ini adalah

melakukan studi literatur dengan cara mempelajari teori dan

Page 46: ANALISA PENENTUAN STATUS PRODUK NOT GOOD

1

pengetahuan dasar-dasar dan konsep-konsep yang mendukung

penelitian.

2. Tahap kedua yaitu identifikasi masalah, pada tahap ini proses yang

dilakukan adalah mengggali permasalahan yang di temukan pada objek

yang di teliti serta mengidentifikasi kebutuhan yang di butuhkan oleh

pengguna guna mencari alternatif solusi yang terkait dengan

permasalahan tersebut.

3. Tahap ketiga yaitu pengumpulan data, setelah tahap identfifikasi

masalah dilakukan dan semua kebutuhan sudah di dapatkan maka tahap

selanjutnya yang harus dilakukan adalah mengumpulkan data. Data yang

di butuhkan adalah kategori produk. Sumber data di dapatkan dari Pt

Arimuraya Indonesia.

4. Tahap keempat yaitu membuat data training /latih dari data-data yang

sudah di kumpulkan, karena tidak semua data di butuhkan untuk

pengujian model.

5. Tahap kelima yaitu membuat data mining yang digunakan untuk

memilih teknik dan algoritma yang sesuai untuk menemukan pola yang

berharga dan tersembunyi dari data kategori produk dengan algoritma

naive bayes.

6. Tahap ke enam adalah hasil prediksi dan penerapan data mining dengan

algoritma naive bayes.

7. Tahap ketujuh yaitu Evaluasi, pada tahap ini dilakukannya evaluasi

untuk mengetahui apakah teknik dan algoritma yang digunakan sudah

Page 47: ANALISA PENENTUAN STATUS PRODUK NOT GOOD

1

sesuai untuk digunakan dalam penelitian sehingga bisa menemukan pola

hubungan antar nilai.

3.5 Peralatan

Penelitian ini memerlukan dukungan peralatan untuk pelaksanaan

penelitian. Peralatan tersebut terbagi menjadi 2, yaitu kebutuhan

software(perangkat lunak) dan hardware (perangkat keras). Berikut ini kebutuhan

peralatan yang dibutuhkan antara lain :

1. Kebutuhan software

Kebutuhan software yang diperlukan pada adalah sebagai berikut :

a. Sistem operasi windows 7 versi 64 bit

Pada penelitian ini penulis menggunakan sistem operasi windows 7

versi 64 bit sebagai platform untuk menjalankan program data mining

tools

b. Rapidminer .

Program ini digunakan sebagai data mining tools untuk menjalankan

tahap-tahap data mining, implementasi algoritma, melakukan metode

optimasi, serta hasil akurasi yang didapat.

c. Microsoft Excel

Program ini digunakan sebagai tools untuk menghitung Naive Bayes

secara manual dengan mengambil beberapa sampel untuk dijadikan

sampling dari keseluruhan data yang ada.

2. Kebutuhan Hardware

Page 48: ANALISA PENENTUAN STATUS PRODUK NOT GOOD

1

Kebutuhan hardware yang diperlukan dalam penelitian ini dalah sebagai

berikut :

a. Laptop intel core-i3

b. RAM 6 GB

c. Hardisk 500 MB

d. Printer

e. Flashdisk

3.6 Jadwal Penelitian

Tahap-tahap dalam kegiatan penelitian ini meliputi, tahap persiapan, tahap

pelaksanaan,tahap penyelesaian, dan tahapan akhir. Berikut adalah tabel kegiatan

penelitian :

Tabel 3.3 Kegiatan penelitian

No Kegiatan

Bulan Pelaksanaan tahun 2018

Juli Agustus September Oktober November

1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4

1.

Pencarian dan

Pemilihan Obyek

Penelitian

2. Perumusan Masalah

Penelitian

3. Penentuan Topik

penelitian

4. Pengumpulan Bahan

Literatur/Referensi

Page 49: ANALISA PENENTUAN STATUS PRODUK NOT GOOD

1

5.

Penyusunan

Kerangka/Landasan

Pemikiran (Tinjauan

Pustaka/Studi/Organis

asi sampai dengan

Kerangka Konsep dan

Hipotesis)

6.

Penyusunan

Metodologi Penelitian

(Jenis Penelitian,

Metode Pengumpulan

Data,

Teknik Analisis

7. Penyusunan Naskah

Proposal Skripsi

8.

Pelaksanaan

Pengumpulan Data

Sampel

9.

Analisis Data,

Implementasi,

Pengujian

10. Penyusunan Naskah

Akhir Skripsi

11.

Penyerahan Formulir

Pendaftaran Sidang

Akhir Skripsi

Page 50: ANALISA PENENTUAN STATUS PRODUK NOT GOOD

1

12. Sidang Akhir Skripsi

13. Penyempurnaan

Naskah Akhir Skrispi

14.

Penggandaan Naskah

Akhir Skripsi dan

Paper

15.

Pembuatan CD berisi

Naskah Akhir Skripsi,

Paper, dan Slide

Presentasi

16. Penyerahan Naskah

Akhir Skripsi, Paper

dan CD

Page 51: ANALISA PENENTUAN STATUS PRODUK NOT GOOD

1

BAB IV

HASIL DAN PEMBAHASAN

4.1 Hasil

Hasil pada penelitian ini dilakukan dengan perhitungan manual dengan

menggunakan microsoft excel, kemudian diuji dengan tool bantu aplikasi

Rapidminer dengan dataset yang telah dipersiapkan. Pengujian pada penelitian ini

dilakukan dengan menggunakan algoritma Naive Bayes.

Tahap awal cara kerja dari proses perhitungan Naive Bayes adalah dengan

melakukan pengambilan data training dari data kategori produk Ok atau Ng.

Adapun variabel penentu yang digunakan dalam mengklasifikasikan data produk

yaitu :

1. Nama Produk

Merupakan variabel yang terdiri dari beberapa jenis produk di PT

Arimuraya Indonesia.

2. Warna

Merupakan variabel dari salah satu penentu bahwa produk layak atau tidak

(NG) dengan warna putih, coklat, pink, kuning dan hitam.

3. Waktu Pemasakan

Merupakan variabel ketentuan waktu disetiap proses pemasakan produk

tertentu, ada dua kategori dalam waktu pemasakan yaitu 5 menit dan 60

menit.

4. Jenis

Page 52: ANALISA PENENTUAN STATUS PRODUK NOT GOOD

1

Merupakan variabel ketentuan jenis produk dengan dua kategori yaitu

kukus dan goreng.

5. Alat Pemasakan

Merupakan variabel ketentuan produk di masak atau di produksi dengan

alat yang sesuai yaitu Boiler, Fryer, dan Steamer.

6. Kematangan

Merupakan variabel dari salah satu penentu produk layak atau tidak

dengan beberapa kategori yaitu padat, lembek, keras, dan gosong.

7. Berat

Merupakan variabel dari salah satu penentu produk layak atau tidak

dengan ukuran 8 gr sampai dengan 221 grsesuai data training.

Tabel 4.1 Data testing (random)

Berdasarkan tabel diatas dapat dihitung klasifikasi data kategori produk Oke

atau Not Good apabila diberikan input berupa nama produk, warna, waktu

No Nama Produk Warna Waktu

Pemasakan Jenis

Alat

Pemasakan Kematangan Berat Status

1 Shaburi Shiro Putih 5 Menit Kukus Boiler Padat 8 Gr Ok

2 Shaburi Shiro Putih 5 Menit Kukus Boiler Padat 9 Gr Ok

3 Shaburi Shiro Putih 5 Menit Kukus Boiler Padat 10 Gr Ok

4 Shaburi Shiro Putih 5 Menit Kukus Boiler Padat 11 Gr Ok

5 Shaburi Shiro Putih 5 Menit Kukus Boiler Padat 12 Gr Ok

- - - - - - - -

- - - - - - - -

- - - - - - - -

496 Tamanegi Ten Coklat 5 Menit Goreng Fryer Padat 53 Gr Ng

497 Tamanegi Ten Coklat 5 Menit Goreng Fryer Padat 54 Gr Ng

498 Tamanegi Ten Coklat 5 Menit Goreng Fryer Padat 55 Gr Ng

499 Tamanegi Ten Coklat 5 Menit Goreng Fryer Padat 56 Gr Ng

500 Tamanegi Ten Coklat 5 Menit Goreng Fryer Padat 57 Gr Ng

Page 53: ANALISA PENENTUAN STATUS PRODUK NOT GOOD

1

pemasakan, jenis, alat pemasakan, kematangan dan berat. Menggunkan Naive

Bayes.

Apabila diberikan input baru, maka klasifikasi data kategori produk dapat

ditentukan melalui langkah berikut :

Keterangan :

Y : Status

X1 : Nama Produk

X2 : Warna

X3 : Waktu Pemasakan

X4 : Jenis

X5 : Alat pemasakan

X6 : Kematangan

X7 : Berat

Penghitungan Naive Bayesmanual menggunakan Microsoft Excel:

1. Menghitung jumlah class/label

Tabel 4.2 Penghitungan class atau label

P(Y=Ok) P(Y=Ng)

122/500=0,244 378/500=0,756

Page 54: ANALISA PENENTUAN STATUS PRODUK NOT GOOD

1

Dari hasil penghitungan ini maka di dapat jika jumlah class/labelOk pada

data testing sebanyak 122 dibagi dengan keseluruhan jumlah Y sebanyak 500

maka hasil Ok= 0,224 dan jumlah data Ng pada data sebanyak 378 dibagi dengan

keseluruhan jumlah Y sebanyak 500 maka hasil Ng=0,756.

2. Mencari peluang

Tabel 4.3 Penghitungan X1

X1 Ok Ng P X1(Ok) P X1(Ng)

Shaburi Shiro 5 15 0,040983607 0,03968254

Shaburi Age 4 16 0,032786885 0,042328042

Boten 4 16 0,032786885 0,042328042

Kamaboko

Shiro

3 27

0,024590164 0,071428571

Kamaboko Aka 6 19 0,049180328 0,05026455

Tokudai Maru 4 21 0,032786885 0,055555556

Jumbo 7 13 0,057377049 0,034391534

Mini Maru 6 24 0,049180328 0,063492063

Mini Ten 6 14 0,049180328 0,037037037

Stick Plan 5 15 0,040983607 0,03968254

Gobo FS 7 23 0,057377049 0,060846561

Gobo Retail 5 15 0,040983607 0,03968254

Tokudai Gobo 6 14 0,049180328 0,037037037

Edamame FS 6 24 0,049180328 0,063492063

Edamame

Retail

6 14

0,049180328 0,037037037

Mix Yasai Ball 6 14 0,049180328 0,037037037

Satai Yasai 6 14 0,049180328 0,037037037

Komugi 6 14 0,049180328 0,037037037

Naruto 6 14 0,049180328 0,037037037

Yasai Ten 6 24 0,049180328 0,063492063

Cheese Ten 6 14 0,049180328 0,037037037

Tamanegi Ten 6 14 0,049180328 0,037037037

Total 122 378

Page 55: ANALISA PENENTUAN STATUS PRODUK NOT GOOD

1

Dari perhitungan mencari probabilitas X1 =

Jumlah X1(Ok) Pada setiap nama produk di bagi total Ok keseluruhan data X1

menghasilkan PX1(Ok).

Shaburi Shiro (Ok) = 5/122 = 0,040983607

Jumlah X1(Ng) Pada setiap nama produk di bagi total Ok keseluruhan data X1

menghasilkan P X1(Ng).

Shaburi Shiro (Ng) = 15/378 = 0,03968254

Tabel 4.4 Penghitungan X2

X2 Ok Ng P X2(Ok) P X2(Ng)

Putih 14 51 0,114754098 0,134920635

Kuning 0 5 0 0,013227513

Coklat 102 231 0,836065574 0,611111111

Hitam 0 72 0 0,19047619

Pink 6 19 0,049180328 0,047619048

Total 122 378

Dari perhitungan mencari probabilitas X2=

Jumlah X2(Ok) Pada warna produk di bagi total Ok keseluruhan data

X2menghasilkan PX2(Ok).

Contoh :

Putih (Ok) = 14/122 = 0,114754098

Jumlah X2(Ng) Pada warna produk di bagi total Ok keseluruhan data

X2menghasilkan P X2(Ng).

Page 56: ANALISA PENENTUAN STATUS PRODUK NOT GOOD

1

Contoh :

Putih (Ng) = 51/378 = 0,134920635

Tabel 4.5 Penghitungan X3

X3 Ok Ng P X3(Ok) P X3(Ng)

5 Menit 107 318 0,87704918 0,841269841

60 Menit 15 60 0,12295082 0,158730159

Total 122 378

Dari perhitungan mencari probabilitas X3 =

Jumlah X3(Ok) Pada waktu produk di bagi total Ok keseluruhan data

X3menghasilkan PX3(Ok).

Contoh :

5 Menit (Ok) = 107/122 = 0,87704918

Jumlah X3(Ng) Pada waktu produk di bagi total Ok keseluruhan data

X3menghasilkan P X3(Ng).

Contoh :

5 Menit (Ng) = 318/378 = 0,841269841

Tabel 4.6 Penghitungan X4

X4 Ok Ng P X4(Ok) P X4(Ng)

Kukus 20 75 0,163934426 0,198412698

Goreng 102 303 0,836065574 0,801587302

Total 122 378

Page 57: ANALISA PENENTUAN STATUS PRODUK NOT GOOD

1

Dari perhitungan mencari probabilitas X4 =

Jumlah X4(Ok) Pada setiap jenis produk di bagi total Ok keseluruhan data

X4menghasilkan PX4(Ok).

Contoh:

Kukus (Ok) = 20/122 = 0,163934426

Jumlah X2(Ng) Pada setiap jenis produk di bagi total Ok keseluruhan data

X2menghasilkan P X2(Ng).

Contoh:

Kukus (Ng) = 75/378 = 0,198412698

Tabel 4.7 Penghitungan X5

X5 Ok Ng P X5(Ok) P X5(Ng)

Boiler 5 15 0,040983607 0,03968254

Fryer 102 303 0,836065574 0,801587302

Steamer 15 60 0,12295082 0,158730159

Total 122 378

Dari perhitungan mencari probabilitas X5=

Jumlah X5(Ok) Pada setiap alat pemasakan produk di bagi total Ok keseluruhan

data X5menghasilkan PX5(Ok).

Contoh :

Boiler (Ok) = 5/122 = 0,040983607

Page 58: ANALISA PENENTUAN STATUS PRODUK NOT GOOD

1

Jumlah X5(Ng) Pada setiap alat pemasakan produk di bagi total Ok keseluruhan

data X5menghasilkan P X5(Ng).

Contoh :

Boiler (Ng) = 15/378 = 0,03968254

Tabel 4.8 Penghitungan X6

X6 Ok Ng P X6(Ok) P X6(Ng)

Lembek 0 36 0 0,095238095

Padat 107 216 0,87704918 0,571428571

Kenyal 15 47 0,12295082 0,124338624

Keras 0 10 0 0,026455026

Gosong 0 69 0 0,182539683

Total 122 378

Dari perhitungan mencari probabilitas X6=

Jumlah X6(Ok) Pada setiap kematangan produk di bagi total Ok keseluruhan data

X6menghasilkan PX6(Ok).

Contoh :

Lembek (Ok) = 0/122 = 0

Jumlah X6(Ng) Pada setiap kematangan produk di bagi total Ok keseluruhan data

X6menghasilkan P X6(Ng).

Contoh :

Lembek (Ng) = 36/378 = 0,095238095

Page 59: ANALISA PENENTUAN STATUS PRODUK NOT GOOD

1

Tabel 4.9 Penghitungan X7

X7 Ok Ng P X7(Ok) P X7(Ng)

8 Gr 2 7 0,016393443 0,018518519

9 Gr 2 4 0,016393443 0,010582011

10 Gr 2 4 0,016393443 0,010582011

11 Gr 2 3 0,016393443 0,007936508

12 Gr 1 3 0,008196721 0,007936508

- - - - -

- - - - -

- - - - -

53 Gr 2 8 0,016393443 0,021164021

54 Gr 2 8 0,016393443 0,021164021

55 Gr 4 9 0,032786885 0,023809524

56 Gr 2 9 0,016393443 0,023809524

57 Gr 2 9 0,016393443 0,023809524

Total 122 378

Dari perhitungan mencari probabilitas X7=

Jumlah X7(Ok) Pada setiap berat produk di bagi total Ok keseluruhan data

X7menghasilkan PX7(Ok).

Contoh :

8 Gr (Ok) = 2/122 = 0,016393443

Jumlah X7(Ng) Pada setiap berat produk di bagi total Ok keseluruhan data

X7menghasilkan P X7(Ng).

Contoh :

8 Gr (Ng) = 7/378 = 0,018518519

Page 60: ANALISA PENENTUAN STATUS PRODUK NOT GOOD

49

3. Kalikan semua hasil atribut Ok

Tabel 4.10 Penghitungan atribut Ok

Dari Penghitungan ini dikalikan semua hasil probabilitas Ok pada data testing yang diuji

Contoh : 0,040983607 x 0,114754098 x 0,87704918 x 0,163934426 x 0,040983607 x 0,87704918 x 0,016393443 x 0,244 = 9,72225E-

08

P(X1)* P(X2)* P(X3)* P(X4)* P(X4)* P(X5)* P(X6)* P(X7)= P(X) P(X)*Y(Ok)

No Y(Ok) X1 X2 X3 X4 X5 X6 X7 Ok

1 0,244 0,040983607 0,114754098 0,87704918 0,163934426 0,040983607 0,87704918 0,016393443 9,72225E-08

2 0,244 0,040983607 0,114754098 0,87704918 0,163934426 0,040983607 0,87704918 0,016393443 9,72225E-08

3 0,244 0,040983607 0,114754098 0,87704918 0,163934426 0,040983607 0,87704918 0,016393443 9,72225E-08

4 0,244 0,040983607 0,114754098 0,87704918 0,163934426 0,040983607 0,87704918 0,016393443 9,72225E-08

5 0,244 0,040983607 0,114754098 0,87704918 0,163934426 0,040983607 0,87704918 0,008196721 4,86112E-08

- - - - - - - - - -

- - - - - - - - - -

- - - - - - - - - -

496 0,244 0,049180328 0,836065574 0,87704918 0,836065574 0,836065574 0,87704918 0,016393443 8,84342E-05

497 0,244 0,049180328 0,836065574 0,87704918 0,836065574 0,836065574 0,87704918 0,016393443 8,84342E-05

498 0,244 0,049180328 0,836065574 0,87704918 0,836065574 0,836065574 0,87704918 0,032786885 0,000176868

499 0,244 0,049180328 0,836065574 0,87704918 0,836065574 0,836065574 0,87704918 0,016393443 8,84342E-05

500 0,244 0,049180328 0,836065574 0,87704918 0,836065574 0,836065574 0,87704918 0,016393443 8,84342E-05

Page 61: ANALISA PENENTUAN STATUS PRODUK NOT GOOD

1

4. Kalikan semua hasil variabel Ng

Tabel 4.11 Penghitungan Variabel Ng

Dari Penghitungan ini dikalikan semua hasil probabilitas Ng pada data testing yang diuji.

Contoh : 0,03968254 x 0,134920635 x 0,841269841 x 0,198412698 x 0,040983607 x 0,571428571 x 0,018518519x 0,756 = 2,83708E-07

P(X1)* P(X2)* P(X3)* P(X4)* P(X4)* P(X5)* P(X6)* P(X7)= P(X) P(X)*Y(Ng)

No Y(Ng) X1 X2 X3 X4 X5 X6 X7 Ng

1 0,756 0,03968254 0,134920635 0,841269841 0,198412698 0,03968254 0,571428571 0,018518519 2,83708E-07

2 0,756 0,03968254 0,134920635 0,841269841 0,198412698 0,03968254 0,571428571 0,010582011 1,62119E-07

3 0,756 0,03968254 0,134920635 0,841269841 0,198412698 0,03968254 0,571428571 0,010582011 1,62119E-07

4 0,756 0,03968254 0,134920635 0,841269841 0,198412698 0,03968254 0,571428571 0,007936508 1,21589E-07

5 0,756 0,03968254 0,134920635 0,841269841 0,198412698 0,03968254 0,571428571 0,007936508 1,21589E-07

- - - - - - - - - - - - - - - - - - - - - - - - - - - - - -

496 0,756 0,037037037 0,611111111 0,841269841 0,801587302 0,801587302 0,571428571 0,021164021 0,00011186

497 0,756 0,037037037 0,611111111 0,841269841 0,801587302 0,801587302 0,571428571 0,021164021 0,00011186

498 0,756 0,037037037 0,611111111 0,841269841 0,801587302 0,801587302 0,571428571 0,023809524 0,000125843

499 0,756 0,037037037 0,611111111 0,841269841 0,801587302 0,801587302 0,571428571 0,023809524 0,000125843

500 0,756 0,037037037 0,611111111 0,841269841 0,801587302 0,801587302 0,571428571 0,023809524 0,000125843

Page 62: ANALISA PENENTUAN STATUS PRODUK NOT GOOD

49

Maka dapat di tentukan hasil prediksi :

Tabel 4.12 Penghitungan Prediction

Jika Hasil Ok > dari Ng Maka menjadi hasil Class Prediction

Accuracy = 85%

No Ok Ng Class Prediction

1 9,72225E-08 2,83708E-07 Ng

2 9,72225E-08 1,62119E-07 Ng

3 9,72225E-08 1,62119E-07 Ng

4 9,72225E-08 1,21589E-07 Ng

5 4,86112E-08 1,21589E-07 Ng

- - - -

- - - -

- - - -

496 8,84342E-05 0,00011186 Ng

497 8,84342E-05 0,00011186 Ng

498 0,000176868 0,000125843 Ok

499 8,84342E-05 0,000125843 Ng

500 8,84342E-05 0,000125843 Ng

Tabel 4.13PenghitunganAccuracy

CLASS

Predicted โ†“ Ok Ng

Ok 72 25

Ng 50 353

Page 63: ANALISA PENENTUAN STATUS PRODUK NOT GOOD

1

4.2 Analisa algoritma Naive Bayes Implementasi dengan RapidMiner

RapidMiner Studio 8.2 adalah salah satu tooluntuk melakukan prediksidan

analisa data mining. Berikut adalah tahapan pengolahan data dengan

menggunakanRapidMiner Studio 8.2 :

1. Pada tahap ini data training kategori status produk di import kedalam

toolRapidMiner Studio 8.2

Gambar 4. 1Import data kategori status produk

2. Pada tahap kedua data testing kategori status produk di import kedalam

toolRapidMiner Studio 8.2

Page 64: ANALISA PENENTUAN STATUS PRODUK NOT GOOD

1

Gambar 4. 2Import data testing kategori status produk

3. Proses Training yaitu melakukan proses pelatihan data pada model

NaรฏveBayes. Sedangkan proses testing yaitu melakukan pengujian data

yang akanmenghasilkan grafik dan pola.

Pada gambar 4.3 dijelaskan bahwa proses training di gunakan untuk

blokmodel naive bayes, di hubungkan dengan garis penghubung pada blok

applymodel dan blok performance dengan bagian testing sebagai penampil

informasihasil dari pengujian data, hasil dari pengujian ini akan

menghasilkan arsitekturnaive bayes. Dengan menggunakan Rapidminer

dapat menganalisis dataset datamahasiswa menggunakan metode naive

Page 65: ANALISA PENENTUAN STATUS PRODUK NOT GOOD

1

bayes. Untuk menghindari kesalahankarena terdapat hasil 0 (nol) maka

bagian laplace correction di parameter harus dichecklist.

Gambar 4. 3 Proses permodelan Naive Bayes pada data kategori status produk

4. Pada tahap ini hasil dari apply model sebagai berikut :

Gambar 4. 4 Proses apply model pada data kategori status produk

Page 66: ANALISA PENENTUAN STATUS PRODUK NOT GOOD

1

4.3 Evaluasi (Evaluation)

Gambar 4. 5 Hasil Performance Vektor

Proses klasifikasi dengan Rapidminer dengan metode naive bayes yang

digunakan mengklasifikasi data kategori status produk pada penelitian ini

sehingga diperoleh nilai Accuracy, Precision, dan Recall.

a. Accuracy/akurasi

Dengan mengetahui jumlah data yang di klasifikasikan secara benarmaka

dapat di ketahui akurasi hasil prediksi yaitu 85% dari hasil datatesting.

Page 67: ANALISA PENENTUAN STATUS PRODUK NOT GOOD

1

Gambar 4. 6 Hasil Accuracy

b. Precision

Precision adalah jumlah data yang true positive (jumlah data positifyang di

kenali secara benar sebagai positif) di bagi dengan jumlah datadikenali

sebagai positif. Dari hasil pengujian nilai precision yaitu 74,23%untuk class

Ok dan 87.59% untuk class Ng.

Gambar 4. 7 Hasil Precision

c. Recall

Page 68: ANALISA PENENTUAN STATUS PRODUK NOT GOOD

1

Recall adalah jumlah data yang true positive di bagi dengan jumlahdata yang

sebenarnya positive (true positive โ€“ true negative). Untuk nilaiRecall yaitu

59,02% untuk class Ok dan 100% untuk class Ng.

Gambar 4. 8 Hasil Recall

Page 69: ANALISA PENENTUAN STATUS PRODUK NOT GOOD

1

BAB V

PENUTUP

5.1 Kesimpulan

Metode Naive Bayes memanfaatkan data training untuk menghasilkan

probabilitas setiap kriteria untuk class yang berbeda, sehingga nilai-nilai

probabilitas dari kriteria tersebut dapat dioptimalkan untuk menentukan produk

Not Good berdasarkan klasifikasi yang dilakukan oleh metode naive bayes itu

sendiri.

Dari hasil pengujian yang telah dilakukan maka hasil penelitian dengan

algoritma naive bayes didapatkan sebuah hasil bahwa nilai akurasinya adalah 85%

ini adalah termasuk akurasi yang excellent classification (klasifikasi yang sangat

baik) pada grafik probabilitas Not Goodmenunjukan bahwa class dapat digunakan

sebagai acuan status produk Not Good.

5.2 Saran

Perlu dilakukan pengembangan metode klasifikasi seperti klastering dan

asosiasi. Setiap metode diuji tingkat akurasinya baik dari akurasi metode pada

data mining dan pada uji akurasi antara actual dan prediksi. Perlu dilakukan studi

lebih lanjut dalam kakus penentuan status produk Not Goodserta melakukan

perbandingan dengan algoritma lain sehingga dapat diperoleh algoritma dengan

tingkat akurasi yang baik.

Page 70: ANALISA PENENTUAN STATUS PRODUK NOT GOOD

1

DAFTAR PUSTAKA

Aan Komariyah & Djamโ€™an Satori (2014). Metodologi Penelitian Kualitatif

Bandung : Alfabeta,(1), 102-107.

Bustami. (2014). Penerapan Algoritma Naive Bayes untuk Mengklasifikasi Data

Nasabah Asuransi. Jurnal Penelitian Teknik Informatika Universitas Ahmad

Dahlan (TECHSI), (1), 128โ€“146.

Jananto, A. (2013). Algoritma Naive Bayes untuk Mencari Perkiraan Waktu

Studi Mahasiswa. Teknologi Informasi DINAMIK, 18(1), 9โ€“16.

Jiawei, H., Kamber, M., Han, J., Kamber, M., & Pei, J. (2012). Data mining:

Concepts and Techniques. San Francisco, CA, itd: Morgan Kaufmann.

Manalu, E., Sianturi, F. A., & Manalu, M. R. (2017). Penerapan Algoritma Naive

Bayes Untuk Memprediksi Jumlah Produksi Barang Berdasarkan Data

Persediaan Dan Jumlah Pemesanan Pada Cv . Papadan Mama Pastries.

Mantik Penusa, 1(2), 16โ€“21. Retrieved from

https://ejurnal.pelitanusantara.ac.id/index.php/mantik/article/view/257

Marwanto, Aris. (2015). Marketing Sukses. Yogjakarta: KOBIS.

Meilani, B. D., Susanti (2015). Aplikasi data mining untuk menghasilkan pola.

Jurnal Ilmiah NERO, Vol.1, Page 182-189.

Patil, T. R. (2013). Performance Analysis of Naive Bayes and J48 Classication

algorithm for Data Classification. Internasional Journal Of Computer

Science And Applications, ISSN: 0974-1011, Vol 6, Page 256-261.

Page 71: ANALISA PENENTUAN STATUS PRODUK NOT GOOD

1

Permata , A. & Ayu, F.(2015). Mapping Student's Performance Based on Data

Mining Approach (A Case Study). Italian Oral Surgery, Vol.3, Page 173-

177. http://doi.org/10.1016/j.aaspro.2015.01.034

Sangadji, E.M., (2013). Prilaku Konsumen: Pendekatan Praktis

Disertai:Himpunan Jurnal Penelitian. Yogyakarta: Penerbit Andi.

Wicaksono, A. E. (2016). Implementasi data mining dalam pengelompokan data

peserta didik di sekolah untuk memprediksi calon penerima beasiswa

dengan menggunakan algoritma k- means (studi kasus sman 16 bekasi).

Jurusan Teknik Informatika, Universitas Gunadarma, 21(3), 208.

Yuda Septian, N. (2013). Data Mining Menggunakan Algoritma Naรฏve Bayes

Untuk Klasifikasi Kelulusan Mahasiswa Universitas Dian Nuswantoro.

Jurnal Semantik 2013, 1โ€“11. https://doi.org/10.13140/RG.2.1.4204.3923

Page 72: ANALISA PENENTUAN STATUS PRODUK NOT GOOD

1

Page 73: ANALISA PENENTUAN STATUS PRODUK NOT GOOD

1

Page 74: ANALISA PENENTUAN STATUS PRODUK NOT GOOD

49