PENERAPAN DATA MINING DENGAN ALGORITMA
C4.5 DALAM PREDIKSI PENJUALAN BOTOL
PADA CV. SERIBUKILO
SKRIPSI
Oleh:
TRI BAGUS TUSARWENDA
311410769
PROGRAM STUDI TEKNIK INFORMATIKA
SEKOLAH TINGGI TEKNOLOGI PELITA BANGSA
BEKASI
2018
PENERAPAN DATA MINING DENGAN ALGORITMA
C4.5 DALAM PREDIKSI PENJUALAN BOTOL
PADA CV. SERIBUKILO
SKRIPSI
Diajukan Sebagai Salah Satu Syarat Untuk Menyelesaikan
Program Strata Satu (S1) pada Program Studi Teknik Informatika
Oleh:
TRI BAGUS TUSARWENDA
311410769
PROGTAM STUDI TEKNIK INFORMATIKA
SEKOLAH TINGGI TEKNOLOGI PELITA BANGSA
BEKASI
2018
iv
KATA PENGANTAR
Puji syukur penulis panjatkan ke hadiran Allah SWT. yang telah
melimpahkan segala rahmat dan hidayah-Nya, sehingga tersusunlah Skripsi yang
berjudul “PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM
PREDIKSI PENJUALAN BOTOL PADA CV.SERIBUKILO”.
Skripsi tersusun dalam rangka melengkapi salah satu persyaratan dalam
rangka menempuh ujian akhir untuk memperoleh gelar Sarjana Komputer (S.Kom.)
pada Program Studi Teknik Informatika di Sekolah Tinggi Teknologi Pelita Bangsa.
Penulis sungguh sangat menyadari, bahwa penulisan Skripsi ini tidak akan
terwujud tanpa adanya dukungan dan bantuan dari berbagai pihak. Sudah
selayaknya, dalam kesempatan ini penulis menghaturkan penghargaan dan ucapan
terima kasih yang sebesar-besarnya kepada:
a. Bapak Dr. Ir. Suprianto, M.P selaku Ketua STT Pelita Bangsa
b. Bapak Aswan Supriyadi Sunge, S.Kom, M.Kom selaku Ketua Program Studi
Teknik Informatika STT Pelita Bangsa.
c. Bapak Aswan Supriyadi Sunge, S.Kom, M.Kom selaku Pembimbing Utama
yang telah banyak memberikan arahan dan bimbingan kepada penulis dalam
penyusunan Skripsi ini.
d. Ibu Nisa Nurhidayanti, S.Pd, M.T, selaku Pembimbing Kedua yang telah
banyak memberikan arahan dan bimbingan kepada penulis dalam penyusunan
Skripsi ini.
e. Seluruh Dosen STT Pelita Bangsa yang telah membekali penulis dengan
wawasan dan ilmu di bidang teknik informatika.
f. Seluruh staf STT Pelita Bangsa yang telah memberikan pelayanan terbaiknya
kepada penulis selama perjalanan studi jenjang Strata 1.
g. Rekan-rekan mahasiswa STT Pelita Bangsa, khususnya angkatan 2014, yang
telah banyak memberikan inspirasi dan semangat kepada penulis untuk dapat
menyelesaikan studi jenjang Strata 1.
h. Ibu dan Ayah tercinta yang senantiasa mendo’akan dan memberikan semangat
dalam perjalanan studi Strata 1 maupun dalam kehidupan penulis.
v
Akhir kata, penulis mohon maaf atas kekeliruan dan kesalahan yang terdapat
dalam Skripsi ini dan berharap semoga Skripsi ini dapat memberikan manfaat bagi
khasanah pengetahuan Teknologi Informasi di lingkungan STT Pelita Bangsa
khususnya dan Indonesia pada umumnya.
Bekasi, November 2018
Penulis
vi
DAFTAR ISI
PERSETUJUAN ...................................................................................................... i
PENGESAHAN ...................................................................................................... ii
PERNYATAAN KEASLIAN PENELITIAN ....................................................... iii
KATA PENGANTAR ........................................................................................... iv
DAFTAR ISI .......................................................................................................... vi
DAFTAR TABEL ................................................................................................... x
DAFTAR GAMBAR ............................................................................................ xii
ABSTRACT ......................................................................................................... xiii
ABSTAKSI .......................................................................................................... xiv
BAB I PENDAHULUAN ....................................................................................... 1
1.1 Latar Belakang Masalah ........................................................................... 1
1.2 Identifikasi Masalah ................................................................................. 3
1.3 Rumusan Masalah .................................................................................... 4
1.4 Batasan Masalah ....................................................................................... 4
1.5 Tujuan dan Manfaat .................................................................................. 4
1.5.1 Tujuan ............................................................................................... 4
1.5.2 Manfaat Penelitian ............................................................................ 5
1.6 Sistematika Penulisan ............................................................................... 5
BAB II TINJAUAN PUSTAKA ............................................................................. 7
vii
2.1 Tinjauan Penelitian Terdahulu ................................................................. 7
2.2 Tinjauan Teori ........................................................................................ 12
2.2.1 Produk ............................................................................................. 12
2.2.2 Penjualan. ........................................................................................ 13
2.2.3 Laba..................................................................................................14
2.2.4 Machine Learning............................................................................15
2.2.5 Bagian Machine Learning...............................................................16
2.2.6 Data Mining......................................................................................17
2.2.7 Tahapan Data Mining.......................................................................19
2.2.8 Klasifikasi ..........................................................................................21
2.2.9 Prediksi ..............................................................................................23
2.2.10 Algoritma C4.5 ..................................................................................24
BAB III METODE PENELITIAN........................................................................ 28
3.1 Metode Penelitian ................................................................................... 28
3.2 Kerangka Berfikir ................................................................................... 29
3.3 Objek Penelitian.......................................................................................32
3.4 Bahan Penelitian ......................................................................................33
3.5 Alat Penelitian (RapidMiner)....................................................................34
3.6 Jenis Data .................................................................................................35
3.7 Teknik Analisa Data..................................................................................36
viii
3.8 Tahapan Penelitian ...................................................................................37
3.8.1 Pengumpulan Data................................................................................39
3.8.2 Pengelolaan Awal Data.........................................................................49
3.8.3 Metode yang Diusulkan........................................................................52
BAB IV HASIL DAN PEMBAHASAN .............................................................. 54
4.1 Hasil ........................................................................................................ 54
4.1.1 Evaluasi dan Validasi Hasil Algoritma C4.5......................................54
4.1.2 Pemilihan Data....................................................................................67
4.1.3 Pemilihan Atribut Sebagai Label........................................................68
4.1.4 Cross Validation.................................................................................68
4.1.5 Main Proces Decision Tree..................................................................69
4.1.6 Main Proces Validation.......................................................................70
4.2 Pembahasan ............................................................................................ 71
4.2.1 Decision Tree......................................................................................71
4.2.2 Confusion Matrix ...............................................................................72
4.2.2.1 Accuracy (Data Training)..................................................72
4.2.2.2 Recal Data (Data Training)...............................................73
4.2.2.3 Accuracy (Data Testing).....................................................74
4.2.2.4 Recal Data (Data Testing).................................................75
4.2.3 ROC/AUC (Area Under Cover)........................................................75
ix
4.2.3.1 ROC/AUC Data Training...................................................76
4.2.3.2 ROC/AUC Data Testing.....................................................77
BAB V KESIMPULAN ........................................................................................ 78
5.1 Kesimpulan ............................................................................................. 78
5.2 Saran ....................................................................................................... 78
DAFTAR PUSTAKA ........................................................................................... 80
x
DAFTAR TABEL
Tabel 3.1 Data Jenis Botol .................................................................................... 40
Tabel 3.2 Data Jenis Botol (lanjutan) .................................................................... 41
Tabel 3.3 Data Jenis Botol (lanjutan).....................................................................42
Tabel 3.4 Data Jenis Botol (lanjutan).....................................................................43
Tabel 3.5 Data Jenis Botol (lanjutan).....................................................................44
Tabel 3.6 Data Jenis Botol (lanjutan).....................................................................45
Tabel 3.7 Data Jenis Botol (lanjutan).....................................................................46
Tabel 3.8 Atribut Data............................................................................................46
Tabel 3.9 Atribut Data (lanjutan)...........................................................................47
Tabel 3.10 Jurnal Penelitian Terdahulu..................................................................47
Tabel 3.11 Jurnal Penelitian Terdahulu (lanjutan).................................................48
Tabel 3.12 Jurnal Penelitian Terdahulu (lanjutan).................................................49
Tabel 3.13 Atribut Data Training...........................................................................49
Tabel 3.14 Atribut Data Training..........................................................................50
Tabel 4.1 Data Jenis Botol Keseluruhan................................................................54
Tabel 4.2 Data Jenis Botol Keseluruhan (lanjutan).................................................55
Tabel 4.3 Data Jenis Botol Keseluruhan (lanjutan).................................................56
Tabel 4.4 Data Jenis Botol Keseluruhan (lanjutan).................................................57
Tabel 4.5 Data Jenis Botol Keseluruhan (lanjutan).................................................58
xi
Tabel 4.6 Data Jenis Botol Keseluruhan (lanjutan).................................................59
Tabel 4.7 Data Jenis Botol Keseluruhan (lanjutan).................................................60
Tabel 4.8 Data Jenis Botol Keseluruhan (lanjutan).................................................61
Tabel 4.9 Data Training (80% dari Data Keseluruhan)..........................................61
Tabel 4.10 Data Training Lanjutan (80% dari Data Keseluruhan).........................62
Tabel 4.11 Data Training Lanjutan (80% dari Data Keseluruhan).........................63
Tabel 4.12 Data Training Lanjutan (80% dari Data Keseluruhan).........................64
Tabel 4.13 Data Training Lanjutan (80% dari Data Keseluruhan).........................65
Tabel 4.14 Data Testing (20% dari Data Keseluruhan).........................................65
Tabel 4.15 Data Testing Lanjutan (20% dari Data Keseluruhan)...........................66
xii
DAFTAR GAMBAR
Gambar 2.1 Tahapan Data Mining........................................................................ 19
Gambar 2.2 Rumus Gain Ration........ ....................................................................25
Gambar 2.3 Rumus Split Information............ ........................................................25
Gambar 2.4 Rumus Prepruning......... ....................................................................26
Gambar 3.1 Kerangka Berfikir .............................................................................. 30
Gambar 3.2 Logo Seribukilo ................................................................................. 33
Gambar 3.3 Tahapan Penelitian ............................................................................ 38
Gambar 3.4 Langkah Pengujian.............................................................................53
Gambar 4.1 Pemilihan Data....................................................................................67
Gambar 4.2 Pemilihan Atribut Sebagai Label........................................................68
Gambar 4.3 Cross Validation.................................................................................68
Gambar 4.4 Main Proces Decision Tree (Data Training) ....................................69
Gambar 4.5 Main Proces Validation.....................................................................70
Gambar 4.6 Decision Tree.....................................................................................71
Gambar 4.7 Acciracy Data Training......................................................................72
Gambar 4.8 Recall Data (Data Training)...............................................................73
Gambar 4.9 Accuracy (Data Training)...................................................................74
Gambar 4.10 Recall Data (Data Testing)...............................................................75
Gambar 4.11 ROC/AUC Data Training.................................................................76
xiii
Gambar 4.12 ROC/AUC Data Testing...................................................................77
xiv
ABSTRACT
Many people talk about business, business benefits and the many types of
businesses that are diverse, which certainly has one goal, which is to get financial
benefits or profits. With so many types of businesses and benefits that can be taken
from business, of course, we often feel like immediately jumping into the business
world to get more or more specific profits, namely income. One example of a
business is selling bottles. In selling, we certainly have a large collection of sales
data, so we must be able to process sales data to become new information. In this
case the C4.5 algorithm is a method that can help process or predict sales values
in the future. One software that can be used to help implement the C4.5 algorithm
and simultaneously process data so that the data can be useful and produce new
information, namely RapidMiner. This research was conducted in order to help
sellers to predict sales of merchandise, so that they can prepare or stock items that
are predicted to increase in sales. From this study it can be concluded that by using
the C4.5 algorithm, bottle sales can be predicted with a fairly high accuracy, the
results of measuring the accuracy of the data obtained from training data with
Confusion Matrix are 90.59% and the testing data reaches 88.00%. When viewed
with the ROC curve, training data has Excellent Classification accuracy of 0.998
and testing data with Excellent Classification accuracy of 1,000.
Keywords: Data Mining, Sales, Classification, C4.5 Algorithm, RapidMiner,
Prediction.
xv
ABSTRAK
Banyak orang membicarakan tentang bisnis, keuntungan bisnis serta
banyaknya jenis bisnis yang beraneka ragam yang tentu memiliki satu tujuan yaitu
mendapatkan keuntungan secara finansial atau laba. Dengan begitu banyak jenis
bisnis dan manfaat yang bisa di ambil dari bisnis tentu seringkali kita merasa ingin
segera terjun ke dunia bisnis untuk mendapatkan keuntungan atau lebih spesifik
yaitu penghasilan. Salah satu contoh bisnis adalah berjualan botol. Didalam
berjualan pasti kita mempunyai sekumpulan data penjualan yang sangat banyak,
karena itu kita harus dapat mengolah data penjualan agar menjadi informasi baru.
Dalam kasus ini algoritma C4.5 merupakan sebuah metode yang bisa membantu
mengolah atau memprediksi nilai penjualan dimasa yang akan datang. Salah satu
software yang dapat digunakan untuk membantu menerapkan algoritma C4.5 dan
sekaligus mengolah data agar data tersebut dapat bermanfaat dan menghasilkan
sebuah informasi yang baru yaitu RapidMiner. Penelitian ini dilakukan dalam
rangka membantu para penjual untuk memprediksi penjualan barang dagangannya,
sehingga mereka dapat menyiapkan atau menyetok barang yang diprediksi akan
mengalami kenaikan dalam penjualanya. Dari penelitian ini dapat disimpulkan
bahwa dengan menggunakan algoritma C4.5 maka pejualan botol dapat diprediksi
dengan akurasi yang cukup tinggi, hasil pengukuran akurasi data yang diperoleh
dari data training dengan Confusion Matrix nilainya mencapai 90.59% dan data
testing tingkat akurasinya mencapai 88.00%. Jika dilihat dengan kurva ROC, data
training memiliki akurasi Excellent Classification sebesar 0.998 dan data testing
dengan akurasi Excellent Classification sebesar 1.000.
Kata kunci : Data Mining, Penjualan, Klasifikasi, Algoritma C4.5, RapidMiner,
Prediksi.
1
BAB I
PENDAHULUAN
1.1 Latar Belakang Masalah
Banyak orang membicarakan tentang bisnis, keuntungan bisnis serta banyak nya
jenis bisnis yang beraneka ragam yang tentu memiliki satu tujuan yaitu mendapatkan
keuntungan secara finansial atau laba. Dengan begitu banyak jenis bisnis dan manfaat
yang bisa di ambil dari bisnis tentu seringkali kita merasa ingin segera terjun ke dunia
bisnis untuk mendapatkan keuntungan atau lebih spesifik yaitu penghasilan. Salah satu
contoh bisnis adalah berjualan atau berdagang.
Menjual suatu barang di era moderninsasi ini sudah sangatlah mudah, tidak seperti
dulu kita harus mempunyai suatu tempat atau toko untuk berjualan, di zaman sekarang
kita tidak harus memiliki tempat atau toko untuk berjualan, kita bisa berjualan secara
online, kita hanya memerlukan smartphone atau laptop dan koneksi internet serta barang
yang akan di jual. Setelah semua yang kita perlukan tersedia, kita hanya perlu
mengunjungi beberapa marketplace dan kita taruh barang jualan kita di marketplace
tersebut. Kita juga mendapatkan keuntungan yang sangat banyak misalnya kita tidak
perlu menyewa tempat, kita mendapatkan notifikasi saat barang jualan kita akan di belu
customer, kita mendapatkan rekap data transaksi penjualan yang cukup akurat, dan masih
banyak yang lainnya.
Dalam lingkungan bisnis yang global sekarang ini, setiap perusahaan dituntut
untuk mampu bersaing dalam meningkatkan kinerja dan mampu menghasilkan laporan
2
yang sesuai, sehingga perusahaan dapat mengambil keputusan dari hasil kinerja dan
laporan tersebut. Di sisi lain perkembangan teknologi informasi mempengaruhi
pemrosesan data untuk menghasilkan informasi yang lebih cepat, akurat, aktual, dan
relevan untuk meningkatkan ketepatan atau akurasi dalam pengambilan keputusan.
Dizaman sekarang hampir semua toko online maupun offline menggunakan
sistem komputerisasi dalam penyimpanan data penjualan, sehingga banyak data transaksi
akan dihasilkan. Data transaksi yang ada dalam database penjualan barang menyimpan
jumlah record transaksi penjualan yang memiliki volume yang sangat besar sehingga
menyebabkan jumlah data terus menerus bertambah setiap hari. Dari penumpukkan data
yang tejadi dapat digali untuk menemukan pola-pola penjualan barang yang dapat
digunakan untuk menganalisa pasar dan meramalkan penjualan pada waktu yang akan
datang.
Prediksi jumlah penjualan merupakan faktor penting yang menentukan kelancaran
usaha suatu perusahaan. Prediksi ini sangat berguna untuk menentukan berapa banyak
barang yang akan dipesan pada bulan selanjutnya. Permasalahan yang umum dihadapi
oleh suatu perusahaan adalah bagaimana memprediksi atau meramalkan penjualan barang
di masa mendatang berdasarkan data penjualan sebelumnya. Prediksi tersebut sangat
berpengaruh untuk menentukan target penjualan yang harus dicapai. Perencanaan yang
efektif baik untuk jangka panjang maupun jangka pendek bergantung pada peramalan
permintaan untuk produk yang akan dijual. Untuk menghasilkan prediksi yang tepat tentu
saja dibutuhkan kecermatan dan ketelitian.
3
CV.Seribukilo merupakan suatu tempat penjualan macam–macam jenis botol,
berbagai macam bentuk dan berbagai macam model yang dijualnya, dari yang berbahan
plastik sampai yang berbahan kaca. CV.Seribukilo pun menjual barang dagangannya di
berbagai macam marketplace seperti Tokopedia, Bukalapak dan Shopee. Dengan harga
jualnya yang cukup murah, CV.Seribukilo pun memperoleh penjualan yang sangat
banyak sehingga kehabisan stok barang. Pemilik CV.Seribukilo ini pun ingin mengetahui
seberapa banyak penjualan di bulan berikutnya sehingga penjual dapat menyiapkan
barang yang cukup untuk di jual dibulan berikutnya.
Salah satu wujud nyata dari upaya ini yaitu menghitung potensi penjualan
seakurat mungkin sehingga akan diketahui seberapa besar penjualan pada CV.Seribukilo.
Algoritma yang akan digunakan untuk memprediksi penjualan dalam kasus ini adalah
algoritma C4.5, Metode ini akan berusaha mendapatkan prediksi penjualan dan dapat
diketahui gambaran fluktuasi penjualan pada perusahaan tersebut. Dari latar belakang
diatas, maka penulis berkeinginan untuk menyusun tugas akhir dengan judul “Penerapan
Data Mining Dengan Algoritma C4.5 Dalam Prediksi Penjualan Botol Pada
CV.Seribukilo”.
1.2 Identifikasi Masalah
Berdasarkan latar belakang masalah yang telah diuraikan diatas, maka penulis
mengidentifikasi masalah penelitian sebagai berikut:
1. Belum adanya suatu metode dalam penentuan prediksi penjualan produk di
CV.Seribukilo.
4
2. Belum adanya suatu akurasi yang tepat dalam melihat penentuan suatu prediksi
penjualan produk.
1.3 Batasan Masalah
Untuk membatasi cakupan dari pokok pembahasan dan permasalahan yang akan
dipecahkan, maka dibuat batasan masalah sebagai berikut:
1. Penentuan akurasi untuk memprediksi penjualan produk.
2. menguji suatu metode (dalam hal ini algoritma C4.5) dalam klasifikasi data
mining terutama dalam hal prediksi penjualan produk.
1.4 Rumusan Masalah
Dari identfikasi masalah dan batasan masalah maka disimpulkan rumusan
masalah yaitu “Bagaimana tingkat akurasi penggunaan metode C4.5 dalam memprediksi
penjualan botol pada CV.Seribukilo?.”
1.5 Tujuan dan Manfaat Penelitian
1.5.1 Tujuan
Tujuan yang ingin dicapai dalam penelitian ini adalah untuk mendapatkan tingkat
akurasi dalam memprediksi penjualan botol pada CV.Seribukilo dengan menggunakan
algoritma C4.5.
5
1.5.2 Manfaat Penelitian
Dengan tercapainya tujuan penelitian di atas, maka diharapkan akan bermanfaat
bagi semua pihak, bagi CV.Seribukilo maupun bagi penulis. Manfaat dari penelitian ini
adalah:.
1. Bagi Penulis
a. Menambah wawasan dan pengetahuan penulis tentang algoritma C4.5 untuk
prediksi tingkat penjualan barang.
b. Menerapkan ilmu yang telah didapat selama kuliah.
2. Bagi Institusi
Sebagai bahan masukan bagi perguruan tinggi untuk memperbaiki praktik-praktik
pembelajaran agar staff pengajar menjadi lebih kreatif, efektif, dan efisien
sehingga kualitas pembelajaran dan hasil belajar siswa meningkat.
3. Bagi CV.Seribukilo
Dapat digunakan untuk mengetahui tingkat penjualan barang pada masa
mendatang
1.6 Sistematika Penulisan
Gambaran secara garis besar mengenail hal-hal yang akan di bahas dalam
penulisan penelitian ini terdiri dari lima bab yaitu:
BAB I PENDAHULUAN
Dalam bab ini penulis menguraikan mengenai latar belakang
masalah, identifikasi masalah, batasan masalah, rumusan maslah.
6
maksud dan tujuan penelitian, manfaat penelitian, metode
pengumpulan data, serta sistematika penulisan.
BAB II TINJAUAN PUSTAKA
Dalam bab ini berisi tentang teori yang mendasari judul dan
tinjauan penelitian terdahulu yang berkaitan dengan judul
penelitian ini.
BAB III METODOLOGI PENELITIAN
Bab ini memaparkan tentang objek yang dijadikan penelitian dan
rancangan atau langkah-langkah atau metode yang diuraikan
secara detail dipergunakan untuk memecahkan masalah yang
diambil dalam penelitian tugas akhir.
BAB IV HASIL DAN PEMBAHASAN
Dalam bab ini berisi tentang hasil penelitian dan pembahasan dari
jawaban hasil penelitian terhadap rumusan masalah.
BAB V PENUTUP
Bab ini memberikan penjelasan mengenai kesimpulan dan saran
yang diberikan untuk dijadikan sebagai bahan perbaikan untuk
penelitian selanjutnya.
7
BAB II
TINJAUAN PUSTAKA
2.1 Tinjauan Penelitian Terdahulu
1. Penerapan Data Mining Dalam Memprediksi Pembelian Cat (Fitriana Harahap,
2015), penelitian ini merupakan penerapan teknik klasifikasi data mining pada
pembelian cat yang efektif pada departement penjualan home smart, diharapkan
nantinya dapat menghasilkan suatu pengetahuan yang dapat digunakan dalam
pengambilan keputusan dalam melakukan pembelian cat yang efektif. Algoritma
C4.5 adalah algoritma klasifikasi data bertipe pohon keputusan. Pohon keputusan
Algoritma C4.5 dibangun dengan beberapa tahap yang meliputi pemilihan atribut
sebagai akar, membuat cabang untuk tiap-tiap nilai dan membagi kasus dalam
cabang. Tahapantahapan ini akan diulangi untuk setiap cabang sampai semua
kasus pada cabang memiliki kelas yang sama. Dari penyelesaian pohon keputusan
maka akan didapatkan beberapa rule. Dalam hal ini penulis mengklasifikasikan
pembelian cat berdasarkan penjualan pada departement penjualan home smart.
Penerapan Algoritma C4.5 ini dapat membantu departement penjuan home smart
dalam menentukan pembelian cat dari suplier.
2. Analisa Penerapan Algoritma C4.5 Untuk Mempredikasi Penjualan Motor Pada
PT. Capella Dinamik Nusantara Cabang Muka Kuning (Azwanti Nurul, 2018),
penelitian ini membahas tentang analisa diperlukan untuk melihat pola dari data
penjualan sehingga dapat menghasilkan prediksi penjualan motor yang nantinya
8
akan berguna untuk pendistribusian motor dibeberapa wilayah. Dari data
konsumen yang begitu banyak, maka dilakukan data mining dengan
menggunakan algoritma C4.5. Hasil dari kegiatan mining ini diharapkan dapat
memberikan sebuah pohon keputusan untuk melihat pola prediksi perilaku
konsumen membeli motor.
3. Prediksi Kompetensi Karyawan Menggunakan Algoritma C4.5 Studi Kasus: PT.
Hankook Tire Indonesia (Aswan Supriyadi Sunge, 2018), penelitian ini
membahas tentang ketidak kompetensi merupakan hal yang merugikan dari segi
perusahaan maupun karyawan tersebut, apa lagi persaingan yang sangat ketat
pada era sekarang ini yang harus mencari orang-orang berkompenten, oleh karena
itu dibutuhkan teknik klasifikasi dan prediksi data mining dalam memecahkan
masalah tersebut. Klasifikasi yang digunakan dalam data mining adalah Decision
Tree dikarenakan merupakan teknik yang banyak digunakan dan menghasilkan
output yang dengan aturan yang ada, dengan hal tersebut dapat menyajikan data
ketidak kompetensi karyawan. Dalam penelitian ini menggunakan Algoritma
C4.5 untuk menghasilkan aturan klasifikasi ketidak kompentesi karyawan dan
hasil akurasinya di dapat.
4. Penerapan Data Mining Untuk Prediksi Penjualan Wallpaper Menggunakan
Algoritma C4.5 (Juna Eska, 2016) jurnal ini membahas tentang presiksi penjualan
wallpaper. Wallpaper dinding rumah atau kertas dinding merupakan hiasan
dinding dengan bermacam motif dan warna. Kertas dinding digunakan untuk
mengubah penampilan suatu ruang agar semakin cantik dan memiliki nilai
9
tambah. Dinding rumah yang polos cenderung membuat penghuni rumah merasa
bosan karena tampilan dinding yang monoton. Untuk itu, memiliki inisiatif
mendesain dinding rumah dengan wallpaper menjadi satu ide cemerlang yang
harus dicoba. Mewarnai dinding rumah dengan wallpaper memang bisa
menambah kesan indah pada suatu ruangan, sehingga ruangan terlihat lebih
ekspresif. Bermacam motif, warna, dan corak wallpaper dapat dipilih. Oleh karena
itu penjual harus lebih cermat menyediakan wallpaper mana yang akan banyak
peminatnya, sehingga perlu perekomendasian jenis jenis wallpaper dengan
menggunakan metode klasifikasi dilakukan menggunakan data mining algoritma
C4.5.
5. Closed Item-Set Mining for Prediction of Indian Summer Monsoon Rainfall A
Data Mining Model with Land and Ocean Variables as Predictors
(H.Vathsala,2015) Penelitian ini membahas tentang menambang aturan asosiasi
dari 37 (1969-2005) tahun monsun musim panas India data curah hujan dan coba
penerapannya dalam membantu prediksi yang lebih baik dari curah hujan
monsoon musim panas India. Kami memilih 36 variabel sebagai prediktor yang
mungkin dari curah hujan monsoon musim panas India berdasarkan literatur
sebelumnya dan membandingkan prediksi menggunakan semua 36 variabel dan
prediksi oleh atribut yang dipilih dari aturan asosiasi turunan. Hasil menunjukkan
kinerja yang lebih baik dalam prediksi semua wilayah India, wilayah tengah Barat
dan curah hujan wilayah Semenanjung ketika seleksi atribut digunakan
dibandingkan dengan semua 36 variabel digunakan untuk prediksi.
10
6. Penerapan Algoritma C4.5 Untuk Penentuan Jurusan Mahasiswa (Liliana
Suastina,2013) Penelitian ini membahas tentang pemilihan jurusan yang tidak
sesuai dengan kemampuan, kepribadian, minat dan bakat dapat mempengaruhi
mahasiswa dalam mengikuti perkuliahan. Penggunaan pendekatan algoritma
klasifikasi data mining akan diterapkan untuk menentukan jurusan dalam bidang
studi yang akan diambil oleh mahasiswa, sehingga mahasiswa tidak salah dalam
memilih jurusan yang akan di tempuh selama belajar pada perguruan tinggi.
Algoritma C4.5 digunakan untuk menentukan jurusan yang akan diambil oleh
mahasiswa sesuai dengan latar belakang, minat dan kemampuannya sendiri.
Parameter pemilihan jurusan adalah Indeks Prestasi Kumulatif Semester 1 dan 2.
Hasil eksperimen dan evaluasi menunjukan bahwa Algoritma Decision Tree C4.5
akurat diterapkan untuk penentuan kesesuaian jurusan mahasiswa dengan tingkat
akurasi 93,31 % dan akurasi rekomendasi jurusan sebesar 82,64%.
7. Analisa dan Penerapan Metode C4.5 Untuk Prediksi Loyalitas Pelanggan (Teguh
Budi Santoso, 2013) penelitian ini membahas tentang berbagai cara dilakukan
oleh masing-masing provider untuk memenangkan persaingan, antara lain yakni
dengan mempertahankan loyalitas pelanggan. Penelitian ini bertujuan membentuk
model klasifikasi pohon keputusan untuk memprediksi loyalitas pelanggan dan
melihat variable yang paling berpengaruh. Obyek dalam penelitian ini adalah
pelanggan. Data yang digunakan adalah data primer dari penyebaran kuisioner
berupa pertanyaan. Pembentukan model prediksi menggunakan metode C4.5.
pada algoritma C4.5 dilakukan perhitungan entropy dan information gain dimana
11
atribut loyalitas pelanggan sebagai atribut tujuan, sedangkan harga, pelayanan,
promosi, citra perusahaan, dan kepercayaan sebagai atribut sumber untuk
memperoleh node akar dan node lainnya. Berdasarkan hasil klasifikasi
menggunkan algoritma C4.5 menunjukkan bahwa diperoleh akurasi mencapai
97.5%, yang menunjukkan bahwa algoritma C4.5 cocok digunakan untuk
mengukur tinggkat loyalitas pelanggan data seluler.
8. Kajian Penerapan Metode klasifikasi Data Mining Algoritma C4.5 Untuk
Prediksi Kelayakan Kredit Pada Bank Mayapada jakarta (Nandang Iriadi, 2016)
Industri perbankan mengalami perkembangan yang cukup pesat, baik dari sisi
volume usaha, mobilisasi dana masyarakat maupun pemberian kredit. Data
mining mengenai pinjaman memiliki potensial besar untuk menjelajahi bagian
pola yang tersembunyi dalam suatu dataset dari domain pinjaman termasuk
pinjaman kredit. Algoritma C4.5 merupakan pengklasifikasian yang paling
sederhana, mudah diimplemntasikan. Namun, Algoritma C4.5 masih memiliki
kelemahan dalam menangani data dalam dimensi tinggi. Penelitian ini bertujuan
untuk menerapkan algoritma C4.5 dengan seleksi atribut sehingga dapat
mengurangi dimensi dari data, serta mengidentifikasi fitur dalam kumpulan data
dengan metode algoritma C4.5. Dari penelitian ini yang dilakukan model yang
terbentuk dengan algoritma C4.5 sendiri sudah memiliki akurasi yang baik yaitu
sebesar 83.67% dengan proses seleksi atribut oleh algoritma C4.5.
12
2.2 Tinjauan Teori
2.2.1 Produk
Produk merupakan titik pusat dari kegiatan pemasaran karena produk merupakan
hasil dari suatu perusahaan yang dapat ditawarkan ke pasar untuk di konsumsi dan
merupakan alat dari suatu perusahaan untuk mencapai tujuan dari perusahaannya. Suatu
produk harus memiliki keunggulan dari produk-produk yang lain baik dari segi kualitas,
desain, bentuk, ukuran, kemasan, pelayanan, garansi, dan rasa agar dapat menarik minat
konsumen untuk mencoba dan membeli produk tersebut.
Pengertian produk menurut Kotler (2009) adalah segala sesuatu yang dapat
ditawarkan kepasar untuk mendapatkan perhatian, dibeli digunakan, atau dikonsumsi
yang dapat memuaskan keinginan atau kebutuhan.
Sedangkan pengertian produk ( product ) menurut Kotler & Armstrong
(2001:346) adalah segala sesuatu yang dapat ditawarkan kepasar untuk mendapatkan
perhatian, dibeli, digunakan, atau dikonsumsi yang dapat memuaskan keinginan atau
kebutuhan. Secara konseptual produk adalah pemahaman subyektif dari produsen atas
sesuatu yang bisa ditawarkan sebagai usaha untuk mencapai tujuan organisasi melalui
pemenuhan kebutuhan dan kegiatan konsumen, sesuai dengan kompetensi dan kapasitas
organisasi serta daya beli pasar. Selain itu produk dapat pula didefinisikan sebagai
persepsi konsumen yang dijabarkan oleh produsen melalui hasil produksinya. Produk
dipandang penting oleh konsumen dan dijadikan dasar pengambilan keputusan
pembelian.
13
2.2.2 Penjualan
Ada beberapa pengertian penjualan menurut beberapa ahli, yaitu sebagai berikut:
1. Menurut Moekijat (2000:48), “penjualan adalah suatu kegiatan yang ditujukan
untuk mencari pembeli, mempengaruhi, dan memberi petunjuk agar pembelian
dapat menyesuaikan kebutuhannya dengan produksi yang ditawarkan serta
mengadakan perjanjian mengenai harga yang menguntungkan kedua belah pihak”
2. Menurut Rudianto (2009:104), penjualan merupakan sebuah aktivitas yang
mengakibatkan arus barang keluar perusahaan sehingga perusahaan memperoleh
penerimaan uang dari pelanggan. Penjualan untuk perusahaan jasa, adalah jasa
yang dijual perusahaan tersebut. Untuk perusahaan dagang, adalah barang yang
diperjualbelikan perusahaan tersebut. Sedangkan untuk perusahaan manufaktur,
penjualan adalah barang yang diproduksi dan dijual perusahaan tersebut.
3. Penjualan merupakan kegiatan yang dilakukan oleh penjual dalam menjual barang
atau jasa dengan harapan akan memperoleh laba dari adanya transaksi-transaksi
tersebut (Mulyadi,2014).
4. Menurut Swastha (2014:246), penjualan adalah suatu proses pertukaran barang
atau jasa antara penjual dan pembeli. Jadi dapat disimpulkan bahwa penjualan
adalah usaha yang dilakukan manusia untuk menyampaikan barang kebutuhan
yang telah dihasilkan kepada mereka yang membutuhkan yang telah ditentukan
atas tujuan bersama.
14
2.2.3 Laba
Menurut Darsono (2008:177) Laba adalah prestasi seluruh karyawan dalam
suatu perusahaan yang dinyatakan dalam bentuk uang yaitu selisih antara pendapatan
dikurangi beban.
Laba adalah kenaikan modal (aktiva bersih) yang berasal dari transaksi sampingan
atau transaksi yang jarang terjadi dari suatu badan usaha, dan dari semua transaksi atau
kejadian lain yang mempunyai badan usaha selama satu periode, kecuali yang timbul dari
pendapatan (revenue) atau investasi pemilik (Baridwan, 1992: 55).
Pengertian laba secara umum adalah selisih dari pendapatan di atas biaya-
biayanya dalam jangka waktu (perioda) tertentu. Laba sering digunakan sebagai suatu
dasar untuk pengenaan pajak, kebijakan deviden, pedoman investasi serta pengambilan
keputusan dan unsur prediksi (Harnanto, 2003: 444).
Dalam teori ekonomi juga dikenal adanya istilah laba, akan tetapi pengertian laba
di dalam teori ekonomi berbeda dengan pengertian laba menurut akuntansi. Dalam teori
ekonomi, para ekonom mengartikan laba sebagai suatu kenaikan dalam kekayaan
perusahaan, sedangkan dalam akuntansi, laba adalah perbedaan pendapatan yang
direalisasi dari transaksi yang terjadi pada waktu dibandingkan dengan biaya-biaya yang
dikeluarkan pada periode tertentu. Laba atau rugi sering dimanfaatkan sebagai ukuran
untuk menilai prestasi perusahaan atau sebagai dasar ukuran penilaian yang lain, seperti
laba per lembar saham. Unsur-unsur yang menjadi bagian pembentuk laba adalah
pendapatan dan biaya. Dengan mengelompokkan unsur-unsur pendapatan dan biaya,
15
akan dapat diperoleh hasil pengukuran laba yang berbeda antara lain: laba kotor, laba
operasional, laba sebelum pajak, dan laba bersih (Harahap, 1997).
2.2.4 Machine Learning
Machine learning adalah cabang dari kecerdasan buatan, merupakan disiplin ilmu
yang mencakup perancangan dan pengembangan algoritma yang memungkinkan
komputer untuk mengembangkan perilaku yang didasarkan kepada data empiris, seperti
dari sensor data pada basis data. Sistem pembelajaran dapat memanfaatkan contoh (data)
untuk menangkap ciri yang diperlukan dari probabilitas yang mendasarinya (yang tidak
diketahui). Data dapat dilihat sebagai contoh yang menggambarkan hubungan antara
variabel yang diamati. Fokus besar penelitian Machine learning adalah bagaimana
mengenali secara otomatis pola kompleks dan membuat keputusan cerdas berdasarkan
data. Kesukarannya terjadi karena himpunan semua perilaku yang mungkin, dari semua
masukan yang dimungkinkan, terlalu besar untuk diliput oleh himpunan contoh
pengamatan (data pelatihan). Karena itu Machine learning harus merampatkan
(generalisasi) perilaku dari contoh yang ada untuk menghasilkan keluaran yang berguna
dalam kasus-kasus baru (Purnamasari, 2015).
Sejak pertama kali komputer diciptakan manusia sudah memikirkan bagaimana
caranya agar komputer dapat belajar dari pengalaman. Hal tersebut terbukti pada tahun
1952, Arthur Samuel menciptakan sebuah program, game of checkers, pada sebuah
komputer IBM. Program tersebut dapat mempelajari gerakan untuk memenangkan
permainan checkers dan menyimpan gerakan tersebut kedalam memorinya.
16
Istilah machine learning pada dasarnya adalah proses komputer untuk belajar dari data
(learn from data). Tanpa adanya data, komputer tidak akan bisa belajar apa-apa. Oleh
karena itu jika kita ingin belajar machine learning, pasti akan terus berinteraksi dengan
data. Semua pengetahuan machine learning pasti akan melibatkan data. Data bisa saja
sama, akan tetapi algoritma dan pendekatan nya berbeda-beda untuk mendapatkan hasil
yang optimal. (Purnamasari, 2015).
2.2.5 Bagian Machine Learning
Ada beberapa bagian pada machine learning, sistem pembelajaran mesin terdiri
dari tiga bagian utama, yaitu (Tom Mitcel,1997):
1. Model: sistem yang membentuk prediksi atau identifikasi.
2. Parameter: sinyal atau faktor yang digunakan oleh model untuk membentuk
keputusannya.
3. Pembelajaran: sistem yang menyesuaikan parameter dan model dalam prediksi
versus hasil aktual.
Machine learning merupakan salah satu cabang dari disiplin ilmu Kecerdasan
Buatan (Artificial Intellegence) yang membahas mengenai pembangunan sistem yang
berdasarkan pada data. Banyak hal yang dipelajari, akan tetapi pada dasarnya ada 4 hal
pokok yang dipelajari dalam machine learning (Tom Mitcel, 1997):
1. Supervised machine learning algorithms
Supervised machine learning adalah algoritma machine learning yang dapat
menerapkan informasi yang telah ada pada data dengan memberikan label
17
tertentu, misalnya data yang telah diklasifikasikan sebelumnya (terarah).
Algoritma ini mampu memberikan target terhadap output yang dilakukan dengan
membandingkan pengalaman belajar di masa lalu.
2. Unsupervised machine learning algorithms
Unsupervised machine learning adalah algoritma machine learning yang
digunakan pada data yang tidak mempunyai informasi yang dapat diterapkan
secara langsung (tidak terarah). Algoritma ini diharapkan mampu menemukan
struktur tersembunyi pada data yang tidak berlabel.
3. Semi-supervised machine learning algorithms
Semi-supervised machine learning adalah algoritma yang digunakan untuk
melakukan pemebelajaran data berlabel dan tanpa label. Sistem yang
menggunakan metode ini dapat meningkatkan efesiensi output yang dihasilkan.
4. Reinforcement machine learning algorithms
Reinforcement machine learning adalah algoritma yang mempunyai kemampuan
untuk bertinteraksi dengan proses belajar yang dilakukan, algoritma ini akan
memberikan poin (reward) saat model yang diberikan semakin baik atau
mengurangi poin (error) saat model yang dihasilkan semakin buruk. Salah satu
penerapannya adalah pada mesin pencari.
2.2.6 Data Mining
Berikut ini beberapa definisi dari data mining:
18
1. Data mining adalah serangkaian proses untuk menggali nilai tambah dari suatu
kumpulan data berupa pengetahuan yang selama ini tidak diketahui secara manual
(Pramudiono, 2006).
2. Data mining adalah analisis otomatis dari data yang berjumlah besar atau
kompleks dengan tujuan untuk menemukan pola atau kecenderungan yang
penting yang biasanya tidak disadari keberadaannya (Pramudiono, 2006).
3. Data mining merupakan analisis dari peninjauan kumpulan data untuk
menemukan hubungan ynag tidak diduga dan meringkas data dengan cara yang
berbeda dengan sebelumnya, yang dapat dipahami dan bermanfaat bagi pemilik
data (Larose, 2005).
4. Data mining merupakan bidang dari beberapa bidang keilmuan yang menyatukan
teknik dari pembelajaran mesin, pengenalan pola, statistik, basis data, dan
visualisasi untuk penanganan permasalahan pengambilan informasi dari basis data
yang besar (Larose, 2005).
Asal muasal data mining dari kata mining yang artinya tambang jika
dikembangkan menggali data yang telah lampau. Data mining merupakan proses terpadu
dari analisis data yang terdiri dari serangkaian kegiatan yang berjalan berdasarkan definisi
tujuan yang akan dianalisis, dengan analisis datanya sampai interpretasi dan evaluasi hasil
(Giudici & Figini, 2009).
Pengumpulan data mining bukan sekedar terkumpul data saja tetapi mencakup
analisis dan prediksi dari informasi yang ingin ditampilkan. Data yang dikumpulkan
disimpan dalam database kemudian diproses sehingga dapat dijadikan untuk pengambilan
19
keputusan dalam melihat informasi yang akan digunakan. Data mining dan Knowledge
Discovery in Databases (KDD) sering kali digunakan secara bergantian dalam
menjelaskan proses penggalian informasi dalam basis data yang sangat besar akan tetapi
berkaitan satu sama yang lain, skema proses KDD (Han & Kamber, 2006).
2.2.7 Tahapan Data Mining
Tahap- tahap data mining adalah sebagai berikut (Fayyad, 1996):
Gambar 2.1 Tahap Data Mining
Sumber: Fayyad
1. Data Selection
a. Menciptakan himpunan data target , pemilihan himpunan data, atau
memfokuskan pada subset variabel atau sampel data, dimana penemuan
(discovery) akan dilakukan.
20
b. Pemilihan (seleksi) data dari sekumpulan data operasional perlu dilakukan
sebelum tahap penggalian informasi dalam KDD dimulai. Data hasil
seleksi yang akan digunakan untuk proses data mining, disimpan dalam
suatu berkas, terpisah dari basis data operasional.
2. Pre-processing/ Cleaning
a. Pemprosesan pendahuluan dan pembersihan data merupakan operasi dasar
seperti penghapusan noise dilakukan.
b. Sebelum proses data mining dapat dilaksanakan, perlu dilakukan proses
cleaning pada data yang menjadi fokus KDD.
c. Proses cleaning mencakup antara lain membuang duplikasi data,
memeriksa data yang inkonsisten, dan memperbaiki kesalahan pada data,
seperti kesalahan cetak (tipografi).
d. Dilakukan proses enrichment, yaitu proses “memperkaya” data yang sudah
ada dengan data atau informasi lain yang relevan dan diperlukan untuk
KDD, seperti data atau informasi eksternal.
3. Transformation
a. Pencarian fitur-fitur yang berguna untuk mempresentasikan data
bergantung kepada goal yang ingin dicapai.
b. Merupakan proses transformasi pada data yang telah dipilih, sehingga data
tersebut sesuai untuk proses data mining. Proses ini merupakan proses
kreatif dan sangat tergantung pada jenis atau pola informasi yang akan
dicari dalam basis data.
21
4. Data mining
a. Pemilihan tugas data mining; pemilihan goal dari proses KDD misalnya
klasifikasi, regresi, clustering, dan lain-lain.
b. Pemilihan algoritma data mining untuk pencarian (searching).
c. Proses Data mining yaitu proses mencari pola atau informasi menarik
dalam data terpilih dengan menggunakan teknik atau metode tertentu.
Teknik, metode, atau algoritma dalam data mining sangat bervariasi.
Pemilihan metode atau algoritma yang tepat sangat bergantung pada tujuan
dan proses KDD secara keseluruhan.
5. Interpretation/ Evaluation
a. Penerjemahan pola-pola yang dihasilkan dari data mining.
b. Pola informasi yang dihasilkan dari proses data mining perlu ditampilkan
dalam bentuk yang mudah mimengerti oleh pihak yang berkepentingan.
c. Tahap ini merupakan bagian dari proses KDD yang mencakup
pemeriksaan apakah pola atau informasi yang ditemukan bertentangan
dengan fakta atau hipotesa yang ada sebelumnya.
2.2.8 Klasifikasi
Menurut Jiawei Han (2012:327) dalam ebook yang berjudul "Data Mining
Concepts and Techniques" Klasifikasi adalah suatu bentuk analisis data yang
mengekstrak model yang menggambarkan kelas data penting. Model seperti itu, yang
disebut penggolong, memprediksi label kelas kategoris (diskrit, tidak berurutan).
22
Misalnya, kita bisa membangun klasifikasi untuk mengkategorikan aplikasi pinjaman
bank aman atau berisiko analisis semacam itu dapat membantu kami memahami data
dengan lebih baik besar. Banyak metode klasifikasi yang telah diajukan oleh peneliti
dalam pembelajaran mesin, pengenalan pola, dan statistik. Kebanyakan algoritma adalah
memori penduduk, biasanya dengan asumsi ukuran data yang kecil. Penelitian data
mining terbaru telah dibangun di atas pekerjaan semacam itu, berkembang klasifikasi
terukur dan teknik prediksi yang mampu menangani sejumlah besar data disk- resident.
Klasifikasi memiliki banyak aplikasi, termasuk deteksi kecurangan, target pemasaran,
prediksi kinerja, manufaktur, dan diagnosis medis.
Menurut Luthfi (2009) klasifikasi adalah proses pengelompokan benda
berdasarkan ciri-ciri persamaan dan perbedaan. Dalam klasifikasi, terdapat terget variabel
kategori. sebagai contoh, penggolongan pendapatan dapat dipisahkan dalam tiga kategori
yaitu: pendapatan tinggi, pendapatan sedang, dan pendapatan rendah. Contoh lain
klasifikasi dalam bisnis dan penelitian adalah:
1. Menentukan apakah suatu transaksi kartu kredit merupakan transaksi yang curang
atau bukan.
2. Memperkirakan apakah suatu pengajuan hipotek oleh nasabah merupakan suatu
kredit yang baik atau buruk.
3. Mendiagnosis penyakit seorang pasien untuk mendapatkan termasuk kategori
penyakit apa.
23
2.2.9 Prediksi
Adapun pengertian prediksi menurut para ahli dan menurut Kamus Besar Bahasa
Indonesia (KBBI) yaitu:
1. Prediksi adalah suatu proses memperkirakan secara sistematis tentang sesuatu
yang paling mungkin terjadi di masa depan berdasarkan informasi masa lalu dan
sekarang yang dimiliki, agar kesalahannya (selisih antara sesuatu yang terjadi
dengan hasil perkiraan) dapat diperkecil. Prediksi tidak harus memberikan
jawaban secara pasti kejadian yang akan terjadi, melainkan berusaha untuk
mencari jawaban sedekat mungkin yang akan terjadi (Herdianto, 2013 : 8).
2. Menurut Kamus Besar Bahasa Indonesia (KBBI) prediksi adalah hasil dari
kegiatan memprediksi atau meramal atau memperkirakan nilai pada masa yang
akan datang dengan menggunakan data masa lalu. Prediksi menunjukkan apa
yang akan terjadi pada suatu keadaan tertentu dan merupakan input bagi proses
perencanaan dan pengambilan keputusan.
3. Menurut Render (2001) Peramalan (forecasting) adalah seni dan ilmu
memprediksi peristiwa-peristiwa masa depan dengan pengambilan data historis
dan memproyeksikannya ke masa depan dengan menggunakan beebrapa bentuk
model matematis.
4. Pengertian ramalan penjualan menurut Nafarin (2000) adalah proses kegiatan
memperkirakan produk yang akan dijual pada waktu yang akan datang dalam
keadaan tertentu dan dibuah berdasasrkan data yang pernah terjadi dan atau tidak
mungkin akan terjadi.
24
2.2.10 Algoritma C4.5
Algoritma C4.5 merupakan algortima yang digunakan untuk membentuk pohon
keputusan. Pohon keputusan merupakan metodeklasifikasi dan prediksi yang sangat kuat
dan terkenal. Metode pohon keputusa mengubah fakta yang sangat besar menjadi pohon
keputusanyang merepresentasikan aturan. Aturan dapat dengan mudah dipahami dengan
bahasa alami. Dan mereka juga dapat diekspresikan dalam bentukbahasa basis data
seperti Structured Query Language untuk mencari record pada kategori tertentu (Kusrini,
2009).
Algoritma C4.5 merupakan kelompok algoritma Decision Tree. Algoritma ini
mempunyai input berupa training samples dan samples. Training samples berupa data
contoh yang akan digunakan untuk membangun sebuah tree yang telah diuji
kebenarannya. Sedangkan samplesmerupakan field-field data yang nantinya akan
digunakan sebagai parameter dalam melakukan klasifikasi data (Sunjana, 2010)
Menurut (Quinlan, 1993) Algoritma C4.5 adalah salah satu metode untuk
membuat decision tree berdasarkan training data yang telah disediakan. Algoritma C 4.5
dibuat oleh Ross Quinlan yang merupakan pengembangan dari ID3 yang juga dibuat oleh
Quinlan. Beberapa pengembangan yang dilakukan pada C4.5 adalah sebagai antara lain
bisa mengatasi missing value, bisa mengatasi continue data, dan pruning. Pohon
keputusan banyak sekali perkembangan tetapi yang sering dipakai adalah ID3 dan C4.5.
Keduanya mempunyai prinsip yang sama dikarenakan Algoritma C4.5 merupakan
pengembangan dari ID3, tetapi mempunyai perbedaan utama yaitu :
25
1. C4.5 dapat menangani atribut yang kontinyu dan diskrit dan juga dapat menangani
data training dengan nilai yang hilang atau data yang kosong.
2. Hasil yang didapat dari Algoritma C4.5 akan terpangkas setelah dibentuk
3. Pemilihan atribut yang dilakukan dengan menggunakan Gain Ratio.
Algoritma C4.5 merupakan perbaikan dari ID3 menggunakan Gain Ratio untuk
diperbaharui information gain maka dengan rumus :
Gambar 2.2 Rumus Gain Ratio
Sumber: Quinlan
Dimana:
S = Ruang/Data Sample yang dipergunakan untuk data training
A = Atribut
Gain(S,A) = information gain pada atribut A
SplitInfo(S,A) = split information pada atribut A
Dengan atribut yang nilai Gain Ration yang paling tertinggi dipilih sebagai atribut
test untuk simpul. Pendekatan ini menerapkan normalisasi pada information gain dengan
menggunakan apa yang disebut dengan split information, dengan rumus :
Gambar 2.3 Rumus Split Information
Sumber: Quinlan
26
Dimana:
S = Ruang (data) sample yang digunakan untuk training.
A = Atribut.
Si = Jumlah sample untuk atribut i
Pada saat membangun pohon keputusan, mungkin adanya data yang noise
maupun kosong pada training data. Pemangkasan pohon dapat dilakukan untuk
mengenali dan menghilangkan cabang tersebut agar pohon lebih kecil dan lebih mudah
dipahami agar lebih baik dalam melakukan klasifikasi. Ada dua metode dalam melakukan
pemakasan pohon keputusan yaitu:
1. Dengan Prepruning yaitu menghentikan pembangunan lebih awal pada subtree
agar tidak sampai lebih jauh dalam pemangkas data training. Rumus Prepruning
:
Gambar 2.4 Rumus Prepruning
Sumber: Quinlan
Dimana :
r = nilai perbandingan error rate
n = total sample
z = Φ-1(c)
c= confidence level
27
2. Dengan Postpruning yaitu menyederhanakan pohon dengan membuang beberapa
cabang subtree setelah selesai dibangun. Metode ini sebagai bagian standard
untuk Algoritma C4.5.
28
BAB III
METODOLOGI PENELITIAN
3.1 Metode Penelitian
Metode penelitian dapat diartikan sebagai cara ilmiah untuk mendapatkan data
yang valid dengan tujuan dapat ditemukan, dikembangkan, dan dibuktikan, suatu
pengetahuan tertentu sehingga dapat digunakan untuk memahami, memecahkan, dan
mengantisispasi masalah (Sugiyono, 2014).
Dalam pengumpulan data terdapat sumber data yang dihimpun langsung oleh
peneliti disebut dengan sumber primer, sedangkan apabila melalui tangan kedua disebut
sumber sekunder (Riduwan, 2008).
Untuk mendapatkan informasi serta data yang lengkap dan akurat dalam penulisan
laporan tugas akhir, maka penulis melakukan penelitian dengan metode-metode sebagai
berikut :
1. Observasi
Pengamatan melibatkan semua indera (penglihatan, pendengaran, penciuman,
pembauan, dan perasa). Pencatatan hasil dapat dilakukan dengan bantuan alat
rekam elektronik.
2. Wawancara
Pengambilan data melalui wawancara atau secara lisan langsung dengan sumber
datanya, baik melalui tatap muka atau melalui telephone. Jawaban responden
direkam dan dirangkum sendiri oleh peneliti.
29
3. Dokumen
Pengambilan data melalui dokumen tertulis maupun elektronik dari lembaga atau
institusi. Dokumen diperuntukan untuk mendukung kelengkapan data yang lain.
Data yang diperoleh adalah data pejualan botol milik CV.Seribukilo di daerah
bekasi. Setelah data dikumpulkan berjumlah 210 data kemudian dibagi 2 yaitu data
training sejumlah 168 data dan data testing sejumlah 42 data dengan perbandingan 80%
dan 20%. Hasil data training digunakan untuk memperoleh hasil klasifikasi penjualan
dalam bentuk pohon keputusan dan data testing digunakan tingkat akurasi dari hasil
klasifikasi tersebut.
3.2 Kerangka Berpikir
Dalam menyelesaikan penelitian ini dibutuhkan sebuah kerangka pemikiran
sebagai pedoman yang dilakukan secara konsisten. Permasalahan penelitian ini adalah
dibutuhkan sebuah prediksi penjualan botol. Sebelum memulai prediksi yang harus
dilakukan terlebih dahulu adalah pengolahan data training untuk mendapatan rule
decision tree Algoritma C4.5 yang menjadi acuan menghasilkan prediksi penjualan botol.
Pengujian metode ini dilakukan dengan cara cross validation, confusion matrix dan kurva
ROC. Untuk pengembangannya dan pengujian metode digunakan aplikasi RapidMiner.
Berikut ini kerangka pemikiran yang dilakukan. Berikut merupakan langkah – langkah
yang akan dilakukan pada penelitian ini:
30
Gambar 3.1 Kerangka Berpikir
Sumber: Pengolahan Data
Tahap pertama yang dilakukan dalam melakukan penelitian ini adalah melakukan
studi literatur dengan cara mempelajari teori dan pengetahuan dasar mengenai semua
yang berkaitan dengan penelitian ini agar dapat memahami dasar-dasar teori dan konsep-
konsep yang mendukung penelitian.
31
Tahap kedua yaitu identifikasi masalah, pada tahap ini proses yang dilakukan
adalah menggali permasalahan yang di temukan pada objek yang di teliti serta
mengidentifikasi kebutuhan yang di butuhkan oleh pengguna guna mencari alternatif
solusi yang terkait dengan permasalahan tersebut.
Tahap ketiga yaitu pengumpulan data, setelah tahap identifikasi masalah
dilakukan dan semua kebutuhan sudah di dapatkan maka tahap selanjutnya yang harus
dilakukan adalah mengumpulkan data. Data yang di butuhkan data penjualan botol yang
di dapatkan dari CV.Seribukilo.
Tahap keempat yaitu membuat data training dari data-data yang sudah di
kumpulkan, karena tidak semua data di butuhkan untuk pengujian model.
Tahap kelima yaitu membuat data mining yang digunakan untuk memilih teknik
dan algoritma yang sesuai untuk menemukan pola yang tersembunyi dari data penjualan
botol yang di dapatkan dari CV.Seribukilo dengan menggunakan algoritma C4.5
Tahap keenam adalah hasil prediksi, di tahap ini kita dapat melihat hasil prediksi
dari penerapan data mining dengan algoritma C4.5.
Tahap ketujuh yaitu evaluasi, pada tahap ini dilakukanya evaluasi untuk
mengetahui apakah teknik dan algoritma yang digunakan sudah sesuai untuk digunakan
dalam penelitian sehingga bisa menemukan pola penjualan botol yang bermanfaat untuk
meningkatkan penjulan botol tersebut.
32
3.3 Objek Penelitian
CV.Seribukilo adalah sebuah toko yang menjual berbagai macam jenis – jenis
kemasan botol, ada yang berbentuk bulat dan kotak, dan banyak juga warna yang tersedia.
Selain menjual barangnya dengan cara offline, CV.Seribukilo pun menjual barang
jualannya di marketplace yang sudah terkenal di Indonesia seperti tokopedia, shopee, dan
bukalapak. CV.Seribukilo ini berada di alamat Jl. Raya Taman Narogong Indah A8 No.7
Pengasinan, Rawalumbu – Kota Bekasi 17115. Seiring berjalannya waktu dan penjualan
semakin bertambah CV.Seribukilo ini pun membuka cabang di daerah Cileungsi-Bogor.
Banyak jenis botol yang dijual di toko ini seperti botol kale, botol kapsul, botol spray,
botol cimori dan masih banyak sekali jenis – jenis botol yang dijual.
CV.Seribukilo ini pun menpunyai selogan yaitu “Seribu Murahnya, Seribu
Puasnya”. memang sesuai seperti selogannya, harga yang di tawarkan pada barang
jualannya memang murah dan terjangkau, namun tetap dengan kualitas barang yang
cukup bagus sehingga para pembeli sangat puas dan tidak kecewa.
33
Gambar 3.2 Logo Seribukilo
Sumber: CV.Seribukilo
3.4 Bahan Penelitian
Dalam melakukan penelitian ini, berikut bahan penelitian yang digunakan:
1. Literatur
Yaitu jurnal, buku dan artikel yang berhubungan dengan Algoritma C4.5, decision
tree dan data mining yang relevan dengan penelitian dan semuanya digunakan
sebagai bahan referensi untuk memperdalam pemahaman teori-teori dan
penerapan data.
2. Data
Pada penelitian ini, data yang digunakan adalah data penjualan milik
CV.Seribukilo. Data penjualan tersebut akan diolah menggunakan beberapa
34
metode data mining sehingga diperoleh satu metode yang paling akurat dan dapat
digunakan sebagai rules dalam memprediksi penjualan botol pada CV.Seribukilo.
3.5 Alat Penelitian (RapidMiner)
Adapun alat penelitian yang digunakan untuk menunjang penelitian ini adalah
RapidMiner, yaitu perangkat lunak yang bersifat terbuka (open source). RapidMiner
adalah sebuah solusi untuk melakukan analisis terhadap data mining, text mining dan
analisis prediksi. RapidMiner menggunakan berbagai teknik deskriptif dan prediksi
dalam memberikan wawasan kepada pengguna sehingga dapat membuat keputusan yang
paling baik. RapidMiner memiliki kurang lebih 500 operator data mining, termasuk
operator untuk input, output, data preprocessing dan visualisasi.
RapidMiner memiliki beberapa sifat sebagai berikut:
1. Ditulis dengan bahasa pemrograman Java sehingga dapat dijalankan di berbagai
sistem operasi.
2. Proses penemuan pengetahuan dimodelkan sebagai operator trees.
3. Representasi XML internal untuk memastikan format standar pertukaran data.
4. Bahasa scripting memungkinkan untuk eksperimen skala besar dan otomatisasi
eksperimen.
5. Konsep multi-layer untuk menjamin tampilan data yang efisien dan menjamin
penanganan data.
6. Memiliki GUI, command line mode, dan Java API yang dapat dipanggil dari
program lain.
35
Tools yang digunakan dalam RapidMiner ini adalah:
1. Panel operator view
Panel operator view merupakan induk langkah kerja dari proses analisa.
2. Panel repository view
merupakan komponen utama dalam Design Perspective selain Operator View.
View ini dapat digunakan untuk mengelola dan menata proses Analisis menjadi
proyek dan pada saat yang sama juga dapat digunakan sebagai sumber data dan
yang berkaitan dengan meta data.
3. Process view
Process View menunjukkan langkah-langkah tertentu dalam proses analisis dan
sebagai penghubung langkah-langkah tersebut.
4. Parameter view
Digunakan untuk mengatur fungsionalitas dari beberapa operator yang
membutuhkannya agar dapat dijalankan sesuai dengan proses analisa.
3.6 Jenis Data
Pada penelitian ini digunakan data yang berasal dari data historis penjualan botol
pada CV.Seribukkilo dengan jumlah data sebanyak 210 data. Terdapat 10 atribut terdiri
dari id barang, nama barang, kategori, satuan, harga, ukuran , bentuk, kualitas bahan,
warna, dan minat (naik atau turun).
Pada penelitian ini akan dilakukan menggunakan dua jenis data yaitu data
kualitatif dan data kuantitatif.
36
1. Data kualitatif
Data kualitaif merupakan data yang berbentuk kata-kata, data kualitatif dalam data
yang akan digunakan pada penelitian ini yaitu id barang, nama barang , kategori,
satuan, bentuk, kuaitas bahan, ukuran, warna, dan termasuk label yaitu naik atau
turun
2. Data kuantitatif
Data kuanitaif merupakan data yang berbentuk angka dan dapat dihitung nilainya
dengan statistik ataupun matematika secara pasti. Fungsi dari data kuantitatif
adalah mengetahui jumlah atau besaran objek yang akan diteliti. Data kuantitatif
merupakan data yang menunjukan probabilititas, dalam data yang digunakan
untuk penelitian yaitu harga.
3.7 Teknik Analisa Data
Data karyawan yang didapatkan dari proses pengumpulan data sebanyak 210 data
karyawan dan memiliki 10 atribut terdiri dari id barang, nama barang, kategori, satuan,
harga, ukuran , bentuk, kualitas bahan, warna, dan minat (naik atau turun). Setelah data
didapatkan untuk melakukan penelitian maka ada beberapa tahapan preparation data.
Preparation data merupakan tahapan untuk mendapatkan data yang berkualitas, maka
dapat dilakukan beberapa teknik sebagai berikut:
1. Data Cleaning
Data yang berkualitas sangat mempengaruhi kualitas keputusan yang akan
diperoleh. Data yang tidak berkualitas adalah data yang nilai atributnya hilang,
37
error dan data yang tidak konsiten dalam pengisian atributnya. Untuk
mendapatkan data yang berkualitas dilakukan tahapan dalam Data Cleaning
sebagai berikut:
a. Menghilangkan data yang tidak lengkap atau data yang tidak mempengaruhi
hasil pada saat di testing.
b. Mengisi nilai- nilai yang hilang, data yang tidak lengkap (missing value).
2. Data Integration and Transformation
Teknik yang digunakan untuk menganalisis data kolerasi, atribut yang redundan
disebut integration, sedangkan transformation berguna untuk meningkatkan
akurasi dan efisiensi. Algoritma C4.5 memiliki kelebihan memproses data yang
bernilai nominal, ortodinal maupun continue. Sehingga nilai-nilai setiap atribut
yang terdapat pada dataset tidak perlu ditransformasikan.
3. Data Reduction
Data set dapat direduksi dengan mengurangi jumlah atribut dan record supaya
menjadi lebih sedikit tetapi tetap bersifat informatif. Memperoleh representasi
dalam bentuk volume data yang telah berkurang jumlahnya namun tetap
mendapatkan hasil analisis yang sama. Deskretasi data merupakan bagian dari
reduksi data bagian penting untuk data numerik.
3.8 Tahapan Penelitian
Tahap selanjutnya adalah menentukan metode apa yang cocok digunakan dalam
teknik klasifikasi, setelah melakukan pengamatan dan observasi peneliti menentukan
38
Algoritma C.45. Dalam penelitian ini akan dilakukan beberapa langkah-langkah atau
tahapan penelitian.
Gambar 3.3 Tahapan Penelitian
Sumber : Pengolahan Data
1. Pengumpulan Data
Pada bagian ini dijelaskan tentang bagaimana dan darimana data dalam penelitian
ini didapatkan, meliputi data sekunder dan data primer. Data sekunder berisi
tentang sumber perolehan data untuk keperluan penelitian, sedangkan data primer
berisi tentang data yang dihasilkan dari penelitian.
39
2. Pengolahan Awal Data
Pada bagian ini dijelaskan tentang tahap awal data mining. Pengolahan awal data
meliputi proses input data ke format yang dibutuhkan, pengelompokan dan
penentuan atribut data.
3. Metode yang Diusulkan
Pada bagian ini dijelaskan tentang metode yang diusulkan untuk digunakan pada
prediksi penjualan botol, Penjelasan meliputi pengaturan dan pemilihan nilai dari
paraneter-parameter dan arsitektur melalui uji coba.
4. Evaluasi dan Validasi hasil
pada bagian ini dijelaskan tentang evaluasi dan validasi hasil penerapan metode
pada penelitian yang dilakukan. Penjelasan mengenai hal ini akan dipaparkan
pada bab IV.
3.8.1 Pengumpulan Data
Selama penelitian di CV.Seribukilo penulis dapat mengupulkan beberapa data,
antara lain:
1. Data Primer
Data primer adalah data yang diperoleh atau dikumpulkan oleh peneliti secara
langsung dari sumber datanya. Data primer disebut juga sebagai data asli atau data
baru yang memiliki sifat up to date. Untuk mendapatkan data primer peneliti harus
mengumpulkannya secara langsung. Teknik yang dapat digunakan peneliti untuk
mengumpulkan data primer antara lain observasi, wawancara, diskusi terfokus
40
(Focus Grup Discussion - FGD) dan penyebaran kuesioner. Data primer dalam
penelitian ini didapatkan dari data penjualan botol milik CV.Seribukilo.
Tabel 3.1 Data Jenis Botol
id b
ara
ng
na
ma
ba
ran
g
ka
tego
ri
satu
an
ha
rga
uk
ura
n
ben
tuk
ku
ali
tas
ba
ha
n
wa
rna
min
at
btl001 botol agro 100ml perkakas pcs 2100 kecil kotak baik sedikit naik
btl002 botol agro 150ml perkakas pcs 2400 kecil kotak baik banyak naik
btl003 botol agro 200ml perkakas pcs 2700 kecil kotak baik sedikit naik
btl004 botol agro 50ml perkakas pcs 1900 kecil kotak baik banyak naik
btl005 botol aqua 1000ml perkakas pcs 1400 besar bulat terbaik banyak naik
btl006 botol aqua 330ml perkakas pcs 1000 besar bulat terbaik banyak naik
btl007 botol aqua 500ml perkakas pcs 1100 besar bulat terbaik banyak naik
btl008 botol aqua 600ml perkakas pcs 1100 besar bulat terbaik banyak naik
btl009 botol aqua 750ml perkakas pcs 1200 besar bulat terbaik banyak naik
btl010 botol bohlam 1000ml perkakas pcs 2900 besar bulat baik banyak naik
btl011 botol bohlam 500ml perkakas pcs 1900 besar bulat baik banyak naik
btl012 botol bohlam 750ml perkakas pcs 2400 besar bulat baik banyak naik
btl013 botol bowling 1000ml perkakas pcs 2500 besar bulat baik banyak naik
btl014 botol bowling 250ml perkakas pcs 1500 besar bulat baik banyak naik
btl015 botol bowling 500ml perkakas pcs 1900 besar bulat baik banyak naik
btl016 botol bowling 600ml perkakas pcs 2100 besar bulat baik banyak naik
btl017 botol bp kotak 100ml perkakas pcs 900 kecil kotak terbaik banyak turun
btl018 botol bp kotak 150ml perkakas pcs 1100 kecil kotak terbaik banyak turun
btl019 botol bp kotak 50ml perkakas pcs 650 kecil kotak terbaik banyak turun
btl020 botol bp kotak 80ml perkakas pcs 750 kecil kotak terbaik banyak turun
btl021 botol bumbu 250ml perkakas pcs 1700 besar bulat terbaik banyak naik
btl022 botol bumbu 320ml perkakas pcs 1850 besar bulat terbaik banyak naik
btl023 botol bumbu 500ml perkakas pcs 2100 besar bulat terbaik banyak naik
btl024 botol bumbu lada 120ml perkakas pcs 1900 kecil kotak terbaik sedikit naik
btl025 botol bumbu lada 150ml perkakas pcs 2150 kecil kotak terbaik sedikit naik
btl026 botol bumbu lada 180ml perkakas pcs 2400 kecil kotak terbaik sedikit naik
btl027 botol bumbu lada 210ml perkakas pcs 2650 kecil kotak terbaik sedikit naik
btl028 botol cantik 1000ml perkakas pcs 3400 besar bulat baik banyak naik
btl029 botol cantik 250ml perkakas pcs 1550 besar bulat baik banyak naik
btl030 botol cantik 350ml perkakas pcs 1650 besar bulat baik banyak naik
41
Tabel 3.2 Data Jenis Botol (lanjutan) id
ba
ran
g
nama barang
ka
tego
ri
satu
an
ha
rga
uk
ura
n
ben
tuk
ku
ali
tas
ba
ha
n
wa
rna
min
at
btl031 botol cantik 500ml perkakas pcs 2500 besar bulat baik banyak naik
btl032 botol cantik 750ml perkakas pcs 3000 besar bulat baik banyak naik
btl033 botol disctop 100ml perkakas pcs 1900 kecil bulat terbaik sedikit naik
btl034 botol disctop 20ml perkakas pcs 1600 kecil bulat terbaik sedikit naik
btl035 botol disctop 30ml perkakas pcs 1600 kecil bulat terbaik sedikit naik
btl036 botol disctop 60ml perkakas pcs 1700 kecil bulat terbaik sedikit naik
btl037 botol fliptop 100ml perkakas pcs 1900 kecil bulat terbaik sedikit naik
btl038 botol fliptop 20ml perkakas pcs 1600 kecil bulat terbaik sedikit naik
btl039 botol fliptop 30ml perkakas pcs 1600 kecil bulat terbaik sedikit naik
btl040 botol fliptop 60ml perkakas pcs 1700 kecil bulat terbaik sedikit naik
btl041 botol gummy 150ml perkakas pcs 1600 kecil kotak baik banyak naik
btl042 botol gummy 200ml perkakas pcs 1900 kecil kotak baik sedikit naik
btl043 botol hand soap 500ml perkakas pcs 4200 besar bulat baik sedikit naik
btl044 botol jelly kotak 100ml perkakas pcs 1600 kecil kotak baik banyak turun
btl045 botol jelly kotak 150ml perkakas pcs 1900 kecil kotak baik banyak turun
btl046 botol jelly kotak 200ml perkakas pcs 2400 kecil kotak baik banyak turun
btl047 botol kale 1000ml perkakas pcs 3400 besar bulat baik banyak naik
btl048 botol kale 250ml perkakas pcs 1550 besar bulat baik banyak naik
btl049 botol kale 350ml perkakas pcs 1700 besar bulat baik banyak naik
btl050 botol kale 500ml perkakas pcs 2400 besar bulat baik banyak naik
btl051 botol kale 600ml perkakas pcs 2500 besar bulat baik banyak naik
btl052 botol kale 750ml perkakas pcs 3000 besar bulat baik banyak naik
btl053 botol kale kotak 1000ml perkakas pcs 3200 besar kotak terbaik banyak turun
btl054 botol kale kotak 250ml perkakas pcs 1600 besar kotak terbaik banyak turun
btl055 botol kale kotak 330ml perkakas pcs 1900 besar kotak terbaik banyak turun
btl056 botol kale kotak 500ml perkakas pcs 2500 besar kotak baik banyak turun
btl057 botol kapsul 100ml perkakas pcs 1900 kecil bulat terbaik sedikit naik
btl058 botol kapsul 130ml perkakas pcs 2000 kecil kotak baik banyak turun
btl059 botol kapsul 130ml perkakas pcs 2100 kecil bulat terbaik sedikit naik
btl060 botol kapsul 210ml perkakas pcs 2450 kecil kotak baik banyak turun
btl061 botol kapsul 230ml perkakas pcs 2300 kecil bulat terbaik sedikit naik
btl062 botol kapsul kotak 100ml perkakas pcs 1900 kecil kotak terbaik sedikit naik
btl063 botol kapsul kotak 130ml perkakas pcs 2100 kecil kotak terbaik sedikit naik
42
Tabel 3.3 Data Jenis Botol (lanjutan) id
ba
ran
g
nama barang
ka
tego
ri
satu
an
ha
rga
uk
ura
n
ben
tuk
ku
ali
tas
ba
ha
n
wa
rna
min
at
btl064 botol kapsul kotak 230ml perkakas pcs 2300 kecil kotak terbaik sedikit naik
btl065 botol karismatik kotak 250ml perkakas pcs 600 besar kotak terbaik banyak turun
btl066 botol karismatik kotak 330ml perkakas pcs 700 besar kotak terbaik banyak turun
btl067 botol karismatik kotak 400ml perkakas pcs 800 besar kotak terbaik banyak turun
btl068 botol karismatik kotak 500ml perkakas pcs 950 besar kotak baik banyak turun
btl069 botol karismatik kotak 600ml perkakas pcs 1100 besar kotak terbaik banyak turun
btl070 botol karismatik kotak 750ml perkakas pcs 1250 besar kotak terbaik banyak turun
btl071 botol karisnatik kotak 1000ml perkakas pcs 1400 besar kotak terbaik banyak turun
btl072 botol kick square 1000ml perkakas pcs 3200 besar kotak baik banyak turun
btl073 botol kick square 250ml perkakas pcs 1600 besar kotak terbaik banyak turun
btl074 botol kick square 330ml perkakas pcs 1900 besar kotak terbaik banyak turun
btl075 botol kick square 500ml perkakas pcs 2500 besar kotak baik banyak turun
btl076 botol kiwi 1000ml perkakas pcs 3000 besar bulat terbaik banyak naik
btl077 botol kiwi 250ml perkakas pcs 1700 besar bulat terbaik banyak naik
btl078 botol kiwi 500ml perkakas pcs 2500 besar bulat terbaik banyak naik
btl079 botol kristine 330ml perkakas pcs 1000 besar bulat terbaik sedikit naik
btl080 botol kristine 500ml perkakas pcs 1200 besar bulat terbaik sedikit naik
btl081 botol kristine 600ml perkakas pcs 1300 besar bulat terbaik sedikit naik
btl082 botol labor 250ml perkakas pcs 1900 besar bulat baik sedikit naik
btl083 botol labor 350ml perkakas pcs 2200 besar bulat baik sedikit naik
btl084 botol labor 500ml perkakas pcs 3200 besar bulat baik sedikit naik
btl085 botol labor bening 1000ml perkakas pcs 3400 besar bulat baik sedikit naik
btl086 botol labor bening 250ml perkakas pcs 2300 besar bulat baik sedikit naik
btl087 botol labor bening 350ml perkakas pcs 2600 besar bulat baik sedikit naik
btl088 botol labor bening 500ml perkakas pcs 2900 besar bulat baik sedikit naik
btl089 botol lemon 100ml perkakas pcs 1600 kecil kotak baik banyak turun
btl090 botol lemon 150ml perkakas pcs 1900 kecil kotak baik banyak turun
btl091 botol lemon 200ml perkakas pcs 2500 kecil kotak baik banyak turun
btl092 botol liebe 100ml perkakas pcs 1500 kecil kotak terbaik sedikit naik
btl093 botol liebe 200ml perkakas pcs 1700 kecil kotak terbaik sedikit naik
btl094 botol madu 100ml perkakas pcs 3200 kecil kotak terbaik sedikit naik
btl095 botol madu 200ml perkakas pcs 3700 kecil kotak terbaik sedikit naik
btl096 botol mahmud 250ml perkakas pcs 850 besar bulat terbaik sedikit naik
43
Tabel 3.4 Data Jenis Botol (lanjutan) id
ba
ran
g
nama barang
ka
tego
ri
satu
an
ha
rga
uk
ura
n
ben
tuk
ku
ali
tas
ba
ha
n
wa
rna
min
at
btl097 botol mahmud 350ml perkakas pcs 1000 besar bulat terbaik sedikit naik
btl098 botol mahmud 450ml perkakas pcs 1200 besar bulat terbaik sedikit naik
btl099 botol mahmud 500ml perkakas pcs 1300 besar bulat terbaik sedikit naik
btl100 botol matcha kotak 100ml perkakas pcs 1600 kecil kotak baik banyak turun
btl101 botol matcha kotak 150ml perkakas pcs 1900 kecil kotak baik banyak turun
btl102 botol matcha kotak 200ml perkakas pcs 2400 kecil kotak baik banyak turun
btl103 botol mg kotak 100ml perkakas pcs 900 kecil kotak terbaik banyak turun
btl104 botol mg kotak 150ml perkakas pcs 1100 kecil kotak terbaik banyak turun
btl105 botol mg kotak 200ml perkakas pcs 1300 kecil kotak terbaik banyak turun
btl106 botol mg kotak 50ml perkakas pcs 650 kecil kotak terbaik banyak turun
btl107 botol mg kotak 80ml perkakas pcs 750 kecil kotak terbaik banyak turun
btl108 botol parfum kotak 100ml perkakas pcs 1500 kecil kotak baik banyak naik
btl109 botol parfum kotak 10ml perkakas pcs 900 kecil kotak baik banyak naik
btl110 botol parfum kotak 20ml perkakas pcs 1000 kecil kotak baik banyak naik
btl111 botol parfum kotak 30ml perkakas pcs 1100 kecil kotak baik banyak naik
btl112 botol parfum kotak 50ml perkakas pcs 1200 kecil kotak baik banyak naik
btl113 botol parfum kotak 60ml perkakas pcs 1300 kecil kotak baik banyak naik
btl114 botol parfum kotak 80ml perkakas pcs 1400 kecil kotak baik banyak naik
btl115 botol parfum rol 10ml perkakas pcs 900 kecil kotak baik banyak naik
btl116 botol parfum rol 30ml perkakas pcs 1000 kecil kotak baik banyak naik
btl117 botol persegi moca 130ml perkakas pcs 1700 kecil kotak baik sedikit naik
btl118 botol persegi moca 160ml perkakas pcs 2000 kecil kotak baik sedikit naik
btl119 botol persegi moca 200ml perkakas pcs 2500 kecil kotak baik banyak naik
btl120 botol pipet 10ml perkakas pcs 2400 kecil kotak terbaik sedikit naik
btl121 botol pipet 10ml segel perkakas pcs 2700 kecil kotak terbaik banyak turun
btl122 botol pipet 15ml perkakas pcs 2500 kecil kotak terbaik sedikit naik
btl123 botol pipet 15ml segel perkakas pcs 2900 kecil kotak terbaik banyak turun
btl124 botol pipet 20ml segel perkakas pcs 3000 kecil kotak terbaik banyak turun
btl125 botol pipet 30ml perkakas pcs 2700 kecil kotak terbaik sedikit naik
btl126 botol pipet 30ml segel perkakas pcs 3200 kecil kotak terbaik banyak turun
btl127 botol pipet 40ml perkakas pcs 2900 kecil kotak terbaik sedikit naik
btl128 botol pipet 40ml segel perkakas pcs 3400 kecil kotak terbaik banyak turun
btl129 botol pipet 50ml segel perkakas pcs 2100 kecil kotak terbaik banyak turun
44
Tabel 3.5 Data Jenis Botol (lanjutan) id
ba
ran
g
nama barang
ka
tego
ri
satu
an
ha
rga
uk
ura
n
ben
tuk
ku
ali
tas
ba
ha
n
wa
rna
min
at
btl130 botol pipet 5ml segel perkakas pcs 2500 kecil kotak terbaik banyak turun
btl131 botol pipet 5ml segel perkakas pcs 2500 kecil kotak terbaik banyak turun
btl132 botol prima 1000ml perkakas pcs 3500 besar bulat baik banyak naik
btl133 botol prima 250ml perkakas pcs 1600 besar bulat baik banyak naik
btl134 botol prima 350ml perkakas pcs 1700 besar bulat baik banyak naik
btl135 botol prima 500ml perkakas pcs 2500 besar bulat baik banyak naik
btl136 botol prima 600ml perkakas pcs 2600 besar bulat baik banyak naik
btl137 botol prima 750ml perkakas pcs 3000 besar bulat baik banyak naik
btl138 botol prima kotak 1000ml perkakas pcs 3200 besar kotak terbaik banyak turun
btl139 botol prima kotak 250ml perkakas pcs 1600 besar kotak terbaik banyak turun
btl140 botol prima kotak 500ml perkakas pcs 2500 besar kotak terbaik banyak turun
btl141 botol pro round 100ml perkakas pcs 1500 kecil kotak terbaik sedikit naik
btl142 botol pro round 150ml perkakas pcs 1700 kecil kotak terbaik sedikit naik
btl143 botol pro round 200ml perkakas pcs 1900 kecil kotak terbaik sedikit naik
btl144 botol ps kotak 100ml perkakas pcs 850 kecil kotak terbaik banyak naik
btl145 botol ps kotak 130ml perkakas pcs 950 kecil kotak terbaik banyak naik
btl146 botol ps kotak 150ml perkakas pcs 1100 kecil kotak terbaik banyak naik
btl147 botol ps kotak 200ml perkakas pcs 1300 kecil kotak terbaik banyak naik
btl148 botol ps kotak 80ml perkakas pcs 750 kecil kotak terbaik banyak naik
btl149 botol pump 250ml perkakas pcs 3200 besar bulat terbaik banyak naik
btl150 botol pump 320ml perkakas pcs 3500 besar bulat terbaik banyak naik
btl151 botol pump 500ml perkakas pcs 3900 besar bulat terbaik banyak naik
btl152 botol pump kotak 1000ml perkakas pcs 5000 besar kotak terbaik banyak turun
btl153 botol pump kotak 250ml perkakas pcs 3200 besar kotak terbaik banyak turun
btl154 botol pump kotak 330ml perkakas pcs 3700 besar kotak baik banyak turun
btl155 botol pump kotak 500ml perkakas pcs 4200 besar kotak terbaik banyak turun
btl156 botol pump kotak 750ml perkakas pcs 4600 besar kotak terbaik banyak turun
btl157 botol sabun 250ml perkakas pcs 950 besar bulat terbaik banyak naik
btl158 botol sabun 330ml perkakas pcs 1100 besar bulat terbaik banyak naik
btl159 botol sabun 450ml perkakas pcs 1200 besar bulat terbaik banyak naik
btl160 botol sabun 600ml perkakas pcs 1400 besar bulat terbaik banyak naik
btl161 botol sabun 700ml perkakas pcs 1500 besar bulat terbaik banyak naik
btl162 botol sase 1000ml perkakas pcs 2900 besar bulat terbaik banyak naik
45
Tabel 3.6 Data Jenis Botol (lanjutan) id
ba
ran
g
nama barang
ka
tego
ri
satu
an
ha
rga
uk
ura
n
ben
tuk
ku
ali
tas
ba
ha
n
wa
rna
min
at
btl163 botol sase 250ml perkakas pcs 1600 besar bulat terbaik banyak naik
btl164 botol sase 350ml perkakas pcs 1900 besar bulat terbaik banyak naik
btl165 botol sase 500ml perkakas pcs 2400 besar bulat terbaik banyak naik
btl166 botol sase kotak 1000ml perkakas pcs 3200 besar kotak baik banyak turun
btl167 botol sase kotak 250ml perkakas pcs 1600 besar kotak terbaik banyak turun
btl168 botol sase kotak 350ml perkakas pcs 1900 besar kotak baik banyak turun
btl169 botol sase kotak 500ml perkakas pcs 2500 besar kotak baik banyak turun
btl170 botol sase kotak 750ml perkakas pcs 2900 besar kotak terbaik banyak turun
btl171 botol sehat 1000ml perkakas pcs 1450 besar bulat terbaik banyak naik
btl172 botol sehat 330ml perkakas pcs 850 besar bulat terbaik banyak naik
btl173 botol sehat 500ml perkakas pcs 950 besar bulat terbaik banyak naik
btl174 botol sehat 600ml perkakas pcs 1200 besar bulat terbaik banyak naik
btl175 botol sehat 750ml perkakas pcs 1300 besar bulat terbaik banyak naik
btl176 botol slim kotak 100ml perkakas pcs 1600 kecil kotak baik banyak turun
btl177 botol slim kotak 150ml perkakas pcs 2000 kecil kotak baik banyak turun
btl178 botol slim kotak 200ml perkakas pcs 2500 kecil kotak baik banyak turun
btl179 botol spray 20ml perkakas pcs 1700 kecil bulat baik banyak naik
btl180 botol spray 250ml perkakas pcs 2500 besar bulat baik sedikit naik
btl181 botol spray 30ml perkakas pcs 1700 kecil bulat baik banyak naik
btl182 botol spray 350ml perkakas pcs 2900 besar bulat baik sedikit naik
btl183 botol spray 500ml perkakas pcs 3200 besar bulat baik sedikit naik
btl184 botol spray 60ml perkakas pcs 1800 kecil bulat baik banyak naik
btl185 botol spray kotak 100ml perkakas pcs 1200 kecil kotak baik sedikit turun
btl186 botol spray kotak 30ml perkakas pcs 850 kecil kotak baik sedikit turun
btl187 botol spray kotak 60ml perkakas pcs 1000 kecil kotak baik sedikit turun
btl188 botol spray trigger 250ml perkakas pcs 4200 besar bulat baik banyak naik
btl189 botol tablet 100ml perkakas pcs 1600 kecil kotak baik sedikit naik
btl190 botol tablet 130ml perkakas pcs 1800 kecil kotak baik banyak naik
btl191 botol tablet 150ml perkakas pcs 2000 kecil kotak baik sedikit naik
btl192 botol tablet 200ml perkakas pcs 2300 kecil kotak baik sedikit naik
btl193 botol takar kotak 100ml perkakas pcs 1650 kecil kotak baik banyak turun
btl194 botol takar kotak 150ml perkakas pcs 1900 kecil kotak baik banyak turun
btl195 botol takar kotak 200ml perkakas pcs 2200 kecil kotak baik banyak turun
46
Tabel 3.7 Data Jenis Botol (lanjutan) id
ba
ran
g
nama barang
ka
tego
ri
satu
an
ha
rga
uk
ura
n
ben
tuk
ku
ali
tas
ba
ha
n
wa
rna
min
at
btl196 botol tetes 10ml perkakas pcs 900 kecil bulat baik sedikit naik
btl197 botol tetes 15ml perkakas pcs 1000 kecil bulat baik sedikit naik
btl198 botol tetes 20ml perkakas pcs 1100 kecil bulat baik sedikit naik
btl199 botol tetes 30ml perkakas pcs 1200 kecil bulat baik sedikit naik
btl200 botol wafe kotak 100ml perkakas pcs 1000 kecil kotak baik sedikit turun
btl201 botol wafe kotak 150ml perkakas pcs 1200 kecil kotak baik sedikit turun
btl202 botol wafe kotak 200ml perkakas pcs 1400 kecil kotak baik sedikit turun
btl203 botol wafe kotak 230ml perkakas pcs 1450 kecil kotak baik sedikit turun
btl204 botol yardley kotak 1000ml perkakas pcs 1400 besar kotak terbaik banyak Turun
btl205 botol yardley kotak 250ml perkakas pcs 600 besar kotak baik banyak Turun
btl206 botol yardley kotak 330ml perkakas pcs 700 besar kotak terbaik banyak Turun
btl207 botol yardley kotak 400ml perkakas pcs 800 besar kotak terbaik banyak Turun
btl208 botol yardley kotak 500ml perkakas pcs 950 besar kotak terbaik banyak Turun
btl209 botol yardley kotak 600ml perkakas pcs 1100 besar kotak terbaik banyak Turun
btl210 botol yardley kotak 750ml perkakas pcs 1250 besar kotak terbaik banyak Turun
Adapun atribut yang diguakan dalam mengolah data penjualan botol yaitu:
Tabel 3.8 Atribut Data
No Atribut Keterangan
1 Id Barang Data primary key yang merupakan identitas suatu barang
2 Nama Barang Nama dari jenis Botol
3 Kategori Jenis Suatu Barang
4 Satuan Ukuran suatu besaran
5 Harga Nilai penjualan botol
6 Ukuran Besar atau kecilnya botol
47
Tabel 3.9 Atribut Data (Lanjutan)
No Atribut Keterangan
7 Bentuk Wujud dari botol, dengan dua nilai yakni: Bulat dan Kotak
8 Kualitas Bahan Bahan yang digunakan, dengan dua nilai yakni: Baik dan
Terbaik
9 Warna Macam – macam warna dari setiap botol, dengan dua nilai
yakni: Banyak dan Sedikit
10 Minat Jumlah peminat dari penjualan botol, dengan dua nilai
yakni: Naik dan Turun
2. Data Sekunder
Data sekunder adalah data yang diperoleh atau dikumpulkan peneliti dari berbagai
sumber yang telah ada (peneliti sebagai tangan kedua). Data sekunder dapat
diperoleh dari berbagai sumber seperti Biro Pusat Statistik (BPS), buku, laporm,
jural, dan lain-lain.
Tabel 3.10 Jurnal Penelitian Terdahulu
No Judul Jurnal Nama Pembuat Jurnal Tahun
1 Penerapan data mining dalam
memprediksi pembelian cat
Fitriana Harahap 2015
48
Tabel 3.11 Jurnal Penelitian Terdahulu (Lanjutan)
No Judul Jurnal Nama Pembuat Jurnal Tahun
2 Analisa penerapan algoritma C4.5 untuk
mempredikasi penjualan motor pada PT.
Capella Dinamik Nusantara cabang muka
kuning
Nurul Azwanti 2018
3 Prediksi Kompetensi Karyawan
Menggunakan Algoritma C4.5 Studi
Kasus: PT. Hankook Tire Indonesia
Aswan Supriyadi Sunge 2018
4 Penerapan Data Mining Untuk Prediksi
Penjualan Wallpaper menggunakan
Algoritma C4.5
Juna Eska 2016
5 Closed Item-Set Mining for Prediction of
Indian Summer Monsoon Rainfall A Data
Mining Model with Land and Ocean
Variables as Predictors
H. Vathsala 2015
6 Penerapan Algoritma C4.5 Untuk
Penentuan Jurusan Mahasiswa
Liliana Suastina 2013
49
Tabel 3.12 Jurnal Penelitian Terdahulu (Lanjutan)
No Judul Jurnal Nama Pembuat Jurnal Tahun
7 Analisa dan Penerapan Metode C4.5
Untuk Prediksi Loyalitas Pelanggan
Teguh Budi Santoso 2013
8 Kajian Penerapan Metode klasifikasi
Data Mining Algoritma C4.5 Untuk
Prediksi Kelayakan Kredit Pada Bank
Mayapada jakarta
Nandang Iriadi 2016
3.8.2 Pengelolaan Awal Data
Pada data penjualan botol yang telah dikumpulkan selanjutnya dilakukan proses
cleaning data, yaitu dengan menghilangkan record-record yang nois atau tidak lengkap
dan record yang berulang, atribut yang tidak diperlukan juga bisa dihilangkan seperti
atribut Id Barang, Nama Barang, Kategori dan Satuan, hal ini dilakukan karena atribut
tersebut tidak berpengaruh terhadap pengolahan data pada proes selanjutnya. Berikut
adalah tabel atribut dan kategorinya.
Tabel 3.13 Atribut Data Training
No Atribut Nilai
1 Harga
>600
<5000
50
Tabel 3.14 Atribut Data Training
No Atribut Nilai
2 Ukuran
Besar
Kecil
3 Bentuk
Bulat
Kotak
4 Kualitas Bahan
Baik
Terbaik
5 Warna
Sedikit
Banyak
6 Minat
Naik
Turun
Dan yang sudah disiapkan untuk klasifikasi dibagi menjadi dua data, untuk data
training (80%) dan untuk data testing (20%). Pembagian data training dan data testing
menggunkan teknik sampling random sistematik. Cara penggunaan teknik ini yaitu
dengan cara perandoman atau pengundian hanya dilakukan satu kali, yakni ketika
menentukan unsur pertama dari sampling yang akan diambil. Penentuan unsur sampling
selanjutnya ditempuh dengan cara memanfaatkan interval sampel. Interval sampel adalah
angka yang menunjukkan jarak antara nomor-nomor urut yang terdapat dalam kerangka
sampling yang akan dijadikan patokan dalam menentukan atau memilih unsur- unsur
51
sampling kedua dan seterusnya hingga unsur ke-n. Interval sampel biasanya
dilambangkan dengan huruf “k”.
Interval sampel atau juga disebut sampling rasio diperoleh dengan cara membagi
ukuran populasi dengan ukuran sampel yang dikehendaki (N/m). Contoh perhitungan
untuk mengambil data testing adalah sebagai berikut:
Jumlah populasi (N) = 210
Jumlah sampel (n) = 42
Jumlah data testing = 20 % x 210 = 42
Interval Sampling (k) = N/n = 210/42 = 5
Unsur pertama yang diambil untuk data testing (s) = 1
Unsur kedua = s + k
Unsur ketiga = s + 2k
Unsur keempat = s + 3k, dan seterusnya hingga unsurke-n.
Dari hasil diatas diperoleh data testing sebanyak 42 data botol, maka sisanya
dijadikan data training sebanyak 168 data botol. Setelah semua data siap dan sudah sesuai
dengan tahapan pengolahan sebelumnya, tahap selanjutnya yang dapat dilakukan adalah:
1. Choosing the appropriate Data Mining task
Pada tahap ini yang harus dilakukan adalah memilih jenis data mining yang ingin
digunakan pada penelitian untuk prediksi penjualan botol CV.Seribukilo maka
dipilih jenis data mining yang akan digunakan adalah klasifikasi.
52
2. Choosing the Data Mining Algorithm
Setelah pemilihan jenis data mining yang akan digunakan yaitu klasifikasi, maka
tahap selanjutnya menentukan algoritma klasifikasi yang akan digunakan. Pada
penelitian ini algoritma yang akan digunakan adalah C4.5.
3. Employing the Data Mining Algorithm
Ditahap ini dilakukan pengolahan data dengan algoritma yang telah dipilih untuk
mendapatkan algoritma terbaik dengan tingkat akurasi yang tinggi dalam
klasifikasi prediksi penjualan botol pada CV.Seribukilo.
4. Evaluation
Dalam tahap ini dilakukan evaluasi dan menafsirkan pola yang didapatkan dari
hasil algoritma yang dipakai untuk mengetahui aturan, kehandalan, dan lain-lain.
Evaluasi dilakukan dengan menerapkan pola yang didapat dari proses sebelumnya
terhadap data testing yang disediakan. Evaluasi dilakukan dengan confusion
matrix dan kurva ROC.
5. Using the discovered knowledge
Pada tahap ini menggunakan pengetahuan yang diperoleh dari proses data mining
untuk penerapan pada aplikasi atau lainnya.
3.8.3 Metode Yang Diusulkan
Dalam penelitian ini akan dilakukan analisa menggukanan metode algoritma
C4.5. Data dihitung dengan menggunakan algoritma sesuai dengan metodenya kemudian
53
dicari hasil akurasinya. Dalam tahapan ini akan dilakukan beberapa langkah pengujian
data yaitu seperti berikut:
Gambar 3.4 Langkah Pengujian
Sumber: Pengolahan Data
54
BAB IV
HASIL DAN PEMBAHASAN
4.1 Hasil
4.1.1 Evaluasi dan Validasi Hasil Algoritma C4.5
Langkah pembuatan pohon keputusan (Decision Tree). Pada langkah awal dari
proses evaluasi algoritma C4.5 ini adalah mempersiapkan data yang akan di proses,
dalam penelitian ini data yang akan diolah adalah penjualan botol milik CV.Seribukilo.
Tabel 4.1 Data Jenis Botol Keseluruhan
id
ba
ran
g
nama barang Ka
tego
ri
satu
an
Ha
rga
Uk
ura
n
ben
tuk
ku
ali
tas
ba
ha
n
wa
rna
min
at
btl001 botol agro 100ml Perkakas pcs 2100 kecil kotak baik sedikit Naik
btl002 botol agro 150ml Perkakas pcs 2400 kecil kotak baik banyak Naik
btl003 botol agro 200ml Perkakas pcs 2700 kecil kotak baik sedikit Naik
btl004 botol agro 50ml Perkakas pcs 1900 kecil kotak baik banyak Naik
btl005 botol aqua 1000ml Perkakas pcs 1400 besar bulat terbaik banyak Naik
btl006 botol aqua 330ml Perkakas pcs 1000 besar bulat terbaik banyak Naik
btl007 botol aqua 500ml Perkakas pcs 1100 besar bulat terbaik banyak Naik
btl008 botol aqua 600ml Perkakas pcs 1100 besar bulat terbaik banyak Naik
btl009 botol aqua 750ml Perkakas pcs 1200 besar bulat terbaik banyak Naik
btl010 botol bohlam 1000ml Perkakas pcs 2900 besar bulat baik banyak Naik
btl011 botol bohlam 500ml Perkakas pcs 1900 besar bulat baik banyak Naik
btl012 botol bohlam 750ml Perkakas pcs 2400 besar bulat baik banyak Naik
btl013 botol bowling 1000ml Perkakas pcs 2500 besar bulat baik banyak Naik
btl014 botol bowling 250ml Perkakas pcs 1500 besar bulat baik banyak Naik
btl015 botol bowling 500ml Perkakas pcs 1900 besar bulat baik banyak Naik
btl016 botol bowling 600ml Perkakas pcs 2100 besar bulat baik banyak Naik
btl017 botol bp kotak 100ml Perkakas pcs 900 kecil kotak terbaik banyak Turun
btl018 botol bp kotak 150ml Perkakas pcs 1100 kecil kotak terbaik banyak Turun
btl019 botol bp kotak 50ml Perkakas pcs 650 kecil kotak terbaik banyak Turun
btl020 botol bp kotak 80ml Perkakas pcs 750 kecil kotak terbaik banyak Turun
55
Tabel 4.2 Data Jenis Botol Keseluruhan (Lanjutan)
id
ba
ran
g
nama barang Ka
tego
ri
satu
an
Ha
rga
Uk
ura
n
ben
tuk
ku
ali
tas
ba
ha
n
wa
rna
min
at
btl021 botol bumbu 250ml perkakas pcs 1700 besar bulat terbaik banyak Naik
btl022 botol bumbu 320ml perkakas pcs 1850 besar bulat terbaik banyak Naik
btl023 botol bumbu 500ml perkakas pcs 2100 besar bulat terbaik banyak Naik
btl024 botol bumbu lada 120ml perkakas pcs 1900 kecil kotak terbaik sedikit Naik
btl025 botol bumbu lada 150ml perkakas pcs 2150 kecil kotak terbaik sedikit Naik
btl026 botol bumbu lada 180ml perkakas pcs 2400 kecil kotak terbaik sedikit Naik
btl027 botol bumbu lada 210ml perkakas pcs 2650 kecil kotak terbaik sedikit Naik
btl028 botol cantik 1000ml perkakas pcs 3400 besar bulat baik banyak Naik
btl029 botol cantik 250ml perkakas pcs 1550 besar bulat baik banyak naik
btl030 botol cantik 350ml perkakas pcs 1650 besar bulat baik banyak naik
btl031 botol cantik 500ml perkakas pcs 2500 besar bulat baik banyak naik
btl032 botol cantik 750ml perkakas pcs 3000 besar bulat baik banyak naik
btl033 botol disctop 100ml perkakas pcs 1900 kecil bulat terbaik sedikit naik
btl034 botol disctop 20ml perkakas pcs 1600 kecil bulat terbaik sedikit naik
btl035 botol disctop 30ml perkakas pcs 1600 kecil bulat terbaik sedikit naik
btl036 botol disctop 60ml perkakas pcs 1700 kecil bulat terbaik sedikit naik
btl037 botol fliptop 100ml perkakas pcs 1900 kecil bulat terbaik sedikit naik
btl038 botol fliptop 20ml perkakas pcs 1600 kecil bulat terbaik sedikit naik
btl039 botol fliptop 30ml perkakas pcs 1600 kecil bulat terbaik sedikit naik
btl040 botol fliptop 60ml perkakas pcs 1700 kecil bulat terbaik sedikit naik
btl041 botol gummy 150ml perkakas pcs 1600 kecil kotak baik banyak naik
btl042 botol gummy 200ml perkakas pcs 1900 kecil kotak baik sedikit naik
btl043 botol hand soap 500ml perkakas pcs 4200 besar bulat baik sedikit naik
btl044 botol jelly kotak 100ml perkakas pcs 1600 kecil kotak baik banyak turun
btl045 botol jelly kotak 150ml perkakas pcs 1900 kecil kotak baik banyak turun
btl046 botol jelly kotak 200ml perkakas pcs 2400 kecil kotak baik banyak turun
btl047 botol kale 1000ml perkakas pcs 3400 besar bulat baik banyak naik
btl048 botol kale 250ml perkakas pcs 1550 besar bulat baik banyak naik
btl049 botol kale 350ml perkakas pcs 1700 besar bulat baik banyak naik
btl050 botol kale 500ml perkakas pcs 2400 besar bulat baik banyak naik
btl051 botol kale 600ml perkakas pcs 2500 besar bulat baik banyak naik
btl052 botol kale 750ml perkakas pcs 3000 besar bulat baik banyak naik
btl021 botol bumbu 250ml perkakas pcs 1700 besar bulat terbaik banyak Naik
btl022 botol bumbu 320ml perkakas pcs 1850 besar bulat terbaik banyak Naik
btl023 botol bumbu 500ml perkakas pcs 2100 besar bulat terbaik banyak Naik
56
Tabel 4.3 Data Jenis Botol Keseluruhan (Lanjutan)
id
ba
ran
g
nama barang Ka
tego
ri
satu
an
Ha
rga
Uk
ura
n
ben
tuk
ku
ali
tas
ba
ha
n
wa
rna
min
at
btl024 botol bumbu lada 120ml perkakas pcs 1900 kecil kotak terbaik sedikit Naik
btl025 botol bumbu lada 150ml perkakas pcs 2150 kecil kotak terbaik sedikit Naik
btl026 botol bumbu lada 180ml perkakas pcs 2400 kecil kotak terbaik sedikit Naik
btl027 botol bumbu lada 210ml perkakas pcs 2650 kecil kotak terbaik sedikit Naik
btl028 botol cantik 1000ml perkakas pcs 3400 besar bulat baik banyak Naik
btl029 botol cantik 250ml perkakas pcs 1550 besar bulat baik banyak naik
btl030 botol cantik 350ml perkakas pcs 1650 besar bulat baik banyak naik
btl031 botol cantik 500ml perkakas pcs 2500 besar bulat baik banyak naik
btl032 botol cantik 750ml perkakas pcs 3000 besar bulat baik banyak naik
btl033 botol disctop 100ml perkakas pcs 1900 kecil bulat terbaik sedikit naik
btl034 botol disctop 20ml perkakas pcs 1600 kecil bulat terbaik sedikit naik
btl035 botol disctop 30ml perkakas pcs 1600 kecil bulat terbaik sedikit naik
btl036 botol disctop 60ml perkakas pcs 1700 kecil bulat terbaik sedikit naik
btl037 botol fliptop 100ml perkakas pcs 1900 kecil bulat terbaik sedikit naik
btl038 botol fliptop 20ml perkakas pcs 1600 kecil bulat terbaik sedikit naik
btl039 botol fliptop 30ml perkakas pcs 1600 kecil bulat terbaik sedikit naik
btl040 botol fliptop 60ml perkakas pcs 1700 kecil bulat terbaik sedikit naik
btl041 botol gummy 150ml perkakas pcs 1600 kecil kotak baik banyak naik
btl042 botol gummy 200ml perkakas pcs 1900 kecil kotak baik sedikit naik
btl043 botol hand soap 500ml perkakas pcs 4200 besar bulat baik sedikit naik
btl044 botol jelly kotak 100ml perkakas pcs 1600 kecil kotak baik banyak turun
btl045 botol jelly kotak 150ml perkakas pcs 1900 kecil kotak baik banyak turun
btl046 botol jelly kotak 200ml perkakas pcs 2400 kecil kotak baik banyak turun
btl047 botol kale 1000ml perkakas pcs 3400 besar bulat baik banyak naik
btl048 botol kale 250ml perkakas pcs 1550 besar bulat baik banyak naik
btl049 botol kale 350ml perkakas pcs 1700 besar bulat baik banyak naik
btl050 botol kale 500ml perkakas pcs 2400 besar bulat baik banyak naik
btl051 botol kale 600ml perkakas pcs 2500 besar bulat baik banyak naik
btl052 botol kale 750ml perkakas pcs 3000 besar bulat baik banyak naik
btl053 botol kale kotak 1000ml perkakas pcs 3200 besar kotak terbaik banyak turun
btl054 botol kale kotak 250ml perkakas pcs 1600 besar kotak terbaik banyak turun
btl055 botol kale kotak 330ml perkakas pcs 1900 besar kotak terbaik banyak turun
btl056 botol kale kotak 500ml perkakas pcs 2500 besar kotak baik banyak turun
btl057 botol kapsul 100ml perkakas pcs 1900 kecil bulat terbaik sedikit naik
btl058 botol kapsul 130ml perkakas pcs 2000 kecil kotak baik banyak turun
57
Tabel 4.4 Data Jenis Botol Keseluruhan (Lanjutan)
id
ba
ran
g
nama barang Ka
tego
ri
satu
an
Ha
rga
Uk
ura
n
ben
tuk
ku
ali
tas
ba
ha
n
wa
rna
min
at
btl059 botol kapsul 130ml perkakas pcs 2100 kecil bulat terbaik sedikit naik
btl060 botol kapsul 210ml perkakas pcs 2450 kecil kotak baik banyak turun
btl061 botol kapsul 230ml perkakas pcs 2300 kecil bulat terbaik sedikit naik
btl062 botol kapsul kotak 100ml perkakas pcs 1900 kecil kotak terbaik sedikit naik
btl063 botol kapsul kotak 130ml perkakas pcs 2100 kecil kotak terbaik sedikit naik
btl064 botol kapsul kotak 230ml perkakas pcs 2300 kecil kotak terbaik sedikit naik
btl065 botol karismatik kotak 250ml perkakas pcs 600 besar kotak terbaik banyak turun
btl066 botol karismatik kotak 330ml perkakas pcs 700 besar kotak terbaik banyak turun
btl067 botol karismatik kotak 400ml perkakas pcs 800 besar kotak terbaik banyak turun
btl068 botol karismatik kotak 500ml perkakas pcs 950 besar kotak baik banyak turun
btl069 botol karismatik kotak 600ml perkakas pcs 1100 besar kotak terbaik banyak turun
btl070 botol karismatik kotak 750ml perkakas pcs 1250 besar kotak terbaik banyak turun
btl071 botol karisnatik kotak 1000ml perkakas pcs 1400 besar kotak terbaik banyak turun
btl072 botol kick square 1000ml perkakas pcs 3200 besar kotak baik banyak turun
btl073 botol kick square 250ml perkakas pcs 1600 besar kotak terbaik banyak turun
btl074 botol kick square 330ml perkakas pcs 1900 besar kotak terbaik banyak turun
btl075 botol kick square 500ml perkakas pcs 2500 besar kotak baik banyak turun
btl076 botol kiwi 1000ml perkakas pcs 3000 besar bulat terbaik banyak naik
btl077 botol kiwi 250ml perkakas pcs 1700 besar bulat terbaik banyak naik
btl078 botol kiwi 500ml perkakas pcs 2500 besar bulat terbaik banyak naik
btl079 botol kristine 330ml perkakas pcs 1000 besar bulat terbaik sedikit naik
btl080 botol kristine 500ml perkakas pcs 1200 besar bulat terbaik sedikit naik
btl081 botol kristine 600ml perkakas pcs 1300 besar bulat terbaik sedikit naik
btl082 botol labor 250ml perkakas pcs 1900 besar bulat baik sedikit naik
btl083 botol labor 350ml perkakas pcs 2200 besar bulat baik sedikit naik
btl084 botol labor 500ml perkakas pcs 3200 besar bulat baik sedikit naik
btl085 botol labor bening 1000ml perkakas pcs 3400 besar bulat baik sedikit naik
btl086 botol labor bening 250ml perkakas pcs 2300 besar bulat baik sedikit naik
btl087 botol labor bening 350ml perkakas pcs 2600 besar bulat baik sedikit naik
btl088 botol labor bening 500ml perkakas pcs 2900 besar bulat baik sedikit naik
btl089 botol lemon 100ml perkakas pcs 1600 kecil kotak baik banyak turun
btl090 botol lemon 150ml perkakas pcs 1900 kecil kotak baik banyak turun
btl091 botol lemon 200ml perkakas pcs 2500 kecil kotak baik banyak turun
btl092 botol liebe 100ml perkakas pcs 1500 kecil kotak terbaik sedikit naik
btl093 botol liebe 200ml perkakas pcs 1700 kecil kotak terbaik sedikit naik
58
Tabel 4.5 Data Jenis Botol Keseluruhan (Lanjutan)
id
ba
ran
g
nama barang Ka
tego
ri
satu
an
Ha
rga
Uk
ura
n
ben
tuk
ku
ali
tas
ba
ha
n
wa
rna
min
at
btl094 botol madu 100ml perkakas pcs 3200 kecil kotak terbaik sedikit naik
btl095 botol madu 200ml perkakas pcs 3700 kecil kotak terbaik sedikit naik
btl096 botol mahmud 250ml perkakas pcs 850 besar bulat terbaik sedikit naik
btl097 botol mahmud 350ml perkakas pcs 1000 besar bulat terbaik sedikit naik
btl098 botol mahmud 450ml perkakas pcs 1200 besar bulat terbaik sedikit naik
btl099 botol mahmud 500ml perkakas pcs 1300 besar bulat terbaik sedikit naik
btl100 botol matcha kotak 100ml perkakas pcs 1600 kecil kotak baik banyak turun
btl101 botol matcha kotak 150ml perkakas pcs 1900 kecil kotak baik banyak turun
btl102 botol matcha kotak 200ml perkakas pcs 2400 kecil kotak baik banyak turun
btl103 botol mg kotak 100ml perkakas pcs 900 kecil kotak terbaik banyak turun
btl104 botol mg kotak 150ml perkakas pcs 1100 kecil kotak terbaik banyak turun
btl105 botol mg kotak 200ml perkakas pcs 1300 kecil kotak terbaik banyak turun
btl106 botol mg kotak 50ml perkakas pcs 650 kecil kotak terbaik banyak turun
btl107 botol mg kotak 80ml perkakas pcs 750 kecil kotak terbaik banyak turun
btl108 botol parfum kotak 100ml perkakas pcs 1500 kecil kotak baik banyak naik
btl109 botol parfum kotak 10ml perkakas pcs 900 kecil kotak baik banyak naik
btl110 botol parfum kotak 20ml perkakas pcs 1000 kecil kotak baik banyak naik
btl111 botol parfum kotak 30ml perkakas pcs 1100 kecil kotak baik banyak naik
btl112 botol parfum kotak 50ml perkakas pcs 1200 kecil kotak baik banyak naik
btl113 botol parfum kotak 60ml perkakas pcs 1300 kecil kotak baik banyak naik
btl114 botol parfum kotak 80ml perkakas pcs 1400 kecil kotak baik banyak naik
btl115 botol parfum rol 10ml perkakas pcs 900 kecil kotak baik banyak naik
btl116 botol parfum rol 30ml perkakas pcs 1000 kecil kotak baik banyak naik
btl117 botol persegi moca 130ml perkakas pcs 1700 kecil kotak baik sedikit naik
btl118 botol persegi moca 160ml perkakas pcs 2000 kecil kotak baik sedikit naik
btl119 botol persegi moca 200ml perkakas pcs 2500 kecil kotak baik banyak naik
btl120 botol pipet 10ml perkakas pcs 2400 kecil kotak terbaik sedikit naik
btl121 botol pipet 10ml segel perkakas pcs 2700 kecil kotak terbaik banyak turun
btl122 botol pipet 15ml perkakas pcs 2500 kecil kotak terbaik sedikit naik
btl123 botol pipet 15ml segel perkakas pcs 2900 kecil kotak terbaik banyak turun
btl124 botol pipet 20ml segel perkakas pcs 3000 kecil kotak terbaik banyak turun
btl125 botol pipet 30ml perkakas pcs 2700 kecil kotak terbaik sedikit naik
btl126 botol pipet 30ml segel perkakas pcs 3200 kecil kotak terbaik banyak turun
btl127 botol pipet 40ml perkakas pcs 2900 kecil kotak terbaik sedikit naik
btl128 botol pipet 40ml segel perkakas pcs 3400 kecil kotak terbaik banyak turun
59
Tabel 4.6 Data Jenis Botol Keseluruhan (Lanjutan)
id
ba
ran
g
nama barang Ka
tego
ri
satu
an
Ha
rga
Uk
ura
n
ben
tuk
ku
ali
tas
ba
ha
n
wa
rna
min
at
btl129 botol pipet 50ml segel perkakas pcs 2100 kecil kotak terbaik banyak turun
btl130 botol pipet 5ml perkakas pcs 2300 kecil kotak terbaik sedikit naik
btl131 botol pipet 5ml segel perkakas pcs 2500 kecil kotak terbaik banyak turun
btl132 botol prima 1000ml perkakas pcs 3500 besar bulat baik banyak naik
btl133 botol prima 250ml perkakas pcs 1600 besar bulat baik banyak naik
btl134 botol prima 350ml perkakas pcs 1700 besar bulat baik banyak naik
btl135 botol prima 500ml perkakas pcs 2500 besar bulat baik banyak naik
btl136 botol prima 600ml perkakas pcs 2600 besar bulat baik banyak naik
btl137 botol prima 750ml perkakas pcs 3000 besar bulat baik banyak naik
btl138 botol prima kotak 1000ml perkakas pcs 3200 besar kotak terbaik banyak turun
btl139 botol prima kotak 250ml perkakas pcs 1600 besar kotak terbaik banyak turun
btl140 botol prima kotak 500ml perkakas pcs 2500 besar kotak terbaik banyak turun
btl141 botol pro round 100ml perkakas pcs 1500 kecil kotak terbaik sedikit naik
btl142 botol pro round 150ml perkakas pcs 1700 kecil kotak terbaik sedikit naik
btl143 botol pro round 200ml perkakas pcs 1900 kecil kotak terbaik sedikit naik
btl144 botol ps kotak 100ml perkakas pcs 850 kecil kotak terbaik banyak naik
btl145 botol ps kotak 130ml perkakas pcs 950 kecil kotak terbaik banyak naik
btl146 botol ps kotak 150ml perkakas pcs 1100 kecil kotak terbaik banyak naik
btl147 botol ps kotak 200ml perkakas pcs 1300 kecil kotak terbaik banyak naik
btl148 botol ps kotak 80ml perkakas pcs 750 kecil kotak terbaik banyak naik
btl149 botol pump 250ml perkakas pcs 3200 besar bulat terbaik banyak naik
btl150 botol pump 320ml perkakas pcs 3500 besar bulat terbaik banyak naik
btl151 botol pump 500ml perkakas pcs 3900 besar bulat terbaik banyak naik
btl152 botol pump kotak 1000ml perkakas pcs 5000 besar kotak terbaik banyak turun
btl153 botol pump kotak 250ml perkakas pcs 3200 besar kotak terbaik banyak turun
btl154 botol pump kotak 330ml perkakas pcs 3700 besar kotak baik banyak turun
btl155 botol pump kotak 500ml perkakas pcs 4200 besar kotak terbaik banyak turun
btl156 botol pump kotak 750ml perkakas pcs 4600 besar kotak terbaik banyak turun
btl157 botol sabun 250ml perkakas pcs 950 besar bulat terbaik banyak naik
btl158 botol sabun 330ml perkakas pcs 1100 besar bulat terbaik banyak naik
btl159 botol sabun 450ml perkakas pcs 1200 besar bulat terbaik banyak naik
btl160 botol sabun 600ml perkakas pcs 1400 besar bulat terbaik banyak naik
btl161 botol sabun 700ml perkakas pcs 1500 besar bulat terbaik banyak naik
btl162 botol sase 1000ml perkakas pcs 2900 besar bulat terbaik banyak naik
btl163 botol sase 250ml perkakas pcs 1600 besar bulat terbaik banyak naik
60
Tabel 4.7 Data Jenis Botol Keseluruhan (Lanjutan)
id
ba
ran
g
nama barang Ka
tego
ri
satu
an
Ha
rga
Uk
ura
n
ben
tuk
ku
ali
tas
ba
ha
n
wa
rna
min
at
btl164 botol sase 350ml perkakas pcs 1900 besar bulat terbaik banyak naik
btl165 botol sase 500ml perkakas pcs 2400 besar bulat terbaik banyak naik
btl166 botol sase kotak 1000ml perkakas pcs 3200 besar kotak baik banyak turun
btl167 botol sase kotak 250ml perkakas pcs 1600 besar kotak terbaik banyak turun
btl168 botol sase kotak 350ml perkakas pcs 1900 besar kotak baik banyak turun
btl169 botol sase kotak 500ml perkakas Pcs 2500 besar kotak baik banyak turun
btl170 botol sase kotak 750ml perkakas Pcs 2900 besar kotak terbaik banyak turun
btl171 botol sehat 1000ml perkakas Pcs 1450 besar bulat terbaik banyak naik
btl172 botol sehat 330ml perkakas Pcs 850 besar bulat terbaik banyak naik
btl173 botol sehat 500ml perkakas Pcs 950 besar bulat terbaik banyak naik
btl174 botol sehat 600ml perkakas Pcs 1200 besar bulat terbaik banyak naik
btl175 botol sehat 750ml perkakas Pcs 1300 besar bulat terbaik banyak naik
btl176 botol slim kotak 100ml perkakas Pcs 1600 kecil kotak baik banyak turun
btl177 botol slim kotak 150ml perkakas Pcs 2000 kecil kotak baik banyak turun
btl178 botol slim kotak 200ml perkakas Pcs 2500 kecil kotak baik banyak turun
btl179 botol spray 20ml perkakas Pcs 1700 kecil bulat baik banyak naik
btl180 botol spray 250ml perkakas Pcs 2500 besar bulat baik sedikit naik
btl181 botol spray 30ml perkakas Pcs 1700 kecil bulat baik banyak naik
btl182 botol spray 350ml perkakas Pcs 2900 besar bulat baik sedikit naik
btl183 botol spray 500ml perkakas Pcs 3200 besar bulat baik sedikit naik
btl184 botol spray 60ml perkakas Pcs 1800 kecil bulat baik banyak naik
btl185 botol spray kotak 100ml perkakas Pcs 1200 kecil kotak baik sedikit turun
btl186 botol spray kotak 30ml perkakas Pcs 850 kecil kotak baik sedikit turun
btl187 botol spray kotak 60ml perkakas Pcs 1000 kecil kotak baik sedikit turun
btl188 botol spray trigger 250ml perkakas Pcs 4200 besar bulat baik banyak naik
btl189 botol tablet 100ml perkakas Pcs 1600 kecil kotak baik sedikit naik
btl190 botol tablet 130ml perkakas Pcs 1800 kecil kotak baik banyak naik
btl191 botol tablet 150ml perkakas Pcs 2000 kecil kotak baik sedikit naik
btl192 botol tablet 200ml perkakas Pcs 2300 kecil kotak baik sedikit naik
btl193 botol takar kotak 100ml perkakas Pcs 1650 kecil kotak baik banyak turun
btl194 botol takar kotak 150ml perkakas Pcs 1900 kecil kotak baik banyak turun
btl195 botol takar kotak 200ml perkakas Pcs 2200 kecil kotak baik banyak turun
btl196 botol tetes 10ml perkakas Pcs 900 kecil bulat baik sedikit naik
btl197 botol tetes 15ml perkakas Pcs 1000 kecil bulat baik sedikit naik
btl198 botol tetes 20ml perkakas Pcs 1100 kecil bulat baik sedikit naik
61
Tabel 4.8 Data Jenis Botol Keseluruhan (Lanjutan)
id
ba
ran
g
nama barang Ka
tego
ri
satu
an
Ha
rga
Uk
ura
n
ben
tuk
ku
ali
tas
ba
ha
n
wa
rna
min
at
btl199 botol tetes 30ml perkakas Pcs 1200 kecil bulat baik sedikit naik
btl200 botol wafe kotak 100ml perkakas Pcs 1000 kecil kotak baik sedikit turun
btl201 botol wafe kotak 150ml perkakas Pcs 1200 kecil kotak baik sedikit turun
btl202 botol wafe kotak 200ml perkakas Pcs 1400 kecil kotak baik sedikit turun
btl203 botol wafe kotak 230ml perkakas Pcs 1450 kecil kotak baik sedikit turun
btl204 botol yardley kotak 1000ml perkakas Pcs 1400 besar kotak terbaik banyak turun
btl205 botol yardley kotak 250ml perkakas Pcs 600 besar kotak baik banyak turun
btl206 botol yardley kotak 330ml perkakas Pcs 700 besar kotak terbaik banyak turun
btl207 botol yardley kotak 400ml perkakas Pcs 800 besar kotak terbaik banyak turun
btl208 botol yardley kotak 500ml perkakas Pcs 950 besar kotak terbaik banyak turun
btl209 botol yardley kotak 600ml perkakas Pcs 1100 besar kotak terbaik banyak turun
btl210 botol yardley kotak 750ml perkakas Pcs 1250 besar kotak terbaik banyak turun
Data diatas adalah data keseluruhan, untuk melakukan pengolahan data di
RapidMiner data yang digunakan adalah Data Training dari seluruh populasi, data di
ambil 80% dari data seluruh populasi untuk di jadikan Data Training yang akan dipakai
untuk membuat model atau rule, dan 20% sebagai Data Testing yang dipakai untuk
sample testing.
Tabel 4.9 Data Training (80% dari Data Keseluruhan)
harga ukuran Bentuk kualitas bahan warna minat
2700 kecil Kotak Baik sedikit naik
2400 kecil Kotak Baik banyak naik
2100 kecil Kotak Baik sedikit naik
1000 besar Bulat Terbaik banyak naik
1100 besar Bulat Terbaik banyak naik
1100 besar Bulat Terbaik banyak naik
1200 besar Bulat Terbaik banyak naik
2900 besar Bulat Baik banyak naik
62
Tabel 4.10 Data Training (80% dari Data Keseluruhan)
harga ukuran Bentuk kualitas bahan warna minat
1900 besar Bulat Baik banyak naik
2400 besar Bulat Baik banyak Naik
2500 besar Bulat Baik banyak Naik
750 kecil Kotak Terbaik banyak Turun
1700 besar Bulat Terbaik banyak Naik
1850 besar Bulat Terbaik banyak Naik
2100 besar Bulat Terbaik banyak Naik
1900 kecil Kotak Terbaik sedikit Naik
2150 kecil Kotak Terbaik sedikit Naik
2400 kecil Kotak Terbaik sedikit Naik
2650 kecil Kotak Terbaik sedikit Naik
3400 besar Bulat Baik banyak Naik
1550 besar Bulat Baik banyak Naik
1650 besar Bulat Baik banyak Naik
2500 besar Bulat Baik banyak Naik
3000 besar Bulat Baik banyak Naik
1900 kecil Bulat Terbaik sedikit Naik
1600 kecil Bulat Terbaik sedikit Naik
1600 kecil Bulat Terbaik sedikit Naik
1700 kecil Bulat Terbaik sedikit Naik
1900 kecil Bulat Terbaik sedikit Naik
1600 kecil Bulat Terbaik sedikit Naik
1600 kecil Bulat Terbaik sedikit Naik
1700 kecil Bulat Terbaik sedikit Naik
1600 kecil Kotak Baik banyak Naik
1900 kecil Kotak Baik sedikit Naik
1900 kecil Kotak Baik banyak Turun
2400 kecil Kotak Baik banyak Turun
3400 besar Bulat Baik banyak Naik
1550 besar Bulat Baik banyak Naik
1700 besar Bulat Baik banyak Naik
2400 besar Bulat Baik banyak Naik
1600 besar Kotak Terbaik banyak Turun
1900 besar Kotak Terbaik banyak Turun
2500 besar Kotak Baik banyak Turun
1900 kecil Bulat Terbaik sedikit Naik
63
Tabel 4.11 Data Training (80% dari Data Keseluruhan)
harga ukuran Bentuk kualitas bahan warna minat
2000 kecil Kotak Baik banyak Turun
2100 kecil Bulat Terbaik sedikit Naik
2450 kecil Kotak Baik banyak Turun
2300 kecil Bulat Terbaik sedikit Naik
1900 kecil Kotak Terbaik sedikit Naik
2100 kecil Kotak Terbaik sedikit Naik
2300 kecil Kotak Terbaik sedikit Naik
600 besar Kotak Terbaik banyak Turun
700 besar Kotak Terbaik banyak Turun
800 besar Kotak Terbaik banyak Turun
1700 besar Bulat Baik banyak naik
2500 besar Bulat Baik banyak naik
2600 besar Bulat Baik banyak naik
3000 besar Bulat Baik banyak naik
3200 besar Kotak Terbaik banyak turun
1600 besar Kotak Terbaik banyak turun
2500 besar Kotak Terbaik banyak turun
1500 kecil Kotak Terbaik sedikit naik
1700 kecil Kotak Terbaik sedikit naik
1900 kecil Kotak Terbaik sedikit naik
850 kecil Kotak Terbaik banyak naik
950 kecil Kotak Terbaik banyak naik
1100 kecil Kotak Terbaik banyak naik
1300 kecil Kotak Terbaik banyak naik
750 kecil Kotak Terbaik banyak naik
3200 besar Bulat Terbaik banyak naik
3500 besar Bulat Terbaik banyak naik
3900 besar Bulat Terbaik banyak naik
5000 besar Kotak Terbaik banyak turun
3200 besar Kotak Terbaik banyak turun
3700 besar Kotak Baik banyak turun
4200 besar Kotak Terbaik banyak turun
4600 besar Kotak Terbaik banyak turun
950 besar Bulat Terbaik banyak naik
1100 besar Bulat Terbaik banyak naik
1200 besar Bulat Terbaik banyak naik
64
Tabel 4.12 Data Training (80% dari Data Keseluruhan)
harga ukuran Bentuk kualitas bahan warna minat
1400 besar Bulat Terbaik banyak naik
1500 besar Bulat Terbaik banyak naik
2900 besar Bulat Terbaik banyak naik
1600 besar Bulat Terbaik banyak naik
1900 besar Bulat Terbaik banyak naik
2400 besar Bulat Terbaik banyak naik
3200 besar Kotak Baik banyak turun
1600 besar Kotak Terbaik banyak turun
1900 besar Kotak Baik banyak turun
2500 besar Kotak Baik banyak turun
2900 besar Kotak Terbaik banyak turun
1450 besar Bulat Terbaik banyak naik
850 besar Bulat Terbaik banyak naik
950 besar Bulat Terbaik banyak naik
1200 besar Bulat Terbaik banyak naik
1300 besar Bulat Terbaik banyak naik
1600 kecil Kotak Baik banyak turun
2000 kecil Kotak Baik banyak turun
2500 kecil Kotak Baik banyak turun
1700 kecil Bulat Baik banyak naik
2500 besar Bulat Baik sedikit naik
1700 kecil Bulat Baik banyak naik
2900 besar Bulat Baik sedikit naik
3200 besar Bulat Baik sedikit naik
1800 kecil Bulat Baik banyak naik
1200 kecil Kotak Baik sedikit turun
850 kecil Kotak Baik sedikit turun
1000 kecil Kotak Baik sedikit turun
4200 besar Bulat Baik banyak naik
1600 kecil Kotak Baik sedikit naik
1800 kecil Kotak Baik banyak naik
2000 kecil Kotak Baik sedikit naik
2300 kecil Kotak Baik sedikit naik
1650 kecil Kotak Baik banyak turun
1900 kecil Kotak Baik banyak turun
2200 kecil Kotak Baik banyak turun
65
Tabel 4.13 Data Training (80% dari Data Keseluruhan)
harga ukuran Bentuk kualitas bahan warna minat
900 kecil Bulat Baik sedikit naik
1000 kecil Bulat Baik sedikit naik
1100 kecil Bulat Baik sedikit naik
1200 kecil Bulat Baik sedikit naik
1000 kecil Kotak Baik sedikit turun
1200 kecil Kotak Baik sedikit turun
1400 kecil Kotak Baik sedikit turun
1450 kecil Kotak Baik sedikit turun
1400 besar Kotak Terbaik banyak turun
600 besar Kotak Baik banyak turun
700 Besar Kotak Terbaik banyak turun
800 Besar Kotak Terbaik banyak turun
950 Besar Kotak Terbaik banyak turun
1100 Besar Kotak Terbaik banyak turun
1250 Besar Kotak Terbaik banyak turun
Data diatas adalah data training, data training adalah 80% dari data keseluruhan,
total populasi data training berjumlah 168 data. Data training dipilih secara acak dan
menghapus atribut id barang, nama barang, kategori, dan satuan karena atribut tersebut
tidak berpengaruh saat pengolahan data di RapidMiner. Atribut yang dipakai hanya harga,
ukuran, bentuk, kualitas bahan, warna dan minat (naik dan turun).
Tabel 4.14 Data Testing (20% dari data keseluruhan)
Harga ukuran Bentuk kualitas bahan warna Minat
1500 besar Bulat Baik banyak Naik
1900 besar Bulat Baik banyak Naik
2100 besar Bulat Baik banyak Naik
900 kecil Kotak terbaik banyak Turun
1100 kecil Kotak terbaik banyak Turun
650 kecil Kotak terbaik banyak Turun
66
Tabel 4.15 Data Testing (20% dari data keseluruhan)
Harga ukuran Bentuk kualitas bahan warna Minat
1900 kecil Kotak Baik banyak Naik
1400 besar Bulat terbaik banyak Naik
4200 besar Bulat Baik sedikit Naik
1600 kecil Kotak Baik banyak Turun
2500 besar Bulat Baik banyak Naik
3000 besar Bulat Baik banyak Naik
3200 besar Kotak terbaik banyak Turun
1600 besar Kotak terbaik banyak Turun
1900 besar Kotak terbaik banyak Turun
2500 besar Kotak Baik banyak Turun
3000 besar Bulat terbaik banyak Naik
1700 besar Bulat terbaik banyak Naik
2500 besar Bulat terbaik banyak Naik
1200 besar Bulat terbaik sedikit naik
1300 besar Bulat terbaik sedikit naik
1900 besar Bulat Baik sedikit naik
2200 besar Bulat Baik sedikit naik
1000 besar Bulat terbaik sedikit naik
1200 besar Bulat terbaik sedikit naik
1300 besar Bulat terbaik sedikit naik
1600 kecil Kotak Baik banyak turun
1900 kecil Kotak Baik banyak turun
1100 kecil Kotak terbaik banyak turun
1300 kecil Kotak terbaik banyak turun
650 kecil Kotak terbaik banyak turun
750 kecil Kotak terbaik banyak turun
1500 kecil Kotak baik banyak naik
900 kecil Kotak baik banyak naik
1000 kecil Kotak baik banyak naik
1100 kecil Kotak baik banyak Naik
2500 kecil Kotak terbaik sedikit Naik
2900 kecil Kotak terbaik banyak Turun
3000 kecil Kotak terbaik banyak Turun
2700 kecil Kotak terbaik sedikit Naik
3200 kecil Kotak terbaik banyak Turun
2900 kecil Kotak terbaik sedikit Naik
67
Data diatas adalah data testing, data testing adalah 20% dari data keseluruhan,
total populasi data testing berjumlah 42 data. Data testing dipilih secara acak, dan
menghapus atribut id barang, nama barang, kategori, dan satuan karena atribut tersebut
tidak berpengaruh saat pengolahan data di RapidMiner. Atribut yang dipakai hanya harga,
ukuran, bentuk, kualitas bahan, warna dan minat (naik dan turun).
4.1.2 Pemilihan Data
Gambar 4.1 Pemilihan Data
Sumber: Pengolahan Data
Langkah awal dalam mengelola data adalah memasukkan data yang ingin diolah
kedalam RapidMiner. Data yang akan dimasukkan yaitu data training atau data testing.
Pastikan sheet data yang ingin kita masukkan benar.
68
4.1.3 Pemilihan Atribut Sebagai Label
Gambar 4.2 Pemilihan Atribut Sebagai Label
Sumber: Pengolahan Data
Pada atribut minat pilih sebagai binominal dan label, sedangkan yang lain
disesuaikan setelah itu tekan finish.
4.1.4 Cross Validation
Gambar 4.3 Cross Validation
Sumber: Pengolahan Data
69
Cari operator cross validation pada kolom pencarian operator, selanjutnya double
click pada cross validation.
4.1.5 Main Proces Decision Tree
Gambar 4.4 Main Proces Decision Tree (Data Training)
Sumber: Pengolahan Data
Dalam proses ini dimasukan operator Decision Tree, Apply Model dan
Performance pada Main Proces, lalu hubungkan kabel-kabel tersebut. lalu klik tanda
panah yang mengarah keatas. Pastikan kabel-kabel tersebut terhubung secara benar,
sehingga tidak terjadi error.
70
4.1.6 Main Proces Validation
Gambar 4.5 Main Proces Validation
Sumber: Pengolahan Data
Setelah muncul Validation pada Main Proces geser Validation kekanan lalu
sambungkan kabel Input ke Read Excell satu kabel, Read Excell ke Validation satu kabel
dan Validation ke Res empat kabel. Lalu tekan Running atau Play (segitiga warna biru)
di atas.
71
4.2 Pembahasan
4.2.1 Decision Tree
Gambar 4.6 Decision Tree
Sumber: Pengolahan Data
Dari gambar diatas bisa diambil keputusan pengaruh terbesar penjualan yaitu dari
faktor bentuk barang itu sendiri. jika bentuk bulat maka penjualan naik, jika bentuk kotak
ukuran besar maka penjualan turun, jika bentuk kotak ukuran kecil warna banyak dan
harga lebih dari Rp1500 maka penjualan turun, jika bentuk kotak ukuran kecil warna
banyak dan harga dibawah atau sama dengan Rp1500 maka penjualan naik, jika bentuk
kotak ukuran kecil warna sedikit harga lebih dari Rp1475 maka penjualan akan naik, dan
72
jika bentuk kotak ukuran kecil warna sedikit harga dibawah atau sama dengan Rp1475
maka penjualan akan turun.
4.2.2 Confusion Matrix
4.2.2.1 Accuracy (Data Training)
Gambar 4.7 Accuracy Data Training
Sumber: Pengolahan Data
Hasil pengukuran akurasi data yang diperoleh dari data training nilainya
mencapai 90.59%. Dari tabel tersebut diketahui prediksi naik dengan true naik mencapai
107 barang dan true turun sebanyak 13 barang, dengan hasil pencapaian nilai presisi
sebesar 89.17%. Sedangkan untuk prediksi penjualan barang turun untuk true naik
mencapai 3 barang dan untuk true turun terdapat 45 barang dengan hasil pencapaian nilai
presisi sebesar 93.75%. Untuk recall data barang yang sangat tinggi terdapat pada class
recall tue naik mencapai 97.27% sedangkan untuk class recall true turun mencapai
77.59%.
73
4.2.2.2 Recall Data (Data Training)
Gambar 4.8 Recall Data (Data Training)
Sumber: Pengolahan Data
Hasil pengukuran recall data yang diperoleh dari data training nilainya mencapai
78.33%. Dari tabel tersebut diketahui prediksi naik dengan true naik mencapai 107 barang
dan true turun sebanyak 13 barang, dengan hasil pencapaian nilai presisi sebesar 89.17%.
Sedangkan untuk prediksi penjualan barang turun untuk true naik mencapai 3 barang dan
untuk true turun terdapat 45 barang dengan hasil pencapaian nilai presisi sebesar 93.75%.
Untuk recall data barang yang sangat tinggi terdapat pada class recall tue naik mencapai
97.27% sedangkan untuk class recall true turun mencapai 77.59%.
74
4.2.2.3 Accuracy (Data Testing)
Gambar 4.9 Accuracy (Data Training)
Sumber: Pengolahan Data
Hasil pengukuran akurasi data yang diperoleh dari data testing nilainya mencapai
88.00%. Dari tabel tersebut diketahui prediksi naik dengan true naik mencapai 23 barang
dan true turun sebanyak 3 barang, dengan hasil pencapaian nilai presisi sebesar 88.46%.
Sedangkan untuk prediksi penjualan barang turun untuk true naik mencapai 2 barang dan
untuk true turun terdapat 14 barang dengan hasil pencapaian nilai presisi sebesar 87.50%.
Untuk recall data barang yang sangat tinggi terdapat pada class recall tue naik mencapai
92.00% sedangkan untuk class recall true turun mencapai 82.35%.
75
4.2.2.3 Recall Data (Data Testing)
Gambar 4.10 Recall Data (Data Testing)
Sumber: Pengolahan Data
Hasil pengukuran recall data yang diperoleh dari data training nilainya mencapai
86.67%. Dari tabel tersebut diketahui prediksi naik dengan true naik mencapai 23 barang
dan true turun sebanyak 3 barang, dengan hasil pencapaian nilai presisi sebesar 88.46%.
Sedangkan untuk prediksi penjualan barang turun untuk true naik mencapai 2 barang dan
untuk true turun terdapat 14 barang dengan hasil pencapaian nilai presisi sebesar 87.50%.
Untuk recall data barang yang sangat tinggi terdapat pada class recall tue naik mencapai
92.00% sedangkan untuk class recall true turun mencapai 82.35%.
4.2.3 ROC/AUC (Area Under Cover)
Performance keakurasian AUC (Gorunescu, 2010) dapat diklasifikasikan menjadi
lima kelompok yaitu:
a. 0.90 – 1.00 = Excellent Classification.
76
b. 0.80 – 0.90 = Good Classification.
c. 0.70 – 0.80 = Fair Classification.
d. 0.60 – 0.70 = Poor Classification.
e. 0.50 – 0.60 = Failure.
4.2.3.1 ROC/AUC Data Training
Gambar 4.11 ROC/AUC Data Training
Sumber: Pengolahan Data
Hasil yang didapat dari pengolahan ROC metode Algoritma C4.5 sebesar 0.998
menggunakan data training dapat dilihat gambar diatas dengan tingkat akurasi Excellent
Classification.
77
4.2.3.2 ROC/AUC Data Testing
Gambar 4.12 ROC/AUC Data Testing
Sumber: Pengolahan Data
Sedangkan dari pengolahan ROC menggunakan data testing sebesar 1.000 dapat
dilihat digambar diatas dengan tingkat akurasi Excellent Classification.
78
BAB V
KESIMPULAN DAN SARAN
5.1 Kesimpulan
Berdasarkan hasil eveluasi dan validasi hasil serta uji coba pada penelitian
data mining prediksi penjualan botol menggunakan algoritma C4.5, peneliti dapat
menyimpulkan bahwa dengan menggunakan algoritma C4.5 maka penjualan botol
dapat diprediksi dengan akurasi yang cukup tinggi, hasil pengukuran akurasi data
yang diperoleh dari data training dengan Confusion Matrix nilainya mencapai
90.59% dan data testing tingkat akurasinya mencapai 88.00%. Jika dilihat dengan
kurva ROC, data training memiliki akurasi Exellent Clasification sebesar 0.998 dan
data testing dengan akurasi Exellent Clasification sebesar 1.000.
5.2 Saran
Dari hasil pengujian yang telah dilakukan dan hasil kesimpulan, maka saran
yang dapat diberikan penulis untuk pengembangan pada penelitian selanjutnya
adalah:
1. Memaksimalkan atau menambah atribut yang lebih spesifik dan lebih
banyak dalam menentukan prediksi penjualan botol seperti ketebalan botol,
panjang botol dan lain sebagainya oleh pihak perusahaan agar prediksi
kompetensi semakin akurat.
79
2. Perlu adanya penelitian lebih lanjut dengan melakukan pengujian dengan
metode lain maupun komparasi seperti Naive Bayes, Neural Network dan
lain sebagainya agar memperoleh perbandingan dengan tingkat akurasi
yang paling tinggi dalam membuat kualifikasi prediksi penjualan botol.
3. Dalam penelitian selanjutnya diharapkan penelitian ini dapat dikembangkan
dalam bentuk aplikasi.
72
DAFTAR PUSTAKA
Harahap, Fitriana. 2015. Penerapan Data Mining Dalam Memprediksi Pembelian
Cat. Medan: STMIK Potensi Utama.
Santoso, Teguh Budi. 2013. Analisa Dan Penerapan Metode C4.5 Untuk Prediksi
Loyalitas Pelanggan. Jakarta: Universitas Satya Negara Indonesia.
Fajrin, Alfannisa Annurullah dan Algifanri Maulana. 2018. Penerapan Data
Mining Untuk Analisa Pola Pembelian Konsumen Dengan Algoritma FP
Growth Pada Data Transaksi Penjualan Spare Part Motor. Batam:
Universitas Putera Batam.
Azwanti, Nurul. 2018. Analisa Algoritma C4.5 Untuk Memprediksi Penjualan
Motor Pada PT.Capella Dinamik Nusantara Cabang Muka Kuning. Batam:
Universitas Putera Batam.
Vathsala, H dan Shashidhar G Koolagudi. 2015. Close Item-Set Mining For
Prediction Of India Summer Monsoon Rainfall A Data Mining Model With
Land and Ocean Variables As Predictors. India: National Institute Of
Technologi.
Eska, Juna. 2016. Penerapan Data Mining Untuk Prediksi Penjualan Wallpaper
73
menggunakan Algoritma C4.5. Medan: STMIK Royal Kisaran.
Rani, Larissa Navia. 2015. Klasifikasi Nasaah Menggunakan Algoritma C4.5
Sebagai Dasar Pemberian Kredit. Padang: Universitas Putera Indonesia
YPTK.
Sunge, Aswan Supriyadi. 2018. Prediksi Kompetensi Karyawan Menggunakan
Algoritma C4.5 (Studi Kasus: PT. Hankook Tire Indonesia). Bekasi: STT
Pelita Bangsa.
Purnamasari, Detty, Jonathan Henharta, Yoga Perdana Sasmita, Fuji Ihsani dan I
Wayan Simri Wicaksana. 2013. Get Easy Using Weka. Makasar: Dapur
Buku.
DAFTAR RIWAYAT HIDUP
DATA PRIBADI :
Nama : Tri Bagus Tusarwenda
Usia : 24 Tahun
Tempat/Tgl lahir : Indramayu, 23 Agustus 1994
Jenis Kelamin : Laki-Laki
Agama : Islam
Status Pernikahan : Belum Menikah
Alamat sekarang : Jl. Makrik Rt 001/004 No 15 Kel. Bojong rawalumbu
Kec. Rawalumbu Bekasi 17116
No. Telpon : 0896 3747 7100
E-mail : [email protected]
PENDIDIKAN FORMAL :
1. Tamatan SDN Pengasinan II Bekasi Tahun 2001-2007 LULUS
2. Tamatan SMP Widya Nusantara Bekasi Tahun 2007-2010 LULUS
3. Tamatan SMK Binakarya Mandiri Bekasi Tahun 2010-2013 LULUS
4. Sekolah Tinggi Teknologi Pelita Bangsa Tahun 2014- Sekarang
Hormat Saya,
(Tri Bagus Tusarwenda )