data mining ms. excel
DESCRIPTION
Pengaplikasian data mining dengan menggunakan microsoft excelTRANSCRIPT
-
1
Tugas 4 Kelas: C
Mata Kuliah:
Pengelolaan Hubungan Pelanggan (CRM)
Semester Ganjil 2012/2013
Management
Dikumpulkan Senin Tanggal 23 Desember 2013, Jam 09.30 (Softcopy)
Senin Tanggal 30 Desember 2013, Jam 09.30 (Hardcopy)
Nama NRP
Ali Mangsur 5212100023
Ayu Siti Munawaroh 5212100039
Astried Nadia Mayasari 5212100073
JURUSAN SISTEM INFORMASI
FAKULTAS TEKNOLOGI INFORMASI
INSTITUT TEKNOLOGI SEPULUH NOPEMBER
2013
Nama Tugas
DATA MINING
Komentar:
-
2
DAFTAR ISI
DAFTAR ISI ................................................................................................................Error! Bookmark not defined.
DAFTAR TABEL .............................................................................................................................................. 3
DAFTAR GAMBAR .......................................................................................................................................... 3
BAB 1: PENDAHULUAN ........................................................................................................................................... 7
Latar Belakang .................................................................................................................................................... 7
Tujuan ................................................................................................................................................................. 7
Batasan Masalah ................................................................................................................................................. 7
BAB 2: KAJIAN TEORI .............................................................................................................................................. 8
Data Mining ........................................................................................................................................................ 8
Classification Tree .......................................................................................................................................... 9
Implementasi ke CRM ....................................................................................................................................... 11
Penerapan Pada Excel ....................................................................................................................................... 11
BAB 3 : Implementasi data mining dalam microsoft excel ................................................................................... 12
Classification ..................................................................................................................................................... 12
Estimation ......................................................................................................................................................... 22
Prediction ......................................................................................................................................................... 25
Affinity Grouping .............................................................................................................................................. 32
Clustering .......................................................................................................................................................... 36
Description And Profiling .................................................................................................................................. 39
BAB 4: ANALISIS DAN PEMBAHASAN .................................................................................................................... 43
Classification .................................................................................................................................................... 43
estimation ......................................................................................................................................................... 45
prediction .......................................................................................................................................................... 46
Affinity group ................................................................................................................................................... 48
Clustering .......................................................................................................................................................... 50
Description and Profilling ................................................................................................................................. 53
BAB 5: PENUTUP ................................................................................................................................................... 57
Simpulan ........................................................................................................................................................... 57
-
3
DAFTAR PUSTAKA ................................................................................................................................................. 57
LAMPIRAN............................................................................................................................................................. 57
DAFTAR TABEL
Table 1 ..................................................................................................................................... 48
Table 2 ..................................................................................................................................... 50
Table 3 ..................................................................................................................................... 51
Table 4 ..................................................................................................................................... 51
Table 5 ..................................................................................................................................... 52
Table 6 ..................................................................................................................................... 52
Table 7 ..................................................................................................................................... 52
Table 8 ..................................................................................................................................... 53
Table 9 ..................................................................................................................................... 53
Table 10 ................................................................................................................................... 54
Table 11 ................................................................................................................................... 55
DAFTAR GAMBAR
Figure 1 . Menu Data Mining .................................................................................................. 12
Figure 2.Classify Data Mining ................................................................................................. 12
Figure 3. Start Data Mining ..................................................................................................... 13
Figure 4. Select Source Data .................................................................................................... 13
Figure 5. Classification ............................................................................................................ 14
Figure 6 . Split data .................................................................................................................. 14
Figure 7. Finish Classify .......................................................................................................... 15
Figure 8.Process ....................................................................................................................... 15
Figure 9 . Decision Tree........................................................................................................... 15
-
4
Figure 10.Mining Legend ........................................................................................................ 16
Figure 11.Decision Tree........................................................................................................... 16
Figure 12.Mining Legend ........................................................................................................ 16
Figure 13.Dependency Network .............................................................................................. 17
Figure 14.Classification ........................................................................................................... 17
Figure 15.Decision Tree........................................................................................................... 18
Figure 16.Mining Legend ........................................................................................................ 18
Figure 17.Decision Tree........................................................................................................... 19
Figure 18.Mining Legend ........................................................................................................ 19
Figure 19.Dependency Network .............................................................................................. 19
Figure 20.Classification ........................................................................................................... 20
Figure 21.Decision Tree........................................................................................................... 20
Figure 22.Mining Legend ........................................................................................................ 21
Figure 23.Decision Tree........................................................................................................... 21
Figure 24.Mining Legend ........................................................................................................ 21
Figure 25.Dependency Network .............................................................................................. 22
Figure 26.Menu Estimate ......................................................................................................... 22
Figure 27.Estimate Wizard ...................................................................................................... 23
Figure 28.Select source code ................................................................................................... 23
Figure 29.Estimation ................................................................................................................ 24
Figure 30.Finish estimate ......................................................................................................... 24
Figure 31.process ..................................................................................................................... 24
Figure 32.Decision Tree........................................................................................................... 25
Figure 33.Dependency Network .............................................................................................. 25
Figure 34.Menu Forecast ......................................................................................................... 26
Figure 35.Forecast Wizard ....................................................................................................... 26
Figure 36.Source Data ............................................................................................................. 27
-
5
Figure 37.Forecasting .............................................................................................................. 27
Figure 38.Finish Forecasting ................................................................................................... 28
Figure 39.Process Forecasting ................................................................................................. 28
Figure 40.Charts ....................................................................................................................... 29
Figure 41.Charts-2 ................................................................................................................... 29
Figure 42.Charts-3 ................................................................................................................... 30
Figure 43.Decision Tree........................................................................................................... 30
Figure 44.Decision Tree........................................................................................................... 30
Figure 45.Forecasting .............................................................................................................. 31
Figure 46.Charts ....................................................................................................................... 31
Figure 47.Model ....................................................................................................................... 32
Figure 48.Model ....................................................................................................................... 32
Figure 49.Data.......................................................................................................................... 33
Figure 50.Source Data ............................................................................................................. 33
Figure 51.Association .............................................................................................................. 34
Figure 52.Finish ....................................................................................................................... 34
Figure 53.Ruler ........................................................................................................................ 35
Figure 54.Associate Product .................................................................................................... 35
Figure 55.Data.......................................................................................................................... 36
Figure 56.Menu Cluster ........................................................................................................... 36
Figure 57.Source Data ............................................................................................................. 37
Figure 58.Cluster Diagram....................................................................................................... 38
Figure 59.Cluster Profile .......................................................................................................... 38
Figure 60 .................................................................................................................................. 39
Figure 61 .................................................................................................................................. 39
Figure 62 .................................................................................................................................. 41
Figure 63 .................................................................................................................................. 41
-
6
Figure 64 .................................................................................................................................. 42
Figure 65 .................................................................................................................................. 43
Figure 66 .................................................................................................................................. 43
Figure 67 .................................................................................................................................. 44
Figure 68 .................................................................................................................................. 44
Figure 69 .................................................................................................................................. 45
Figure 70 .................................................................................................................................. 45
Figure 71 .................................................................................................................................. 46
Figure 72 .................................................................................................................................. 46
Figure 73 .................................................................................................................................. 47
Figure 74 .................................................................................................................................. 47
Figure 75 .................................................................................................................................. 48
Figure 76 .................................................................................................................................. 50
Figure 77 .................................................................................................................................. 54
Figure 78 .................................................................................................................................. 55
-
7
BAB 1: PENDAHULUAN
LATAR BELAKANG
Pada suatu bisnis di perusahaan , mengelola hubungan dengan pelanggan yang sudah
lama lebih mudah dan menjadi hal yang lebih menguntungkan dibanding mendapatkan
pelanggan baru dan mendapatkan keuntungan dari pelanggan baru pasti lebih sulit, sehingga
dengan adanya hal tersebut Pengelolaan Hubungan Pelanggan (PHP) adalah ilmu yang
berguna dan dapat digunakan untuk mengelola hubungan pelanggan tersebut. Dengan ilmu
ini diharapkan profit yang didapatkan lebih maksimal dengan dana yang dikeluarkan oleh
perusahaan dapat di minimalisir
Pengelolaan Hubungan Pelanggan atau Customer Relationship Management (CRM)
terdiri dari beberapa dimensi, salah satunya adalah Analytical CRM. Analytical CRM
membahas analisis apa yang perusahaan lakukan sebelum mengeksekusi program CRM.
Analisis itu didapatkan dari data-data dalam jumlah besar yang telah dimiliki perusahaan
sebelumnya
Dalam mengelola data-data yang jumlahnya besar tersebut, dapat digunakan banyak
teknik yang digunakan untuk mempermudah pengelolaan data-data tersebut. Teknik-teknik
tersebut termasuk dalam ranah Data Mining, atau penggalian data untuk mendapatkan sebuah
informasi yang bermanfaat. Beberapa teknik dalam Data Mining yaitu Classification,
Estimation, Prediction , Affiling Grouping , Clustering , dan Description and Profilling. Pada
laporan ini kita akan memanfaatkan ke-6 teknik tersebut pada contoh data yang telah
diberikan , untuk memahami lebih dalam mengenai teknik-teknik tersebut dan bisa
menerapkan semua teknik dan diharapkan dapat memberikan manfaat bagi kami kedepannya
TUJUAN
Dapat menggunakan fitur-fitur atau tools yang ada pada Add-in Data Mining Microsoft Excel
Dapat mengimplementasikan berbagai macam tools tersebut dengan sample atau contoh data yang diberikan , sehingga dapat memahami maksud dari penggunaan
tools tersebut
Dapat memanfaatkan secara maksimal penggunaan tools Data Mining dalam pengelolaan data sehingga lebih cepat dalam mengelola suatu data
Memudahkan dalam menganalisis suatu data dengan berbagai macam tools
BATASAN MASALAH
Bagaimana memanfaatkan tools-tools yang ada pada Data Mining secara benar , efektif , dan efisien ?
Bagaimana memililh dan memanfaatkan data yang ada untuk keperluan Data Mining?
Bagaimana cara menerapakan tools tersebut untuk melakukan Data Mining pada sample data?
Bagaimana mempermudah proses analisis data dengan menggunakan tools yang ada pada Data Mining?
-
8
BAB 2: KAJIAN TEORI
DATA MINING
Dalam membuat sebuah keputusan bisnis, dibutuhkan sejumlah pengetahuan kondisi
pasar sehingga keputusan bisnis tersebut dapat menghasilkan perkembangan yang bermanfaat
dan menguntungkan bagi perusahaan. Pengetahuan ini dapat diperoleh dengan cara
melakukan analisis terhadap data data yang telah ada.
Pada awalnya data mining hadir dengan dilatarbelakangi dengan masalah
pembengkakan data yang dialami oleh organisasi. Dengan adanya data yang terus menerus
bertambah setiap harinya, lama kelamaan data tersebut akan menjadi bertumpuk dan tidak
menghasilkan sesuatu yang berguna. Oleh karena itu muncullah pemikiran agar data tersebut
berguna. Yaitu menambang emas(informasi) dengan sejumlah data yang banyak tersebut.
Menurut Han dan Kamber (Kember and Han, 2006), data mining dapat didefinisikan
sebagai proses mengekstrak atau menambang prngrtahuan yang dibutuhkan dari sejumlah
besar data. Pada prosesnya data mining akan mengekstrak informasi yang berharga dengan
cara menganalisis adanya pola pola ataupun hubungan keterkaitan tertentu dari data data yang ada.
Proses penemuan pengetahuan meliputi 7 langkah (Kember and Han, 2006) diantaranya
adalah :
1. Data cleaning (menghilangkan noise dan data yang tidak konsisten) 2. Data integration (menggabungkan data dari berbagai sumber data) 3. Data Selection (memilih data yang relevan dengan analiis) 4. Data Transformation (transformasi atau konsolidasi data ke dalam bentuk yang tepat
untuk mining)
5. Data mining (mengidentifikasi polamenarik dan merepresentasikan basis pengetahuan) 6. Patern evaluation (mengidentifikasi pola menarik dan merepresentasikan basis
pengetahuan)
7. Knowledge presentation (penggunaan teknik representasi visual untuk menyajikan yang telah diperoleh kepada user).
Langkah 1 sampai 4 merupakan bentuk dari data processing. Data processing ini
dibutuhkan untuk menghilangkan data yang tidak konsisten, memiliki noise, atau terdapat
bagian yang hilang. Melalui data processing kemudian data bisa melalui tahap data mining.
Pada dasarnya datamining digunakan untuk menyelesaikan tugas yang bersifat prediktif
dan deskriptif. Prediktif, sejumlah variabel akan digunakan untuk memprediksi nilai yang
belum diketahui dari variabel lainya sedangkan descriptif akan dilakukan
penginterpresentasian pola untuk mendeskripsikan data tersebut. Dari kedua jenis diatas
kemudian dibagi lagi menjadi beberapa jenis tugas, diantaranya adalah klasifikasi, estimasi,
prediksi, affinity grouping, clustering, dan description and profilling.
Dalam konteks CRM, data mining adalah Aplikasi dari analisis desktriptif dan
prediktif untuk membantu membantu proses pemasaran, penjualan, dan fungsi-fungsi
perusahaan. Meskipun data mining dapat dilaksanakan dalam database operasional, biasanya
-
9
data mining dipakai dalam data warehouse dimana dalam data warehouse, database-nya
cenderung lebih stabil.
Data mining berguna dalam menjawab permasalahan seputar Strategic CRM dan
Operational CRM. Seperti cara untuk membagi-bagi pelanggan, menentukan pelanggan yang
paling berharga, produk apa yang paling disukai pelanggan, berapa harga yang diminati
pelanggan, taktik penjualan apa yang berhasil diimplementasikan, dan lain-lain.
Tujuan dari data mining adalah untuk menemukan sebuah pola atau hubungan yang
didapatkan dari data perusahaan/data warehouse dalam jumlah besar. Dari Data Mining bisa
didapatkan demographic mengenai profil pelanggan, produk, atau jasa tertentu.
Dalam melakukan data mining dan mengelola data yang begitu besar tersebut
diperlukan alat bantu berupa Software, contohnya : SPSS, Weka, Matlab dan lain-lain.
Francis Buttle hal 114
CLASSIFICATION TREE
Ada banyak teknik-teknik yang digunakan dalam data mining, diantaranya adalah
Classification Tree.
Francis Buttle hal 169.
Classification Tree merupakan nama yang lebih spesifik dari Decision Tree (Pohon
pengambilan keputusan), disebut decision tree karena secara grafis merepresentasikan
struktur yang bercabang. Decision tree bekerja dengan menganalisa kumpulan data untuk
mencari variabel independen yang ketika akan digunakan untuk membagi-bagi populasi. Dari
situ akan dihasilkan noktah-noktah yang berbeda antara satu dan yang lainnya. Noktah-
noktah tersebut berisi variabel yang ingin kita prediksikan.
-
10
Meskipun disebut Decision Tree, namun sebetulnya yang ditunjukan adalah data
mengenai variabel tertentu. Keputusan tetap berada ditangan perusahaan. Decision tree hanya
memembantu pengambilan perusahaan karena menunjukan data-data y ang ada. Pada
aplikasinya hasil dari decision tree, dan classification tree bisa digunakan untuk software lain.
Namun tetap saja pemegang keputusan tetaplah pengguna.
Contohnya dari data pelanggan dibawah ini akan diubah menjadi Decision Tree.
Data diatas merupakan data pelanggan suatu perusahaan, kita ingin prediksi profil pelanggan.
Dari sini didapatkan bahwa pelanggan yang menikah dan memiliki penghasilan tinggi
akan memiliki credit risk yang paling tinggi.
Keputusan apa yang akan diambil perusahaan setelah melihat representasi data ini?
Bisa jadi banyak hal. Namun seperti yang bisa kita lihat, decision tree dan classification tree
membantu pengguna dalam pengambilan keputusan.
-
11
IMPLEMENTASI KE CRM
Di dalam CRM biasanya fokus kepada tiga area yaitu penjualan (sales), layanan
pelanggan (customer service), dan otomasi pemasaran (marketing automation). Penjualan
meliputi semua hal yang berhubungan dengan area penjualan, call center penjualan, dan e-
commerce. Layanan pelanggan meliputi seluruh area layanan termasuk layanan berbasis
Internet. Sedangkan pada area sales force automation(SFA) meliputi perangkat (tool) BI
(business intelligence), analisis data, dan aplikasi managemen lainnya.
Landasan untuk mencapai keberhasilan CRM adalah adanya informasi pelanggan dan
data transaksi pelanggan yang akurat. Untuk hasil yang maksimal diperlukan suatu analisis
data dari seluruh data transaksi yang ada. Seperti diketahui, basis data sendiri memiliki
volume yang sangat besar, yang kebanyakan berasal dari softwarebisnis seperti aplikasi.
Selain informasi pelanggan yang akurat, teknik pemasaran seperti cross-selling
mutlak diperlukan bagi perusahaan yang ingin berkompetisi di pasar. Cross-selling sudah
menjadi bagian yang tidak terpisahkan dari CRM, telah diakui sebagai teknik pemasaran
yang efektif dan telah terbukti meningkatkan revenue perusahaan seiring dengan
meningkatnya jumlah lines per orderdan meningkatnya customer loyalty and profitability
Data mining dalam CRM berperan sebagai membantu dalam pengambilan
keputusan(Decision Support System) suatu perusahaan. Penganalisa data agar menemukan
value lebih dari pelanggan, dan dapat menjadi bahan pertimbangan dalam pengambilan
langkah stratrgi perusahaan serta menjadi bahan evaluasi bagi perusahaan tersebut
(Tama, 2009)
PENERAPAN PADA EXCEL
Microsoft Excel merupakan aplikasi untuk mengolah data secara otomatis yang dapat
berupa perhitungan dasar, rumus, pemakaian fungsi-fungsi, pengolahan data dan tabel,
pembuatan grafik dan menajemen data.
Pemakaian rumus sendiri dapat berupa penambahan, pengurangan, perkalian dan lain
sebagainya. Sedangkan pemakaian fungsi-fungsi dapat berupa pemakaian rumus yang
bertujuan untuk menghitung dalam bentuk rumus matematika maupun non matematika.
Microsoft Excel dapat juga digunakan untuk menyelesaikan berbagai keperluan
administrasi, dari yang sederhana sampai dengan yang rumit. Pada pemakaian keperluan
yang sederhana tersebut misalkan untuk membuat perencanaan kebutuhan suatu perusahaan,
berupa perencanaan barang kebutuhan, jumlah maupun harganya.
(Excel, 2013)
Dengan bantuan SQL Server , microsoft excel dapat melakukan data mining yaitu dengan
penambahan Add in yang sesuai. Dengan adanya addin tersebut microsoft excel dapat
terkoneksi dengan data base di SQL Server dan menggunakan Service Analyze untuk process
Data Mining
-
12
BAB 3 : IMPLEMENTASI DATA MINING DALAM MICROSOFT EXCEL
CLASSIFICATION
Klasifikasi merupakan proses menemukan sebuah model atau fungsi yang
mendeskripsikan dan membedakan data ke dalam kelas-kelas atau konsep-konsep .
Klarifikasi melibatkan proses pemeriksaan karakteristik dan objek memasukkan objek ke
dalam salah satu kelas yang sudah didefinisikan sebelumnya , Klasifikasi dilakukan dengan
melakukan analisa pada data historikal yang tersimpan dalam database dan mengenerate
otomatis model yang dapat memprediksi perilaku di masa depan. Dengan melakuan
redefined class , model dapat memprediksi sebuah kelas atau membuat kelas pada rekord-
rekord data yang terklasifikasi . Klasifikasi terdiri dari memeriksa fitur dari objek yang baru
disajikan dan disisipkan ke salah satu set standar kelas. (Supervised Learning) , Contoh
proses klasifikasi yakni Mengklasifikasikan peminjam uang pada suatu bank apakah memiliki
resiko rendah, sedang atau tinggi
Pada Microsoft Excel kita dapat melakukan classification dengan memanfaatkan tools
pada data mining yang telah terinstall sebagai add in , yakni fungsi classify seperti gambar di
bawah ini :
Figure 1 . Menu Data Mining
Berikut langkah-langkah melakukan klasifikasi pada DMAddin_SampleData yang
diberikan untuk klasifikasi
1. Kami melakukan klasifikasi berdasarkan occupation , gender dan age a. Pertama-tama kita membuka sample data seperti gambar di bawah ini ,
kemudian , pilih classify pada menu data mining seperti tampak pada gambar :
Figure 2.Classify Data Mining
b. Setelah itu akan muncul kotak dialog seperti gambar di bawah ini untuk memulai menggunakan classify , kemudian pilih next untuk melanjutkan penggunaan classify :
-
13
Figure 3. Start Data Mining
c. Setelah itu kita diminta untuk memilih source data , seperti gambar di bawah ini , kemudian pilih next untuk melanjutkan ke langkah berikutnya :
Figure 4. Select Source Data
d. Setelah itu pilih akan melakukan klasifikasi terhadap data apa saja , di bawah ini kami memilih untuk melakukan klasifikasi terhadap occupation , age dan gender seperti
gambar di bawah ini , kemudian tekan next untuk melanjutkan pada tahap berikutnya :
-
14
Figure 5. Classification
e. Kemudian , muncul kotak dialog seperti gambar di bawah ini dan tekan next untuk melanjutkan ke tahap berikutnya
Figure 6 . Split data
f. Setelah itu , beri structure name , description , model name , model description , biasanya sudah otomatis terisi dan pilih option , sebaiknya memilih use temporary ,
setelah itu tekan finish
-
15
Figure 7. Finish Classify
g. Setelah menekan tombol finish , maka akan muncul classify untuk selanjutnya memunculkan hasil , seperti pada tahap ke-8
Figure 8.Process
h. Kemudian akan muncul hasil seperti gambar di bawah ini , pada gambar di bawah ini menunjukkan , pada tree Occupation , terbagi menjadi beberapa usia , background
yang dipilih merupakan All cases , sehingga keseluruhan occupation ditampilkan dan
digambarkan seperti gambar di bawah ini , untuk analisis mengenai gambar di bawah
ini akan dijelaskan pada Bab 4 . Analisa dan Pembahasan
Figure 9 . Decision Tree
-
16
Selain itu di bawah ini merupakan gambar hasil juga , yang terdapat pada sebelah
kanan gambar di atas, yang menunjukkan mining legend, dari total cases sebanyak
700 cases (merupakan jumlah keseluruhan occupation)
Figure 10.Mining Legend
i. Pada tahap ke-9 ini merupaka tahap dimana background kita ubah menjadi Clerical atau dalam Bahasa Indonesia berarti Pekerjaan Administrasi , dimana terlihat
bagaimana decision tree yang dihasilkan pada gambar di bawah ini , untuk lebih
jelasnya akan dijelaskan pada Bab 4. Analisa dan Pembahasan
Figure 11.Decision Tree
Pada gambar di bawah ini merupakan gambar di sebelah kanan gambar di atas ,
menunjukkan mining legend , dimana dikhususkan untuk background clerical
saja , dan terlihat total cases hanya sebanyak 116 cases
Figure 12.Mining Legend
-
17
j. Pada tahap ke-10 ini akan menunjukkan langkah dalam memunculkan dependency / ketergantungan antara 1 atribut dan atribut lainnya , seperti pada kasus 1 , sehingga
didapatkan gambar seperti di bawah ini
Figure 13.Dependency Network
2 Kami melakukan klasifikasi berdasarkan income , car , occupation a. Tahap yang dilakukan pada klasifikasi ke-2 ini sama halnya dengan klasifikasi
pada tahap di atas (pada bagian 1.a-1.g) hanya saja perbedaannya terletak pada
tahap d , yaitu pemilihan klasifikasi , seperti gambar di bawah ini :
Figure 14.Classification
b. Kemudian tahap berikutnya sama hingga tahap 1.g , kemudian akan memunculkan hasil seperti gambar di bawah ini , terlihat bahwa trees
merupakan income ,dan pada gambar di bawah ini merupakan all cases , sama
halnya dengan kasus di atas , apabila kita mengganti dengan cases tertentu
hasilnya juga akan berubah :
-
18
Figure 15.Decision Tree
Berikut merupakan mining legend yang dihasilkan , terlihat bahwa terdapat
700 cases, dan terlihat bagaimana probability dalam hitungan prosentase (%) ,
histogram
Figure 16.Mining Legend
c. Kemudian pada tahap 2.c ini memperlihatkan perbedaan apabila yang dipilih merupakan case tertentu atau bukan All cases pada background tampak
gambar di bawah ini ketika yang dipilih merupakan background dengan
value >=127371
-
19
Figure 17.Decision Tree
Berikut merupakan mining legend yang dihasilkan , terlihat bahwa terdapat
700 cases, dan terlihat bagaimana probability dalam hitungan prosentase (%) ,
histogram
Figure 18.Mining Legend
d. Pada tahap ke-4 ini akan menunjukkan langkah dalam memunculkan dependency network / ketergantungan antara 1 atribut dan atribut lainnya ,
seperti pada kasus 1 , sehingga didapatkan gambar seperti di bawah ini
Figure 19.Dependency Network
-
20
3 Kami melakukan klasifikasi berdasarkan Marital status , children , Home Owner
a. Tahap yang dilakukan pada klasifikasi ke-3 ini sama halnya dengan klasifikasi pada tahap di atas (pada bagian 1.a-1.g) hanya saja perbedaannya terletak pada
tahap d , yaitu pemilihan klasifikasi , seperti gambar di bawah ini :
Figure 20.Classification
b. Kemudian tahap berikutnya sama hingga tahap 1.g , kemudian akan memunculkan hasil seperti gambar di bawah ini , terlihat bahwa trees
merupakan marital status ,dan pada gambar di bawah ini merupakan all cases ,
sama halnya dengan kasus di atas , apabila kita mengganti dengan cases
tertentu hasilnya juga akan berubah :
Figure 21.Decision Tree
Berikut merupakan mining legend yang dihasilkan , terlihat bahwa terdapat
700 cases, dan terlihat bagaimana probability dalam hitungan prosentase (%) ,
histogram
-
21
Figure 22.Mining Legend
c. Kemudian pada tahap 3.c ini memperlihatkan perbedaan apabila yang dipilih merupakan case tertentu atau bukan All cases pada background tampak
gambar di bawah ini ketika yang dipilih merupakan background dengan value
Married
Figure 23.Decision Tree
Berikut merupakan mining legend yang dihasilkan , terlihat bahwa terdapat
700 cases, dan terlihat bagaimana probability dalam hitungan prosentase (%) ,
histogram
Figure 24.Mining Legend
d. Pada tahap ke-4 ini akan menunjukkan langkah dalam memunculkan dependency network / ketergantungan antara 1 atribut dan atribut lainnya ,
seperti pada kasus 1 , sehingga didapatkan gambar seperti di bawah ini
-
22
Figure 25.Dependency Network
ESTIMATION
Estimasi digunakan untuk memprediksi hasil keluaran berupa sebuah nilai
kontinu , estimasi juga sering digunakan untuk melakukan tugas klasifikasi , contoh
penggunaan data mining untuk tugas estimasi adalah memperkirakan minimum ,
maksimum , dan rata-rata temperatur harian , Estimasi berkaitan dengan nilai-nilai
yang berkalanjutan., Jika diberikan beberapa data input, estimasi akan memberikan
nilai-nilai seperti pendapatan, tinggi badan, atau saldo kartu kredit
Pada Microsoft Excel kita dapat melakukan estimasi dengan memanfaatkan tools pada
data mining yang telah terinstall sebagai add in , yakni fungsi estimate seperti gambar
di bawah ini :
Figure 26.Menu Estimate
Berikut langkah-langkah melakukan estimate pada DMAddin_SampleData yang
diberikan untuk estimate
1. Kami melakukan estimasi berdasarkan income dan occupation
a. Pertama-tama kita memilih estimate pada salah satu tools di data mining , kemudian akan muncul seperti gambar di bawah ini
-
23
Figure 27.Estimate Wizard
b. Setelah itu kita akan diminta untuk memilih source data yang akan digunakan , seperti gambar di bawah ini , kemudian pilih next untuk melanjutkan ke tahap
berikutnya :
Figure 28.Select source code
c. Kemudian akan muncul kotak dialog estimate , dimana disini kita diminta untuk memilih data-data apa saja yang akan digunakan untuk estimate, setelah
memilih tekan next :
-
24
Figure 29.Estimation
d. Setelah itu akan muncul kotak dialog finish seperti gambar berikut, jangan lupa untuk mencetang user temporary model , setelah itu klik finish
Figure 30.Finish estimate
e. Setelah menekan tombol finish , maka akan diproses seperti gambar di bawah ini :
Figure 31.process
f. Setelah itu akan muncul gambar seperti di bawah ini , yang menunjukkan hasil estimate sesuai dengan data apa saja yang sebelumnya telah kita pilih :
-
25
Figure 32.Decision Tree
g. Pada tahap ini akan menunjukkan langkah dalam memunculkan dependency netwoek / ketergantungan antara 1 atribut dan atribut lainnya , seperti pada
kasus 1 , sehingga didapatkan gambar seperti di bawah ini
Figure 33.Dependency Network
PREDICTION
Prediksi memiliki kemiripan dengan klasifikasi , namun data diklarifikasi berdasarkan
perilaku atau nilai yang diperkirakan pada masa mendatang , salah satu contoh dari tugas
prediksi adalah pengurangan jumlah pelanggan dalam masa mendatang dapat dikatakan
prediksi berupa memperkirakan hal yang belum terjadi, Kita bisa menunggu hingga hal itu
terjadi untuk membuktikan seberapa tepat prediksi kita
Pada Microsoft Excel kita dapat melakukan prediksi dengan memanfaatkan tools pada
data mining yang telah terinstall sebagai add in , yakni fungsi forecast seperti gambar di
bawah ini :
-
26
Figure 34.Menu Forecast
Berikut langkah-langkah melakukan prediksi pada DMAddin_SampleData yang
diberikan untuk prediksi :
1. Kami melakukan prediksi berdasarkan income , ages , car , dan ID
a. Pertama-tama kita memilih forecast pada salah satu tools di data mining , kemudian akan muncul seperti gambar di bawah ini
Figure 35.Forecast Wizard
b. Setelah itu kita akan diminta untuk memilih source data yang akan digunakan , seperti gambar di bawah ini , kemudian pilih next untuk melanjutkan ke tahap
berikutnya :
-
27
Figure 36.Source Data
c. Kemudian akan muncul kotak dialog forecasting , dimana disini kita diminta untuk memilih data-data apa saja yang akan digunakan untuk forecasting ,
setelah memilih tekan next , namun pada time stamp pilih no time stamp ,
seperti gambar di bawah ini :
Figure 37.Forecasting
d. Setelah itu akan muncul kotak dialog finish seperti gambar berikut, jangan lupa untuk mencetang user temporary model , setelah itu klik finish
-
28
Figure 38.Finish Forecasting
e. Setelah menekan tombol finish , maka akan diproses seperti gambar di bawah ini :
Figure 39.Process Forecasting
f. Setelah itu akan muncul grafik seperti gambar di bawah ini , yang menunjukkan hasil forecasting sesuai dengan data apa saja yang sebelumnya
telah kita pilih :
-
29
Figure 40.Charts
g. Kemudian pada grafik tersebut kita dapat memilih apa saja grafik yang akan ditampilkan berdasarkan data pada sisi kanan , pada gambar di bawah ini
menunjukkan grafik antara usia dan pendapatan (age and income) sehingga
hanya muncul 2 warna grafik , biru menunjukkan grafik usia , dan ungu
menunjukkan grafik pendapatan
Figure 41.Charts-2
h. Kemudian pada grafik di bawah ini menunjukkan grafik dengan data usia dan mobil , grafik berwarna biru menandai data Age , sedangkan data cars ditandai
dengan grafik berwarna merah
-
30
Figure 42.Charts-3
i. Kemudian untuk model ditunjukkan pada gambar di bawah ini , yang menggambarkan model forecasting dari data yang telah kita pilih
Figure 43.Decision Tree
j. Kemudian di bawah ini menunjukkan model dengan cases cars , terlihat perbedaannya dengan trees cars
Figure 44.Decision Tree
2. Kami melakukan prediksi berdasarkan income , children, dan age
-
31
a. Tahap yang dilakukan pada prediksi ke-2 ini sama halnya dengan prediksi pada tahap di atas (pada bagian 1.a-1.c) hanya saja perbedaannya terletak
pada tahap d , yaitu pemilihan prediksi, seperti gambar di bawah
Figure 45.Forecasting
b. Setelah itu pada beberapa tahap memiliki kesamaan , hingga menghasilkan grafik seperti gambar di bawah ini :
Figure 46.Charts
c. Setelah itu kita dapat melihat modelnya berdasarkan tree income seperti gambar di bawah ini :
-
32
Figure 47.Model
d. Selain itu kita dapat melihat modelnya berdasarkan tree children seperti gambar di bawah ini , terlihat perbedaannya dibandingkan dengan tree
income di atas
Figure 48.Model
AFFINITY GROUPING
Tugas Affinity Grouping adalah untuk menentukan hal-hal yang bisa
dikelompokkan bersama-sama. Hal ini juga dapat digunakan untuk
mengidentifikasi peluang cross-selling dan untuk merancang paket menarik atau
pengelompokan produk dan jasa.
Affinity Grouping berdasarkan tabel asosiasi
-
33
Figure 49.Data
Tahapan tahapan
Figure 50.Source Data
-
34
Figure 51.Association
Figure 52.Finish
-
35
Figure 53.Ruler
Figure 54.Associate Product
-
36
Berdasarkan data diatas kemungkinan paling tinggi adalah saat consumen
membeli HL Road Tire, konsumen juga membeli produk lain yang berkaitan.
Dengan begitu perusahaan bisa melakukan penawaran lebih pada produk lain yang
dibeli bersamaan tersebut. Seperti Road-250, Road Tire Tube, Patch Kit, dl. Selain
itu perusahaan juga bisa melakukan cross-selling yang berpotensi tinggi. Seperti
ML Road Tire, Touring Tire, dan produk produk lain berdasarkan data di atas
CLUSTERING
Clustering merupakan proses untuk melakukan segmentasi atas sebuah populasi
yang heterogen menjadi sub kelompok atau cluster yang homogen , clustering membagi
objek data tanpa mengetahui jumlah label kelas
Clustering berdasarkan data dibawah
Figure 55.Data
Tahapan tahapan klustering
Figure 56.Menu Cluster
-
37
Figure 57.Source Data
Kemudian menentukan data data yang menjadi dasar dari pembagian cluster, disini data yang dijadikan dasar clustering adalah gender, education, region dan age.
Clustering saya pilih automatis, jadi tidak saya tentukan akan jadi berapa cluster.
-
38
Figure 58.Cluster Diagram
Berikut profil setiap clusternya
Figure 59.Cluster Profile
Dapat mengetahui letak variabel yang
ada, terletak di cluster mana dan
diperhitungkan berapa persen dari total
populasi
-
39
Cluster 1 Cluster 2 Cluster 3
Cluster 4 Cluster 5 Chapter 6
Selain itu ita bisa melihat characteristik setiap cluster, contoh disini adalah charakteristik
cluster 1
Figure 60
Selain itu kita bisa membandingkan cluster 1 dengan yang lainya
Figure 61
DESCRIPTION AND PROFILING
-
40
Description and profiling adalah descripsi dari database yang telah ada sehingga akan
mudah dibaca oleh perusahaan. Berguna untuk meningkatan pemahaman produk, pelanggan,
dan penjualan.Disini kami membuat deskripsi dari data yang ada dengan bentuk chart dan
pengelompokan data.
Untuk pelanggan kami mencontohkan disini Profit chart berdasarkan klasifikasi Matrial
Status
-
41
Figure 62
Maka jadilah analisa profit berdasarkan matrial status , Pada produk dan penjualan kami
membuat yaitu barang yang paling sering dibeli, dan barang yang bersamaan dibeli. Sehingga
dapat dilakukan cross seling terhadap barang tersebut
Figure 63
-
42
Figure 64
Data ini memang sedikit mirip dengan Asociate yaitu sama sama bisa digunakan untuk menentukan cross-selling
-
43
BAB 4: ANALISIS DAN PEMBAHASAN
CLASSIFICATION
Analisis pada kasus 1 sesuai dengan pada Bab 3. Implementasi , pada gambar di bawah ini
menunjukkan , pada tree Occupation , terbagi menjadi beberapa usia , background yang
dipilih merupakan All cases , sehingga keseluruhan occupation ditampilkan dan
digambarkan seperti gambar di bawah ini , untuk analisis gambar di bawah ini menunjukkan
pemecahan pekerjaan berdasarkan usia , terbagi menjadi 3 yaitu usia diantara 32 dan 53
tahun , usia lebih dari sama dengan 53 tahun yang kemudian dibagi lagi menjadi 2 yakni
lebih dari sama dengan 65 tahun dan kurang dari 65 tahun , dan pekerja yang terakhir berusia
kurang dari 32 tahun
Figure 65
Selain itu di bawah ini merupakan gambar hasil juga , yang terdapat pada sebelah kanan
gambar di atas, yang menunjukkan mining legend, dari total cases sebanyak 700 cases
(merupakan jumlah keseluruhan occupation) , berikut data yang ada :
Figure 66
Dari tabel diatas dapat kita lihat pada kolom usia , dengan usia 37-46 tidak memiliki
pekerjaan , pada usia kurang dari 37 tahun terbagi ke dalam 2 pekerjaan skilled- manual dan
manual , dimana lebih banyak skilled-manual pada relative impact yang tergambar di atas ,
pada usia lebih dari sama dengan 65 tahun bekerja sebagai clerical dan management ,
kemudian di antara 46-55 tahun jenis pekerjaan professional , sehingga data tersebut sesuai
dengan decision tree yang digambarkan , sehingga dengan adanya klasifikasi ini dapat
memudahkan kita untuk mengetahui jenis pekerjaan apa yang paling sering digeluti pada
kurun usia tertentu
-
44
Analisis pada kasus 2 dengan menggunakan data berupa penghasilan (income), mobil dan
occupation , pada gambar di bawah ini merupakan decision tree yang dihasilkan dari tools
classify
Figure 67
Analisis yang dapat diambil dari decision tree di atas adalah , tree utama adalah income atau
pendapatan , dimana terbagi atas pekerjaan atau occupation yang ada , terdapat Occupation
manual , skilled-manual , management , professional , dan clerical , kemudian terlihat pada
occupation manual tidak terdapat yang memiliki mobil dan juga hal yang sama terlihat pada
occupation clerical, sedangkan pada occupation skilled-manial terbagi menjadi 2 jumlah
mobil , sama halnya pada occupation management , namun pada jumlah mobil masih dibagi
lagi pada jumlah mobil tidak sama dengan 4 , hal yang sama terdapat pada occupation
professional
Figure 68
Dari tabel di atas terlihat kesamaan dengan decision tree , dimana keselarasan antara
occupation , cars dan income , dimana kita lihat saja pada occupation clerical dan manual
-
45
memiliki income dengan jumlah yang sama , yakni
-
46
Figure 71
Terlihat pada decision tree yang memiliki tree utama income ini ,terbagi atas berbagai macam
jenis occupation , yang kemudian dibagi lagi menjadi beberapa occupation seperti gambar
diatas , Estimasi digunakan untuk memprediksi hasil keluaran berupa sebuah nilai kontinu ,
estimasi juga sering digunakan untuk melakukan tugas klasifikasi , sehingga hal tersebut
telah digambarkan dengan decision tree tersebut
PREDICTION
Analisis pada prediction ini juga merupakan pembahasan mengenai implementasi pada Bab 3
diatas m berikut merupakan analisa tiap kasus yang ada :
Kasus 1 , yakni dengan menggunakan data usia , mobil , ID , dan pendapatan ,sehingga
muncul grafik seperti gambar di bawah ini , yang menunjukkan hasil forecasting sesuai
dengan data apa saja yang sebelumnya telah kita pilih :
Figure 72
Kemudian pada grafik tersebut kita dapat memilih apa saja grafik yang akan ditampilkan
berdasarkan data pada sisi kanan , pada gambar di bawah ini menunjukkan grafik antara usia
dan pendapatan (age and income) sehingga hanya muncul 2 warna grafik , biru menunjukkan
grafik usia , dan ungu menunjukkan grafik pendapatan, terlihat bahwa grafik terlihat
fluktuatif, terlihat cepat turun dan naik , berdasarkan dengan sample data yang ada , yang
jelas ke-4 warna grafik tersebut berpengaruh satu sama lain , forecasting merupakan ilmu
-
47
peramalan bagaimana keadaan kedepannya , sehingga kita sudah dapat memiliki gambaran
kedepannya
Figure 73
Kemudian pada grafik di bawah ini menunjukkan grafik dengan data usia dan mobil , grafik
berwarna biru menandai data Age , sedangkan data cars ditandai dengan grafik berwarna
merah
Figure 74
Kemudian untuk model ditunjukkan pada gambar di bawah ini , yang menggambarkan model
forecasting dari data yang telah kita pilih
-
48
Figure 75
Dari model decision tree tersebut juga dapat kita lakukan analisis , dan sebagian besar
bergantung pada income , prediksi mirip dengan klasifikasi namun prediksi merupakan teknik
yang digunakan untuk mengetahui keadaan sesuatu di masa akan mendatanng , sehingga
tidak menimbulkan kerugian yang besar
AFFINITY GROUP
Affinity group digunakan untuk menentukan hal hal yang terjadi bersamaan. Affinity group merupakan pendekatan sederhana untuk menghasilkan aturan aturan dari data. Berdasarkan data yang sudah kita lakukan datamining berdasarkan Affiniting group diperoleh data
Table 1
Probability Importance Rule
100 % 1,51 Road-250, Road Tire Tube -> HL Road Tire
100 % 1,46 Road-250, Patch kit -> HL Road Tire
100 % 1,43 Road-350-W, Road Tire Tube -> ML Road Tire
100 % 1,43 Mountain-500, Mountain Tire Tube -> LL Mountain Tire
100 % 1,42 Road-750, Road Tire Tube -> LL Road Tire
100 % 1,41 Touring-1000, Touring Tire Tube -> Touring Tire
100 % 1,40 Road-550-W, Road Tire Tube -> ML Road Tire
100 % 1,35 Touring-3000, Touring Tire Tube -> Touring Tire
100 % 1,35 Touring-2000, Touring Tire Tube -> Touring Tire
100 % 1,31 Mountain-200, Mountain Tire Tube -> HL Mountain Tire
100 % 1,30 Mountain-400-W, Mountain Tire Tube -> ML Mountain Tire
100 % 1,24 Touring Tire, Sport-100 -> Touring Tire Tube
100 % 1,24 Road-750, Water Bottle -> Road Bottle Cage
100 % 1,20 Touring-1000, Water Bottle -> Road Bottle Cage
100 % 1,18 Touring Tire, Half-Finger Gloves -> Touring Tire Tube
100 % 1,17 Hydration Pack, Touring Tire -> Touring Tire Tube
100 % 1,17 Mountain-200, Water Bottle -> Mountain Bottle Cage
100 % 1,16 Touring Tire, Cycling Cap -> Touring Tire Tube
100 % 1,15 Touring Tire, Road Bottle Cage -> Touring Tire Tube
100 % 1,15 Touring Tire, Long-Sleeve Logo Jersey -> Touring Tire Tube
100 % 1,15 Touring Tire, Water Bottle -> Touring Tire Tube
100 % 1,14 Touring-3000, Water Bottle -> Road Bottle Cage
-
49
100 % 1,14 Road-550-W, Water Bottle -> Road Bottle Cage
100 % 1,14 Road-250, Water Bottle -> Road Bottle Cage
100 % 1,12 Road-350-W, Water Bottle -> Road Bottle Cage
100 % 1,12 Touring-2000, Water Bottle -> Road Bottle Cage
100 % 1,11 Touring Tire Tube, Water Bottle -> Road Bottle Cage
100 % 1,10 Fender Set - Mountain, Water Bottle -> Mountain Bottle Cage
100 % 1,10 Touring Tire, Water Bottle -> Road Bottle Cage
100 % 1,06 Mountain-500, Water Bottle -> Mountain Bottle Cage
100 % 1,05 Mountain Tire Tube, Water Bottle -> Mountain Bottle Cage
100 % 1,03 HL Mountain Tire, Water Bottle -> Mountain Bottle Cage
100 % 1,02 ML Road Tire, Sport-100 -> Road Tire Tube
100 % 1,00 LL Road Tire, Sport-100 -> Road Tire Tube
100 % 0,96 LL Road Tire, Half-Finger Gloves -> Road Tire Tube
100 % 0,95 LL Road Tire, Long-Sleeve Logo Jersey -> Road Tire Tube
100 % 0,95 Classic Vest, LL Road Tire -> Road Tire Tube
100 % 0,95 Classic Vest, HL Road Tire -> Road Tire Tube
100 % 0,85 ML Mountain Tire, Half-Finger Gloves -> Mountain Tire Tube
100 % 0,84 LL Mountain Tire, Long-Sleeve Logo Jersey -> Mountain Tire Tube
100 % 0,84 LL Mountain Tire, Fender Set - Mountain -> Mountain Tire Tube
100 % 0,75 Road Bottle Cage, Sport-100 -> Water Bottle
100 % 0,73 Road Bottle Cage, Cycling Cap -> Water Bottle
100 % 0,72 Short-Sleeve Classic Jersey, Road Bottle Cage -> Water Bottle
100 % 0,72 Half-Finger Gloves, Road Bottle Cage -> Water Bottle
100 % 0,71 Road Bottle Cage, Long-Sleeve Logo Jersey -> Water Bottle
100 % 0,71 Hydration Pack, Road Bottle Cage -> Water Bottle
100 % 0,70 Classic Vest, Mountain Bottle Cage -> Water Bottle
100 % 0,70 Classic Vest, Road Bottle Cage -> Water Bottle
100 % 0,70 Road Bottle Cage, Patch kit -> Water Bottle
99 % 0,90 ML Mountain Tire, Sport-100 -> Mountain Tire Tube
97 % 0,70 Bike Wash, Mountain Bottle Cage -> Water Bottle
95 % 1,26 Mountain-400-W, Patch kit -> ML Mountain Tire
95 % 0,68 Mountain Bottle Cage, Patch kit -> Water Bottle
95 % 0,83 ML Mountain Tire, Long-Sleeve Logo Jersey -> Mountain Tire Tube
95 % 1,21 Touring Tire, Patch kit -> Touring Tire Tube
95 % 0,69 Half-Finger Gloves, Mountain Bottle Cage -> Water Bottle
94 % 0,94 ML Road Tire, Cycling Cap -> Road Tire Tube
94 % 0,69 Road-350-W, Road Bottle Cage -> Water Bottle
94 % 1,12 Bike Wash, Touring Tire -> Touring Tire Tube
94 % 0,69 Short-Sleeve Classic Jersey, Mountain Bottle Cage -> Water Bottle
93 % 0,92 ML Road Tire, Short-Sleeve Classic Jersey -> Road Tire Tube
93 % 0,66 Racing Socks, Mountain Bottle Cage -> Water Bottle
93 % 0,97 HL Road Tire, Sport-100 -> Road Tire Tube
93 % 0,67 Touring Tire Tube, Road Bottle Cage -> Water Bottle
91 % 0,67 Touring-2000, Road Bottle Cage -> Water Bottle
91 % 0,99 Mountain-400-W, Water Bottle -> Mountain Bottle Cage
91 % 0,68 Touring-3000, Road Bottle Cage -> Water Bottle
-
50
91 % 0,69 Mountain Bottle Cage, Cycling Cap -> Water Bottle
91 % 1,28 Touring-2000, Patch kit -> Touring Tire
91 % 1,05 Hydration Pack, Road-750 -> Road Bottle Cage
91 % 0,91 HL Road Tire, Bike Wash -> Road Tire Tube
91 % 0,80 ML Mountain Tire, Mountain Bottle Cage -> Mountain Tire Tube
91 % 0,64 Hydration Pack, Road-750 -> Water Bottle
90 % 0,84 LL Mountain Tire, Sport-100 -> Mountain Tire Tube
Berdasarkan data diatas ketika konsumen membeli HL Road Tire mereka juga membeli Road
250, Road Tire Tube, dan Patch kit. Dengan begitu perusahaan melakukan penawaran
terhadap produk tersebut ketika customer lain membeli HL Road Tire. Bukan hanya HL Road
Tire yang bisa diberi penawaran tetapi juga produk lain yang memiliki probability tinggi
untuk diberi penawaran terhadap produk lai seperti ML Road Tire, LL Mountain Tire dan
produk lainya.
CLUSTERING
Clustering merupakan proses untuk melakukan segmentasi atas sebuah populasi yang
heterogen menjadi cluster yang homogen. Cluster dapat digunakan untuk menghasilkan label
label. Objek objek dikelompokan berdasarkan prinsip maksimalisasi kemiripan dalam satu kelas dan minimalisasi kemiripan antar kelas. Clusterisasi yang sudah kami lakukan
terhadap tabel Data Source, berdasarkan gender(jenis kelamin), education(pendidikan),
region(kota) dan age(umur). Hasilnya menjadi 5 cluster
Figure 76
Table 2
Variables States Population (All) Cluster 1 Cluster 2 Cluster 3 Cluster 6 Cluster 4 Cluster 5
Size 7000 1617 1391 1324 920 874 874
Age Mean 45 39,42 30,78 53,48 42,57 50,77 64,12
Age Deviation 12,02 4,4 3,08 4,53 5,04 8,49 7,65
Education Partial College 1878 0 % 43 % 21 % 39 % 66 % 4 %
Education Bachelors 1807 78 % 0 % 1 % 0 % 11 % 48 %
-
51
Education High School 1405 1 % 34 % 54 % 11 % 12 % 4 %
Education Graduate Degree 1156 21 % 0 % 0 % 47 % 9 % 35 %
Education Partial High School 754 1 % 23 % 24 % 3 % 3 % 8 %
Gender Male 3592 45 % 52 % 59 % 92 % 10 % 55 %
Gender Female 3408 55 % 49 % 41 % 8 % 90 % 46 %
Region North America 3827 49 % 47 % 59 % 66 % 47 % 67 %
Region Europe 2058 14 % 46 % 27 % 27 % 40 % 25 %
Region Pacific 1115 37 % 7 % 14 % 6 % 13 % 8 %
Dan berikut kharakteristik dari setiap cluster
Cluster 1
Table 3
Variables Values Probability
Education Bachelors 78 %
Age 38 - 45 60 %
Gender Female 55 %
Region North America 49 %
Gender Male 45 %
Region Pacific 37 %
Age 25 - 37 31 %
Education Graduate Degree 21 %
Region Europe 14 %
Age 46 - 53 9 %
Education High School 1 %
Education Partial High School 1 %
Cluster 2
Table 4
Variables Values Probability
Age 25 - 37 95 %
Gender Male 52 %
Gender Female 48 %
Region North America 47 %
Region Europe 46 %
Education Partial College 43 %
Education High School 34 %
Education Partial High School 23 %
Region Pacific 7 %
Age 38 - 45 2 %
Cluster 3
-
52
Table 5
Variables Values Probability
Region North America 59 %
Gender Male 59 %
Education High School 54 %
Age 54 - 81 51 %
Age 46 - 53 46 %
Gender Female 41 %
Region Europe 27 %
Education Partial High School 23 %
Education Partial College 21 %
Region Pacific 14 %
Age 38 - 45 4 %
Education Bachelors 1 %
Cluster 4
Table 6
Variables Values Probability
Gender Female 90 %
Education Partial College 66 %
Region North America 47 %
Region Europe 40 %
Age 54 - 81 38 %
Age 46 - 53 36 %
Age 38 - 45 21 %
Region Pacific 13 %
Education High School 11 %
Education Bachelors 11 %
Gender Male 10 %
Education Graduate Degree 9 %
Age 25 - 37 5 %
Education Partial High School 3 %
Cluster 5
Table 7
Variables Values Probability
Age 54 - 81 91 %
Region North America 67 %
Gender Male 55 %
Education Bachelors 48 %
Gender Female 45 %
Education Graduate Degree 35 %
-
53
Region Europe 25 %
Education Partial High School 8 %
Region Pacific 8 %
Age 46 - 53 7 %
Education Partial College 4 %
Education High School 4 %
Age 38 - 45 1 %
Cluster 6
Table 8
Variables Values Probability
Gender Male 92 %
Region North America 66 %
Age 38 - 45 56 %
Education Graduate Degree 47 %
Education Partial College 39 %
Age 46 - 53 28 %
Region Europe 27 %
Age 25 - 37 14 %
Education High School 11 %
Gender Female 8 %
Region Pacific 6 %
Education Partial High School 3 %
Age 54 - 81 2 %
DESCRIPTION AND PROFILLING
Pelanggan
Profit Chart berdasarkan matrial status
1. Matrial Status = Single
Table 9
Fixed cost 5000
Population 50000
Individual cost 3
Revenue per individual 15
Model Name Classify Marital Status
Maximum profit Rp170.500,00
Probability threshold 17,61 %
-
54
Figure 77
2. Matrial Status = Maried
Table 10
Fixed cost 5000
Population 50000
Individual cost 3
Revenue per individual 15
Model Name Classify Marital Status
Maximum profit Rp270.475,00
Probability threshold 19,83 %
(Rp20,000.00)
Rp0.00
Rp20,000.00
Rp40,000.00
Rp60,000.00
Rp80,000.00
Rp100,000.00
Rp120,000.00
Rp140,000.00
Rp160,000.00
Rp180,000.00
0 % 10 % 20 % 30 % 40 % 50 % 60 % 70 % 80 % 90 % 100%
Pro
fit
Overall Population %
No Model
Classify Marital Status
-
55
Figure 78
Produk dan penjualan
Dengan mengetahui produk yang sering dibeli maka akan perusahaan dengan mudah dapat
mengetahui strategi yang tepat untuk kedepanya. Pada data penjualan ini akan ditampilkan
data produk yang sering dibeli beserta bundlenya.
Table 11
Bundle of items Number of sales Average Value Per Sale
Overall value of Bundle
Road Bikes, Helmets 805 1570,228025 1264033,56
Mountain Bikes, Tires and Tubes 569 2208,067434 1256390,37
Fenders, Mountain Bikes 539 2022,477421 1090115,33
Mountain Bikes, Bottles and Cages 563 1923,73222 1083061,24
Mountain Bikes, Helmets 537 1966,57311 1056049,76
Jerseys, Road Bikes 480 2183,375083 1048020,04
Touring Bikes, Helmets 536 1925,792761 1032224,92
Road Bikes, Tires and Tubes 486 1541,535514 749186,26
Road Bikes, Bottles and Cages 552 1157,4025 638886,18
Touring Bikes, Bottles and Cages 351 1819,513846 638649,36
Jerseys, Mountain Bikes 284 1769,032817 502405,32
Touring Bikes, Tires and Tubes 205 1964,783707 402780,66
Touring Bikes, Jerseys 182 2140,195275 389515,54
Caps, Touring Bikes 192 1845,028125 354245,4
Mountain Bikes, Bottles and Cages, 172 2014,376977 346472,84
(Rp50,000.00)
Rp0.00
Rp50,000.00
Rp100,000.00
Rp150,000.00
Rp200,000.00
Rp250,000.00
Rp300,000.00
0 % 10 % 20 % 30 % 40 % 50 % 60 % 70 % 80 % 90 % 100%
Pro
fit
Overall Population %
No Model
Classify Marital Status
-
56
Helmets
Caps, Road Bikes 218 1493,217339 325521,38
Caps, Mountain Bikes 193 1613,720933 311448,14
Gloves, Road Bikes 188 1579,83234 297008,48
Hydration Packs, Mountain Bikes 124 2197,621129 272505,02
Fenders, Mountain Bikes, Helmets 131 2015,929466 264086,76
Mountain Bikes, Helmets, Tires and Tubes 122 2010,395656 245268,27
Fenders, Jerseys, Mountain Bikes 102 2310,072745 235627,42 Fenders, Mountain Bikes, Bottles and Cages 114 2002,902982 228330,94
Gloves, Mountain Bikes 111 1770,763784 196554,78
Fenders, Mountain Bikes, Tires and Tubes 83 2335,897952 193879,53
Caps, Jerseys, Road Bikes 79 2193,428734 173280,87
Road Bikes, Helmets, Tires and Tubes 118 1459,651864 172238,92 Jerseys, Mountain Bikes, Bottles and Cages 71 2249,589718 159720,87
Cleaners, Mountain Bikes 86 1837,835349 158053,84
Road Bikes, Bottles and Cages, Helmets 130 1175,756462 152848,34
Caps, Mountain Bikes, Bottles and Cages 74 2014,618649 149081,78
Jerseys, Road Bikes, Helmets 82 1701,356585 139511,24
Touring Bikes, Bottles and Cages, Helmets 72 1897,03 136586,16
Vests, Mountain Bikes 67 2035,527313 136380,33
Jerseys, Bottles and Cages 382 340,7286911 130158,36
Gloves, Touring Bikes 72 1803,594167 129858,78
Gloves, Jerseys, Road Bikes 57 2206,946491 125795,95
Helmets, Tires and Tubes 1617 76,08829932 123034,78
Caps, Jerseys 357 327,9996078 117095,86
Jerseys, Road Bikes, Bottles and Cages 70 1658,607143 116102,5
Gloves, Road Bikes, Helmets 74 1537,473514 113773,04
Bike Racks, Mountain Bikes 51 2213,676275 112897,49
Socks, Touring Bikes 56 1926,164286 107865,2
Jerseys, Mountain Bikes, Helmets 49 2090,459796 102432,53
Touring Bikes, Helmets, Tires and Tubes 54 1894,451111 102300,36
Caps, Mountain Bikes, Helmets 49 2074,765918 101663,53
Fenders, Caps, Mountain Bikes 49 2069,715102 101416,04
Touring Bikes, Jerseys, Helmets 45 2202,848222 99128,17
Cleaners, Tires and Tubes 259 377,517027 97776,91
Caps, Jerseys, Mountain Bikes 51 1875,048431 95627,47
Touring Bikes, Jerseys, Bottles and Cages 46 2053,08 94441,68
Jerseys, Helmets 404 231,3314851 93457,92
Caps, Touring Bikes, Bottles and Cages 50 1858,2808 92914,04
Shorts, Mountain Bikes 107 839,48 89824,36
Caps, Touring Bikes, Helmets 43 2060,040233 88581,73
Gloves, Mountain Bikes, Helmets 45 1964,603333 88407,15
-
57
Dari data diatas dapat perusahaan ketahui perolehan value terbesar. Sehingga kedepanya
perusahaan dapat menentukan bagaimana strategi yang lebih tepat. Bisa berupa penjumlahan
stok, strategi cross seling berdasarkan bundle bundle diatas atau yang lainnya.
Maksud dengan description dan profilling adalah mendescripsikan sehingga data mudah
dibaca. Pembuatan profit chart, pengelompokan data merupakan salah sati pendeskripsian
suatu data agar nantinya mudah dibaca.
BAB 5: PENUTUP
SIMPULAN
Jadi , dengan menggunakan berbagai macam tools atau fitur-fitur yang ada pada data
mining , sangat membantu kita dalam pengelolaan data pelanggan , karena seperti yang telah
disinggung di atas bahwa lebih mudah mendapatkan keuntungan dari pelanggan lama
daripada pelanggan baru , sehingga Data Mining ini sangat cocok digunakan bagi perusahaan
yang ingin mempertahankan pelanggan mereka khususnya , berbagai macam fitur Data
Mining yaitu Classification, Estimation, Prediction , Affiling Grouping , Clustering , dan
Description and Profilling keseluruhannya dapat kita manfaatkan dan bisa kita terapkan
teknik tersebut , sehingga menghasilkan data berupa grafik , tabel dan lainnya , sehingga kita
dapat membantu perusahaan dengan memanfaatkan Data Mining yang ada
DAFTAR PUSTAKA
Luki Iswara Pengenalan Data Mining[Online] // Data Mining 27 April 2010-22 Desember 2013-http://mugi.or.id/blogs/luki/archive/2010/04/27/pengenalan-data-mining.aspx
Binus Tools Data Mining [Online] // Binus - 10 Januari 2010. - 17 Desember 2013. -
http://library.binus.ac.id/eColls/eThesisdoc/Bab2/TSA-2013-0031 % 20 BAB %202.pdf
Excel Microsoft Pengertian dan Fungsi Microsoft Excel [Online] // Blog Arikus. - 11 May
2013. - 22 Desember 2012. - http://arikus.web.id/2013/05/11/pengertian-dan-fungsi-
microsoft-excel/.
Kember and Han Data Mining: Concepts and Techniques, 2nd ed. [Buku]. - [s.l.] : Morgan
Kaufmann Publishers, 2006.
Tama Bayu Adhi IMPLEMENTASI TEKNIK DATA MINING DI DALAM KONSEP
[Jurnal]. - Bali : [s.n.], 2009.
LAMPIRAN