data mining ms. excel

57
1 Tugas 4 Kelas: C Mata Kuliah: Pengelolaan Hubungan Pelanggan (CRM) Semester Ganjil 2012/2013 Management Dikumpulkan Senin Tanggal 23 Desember 2013, Jam 09.30 (Softcopy) Senin Tanggal 30 Desember 2013, Jam 09.30 (Hardcopy) Nama NRP Ali Mangsur 5212100023 Ayu Siti Munawaroh 5212100039 Astried Nadia Mayasari 5212100073 JURUSAN SISTEM INFORMASI FAKULTAS TEKNOLOGI INFORMASI INSTITUT TEKNOLOGI SEPULUH NOPEMBER 2013 Nama Tugas DATA MINING Komentar:

Upload: ayu-siti-munawaroh

Post on 13-Oct-2015

246 views

Category:

Documents


11 download

DESCRIPTION

Pengaplikasian data mining dengan menggunakan microsoft excel

TRANSCRIPT

  • 1

    Tugas 4 Kelas: C

    Mata Kuliah:

    Pengelolaan Hubungan Pelanggan (CRM)

    Semester Ganjil 2012/2013

    Management

    Dikumpulkan Senin Tanggal 23 Desember 2013, Jam 09.30 (Softcopy)

    Senin Tanggal 30 Desember 2013, Jam 09.30 (Hardcopy)

    Nama NRP

    Ali Mangsur 5212100023

    Ayu Siti Munawaroh 5212100039

    Astried Nadia Mayasari 5212100073

    JURUSAN SISTEM INFORMASI

    FAKULTAS TEKNOLOGI INFORMASI

    INSTITUT TEKNOLOGI SEPULUH NOPEMBER

    2013

    Nama Tugas

    DATA MINING

    Komentar:

  • 2

    DAFTAR ISI

    DAFTAR ISI ................................................................................................................Error! Bookmark not defined.

    DAFTAR TABEL .............................................................................................................................................. 3

    DAFTAR GAMBAR .......................................................................................................................................... 3

    BAB 1: PENDAHULUAN ........................................................................................................................................... 7

    Latar Belakang .................................................................................................................................................... 7

    Tujuan ................................................................................................................................................................. 7

    Batasan Masalah ................................................................................................................................................. 7

    BAB 2: KAJIAN TEORI .............................................................................................................................................. 8

    Data Mining ........................................................................................................................................................ 8

    Classification Tree .......................................................................................................................................... 9

    Implementasi ke CRM ....................................................................................................................................... 11

    Penerapan Pada Excel ....................................................................................................................................... 11

    BAB 3 : Implementasi data mining dalam microsoft excel ................................................................................... 12

    Classification ..................................................................................................................................................... 12

    Estimation ......................................................................................................................................................... 22

    Prediction ......................................................................................................................................................... 25

    Affinity Grouping .............................................................................................................................................. 32

    Clustering .......................................................................................................................................................... 36

    Description And Profiling .................................................................................................................................. 39

    BAB 4: ANALISIS DAN PEMBAHASAN .................................................................................................................... 43

    Classification .................................................................................................................................................... 43

    estimation ......................................................................................................................................................... 45

    prediction .......................................................................................................................................................... 46

    Affinity group ................................................................................................................................................... 48

    Clustering .......................................................................................................................................................... 50

    Description and Profilling ................................................................................................................................. 53

    BAB 5: PENUTUP ................................................................................................................................................... 57

    Simpulan ........................................................................................................................................................... 57

  • 3

    DAFTAR PUSTAKA ................................................................................................................................................. 57

    LAMPIRAN............................................................................................................................................................. 57

    DAFTAR TABEL

    Table 1 ..................................................................................................................................... 48

    Table 2 ..................................................................................................................................... 50

    Table 3 ..................................................................................................................................... 51

    Table 4 ..................................................................................................................................... 51

    Table 5 ..................................................................................................................................... 52

    Table 6 ..................................................................................................................................... 52

    Table 7 ..................................................................................................................................... 52

    Table 8 ..................................................................................................................................... 53

    Table 9 ..................................................................................................................................... 53

    Table 10 ................................................................................................................................... 54

    Table 11 ................................................................................................................................... 55

    DAFTAR GAMBAR

    Figure 1 . Menu Data Mining .................................................................................................. 12

    Figure 2.Classify Data Mining ................................................................................................. 12

    Figure 3. Start Data Mining ..................................................................................................... 13

    Figure 4. Select Source Data .................................................................................................... 13

    Figure 5. Classification ............................................................................................................ 14

    Figure 6 . Split data .................................................................................................................. 14

    Figure 7. Finish Classify .......................................................................................................... 15

    Figure 8.Process ....................................................................................................................... 15

    Figure 9 . Decision Tree........................................................................................................... 15

  • 4

    Figure 10.Mining Legend ........................................................................................................ 16

    Figure 11.Decision Tree........................................................................................................... 16

    Figure 12.Mining Legend ........................................................................................................ 16

    Figure 13.Dependency Network .............................................................................................. 17

    Figure 14.Classification ........................................................................................................... 17

    Figure 15.Decision Tree........................................................................................................... 18

    Figure 16.Mining Legend ........................................................................................................ 18

    Figure 17.Decision Tree........................................................................................................... 19

    Figure 18.Mining Legend ........................................................................................................ 19

    Figure 19.Dependency Network .............................................................................................. 19

    Figure 20.Classification ........................................................................................................... 20

    Figure 21.Decision Tree........................................................................................................... 20

    Figure 22.Mining Legend ........................................................................................................ 21

    Figure 23.Decision Tree........................................................................................................... 21

    Figure 24.Mining Legend ........................................................................................................ 21

    Figure 25.Dependency Network .............................................................................................. 22

    Figure 26.Menu Estimate ......................................................................................................... 22

    Figure 27.Estimate Wizard ...................................................................................................... 23

    Figure 28.Select source code ................................................................................................... 23

    Figure 29.Estimation ................................................................................................................ 24

    Figure 30.Finish estimate ......................................................................................................... 24

    Figure 31.process ..................................................................................................................... 24

    Figure 32.Decision Tree........................................................................................................... 25

    Figure 33.Dependency Network .............................................................................................. 25

    Figure 34.Menu Forecast ......................................................................................................... 26

    Figure 35.Forecast Wizard ....................................................................................................... 26

    Figure 36.Source Data ............................................................................................................. 27

  • 5

    Figure 37.Forecasting .............................................................................................................. 27

    Figure 38.Finish Forecasting ................................................................................................... 28

    Figure 39.Process Forecasting ................................................................................................. 28

    Figure 40.Charts ....................................................................................................................... 29

    Figure 41.Charts-2 ................................................................................................................... 29

    Figure 42.Charts-3 ................................................................................................................... 30

    Figure 43.Decision Tree........................................................................................................... 30

    Figure 44.Decision Tree........................................................................................................... 30

    Figure 45.Forecasting .............................................................................................................. 31

    Figure 46.Charts ....................................................................................................................... 31

    Figure 47.Model ....................................................................................................................... 32

    Figure 48.Model ....................................................................................................................... 32

    Figure 49.Data.......................................................................................................................... 33

    Figure 50.Source Data ............................................................................................................. 33

    Figure 51.Association .............................................................................................................. 34

    Figure 52.Finish ....................................................................................................................... 34

    Figure 53.Ruler ........................................................................................................................ 35

    Figure 54.Associate Product .................................................................................................... 35

    Figure 55.Data.......................................................................................................................... 36

    Figure 56.Menu Cluster ........................................................................................................... 36

    Figure 57.Source Data ............................................................................................................. 37

    Figure 58.Cluster Diagram....................................................................................................... 38

    Figure 59.Cluster Profile .......................................................................................................... 38

    Figure 60 .................................................................................................................................. 39

    Figure 61 .................................................................................................................................. 39

    Figure 62 .................................................................................................................................. 41

    Figure 63 .................................................................................................................................. 41

  • 6

    Figure 64 .................................................................................................................................. 42

    Figure 65 .................................................................................................................................. 43

    Figure 66 .................................................................................................................................. 43

    Figure 67 .................................................................................................................................. 44

    Figure 68 .................................................................................................................................. 44

    Figure 69 .................................................................................................................................. 45

    Figure 70 .................................................................................................................................. 45

    Figure 71 .................................................................................................................................. 46

    Figure 72 .................................................................................................................................. 46

    Figure 73 .................................................................................................................................. 47

    Figure 74 .................................................................................................................................. 47

    Figure 75 .................................................................................................................................. 48

    Figure 76 .................................................................................................................................. 50

    Figure 77 .................................................................................................................................. 54

    Figure 78 .................................................................................................................................. 55

  • 7

    BAB 1: PENDAHULUAN

    LATAR BELAKANG

    Pada suatu bisnis di perusahaan , mengelola hubungan dengan pelanggan yang sudah

    lama lebih mudah dan menjadi hal yang lebih menguntungkan dibanding mendapatkan

    pelanggan baru dan mendapatkan keuntungan dari pelanggan baru pasti lebih sulit, sehingga

    dengan adanya hal tersebut Pengelolaan Hubungan Pelanggan (PHP) adalah ilmu yang

    berguna dan dapat digunakan untuk mengelola hubungan pelanggan tersebut. Dengan ilmu

    ini diharapkan profit yang didapatkan lebih maksimal dengan dana yang dikeluarkan oleh

    perusahaan dapat di minimalisir

    Pengelolaan Hubungan Pelanggan atau Customer Relationship Management (CRM)

    terdiri dari beberapa dimensi, salah satunya adalah Analytical CRM. Analytical CRM

    membahas analisis apa yang perusahaan lakukan sebelum mengeksekusi program CRM.

    Analisis itu didapatkan dari data-data dalam jumlah besar yang telah dimiliki perusahaan

    sebelumnya

    Dalam mengelola data-data yang jumlahnya besar tersebut, dapat digunakan banyak

    teknik yang digunakan untuk mempermudah pengelolaan data-data tersebut. Teknik-teknik

    tersebut termasuk dalam ranah Data Mining, atau penggalian data untuk mendapatkan sebuah

    informasi yang bermanfaat. Beberapa teknik dalam Data Mining yaitu Classification,

    Estimation, Prediction , Affiling Grouping , Clustering , dan Description and Profilling. Pada

    laporan ini kita akan memanfaatkan ke-6 teknik tersebut pada contoh data yang telah

    diberikan , untuk memahami lebih dalam mengenai teknik-teknik tersebut dan bisa

    menerapkan semua teknik dan diharapkan dapat memberikan manfaat bagi kami kedepannya

    TUJUAN

    Dapat menggunakan fitur-fitur atau tools yang ada pada Add-in Data Mining Microsoft Excel

    Dapat mengimplementasikan berbagai macam tools tersebut dengan sample atau contoh data yang diberikan , sehingga dapat memahami maksud dari penggunaan

    tools tersebut

    Dapat memanfaatkan secara maksimal penggunaan tools Data Mining dalam pengelolaan data sehingga lebih cepat dalam mengelola suatu data

    Memudahkan dalam menganalisis suatu data dengan berbagai macam tools

    BATASAN MASALAH

    Bagaimana memanfaatkan tools-tools yang ada pada Data Mining secara benar , efektif , dan efisien ?

    Bagaimana memililh dan memanfaatkan data yang ada untuk keperluan Data Mining?

    Bagaimana cara menerapakan tools tersebut untuk melakukan Data Mining pada sample data?

    Bagaimana mempermudah proses analisis data dengan menggunakan tools yang ada pada Data Mining?

  • 8

    BAB 2: KAJIAN TEORI

    DATA MINING

    Dalam membuat sebuah keputusan bisnis, dibutuhkan sejumlah pengetahuan kondisi

    pasar sehingga keputusan bisnis tersebut dapat menghasilkan perkembangan yang bermanfaat

    dan menguntungkan bagi perusahaan. Pengetahuan ini dapat diperoleh dengan cara

    melakukan analisis terhadap data data yang telah ada.

    Pada awalnya data mining hadir dengan dilatarbelakangi dengan masalah

    pembengkakan data yang dialami oleh organisasi. Dengan adanya data yang terus menerus

    bertambah setiap harinya, lama kelamaan data tersebut akan menjadi bertumpuk dan tidak

    menghasilkan sesuatu yang berguna. Oleh karena itu muncullah pemikiran agar data tersebut

    berguna. Yaitu menambang emas(informasi) dengan sejumlah data yang banyak tersebut.

    Menurut Han dan Kamber (Kember and Han, 2006), data mining dapat didefinisikan

    sebagai proses mengekstrak atau menambang prngrtahuan yang dibutuhkan dari sejumlah

    besar data. Pada prosesnya data mining akan mengekstrak informasi yang berharga dengan

    cara menganalisis adanya pola pola ataupun hubungan keterkaitan tertentu dari data data yang ada.

    Proses penemuan pengetahuan meliputi 7 langkah (Kember and Han, 2006) diantaranya

    adalah :

    1. Data cleaning (menghilangkan noise dan data yang tidak konsisten) 2. Data integration (menggabungkan data dari berbagai sumber data) 3. Data Selection (memilih data yang relevan dengan analiis) 4. Data Transformation (transformasi atau konsolidasi data ke dalam bentuk yang tepat

    untuk mining)

    5. Data mining (mengidentifikasi polamenarik dan merepresentasikan basis pengetahuan) 6. Patern evaluation (mengidentifikasi pola menarik dan merepresentasikan basis

    pengetahuan)

    7. Knowledge presentation (penggunaan teknik representasi visual untuk menyajikan yang telah diperoleh kepada user).

    Langkah 1 sampai 4 merupakan bentuk dari data processing. Data processing ini

    dibutuhkan untuk menghilangkan data yang tidak konsisten, memiliki noise, atau terdapat

    bagian yang hilang. Melalui data processing kemudian data bisa melalui tahap data mining.

    Pada dasarnya datamining digunakan untuk menyelesaikan tugas yang bersifat prediktif

    dan deskriptif. Prediktif, sejumlah variabel akan digunakan untuk memprediksi nilai yang

    belum diketahui dari variabel lainya sedangkan descriptif akan dilakukan

    penginterpresentasian pola untuk mendeskripsikan data tersebut. Dari kedua jenis diatas

    kemudian dibagi lagi menjadi beberapa jenis tugas, diantaranya adalah klasifikasi, estimasi,

    prediksi, affinity grouping, clustering, dan description and profilling.

    Dalam konteks CRM, data mining adalah Aplikasi dari analisis desktriptif dan

    prediktif untuk membantu membantu proses pemasaran, penjualan, dan fungsi-fungsi

    perusahaan. Meskipun data mining dapat dilaksanakan dalam database operasional, biasanya

  • 9

    data mining dipakai dalam data warehouse dimana dalam data warehouse, database-nya

    cenderung lebih stabil.

    Data mining berguna dalam menjawab permasalahan seputar Strategic CRM dan

    Operational CRM. Seperti cara untuk membagi-bagi pelanggan, menentukan pelanggan yang

    paling berharga, produk apa yang paling disukai pelanggan, berapa harga yang diminati

    pelanggan, taktik penjualan apa yang berhasil diimplementasikan, dan lain-lain.

    Tujuan dari data mining adalah untuk menemukan sebuah pola atau hubungan yang

    didapatkan dari data perusahaan/data warehouse dalam jumlah besar. Dari Data Mining bisa

    didapatkan demographic mengenai profil pelanggan, produk, atau jasa tertentu.

    Dalam melakukan data mining dan mengelola data yang begitu besar tersebut

    diperlukan alat bantu berupa Software, contohnya : SPSS, Weka, Matlab dan lain-lain.

    Francis Buttle hal 114

    CLASSIFICATION TREE

    Ada banyak teknik-teknik yang digunakan dalam data mining, diantaranya adalah

    Classification Tree.

    Francis Buttle hal 169.

    Classification Tree merupakan nama yang lebih spesifik dari Decision Tree (Pohon

    pengambilan keputusan), disebut decision tree karena secara grafis merepresentasikan

    struktur yang bercabang. Decision tree bekerja dengan menganalisa kumpulan data untuk

    mencari variabel independen yang ketika akan digunakan untuk membagi-bagi populasi. Dari

    situ akan dihasilkan noktah-noktah yang berbeda antara satu dan yang lainnya. Noktah-

    noktah tersebut berisi variabel yang ingin kita prediksikan.

  • 10

    Meskipun disebut Decision Tree, namun sebetulnya yang ditunjukan adalah data

    mengenai variabel tertentu. Keputusan tetap berada ditangan perusahaan. Decision tree hanya

    memembantu pengambilan perusahaan karena menunjukan data-data y ang ada. Pada

    aplikasinya hasil dari decision tree, dan classification tree bisa digunakan untuk software lain.

    Namun tetap saja pemegang keputusan tetaplah pengguna.

    Contohnya dari data pelanggan dibawah ini akan diubah menjadi Decision Tree.

    Data diatas merupakan data pelanggan suatu perusahaan, kita ingin prediksi profil pelanggan.

    Dari sini didapatkan bahwa pelanggan yang menikah dan memiliki penghasilan tinggi

    akan memiliki credit risk yang paling tinggi.

    Keputusan apa yang akan diambil perusahaan setelah melihat representasi data ini?

    Bisa jadi banyak hal. Namun seperti yang bisa kita lihat, decision tree dan classification tree

    membantu pengguna dalam pengambilan keputusan.

  • 11

    IMPLEMENTASI KE CRM

    Di dalam CRM biasanya fokus kepada tiga area yaitu penjualan (sales), layanan

    pelanggan (customer service), dan otomasi pemasaran (marketing automation). Penjualan

    meliputi semua hal yang berhubungan dengan area penjualan, call center penjualan, dan e-

    commerce. Layanan pelanggan meliputi seluruh area layanan termasuk layanan berbasis

    Internet. Sedangkan pada area sales force automation(SFA) meliputi perangkat (tool) BI

    (business intelligence), analisis data, dan aplikasi managemen lainnya.

    Landasan untuk mencapai keberhasilan CRM adalah adanya informasi pelanggan dan

    data transaksi pelanggan yang akurat. Untuk hasil yang maksimal diperlukan suatu analisis

    data dari seluruh data transaksi yang ada. Seperti diketahui, basis data sendiri memiliki

    volume yang sangat besar, yang kebanyakan berasal dari softwarebisnis seperti aplikasi.

    Selain informasi pelanggan yang akurat, teknik pemasaran seperti cross-selling

    mutlak diperlukan bagi perusahaan yang ingin berkompetisi di pasar. Cross-selling sudah

    menjadi bagian yang tidak terpisahkan dari CRM, telah diakui sebagai teknik pemasaran

    yang efektif dan telah terbukti meningkatkan revenue perusahaan seiring dengan

    meningkatnya jumlah lines per orderdan meningkatnya customer loyalty and profitability

    Data mining dalam CRM berperan sebagai membantu dalam pengambilan

    keputusan(Decision Support System) suatu perusahaan. Penganalisa data agar menemukan

    value lebih dari pelanggan, dan dapat menjadi bahan pertimbangan dalam pengambilan

    langkah stratrgi perusahaan serta menjadi bahan evaluasi bagi perusahaan tersebut

    (Tama, 2009)

    PENERAPAN PADA EXCEL

    Microsoft Excel merupakan aplikasi untuk mengolah data secara otomatis yang dapat

    berupa perhitungan dasar, rumus, pemakaian fungsi-fungsi, pengolahan data dan tabel,

    pembuatan grafik dan menajemen data.

    Pemakaian rumus sendiri dapat berupa penambahan, pengurangan, perkalian dan lain

    sebagainya. Sedangkan pemakaian fungsi-fungsi dapat berupa pemakaian rumus yang

    bertujuan untuk menghitung dalam bentuk rumus matematika maupun non matematika.

    Microsoft Excel dapat juga digunakan untuk menyelesaikan berbagai keperluan

    administrasi, dari yang sederhana sampai dengan yang rumit. Pada pemakaian keperluan

    yang sederhana tersebut misalkan untuk membuat perencanaan kebutuhan suatu perusahaan,

    berupa perencanaan barang kebutuhan, jumlah maupun harganya.

    (Excel, 2013)

    Dengan bantuan SQL Server , microsoft excel dapat melakukan data mining yaitu dengan

    penambahan Add in yang sesuai. Dengan adanya addin tersebut microsoft excel dapat

    terkoneksi dengan data base di SQL Server dan menggunakan Service Analyze untuk process

    Data Mining

  • 12

    BAB 3 : IMPLEMENTASI DATA MINING DALAM MICROSOFT EXCEL

    CLASSIFICATION

    Klasifikasi merupakan proses menemukan sebuah model atau fungsi yang

    mendeskripsikan dan membedakan data ke dalam kelas-kelas atau konsep-konsep .

    Klarifikasi melibatkan proses pemeriksaan karakteristik dan objek memasukkan objek ke

    dalam salah satu kelas yang sudah didefinisikan sebelumnya , Klasifikasi dilakukan dengan

    melakukan analisa pada data historikal yang tersimpan dalam database dan mengenerate

    otomatis model yang dapat memprediksi perilaku di masa depan. Dengan melakuan

    redefined class , model dapat memprediksi sebuah kelas atau membuat kelas pada rekord-

    rekord data yang terklasifikasi . Klasifikasi terdiri dari memeriksa fitur dari objek yang baru

    disajikan dan disisipkan ke salah satu set standar kelas. (Supervised Learning) , Contoh

    proses klasifikasi yakni Mengklasifikasikan peminjam uang pada suatu bank apakah memiliki

    resiko rendah, sedang atau tinggi

    Pada Microsoft Excel kita dapat melakukan classification dengan memanfaatkan tools

    pada data mining yang telah terinstall sebagai add in , yakni fungsi classify seperti gambar di

    bawah ini :

    Figure 1 . Menu Data Mining

    Berikut langkah-langkah melakukan klasifikasi pada DMAddin_SampleData yang

    diberikan untuk klasifikasi

    1. Kami melakukan klasifikasi berdasarkan occupation , gender dan age a. Pertama-tama kita membuka sample data seperti gambar di bawah ini ,

    kemudian , pilih classify pada menu data mining seperti tampak pada gambar :

    Figure 2.Classify Data Mining

    b. Setelah itu akan muncul kotak dialog seperti gambar di bawah ini untuk memulai menggunakan classify , kemudian pilih next untuk melanjutkan penggunaan classify :

  • 13

    Figure 3. Start Data Mining

    c. Setelah itu kita diminta untuk memilih source data , seperti gambar di bawah ini , kemudian pilih next untuk melanjutkan ke langkah berikutnya :

    Figure 4. Select Source Data

    d. Setelah itu pilih akan melakukan klasifikasi terhadap data apa saja , di bawah ini kami memilih untuk melakukan klasifikasi terhadap occupation , age dan gender seperti

    gambar di bawah ini , kemudian tekan next untuk melanjutkan pada tahap berikutnya :

  • 14

    Figure 5. Classification

    e. Kemudian , muncul kotak dialog seperti gambar di bawah ini dan tekan next untuk melanjutkan ke tahap berikutnya

    Figure 6 . Split data

    f. Setelah itu , beri structure name , description , model name , model description , biasanya sudah otomatis terisi dan pilih option , sebaiknya memilih use temporary ,

    setelah itu tekan finish

  • 15

    Figure 7. Finish Classify

    g. Setelah menekan tombol finish , maka akan muncul classify untuk selanjutnya memunculkan hasil , seperti pada tahap ke-8

    Figure 8.Process

    h. Kemudian akan muncul hasil seperti gambar di bawah ini , pada gambar di bawah ini menunjukkan , pada tree Occupation , terbagi menjadi beberapa usia , background

    yang dipilih merupakan All cases , sehingga keseluruhan occupation ditampilkan dan

    digambarkan seperti gambar di bawah ini , untuk analisis mengenai gambar di bawah

    ini akan dijelaskan pada Bab 4 . Analisa dan Pembahasan

    Figure 9 . Decision Tree

  • 16

    Selain itu di bawah ini merupakan gambar hasil juga , yang terdapat pada sebelah

    kanan gambar di atas, yang menunjukkan mining legend, dari total cases sebanyak

    700 cases (merupakan jumlah keseluruhan occupation)

    Figure 10.Mining Legend

    i. Pada tahap ke-9 ini merupaka tahap dimana background kita ubah menjadi Clerical atau dalam Bahasa Indonesia berarti Pekerjaan Administrasi , dimana terlihat

    bagaimana decision tree yang dihasilkan pada gambar di bawah ini , untuk lebih

    jelasnya akan dijelaskan pada Bab 4. Analisa dan Pembahasan

    Figure 11.Decision Tree

    Pada gambar di bawah ini merupakan gambar di sebelah kanan gambar di atas ,

    menunjukkan mining legend , dimana dikhususkan untuk background clerical

    saja , dan terlihat total cases hanya sebanyak 116 cases

    Figure 12.Mining Legend

  • 17

    j. Pada tahap ke-10 ini akan menunjukkan langkah dalam memunculkan dependency / ketergantungan antara 1 atribut dan atribut lainnya , seperti pada kasus 1 , sehingga

    didapatkan gambar seperti di bawah ini

    Figure 13.Dependency Network

    2 Kami melakukan klasifikasi berdasarkan income , car , occupation a. Tahap yang dilakukan pada klasifikasi ke-2 ini sama halnya dengan klasifikasi

    pada tahap di atas (pada bagian 1.a-1.g) hanya saja perbedaannya terletak pada

    tahap d , yaitu pemilihan klasifikasi , seperti gambar di bawah ini :

    Figure 14.Classification

    b. Kemudian tahap berikutnya sama hingga tahap 1.g , kemudian akan memunculkan hasil seperti gambar di bawah ini , terlihat bahwa trees

    merupakan income ,dan pada gambar di bawah ini merupakan all cases , sama

    halnya dengan kasus di atas , apabila kita mengganti dengan cases tertentu

    hasilnya juga akan berubah :

  • 18

    Figure 15.Decision Tree

    Berikut merupakan mining legend yang dihasilkan , terlihat bahwa terdapat

    700 cases, dan terlihat bagaimana probability dalam hitungan prosentase (%) ,

    histogram

    Figure 16.Mining Legend

    c. Kemudian pada tahap 2.c ini memperlihatkan perbedaan apabila yang dipilih merupakan case tertentu atau bukan All cases pada background tampak

    gambar di bawah ini ketika yang dipilih merupakan background dengan

    value >=127371

  • 19

    Figure 17.Decision Tree

    Berikut merupakan mining legend yang dihasilkan , terlihat bahwa terdapat

    700 cases, dan terlihat bagaimana probability dalam hitungan prosentase (%) ,

    histogram

    Figure 18.Mining Legend

    d. Pada tahap ke-4 ini akan menunjukkan langkah dalam memunculkan dependency network / ketergantungan antara 1 atribut dan atribut lainnya ,

    seperti pada kasus 1 , sehingga didapatkan gambar seperti di bawah ini

    Figure 19.Dependency Network

  • 20

    3 Kami melakukan klasifikasi berdasarkan Marital status , children , Home Owner

    a. Tahap yang dilakukan pada klasifikasi ke-3 ini sama halnya dengan klasifikasi pada tahap di atas (pada bagian 1.a-1.g) hanya saja perbedaannya terletak pada

    tahap d , yaitu pemilihan klasifikasi , seperti gambar di bawah ini :

    Figure 20.Classification

    b. Kemudian tahap berikutnya sama hingga tahap 1.g , kemudian akan memunculkan hasil seperti gambar di bawah ini , terlihat bahwa trees

    merupakan marital status ,dan pada gambar di bawah ini merupakan all cases ,

    sama halnya dengan kasus di atas , apabila kita mengganti dengan cases

    tertentu hasilnya juga akan berubah :

    Figure 21.Decision Tree

    Berikut merupakan mining legend yang dihasilkan , terlihat bahwa terdapat

    700 cases, dan terlihat bagaimana probability dalam hitungan prosentase (%) ,

    histogram

  • 21

    Figure 22.Mining Legend

    c. Kemudian pada tahap 3.c ini memperlihatkan perbedaan apabila yang dipilih merupakan case tertentu atau bukan All cases pada background tampak

    gambar di bawah ini ketika yang dipilih merupakan background dengan value

    Married

    Figure 23.Decision Tree

    Berikut merupakan mining legend yang dihasilkan , terlihat bahwa terdapat

    700 cases, dan terlihat bagaimana probability dalam hitungan prosentase (%) ,

    histogram

    Figure 24.Mining Legend

    d. Pada tahap ke-4 ini akan menunjukkan langkah dalam memunculkan dependency network / ketergantungan antara 1 atribut dan atribut lainnya ,

    seperti pada kasus 1 , sehingga didapatkan gambar seperti di bawah ini

  • 22

    Figure 25.Dependency Network

    ESTIMATION

    Estimasi digunakan untuk memprediksi hasil keluaran berupa sebuah nilai

    kontinu , estimasi juga sering digunakan untuk melakukan tugas klasifikasi , contoh

    penggunaan data mining untuk tugas estimasi adalah memperkirakan minimum ,

    maksimum , dan rata-rata temperatur harian , Estimasi berkaitan dengan nilai-nilai

    yang berkalanjutan., Jika diberikan beberapa data input, estimasi akan memberikan

    nilai-nilai seperti pendapatan, tinggi badan, atau saldo kartu kredit

    Pada Microsoft Excel kita dapat melakukan estimasi dengan memanfaatkan tools pada

    data mining yang telah terinstall sebagai add in , yakni fungsi estimate seperti gambar

    di bawah ini :

    Figure 26.Menu Estimate

    Berikut langkah-langkah melakukan estimate pada DMAddin_SampleData yang

    diberikan untuk estimate

    1. Kami melakukan estimasi berdasarkan income dan occupation

    a. Pertama-tama kita memilih estimate pada salah satu tools di data mining , kemudian akan muncul seperti gambar di bawah ini

  • 23

    Figure 27.Estimate Wizard

    b. Setelah itu kita akan diminta untuk memilih source data yang akan digunakan , seperti gambar di bawah ini , kemudian pilih next untuk melanjutkan ke tahap

    berikutnya :

    Figure 28.Select source code

    c. Kemudian akan muncul kotak dialog estimate , dimana disini kita diminta untuk memilih data-data apa saja yang akan digunakan untuk estimate, setelah

    memilih tekan next :

  • 24

    Figure 29.Estimation

    d. Setelah itu akan muncul kotak dialog finish seperti gambar berikut, jangan lupa untuk mencetang user temporary model , setelah itu klik finish

    Figure 30.Finish estimate

    e. Setelah menekan tombol finish , maka akan diproses seperti gambar di bawah ini :

    Figure 31.process

    f. Setelah itu akan muncul gambar seperti di bawah ini , yang menunjukkan hasil estimate sesuai dengan data apa saja yang sebelumnya telah kita pilih :

  • 25

    Figure 32.Decision Tree

    g. Pada tahap ini akan menunjukkan langkah dalam memunculkan dependency netwoek / ketergantungan antara 1 atribut dan atribut lainnya , seperti pada

    kasus 1 , sehingga didapatkan gambar seperti di bawah ini

    Figure 33.Dependency Network

    PREDICTION

    Prediksi memiliki kemiripan dengan klasifikasi , namun data diklarifikasi berdasarkan

    perilaku atau nilai yang diperkirakan pada masa mendatang , salah satu contoh dari tugas

    prediksi adalah pengurangan jumlah pelanggan dalam masa mendatang dapat dikatakan

    prediksi berupa memperkirakan hal yang belum terjadi, Kita bisa menunggu hingga hal itu

    terjadi untuk membuktikan seberapa tepat prediksi kita

    Pada Microsoft Excel kita dapat melakukan prediksi dengan memanfaatkan tools pada

    data mining yang telah terinstall sebagai add in , yakni fungsi forecast seperti gambar di

    bawah ini :

  • 26

    Figure 34.Menu Forecast

    Berikut langkah-langkah melakukan prediksi pada DMAddin_SampleData yang

    diberikan untuk prediksi :

    1. Kami melakukan prediksi berdasarkan income , ages , car , dan ID

    a. Pertama-tama kita memilih forecast pada salah satu tools di data mining , kemudian akan muncul seperti gambar di bawah ini

    Figure 35.Forecast Wizard

    b. Setelah itu kita akan diminta untuk memilih source data yang akan digunakan , seperti gambar di bawah ini , kemudian pilih next untuk melanjutkan ke tahap

    berikutnya :

  • 27

    Figure 36.Source Data

    c. Kemudian akan muncul kotak dialog forecasting , dimana disini kita diminta untuk memilih data-data apa saja yang akan digunakan untuk forecasting ,

    setelah memilih tekan next , namun pada time stamp pilih no time stamp ,

    seperti gambar di bawah ini :

    Figure 37.Forecasting

    d. Setelah itu akan muncul kotak dialog finish seperti gambar berikut, jangan lupa untuk mencetang user temporary model , setelah itu klik finish

  • 28

    Figure 38.Finish Forecasting

    e. Setelah menekan tombol finish , maka akan diproses seperti gambar di bawah ini :

    Figure 39.Process Forecasting

    f. Setelah itu akan muncul grafik seperti gambar di bawah ini , yang menunjukkan hasil forecasting sesuai dengan data apa saja yang sebelumnya

    telah kita pilih :

  • 29

    Figure 40.Charts

    g. Kemudian pada grafik tersebut kita dapat memilih apa saja grafik yang akan ditampilkan berdasarkan data pada sisi kanan , pada gambar di bawah ini

    menunjukkan grafik antara usia dan pendapatan (age and income) sehingga

    hanya muncul 2 warna grafik , biru menunjukkan grafik usia , dan ungu

    menunjukkan grafik pendapatan

    Figure 41.Charts-2

    h. Kemudian pada grafik di bawah ini menunjukkan grafik dengan data usia dan mobil , grafik berwarna biru menandai data Age , sedangkan data cars ditandai

    dengan grafik berwarna merah

  • 30

    Figure 42.Charts-3

    i. Kemudian untuk model ditunjukkan pada gambar di bawah ini , yang menggambarkan model forecasting dari data yang telah kita pilih

    Figure 43.Decision Tree

    j. Kemudian di bawah ini menunjukkan model dengan cases cars , terlihat perbedaannya dengan trees cars

    Figure 44.Decision Tree

    2. Kami melakukan prediksi berdasarkan income , children, dan age

  • 31

    a. Tahap yang dilakukan pada prediksi ke-2 ini sama halnya dengan prediksi pada tahap di atas (pada bagian 1.a-1.c) hanya saja perbedaannya terletak

    pada tahap d , yaitu pemilihan prediksi, seperti gambar di bawah

    Figure 45.Forecasting

    b. Setelah itu pada beberapa tahap memiliki kesamaan , hingga menghasilkan grafik seperti gambar di bawah ini :

    Figure 46.Charts

    c. Setelah itu kita dapat melihat modelnya berdasarkan tree income seperti gambar di bawah ini :

  • 32

    Figure 47.Model

    d. Selain itu kita dapat melihat modelnya berdasarkan tree children seperti gambar di bawah ini , terlihat perbedaannya dibandingkan dengan tree

    income di atas

    Figure 48.Model

    AFFINITY GROUPING

    Tugas Affinity Grouping adalah untuk menentukan hal-hal yang bisa

    dikelompokkan bersama-sama. Hal ini juga dapat digunakan untuk

    mengidentifikasi peluang cross-selling dan untuk merancang paket menarik atau

    pengelompokan produk dan jasa.

    Affinity Grouping berdasarkan tabel asosiasi

  • 33

    Figure 49.Data

    Tahapan tahapan

    Figure 50.Source Data

  • 34

    Figure 51.Association

    Figure 52.Finish

  • 35

    Figure 53.Ruler

    Figure 54.Associate Product

  • 36

    Berdasarkan data diatas kemungkinan paling tinggi adalah saat consumen

    membeli HL Road Tire, konsumen juga membeli produk lain yang berkaitan.

    Dengan begitu perusahaan bisa melakukan penawaran lebih pada produk lain yang

    dibeli bersamaan tersebut. Seperti Road-250, Road Tire Tube, Patch Kit, dl. Selain

    itu perusahaan juga bisa melakukan cross-selling yang berpotensi tinggi. Seperti

    ML Road Tire, Touring Tire, dan produk produk lain berdasarkan data di atas

    CLUSTERING

    Clustering merupakan proses untuk melakukan segmentasi atas sebuah populasi

    yang heterogen menjadi sub kelompok atau cluster yang homogen , clustering membagi

    objek data tanpa mengetahui jumlah label kelas

    Clustering berdasarkan data dibawah

    Figure 55.Data

    Tahapan tahapan klustering

    Figure 56.Menu Cluster

  • 37

    Figure 57.Source Data

    Kemudian menentukan data data yang menjadi dasar dari pembagian cluster, disini data yang dijadikan dasar clustering adalah gender, education, region dan age.

    Clustering saya pilih automatis, jadi tidak saya tentukan akan jadi berapa cluster.

  • 38

    Figure 58.Cluster Diagram

    Berikut profil setiap clusternya

    Figure 59.Cluster Profile

    Dapat mengetahui letak variabel yang

    ada, terletak di cluster mana dan

    diperhitungkan berapa persen dari total

    populasi

  • 39

    Cluster 1 Cluster 2 Cluster 3

    Cluster 4 Cluster 5 Chapter 6

    Selain itu ita bisa melihat characteristik setiap cluster, contoh disini adalah charakteristik

    cluster 1

    Figure 60

    Selain itu kita bisa membandingkan cluster 1 dengan yang lainya

    Figure 61

    DESCRIPTION AND PROFILING

  • 40

    Description and profiling adalah descripsi dari database yang telah ada sehingga akan

    mudah dibaca oleh perusahaan. Berguna untuk meningkatan pemahaman produk, pelanggan,

    dan penjualan.Disini kami membuat deskripsi dari data yang ada dengan bentuk chart dan

    pengelompokan data.

    Untuk pelanggan kami mencontohkan disini Profit chart berdasarkan klasifikasi Matrial

    Status

  • 41

    Figure 62

    Maka jadilah analisa profit berdasarkan matrial status , Pada produk dan penjualan kami

    membuat yaitu barang yang paling sering dibeli, dan barang yang bersamaan dibeli. Sehingga

    dapat dilakukan cross seling terhadap barang tersebut

    Figure 63

  • 42

    Figure 64

    Data ini memang sedikit mirip dengan Asociate yaitu sama sama bisa digunakan untuk menentukan cross-selling

  • 43

    BAB 4: ANALISIS DAN PEMBAHASAN

    CLASSIFICATION

    Analisis pada kasus 1 sesuai dengan pada Bab 3. Implementasi , pada gambar di bawah ini

    menunjukkan , pada tree Occupation , terbagi menjadi beberapa usia , background yang

    dipilih merupakan All cases , sehingga keseluruhan occupation ditampilkan dan

    digambarkan seperti gambar di bawah ini , untuk analisis gambar di bawah ini menunjukkan

    pemecahan pekerjaan berdasarkan usia , terbagi menjadi 3 yaitu usia diantara 32 dan 53

    tahun , usia lebih dari sama dengan 53 tahun yang kemudian dibagi lagi menjadi 2 yakni

    lebih dari sama dengan 65 tahun dan kurang dari 65 tahun , dan pekerja yang terakhir berusia

    kurang dari 32 tahun

    Figure 65

    Selain itu di bawah ini merupakan gambar hasil juga , yang terdapat pada sebelah kanan

    gambar di atas, yang menunjukkan mining legend, dari total cases sebanyak 700 cases

    (merupakan jumlah keseluruhan occupation) , berikut data yang ada :

    Figure 66

    Dari tabel diatas dapat kita lihat pada kolom usia , dengan usia 37-46 tidak memiliki

    pekerjaan , pada usia kurang dari 37 tahun terbagi ke dalam 2 pekerjaan skilled- manual dan

    manual , dimana lebih banyak skilled-manual pada relative impact yang tergambar di atas ,

    pada usia lebih dari sama dengan 65 tahun bekerja sebagai clerical dan management ,

    kemudian di antara 46-55 tahun jenis pekerjaan professional , sehingga data tersebut sesuai

    dengan decision tree yang digambarkan , sehingga dengan adanya klasifikasi ini dapat

    memudahkan kita untuk mengetahui jenis pekerjaan apa yang paling sering digeluti pada

    kurun usia tertentu

  • 44

    Analisis pada kasus 2 dengan menggunakan data berupa penghasilan (income), mobil dan

    occupation , pada gambar di bawah ini merupakan decision tree yang dihasilkan dari tools

    classify

    Figure 67

    Analisis yang dapat diambil dari decision tree di atas adalah , tree utama adalah income atau

    pendapatan , dimana terbagi atas pekerjaan atau occupation yang ada , terdapat Occupation

    manual , skilled-manual , management , professional , dan clerical , kemudian terlihat pada

    occupation manual tidak terdapat yang memiliki mobil dan juga hal yang sama terlihat pada

    occupation clerical, sedangkan pada occupation skilled-manial terbagi menjadi 2 jumlah

    mobil , sama halnya pada occupation management , namun pada jumlah mobil masih dibagi

    lagi pada jumlah mobil tidak sama dengan 4 , hal yang sama terdapat pada occupation

    professional

    Figure 68

    Dari tabel di atas terlihat kesamaan dengan decision tree , dimana keselarasan antara

    occupation , cars dan income , dimana kita lihat saja pada occupation clerical dan manual

  • 45

    memiliki income dengan jumlah yang sama , yakni

  • 46

    Figure 71

    Terlihat pada decision tree yang memiliki tree utama income ini ,terbagi atas berbagai macam

    jenis occupation , yang kemudian dibagi lagi menjadi beberapa occupation seperti gambar

    diatas , Estimasi digunakan untuk memprediksi hasil keluaran berupa sebuah nilai kontinu ,

    estimasi juga sering digunakan untuk melakukan tugas klasifikasi , sehingga hal tersebut

    telah digambarkan dengan decision tree tersebut

    PREDICTION

    Analisis pada prediction ini juga merupakan pembahasan mengenai implementasi pada Bab 3

    diatas m berikut merupakan analisa tiap kasus yang ada :

    Kasus 1 , yakni dengan menggunakan data usia , mobil , ID , dan pendapatan ,sehingga

    muncul grafik seperti gambar di bawah ini , yang menunjukkan hasil forecasting sesuai

    dengan data apa saja yang sebelumnya telah kita pilih :

    Figure 72

    Kemudian pada grafik tersebut kita dapat memilih apa saja grafik yang akan ditampilkan

    berdasarkan data pada sisi kanan , pada gambar di bawah ini menunjukkan grafik antara usia

    dan pendapatan (age and income) sehingga hanya muncul 2 warna grafik , biru menunjukkan

    grafik usia , dan ungu menunjukkan grafik pendapatan, terlihat bahwa grafik terlihat

    fluktuatif, terlihat cepat turun dan naik , berdasarkan dengan sample data yang ada , yang

    jelas ke-4 warna grafik tersebut berpengaruh satu sama lain , forecasting merupakan ilmu

  • 47

    peramalan bagaimana keadaan kedepannya , sehingga kita sudah dapat memiliki gambaran

    kedepannya

    Figure 73

    Kemudian pada grafik di bawah ini menunjukkan grafik dengan data usia dan mobil , grafik

    berwarna biru menandai data Age , sedangkan data cars ditandai dengan grafik berwarna

    merah

    Figure 74

    Kemudian untuk model ditunjukkan pada gambar di bawah ini , yang menggambarkan model

    forecasting dari data yang telah kita pilih

  • 48

    Figure 75

    Dari model decision tree tersebut juga dapat kita lakukan analisis , dan sebagian besar

    bergantung pada income , prediksi mirip dengan klasifikasi namun prediksi merupakan teknik

    yang digunakan untuk mengetahui keadaan sesuatu di masa akan mendatanng , sehingga

    tidak menimbulkan kerugian yang besar

    AFFINITY GROUP

    Affinity group digunakan untuk menentukan hal hal yang terjadi bersamaan. Affinity group merupakan pendekatan sederhana untuk menghasilkan aturan aturan dari data. Berdasarkan data yang sudah kita lakukan datamining berdasarkan Affiniting group diperoleh data

    Table 1

    Probability Importance Rule

    100 % 1,51 Road-250, Road Tire Tube -> HL Road Tire

    100 % 1,46 Road-250, Patch kit -> HL Road Tire

    100 % 1,43 Road-350-W, Road Tire Tube -> ML Road Tire

    100 % 1,43 Mountain-500, Mountain Tire Tube -> LL Mountain Tire

    100 % 1,42 Road-750, Road Tire Tube -> LL Road Tire

    100 % 1,41 Touring-1000, Touring Tire Tube -> Touring Tire

    100 % 1,40 Road-550-W, Road Tire Tube -> ML Road Tire

    100 % 1,35 Touring-3000, Touring Tire Tube -> Touring Tire

    100 % 1,35 Touring-2000, Touring Tire Tube -> Touring Tire

    100 % 1,31 Mountain-200, Mountain Tire Tube -> HL Mountain Tire

    100 % 1,30 Mountain-400-W, Mountain Tire Tube -> ML Mountain Tire

    100 % 1,24 Touring Tire, Sport-100 -> Touring Tire Tube

    100 % 1,24 Road-750, Water Bottle -> Road Bottle Cage

    100 % 1,20 Touring-1000, Water Bottle -> Road Bottle Cage

    100 % 1,18 Touring Tire, Half-Finger Gloves -> Touring Tire Tube

    100 % 1,17 Hydration Pack, Touring Tire -> Touring Tire Tube

    100 % 1,17 Mountain-200, Water Bottle -> Mountain Bottle Cage

    100 % 1,16 Touring Tire, Cycling Cap -> Touring Tire Tube

    100 % 1,15 Touring Tire, Road Bottle Cage -> Touring Tire Tube

    100 % 1,15 Touring Tire, Long-Sleeve Logo Jersey -> Touring Tire Tube

    100 % 1,15 Touring Tire, Water Bottle -> Touring Tire Tube

    100 % 1,14 Touring-3000, Water Bottle -> Road Bottle Cage

  • 49

    100 % 1,14 Road-550-W, Water Bottle -> Road Bottle Cage

    100 % 1,14 Road-250, Water Bottle -> Road Bottle Cage

    100 % 1,12 Road-350-W, Water Bottle -> Road Bottle Cage

    100 % 1,12 Touring-2000, Water Bottle -> Road Bottle Cage

    100 % 1,11 Touring Tire Tube, Water Bottle -> Road Bottle Cage

    100 % 1,10 Fender Set - Mountain, Water Bottle -> Mountain Bottle Cage

    100 % 1,10 Touring Tire, Water Bottle -> Road Bottle Cage

    100 % 1,06 Mountain-500, Water Bottle -> Mountain Bottle Cage

    100 % 1,05 Mountain Tire Tube, Water Bottle -> Mountain Bottle Cage

    100 % 1,03 HL Mountain Tire, Water Bottle -> Mountain Bottle Cage

    100 % 1,02 ML Road Tire, Sport-100 -> Road Tire Tube

    100 % 1,00 LL Road Tire, Sport-100 -> Road Tire Tube

    100 % 0,96 LL Road Tire, Half-Finger Gloves -> Road Tire Tube

    100 % 0,95 LL Road Tire, Long-Sleeve Logo Jersey -> Road Tire Tube

    100 % 0,95 Classic Vest, LL Road Tire -> Road Tire Tube

    100 % 0,95 Classic Vest, HL Road Tire -> Road Tire Tube

    100 % 0,85 ML Mountain Tire, Half-Finger Gloves -> Mountain Tire Tube

    100 % 0,84 LL Mountain Tire, Long-Sleeve Logo Jersey -> Mountain Tire Tube

    100 % 0,84 LL Mountain Tire, Fender Set - Mountain -> Mountain Tire Tube

    100 % 0,75 Road Bottle Cage, Sport-100 -> Water Bottle

    100 % 0,73 Road Bottle Cage, Cycling Cap -> Water Bottle

    100 % 0,72 Short-Sleeve Classic Jersey, Road Bottle Cage -> Water Bottle

    100 % 0,72 Half-Finger Gloves, Road Bottle Cage -> Water Bottle

    100 % 0,71 Road Bottle Cage, Long-Sleeve Logo Jersey -> Water Bottle

    100 % 0,71 Hydration Pack, Road Bottle Cage -> Water Bottle

    100 % 0,70 Classic Vest, Mountain Bottle Cage -> Water Bottle

    100 % 0,70 Classic Vest, Road Bottle Cage -> Water Bottle

    100 % 0,70 Road Bottle Cage, Patch kit -> Water Bottle

    99 % 0,90 ML Mountain Tire, Sport-100 -> Mountain Tire Tube

    97 % 0,70 Bike Wash, Mountain Bottle Cage -> Water Bottle

    95 % 1,26 Mountain-400-W, Patch kit -> ML Mountain Tire

    95 % 0,68 Mountain Bottle Cage, Patch kit -> Water Bottle

    95 % 0,83 ML Mountain Tire, Long-Sleeve Logo Jersey -> Mountain Tire Tube

    95 % 1,21 Touring Tire, Patch kit -> Touring Tire Tube

    95 % 0,69 Half-Finger Gloves, Mountain Bottle Cage -> Water Bottle

    94 % 0,94 ML Road Tire, Cycling Cap -> Road Tire Tube

    94 % 0,69 Road-350-W, Road Bottle Cage -> Water Bottle

    94 % 1,12 Bike Wash, Touring Tire -> Touring Tire Tube

    94 % 0,69 Short-Sleeve Classic Jersey, Mountain Bottle Cage -> Water Bottle

    93 % 0,92 ML Road Tire, Short-Sleeve Classic Jersey -> Road Tire Tube

    93 % 0,66 Racing Socks, Mountain Bottle Cage -> Water Bottle

    93 % 0,97 HL Road Tire, Sport-100 -> Road Tire Tube

    93 % 0,67 Touring Tire Tube, Road Bottle Cage -> Water Bottle

    91 % 0,67 Touring-2000, Road Bottle Cage -> Water Bottle

    91 % 0,99 Mountain-400-W, Water Bottle -> Mountain Bottle Cage

    91 % 0,68 Touring-3000, Road Bottle Cage -> Water Bottle

  • 50

    91 % 0,69 Mountain Bottle Cage, Cycling Cap -> Water Bottle

    91 % 1,28 Touring-2000, Patch kit -> Touring Tire

    91 % 1,05 Hydration Pack, Road-750 -> Road Bottle Cage

    91 % 0,91 HL Road Tire, Bike Wash -> Road Tire Tube

    91 % 0,80 ML Mountain Tire, Mountain Bottle Cage -> Mountain Tire Tube

    91 % 0,64 Hydration Pack, Road-750 -> Water Bottle

    90 % 0,84 LL Mountain Tire, Sport-100 -> Mountain Tire Tube

    Berdasarkan data diatas ketika konsumen membeli HL Road Tire mereka juga membeli Road

    250, Road Tire Tube, dan Patch kit. Dengan begitu perusahaan melakukan penawaran

    terhadap produk tersebut ketika customer lain membeli HL Road Tire. Bukan hanya HL Road

    Tire yang bisa diberi penawaran tetapi juga produk lain yang memiliki probability tinggi

    untuk diberi penawaran terhadap produk lai seperti ML Road Tire, LL Mountain Tire dan

    produk lainya.

    CLUSTERING

    Clustering merupakan proses untuk melakukan segmentasi atas sebuah populasi yang

    heterogen menjadi cluster yang homogen. Cluster dapat digunakan untuk menghasilkan label

    label. Objek objek dikelompokan berdasarkan prinsip maksimalisasi kemiripan dalam satu kelas dan minimalisasi kemiripan antar kelas. Clusterisasi yang sudah kami lakukan

    terhadap tabel Data Source, berdasarkan gender(jenis kelamin), education(pendidikan),

    region(kota) dan age(umur). Hasilnya menjadi 5 cluster

    Figure 76

    Table 2

    Variables States Population (All) Cluster 1 Cluster 2 Cluster 3 Cluster 6 Cluster 4 Cluster 5

    Size 7000 1617 1391 1324 920 874 874

    Age Mean 45 39,42 30,78 53,48 42,57 50,77 64,12

    Age Deviation 12,02 4,4 3,08 4,53 5,04 8,49 7,65

    Education Partial College 1878 0 % 43 % 21 % 39 % 66 % 4 %

    Education Bachelors 1807 78 % 0 % 1 % 0 % 11 % 48 %

  • 51

    Education High School 1405 1 % 34 % 54 % 11 % 12 % 4 %

    Education Graduate Degree 1156 21 % 0 % 0 % 47 % 9 % 35 %

    Education Partial High School 754 1 % 23 % 24 % 3 % 3 % 8 %

    Gender Male 3592 45 % 52 % 59 % 92 % 10 % 55 %

    Gender Female 3408 55 % 49 % 41 % 8 % 90 % 46 %

    Region North America 3827 49 % 47 % 59 % 66 % 47 % 67 %

    Region Europe 2058 14 % 46 % 27 % 27 % 40 % 25 %

    Region Pacific 1115 37 % 7 % 14 % 6 % 13 % 8 %

    Dan berikut kharakteristik dari setiap cluster

    Cluster 1

    Table 3

    Variables Values Probability

    Education Bachelors 78 %

    Age 38 - 45 60 %

    Gender Female 55 %

    Region North America 49 %

    Gender Male 45 %

    Region Pacific 37 %

    Age 25 - 37 31 %

    Education Graduate Degree 21 %

    Region Europe 14 %

    Age 46 - 53 9 %

    Education High School 1 %

    Education Partial High School 1 %

    Cluster 2

    Table 4

    Variables Values Probability

    Age 25 - 37 95 %

    Gender Male 52 %

    Gender Female 48 %

    Region North America 47 %

    Region Europe 46 %

    Education Partial College 43 %

    Education High School 34 %

    Education Partial High School 23 %

    Region Pacific 7 %

    Age 38 - 45 2 %

    Cluster 3

  • 52

    Table 5

    Variables Values Probability

    Region North America 59 %

    Gender Male 59 %

    Education High School 54 %

    Age 54 - 81 51 %

    Age 46 - 53 46 %

    Gender Female 41 %

    Region Europe 27 %

    Education Partial High School 23 %

    Education Partial College 21 %

    Region Pacific 14 %

    Age 38 - 45 4 %

    Education Bachelors 1 %

    Cluster 4

    Table 6

    Variables Values Probability

    Gender Female 90 %

    Education Partial College 66 %

    Region North America 47 %

    Region Europe 40 %

    Age 54 - 81 38 %

    Age 46 - 53 36 %

    Age 38 - 45 21 %

    Region Pacific 13 %

    Education High School 11 %

    Education Bachelors 11 %

    Gender Male 10 %

    Education Graduate Degree 9 %

    Age 25 - 37 5 %

    Education Partial High School 3 %

    Cluster 5

    Table 7

    Variables Values Probability

    Age 54 - 81 91 %

    Region North America 67 %

    Gender Male 55 %

    Education Bachelors 48 %

    Gender Female 45 %

    Education Graduate Degree 35 %

  • 53

    Region Europe 25 %

    Education Partial High School 8 %

    Region Pacific 8 %

    Age 46 - 53 7 %

    Education Partial College 4 %

    Education High School 4 %

    Age 38 - 45 1 %

    Cluster 6

    Table 8

    Variables Values Probability

    Gender Male 92 %

    Region North America 66 %

    Age 38 - 45 56 %

    Education Graduate Degree 47 %

    Education Partial College 39 %

    Age 46 - 53 28 %

    Region Europe 27 %

    Age 25 - 37 14 %

    Education High School 11 %

    Gender Female 8 %

    Region Pacific 6 %

    Education Partial High School 3 %

    Age 54 - 81 2 %

    DESCRIPTION AND PROFILLING

    Pelanggan

    Profit Chart berdasarkan matrial status

    1. Matrial Status = Single

    Table 9

    Fixed cost 5000

    Population 50000

    Individual cost 3

    Revenue per individual 15

    Model Name Classify Marital Status

    Maximum profit Rp170.500,00

    Probability threshold 17,61 %

  • 54

    Figure 77

    2. Matrial Status = Maried

    Table 10

    Fixed cost 5000

    Population 50000

    Individual cost 3

    Revenue per individual 15

    Model Name Classify Marital Status

    Maximum profit Rp270.475,00

    Probability threshold 19,83 %

    (Rp20,000.00)

    Rp0.00

    Rp20,000.00

    Rp40,000.00

    Rp60,000.00

    Rp80,000.00

    Rp100,000.00

    Rp120,000.00

    Rp140,000.00

    Rp160,000.00

    Rp180,000.00

    0 % 10 % 20 % 30 % 40 % 50 % 60 % 70 % 80 % 90 % 100%

    Pro

    fit

    Overall Population %

    No Model

    Classify Marital Status

  • 55

    Figure 78

    Produk dan penjualan

    Dengan mengetahui produk yang sering dibeli maka akan perusahaan dengan mudah dapat

    mengetahui strategi yang tepat untuk kedepanya. Pada data penjualan ini akan ditampilkan

    data produk yang sering dibeli beserta bundlenya.

    Table 11

    Bundle of items Number of sales Average Value Per Sale

    Overall value of Bundle

    Road Bikes, Helmets 805 1570,228025 1264033,56

    Mountain Bikes, Tires and Tubes 569 2208,067434 1256390,37

    Fenders, Mountain Bikes 539 2022,477421 1090115,33

    Mountain Bikes, Bottles and Cages 563 1923,73222 1083061,24

    Mountain Bikes, Helmets 537 1966,57311 1056049,76

    Jerseys, Road Bikes 480 2183,375083 1048020,04

    Touring Bikes, Helmets 536 1925,792761 1032224,92

    Road Bikes, Tires and Tubes 486 1541,535514 749186,26

    Road Bikes, Bottles and Cages 552 1157,4025 638886,18

    Touring Bikes, Bottles and Cages 351 1819,513846 638649,36

    Jerseys, Mountain Bikes 284 1769,032817 502405,32

    Touring Bikes, Tires and Tubes 205 1964,783707 402780,66

    Touring Bikes, Jerseys 182 2140,195275 389515,54

    Caps, Touring Bikes 192 1845,028125 354245,4

    Mountain Bikes, Bottles and Cages, 172 2014,376977 346472,84

    (Rp50,000.00)

    Rp0.00

    Rp50,000.00

    Rp100,000.00

    Rp150,000.00

    Rp200,000.00

    Rp250,000.00

    Rp300,000.00

    0 % 10 % 20 % 30 % 40 % 50 % 60 % 70 % 80 % 90 % 100%

    Pro

    fit

    Overall Population %

    No Model

    Classify Marital Status

  • 56

    Helmets

    Caps, Road Bikes 218 1493,217339 325521,38

    Caps, Mountain Bikes 193 1613,720933 311448,14

    Gloves, Road Bikes 188 1579,83234 297008,48

    Hydration Packs, Mountain Bikes 124 2197,621129 272505,02

    Fenders, Mountain Bikes, Helmets 131 2015,929466 264086,76

    Mountain Bikes, Helmets, Tires and Tubes 122 2010,395656 245268,27

    Fenders, Jerseys, Mountain Bikes 102 2310,072745 235627,42 Fenders, Mountain Bikes, Bottles and Cages 114 2002,902982 228330,94

    Gloves, Mountain Bikes 111 1770,763784 196554,78

    Fenders, Mountain Bikes, Tires and Tubes 83 2335,897952 193879,53

    Caps, Jerseys, Road Bikes 79 2193,428734 173280,87

    Road Bikes, Helmets, Tires and Tubes 118 1459,651864 172238,92 Jerseys, Mountain Bikes, Bottles and Cages 71 2249,589718 159720,87

    Cleaners, Mountain Bikes 86 1837,835349 158053,84

    Road Bikes, Bottles and Cages, Helmets 130 1175,756462 152848,34

    Caps, Mountain Bikes, Bottles and Cages 74 2014,618649 149081,78

    Jerseys, Road Bikes, Helmets 82 1701,356585 139511,24

    Touring Bikes, Bottles and Cages, Helmets 72 1897,03 136586,16

    Vests, Mountain Bikes 67 2035,527313 136380,33

    Jerseys, Bottles and Cages 382 340,7286911 130158,36

    Gloves, Touring Bikes 72 1803,594167 129858,78

    Gloves, Jerseys, Road Bikes 57 2206,946491 125795,95

    Helmets, Tires and Tubes 1617 76,08829932 123034,78

    Caps, Jerseys 357 327,9996078 117095,86

    Jerseys, Road Bikes, Bottles and Cages 70 1658,607143 116102,5

    Gloves, Road Bikes, Helmets 74 1537,473514 113773,04

    Bike Racks, Mountain Bikes 51 2213,676275 112897,49

    Socks, Touring Bikes 56 1926,164286 107865,2

    Jerseys, Mountain Bikes, Helmets 49 2090,459796 102432,53

    Touring Bikes, Helmets, Tires and Tubes 54 1894,451111 102300,36

    Caps, Mountain Bikes, Helmets 49 2074,765918 101663,53

    Fenders, Caps, Mountain Bikes 49 2069,715102 101416,04

    Touring Bikes, Jerseys, Helmets 45 2202,848222 99128,17

    Cleaners, Tires and Tubes 259 377,517027 97776,91

    Caps, Jerseys, Mountain Bikes 51 1875,048431 95627,47

    Touring Bikes, Jerseys, Bottles and Cages 46 2053,08 94441,68

    Jerseys, Helmets 404 231,3314851 93457,92

    Caps, Touring Bikes, Bottles and Cages 50 1858,2808 92914,04

    Shorts, Mountain Bikes 107 839,48 89824,36

    Caps, Touring Bikes, Helmets 43 2060,040233 88581,73

    Gloves, Mountain Bikes, Helmets 45 1964,603333 88407,15

  • 57

    Dari data diatas dapat perusahaan ketahui perolehan value terbesar. Sehingga kedepanya

    perusahaan dapat menentukan bagaimana strategi yang lebih tepat. Bisa berupa penjumlahan

    stok, strategi cross seling berdasarkan bundle bundle diatas atau yang lainnya.

    Maksud dengan description dan profilling adalah mendescripsikan sehingga data mudah

    dibaca. Pembuatan profit chart, pengelompokan data merupakan salah sati pendeskripsian

    suatu data agar nantinya mudah dibaca.

    BAB 5: PENUTUP

    SIMPULAN

    Jadi , dengan menggunakan berbagai macam tools atau fitur-fitur yang ada pada data

    mining , sangat membantu kita dalam pengelolaan data pelanggan , karena seperti yang telah

    disinggung di atas bahwa lebih mudah mendapatkan keuntungan dari pelanggan lama

    daripada pelanggan baru , sehingga Data Mining ini sangat cocok digunakan bagi perusahaan

    yang ingin mempertahankan pelanggan mereka khususnya , berbagai macam fitur Data

    Mining yaitu Classification, Estimation, Prediction , Affiling Grouping , Clustering , dan

    Description and Profilling keseluruhannya dapat kita manfaatkan dan bisa kita terapkan

    teknik tersebut , sehingga menghasilkan data berupa grafik , tabel dan lainnya , sehingga kita

    dapat membantu perusahaan dengan memanfaatkan Data Mining yang ada

    DAFTAR PUSTAKA

    Luki Iswara Pengenalan Data Mining[Online] // Data Mining 27 April 2010-22 Desember 2013-http://mugi.or.id/blogs/luki/archive/2010/04/27/pengenalan-data-mining.aspx

    Binus Tools Data Mining [Online] // Binus - 10 Januari 2010. - 17 Desember 2013. -

    http://library.binus.ac.id/eColls/eThesisdoc/Bab2/TSA-2013-0031 % 20 BAB %202.pdf

    Excel Microsoft Pengertian dan Fungsi Microsoft Excel [Online] // Blog Arikus. - 11 May

    2013. - 22 Desember 2012. - http://arikus.web.id/2013/05/11/pengertian-dan-fungsi-

    microsoft-excel/.

    Kember and Han Data Mining: Concepts and Techniques, 2nd ed. [Buku]. - [s.l.] : Morgan

    Kaufmann Publishers, 2006.

    Tama Bayu Adhi IMPLEMENTASI TEKNIK DATA MINING DI DALAM KONSEP

    [Jurnal]. - Bali : [s.n.], 2009.

    LAMPIRAN