modul praktikum 4 - ar-mba -...
TRANSCRIPT
UNIVERSITAS ISLAM INDONESIA FM‐UII‐AA‐FKA‐07/R0
MATERI PRAKTIKUM
PRAKTIKUM 4
ANALISA AR-MBA
(ASSOCIATION RULE - MARKET BASKET ANALYSIS)
Tujuan Praktikum
1. Mahasiswa dapat mengetahui salah satu metode asosiasi dalam data mining.
2. Memberikan pemahaman mengenai prosedurMarket Basket Analysis.
3. Mahasiswa dapat mengolah suatu data yang cukup besar sehingga data tersebut dapat
digunakan dengan menggunakan Association Rule.
Latar Belakang AR-MBA
Dewasa ini, penggunaan mesin pencatat dan pemroses transaksi berteknologi barcode telah
umum digunakan pada penjual eceran maupun kecil (toko atau swalayan). Dengan mesin ini,
penjual eceran dapat menyimpan data transaksinya dalam suatu basisdata transaksi. Tiap
informasi pada transaksi memuat tanggal dan item apa saja yang dibeli. Data ini disebut
sebagai basket data. Market Basket Analysis (MBA) merupakan studi mengenai analisis
basket data.
Salah satu metode yang banyak digunakan dalam MBA adalah association rule
mining yang bertujuan menemukan aturan-aturan asosiasi di antara himpunan besar data item
dalam basisdata transaksi. Apabila diimplementasikan dalam basis data transaksi, aturan-
aturan asosiasi ini akan sangat berguna dalam menentukan strategi bisnis seperti mendesain
katalog, menata layout, serta merancang kampanye pemasaran dan promosi.
Salah satu kemungkinan contoh dari asosiasi misalnya adalah bahwa 80% pelanggan
yang membeli produk A juga membeli produk B. Dalam hal ini produk A dan B disebut
dengan istilah frequent itemset. Dari frequent itemset tersebut kita dapat menentukan aturan
asosiasi antar item dalam frequent itemset .
UNIVERSITAS ISLAM INDONESIA FM‐UII‐AA‐FKA‐07/R0
MATERI PRAKTIKUM
Menggali aturan asosiasi dari basis data transaksi bukan merupakan masalah trivial.
Pertama, jumlah transaksi yang terdapat dalam basis data umumnya sangat banyak. Kedua,
jumlah kemungkinan frequent itemset meningkat secara eksponensial terhadap jumlah jenis
item. Terdapat berbagai algoritma yang dapat digunakan untuk aplikasi AR-MBA, antara lain
yaitu algoritma apriori dan algoritma FP-growth. Berikut penjelasan dari kedua algoritma
tersebut:
Algoritma Apriori
Algoritma apriori merupakan suatu algoritma untuk mengurangi ruang pencarian kombinasi
item, sehingga analisis dapat dilakukan dengan lebih cepat. Lebih lanjut lagi, aturan-aturan
yang dihasilkan dari algoritma apriori dapat diidentifikasi lagi untuk menentukan aturan
mana yang dapat memberikan informasi lebih banyak dengan menggunakan ukuran support
dan lift ratio. Kemudian, aturan-aturan asosiasi yang telah dihasilkan dapat digunakan
sebagai bahan pertimbangan untuk pengambilan keputusan dalam strategi bisnis. Adapun dua
proses utama yang dilakukan dalam algoritma Apriori (Han & Kamber, 2006), yaitu :
1. Join (penggabungan).
Pada proses ini setiap item dikombinasikan dengan item yang lainnya sampai
tidak terbentuk kombinasi lagi.
2. Prune (pemangkasan).
Pada proses ini, hasil dari item yang telah dikombinasikan tadi lalu dipangkas
dengan menggunakan minimum support yang telah ditentukan oleh user.
Algoritma FP-Growth
Algoritma FP-Growth merupakan pengembangan dari algoritma Apriori. Sehingga
kekurangan dari algoritma Apriori diperbaiki oleh algoritma FP-Growth. Frequent Pattern
Growth (FP-Growth) adalah salah satu alternatif algoritma yang dapat digunakan untuk
menentukan himpunan data yang paling sering muncul (frequent itemset) dalam sebuah
kumpulan data (David Samuel, 2008). Pada algoritma Apriori diperlukan generate candidate
UNIVERSITAS ISLAM INDONESIA FM‐UII‐AA‐FKA‐07/R0
MATERI PRAKTIKUM
untuk mendapatkan frequent itemsets. Akan tetapi, di algoritma FP-Growth generate
candidate tidak dilakuka karena FP-Growth menggunakan konsep pembangunan tree dalam
pencarian frequent itemsets. Hal tersebutlah yang menyebabkan algoritma FP-Growth lebih
cepat dari algoritma Apriori.
Karakteristik algoritma FP-Growth adalah struktur data yang digunakan adalah tree
yang disebut dengan FP-Tree. Dengan menggunakan FP-Tree, algoritma FP-growth dapat
langsung mengekstrak frequent Itemset dari FP-Tree. Penggalian itemset yang frequent
dengan menggunakan algoritma FP-Growth akan dilakukan dengan cara membangkitkan
struktur data tree atau disebut dengan FPTree. Metode FP-Growth dapat dibagi menjadi 3
tahapan utama yaitu sebagai berikut (Han & Kamber 2006):
1. Tahap pembangkitan conditional pattern base,
2. Tahap pembangkitan conditional FP-Tree, dan
3. Tahap pencarian frequent itemset.
Association Rule
Asociation dalam data mining adalah pekerjaan untuk menentukan mana atribut yang akan
didapatkan bersamaan. Dalam dunia bisnis lazim dikenal istilah affinity analysis. Tugas dari
asociation rule adalah mencari aturan yang tidak mengcover untuk mengukur hubungan
antara dua atau lebih atribut.
Association Rule adalah bentuk jika “kejadian sebelumnya” kemudian
“konsekuensinya”. (IF antecedent, THEN consequent). Bersamaan dengan perhitungan
aturan support dan confidence. Pola asosiasi menjadi salah satu fungsionalitas yang paling
menarik dalam penggalian data (Kumar dan Wahidabanu, 2007). Association Rule adalah
teknik data mining untuk menemukan aturan assosiatif antara suatu kombinasi item. Contoh
dari Association Rule dari analisa pembelian di suatu pasar swalayan adalah bisa diketahui
berapa besar kemungkinan seorang pembeli membeli roti bersamaan dengan susu. Dengan
pengetahuan tersebut Pemilik pasar swalayan dapat mengatur penempatan barangnya atau
UNIVERSITAS ISLAM INDONESIA FM‐UII‐AA‐FKA‐07/R0
MATERI PRAKTIKUM
merancang kampanye pemasaran dengan memakai kupon diskon untuk kombinasi barang
tertentu (Wiwin Suwarningsih, 2008).
Menurut Leo Susanto (2003) penggalian kaidah asosiasi mempunyai peranan penting
dalam proses pengambilan keputusan. Salah satu contoh penerapan Association Rule adalah
Market Basket Analysis. Association Rule menjadi terkenal karena aplikasinya untuk
menganalisa isi keranjang belanja di pasar swalayan, sehingga Association Rule juga sering
disebut dengan istilah Market Basket Analysis. Association Rule juga dikenal sebagai salah
satu teknik data mining yang menjadi dasar dari berbagai teknik data mining lainnya.
Konsep Market Basket Analysis
Gambar 1. Ilustrasi Penggunaan MBA
Market Basket Analysis merupakan salah satu contoh penerapan Association Rule.
Untuk menyampaikan ide mendasar dari Market Basket Analysis, dimulai dengan melihat
gambar keranjangan belanjaan pada gambar 3.1 yang berisi bermacam-macam barang-
barang yang dibeli oleh seseorang disebuah supermarket. Keranjang ini berisi bermacam-
macam barang-barang seperti roti, susu, sereal, telur, mentega, gula, dan sebagainya.
Sebuah keranjang memberitahukan kepada kita tentang apa saja yang dibeli oleh seorang
konsumen dalam satu waktu. Sebuah daftar belanjaan yang lengkap yang diperoleh dari
UNIVERSITAS ISLAM INDONESIA FM‐UII‐AA‐FKA‐07/R0
MATERI PRAKTIKUM
semua konsumen memberikan kita informasi yang sangat banyak, dan ini dapat
menjelaskan barang-barang apa saja yang paling penting dari bisnis penjualan yaitu ”apa
barang yang dibeli oleh konsumen dan kapan”.
Setiap konsumen membeli seperangkat barang-barang yang berbeda, dalam jumlah
yang berbeda, dan dalam waktu yang berbeda. Market Basket Analysis menggunakan
informasi apa yang dibeli oleh konsumen-konsumen untuk menyediakan tanda/informasi
yaitu siapa mereka dan mengapa mereka melakukan pembelian tersebut? Market Basket
Analysis menyediakan pengertian tentang barang dagangan dengan memberitahukan
kepada kita produk-produk mana yang memungkinkan untuk dibeli secara bersamaan dan
produk mana yang lebih disetujui untuk di promosikan. Karena dalam Market Basket
Analysis tidak hanya memahami kuantitas dari item yang dibeli dalam keranjang itu, tapi
bagaimana item yang dibeli dalam hubungannya satu dengan yang lain. Informasi ini
dapat digunakan dalam:
1. Lebih menguntungkan periklanan dan promosi. Market Basket Analysis
menggunakan iklan dan promosi agar lebih memahami bagaimana pembeli
menanggapi dan berkomunikasi atas produk-produk yang ditawarkan, karena tujuan
dari retailer adalah ”Bagaimana mengubah penjualan ini? Apa lagi yang dijual dan
apa yang diiklankan?”.
2. Penargetan yang lebih tepat dalam mengembalikan ROI (Return of Investment).
Market Basket Analysis digunakan untuk mengoptimalkan kampanye dan promosi
untuk peningkatan penjualan dan margin dengan penargetan lebih tepat.
3. Loyalitas kartu promosi dengan analisis longitudinal. Longitudinal pengguna Market
Basket Analysis memungkinkan pengecer untuk membeli karakter perilaku pelanggan
seiring waktu. Retailer menggunakan kartu loyalitas pelanggan untuk menangkap
lifecycle data sehingga mereka dapat menganalisis pelanggan dari masa pembelian
perilaku seperti belanja. Misalnya, satu mainan pengecer menjelaskan bahwa ia tidak
masuk akal untuk menjual satu mesin permainan (dengan sedikit margin) kecuali
pelanggan yang juga membeli aksesoris dan perangkat lunak
UNIVERSITAS ISLAM INDONESIA FM‐UII‐AA‐FKA‐07/R0
MATERI PRAKTIKUM
permainan (tinggi dengan margin). Mereka menggunakan Market Basket Analysis
terhadap loyalitas kartu data mereka secara keseluruhan untuk menentukan margin
pada video game dan penjualan untuk membuat ingatan promosi pelanggan dan
mempengaruhi pembeli untuk membeli permainan dan aksesoris dari mereka dan
tidak dari pengecer lain.
4. Menentukan tata letak toko yang baru (new store layouts) atau menarik lebih banyak
lalu lintas ke toko, menetapkan produk-produk mana yang akan diletakan dalam
tempat yang khusus. Market Basket Analysis juga menggunakan ruang untuk
meningkatkan perencanaan dan visual merchandising lintas untuk meningkatkan
penjualan.
5. Mengidentifikasi ketika persoalannya berpasangan/kupon (issue coupons). Untuk
meningkatkan penjualan atau menghabiskan barang yang menjadi inventory.
Definisi Market Basket Analysis
Bebrapa definisi dari MBA adalah sebagai berikut:
▪ Market Basket Analysis adalah teknik matematis yang biasa digunakan oleh
marketing yang profesional untuk menyatakan kesamaan antara produk individu atau
produk kelompok.
▪ Market Basket Analysis berkenaan dengan sekumpulan permasalahan bisinis yang
berkaitan untuk mengetahui point of sale dari data transaksi.
▪ Market Basket Analysis adalah istilah umum untuk metodologi yang mempelajari
tentang komposisi keranjang belanjaan yang dibeli oleh rumah tangga selama 1 kali
berbelanja.
▪ Market Basket Analysis adalah kumpulan kombinasi produk yang dibeli bersamaan.
▪ Market Basket Analysis adalah analisis kecenderungan suatu item terbeli oleh
costumer yang sama pada waktu yang bersamaan.
UNIVERSITAS ISLAM INDONESIA FM‐UII‐AA‐FKA‐07/R0
MATERI PRAKTIKUM
Tiga Level Market Basket Data
Market Basket Data adalah data transaksi yang menjelaskan tiga perbedaan entitas yang
mendasar yaitu :
1. Customers
2. Orders/pembelian
3. Items (barang-barang)
Dalam sebuah relational database, struktur data dari market basket data sering terlihat
sama. Data Struktur ini didalamnya terdapat empat entitas yang penting.
Gambar 2. Relational database
Permintaan adalah stuktur data yang fundamental untuk Market Basket Data.
Permintaan dapat berupa kejadian suatu pembelian oleh customer. Pembelian juga dapat
dilakukan melalui website, grosir, ataupun dari catalog. Semua ini dapat termasuk dalah
sebuah pembelian, pembelian tambahan, tipe dari pembayaran, dan data lain yang termasuk
dalam suatu transaksi. Beberapa transaksi diberikan identitas khusus. Namun ada beberapa
identitas khusus tersebut harus digabungkan dengan data yang lainnya. Sebagai contoh, kita
perlu mengkombinasikan empat lahan untuk mendapatkan empat identitas khusus untuk
penjualan di toko. Waktu dimulai ketika customer membayar, chain ID, store ID dan lane ID.
UNIVERSITAS ISLAM INDONESIA FM‐UII‐AA‐FKA‐07/R0
MATERI PRAKTIKUM
Barang dalam suatu pembelian digambarkan dalam line items. Data ini termasuk harga
pembayaran barang, jumlah barang, pajak yang harus dibayar, mungkin juga termasuk harga
(yang digunakan untuk penghitungan margin). Meja barang (item table) biasanya mempunyai
hubungan dengan product reference table yang memberikan gambaran lebih jelas mengenai
produk yang ada. Gambaran informasinya termasuk hierachy produk dan informasi lain yang
mungkin memudahkan dalam menganalisis.
Customer table (meja customer) adalah meja pilihan dan harus bisa digunakan ketika
customer dapat di identifikasikan. Contoh, di dalam sebuah web site, ada sebuah syarat dalam
melakukan registrasi atau ketika customer menggunakan kartu anggota (affinity card) dalam
melakukan pembayaran. Walaupun customer table mempunyai area yang menarik, tetapi
yang paling penting adalah identitas tersebut. Sebab ini merupakan dasi dari sebuah transaksi
setiap waktu. Pengenalan customer setiap saat membuat mungkin untuk dikenali secara
cepat, seperti frekuensi pembelian yang dilakukan oleh customer. Tiga level dari market
basket data yang penting yang secara cepat dapat memahami permintaan. Ada beberapa dasar
pengukuran yaitu:
1. Berapa rata-rata pembelian yang dilakukan customer?
2. Berapa rata-rata barang yang khusus setiap pembelian?
3. Berapa rata-rata barang setiap pembelian?
4. Untuk produk tertentu, proporsi customer apa yang telah membeli produk?
5. Untuk produk tertentu, berapa rata-rata dari pembelian setiap customer yang
termasuk dalam barang?
6. Untuk produk tertentu, berapa rata-rata jumlah pembelian dalam suatu pembelian
ketika produk dibeli?
Pengukuran ini memberikan gambaran untuk sebuah bisnis. Dalam beberapa kasus, ada
beberapa pembeli yang berulang, sehingga proporsi dari sebuah pembelian setiap customer
mendekati 1. Saran ini digunakan suatu perusahaan untuk meningkatkan penjualan setiap
customers. Atau jumlah dari produk setiap pembelian mendekati 1, penyaranan akan
kesempatan untuk penjualan silang selama proses pembelian.
UNIVERSITAS ISLAM INDONESIA FM‐UII‐AA‐FKA‐07/R0
MATERI PRAKTIKUM
Pertemuan ke Modul ke
Jumlah Halaman
Mulai berlaku
: 4 : 4
: 28
: 2017
Fakultas : Teknologi Industri Jurusan/Program Studi : Teknik Industri Kode Mata
Kuliah : 52224603
Nama Mata Kuliah : Analisis Keputusan dan Data Mining
Hal ini dapat berguna untuk membandingkan pengukuran ini terhadap yang lainnya. Kita
telah menemukan bahwa jumlah pembelian dapat menjadi acuan untuk membedakan diantara
para customer (costumer yang sesungguhnya/membeli lebih sering dari pada hanya sekedar
customer). Gambar 2 menggambarkan tentang hubungan antar customer (jumlah barang
khusus setiap pembelian) dengan seberapa dalam hubungannya (jumlah yang dibeli) untuk
customer yang membeli lebih dari 1 barang. Data ini bisa berasal dari retailer yang kecil.
Bulatan yang paling besar menunjukan jumlah customer yang membeli dua barang sekaligus
dalam waktu yang bersamaan., dalam gambar juga dapat dilihat bulatan yang besar
menunjukan jumlah customer yang membeli barang yang sama dalam dua kali pembelian.
Customers yang baik–yaitu mereka yang melakukan pembelian kembali berulang kali.
Cenderung untuk membeli bermacam-macam barang dalam jumlah besar. Walaupun,
beberapa dari mereka kembali dan membeli barang yang sama sepeti ketika mereka pertama
kali membeli. Bagaimana retailer dapat mendorong customers untuk datang kembali dan
membeli lebih dan juga barang yang berbeda? Market Basket Analysis tidak dapat menjawab
pertanyaan ini, tetapi Market Basket Analysis dapat sedikit dorongan untuk meminta itu dan
mungkin menbeikan isyarat yang dapat membantu.
Support dan Confidence
Penting tidaknya suatu aturan assosiatif dapat diketahui dengan dua parameter,
support (nilai penunjang) yaitu persentase kombinasi item tersebut dan confidence (nilai
kepastian) yaitu kuatnya hubungan antar item dalam aturan assosiatif. Aturan assosiatif
biasanya dinyatakan dalam bentuk :
{roti,mentega} → {susu} (support = 40%, confidence = 50%)
Yang artinya : ”50% dari transaksi di database yang memuat item roti dan mentega juga
memuat item susu. Sedangkan 40% dari seluruh transaksi yang ada di database memuat
ketiga item itu”. Dapat juga diartikan : "Seorang konsumen yang membeli roti dan mentega
UNIVERSITAS ISLAM INDONESIA FM‐UII‐AA‐FKA‐07/R0
MATERI PRAKTIKUM
Pertemuan ke Modul ke
Jumlah Halaman
Mulai berlaku
: 4 : 4
: 33
: 2017
Fakultas : Teknologi Industri Jurusan/Program Studi : Teknik Industri Kode Mata
Kuliah : 52224603
Nama Mata Kuliah : Analisis Keputusan dan Data Mining
punya kemungkinan 50% untuk juga membeli susu. Aturan ini cukup signifikan karena
mewakili 40% dari catatan transaksi selama ini."
Analisis asosiasi didefinisikan suatu proses untuk menemukan semua aturan assosiatif yang
memenuhi syarat minimum untuk support (minimum support) dan syarat minimum untuk
confidence (minimum confidence).
Metode Dasar Association Rule
Metodologi dasar analisis asosiasi terbagi menjadi dua tahap :
1. Analisa pola frekuensi tinggi
Tahap ini mencari kombinasi item yang memenuhi syarat minimum dari nilai support dalam
database, yang dapat dirumuskan sebagai berikut:
Contohnya pada database transaksi belanja pasar swalayan berikut:
Tabel 1. Data Transaksi
Diketahui bahwa jumlah transaksi yang memuat {roti,mentega} ada 4 (support 80%),
sedangkan jumlah transaksi yang memuat {roti,mentega,susu} ada 2 (support 40%), transaksi
yang memuat {buncis} hanya 1 (support 20%) dan sebagainya. Bila ditetapkan syarat
UNIVERSITAS ISLAM INDONESIA FM‐UII‐AA‐FKA‐07/R0
MATERI PRAKTIKUM
Pertemuan ke Modul ke
Jumlah Halaman
Mulai berlaku
: 4 : 4
: 33
: 2017
Fakultas : Teknologi Industri Jurusan/Program Studi : Teknik Industri Kode Mata
Kuliah : 52224603
Nama Mata Kuliah : Analisis Keputusan dan Data Mining
minimum dari nilai support untuk pola frekuensi tinggi dalam contoh ini adalah 30%,
diperoleh pola frekuensi tinggi yang memenuhi syarat minimum nilai support adalah :
Tabel 2. Data Transaksi dengan Frekuensi Tertinggi
2. Pembentukan aturan assosiatif
Setelah semua pola frekuensi tinggi ditemukan, barulah dicari aturan assosiatif yang
memenuhi syarat minimum untuk confidence dengan menghitung confidence aturan assosiatif
A→ B dengan menggunakan rumus berikut :
Bila syarat minimum untuk confidence dari contoh diatas adalah 50% maka salah satu contoh
aturan assosiatif yang dapat ditemukan adalah : {telur,susu} → {roti,mentega} dengan nilai
confidence:
Aturan assosiatif lain yang dapat ditemukan diantaranya adalah :
UNIVERSITAS ISLAM INDONESIA FM‐UII‐AA‐FKA‐07/R0
MATERI PRAKTIKUM
Pertemuan ke Modul ke
Jumlah Halaman
Mulai berlaku
: 4 : 4
: 33
: 2017
Fakultas : Teknologi Industri Jurusan/Program Studi : Teknik Industri Kode Mata
Kuliah : 52224603
Nama Mata Kuliah : Analisis Keputusan dan Data Mining
Tabel 3. Tabel Association Rule
3. Lift / Improvement Ratio
Lift Ratio adalah parameter penting selain support dan confidence dalam association rule. Lift
Ratio mengukur seberapa penting rule yang teleh terbentuk berdasarkan nilai support dan
confidence. Lift Ratio merupakan nilai yang menunjukkan kevalidan proses transaksi dan
memberikan informasi apakah benar produk A dibeli bersamaan dengan produk B. Lift /
Improvement Ratio dapat dihitung dengan rumus:
Sebuah transaksi dikatakan valid jika mempunyai nilai Lift / Improvement lebih dari 1, yang
berarti bahwa dalam transaksi tersebut, produk A dan B benar-benar dibeli secara bersamaan.
Pemanfaatan Aturan Asosiasi
Sesuai namanya, aturan asosiasi yang dihasilkan dalam proses Market Basket Analysis
umumnya digunakan pada bisnis retail. Untuk bagian pemasaran, peningkatan penjualan
dapat dicapai dengan mengorganisasikan ulang item-item sehingga item-item yang terjual
bersama-sama selalu ditemukan bersama. Hal ini akan memicu pembelian dan membantu
memastikan pelanggan untuk membeli sebuah item tidak lupa untuk membelinya karena
tidak melihatnya. Organisasi retail juga dapat memberikan kupon diskon untuk pembelian
item B jika pelanggan membeli item A (jika aturan asosiasi A => B merupakan aturan
asosiasi yang kuat).
Situs e-commerce juga dapat menggunakan aturan asosiasi untuk memberikan saran
(recommender system/suggestive sell) bagi pembeli berdasarkan item-item apa saja yang
sudah berada dalam keranjang belanja (shopping cart) mereka. Situs e-commerce terkenal
seperti Amazon.com menggunakan sistem pemberi saran ini untuk meningkatkan penjualan.
UNIVERSITAS ISLAM INDONESIA FM‐UII‐AA‐FKA‐07/R0
MATERI PRAKTIKUM
Pertemuan ke Modul ke
Jumlah Halaman
Mulai berlaku
: 4 : 4
: 33
: 2017
Fakultas : Teknologi Industri Jurusan/Program Studi : Teknik Industri Kode Mata
Kuliah : 52224603
Nama Mata Kuliah : Analisis Keputusan dan Data Mining
Untuk pemasaran langsung, promosi kepada pelanggan yang sudah ada lebih disukai, karena
data pembelian mereka telah diketahui. Perusahaan telah memiliki data para pelanggan dalam
basis datanya, dan mengetahui informasi yang signifikan mengenai mereka. Setelah
menjalankan Market Basket Analysis, staf pemasaran dapat menghubungi pelanggan atau
mengirimkan katalog produk untuk mempromosikan produk yang kira-kira akan menarik
untuk mereka beli dengan berdasarkan catatan riwayat pembelian mereka. Amazon.com juga
menggunakan sistem ini. Perusahaan tersebut mengirimkan e-mail kepada pelanggan untuk
menawarkan produk-produk yang kemungkinan menarik untuk mereka beli dengan melihat
produk apa saja yang telah mereka beli sebelumnya.
Selain dalam bisnis retail, Market Basket Analysis juga dapat diaplikasikan dalam
bidang-bidang yang lain. Market Basket Analysis dapat digunakan dalam spam filtering,
fraud detection (pendeteksi kecurangan, dalam klaim asuransi misalnya), analisis pembelian
kartu kredit, analisis pola panggilan telepon, analisis penggunaan layanan telekomunikasi,
dan sebagainya.
Situs Google Reader yang merupakan aplikasi web di mana pengguna dapat
berlangganan feed dari situs-situs berita atau blog (pengguna akan dapat mengetahui apakah
sebuah situs sudah di-update atau belum tanpa harus mengunjungi masing-
masing situs) juga menggunakan Market Basket Analysis. Aturan asosiasi yang dihasilkan
bersama daftar situs yang dilanggani feed-nya digunakan untuk memberikan saran bagi
pengguna mengenai situs lain yang kira-kira menarik untuk ditambahkan dalam daftar feed.
UNIVERSITAS ISLAM INDONESIA FM‐UII‐AA‐FKA‐07/R0
MATERI PRAKTIKUM
Pertemuan ke Modul ke
Jumlah Halaman
Mulai berlaku
: 4 : 4
: 33
: 2017
Fakultas : Teknologi Industri Jurusan/Program Studi : Teknik Industri Kode Mata
Kuliah : 52224603
Nama Mata Kuliah : Analisis Keputusan dan Data Mining
Gambar 3. Flowchart Tahapan MBA
UNIVERSITAS ISLAM INDONESIA FM‐UII‐AA‐FKA‐07/R0
MATERI PRAKTIKUM
Pertemuan ke Modul ke
Jumlah Halaman
Mulai berlaku
: 4 : 4
: 33
: 2017
Fakultas : Teknologi Industri Jurusan/Program Studi : Teknik Industri Kode Mata
Kuliah : 52224603
Nama Mata Kuliah : Analisis Keputusan dan Data Mining
Studi Kasus
Super Jaya Supermarket ingin melakukan identifikasi terhadap perilaku konsumen yang bertujuan
untuk menentukan kebijakan yang akan diterapkan ke depan. Metode yang akan digunakan adalah
AR-MBA dengan 30 data transaksi belanja Amanah Supermarket yang akan diidentifikasi hubungan
antara item dengan item yang lain dengan nilai minimal support 10% dan minimal confidence 50%
Tabel 3. Rekapitulasi Data
No Jenis
1 frestea, nano
2 coca cola, sosro, chomp
3 good day, pronas corn beef, delmonte, yakult, d/hoa kecap, indomilk
4 kratingdaeng, sampoerna, aqua
5 npl air pet, coca cola, sarimi, lucky strike
6 aqua, p/pinang, malboro
7 scrln sdl men, ades, goal
8 ades, nu green tea, fruit tea
9 ultra, lifebuoy, Javana, Aqua, indomilk
10 alfa air pet, vit, coca cola, happy tos
11 miranda, forvita, segitiga biru, wall's, pocky, listerin
12 mamypoko, nesscafe
13 npl air pet, mie gemez, abc exo, root beer
14 frisian flag, pocky, tango, sari roti
15 aqua, citato
16 dunhill, pulpy
17 ubm, hit, auldey, indomilk
18 aqua, vidoran kids
19 aqua, djarum
20 komix, frisian flag
21 aqua, the kotak
22 aqua, mogu
23 indomilk, aqua, wall's, telur ayam
24 aqua, pocari
25 adem sari, goodtime, sampoerna
26 gs lem, yupi, mr hottest, lifebuoy
27 vit, djarum, campina, antangin, lifebuoy
28 sinde, kraff, alkaline
29 sticker, ABC sari kacang hijau, sosro, taro, frisian flag, indomilk
30 you c1000, aqua
UNIVERSITAS ISLAM INDONESIA FM‐UII‐AA‐FKA‐07/R0
MATERI PRAKTIKUM
Pertemuan ke Modul ke
Jumlah Halaman
Mulai berlaku
: 4 : 4
: 33
: 2017
Fakultas : Teknologi Industri Jurusan/Program Studi : Teknik Industri Kode Mata
Kuliah : 52224603
Nama Mata Kuliah : Analisis Keputusan dan Data Mining
Tabel 4. Pembagian Departemen
Departemen Jenis Barang
Departemen 1 (bumbu
dapur dan makanan pokok)
sasa tepung goreng, d/hoa kecap, telur ayam, gula pasir,
forvita segitiga biru, mamasuka, indofood, royco
Departemen 2 (snack)
biskies, pocky, top, tango, citato,ubm, happy tos, mr hottest,
twistko, roma, smax, re-bo kwaci, nyam-nyam, qtela, ns
crispy, beng-beng, garuda, nissin
Departemen 3 (rokok) sampoerna, surya, dunhill, clas mild, djarum, lucky strike,
malboro, gg filter, dji sam soe, u mild, diploma mild
Departemen 4 (minuman
dan jelly)
frestea, sosro, good day, floridina, ale-ale, tebs,
kratingdaeng, futamin, nescafe, pulply, w/coco my jelly,
g/sands, big tress, the kotak, teh gelas, nu green tea, fayrouz,
you c1000, fruit tea, javana, miranda, mogu, pocari,marjan,
adem sari, sine, ABC sari kacang hijau, tong dji, my tea
olong, teh hijau, javabica, abc exo, root beer
Departemen 5 (permen) nano, chomp, kino, big babol, yupi, milkita, kopiko, h/dent,
wrigley's, strepsils, blaster, haribo, hexos
Departemen 6 (sabun
mandi dan wajah) lux, garnier, scrln, goal, lifebuoy, dettol, citra
Departemen 7 (air mineral) aqua, vit, npl, ades, alfa, total
Departemen 8 (susu) indomilk, , yakult, bear brand, frisian flag, zee, cimory, ultra,
nestle, chil go, sgm
Departemen 9 (ice cream) wall's, campira
Departemen 10 (obat-
obatan)
salonpas, betadine, f/care, hit, vidoran kids, komix, konicare,
p/pinang, konidin, mixagrip, antangin, antimo, durex, tiga
tangkai, bintang 7, my baby telon, sido muncul, vitacimin,
evervon c, herbacov
UNIVERSITAS ISLAM INDONESIA FM‐UII‐AA‐FKA‐07/R0
MATERI PRAKTIKUM
Pertemuan ke Modul ke
Jumlah Halaman
Mulai berlaku
: 4 : 4
: 33
: 2017
Fakultas : Teknologi Industri Jurusan/Program Studi : Teknik Industri Kode Mata
Kuliah : 52224603
Nama Mata Kuliah : Analisis Keputusan dan Data Mining
Tabel 5. Integrasi Data
Transaksi Item Set
1 DEPT 4, DEPT 5
2 DEPT 9, DEPT 4, DEPT 5
3 DEPT 4, dept 10, dept 1, DEPT 8
4 DEPT 4, DEPT 3, DEPT 7
5 DEPT 3, DEPT 7, dept 9, dept 10
6 DEPT 7, DEPT 10, DEPT 4
7 DEPT 7, DEPT 6
8 DEPT 7, DEPT 4
9 DEPT 8, DEPT 6, DEPT 4, DEPT 7
10 DEPT 2, DEPT 7, DEPT 10
11 dept 1, DEPT 2, DEPT 4, DEPT 9
12 DEPT 5, DEPT 4
13 DEPT 7, DEPT 2, DEPT 4
14 DEPT 8, DEPT 2, dept 11
15 DEPT 7, DEPT 2
16 DEPT 3, DEPT 4
17 DEPT 2, DEPT 10, dept 13, DEPT 8
18 DEPT 7, DEPT 10
19 DEPT 7, DEPT 3
20 DEPT 10, DEPT 8
21 DEPT 7, DEPT 4
22 DEPT 7, DEPT 4
23 dept 1, DEPT 4, DEPT 7, DEPT 9
24 DEPT 7, DEPT 4
25 DEPT 2, DEPT 4, DEPT 3
26 dept 12, DEPT 5, DEPT 2, DEPT 6
27 DEPT 6, DEPT 3, DEPT 9, DEPT 7
28 DEPT 4, dept 21, DEPT 7
29 dept 13, dept, 8, DEPT 2, DEPT 8
30 DEPT 4, DEPT 7
UNIVERSITAS ISLAM INDONESIA FM‐UII‐AA‐FKA‐07/R0
MATERI PRAKTIKUM
Pertemuan ke Modul ke
Jumlah Halaman
Mulai berlaku
: 4 : 4
: 33
: 2017
Fakultas : Teknologi Industri Jurusan/Program Studi : Teknik Industri Kode Mata
Kuliah : 52224603
Nama Mata Kuliah : Analisis Keputusan dan Data Mining
Tabel 6. Taranformasi Data
Transaksi dept.1 dept.2 dept.3 dept.4 dept.5 dept.6 dept.7 dept.8 dept.9 dept.10
1 0 0 0 1 1 0 0 0 0 0
2 0 0 0 1 1 0 0 0 1 0
3 1 1 0 1 0 0 0 1 0 0
4 0 0 1 1 0 0 1 0 0 0
5 0 0 1 0 0 0 1 0 0 0
6 0 0 0 1 0 0 1 0 0 1
7 0 0 0 0 0 1 1 0 0 0
8 0 0 0 1 0 0 1 0 0 0
9 0 0 0 1 0 1 1 1 0 0
10 0 1 0 0 0 0 1 0 0 1
11 1 1 0 1 0 0 0 0 1 0
12 0 0 0 1 1 0 0 0 0 0
13 0 1 0 1 0 0 1 0 0 0
14 0 1 0 0 0 0 0 1 0 0
15 0 1 0 0 0 0 1 0 0 0
16 0 0 1 1 0 0 0 0 0 0
17 0 1 0 0 0 0 0 1 0 1
18 0 0 0 0 0 0 1 0 0 1
19 0 0 1 0 0 0 1 0 0 0
20 0 0 0 0 0 0 0 1 0 1
21 0 0 0 1 0 0 1 0 0 0
22 0 0 0 1 0 0 1 0 0 0
23 1 0 0 1 0 0 1 0 1 0
24 0 0 0 1 0 0 1 0 0 0
25 0 1 1 1 0 0 0 0 0 0
26 0 1 0 0 1 1 0 0 0 0
27 0 0 1 0 0 1 1 0 1 0
28 0 0 0 1 0 0 1 0 0 0
29 0 1 0 1 0 0 0 1 0 0
30 0 0 0 1 0 0 1 0 0 0
UNIVERSITAS ISLAM INDONESIA FM‐UII‐AA‐FKA‐07/R0
MATERI PRAKTIKUM
Pertemuan ke Modul ke
Jumlah Halaman
Mulai berlaku
: 4 : 4
: 33
: 2017
Fakultas : Teknologi Industri Jurusan/Program Studi : Teknik Industri Kode Mata
Kuliah : 52224603
Nama Mata Kuliah : Analisis Keputusan dan Data Mining
Langkah-langkah yang dilakukan dalam software adalah sebagai berikut:
1. Buka software rapid miner, klik New Process
2. Pilih File – Import Data – Import Excel Sheet
3. Kemudian cari data excel tersebut di dalam computer, pilih, klik Next
Gambar 4. Membuka Data
UNIVERSITAS ISLAM INDONESIA FM‐UII‐AA‐FKA‐07/R0
MATERI PRAKTIKUM
Pertemuan ke Modul ke
Jumlah Halaman
Mulai berlaku
: 4 : 4
: 33
: 2017
Fakultas : Teknologi Industri Jurusan/Program Studi : Teknik Industri Kode Mata
Kuliah : 52224603
Nama Mata Kuliah : Analisis Keputusan dan Data Mining
4. Klik Next
Gambar 5. Data Import Step 1
5. Klik Next
Gambar 6. Data Import Step 2
UNIVERSITAS ISLAM INDONESIA FM‐UII‐AA‐FKA‐07/R0
MATERI PRAKTIKUM
Pertemuan ke Modul ke
Jumlah Halaman
Mulai berlaku
: 4 : 4
: 33
: 2017
Fakultas : Teknologi Industri Jurusan/Program Studi : Teknik Industri Kode Mata
Kuliah : 52224603
Nama Mata Kuliah : Analisis Keputusan dan Data Mining
6. Klik Next
Gambar 7. Data Import Step 3
7. Klik Next
Gambar 8. Data Import Step 4
UNIVERSITAS ISLAM INDONESIA FM‐UII‐AA‐FKA‐07/R0
MATERI PRAKTIKUM
Pertemuan ke Modul ke
Jumlah Halaman
Mulai berlaku
: 4 : 4
: 33
: 2017
Fakultas : Teknologi Industri Jurusan/Program Studi : Teknik Industri Kode Mata
Kuliah : 52224603
Nama Mata Kuliah : Analisis Keputusan dan Data Mining
8. Simpan data di folder latihan1 dengan nama training
Gambar 9. Data Import Step 5
9. Klik Finish, akan muncul output seperti gambar di bawah ini
Gambar 10. Output Import Data
UNIVERSITAS ISLAM INDONESIA FM‐UII‐AA‐FKA‐07/R0
MATERI PRAKTIKUM
Pertemuan ke Modul ke
Jumlah Halaman
Mulai berlaku
: 4 : 4
: 33
: 2017
Fakultas : Teknologi Industri Jurusan/Program Studi : Teknik Industri Kode Mata
Kuliah : 52224603
Nama Mata Kuliah : Analisis Keputusan dan Data Mining
10. Kemudian drag file training ke dalam kotak Main Process
Gambar 11. Drag Training File
11. Cari Select Attributes, kemudian drag ke dalam kotak Main Process
Gambar 12. Drag Select Attribute
UNIVERSITAS ISLAM INDONESIA FM‐UII‐AA‐FKA‐07/R0
MATERI PRAKTIKUM
Pertemuan ke Modul ke
Jumlah Halaman
Mulai berlaku
: 4 : 4
: 33
: 2017
Fakultas : Teknologi Industri Jurusan/Program Studi : Teknik Industri Kode Mata
Kuliah : 52224603
Nama Mata Kuliah : Analisis Keputusan dan Data Mining
12. Hubungkan training dengan Select Attributes
Gambar 13. Menghubungkan Data Training dengan Select Attribute
13. Klik Select Attributes, ganti attribute filter by… dengan subset. Kemudian klik menu
Select Attributes di attributes. Pindahkan semua departemen ke dalam kotak sebelah
kanan
Gambar 14. Select Attributes: attributes
UNIVERSITAS ISLAM INDONESIA FM‐UII‐AA‐FKA‐07/R0
MATERI PRAKTIKUM
Pertemuan ke Modul ke
Jumlah Halaman
Mulai berlaku
: 4 : 4
: 33
: 2017
Fakultas : Teknologi Industri Jurusan/Program Studi : Teknik Industri Kode Mata
Kuliah : 52224603
Nama Mata Kuliah : Analisis Keputusan dan Data Mining
14. Cari Numerical to Binominal, kemudian drag ke dalam kotak Main Process
Gambar 15. Proses Drag Numerical to Binominal
15. Cari Remap Binominals, kemudian drag ke dalam kotak Main Process
Gambar 16. Proses Drag Remap Binominals
UNIVERSITAS ISLAM INDONESIA FM‐UII‐AA‐FKA‐07/R0
MATERI PRAKTIKUM
Pertemuan ke Modul ke
Jumlah Halaman
Mulai berlaku
: 4 : 4
: 33
: 2017
Fakultas : Teknologi Industri Jurusan/Program Studi : Teknik Industri Kode Mata
Kuliah : 52224603
Nama Mata Kuliah : Analisis Keputusan dan Data Mining
16. Hubungkan Select Attributes dengan Numerical to Binominal, dan Numerical to
Binominal dengan Remap Binominals. Kemudian ganti negative value dengan nilai 0
dan positive value dengan nilai 1
Gambar 17. Proses Numerical to Binominal, dan Numerical to Binominal dengan Remap
Binominals
UNIVERSITAS ISLAM INDONESIA FM‐UII‐AA‐FKA‐07/R0
MATERI PRAKTIKUM
Pertemuan ke Modul ke
Jumlah Halaman
Mulai berlaku
: 4 : 4
: 33
: 2017
Fakultas : Teknologi Industri Jurusan/Program Studi : Teknik Industri Kode Mata
Kuliah : 52224603
Nama Mata Kuliah : Analisis Keputusan dan Data Mining
17. Cari FP-Growth, kemudian drag ke dalam kotak Main Process
Gambar 18. Proses drag FP-Growth
18. Cari Create Association Rules, kemudian drag ke dalam kotak Main Process. Lalu
hubungkan Remap Binominals ke FP-Growth dan FP-Growth (fre) ke Create
Association Rules
Gambar 19. Proses Create Association Rules
UNIVERSITAS ISLAM INDONESIA FM‐UII‐AA‐FKA‐07/R0
MATERI PRAKTIKUM
Pertemuan ke Modul ke
Jumlah Halaman
Mulai berlaku
: 4 : 4
: 33
: 2017
Fakultas : Teknologi Industri Jurusan/Program Studi : Teknik Industri Kode Mata
Kuliah : 52224603
Nama Mata Kuliah : Analisis Keputusan dan Data Mining
19. Hubungkan FP-Growth (exa) ke res pertama (sebelah kanan) dan Create Association
Rules (rul) ke res kedua (sebelah kanan)
Gambar 20. Proses menghubungkan FP-Growth ke ras pertama dan Create Association Rules ke res
kedua
20. Klik FP-Growth, ganti min support dengan nilai 0.1
Gambar 21. Min Support bernilai 0.1
UNIVERSITAS ISLAM INDONESIA FM‐UII‐AA‐FKA‐07/R0
MATERI PRAKTIKUM
Pertemuan ke Modul ke
Jumlah Halaman
Mulai berlaku
: 4 : 4
: 33
: 2017
Fakultas : Teknologi Industri Jurusan/Program Studi : Teknik Industri Kode Mata
Kuliah : 52224603
Nama Mata Kuliah : Analisis Keputusan dan Data Mining
21. Klik Create Association Rules kemudian ganti min confidence dengan nilai 0.5
Gambar 22. Min Confidence bernilai 0.5
22. Lalu klik Run, akan muncul output seperti gambar di bawah ini.
Gambar 23. Output
UNIVERSITAS ISLAM INDONESIA FM‐UII‐AA‐FKA‐07/R0
MATERI PRAKTIKUM
Pertemuan ke Modul ke
Jumlah Halaman
Mulai berlaku
: 4 : 4
: 33
: 2017
Fakultas : Teknologi Industri Jurusan/Program Studi : Teknik Industri Kode Mata
Kuliah : 52224603
Nama Mata Kuliah : Analisis Keputusan dan Data Mining
23. Rule yang valid adalah yang memiliki nilai Lift Ratio > 1
Gambar 25. Rule valid jika nilai Lift Ratio > 1
UNIVERSITAS ISLAM INDONESIA FM‐UII‐AA‐FKA‐07/R0
MATERI PRAKTIKUM
Pertemuan ke Modul ke
Jumlah Halaman
Mulai berlaku
: 4 : 4
: 33
: 2017
Fakultas : Teknologi Industri Jurusan/Program Studi : Teknik Industri Kode Mata
Kuliah : 52224603
Nama Mata Kuliah : Analisis Keputusan dan Data Mining
Dari hasil output di atas, dapat diketahui rules sebagai berikut:
1. Dept.8 akan terbeli bersama dengan dept.2, dengan tingkat kepercayaan 66,7% dan
didukung oleh 13,3% dari data keseluruhan.
2. Dept.1 akan terbeli bersama dengan dept.4, dengan tingkat kepercayaan 100% dan
didukung oleh 10% dari data keseluruhan.
3. Dept.6 akan terbeli bersama dengan dept.7, dengan tingkat kepercayaan 75% dan
didukung oleh 10% dari data keseluruhan.
4. Dept.9 akan terbeli bersama dengan dept.4, dengan tingkat kepercayaan 75% dan
didukung oleh 10% dari data keseluruhan.
5. Dept.5 akan terbeli bersama dengan dept.4, dengan tingkat kepercayaan 75% dan
didukung oleh 10% dari data keseluruhan.
6. Dept.3 akan terbeli bersama dengan dept.7, dengan tingkat kepercayaan 66,7% dan
didukung oleh 13,3% dari data keseluruhan.
7. Dept.10 akan terbeli bersama dengan dept.7, dengan tingkat kepercayaan 60% dan
didukung oleh 10% dari data keseluruhan.
Knowledge yang didapatkan pada rule dapat digunakan untuk aplikasi berikut :
• Pembuatan katalog dengan mendekatkan produk yang sering terbeli secara bersamaan didekatkan
dalam penyusunan katalog.
• Pemilihan layout tempat belanja, dimana produk yang sering terbeli secara bersamaan didekatkan
tempat peletakannya.
• Pembuatan kupon belanja, dengan membuat produk yang jarang terbeli sebagai bonus dari
pembelian produk yang sering terbeli.
UNIVERSITAS ISLAM INDONESIA FM‐UII‐AA‐FKA‐07/R0
MATERI PRAKTIKUM
Pertemuan ke Modul ke
Jumlah Halaman
Mulai berlaku
: 4 : 4
: 33
: 2017
Fakultas : Teknologi Industri Jurusan/Program Studi : Teknik Industri Kode Mata
Kuliah : 52224603
Nama Mata Kuliah : Analisis Keputusan dan Data Mining
Berikut ini contoh pembuatan katalog dengan mengambil rule yang pertama yaitu Dept.8 (susu) akan
terbeli bersama dengan dept.2 (snack), dengan tingkat kepercayaan 66,7% dan didukung oleh
13,3% dari data keseluruhan.
UNIVERSITAS ISLAM INDONESIA FM‐UII‐AA‐FKA‐07/R0
MATERI PRAKTIKUM
Pertemuan ke Modul ke
Jumlah Halaman
Mulai berlaku
: 4 : 4
: 33
: 2017
Fakultas : Teknologi Industri Jurusan/Program Studi : Teknik Industri Kode Mata
Kuliah : 52224603
Nama Mata Kuliah : Analisis Keputusan dan Data Mining
DAFTAR PUSTAKA
David Samuel. 2008. Penerapan Stuktur FP-Tree dan Algoritma FPGrowth dalam Optimasi
Penentuan Frequent Itemset. Institut Teknologi Bandung.
Han Jiawei, and M. Kamber. 2006. Data Mining: Concepts and Techniques, Morgan
Kaufmann, USA.
Wiwin Suwarningsih. 2008. Penerapan Association Rule Mining untuk Perancangan Data
Mining BDP (Barang Dalam Proses) Obat. Pusat Penelitian Informatika LIPI