modul praktikum ar-mba

31
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0 MATERI PRAKTIKUM Fakultas : Teknologi Industri Pertemuan ke : 11 Jurusan/Program Studi : Teknik Industri Modul ke : 4 Kode Mata Kuliah : 52224603 Jumlah Halaman : 29 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2015

Upload: saefullah-el-fathin

Post on 05-Feb-2016

42 views

Category:

Documents


1 download

DESCRIPTION

modul praktikum AR-MBA laboratorium Datamining Jurusan Teknik industri Universitas Islam Indonesia Yogyakarta

TRANSCRIPT

Page 1: Modul Praktikum AR-MBA

UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

MATERI PRAKTIKUM

Fakultas : Teknologi Industri Pertemuan ke : 11 Jurusan/Program Studi : Teknik Industri Modul ke : 4 Kode Mata Kuliah : 52224603 Jumlah Halaman : 29 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2015

Page 2: Modul Praktikum AR-MBA

UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

MATERI PRAKTIKUM

Fakultas : Teknologi Industri Pertemuan ke : 11 Jurusan/Program Studi : Teknik Industri Modul ke : 4 Kode Mata Kuliah : 52224603 Jumlah Halaman : 29 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2015

PERTEMUAN KE-11

AR-MBA

(ASSOCIATION RULE - MARKET BASKET ANALYSIS)

Tujuan Praktikum

1) Mahasiswa dapat mengetahui salah satu metode asosiasi dalam data mining.

2) Memberikan pemahaman mengenai prosedurMarket Basket Analysis.

3) Mahasiswa dapat mengolah suatu data yang cukup besar sehingga data tersebut dapat

digunakan dengan menggunakan Association Rule.

Latar Belakang AR-MBA

Dewasa ini, penggunaan mesin pencatat dan pemroses transaksi berteknologi barcode telah

umum digunakan pada penjual eceran maupun kecil (toko atau swalayan). Dengan mesin ini,

penjual eceran dapat menyimpan data transaksinya dalam suatu basisdata transaksi. Tiap

informasi pada transaksi memuat tanggal dan item apa saja yang dibeli. Data ini disebut

sebagai basket data. Market Basket Analysis (MBA) merupakan studi mengenai analisis

basket data.

Salah satu metode yang banyak digunakan dalam MBA adalah association rule

mining yang bertujuan menemukan aturan-aturan asosiasi di antara himpunan besar data item

dalam basisdata transaksi. Apabila diimplementasikan dalam basis data transaksi, aturan-

aturan asosiasi ini akan sangat berguna dalam menentukan strategi bisnis seperti mendesain

katalog, menata layout, serta merancang kampanye pemasaran dan promosi.

Salah satu kemungkinan contoh dari asosiasi misalnya adalah bahwa 80% pelanggan

yang membeli produk A juga membeli produk B. Dalam hal ini produk A dan B disebut

dengan istilah frequent itemset. Dari frequent itemset tersebut kita dapat menentukan aturan

asosiasi antar item dalam frequent itemset .

Page 3: Modul Praktikum AR-MBA

UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

MATERI PRAKTIKUM

Fakultas : Teknologi Industri Pertemuan ke : 11 Jurusan/Program Studi : Teknik Industri Modul ke : 4 Kode Mata Kuliah : 52224603 Jumlah Halaman : 29 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2015

Menggali aturan asosiasi dari basis data transaksi bukan merupakan masalah trivial.

Pertama, jumlah transaksi yang terdapat dalam basis data umumnya sangat banyak. Kedua,

jumlah kemungkinan frequent itemset meningkat secara eksponensial terhadap jumlah jenis

item. Terdapat berbagai algoritma yang dapat digunakan untuk aplikasi AR-MBA, antara lain

yaitu algoritma apriori dan algoritma FP-growth. Berikut penjelasan dari kedua algoritma

tersebut:

Algoritma Apriori

Algoritma apriori merupakan suatu algoritma untuk mengurangi ruang pencarian kombinasi

item, sehingga analisis dapat dilakukan dengan lebih cepat. Lebih lanjut lagi, aturan-aturan

yang dihasilkan dari algoritma apriori dapat diidentifikasi lagi untuk menentukan aturan

mana yang dapat memberikan informasi lebih banyak dengan menggunakan ukuran support

dan lift ratio. Kemudian, aturan-aturan asosiasi yang telah dihasilkan dapat digunakan

sebagai bahan pertimbangan untuk pengambilan keputusan dalam strategi bisnis. Adapun dua

proses utama yang dilakukan dalam algoritma Apriori (Han & Kamber, 2006), yaitu :

1. Join (penggabungan).

Pada proses ini setiap item dikombinasikan dengan item yang lainnya sampai tidak

terbentuk kombinasi lagi.

2. Prune (pemangkasan).

Pada proses ini, hasil dari item yang telah dikombinasikan tadi lalu dipangkas dengan

menggunakan minimum support yang telah ditentukan oleh user.

Page 4: Modul Praktikum AR-MBA

UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

MATERI PRAKTIKUM

Fakultas : Teknologi Industri Pertemuan ke : 11 Jurusan/Program Studi : Teknik Industri Modul ke : 4 Kode Mata Kuliah : 52224603 Jumlah Halaman : 29 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2015

Gambar 1. Proses iterasi algoritma apriori

Gambar diatas menunjukkan proses iterasi join dan prune dalam algoritma apriori.

Pada tabel Transaction D terdapat 4 data pembelian item, data pembelian tersebut kemudian

mengalami proses scan untuk mengelompokkan jumlah tiap item yang ada pada transaksi.

Setelah proses scan dilakukan maka proses selanjutnya ialah prune atau pemangkasan yang

dilakukan untuk memangkas item yang memiliki jumlah kurang dari 2, sehingga diperoleh

item 1, item 2, item 3 dan item 5 yang masih akan berlanjut pada proses berikutnya. Item 1,

item 2, item 3 dan item 5 kemudian mengalami proses join dimana item tersebut akan

bergabung satu sama lain menjadi satu kelompok item yang masing-masing berisi 2 item.

Setelah proses join dilakukan langkah selanjutnya adalah proses scan yang dilakukan untuk

mengetahui jumlah tiap kelompok item dalam transaksi, kemudian dilanjutkan dengan proses

prune untuk memangkas kelompok item yang memiliki jumlah kurang dari 2 sehingga

diperoleh kelompok item {1,3}, {2,3}, {2,5} dan {3,5}. Proses ini akan berulang sampai

tidak ada lagi kelompok item yang dapat dihasilkan dalam iterasi selanjutnya.

Dalam contoh diatas dapat dilihat bahwa algoritma apriori dapat mengurangi item

dengan adanya proses pemangkasan. Namun algoritma apriori memiliki kelemahan dimana

proses iterasi yang dilakukan memakan waktu yang cukup banyak sesuai banyaknya iterasi

yang dilakukan.

Page 5: Modul Praktikum AR-MBA

UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

MATERI PRAKTIKUM

Fakultas : Teknologi Industri Pertemuan ke : 11 Jurusan/Program Studi : Teknik Industri Modul ke : 4 Kode Mata Kuliah : 52224603 Jumlah Halaman : 29 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2015

Algoritma FP-Growth

Algoritma FP-Growth merupakan pengembangan dari algoritma Apriori. Sehingga

kekurangan dari algoritma Apriori berupa lamanya waktu yang dibutuhkan ketika banyaknya

proses iterasi yang dilakukan diperbaiki oleh algoritma FP-Growth. Frequent Pattern Growth

(FP-Growth) adalah salah satu alternatif algoritma yang dapat digunakan untuk menentukan

himpunan data yang paling sering muncul (frequent itemset) dalam sebuah kumpulan data

(David Samuel, 2008). Pada algoritma Apriori diperlukan generate candidate untuk

mendapatkan frequent itemsets. Akan tetapi, di algoritma FP-Growth generate candidate

tidak dilakuka karena FP-Growth menggunakan konsep pembangunan tree dalam pencarian

frequent itemsets. Hal tersebutlah yang menyebabkan algoritma FP-Growth lebih cepat dari

algoritma Apriori.

Karakteristik algoritma FP-Growth adalah struktur data yang digunakan adalah tree

yang disebut dengan FP-Tree. Dengan menggunakan FP-Tree, algoritma FP-growth dapat

langsung mengekstrak frequent Itemset dari FP-Tree. Penggalian itemset yang frequent

dengan menggunakan algoritma FP-Growth akan dilakukan dengan cara membangkitkan

struktur data tree atau disebut dengan FPTree. Metode FP-Growth dapat dibagi menjadi 3

tahapan utama yaitu sebagai berikut (Han & Kamber 2006):

1) Tahap pembangkitan conditional pattern base,

2) Tahap pembangkitan conditional FP-Tree, dan

3) Tahap pencarian frequent itemset.

Association Rule

Association dalam data mining adalah pekerjaan untuk menentukan mana atribut yang akan

didapatkan bersamaan. Dalam dunia bisnis lazim dikenal istilah affinity analysis. Tugas dari

asociation rule adalah mencari aturan yang tidak mengcover untuk mengukur hubungan

antara dua atau lebih atribut.

Association Rule adalah bentuk jika “kejadian sebelumnya” kemudian

“konsekuensinya”. (IF antecedent, THEN consequent). Bersamaan dengan perhitungan

Page 6: Modul Praktikum AR-MBA

UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

MATERI PRAKTIKUM

Fakultas : Teknologi Industri Pertemuan ke : 11 Jurusan/Program Studi : Teknik Industri Modul ke : 4 Kode Mata Kuliah : 52224603 Jumlah Halaman : 29 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2015

aturan support dan confidence. Pola asosiasi menjadi salah satu fungsionalitas yang paling

menarik dalam penggalian data (Kumar dan Wahidabanu, 2007). Association Rule adalah

teknik data mining untuk menemukan aturan assosiatif antara suatu kombinasi item. Contoh

dari Association Rule dari analisa pembelian di suatu pasar swalayan adalah bisa diketahui

berapa besar kemungkinan seorang pembeli membeli roti bersamaan dengan susu. Dengan

pengetahuan tersebut Pemilik pasar swalayan dapat mengatur penempatan barangnya atau

merancang kampanye pemasaran dengan memakai kupon diskon untuk kombinasi barang

tertentu (Wiwin Suwarningsih, 2008).

Menurut Leo Susanto (2003) penggalian kaidah asosiasi mempunyai peranan penting

dalam proses pengambilan keputusan. Salah satu contoh penerapan Association Rule adalah

Market Basket Analysis. Association Rule menjadi terkenal karena aplikasinya untuk

menganalisa isi keranjang belanja di pasar swalayan, sehingga Association Rule juga sering

disebut dengan istilah Market Basket Analysis. Association Rule juga dikenal sebagai salah

satu teknik data mining yang menjadi dasar dari berbagai teknik data mining lainnya.

Konsep Market Basket Analysis

Gambar 2. Ilustrasi Penggunaan MBA

Market Basket Analysis merupakan salah satu contoh penerapan Association Rule.

Untuk menyampaikan ide mendasar dari Market Basket Analysis, dimulai dengan melihat

gambar keranjangan belanjaan pada gambar 3.1 yang berisi bermacam-macam barang-barang

yang dibeli oleh seseorang disebuah supermarket. Keranjang ini berisi bermacam-macam

Page 7: Modul Praktikum AR-MBA

UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

MATERI PRAKTIKUM

Fakultas : Teknologi Industri Pertemuan ke : 11 Jurusan/Program Studi : Teknik Industri Modul ke : 4 Kode Mata Kuliah : 52224603 Jumlah Halaman : 29 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2015

barang-barang seperti roti, susu, sereal, telur, mentega, gula, dan sebagainya. Sebuah

keranjang memberitahukan kepada kita tentang apa saja yang dibeli oleh seorang konsumen

dalam satu waktu. Sebuah daftar belanjaan yang lengkap yang diperoleh dari semua

konsumen memberikan kita informasi yang sangat banyak, dan ini dapat menjelaskan barang-

barang apa saja yang paling penting dari bisnis penjualan yaitu ”apa barang yang dibeli oleh

konsumen dan kapan”.

Setiap konsumen membeli seperangkat barang-barang yang berbeda, dalam jumlah

yang berbeda, dan dalam waktu yang berbeda. Market Basket Analysis menggunakan

informasi apa yang dibeli oleh konsumen-konsumen untuk menyediakan tanda/informasi

yaitu siapa mereka dan mengapa mereka melakukan pembelian tersebut? Market Basket

Analysis menyediakan pengertian tentang barang dagangan dengan memberitahukan kepada

kita produk-produk mana yang memungkinkan untuk dibeli secara bersamaan dan produk

mana yang lebih disetujui untuk di promosikan. Karena dalam Market Basket Analysis tidak

hanya memahami kuantitas dari item yang dibeli dalam keranjang itu, tapi bagaimana item

yang dibeli dalam hubungannya satu dengan yang lain. Informasi ini dapat digunakan dalam:

1. Lebih menguntungkan periklanan dan promosi. Market Basket Analysis

menggunakan iklan dan promosi agar lebih memahami bagaimana pembeli

menanggapi dan berkomunikasi atas produk-produk yang ditawarkan, karena tujuan

dariVretailer adalah ”Bagaimana mengubah penjualan ini? Apa lagi yang dijual dan

apaVyang diiklankan?”.

2. Penargetan yang lebih tepat dalam mengembalikan ROI (Return of Investment).

Market Basket Analysis digunakan untuk mengoptimalkan kampanye dan promosi

untuk peningkatan penjualan dan margin dengan penargetan lebih tepat.

3. Loyalitas kartu promosi dengan analisis longitudinal. Longitudinal pengguna Market

Basket Analysis memungkinkan pengecer untuk membeli karakter perilaku

pelanggan seiring waktu. Retailer menggunakan kartu loyalitas pelanggan untuk

menangkap lifecycle data sehingga mereka dapat menganalisis pelanggan dari masa

pembelian perilaku seperti belanja. Misalnya, satu mainan pengecer menjelaskan

Page 8: Modul Praktikum AR-MBA

UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

MATERI PRAKTIKUM

Fakultas : Teknologi Industri Pertemuan ke : 11 Jurusan/Program Studi : Teknik Industri Modul ke : 4 Kode Mata Kuliah : 52224603 Jumlah Halaman : 29 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2015

bahwa ia tidak masuk akal untuk menjual satu mesin permainan (dengan sedikit

margin) kecuali pelanggan yang juga membeli aksesoris dan perangkat lunak

permainan (tinggi dengan margin). Mereka menggunakan Market Basket Analysis

terhadap loyalitas kartu data mereka secara keseluruhan untuk menentukan margin

pada video game dan penjualan untuk membuat ingatan promosi pelanggan dan

mempengaruhi pembeli untuk membeli permainan dan aksesoris dari mereka dan

tidak dari pengecer lain.

4. Menentukan tata letak toko yang baru (new store layouts) atau menarik lebih banyak

lalu lintas ke toko, menetapkan produk-produk mana yang akan diletakan dalam

tempat yang khusus. Market Basket Analysis juga menggunakan ruang untuk

meningkatkan perencanaan dan visual merchandising lintas untuk meningkatkan

penjualan.

5. Mengidentifikasi ketika persoalannya berpasangan/kupon (issue coupons). Untuk

meningkatkan penjualan atau menghabiskan barang yang menjadi inventory.

Definisi Market Basket Analysis

Bebrapa definisi dari MBA adalah sebagai berikut:

Market Basket Analysis adalah teknik matematis yang biasa digunakan oleh

marketing yang profesional untuk menyatakan kesamaan antara produk individu

atau produk kelompok.

Market Basket Analysis berkenaan dengan sekumpulan permasalahan bisinis yang

berkaitan untuk mengetahui point of sale dari data transaksi.

Market Basket Analysis adalah istilah umum untuk metodologi yang mempelajari

tentang komposisi keranjang belanjaan yang dibeli oleh rumah tangga selama 1 kali

berbelanja.

Market Basket Analysis adalah kumpulan kombinasi produk yang dibeli bersamaan.

Market Basket Analysis adalah analisis kecenderungan suatu item terbeli oleh

costumer yang sama pada waktu yang bersamaan.

Page 9: Modul Praktikum AR-MBA

UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

MATERI PRAKTIKUM

Fakultas : Teknologi Industri Pertemuan ke : 11 Jurusan/Program Studi : Teknik Industri Modul ke : 4 Kode Mata Kuliah : 52224603 Jumlah Halaman : 29 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2015

Tiga Level Market Basket Data

Market Basket Data adalah data transaksi yang menjelaskan tiga perbedaan entitas yang

mendasar yaitu :

1. Customers

2. Orders/pembelian

3. Items (barang-barang)

Dalam sebuah relational database, struktur data dari market basket data sering terlihat

sama. Data Struktur ini didalamnya terdapat empat entitas yang penting.

Gambar 3. Relational database

Permintaan adalah stuktur data yang fundamental untuk Market Basket Data.

Permintaan dapat berupa kejadian suatu pembelian oleh customer. Pembelian juga dapat

dilakukan melalui website, grosir, ataupun dari catalog. Semua ini dapat termasuk dalah

sebuah pembelian, pembelian tambahan, tipe dari pembayaran, dan data lain yang termasuk

dalam suatu transaksi. Beberapa transaksi diberikan identitas khusus. Namun ada beberapa

identitas khusus tersebut harus digabungkan dengan data yang lainnya. Sebagai contoh, kita

perlu mengkombinasikan empat lahan untuk mendapatkan empat identitas khusus untuk

penjualan di toko. Waktu dimulai ketika customer membayar, chain ID, store ID dan lane ID.

Barang dalam suatu pembelian digambarkan dalam line items. Data ini termasuk harga

pembayaran barang, jumlah barang, pajak yang harus dibayar, mungkin juga termasuk harga

Page 10: Modul Praktikum AR-MBA

UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

MATERI PRAKTIKUM

Fakultas : Teknologi Industri Pertemuan ke : 11 Jurusan/Program Studi : Teknik Industri Modul ke : 4 Kode Mata Kuliah : 52224603 Jumlah Halaman : 29 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2015

(yang digunakan untuk penghitungan margin). Meja barang (item table) biasanya mempunyai

hubungan dengan product reference table yang memberikan gambaran lebih jelas mengenai

produk yang ada. Gambaran informasinya termasuk hierachy produk dan informasi lain yang

mungkin memudahkan dalam menganalisis.

Customer table (meja customer) adalah meja pilihan dan harus bisa digunakan ketika

customer dapat di identifikasikan. Contoh, di dalam sebuah web site, ada sebuah syarat dalam

melakukan registrasi atau ketika customer menggunakan kartu anggota (affinity card) dalam

melakukan pembayaran. Walaupun customer table mempunyai area yang menarik, tetapi

yang paling penting adalah identitas tersebut. Sebab ini merupakan dasi dari sebuah transaksi

setiap waktu. Pengenalan customer setiap saat membuat mungkin untuk dikenali secara

cepat, seperti frekuensi pembelian yang dilakukan oleh customer. Tiga level dari market

basket data yang penting yang secara cepat dapat memahami permintaan. Ada beberapa dasar

pengukuran yaitu:

1. Berapa rata-rata pembelian yang dilakukan customer?

2. Berapa rata-rata barang yang khusus setiap pembelian?

3. Berapa rata-rata barang setiap pembelian?

4. Untuk produk tertentu, proporsi customer apa yang telah membeli produk?

5. Untuk produk tertentu, berapa rata-rata dari pembelian setiap customer yang

termasuk dalam barang?

6. Untuk produk tertentu, berapa rata-rata jumlah pembelian dalam suatu pembelian

ketika produk dibeli?

Pengukuran ini memberikan gambaran untuk sebuah bisnis. Dalam beberapa kasus, ada

beberapa pembeli yang berulang, sehingga proporsi dari sebuah pembelian setiap customer

mendekati 1. Saran ini digunakan suatu perusahaan untuk meningkatkan penjualan setiap

customers. Atau jumlah dari produk setiap pembelian mendekati 1, penyaranan akan

kesempatan untuk penjualan silang selama proses pembelian.

Hal ini dapat berguna untuk membandingkan pengukuran ini terhadap yang lainnya. Kita

telah menemukan bahwa jumlah pembelian dapat menjadi acuan untuk membedakan diantara

Page 11: Modul Praktikum AR-MBA

UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

MATERI PRAKTIKUM

Fakultas : Teknologi Industri Pertemuan ke : 11 Jurusan/Program Studi : Teknik Industri Modul ke : 4 Kode Mata Kuliah : 52224603 Jumlah Halaman : 29 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2015

para customer (costumer yang sesungguhnya/membeli lebih sering dari pada hanya sekedar

customer). Gambar 2 menggambarkan tentang hubungan antar customer (jumlah barang

khusus setiap pembelian) dengan seberapa dalam hubungannya (jumlah yang dibeli) untuk

customer yang membeli lebih dari 1 barang. Data ini bisa berasal dari retailer yang kecil.

Bulatan yang paling besar menunjukan jumlah customer yang membeli dua barang sekaligus

dalam waktu yang bersamaan., dalam gambar juga dapat dilihat bulatan yang besar

menunjukan jumlah customer yang membeli barang yang sama dalam dua kali pembelian.

Customers yang baik–yaitu mereka yang melakukan pembelian kembali berulang kali.

Cenderung untuk membeli bermacam-macam barang dalam jumlah besar. Walaupun,

beberapa dari mereka kembali dan membeli barang yang sama sepeti ketika mereka pertama

kali membeli. Bagaimana retailer dapat mendorong customers untuk datang kembali dan

membeli lebih dan juga barang yang berbeda? Market Basket Analysis tidak dapat menjawab

pertanyaan ini, tetapi Market Basket Analysis dapat sedikit dorongan untuk meminta itu dan

mungkin menbeikan isyarat yang dapat membantu.

Support dan Confidence

Penting tidaknya suatu aturan assosiatif dapat diketahui dengan dua parameter,

support (nilai penunjang) yaitu persentase kombinasi item tersebut dan confidence (nilai

kepastian) yaitu kuatnya hubungan antar item dalam aturan assosiatif. Aturan assosiatif

biasanya dinyatakan dalam bentuk :

Contoh perhitungan diatas memiliki arti sebagai berikut :

50% dari transaksi di database yang memuat item pensil dan buku juga memuat item

penghapus. Sedangkan 40% dari seluruh transaksi yang ada di database memuat ketiga

item.

Atau dapat juga diartikan sebagai berikut :

{Pensil, Buku} → {Penghapus}

(support = 40%, confidence =50%)

Page 12: Modul Praktikum AR-MBA

UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

MATERI PRAKTIKUM

Fakultas : Teknologi Industri Pertemuan ke : 11 Jurusan/Program Studi : Teknik Industri Modul ke : 4 Kode Mata Kuliah : 52224603 Jumlah Halaman : 29 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2015

Seorang konsumen yang membeli pensil serta buku memiliki kemungkinan 50% untuk

membeli barang lain yaitu penghapus, dan aturan ini cukup signifikan karena mewakili

40% dari catatan transaksi yang ada.

Analisis asosiasi didefinisikan suatu proses untuk menemukan semua aturan assosiatif yang

memenuhi syarat minimum untuk support (minimum support) dan syarat minimum untuk

confidence (minimum confidence).

Metode Dasar Association Rule

Metodologi dasar analisis asosiasi terbagi menjadi dua tahap :

1. Analisa pola frekuensi tinggi

Tahap ini mencari kombinasi item yang memenuhi syarat minimum dari nilai support dalam

database, yang dapat dirumuskan sebagai berikut:

Contohnya pada database transaksi belanja pasar swalayan berikut:

Tabel 1. Data Transaksi

Diketahui bahwa jumlah transaksi yang memuat {pensil, buku} ada 4 (support 80%),

sedangkan jumlah transaksi yang memuat {pensil, buku, penghapus} ada 2 (support 40%),

transaksi yang memuat {amplop} hanya 1 (support 20%) dan sebagainya. Bila ditetapkan

syarat minimum dari nilai support untuk pola frekuensi tinggi dalam contoh ini adalah 30%,

diperoleh pola frekuensi tinggi yang memenuhi syarat minimum nilai support adalah :

Page 13: Modul Praktikum AR-MBA

UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

MATERI PRAKTIKUM

Fakultas : Teknologi Industri Pertemuan ke : 11 Jurusan/Program Studi : Teknik Industri Modul ke : 4 Kode Mata Kuliah : 52224603 Jumlah Halaman : 29 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2015

Tabel 2. Data Transaksi dengan Frekuensi Tertinggi

2. Pembentukan aturan assosiatif

Setelah semua pola frekuensi tinggi ditemukan, barulah dicari aturan assosiatif yang

memenuhi syarat minimum untuk confidence dengan menghitung confidence aturan assosiatif

A→ B dengan menggunakan rumus berikut :

Bila syarat minimum untuk confidence dari contoh diatas adalah 50% maka salah satu contoh

aturan assosiatif yang dapat ditemukan adalah : {Penggaris, Penghapus} → {Pensil, Buku}

dengan nilai confidence:

Aturan assosiatif lain yang dapat ditemukan diantaranya adalah :

Tabel 3. Tabel Association Rule

Page 14: Modul Praktikum AR-MBA

UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

MATERI PRAKTIKUM

Fakultas : Teknologi Industri Pertemuan ke : 11 Jurusan/Program Studi : Teknik Industri Modul ke : 4 Kode Mata Kuliah : 52224603 Jumlah Halaman : 29 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2015

3. Lift / Improvement Ratio

Lift Ratio adalah parameter penting selain support dan confidence dalam association rule. Lift

Ratio mengukur seberapa penting rule yang teleh terbentuk berdasarkan nilai support dan

confidence. Lift Ratio merupakan nilai yang menunjukkan kevalidan proses transaksi dan

memberikan informasi apakah benar produk A dibeli bersamaan dengan produk B. Lift /

Improvement Ratio dapat dihitung dengan rumus:

Sebuah transaksi dikatakan valid jika mempunyai nilai Lift / Improvement lebih dari 1, yang

berarti bahwa dalam transaksi tersebut, produk A dan B benar-benar dibeli secara bersamaan.

Pemanfaatan Aturan Asosiasi

Sesuai namanya, aturan asosiasi yang dihasilkan dalam proses Market Basket Analysis

umumnya digunakan pada bisnis retail. Untuk bagian pemasaran, peningkatan penjualan

dapat dicapai dengan mengorganisasikan ulang item-item sehingga item-item yang terjual

bersama-sama selalu ditemukan bersama. Hal ini akan memicu pembelian dan membantu

memastikan pelanggan untuk membeli sebuah item tidak lupa untuk membelinya karena

tidak melihatnya. Organisasi retail juga dapat memberikan kupon diskon untuk pembelian

item B jika pelanggan membeli item A (jika aturan asosiasi A => B merupakan aturan

asosiasi yang kuat).

Situs e-commerce juga dapat menggunakan aturan asosiasi untuk memberikan saran

(recommender system/suggestive sell) bagi pembeli berdasarkan item-item apa saja yang

sudah berada dalam keranjang belanja (shopping cart) mereka. Situs e-commerce terkenal

seperti Amazon.com menggunakan sistem pemberi saran ini untuk meningkatkan penjualan.

Untuk pemasaran langsung, promosi kepada pelanggan yang sudah ada lebih disukai, karena

data pembelian mereka telah diketahui. Perusahaan telah memiliki data para pelanggan dalam

basis datanya, dan mengetahui informasi yang signifikan mengenai mereka. Setelah

Page 15: Modul Praktikum AR-MBA

UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

MATERI PRAKTIKUM

Fakultas : Teknologi Industri Pertemuan ke : 11 Jurusan/Program Studi : Teknik Industri Modul ke : 4 Kode Mata Kuliah : 52224603 Jumlah Halaman : 29 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2015

menjalankan Market Basket Analysis, staf pemasaran dapat menghubungi pelanggan atau

mengirimkan katalog produk untuk mempromosikan produk yang kira-kira akan menarik

untuk mereka beli dengan berdasarkan catatan riwayat pembelian mereka. Amazon.com juga

menggunakan sistem ini. Perusahaan tersebut mengirimkan e-mail kepada pelanggan untuk

menawarkan produk-produk yang kemungkinan menarik untuk mereka beli dengan melihat

produk apa saja yang telah mereka beli sebelumnya.

Selain dalam bisnis retail, Market Basket Analysis juga dapat diaplikasikan dalam

bidang-bidang yang lain. Market Basket Analysis dapat digunakan dalam spam filtering,

fraud detection (pendeteksi kecurangan, dalam klaim asuransi misalnya), analisis pembelian

kartu kredit, analisis pola panggilan telepon, analisis penggunaan layanan telekomunikasi,

dan sebagainya.

Situs Google Reader yang merupakan aplikasi web di mana pengguna dapat

berlangganan feed dari situs-situs berita atau blog (pengguna akan dapat mengetahui apakah

sebuah situs sudah di-update atau belum tanpa harus mengunjungi masing-

masing situs) juga menggunakan Market Basket Analysis. Aturan asosiasi yang dihasilkan

bersama daftar situs yang dilanggani feed-nya digunakan untuk memberikan saran bagi

pengguna mengenai situs lain yang kira-kira menarik untuk ditambahkan dalam daftar feed.

Page 16: Modul Praktikum AR-MBA

UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

MATERI PRAKTIKUM

Fakultas : Teknologi Industri Pertemuan ke : 11 Jurusan/Program Studi : Teknik Industri Modul ke : 4 Kode Mata Kuliah : 52224603 Jumlah Halaman : 29 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2015

Gambar 4. Flowchart Tahapan MBA

Page 17: Modul Praktikum AR-MBA

UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

MATERI PRAKTIKUM

Fakultas : Teknologi Industri Pertemuan ke : 11 Jurusan/Program Studi : Teknik Industri Modul ke : 4 Kode Mata Kuliah : 52224603 Jumlah Halaman : 29 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2015

Studi Kasus

Cara mengolah data AR-MBA menggunakan software rapidminer. Contoh data yang dimiliki

adalah sebagai berikut:

Tabel 3. Sampel data

No Dept 1 Dept 2 Dept 3 Dept 4 Dept 5 Dept 6 Dept 7 Dept 8

1 1 1 0 0 0 0 0 0

2 1 0 1 0 1 0 1 0

3 1 1 0 0 1 0 0 0

4 1 1 0 0 0 0 0 0

5 1 1 0 0 0 0 0 0

6 1 1 0 0 0 0 0 0

7 1 0 0 0 0 0 1 0

8 1 1 0 0 0 0 0 0

9 1 1 0 0 0 0 0 0

10 0 0 1 0 0 0 1 0

11 1 1 0 0 0 0 0 0

12 1 1 0 0 1 0 0 0

13 1 1 0 0 0 0 0 0

14 1 0 0 0 0 0 1 0

15 1 1 0 0 0 0 1 0

16 1 1 0 0 0 0 0 0

17 0 0 1 0 0 0 1 0

18 1 1 0 0 1 0 0 0

19 1 0 0 0 0 0 1 0

20 1 1 0 0 1 0 1 0

Page 18: Modul Praktikum AR-MBA

UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

MATERI PRAKTIKUM

Fakultas : Teknologi Industri Pertemuan ke : 11 Jurusan/Program Studi : Teknik Industri Modul ke : 4 Kode Mata Kuliah : 52224603 Jumlah Halaman : 29 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2015

Langkah-langkah yang dilakukan dalam software adalah sebagai berikut:

1. Buka software rapid miner, klik New Process

2. Pilih File – Import Data – Import Excel Sheet…

3. Kemudian cari data excel tersebut di dalam computer, pilih, klik Next

Gambar 5. Membuka data

Klik Next

Gambar 6. Data import step 1

Page 19: Modul Praktikum AR-MBA

UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

MATERI PRAKTIKUM

Fakultas : Teknologi Industri Pertemuan ke : 11 Jurusan/Program Studi : Teknik Industri Modul ke : 4 Kode Mata Kuliah : 52224603 Jumlah Halaman : 29 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2015

4. Klik Next

Gambar 7. Data import step 2

5. Klik Next

Gambar 8. Data import step 3

Page 20: Modul Praktikum AR-MBA

UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

MATERI PRAKTIKUM

Fakultas : Teknologi Industri Pertemuan ke : 11 Jurusan/Program Studi : Teknik Industri Modul ke : 4 Kode Mata Kuliah : 52224603 Jumlah Halaman : 29 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2015

6. Klik Next

Gambar 9. Data import step 4

7. Simpan data di folder latihan1 dengan nama training

Gambar 10. Data import step 5

Page 21: Modul Praktikum AR-MBA

UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

MATERI PRAKTIKUM

Fakultas : Teknologi Industri Pertemuan ke : 11 Jurusan/Program Studi : Teknik Industri Modul ke : 4 Kode Mata Kuliah : 52224603 Jumlah Halaman : 29 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2015

8. Klik Finish, akan muncul output seperti gambar di bawah ini

Gambar 11. Output import data

9. Kemudian drag file training ke dalam kotak Main Process

Gambar 12. Drag training file

Page 22: Modul Praktikum AR-MBA

UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

MATERI PRAKTIKUM

Fakultas : Teknologi Industri Pertemuan ke : 11 Jurusan/Program Studi : Teknik Industri Modul ke : 4 Kode Mata Kuliah : 52224603 Jumlah Halaman : 29 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2015

10. Cari Select Attributes, kemudian drag ke dalam kotak Main Process

Gambar 13. Drag select attribute

Hubungkan training dengan Select Attributes

Gambar 14. Menghubungkan data training dengan select attribute

Page 23: Modul Praktikum AR-MBA

UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

MATERI PRAKTIKUM

Fakultas : Teknologi Industri Pertemuan ke : 11 Jurusan/Program Studi : Teknik Industri Modul ke : 4 Kode Mata Kuliah : 52224603 Jumlah Halaman : 29 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2015

11. Klik Select Attributes, ganti attribute filter by… dengan subset. Kemudian klik menu

Select Attributes di attributes. Pindahkan semua departemen ke dalam kotak sebelah

kanan

Gambar 15. Select Attributes: attributes

12. Cari Numerical to Binominal, kemudian drag ke dalam kotak Main Process

Gambar16. Proses drag Numerical to Binominal

Page 24: Modul Praktikum AR-MBA

UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

MATERI PRAKTIKUM

Fakultas : Teknologi Industri Pertemuan ke : 11 Jurusan/Program Studi : Teknik Industri Modul ke : 4 Kode Mata Kuliah : 52224603 Jumlah Halaman : 29 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2015

13. Cari Remap Binominals, kemudian drag ke dalam kotak Main Process

Gambar 17. Proses drag Remap Binominals

14. Hubungkan Select Attributes dengan Numerical to Binominal, dan Numerical to

Binominal dengan Remap Binominals. Kemudian ganti negative value dengan nilai 0

dan positive value dengan nilai 1

Gambar 18. Proses Numerical to Binominal, dan Numerical to Binominal dengan Remap

Binominals

Page 25: Modul Praktikum AR-MBA

UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

MATERI PRAKTIKUM

Fakultas : Teknologi Industri Pertemuan ke : 11 Jurusan/Program Studi : Teknik Industri Modul ke : 4 Kode Mata Kuliah : 52224603 Jumlah Halaman : 29 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2015

Cari FP-Growth, kemudian drag ke dalam kotak Main Process

Gambar 19. Proses drag FP-Growth

15. Cari Create Association Rules, kemudian drag ke dalam kotak Main Process. Lalu

hubungkan Remap Binominals ke FP-Growth dan FP-Growth (fre) ke Create

Association Rules

Gambar 20. Proses Create Assosiate Rules

Page 26: Modul Praktikum AR-MBA

UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

MATERI PRAKTIKUM

Fakultas : Teknologi Industri Pertemuan ke : 11 Jurusan/Program Studi : Teknik Industri Modul ke : 4 Kode Mata Kuliah : 52224603 Jumlah Halaman : 29 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2015

16. Hubungkan FP-Growth (exa) ke res pertama (sebelah kanan) dan Create Association

Rules (rul) ke res kedua (sebelah kanan)

Gambar 21. Proses menghubungkan FP-Growth ke ras pertama dan Create Association Rules

ke res kedua

17. Klik FP-Growth, ganti min support dengan nilai 0.05

Gambar 22. Min Support bernilai 0.05

Page 27: Modul Praktikum AR-MBA

UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

MATERI PRAKTIKUM

Fakultas : Teknologi Industri Pertemuan ke : 11 Jurusan/Program Studi : Teknik Industri Modul ke : 4 Kode Mata Kuliah : 52224603 Jumlah Halaman : 29 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2015

18. Klik Create Association Rules kemudian ganti min confidence dengan nilai 0.05

Gambar 23. Min Confidence bernilai 0.05

19. Lalu klik Run, akan muncul output seperti gambar di bawah ini

Gambar 24. Output

Page 28: Modul Praktikum AR-MBA

UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

MATERI PRAKTIKUM

Fakultas : Teknologi Industri Pertemuan ke : 11 Jurusan/Program Studi : Teknik Industri Modul ke : 4 Kode Mata Kuliah : 52224603 Jumlah Halaman : 29 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2015

20. Apabila nilai support diganti 0.2 kemudian klik Run, akan muncul output seperti

gambar di bawah ini

Gambar 25. Output apabila nilai support diganti 0.2

24. Rule yang valid adalah yang memiliki nilai Lift Ratio > 1

Gambar 26. Rule valid jika nilai Lift Ratio > 1

Page 29: Modul Praktikum AR-MBA

UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

MATERI PRAKTIKUM

Fakultas : Teknologi Industri Pertemuan ke : 11 Jurusan/Program Studi : Teknik Industri Modul ke : 4 Kode Mata Kuliah : 52224603 Jumlah Halaman : 29 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2015

Dari hasil output di atas, dapat diketahui rules sebagai berikut:

1. Dept1 akan terbeli bersama dengan dept2, dengan tingkat kepercayaan 64,9% dan

didukung oleh 50% dari data keseluruhan.

2. Dept2 akan terbeli bersama dengan dept1, dengan tingkat kepercayaan 79,4% dan

didukung oleh 50% dari data keseluruhan.

3. Dept1 akan terbeli bersama dengan dept5, dengan tingkat kepercayaan 27,3% dan

didukung oleh 21% dari data keseluruhan.

4. Dan seterusnya….

Page 30: Modul Praktikum AR-MBA

UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

MATERI PRAKTIKUM

Fakultas : Teknologi Industri Pertemuan ke : 11 Jurusan/Program Studi : Teknik Industri Modul ke : 4 Kode Mata Kuliah : 52224603 Jumlah Halaman : 29 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2015

REFERENSI

David Samuel. 2008. Penerapan Stuktur FP-Tree dan Algoritma FPGrowth dalam Optimasi

Penentuan Frequent Itemset. Institut Teknologi Bandung.

Han Jiawei, and M. Kamber. 2006. Data Mining: Concepts and Techniques, Morgan

Kaufmann, USA.

Wiwin Suwarningsih. 2008. Penerapan Association Rule Mining untuk Perancangan Data

Mining BDP (Barang Dalam Proses) Obat. Pusat Penelitian Informatika LIPI.

Page 31: Modul Praktikum AR-MBA

UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

MATERI PRAKTIKUM

Fakultas : Teknologi Industri Pertemuan ke : 11 Jurusan/Program Studi : Teknik Industri Modul ke : 4 Kode Mata Kuliah : 52224603 Jumlah Halaman : 29 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2015