algoritma apriori berbasis prinsip inklusi- eksklusi …
TRANSCRIPT
ALGORITMA APRIORI BERBASIS PRINSIP INKLUSI-
EKSKLUSI UNTUK PENCARIAN FREQUENT ITEMSET
PADA ANALISIS KERANJANG BELANJA
TESIS
NIM : 14001692
Nama : Lusa Indah Prahartiwi
PROGRAM PASCASARJANA MAGISTER ILMU KOMPUTER
SEKOLAH TINGGI MANAJEMEN INFORMATIKA DAN KOMPUTER
NUSA MANDIRI
JAKARTA
2016
ii Program Pascasarjana Magister Ilmu Komputer STMIK Nusa Mandiri
ALGORITMA APRIORI BERBASIS PRINSIP INKLUSI-
EKSKLUSI UNTUK PENCARIAN FREQUENT ITEMSET
PADA ANALISIS KERANJANG BELANJA
TESIS
NIM : 14001692
Nama : Lusa Indah Prahartiwi
PROGRAM PASCASARJANA MAGISTER ILMU KOMPUTER
SEKOLAH TINGGI MANAJEMEN INFORMATIKA DAN KOMPUTER
NUSA MANDIRI
JAKARTA
2016
iii Program Pascasarjana Magister Ilmu Komputer STMIK Nusa Mandiri
iv Program Pascasarjana Magister Ilmu Komputer STMIK Nusa Mandiri
v Program Pascasarjana Magister Ilmu Komputer STMIK Nusa Mandiri
vi Program Pascasarjana Magister Ilmu Komputer STMIK Nusa Mandiri
KATA PENGANTAR
Puji syukur alhamdulillah, penulis panjatkan kehadirat Allah SWT yang
telah melimpahkan rahmat dan karunia-Nya sehingga pada akhirnya penulis dapat
menyelesaikan tesis ini tepat pada waktunya. Dimana tesis ini penulis sajikan
dalam bentuk buku yang sederhana. Adapun judul tesis yang penulis ambil
sebagai berikut “Algoritma Apriori Berbasis Prinsip Inklusi-Eksklusi Untuk
Pencarian Frequent Itemset Pada Analisis Keranjang Belanja “.
Tujuan penulisan tesis ini dibuat sebagai salah satu syarat untuk
mendapatkan gelar Magister Ilmu Komputer (M.Kom) pada Program
Pascasarjana Magister Ilmu Komputer Sekolah Tinggi Manajemen Informatika
dan Komputer Nusa Mandiri (STMIK Nusa Mandiri).
Penulis melakukan pencarian dan menganalisa berbagai macam sumber
referensi, baik dalam bentuk jurnal ilmiah, buku-buku literatur, internet, dan lain-
lain yang terkait dengan pembahasan pada tesis ini.
Penulis menyadari bahwa tanpa bimbingan dan dukungan dari semua
pihak dalam pembuatan tesis ini, maka penulis tidak dapat menyelesaikan tesis ini
tepat pada waktunya. Untuk itu ijinkanlah penulis dalam kesempatan ini untuk
mengucapkan ucapan terima kasih yang sebesar-besarnya kepada :
1. Allah SWT yang selalu mencurahkan nikmat dan rahmatNya pada saya
sehingga saya dapat menyelesaikan tesis ini tepat pada waktunya.
2. Muchlas dan Fatmawati(Orang tua) yang selalu memberikan dukungan
material dan moral kepada penulis
3. Bapak Romi Satria Wahono, M.Eng, Ph.D selaku pembimbing tesis yang
telah menyediakan waktu, pikiran dan tenaga dalam membimbing penulis
dalam menyelesaikan tesis ini.
4. Kekasih hati Bramastyo Kusumo yang telah banyak membantu,
memberikan semangat dan doa untuk penulis dalam menyelesaikan tesis
ini.
5. Teman-teman penulis dari grup Inteligent System yang menyokong
dari kejauhan dengan memberikan sumbangsih ilmu yang bermanfaat
bagi penulis dalam penulisan tesis ini
vii Program Pascasarjana Magister Ilmu Komputer STMIK Nusa Mandiri
viii Program Pascasarjana Magister Ilmu Komputer STMIK Nusa Mandiri
ix Program Pascasarjana Magister Ilmu Komputer STMIK Nusa Mandiri
DAFTAR ISI
Halaman
SURAT PERNYATAAN ORISINALITAS ...... Error! Bookmark not defined.iii
HALAMAN PENGESAHAN .............................................................................. iiiv
KATA PENGANTAR ........................................................................................... vi
SURAT PERNYATAAN PERSETUJUAN PUBLIKASI KARYA ILMIAH
UNTUK KEPENTINGAN AKADEMIS ............................................................ viii
ABSTRAK ............................................................................................................. ix
ABSTRACT ........................................................... Error! Bookmark not defined.x
DAFTAR ISI .......................................................................................................... xi
DAFTAR TABEL ................................................................................................ xiii
DAFTAR GAMBAR ............................................................................................ xv
DAFTAR LAMPIRAN ........................................................................................ xiv
BAB I PENDAHULUAN ....................................................................................... 1
1.1 Latar Belakang Penelitian ............................................................................. 1
1.2 Identifikasi Masalah ...................................................................................... 3
1.3 Rumusan Masalah ......................................................................................... 3
1.4 Tujuan Penelitian ........................................................................................... 3
1.5 Manfaat Penelitian ......................................................................................... 3
1.6 Sistematika Penulisan .................................................................................... 4
BAB II LANDASAN TEORI ................................................................................. 5
2.1 Tinjauan Studi ............................................................................................... 5
2.1.1 Metode yang Diusulkan (Venkatachari, 2016) .... Error! Bookmark not
defined.5
2.1.2 Metode Yang Diusulkan (Wisaeng, 2014) .......... Error! Bookmark not
defined.8
2.2 Tinjauan Pustaka ......................................................................................... 12
2.2.1 Data Mining .......................................................................................... 12
2.2.2 Association Rules Mining .................. Error! Bookmark not defined.15
2.2.3 Metode Evaluasi Association Rules Mining ........ Error! Bookmark not
defined.18
x Program Pascasarjana Magister Ilmu Komputer STMIK Nusa Mandiri
2.3 Kerangka Pemikiran .................................................................................... 19
BAB III METODE PENELITIAN........................................................................ 21
3.1 Perancangan Penelitian ................................................................................ 21
3.2 Pengumpulan Data ...................................................................................... 22
3.3 Pengolahan Data Awal ................................................................................ 23
3.4 Metode Yang Diusulkan .............................................................................. 25
3.5 Eksperimen dan Pengujian Metode ............................................................. 27
3.6 Evaluasi Hasil .............................................................................................. 29
BAB IV HASIL DAN PEMBAHASAN .............................................................. 30
4.1 Eksperimen dan Pengujian Metode ............................................................. 30
4.1.1 Metode Apriori pada Dataset Supermarket ......... Error! Bookmark not
defined.30
4.1.2 Metode Apriori pada Dataset Online Retail ........ Error! Bookmark not
defined.34
4.1.4 Metode FP-Growth pada Dataset Online Retail .. Error! Bookmark not
defined.36
4.1.5 Metode Apriori Berbasis Prinsip Inklusi-Eksklusi pada Dataset
Supermarket ................................................................................................... 37
4.1.6 Metode Apriori Berbasis Prinsip Inklusi-Eksklusi pada Dataset Online
Retail .............................................................................................................. 44
4.2 Pembahasan ................................................................................................. 49
4.2.1 Hasil Pengukuran Kinerja Metode ........................................................ 49
4.2.2 Perbandingan Kinerja Metode .............................................................. 50
4.3 Implikasi Penelitian ..................................................................................... 52
BAB V PENUTUP ................................................................................................ 53
5.1 Kesimpulan .................................................................................................. 53
5.2 Saran ............................................................................................................ 54
DAFTAR PUSTAKA ........................................................................................... 55
LAMPIRAN .......................................................................................................... 58
DAFTAR RIWAYAT HIDUP ............................................................................ 104
xi Program Pascasarjana Magister Ilmu Komputer STMIK Nusa Mandiri
DAFTAR TABEL
Halaman
Tabel 2.1 Rangkuman Penelitian Terkait .............................................................. 11
Tabel 3.1 Dataset Supermarket ............................................................................. 23
Tabel 3.2 Dataset Online Retail ............................................................................ 23
Tabel 3.3 Dataset Supermarket Setelah Penghapusan Atribut .... Error! Bookmark
not defined.24
Tabel 3.4 Dataset Online Retail Setelah Penghapusan Atribut ... Error! Bookmark
not defined.25
Tabel 3.5 Spesifikasi Komputer yang Digunakan................ Error! Bookmark not
defined.28
Tabel 4.1 Hasil Scan Data 1-Itemset (Apriori) pada Dataset Supermarket ... Error!
Bookmark not defined.30
Tabel 4.2 Hasil Pemangkasan Scan Data 1-Itemset (Apriori) pada Dataset
Supermarket .......................................................................................................... 31
Tabel 4.3 Hasil Scan Data 2-Itemset (Apriori) pada Dataset Supermarket .......... 32
Tabel 4.4 Aturan Final (Apriori) pada Dataset Supermarket ................................ 33
Tabel 4.5 Hasil Eksperimen Metode Apriori pada Dataset Supermarket
Menggunakan Tools Tanagra 1.4.50 ..................................................................... 33
Tabel 4.6 Hasil Eksperimen Metode Apriori pada Dataset Online Retail
Menggunakan Tools Tanagra 1.4.50 ..................................................................... 34
Tabel 4.7 Hasil Scan Data 1-Itemset (Metode yang Diusulkan) pada Dataset
Supermarket .......................................................................................................... 37
Tabel 4.8 Hasil Pemangkasan Scan Data 1-itemset (Metode yang Diusulkan) pada
Dataset Supermarket .......................................... Error! Bookmark not defined.38
Tabel 4.9 Hasil Pemangkasan Itemset (Metode yang Diusulkan) pada Dataset
Supermarket .......................................................................................................... 39
xii Program Pascasarjana Magister Ilmu Komputer STMIK Nusa Mandiri
Tabel 4.10 Interval List 2-Itemset pada dataset Supermarket ..... Error! Bookmark
not defined.41
Tabel 4.11 Interval List 3-Itemset pada Dataset Supermarket .... Error! Bookmark
not defined.42
Tabel 4.12 Proses Pencarian Frequent itemset pada Dataset Supermarket .... Error!
Bookmark not defined.43
Tabel 4.13 Hasil Scan Data 1-Itemset (Metode yang Diusulkan) pada Dataset
Online Retail ......................................................................................................... 45
Tabel 4.14 Hasil Pemangkasan Itemset (Metode yang Diusulkan) pada Dataset
Online Retail ......................................................................................................... 45
Tabel 4.15 Interval List pada Dataset Online Retail ............ Error! Bookmark not
defined.47
Tabel 4.16 Proses Pencarian Frequent Itemset pada Dataset Online Retail ......... 48
Tabel 4.17 Hasil Pengukuran Kinerja Metode Asosiasi Menggunakan Dataset
Supermarket .......................................................................................................... 50
Tabel 4.18 Hasil Pengukuran Kinerja Metode Asosiasi Menggunakan Dataset
Online Retail ......................................................................................................... 50
Tabel 4. 19 Perbandingan Lift ratio Metode Apriori Berbasis Prinsip Inklusi-
Eksklusi dengan Metode Lain ............................................................................... 51
xiii Program Pascasarjana Magister Ilmu Komputer STMIK Nusa Mandiri
DAFTAR GAMBAR
Halaman
Gambar 2.1 Metode yang Diusulkan (Venkatachari, 2016) ................................... 6
Gambar 2.2 Flowchart Metode yang Diusulkan (Venkatachari, 2016) .................. 7
Gambar 2.3 Metode yang Diusulkan (Wisaeng, 2014) ........................................... 9
Gambar 2.4 Flowchart Metode yang Diusulkan (Wisaeng, 2014)........................ 10
Gambar 2.5 Model Data Untuk Data Keranjang Belanja ..................................... 15
Gambar 2.6 Kerangka Pemikiran Pemikiran ........................................................ 20
Gambar 3.1 Metode Penelitian .............................................................................. 22
Gambar 3.2 Metode yang Diusulkan .................................................................... 25
Gambar 3.3 Flowchart Metode yang Diusulkan ................................................... 26
Gambar 3.4 Eksperimen dan Pengujian Metode ................................................... 28
Gambar 4.1 Proses Eksperimen Metode FP-Growth pada Dataset Supermarket
Menggunakan Tools Rapid Miner ........................................................................ 35
Gambar 4.2 Hasil Eksperimen Algoritma FP-Growth pada Dataset Supermarket
menggunakan Tools Rapid Miner ......................................................................... 35
Gambar 4.3 Proses Eksperimen Metode FP-Growth pada Dataset Online Retail
Menggunakan Tools Rapid Miner ........................................................................ 36
xiv Program Pascasarjana Magister Ilmu Komputer STMIK Nusa Mandiri
Gambar 4.4 Hasil Eksperimen Algoritma FP-Growth pada Dataset Online Retail
menggunakan Tools Rapid Miner ......................................................................... 36
Gambar 4.5 FP Tree pada Dataset Supermarket ................................................... 40
Gambar 4.6 FP-Tree pada Dataset Online Retail .................................................. 46
Gambar 4.7 Diagram Perbandingan Lift ratio....................................................... 51
DAFTAR LAMPIRAN
Halaman
Lampiran 1 Dataset Supermarket .......................................................................... 58
Lampiran 2 Dataset Supermarket Setelah Penghapusan Atribut Error! Bookmark
not defined.67
Lampiran 3 Proses Scan Database 2-Itemset ........................................................ 76
Lampiran 4 Hasil Pemangkasan Itemset ............................................................... 77
Lampiran 5 Interval List 2-Itemset ....................................................................... 90
Lampiran 6 Interval List 3-Itemset ....................................................................... 97
Lampiran 7 Proses Pencarian Frequent Itemset pada Dataset Supermarket .. Error!
Bookmark not defined.98
Lampiran 8 Interval List pada dataset Online Retail ........... Error! Bookmark not
defined.100
Lampiran 9 Proses Pencarian Frequent Itemset pada Dataset Online Retail . Error!
Bookmark not defined.101