dr00119201406_fin-fp growth

6
PENEMUAN POLA PENERIMAAN DAN KELULUSAN MAHASISWA S1 FAKULTAS EKONOMI DAN BISNIS UNIVERSITAS BRAWIJAYA DENGAN MENGGUNAKAN ALGORITMA FP-GROWTH Meidi Dian Laksana Putra 1) , Dian Eka Ratnawati 2) , Marji 2) 1) Mahasiswa, 2) Dosen Pembimbing Program Studi Teknik Informatika/Ilmu Komputer, Program Teknologi Informasi dan Ilmu Komputer Universitas Brawijaya, Jalan Veteran No 8 Malang 65145, Jawa Timur, Indonesia email : [email protected] ABSTRAK Universitas Brawijaya menggunakan database sebagai media penyimpanan data-data mahasiswanya yang sangat banyak. Salah satu fakultas yang memiliki jumlah mahasiswa yang besar adalah Fakultas Ekonomi dan Bisnis (FEB). Besarnya jumlah mahasiswa ini karena daya tampung untuk penerimaan mahasiswa baru setiap tahunnya semakin besar. Dengan besarnya data yang ada, diperlukan penggunaan data mining untuk pendekatan mengolah, menggali dan menemukan informasi yang tersembunyi pada gudang data tersebut. Dengan didukung penggunaan algoritna FP-Growth (Frequent Pattern Growth) untuk mendapatkan pola penerimaan dan kelulusan. Dalam penelitian ini digunakan data induk mahasiswa FEB untuk mendapatkan pola penerimaan dan kelulusan dari mahasiswa. Asal daerah (Propinsi) merupakan salah satu atribut yang bisa dipakai untuk mendapatkan aspek penunjang dalam penerimaan. Dengan atribut-atribut yang ada diharapkan akan ditemukan tren penerimaan dan kelulusan dengan mencari pola dari penerimaan dan kelulusan.Tren yang ada pada proses penerimaan bisa menjadi dasar pengembangan pasar untuk penyaringan dan promosi ke daerah-daerah yang yangmemiliki tren baik pada FEB, sedangkan untuk tren yang didapat pada kelulusan dapat digunakan sebagai dasar pengembangan jumlah kuota untuk setiap jalur masuk sesuai dengan tren kelulusan yang ada. Dalam penelitian ini dihasilkan bahwa pada pola penerimaan didapat pola yang selalu muncul adalah S9P1 yang mempunyai nilai support 33,1, confidence 81,7 dan lift ratio 1,078. Sedangkan, pada pola kelulusan didapat pola yang selalu muncul adalah K2B1 yang mempunyai nilai support 42,92, confidence 80,05 dan lift ratio 1,139. Kata kunci : aturan asosiasi, Penggalian pola , FP-Growth Brawijaya University use database as media storage to save the data of its many students. One of the faculty who has many students is Economics and Business of Faculty (FEB). The big number of the students in this faculty is because the capacity for new students getting bigger for each year. Because of this may data, FEB need the use of data mining’s method to process, explode and find the hidden information in the data warehouse. The use of FP-Growth’s algorithm (Frequent Pattern Growth) is to get enrollment’s pattern and graduation’s pattern. This research use student’s data of FEB to get enrollment’s pattern and graduation’s pattern the student. Region where student come (province) is one of the attribute that can use to get support’s aspect in enrollment of the students. This attributes is expected to find the enrollment’s and graduation’s trend by look the pattern of enrollment and graduation. The trends of enrollment can be a basic of the market development for filter and promote FEB to regions where has a positive trend of FEB and the trends of graduation can be a basic of the quota development for every registration’s program. This research result the enrollment’s pattern which appear frequently is S9P1 that has support’s value 33,1, confidence 81,7 and lift ratio 1,078 and graduation’s pattern which appear frequently is K2B1 that has support’s value 42,92, confidence 80,05 and lift ratio 1,139. Keyword :Data Mining, Association Rule, FP-Growth 1. PENDAHULUAN Universitas Brawijaya menggunakan database sebagai media penyimpanan data-data mahasiswanya yang sangat banyak. Salah satu fakultas yang memiliki jumlah mahasiswa yang besar adalah Fakultas Ekonomi dan Bisnis (FEB). Besarnya jumlah mahasiswa ini karena daya tampung untuk penerimaan mahasiswa baru setiap tahunnya semakin besar. Dalam proses penerimaan, aspek utama adalah nilai dari calon mahasiswa tersebut, tetapi terdapat aspek-aspek penunjang dalam menentukan mahasiswa yang diterima, seperti ketika terdapat lebih dari satu calon mahasiswa yang memiliki nilai yang sama. Hal seperti ini akan menyulitkan pihak penyelenggara dalam menentukan calon mahasiswa yang diterima masuk apabila tidak diketahui aspek-aspek penunjang dalam penerimaan mahasiswa. Salah satu cara untuk mengetahui aspek penunjang adalah dengan mengetahui tren yang ada baik dalam proses penerimaan maupun kelulusan. Dalam database yang digunakan FEB terdapat banyak atribut didalamnya. Asal daerah (Propinsi) merupakan salah satu atribut yang bisa dipakai untuk mendapatkan aspek penunjang dalam penerimaan. Dengan atribut-atribut yang ada diharapkan akan ditemukan tren penerimaan dengan mencari pola dari penerimaan. Selain pola penerimaan, pola lain yang ingin digali adalah pola kelulusan. Atribut-atribut yang ada diharapkan akan menunjang didapatkannya tren dari kelulusan FEB. Diperlukan pendekatan atau metode pengolahan yang dapat memperbaiki efisiensi pengolahan dan penggalian data yang besar yang bisa menemukan dan menampilkan pola hubungan antar data, sehingga informasi yang tadinya tidak terlihat dapat ditampilkan dan menjadi informasi yang lebih berguna. Dalam penyelesaian penemuan pola atau informasi yang masih tersembunyi pada suatu gudang data atau

Upload: basiran-poeyink

Post on 07-Dec-2015

238 views

Category:

Documents


0 download

DESCRIPTION

Data Mining

TRANSCRIPT

Page 1: DR00119201406_FIN-fp growth

PENEMUAN POLA PENERIMAAN DAN KELULUSAN MAHASISWA S1 FAKULTAS

EKONOMI DAN BISNIS UNIVERSITAS BRAWIJAYA DENGAN MENGGUNAKAN ALGORITMA FP-GROWTH

Meidi Dian Laksana Putra1), Dian Eka Ratnawati2), Marji2)

1) Mahasiswa, 2) Dosen Pembimbing Program Studi Teknik Informatika/Ilmu Komputer, Program Teknologi Informasi dan Ilmu Komputer

Universitas Brawijaya, Jalan Veteran No 8 Malang 65145, Jawa Timur, Indonesia email : [email protected]

ABSTRAK

Universitas Brawijaya menggunakan database sebagai media penyimpanan data-data mahasiswanya yang sangat banyak. Salah satu fakultas yang memiliki jumlah mahasiswa yang besar adalah Fakultas Ekonomi dan Bisnis (FEB). Besarnya jumlah mahasiswa ini karena daya tampung untuk penerimaan mahasiswa baru setiap tahunnya semakin besar. Dengan besarnya data yang ada, diperlukan penggunaan data mining untuk pendekatan mengolah, menggali dan menemukan informasi yang tersembunyi pada gudang data tersebut. Dengan didukung penggunaan algoritna FP-Growth (Frequent Pattern Growth) untuk mendapatkan pola penerimaan dan kelulusan. Dalam penelitian ini digunakan data induk mahasiswa FEB untuk mendapatkan pola penerimaan dan kelulusan dari mahasiswa. Asal daerah (Propinsi) merupakan salah satu atribut yang bisa dipakai untuk mendapatkan aspek penunjang dalam penerimaan. Dengan atribut-atribut yang ada diharapkan akan ditemukan tren penerimaan dan kelulusan dengan mencari pola dari penerimaan dan kelulusan.Tren yang ada pada proses penerimaan bisa menjadi dasar pengembangan pasar untuk penyaringan dan promosi ke daerah-daerah yang yangmemiliki tren baik pada FEB, sedangkan untuk tren yang didapat pada kelulusan dapat digunakan sebagai dasar pengembangan jumlah kuota untuk setiap jalur masuk sesuai dengan tren kelulusan yang ada. Dalam penelitian ini dihasilkan bahwa pada pola penerimaan didapat pola yang selalu muncul adalah S9P1 yang mempunyai nilai support 33,1, confidence 81,7 dan lift ratio 1,078. Sedangkan, pada pola kelulusan didapat pola yang selalu muncul adalah K2B1 yang mempunyai nilai support 42,92, confidence 80,05 dan lift ratio 1,139. Kata kunci : aturan asosiasi, Penggalian pola , FP-Growth

Brawijaya University use database as media storage to save the data of its many students. One of the faculty who has many students is Economics and Business of Faculty (FEB). The big number of the students in this faculty is because the capacity for new students getting bigger for each year. Because of this may data, FEB need the use of data mining’s method to process, explode and find the hidden information in the data warehouse. The use of FP-Growth’s algorithm (Frequent Pattern Growth) is to get enrollment’s pattern and graduation’s pattern. This research use student’s data of FEB to get enrollment’s pattern and graduation’s pattern the student. Region where student come (province) is one of the attribute that can use to get support’s aspect in enrollment of the students. This attributes is expected to find the enrollment’s and graduation’s trend by look the pattern of enrollment and graduation. The trends of enrollment can be a basic of the market development for filter and promote FEB to regions where has a positive trend of FEB and the trends of graduation can be a basic of the quota development for every registration’s program. This research result the enrollment’s pattern which appear frequently is S9P1 that has support’s value 33,1, confidence 81,7 and lift ratio 1,078 and graduation’s pattern which appear frequently is K2B1 that has support’s value 42,92, confidence 80,05 and lift ratio 1,139.

Keyword :Data Mining, Association Rule, FP-Growth 1. PENDAHULUAN

Universitas Brawijaya menggunakan database sebagai media penyimpanan data-data mahasiswanya yang sangat banyak. Salah satu fakultas yang memiliki jumlah mahasiswa yang besar adalah Fakultas Ekonomi dan Bisnis (FEB). Besarnya jumlah mahasiswa ini karena daya tampung untuk penerimaan mahasiswa baru setiap tahunnya semakin besar. Dalam proses penerimaan, aspek utama adalah nilai dari calon mahasiswa tersebut, tetapi terdapat aspek-aspek penunjang dalam menentukan mahasiswa yang diterima, seperti ketika terdapat lebih dari satu calon mahasiswa yang memiliki nilai yang sama. Hal seperti ini akan menyulitkan pihak penyelenggara dalam menentukan calon mahasiswa yang diterima masuk apabila tidak diketahui aspek-aspek penunjang dalam penerimaan mahasiswa. Salah satu cara untuk mengetahui aspek penunjang adalah dengan mengetahui tren yang ada baik dalam proses

penerimaan maupun kelulusan. Dalam database yang digunakan FEB terdapat banyak atribut didalamnya. Asal daerah (Propinsi) merupakan salah satu atribut yang bisa dipakai untuk mendapatkan aspek penunjang dalam penerimaan. Dengan atribut-atribut yang ada diharapkan akan ditemukan tren penerimaan dengan mencari pola dari penerimaan. Selain pola penerimaan, pola lain yang ingin digali adalah pola kelulusan. Atribut-atribut yang ada diharapkan akan menunjang didapatkannya tren dari kelulusan FEB.

Diperlukan pendekatan atau metode pengolahan yang dapat memperbaiki efisiensi pengolahan dan penggalian data yang besar yang bisa menemukan dan menampilkan pola hubungan antar data, sehingga informasi yang tadinya tidak terlihat dapat ditampilkan dan menjadi informasi yang lebih berguna. Dalam penyelesaian penemuan pola atau informasi yang masih tersembunyi pada suatu gudang data atau

Page 2: DR00119201406_FIN-fp growth

disebut dengan Data Mining (Penggalian Data), banyak penelitian yang menggunakan algoritma Apriori, yaitu suatu algoritma yang sudah sangat terkenal dalam melakukan pencarian frequent itemset dengan menggunakan teknik association rules [2]. Akan tetapi dengan semakin besarnya data yang ada, algoritma ini menjadi kurang efekttif. Suatu algoritma pengembangan dari algoritma Apriori menjadi alternatif yang dapat digunakan. Algoritma itu adalah algoritma FP-Growth. Dengan pengembangan yang ada, algoritma ini dapat memperbaiki kekurangan yang ada pada algoritma Apriori yang biasa digunakan.

Penelitian ini bertujuan untuk mengetahui pola dari tingkat penerimaan dan kelulusan Fakultas Ekonomi dan Bisnis Universitas Brawijaya. Dengan penggalian pola ini diharapkan akan diketahui pengaruh dari minimum support dan minimum confidence terhadap pola yang dihasilkan. 2. METODE PENELITIAN 2.1 Data Mining

Data mining memiliki beberapa pandangan, seperti knowledge ataupun pattern recognition. Kedua istilah tersebut sebenarnya memiliki ketepatannya masing-masing. Istilah knowledge discovery atau penemuan pengatahuan tepat digunakan karena tujuan utama dari data mining memang untuk mendapatkan pengetahuan yang masih tersembuyi didalam bongkahan data. Istilah pattern recognition atau pengenalan pola pun tepat untuk digunakan karena pengetahuan yang hendak digali berbentuk pola-pola yang mungkin juga masih perlu digali dari dalam bongkahan data yang tengah dihadapi [11].

Data mining merupakan solusi yang mampu menemukan kandungan informasi yang tersembunyi berupa pola dan aturan dari sekumpulan data yang besar [4].

2.2 Association Rule Aturan asosiasi (association rules) merupakan

teknik data mining untuk menemukan aturan asosiatif antara kombinasi item. Analisa asosiasi ini menjadi dikenal banyak kalangan karena sering dipakai mngeanalisa kerangjang belanja swalayan (market basket analysis). Analisis asosiasi dipakai sebagai acuan dalam data mining. Salah satu tahap dari analisis asosiasi yaitu analisis pola frekuensi tinggi (frequent pattern mining) menarik perhatian banyak peneliti unutk menghasilkan algoritma yang efisien. Penting tidaknya suatu aturan asosiatif dapat diketahui dengan tiiga parameter, yaitu support (nilai penunjang) dan confidence (nilai kepastian), dan nilai Lift (nilai kekuatan). Support adalah persentase kombinasi item tersebut dalam database, confidence adalah kuatnya hubungan antar item dalam aturan asosiatif.

Metodologi dasar analisis asosiasi terbagi menjadi dua tahap, yaitu : a Analisa pola frekuensi tinggi

Tahap ini mencari kombinasi item yang memenuhi syarat minimum dari nilai support dalam database. Rumus perhitungan support dari item dapat dilihat pada persamaan (1) dan (2) .

(1)

(2)

b Pembentukan aturan asosiatif Setelah semua pola frekuensi tinggi

ditemukan, barulah dicari aturan asosiatif yang memenuhi syarat minimum untuk confidence dengan menghitung confidence aturan asosiatif A → B. Nilai confidence dari aturan A → B diperoleh dari rumus pada persamaan (3).

(3)

2.3 Algortima FP-Growth Frequent Pattern Growth (FP-Growth) adalah

algoritma yang mengadopsi devide dan conquer dalam proses mendapatkan frequent itemset. Devide merupakan tahap pembagian permasalahan yang besar menjadi permasalahan yang lebih kecil. Sedangkan conquer merupakan tahap pembagian secara terus-menerus sampai didapatkan bagian maasalah kecil yang lebih mudah untuk dipecah. Dalam penemuan frequent itemset, algoritma FP-Growth menggunakan FP-Tree (Frequent pattern Growth).

FP-Tree terdiri dari root yang diberi nilai null, subtree sebagai anak dari root, dan tabel frequent header. Node dalam FP-Tree mempunyai tiga informasi penting, yang terdiri dari label item, support count, dan pointer. Label item, menginformasikan jenis item dari node tersebut. Support count, menginformasikan jumlah lintasan transaksi yang melalui node tersebut. Pointer, merupakan penghubung node-node dengan label item yang sama antar lintasan.

Input : FP-Tree Tree Output : Rt sekumpulan lengkap pola frequent Method : FP-growth (Tree, null) Procedure : FP-growth (Tree, _) { 01: if Tree mengandung single path P; 02: then untuk tiap kombinasi (dinotasikan _) dari node-node dalam path do 03: bangkitkan pola _ _ dengan support dari node-node dalam _; 04: else untuk tiap a1 dalam header dari Tree do { 05: bangkitkan pola 06: bangun _ = a1 _ dengan support = a1. support 07: if Tree _ = _ 08: then panggil FP-growth (Tree, _) } }

Gambar 1. Pseudocode FP-Growth

2.4 Lift Ratio Lift Rasio merupakan ukuran dari tingkat

kekuatan pola yang dihasilkan. Pola yang mempunyai nilai lift rasio lebih besar dari 1, menunjukkan bahwa pola tersebut memiliki kekuatan dalam polanya. Semakin besar nilai lift rasio suatu pola, semakin besar pula tingkat kekuatan pola tersebut. Sedangkan untuk pola yang mempunyai nilai lift rasio kurang dari satu, kekuatan pola tersebut dianggap lemah. Nilai lift rasio didapatkan dari perhitungan antara nilai confidence dengan nilai benchmark confidence

Page 3: DR00119201406_FIN-fp growth

(confidence’). Rumus benchmark confidence dan lift ratio dapat dilihat pada persamaan (4) dan (5).

(4)

(5)

3. PERANCANGAN 3.1 Rancangan Sistem

Proses perancangan sistem dapat dilihat pada gambar 2.

Gambar 2. Diagram Alir Sistem

3.2 Pembangunan Tree Proses pembangunan tree dapat dilihat pada

gambar 3.

Gambar 3. Diagram Alir Proses Pembangunan

Tree Pembangunan tree dilakukan untuk

mendapatkan lintasan setiap node. Node yang ada pada tree merupakan item-item tiap transaksi yang ada. 3.3 Algoritma FP-Growth

Gambar 4. Diagram Alir Algortima FP-Growth

Sistem membentuk FP-Tree dari dataset, ketika FP-Tree sudah terbentuk maka akan dilakukan proses pemeriksaaan path. Jika bukan single path, dilakukan scan tree dari bawah ke atas untuk membangkitkan conditional pattern dari masing-masing item mulai dari item yang mempunyai jumlah kemunculan paling kecil. Selanjutnya, akan dibentuk tree dari masing-masing item. Jika tree single path, akan dilakukan proses generate subset dari tree tersebut.

4. HASIL DAN PEMBAHASAN

Tahap pengujian terdiri dari dua skenario, yaitu skenario pertama dilakukan dengan membandingkan hasil perhitungan manual dengan hasil aplikasi yang menggunakan data yang sama dengan data yang perhitungan manual. Skenario kedua dilakukan dengan memasukan nilai minimum support yang berbeda-beda kedalam sistem.

4.1 Skenario Pertama Pada saat skenario pertama data yang

dimasukan kedalam aplikasi adalah data yang sama saat peroses perhitungan manual. Hasil dari program akan dibandingkan dengan hasil perhitungan manual. Jika hasil pebandingannya terdapat perbedaan, kemungkinan ada kesalahan dalam program (source code), dengan ada hal ini perlu dilakukan perbaikan dan pengujian ulang agar program bisa berjalan sesuai dengan apa yang diharapkan. Tabel 1. Tabel Hasil Pencarian Itemset Perhitungan Manual Data Penerimaan

Itemset Jumlah Kemunculan P1 17 S9 8 PS1 7 B1 7 S2 7 B5 7 PS4 6 PS5 6 S3 4 PS5, B1 4 PS4, PI 5 PS1, S9 5 PS1, PI 7 S2, P1 6 B1, P1 5 B5, PS1 4 B5, S9 4 B5, P1 7 S9, P1 8 PS1, S9, P1 5 B5, PS1, P1 4 B5, S9, P1 4

Gambar 5. Hasil pencarian itemset penerimaan

pada aplikasi

Page 4: DR00119201406_FIN-fp growth

Pada tabel 1 dan gambar 5, dapat dilihat hasil dari pencarian penerimaan itemset antara aplikasi dengan perhitungan manual menunjukan hasil yang sama. Keduanya mengahasilkan 22 itemset yang terdiri dari 1-itemset sebanyak 9, 2-itemset sebanyak 10, dan 3-itemset sebanyak 3. Tabel 2. Tabel Hasil Analisa Pola Penerimaan dengan Perhitungan Manual

Itemset Frekuensi Support Confidence Lift Ratio PS4, P1 5 0,25 0,83 0,98 PS1, P1 7 0,35 1 1,18 S2, P1 6 0,3 0,86 1,01 B1, P1 5 0,25 0,71 0,83 B5, P1 7 0,35 1 1,18 S9, P1 8 0,4 1 1,176 PS1, S9, P1 5 0,25 1 2,5 B5, PS1, P1 4 0,2 1 2,857 B5, S9, P1 4 0,2 1 2,5

Gambar 6. Hasil analisa pola penerimaan dengan

aplikasi Pada tabel 2 dan gambar 6 menunjukkan

hasil analisa pola penerimaan antara perhitungan manual dan aplikasi menghasilkan analisa yang sama. Keduanya menghasilkan 9 pola yang memenuhi minimum confidence 70%. Tabel 3. Tabel Hasil Pencarian Itemset Perhitungan Manual Data Kelulusan

Itemset Frekuensi B1 16 S9 14 PS5 12 K3 11 K2 9 PS4 6 B2 4 PS4, S9 4 PS4, B1 5 K2, PS5 5 K2, S9 6 K2, B1 6 K3, PS5 7 K3, S9 8 K3, B1 10 PS5, S9 10 PS5, B1 10 S9, B1 12 K2, PS5, S9 4 K2, S9, B1 4 K3, PS5, S9 6 K3, PS5, B1 7 K3, S9, B1 8 PS5, S9, B1 8 PS4, S9, B1 4 K3, PS5, S9, B1 6

Gambar 7. Hasil pencarian itemset kelulusan pada

aplikasi

Pada tabel 3 dan gambar 7, dapat dilihat hasil dari pencarian itemset kelulusan antara aplikasi dengan perhitungan manual menunjukan hasil yang sama. Keduanya mengahasilkan 26 itemset yang terdiri dari 1-itemset sebanyak 7, 2-itemset sebanyak 11 dan 3-itemset sebanyak 7. Tabel 4. Tabel Hasil Analisa Pola Kelulusan dengan Perhitungan Manual

Itemset Frekuensi Support Confidence Lift ratio K3, S9 8 0,4 0,73 0,96 K3, B1 10 0,5 0,91 0,84 K3, S9, B1 8 0,4 0,73 1,22

Gambar 8. Hasil analisa pola kelulusan dengan

aplikasi Pada tabel 4 dan gambar 8 menunjukkan

hasil analisa pola kelulusan antara perhitungan manual dan aplikasi menghasilkan analisa yang sama. Keduanya menghasilkan 3 pola yang memenuhi minimum confidence 70%.

4.2 Skenario Kedua Pada skenario kedua, digunakan data

Fakultas Ekonomi dan Bisnis 5 tahun terakhir. Untuk data penerimaan mahasiswa didapat 4380 record dan untuk data kelulusan mahasiswa didapat 636 record. Kedua data ini dilakukan proses pemasukan minimum support berbeda-beda, mulai 5 dengan kelipatan 5 sampai tidak ada pola yang dihasilkan. Kemudian tiap minimum support diberikan pula minimum confidence mulai dari 60 untuk semua pola yang muncul sampai tidak ada pola yang muncul yang memenuhi nilai minimum confidence. Untuk nilai lift rato yang dipakai dari pola yang memenuhi minimum support dan minimum confidence adalah pola yang memiliki nilai lift ratio ≥ 1. 4.2.1. Pola Penerimaan

Pola penerimaan digunakan 4380 record data mulai dari data kelulusan tahun 2008 sampai 2012. Besar minimum support yang dimasukan dimulai dari dari 5, 10, 15, 20, 25, dan 30. Sedangkan, besar minimum confidence yang dimasukan pada tiap minimum support adalah 60, 70, dan 80.

Gambar 9. Grafik Perbandingan nilai minimum

support dengan jumlah rule penerimaan

0  10  20  30  40  50  

Rule  

Rule  

Page 5: DR00119201406_FIN-fp growth

Gambar 10. Grafik perbandingan minimum

support, confidence, dan jumlah rule penerimaan

Gambar 11. Gambar perbedaan jumlah rule saat

minimum support 5 dengan minimum confidence 60, 70 dan 80

Gambar 11 mengilustrasikan dengan minimum support yang sama akan menghasilkan jumlah rule yang berbeda saat pemasukan minimum confidence yang berbeda. Jumlah rule yang berbeda ini merupakan himpunan bagian dari hasil rule yang lain. Pada saat minimum confidence 80 yang menghasilkan 9 rule, 9 rule ini marupakan bagian dari 24 rule yang dihasilkan pada saat minimum confidence 70, begitu pula 24 rule itu merupakan bagian dari 29 rule yang dihasilkan saat minimum confidence 60, untuk rincian rule yang dihasilkan dapat dilihat pada lampiran C tabel C1, C2 dan C3. Himpunan bagian dari perbedaan jumlah rule ini dikarenakan nilai (support dan confidence) yang dimiliki tiap rule bervariasi dan tidak berubah-ubah. Nilai yang dimiliki tiap rule berasal dari perhitungan sesuai dengan rumus support dan confidence. Perhitungan nilai yang dimiliki oleh setiap rule dilakukan setelah tree terbentuk sehingga nilai-nilai ini tidak berubah jika tree-nya tidak berubah pula, tree yang dibentuk ditentukan oleh komposisi data yang dipakai. Sehingga, pada saat pemasukan minimum support dan minimum confidence akan mengambil rule yang memenuhi syarat atau batas yang telah ditentukan tanpa mengubah nilainya.

Gambar 12. Gambar perbedaan jumlah rule saat minimum support 30 dengan minimum confidence

60, 70 dan 80 Pada gambar 12 menunjukan pada saat minimum support 30 hanya menghasilkan 1 rule pada tiap minimum confidence (60, 70 dan 80). Rule yang dihasilkan sama yaitu S9 P1, rincian rule dapat

dilihat pada lampiran C tabel C16, C17 dan C18. Hal ini terjadi karena rule S9 P1 mempunyai nilai support ≥ 30% dan nilai confidence ≥ 80%. Sehingga, rule S9 P1 selalu muncul pada setiap pemasukan minimum support dan minimum confidence. 4.2.2. Pola Kelulusan

Pola kelulusan digunakan 636 record data mulai dari data kelulusan tahun 2008 sampai 2012. Besar minimum support yang dimasukan dimulai dari dari 5, 10, 15, 20, 25, 30 dan 35. Sedangkan, besar minimum confidence yang dimasukan pada tiap minimum support adalah 60, 70, dan 80.

Gambar 13. Grafik Perbandingan nilai minimum

support dengan jumlah rule kelulusan

Gambar 14. Grafik perbandingan minimum

support, confidence, dan jumlah rule penerimaan

Gambar 15. Gambar perbedaan jumlah rule saat

minimum support 5 dengan minimum confidence 40, 50, 60, 70 dan 80

Gambar 15 menunjukan bahwa dengan minimum support yang sama akan menghasilkan jumlah rule yang berbeda saat pemasukan minimum confidence yang berbeda. Jumlah rule yang berbeda ini merupakan himpunan bagian dari hasil rule yang lain. Pada saat minimum confidence 80 yang menghasilkan 1 rule, 1 rule ini marupakan bagian dari 3 rule yang dihasilkan pada saat minimum confidence 70, 3 rule itu merupakan bagian dari 8 rule yang dihasilkan saat minimum confidence 60, 8 rule ini merupakan bagian dari 13 rule yang dihasilkan pada saat minimum confidence 50, begitu pula 13 rule ini merupakan bagian dari 18 rule yang dihasilkan pada saat minimum confidence 40, untuk rincian rule yang dihasilkan dapat

0  10  20  30  40  

Mincof  60  

Mincof  70  

Mincof  80  

minimum  con8idence  60  =  29  rule  

minimum  con8idence  70  =  24  rule  

minimum  con8idence  80  

=  9  rule  

rule  S9-­‐>P1  

minimum  con8idence  60  =  1  rule  

minimum  con8idence  70  =  1  rule  

minimum  con8idence  80  =  1  rule  

0  10  20  30  40  50  

Rule  

Rule  

0  2  4  6  8  

Mincof  60  

Mincof  70  

minimum  con8idence  40  =  19  

rule  minimum  

con8idence  50  =  13  rule  minimum  

con8idence  60  =  8  rule  

minimum  con8idence  70  

=  3  rule  

minimum  con8idence  80  =  1  rule  

Page 6: DR00119201406_FIN-fp growth

dilihat pada lampiran D tabel D1, D2 , D3, D4 dan D5. Sama halnya seperti saat pencarian pola penerimaan, pada dasarnya nilai yang dimiliki tiap rule berasal dari perhitungan sesuai dengan rumus support dan confidence, perhitungan nilai yang dimiliki oleh setiap rule dilakukan setelah tree terbentuk sehingga nilai-nilai ini tidak berubah jika tree-nya tidak berubah pula, tree yang dibentuk ditentukan oleh komposisi data yang dipakai. Sehingga, pada saat pemsukan minimum support dan minimum confidence akan mengambil rule yang memenuhi syarat atau batas yang telah ditentukan tanpa mengubah nilainya.

Gambar 16. Gambar perbedaan jumlah rule saat minimum support 40 dengan minimum confidence

40, 50, 60, 70 dan 80 Pada gambar 16 menunjukan pada saat

minimum support 40 hanya menghasilkan 1 rule pada tiap minimum confidence (40, 50, 60, 70 dan 80). Rule yang dihasilkan sama yaitu K2 B1, rincian rule dapat dilihat pada lampiran D tabel D36, D37, D38, D39 dan D40. Hal ini terjadi karena rule K2 B1 mempunyai nilai support ≥ 40% dan nilai confidence ≥ 80%. Sehingga, rule K2 B1 selalu muncul pada setiap pemasukan minimum support dan minimum confidence. 5. KESIMPULAN

Dari hasil pengimplementasian dan analisis yang dilakukan, didapat kesimpulan mengenai pola yang didapat bahwa : 1. Pola dari penerimaan pada tahun 2008 -2012

dan pola dari kelulusan tahun 2008-2009 didapat rule yang sering muncul pada nilai confidence ≥60, ≥70 dan ≥80 tingkat kemunculannya didasarkan pada frekuensi kemunculannya sendiri. Frekuensi kemunculannya pola tergantung pada komposisi data tersebut, jumlah item pada komposisi data mempengaruhi banyaknya itemset yang mengandung item tersebut. Jumlah dari pola penerimaan yang dihasilkan sebanyak 29 pola, tetapi tidak semua pola itu selalu muncul pada setiap skenario, hanya satu pola yang memenuhi itu yaitu S9P1, jika mahasiswa masuk melalui seleksi SNMPTN maka berasal dari Jawa Timur. Sedangkan untuk jumlah pola kelulusan yang didapat sebanyak 8 pola, sama seperti pada pola penerimaan, pada pola kelulusan juga hanya satu pola yang selalu muncul pada setiap skenario yaitu K2B1, jika mahasiswa lulus dengan predikat Sangat memuaskan, maka mahasiswa tersebut berasal dari angkatan 2008.

2. Pola yang memiliki antecedent dan consequent pada pola penerimaan maupun kelulusan, semakin besar nilai miniminum support dan

confidence maka pola yang dihasilkan semakin berkurang. Tetapi pada pola penerimaan, komposisi data tidak seimbang, terjadi ketimpangan data, sehingga variasi kombinasi data lebih didominasi data yang mempunyai tingkat kemunculan yang tinggi. Sedangkan pada pola kelulusan, komposisi data cukup merata sehingga lebih banyak didapatkan kombinasi data yang lebih bervariasi

3. Berdasarkan pengujian yang dilakukan dengan menggunakan jumlah data yang berbeda (data penerimaan dan kelulusan) didapatkan bahwa pengaruh nilai minimum support dan minimum confidence terhadap pola yang dihasilkan tetap sama yaitu semakin besar nilai minimum support dan minimum confidence maka semakin sedikit pola yang dihasilkan, begitu pula sebaliknya. Sehingga, jumlah data tidak mempengaruhi kerja minimum support dan minimum confidence, jumlah data hanya mempengaruhi julah pola yang dihasilkan.

Daftar Pustaka [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14]

Biro Administrasi Akademik dan Kemahasiswaan. (2009). “Pedoman Pendidikan”. Malang: Universitas Brawijaya. Erwin. (2009). “Analisis Market Basket Dengan Algoritma Apriori dan FP-Growth”. JOURNAL GENERIC. Palembang: Universitas Sriwijaya. Haidar. (2007). “Basis Data (Database)”. Han Jiawei dan Micheline Kamber. (2006). “Data Mining : Concepts and Techniques 2nd Edition”. Morgan Kaufmann: California. Han, Kamber, Pei. (2012). “Data Mining : Concepts and Techniques third Edition”. Morgan Kaufman : California. Hand, Mannila, Smyth. (2001). “Principles of Data Mining”. Cambrige : Massachusetts LondonEngland Leung. (2007). “Association Rules”. Mitsa. (2010). “Temporal Data Mining”. Boca Raton, London, New York: CRC Press. Tim Pembaharuan Buku Pedoman Akademik Tahun Akademik 2012/2013. (2012). “Buku Pedoman Akademik Fakultas Ekonomi dan Bisnis Universitas Brawijaya”. Malang: Universitas Brawijaya. Sekertariat Jenderal Kementrian Susyanto, Suryadi. (2010). “Pengantar Data Mining – Menggali Pengetahuan dari Bongkahan Data”. Yogyakarta: ANDI. Xindong, dkk. (2007). “Top 10 Algorithms in Data Mining”. Ariawan. (2011). “Association Rule Dengan FP-Tree dan FP-Growth”. Sistem Informasi FT – UPI-YAI Han, J., Pei, J., Yin, Y., Mao, R.. (2004). “Mining Freqeunt Patterns without Candidate Generation: A Frequent-Pattern Tree ”. Netherlands : Kluwer Academic Publishers

rule    K2  -­‐>  B1  

minimum  support  80  =  1  rule  

minimum  support  70  =  1  rule  

minimum  support  60  =  1  rule  

minimum  support  50  =  1  rule  

minimum  support  40  =  1  rule