bab ii

14
8 BAB II LANDASAN TEORI A. Dasar Teori 1. Data Mining Istilah data mining sudah berkembang jauh dalam mengadaptasi setiap bentuk analisa data. Pada dasarnya data mining berhubungan dengan analisa data dan penggunaan teknik-teknik perangkat lunak untuk mencari pola dan keteraturan dalam himpunan data yang sifatnya “tersembunyi”. Dengan diperolehnya informasi-informasi yang berguna dari data yang ada, hubungan antara item dalam transaksi, maupun informasi informasi-yang potensial, selanjutnya dapat diekstrak dan dianalisa serta diteliti lebih lanjut dari berbagai sudut pandang. Informasi yang ditemukan ini selanjutnya dapat diaplikasikan untuk aplikasi manajemen, melakukan query processing, pengambilan keputusan dan lain sebagainya. Dengan semakin

Upload: aris-budi-hermawan

Post on 27-Jan-2016

234 views

Category:

Documents


1 download

DESCRIPTION

SKRIPSI

TRANSCRIPT

Page 1: BAB II

8

BAB II

LANDASAN TEORI

A. Dasar Teori

1. Data Mining

Istilah data mining sudah berkembang jauh dalam mengadaptasi setiap

bentuk analisa data. Pada dasarnya data mining berhubungan dengan analisa data dan

penggunaan teknik-teknik perangkat lunak untuk mencari pola dan keteraturan dalam

himpunan data yang sifatnya “tersembunyi”.

Dengan diperolehnya informasi-informasi yang berguna dari data yang ada,

hubungan antara item dalam transaksi, maupun informasi informasi-yang potensial,

selanjutnya dapat diekstrak dan dianalisa serta diteliti lebih lanjut dari berbagai sudut

pandang. Informasi yang ditemukan ini selanjutnya dapat diaplikasikan untuk aplikasi

manajemen, melakukan query processing, pengambilan keputusan dan lain

sebagainya. Dengan semakin berkembangnya kebutuhan akan informasi-informasi,

semakin banyak pula bidang-bidang yang rnenerapkan konsep data mining.

Beberapa pengertian data mining yang dikemukakan oleh para ahli di bidang

ini adalah sebagai berikut :

a. (Davies, 2004 dalam (Wirdasari Dian, 2011: 139)), pengertian data mining

dimaknai sebagai berikut:

8

Page 2: BAB II

9

“Secara sederhana data mining adalah penambangan atau penemuan

informasi baru dengan mencari pola atau aturan tertentu dari sejumlah data

yang sangat besar . “

b. Sedangkan (Jiawei, 2011: 18), mengartikan data mining sebagai berikut:

Data mining adalah kegiatan menemukan pola yang menarik dari data dalam jumlah besar, data dapat disimpan dalam database, data warehouse, atau penyimpanan informasi lainnya yang masih berkaitan dengan bidang ilmu-ilmu lain, seperti database system, data warehousing, statistik, machine learning, information retrieval, dan komputasi tingkat tinggi. Selain itu, data mining didukung oleh ilmu lain seperti neural network, pengenalan pola, spatial data analysis, image database, signal processing.

c. Dan menurut (Susanto & Suryadi, 2010: 2) istilah data mining sebagai berikut:

knowledge discovery ataupun pattern recognition sebenarnya memiliki ketepatannya masing-masing. Istilah knowledge discovery atau penemuan pengetahuan tepat digunakan karena tujuan utama dari data mining memang untuk mendapatkan pengetahuan yang masih tersembunyi di dalam bongkahan data. Istilah pattern recognition atau pengenalah pola pun tetap untuk digunakan karena pengetahuan yang hendak digali memang berbentuk pola-pola yang mungkin juga masih perlu digali dari dalam bongkahan data yang tengah dihadapi. Banyak definisi bagi istilah data mining dan belum ada yang dibakukan atau disepakati semua pihak. Namun demikian, istilah data mining ini memiliki hakikat (notion) sebagai disiplin ilmu yang tujuan utamanya adalah untuk menemukan, menggali, atau menambang pengetahuan dari data atau informasi yang kita miliki. Kegiatan inilah yang menjadi garapan atau perhatian utama dari disiplin ilmu data mining

Berdasarkan beberapa pengertian di atas dapat ditarik kesimpulan bahwa

data mining adalah suatu teknik di dalam menggali informasi berharga yang

terpendam atau tersembunyi pada suatu koleksi data (database) yang sangat besar

sehingga ditemukan suatu pola yang menarik yang sebelumnya tidak diketahui.

Menurut (Mujib & Hadi, 2013: 60) Ada beberapa teknik yang dimiliki data

mining berdasarkan tugas yang bisa dilakukan,yaitu:

Page 3: BAB II

10

a. Deskripsi Para peneliti biasanya mencoba menemukan cara untuk mendeskripsikan pola dan trend yang tersembunyi dalam data.

b. EstimasiEstimasi mirip dengan klasifikasi, kecuali variabel tujuan yang lebih kearah numerik dari pada kategori.

c. KlasifikasiDalam klasifikasi variabel, tujuan bersifat kategorik. Misalnya, kita akan mengklasifikasikan pendapatan dalam tiga kelas, yaitu pendapatan tinggi, pendapatan sedang, dan pendapatan rendah.

d. ClusteringClustering lebih ke arah pengelompokan record , pengamatan, atau kasus dalam kelas yang memiliki kemiripan.

e. AsosiasiMengidentifikasi hubungan antara berbagai peristiwa yang terjadi pada satu waktu.

2. Association Rule

Analisis asosiasi dikenal juga sebagai salah satu teknik data mining yang

menjadi dasar dari berbagai teknik data mining lainnya, khususnya analisis pola

frekuensi tinggi (frequent pattern mining).

“Teknik asosiasi menarik perhatian banyak peneliti karena mampu

menghasilkan algoritma yang efisien” (Emha, 2009: 150).

Menurut Shuruti Aggarwal dalam (Tampubolon Kennedi, 2013: 93) ada

beberapa algoritma yang termasuk dalam Aturan Asosiasi yaitu sebagai berikut:

“AIS Algorithm, Apriori Algorithm, DHP Algorithm, dan Partition

Algorithm. “

Metodologi dasar analisis asosiasi terbagi menjadi dua tahap:

1. Analisa pola frekuensi tinggi

Page 4: BAB II

11

Tahap ini mencari kombinasi item yang memenuhi syarat minimum dari nilai

support dalam database. Nilai support sebuah item diperoleh dengan memakai rumus

berikut:

Support (A) = Jumlah Transaksi Mengandung A

Total Transaksi

Sedangkan nilai dari support dua item diperoleh dari rumus berikut :

Support (A,B) = (A⋂B) = Jumlah Transaksi Mengandung A dan BTotal Transaksi

2. Pembentukan Aturan Asosiasi

Setelah semua pola frekuensi tinggi ditemukan, barulah dicari aturan

assosiatif yang memenuhi syarat minimum untuk confidence dengan menghitung

confidence aturan asosiasi “ jika A maka B “. Nilai confidence dari aturan “ jika A

maka B “ diperoleh dari rumus berikut :

Confidence = P(B|A) = Jumlah Transaksi Mengandung A dan B

Jumlah Transaksi Mengandung A

3. Algoritma Apriori

Algoritma apriori adalah suatu algoritma dasar yang diusulkan oleh Agrawal

& Srikant pada tahun 1994 untuk menentukan Frequent itemsets untuk aturan asosiasi

Boolean. Analisis asosiasi atau association rule mining adalah teknik data mining

untuk menemukan aturan assosiatif antara suatu kombinasi item. Algoritma apriori

termasuk jenis aturan assosiasi pada data mining yang menyatakan asosiasi antara

beberapa atribut yang sering disebut sebagai affinity analysis atau market basket

analysis. Contoh dari aturan assosiatif di pasar swalayan dapat diketahuinya berapa

besar kemungkinan seorang pelanggan membeli roti bersamaan dengan susu. Dengan

Page 5: BAB II

12

pengetahuan tersebut pemilik pasar swalayan dapat mengatur penempatan barangnya

atau merancang kampanye pemasaran dengan memakai kupon diskon untuk

kombinasi barang tertentu.

Penting tidaknya suatu aturan assosiatif menurut (Kusrini & Emha, 2009:

150) dapat diketahui sebagai berikut:

dengan dua parameter, support (nilai penunjang) yaitu persentase kombinasi item tersebut dalam database dan confidence (nilai kepastian) yaitu kuatnya hubungan antar item dalam aturan asosiasi.

Kelebihan Algoritma Apriori menurut (Erwin, 2009: 26) yaitu:

“mudah untuk dipahami dan dimplementasikan dibandingkan dengan

algoritma yang lainnya yang memang diterapkan untuk proses association

rule.”

Algoritma apriori dibagi menjadi beberapa tahap yang disebut narasi atau

pass menururt (Devi dinda setiawan, dalam (Buulolo, 2013: 75)).

1. Pembentukan kandidat itemset.Kandidat k-itemset dibentuk dari kombinasi (k-1)- itemset yang didapat dari iterasi sebelumnya. Satu cara dari algoritma apriori adalah pemangkasan kandidat k-itemset yang subsetnya berisi k-1 item tidak termasuk dalam pola frekuensi tinggi dengan panjang k-1.2. Penghitungan support dari tiap kandidat k-itemset.Support dari tiap kandidat k-itemset didapat dengan menscan database untuk menghitung jumlah transaksi yang memuat semua item didalam kandidat k-itemset tersebut. Ini adalah juga ciri dari algoritma apriori dimana diperlukan penghitungan dengan cara seluruh database sebanyak k-itemset terpanjang.3. Tetapkan pola frekuensi tinggi.Pola frekuensi tinggi yang memuat k item atau k-itemset ditetapkan dari kandidat k-itemset yang supportnya lebih besar dari minimum support.4. Bila tidak didapat pola frekuensi tinggi baru maka seluruh proses dihentikan. Bila tidak, maka k ditambah satu dan kembali bagian 1.

Untuk lebih memahami proses algoritma Apriori maka berikut ini akan

diberikan ilustrasi penggunaan algoritma Apriori.

Page 6: BAB II

13

Gambar 2.1 : FlowChart Algoritma Apriori (Buulolo, 2013: 75)

4. Perangkat Lunak Pendukung

a. Database

Menurut (Agnes, Triyuliana Heni (Ed.), 2007: 2) ”Aplikasi Manajemen

Database Pendidikan Berbasis Web dengan PHP dan MYSQL” Database dapat

berarti:

Database adalah sekumpulan data yang terdiri dari satu atau lebih tabel yang saling berhubungan. Anda atau user mempunyai wewenang untuk mengakses data tersebut, baik untuk menambah, mengubah, atau menghapus data yang ada dalam tabel tersebut.

b. Delphi

Page 7: BAB II

14

Menurut (Alam, 2003: 15) Pengertian Delphi yaitu :

Delphi merupakan paket bahasa pemrograman yang bekerja dalam sistem operasi windows yang mempunyai cakupan kemampuan yang luas dan sangat canggih. Berbagai jenis aplikasi dapat dibuat dengan Delphi , termasuk aplikasi untuk mengolah teks, grafik, angka, database dan aplikasi web.

Secara umum kemampuan Delphi adalah menyediakan komponen-

komponen dan bahasa pemrograman yang andal, sehingga memungkinkan untuk

membuat program aplikasi sesuai dengan keinginan, dengan tampilan dan

kemampuan yang canggih.

Untuk mempermudah pemrograman dalam membuat program aplikasi,

Delphi menyediakan fasilitas pemrograman yang sangat lengkap. Fasilitas

pemrograman tersebut dibagi dalam dua kelompok, yaitu object dan bahasa

pemrograman. Secara ringkas, object adalah suatu komponen yang mempunyai

bentuk fisik dan biasanya dapat dilihat (visual). Object biasanya dipakai untuk

melakukan tugas tertentu dan mempunyai batasan-batasan tertentu. Sedangkan

bahsa pemrograman secar singkat dapat disebut sebagai sekumpulan teks yang

mempunyai arti tertentu dan disusun dengan aturan tertentu serta untuk

menjalankan tugas tertentu. Delphi menggunakan struktur bahasa pemrograman

object pascal yang sudah sangat dikenal dikalangan pemrograman profesiaonal.

Gabungan dari object dan bahasa pemrograman ini sering disebut sebagai bahasa

pemrograman berorientasi object atau Object Oriented Programing (OOP).

Khusus untuk pemrograman database, Delphi menyediakan object yang

sangat kuat canggih dan lengkap, sehingga memudahkan pemrogram dalam

merancang, membuat dan menyelesaikan aplikasi database yang diinginkan.

Selain itu, Delphi juga dapat menangani data dalam berbagai format database,

Page 8: BAB II

15

misalnya format MS-Access, SyBase, Oracle, FoxPro, Informix, DB2 dan lain-

lain. Format database yang dianggap asli dari Delphi adalah Paradox dan dBase.

c. XAMPP

Menurut (Hermawan Widyo C. (Ed.), 2009: 30) ” Short Cours: PHP

Programming” XAMPP dapat diartikan:

XAMPP adalah salah satu pake instalasi Apache, PHP, dan MySQL secara instan yang dapat digunakan untuk membantu proses instalasi ketiga produk tersebut sama seprti PHPTriad. Selain paket instalasi instan, XAMPP juga memberikan fasilitas pilihan penggunaan PHP 4 atau PHP 5. Untuk melakukan migrasi ke versi lebih tinggi juga sangat mudah dilakukan dengan bantuan PHP–Switch yang telah disertakan oleh XAMPP. Sama halnya dengan PHP, XAMPP berisfat free atau gratis untuk digunakan.XAMPP adalah suatu langkah mudah untuk menginstal distribusi Apache yang memiliki fitur program MySQL, PHP, dan Perl. XAMPP juga sangat mudah diinstal dan digunakan. XAMPP berdasar pada lisensi GNU General Public License, sehingga instalasi XAMPP tidak memerlukan perubahan pada register Windows dan tidak perlu mengedit file konfigurasinya.

Dalam paket XAMPP, akan diperoleh beberapa fitur sebagai berikut:1) Apache2) Cgi-Bin3) PHP4) MySQL5) FTP6) Mercury Mail (SMTP)7) PHP MyAdmin8) Perl9) Webalizer10) dll.

5. Conceptual Data Model (CDM)

Menurut (Shalahuddin, 2013: 43) CDM dimaknai sebagai berikut :

Conceptual Data Model (CDM) adalah konsep yang berkaitan dengan pandangan pemakai terhadap data yang disimpan dalam basis data, CDM sudah dibuat dalam bentuk tabel tabel namun belum menggambarkan fisik dari database secara sesungguhnya. CDM merupakan hasil

Page 9: BAB II

16

penjabaran lebih lanjut dari ERD ada aturan aturan khusus dalam menjabarkan ERD menjadi sebuah CDM yang harus di perhatikan.

6. Physical Data Model (PDM)Menurut (Shalahuddin, 2013: 45) PDM dimaknai sebagai berikut:

Physical Data Model (PDM) adalah model yang menggunakan sejumlah tabel untuk menggambarkan data serta hubungan antara data. Setiap tabel mempunyai sejumlah kolom dimana setiap kolom memiliki nama yang unik beserta tipe datanya. PDM merupakan konsep konsep yang menerangkan detail dari bagaimana data disimpan dalam basis data. PDM merupakan bentuk fisik perancangan basis data yang sudah siap di implementasikan ke dalam DBMS sehingga nama tabel juga sudah merupakan nama asli tabel yang akan di implementasikan ke dalam DBMS

B. Penelitian Sebelumnya

1. Penerapan Data Mining Algoritma Asosiasi Untuk Meningkatkan Penjualan

(Emha, 2009)

Pada penelitiannya, (Emha, 2009) menggunakan algoritma asosiasi untuk menyusun

sebuah sistem yang memiliki kemampuan melihat pola penjualan barang untuk

meningkatkan hasil penjualan. Hasil penelitian ini penggunaan data mining dalam

menggali data terbukti dapat bermanfaat dalam dunia bisnis secara khusus terbukti

untuk kasus penjualan barang.

2. Implementasi Algoritma Apriori Pada Sistem Persediaan Obat (Studi Kasus :

Apotik Rumah Sakit Estomihi Medan) (Buulolo, 2013)

Pada penelitiannya, (Buulolo, 2013) membentuk pola kombinasi item sets dari data

penjualan (data obat keluar) dengan menggunakan algoritma apriori untuk

menghasilkan rules dengan association rules dari pola kombinasi itemsets yang

interesting. Hasil penelitian ini menunjukkan bahwa dengan algoritma apriori dan

pengujian dengan aplikasi Tanagra menghasilkan pola kombinasi itemsets dan rules

sebagai ilmu pengetahuan dan informasi penting dari data penjualan (data obat

Page 10: BAB II

17

keluar). Teknik data mining dengan algoritma apriori dapat diimplementasikan pada

sistem persediaan dengan data yang digunakan adalah data penjualan (data obat

keluar).