bab 1 pendahuluan - agusaan.files.wordpress.com a. latar belakang ... • ekstraksi dari suatu...

27
1 BAB 1 PENDAHULUAN A. Latar Belakang Selama dua decade terakhir telah terjadi peningkatan yang dramatis terhadap jumlah informasi atau data yang disimpan secar a elektronis. Telah diperkirakan sebelumnya bahwa jumlah informasi di dunia akan berlipat ganda setiap 20 bulan dan jumlah ukuran basis data akan bertambah lebih cepat lagi dari itu. Teknologi database saat ini memungkinkan untuk menyimpan sejumlah data dalam jumlah yang sangat besar dan terakumulasi. Disinilah awal timbulnya persoalan ledakan data (jumlah data yang tiba-tiba begitu sangat besar). Data perlu disimpan, tapi yang lebih penting dari itu adalah proses penemuan pengetahuan (knowledge) dari data yang disimpan ! Oleh karenanya data yang tersimpan dalam sebuah gudang data yang disebut dengan data warehouses perlu dianalisa. Permasalahannya kemudian adalah apa yang harus dilakukan dengan data-data itu. Sudah diketahui secara umum bahwa informasi merupakan hal yang sangat penting dalam menunjang oper asi-operasi bisnis dan membantu para pengambil keputusan untuk mendapatkan gambaran lebih tentang bisnis mereka. Sistem manajemen basis data memberikan akses terhadap data namun hanya sebagian kecil

Upload: lamthien

Post on 19-Apr-2018

221 views

Category:

Documents


2 download

TRANSCRIPT

Page 1: BAB 1 PENDAHULUAN - agusaan.files.wordpress.com A. Latar Belakang ... • Ekstraksi dari suatu informasi yang berguna atau menarik ... akan dijelaskan pada bagian- lain laporan tugas

1

BAB 1

PENDAHULUAN

A. Latar Belakang

Selama dua decade terakhir telah terjadi

peningkatan yang dramatis terhadap jumlah informasi

atau data yang disimpan secar a elektronis. Telah

diperkirakan sebelumnya bahwa jumlah informasi di

dunia akan berlipat ganda setiap 20 bulan dan jumlah

ukuran basis data akan bertambah lebih cepat lagi dari

itu. Teknologi database saat ini memungkinkan untuk

menyimpan sejumlah data dalam jumlah yang sangat

besar dan terakumulasi. Disinilah awal timbulnya

persoalan ledakan data (jumlah data yang tiba-tiba begitu

sangat besar). Data perlu disimpan, tapi yang lebih

penting dari itu adalah proses penemuan pengetahuan

(knowledge) dari data yang disimpan ! Oleh karenanya

data yang tersimpan dalam sebuah gudang data yang

disebut dengan data warehouses perlu dianalisa.

Permasalahannya kemudian adalah apa yang harus

dilakukan dengan data-data itu. Sudah diketahui secara

umum bahwa informasi merupakan hal yang sangat

penting dalam menunjang oper asi-operasi bisnis dan

membantu para pengambil keputusan untuk

mendapatkan gambaran lebih tentang bisnis mereka.

Sistem manajemen basis data memberikan akses

terhadap data namun hanya sebagian kecil

Page 2: BAB 1 PENDAHULUAN - agusaan.files.wordpress.com A. Latar Belakang ... • Ekstraksi dari suatu informasi yang berguna atau menarik ... akan dijelaskan pada bagian- lain laporan tugas

2

kontribusinya terhadap apa yang seharusnya dapat

dihasilkan dari data-data itu. Sistem pemrosesan

transaksi online (OLPT) tradisional sangat baik dalam

menyimpan data secara cepat, aman, dan efisien ke

dalam basis data namun tidak cukup baik dalam hal

kemampuan melakukan analisa terhadap data-data

yang ada, padahal analisa terhadap data memberikan

pengetahuan lebih mendalam tentang bisnis yang

dilakukan. Solusi untuk persoalan penemuan

pengetahuan dalam database berukuran besar adalah

dengan menggunakan Data warehousing dan data

mining. Disinilah peran Data Mining akan memberikan

konstribusi besar bagi setiap perusahaan yang

mengimplementasikannya.

B. Tujuan

1. Untuk memenuhi tugas mata kuliah Sistem

Manajemen Basis Data.

2. Untuk mengetahui lebih luas tentang Data Mining.

3. Untuk menambah pengetahuan.

C. Rumusan Masalah

1. Apa yang dimaksud dengan Data Mining ?

2. Apa fungsi dan tujuan dari Data Mining ?

3. Bagaimana penerapan Data Mining dalam

kehidupan?

Page 3: BAB 1 PENDAHULUAN - agusaan.files.wordpress.com A. Latar Belakang ... • Ekstraksi dari suatu informasi yang berguna atau menarik ... akan dijelaskan pada bagian- lain laporan tugas

3

BAB II

PEMBAHASAN

A. Pengertian data Mining

Ada beberapa definisi dari Data mining. Secara

umum data mining dapat

didefinisikan sebagai berikut :

• Proses penemuan pola yang menarik dari data yang

tersimpan dalam jumlah besar. Merupakan evolusi

alami dari teknologi database, dan merupakan metode

yang paling banyak dibutuhkan, dengan aplikasi yang

sangat luas.

• Ekstraksi dari suatu informasi yang berguna atau

menarik (non-trivial, implisit, sebelumnya belum

diketahui, potensial kegunaannya) pola atau

pengetahuan dari data yang disimpan dalam jumlah

besar.

• Ekplorasi dari analisa secara otomatis atau

semiotomatis terhadap data-data dalam jumlah besar

untuk mencari pola dan aturan yang berarti.Pada

dasarnya data mining berhubungan erat dengan

analisa data dan penggunaan perangkat lunak untuk

mencari pola dan kesamaan dalam sekumpulan data. Ide

dasarnya sangat menggali sumber yang berharga dari

tempat yang sama sekali tidak diduga seperti perangkat

Page 4: BAB 1 PENDAHULUAN - agusaan.files.wordpress.com A. Latar Belakang ... • Ekstraksi dari suatu informasi yang berguna atau menarik ... akan dijelaskan pada bagian- lain laporan tugas

4

lunak data mining mengekstrasi pola yang sebelumnya

tidak terlihat atau tigak begitu jelas sehingga tidak

seorang pun yang memperhatikan sebeumnya. Analisa

data mining berjalan pada data yang cenderung terus

membesar dan teknik terbaik yang digunakan kemudian

beorientasi kepada data beukur an sangat besar untuk

mendapatkn kesimpulan dan keputusan paling layak.

Data mining memiliki beberapa sebutan atau nama

lain yaitu : Knowledge discovery (mining) in databases

(KDD), ekstraksi pengetahuan (knowledge extraction),

Analisa data/pola, kecerdasan bisnis (business

intelligence), dll.

Meskipun sebagian besar teknik data mining seperti yang

akan dijelaskan pada bagian- lain laporan tugas akhir ini sudah

ada sejak lama, namun hanya pada beberapa tahun terakhir

ini data mining benar-benar berperan yaitu sejak dilakukan

komersialisasi data mining. Beberapa faktor yang mendukung

perlunya dilakukan data mining adalah :

1. Data telah mencapai jumlah dan ukuran yang sangat

besar Hasil dan proses data mining merupakan

suatu informasi yang akan mendasari tindakan

tertentu sehingga tingkat kebenaran informasi

tersebut menjadi sangat signifikan, dan makin besar

serta makin banyak data yang digunakan maka

Page 5: BAB 1 PENDAHULUAN - agusaan.files.wordpress.com A. Latar Belakang ... • Ekstraksi dari suatu informasi yang berguna atau menarik ... akan dijelaskan pada bagian- lain laporan tugas

5

akan semakin valid hasilnya. Perkembangan data

dalam hal jumlah dan ukuran telah mencapai

kecepatan yang sangat cepat, sehingga ukuran basis

data yang dimiliki oleh sebuah perusahaan bisa

mencapai kisaran gigabyte atau bahkan terabyte.

2. Telah dilakukan proses data warehousing Untuk

mencapai hasil yang memuaskan, maka sumber

data yang digunakan dalam proses data mining

seringkali merupakan data gabungan dari banyak

departemen, daerah operasi bahkan dari sumber-

sumber lain seper ti data kependudukan. Oleh karena

itu maka disarankan perlunya proses data

warehousing untuk menjaga konsistensi, memberikan

prespektif yang lebih baik terhadap data dan menjaga

integritas data.

3. Kemampuan Komputasi yang semakin terjangkau Pada

dasarnya proses data mining melakukan banyak akses

terhadap data yang sangat besar. Selain itu juga

melakukan proses komputasi yang membutuhkan

sumber daya sangat besar. Penurunan harga yang

cukup cepat terhadap perangkat keras computer serta

semakin tingginya kinerja yang berhasil dicapai oleh

perangkat computer maupun teknologi pengolahan

data seperti teknologi pararel proses saat ini,

menjadikan proses saat ini, menjadikan proses data

Page 6: BAB 1 PENDAHULUAN - agusaan.files.wordpress.com A. Latar Belakang ... • Ekstraksi dari suatu informasi yang berguna atau menarik ... akan dijelaskan pada bagian- lain laporan tugas

6

mining suduh cukup layak untuk dilakukan secara

komersial.

4. Persaingan bisnis yang semakin ketat Tekanan

persaingan bisnis yang semakin ketat mendorong

perusahaan- perusahaan untuk selalu berinovasi

agar mampu meningkatkan daya saingnya dipasar

global. Beberapa tren yang berkembang saat ini adalah

a. Setiap bisnis adalah bisnis pelayanan

b. Adanya fenomena kustomisasi produk oleh

masyarakat

c. Informasi adalah produk

B. Model dalam Data Mining

Terdapat dua tipe atau mode operasi yang bisa

digunakan untuk mencari informasi yang dibutuhkan

user lewat proses data mining, yaitu model verifikasi

dan knowledge discover y. Model verifikasi

menggunakan pendekatan top down dengan

mengambil hipotesa dari user dan memeriksa

validitasnya dengan data sehingga bisa dibuktikan

kebenaran hipotesa tersebut. Model Knowledge

Discovery menggunakan pendekatan bottom up untuk

mendapatkan informasi yang sebelumnya tidak diketahui.

Model ini terbagi menjadi dua directed knowledge

discovery dan undirected knowledge discovery. Pada

Page 7: BAB 1 PENDAHULUAN - agusaan.files.wordpress.com A. Latar Belakang ... • Ekstraksi dari suatu informasi yang berguna atau menarik ... akan dijelaskan pada bagian- lain laporan tugas

7

directed knowledge discovery data mining akan

mencoba mencari penjelasan nilai target field tertentu

(seperti penghasilan, respons, usia, dan lain-lain)

terhadap field-field yang lain. Sedangkan pada undirected

knowledge discovery tidak ada target field karena

komputer akan mencari pola yang ada pada data. Jadi

undirected knowledge discovery digunakan untuk

mengenali hubungan / relasi yang ada pada data

sedangkan directed knowledge discovery akan

menjelaskan hubungan / relasi tersebut.

C. Tahapan Proses Dalam Data Minning

Ada beberapa tahapan proses dalam data mining.

Diagram dibawah menggambarkan beberapa tahap /

proses yang berlangsung dalam data mining. Fase awal

dimulai dari data sumber dan berakhir dengan adanya

informasi yang dihasilkan dari bebrapa tahapan, yaitu :

Gambar 1.1 Fase-fase Dalam Data Mining

Page 8: BAB 1 PENDAHULUAN - agusaan.files.wordpress.com A. Latar Belakang ... • Ekstraksi dari suatu informasi yang berguna atau menarik ... akan dijelaskan pada bagian- lain laporan tugas

8

Tahapan proses dalam Data Mining dapat dijelaskan

sebagai berikut :

1. Seleksi Data

Pemilihan (seleksi) data daru sekumpulan data

operasional perlu dilakukan sebelum tahap penggalian

informasi dalam KDD dimulai. Data hasil seleksi yang

akan digunakan untuk proses data mining, disimpan

dalam suatu berkas, terpisah dari basis data operasional.

2. Pre-processing/ Cleaning ( pemilihan data )

Sebelum proses data mining dapat dilaksanakan,

perlu dilakukan proses cleaning pada data yang menjadi

fokus KDD. Proses cleaning mencakup antara lain

membuang duplikasi data, memeriksa data yang

inkonsisten, dan memperbaiki kesalahan pada data,

seperti kesalahan cetak (tipografi). Juga dilakukan proses

enrichment, yaitu proses “memperkaya” data yang sudah

ada dengan data atau informasi lain yang relevan dan

diperlukan untuk KDD, seperti data atau informasi

eksternal.

3. Transformasi

Coding adalah proses transformasi pada data yang

telah dipilih, sehingga data tersebut sesuai untuk proses

data mining. Proses coding dalam KDD merupakan proses

Page 9: BAB 1 PENDAHULUAN - agusaan.files.wordpress.com A. Latar Belakang ... • Ekstraksi dari suatu informasi yang berguna atau menarik ... akan dijelaskan pada bagian- lain laporan tugas

9

kreatif dan sangat tergantung pada jenis atau pola

informasi yang akan dicari dalam basis data

4. Data mining

Data mining adalah proses mencari pola atau

informasi menarik dalam data terpilih dengan

menggunakan teknik atau metode tertentu. Teknik,

metode, atau algoritma dalam data mining sangat

bervariasi. Pemilihan metode atau algoritma yang tepat

sangat bergantung pada tujuan dan proses KDD secara

keseluruhan.

5. Interpretasi / Evaluasi

Pola informasi yang dihasilkan dari proses data mining

perlu ditampilkan dalam bentuk yang mudah dimengerti

oleh pihak yang berkepentingan. Tahap ini merupakan

bagian dari proses KDD yang disebut dengan

interpretation. Tahap ini mencakup pemeriksaan

apakah pola atau informasi yang ditemukan

bertentangan dengan fakta atau hipotesa yang ada

sebelumnya.

Proses KDD secara garis besar memang terdiri dari 5

tahap seperti yang telah dijelaskan sebelumnya. Akan

tetapi, dalam proses KDD yang sesungguhnya, dapat saja

terjadi iterasi atau pengulangan pada tahap tahap

Page 10: BAB 1 PENDAHULUAN - agusaan.files.wordpress.com A. Latar Belakang ... • Ekstraksi dari suatu informasi yang berguna atau menarik ... akan dijelaskan pada bagian- lain laporan tugas

10

tertentu. Pada setiap tahap dalam proses KDD, seorang

analis dapat saja kembali ke tahap sebelumnya. Sebagai

contoh, pada saat coding atau data mining, analis

menyadari proses cleaning belum dilakukan dengan

sempurna, atau mungkin saja analis menemukan data atau

informasi baru untuk “memperkaya” data yang sudah ada.

D. Metode Data Minning

Data mining model dibuat berdasarkan salah satu dari

dua jenis pembelajaran supervised dan unsupervised.

Fungsi pembelajaran Supervised digunakan untuk

memprediksi suatu nilai. Fungsi pembelajaran Unsupervised

digunakan untuk mencari struktur intrinsik, relasi dalam

suatu data yang tidak memerlukan class atau label

sebelum dilakukan proses pembelajaran. Contoh dari

algoritma pembelajaran unsupervised, diantaranya k-means

clustering dan Apriori association rules. Contoh dari

algoritma pembelajaran supervised yaitu NaiveBayes untuk

klasifikasi. Metode data mining dapat diklasifikasikan

berdasarkan fungsi yang dilakukan atau berdasarkan jenis

aplikasi yang menggunakannya:

Klasifikasi (supervised)

Pada persoalan klasifikasi, kita memiliki

sejumlah kasus (sampel data) dan ingin memprediksi

beberapa class yang ada pada sampel data tersebut.

Tiap instan data berisi banyak atribut, dimana

Page 11: BAB 1 PENDAHULUAN - agusaan.files.wordpress.com A. Latar Belakang ... • Ekstraksi dari suatu informasi yang berguna atau menarik ... akan dijelaskan pada bagian- lain laporan tugas

11

masing-masing atribut memiliki satu dari beberapa

kemungkinan nilai. Hanya satu atribut diantara

banyak atribut tersebut yang disebut dengan

atribut target, sedangkan atribut yang lain disebut

sebagai atribut prediktor. Tiap kemungkinan nilai

yang dimiliki oleh atribut target menunjukkan class

yang diprediksi berdasarkan nilai-nilai dari atribut

prediktor.

Klasifikasi digunakan untuk segmentasi customer,

pemodelan bisnis, analisa kartu kredit, dan banyak

aplikasi yang lain. Sebagai contoh, perusahaan kartu

kredit ingin memprediksi customer berdasarkan tipe

pembayaran.

Clustering (unsupervised)

Clustering adalah teknik yang berguna untuk

mengeksplorasi data. Digunakan pada saat banyak

kasus dan tidak memiliki pengelompokan secara

alami. Dalam hal ini algoritma data mining dapat

digunakan untuk mencari pengelompokan yang ada

pada data.. Analisa Clustering mengidentifikasi

cluster yang ada pada data. Cluster adalah kumpulan

obyek data yang mirip satu sama lain. Metode

clustering yang bagus menghasilkan cluster yang

berkualitas untuk memastikan kesamaan pada

datadata yang ada dalam satu cluster. Clustering

model berbeda dari model pr ediktif dikarenakan

Page 12: BAB 1 PENDAHULUAN - agusaan.files.wordpress.com A. Latar Belakang ... • Ekstraksi dari suatu informasi yang berguna atau menarik ... akan dijelaskan pada bagian- lain laporan tugas

12

pada clustering tidak perlu ada atribut target.

Clustering yang diorganisasi ke dalam struktur

hirarkikal akan mendefinisikan taksonomi dari data.

Dalam ODM, suatu cluster dikarakterisasi oleh

centroid, attribute histograms, dan clustering model

hierarchical tree. ODM membentuk hierarchical

clustering dengan menggunakan versi perbaikan dari

algoritma k-means dan O-Cluster.

Association Rules (unsupervised)

Fungsi Association Rules seringkali disebut

dengan "market basket analysis", yang digunakan

untuk menemukan relasi atau korelasi diantar a

himpunan item2. Fungsi ini paling banyak digunakan

untuk menganalisa data dalam rangka keperluan

strategi pemasaran, desain katalog, dan proses

pembuatan keputusan bisnis. Tipe association rule

bisa dinyatakan sebagai misal : "70% dari orangorang

yang membeli mie, juice dan saus akan membeli juga

roti tawar". Aturan asosiasi mengcapture item atau

kejadian dalam data berukuran besar yang berisi

data transaksi. Dengan kemajuan teknologi, data

penjualan dapat disimpan dalam jumlah besar yang

disebut dengan "basket data." Aturan asosiasi

yang didefinisikan pada basket data, digunakan

untuk keperluan promosi, desain katalog,

segmentasi customer dan target pemasaran.

Page 13: BAB 1 PENDAHULUAN - agusaan.files.wordpress.com A. Latar Belakang ... • Ekstraksi dari suatu informasi yang berguna atau menarik ... akan dijelaskan pada bagian- lain laporan tugas

13

Attribute Importance (supervised)

Attribute Importance, disebut juga dengan

feature selection, menyediakan solusi otomatis

untuk meningkatkan kecepatan dan akurasi dari

model klasifikasi yang dibangun pada table data

yang memiliki jumlah atribut yang sangat banyak..

Attribute Importance meranking atribut prediktif

dengan melakukan eleminasi nilai yang redundant,

tidak relevant atau tidak informative dan

mengidentifikasi atribut predictor yang banyak

paling berpengaruh dalam pengambilan keputusan.

Dengan menggunakan atribut yang lebih sedikit

akan mereduksi waktu untuk membangun suatu

model, juga dapat meningkatkan akurasi dari

kemampuan prediksi. Jika terlalu banyak atribut yang

dilibatkan maka akan banyak pula noise yang terlibat

yang akan berpengaruh terhadap model karena

dapat menurunkan performansi dan akurasi.

E. Contoh Kasus dan Pembahasan

Analisa Pasar dan Manajemen

Untuk analisa pasar, banyak sekali sumber data yang

dapat digunakan seperti transaksi kartu kredit, kartu anggota

Page 14: BAB 1 PENDAHULUAN - agusaan.files.wordpress.com A. Latar Belakang ... • Ekstraksi dari suatu informasi yang berguna atau menarik ... akan dijelaskan pada bagian- lain laporan tugas

14

club tertentu, kupon diskon, keluhan pembeli, ditambah

dengan studi tentang gaya hidup publik.

Beberapa solusi yang bisa diselesaikan dengan data mining

diantaranya:

• Menembak target pasar

Data mining dapat melakukan pengelompokan (clustering)

dari model-model pembeli dan melakukan klasifikasi terhadap

setiap pembeli sesuai dengan karakteristik yang diinginkan

seperti kesukaan yang sama, tingkat penghasilan yang sama,

kebiasaan membeli dan karakteristik lainnya.

• Melihat pola beli pemakai dari waktu ke waktu

Data mining dapat digunakan untuk melihat pola beli

seseorang dari waktu ke waktu. Sebagai contoh, ketika

seseorang menikah bisa saja dia kemudian memutuskan

pindah dari single account ke joint account (rekening

bersama) dan kemudian setelah itu pola beli-nya berbeda

dengan ketika dia masih bujangan.

• Cross-Market Analysis

dengan produk lainnya. Berikut ini saya sajikan beberapa

contoh:

Cari pola penjualan Coca Cola sedemikian rupa

sehingga kita dapat mengetahui barang apa sajakah

Page 15: BAB 1 PENDAHULUAN - agusaan.files.wordpress.com A. Latar Belakang ... • Ekstraksi dari suatu informasi yang berguna atau menarik ... akan dijelaskan pada bagian- lain laporan tugas

15

yang harus kita sediakan untuk meningkatkan

penjualan Coca Cola?

Cari pola penjualan IndoMie sedemikian rupa sehingga

kita dapat mengetahui barang apa saja yang juga dibeli

oleh pembeli IndoMie. Dengan demikian kita bisa

mengetahui dampak jika kita tidak lagi menjual

IndoMie.

• Profil Customer

Data mining dapat membantu Anda untuk melihat profil

customer/pembeli/nasabah sehingga kita dapat mengetahui

kelompok customer tertentu suka membeli produk apa saja.

• Identifikasi Kebutuhan Customer

Anda dapat mengidentifikasi produk-produk apa saja yang

terbaik untuk tiap kelompok customer dan menyusun faktor-

faktor apa saja yang kira-kira dapat menarik customer baru

untuk bergabung/membeli.

• Informasi Summary

Anda juga dapat memanfaatkan data mining untuk membuat

laporan summary yang bersifat multi-dimensi dan dilengkapi

dengan informasi statistik lainnya.

Data Mining – Yang Bisa dan Tidak Bisa Dilakukan

Secara umum, data mining dapat melakukan dua hal yaitu :

Page 16: BAB 1 PENDAHULUAN - agusaan.files.wordpress.com A. Latar Belakang ... • Ekstraksi dari suatu informasi yang berguna atau menarik ... akan dijelaskan pada bagian- lain laporan tugas

16

Memberikan kesempatan untuk menemukan

informasi menarik yang tidak terduga.

Dapat menangani data berskala besar.

Dalam menemukan informasi yang menarik ini, ciri khas data

mining adalah kemampuan pencarian secara hampir otomatis.

Mengapa disebut hampir otomatis karena dalam banyak

teknik data mining ada beberapa parameter yang masih harus

ditentukan secara manual atau semi manual. Penelitian untuk

melakukan setting secara adaptif merupakan bidang yang

hangat diteliti. Data mining juga dapat memanfaatkan

pengalaman atau bahkan kesalahan di masa lalu untuk

meningkatkan kualitas dari model maupun hasil analisanya,

salah satunya dengan kemampuan pembelajaran yang dimiliki

beberapa teknik data mining seperti klasifikasi. Data Mining

juga memiliki kemampuan, diantaranya :

Mampu menangani data dalam jumlah besar.

Memungkinkan data mining untuk diterapkan

pada masalah-masalah kompleks yang

ukurannya tidak dibatasi lagi oleh otak manusia.

Selain itu penelitian tentang algoritma parallel

dari data mining juga membuka jalan agar data

mining dapat diterapkan pada program skala

yang lebih besar lagi.

Sebaliknya, disamping memiliki kemampuan ada beberapa hal

yang tidak bisa dilakukan oleh data mining, diantaranya :

Page 17: BAB 1 PENDAHULUAN - agusaan.files.wordpress.com A. Latar Belakang ... • Ekstraksi dari suatu informasi yang berguna atau menarik ... akan dijelaskan pada bagian- lain laporan tugas

17

Perlu disadari bahwa data mining bukanlah solusi yang

cocok untuk setiap masalah. Ada banyak masalah yang

justru lebih baik diselesaikan dengan statistic yang

sederhana.

Data mining juga tidak bisa menemukan pengetahuan

yang bermanfaat secara instan.

Beberapa hal yang perlu diperhatikan oleh seorang analis :

Seorang analis data mining perlu tahu perbedaan,

kelebihan dan kekurangan dari teknik-teknik data

mining yang ada sebelumnya mengaplikasikan yang

paling cocok untuk masalah yang dihadapinya.

Ketika menjalankan teknik data mining itu sendiri, si

analis juga perlu mengarahkan programnya dengan

melakukan persiapan-persiapan dan pemilihan

parameternya.

Setelah data mining dilaksanakan pun si analis harus

melakukan evaluasi terhadap pola-pola yang dihasilkan

sebelumnya bisa merumuskan hasilnya.

Terakhir perlu diingat bahwa data mining tidak bisa

memberikan hasil yang bisa langsung digunakan.

Banyak hasil dari data mining yang tidak bisa langsung

diinterpretasikan dengan mudah.

Hal-hal ini juga disadari oleh perusahaan-perusahaan

yang menerapkan data mining dan OLAP, yang sering

dirangkum dalam istilah business intelligence (BI).

Page 18: BAB 1 PENDAHULUAN - agusaan.files.wordpress.com A. Latar Belakang ... • Ekstraksi dari suatu informasi yang berguna atau menarik ... akan dijelaskan pada bagian- lain laporan tugas

18

Untuk memecahkan masalah ini, mulai banyak

perusahaan yang membuat pusat untuk business

intelligence yang membantu karyawan biasa untuk

menggunakan piranti OLAP maupun data mining

dengan menyediakan pelatihan dan informasi praktis

pemakaian dan aplikasi hasilnya.

Langkah-langkah penerapan data warehouse

Identifikasi system dan unit bisnis yang membutuhkan

integrasi data.

Menetapkan batasan data dan prioritas yang

dibutuhkan untuk putusan organisasional.

Menampilkan dan memutuskan berbagai alternative

teknologi basis data yang menerapkan konsep data

warehouse.

Merencanakan pemprosesan dan perancangan standar

prosedur operasional implementasi data warehouse

Penerapan teknologi dan produk data warehouse

Penerapan Data Warehouse di Perusahaan

Retailing dan sales, memprediksi penjualan, mencegah

pencuri dan kecurangan, dan menentukan level

inventori yang benar dan mendistribusikan jadwal

sepanjang outlet. Sebagai contoh, penjual seperti

Page 19: BAB 1 PENDAHULUAN - agusaan.files.wordpress.com A. Latar Belakang ... • Ekstraksi dari suatu informasi yang berguna atau menarik ... akan dijelaskan pada bagian- lain laporan tugas

19

AAFES menggunakan Fraud Watch dari Triversity untuk

melawan penipuan oleh pekerja di 1400 toko.

Banking. Level prediksi untuk peminjaman yang buruk

dan kecurangan dalam penggunaan kartu kredit,

prediksi pengeluaran kartu kredit oleh pelanggan yang

baru, dan menentukan jenis mana dari pelanggan yang

memberikan respon yang baik untuk menawarkan

peminjaman.

Manufacturing dan production, memprediksi

kesalahan mesin, dan menemukan faktor kunci yang

dapat mengoptimasi kapasitas produksi.

Insurance. Memprediksi jumlah tagihan dan ongkon

kesehatan, mengklasifikasikan elemen yang paling

penting yang mempengaruhi jaminan kesehatan dan

memoprediksi pelanggan mana yang akan membeli

polis asuransi baru.

Policework. Menemukan pola kejahatan, lokasi, dan

perilaku tindak kejahatan; mengidentifikasi atribut

yang berguna untuk menyelesaikan masalah kriminal.

Healthcare. Korelasi demografis dari pasien yang

memiliki penyakit yang parah, dan memperluas

wawasan yang lebih baik tentang bagaimana

mengidentifikasi dan gejala penyakit dan

penyebabnya.

Marketing. Mengklasifikasikan demografis pelanggan

yang dapat digunakan untuk memprediksi pelanggan

Page 20: BAB 1 PENDAHULUAN - agusaan.files.wordpress.com A. Latar Belakang ... • Ekstraksi dari suatu informasi yang berguna atau menarik ... akan dijelaskan pada bagian- lain laporan tugas

20

mana yang akan merespon untuk pembelian produk

tertentu.

Analisa Perusahaan dan Manajemen Resiko

Perencanaan Keuangan dan Evaluasi Aset ,data Mining

dapat membantu untuk melakukan analisis dan

prediksi cash flow serta melakukan contingent claim

analysis untuk mengevaluasi aset. Selain itu juga dapat

menggunakannya untuk analisis trend.

Perencanaan Sumber Daya (Resource Planning)

,dengan melihat informasi ringkas (summary) serta

pola pembelanjaan dan pemasukan dari masing-

masing resource, dapat memanfaatkannya untuk

melakukan resource planning.

Persaingan (Competition) Sekarang ini banyak

perusahaan yang berupaya untuk dapat melakukan

competitive intelligence. Data Mining dapat

membantu untuk memonitor pesaing-pesaing dan

melihat market direction mereka.

Dapat melakukan pengelompokan customer dan

memberikan variasi harga/layanan/bonus untuk

masing-masing grup.

Menyusun strategi penetapan harga di pasar yang

sangat kompetitif. Hal ini diterapkan oleh perusahaan

minyak REPSOL di Spanyol dalam menetapkan harga

jual gas di pasaran.

Page 21: BAB 1 PENDAHULUAN - agusaan.files.wordpress.com A. Latar Belakang ... • Ekstraksi dari suatu informasi yang berguna atau menarik ... akan dijelaskan pada bagian- lain laporan tugas

21

Contoh Perusahaan Yang Menerapkan Data Warehouse

1. Telekomunikasi

Sebuah perusahaan telekomunikasi menerapkan data

warehouse dan data mining untuk melihat dari jutaan

transaksi yang masuk, transaksi mana sajakah yang

masih harus ditangani secara manual (dilayani oleh

orang), Tujuannya tidak lain adalah untuk menambah

layanan otomatis khusus untuk transaksi-transaksi

yang masih dilayani secara manual. Dengan demikian

jumlah operator penerima transaksi manual tetap bisa

ditekan minimal

2. Keuangan

Financial Crime Enforcement Network di Amerika

Serikat baru-baru ini menggunakan menggunakan data

minimng untuk menambang trilyunan daru berbagai

subjek seperti property, rekening bank dan transaksi

keuangan lainnya untuk mendeteksi transaksi-

transaksi keuangan yang mencurigakan seperti money

laundry. Mereka menyatakan bahwa hal tersebut akan

susah dilakukan jika menggunakan analisis standar

3. Asuransi

Australian Health Insurance Commision menggunakan

data mining untuk mengidentifikasi layanan kesehatan

yang sebenarnya tidak perlu tetapi tetap dilakukan

Page 22: BAB 1 PENDAHULUAN - agusaan.files.wordpress.com A. Latar Belakang ... • Ekstraksi dari suatu informasi yang berguna atau menarik ... akan dijelaskan pada bagian- lain laporan tugas

22

oleh peserta asuransi. Hasilnya? mereka berhasil

menghemat satu juta dollar pertahun.

4. Olahraga

IBM Advanced Scout menggunakan data mining untuk

menganalisis statistik permainan NBA (jumlah shots

blocked, assists dan fouls) dalam rangka mencapai

keunggulan bersaing (competitive advantage) untuk

tim New York Knick dan Miami Heat

5. Astronomi

Jet Propulsion Laboratory (JPL) di Pasadena, California

dan Palomar Observartory berhasil menemukan 22

quasar dengan bantuan data mining. Hal ini

merupakan salah satu kesuksesan penerapan data

mining di bidang astronomi dan ilmu ruang angkasa

6. Internet Web Surf-Aid

IBM Surf-Aid menggunakan algoritma data mining

untuk mendata akses halaman web khususnya yang

berkaitan dengan pemasaran guna melihat prilaku dan

minat costumer serta melihat keefektifan pemasaran

melalui web.

7. Penerapan Data Warehouse Pada Perusahaan Berskala

Kecil

Page 23: BAB 1 PENDAHULUAN - agusaan.files.wordpress.com A. Latar Belakang ... • Ekstraksi dari suatu informasi yang berguna atau menarik ... akan dijelaskan pada bagian- lain laporan tugas

23

8. Karena data warehouse sangat mahal, mereka

biasanya digunakan oleh perusahaan-perusahaan

besar. Beberapa perusahaan yang lebih kecil,

menggunakan data warehouse yang skala nya lebih

kecil, yang biasa disebut data mart. Data mart adalah

data warehouse yang kecil yang didesain untuk

kebutuhan pemakai akhir pada sebuah unit bisnis

strategi (SBU = Strategic Business Unit) atau

departemen. Dalam tahapan sebelumnya, data mart

jauh lebih murah dari pada data warehouse. Data mart

biasanya menghabiskan dana sampai $100,000,

bandingkan dengan data warehouse yang

menghabiskan $1 juta atau lebih. Ditambah lagi, data

mart dapat diimplementasikan lebih cepat, biasanya

kurang dari 90 hari. Hal ini dikarenakan data mart

hanya berisi lebih sedikit informasi dari pada data

warehouse, data mart juga memiliki respon yang lebih

cepat dan lebih mudah untuk dipelajari. Data mart

mendukung lebih ke lokal dari pada pengontrolan

terpusat oleh manajer suatu departemen. Data mart

juga memberikan hak kepada SBU untuk membuat

sebuah sistem pendukung keputusan tanpa

mengandalkan Data mart memfokuskan hanya pada

kebutuhan-kebutuhan pemakai yang terkait dalam

sebuah departemen atau fungsi bisnis. Data mart

biasanya tidak mengandung operasional yang rinci

Page 24: BAB 1 PENDAHULUAN - agusaan.files.wordpress.com A. Latar Belakang ... • Ekstraksi dari suatu informasi yang berguna atau menarik ... akan dijelaskan pada bagian- lain laporan tugas

24

seperti pada data warehouse. Data mart hanya

mengandung sedikit informasi dibandingkan dengan

data warehouse. Data mart lebih mudah dipahami dan

dinavigasi.

Page 25: BAB 1 PENDAHULUAN - agusaan.files.wordpress.com A. Latar Belakang ... • Ekstraksi dari suatu informasi yang berguna atau menarik ... akan dijelaskan pada bagian- lain laporan tugas

25

BAB III

PENUTUP

A. Kesimpulan

Pada proses Data Mining hal yang paling penting adalah

pada tahap “Data Mining” dengan menggunakan teknik-

teknik yang diaplikasikan untuk mengekstrak pola-pola

potensial yang berguna.

B. Saran

Berikut adalah saran yang mungkin perlu dilakukan dalam

pengembangan selanjutnya dimasa yang akan datang

terhadap aplikasi data mining dengan metode clustering:

Dimasa yang akan datang dalam pengembangan

selanjutnya, guna lebih memaksimalkan pendukung

keputusan yang akan diambil, misalkan untuk kepentingan

memudahkan kegiatan promosi bisa ditambahkan sebuah

fasilitas berupa fasilitah pengiriman email kepada customer

Dalam studi kasus ini, item yang digunakan sebagai

data proses dalam pembentuk sebuah cluster hanya

didasarkan pada satu item saja yaitu pembacaan frekuensi

id customer yang ada ditabel transaksi berdasarkan id

Page 26: BAB 1 PENDAHULUAN - agusaan.files.wordpress.com A. Latar Belakang ... • Ekstraksi dari suatu informasi yang berguna atau menarik ... akan dijelaskan pada bagian- lain laporan tugas

26

customer yang ada ditabel customer. Pada pengembangan

selanjutnya disarankan untuk pengambilan data proses

tidak hanya berdasarkan satu item saja, mungkin juga bisa

dilakukan dengan pembacaan lebih dari satu item.

Misalnya id barang ataupun total harga yang dibayarkan

untuk transaksinya, sehingga bisa diketahui barang apa saja

yang biasa dibeli customer pada sebuah klaster maupun

besarnya jumlah total harga yang dibayarkan oleh

customer terhadap transaksi yang dilakukannya. Dengan

demikian klaster yang dibentuk tidak hanya tiga klaster tapi

mungkin lebih dari pada itu dan informasi yang

didapatkanpun menjadi lebih banyak.

Page 27: BAB 1 PENDAHULUAN - agusaan.files.wordpress.com A. Latar Belakang ... • Ekstraksi dari suatu informasi yang berguna atau menarik ... akan dijelaskan pada bagian- lain laporan tugas

27

DAFTAR PUSTAKA

http://rezqiwati.wordpress.com/2009/04/24/data-mining%E2%80%93-proses-tahapan-dan-penerapannya/

http://harsiti09.files.wordpress.com/2009/10/datawarehouse-olap-dan-data-mining2.ppt

http://ligarsekarwangi.blogspot.com/2009/10/penerapan-data-warehouse-pada.html

http://blog-wilsarbali.blogspot.com/2009/11/perlunya-data-warehouse-pada-perusahaan.html

https://datamining10041.wordpress.com/2012/03/11/contoh-kasus-penerapan-data-mining/