tugas paper totolan 2- leni gustini_1501166301_06pjm
DESCRIPTION
Tugas Paper Totolan 2- Leni Gustini_1501166301_06PJMTRANSCRIPT
TUGAS PAPER
Data Mining dan Contoh Penerapan Data Mining Dalam Perusahaaan
Nama :
Leni Gustini 1501166301
06 PJM
Abstrak
Tujuan dari pembahasan mengenai topik data mining ini adalah untuk memberikan
pengetahuan dan informasi kepada para pembaca mengenai data mining yang telah dikenal di
perusaahan. Di dalam perusahaan pasti mempunyai data yang penting, data-data penting itu
dikumpulkan dan di simpan di dalam data warehouse. Dalam data warehouse berisi kumpulan
data yang akan berguna bagi perusahaan untuk mengambil keputusan. Namun, data yang ada
di data warehouse sangatlah banyak, jadi kita harus menggunakan data mining dalam
pencarian data ataupun informasi yang dicari.
Selain data mining, ada juga data mart yang saling terkait yang digunakan untuk
memdukung satu sama lain. Data mining sendiri dapat berguna dan memberikan solusi bagi
perusahaan seperti yang akan di bahas didalam paper ini dan juga kita bisa melihat contoh
penerapan data mining di beberapa perusahaan.
Metode analisa yang digunakan didalam paper ini adalah metode pengumpulan data
melalui e-jurnal,artikel,penelitian ilmah maupun sumber lain yang dapat ditemukan dengan
pencarian melalui internet.
Kata kunci : Data, Data Warehouse, Data Mining, Data Mart
BAB I
Pendahuluan
1.1 Latar Belakang
Saat ini kemajuan teknologi sudah sangatlah berkembang dengan pesat.
Kebutuhan perusahaan dan traksaksi yang dilakukan perusahaan sangatlah banyak,
setiap transaksi di dalam perusahaan di kumpulkan dan disimpan agar data atau
informasi tersebut dapat membantu perusahaan dalam pengambilan keputusan.
Kumpulan data yang ada disimpan di dalam perusahaan disebut data warehouse,
karena kumpulan data yang banyak bagaimana cara perusahaan mencari atau
menemukan informasi dan data yang dibutuhkan oleh perusahaan untuk suatu
masalah.
Dalam perkembangannya,munculah data mining yang digunakan untuk
mencari data, informasi maupun knowledge yang berguna bagi perusahaan. Dengan
kehadiran data mining inilah perusahaan dapat mencari informasi maupun knowledge
yang ada di data warehouse. Namun, masih banyak orang yang tidak mengetahui
mengenai data mining, padalah dengan penerapan data mining ini dapat membantu
perusahaan untuk mengatasi masalah yang ada, asal mengetahui lebih dalam mengenai
data mining dan teknik dan langkah-langkah apa saja yang dibutuhkan dalam
penerapan data mining. Oleh karena itu , saya memilih topik ini agar para pembaca
khususnya bagi mahasiswa Bina Nusantara dapat mengetahui lebih jelas lagi
mengenai data mining.
1.2 Ruang Lingkup
Rung Lingkup dari penulisan paper ini akan dibatasi pada pengertian data mining,
solusi yang diberikan,langkah-langkah data mining, tugas-tugas data mining, , tool data
mining, karakterik data mining,tujuan data mining,teknik-teknik untuk data mining dan
contoh penerapan data mining.
1.3 Tujuan dan Manfaat
Adapun tujuan dalam penulisan Paper ini adalah:
1. Mengetahui mengenai data mining
2. Mengetahui solusi yang diberikan oleh data mining
3. Mengetahui mengenai langkah-langkah data mining
4. Mengetahui mengenai teknik-teknik data mining
5. Mengetahui mengenai tujuan data mining
6. Mengetahui tugas-tugas data mining
7. Mengetahui artsitektur data mining
8. Mengetahui karatkteristik dan tool data mining
9. Mengetahui contoh penerapan data mining di beberapa perusahaan
Manfaat yang di dapat dari penulisan paper ini adalah :
1. Dapat mengetahui apakah data mining itu
2. Mampu mempertimbangkan penggunaan data mining agar bisa diterapkan di
kehidupan nyata
3. Mampu menerapkan data mining secara benar dan tepat
1.4 Metodologi
Metedologi yang digunakan dalam penulisan paper ini adalah :
1. Memberikan definisi mengenai data mining
2. Mengumpulkan informasi dan data dari berbagai sumber yang telah diketahui
kebenarannya mengenai data mining
3. Analisis informasi dan data mengenai data mining yang telah diperoleh
BAB II
LANDASAN TEORI
2.1. Data
2.1.1. Pengertian Data
Pengertian data menurut Webster New World Dictornary data adalah
sesuatu yang diketahui dan dianggap, yang berati data tersebut sudah
diketahui kebenarannya dan dapat mengambarkan suatu kejadian atau
kondisi.
Pengertian data menurut Inmom (2005) data adalah sekumpulan
fakta,instruksi tempat penyimpanan yang berguna untuk kepentingan
komunikasai, memperbaiki dan prosesnya dilakukan secara otomatis dan
mempresentasikan informasi yang bisa dimengerti untuk user.
Pengertian data menurut Turban (2010) data adalah gambaran dasar dari
event,benda,kegiatan dan transaksi yang ditulis, direkam, dikelompokan
dan disimpan tetapi belum diolah dan terorganisir untuk memberikan arti
atau informasi.
2.1.2. Pembagian Data dan Kriteria Data
Pembagian data menurut Lugan (2010) adalah sebagai berikut :
1. Menurut Sifat
Menurut sifat data, data dapat dibagi lagi menjadi dua yaitu
sebagai berikut:
Data Qualitative
Data Quantitative
2. Menurut Waktu
Menurut waktu data, data dapat dibagi lagi menjadi dua yaitu
sebagai berikut :
Data Silang
Data Berkala
3. Menurut Cara Memperoleh
Menurut cara memperoleh data, data dapat dibagi lagi menjadi
dua yaitu sebagai berikut :
Data Primer
Data Skekunder
4. Menurut Sumber
Menurut sumber, data dapat dibagi lagi menjadi dua yaitu
sebagai berikut :
Data Internal
Data External
2.2. Data Warehouse
2.2.1 Pengertian Data Warehouse
Pengertian data warehouse menurut Inmon (2005) data warehouse
adalah kumpulan data yang berorientasikan objek, non-volatile, time
variant dan terintegrasi yang digunakan untuk mendukung proses
pengambilan keputusan dalam perusahaan.
Pengertian data warehouse menurut Connoly dan Begg (2010) data
warehouse adalah kumpulan data yang berorientasikan,
objek,terintegrasi, time based dan tidak mengalami perubahan untuk
mendukung proses pengambilan keputusan dalam perusahaan.
Pengertian data warehouse menurut Hsiang Yuan (2007) data
warehouse adalah solusi yang digunakan untuk mekonversikan data
dari database yang saling berdistribusi.
Pengertian data warehouse O’Brien (2010) data warehouse adalah
kumpulan data yang telah diekstrak dari database operasional,history
yang telah dibersihkan,dikelompokan dan diubah untuk ditelusuri dan
dianalisis untuk proses pengambilan keputusan di dalam perusahaan.
2.2.2 Karakteristik Data Warehouse
Menurut Inmon karakteristik data warehouse adalah sebagai berikut :
1. Integration
Di dalam data warehouse tersimpan data-data yang berasal
dari berbagai sumber termasuk transaksi yang ada di
perusahaan yang dimpan di dalam format yang konsisten
dan saling terintegrasi satu sama lain, karena itu data tidak
dapat terpisah-pisah atau terpecah karena data tersebut
merupakan satu kesatuan.
Gambar 2.1. Integration Data Warehouse
2. Subject Oriented
Subject orieted maksudnya data warehouse di rancang
untuk menganalisis data berdasarkan subject tertentu di
dalam organisasi, namun bukan pada proses maupun fungsi
pada aplikasi tertentu.
3. Time Variant
Data yang ada di dalam datawarehouse relavant dan akurat
dalam rentang waktu tertentu. Kita bisa melihat rentang
waktu untuk memastikan kebenaran data dengan beberapa
cara.
Gambar 2.2. Time Variance Data Warehouse
4. Non Volalite
Non volalite adalah dimana data pada data warehouse tidak
terupdate seacara real time tetapi direfresh dari operational
system secara terus-menerus. Data yang baru akan
ditambahkan untuk database itu yang dimana database
tersebut akan mengalami perubahan.
Gambar 2.3. Non Volalite Data Warehouse
2.3. Pengertian Data Mart
Pengertian data mart menurut Huisman (2009) adalah, data mart sebagain kecil dari
data warehouse yang berkaitan dengan proses binis yang detil.
Pengertian data mart menurut Inmon(2005) adalah stuktur data perunit atau perdivisi
yang didapatkan dari data warehouse dimana data tersebut di normalisasikan sesuai
dengan kebutuhan divisi atau unit tersebut.
Pengertian data mart menurut Connoly dan Begg (2010) adalah seluruh database yang
di dalamnya berisi data perusahaan yang akan mendukung syarat analitis dari unit
perusahaan .
BAB III
Pembahasan
4.1. Data Mining
Data mining adalah proses pencarian pengetahuan di dalam data warehouse maupun
dalam kumpulan data untuk mencari data atau informasi yang yang dicari. Menurut para ahli,
ada beberapa pengertian dari data mining, yaitu sebagai berikut :
Menurut Han dan Kamber (2006) data mining adalah proses untuk mengekstrak
maupun menggali knowledge yang dibutuhkan dari kumpulan data yang berskala
besar.
Menurut Connolly dan Begg (2010) data mining adalah proses ektraksi atau menggali
data yang tidak diketahui dari database yang besar namun data tersebut dapat berguna
dan di pahami guna membantu penggambilan keputusan.
Dengan adannya data mining bisa memberikan beberapa solusi yaitu seperti :
1.Memprediksikan target pasar
Data mining dapat digunakan untuk pengelompokan model pembeli dan
melakukan classification pada setiap customer yang sesuai dengan
karateristiknya
2. Cross Market Analysis
Data mining bermanfaat untuk memperlihatkan hubungan antar produk
dengan produk lainnya
3. Memperlihatkan pola pembelian dari waktu ke waktu
Data mining dapat digunakan untuk memperlihatkan pola pembelian dari
waktu ke waktu
5.Customer Profil
Data mining dapat digunakan untuk membantu user , dimana user bisa
melihat customer profil sehingga user dapat mengetahui produk apa yang
paling disukai oleh customer
6. Summary Information
Data mining dapat digunakan untuk membuat laporan summary spserti
adanya grafik maupun gambar yang lengkap berserta dengan nilai
statistiknya
4.2. Tujuan Data Mining
Menurut Hoffer,Prescott dan McFadden ( 2007) tujuan dari data mining adalah
sebagai berikut:
1. Explanatory
Explanatory digunakan untuk menjelaskan kondisi penelitian,
contohnya seperti mengapa penjualan kayu meningkat di Rusia.
2. Exploratory
Exploratory digunakan untuk menganalisa data mana yang
memiliki hubungan baru. Contohnya pola apa yang sesuai untuk
kasus korupsi yang terjadi di Indonesia
3. Confirmatory
Confirmatory digunakan untuk mempertegas dugaan atau
hipotesis, sama seperti pendapatan rumah tangga lebih banyak
digunakan untuk membeli kebutuhan rumah tangga dibandingan
dengan satu kali pendapatan rumah
4.3. Langkah-Langkah Data Mining
Dalam data mining kita perlu menentukan langkah- langkahnya. Menurut standar dari
Industry Standard Process for Data Mining atau yang disingkat menjadi CRISP DM langkah-
langkah tersebut adalah :
1. Business Understanding
Menentukan tujuan dan menganalisis kebutuhan yang ada dalam bisnis tersebut
Menerjemahkan tujuan dan batasan yang ada dan membuat formula dari tujuan dan
batasan tersebut berdasarkan masalah yang terjadi pada data mining tersebut
Mempersiapkan strategi untuk mencapai tujuan yang telah ditetapkan
2. Data Understanding
Pengumpulan data
Menganalisis data untuk lebih mengenali data yang dilolah untuk menemukan
informasi
Evaluasi data serta kualitas data tersebut
Bisa juga kita memilih data yang kecil yang dapat mengambarkan masalah yang ada
3. Data Preparation
Menyiapkan data dan mengumpulkan data yang akan digunakan untuk digunakan
dalam langkah berikutnya
Pilihlah case dan variabel yang sesuai guna keperluan analisis yang akan dilakukan
Jika diperlukan, lakukanlah perubahan pada beberapa variabel
Menyiapkan data yang akan digunakan untuk perangkat pemodelan
4. Modeling
Memilih dan menerapkan teknik pemodelan yang sesuai
Kalibrasi model untuk memberikan hasil yang optimal.
Ada beberapa teknik yang berbeda namun bisa digunakan untuk mengatasi masalah
yang sama di dalam data mining
Proses dapat kembali ke langkah data preparation agar data dapat sesuai dengan
kebutuhan di dalam teknik mining
5. Evaluation
Evaluasi model yang digunakan untuk mendapatkan hasil yang maksimal sebelum
digunakan
Mencari apakah ada model yang telah memenuhi tujuan dalam langkah awal
Tentukan apakah ada masalah yang belum ditangani
Ambil sebuah keputusan yang sesuai dari hasil data mining
6. Deployment
Gunakan model yang telah dibuat dalam langkah-langkah ini
Contoh deployment : membuat laporan untuk deployment yang sederhana dan
deployment kompleks seperti penerapan data mining secara paralel
Gambar 4.1 Langkah-langkah Data Mining (sumber:wikipedia)
Sedangkan langkah-langkah data mining di dalam proses KKD atau yang disebut juga
sebagai Knowledge Discovery in Database adalah :
1. Data Cleaning
Adalah langkah dimana kita akan menghilangkan atau membuang redudansi data, data
yang tidak konsisten, dan memperbaiki kesalahan pada data. Data cleaning akan
berdampak pada hasil informasi yang ada dalam data mining
2.Data Integration
Adalah langkah dimana kita dapat menambahkan informasi maupun sumber kedalam
data atau infromasi yang sudah ada, data integration bisa disebut juga sebagai
pengabunggan data menjadi data yang baru yang hasilnya menjadi akurat dan detail.
3. Data Selection
Adalah langkah dimana kita memilih data yang sesuai dan relavant untuk dilakukan
analisis dari data yang sudah ada, yang hasilnya akan disimpan kedalam database yang
terpisah
4. Data Transformation
Adalah langkah dimana data diubah sesuai dengan format untuk data mining
5. Data Mining
Adalah langkah dimana proses untuk mencari knowledge,informasi maupun pola
dengan menggunakan metode ataupun teknik alogaritma
6. Pattern Evolution
Adalah langkah dimana kita mengidentifikasikan pola menarik dari data mining yang
dilakukan
7. Knowledge Presentation
Adalah langkah dimana ditampilkannya gambaran visualisasi berupa pola dari hasil
informasi atupun knowledge yang dilakukan dengan data mining
Gambar 4.2 Langkah-langkah data mining pada proses KKD
4.4. Teknik-teknik Data Mining
Teknik-teknik yang sering dipakai di dalam data mining adalah sebagai berikut :
1. Association Rule Mining
Teknik ini dipakai untuk mengetahui perilaku dari kejadian khusus maupun
proses dimana hubungan asosiasi muncul pada setiap kejadian. Contohnya
adalah aturan asosiatif dari analisis pembelian pada suatu pasar dari sini bisa
diketahui kemungkinan seorang customer yang membeli susu dengan roti
secara bersamaan. Sehingga penjual dapat mengetahui pembelian apa saja
yang mungkin dibeli dan memberikan diskon pada barang tertentu.
2.Clustering
Teknik clustering sering di masukan sebagai metode unsupervised learning.
Karena clustering dapat digunakan untuk memberikan label pada class data
yang belum diketahui atau dikenali. Clustering sendiri melakukan
pengelompokan data tanpa didasarkan class tertentu. Prinsip dari teknik
clustering adalah untuk memaksimalkan persamaan antara anggota class dan
meminimalisir persamaan class.
3. Classification
Teknik classification meupakan proses untuk menemukan model maupun fungsi
yang dapat menjelaskan atau membedakan class dari data yang bertujuan untuk
menentukan class dari suatu object yang belum diketahui. Teknik classification ini
mempunyai aturan ‘if-then’, seperti desicion tree. Contoh teknik classification
lainnya adalah fuzzy, k-nearest, dan bayesian.
4.5. Arsitektur Data Mining
Komponen aristektur data mining menurut Han dan Kamber adalah sebagai berikut :
1. Database, Data Warehouse, WWW
Adalah tempat penyimpanan informasi, selain itu kita juga bisa menyimpan
informasi ketempat yang lain yang bisa berbentuk database,spreadsheet maupun
data warehouse. Dalam data atau informasi tersebut dijalanlan data intregation,
data selection dan data cleaning.
2. Data Mining Engine
Data mining engine mempunyai peran penting dalam arsitektur data mining
dimana data mining engine ini terdapat modul fungsional misalnya seperti
assosiaction,analisis cluster, dan classification
3. Database dan Data Warehouse Server
Database dan data warehouse server bertanggung jawab atas pengambilan
data yang benar dan akurat sesuai dengan request dari user.
4.Knowledge Based
Knowledge based merupakan sebuah domain knowledge yang berguna
untuk dalam pencarian dan evalusi pola-pola yang telah dihasilkan.
Knowledge meliputi konsep hiraki yang berguna untuk organisasi value
maupun artibut kedalam level tertentu
5. GUI
GUI akan berinteraksi dengan user dan data mining, cara user berinteraksi
dengan GUI ini adalah dengan cara menggunakan query yang akan
dikirimkan dan dikembalikan sesuai dengan request dari user
6. Data Cleaning
Data cleaning digunakan untuk menghilangkan maupun membuang data
yang tidak benar, redudansi data dan noise yang ada.
7. Pattern Evaluation
Pattern evaluation digunakan untuk menemukan value yang berasal dari
knowledge
8. Data Integration
Data integration ini digunakan untuk mengabung data dari berbagai
macam sumber
Gambar 4.3. Arsitektur data mining
4.6. Tool Data Mining
Karakteristik dari tool data mining adalah sebagai berikut :
Fasilitas Persiapan Data
Fasilitas untuk visualisasi hasil
Pemilihan operasi data mining /algoritma
Skalabilitas dan Kinerja Produk
Macam-macam data mining tool adalah sebagai berikut :
Informations Discovery Inc Data Mining Suite
Integral Solution Ltd Clementine
SAS Institute Inc SAS System
IBM’s Intelligent Miner
DataMind Corps Data Crusher
4.7. Tugas Data Mining
Menuut Tan,dkk 2006, tugas utama data mining dibagi menjadi dua, yaitu :
1. Predictive
Memprediksikan value dari atribut yang berdasarkan value dari atribut lainnya
2. Descriptive
Untuk mendapatkan pola seperti correlation,cluster,anomaly,trend,trajectory
yang dapat memberikan kesimpulan atas hubungan yang ada di dalam data
Tugas Data Mining adalah sebagai berikut :
1. Predictive Modeling
Predictive modeling terpaku pada proses pembanginan
model untuk variable target sebagai fungsi dari variable
yang menjelaskan. Predictive modeling dibagi menjadi dua
kategori yaitu :
a. Classification
Classification digunakan untuk target variable disket
b. Regression
Regression digunakan untuk target variable kontinu
2. Analisa Asosiasi
Analisa asosiasi berguna untuk menemukan pola
yang dapat mengambarkan fitur yang saling
berhubungan
3. Analisa Cluster
Analisa cluster adalah proses yang berguna untuk mencari
kelompok-kelompokdata sehingga data yang berada dalam
satu kelompok memiliki persamaan dibandingan dengan
kelompok data
4. Deteksi Anomaly
Deteksi anomaly adalah proses identifikasi karakteristik
data yang memiliki perbedaan secara dignifikan dengan data
yang lain
Gambar 4.4. Tugas Data Mining
4.8. Contoh Penerapan Data Mining di dalam Perusahaan
Berikut adalah beberapa contoh perusahaan yang menggunakan data mining, yaitu :
1. Perusahaan Australian Health Insurance Commision yang bergerak dalam bidang
asuransi menggunakan data mining yang digunakan untuk meindentifikasi layanan
kesehatan. Hasil dari penggunaan data mining ini membuat Australian Health
Insurance Commision dapat menghemat $1.000.000/ tahun .
2. IBM Surf-Aid menggunaka alogaritma data mining yang digunakan untuk
mencatat akses halaman web yang berkaitan pada pemasaran untuk melihat perilaku
dan minat pelanggan serta mengamati apakah pemasaran dengan web efektif
3. Financial Crimes Enforcement Network yang terletak di AS menggunakan data
mining untuk menggali atau menambang triliun dari berbagai sumber seperti rekening
bank, transaksi keuangan dan lain-lain untuk menemukan adanya transaksi keuangan
yang mencuringakan seperti penggelapan
BAB IV
Kesimpulan dan Saran
4.1 Kesimpulan
Kesimpulan yang bisa didapat dari paper ini adalah data mining merupakan proses
pencarian maupun penggalian mengenai informasi maupun knowledge yang dicari agar
informasi atau knowledge itu bisa digunakan untuk membantu perusahaan untuk mengambil
keputusan. Di dalam data mining terdapat langkah-langkah maupun teknik-teknik yang bisa
digunakan sesuai kondisi maupun masalah yang muncul. Selain itu data mining mempunyai
karakteristik maupun tool yang beguna bagi perusahaan. Data mining juga dapat memberikan
solusi bagi perusahaan dalam memecahkan masalah yang ada di perusahaan contohnya seperti
IBM Surf-Aid, Financial Crimes Enforcement Network dan Australian Health Insurance
Commision.
4.2 Saran
Data mining sangatlah penting bagi perusahaan dalam pencarian informasi maupun
knowledge yang dibutuhkan yang ada di dalam data warehouse. Namun, tidak semua
penerapan data mining di dalam perusahaan benar atau tepat. Untuk mendapatkan hasil
maksimal dari penerepan data mining, perusahaan harus mengerti lebih dalam mengenai data
mining, seperti teknik yang tepat untuk perusahaan tersebut.Perusahaan juga bisa mempelajari
data mining dari perusahaan yang telah sukses dalam menerapkan data mining sehingga
perusahaan dapat menerapkan data mining secara benar dan dapat mengatasi permasalahan
yang ada di dalam perusahaan.
Daftar Pustaka
http://mugi.or.id/blogs/luki/archive/2010/07/17/tentang-crisp-dm.aspx
http://upload.wikimedia.org/wikipedia/commons/b/b9/CRISP-
DM_Process_Diagram.png
http://informatika.web.id/category/data-mining
http://annisapuspakirana.staff.ub.ac.id/data-mining-data-warehouse/
http://repository.usu.ac.id/bitstream/123456789/33409/3/Chapter%20II.pdf
http://informatika.web.id/tugas-data-mining.htm
http://biwfobim.wordpress.com/2012/08/05/penerapan-data-mining-dalam-bisnis/
http://repository.usu.ac.id/bitstream/123456789/31270/3/Chapter%20II.pdf
http://hibah.ilearning.me/wp-content/uploads/sites/381/2013/11/
AsepSaefullah_STMIKRaharja_PDP.pdf
http://www.pengertianahli.com/2013/11/pengertian-data-dan-jenis-data.html
http://library.binus.ac.id/eColls/eThesisdoc/Bab2/2012-1-00631-SI%20Bab2002.pdf
http://www.academia.edu/4517858/Pengertian_Data
DAFTAR RIWAYAT HIDUP
Picture
Binusian ID :1501166301
Full Name : Leni Gustini
Email : shinyeon_yeon.yahoo.com
Address Current
Jl Haji Senen no 54
Jakarta Barat 00000
DKI Jakarta, Indonesia
Permanent
Jl Raya Kosambi n0 52
Karawang 41313
Phone Numbers : Mobile : 62-85-781898236
Home : 62-26-7436449
Fax : 62-85-781898236
Office: 62-85-781898236
Gender : Female
Birth Place/Date : Jungkat, 01 Agustus 1993
Nationality : Indonesia
Martial Status : Single
Region : Christian
Formal Education
Jan 2011-Present :Bina Nusantara University, Jakarta
,Indonesia
Bacheleor (S1), Information Systems GPA:
3.52
Organization Experience
Oct 2011 – Present : HIMSISFO, Commite
Commitee