konsep dan teknologi data mining.ppt
TRANSCRIPT
Data Mining : Konsep dan Teknologi 1
Aplikasi dan Kecenderungan dalam Data Mining
■ Aplikasi data mining
■ Sistem produk dan protetipe riset data mining
■ Tema tambahan pada data mining
■ Dampak tentang data mining
■ Kecenderungan yang terdapat pada data mining
■ Ringkasan
12 Oktober 2006 Data Mining : Konsep dan Teknologi 2
Aplikasi Data Mining
■ Data Mining adalah suatu aplikasi terbaru yang berbeda dan lebih luas
■ Masih adanya perbedaan pendapat antara prinsip umum dan pembagian wilayah secara khusus pada aplikasi data mining, khususnya pada keefektifan alat bantu data mining untuk aplikasi tertentu
■ Beberapa aplikasi domein (yang tercantum pada bab ini)■ Biomedical dan analisa data DNA
■ Analisa data keuangan
■ Industri penjualan eceran
■ Industri telekomunikasi
12 Oktober 2006 Data Mining : Konsep dan Teknologi 3
Biomedical dan Analisa Data DNA
■ Urutan DNA: 4 dasar yang membangun blok ( nucleotides): adenine ( A), cytosine ( C), guanine ( G), dan thymine ( T)
■ Gen: suatu urutan dari beratus-ratus individu nucleotides yang diatur secara tertentu
■ Manusia mempunyai sekitar 30,000 gen
■ Hal yang paling luar biasa yaitu jumlah jalan yang terdapat pada nucleotides sehingga dapat dipecah dan diurutkan kembali untuk membentuk gen yang terpisah
■ Pengintegrasian pembagian heterogen yang semantik, dalam genome database
Sekarang: terbagi-bagi, Generasi yang tak terkendali dan penggunaan data DNA secara luas
Metoda pembersihan dan pengintegrasian data yang dikembangkan dalam Data Mining akan sangat membantu
12 Oktober 2006 Data Mining : Konsep dan Teknologi 4
Contoh Analisa DNA
Pencarian persamaan dan perbandingan antar urutan DNA
Perbandingan sering terjadi pada pola tiap kelas ( sebagai contoh, sehat dan sakit)
Mengidentifikasi urutan pola gen yang berperan dalam berbagai penyakit
Analisa asosiasi: identifikasi dari co-occurring urutan gen
Kebanyakan penyakit tidaklah dicetuskan oleh gen tunggal tetapi oleh suatu kombinasi gen yang bertindak bersama-sama
Analisa asosiasi dapat membantu menentukan macam gen yang mungkin terjadi bersama-sama dalam target percontohan
Analisa alur: menghubungkan gen pada masa pengembangan penyakit lain
Gen yang berbeda bisa menjadi aktip pada penyakit yang berbeda
Intervensi pada masa perkembang farmasi yang mentargetkan langkah-langkah yang berbeda secara terpisah
Penggambaran alat bantu dan analisa data genetik
12 Oktober 2006 Data Mining : Konsep dan Teknologi 5
Data Mining pada Analisa Data Keuangan
Data keuangan yang dikumpulkan oleh bank dan lembaga keuangan relatif lebih lengkap, dapat dipercaya, dan bermutu tinggi
Disain dan konstruksi dari gudang data untuk multidimensional analisa data dan data mining
Gambaran dari hutang perbulan, perdaerah, persektor, dan faktor lain
Mengakses informasi statistik seperti maximum, minimum, total, rata-rata, kecenderungannya, dan lain lain
Analisa pembayaran peminjaman kebijakan kredit secara prediksi per pelanggan
Seleksi di masa depan dan perlunya penggolongan secara atribut
Pencapaian pembayaran peminjaman
Nilai kredit konsumen
12 Oktober 2006 Data Mining : Konsep dan Teknologi 6
Keuangan Data Mining
Penggolongan dan pengelompokan pelanggan untuk target pemasaran
Segmentasi multidimensional berdasarkan metode terdekat, penggolongan, alur keputusan, dan lain lain untuk mengidentifikasi penggolongan persediaan sekelompok pelanggan atau pelanggan baru
Mendeteksi pencucian uang dan kejahatan keuangan lainpengintegrasian dari berbagai DBs ( sebagai contoh, transaksi bank, DBs sejarah kejahatan federal/negara)
Alat bantu: data gambar, analisa pertalian, penggolongan, alat penggabungan, analisa orang asing, dan analisa pola alat percontohan (ditemukan urutan akses secara tidak biasa)
12 Oktober 2006 Data Mining : Konsep dan Teknologi 7
Data Mining pada Industri Retail
Industri Retail: besarnya data penjualan, sejarah belanja pelanggan, dan lain-lain
Aplikasi dari Retail data miningMengidentifikasi perilaku pembelian pelanggan
Menentukan kecenderungan pola belanja pelanggan
Meningkatkan mutu dari layanan pelanggan
Mencapai kepuasan pelanggan
Tingkatkan perbandingan konsumsi barang-barang
Mendisain keefektifan distribusi dan transportasi barang
12 Oktober 2006 Data Mining : Konsep dan Teknologi 8
Contoh Data Mining pada Industri Retail
Disain dan konstruksi dari gudang data yang didasarkan keuntungan penggunaan data mining
Analisa multidimensional dari penjualan, pelanggan, produk, waktu, dan daerah
Analisa dari efektivitas dari kampanye penjualanIngatan pelanggan: Analisa dari kesetiaan pelanggan
Menggunakan informasi kartu kesetiaan pelanggan untuk mendaftarkan urutan dari pembelian dari pelanggan tertentuMenggunakan pola mining untuk menyelidiki perubahan dalam konsumsi atau kesetiaan pelanggan Menyarankan penyesuaian penetapan harga dan variasi barang-barang
Referensi pembelian dan perbandingan materi
12 Oktober 2006 Data Mining : Konsep dan Teknologi 9
Data Mining pada Industri Telekomunikasi ( 1)
Perkembangan yang sangat cepat dan industri yang sangat kompetitif dan permintaan yang besar untuk data mining
Memahami bisnis yang terlibatMengidentifikasi pola telekomunikasiMenangkap aktivitas curangMempergunaan sumber daya secara lebih baikMeningkatkan mutu dari layanan
Analisa multidimensional dari data telekomunikasiHakekat multidimensional: tempo pemanggilan, jangka waktu, lokasi dari pemanggil, jenis panggilan, dan lain lain
12 Oktober 2006 Data Mining : Konsep dan Teknologi 10
Data Mining pada Industri Telekomunikasi ( 2)
Analisa pola kecurangan dan identifikasi pola yang tidak lazim
Mengidentifikasi pola para pengguna yang berpotensi curang dan penggunaan yang tidak lazimMendeteksi usaha kecurangan masukan ke dalam rekening pelangganMenemukan pola yang tidak biasa memerlukan perhatian khusus
Multidimensional asosiasi dan percontohan pola analisaTemukan pola satu set jasa komunikasi berdasarkan kelompok pelanggan, bulan, dan lain lainMempromosikan penjualan dari jasa spesifikMeningkatkan ketersediaan dari jasa tertentu pada suatu daerah
Penggunaan alat bantu penggambaran dalam analisa data telekomunikasi
12 Oktober 2006 Data Mining : Konsep dan Teknologi 11
Bagaimana cara memilih suatu Sistem Data Mining?
Secara komersil sistem data mining mempunyai sedikit kesamaan
Perbedaan kemampuan atau metodologi Data MiningDapat bekerja dengan bermacam-macam data yang berbeda
Memerlukan berbagai pandangan yang dimensional dalam pemilihanJenis data: relational, tanggapan, teks, urutan waktu, ruang?Isu sistem
Hanya berjalan pada satu atau beberapa sistem operasi?Arsitektur client/server?Menyediakan tampilan berbasis Web dan mengijinkan data XML sebagai masukan atau keluaran?
12 Oktober 2006 Data Mining : Konsep dan Teknologi 12
Bagaimana cara memilih suatu Sistem Data Mining? ( 2)
Sumber dataFile teks ASCII, berbagai sumber data relationalMendukung koneksi ODBC ( OLE DB, JDBC)?
Fungsi dan metodologi Data miningSatu melawan berbagai fungsi data miningSatu melawan berbagai macam variasi perfungsi
Fungsi lain data mining dan metoda perfungsinya menyediakan pengguna dengan analisa dan fleksibilitas yang lebih besar
Menggabungkan dengan DB dan/atau sistem data gudangEmpat format penggabungan: tidak ada penggabungan, penggabungan lepas, penggabungan semi ketat, dan penggabungan ketat
Idealnya, suatu sistem data mining harus di gabungkan dengan ketat dengan suatu sistem database
12 Oktober 2006 Data Mining : Konsep dan Teknologi 13
Bagaimana cara memilih suatu Sistem Data Mining? ( 3)
ScalabilitasScalabilitas perbaris ( atau ukuran database)Scalabilitas perkolom ( atau dimensi)Kutukan dari dimensionalitas: jauh lebih menantang untuk membuat suatu skala sistem kolom dari pada skala sistem baris
Alat bantu gambar"Suatu gambar dapat berharga seribu kata-kata“Kategori penggambaran: data gambar, hasil gambaran, proses penggambaran, dan gambaran data mining
Bahasa query pada Data mining dan tampilan grafis pengguna
Mudah digunakan dan grafis yang berkualitas tinggiPentingnya buku pedoman, data mining yang sangat interaktip
12 Oktober 2006 Data Mining : Konsep dan Teknologi 14
Contoh Sistem Data Mining ( 1)
Miner IBM yang cerdasSuatu cakupan luas dari algoritma data miningSkala algoritma data miningAlat bantu: algoritma jaringan neural, metode statistik, persiapan data, dan alat bantu penggambaran data gambarPengintegrasian yang ketat IBM dengan relational sistem database DB2
Perusahaan SAS minerBerbagai alat bantu analisa yang statistikAlat bantu data gudang dan berbagai data algoritma mining
Microsoft SQLServer 2000Mengintegrasikan DB dan OLAP dengan miningMendukung OLEDB untuk DM standard
12 Oktober 2006 Data Mining : Konsep dan Teknologi 15
Contoh Sistem Data Mining ( 2)
Sgi MinesetBerbagai algoritma dan statistik tingkat lanjut data miningAlat bantu penggambaran tingkat lanjut
Clementine (SPSS)Pengembangan lingkungan data mining yang terintegrasi untuk pengguna akhir dan pengembangBerbagai algoritma data mining dan alat bantu penggambaran
DBMiner ( DBMiner Teknologi Inc.)Berbagai modul data mining : analisa OLAP discovery-driven, asosiasi, penggolongan, dan pengelompokanefisien, Asosiasi dan sequential-pattern fungsi mining, dan alat penggolongan visuilMining antara database relational dan data gudang
12 Oktober 2006 Data Mining : Konsep dan Teknologi 16
Visuallisasi Data Mining
Visualisasi: penggunaan grafik komputer untuk menciptakan gambaran visuil yang membantu pemahaman yang ruwet, penyajian presentasi data yang kokoh
Visualisasi Data mining: proses menemukan kandungan yang tersembunyi dapat menjadi pengetahuan yang bermanfaat khususnya dari data yang besar dengan menggunakan teknik visualisasi
12 Oktober 2006 Data Mining : Konsep dan Teknologi 17
Visualisasi
Tujuan visualisasiMemperoleh masukan ruang informasi dengan mempetakan data ke dalam grafis sederhanaMenyediakan ikhtisar yang kwalitatif dari data yang besarMencari contoh pola, kecenderungan, struktur, ketidakteraturan, hubungan antar data.Bantuan untuk menemukan daerah menarik dan parameter yang pantas untuk analisis kuantitatif lebih lanjut.Menyediakan suatu bukti yang visuil tentang memperoleh penyajian komputer
12 Oktober 2006 Data Mining : Konsep dan Teknologi 18
Visualisasi Data Mining & Visualisasi Data
Pengintegrasian dari visualisasi data miningVisualisasi data
Hasil Visualisasi data mining
Proses visualisasi data mining
Visualisasi data mining yang interaktip
Visualisasi dataData dalam database atau data gudang terlihat
Pada tingkat abstrak yang berbeda
Sebagai kombinasi yang berbeda tentang atribut atau dimensi
Data dapat dipersentasikan dalam berbagai format visual
12 Oktober 2006 Data Mining : Konsep dan Teknologi 19
Hasil Visualisasi Data Mining
Presentasi dari hasil atau pengetahuan yang diperoleh dari format visual data mining
ContohMenyebar alur cerita dan boxplots (yang diperoleh dari data mining)
Alur keputusan
Aturan Asosiasi
Kelompok
Asing
Aturan disamaratakan
12 Oktober 2006 Data Mining : Konsep dan Teknologi 20
Boxplots dari Statsoft: Berbagai Combinasi Variabel
12 Oktober 2006 Data Mining : Konsep dan Teknologi 21
Visualisasi dari Data Mining pada Perusahaan SAS Miner : Menyebaran
Plots
12 Oktober 2006 Data Mining : Konsep dan Teknologi 22
Visualisasi dari Peraturan Asosiasi SGI/MineSet 3.0