a11.2012.07112 alvian yudha prawira tgsdm2 _a11.4803

Tugas 2

Nama: Alvian Yudha Prawira NIM: A11.2012.07112 Kelompok: A11.4803

MACHINE LEARNING DAN DATA MINING

Data mining adalah proses semi otomatis dengan menggunakan teknik statistik,matematika,kecerdasanbuatan,dan machine learning untuk mengekstraksi serta mengidentifikasi informasi pengetahuan potensial dan bermanfaat yang tersimpan di dalam database besar. Mchine Learning sendiri adalah ilmu yang mempelajari cara memberikan kaemampuan kepada komputer untuk menyelesaikan masalah secara mandiri tanpa bantuan user.

Sejarah

Perceptron ditemukan pada tahun 1957, dan menghasilkan model yang lebih optimis untuk AI selama tahun 1960-an. Setelah Marvin Minsky menunjukkan keterbatasan model ini dalam mengekspresikan fungsi kompleks.Kebangkitan pembelajaran machine datang pada pertengahan 1980-an, ketika model pohon keputusan diciptakan dan didistribusikan sebagai perangkat lunak. Hal ini juga di pertengahan 1980-an jaringan saraf multi-layer diciptakan, dengan lapisan tersembunyi(jar-sar), jaringan saraf dapat mengekspresikan fungsi apapun, sehingga mengatasi keterbatasan perceptron.

Pemanfaatan machine learning

Berikut pemanfaatan Machine learning sbb:

1. Digunakan untuk mendetek spam pada email

2. untuk mengidentifikasi wajah dan ekspresi mimik wajah

3. untuk mengenali berbagai suara4. untuk membaca tulisan tangan

Supervised Learning dan Unsepervised Learning Supervised Learning: teknik pembelajaran dengan membuat

fungsi dari data latihan. Data latihan terdiri dari pasangan nilai input dan output yang diharapkan dari input. Tugas dari Supervised learning yaitu untuk memprediksi nilai fungsi untuk nilai semua input yang ada.

Unsepervised Learning: mempelajari bagaimana sebuah sistem dapat belajar untuk merepresentasikan pola input dalam cara yang menggambarkan struktur statistikal dari keseluruhan pola input. Unsupervised learning tidak memiliki target output yang eksplisit atau tidak ada pengklasifikasian input.Dalam machine learning, teknik unsupervised learning menjadi esensial karnaunsupervised sangat penting dikarenakan cara bekerjanya mirip dengan cara bekerja otak manusia, Karena dalam melakukan pembelajaran, tidak ada informasi dari contoh yang tersedia.

Perbedaan

Supervised Learning : Sebagian besar algoritma data mining

(estimation, prediction/forecasting, classification) adalah supervised learning

Variabel yang menjadi target/label/class ditentukan

Algoritma melakukan proses belajar berdasarkan nilai dari variabel target yang terasosiasi dengan nilai dari variable prediktor

Unsupervised Learning: Algoritma data mining mencari pola dari

semua variable (atribut) Variable (atribut) yang menjadi

target/label/class tidak ditentukan (tidak ada)

Algoritma clustering adalah algoritma unsupervised learning

Algoritma

Algoritma Estimasi

Algoritma estimasi mirip dengan algoritma klasifikasi, tapi variabel target adalah berupa bilangan numerik (kontinyu) dan bukan kategorikal (nominal atau diskrit)

Estimasi nilai dari variable target ditentukan berdasarkan nilai dari variabel prediktor (atribut)

Algoritma estimasi yang biasa digunakan adalah: Linear Regression, Neural Network, Support Vector Machine

Algoritma Prediksi

Algoritma prediksi/forecasting sama dengan algoritma estimasi di mana label/target/class bertipe numerik, bedanya adalah data yang digunakan merupakan data rentet waktu(data time series)

Istilah prediksi kadang digunakan juga untuk klasifikasi, tidak hanya untuk prediksi time series, karena sifatnya yang bisa menghasilkan class berdasarkan berbagai atribut yang kita sediakan

Semua algoritma estimasi dapat digunakan untuk prediksi/forecasting

Algoritma Klasifikasi

Klasifikasi adalah algoritma yang menggunakan data dengan target/class/label berupa nilai kategorikal (nominal)

Contoh, apabila target/class/label adalah pendapatan, maka bisa digunakan nilai nominal (kategorikal) sbb: pendapatan besar, menengah, kecil

Contoh lain adalah rekomendasi contact lens, apakah menggunakan yang jenis soft, hard atau none

Algoritma klasifikasi yang biasa digunakan adalah: Naive Bayes, K-Nearest Neighbor, C4.5, ID3, CART, Linear Discriminant Analysis, etc

Algoritma Klastering Klastering adalah pengelompokkan data, hasil

observasi dan kasus ke dalam class yang mirip Suatu klaster (cluster) adalah koleksi data yang mirip

antara satu dengan yang lain, dan memiliki perbedaan bila dibandingkan dengan data dari klaster lain

Perbedaan utama algoritma klastering dengan klasifikasi adalah klastering tidak memiliki target/class/label, jadi termasuk unsupervised learning

Klastering sering digunakan sebagai tahap awal dalam proses data mining, dengan hasil klaster yang terbentuk akan menjadi input dari algoritma berikutnya yang digunakan

Algoritma Asosiasi

Algoritma association rule (aturan asosiasi) adalah algoritma yang menemukan atribut yang “muncul bersamaan”

Dalam dunia bisnis, sering disebut dengan affinity analysis atau market basket analysis

Algoritma asosiasi akan mencari aturan yang menghitung hubungan diantara dua atau lebih atribut

Algoritma association rules berangkat dari pola “If antecedent, then consequent,” bersamaan dengan pengukuran support (coverage) dan confidence (accuration) yang terasosiasi dalam aturan

Algoritma Asosiasi

Contoh, pada hari kamis malam, 1000 pelanggan telah melakukan belanja di supermaket ABC, dimana: 200 orang membeli Sabun Mandi dari 200 orang yang membeli sabun mandi, 50

orangnya membeli Fanta Jadi, association rule menjadi, “Jika membeli sabun

mandi, maka membeli Fanta”, dengan nilai support = 200/1000 = 20% dan nilai confidence = 50/200 = 25%

Algoritma association rule diantaranya adalah: A priori algorithm, FP-Growth algorithm, GRI algorithm

Contoh studi kasus Machine learning

Berikut contoh studi kasus machine learning Analisa pasar dan manajemen.

Solusi yang dapat diselesaikan menggunakandata mining, diantaranya: Menembak target pasar, Melihat pola beli pemakai dari waktu ke waktu, Cross-Market analysis, Profil Customer, Identifikasi kebutuhan Customer, Menilai loyalitas Customer, Informasi Summary.

- Analisa Perusahaan dan Manajemen resiko.

Solusi yang dapat diselesaikan menggunakan data mining, diantaranya: Perencanaan keuangan dan Evaluasi aset, Perencanaan sumber daya (Resource Planning), Persaingan (Competition).

- Telekomunikasi.Sebuah perusahaan telekomunikasi menerapkan data mining untuk melihat dari jutaan transaksi yang masuk, transaksi mana sajakah yang masih harus ditangani secara manual.

Sumber refrensi

http://situkangsayur.wordpress.com/tag/machine-learning/ http://situkangsayur.wordpress.com/2013/11/23/machine-learning-pembelajaran-mes

in/

http://hildaw.wordpress.com/2009/03/12/supervised-learning-vs-unsupervised-learning/

http://ghifar.wordpress.com/2013/07/28/deep-learning-part-1/ http://denysutani.wordpress.com/2008/12/18/machine-learning/ http://tiindonesia.blogspot.com/2013/05/pengertian-machine-learning-pada.html http://www.slideshare.net/SherlyUda/supervised-learning-33884254 https://methodusmethodus.wordpress.com/tag/machine-learning/

http://situkangsayur.wordpress.com/tag/machine-learning/

http://situkangsayur.wordpress.com/tag/machine-learning/

http://situkangsayur.wordpress.com/2013/11/23/machine-learning-pembelajaran-mesin/






http://ghifar.wordpress.com/2013/07/28/deep-learning-part-1/

http://ghifar.wordpress.com/2013/07/28/deep-learning-part-1/

http://denysutani.wordpress.com/2008/12/18/machine-learning/

http://denysutani.wordpress.com/2008/12/18/machine-learning/

http://tiindonesia.blogspot.com/2013/05/pengertian-machine-learning-pada.html

http://tiindonesia.blogspot.com/2013/05/pengertian-machine-learning-pada.html

http://www.slideshare.net/SherlyUda/supervised-learning-33884254

http://www.slideshare.net/SherlyUda/supervised-learning-33884254

https://methodusmethodus.wordpress.com/tag/machine-learning/

https://methodusmethodus.wordpress.com/tag/machine-learning/

a11.2012.07112 alvian yudha prawira tgsdm2 _a11.4803

Technology