pcd 012 - pengenalan pola (lanjutan)

7

Upload: febriyani-syafri

Post on 18-Dec-2014

557 views

Category:

Technology


1 download

DESCRIPTION

 

TRANSCRIPT

Page 1: Pcd   012 - pengenalan pola (lanjutan)
Page 2: Pcd   012 - pengenalan pola (lanjutan)

Pengenalan Pola Terbimbing Versus Tak Terbimbing

Pengenalan pola terbimbing (supervised) dan tak terbimbing (unsupervised)

berkaitan dengan bagaimana klasifikasi dilakukan atau bagaimana pemilah dirancang.

Bila vektor fitur pelatihan tersedia dan telah diketahui kelas-kelasnya, kemudian vektor

fitur pelatihan tersebut dimanfaatkan untuk merancang pemilah maka pengenalan pola

ini disebut terbimbing. Akan tetapi, tidak selamanya vektor fitur pelatihan tersedia

sebelumnya sehingga untuk proses klasifikasi, sekumpulan vektor fitur dikelompokkan

ke dalam beberapa kluster (group) berdasarkan tingkat kemiripannya. Pengenalan pola

seperti itu disebut pengenalan tak terbimbing atau clustering.

Page 3: Pcd   012 - pengenalan pola (lanjutan)

Distance (Jarak)

Jarak digunakan untuk menentukan tingkat kesamaan (similarity degree) atau ketidaksamaan

(disimililarity degree) dua vektor fitur. Tingkat kesamaan berupa suau nilai (scone) dan

berdasarkan skor tersebut dua vektor fitur akan dikatakan mirip atau tidak.

Teknik Clustering (Unsupervised Learning)

Teknik clustering merupakan seni atau teknik mengelompokkan data (objek) ke dalam beberapa

kluster (kelompok) yang belum diketahui. Berbeda dengan teknik klasifikasi, pada clustering,

jumlah dan karakteristik dari kelompok akan diperoleh dari data dan biasanya kelompok-

kelompok tersebut belum diketahui sebelumnya.

Secara umum, metode clustering dikelompokkan menjadi 2 yaitu metode berbasis hirarki

(hierarchical) dan metode berbasis partisi (non-hierachical).

Page 4: Pcd   012 - pengenalan pola (lanjutan)

Pengelompokkan Berbasis Hirarki (Hierachical Clustering)

Algoritma hirarki menghasilkan pengelompokkan seperti tree atau dendogram. Pada level puncak

tree setiap objek dinyatakan sebagai kluster terpisah. Pada level tengah jumlah kluster berkurang

dan pada level terbawah semua objek dikelompokkan menjadi 1 kluster. Salah satu metode yang

tergolong ke dalam metode hirarki dan paling sering digunakan adalah agglomerative

hierarchical.

Algoritma Agglomerative Hierachical

Metode iini dimulai dengan setiap objek dinyatakan sebagai kluster tersendiri. Kedekatan (jarak)

antarkluster dihitung dank luster yang paling dekat digabung. Kedekatan pada kluster baru

dihitung ulang dan kluster paling dekat digabung lagi. Proses tersebut dilakukan secara berulang

sampai seluruh data (objek) menjadi 1 kluster.

Page 5: Pcd   012 - pengenalan pola (lanjutan)

Ada berbagai metode digunakan untuk menghitung kedekatan (jarak) antara dua kluster, di

antaranya sebagai berikut.

Metode tetanggaa terdekat (nearest neighbor) single-linkage.

Metode tetangga terjauh (farthest neighbor) atau complete-linkage.

Metode rata-rata atau average linkage.

Pengelompokkan Berbasis Partisi (Partision Clustering)

Berbeda dengan metode hirarki yang mengelompokkan objek dengan konsep tree, metode partisi

mengelompokkan objek dengan mencari pusat kluster (cluster seeking). Seluruh objek akan

dipartisi ke dalam beberapa kluster dengan setiap kluster memiliki pusat kluster. Salah satu

metode cukup terkenal yang masuk ke dalam kategori ini adalah metode K-means. Teknik yang

lainnya adalah algoritma Maximum-distance dan algoritma Isodata.

Page 6: Pcd   012 - pengenalan pola (lanjutan)

Algoritma K-means

K-means mengelompokkan objek menjadi K kluster. Metode akan mencari pusat kluster dan batas-

batas kluster melalui proses perulangan (iterative). Kedekatan atau kemiripan (similarity) suatu

objek dengan objek yang lain atau dengan pusat kluster dihitung dengan menggunakan jarak.

Jaringan Saraf Buatan untuk Pengenalan Pola

Jaringan saraf tiruan atau Artificial Neural Network yang sering disingkat dengan ANN merupakan

model jaringan neural yang meniru prinsip kerja dari neuron otak manusia (neuron biologis). ANN

pertama kali muncul setelah model sederhana dari neuron buatan diperkenalkan oleh McCulloch dan

Pitts pada tahun 1943. Model sederhana tersebut dibuat berdasarkan fungsi neuron biologis yang

merupakan dasar unit pensinyalan dari sistem saraf.

Page 7: Pcd   012 - pengenalan pola (lanjutan)