pw 1341 teknik analisis perencanaan i
TRANSCRIPT
Institut Teknologi Sepuluh Nopember
www.its.ac.id
Institut Teknologi Sepuluh Nopember
www.its.ac.id
CLUSTER ANALYSIS
DEPARTMENT OF URBAN AND REGIONAL
PLANNING
2019
1. PENGERTIAN:
• Definisi:
➢ Teknik statistik multivariat untuk mengidentifikasi sekelompok objek (case) yang memiliki kemiripan karakteristik tertentu sehingga dapat dipisahkan dari kelompok objek lainnya.
• Tujuan:
➢Menemukan kelompok objek/cluster berdasarkan karakteristik yang dimilikinya
➢Memudahkan interpretasi, analisis lanjut, dan penanganan
➢Mereduksi data
Kasus 1:
Individu Asal Hoby Makanan favorit
A Surabaya Baca Nasi Goreng
B Denpasar Travel Chinese
C Malang Nonton Chinese
D Semarang Baca Padang
E Kupang Olah raga Burger
▪ Kelompok berdasarkan asal daerah:
I : A, C, D -------------- II : B, E
Kelompok berdasarkan hoby:
I : A, D --------------- II : B, C, E
Kelompok berdasarkan makanan
I : B, C, E --------------- II : A, D
Cluster Analysis:
Kelompok berdasarkan asal, hoby,
makanan favorit??
2. PRINSIP-PRINSIP DASAR:Prinsip:
• Pengelompokan berdasarkan similarity (kesamaan) antar objek
• Meminimalkan jarak antar objek dalam cluster (within cluster)
• Memaksimalkan jarak antar kelompok (between cluster)
Pertanyaan dasar:1. Bagaimana mengukur similarity antar objek?
2. Bagaimana prosedur membentuk cluster berdasarkan hasil pengukuran similarity-nya?
WITHIN AND BETWEEN CLUSTER
3. MENGUKUR SIMILARITY:
Prinsip pengukuran:
mengukur atau memperkirakan kesamaan antara
pasangan-pasangan objek dalam data, berdasarkan jarak
(distance) atau perbedaan (difference) antara sepasang
objek
Metode:
•Correlation coefficients: nilai korelasi antara sepasang
objek yang diukur berdasarkan variabel-variabelnya
•Euclidean Distances:berdasarkan jarak terdekat antara
dua objek yang diukur berdasarkan nilai variabel-
variabelnya
•Matching-type measure of similarity: mencocokkan
kesamaan antar objek (untuk objek-objek kualitatif)
Pertimbangan pemilihan metode:
• Correlation coefficients:
• Euclidean Distances
• Matching-type
measure of
similarity:
• Karakter variabel
(diskrit, continyu,
binary)
• Skala pengukuran
variabel (nominal,
ordinal, interval, ratio)
Euclidean Distances:
Matching-type measure of similarity:
4. PROSEDUR
PEMBENTUKAN CLUSTER
METODE:
- Non Hierarchical Cluster:
- Hierarchical Cluster:
Pertanyaan dasar:
Berapa banyak cluster yang akan
dibentuk??
Siapa saja anggotanya??
PROSEDUR PEMBENTUKAN CLUSTER:
Data:
Objek dengan
karakteristiknya
Matrik
similarity
Cluster
yang
terbentuk
•Euclidean Distance
•Correlation
•Matching type
•Hierarchical
cluster
•Non-Hierarchical
cluster
•Cluster 1: O1, O2, O3
•Cluster 2: 04
ProsedurPengklasteran
Hierarchical Methods
pembagian kelompok dilakukan berdasarkan hirarki
yang ada sehingga jumlah kelompok data yang
terbentuk sangat bergantung pada karakteristik data
Non-hierarchical/Partitioning Methods/K-means Clustering
jumlah cluster ditentukan dahulu baru kemudian
data dibagi sesuai dengan jumlah kelompok yang telah
ditetapkan
Prosedur Pengklasteran
Pengklasteran hierarki ditandai dengan pengembangan
suatu hierarki atau struktur mirip pohon (tree like structure)
Pengelompokan objek secara bertahap dan bertingkat
sesuai dengan skala similarity-nya
Jika suatu objek dikelompokkan ke dalam suatu cluster, maka
objek tersebut tetap berada pada kelompok tersebut, sehingga jika
ketika objek tadi akan dikelompokkan dengan objek lain, maka
culster-nya akan dikelompokkan juga
Penentuan jumlah cluster ditentukan kemudian sesuai
dengan keinginan peneliti
Dimodelkan dengan DENDOGRAM
Contoh dendogram:
Posisi objek dalam suatu cluster tidak tetap, meskipun
objek telah masuk dalam suatu cluster, objek tersebut
dapat mengalami relokasi ke dalam cluster lain.
Umumnya digunakan untuk objek dalam jumlah yang
besar (> 200)
Pengklasteran aglomeratif dimulai dengan
mengelompokkan objek dalam suatu cluster yang terpisah,
hingga semua objek menjadi anggota dari suatu klaster
tunggal.
Pengklasteran devisive dimulai dengan semua objek
dikelompokkan menjadi cluster tunggal, kemudian
dipisahkan hingga setiap objek berada dalam cluster yang
terpisah.
Single Linkage
Complete Linkage
Average Linkage
Linkage Method of Clustering
Single Linkage minimum distance or nearest
neighbor mengelompokkan objek dengan teknik
jarak terdekat
Complete linkage maximum distance or
furthest neighbor) mengelompokkan objek
dengan teknik jarak terjauh
Average linkage average distance
pengelompokan objek berdasarkan jarak rata-rata
antara dua kelompok cluster
Pengklasteran Ideal
Pengklasteran dalam Praktek
A Schematic Diagram of the Discipline of Statistical Analysis
SEKIAN, TERIMA KASIH