analisis cluster multyvaiate
DESCRIPTION
berisikan tentang ringkasan penjelasan mengenai analisis clusterTRANSCRIPT
TUGAS STATISTIKA LANJUTAN
TEKNIK ANALISIS DATA MULTIVARIAT
ANALISIS CLUSTER
OLEH:
ADH A SEMESTER 5
Ayu Putri Sili Anggreni 11102004
I.A. Tara Astherina S. 11102005
Ni Wayan Aryati 11102012
Ni Wayan Priyanka Diana 11102013
I Gede Arimbawa 11102019
KEMENTERIAN PARIWISATA DAN EKONOMI KREATIFSEKOLAH TINGGI PARIWISATA NUSADUA BALI
2013
KATA PENGANTAR
Puji syukur kami panjatkan kehadirat Tuhan Yang Maha Esa atas rahmat
dan karunia-Nya, sehingga kami dapat menyelesaikan Tugas mata kuliah
Statistika lanjutan mengenai Menu Engineering
Dengan selesainya tugas ini tidak lepas dari bantuan banyak pihak yang
telah memberikan masukan-masukan kepada kami. Untuk itu kami mengucapkan
banyak terimakasih
Kami menyadari bahwa tugas ini masih memiliki banyak kekurangan baik
dari segi materi maupun dari segi penyajiannya. Oleh karena itu, kritik dan saran
yang membangun sangat kami harapkan demi sempurnanya tugas ini.
Denpasar, November 2013
Tim Penulis
i
DAFTAR ISI
KATA PENGANTARDAFTAR ISI
BAB I PENDAHULUANA. Latar BelakangB. Rumusan MasalahC. Tujuan
BAB II TEKNIK ANALISIS MULTIVARIATA. Definisi Analisis MultivariatB. Klasifikasi teknik Analisis Multivariat
BAB III ANALISIS CLUSTERA. Definisi Analisis clusterB. Sejarah SingkatC. Analisis Cluster dalam Berbagai bidang KeilmuanD. Istilah Dalam Analisis ClusterE. Cara Kerja Analisis ClusterF. Proses Analisis ClusterG. Contoh Analisis cluster dengan SPSS
BAB IV PENUTUPA. Kesimpulan
DAFTAR PUSTAKA
ii
BAB I
PENDAHULUAN
A. Latar Belakang
Analisis multivariat atau yang sering disebut dengan teknik analisis
peubah ganda adalah satu teknik analisis data pada statistika yang dikenakan pada
data yang terdiri dari banyak variabel dan antar variabel saling berkorelasi. Salah
satu bagian dari teknik analisis data multivariat adalah analisis cluster (cluster
analysis). Analisis cluster merupakan teknik multivariat yang mempunyai tujuan
utama untuk mengelompokkan objek-objek berdasarkan karakteristik yang
dimilikinya. Analisis cluster mengklasifikasi objek sehingga setiap objek yang
paling dekat kesamaannya dengan objek lain berada dalam cluster yang sama.
Berbeda dengan teknik multivariat lainnya, analisis ini tidak mengestimasi
set vaiabel secara empiris sebaliknya menggunakan setvariabel yang ditentukan
oleh peneliti itu sendiri. Fokus dari analisis cluster adlah membandingkan objek
berdasarkan set variabel, hal inilah yang menyebabkan para ahli mendefinisikan
set variabel sebagai tahap kritis dalam analisis cluster. Set variabel cluster adalah
suatu set variabel yang merpresentasikan karakteristik yang dipakai objek-objek.
Bedanya dengan analisis faktor adalah bahwa analisis cluster terfokus pada
pengelompokan objek sedangkan analisis faktor terfokus pada kelompok variabel.
1
B. Rumusan masalah
Berdasarkan latar belakang tersebut kami merumuskan beberapa rumusan masalah
yang akan dibahas pada paper ini antara lain:
1. Apakah yang dimaksud dengan analisis cluster?
2. Bagaimana proses dalam penggunaan analisis cluster?
3. Bagaimana cara peenggunaan SPSS dalam melakukan analisis
cluster?
C. Tujuan
Adapun tujuan dibuatnya paper ini adalah :
1. Untuk mengetahui pengertian serta fungsi dar analisis cluster
2. Untuk mengetahui bagaimana proses dalam melakukan analisis cluster
3. Untukmengetahui cara penggunaan program SPSS dalam analisis
cluster
4. Untuk pemenuhan tugas matakuliah statistika lanjutan
2
BAB II
TEKNIK ANALISIS MULTIVARIAT
A. Definisi analisis Multivariat
Teknik analissi multivariat merupakan salah satu teknik analisis dari
statistika Analisis statistika multivariate adalah analisis statistika yang dikenakan
pada data yang terdiri dari banyak variabel dan antar variabel saling berkorelasi.
Analisis statistik multivariat merupakan metode statistik yang
memungkinkan kita melakukan penelitian terhadap lebih dari dua variable secara
bersamaan. Dengan menggunakan teknik analisis ini maka kita dapat
menganalisis pengaruh beberapa variable terhadap variabel – (variable) lainnya
dalam waktu yang bersamaan. Contoh kita dapat menganalisis pengaruh variable
kualitas produk, harga dan saluran distribusi terhadap kepuasan pelanggan.
Contoh yang lain, misalnya pengaruh kecepatan layanan, keramahan petugas dan
kejelasan memberikan informasi terhadap kepuasan dan loyalitas pelanggan.
Analisis multivariat digunakan karena pada kenyataannnya masalah yang terjadi
tidak dapat diselesaikan dengan hanya menghubung-hubungkan dua variable atau
melihat pengaruh satu variable terhadap variable lainnya. Sebagaimana contoh di
atas, variable kepuasan pelanggan dipengaruhi tidak hanya oleh kualitas produk
tetapi juga oleh harga dan saluran distribusi produk tersebut.
B. Klasifikasi teknik analisis multivariat
Teknik analisis multivariat secara dasar diklasifikasi menjadi dua, yaitu
sebagai berikut :
3
1. Analisis Dependensi
Analisis dependensi berfungsi untuk menerangkan atau memprediksi
variable (variable) tergantung dengan menggunakan dua atau lebih
variable bebas. Yang termasuk dalam klasifikasi ini ialah
a. analisis regresi linear berganda,
b. analisis diskriminan,
c. analisis varian multivariate (MANOVA),
d. analisis korelasi kanonikal.
2. Analisis Interdependensi
Analisis interdependensi berfungsi untuk memberikan makna terhadap
seperangkat variable atau membuat kelompok-kelompok secara bersama-
sama. Yang termasuk dalam klasifikasi ini ialah
a. analsis faktor,
b. analisis cluster,
c. multidimensional scaling.
4
BAB III
ANALISIS CLUSTER
A. Definisi Analisis Cluster
Analisis Cluster termasuk dalam teknik analisis multivariate metode
interdependen. Teknik analisis ini bertujuan untuk mengatur informasi /
meringkas data dengan cara mengelompokkan objek-objek berdasarkan kesamaan
karakteristik tertentu. Dengan demikian, Cluster analisis atau clustering memiliki
tujuan untuk mengelompokkan data dari serangkaian pengamatan ke subset
(disebut cluster).
Di Indonesia analisis ini juga sering desebut dengan analisis gerombol.
Analisis gerombol adalah analisis statistik peubah ganda yang digunakan apabila
ada N buah individu atau objek yang mempunyai p peubah dan N objek tersebut
ingin dikelompokkan ke dalam k kelompok berdasarkan sifat-sifat yang dimati
sehingga individu atau objek yang terletak dalam satu gerombol memiliki
kemiripan sifat yang lebih besar dibandingkan dengan individu yang terletak
dalam gerombol lain (Dillon & Goldstein, 1984).
Analisis cluster mengelompokkan objek data hanya berdasarkan pada
informasi yang ditemukan pada data tersebut yang menunjukkan hubungan antara
setiap objeknya. Tujuannya agar object dalam suatu kelompok serupa atau saling
berkaitan dan berbeda dengan objek pada kelompok yang lainnya.
5
Pada Gambar 2.1 dapat diilustrasikan bahwa data yang ada dapat
diklasifikasikan menjadi beberapa kelompok tertentu berdasarkan kemiripan atau
kesamaan karakteristik yang dimiliki oleh setiap data. Pada klasifikasi dua cluster
dapat dilihat bahwa analisis cluster memisahkan data berbentuk segitiga dengan
data yang berbentuk persegi.
Gambar 3.1Ilustrasi Pengelompokan Data dalam Analisis Cluster
Sumber: analisis cluster, 2012
B. Sejarah Singkat
Analisis cluster panjang (pertama kali digunakan oleh Tryon, 1939)
meliputi beberapa algoritma yang berbeda dan metode untuk mengelompokkan
benda serupa ke dalam kategori masing-masing. Sebuah pertanyaan umum yang
dihadapi peneliti di banyak bidang penelitian adalah bagaimana mengorganisasi
data yang diamati ke dalam struktur yang bermakna, yaitu, untuk
mengembangkan taksonomi.Analisis cluster dapat digunakan untuk menemukan
6
struktur data tanpa memberikan penjelasan / penafsiran. Dengan kata lain, analisis
cluster hanya menemukan struktur data tanpa menjelaskan mengapa mereka ada.
C. Analisis Cluster dalam beberapa bidang keilmuan
Dalam analisis Pemasaran, Cluster analysis dapat digunakan untuk:
1. mengetahui segmentasi dan menentukan target pasar yang dituju;
2. mengetahui positioning produk dan menentukan pengembangan produk
baru;
3. Memilih pasar yang akan dipilih untuk produk baru perusahaan.
Dalam pencitraan medis, seperti PET scan (Positron emission
tomography), analisis cluster dapat digunakan untuk membedakan antara berbagai
jenis jaringan dan darah dalam gambar tiga dimensi. Dalam aplikasi ini, posisi
sebenarnya tidak masalah, namun intensitas voxel dianggap sebagai vektor,
dengan dimensi untuk setiap gambar yang diambil dari waktu ke waktu. Teknik
ini memungkinkan, misalnya, pengukuran akurat dari tingkat pelacak radioaktif
dikirim ke daerah yang menarik, tanpa pengambilan sampel terpisah dari darah
arteri, teknik mengganggu yang paling umum saat ini.
Dalam analisis penelitian pendidikan, data untuk clustering dapat berupa
data siswa, orang tua, jenis kelamin atau nilai ujian. Clustering merupakan metode
penting untuk memahami dan utilitas dari cluster dalam penelitian pendidikan.
Cluster analisis dalam penelitian pendidikan dapat digunakan untuk data
eksplorasi, cluster konfirmasi dan pengujian hipotesis. Data eksplorasi digunakan
ketika ada sedikit informasi tentang sekolah atau siswa yang akan dikelompokkan
bersama-sama. Ini. bertujuan untuk menemukan setiap cluster yang berarti unit
berdasarkan langkah-langkah pada satu set variabel respon. Konfirmasi cluster
7
digunakan untuk mengkonfirmasikan hasil cluster yang dilaporkan sebelumnya
pengujian Hipotesis yang digunakan untuk mengatur struktur cluster.
D. Istilah dalam Analisis Cluster
Adapun beberapa istilah yang sering digunakan dalam analisis cluster antara lain :
1. Aggomerration schedule : merupakan jadwal yang akan memberikan
informasi tentang ibjek atau kasus yang akan dikelompokkan pada setiap
tahap pada suatu proses analisis cluster yang hierarkis.
2. Cluster centroid : merupakan nilai rata-rata variabel dari semua
objek/kasus atau observasi dalam cluster tertentu
3. Cluster centers, adalah titik awal dimulainya pengelompokan di dalam
cluster nonhierarki.
4. Cluster membership merupakan keanggotaan yang menunjukkan cluster.
5. Dendogram merupakan visualisasi cluster. Garis vertical (Y) menunjukkan
cluster yang digabung bersama. Posisi garis pada skala X menunjukkan
jarak (distance) dimana cluster digabung.
6. Distance between cluster center adalah jarak yang menunjukkan
bagaimana terpisahnya pasangan individu cluster.
7. Dua metode analisis Cluster adalah Hierarchical Cluster dan K-means
Cluster. Hierarchical Cluster disarankan untuk data dengan sampel kecil,
sedangan K-means cluster disarankan untuk sampel bersa (lebih dari 100)
E. Cara Kerja Analisis Cluster
Secara garis besar ada tiga hal yang harus terjawab dalam proses kerja
analisis cluster, yaitu :
8
1. Bagaimana mengukur kesamaan ?
Ada tiga ukuran untuk mengukur kesamaaan antar objek, yaitu ukuran
korelasi, ukuran jarak, dan ukuran asosiasi.
2. Bagaimana membentuk cluster ?
Prosedur yang diterapkan harus dapat mengelompokkan objek-objek yang
memiliki kesamaan yang tinggi ke dalam sutau cluster yang sama.
3. Berapa banyak cluster/kelompok yang akan dibentuk ?
Pada prinsipnya jika jumlah cluster berkurang maka homogenitas alam
cluster secra otomatis akan menurun.
F. Proses Analisis Cluster
Sebagaimana teknik multivariat lain proses analisis cluster dapat
dijelaskan dalam enam tahap sebagai berikut :
1. Tahap Pertama : Tujuan Analisis Cluster
Tujuan utama analisis cluster adalah mempartisi suatu set objek menjadi
dua kelompok atau lebih berdasarkan kesamaan karakteristik khusus yang
dimilikinya.
Dalam pembentukan kelompok/cluster dapat dicapai tiga tujuan, yaitu :
a. Deskripsi klasifikasi (taxonomy description)
Penerapan anallisis cluster secara tradisisonal bertujuan mengeksplorasi
dan membentuk suatu klasisfikasi/taksonomi secara empiris. Karena
kemampuan partisinya analisis cluster dapat diterapkan secara luas.
9
Meskipun secara empiris merupakan teknik eksplorasi analisis cluster
dapat pula digunakan untuk tujuan konfirmasi.
1) Penyederhanaan Data
Penyederhanaan data merupakan bagian dari suatu taksonomi. Dengan
struktur yang terbatas observasi/objek dapat dikelompokkan untuk
analisis selanjutnya.
2) Identifikasi Hubungan (Relationship Identification)
Hubunganantar objek diidentifikasi secara empiris. Struktur analisis
cluster yang sederhana dapat menggambarkan adanya hubungan atau
kesamaan dan perbedaan yang tidak dinyatakan sebelumnya.
b. Pemilihan pada Pengelompokan Variabel
Tujuan analisis cluster tidak dapat dipisahkan dengan pemilihan variabel
yang digunakan untuk menggolongkan objek ke dalam clucter-cluster.
Cluster yang terbentuk merefleksikan struktur yang melekat pada data
seperti yang didefinisikan oleh variabel-variabel. Pemilihan variabel harus
sesuai dengan teori dan konsep yang umum digunakan dan harus rasional.
Rasionalitas ini didasarkan pada teori-teori eksplisit atau penelitian
sebelumnya. Variabel-variabel yang dipilih hanyalah variabel yang dapat
mencirikan objek yang akan dikelompokkan dan secara spesifik harus
sesuai dengan tujuan analisis cluster.
2. Tahap Kedua : Desain Penelitian dalam Analisis Cluster
10
Tiga hal penting dalam tahap ini adalah pendeteksian outlier, mengukur
kesamaan, dan standarisasi data.
a. Pendeteksian Outlier
Outlier adalah suatu objek yang sangat berbeda dengan objek lainnya.
Outlier dapat digambarkan sebagai observasi yang secara nyata kebiasaan,
tidak mewakili populasi umum, dan adanya undersampling dapat pula
memunculkan outlier. Outlier menyebabkan menyebabkan struktur yang
tidak benar dan cluster yang terbentuk menjadi tidak representatif.
b. Mengukur Kesamaan antar Objek
Konsep kesamaan adalah hal yang fundamental dalam analisis cluster.
Kesamaan antar objek merupakan ukuran korespondensi antar objek. Ada
tiga metode yang dapat diterapkan, yaitu ukuran korelasi, ukuran jarak,
dan ukuran asosiasi.
1) Ukuran Korelasi
Ukuran ini dapat diterapkan pada data dengan skala metrik, namun
jarang digunakan karena titik bertnya pada nilai suatu pola tertentu,
padahal tisik berat analisis cluster adalah besarnya objek. Kesamaan
antar objek dapat dilihat dari koefisien korelasi antar pasangan objek
yang diukur dengan beberapa variabel.
2) Ukuran Jarak
Merupakan ukuran yang paling sering digunakan. Diterapkan untuk
data berskala metrik. Sebenarnya merupakan ukuran ketidakmiripan,
dimana jarak yang besar menunjukkan sedikit kesamaan sebaliknya
jarak yang pendek/kesil menunjukkan bahwa suatu objek makin mirip
11
dengan objek lain. Bedanya dengan ukuran korelasi adalah bnahwa
ukuran jarak fokusnya pada besarnya nilai. Cluster berdasarkan
ukuran korelasi bisa saja tidak memiliki kesamaan nilai tapi memiliki
kesamaan pola, sedangkan cluster dberdasrkan ukuran jarak lebih
memiliki kesamaan nilai meskipun polanya berbeda.
Ada beberapa tipe ukuran jarak antara lain jarak Euklidian, jarak city-
Box, dan jarak Mahalanobis. Ukuran yang paling sering digunakan
adalah jarak Euklidian. Jarak Euklidian adalah besarnya jarak suatu
garis lurus yang menghubungkan antar objek.
3) Ukuran Asosiasi
Ukuran asosiasi dipakai untuk mengukur data berskala nonmetrik
(nominal atau ordinal).
c. Standarisasi Data
1) Standarisasi Variabel
Bentuk paling umum dalam standarisasi variabel adalah konversi
setiap variabel terhadap skor atandar ( dikenal dengan Z score) dengan
melakukan substraksi nilai tengan dan membaginyadengan standar
deviasi tiap variabel.
2) Standarisasi Data
Berbeda dengan standarisasi variabel, standarisasi ndata dilakukan
terhadap observasi/objek yang akan dikelompokkan.
3. Tahap Ketiga : Asumsi-asumsi dalam Analisis Cluster
12
Seperti hal teknik analisis lain,analisis cluster juga menetapkan adanya
suatu asumsi. Ada dua asumsi dalam analisis cluster, yaitu :
a. Kecukupan Sampel untuk merepresentasikan/mewakili Populasi
Biasanya suatu penelitian dilakukan terhadap populasi diwakili oleh
sekelompok sampel. Sampel yang digunakan dalam analisis ckuster harus
dapat mewakili populasi yang ingin dijelaskan, karena analisis ini baik jika
sampel representatif. Jumlah sampel yang diambil tergantung penelitinya,
seorang peneliti harus yakin bahwa sampil yang diambil representatif
terhadap populasi.
b. Pengaruh Multukolinieritas
Ada atau tidaknya multikolinieritas antar variabel sangat diperhatikan
dalam analisis cluster karena hal itu berpengaruh, sehingga variabel-
variabel yang bersifat multikolinieritas secara eksplisit dieprtimbangkan
dengan lebih seksama.
4. Tahap Keempat : Proses Mendapatkan Cluster dan Menilai kelayakan
secara keseluruhan
Ada dua proses penting yaitu algoritma cluster dalam pembentukan cluster
dan menentukan jumlah cluster yang akan dibentuk. Keduanya mempunyai
implikasi substansial tidak hanya pada hasil yang diperoleh tetapi juga pada
interpretasi yang akan dilakukan terhadap hasil tersebut.
a. Algoritma Cluster
13
Algoritma cluster harus dapat memaksimalkan perbedaan relatif
cluster terhadap variasi dalam cluster. Dua metode paling umum dalam
algoritma cluster adalah metode hirarkhi dan metode non hirarkhi.
Penentuan metode mana yang akan dipakai tergantung kepada peneliti dan
konteks penelitian dengan tidak mengabaikan substansi, teori dan konsep
yang berlaku. Keduanya memiliki kelebihan sendiri-sendiri. Keuntungan
metode hirarkhi adalah cepat dalam proses pengolahan sehingga
menghemat waktu, namun kelemahannya metode ini dapat menimbulkan
kesalahan. Selain itu tidak baik diterapkan untuk menganalisis sampel
dengan ukuran besar. Metode Non Hirarkhi memiliki keuntungan lebih
daripada metode hirarkhi. Hasilnya memiliki sedikit kelemahan pada data
outlier, ukuran jarak yang digunakan, dan termasuk variabel tak relevan
atau variabel yang tidak tepat. Keuntungannya hanya dengan
menggunakan titik bakal nonrandom, penggunaan metode non hirarkhi
untuk titik bakal random secara nyata lebih buruk dari pada metode
hirarkhi.
Alternatif lain adalah dengan mengkombinasikan kedua metode ini.
Pertama gunakan metode hirarkhi kemudian dilanjutkan dengan metode
non hirarkhi.
1) Metode Hirarkhi
Tipe dasar dalam metode ni adalah aglomerasi dan pemecahan.
Dalam metode aglomerasi tiap observasi pada mulanya dianggap
sebagai cluster tersendiri sehingga terdapat cluster sebyak jumlah
observasi. Kemudian dua cluster yang terdekat kesamaannya digabung
14
menjadi suatu cluster babru, sehingga jumlah cluster berkurang satu
pada tiap tahap. Sebaliknya pada metode pemecahan dimulai dari satu
cluster besar yang mengandung seluruh observasi, selanjutnya
observasi-observasi yang paling tidak sama dipisah dan dibentuk
cluster-cluster yang lebih kecil. Proses ini dilakukan hingga tiap
observasi menjadi cluster sendiri-sendiri.
Hal penting dalam metode hirarkhi adalah bahwa hasil pada
tahap sebelumnya selalu bersarang di dalam hasil pada tahap
berikutnya, membentuk sebuah pohon.
Ada lima metode aglomerasi dalam pembentukan cluster, yatiu :
a) Pautan Tunggal (Single Linkage)
Metode ini didasarkan pada jarak minimum. Dimulai dengan dua
objek yang dipisahkan dengan jarak paling pendek maka
keduanya akan ditempatkan pada cluster pertama, dan seterusnya.
Metode ini dikenal pula dengan nama pendekatan tetangga
terdekat.
b) Pautan Lengkap (Complete Linkage)
Disebut juga pendekatan tetangga terjauh. Dasarnya adalah jarak
maksimum. Dalam metode ini seluruh objek dalam suatu cluster
dikaitkan satu sama lain pada suatu jarak maksimuma atau
dengan kesamaan minimum.
c) Pautan Rata-rata (Average Linkage)
15
Dasarnya adalah jarak rata-rata antar observasi. pengelompokan
dimulai dari tengan atau pasangan observasi dengan jarak paling
mendekati jarak rata-rata.
d) Metode Ward (Ward’s Method)
Dalam metode ini jarak antara dua cluster adalah jumlah kuadrat
antara dua cluster untuk seluruh variabel. Metode ini cenderung
digunakan untuk mengkombinasi cluster-cluster dengan jumlah
kecil.
e) Metode Centroid
Jarak antara dua cluster adalah jarak antar centroid cluster
tersebut. Centroid cluster adalah nilai tengah observasi pada
variabel dalam suatu set variabel cluster. Keuntungannya adalah
outlier hanya sedikit berpengaruh jika dibandingkan dengan
metode lain.
3) Metode Non Hirarkhi
Masalah utama dalam metoda non hirarkhi adalah bagaimana
memilih bakal cluster. Harus disadari pengaruh pemilihan bakal
cluster terhadap hasil akhir analisis cluster. Bakal cluster pertama
adalah observasi pertama dalam set data tanpa missing value. Bakal
kedua adalah observasi lengkap berikutnya (tanpa missing data) yang
dipisahkan dari bakal pertama oleh jarak minimum khusus.
Ada tiga prosedur dalam metode non hirarkhi, yaitu :
a) Sequential threshold
16
Metode ini dimulai dengan memilih bakal cluster dan
menyertakan seluruh objek dalam jarak tertentu. Jika seluruh
objek dalam jarak tersebut disertakan, bakal cluster kedua terpilih,
kemudian proses terus berlangsung seperti sebelumnya.
b) Parallel Threshold
Metode ini memilih beberapa bakal cluster secara simultan pada
permulaannya dan menandai objek-objek dengan jarak permulaan
ke bakal terdekat.
c) Optimalisasi
Metode ketiga ini mirip dengan kedua metode sebelumnya
kecuali pada penandaan ulang terhadap objek-objek.
b. Menentukan jumlah cluster yang akan dibentuk
Hal penting lain dalam tahap keempat adalah menentukan jumlah cluster
yang akan dibentuk.Sebenarnya tidak ada standar,prosedur pemilihan
tujuan eksis. Karena tidak ada kriteria statistik internal digunakan untuk
inferensia, seperti tes signifikansipada teknik multivariat lainnya, para
peneliti telah mengembangkan beberapa kriteria dan petunjuk sebagai
pendekatan terhadap permasalahan ini dengan memperhatikan substansi
dan aspek konseptual.
5. Tahap Kelima : Interpretasi terhadap Cluster
Tahap interpretasi meliputi pengujian tiap cluster dalam term untuk
menamai dan menandai dengan suatu label yang secara akurat dapat menjelaskan
17
kealamian cluster. Proes ini dimulai dengan suatu ukuran yang sering digunakan
yaitu centroid cluster.
Membuat profil dan interpretasi cluster tidak hanya tidak hanya untuk
memoeroleh suatu gambaran saja melainkan pertama, menyediakan suatu rata-rata
untuk menilai korespondensi pada cluster yang terbentuk, kedua, profil cluster
memberikan araha bagi penilainan terhadap signifikansi praktis.
6. Tahap Keenam: Proses Validasi dan Pembuatan Profil (PROFILING)
Cluster
a. Proses validasi solusi cluster
Proses validasi bertujuan menjamin bahwa solusi yang dihasilkan
dari analisis cluster dapat mewakili populasi dan dapat digeneralisasi
untuk objek lain. Pendekatan ini membandingkan solusi cluster dan
menilai korespondensi hasil. Terkadang tidak dapat dipraktekkan karena
adanya kendala waktu dan biaya atau ketidaktersediaan ibjek untuk
analisis cluster ganda.
b. Pembuatan Profil ( PROFILING)Solusi Cluster
Tahap ini menggambarkan karakteristik tiap cluster untuk
menjelaskan cluster-cluster tersebut dapat dapat berbeda pada dimensi
yang relevan. Titik beratnta pada karakteristik yang secara signifikan
berbeda antar clustre dan memprediksi anggota dalam suatu cluster
khusus.
18
Secara keseluruhan proses analisis cluster berakhir setelah keenam tahap
ini dilalui. Hasil analisis cluster dapat digunakan untuk berbagai kepentingan
sesuai dengan materi yang dianalisis.
G. Contoh Analisis Cluster dengan SPSS
Terdapat sebuah penelitian mengenai tingkat stress yang dialami pada anak anak.
Gejala-gejala stres yang digunakan ada empat dimana nilai tersebut merupakan
total skor dari skala sikap yang telah dibuat berdasarkan observasi terhadap 45
responden. Penelitian tersebut kemudian dianalisa menggunakan analisis cluster
dengan bantuan SPSS.
Berikut merupakan data yang telah diambil yang dipaparkan pada tabel 3.1
berikut ini.
Tabel 3.1Skor Tingkat Stres pada Anak-anak Berdasarkan Gejala
di daerah Yogyakarta Tahun 2011
No. Intrusion Hyperarousal Avoidance Perilaku lain1. 19 27 17 192. 10 38 20 193. 22 32 11 214. 18 38 18 185. 21 29 13 216. 23 30 16 227. 17 46 10 238. 23 26 12 179. 14 35 12 1410. 23 31 15 1811. 18 32 11 1812. 20 30 12 1713. 19 27 18 2014. 23 30 12 2115. 19 39 14 2016. 14 29 14 25
19
17. 12 23 11 1418. 20 30 14 2319. 20 30 15 1720. 15 30 15 2121. 19 26 13 1822. 19 38 14 1923. 20 30 9 2124. 19 30 12 2325. 22 35 19 2426. 22 26 11 1727. 23 35 18 2028. 26 34 15 1829. 20 27 11 1930. 15 27 20 2331. 13 23 14 1832. 21 28 13 1933. 23 28 18 2034. 19 35 16 1235. 19 27 9 1836. 26 37 17 2037. 29 45 19 2038. 18 29 14 1739. 19 27 15 1540. 22 31 14 2041. 19 37 16 1742. 20 29 16 1843. 23 34 12 2344. 21 31 18 2945. 20 31 11 17
Sumber: hasil observasi peneliti, 2011
Berdasarkan data tersebut peneliti akan melakukan pengelompokan (clustering)
menjadi 2 kelompok yaitu kelompok yang memiliki tingkat stres yang tinggi
dengan kelompok yang memiliki tingkat stres yang rendah. Analisis clustering
tersebut akan dilaksanakan dengan menggunakan program SPSS.
Adapun langkah langkah yang ditempuh adalah sebagai berikut:
20
1. Masukkan data. Cara pemasukan data dapat dilihat pada gambar 3.2
berikut ini.
Gambar 3.2Pemasukan Data penelitian pada Program SPSS
pada Variable view
Sumber: SPSS, 2013
Gambar 3.3Pemasukan data penelitian pada Program SPSS
Pada Data View
Sumber: SPSS, 2013
21
2. Untuk menghilangkan pengaruh karena perbedaan interval antar
dimensi/variabel maka perlu dilakukan standardisasi.
Dari menu Analyze, pilih submenu Descriptive Statistic kemudian
Descriptives dan muncul kotak dialog yang dapat dilihat pada gambar 3.4
berikut ini.
Gambar 3.4Tampilan layar menu Descriptives
Sumber: SPSS, 2013
Pengisisan:
Variable(s): masukkan keempat gejala stres
kemudian tandai save standardized values as variables lalu klik OK
maka nilai standardisasi akan masuk ke data spss dgn awalan Z....
3. Setelah diperoleh nilai standar dilanjutkan ke analisis cluster
Dari menu Analyze, pilih submenu Classify kemudian K-Means
Cluster..
Pengisian:
Variables: masukkan nama yang sudah distandardisasi
Number of cluster: masukkan jumlah kelompok yang akan dibentuk
22
Method: tandai iterate and classify kemudian klik OK
Untuk lebih jelanya langkah ini dapat dilihat pada gambar 3.5 berikut ini
Gambar 3.5Tampilan menu Cluster analysis pada SPSS
Sumber: SPSS, 2013
Kemudian dari langkah tersebut akan didapatkan data berupa output yang
ditunjukkan oleh tabel 3.2 berikut ini.
Tabel 3.2Final Cluster Center
Cluster1 2
Zscore(Hyperarousal) -.21621 .35610Zscore(Avoidance) -.63754 1.05006Zscore(Perilaku_lain) -.63754 1.05006Zscore(Intrusion) -.19301 .31790
Sumber: SPSS, 2013(data diolah)
Berdasarkan Tabel 3.2, dapat dilihat bahwa untuk kelompok 1 memiliki
nilai yang negatif semua yang berarti di bawah rata-rata sedangkan kelompok 2
kondisinya sebaliknya yaitu nilainya positif semua yang berarti di atas ratarata.
23
Sehingga kita bisa menamai kelompok 1 sebagai kelompok tingkat stres rendah
dan kelompok 2 sebagai kelompok tingkat stres tinggi.
Tabel 3.3Number of cases in each Cluster
JumlahCluster 1 28.000
2 17.000Valid 45.000Missing .000
Sumber: SPSS, 2013(data diolah)
Pada Tabel 3.3 menunjukkan jumlah anggota pada setiap kelompok, dimana
responden yang mengalami tingkat stres rendah sebanyak 28 dan yang mengalami
tingkat stres tinggi sebanyak 17 orang dari jumlah total sebanyak 45 responden.
24