analisis cluster multyvaiate

43
TUGAS STATISTIKA LANJUTAN TEKNIK ANALISIS DATA MULTIVARIAT ANALISIS CLUSTER OLEH: ADH A SEMESTER 5 Ayu Putri Sili Anggreni 11102004 I.A. Tara Astherina S. 11102005 Ni Wayan Aryati 11102012 Ni Wayan Priyanka Diana 11102013 I Gede Arimbawa 11102019

Upload: arimbawa-igede

Post on 20-Oct-2015

78 views

Category:

Documents


3 download

DESCRIPTION

berisikan tentang ringkasan penjelasan mengenai analisis cluster

TRANSCRIPT

TUGAS STATISTIKA LANJUTAN

TEKNIK ANALISIS DATA MULTIVARIAT

ANALISIS CLUSTER

OLEH:

ADH A SEMESTER 5

Ayu Putri Sili Anggreni 11102004

I.A. Tara Astherina S. 11102005

Ni Wayan Aryati 11102012

Ni Wayan Priyanka Diana 11102013

I Gede Arimbawa 11102019

KEMENTERIAN PARIWISATA DAN EKONOMI KREATIFSEKOLAH TINGGI PARIWISATA NUSADUA BALI

2013

KATA PENGANTAR

Puji syukur kami panjatkan kehadirat Tuhan Yang Maha Esa atas rahmat

dan karunia-Nya, sehingga kami dapat menyelesaikan Tugas mata kuliah

Statistika lanjutan mengenai Menu Engineering

Dengan selesainya tugas ini tidak lepas dari bantuan banyak pihak yang

telah memberikan masukan-masukan kepada kami. Untuk itu kami mengucapkan

banyak terimakasih

Kami menyadari bahwa tugas ini masih memiliki banyak kekurangan baik

dari segi materi maupun dari segi penyajiannya. Oleh karena itu, kritik dan saran

yang membangun sangat kami harapkan demi sempurnanya tugas ini.

Denpasar, November 2013

Tim Penulis

i

DAFTAR ISI

KATA PENGANTARDAFTAR ISI

BAB I PENDAHULUANA. Latar BelakangB. Rumusan MasalahC. Tujuan

BAB II TEKNIK ANALISIS MULTIVARIATA. Definisi Analisis MultivariatB. Klasifikasi teknik Analisis Multivariat

BAB III ANALISIS CLUSTERA. Definisi Analisis clusterB. Sejarah SingkatC. Analisis Cluster dalam Berbagai bidang KeilmuanD. Istilah Dalam Analisis ClusterE. Cara Kerja Analisis ClusterF. Proses Analisis ClusterG. Contoh Analisis cluster dengan SPSS

BAB IV PENUTUPA. Kesimpulan

DAFTAR PUSTAKA

ii

BAB I

PENDAHULUAN

A. Latar Belakang

Analisis multivariat atau yang sering disebut dengan teknik analisis

peubah ganda adalah satu teknik analisis data pada statistika yang dikenakan pada

data yang terdiri dari banyak variabel dan antar variabel saling berkorelasi. Salah

satu bagian dari teknik analisis data multivariat adalah analisis cluster (cluster

analysis). Analisis cluster merupakan teknik multivariat yang mempunyai tujuan

utama untuk mengelompokkan objek-objek berdasarkan karakteristik yang

dimilikinya. Analisis cluster mengklasifikasi objek sehingga setiap objek yang

paling dekat kesamaannya dengan objek lain berada dalam cluster yang sama.

Berbeda dengan teknik multivariat lainnya, analisis ini tidak mengestimasi

set vaiabel secara empiris sebaliknya menggunakan setvariabel yang ditentukan

oleh peneliti itu sendiri. Fokus dari analisis cluster adlah membandingkan objek

berdasarkan set variabel, hal inilah yang menyebabkan para ahli mendefinisikan

set variabel sebagai tahap kritis dalam analisis cluster. Set variabel cluster adalah

suatu set variabel yang merpresentasikan karakteristik yang dipakai objek-objek.

Bedanya dengan analisis faktor adalah bahwa analisis cluster terfokus pada

pengelompokan objek sedangkan analisis faktor terfokus pada kelompok variabel.

1

B. Rumusan masalah

Berdasarkan latar belakang tersebut kami merumuskan beberapa rumusan masalah

yang akan dibahas pada paper ini antara lain:

1. Apakah yang dimaksud dengan analisis cluster?

2. Bagaimana proses dalam penggunaan analisis cluster?

3. Bagaimana cara peenggunaan SPSS dalam melakukan analisis

cluster?

C. Tujuan

Adapun tujuan dibuatnya paper ini adalah :

1. Untuk mengetahui pengertian serta fungsi dar analisis cluster

2. Untuk mengetahui bagaimana proses dalam melakukan analisis cluster

3. Untukmengetahui cara penggunaan program SPSS dalam analisis

cluster

4. Untuk pemenuhan tugas matakuliah statistika lanjutan

2

BAB II

TEKNIK ANALISIS MULTIVARIAT

A. Definisi analisis Multivariat

Teknik analissi multivariat merupakan salah satu teknik analisis dari

statistika Analisis statistika multivariate adalah analisis statistika yang dikenakan

pada data yang terdiri dari banyak variabel dan antar variabel saling berkorelasi.

Analisis statistik multivariat merupakan metode statistik yang

memungkinkan kita melakukan penelitian terhadap lebih dari dua variable secara

bersamaan. Dengan menggunakan teknik analisis ini maka kita dapat

menganalisis pengaruh beberapa variable terhadap variabel – (variable) lainnya

dalam waktu yang bersamaan. Contoh kita dapat menganalisis pengaruh variable

kualitas produk, harga dan saluran distribusi terhadap kepuasan pelanggan.

Contoh yang lain, misalnya pengaruh kecepatan layanan, keramahan petugas dan

kejelasan memberikan informasi terhadap kepuasan dan loyalitas pelanggan.

Analisis multivariat digunakan karena pada kenyataannnya masalah yang terjadi

tidak dapat diselesaikan dengan hanya menghubung-hubungkan dua variable atau

melihat pengaruh satu variable terhadap variable lainnya. Sebagaimana contoh di

atas, variable kepuasan pelanggan dipengaruhi tidak hanya oleh kualitas produk

tetapi juga oleh harga dan saluran distribusi produk tersebut.

B. Klasifikasi teknik analisis multivariat

Teknik analisis multivariat secara dasar diklasifikasi menjadi dua, yaitu

sebagai berikut :

3

1. Analisis Dependensi

Analisis dependensi berfungsi untuk menerangkan atau memprediksi

variable (variable) tergantung dengan menggunakan dua atau lebih

variable bebas. Yang termasuk dalam klasifikasi ini ialah

a. analisis regresi linear berganda,

b. analisis diskriminan,

c. analisis varian multivariate (MANOVA),

d. analisis korelasi kanonikal.

2. Analisis Interdependensi

Analisis interdependensi berfungsi untuk memberikan makna terhadap

seperangkat variable atau membuat kelompok-kelompok secara bersama-

sama. Yang termasuk dalam klasifikasi ini ialah

a. analsis faktor,

b. analisis cluster,

c. multidimensional scaling.

4

BAB III

ANALISIS CLUSTER

A. Definisi Analisis Cluster

Analisis Cluster termasuk dalam teknik analisis multivariate metode

interdependen. Teknik analisis ini bertujuan untuk mengatur informasi /

meringkas data dengan cara mengelompokkan objek-objek berdasarkan kesamaan

karakteristik tertentu. Dengan demikian, Cluster analisis atau clustering memiliki

tujuan untuk mengelompokkan data dari serangkaian pengamatan ke subset

(disebut cluster).

Di Indonesia analisis ini juga sering desebut dengan analisis gerombol.

Analisis gerombol adalah analisis statistik peubah ganda yang digunakan apabila

ada N buah individu atau objek yang mempunyai p peubah dan N objek tersebut

ingin dikelompokkan ke dalam k kelompok berdasarkan sifat-sifat yang dimati

sehingga individu atau objek yang terletak dalam satu gerombol memiliki

kemiripan sifat yang lebih besar dibandingkan dengan individu yang terletak

dalam gerombol lain (Dillon & Goldstein, 1984).

Analisis cluster mengelompokkan objek data hanya berdasarkan pada

informasi yang ditemukan pada data tersebut yang menunjukkan hubungan antara

setiap objeknya. Tujuannya agar object dalam suatu kelompok serupa atau saling

berkaitan dan berbeda dengan objek pada kelompok yang lainnya.

5

Pada Gambar 2.1 dapat diilustrasikan bahwa data yang ada dapat

diklasifikasikan menjadi beberapa kelompok tertentu berdasarkan kemiripan atau

kesamaan karakteristik yang dimiliki oleh setiap data. Pada klasifikasi dua cluster

dapat dilihat bahwa analisis cluster memisahkan data berbentuk segitiga dengan

data yang berbentuk persegi.

Gambar 3.1Ilustrasi Pengelompokan Data dalam Analisis Cluster

Sumber: analisis cluster, 2012

B. Sejarah Singkat

Analisis cluster panjang (pertama kali digunakan oleh Tryon, 1939)

meliputi beberapa algoritma yang berbeda dan metode untuk mengelompokkan

benda serupa ke dalam kategori masing-masing. Sebuah pertanyaan umum yang

dihadapi peneliti di banyak bidang penelitian adalah bagaimana mengorganisasi

data yang diamati ke dalam struktur yang bermakna, yaitu, untuk

mengembangkan taksonomi.Analisis cluster dapat digunakan untuk menemukan

6

struktur data tanpa memberikan penjelasan / penafsiran. Dengan kata lain, analisis

cluster hanya menemukan struktur data tanpa menjelaskan mengapa mereka ada.

C. Analisis Cluster dalam beberapa bidang keilmuan

Dalam analisis Pemasaran, Cluster analysis dapat digunakan untuk:

1. mengetahui segmentasi dan menentukan target pasar yang dituju;

2. mengetahui positioning produk dan menentukan pengembangan produk

baru;

3. Memilih pasar yang akan dipilih untuk produk baru perusahaan.

Dalam pencitraan medis, seperti PET scan (Positron emission

tomography), analisis cluster dapat digunakan untuk membedakan antara berbagai

jenis jaringan dan darah dalam gambar tiga dimensi. Dalam aplikasi ini, posisi

sebenarnya tidak masalah, namun intensitas voxel dianggap sebagai vektor,

dengan dimensi untuk setiap gambar yang diambil dari waktu ke waktu. Teknik

ini memungkinkan, misalnya, pengukuran akurat dari tingkat pelacak radioaktif

dikirim ke daerah yang menarik, tanpa pengambilan sampel terpisah dari darah

arteri, teknik mengganggu yang paling umum saat ini.

Dalam analisis penelitian pendidikan, data untuk clustering dapat berupa

data siswa, orang tua, jenis kelamin atau nilai ujian. Clustering merupakan metode

penting untuk memahami dan utilitas dari cluster dalam penelitian pendidikan.

Cluster analisis dalam penelitian pendidikan dapat digunakan untuk data

eksplorasi, cluster konfirmasi dan pengujian hipotesis. Data eksplorasi digunakan

ketika ada sedikit informasi tentang sekolah atau siswa yang akan dikelompokkan

bersama-sama. Ini. bertujuan untuk menemukan setiap cluster yang berarti unit

berdasarkan langkah-langkah pada satu set variabel respon. Konfirmasi cluster

7

digunakan untuk mengkonfirmasikan hasil cluster yang dilaporkan sebelumnya

pengujian Hipotesis yang digunakan untuk mengatur struktur cluster.

D. Istilah dalam Analisis Cluster

Adapun beberapa istilah yang sering digunakan dalam analisis cluster antara lain :

1. Aggomerration schedule : merupakan jadwal yang akan memberikan

informasi tentang ibjek atau kasus yang akan dikelompokkan pada setiap

tahap pada suatu proses analisis cluster yang hierarkis.

2. Cluster centroid : merupakan nilai rata-rata variabel dari semua

objek/kasus atau observasi dalam cluster tertentu

3. Cluster centers, adalah titik awal dimulainya pengelompokan di dalam

cluster nonhierarki.

4. Cluster membership merupakan keanggotaan yang menunjukkan cluster.

5. Dendogram merupakan visualisasi cluster. Garis vertical (Y) menunjukkan

cluster yang digabung bersama. Posisi garis pada skala X menunjukkan

jarak (distance) dimana cluster digabung.

6. Distance between cluster center adalah jarak yang menunjukkan

bagaimana terpisahnya pasangan individu cluster.

7. Dua metode analisis Cluster adalah Hierarchical Cluster dan K-means

Cluster. Hierarchical Cluster disarankan untuk data dengan sampel kecil,

sedangan K-means cluster disarankan untuk sampel bersa (lebih dari 100)

E. Cara Kerja Analisis Cluster

Secara garis besar ada tiga hal yang harus terjawab dalam proses kerja

analisis cluster, yaitu :

8

1. Bagaimana mengukur kesamaan ?

Ada tiga ukuran untuk mengukur kesamaaan antar objek, yaitu ukuran

korelasi, ukuran jarak, dan ukuran asosiasi.

2. Bagaimana membentuk cluster ?

Prosedur yang diterapkan harus dapat mengelompokkan objek-objek yang

memiliki kesamaan yang tinggi ke dalam sutau cluster yang sama.

3. Berapa banyak cluster/kelompok yang akan dibentuk ?

Pada prinsipnya jika jumlah cluster berkurang maka homogenitas alam

cluster secra otomatis akan menurun.

F. Proses Analisis Cluster

Sebagaimana teknik multivariat lain proses analisis cluster dapat

dijelaskan dalam enam tahap sebagai berikut :

1. Tahap Pertama : Tujuan Analisis Cluster

Tujuan utama analisis cluster adalah mempartisi suatu set objek menjadi

dua kelompok atau lebih berdasarkan kesamaan karakteristik khusus yang

dimilikinya.

Dalam pembentukan kelompok/cluster dapat dicapai tiga tujuan, yaitu :

a. Deskripsi klasifikasi (taxonomy description)

Penerapan anallisis cluster secara tradisisonal bertujuan mengeksplorasi

dan membentuk suatu klasisfikasi/taksonomi secara empiris. Karena

kemampuan partisinya analisis cluster dapat diterapkan secara luas.

9

Meskipun secara empiris merupakan teknik eksplorasi analisis cluster

dapat pula digunakan untuk tujuan konfirmasi.

1) Penyederhanaan Data

Penyederhanaan data merupakan bagian dari suatu taksonomi. Dengan

struktur yang terbatas observasi/objek dapat dikelompokkan untuk

analisis selanjutnya.

2) Identifikasi Hubungan (Relationship Identification)

Hubunganantar objek diidentifikasi secara empiris. Struktur analisis

cluster yang sederhana dapat menggambarkan adanya hubungan atau

kesamaan dan perbedaan yang tidak dinyatakan sebelumnya.

b. Pemilihan pada Pengelompokan Variabel

Tujuan analisis cluster tidak dapat dipisahkan dengan pemilihan variabel

yang digunakan untuk menggolongkan objek ke dalam clucter-cluster.

Cluster yang terbentuk merefleksikan struktur yang melekat pada data

seperti yang didefinisikan oleh variabel-variabel. Pemilihan variabel harus

sesuai dengan teori dan konsep yang umum digunakan dan harus rasional.

Rasionalitas ini didasarkan pada teori-teori eksplisit atau penelitian

sebelumnya. Variabel-variabel yang dipilih hanyalah variabel yang dapat

mencirikan objek yang akan dikelompokkan dan secara spesifik harus

sesuai dengan tujuan analisis cluster.

2. Tahap Kedua : Desain Penelitian dalam Analisis Cluster

10

Tiga hal penting dalam tahap ini adalah pendeteksian outlier, mengukur

kesamaan, dan standarisasi data.

a. Pendeteksian Outlier

Outlier adalah suatu objek yang sangat berbeda dengan objek lainnya.

Outlier dapat digambarkan sebagai observasi yang secara nyata kebiasaan,

tidak mewakili populasi umum, dan adanya undersampling dapat pula

memunculkan outlier. Outlier menyebabkan menyebabkan struktur yang

tidak benar dan cluster yang terbentuk menjadi tidak representatif.

b. Mengukur Kesamaan antar Objek

Konsep kesamaan adalah hal yang fundamental dalam analisis cluster.

Kesamaan antar objek merupakan ukuran korespondensi antar objek. Ada

tiga metode yang dapat diterapkan, yaitu ukuran korelasi, ukuran jarak,

dan ukuran asosiasi.

1) Ukuran Korelasi

Ukuran ini dapat diterapkan pada data dengan skala metrik, namun

jarang digunakan karena titik bertnya pada nilai suatu pola tertentu,

padahal tisik berat analisis cluster adalah besarnya objek. Kesamaan

antar objek dapat dilihat dari koefisien korelasi antar pasangan objek

yang diukur dengan beberapa variabel.

2) Ukuran Jarak

Merupakan ukuran yang paling sering digunakan. Diterapkan untuk

data berskala metrik. Sebenarnya merupakan ukuran ketidakmiripan,

dimana jarak yang besar menunjukkan sedikit kesamaan sebaliknya

jarak yang pendek/kesil menunjukkan bahwa suatu objek makin mirip

11

dengan objek lain. Bedanya dengan ukuran korelasi adalah bnahwa

ukuran jarak fokusnya pada besarnya nilai. Cluster berdasarkan

ukuran korelasi bisa saja tidak memiliki kesamaan nilai tapi memiliki

kesamaan pola, sedangkan cluster dberdasrkan ukuran jarak lebih

memiliki kesamaan nilai meskipun polanya berbeda.

Ada beberapa tipe ukuran jarak antara lain jarak Euklidian, jarak city-

Box, dan jarak Mahalanobis. Ukuran yang paling sering digunakan

adalah jarak Euklidian. Jarak Euklidian adalah besarnya jarak suatu

garis lurus yang menghubungkan antar objek.

3) Ukuran Asosiasi

Ukuran asosiasi dipakai untuk mengukur data berskala nonmetrik

(nominal atau ordinal).

c. Standarisasi Data

1) Standarisasi Variabel

Bentuk paling umum dalam standarisasi variabel adalah konversi

setiap variabel terhadap skor atandar ( dikenal dengan Z score) dengan

melakukan substraksi nilai tengan dan membaginyadengan standar

deviasi tiap variabel.

2) Standarisasi Data

Berbeda dengan standarisasi variabel, standarisasi ndata dilakukan

terhadap observasi/objek yang akan dikelompokkan.

3. Tahap Ketiga : Asumsi-asumsi dalam Analisis Cluster

12

Seperti hal teknik analisis lain,analisis cluster juga menetapkan adanya

suatu asumsi. Ada dua asumsi dalam analisis cluster, yaitu :

a. Kecukupan Sampel untuk merepresentasikan/mewakili Populasi

Biasanya suatu penelitian dilakukan terhadap populasi diwakili oleh

sekelompok sampel. Sampel yang digunakan dalam analisis ckuster harus

dapat mewakili populasi yang ingin dijelaskan, karena analisis ini baik jika

sampel representatif. Jumlah sampel yang diambil tergantung penelitinya,

seorang peneliti harus yakin bahwa sampil yang diambil representatif

terhadap populasi.

b. Pengaruh Multukolinieritas

Ada atau tidaknya multikolinieritas antar variabel sangat diperhatikan

dalam analisis cluster karena hal itu berpengaruh, sehingga variabel-

variabel yang bersifat multikolinieritas secara eksplisit dieprtimbangkan

dengan lebih seksama.

4. Tahap Keempat : Proses Mendapatkan Cluster dan Menilai kelayakan

secara keseluruhan

Ada dua proses penting yaitu algoritma cluster dalam pembentukan cluster

dan menentukan jumlah cluster yang akan dibentuk. Keduanya mempunyai

implikasi substansial tidak hanya pada hasil yang diperoleh tetapi juga pada

interpretasi yang akan dilakukan terhadap hasil tersebut.

a. Algoritma Cluster

13

Algoritma cluster harus dapat memaksimalkan perbedaan relatif

cluster terhadap variasi dalam cluster. Dua metode paling umum dalam

algoritma cluster adalah metode hirarkhi dan metode non hirarkhi.

Penentuan metode mana yang akan dipakai tergantung kepada peneliti dan

konteks penelitian dengan tidak mengabaikan substansi, teori dan konsep

yang berlaku. Keduanya memiliki kelebihan sendiri-sendiri. Keuntungan

metode hirarkhi adalah cepat dalam proses pengolahan sehingga

menghemat waktu, namun kelemahannya metode ini dapat menimbulkan

kesalahan. Selain itu tidak baik diterapkan untuk menganalisis sampel

dengan ukuran besar. Metode Non Hirarkhi memiliki keuntungan lebih

daripada metode hirarkhi. Hasilnya memiliki sedikit kelemahan pada data

outlier, ukuran jarak yang digunakan, dan termasuk variabel tak relevan

atau variabel yang tidak tepat. Keuntungannya hanya dengan

menggunakan titik bakal nonrandom, penggunaan metode non hirarkhi

untuk titik bakal random secara nyata lebih buruk dari pada metode

hirarkhi.

Alternatif lain adalah dengan mengkombinasikan kedua metode ini.

Pertama gunakan metode hirarkhi kemudian dilanjutkan dengan metode

non hirarkhi.

1) Metode Hirarkhi

Tipe dasar dalam metode ni adalah aglomerasi dan pemecahan.

Dalam metode aglomerasi tiap observasi pada mulanya dianggap

sebagai cluster tersendiri sehingga terdapat cluster sebyak jumlah

observasi. Kemudian dua cluster yang terdekat kesamaannya digabung

14

menjadi suatu cluster babru, sehingga jumlah cluster berkurang satu

pada tiap tahap. Sebaliknya pada metode pemecahan dimulai dari satu

cluster besar yang mengandung seluruh observasi, selanjutnya

observasi-observasi yang paling tidak sama dipisah dan dibentuk

cluster-cluster yang lebih kecil. Proses ini dilakukan hingga tiap

observasi menjadi cluster sendiri-sendiri.

Hal penting dalam metode hirarkhi adalah bahwa hasil pada

tahap sebelumnya selalu bersarang di dalam hasil pada tahap

berikutnya, membentuk sebuah pohon.

Ada lima metode aglomerasi dalam pembentukan cluster, yatiu :

a) Pautan Tunggal (Single Linkage)

Metode ini didasarkan pada jarak minimum. Dimulai dengan dua

objek yang dipisahkan dengan jarak paling pendek maka

keduanya akan ditempatkan pada cluster pertama, dan seterusnya.

Metode ini dikenal pula dengan nama pendekatan tetangga

terdekat.

b) Pautan Lengkap (Complete Linkage)

Disebut juga pendekatan tetangga terjauh. Dasarnya adalah jarak

maksimum. Dalam metode ini seluruh objek dalam suatu cluster

dikaitkan satu sama lain pada suatu jarak maksimuma atau

dengan kesamaan minimum.

c) Pautan Rata-rata (Average Linkage)

15

Dasarnya adalah jarak rata-rata antar observasi. pengelompokan

dimulai dari tengan atau pasangan observasi dengan jarak paling

mendekati jarak rata-rata.

d) Metode Ward (Ward’s Method)

Dalam metode ini jarak antara dua cluster adalah jumlah kuadrat

antara dua cluster untuk seluruh variabel. Metode ini cenderung

digunakan untuk mengkombinasi cluster-cluster dengan jumlah

kecil.

e) Metode Centroid

Jarak antara dua cluster adalah jarak antar centroid cluster

tersebut. Centroid cluster adalah nilai tengah observasi pada

variabel dalam suatu set variabel cluster. Keuntungannya adalah

outlier hanya sedikit berpengaruh jika dibandingkan dengan

metode lain.

3) Metode Non Hirarkhi

Masalah utama dalam metoda non hirarkhi adalah bagaimana

memilih bakal cluster. Harus disadari pengaruh pemilihan bakal

cluster terhadap hasil akhir analisis cluster. Bakal cluster pertama

adalah observasi pertama dalam set data tanpa missing value. Bakal

kedua adalah observasi lengkap berikutnya (tanpa missing data) yang

dipisahkan dari bakal pertama oleh jarak minimum khusus.

Ada tiga prosedur dalam metode non hirarkhi, yaitu :

a) Sequential threshold

16

Metode ini dimulai dengan memilih bakal cluster dan

menyertakan seluruh objek dalam jarak tertentu. Jika seluruh

objek dalam jarak tersebut disertakan, bakal cluster kedua terpilih,

kemudian proses terus berlangsung seperti sebelumnya.

b) Parallel Threshold

Metode ini memilih beberapa bakal cluster secara simultan pada

permulaannya dan menandai objek-objek dengan jarak permulaan

ke bakal terdekat.

c) Optimalisasi

Metode ketiga ini mirip dengan kedua metode sebelumnya

kecuali pada penandaan ulang terhadap objek-objek.

b. Menentukan jumlah cluster yang akan dibentuk

Hal penting lain dalam tahap keempat adalah menentukan jumlah cluster

yang akan dibentuk.Sebenarnya tidak ada standar,prosedur pemilihan

tujuan eksis. Karena tidak ada kriteria statistik internal digunakan untuk

inferensia, seperti tes signifikansipada teknik multivariat lainnya, para

peneliti telah mengembangkan beberapa kriteria dan petunjuk sebagai

pendekatan terhadap permasalahan ini dengan memperhatikan substansi

dan aspek konseptual.

5. Tahap Kelima : Interpretasi terhadap Cluster

Tahap interpretasi meliputi pengujian tiap cluster dalam term untuk

menamai dan menandai dengan suatu label yang secara akurat dapat menjelaskan

17

kealamian cluster. Proes ini dimulai dengan suatu ukuran yang sering digunakan

yaitu centroid cluster.

Membuat profil dan interpretasi cluster tidak hanya tidak hanya untuk

memoeroleh suatu gambaran saja melainkan pertama, menyediakan suatu rata-rata

untuk menilai korespondensi pada cluster yang terbentuk, kedua, profil cluster

memberikan araha bagi penilainan terhadap signifikansi praktis.

6. Tahap Keenam: Proses Validasi dan Pembuatan Profil (PROFILING)

Cluster

a. Proses validasi solusi cluster

Proses validasi bertujuan menjamin bahwa solusi yang dihasilkan

dari analisis cluster dapat mewakili populasi dan dapat digeneralisasi

untuk objek lain. Pendekatan ini membandingkan solusi cluster dan

menilai korespondensi hasil. Terkadang tidak dapat dipraktekkan karena

adanya kendala waktu dan biaya atau ketidaktersediaan ibjek untuk

analisis cluster ganda.

b. Pembuatan Profil ( PROFILING)Solusi Cluster

Tahap ini menggambarkan karakteristik tiap cluster untuk

menjelaskan cluster-cluster tersebut dapat dapat berbeda pada dimensi

yang relevan. Titik beratnta pada karakteristik yang secara signifikan

berbeda antar clustre dan memprediksi anggota dalam suatu cluster

khusus.

18

Secara keseluruhan proses analisis cluster berakhir setelah keenam tahap

ini dilalui. Hasil analisis cluster dapat digunakan untuk berbagai kepentingan

sesuai dengan materi yang dianalisis.

G. Contoh Analisis Cluster dengan SPSS

Terdapat sebuah penelitian mengenai tingkat stress yang dialami pada anak anak.

Gejala-gejala stres yang digunakan ada empat dimana nilai tersebut merupakan

total skor dari skala sikap yang telah dibuat berdasarkan observasi terhadap 45

responden. Penelitian tersebut kemudian dianalisa menggunakan analisis cluster

dengan bantuan SPSS.

Berikut merupakan data yang telah diambil yang dipaparkan pada tabel 3.1

berikut ini.

Tabel 3.1Skor Tingkat Stres pada Anak-anak Berdasarkan Gejala

di daerah Yogyakarta Tahun 2011

No. Intrusion Hyperarousal Avoidance Perilaku lain1. 19 27 17 192. 10 38 20 193. 22 32 11 214. 18 38 18 185. 21 29 13 216. 23 30 16 227. 17 46 10 238. 23 26 12 179. 14 35 12 1410. 23 31 15 1811. 18 32 11 1812. 20 30 12 1713. 19 27 18 2014. 23 30 12 2115. 19 39 14 2016. 14 29 14 25

19

17. 12 23 11 1418. 20 30 14 2319. 20 30 15 1720. 15 30 15 2121. 19 26 13 1822. 19 38 14 1923. 20 30 9 2124. 19 30 12 2325. 22 35 19 2426. 22 26 11 1727. 23 35 18 2028. 26 34 15 1829. 20 27 11 1930. 15 27 20 2331. 13 23 14 1832. 21 28 13 1933. 23 28 18 2034. 19 35 16 1235. 19 27 9 1836. 26 37 17 2037. 29 45 19 2038. 18 29 14 1739. 19 27 15 1540. 22 31 14 2041. 19 37 16 1742. 20 29 16 1843. 23 34 12 2344. 21 31 18 2945. 20 31 11 17

Sumber: hasil observasi peneliti, 2011

Berdasarkan data tersebut peneliti akan melakukan pengelompokan (clustering)

menjadi 2 kelompok yaitu kelompok yang memiliki tingkat stres yang tinggi

dengan kelompok yang memiliki tingkat stres yang rendah. Analisis clustering

tersebut akan dilaksanakan dengan menggunakan program SPSS.

Adapun langkah langkah yang ditempuh adalah sebagai berikut:

20

1. Masukkan data. Cara pemasukan data dapat dilihat pada gambar 3.2

berikut ini.

Gambar 3.2Pemasukan Data penelitian pada Program SPSS

pada Variable view

Sumber: SPSS, 2013

Gambar 3.3Pemasukan data penelitian pada Program SPSS

Pada Data View

Sumber: SPSS, 2013

21

2. Untuk menghilangkan pengaruh karena perbedaan interval antar

dimensi/variabel maka perlu dilakukan standardisasi.

Dari menu Analyze, pilih submenu Descriptive Statistic kemudian

Descriptives dan muncul kotak dialog yang dapat dilihat pada gambar 3.4

berikut ini.

Gambar 3.4Tampilan layar menu Descriptives

Sumber: SPSS, 2013

Pengisisan:

Variable(s): masukkan keempat gejala stres

kemudian tandai save standardized values as variables lalu klik OK

maka nilai standardisasi akan masuk ke data spss dgn awalan Z....

3. Setelah diperoleh nilai standar dilanjutkan ke analisis cluster

Dari menu Analyze, pilih submenu Classify kemudian K-Means

Cluster..

Pengisian:

Variables: masukkan nama yang sudah distandardisasi

Number of cluster: masukkan jumlah kelompok yang akan dibentuk

22

Method: tandai iterate and classify kemudian klik OK

Untuk lebih jelanya langkah ini dapat dilihat pada gambar 3.5 berikut ini

Gambar 3.5Tampilan menu Cluster analysis pada SPSS

Sumber: SPSS, 2013

Kemudian dari langkah tersebut akan didapatkan data berupa output yang

ditunjukkan oleh tabel 3.2 berikut ini.

Tabel 3.2Final Cluster Center

Cluster1 2

Zscore(Hyperarousal) -.21621 .35610Zscore(Avoidance) -.63754 1.05006Zscore(Perilaku_lain) -.63754 1.05006Zscore(Intrusion) -.19301 .31790

Sumber: SPSS, 2013(data diolah)

Berdasarkan Tabel 3.2, dapat dilihat bahwa untuk kelompok 1 memiliki

nilai yang negatif semua yang berarti di bawah rata-rata sedangkan kelompok 2

kondisinya sebaliknya yaitu nilainya positif semua yang berarti di atas ratarata.

23

Sehingga kita bisa menamai kelompok 1 sebagai kelompok tingkat stres rendah

dan kelompok 2 sebagai kelompok tingkat stres tinggi.

Tabel 3.3Number of cases in each Cluster

JumlahCluster 1 28.000

2 17.000Valid 45.000Missing .000

Sumber: SPSS, 2013(data diolah)

Pada Tabel 3.3 menunjukkan jumlah anggota pada setiap kelompok, dimana

responden yang mengalami tingkat stres rendah sebanyak 28 dan yang mengalami

tingkat stres tinggi sebanyak 17 orang dari jumlah total sebanyak 45 responden.

24

BAB IV

PENUTUP

A. Kesimpulan

25

DAFTAR PUSTAKA

26