cluster hierarki

BAB I

PENDAHULUAN

A. LATAR BELAKANG

Sumber daya manusia yang berkualitas merupakan modal dasar yang sekaligus juga

menjadi kunci dan parameter keberhasilan pembanguna nasional. Hal ini dapat dilihat

dari beberapa negara maju yang telah berkembang menjadi negara industri, bukan karena

kekayaan alam yang berlimpah, tetapi karena mutu dari tenaga kerja yang merupakan

sumber daya manusianya yang baik dan berkualitas. Bila sumber daya indonesia dalam

jumlah besar dapat ditingkatkan kualitas dan pendayagunaannya, maka tidak mustahil

Indonesia dapat berkembang dan mampu bersaing dengan negara-negara maju lainnya.

Oleh karena itu, pantangan terbesar yang dihadapi pada masa sekarang dan seterusnya

adalah dalam hal menyiapkan tenaga-tenaga yang terampil dan berkualitas sebagai

pelaksana pembangunan yang tidak hanya mampu bekerja dengan terampil, tetapi juga

dapat berinovasi dan mempunyai tingkat kreatifitas yang tinggi serta mempunyai

pemikiran dan pandangan jauh kedepan.

Pendidikan merupakan hal utama sebagai ujung tombak kemajuan suatu bangsa.

Pendidikan yang berkualitas dapat menghasilkan sumber daya manusia yang berkualitas

dan produktif. Hal ini dapat menjadikan suatu negara menjadi negara yang maju dan

berkembang pesat dalam perkembangan ilmu pengetahuan dan teknologi. Dalam hal ini

dunia pendidikan mempunyai dua fungsi utama. Pertama dunia pendidikan berkewajiban

untuk menyediakan urusan yang berkualitas, mempunyai disiplin tinggi, serta mampu

menjadi dinamisator, inovator, motivator, dan penggerak pembangunan. Kedua dunia

pendidikan khususnya perguruan tinggi, berkewajiban menyediakan lulusan yang ahli dan

terampil dalam hal melaksanakan tugasnya, serta mampu mengembangkan

kemampuannya dalam kehidupan nyata.

Dunia pendidikan berfungsi memproduksi tenaga-teanaga yang berkualitas untuk

berbagai tingkatan dan bidang keahlian. Tenaga-tenaga yang berkualitas diharapkan dapat

dijadikan dinamisator dalam pembangunan. Gerak dan laju pembangunan banyak

ditentukan oleh jumlah, mutu, kemampuan,dan kecocokan urusan dunia pendidikan yang

dihasilkan dengan kebutuhan dalam dunia nyata.

Dalam suatu fenomena yang lain, permasalahan yang muncul sekarang adalah isu

tentang rendahnya mutu pendidikan dalam berbagai jenjang pendidikan di Indonesia.

Selain itu berdfasarkan capaian program education for all (EFA) global monitoring report

2008 menyatakan EFA development index (EDI) Indonesia untuk indikator tingkat buta

huruf peringkat Indonesia turun dari peringkat dari 67 menjadi 71 (Hendri,2008). Hal ini

mengindikasikan masih banyaknya presentase penduduk yang masih tidak bisa membaca

dan menulis huruf latin maupun huruf lainnya yang merupakan salah satu permasalahan

yang tengah dihadapi oleh bangsa Indonesia. Hal ini mengisyaratkan bahwa masih

lemahnya management pendidikan di Indonesia yang harus segera mendapatkan

penanganan untuk secepatnya dicari solusi yang terbaik untuk mengatasinya.

Dari analisis cluster yang akan kita gunakan diharapkan nantinya pembangunan

nasional dapat lebih terarah pada kabupaten atau kota madya yang tergolong

membutuhkan perhatian khusus dari pemerintah, untuk menangani permasalahan

rendahnya angka kesadaran masyarakat akan pentingnya pendidikan.

Belakangan ini kita rasakan arah pembangunan Jawa Timur kurang tepat sasaran.

Yang menjadi penyebabnya adalah tidak adanya data tentang pengelompoan kabupaten

atau kota madya yang sangat memerlukan peningkatan pembangunan terutama dibidang

pendidikan. Sehingga dalam melaksanakan pembangunan, pemerintah hanya berdasar

pada proposal yang masuk ke pemerintahan saja, tanpa memperhatikan kelompok daerah

tertinggal. Data-data tersebut kemudian dianalisis menggunakan analisis cluster untuk

menjawab permasalahan suatu kabupaten atau kota madya yang memerlukan perhatian

khusus mengenai pendidikan di daerahnya. Istilah cluster berkenaan dengan obyek-obyek

yang memiliki kemiripan. Dalam permasalhan suatu daerah, kabupaten atau kota madya

yang memiliki kemiripan dimasukkan dalam satu cluster.

Analisis cluster berbeda dengan tekhnik multivariat yang lain. Cluster diartikan

sebagai sejumlah variabel yang dianggap sebagai karakteristik yang dipakai untuk

membandingkan sebuah obyek dengan obyek lainnya. Jadi, dalam analisis cluster tidak

dilakukan pencarian nilai variat secara empiris sebagai mana pada tekhnik-tekhnik

multivariat lainnya.

B. RUMUSAN MASALAH

Dari latar belakang masalah di atas, rumusan masalah yang diambil adalah :

1. Bagaimana pengelompokan tingkat pendidikan kabupaten dan kota di Jawa Timur

yang dimiliki karakteristik sama?

2. Bagaimana ciri-ciri dari kelompok yang terbentuk?

C. TUJUAN PENULISAN

Tujuan dari penulisan ini adalah untuk mengetahui kelompok-kelokpok Kabupaten

dan kota di provinsi Jawa Timur tahun 2008 yang memiliki karakteristik sama di bidang

pendidikan.

D. BATASAN MASALAH

Dalam makalah ini, data dibatasi hanya pada data indikator pendidikan provinsi Jawa

Timur hasil surve tahun 2008. Metode analisis yang digunakan adalah cluster analysis

menggunakan metode hierarchical cluster.

BAB II

KAJIAN PUSTAKA

A. Analisis Multivariat

Menurut Kuncoro (dalam Purwaningsih,2007), analisis multivariat merupakan

analisis dimana masalah yang diteliti bersifat multidimensional dan menggunakan tiga

atau lebih variabel. Analisis multivariat dibagi menjadi dua kategori utama yaitu:

1. Analisis dependensi/ketergantungan (Dependence Methods).

Analisis ketergantungan digunakan apabila tujuan dari analisis adalah untuk

menjelaskan atau memprediksi variabel terikat berdasarkan dua atau lebih variabel

bebas. Metode ini terdiri dari 4 macam yaitu Analisis Regresi Berganda (multiple

Discriminant Analysis), Analisis Diskriminasi Berganda (Multiple Discriminant

Analysis), Analisis Multivariat Varians (Multivariate Analysis of Variance), dan

Analisis Korelasi Kanonikal (Canonical Correlation Analysis).

2. Analisis interdependensi/saling ketergantungan (Interpendence Method).

Metode yang digunakan untuk menjelaskan seperangkat variabel atau

mengelompokkan berdasarkan variabel-variabel tertentu. Metode ini dikelompokkan

menjadi tiga yaitu Analisis Faktor (Factor Analysis), Analisis Kluster (Cluster

Analysis), dan Skala Multidimensional (Multidimensional Scaling). Pada umumnya di

dalam riset pemasaran, analisis interpendensi untuk membentuk segmen pasar Objek

(responden/pelanggan) dalam segmen akan homogen atau relatif homogen (hampir

sama /mirip) akan tetapi antar-segmen sangat heterogen/sangat berbeda/bervariasi.

B. Analisis Cluster

Menurut Kuncoro (dalam Purwaningsih,2007) analisis cluster adalah tekhnik yang

digunakan untuk mengidentifikasi obyek atau individu yang serupa dengan

memperhatikan beberapa kriteria. Sedangkan menurut Supranto ( dalam Purwaningsih)

analisis cluster adalah analisis untuk mengelompokkan elemen yang mirip sebagai obyek

penelitian menjadi kelompok (cluster) yang berbeda dan mutualy exclusif.

Analisis cluster termasuk dalam analysis statistik multivariat metode interdependen.

Sebagai alat analisis interdependen maka tujuan analysis cluster tidak untuk

menghubungkan ataupun membedakan dengan sampel atau variabel lain. Analysis cluster

merupakan suatu analysis yang berguna sebagai peringkas data. Dalam meringkas data ini

dapat dilakukan dengan jalan mengelompokkan obyek-obyek berdasarkan kesamaan

karakteristik tertentu diantara obyek-obyek yang hendak diteliti.

Suprapto (dalam Purwaningsih,2007) menjelaskan bahwa analysis cluster suatu alat

untuk mengelompokkan sejumlah n obyek berdasarkan p variat yang secara relatif

mempunyai kesamaan karakteristik diantara obyek-obyek tersebut, sehingga keragaman

di dalam suatu kelompok tersebut lebih kecil dibandingkan keragaman antar kelompok.

Obyek dapat berupa barang, jasa, tumbuhan, binatang dan orang ( responden, konsumen,

atau yang lainnya). Obyek tersebut akan diklasifikasikan ke dalam satu atau lebih

cluster(kelompok) sehingga obyek-obyek yang berada dalam satu cluster akan

mempunyai kemiripan atau kesamaan karakter.

Jika terdapat n obyek dan p variat, maka observasi xij dengan dan

, dapat digambarkan sebagai berikut :

Var 1 Var2 ... Var j ... Var p

Obyek 1 X11 X12 ... X1j ... X1p

Obyek 2 X21 X22 ... X2j ... X2p

: : : : : : :

Obyek i Xi1 Xi2 : Xij : Xip

: : : : : : :

Obyek n Xn1 Xn2 : Xnj : Xnp

Adapun ciri-ciri cluster adalah

1. Homogenitas (kesamaan) yang tinggi antar anggota dalam satu cluster(within cluster).

2. Heterogenitas (perbedaan)yang tinggi antar cluster yang satu dengan cluster

yanglainnya(between cluster).

Analisis cluster mempunyai beberapa istilah penting, antara lain:

1. skedul aglomerasi (aglomeration schedulea0 , ialah skedul yang memberikan

informasi tentang objek atau kasus yang akan digabung (dikelompokkan, dimasukkan

dalam klaster) pada setiap tahap, pada suatu proses pengklasteran yang hierarki.

2. Rata-rata kluster (cluster centroid), ialah nilai rata-rata variabel dari semua objek atau

observasi dalam klster tertentu.

3. Pusat klater (cluster centre) ialah titik awal dimulainya pengelompoan di dalam

klaster non hierarki(non-hierarchialo clustering). Klater dibentuk/dibangun di sekitar

titik-titik ini atau benih (seeds ).

4. Keanggotaan klaster (cluster member ship) ialah keanggotaan yang menunjukkan

klater un tuk setiap objek yang menjadi anggotanya (misalnya objek tertentu menjadi

anggota klaster satu atau menjadi anggota klaster dua, dan lain sebagainya).

5. Dendogram disebut juga grafik pohon(tree graph), output spss yang

memvisualisasikan hasil analysis cluster yang dilakukan peneliti. Garis vertical atau

tegak menunjukkan klaster yang dgabung bersama.posisi garis pada skala

menunjukkan jarak (distance)untuk mana klaster digabung. Dendogram harus dibaca

dari kiri ke kanan.

6. Distances between cluster centers, ialah jarak yang menunjukkan bagaimana

terpisahnya pasangan individu cluster.

C. Tujuan Analisis Cluster

Tujuan utama analisis klaster adalah untuk menempatkan sekumpulan objek ke dalam

dua atau lebih grup berdasarkan kesamaan-kesamaan objek atas dasar berbagai

berbagai karakteristik. Melalui prinsip homogenitas grup, terdapat tiga sasaran yang

tersedia bagi peneliti, yaitu:

1. Deskripsi taksonomi. Ini merupakan sasaran tradisional analisis klaster.

Dengan taksonomi, kita dapat mengumpulkan sekumpulan objek secara

empiris. Memang, analisis klaster telah dipakai untuk keperluan-keperluan

pengelompokan, namun kemampuannya tidak hanya sebatas itu. Analisis

klaster dapat pula dipakai untuk memunculkan hipotesis tentang struktur

objek-objek yang diteliti. Jadi sekalipun banyak dipandang sebagai alat

analisis untuk keperluan eksploratori, analisis klaster dapat pula digunakan

untuk tujuan konfirmatori.

2. Simplikasi data. Dengan taksonomi, yang kita peroleh memang grup. Akan

tetapi, berdasarkan struktur yang diperoleh, kita juga bisa menjelaskan profil

setiap grup berdasarkan karakteristik umum yang dimiliki. Kalau analisis

faktor menjelaskan “dimensi” yang mendasari sejumlah variabel, dengan

analisis klaster kita juga melakukan hal yang sama, yaitu dimensi yang

mendasari sejumlah observasi yang berada pada suatu klaster.

3. Identifikasi hubungan. Setelah klaster terbentuk dan struktur data yang

mendasari diperlihatkan dalam klaster, periset mendapat informasi tentang

hubungan antar observasi yang tidak mungkin diperoleh dengan menganalisis

observasi secara individu. Memang analisis diskriminan dapat digunakan

untuk mengetahui hubungan tersebut secara empiris. Bahkan secara kualitatif

hubungan tersebut juga bisa diidentifikasi. Akan tetapi analisis laster sering

kali memperlihatkan kesamaan-kesamaan maupun perbedaan-perbedaan yang

tidak terdeteksi metode-metode lain. Konsep Dasar dalam Analisis Cluster

Analisis cluster merupakan suatu kelas teknik, diprgunakan untuk

mengklasifikasikan objek atau kasus ke dalam kelompok yang relatif homogen, yang

disebut cluster. Objek dalam setiap kelompok cenderung mirip satu sama lain dan

berbeda jauh (tidak sama) dengan objek dari cluster lainnya. Pengelompokan

dilakukan berdasarkan kemiripan (similarity) antar objek. Kemiripan diperoleh

dengan meminimalkan jarak antar objek dalam kelompok (within-cluster) dan

memaksimalkan jarak antar kelompok (between-cluster).

D. Proses Analisis Cluster

Untuk melakukan analisis cluster ada beberapa proses yang haruis dilakukan. Proses

analisis cluster tersebut meliputi:

1. Menentukan ukuran ketakmiripan antar dua objek.

Sesuai prinsip daftar cluster yaitu mengelompokkan objek yang mempunyai

kemiripan, maka proses pertama adalah mengukur seberapa jauh ada kesamaan

antar objek. Dengan memiliki sebuah ukuran kuantitatif untuk mengatakan bahwa

dua objek tertentu lebih mirip dibandingkan dengan objek lain, akan

menghilangkan kebingungan dan mempermudah proses formal dalam

pengclusteran. Salah satu yang jelas bisa menjadi ukuran ketakmiripan adalah

fungsi jarak antara objek a dan b, yang bisa dinotasikan dengan d(a,b).

Sifat-sifat ukuran ketakmiripan adalah:

a. d(a,b) 0

b. d(a,a) = 0

c. (a,b) meningkat seiring semakin tidak mirip kedua objek a dan b.

d. d(a,c) d(a,b) + d(b,c).

jarak yang paling umum digunakan adalah jarak Euclidean. Ukuran jarak atau

ketidaksamaan antar objek ke-I dengan objek ke-h, disimbolkan dengan dih.

Nilai dih diperoleh melalui perhitungan jarak kuadrat Euclidean

∑

Sebagai berikut dimana:

dih = jarak kuadrat Euclidean antar objek ke-I dengan objek ke-h.

p = jumlah variable cluster.

Xij = nilai atau data dari objek ke-I pada variable ke-j.

Xhj = nilai atau data dari objek ke-h pada variable ke-j (Everitt, 1993).

2. Membuat Cluster

Proses cluster atau pengelompokan data biasa dilakukan dengan dua metode:

a. Metode Hirarki

Metode ini memulai pengelompokan dengan dua atau lebih objek yang

mempunyai kesamaan paling dekat. Kemudian operasi seterusnya

sehingga cluster akan membentuk semacam „pohon‟ dimana ada hirarki

(tingkatan) yang jelas antar objek, dari yang paling mirip sampai paling

tidak mirip. Metode yang digunakan untuk proses Clustering secara hirarki

adalah Single Linkage (Pautan Tunggal). Metode ini akan

mengelompokkan dua objek yang mempunyai jarak terdekat dahulu. Jadi

pada setiap tahapan, banyaknya cluster berkurang satu. Secara formal, dua

buah cluster Br dan Bs ,jarak antara Br dan Bs misalkan h(Br , Bs)

didefinisikan sebagai :

h(Br , Bs) = min {d(xi , Xj ); xi anggota Br , xj anggota Bs }

hasil berupa single linkage clustering dapat disajikan dalam bentuk suatu

dendogram atau diagram pohoin. Cabang-cabang pohon menunjukkan

cluster/kelompok. Cabang-cabang terebut bertemu bersama-sama

(menggabung) pada simpul yang posisinya sepanjang suatu sumbu jarak

(kemiripan) menunjukkan tingkat dimana penggabungan terjadi.

b. Metode Non-Hirarki

Metode inin dimulai dengan proses penentuan jumlah cluster terlebih

dahulu. Metode Non-Hirarki yang digunakan adalah k-means. Metode k-

means digunakan sebagai alternatif metode cluster untuk data dengan

ukuran yang besar karena memiliki kecepatan yang lebih tinggi disbanding

metode hirarki.

Mac Queen menyarankan bahwa penggunaan k-means untuk menjelaskan

algoritma dalam penentuan suatu objek ke dalam cluster tertentu

berdasarkan rataan terdekat. Proses pengclusteran dengan metode k-means

adalah:

1) Menetukan besarnya k yaitu banyaknya cluster dan menentukan

centroid di tiap cluster.

2) Menghitung jarak tiap objek dengan setiap centroid.

3) Menghitung kembali rataan (centroid) untuk cluster yang baru

terbentuk.

4) Mengulangi langkah 2 sampai tidak ada lagi pemindahan objek

antar cluster(Sartono dalam Purwaningsih,2007).

3. Setelah cluster terbentuk, baik dengan hirarki maupun non hirarki, langkah

selanjutnya melakukan interpretasi terhadap cluster yang terbentuk, yang pada

intinya memberi nama spesifik untuk menggambarkan isi cluster tersebut.

4. Melakukan Validasi Cluster

Untuk menguji validasi cluster digunakan uji parsial F.

Hipotesis :

H0 : variable I bukan variable pembela dalam pengclusteran.

H1 : variable I merupakan variable pembela dalam pengclusteran

Taraf signifikan α

Statistik uji ,

Kriteria Uji:

Tolak H0 jika F > Fα , k-1 ,n-k

E. Metode Pautan Rata-rata (Average Linkage)

Pada metode ini dihitung jarak minimum antara semua pasangan pengamatan dari

kelompok yang digabung. Jarak antar cluster didefinisikan sebagai jarak rata-rata.

Rata-rata jarak antar kelompok (UV ) yang merupakan jarak antara kelompok U dan

kelompok V dengan kelompok W adalah:

∑ ∑

Dimana :

dik = matriks jarak antara pengamatan ke I dalam kelompok (UV) dan

pengamatan ke k kelompok W

n(UV) = banyaknya pengamatan dalam kelompok (UV)

n(W) = banyaknya pengamatan dalam kelompok W

secara umum langkah-langkah metode pengelompokan adalah sebagai berikut:

1. Membuat matriks jarak antar individu D = (dik)

2. Mencari nilai jarak terdekat antara dua individu

3. Menghitung jarak antara kelompok dengan beberapa individu di luar kelompok

dengan menggunakan metode pautan, missal (UV) dengan W

4. Menyusun kembali matriks jarak yang baru dengan cara membuat baris dan

kolom baru dari nilai jarak antara kelompok dengan beberapa individu di luar

kelompok atau kelompok sisa

5. Mengulangi langkah 2-4 sampai semua indivudu berada dalam satu kelompok

dan tidak dapat lagi dikelompokkan lagi

6. Membuat dendogram

7. Memotong dendogram menggunakan selisih jarak terbesar

Tahap akhir dari analisisi kelompok adalah terbentunya kelompok yang

diharapkanmempunyai kesamaankarakteristik. Hasil pengelompokan ini digambarkan

dalam diagram pohon atau dendogram yang memperlihatkan kelompok dalam tahap

pengelompokan. Penentuan banyaknya kelompok dapat dilihat dari pemotongan

dendogram pada selisis jarak penggabunhgan terbesar atau dengan melihat tingkat

kemiripan dalam kelompok (Everitt dan Dunn, 1980).

Proses Analisis Klaster

Proses yang dilakukan dalam analisis klaster, meliputi:

1. Menentukan ukuran ketakmiripan antara dua objek

Jarak tiap objek dihitung dengan perhitungan squared euclidean distance dengan

persamaan:

∑

Keterangan :

: jarak euclidean kuadrat

: variabel ke-k pada kabupaten i

: variabel ke-k pada kabupaten j

Dengan i an j adalah nama kabupaten / kotamadya yang ada di Jawa Timur, sehingga

diperoleh:

∑

∑

Dan seterusnya seperti yang ditampilkan dalam tabel Proximity Matrix di bawah ini:

Sebagai contoh jarak anatara Pacitan dengan Tulungagung adalah 69,74, sedangkan

jarak antara Pacitan dengan Trenggalek sebesar 17,6. Hal ini menunjukkan bahwa

Pacitan lebih mirip karakteristiknya dengan Trenggalek daripada dengan

Tulungagung. Semakin kecil nilai jarak antara dua objek, maka semakin mirip kedua

objek tersebut.

2. Membuat klaster

a. Proses klastering secara hirarki

Perhatikan tabel di bawah ini

Pada tabel di atas output menyatakan bahwa semua data telah diproses tanpa

ada data yang hilang. Dan proses penggabungan dua objek atau lebih dapat

dilihat pada tabel Agglometion Schedule (lampiran) dengan tahapan sebagai

berikut:

Pada tahap 1, terbentuk satu klaster anatar kota Blitar dan Kota Batu

karena pasangan ini mempunyau koefisien jarak terdekat sebesar

0,080. Objek-objek lain sama sekali belum memperoleh pasangan,

oleh karena itu pada tahap ini jumlah klaster ada 37. Kemudian jika

dilihat pada kolom tahap berikutnya terlihat angka 21. Hal ini berarti

langkah klastering selanjutnya dilakukan dengan melihat tahap 21,

dengan penjelasan sebagai berikut.

Pada tahap 21, dapat dilihat terbentuknya klaster antara kota Blitar

dengan kota Pasuruan dengan nilai koefisiean jarak sebesar 41,660

yang menunjukkan besarnya jarak terdekat antara kota Blitar dengan

kedua kabupaten sebelumnya.

Dengan terbentuknya klaster tersebut, maka sekarang klaster terdiri

dari tiga objek yaitu, kota Blitar, kota Batu, kota Pasuruan.

Proses klaster dilanjutkan pada tahap selanjutnya hingga menunjukkan

nilai tahap 0, yang berarti proses klaster berhenti. Kemudian proses

dilanjutkan ke tahap yang belum diproses sampai proses klaster

berhenti. Untuk memperjelas proses penggabungan satu demi satu

dapat digambarkan dalam bentuk dendogram.

Pada proses Agglomerasi di atas tentu bersifat kompleks, khususnya

perhitungan koefisien yang melibatkan tujuh variabel. Yang perlu diperhatikan

adalah semakin kecil angka koefisien, anggota klaster tersebut semakin

memiliki kemiripan satu sama lain. Dan sebaliknya, semakin besar koefisien

semakin tidak mirip satu dengan yang lain. Proses agglomerasi pada akhirnya

akan menyatukan semua variabel menjadi satu. Hanya dalam prosesnya,

dihasilkan beberapa klaster dengan masing-masing anggotanya, tergantung

jumlah klaster yang dibentuk. Seperti yang diperlihatkan pada dendogram

berikut.

Dendrogram using Average Linkage (Between Groups)

Rescaled Distance Cluster Combine

C A S E 0 5 10 15 20 25

Label Num +---------+---------+---------+---------+---------+

Blitar 31 ─┬─┐

Batu 38 ─┘ ├───┐

Pasurua 34 ───┘ ├─┐

Proboli 33 ───────┘ │

Sidoarj 15 ─┐ ├───────────────────────────────────────┐

Kediri 30 ─┼───┐ │ │

Mojoker 35 ─┘ ├───┘ │

Malang 32 ─┬─┐ │ │

Surabay 37 ─┘ ├─┘ │

Madiun 36 ───┘ │

Bangkal 26 ─┐ │

Sumenep 29 ─┼───┐ │

Sampang 27 ─┘ ├─────────────────┐ │

Bondowo 11 ─┬───┤ │ │

Proboli 13 ─┘ │ │ │

Situbon 12 ─────┘ │ │

Lumajan 8 ─┬─┐ │ │

Pamekas 28 ─┘ │ │ │

Jember 9 ───┼───┐ │ │

Bojoneg 22 ─┬─┤ │ ├─────────────────────────┘

Tuban 23 ─┘ │ │ │

Pacitan 1 ─┬─┘ ├─┐ │

Trengga 3 ─┘ │ │ │

Blitar 5 ─┬───┐ │ │ │

Pasurua 14 ─┘ ├─┘ │ │

Malang 7 ─┬─┐ │ │ │

Banyuwa 10 ─┘ ├─┘ ├─────────────┘

Ponorog 2 ───┤ │

Ngawi 21 ───┘ │

Lamonga 24 ───┬───┐ │

Gresik 25 ───┘ │ │

Tulunga 4 ─┐ │ │

Magetan 20 ─┼─┐ ├─┘

Nganjuk 18 ─┘ ├─┐ │

Kediri 6 ─┐ │ │ │

Jombang 17 ─┼─┘ ├─┘

Mojoker 16 ─┘ │

Madiun 19 ─────┘

Pada gambar di atas terlihat bahwa dari sisi “Rescaled Distance Cluster

Combine”, yaitu tahap „tiga klaster‟ dan tahap „dua klaster‟ memiliki jarak

paling besar. Maka, pada tiga klaster dimungkinkan untuk diambil sebagai

jumlah klaster yang baik.

Berdasarkan pertimbangan di atas, jumlah klaster terbaik adalah tujuh. Dari

dendogram terlihat anggota setiap klaster. Bila dilihat dari dendogram, klaster

satu beranggotakan respondes 15, 30, 35, 32, 27, dan 36. Dan seterusnya.

3. Interpretasi dan pembuatan profil

Pengelompokan tidak bermanfaat apabila tidak menegtahui profil setiap kelompok.

Untuk menginterpretasikan klaster dan membuat profil, gunakan rata-rata setiap

klaster pada tiap variabel (yang dinamakan centroid). Centroid memungkinkan kita

memberikan label untuk setiap klaster.

Profil Klaster Satu

Responden Tidak /

belum

pernah

sekolah

Tidak/

belum

tamat

SD

SD/MI SMP

sederajat

SMA

sederajat

SMK

sederajat

Perguruan

tinggi

31 1,8 13,6 25,1 20,4 18 12,8 8,3

38 1,7 13,7 25 20,4 18,2 12,7 8,3

34 3,6 18,7 23,8 19,4 17,3 9,8 7,4

33 8,9 17,7 24,4 18,9 12,6 9,9 7,6

Rata-rata 4 15,925 24,575 19,775 16,525 11,3 7,9

Profil Klaster Dua

Responden Tidak /

belum

pernah

sekolah

Tidak /

belum

tamat

SD

SD/MI SMP

sederajat

SMA

sederajat

SMK

sederajat

Perguruan

tinggi

15 1,6 12,3 25,7 21,4 22,7 10,2 6,1

30 1,9 9,4 24,4 21,6 23,8 10,3 8,6

35 2 12,7 24,6 17,3 23,2 11,1 9,1

32 1,4 10,2 20,1 19,7 27,8 10,2 10,6

37 1,3 8,2 21,2 22,1 26,8 9,3 11,1

36 1,5 8,9 20,8 23,1 21,4 13,2 11,1

Rata-rata 1,61 10,28 22,8 20,87 24,28 10,72 9,43

Dan seterusnya sampai klaster ketujuh.

PRESENTASE PENDUDUK MENURUT TINGKAT PENDIDIKAN TERAKHIR DI

KABUPATEN ATAU KOTAMADYA DI PROVINSI JAWA TIMUR PADA TAHUN

2008

No Kabupaten Tidak /

belum

pernah

sekolah

Tidak

/

belum

tamat

SD

SD/

MI

SMP

sederajat

SMA

sederajat

SMK

sederajat

Perguruan

Tinggi

1. Pacitan 10 25.2 39 15 4.9 4 1.9

2. Ponorogo 11.5 24 33.9 15.6 7.1 5.1 2.8

3. Trenggalek 8.4 22.1 40.1 16.4 6.1 4.9 2

4. Tulungagung 4.3 22.9 36.9 18.1 7.8 6.8 3.2

5. Blitar 4.9 28.7 38.5 14.8 5.6 5.1 2.4

6. Kediri 5.4 19.2 34.6 20.3 10.3 7.1 3.1

7. Malang 6.8 26 35.1 19 7.7 4.1 1.3

8. Lumajang 11.9 25.8 39.9 12.1 6.6 2 1.7

9. Jember 15.2 22.1 37.1 12.7 8.6 2.8 1.5

10. Banyuwangi 7.9 26 31.8 19.6 7.9 4.4 2.4

11. Bondowoso 13.8 37.7 28.7 10.8 5.1 2.1 1.8

12. Situbondo 15.9 30.5 25.7 12.7 8.5 3.3 3.4

13. Probolinggo 14.7 34 29.9 10.2 5.9 3.3 2

14. Pasuruan 6 26.2 36.9 15.9 8 4.5 2.5

15. Sidoarjo 1.6 12.3 25.7 21.4 22.7 10.2 6.1

16. Mojokerto 3.5 18.9 32.2 21.8 13.3 7.4 2.9

17. Jombang 3.8 21.2 34.4 19.7 10.1 8.1 2.7

18. Nganjuk 5.8 19.3 37.9 20.1 8.3 6.3 2.3

19. Madiun 9.9 14.8 34.6 18.4 9.8 9.7 2.8

20. Magetan 5.7 20.7 37.6 18.6 6.1 8.2 3.1

21. Ngawi 10.9 21.1 35 20.3 5.1 5.6 2

22. Bojonegoro 12.3 18.8 40.7 17.4 5.7 3.3 1.8

23. Tuban 11.9 21 39.2 15.9 7.3 2.9 1.8

24. Lamongan 9.4 19.7 32.2 18.4 14.6 2.3 3.4

25. Gresik 4.8 18 33.4 19.4 16.5 5.4 2.5

26. Bangkalan 16.2 30.4 34.4 8.3 6.7 2.2 1.8

27. Sampang 19.1 31.6 32.4 10.1 3.9 2.3 0.6

28. Pamekasan 12.7 24.3 39.9 11 7.6 3 1.5

29. Sumenep 17.5 28 34.6 9.2 6.3 2.3 2.1

KOTA

30. Kediri 1.9 9.4 24.4 21.6 23.8 10.3 8.6

31. Blitar 1.8 13.6 25.1 20.4 18 12.8 8.3

32. Malang 1.4 10.2 20.1 19.7 27.8 10.2 10.6

33. Probolinggo 8.9 17.7 24.4 18.9 12.6 9.9 7.6

34. Pasuruan 3.6 18.7 23.8 19.4 17.3 9.8 7.4

35. Mojokerto 2 12.7 24.6 17.3 23.2 11.1 9.1

36. Madiun 1.5 8.9 20.8 23.1 21.4 13.2 11.1

37. Surabaya 1.3 8.2 21.2 22.1 26.8 9.3 11.1

38. Batu 1.7 13.7 25 20.4 18.2 12.7 8.3

Agglomeration Schedule

Stage

Cluster Combined

Coefficients

Stage Cluster First Appears

Next Stage Cluster 1 Cluster 2 Cluster 1 Cluster 2

1 31 38 .080 0 0 21

2 8 28 6.140 0 0 17

3 6 17 8.160 0 0 14

4 26 29 8.560 0 0 15

5 22 23 12.220 0 0 18

6 4 20 12.400 0 0 10

7 32 37 13.040 0 0 25

8 7 10 13.800 0 0 23

9 5 14 17.150 0 0 28

10 4 18 17.460 6 0 22

11 1 3 17.600 0 0 18

12 15 30 17.700 0 0 16

13 11 13 18.420 0 0 27

14 6 16 23.120 3 0 22

15 26 27 27.780 4 0 30

16 15 35 29.540 12 0 26

17 8 9 30.160 2 0 24

18 1 22 33.835 11 5 24

19 2 21 36.960 0 0 23

20 24 25 40.520 0 0 33

21 31 34 41.660 1 0 31

22 4 6 45.409 10 14 29

23 2 7 46.640 19 8 28

24 1 8 52.447 18 17 32

25 32 36 55.010 7 0 26

26 15 32 61.529 16 25 35

27 11 12 65.360 13 0 30

28 2 5 69.077 23 9 32

29 4 19 80.477 22 0 33

30 11 26 86.660 27 15 36

31 31 33 90.000 21 0 35

32 1 2 91.216 24 28 34

33 4 24 93.537 29 20 34

34 1 4 143.990 32 33 36

35 15 31 147.755 26 31 37

36 1 11 331.533 34 30 37

37 1 15 745.689 36 35 0

Cluster Membership

Case 4 Clusters 3 Clusters 2 Clusters

1:Pacitan 1 1 1

2:Ponorog 1 1 1

3:Trengga 1 1 1

4:Tulunga 1 1 1

5:Blitar 1 1 1

6:Kediri 1 1 1

7:Malang 1 1 1

8:Lumajan 1 1 1

9:Jember 1 1 1

10:Banyuwa 1 1 1

11:Bondowo 2 2 1

12:Situbon 2 2 1

13:Proboli 2 2 1

14:Pasurua 1 1 1

15:Sidoarj 3 3 2

16:Mojoker 1 1 1

17:Jombang 1 1 1

18:Nganjuk 1 1 1

19:Madiun 1 1 1

20:Magetan 1 1 1

21:Ngawi 1 1 1

22:Bojoneg 1 1 1

23:Tuban 1 1 1

24:Lamonga 1 1 1

25:Gresik 1 1 1

26:Bangkal 2 2 1

27:Sampang 2 2 1

28:Pamekas 1 1 1

29:Sumenep 2 2 1

30:Kediri 3 3 2

31:Blitar 4 3 2

32:Malang 3 3 2

33:Proboli 4 3 2

34:Pasurua 4 3 2

35:Mojoker 3 3 2

36:Madiun 3 3 2

37:Surabay 3 3 2

38:Batu 4 3 2

KESIMPULAN

Berdasarkan hasil dari pembahasan, maka kesimpulan yang dapat diambil adalah sebagai

berikut:

Berdasarkan langkah-langkah pengklasteran, maka disimpulkan bahwa yang termasuk

dalam klaster sati adalah : Kota Probolinggo, Kota Blitar, Kota Pasuruan, dan Kota Batu.

Klaster dua adalah : Kota Kediri, Kota Malang, Kota Mojokerto, Kota Madiun dan Kota

Surabaya. Klaster tiga adalah : Bangkalan, Bondowoso, Kab.Probolinggo, Sitobondo,

Sumenep dan Sampang. Klaster empat adalah : Lumajang, Pamekasan, Jember, Bojonegoro,

Tuban, Pacitan, dan Trenggalek. Klaster lima adalah Kab. Blitar, Kab.Pasuruan, Kb.Malang,

Banyuwangi, Ponorogo, Dan Ngawi. Klaster enam adalah: Lamongan dan Gresik. Klaster

tujuh adalah Tulungagung, Magetan, Nganjuk, Kab.Kediri, Jombang, Madiun, dan

Mojokerto.

cluster hierarki

Documents