analisis pengelompokan desa tertinggal di kabupaten kutai timur dengan pendekatan metode k-means dan...

12
1 ANALISIS PENGELOMPOKAN DESA TERTINGGAL DI KABUPATEN KUTAI TIMUR DENGAN PENDEKATAN METODE K-MEANS DAN CENTROID LINKAGE (Minkowski Distance Measure) [makalah] Adi Wijaya 1 [email protected] NRP. 1310201720 1 Mahasiswa Program Pascasarjana, Jurusan Statistika, Fakultas MIPA, Institut Teknologi Sepuluh Nopember, Surabaya Abstract Poverty is one of the complicated problems in Indonesia and many countries. In Indonesia especially in East Kutai Regency, the government has published many policies to press the poverty rate. However, poverty is not only about people but also about related to surrounding areas like village. Therefore, this research uses clustering analysis method to find how many clusters will be produced by this method and how many villages that be included in each cluster. The different methods used in this research are non-hierarchical method with k-means clustering analysis and hierarchical method with centroid linkage method using Minkowski distance measure . The results show that the number of clusters of villages in East Kutai is two clusters with different members of each cluster of each method. Keywords: poverty, villages, k-means clustering, centroid linkage, Minkowski distance 1. Pendahuluan Salah satu masalah utama saat ini baik di negara-negara miskin, berkembang maupun di negara-negara maju adalah kemiskinan. Kemiskinan merupakan awal dari timbulnya masalah-masalah sosial lainnya yang terkait erat dengan kualitas pendidikan, kriminalitas, kelaparan dsb yang secara tidak langsung akan mengganggu ketahanan atau stabilitas negara (Arisanti, 2008). Oleh karena itu pemerintah daerah di tiap negara berjuang keras untuk mengatasi masalah kemiskinan dengan beragam kebijakan-kebijakan, termasuk daerah-daerah di Indonesia. Kutai Timur sebagai salah satu kabupaten di Propinsi Kalimantan Timur juga berjuang untuk mengatasi kemiskinan di daerahnya dengan beragam kebijakan baik nasional maupun lokal antara lain bantuan langsung tunai (BLT), pelayanan kesehatan adiwtalks.wordpress.com

Upload: adi-wijaya

Post on 29-Jul-2015

672 views

Category:

Documents


3 download

DESCRIPTION

Poverty is one of the complicated problems in Indonesia and many countries. In Indonesia especially in East Kutai Regency, the government has published many policies to press the poverty rate. However, poverty is not only about people but also about related to surrounding areas like village. Therefore, this research uses clustering analysis method to find how many clusters will be produced by this method and how many villages that be included in each cluster. The different methods used in this research are non-hierarchical method with k-means clustering analysis and hierarchical method with centroid linkage method using Minkowski distance measure . The results show that the number of clusters of villages in East Kutai is two clusters with different members of each cluster of each method.

TRANSCRIPT

Page 1: ANALISIS PENGELOMPOKAN DESA TERTINGGAL DI KABUPATEN KUTAI TIMUR DENGAN PENDEKATAN METODE K-MEANS DAN CENTROID LINKAGE (Minkowski Distance Measure)

1

ANALISIS PENGELOMPOKAN DESA TERTINGGAL

DI KABUPATEN KUTAI TIMUR DENGAN

PENDEKATAN METODE K-MEANS DAN CENTROID LINKAGE

(Minkowski Distance Measure)

[makalah]

Adi Wijaya1

[email protected] NRP. 1310201720

1Mahasiswa Program Pascasarjana, Jurusan Statistika, Fakultas MIPA, Institut Teknologi Sepuluh Nopember, Surabaya

Abstract

Poverty is one of the complicated problems in Indonesia and many countries. In Indonesia especially in East Kutai Regency, the government has published many policies to press the poverty rate. However, poverty is not only about people but also about related to surrounding areas like village. Therefore, this research uses clustering analysis method to find how many clusters will be produced by this method and how many villages that be included in each cluster. The different methods used in this research are non-hierarchical method with k-means clustering analysis and hierarchical method with centroid linkage method using Minkowski distance measure . The results show that the number of clusters of villages in East Kutai is two clusters with different members of each cluster of each method. Keywords: poverty, villages, k-means clustering, centroid linkage, Minkowski distance

1. Pendahuluan

Salah satu masalah utama saat ini baik di negara-negara miskin, berkembang

maupun di negara-negara maju adalah kemiskinan. Kemiskinan merupakan awal dari

timbulnya masalah-masalah sosial lainnya yang terkait erat dengan kualitas

pendidikan, kriminalitas, kelaparan dsb yang secara tidak langsung akan mengganggu

ketahanan atau stabilitas negara (Arisanti, 2008). Oleh karena itu pemerintah daerah

di tiap negara berjuang keras untuk mengatasi masalah kemiskinan dengan beragam

kebijakan-kebijakan, termasuk daerah-daerah di Indonesia.

Kutai Timur sebagai salah satu kabupaten di Propinsi Kalimantan Timur juga

berjuang untuk mengatasi kemiskinan di daerahnya dengan beragam kebijakan baik

nasional maupun lokal antara lain bantuan langsung tunai (BLT), pelayanan kesehatan

adiw

talks

.word

press

.com

Page 2: ANALISIS PENGELOMPOKAN DESA TERTINGGAL DI KABUPATEN KUTAI TIMUR DENGAN PENDEKATAN METODE K-MEANS DAN CENTROID LINKAGE (Minkowski Distance Measure)

2

gratis (JAMKESMAS), pendidikan gratis dsb. Selain itu pembangunan sarana-sarana

penunjang kebijakan-kebijakan tersebut juga ditingkatkan baik dari segi jumlah

maupun kualitas di berbagai lini dari desa, kecamatan hingga tingkat kabupaten (BPS,

2009).

Salah satu langkah awal memerangi kemiskinan adalah dengan mengetahui

kantong-kantong kemiskinan di Kabupaten Kutai Timur. Kantong-kantong

kemiskinan ini merupakan kelompok desa-desa yang memiliki kedekatan karakteristik

sarana dan kemiripan dalam nilai-nilai sejumlah variabel sehingga didefinisikan

sebagai desa tertinggal. Dengan mengetahui secara geografis desa-desa yang

mengalami ketertinggalan, diharapkan akan lahir kebijakan-kebijakan yang tepat

sasaran dan efektif dalam memerangi kemiskinan di Kutai Timur.

Badan Pusat Statistik telah melakukan perhitungan skor desa tertinggal sejak

1993 sebagai penentu identifikasi daerah kantong-kantong kemiskinan melalui data

Potensi Desa. Akan tetapi untuk mengklasifikasian tertinggal tidaknya suatu desa,

dilakukan oleh Kementerian Pembangunan Daerah Tertinggal berdasarkan pada nilai

skor yang diperoleh setiap desa. Metode yang digunakan BPS dalam menentukan

skor desa adalah dengan nilai indeks komposit ketertinggalan desa yang merupakan

rata-rata dari jumlah skor kondisi desa berdasarkan faktor alam/lingkungan, faktor

kelembagaan, keterbatasan sarana prasarana dan akses serta faktor sosial ekonomi

penduduk. Kemudian Kementerian Pembangunan Daerah Tertinggal menetapkan

desa-desa yang memiliki skor terkecil sebagai desa tertinggal dalam suatu kabupaten.

Supaya penetapan desa tertinggal lebih valid, maka dilakukanlah proses klarifikasi

ulang kepada pihak kabupaten yang bersangkutan.

Metode scoring dengan tanpa memperhitungkan faktor jarak atau kedekatan

karakteristik antar wilayah memiliki beberapa kelemahan yaitu tidak tertangkapnya

perbedaan kondisi geografis dan sosilogis antar wilayah, sehingga menghasilkan

pengklasifikasian yang tidak tepat (Widyasthika, 2005).

Oleh karena itu perlu dilakukan sebuah penelitian yang menggunakan metode

dengan memperhitungkan faktor jarak kedekatan antar desa. Sehingga diperoleh

pengelompokan desa tertinggal yang tepat dan akurat. Salah satu metode yang cukup

populer untuk menjawab permasalahan ini adalah clustering.

Metode clustering merupakan suatu metode untuk mengelompokkan individu

atau unit penelitian ke dalam beberapa kelompok dimana setiap unit penelitian dalam

suatu kelompok akan mempunyai ciri yang relatif sama sedangkan antar kelompok

adiw

talks

.word

press

.com

Page 3: ANALISIS PENGELOMPOKAN DESA TERTINGGAL DI KABUPATEN KUTAI TIMUR DENGAN PENDEKATAN METODE K-MEANS DAN CENTROID LINKAGE (Minkowski Distance Measure)

3

unit pengamatan memiliki sifat yang berbeda. Pada penelitian ini, akan digunakan

pendekatan hierarchical method yaitu metode centroid linkage dengan menggunakan

ukuran jarak Minkowski. Selain itu, untuk mendapatkan keterbandingan dengan

metode yang lain akan digunakan non-hierarchical method yaitu metode k-means

cluster analysis.

Diharapkan penggunaan metode cluster ini mampu mengklasifikasikan desa-

desa tertinggal dengan baik, sehingga diperoleh suatu kesimpulan dan keputusan yang

dapat dijadikan salah satu rujukan dalam program pengentasan kemiskinan yang tepat

sasaran melalui program di desa-desa tertinggal di Kabupaten Kutai Timur.

2. Tinjauan Pustaka

2.1 Analisis Faktor

Analisis faktor merupakan suatu metode yang dapat digunakan untuk

mereduksi data dari banyak variabel menjadi variabel yang lebih sedikit (Supranto,

2004). Analisis faktor adalah sebuah kelas prosedur yang digunakan untuk mereduksi

data dan perangkuman data. Dalam beberapa penelitian, dijumpai banyak variabel

yang akan digunakan dalam pemodelan dan perlunya mereduksi jumlah variabel-

variabel tersebut pada tahap yang dapat dikelola sehingga lebih menyederhanakan

variabel-variabel penelitian dari sisi jumlah variabel.

Menurut Jhonson dan Wichern (1992) beberapa manfaat analisis faktor

diantaranya adalah:

1. Untuk meneliti keterkaitan peubah-peubah dalam satu set data

2. Untuk menyederhanakan deskripsi dari suatu set data yang banyak

dan saling berkorelasi menjadi set data lain yang ringkas dan tidak lagi saling

berkorelasi

2.1. Metode Cluster

. Analisis cluster merupakan analisis yang bertujuan untuk

mengelompokkan unit penelitian ke dalam beberapa kelompok dimana setiap unit

penelitian dalam suatu kelompok akan mempunyai ciri yang relatif sama sedangkan

antar kelompok unit pengamatan memiliki sifat yang berbeda (Rencher, 2002).

Metode cluster yang akan digunakan dalam penelitian ini adalah sebagai berikut:

1. Hierarchical Method (Centroid Linkage method)

Tujuan utama penggunaan metode ini adalah apabila jumlah kelompok yang

adiw

talks

.word

press

.com

Page 4: ANALISIS PENGELOMPOKAN DESA TERTINGGAL DI KABUPATEN KUTAI TIMUR DENGAN PENDEKATAN METODE K-MEANS DAN CENTROID LINKAGE (Minkowski Distance Measure)

4

diinginkan tidak diketahui. Metode ini memulai pengelompokkan pada unit penelitian

yang mempunyai kesamaan karakteristik terdekat yang dianalogikan dengan jarak.

Proses dilanjutkan dengan unit penelitian lainnya dengan pertimbangan sama

sepert i proses sebelumnya yaitu unit penelit ian yang memiliki kesamaan

karakteristik terdekat berikutnya, proses yang sama dilakukan hingga ada tingkatan

c u k u p jelas antar unit penelitian dari yang paling mirip sampai yang paling tidak

mirip, sehingga pada akhirnya akan membentuk hanya satu kelompok. Pada

pengelompokan Hierarki terdapat beberapa jenis metode antara lain between-groups

linkage, within-groups linkage, nearest neighbor, furthest neighbor, centroid linkage

clustering, median clustering dan Ward's method. Metode clustering yang digunakan

dalam penelitian ini adalah metode centroid linkage.

Penentuan ukuran interval yang digunakan dalam penelitian ini adalah jarak

Minkowski yaitu akar m dari penjumlahan pangkat m dari selisih antara nilai-nilai

variabel dari dua unit penelitian yang berbeda. Minkowski distance antara dua unit

penelitian misalkan X dan Y dapat dirumuskan sebagai berikut:

𝑑𝑖𝑠𝑡𝑎𝑛𝑐𝑒(𝑋,𝑌) = [∑ (𝑋𝑖 − 𝑌𝑖)𝑚𝑛𝑖=1 ]1/𝑚 , dimana n adalah jumlah variabel.

Untuk m = 1, d(x,y) mengukur jarak “city-block” antara dua titik dalam p-dimensi;

untuk m = 2 , d(x,y) menjadi jarak Euclidian.

Centroid linkage clustering adalah proses pengelompokan yang didasarkan

pada jarak antar centroidnya. Metode ini sangat tepat jika digunakan untuk

memperkecil variance within cluster karena melibatkan centroid pada saat

penggabungan antar cluster. Metode ini juga baik untuk data yang mengandung

outlier (Ardiyanto, 2007).

Pada metode ini ukuran ketidakmiripan yang digunakan adalah:

𝑑𝑘(𝑦) =𝑛𝑖

𝑛𝑖 + 𝑛𝑗𝑑𝑘𝑖 +

𝑛𝑗𝑛𝑖 + 𝑛𝑗

𝑑𝑘𝑗 −𝑛𝑖 + 𝑛𝑗𝑛𝑖 + 𝑛𝑗

𝑑

dimana,

ni = banyaknya unit penelitian dalam cluster i

nj = banyaknya unit penelitian dalam cluster j

nk = banyaknya unit penelitian dalam cluster k

2. Non Hierarchical Method (K-means clustering)

Menurut MacQueen (1967), metode ini dimulai dengan menentukan jumlah

cluster terlebih dahulu yang diinginkan misalkan c cluster. Langkah berikutnya

adalah K-Means, dengan langkah-langkah sebagai berikut:

adiw

talks

.word

press

.com

Page 5: ANALISIS PENGELOMPOKAN DESA TERTINGGAL DI KABUPATEN KUTAI TIMUR DENGAN PENDEKATAN METODE K-MEANS DAN CENTROID LINKAGE (Minkowski Distance Measure)

5

a. Mempartisi objek menjadi sejumlah c initial cluster, kemudian dihitung nilai

rata-rata (centroid) untuk masing-masing kelompok cluster yang ada

b. Memasukkan unit-unit penelitian pada cluster yang memiliki centroid terdekat

(dihitung dari jaraknya). Kemudian hitung kembali centroid untuk masing-

masing cluster yang mengalami perubahan anggotanya (unit penelitian)

c. Ulangi langkah (b ) sampai diperoleh cluster yang tidak berubah-ubah lagi

atau stabil

2.3 Analisis Diskriminan

Tujuan dari analisis diskriminan adalah untuk menggambarkan ciri-ciri suatu

pengamatan dari bermacam-macam populasi yang diketahui, baik secara grafis

maupun aljabar dengan membentuk fungsi diskriminan (Johnson dan Wichern, 2002).

Analisis diskriminan digunakan untuk menganalisis variabel dependen yang bersifat

kategoris dan variabel independen bersifat interval. Adapun tujuan dilakukannya

analisis diskriminan diantaranya adalah:

1. Pengembangan fungsi diskriminan atau kombinasi linier prediktor atau

variabel independen akan mendiskriminasikan yang terbaik antara kategori-

kategori variabel dependen.

2. Pengujian apakah terdapat perbedaan signifikan diantara kelompok-kelompok

dalam hal variabel independen.

3. Penentuan variabel independen mana yang memberikan sumbangan terbesar

terhadap perbedaan kelompok.

4. Pengklasifikasian kasus-kasus ke dalam kelompok berdasarkan nilainilai

variabel independen.

5. Evaluasi akurasi klasifikasi.

2.2 Konsep dan Definisi

Desa tertinggal adalah desa-desa yang kondisinya relatif tertinggal dari desa-

desa lainnya. Kemajuan atau ketertinggalan suatu desa dicerminkan oleh indikator

utama, yaitu tinggi rendahnya rata-rata pengeluaran perkapita penduduk desa (BPS,

2003).

Menurut Sumaryadi dalam Widhyast ika (1997), desa tertinggal dicirikan

sebagai desa dengan potensi sumber daya alam yang terbatas, prasarana dan sarana

pelayanan dasar yang tidak lengkap, serta kelembagaan sosial ekonomi yang

adiw

talks

.word

press

.com

Page 6: ANALISIS PENGELOMPOKAN DESA TERTINGGAL DI KABUPATEN KUTAI TIMUR DENGAN PENDEKATAN METODE K-MEANS DAN CENTROID LINKAGE (Minkowski Distance Measure)

6

belum berkembang. Desa miskin tidak memberikan sumber penghidupan yang

memadai kepada penduduk yang tinggal di dalamnya.

3. Metodologi

3.1 Sumber Data

Data yang digunakan dalam penelitian ini adalah data Potensi Desa Kabupaten

Kutai Timur, Propinsi Kalimantan Timur tahun 2008. Secara keseluruhan data yang

digunakan merupakan data cross section dengan unit observasi sejumlah 135 desa

tanpa dibedakan antara rural dan urban. Sedangkan variabel yang digunakan sebagai

dasar clustering pada penelitian ini adalah karakteristik dari desa yaitu: persentase

keluarga yang memiliki listrik (PLN), persentase keluarga yang tinggal di bantaran

sungai, persentase keluarga yang tinggal di pemukiman kumuh, persentase keluarga

penerima askeskin dan persentase keluarga yang berlangganan telepon kabel.

3.2 Metode Analisis

Langkah-langkah analisis yang dilakukan pada penelitian ini adalah sebagai berikut.

1. Menentukan jumlah cluster yang ingin dibentuk yaitu dua cluster desa

tertinggal dan bukan desa tertinggal

2. Analisis faktor terhadap variabel-variabel yang akan digunakan sebagai dasar

clustering

3. Analisis cluster dengan menggunakan Hierarchical Method (Centroid

Linkage) dengan menggunakan semua variabel asal dan menggunakan hasil

dari analisis faktor (2)

4. Analisis cluster dengan menggunakan non-Hierarchical Method (K-means)

dengan menggunakan semua variabel asal dan menggunakan hasil dari

analisis faktor (2)

5. Analisis perbandingan efektifitas hasil cluster antara metode (3) dan (4)

dengan analisis diskriminan

6. Interpretasi dan kesimpulan

4. Hasil dan Pembahasan

4.1 Analisis Faktor

Analisis Faktor dianggap cukup berarti apabila nilai akar cirinya (eigen value)

lebih dari 1. Semakin besar nilai akar ciri, maka semakin besar pula persentase

adiw

talks

.word

press

.com

Page 7: ANALISIS PENGELOMPOKAN DESA TERTINGGAL DI KABUPATEN KUTAI TIMUR DENGAN PENDEKATAN METODE K-MEANS DAN CENTROID LINKAGE (Minkowski Distance Measure)

7

keragaman yang diterangkan oleh masing-masing komponen, sehingga akar ciri

tersusun dari nilai tetinggi sampai nilai terendah.

Tabel 1. Output Analisis Faktor

Component

Initial Eigenvalues

Total % of Variance Cumulative %

1 1.350 26.990 26.990

2 1.265 25.304 52.295

3 .916 18.324 70.619

4 .825 16.499 87.118

5 .644 12.882 100.000

Dari hasil pengolahan dengan menggunakan bantuan software SPSS dapat

diketahui bahwa terdapat dua faktor dengan nilai eigen value yang lebih dari 1.

Dengan kata lain, dari variabel-variabel yang digunakan sebagai dasar clustering

terbentuk dua faktor. Faktor yang terbentuk ini kemudian akan dilakukan analisis

cluster lanjutan untuk dibandingkan dengan analisis cluster tanpa menggunakan

analisis faktor (dengan menggunakan semua variabel).

4.2 Analisis Cluster

Perbedaan hasil pengelompokan desa antar kedua metode adalah pada

penentuan jumlah cluster. Pada metode hierarki, penentuan atau pemilihan jumlah

cluster dilakukan proses clustering selesai dengan kata lain jumlah cluster tidak dapat

diketahui sebelumnya, yang hasilnya diserahkan sepenuhnya pada peneliti dengan

mengedepankan subyektifitas sesuai dengan tujuan penelitian. Hal ini mengakibatkan

cluster yang terbentuk bisa saja sejumlah 4, 5, 3 atau 2 terkait subyektifitas peneliti.

Sedangkan pada metode non-hierarki, penentuan atau pemilihan jumlah cluster sudah

harus ditentukan di awal sebelum proses clustering berjalan, sehingga hasil

akhirnyapun akan terbentuk jumlah cluster yang sama. Penentuan ini menuntut

kehati-hatian, pengetahuan, informasi memadai dan intuisi yang cukup tinggi dari

peneliti.

Dari hasil pengolahan data dengan menggunakan hierarchical method

(centroid linkage) dengan atau tanpa menggunakan analisis faktor terlihat bahwa

baik dengan tiga atau dua cluster yang ingin dibentuk, jumlah desa yang masuk ke

adiw

talks

.word

press

.com

Page 8: ANALISIS PENGELOMPOKAN DESA TERTINGGAL DI KABUPATEN KUTAI TIMUR DENGAN PENDEKATAN METODE K-MEANS DAN CENTROID LINKAGE (Minkowski Distance Measure)

8

dalam masing-masing cluster tidak begitu jauh berbeda.

Tabel 2. Perbandingan hasil pengelompokan desa di Kabupaten Kutai Timur dengan

menggunakan metode centroid linkage (minkowski distance measure) dengan dan tanpa analisis faktor

Jumlah

Cluster yang terbentuk

Cluster ke- centroid tanpa analisis faktor

(desa)

centroid dengan analisis faktor

(desa)

2 Cluster 1 134 132

2 1 3 3 Cluster 1 132 126

2 1 3

3 2 6 4 cluster 1 35 131

2 91 1

3 3 1

4 6 2

Sedangkan dari hasil pengolahan data dengan menggunakan non-hierarchical

method (K-means) dengan atau tanpa menggunakan analisis faktor terlihat bahwa

baik dengan tiga atau dua cluster yang ingin dibentuk, jumlah desa yang masuk ke

dalam masing-masing cluster sangat bervariasi, ketika cluster yang dibentuk berubah

maka sususan pengelompokan menjadi berubah lagi.

Tabel 3.

Perbandingan hasil pengelompokan desa di Kabupaten Kutai Timur dengan menggunakan metode K-means dengan dan tanpa analisis faktor

Jumlah

Cluster yang terbentuk

Cluster ke- K-means tanpa analisis faktor

(desa)

K-means dengan analisis faktor

(desa)

2 Cluster 1 28 101

2 107 34

3 Cluster 1 6 12

2 16 34

3 113 89

4 Cluster 1 10 2

2 34 108

3 9 9

4 82 16

adiw

talks

.word

press

.com

Page 9: ANALISIS PENGELOMPOKAN DESA TERTINGGAL DI KABUPATEN KUTAI TIMUR DENGAN PENDEKATAN METODE K-MEANS DAN CENTROID LINKAGE (Minkowski Distance Measure)

9

4.2 Analisis Diskriminan

Tepat tidaknya hasil pengelompokan baik melalui metode hierarki maupun

non-hierarko dapat didekati dengan analisis diskriminan. Dimana, semakin banyak

anggota cluster yang tepat diprediksikan maka akan semakin tinggi tingkat

akurasinya. Hal ini menandakan bahwa hasil pengelompokan akan semakin baik.

Dari hasil pengolahan data dengan menggunakan analisis diskriminan terlihat

tingkat akurasi yang dihasilkan hierarchical clustering method(centroid linkage)

dan non-hierarchical clustering method (k-means) dengan atau tanpa menggunakan

analisis faktor sebagai berikut:

Tabel 4. Perbandingan akurasi hasil pengelompokan desa di Kabupaten Kutai Timur

dengan menggunakan metode centroid linkage (minkowski distance measure) dan K-means dengan dan tanpa analisis faktor

Tingkat Akurasi (%)

2 Cluster 3 Cluster 4 cluster

centroid tanpa analisis faktor 98,5 98,5 98,5

centroid dengan analisis faktor 100 97,5 95,6

K-means tanpa analisis faktor 100 100 100

K-means dengan analisis faktor 100 100 100

5. Kesimpulan

Dari hasil pembahasan di atas dapat disimpulkan bahwa

1. Pengelompokan desa dengan hierarchical method (centroid linkage) dengan

atau tanpa menggunakan analisis faktor terlihat bahwa baik dengan tiga atau

dua cluster yang ingin dibentuk, jumlah desa yang masuk ke dalam masing-

masing cluster tidak begitu jauh berbeda.

2. Dengan menggunakan analisis diskriminan terlihat tingkat akurasi yang

dihasilkan hierarchical clustering method (centroid linkage) dan non-

adiw

talks

.word

press

.com

Page 10: ANALISIS PENGELOMPOKAN DESA TERTINGGAL DI KABUPATEN KUTAI TIMUR DENGAN PENDEKATAN METODE K-MEANS DAN CENTROID LINKAGE (Minkowski Distance Measure)

10

hierarchical clustering method (k-means) dengan atau tanpa menggunakan

analisis faktor hampir sama-sama menghasilkan tingkat akurasi yang cukup

tinggi khususnya metode k-means dengan maupun tanpa analisis faktor

3. Perbedaan antar metode hierarki dan non-hierarki terletak pada penentuan

jumlah cluster yang terbentuk, metode hierarki setelah proses clustering

sedangkan pada metode non-hierarki sebelum proses clustering

Daftar Pustaka

Ardyanto, Fendy (2007), “Gambaran Karakterist Tahun 2005”. ik Rumah Tangga Miskin di Indonesia dan Pengelompokannya”. Skripsi. Jakarta: Sekolah Tinggi Ilmu Statistik (STIS). Arisanti, Restu. (2011), “Model Regresi Spasial Untuk Deteksi Faktor-faktor Kemiskinan di Provinsi Jawa Timur”. Tesis. Bogor: Institut Pertanian Bogor (IPB). [BPS] Badan Pusat Statistik. 2009. Kutai Timur Dalam Angka. Kutai Timur: Badan Pusat Statistik. MacQueen, J.B. 1967. Some Methods for Classification and Analysis of Multivariate Observations Hierarchical Grouping to Optimize an Objective Function. Berkeley: University of California Press A967 Rencher, Alvin C. 2000. Methods of Multivariate Analysis:2nd edition. England: Jhon Willey & Sons Ltd Widyasthika, Hayu Fadlun (2005), “Evaluasi Pengklasifikasian Desa Tertinggal Kabupaten Purworejo Tahun 2005”. Skripsi. Jakarta: Sekolah Tinggi Ilmu Statistik (STIS). Ward, J.H. 1963. Hierarchical Grouping to Optimize an Objective Function. Journal of the American Statistical Association. Vol. 58, 236-244. W. Wichern Dean, Richard A.Johnson. 2002. Applied Multivariate Statistical Analysis. USA : Prentice-Hall, Inc. Supranto J. 2004. Analisis Multivariat Arti dan Interpretasi. Jakarta: Rineka Cipta

[email protected]

adiw

talks

.word

press

.com

Page 11: ANALISIS PENGELOMPOKAN DESA TERTINGGAL DI KABUPATEN KUTAI TIMUR DENGAN PENDEKATAN METODE K-MEANS DAN CENTROID LINKAGE (Minkowski Distance Measure)

11

Ilustrasi pengelompokan cluster dengan menggunakan centroid linkage method dengan menggunakan jarak minkowski

Masing-masing kelompok diganti dengan nilai rata-rata unit penelitian,

misalkan sebagai contoh, untuk cluster pertama dibentuk dengan mengkombinasikan

unit penelitian A1 dan A2 yang digambarkan dengan centroid dari A1 dan A2. Cluster

pertama memiliki rata-rata 5,5 variabel X1, rata-rata 5,5 variabel X2 begitu juga

dengan variabel X3.

Saat jarak antar unit penelitian menujukkan nilai yang paling kecil, maka

kedua unit penelitian digabung menjadi 1 cluster dst. Kemiripan sebagai dasar

pembentukan cluster ini menggunakan jarak minkowski.

Hasil pengelompokannya dapat dilihat pada tabel berikut:

Data untuk lima cluster

Jumlah cluster Anggota cluster Variabel X1 Variabel X2 Variabel X3

1 A1&A2 5.5 5.5 5,5

2 A3 15 14 14

3 A4 16 15 15

4 A5 25 20 20

5 A6 30 19 19

Matriks kemiripan (minkowski distance)

A1&A2 A3 A4 A5 A6

A1&A2 0

A3 162.5 0

A4 200,5 2 0

A5 590,5 135.96 106 0

A6 782,5 250 212 26 0

adiw

talks

.word

press

.com

Page 12: ANALISIS PENGELOMPOKAN DESA TERTINGGAL DI KABUPATEN KUTAI TIMUR DENGAN PENDEKATAN METODE K-MEANS DAN CENTROID LINKAGE (Minkowski Distance Measure)

12

Data untuk empat cluster

Jumlah cluster Anggota cluster Variabel X1 Variabel X2 Variabel X3

1 A1&A2 5.5 5.5 5.5

2 A3&A4 15.5 14.5 14.5

3 A5 25 20 20

4 A6 30 19 19

Matriks kemiripan (minkowski distance)

A1&A2 A3&A4 A5 A6

A1&A2 0

A3&A4 181 0

A5 590,5 120.5 0

A6 782,5 230.5 26 0

Data untuk tiga cluster

Jumlah Cluster Anggota cluster Variabel X1 Variabel X2 Variabel X3

1 A1&A2 5.5 5.5 5.5

2 A3&A4 15.5 14.5 14.5

3 A5&A6 27.5 19.5 19.5

Matriks kemiripan (minkowski distance)

A1&A2 A3&A4 A5&A6

A1&A2 0

A3&A4 181 0

A5&A6 680 169 0

Proses ini berlanjut hinga terbentuk hanya 1 cluster.

adiw

talks

.word

press

.com