integrasi self organizing maps dan algoritme k … · iii iii abstract . ulfa khaira. integration...
TRANSCRIPT
i
DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2012
INTEGRASI SELF ORGANIZING MAPS DAN ALGORITME
K-MEANS UNTUK CLUSTERING DATA KETAHANAN PANGAN
KABUPATEN DI WILAYAH PROVINSI BALI, NUSA TENGGARA
BARAT, DAN NUSA TENGGARA TIMUR
ULFA KHAIRA
ii
ii
DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2012
INTEGRASI SELF ORGANIZING MAPS DAN ALGORITME
K-MEANS UNTUK CLUSTERING DATA KETAHANAN PANGAN
KABUPATEN DI WILAYAH PROVINSI BALI, NUSA TENGGARA
BARAT, DAN NUSA TENGGARA TIMUR
ULFA KHAIRA
Skripsi
sebagai salah satu syarat untuk memperoleh gelar
Sarjana Komputer pada
Departemen Ilmu Komputer
iii
iii
ABSTRACT
ULFA KHAIRA. Integration of Self Organizing Maps and K-means Algorithm for Food Security
Cluster in Region Province of Bali, Nusa Tenggara Barat, and Nusa Tenggara Timur. Supervised
by ANNISA.
The assessment of food security as a measure of development is very important. Food
security in a region has multidimentional characteristics that need to be analyzed. The purpose of this research is to implement the S-K algorithm (combination of Self organizing maps -SOM- and
K-means algorithm) for data clustering and to gain data characteristics as the result of data
clustering. The used data is the indicator for the food security from 30 districts in the provinces of
Bali, Nusa Tenggara Barat, and Nusa Tenggara Timur. These data are the input for S-K algorithm.
SOM clustering result is validated using Davies-Bouldin Index (DBI). Centroid and the number of
cluster from SOM are utilized as the input for K-means algorithm, which is used to refine the final
cluster. In this research, these data are also clustered by K-means algorithm with randomly
generated initial centroids. The value of DBI results of SOM, S-K, K-means clustering has been
compared and it is found that S-K algorithm has the minimum value of DBI. Thus, it is proved that
the S-K algorithm gives good clustering results. Based on the data analysis, the districts in the
Province of Nusa Tenggara Timur are categorized as the areas with food insecurity. Meanwhile, the districts in the Province of Nusa Tenggara Barat are included in the relatively food insecurity
areas. Food security in all districts in the Province of Bali are satisfactory.
Keywords: Davies-Bouldin Index, Food Security, K-means, Self Organizing Maps
iv
iv
Judul Skripsi : Integrasi Self Organizing Maps dan Algoritme K-means untuk Clustering Data
Ketahanan Pangan Kabupaten di Wilayah Provinsi Bali, Nusa Tenggara Barat,
dan Nusa Tenggara Timur
Nama : Ulfa Khaira
NIM : G64080064
Menyetujui:
Pembimbing,
Annisa, S.Kom, M.Kom
NIP 19790731 200501 2 002
Mengetahui:
Ketua Departemen Ilmu Komputer
Dr. Ir. Agus Buono, M.Si, M.Kom
NIP. 19660702 199302 1 001
Tanggal Lulus:
v
v
KATA PENGANTAR
Alhamdulillaahirabbil ‘aalamiin, rasa syukur penulis ucapkan kepada Allah Subhanahu wa
Ta’ala atas segala curahan rahmat dan karunia-Nya sehingga penulis dapat menyelesaikan tugas
akhir yang berjudul Integrasi Self Organizing Maps dan Algoritme K-means untuk Clustering Data
Ketahanan Pangan Kabupaten di Wilayah Provinsi Bali, Nusa Tenggara Barat, dan Nusa Tenggara
Timur. Sholawat dan salam semoga senantiasa tercurah kepada Nabi Muhammad Shallallahu a’laihi wasallam, keluarganya, para sahabat, serta para pengikutnya.
Terima kasih kepada kedua orang tua tercinta, Ayahanda Drs. H. M. Saman Sulaiman, M.A
dan Ibunda Hj. Darniati yang sampai detik ini selalu memberikan dukungan, semangat, doa, dan
curahan kasih sayang yang tiada terhingga, begitu juga dengan kedua adik penulis, Atar Satria
Fikri dan Zahratirizka yang menjadi penyemangat bagi penulis untuk selalu melakukan yang
terbaik. Serta keluarga besar penulis di Jambi terima kasih atas segala doa dan perhatiannya.
Penulis mengucapkan terima kasih kepada Ibu Annisa, S.Kom, M.Kom selaku pembimbing
yang dengan sabar membimbing serta memberikan masukan kepada penulis. Terima kasih juga
penulis sampaikan kepada Bapak Hari Agung Adrianto, S.Kom, M.Si dan Bapak Azis Kustiyo,
S.Si, M.Kom selaku penguji yang telah banyak memberikan masukan dan perbaikan dalam
menyempurnakan tugas akhir ini.
Penyelesaian penelitian ini tidak terlepas dari dukungan dan bantuan berbagai pihak, oleh
karena itu penulis ingin mengucapkan terima kasih kepada:
1 Mrs.Coco Ushimaya, Bapak Dedi Junadi, dan seluruh staf United Nations World Food
Programme (WFP) Indonesia yang telah membantu dalam penyediaan data ketahanan
pangan.
2 Teman-teman satu bimbingan: Fahrul, Norma, Muti, Hutomo, Stefanus, Delki, dan Zico
atas bantuan, dukungan, serta motivasi yang selalu diberikan.
3 Teman-teman yang selalu sabar ditanyai oleh penulis, senantiasa berbagi ilmu, membantu,
dan mengajarkan penulis dalam proses menyelesaikan tugas akhir, yaitu: Isnan Mulia, Indra
Lesmana, dan Wangi Saraswati.
4 Vininta Ayudiana, Kurnia Nuraeni, Mayanda Mega, serta teman-teman seperjuangan Ilmu
Komputer angkatan 45 atas segala bantuan, dukungan, dan kenangan bagi penulis selama menjalani masa studi.
5 Teman-teman kostan SQ: Hana M, Fitra, Kak Dayu, Kak Mumpuni, Kak Septi, Nurul,
Mita, Hana A, Orin, Anni, Fida, Lina, Nia, dan Lia atas segala dukungan untuk segera
menyelesaikan tugas akhir ini.
6 Saudara seperantauan Himpunan Mahasiswa Jambi (HIMAJA) terima kasih atas segala
bantuan, perhatian, dan semangat yang diberikan. Semoga kita bisa memajukan dan
membangun Provinsi Jambi dengan ilmu yang kita dapatkan selama studi di IPB.
7 Suyitno, A.Md dan teman-teman Galaxy: Kak Agung, Uni Romi, Mba Dina, dan Mba
Septy atas perhatian, nasihat, serta motivasi yang selalu diberikan. Semoga Allah
Subhanahu wa Ta’ala selalu menyambungkan tali silaturahim ini.
8 Seluruh staf dan karyawan Departemen Ilmu Komputer, serta pihak lain yang telah membantu dalam menyelesaikan penelitian ini.
Penulis menyadari bahwa penulisan tugas akhir ini masih jauh dari sempurna karena
keterbatasan pengalaman dan pengetahuan yang dimiliki penulis. Segala kesempurnaan hanya
milik Allah Subhanahu wa Ta’ala, semoga tulisan ini dapat bermanfaat, Aamin.
Bogor, Desember 2012
Ulfa Khaira
vi
vi
RIWAYAT HIDUP
Ulfa Khaira dilahirkan di Kota Jambi pada tanggal 29 Desember 1989 dari pasangan Bapak Drs. H. M.Saman Sulaiman, M.A dan Ibu Hj. Darniati. Penulis merupakan anak pertama dari tiga
bersaudara. Pada tahun 2008, penulis lulus dari Sekolah Menengah Atas (SMA) Negeri 1 Kota
Jambi dan diterima sebagai mahasiswa di Departemen Ilmu Komputer, Fakultas Matematika dan
Pengetahuan Alam, Institut Pertanian Bogor melalui jalur Undangan Seleksi Masuk IPB (USMI).
Pada tanggal 4 Juli 2011 penulis melaksanakan Praktik Kerja Lapangan di Kementerian
Lingkungan Hidup RI pada sampai dengan tanggal 19 Agustus 2011 di bagian Asisten Deputi
Data dan Informasi. Penulis juga seorang pecinta dunia tulis-menulis, sejak mengenyam
pendidikan di bangku SMP penulis aktif mengisi tulisan di majalah sekolah. Sebagai mahasiswa
perantauan, penulis ikut serta dalam kegiatan organisasi mahasiswa daerah Himpunan Mahasiswa
Jambi (HIMAJA). Penulis pernah menjadi asisten praktikum untuk mata kuliah Penerapan
Komputer pada tahun 2011 di Departemen Ilmu Komputer Institut Pertanian Bogor.
v
DAFTAR ISI
Halaman
DAFTAR TABEL ...................................................................................................................... vi
DAFTAR GAMBAR .................................................................................................................. vi
DAFTAR LAMPIRAN ............................................................................................................... vi
PENDAHULUAN Latar Belakang ........................................................................................................................ 1 Tujuan Penelitian ..................................................................................................................... 1 Ruang Lingkup Penelitian ........................................................................................................ 1
TINJAUAN PUSTAKA
Clustering ............................................................................................................................... 1 Normalisasi z-score ................................................................................................................. 2 Algoritme K-means ................................................................................................................. 2 Self Organizing Maps (SOM)................................................................................................... 2 Algoritme Self Organizing Maps .............................................................................................. 3 Validitas Cluster ...................................................................................................................... 3 Indeks Davies-Bouldin ............................................................................................................ 4 Ketahanan Pangan ................................................................................................................... 4
METODE PENELITIAN
Data Indikator Ketahanan Pangan ............................................................................................ 4 Praproses Data ......................................................................................................................... 4 Data Mining ............................................................................................................................ 4 Representasi Pengetahuan ........................................................................................................ 5 Lingkungan Implementasi ........................................................................................................ 5
HASIL DAN PEMBAHASAN
Data Indikator Ketahanan Pangan ............................................................................................ 5 Praproses Data ......................................................................................................................... 6 Tiga Metode Clustering ........................................................................................................... 6 Penerapan Algoritme SOM ...................................................................................................... 6 Indeks Davies-Bouldin (DBI) .................................................................................................. 6 DBI Terbaik ............................................................................................................................ 6 Clustering dengan Algoritme S-K ............................................................................................ 6 Perbandingan Hasil Clustering ................................................................................................. 7 Deskripsi Hasil Cluster ............................................................................................................ 8
SIMPULAN DAN SARAN
Simpulan ................................................................................................................................. 9 Saran ....................................................................................................................................... 9
DAFTAR PUSTAKA .................................................................................................................. 9
LAMPIRAN .............................................................................................................................. 10
vi
vi
DAFTAR TABEL Halaman
1 Indeks Davies-Bouldin terbaik untuk tiap ukuran cluster ......................................................... 6
2 Banyak anggota masing-masing cluster dengan ukuran cluster 3.............................................. 7
3 Nama anggota pada masing-masing cluster hasil clustering dengan algoritme S-K ................... 7
4 Nama anggota pada masing-masing cluster hasil clustering dengan algoritme SOM ................. 7
5 Nama anggota pada masing-masing cluster hasil clustering dengan algoritme K-means ........... 7
DAFTAR GAMBAR Halaman
1 Ilustrasi lingkungan (Demuth dan Beale 2003)......................................................................... 3
2 Diagram alur penelitian ........................................................................................................... 5
3 Gambar sebaran jumlah anggota berdasarkan provinsi ............................................................. 8
DAFTAR LAMPIRAN Halaman
1 Langkah-langkah clustering dengan algoritme K-means ........................................................ 11
2 Langkah-langkah clustering dengan algoritme SOM .............................................................. 13
3 Langkah perhitungan Indeks Davies-Bouldin ......................................................................... 20
4 Indikator ketahanan pangan ................................................................................................... 22
5 Data indikator ketahanan pangan sebelum dinormalisasi ........................................................ 23
6 Data indikator ketahanan pangan setelah dinormalisasi .......................................................... 26
7 Pengamatan terhadap DBI ..................................................................................................... 29
8 Hasil clustering dari algoritme SOM, K-means, dan S-K ....................................................... 31
9 Bobot optimal dari SOM sebagai initial centroid bagi K-means ............................................. 32
10 Penilaian setiap indikator ...................................................................................................... 33
11 Karakteristik cluster .............................................................................................................. 34
1
PENDAHULUAN
Latar Belakang
Kebijakan peningkatan ketahanan pangan
yang ditetapkan dalam kerangka
pembangunan nasional berimplikasi bahwa
pengkajian ketahanan pangan sebagai tolak ukur keberhasilan pembangunan menjadi
penting. Ketahanan pangan di suatu wilayah
mempunyai sifat multidimensional yang
memerlukan analisis dari berbagai indikator,
tidak hanya produksi dan ketersediaan pangan
saja. Meskipun tidak ada cara spesifik untuk
mengukur ketahanan pangan, kompleksitas
ketahanan pangan dapat disederhanakan
dengan menitikberatkan pada tiga dimensi
yang berbeda namun saling berkaitan yaitu
ketersediaan pangan, akses pangan oleh rumah tangga, dan pemanfaatan pangan oleh
individu.
Pengelompokan daerah berdasarkan
indikator ketahanan pangan sangat penting
dilakukan untuk mengambil kebijakan dalam
hal penentuan sasaran dan memberikan
rekomendasi untuk intervensi kerawanan
pangan di tingkat provinsi dan kabupaten.
Teknik data mining diperlukan untuk
ekstraksi informasi dari data. Clustering
merupakan salah satu metode dalam data
mining untuk mengelompokkan himpunan objek ke dalam kelas-kelas. Pada data mining
baik algoritme k-means dan self organizing
maps (SOM) merupakan proses unsupervised
learning yang penting untuk mendapatkan
pola pada kumpulan data yang tidak berlabel.
SOM tidak dapat menyajikan hasil clustering
yang tepat dan kecepatan konvergensi yang
lambat. Sedangkan K-means bergantung pada
initial centroid, jika terjadi kesalahan pada
pengambilan initial centroid maka hasil
clustering yang terjadi akan berkumpul pada titik yang tidak optimal.
Penelitian ini menggunakan algoritme S-K
(Wang et al. 2010) yang merupakan
kombinasi dari SOM dan K-means untuk
pengelompokan daerah berdasarkan indikator
ketahanan pangan. Pada penelitian Wang
(2010), algoritme S-K memberikan efisiensi
yang baik dan cluster yang akurat. Self
organizing maps digunakan untuk mengetahui
jumlah cluster dan initial centroid yang
digunakan sebagai input untuk k-means,
selanjutnya, akan dihasilkan clustering terbaik dari metode k-means (Kuo et al. 2001).
Tujuan Penelitian
Tujuan dari penelitian ini yaitu:
1 Menerapkan algoritme S-K untuk
clustering ketahanan pangan.
2 Memperoleh karakteristik data ketahanan
pangan kabupaten di wilayah Provinsi
Bali, Nusa Tenggara Barat, dan Nusa
Tenggara Timur.
Ruang Lingkup Penelitian
Penelitian ini dibatasi pada penggunaan
teknik clustering dengan metode self-organizing maps (SOM) dan k-means. Data
yang digunakan adalah data indikator
ketahanan pangan kabupaten di wilayah
Provinsi Bali, Nusa Tenggara Barat, dan Nusa
Tenggara Timur.
TINJAUAN PUSTAKA
Clustering
Clustering adalah pengelompokan dari
record, observasi-observasi atau kasus-kasus
ke kelas yang memiliki kemiripan objek-
objeknya. Cluster adalah koleksi dari record
yang mirip, dan tidak mirip dengan record
dari cluster lain. Clustering berbeda dengan
klasifikasi, dalam hal tidak ada variabel target
untuk clustering. Clustering tidak
mengklasifikasikan, meramalkan, atau
memprediksi nilai dari sebuah variabel target. Algoritme-algoritme clustering digunakan
untuk menentukan segmen keseluruhan
himpunan data menjadi subgroup yang relatif
sama atau cluster, dengan kesamaan record
dalam cluster dimaksimumkan dan kesamaan
record di luar cluster diminimumkan (Larose
2004).
Secara umum metode utama clustering
dapat diklasifikasikan menjadi kategori-
kategori berikut (Han dan Kamber 2006):
Metode partisi. Misalkan ada sebuah basis data berisi n objek. Metode partisi
membangun k partisi pada basis data
tersebut, dengan tiap partisi
merepresentasikan cluster dan k ≤ n.
Partisi yang terbentuk harus memenuhi
syarat yaitu setiap cluster harus berisi
minimal satu objek dan setiap objek harus
termasuk tepat satu cluster.
Metode hirarki, yaitu membuat sebuah
dekomposisi berhirarki dari himpunan
data (atau objek) menggunakan beberapa kriteria. Metode ini memiliki dua jenis
pendekatan yaitu:
2
o Agglomerative, dimulai dengan
titik-titik sebagai cluster
individu. Pada setiap tahap
dilakukan penggabungan setiap
pasangan titik pada cluster
sampai hanya satu titik (atau
cluster) yang tertinggal.
o Divisive, dimulai dengan satu
cluster besar yang berisi semua
titik data.Pada setiap langkah,
dilakukan pemecahan sebuah cluster sampai setiap cluster
berisi sebuah titik (atau terdapat
k cluster).
Metode berdasarkan kepekatan,
merupakan pendekatan yang
berdasarkan pada konektivitas dan
fungsi kepadatan.
Metode berdasarkan grid, merupakan
pendekatan yang berdasarkan pada
struktur multiple-level granularity.
Metode berdasarkan model, yaitu: sebuah model yang dihipotesis untuk
tiap cluster dan ide dasarnya adalah
untuk menemukan model yang cocok
untuk tiap cluster.
Normalisasi z-score
Normalisasi merupakan bagian dari
transformasi data, yaitu atribut diskalakan ke
dalam rentang nilai tertentu yang lebih kecil
seperti -1,0 – 1,0 atau 0,0 – 1,0. Salah satu
teknik normalisasi yang dapat digunakan adalah z-score.
Normalisasi z-score (zero-mean
normalization) merupakan normalisasi
berdasarkan nilai rata-rata dan standar deviasi
dari suatu atribut. Misalkan nilai v merupakan
elemen dari A, Ᾱ adalah rata-rata, dan σA
adalah nilai standar deviasi dari atribut A,
maka nilai v akan ditransformasikan menjadi
v’ dengan fungsi
v' = v-A
σA ...(1)
Normalisasi z-score berguna ketika nilai
aktual dari maksimum dan minimum suatu
atribut tidak diketahui atau ketika outlier
mendominasi pada normalisasi min-max. (Han
dan Kamber 2006).
Algoritme K-means
K-Means merupakan algoritme
clustering yang bersifat partitional yaitu
membagi himpunan objek data ke dalam
sub himpunan (cluster) yang tidak overlap,
sehingga setiap objek data berada tepat
dalam satu cluster. Strategi partitional-
clustering yang paling sering digunakan
adalah berdasarkan kriteria square error.
Secara umum, tujuan kriteria square error
adalah untuk memperoleh partisi (jumlah
cluster tetap) yang meminimalkan total square
error. Misal, diberikan himpunan N objek
data yang telah dipartisi ke dalam K cluster
{C1, C2,…,Ck}. Setiap Ck memiliki nk objek
data dan tepat dalam satu cluster sehingga ∑ nk
= N, dimana k=1,…,K.
Mean vector Mk dari cluster Ck
didefinisikan sebagai centroid dari cluster
(Kantardzic 2003)
Mk = 1nk
xiknk
i=1 ... (2)
dengan 𝑥𝑖𝑘 merupakan objek data ke-i milik
cluster Ck.
Langkah-langkah dalam algoritme K-
means adalah (Kantardzic 2003):
1. Ditentukan initial partion dengan k
cluster berisi sample yang dipilih secara
acak, kemudian dihitung pusat cluster dari
tiap-tiap cluster,
2. Dibangkitkan partisi baru dengan
penugasan setiap sample terhadap pusat
cluster terdekat, 3. Hitung pusat-pusat cluster baru,
4. Ulangi langkah 2 dan 3 sampai nilai
optimum dari fungsi kriteria dipenuhi
(atau sampai cluster membership telah
stabil).
Untuk lebih jelasnya langkah-langkah
clustering dengan algoritme K-means untuk
jumlah cluster 3 dapat dilihat pada Lampiran
1. Hasil cluster dengan metoda K-means
sangat bergantung pada nilai pusat cluster awal
yang diberikan. Pemberian nilai awal yang berbeda bisa menghasilkan hasil cluster yang
berbeda.
Self Organizing Maps (SOM)
Self Organizing Maps (SOM)
diperkenalkan oleh Teuvo Kohonen seorang
ilmuwan Finlandia pada tahun 1982, sehingga
SOM dikenal juga dengan jaringan Kohonen.
SOM merupakan salah satu jaringan syaraf
tiruan yang dikonfigurasi untuk
pengelompokan data. Jaringan SOM Kohonen
menggunakan metode pembelajaran
unsupervised yang proses pelatihannya tidak memerlukan pengawasan (target output).
SOM memperlihatkan tiga karakteristik:
kompetisi yaitu setiap vektor bobot saling
berlomba untuk menjadi simpul pemenang,
3
kooperasi yaitu setiap simpul pemenang
bekerjasama dengan lingkungannya, dan
adaptasi yaitu perubahan simpul pemenang
dan lingkungannya (Larose 2004).
Algoritme Self Organizing Maps
Misalkan himpunan dari m nilai-nilai field
untuk record ke-n menjadi sebuah vektor
input xn = xn1, xn2, xn3,…, xnm, dan himpunan
dari m bobot untuk simpul output tertentu j
menjadi vektor bobot wj= w1j, w2j,…, wmj
(Larose 2004). Langkah-langkah clustering dengan
algoritme SOM dapat dilihat pada Lampiran
2. Secara garis besar langkah-langkah
algoritme SOM (Larose 2004) seperti yang
dijelaskan di bawah ini.
Untuk setiap vektor x, lakukan:
• Kompetisi. Untuk setiap simpul output j,
hitung nilai D(wj,xn) dari fungsi jarak.
Tentukan simpul pemenang j yang
meminimumkan D(wj,xn) dari semua
simpul output. • Kooperasi. Identifikasikan semua simpul
output j dalam lingkungan simpul
pemenang j didefinisikan oleh lingkungan
berukuran R. Untuk simpul-simpul ini,
lakukan:
Adaptasi. Perbarui nilai bobot:
wij,new = wij,current + η( xni – wij,current)
...(3)
Perbarui learning rate (η) dan ukuran
lingkungan R seperlunya.
Hentikan perlakuan ketika kriteria pemberhentian dicapai.
Keterangan:
Inisialisasi nilai bobot biasanya
menggunakan nilai tengah (middle
point/midpoint) atau menggunakan nilai
acak (Demuth dan Beale 2003).
Lingkungan berukuran R berisi indeks dari
semua simpul-simpul yang berada dalam
radius R dari simpul pemenang i*. Ni(d) =
{j,dij ≤ R} (Demuth dan Beale 2003).
Gambar 1 Ilustrasi lingkungan (Demuth dan
Beale 2003)
Gambar 1 mengilustrasikan konsep
lingkungan. Gambar 1 kiri menunjukkan
lingkungan dari radius R=1 sekeliling simpul
13. Gambar 1 kanan menunjukkan lingkungan
dari radius R=2. Topologi lingkungan yang umum digunakan ada tiga yaitu topologi grid,
topologi hexagonal, dan topologi random
(Demuth dan Beale 2003, diacu dalam
Edward 2006).
Fungsi jarak biasanya digunakan jarak
Euclidean
D(wj, xn) = wij-xni i
2 ... (4)
(Demuth dan Beale 2003).
Perubahan tingkat pembelajaran ( LR/α/η) 0 <η<1 ,dengan rumus α(t+1) = θ α(t).
Lambang θ adalah penurunan tingkat
pembelajaran (PLR), menurun seiring
perubahan waktu t (Laurence 1994).
Kriteria pemberhentian bias berupa
pembatasan jumlah iterasi, atau ketika η =
0 (Larose 2004).
Validitas Cluster
Validasi clustering adalah prosedur yang
mengevaluasi hasil analisis cluster secara
kuantitatif dan objektif (Jain dan Dubes 1988).
Terdapat tiga pendekatan untuk
mengeksplorasi validitas cluster:
1. kriteria eksternal, mengevaluasi hasil dari
metode clustering berdasarkan pra-
spesifikasi struktur yang diterima dari
sebuah data yang mencerminkan intuisi
pengguna tentang struktur clustering dari
data, 2. kriteria internal, mengevaluasi hasil
clustering dalam konsep kuantitatif yang
didapat dari data, dan
3. kriteria relatif, membandingkan sebuah
struktur clustering dengan struktur
clustering yang lain yang didapatkan dari
metode clustering yang sama tetapi nilai-
nilai parameternya dimodifikasi (Salazar
et al. 2002).
Untuk memilih skema clustering optimal,
ada dua kriteria (Salazar et al. 2002): 1. Compactness, yaitu anggota dari masing-
masing cluster harus sedekat mungkin
dengan yang lain, dan
2. Separation, yaitu cluster harus terpisah
secara luas dari cluster lain. Indeks
validitas digunakan sebagai metode
validasi cluster untuk evaluasi kuantitatif
dari hasil clustering (Salazar et al.
2002). Beberapa indeks yang biasa digunakan
adalah: Hubert Statistic, Indeks Dun, indeks
Davies-Bouldin, Root-mean-square standard
deviation (RMSSTD), dan R-squared (RS)
(Salazar et al. 2002).
4
Indeks Davies-Bouldin
Pendekatan pengukuran ini untuk
memaksimalkan jarak inter-cluster antara
cluster Ci dan Cj dan pada waktu yang sama
mencoba untuk meminimalkan jarak antar
titik dalam sebuah cluster. Jarak intra-cluster
sc (Qk) dalam cluster Qk ialah:
sc(Qk) =
||𝑋𝑖−𝑖 𝐶𝑘 ||
𝑁𝑘 ...(5)
dengan Nk adalah banyak titik yang termasuk
dalam cluster Qk dan Ck adalah centroid dari
Cluster Qk. Jarak Inter-cluster didefinisikan:
dkl= Ck-Cl ...(6)
dengan Ck dan Cl adalah centroid cluster k dan
cluster l. Di lain pihak, Indeks Davies-
Bouldin didefinisikan:
DB(nc)= 1
nc max
sc Qk +sc(Q
l)
dkl(Qk,Q
l)
nck=l ..(7)
dengan nc adalah banyak cluster. Skema
clustering yang optimal menurut Indeks
Davies-Bouldin ialah yang memiliki Indeks
Davies-Bouldin minimal (Salazar et al. 2002).
Langkah-langkah perhitungan Indeks Davies-
Bouldin disajikan pada Lampiran 3.
Ketahanan Pangan
Dalam undang undang No.7 tahun 1996
tentang pangan, pengertian ketahanan pangan
adalah kondisi terpenuhinya pangan bagi
rumah tangga yang tercermin dari
ketersediaan yang cukup, baik dalam jumlah
maupun mutunya, aman, merata dan
terjangkau. Dari pengertian tersebut, tersirat
bahwa upaya mewujudkan ketahanan pangan nasional harus lebih dipahami sebagai
pemenuhan kondisi-kondisi: (1) terpenuhinya
pangan dengan kondisi ketersediaan yang
cukup, dengan pengertian ketersediaan pangan
dalam arti luas, mencakup pangan yang
berasal dari tanaman, ternak dan ikan dan
memenuhi kebutuhan atas karbohidrat,
vitamin dan mineral serta turunan, yang
bermanfaat bagi pertumbuhan dan kesehatan
manusia, (2) terpenuhinya pangan dengan
kondisi aman, diartikan bebas dari
pencemaran biologis, kimia, dan benda lain yang lain dapat mengganggu, merugikan, dan
membahayakan kesehatan manusia, serta
aman untuk kaidah agama, (3) terpenuhinya
pangan dengan kondisi yang merata, diartikan
bahwa distribusi pangan harus mendukung
tersedianya pangan pada setiap saat dan
merata di seluruh tanah air, (4) terpenuhinya
pangan dengan kondisi terjangkau, diartikan
bahwa pangan mudah diperoleh rumah tangga
dengan harga yang terjangkau.
Ketahanan pangan pada tataran nasional
merupakan kemampuan suatu bangsa untuk
menjamin seluruh penduduknya memperoleh
pangan dalam jumlah yang cukup, mutu yang
layak, aman, dan juga halal, yang didasarkan
pada optimalisasi pemanfaatan dan berbasis
pada keragaman sumber daya domestik. Salah
satu indikator untuk mengukur ketahanan
pangan adalah ketergantungan ketersediaan pangan nasional terhadap impor (Saliem et al.
2007).
METODE PENELITIAN
Penelitian akan dilakukan dalam beberapa
tahap. Gambar 2 menunjukan tahapan dari metode penelitian.
Data Indikator Ketahanan Pangan
Data indikator ketahanan pangan yang
digunakan adalah data yang dikumpulkan oleh
DKP dan WFP (2009). Pada penelitian ini
difokuskan pada wilayah Provinsi Bali, Nusa Tenggara Barat, dan Nusa Tenggara Timur.
Praproses Data
Penelitian ini akan dilakukan
menggunakan proses data mining. Tahapan
yang termasuk dalam praproses yaitu
pembersihan data, integrasi data, transformasi data, dan seleksi data. Tahap pembersihan dan
integrasi data telah dilakukan sebelumnya
oleh tim dari United Nations World Food
Programme (WFP) dan Dewan Ketahanan
Pangan (DKP). Selanjutnya pada tahap seleksi
data akan dipilih data indikator ketahanan
pangan di wilayah Provinsi Bali, Nusa
Tenggara Barat, dan Nusa Tenggara Timur.
Pada tahap transformasi dilakukan
pengubahan data agar dapat digunakan dalam
proses data mining, transformasi data yang dilakukan pada penelitian ini adalah
melakukan normalisasi data dengan
normalisasi z-score.
Data Mining
Data mining yang dilakukan pada
penelitian ini adalah clustering data
menggunakan algoritme SOM. Masukan ke
algoritme SOM adalah data dari praproses
dengan kombinasi dari parameter awal.
Parameter awal dari algoritme SOM yang
akan digunakan adalah:
1. Learning rate (η): 0.1, 0.5, dan 0.9 2. Ukuran cluster: 3, 4, 5, 6
5
3. Ukuran lingkungan (R): 1
4. Penurunan learning rate (θ ): 0.1, 0.5,
0.9, dan 1.
Metode inisialisasi nilai vektor bobot
menggunakan midpoint dengan topologi yang
digunakan adalah topologi grid. Fungsi jarak
yang digunakan adalah Euclidean, dan kriteria
pemberhentian algoritme SOM adalah epoch,
dengan banyak epoch: 100, 200, dan 300.
Seluruh hasil clustering dari algoritme SOM akan divalidasi menggunakan validasi
cluster Indeks Davies-Bouldin (DBI). Dari
berbagai kombinasi parameter awal, akan
dipilih clustering yang menghasilkan DBI
minimal sebagai clustering terbaik.
Jumlah cluster dan bobot dari hasil metode
SOM merupakan input untuk metode K-
means, bobot yang optimal dari hasil metode
SOM dijadikan sebagai initial centroid bagi
K-means. Dari hasil clustering tersebut akan
dilakukan validasi dan perbandingan terhadap clustering dengan menggunakan metode
algoritme SOM saja dan K-means saja.
Apabila hasil valid dan memiliki nilai
yang lebih kecil dari metode algoritma lain
maka dilanjutkan dengan melakukan analisa
hasil klaster, namun apabila masih belum
maka akan kembali dilakukan pemilihan dan
pembersihan data.
Representasi Pengetahuan
Representasi pengetahuan akan
dilakukan terhadap cluster yang sudah
divalidasi. Representasi tersebut akan
memperlihatkan karakteristik masing-masing
cluster. Informasi penting yang terdapat dari
hasil clutering diharapkan bermanfaat
sehingga dapat diperoleh penanganan
terhadap cluster yang bersangkutan.
Lingkungan Implementasi
Beberapa perangkat lunak dan perangkat
keras yang digunakan untuk mengembangkan
sistem adalah sebagai berikut:
Perangkat lunak:
Sistem operasi: Microsoft Windows 7
Professional
MATLAB R2008b
Minitab 14
Perangkat keras:
Prosesor: Intel T4200 2.1 GHz
Memori 2 GB RAM
Monitor dengan resolusi 1366×768
Mouse dan keyboard
Gambar 2 Diagram alur penelitian
HASIL DAN PEMBAHASAN
Data Indikator Ketahanan Pangan
Data sumber yang digunakan pada
penelitian ini adalah data indikator ketahanan
pangan kabupaten di wilayah Provinsi Bali,
Nusa Tenggara Barat (NTB), dan Nusa
Tenggara Timur (NTT) pada tahun 2009
dengan jumlah record sebanyak 30 baris dan 9
Representasi Pengetahuan
Validasi
dengan DBI
Data Indikator
Ketahanan Pangan
Pembersihan,
Integrasi,& Seleksi
data
data
Transformasi Data
K-Means
cluster
Penerapan
SOM
Jumlah cluster
yang didapat
Hasil cluster
Validasi
dengan DBI
Apakah
hasil
cluster
telah
valid
Tidak
Iya
6
atribut. Indikator ketahanan pangan dan
definisinya dapat dilihat pada Lampiran 4.
Praproses Data
Proses normalisasi terhadap data dilakukan
terlebih dahulu sebelum masuk ke tahap
proses data mining, karena data yang
digunakan memiliki rentang nilai yang sangat
besar. Rentang nilai yang sangat besar cukup
mempengaruhi pada metode clustering yang
berbasis jarak. Normalisasi pada umumnya
digunakan untuk menyetarakan atribut agar atribut satu dengan lainnya memiliki ukuran
yang sama, memiliki rataan dan standar
deviasi nol. Normalisasi juga membuat
rentang nilai menjadi jauh lebih kecil
sehingga membantu perhitungan jarak
menjadi lebih cepat dan efisien. Teknik
normalisasi yang digunakan pada penelitian
ini adalah z-score. Data indikator ketahanan
pangan sebelum dan sesudah dinormalisasi
disajikan pada Lampiran 5 dan Lampiran 6.
Tiga Metode Clustering
Pada penelitian ini akan dilakukan
perbandingan terhadap tiga metode clustering
yaitu:
a. SOM
Dengan menggunakan parameter awal
yang dapat menghasilkan nilai DBI
terbaik.
b. SOM+Kmeans (Algoritme S-K)
Dengan menggunakan ukuran cluster 3
dan initial centroid yang didapatkan dari
metode SOM yang menghasilkan DBI terbaik, namun menggunakan algoritme k-
means.
c. K-means
Menggunakan ukuran cluster 3 dan initial
centroid yang dibangkitkan secara acak.
Penerapan Algoritme SOM
Data indikator ketahanan pangan yang
telah dinormalisasi akan di-cluster
menggunakan algoritme Self Organizing
Maps (SOM). Masukan ke algoritme SOM
adalah data dari praproses dengan kombinasi
dari parameter awal.
Kriteria pemberhentian clustering
dilakukan dengan pembatasan jumlah epoch.
Algoritme SOM dijalankan dengan 100, 200,
dan 300 epoch. Hasil pengamatan Indeks
Davies-Bouldin disajikan pada Lampiran 7.
Jumlah cluster dan bobot yang didapat dari
algoritme SOM akan menjadi input awal bagi
algoritme clustering K-means.
Indeks Davies-Bouldin (DBI)
Pengamatan terhadap DBI dilakukan untuk
mengukur validitas dari hasil clustering
algoritme SOM dengan kombinasi berbagai
parameter. Skema clustering yang optimal
menurut Indeks Davies-Bouldin adalah yang
memiliki Indeks Davies-Bouldin minimal.
Hasil pengamatan dengan kombinasi berbagai
parameter disajikan pada Lampiran 7. DBI terbaik untuk tiap ukuran cluster dapat dilihat
pada Tabel 1.
Tabel 1 Indeks Davies-Bouldin terbaik untuk
tiap ukuran cluster
Ukuran
cluster
LR PLR Epoch DBI
3 0.5 1.0 100 2.696
4
5
6
0.1
0.9
0.9
1.0
1.0
0.9
200
300
100
3.003
2.746
2.707
DBI Terbaik
Dari hasil penelitian, Indeks Davies-
Bouldin terbaik dihasilkan dengan parameter
awal: ukuran cluster 3, learning rate 0.5, penurunan learning rate 1, iterasi 100
menghasilkan DBI 2.696 (Tabel 1). Bobot
optimal dengan ukuran cluster 3 dapat dilihat
pada Lampiran 8.
Clustering dengan Algoritme S-K
Ukuran cluster dan bobot dari SOM dengan Indeks Davies-Bouldin terbaik
menjadi masukan bagi algoritme K-means
untuk mendapatkan final cluster (Tabel 2).
Initial centroid sangat dibutuhkan pada
algoritme K-means karena pada K-means nilai
initial centroid dipilih secara acak sehingga
mempengaruhi hasil clustering. Begitu juga
dengan ukuran cluster, algoritme K-means
tidak dapat menentukan ukuran cluster yang
baik. Bobot optimal yang dihasilkan SOM
digunakan sebagai initial centroid bagi algoritme K-means.
Pada tahap ini akan dihasilkan cluster
mengenai data indikator ketahanan pangan.
Kemudian selanjutnya akan dilakukan
perhitungan validasi dengan DBI. Dari
algoritme S-K ini dihasilkan cluster dengan
nilai DBI sebesar 1.011.
7
Banyaknya anggota masing-masing cluster
dengan ukuran cluster 3 disajikan pada Tabel
2. Nama-nama anggota masing-masing cluster
dengan ukuran cluster 3 dapat dilihat pada
Tabel 3 .
Tabel 2 Banyak anggota masing-masing
cluster dengan ukuran cluster 3
Cluster
ke-
Banyak
anggota
Persentase
banyak anggota
1 15 50%
2 7 23.33%
3 8 26.67%
Tabel 3 Nama anggota pada masing-masing
cluster hasil clustering dengan
algoritme S-K
Cluster ke- Anggota
1 Sumba Barat, Sumba Timur,
Timor Tengah Selatan,
Kupang, Timor Tengah Utara,
Belu, Lembata, Sikka,
Manggarai, Rote Ndao,
Manggarai Barat, Alor, Ende,
Flores Timur, Ngada.
2 Lombok Barat, Lombok
Tengah, Lombok Timur,
Sumbawa, Dompu, Bima,
Sumbawa Barat.
3 Jembrana, Tabanan, Badung,
Gianyar, Klungkung, Bangli,
Buleleng, Karang Asem.
Perbandingan Hasil Clustering
Dalam penelitian ini akan dilakukan
perbandingan terhadap hasil clustering
algoritme SOM, S-K, dan K-means.
Clustering menggunakan algoritme K-means
dengan ukuran cluster 3 dan initial centroid
yang dibangkitkan secara acak menghasilkan
cluster dengan nilai DBI sebesar 1.635.
Final cluster dari penerapan algoritme S-K
menghasilkan nilai DBI sebesar 1.011. Nilai
DBI hasil clustering menggunakan algoritme
S-K lebih kecil dibanding nilai DBI hasil
clustering SOM sebelumnya yang sebesar
2.696. Nama-nama anggota masing-masing
cluster dengan ukuran cluster 3 hasil
clustering SOM dan hasil clustering K-means
disajikan pada Tabel 4 dan Tabel 5. Nomor
cluster tidak menunjukan tingkatan.
Tabel 4 Nama anggota pada masing-masing
cluster hasil clustering dengan
algoritme SOM
Cluster ke- Anggota
1 Sumba Barat, Sumba Timur,
Timor Tengah Selatan, Kupang, Timor Tengah
Utara, Belu, Lembata, Sikka,
Manggarai, Rote Ndao,
Manggarai Barat, Alor,
Ende.
2 Lombok Barat, Lombok
Tengah, Lombok Timur,
Sumbawa, Dompu, Bima, Sumbawa Barat, Flores
Timur, Ngada.
3 Jembrana, Tabanan, Badung,
Gianyar, Klungkung, Bangli,
Buleleng, Karang Asem.
Tabel 5 Nama anggota pada masing-masing
cluster hasil clustering dengan
algoritme K-means
Cluster ke- Anggota
1 Sumbawa, Bima, Sumbawa Barat, Kupang, Timor Tengah
Utara, Belu, Alor, Lembata,
Flores Timur, Sikka, Ende,
Ngada, Manggarai, Rote
Ndao, Manggarai Barat.
2 Lombok Barat, Lombok
Tengah, Lombok Timur,
Dompu, Sumba Barat,
Sumba Timur, Timor
Tengah Selatan.
3 Jembrana, Tabanan, Badung,
Gianyar, Klungkung, Bangli,
Buleleng, Karang Asem.
Dari Tabel 3, Tabel 4, dan Tabel 5 terlihat
bahwa hasil clustering dengan SOM, S-K, dan
K-means untuk cluster 3 sama persis, perbandingan anggota hasil clustering
disajikan pada Lampiran 9. Untuk
menentukan hasil clustering yang terbaik
dilakukan perbandingan terhadap hasil DBI.
Nilai DBI yang dihasilkan oleh SOM sebesar
8
2.696, nilai DBI hasil clustering algoritme S-
K sebesar 1.011, dan nilai DBI clustering K-
means sebesar 1.635, skema clustering yang
optimal menurut Indeks Davies-Bouldin
(DBI) adalah yang memiliki DBI minimal.
Sehingga dapat kita simpulkan bahwa
algoritme S-K memberikan hasil clustering
yang terbaik.
Deskripsi Hasil Cluster
Untuk mengetahui karakteristik indikator
ketahanan pangan perlu dilakukan analisis,
untuk mendapatkan hasil analisis yang baik
tentunya membutuhkan hasil clustering yang
valid. Dari hasil pengamatan nilai DBI SOM
sebesar 2.696, DBI algoritme S-K 1.011, dan
DBI K-means 1.635, menunjukan bahwa algoritme S-K menghasilkan clustering yang
valid.
Menurut instrumen situasi ketahanan
pangan suatu wilayah, penilaian ketahanan
pangan dikategorikan menjadi enam prioritas,
di mana prioritas 1 merupakan wilayah sangat
rawan pangan, prioritas 2 wilayah rawan
pangan, prioritas 3 wilayah agak rawan
pangan, prioritas 4 wilayah cukup tahan
pangan, prioritas 5 wilayah tahan pangan, dan
prioritas 6 wilayah sangat tahan pangan (DKP
dan WFP 2009). Penilaian setiap indikator dan karakteristik cluster disajikan pada Lampiran
10 dan Lampiran 11.
Cluster 1 yang memiliki 50% dari data
(Tabel 2), adalah cluster yang memiliki nilai
buruk pada indikator akses listrik, berat badan
bayi di bawah standar, dan kemiskinan
(prioritas 1). Hal yang perlu menjadi perhatian
serius dari pemerintah adalah perbaikan di
bidang ekonomi untuk mengurangi angka
kemiskinan, akses yang cukup terhadap listrik
perlu ditingkatkan secara signifikan, merevitalisasi peran dan fungsi posyandu,
PKK, dan bidan desa untuk menekan angka
berat badan bayi di bawah standar,
penyuluhan kesehatan dan gizi lebih digiatkan
agar masyarakat dapat hidup sehat. Cluster 1
termasuk wilayah rawan pangan.
Cluster 2 (23.33% dari data) adalah cluster
yang memiliki nilai buruk pada indikator
kemiskinan, berat badan bayi di bawah
standar, dan angka harapan hidup berada
prioritas 2, indikator perempuan buta huruf
berada pada prioritas 3. Penduduk yang hidup di bawah garis kemiskinan perlu ditangani
secara optimal dengan pembangunan ekonomi
produktif, akses terhadap listrik perlu
ditingkatkan, dan pemerintah daerah perlu
merevitalisasi peran dan fungsi posyandu,
PKK, dan bidan desa, serta penyuluhan pola
pengasuhan agar balita dapat berkembang
dengan baik. Kondisi kerentanan terhadap
kerawanan pangan pada cluster 2 ini adalah
agak rawan pangan.
Cluster 3 (26.67% dari data) adalah cluster
yang memiliki indikator ketahanan terbaik.
Namun cluster 3 berada di prioritas 3 pada
indikator perempuan buta huruf. Program
pendidikan, baik formal dan non-formal perlu diperhatikan dan dilaksanakan. Untuk
indikator lainnya berada pada prioritas 5 dan
prioritas 6. Ketahanan pangan di cluster 3
terjamin.
Dari Gambar 3 dapat dilihat bahwa
kabupaten yang berada di Provinsi Bali
termasuk dalam cluster yang memiliki kondisi
ketahanan pangan yang terjamin (cluster 3).
Bali harus melanjutkan usaha-usaha
terbaiknya untuk memelihara tingkat
komitmen saat ini. Seluruh kabupaten di Provinsi Nusa Tenggara Barat termasuk dalam
cluster 2 dengan kondisi agak rawan pangan.
Seluruh kabupaten di Provinsi Nusa Tenggara
Timur berada di cluster yang memiliki nilai
indikator yang buruk (cluster 1) dengan
kondisi rawan pangan.
Secara keseluruhan indikator yang
memiliki nilai yang baik adalah akses
terhadap fasilitas kesehatan. Akses terhadap
fasilitas kesehatan meningkat secara
signifikan dalam beberapa tahun terakhir, hal ini disebabkan oleh meningkatnya investasi
pemerintah pusat dan daerah untuk
pembangunan infrastruktur kesehatan di
seluruh Indonesia.
Bali NTB NTT
Cluster 1 0 0 15
Cluster 2 0 7 0
Cluster 3 8 0 0
0
5
10
15
20
Jum
lah
An
ggota
Gambar 3 Gambar sebaran jumlah anggota
berdasarkan provinsi
9
SIMPULAN DAN SARAN
Simpulan
Pada penelitian ini telah
diimplementasikan clustering menggunakan
algoritme S-K untuk data ketahanan pangan di
Provinsi Bali, Nusa Tenggara Barat, dan Nusa Tenggara Timur. Dari hasil percobaan
menggunakan SOM ditemukan bahwa
clustering data ketahanan pangan yang
memiliki Indeks Davies-Bouldin minimal
adalah ukuran cluster 3, learning rate 0.5,
penurunan learning rate 1, epoch 100
menghasilkan nilai Indeks Davies-Bouldin
sebesar 2.696. Bobot optimal yang dihasilkan
SOM kemudian digunakan sebagai initial
centroid bagi algoritme K-means untuk
mendapatkan final cluster. Hasil validasi final cluster didapatkan nilai DBI sebesar 1.011.
Pada penelitian ini juga dilakukan clustering
dengan algoritme K-means yang initial
centroid-nya dibangkitkan secara acak, hasil
validasi dengan DBI sebesar 1.635. Jika
dibandingkan nilai DBI hasil clustering
algoritme SOM, S-K, dan K-means, algoritme
S-K memiliki nilai DBI yang minimal.
Terbukti bahwa algoritme S-K memberikan
hasil clustering yang baik. Akan tetapi, pada
penelitian ini masih terdapat anomali pada
nilai DBI yang dihasilkan dari clustering SOM, secara teori seharusnya nilai DBI yang
dihasilkan dari clustering SOM tidak terlalu
jauh dari nilai DBI clustering S-K. Perlu
penelitian lebih lanjut mengenai validasi
clustering.
Provinsi Nusa Tenggara Timur berada
pada cluster yang memiliki status rawan
pangan. Provinsi Nusa Tenggara Barat
termasuk dalam cluster dengan kondisi agak
rawan pangan. Provinsi Bali berada pada
cluster dengan kondisi ketahanan pangan terjamin.
Saran
Pada penelitian selanjutnya dapat
menggunakan kombinasi dari algoritme
clustering lainnya seperti integrasi algoritme
semut dan K-means. Selain itu, diharapkan
adanya penelitian lebih lanjut untuk
mengevaluasi hasil analisis cluster.
DAFTAR PUSTAKA
Demuth H, Beale M. 2003. Neural Network
Toolbox For Use with MATLAB®.
Massachusetts: The MathWorks.
[DKP dan WFP] Dewan Ketahanan Pangan
dan World Food Programme. 2009. Peta
Ketahanan dan Kerawanan Pangan
Indonesia. Jakarta: Dewan Ketahanan
Pangan, Departemen Pertanian RI.
Edward. 2006. Clustering menggunakan self
organizing maps (studi kasus: data PPMB
IPB) [skripsi]. Bogor: Fakultas
Matematika dan Ilmu Pengetahuan Alam,
Institut Pertanian Bogor.
Han J, Kamber M. 2006. Data Mining: Concepts and Techniques. Ed ke-2. San
Francisco: Morgan Kaufman.
Jain AK, Dubes RC. 1988. Algorithms for
Clustering Data. New Jersey: Prentice
Hall.
Kantardzic M. 2003. Data Mining: Concepts,
Models, Methods, and Algorithm. New
Jersey: John Wiley & Sons.
Kuo RJ, Ho LM, Hu CM. 2001. Integration of
self organizing feature map and K-means
algorithm for market segmentation. Computers and Operations Research 29:
1475-1493.
Larose DT. 2004. Discovering Knowledge in
Data: An Introduction to Data mining.
New Jersey: Wiley.
Laurence F. 1994. Fundamentals of Neural
Networks. New Jersey: Prentice Hall.
Salazar GEJ, Veles AC, Parra MCM, Ortega
LO. 2002. A cluster validity index for
comparing non-hierarchical clustering
methods. [terhubung berkala]. http://citeseer.ist.psu.edu/rd/salazar02clust
er.pdf [20 Jun 2012].
Saliem HP, Lokollo EM, Ariani M,
Purwantini TB, Marisa Y. 2007. Wilayah
Rawan Pangan dan Gizi Kronis di Papua,
Kalimantan Barat Dan Jawa Timur.
Laporan Penelitian Puslitbang Sosek
Pertanian, Badan Litbang Pertanian.
Departemen Pertanian RI.
Wang HB, Yang HL, Xu ZJ, Yuan Z. 2010. A
clustering algorithm use SOM and K-
means in intrusion detection. International Conference on E-Business and E-
Government; Guangzhou, 7-9 Mei 2010.
hlm 1281-1284.
11
Lampiran 1 Langkah-langkah clustering dengan algoritme K-means
Clustering dengan K-means
Jumlah cluster 3
Initial centroid 1.230 0.718 -0.423 0.769 0.523 0.537 0.999 0.099 0.088
-0.082 -0.972 -0.333 -0.363 0.243 -0.306 0.468 -0.118 0.062
-1.021 -0.516 0.473 -1.118 -0.810 -0.766 -0.967 0.599 0.678
Bobot optimal dari SOM digunakan sebagai initial centroid bagi K-means
Data (x)
-1.113 -0.529 0.422 -1.273 -0.865 -0.875 -1.065 0.690 1.008 V1
-0.655 -0.660 -0.010 0.236 -0.260 -0.537 0.699 -0.933 -0.956 V2
1.418 0.813 -0.456 0.814 0.580 0.525 1.094 0.201 0.131 V3
0.210 -1.250 -0.560 -0.749 0.558 -0.224 0.371 0.328 0.632 V4
Iterasi 1 Menghitung jarak antara data vektor input dan centroid dengan rumus jarak euclidean, jarak minimal menentukan vektor input
masuk ke dalam cluster mana.
C1 C2 C3 Cluster
V1 4.616 2.847 0.421 3
V2 3.150 1.718 3.220 2
V3 0.269 2.852 4.540 1
V4 2.926 1.001 2.699 2
12
Lampiran 1 Lanjutan
Menghitung centroid baru
C1 1.2303 0.7176 -0.4234 0.7690 0.5233 0.5368 0.9986 0.0991 0.0881
C2 -0.2227 -0.9550 -0.2850 -0.2566 0.1487 -0.3805 0.5350 -0.3025 -0.1616
C3 -1.0212 -0.5161 0.4729 -1.1175 -0.8097 -0.7662 -0.9665 0.5994 0.6784
Iterasi 2 Menghitung jarak antara data vektor input dan centroid dengan
rumus jarak euclidean, jarak minimal menentukan vektor input masuk
ke dalam cluster mana. Lakukan hingga anggota cluster stabil.
c1 c2 c3 Cluster
v1 4.616 2.949 0.421 3
v2 3.150 1.356 3.220 2
v3 0.269 2.941 4.540 1
v4 2.926 1.356 2.699 2
Menghitung centroid baru
C1 1.230 0.718 -0.423 0.769 0.523 0.537 0.999 0.099 0.088
C2 -0.223 -0.955 -0.285 -0.257 0.149 -0.381 0.535 -0.302 -0.162
C3 -1.021 -0.516 0.473 -1.118 -0.810 -0.766 -0.967 0.599 0.678
13
Lampiran 2 Langkah-langkah clustering dengan algoritme SOM
Clustering dengan algoritme SOM
Tentukan parameter
awal
Learning rate 0.5
Penurunan learning
rate 0.9
Ukuran tetangga 0
Ukuran cluster 3
Bobot awal (w)
0.735 0.465 -0.337 0.651 0.373 0.569 0.747 -0.170 -0.025
0.049 -0.090 0.096 0.150 -0.113 0.035 0.254 -0.178 -0.120
-0.779 -0.483 0.607 -0.709 -0.663 -0.478 -0.707 0.361 -0.192
Data (x)
-1.113 -0.529 0.422 -1.273 -0.865 -0.875 -1.065 0.690 1.008
-0.655 -0.660 -0.010 0.236 -0.260 -0.537 0.699 -0.933 -0.956
1.418 0.813 -0.456 0.814 0.580 0.525 1.094 0.201 0.131
0.210 -1.250 -0.560 -0.749 0.558 -0.224 0.371 0.328 0.632
14
Lampiran 2 Lanjutan
Epoch 1
Untuk vektor (x1)
D(1) 4.170
D(2) 2.972
D(3) 1.531
D(3) minimum maka vektor bobot di baris 3 dimodifikasi.
w3 baru -0.946 -0.506 0.515 -0.991 -0.764 -0.677 -0.886 0.525 0.408
w baru 0.735 0.465 -0.337 0.651 0.373 0.569 0.747 -0.170 -0.025
0.049 -0.090 0.096 0.150 -0.113 0.035 0.254 -0.178 -0.120
-0.946 -0.506 0.515 -0.991 -0.764 -0.677 -0.886 0.525 0.408
Untuk Vektor (x2)
D(1) 2.561
D(2) 1.629
D(3) 2.943
D(2) minimum maka vektor bobot di baris 2 dimodifikasi.
w2 baru -0.30 -0.38 0.04 0.19 -0.19 -0.25 0.48 -0.56 -0.54
w baru 0.74 0.47 -0.34 0.65 0.37 0.57 0.75 -0.17 -0.02
-0.30 -0.38 0.04 0.19 -0.19 -0.25 0.48 -0.56 -0.54
15
-0.95 -0.51 0.51 -0.99 -0.76 -0.68 -0.89 0.53 0.41
Untuk vektor (x3)
D(1) 0.977
D(2) 2.757
D(3) 4.345
D(1) minimum maka vektor bobot di baris 1 dimodifikasi.
w1 baru 1.077 0.639 -0.397 0.732 0.477 0.547 0.921 0.016 0.053
w baru 1.077 0.639 -0.397 0.732 0.477 0.547 0.921 0.016 0.053
-0.303 -0.375 0.043 0.193 -0.187 -0.251 0.476 -0.555 -0.538
-0.946 -0.506 0.515 -0.991 -0.764 -0.677 -0.886 0.525 0.408
Untuk vektor (x4)
D(1) 2.807
D(2) 2.236
D(3) 2.593
D(2) minimum maka vektor bobot di baris 2 dimodifikasi.
w2 baru -0.047 -0.813 -0.259 -0.278 0.185 -0.237 0.424 -0.114 0.047
w baru 1.077 0.639 -0.397 0.732 0.477 0.547 0.921 0.016 0.053
-0.047 -0.813 -0.259 -0.278 0.185 -0.237 0.424 -0.114 0.047
-0.946 -0.506 0.515 -0.991 -0.764 -0.677 -0.886 0.525 0.408
Sebelum melakukan iterasi kedua dalam mengubah bobot, terlebih dahulu dilakukan modifikasi learning rate
Lampiran 2 Lanjutan
16
Epoch 2
Learning rate baru = 0.45
Untuk vektor (x1)
D(1) 4.470
D(2) 2.823
D(3) 0.765
D(3) minimum maka vektor bobot di baris 3
dimodifikasi
w3 baru -1.021 -0.516 0.473 -1.118 -0.810 -0.766 -0.967 0.599 0.678
w baru 1.077 0.639 -0.397 0.732 0.477 0.547 0.921 0.016 0.053
-0.047 -0.813 -0.259 -0.278 0.185 -0.237 0.424 -0.114 0.047
-1.021 -0.516 0.473 -1.118 -0.810 -0.766 -0.967 0.599 0.678
Untuk vektor (x2)
D(1) 2.961
D(2) 1.662
D(3) 3.220
D(2) minimum maka vektor bobot di baris 2
dimodifikasi
w2 baru -0.321 -0.744 -0.147 -0.047 -0.015 -0.372 0.548 -0.482 -0.404
Lampiran 2 Lanjutan
17
w baru 1.077 0.639 -0.397 0.732 0.477 0.547 0.921 0.016 0.053
-0.321 -0.744 -0.147 -0.047 -0.015 -0.372 0.548 -0.482 -0.404
-1.021 -0.516 0.473 -1.118 -0.810 -0.766 -0.967 0.599 0.678
Untuk vektor (x3)
D(1) 0.489
D(2) 2.915
D(3) 4.540
D(1) minimum maka vektor bobot di baris 1 dimodifikasi
w1 baru 1.230 0.718 -0.423 0.769 0.523 0.537 0.999 0.099 0.088
w baru 1.230 0.718 -0.423 0.769 0.523 0.537 0.999 0.099 0.088
-0.321 -0.744 -0.147 -0.047 -0.015 -0.372 0.548 -0.482 -0.404
-1.021 -0.516 0.473 -1.118 -0.810 -0.766 -0.967 0.599 0.678
Untuk vektor (x4)
D(1) 2.926
D(2) 1.821
D(3) 2.699
D(2) minimum maka vektor bobot di baris 2 dimodifikasi
Lampiran 2 Lanjutan
18
w2 baru -0.082 -0.972 -0.333 -0.363 0.243 -0.306 0.468 -0.118 0.062
w baru 1.230 0.718 -0.423 0.769 0.523 0.537 0.999 0.099 0.088
-0.082 -0.972 -0.333 -0.363 0.243 -0.306 0.468 -0.118 0.062
-1.021 -0.516 0.473 -1.118 -0.810 -0.766 -0.967 0.599 0.678
Misalkan maksimum epoch adalah 2, maka bobot akhir yang kita dapatkan adalah
w 1.230 0.718 -0.423 0.769 0.523 0.537 0.999 0.099 0.088
-0.082 -0.972 -0.333 -0.363 0.243 -0.306 0.468 -0.118 0.062
-1.021 -0.516 0.473 -1.118 -0.810 -0.766 -0.967 0.599 0.678
Lampiran 2 Lanjutan
19
Pengelompokan vektor dilakukan dengan menghitung jarak vektor dengan bobot optimal
vektor(x1)
vektor(x2)
vektor(x3)
D(1) 4.616
D(1) 3.150
D(1) 0.269
D(2) 2.847
D(2) 1.718
D(2) 2.852
D(3) 0.421
D(3) 3.220
D(3) 4.540
vektor(x4)
D(1) 2.926
D(2) 1.001
D(3) 2.699
Vektor (x4) masuk ke cluster 2
Vektor (x1) masuk ke cluster 3 Vektor (x2) masuk ke cluster 2 Vektor (x3) masuk ke cluster 1
Lampiran 2 Lanjutan
20
Lampiran 3 Langkah perhitungan Indeks Davies-Bouldin
Indeks Davies-Bouldin(DBI)
Nk = 3
Centroid 1.230 0.718 -0.423 0.769 0.523 0.537 0.999 0.099 0.088
-0.223 -0.955 -0.285 -0.257 0.149 -0.381 0.535 -0.302 -0.162
-1.021 -0.516 0.473 -1.118 -0.810 -0.766 -0.967 0.599 0.678
Xi -1.113 -0.529 0.422 -1.273 -0.865 -0.875 -1.065 0.690 1.008
-0.655 -0.660 -0.010 0.236 -0.260 -0.537 0.699 -0.933 -0.956
1.418 0.813 -0.456 0.814 0.580 0.525 1.094 0.201 0.131
0.210 -1.250 -0.560 -0.749 0.558 -0.224 0.371 0.328 0.632
Mencari jarak intra cluster
sc(Qk) = ||Xi-i Ck||
Nk
Xi = data , Ck= Centroid
Nk=Banyak anggota dalam cluster
Sc (c1) 0.421
Sc (c2) 1.356
Sc (c3) 0.269
Mencari jarak inter-cluster
dkl = 𝐶𝑘 − 𝐶𝑙 Ck= Centroid dari cluster Qk
d1,2 2.720
d1,3 4.346
d2,1 2.720
d2,3 2.643
d3,1 4.346
d3,2 2.643
21
21
Lampiran 3 Lanjutan
Indeks Davies-Bouldin
DB(nc)= 1
nc max
sc Qk +sc(Q
l)
dkl(Qk,Q
l)
nck=l
nc = number of cluster
(Sc1+Sc2)/d1,2 0.653 (Sc2+Sc1)/d2,1 0.653 (Sc3+Sc1)/d31 0.159
(Sc1+Sc3)/d1,3 0.159 (Sc2+Sc3)/d2,3 0.615 (Sc3+Sc2)/d3,2 0.615
max 0.653 max 0.653 max 0.615
DB (nc) = 1
3 0.653+0.653+0.615
= 0.64
22
22
Lampiran 4 Indikator ketahanan pangan
No Indikator Definisi
1 Rasio konsumsi normatif per
kapita terhadap ketersediaan
bersih ‘padi+jagung+ubi
kayu+ubi jalar’
Ketersediaan bersih serealia per kapita per hari
dihitung dengan membagi total ktersediaan
serealia kabupaten dengan jumlah populasi.
Konsumsi normatif serealia/hari/kapita adalah 300
gram/orang/hari.
Kemudian dihitung rasio konsumsi normatif
perkapita terhadap ketersediaan bersih serealia
perkapita. Rasio lebih besar dari 1 menunjukan
daerah defisit pangan dan daerah dengan rasio
lebih kecil dari 1 adalah surplus untuk produksi
serealia.
2 Persentase penduduk hidup di
bawah garis kemiskinan
Nilai rupiah pengeluaran perkapita setiap bulan untuk
memenuhi standar minimum kebutuhan-kebutuhan
konsumsi pangan dan non pangan yang dibutuhkan oleh
seorang individu untuk hidup secara layak. Garis
kemiskinan nasional menggunakan US$ 1,55 (Purchasing
Power Parity) per orang per hari.
3 Persentase desa yang tidak
memiliki akses penghubung
yang memadai
Lalu lintas antar desa yang tidak bisa dilalui oleh
kendaraaan roda empat.
4 Persentase rumah tangga
tanpa akses listrik
Persentase rumah tangga yang tidak memiliki akses
terhadap listrik dari PLN dan/atau non PLN, misalnya
generator.
5 Angka harapan hidup pada
saat lahir
Perkiraan lama hidup rata-rata bayi baru lahir dengan
asumsi tidak ada perubahan pola mortalitas sepanjang
hidupnya.
6 Berat badan balita di bawah
standar (Underweight)
Anak di bawah lima tahun yang berat badannya kurang
dari -2 Standar Deviasi (-2 SD) dari berat badan normal
pada usia dan jenis kelamin tertentu (Standar WHO 2005).
7 Perempuan buta huruf Persentase perempuan di atas 15 tahun yang tidak dapat
membaca atau menulis.
8 Persentase rumah tangga
tanpa akses ke air bersih
Persentase rumah tangga yang tidak memiliki akses ke air
minum yang berasal dari air leding/PAM, pompa air ,
sumur, atau mata air yang terlindungi.
9 Persentase rumah tangga yang
tinggal lebih dari 5 km dari
fasilitas kesehatan
Persentase rumah tangga yang tinggal pada jarak lebih dari
5 kilometer dari fasilitas kesehatan ( rumah sakit, klinik,
puskesmas, dokter, juru rawat, bidan yang terlatih, dan
paramedik)
23
Lampiran 5 Data indikator ketahanan pangan sebelum dinormalisasi
ID PROVINSI Kabupaten Listrik Air
Buta
Huruf Kemiskinan Jalan Kesehatan
BB bayi di
bawah
standar
Angka
harapan
hidup
Rasio
konsumsi
1 Bali Jembrana 1.63 17.42 17.63 9.92 0 11.4 12.2 71.63 0.88
2 Bali Tabanan 0.77 8.57 19.41 7.46 0.78 2.7 7.1 74.32 0.32
3 Bali Badung 0.54 3.31 14.3 4.28 0 0 7.4 71.64 0.6
4 Bali Gianyar 0.65 2.9 26.28 5.98 0 0.2 6.8 71.99 0.45
5 Bali Klungkung 6.01 26.18 28.61 9.14 0 2 12.9 68.95 0.44
6 Bali Bangli 3.82 24.4 25.7 7.48 0 2.4 11.7 71.4 0.48
7 Bali Karang Asem 6.06 37.5 38.33 8.95 0 14.7 19.8 67.77 0.49
8 Bali Buleleng 2.45 15.7 23.43 8.68 0 1.7 14.9 68.65 0.79
9 Nusa Tenggara Barat Lombok Barat 11.18 16.49 34.46 28.97 0 11.8 27.6 59.54 0.68
10 Nusa Tenggara Barat Lombok Tengah 20.9 23.96 37.38 25.74 0.81 1.6 18.2 59.82 0.46
11 Nusa Tenggara Barat Lombok Timur 21.7 14.14 26.47 25.6 0 1.3 25.5 59.16 0.63
12 Nusa Tenggara Barat Sumbawa 5.62 5.64 14.16 28.78 8.48 0.2 27.8 60.4 0.23
13 Nusa Tenggara Barat Dompu 21.58 4.45 26.25 28.57 0 4.9 30 60.7 0.3
14 Nusa Tenggara Barat Bima 16.11 13.14 19.87 25.12 5.08 4.5 33.2 62.01 0.32
24
Lampiran 5 Lanjutan
ID PROVINSI Kabupaten Listrik Air
Buta
Huruf Kemiskinan Jalan Kesehatan
BB bayi di
bawah
standar
Angka
harapan
hidup
Rasio
konsumsi
15 Nusa Tenggara Barat Sumbawa Barat 5.92 8.61 16.74 28.63 8.16 5.6 21.4 60.76 0.27
16 Nusa Tenggara Timur Sumba Barat 82.41 76.1 29.78 42.96 10.42 11.4 30.3 64.11 0.39
17 Nusa Tenggara Timur Sumba Timur 65.98 60.71 21.4 39.08 12.18 25 24.7 61.42 0.62
18 Nusa Tenggara Timur Kupang 59.87 54.62 13.4 31.32 9.17 11.1 37.9 64.77 0.63
19 Nusa Tenggara Timur
Timor Tengah
Selatan 79.63 61.26 21.33 37.43 8.75 34.7 40.2 66.4 0.3
20 Nusa Tenggara Timur
Timor Tengah
Utara 67.59 31.84 15.64 30.12 4.05 16.4 37.5 67.27 0.36
21 Nusa Tenggara Timur Belu 66.93 39.04 19.64 21.02 12.98 11.7 33.9 64.72 0.48
22 Nusa Tenggara Timur Alor 55 21.73 10.67 28.49 26.29 12.5 31.6 65.89 1.05
23 Nusa Tenggara Timur Lembata 60.2 24.86 10 34.45 9.3 10.5 31 66.17 0.52
24 Nusa Tenggara Timur Flores Timur 41.92 1.65 15.33 14.38 11.95 7.1 29.8 67.17 0.7
25 Nusa Tenggara Timur Sikka 51.61 36.63 11.98 19.15 15 16.5 36.7 68.06 0.76
26 Nusa Tenggara Timur Ende 35.51 20.67 13.75 20.33 21.13 10 33.6 64.16 1.32
27 Nusa Tenggara Timur Ngada 58.41 10.32 7.72 16.69 9.09 0.4 26.6 66.77 0.52
25
Lampiran 5 Lanjutan
ID PROVINSI Kabupaten Listrik Air
Buta
Huruf Kemiskinan Jalan Kesehatan
BB bayi di
bawah
standar
Angka
harapan
hidup
Rasio
konsumsi
28 Nusa Tenggara Timur Manggarai 77.96 41.85 16.19 31.41 12.14 13.3 37.3 66.65 0.58
29 Nusa Tenggara Timur Rote Ndao 66.37 27.46 13.76 28.26 0 1.7 40.8 66.78 0.5
30 Nusa Tenggara Timur Manggarai Barat 75.41 48.95 8.88 27.96 32.23 21.3 30.1 65.75 0.39
26
Lampiran 6 Data indikator ketahanan pangan setelah dinormalisasi
No Provinsi Kabupaten Listrik Air
Buta
Huruf Kemiskinan Jalan Kesehatan
BB bayi di
bawah
standar
Angka
harapan
hidup
Rasio
konsumsi
1 Bali Jembrana -1.141 -0.441 -0.281 -1.159 -0.865 0.295 -1.325 1.418 1.385
2 Bali Tabanan -1.170 -0.895 -0.065 -1.385 -0.772 -0.755 -1.817 2.076 -0.956
3 Bali Badung -1.177 -1.165 -0.685 -1.677 -0.865 -1.081 -1.788 1.421 0.215
4 Bali Gianyar -1.174 -1.186 0.768 -1.521 -0.865 -1.056 -1.846 1.506 -0.412
5 Bali Klungkung -0.994 0.009 1.050 -1.230 -0.865 -0.839 -1.258 0.763 -0.454
6 Bali Bangli -1.067 -0.082 0.697 -1.383 -0.865 -0.791 -1.374 1.362 -0.287
7 Bali Karang Asem -0.992 0.590 2.229 -1.248 -0.865 0.694 -0.593 0.475 -0.245
8 Bali Buleleng -1.113 -0.529 0.422 -1.273 -0.865 -0.875 -1.065 0.690 1.008
9 Nusa Tenggara Barat Lombok Barat -0.821 -0.488 1.760 0.590 -0.865 0.344 0.159 -1.537 0.549
10 Nusa Tenggara Barat Lombok Tengah -0.495 -0.105 2.114 0.293 -0.769 -0.887 -0.747 -1.468 -0.371
11 Nusa Tenggara Barat Lombok Timur -0.468 -0.609 0.791 0.280 -0.865 -0.924 -0.043 -1.630 0.340
12 Nusa Tenggara Barat Sumbawa -1.007 -1.045 -0.702 0.572 0.145 -1.056 0.178 -1.327 -1.332
13 Nusa Tenggara Barat Dompu -0.472 -1.106 0.764 0.553 -0.865 -0.489 0.390 -1.253 -1.039
14 Nusa Tenggara Barat Bima -0.655 -0.660 -0.010 0.236 -0.260 -0.537 0.699 -0.933 -0.956
27
Lampiran 6 Lanjutan
ID PROVINSI Kabupaten Listrik Air
Buta
Huruf Kemiskinan Jalan Kesehatan
BB bayi di
bawah
standar
Angka
harapan
hidup
Rasio
konsumsi
15 Nusa Tenggara Barat Sumbawa Barat -0.997 -0.893 -0.389 0.559 0.106 -0.405 -0.439 -1.239 -1.164
16 Nusa Tenggara Timur Sumba Barat 1.567 2.571 1.192 1.874 0.376 0.295 0.419 -0.420 -0.663
17 Nusa Tenggara Timur Sumba Timur 1.016 1.781 0.176 1.518 0.585 1.937 -0.121 -1.077 0.298
18 Nusa Tenggara Timur Kupang 0.812 1.469 -0.794 0.805 0.227 0.259 1.152 -0.259 0.340
19 Nusa Tenggara Timur
Timor Tengah
Selatan 1.474 1.809 0.167 1.366 0.177 3.107 1.374 0.140 -1.039
20 Nusa Tenggara Timur
Timor Tengah
Utara 1.070 0.300 -0.523 0.695 -0.383 0.899 1.113 0.353 -0.788
21 Nusa Tenggara Timur Belu 1.048 0.669 -0.038 -0.140 0.680 0.331 0.766 -0.271 -0.287
22 Nusa Tenggara Timur Alor 0.648 -0.219 -1.126 0.546 2.266 0.428 0.545 0.015 2.095
23 Nusa Tenggara Timur Lembata 0.823 -0.059 -1.207 1.093 0.242 0.187 0.487 0.084 -0.120
24 Nusa Tenggara Timur Flores Timur 0.210 -1.250 -0.560 -0.749 0.558 -0.224 0.371 0.328 0.632
25 Nusa Tenggara Timur Sikka 0.535 0.545 -0.967 -0.312 0.921 0.911 1.036 0.546 0.883
26 Nusa Tenggara Timur Ende -0.005 -0.274 -0.752 -0.203 1.651 0.126 0.737 -0.408 3.223
27 Nusa Tenggara Timur Ngada 0.763 -0.805 -1.483 -0.537 0.217 -1.032 0.063 0.230 -0.120
28
Lampiran 6 Lanjutan
ID PROVINSI Kabupaten Listrik Air
Buta
Huruf Kemiskinan Jalan Kesehatan
BB bayi di
bawah
standar
Angka
harapan
hidup
Rasio
konsumsi
28 Nusa Tenggara Timur Manggarai 1.418 0.813 -0.456 0.814 0.580 0.525 1.094 0.201 0.131
29 Nusa Tenggara Timur Rote Ndao 1.030 0.075 -0.751 0.525 -0.865 -0.875 1.431 0.233 -0.203
30 Nusa Tenggara Timur Manggarai Barat 1.333 1.178 -1.343 0.497 2.973 1.490 0.400 -0.019 -0.663
29
Lampiran 7 Pengamatan terhadap DBI
No LR PLR Iterasi Indeks Davies-Bouldin
3 Cluster 4 Cluster 5 Cluster 6 Cluster
1 0.1
1
100
3.003 3.119 3.034 2.747
2 0.5 2.696 3.326 2.924 2.991
3 0.9 2.763 3.233 3.134 2.947
4 0.1
200
3.086 3.003 3.161 3.024
5 0.5 2.982 3.166 3.374 2.746
6 0.9 2.738 3.363 3.133 2.989
7 0.1
300
2.884 3.003 3.057 2.805
8 0.5 2.798 3.371 2.883 2.918
9 0.9 2.753 2.996 2.746 3.233
10 0.1
0.9
100
3.094 3.124 2.799 2.872
11 0.5 2.765 3.213 2.909 2.979
12 0.9 2.770 3.200 2.929 2.707
13 0.1
200
2.731 3.129 3.176 2.880
14 0.5 2.943 3.111 2.782 2.911
15 0.9 2.834 3.106 2.810 3.034
16 0.1
300
2.830 3.224 2.920 3.087
17 0.5 2.743 3.106 2.875 2.891
18 0.9 2.832 3.075 2.929 2.872
19 0.1
0.5
100
2.781 3.041 2.912 2.925
20 0.5 2.902 3.174 2.854 2.918
21 0.9 2.831 3.237 3.013 2.928
22 0.1
200
2.860 3.217 2.992 3.078
23 0.5 2.827 3.042 2.838 2.764
24 0.9 2.839 3.343 2.907 2.880
25 0.1
300
2.714 3.167 3.205 2.888
26 0.5 2.755 3.103 3.061 2.912
27 0.9 2.762 3.270 3.115 2.781
30
No LR PLR Iterasi Indeks Davies-Bouldin
3 Cluster 4 Cluster 5 Cluster 6 Cluster
28 0.1
0.1
100
2.716 3.175 2.918 2.803
29 0.5 2.907 3.210 2.860 2.967
30 0.9 2.888 3.009 3.110 2.894
31 0.1
200
2.789 3.219 2.861 2.959
32 0.5 2.792 3.199 3.126 2.947
33 0.9 2.791 3.233 2.986 3.100
34 0.1
300
2.862 3.116 2.930 2.995
35 0.5 2.801 3.250 3.590 2.956
36 0.9 2.895 3.267 2.949 2.896
LR= Learning Rate, PLR= Penurunan Learning Rate, Epoch= banyak Iterasi
Lampiran 7 Lanjutan
31
Lampiran 8 Hasil clustering dari algoritme SOM, K-means, dan S-K
No SOM S-K K-means
1 Sumba Barat, Sumba
Timur, Timor Tengah
Selatan, Kupang, Timor
Tengah Utara, Belu,
Lembata, Sikka,
Manggarai, Rote Ndao,
Manggarai Barat, Alor,
Ende.
Sumba Barat, Sumba
Timur, Timor Tengah
Selatan, Kupang, Timor
Tengah Utara, Belu,
Lembata, Sikka,
Manggarai, Rote Ndao,
Manggarai Barat, Alor,
Ende, Flores Timur, Ngada.
Sumbawa, Bima, Sumbawa
Barat, Kupang,Timor
Tengah Utara, Belu,
Alor,Lembata, FloresTimur,
Sikka, Ende, Ngada,
Manggarai, Rote Ndao,
Manggarai Barat.
2 Lombok Barat, Lombok
Tengah, Lombok Timur,
Sumbawa, Dompu, Bima,
Sumbawa Barat, Flores
Timur, Ngada.
Lombok Barat, Lombok
Tengah, Lombok Timur,
Sumbawa, Dompu, Bima,
Sumawa Barat.
Lombok Barat, Lombok
Tengah, Lombok Timur,
Dompu, Sumba Barat,
Sumba Timur, Timor Tengah
Selatan.
3 Jembrana, Tabanan,
Badung, Gianyar,
Klungkung, Bangli,
Buleleng, Karang Asem.
Jembrana, Tabanan,
Badung, Gianyar,
Klungkung, Bangli,
Buleleng, Karang Asem.
Jembrana, Tabanan, Badung,
Gianyar, Klungkung, Bangli,
Buleleng, Karang Asem.
32
Lampiran 9 Bobot optimal dari SOM sebagai initial centroid bagi K-means
Cluster Listrik Air
Buta
Huruf Kemiskinan Jalan Kesehatan
BB bayi di bawah
standar Angka harapan hidup
Rasio
konsumsi
1 0.9822 0.8199 -0.4938 0.6983 0.7253 0.7399 0.8027 -0.0679 0.2467
2 -0.4380 -0.7734 0.2538 0.1996 -0.2888 -0.5790 0.0702 -0.9809 -0.3844
3 -1.1034 -0.4622 0.5169 -1.3593 -0.8537 -0.5510 -1.3833 1.2138 0.0317
33
Lampiran 10 Penilaian setiap indikator
Prioritas ke-
Nilai Indikator
Listrik Air Buta
Huruf
Kemiskinan Jalan Kesehatan Berat Bayi
Kurang
Harapan
Hidup
Konsumsi
Normatif
1 >50 >70 >40 >35 >30 >60 >30 <58 >.15
2 40-50 60-70 30-40 25-35 25-30 50-60 20-30 58-61 1.25-1.5
3 30-40 50-60 20-30 20-25 20-25 40-50 61-64 1.0-1.25
4 20-30 40-50 10-20 15-20 15-20 30-40 64-67 0.7-1.0
5 10-20 30-40 5-10 10-15 10-15 20-30 10-20 67-70 0.5-0.7
6 <10 <30 <5 <10 <10 <20 <10 >70 <0.5