tugas research logy 7mei2012 fitri&souvenir

Upload: souvenir-iddha-wulandari

Post on 05-Apr-2018

216 views

Category:

Documents


0 download

TRANSCRIPT

  • 7/31/2019 Tugas Research logy 7mei2012 Fitri&Souvenir

    1/12

    TUGAS RESEARCH METODOLOGY07 Mei 2012

    Fitri Rahayu Pasaribu (109400017)

    Souvenir Iddha Wulandari (109400045)

    Kelas A 2009

    -------------------------------------------------------------------

    CLUSTER ANALYSIS

    1. PengertianAnalisis cluster merupakan teknik multivariat yang mempunyai tujuan utama untuk

    mengelompokkan objek-objek berdasarkan karakteristik yang dimilikinya. Analisis

    cluster mengklasifikasi objek sehingga setiap objek yang paling dekat kesamaannya

    dengan objek lain berada dalam cluster yang sama. Cluster-cluster yang terbentuk

    memiliki homogenitas internal yang tinggi dan heterogenitas eksternal yang tinggi.

    Berbeda dengan teknik multivariat lainnya, analisis ini tidak mengestimasi set variabel

    secara empiris sebaliknya menggunakan set variabel yang ditentukan oleh peneliti itu

    sendiri. Fokus dari analisis cluster adalah membandingkan objek berdasarkan set variabel,

    hal inilah yang menyebabkan para ahli mendefinisikan set variabel sebagai tahap kritis

    dalam analisis cluster. Set variabel cluster adalah suatu set variabel yang

    merepresentasikan karakteristik yang dipakai objek-objek. Bedanya dengan analisis

    faktor adalah bahwa analisis cluster terfokus pada pengelompokan objek sedangkan

    analisis faktor terfokus pada kelompok variabel.

    Solusi analisis cluster bersifat tidak unik, anggota cluster untuk tiap

    penyelesaian/solusi tergantung pada beberapa elemen prosedur dan beberapa solusi yang

  • 7/31/2019 Tugas Research logy 7mei2012 Fitri&Souvenir

    2/12

    berbeda dapat diperoleh dengan mengubah satu elemen atau lebih. Solusi cluster secara

    keseluruhan bergantung pada variabel-variaabel yang digunakan sebagai dasar untuk

    menilai kesamaan. Penambahan atau pengurangan variabel-variabel yang relevan dapat

    mempengaruhi substansi hasil analisis cluster.

    2. Langkah-Langkah PengerjaanSebagaimana teknik multivariat lain proses analisis cluster dapat dijelaskan dalam enam tahap

    sebagai berikut :

    Tahap Pertama : Tujuan Analisis Cluster

    Tujuan utama analisis cluster adalah mempartisi suatu set objek menjadi dua kelompok atau

    lebih berdasarkan kesamaan karakteristik khusus yang dimilikinya.

    Dalam pembentukan kelompok/cluster dapat dicapai tiga tujuan, yaitu :

    A. Deskripsi klasifikasi (taxonomy description)

    Penerapan analisis cluster secara tradisisonal bertujuan mengeksplorasi dan membentuk suatu

    klasisfikasi/taksonomi secara empiris. Karena kemampuan partisinya analisis cluster dapat

    diterapkan secara luas. Meskipun secara empiris merupakan teknik eksplorasi analisis cluster

    dapat pula digunakan untuk tujuan konfirmasi.

    a. Penyederhanaan DataPenyederhanaan data merupakan bagian dari suatu taksonomi. Dengan struktur yang terbatas

    observasi/objek dapat dikelompokkan untuk analisis selanjutnya.

    b. Identifikasi Hubungan (Relationship Identification)Hubungan antar objek diidentifikasi secara empiris. Struktur analisis cluster yang sederhana dapat

    menggambarkan adanya hubungan atau kesamaan dan perbedaan yang tidak dinyatakan

    sebelumnya.

    Pemilihan pada Pengelompokan Variabel

    Tujuan analisis cluster tidak dapat dipisahkan dengan pemilihan variabel yang digunakan

    untuk menggolongkan objek ke dalam clucter-cluster. Cluster yang terbentuk merefleksikan

    struktur yang melekat pada data seperti yang didefinisikan oleh variabel-variabel. Pemilihan

    variabel harus sesuai dengan teori dan konsep yang umum digunakan dan harus rasional.

    Rasionalitas ini didasarkan pada teori-teori eksplisit atau penelitian sebelumnya. Variabel-

    variabel yang dipilih hanyalah variabel yang dapat mencirikan objek yang akan dikelompokkan

    dan secara spesifik harus sesuai dengan tujuan analisis cluster.

  • 7/31/2019 Tugas Research logy 7mei2012 Fitri&Souvenir

    3/12

    Tahap Kedua : Desain Penelitian dalam Analisis Cluster

    Tiga hal penting dalam tahap ini adalah pendeteksian outlier, mengukur kesamaan, dan

    standarisasi data.

    A. Pendeteksian Outlier

    Outlier adalah suatu objek yang sangat berbeda dengan objek lainnya. Outlier dapat digambarkan

    sebagai observasi yang secara nyata kebiasaan, tidak mewakili populasi umum, dan adanya

    undersampling dapat pula memunculkan outlier. Outlier menyebabkan menyebabkan struktur

    yang tidak benar dan cluster yang terbentuk menjadi tidak representatif.

    B. Mengukur Kesamaan antar Objek

    Konsep kesamaan adalah hal yang fundamental dalam analisis cluster. Kesamaan antar objek

    merupakan ukuran korespondensi antar objek. Ada tiga metode yang dapat diterapkan, yaitu

    ukuran korelasi, ukuran jarak, dan ukuran asosiasi.

    a. Ukuran KorelasiUkuran ini dapat diterapkan pada data dengan skala metrik, namun jarang digunakan karena

    titik bertnya pada nilai suatu pola tertentu, padahal tisik berat analisis cluster adalah besarnya

    objek. Kesamaan antar objek dapat dilihat dari koefisien korelasi antar pasangan objek yang

    diukur dengan beberapa variabel.

    b. Ukuran JarakMerupakan ukuran yang paling sering digunakan. Diterapkan untuk data berskala metrik.

    Sebenarnya merupakan ukuran ketidakmiripan, dimana jarak yang besar menunjukkan sedikit

    kesamaan sebaliknya jarak yang pendek/kesil menunjukkan bahwa suatu objek makin mirip

    dengan objek lain. Bedanya dengan ukuran korelasi adalah bahwa ukuran jarak fokusnya pada

    besarnya nilai. Cluster berdasarkan ukuran korelasi bisa saja tidak memiliki kesamaan nilai tapi

    memiliki kesamaan pola, sedangkan cluster diberdasarkan ukuran jarak lebih memiliki kesamaan

    nilai meskipun polanya berbeda.

    Ada beberapa tipe ukuran jarak antara lain jarak Euklidian, jarak city-Box, dan jarak

    Mahalanobis. Ukuran yang paling sering digunakan adalah jarak Euklidian. Jarak Euklidian

    adalah besarnya jarak suatu garis lurus yang menghubungkan antar objek. Misalkan ada dua objek

    yaitu A dengan koordinat ( ) dan B dengan koordinat ( ) maka jarak antar kedua objek tersebut

    dapat diukur dengan rumus ....

    c. Ukuran AsosiasiUkuran asosiasi dipakai untuk mengukur data berskala nonmetrik (nominal atau ordinal).

  • 7/31/2019 Tugas Research logy 7mei2012 Fitri&Souvenir

    4/12

  • 7/31/2019 Tugas Research logy 7mei2012 Fitri&Souvenir

    5/12

  • 7/31/2019 Tugas Research logy 7mei2012 Fitri&Souvenir

    6/12

    Dalam metode ini jarak antara dua cluster adalah jumlah kuadrat antara dua cluster untuk

    seluruh variabel. Metode ini cenderung digunakan untuk mengkombinasi cluster-cluster dengan

    jumlah kecil.

    e. Metode Centroid

    Jarak antara dua cluster adalah jarak antar centroid cluster tersebut. Centroid cluster

    adalah nilai tengah observasi pada variabel dalam suatu set variabel cluster. Keuntungannya

    adalah outlier hanya sedikit berpengaruh jika dibandingkan dengan metode lain.

    B. Metode Non Hirarkhi

    Masalah utama dalam metoda non hirarkhi adalah bagaimana memilih bakal cluster.

    Harus disadari pengaruh pemilihan bakal cluster terhadap hasil akhir analisis cluster. Bakal

    cluster pertama adalah observasi pertama dalam set data tanpa missing value. Bakal kedua adalah

    observasi lengkap berikutnya (tanpa missing data) yang dipisahkan dari bakal pertama oleh jarak

    minimum khusus.

    Ada tiga prosedur dalam metode non hirarkhi, yaitu :

    a. Sequential thresholdMetode ini dimulai dengan memilih bakal cluster dan menyertakan seluruh objek dalam jarak

    tertentu. Jika seluruh objek dalam jarak tersebut disertakan, bakal cluster kedua terpilih,kemudian proses terus berlangsung seperti sebelumnya.

    b. Parallel ThresholdMetode ini memilih beberapa bakal cluster secara simultan pada permulaannya dan menandai

    objek-objek dengan jarak permulaan ke bakal terdekat.

    c. OptimalisasiMetode ketiga ini mirip dengan kedua metode sebelumnya kecuali pada penandaan ulang

    terhadap objek-objek.

    Hal penting lain dalam tahap keempat adalah menentukan jumlah cluster yang akan dibentuk.

    Sebenarnya tidak ada standar, prosedur pemilihan tujuan eksis. Karena tidak ada kriteria statistik

    internal digunakan untuk inferensia, seperti tes signifikansi pada teknik multivariat lainnya, para

    peneliti telah mengembangkan beberapa kriteria dan petunjuk sebagai pendekatan terhadap

    permasalahan ini dengan memperhatikan substansi dan aspek konseptual.

  • 7/31/2019 Tugas Research logy 7mei2012 Fitri&Souvenir

    7/12

    Tahap Kelima : Interpretasi terhadap Cluster

    Tahap interpretasi meliputi pengujian tiap cluster dalam term untuk menamai dan menandai

    dengan suatu label yang secara akurat dapat menjelaskan kealamian cluster. Proses ini dimulai

    dengan suatu ukuran yang sering digunakan yaitu centroid cluster.

    Membuat profil dan interpretasi cluster tidak hanya untuk memperoleh suatu gambaran saja

    melainkan pertama, menyediakan suatu rata-rata untuk menilai korespondensi pada cluster yang

    terbentuk, kedua, profil cluster memberikan arahan bagi penilaian terhadap signifikansi praktis.

    Tahap Keenam: Proses Validasi dan Pembuatan Profil (PROFILING) Cluster

    A. Proses validasi solusi cluster

    Proses validasi bertujuan menjamin bahwa solusi yang dihasilkan dari analisis cluster

    dapat mewakili populasi dan dapat digeneralisasi untuk objek lain. Pendekatan ini

    membandingkan solusi cluster dan menilai korespondensi hasil. Terkadang tidak dapat

    dipraktekkan karena adanya kendala waktu dan biaya atau ketidaktersediaan objek untuk analisis

    cluster ganda.

    B. Pembuatan Profil (PROFILING) Solusi Cluster

    Tahap ini menggambarkan karakteristik tiap cluster untuk menjelaskan cluster-cluster tersebut

    dapat dapat berbeda pada dimensi yang relevan. Titik beratnta pada karakteristik yang secara

    signifikan berbeda antar clustre dan memprediksi anggota dalam suatu cluster khusus.

    Secara keseluruhan proses analisis cluster berakhir setelah keenam tahap ini dilalui. Hasil

    analisis cluster dapat digunakan untuk berbagai kepentingan sesuai dengan materi yang dianalisis.

    3. Aplikasi Segmentasi Pasar Konsumen Memahami Perilaku Pembeli. Mengidentifikasi peluang produk baru Memilih pasar mana yang akan dituju (targeting). Meringkas data atau Mereduksi data.

    4. Contoh-contohContoh: Berdasarkan data BPS pada laporan Sosial Indonesia dari Supas dan Sakernas 1995

    didapatkan data seperti pada tabel 1.

    Mengingat penduduk lansia semakin lama semakin banyak, didasarkan perkiraan BPS pada

    tahun 2005 penduduk lansia cenderung bertambah atau ada perubahan struktur dari struktur penduduk

  • 7/31/2019 Tugas Research logy 7mei2012 Fitri&Souvenir

    8/12

    muda ke struktur penduduk tua. Maka dari itu perlu adanya perhatian ekstra dari pihak pemerintah

    untuk permsalahan ini.

    Pembentukan wilayah pembinaan untuk permasalahan lansia dapat dilakukan dengan

    membentuk wilayah konsentrasi berdasarkan data pada tabel 1. Model analisis cluster sangat

    mendukung penbentukan wilayah tersebut.

    Tabel. 1

    Enam Kriteria Keterlantara Lansia Menurut Propinsi

    PROPINSI

    tidak pernah

    sekolah/tamat

    SD

    makan

    makanan

    pokok

  • 7/31/2019 Tugas Research logy 7mei2012 Fitri&Souvenir

    9/12

    TENGGARA

    TIMUR

    KALIMANTAN

    BARAT83,48 54,34 38,60 29,46 3,87 7,51

    KALIMANTAN

    TIMUR60,37 50,29 18,78 28,13 6,69 2,68

    KALIMANTAN

    SELATAN76,93 38,72 16,65 29,37 2,77 7,07

    KALIMANTAN

    TENGAH73,43 52,45 18,18 12,72 1,11 1,01

    SULAWESI

    UTARA51,30 58,14 25,58 11,08 1,84 2,89

    SULAWESI

    TENGAH66,01 54,47 16,29 32,81 2,47 8,66

    SULAWESI

    SELATAN77,62 58,74 10,93 24,03 3,70 6,89

    SULAWESI

    TENGGARA74,65 72,91 3,19 17,78 1,07 8,78

    IRIAN JAYA 52,32 70,04 30,37 16,84 6,58 18,62

    Dalam melakukan analisis cluster terdapat dua metode yaitu metode kelompok hiraki dan

    metode kelompok non hirarki.

    Dalam hal ini metode yang digunakan adalah metode hiraki karena paling banyak digunakan

    oleh para peneliti dan memiliki keunggulan tersendiri, yaitu pengelompokan yang terbentuk dapat

    terjadi secara alamiah.

    Berdasarkan hasil pengolahan didapatkan Hasil sebagai berikut:

    Dilihat dari kemiripan dalam melakukan pengklusteran propinsi Jambi dengan Sumatera

    Utara mempunyai jarak 2,241. sedang propinsi Jambi dengan Sumatera Selatan berjarak 7,830. Jadi

    karakteristik lansia terlantar di propinsi Jambi dengan Sumatera Utara lebih mirip bila dibandingkan

    dengan propinsi Jambi dengan Sumatera Selatan. Demikian pula kemiripan propinsi-propinsi lainnya

    dapat dilihat dengan melihat kedekatan jaraknya. Semakin dekat jaraknya berarti semakin mirip.

  • 7/31/2019 Tugas Research logy 7mei2012 Fitri&Souvenir

    10/12

    Agglom eration Schedule

    3 19 .390 0 0 11

    10 12 .788 0 0 5

    11 13 1.188 0 0 15

    4 6 1.759 0 0 9

    10 18 2.758 2 0 12

    2 20 3.828 0 0 11

    5 17 4.909 0 0 18

    21 22 6.047 0 0 14

    1 4 7.473 0 4 10

    1 7 9.159 9 0 17

    2 3 11.209 6 1 1710 14 13.356 5 0 15

    9 16 16.215 0 0 16

    21 23 19.278 8 0 16

    10 11 22.930 12 3 19

    9 21 28.014 13 14 18

    1 2 35.627 10 11 19

    5 9 45.231 7 16 20

    1 10 56.362 17 15 23

    5 15 69.666 18 0 21

    5 24 86.659 20 0 22

    5 8 108.660 21 0 231 5 138.000 19 22 0

    Stage1

    2

    3

    4

    5

    6

    7

    8

    9

    10

    1112

    13

    14

    15

    16

    17

    18

    19

    20

    21

    2223

    Cluster 1 Cluster 2

    Cluster Combined

    Coeff icients Cluster 1 Cluster 2

    Stage Cluster First

    Appears

    Next Stage

    Dari tabel 3., kita bisa melihat bahwa aglomerasi melakukan pengelompokkan secara satu

    demi satu. Pada tahap 1 (stage 1) kasus nomor 3 (propinsi ke 3) dan 19 (propinsi ke 19) adalah yang

    paling mirip, maka mereka menjadi kelompok terlebih dahulu. Kemudian lihat kolom next stage pada

    baris pertama, yang merupakan kelanjutan stage untuk cluster. Terlihat stage 14 yang berarti stage

    dilanjutkan ke stage 14.

    Pada stage 14 terlihat bahwa angka 3 (propinsi 3) dan 11 (propinsi 11) hal ini berarti bahwa

    propinsi 11 masuk pada kelompok 1 yang terbentuk yaitu 3 dan 19. dengan demikian sudah diketahui

    bahwa ada 3 anggota yang sudah diketahui clusternya. Kemudian lihat next stage pada baris ke 14.

    dimana cluster terakhir dilakukan. Terlihat angka 17, yang berarti proses cluster dilanjutkan ke stage

    17. demikian selanjutnya sampai semua cluster terbentuk.

    Tabel 3.

    Agglomerasion Schedule

  • 7/31/2019 Tugas Research logy 7mei2012 Fitri&Souvenir

    11/12

    Bila melihat keanggotaan kluster, terdapat perubahan letak propinsi dalam cluster, seperti

    propinsi Irian jaya yang semula berada dalam kelompok 4 manjadi kelompok 2 dalam cluster 3.

    Sedang untuk jumlah cluster 2 terdapat perubahan cluster untuk propinsi Jakarta yang semula ada

    pada cluster 3 menjadi cluster 2.

    Perubahan-perubahan ini dapat dilihat pada tabel dibawah ini.

    Tabel 4

    Keanggotaan Kluster

    Secara visual hasil pengelompokan dapat dilihat pada dendogram di tabel 5. Pengelompokan

    propinsi propinsi untuk lansia terlantar dapat dibagi atas beberapa kelompok. Penentuan banyaknya

    kelompok dapat dilihat dari karakteristik masing-masing wilayah propinsi.

    Cluster Mem bers hip

    1 1 1

    1 1 1

    1 1 1

    1 1 1

    2 2 2

    1 1 1

    1 1 1

    3 3 2

    2 2 2

    1 1 1

    1 1 1

    1 1 1

    1 1 1

    1 1 1

    2 2 2

    2 2 2

    2 2 2

    1 1 1

    1 1 11 1 1

    2 2 2

    2 2 2

    2 2 2

    4 2 2

    Case

    1:SUMATERA UTARA

    2:SUMATERA BARAT

    3:RIAU

    4:JAMBI

    5:SUMATERA SELATAN

    6:BENGKULU

    7:LAMPUNG

    8:DKI JAKARTA

    9:JAWA BARAT

    10:JAWA TENGAH

    11:D.I. YOGYAKARTA

    12:JAWA TIMUR

    13:BALI

    14:NUSA TENGGARA

    BARAT

    15:NUSA TENGGARA

    TIMUR

    16:KALIMANTAN BARAT

    17:KALIMANTAN TIMUR

    18:KALIMANTAN

    SELATAN

    19:KALIMANTAN TENGAH20:SULAWESI UTARA

    21:SULAWESI TENGAH

    22:SULAWESI SELATAN

    23:SULAWESI

    TENGGA RA

    24:IRIAN JAYA

    4 Clusters 3 Clusters 2 Clusters

  • 7/31/2019 Tugas Research logy 7mei2012 Fitri&Souvenir

    12/12

    Melihat dari karakteristik masing-masing wilayah ada beberapa 3 pengelompokan, yaitu:

    1. Jumlah 2 Kelompok yang terdiri dari kelompok pertama meliputi propinsi Sumatera Utara,Sumatera Barat, Riau, Jambi, Bengkulu, Lampung, Jawa Tengah, DI yokyakarta, Jawa Timur,

    Bali, NTB, Kal Teng, Kal Sel, Sulutdan kelompok kedua meliputi propinsi Sumatera Selatan,

    DKI jakarta, Jawa Barat, NTT, Kal bar, Kal Tim, Sulteng, Sultra dan Irian jaya

    2. Jumlah 3 Kelompok yang terdiri dari kelompok pertama meliputi propinsi Sumatera Utara,Sumatera Barat, Riau, Jambi, Bengkulu, Lampung, Jawa Tengah, DI yokyakarta, Jawa Timur,

    Bali, NTB, Kal Teng, Kal Sel, Sulut dan kelompok kedua meliputi propinsi Sumatera Selatan,

    Jawa Barat, NTT, Kal bar, Kal Tim, Sulteng, Sultra dan Irian jaya. Untuk Kelompok ketiga

    adalah propinsi DKI Jakarta.

    3. Jumlah 4 Kelompok yang terdiri dari kelompok pertama meliputi propinsi Sumatera Utara,Sumatera Barat, Riau, Jambi, Bengkulu, Lampung, Jawa Tengah, DI yokyakarta, Jawa Timur,

    Bali, NTB, Kal Teng, Kal Sel, Sulut dan kelompok kedua meliputi propinsi Sumatera

    Selatan,Jawa Barat, NTT, Kal bar, Kal Tim, Sulteng, Sultra. Kelompok Ketiga adalad DKI

    jakarta dan kelompok keempat adalah propinsi paling timur Irian Jaya.

    Dengan melihat hasil pengelompokan diatas maka lebih baik pengelompokan yang diambil

    adalah dengan jumlah 4 kelompok. Pengambilam 4 kelompok didasarkan pada karakteristik propinsi

    DKI Jakarta pada kelompok tiga berbeda dengan propinsi lainnya, juga perbedaan karakteristik untuk

    propinsi Irian Jaya pada kelompok keempat.