cluster sampling
DESCRIPTION
statistikaTRANSCRIPT
TUGAS STATISTIKA
REVIEW JURNAL
CLUSTER SAMPLING
“ Penggunaan Cluster-Based Sampling Untuk Penggalian Kaidah Asosiasi Multi Objektif “
Disusun Oleh :
AGUNG MUHARAM
G1F009028
KEMENTERIAN PENDIDIKAN DAN KEBUDAYAAN
UNIVERSITAS JENDERAL SOEDIRMAN
FAKULTAS KEDOKTERAN DAN ILMU-ILMU KESEHATAN
JURUSAN FARMASI
PURWOKERTO
2013
Cluster Sampling adalah teknik pengambilan sampel dimana pemilihan mengacu pada
kelompok bukan pada individu. Cara seperti ini baik sekali untuk dilakukan apabila tidak
terdapat atau sulit menentukan / menemukan kerangka sampel meski dapat juga dilakukan pada
populasi yang kerangka sampel sudah ada.
Pengambilan sampel dengan cara Cluster umum dilakukan pada populasi yg bersifat
terbatas (Finit) sementara itu untuk populasi yg jumlah dan identitas anggota populasi tak
diketahui (Infinit) pengambilan sampel biasa dilakukan secara tak acak (Non random Sampling).
Adapun yg termasuk pada cara ini adalah :
Quota Sampling : yaitu penarikan sampel yang hanya menekankan pada jumlah sampel
yang harus dipenuhi.
Purposive Sampling : yaitu pengambilan sampel hanya pada individu yg didasarkan
pada pertimbangan dan karakteristik tertentu.
Accidental Sampling : yaitu pengambilan sampel dengan jalan mengambil individu
siapa saja yang dapat dijangkau atau ditemui.
Pada Jurnal ini menggunakan metode Cluster Sampling, karena Clustering merupakan
salah satu metode data mining yang bersifat tanpa arahan (unsupervised). Clustering data adalah
proses dari pengelompokkan data berdasarkan similaritas atau kesamaan antara data. Similaritas
clustering dapat diaplikasikan untuk beberapa bidang, misalnya di bidang penelitian pasar,
clustering digunakan untuk membagi populasi umum dari konsumen-konsumen ke dalam
segmen pasar, pembagian pasar dan menentukan sasaran pasarnya.
Pada umumnya data yang digunakan untuk penggalian kaidah asosiasi sangatlah besar dan
terdapat variasi data yang sangat tinggi. Hal ini dapat mengurangi kualitas dari kaidah yang
dihasilkan. Oleh karena itu, pada penelitian ini digunakan cluster-based sampling untuk
melakukan clustering data, agar data yang digunakan untuk penggalian kaidah asosiasi sudah
terklaster dengan baik. Kemudian dari data yang terklaster tersebut, dilakukan pengambilan
sampel yang digunakan untuk penggalian kaidah asosiasi. Dengan menggunakan teknik
sampling ini diharapkan dapat meningkatkan kualitas dari kaidah yang dihasilkan. Permasalahan
yang dirumuskan dalam penelitian ini adalah bagimana membandingkan kualitas kaidah-kaidah
yang dihasilkan pada proses penggalian kaidah asosiasi multi obyektif antara data yang dicluster
dengan data yang tidak di-cluster, serta bagaimana mengetahui algoritma yang lebih baik antara
algoritma K-Means dan Fuzzy C Means untuk penggalian kaidah asosiasi multi obyektif. Adapun
tujuan dari penelitian ini adalah penggunaan cluster-based sampling untuk penggalian kaidah
asosiasi multi obyektif untuk membandingkan kualitas kaidah-kaidah yang dihasilkan pada
proses penggalian kaidah asosiasi multi obyektif antara data yang dicluster dengan data yang
tidak di-cluster. Dalam hal ini kualitas dari kaidah yang lebih baik adalah yang mempunyai rata-
rata nilai confidence yang lebih tinggi. Serta membandingkan algoritma K-Means dan Fuzzy C-
Means untuk penggalian kaidah asosiasi multi obyektif.
Manfaat penelitian yang diajukan adalah bahwa data yang di-cluster akan menghasilkan
kaidah-kaidah yang lebih berkualitas dibandingkan dengan data yang tidak melalui proses
clustering. Dan mengetahui algoritma clustering yang lebih baik antara K-Means dan Fuzzy C-
Means untuk penggalian kaidah asosiasi multi obyektif.