model bayes untuk pendugaan area kecil dengan penarikan ... · peluang penarikan contoh dalam...
TRANSCRIPT
MODEL BAYES UNTUK PENDUGAAN AREA KECIL DENGAN PENARIKAN CONTOH
BERPELUANG TIDAK SAMA PADA KASUS RESPON BINOMIAL DAN MULTINOMIAL
APLIKASI : PENDUGAAN INDEKS PENDIDIKAN LEVEL
KECAMATAN DI JAWA TIMUR
AGNES TUTI RUMIATI G161080031 / STK
SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR
2 0 1 2
MODEL BAYES UNTUK PENDUGAAN AREA KECIL
DENGAN PENARIKAN CONTOH BERPELUANG TIDAK SAMA PADA KASUS RESPON BINOMIAL
DAN MULTINOMIAL
APLIKASI : PENDUGAAN INDEKS PENDIDIKAN LEVEL
KECAMATAN DI JAWA TIMUR
Oleh: AGNES TUTI RUMIATI
G161080031 / STK
Disertasi sebagai salah satu syarat untuk memperoleh gelar Doktor
pada Program Studi Statistika
SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR
2 0 1 2
J u d u l : Model Bayes untuk Pendugaan Area Kecil dengan
Penarikan Contoh Berpeluang Tidak Sama pada Kasus Respon Binomial dan Multinomial. Aplikasi : Pendugaan Indeks Pendidikan Level Kecamatan di Jawa Timur
Nama Mahasiswa : Agnes Tuti Rumiati Nomor Pokok : G161080031 Program Studi : Statistika
Menyetujui:
Komisi Pembimbing
K e t u a Prof. Dr. Ir. Khairil A. Notodiputro, MS
Dr. Ir. I Wayan Mangku, MSc A n g g o t a A n g g o t a
Dr. Ir. Kusman Sadik, MS.
Mengetahui:
Koordinator Program Studi Statistika Dekan Sekolah Pascasarjana Dr. Ir. Aji Hamim Wigena, MSc. Dr. Ir. Dahrul Syah, MSc.Agr
PERNYATAAN MENGENAI DISERTASI DAN SUMBER INFORMASI
Dengan ini saya menyatakan bahwa disertasi yang berjudul Model Bayes
untuk Pendugaan Area Kecil dengan Penarikan Contoh Berpeluang Tidak Sama Pada Kasus Respon Binomial dan Multinomial adalah hasil karya saya sendiri dengan arahan komisi pembimbing dan belum pernah diajukan kepada perguruan tinggi manapun. Sumber informasi yang berasal atau dikutip dari karya penulis lain telah dicantumkan di dalam teks dan daftar pustaka disertasi ini.
Bogor, September 2012
Agnes Tuti Rumiati
NIM. G161080031/STK
ABSTRACT
AGNES TUTI RUMIATI. Bayesian Models for Small Area Estimation Based on Unequal Probability Sampling of Binomial and Multinomial Responses. Under guidance of KHAIRIL ANWAR NOTODIPUTRO, I WAYAN MANGKU and KUSMAN SADIK
In this research a Bayesian Method of Small Area Estimation (SAE) has been developed based on binomial and multinomial response variables using Susenas data obtained from unequal probability sampling. Case study was carried out to predict education level of the population measured by literacy rate and mean years of schooling in sub-district level in East Java Province. The SAE model for binomial response was developed with two methods, i.e. using weighted logit normal mixed model and involving the probability of sampling selection model as exponential function into the SAE model. A simulation study was carried out by implementing 100 times sampling selection into population data. Penalized Quasi Likelihood (PQL) and Restricted Maximum Likelihood method (REML) was used to parameter estimation of SAE model. Based on the simulation result, we found that the weighted logit normal mixed model gave the best estimate. In application, the weighted logit normal mixed model also provided good prediction of literacy rate in Sumenep and Pasuruan regency.For the multinomial respons, we applied the weighted logit multinomial mixed model. MSE estimation was used Jackknife method and it gave very small MSE of about 1,14 x10-7
.
Keywords: SAE model, Bayesian approach, binomial and multinomial response Monte
Carlo integration, literacy rate, Susenas, unequal probability sampling, logit normal mixed model, logit multinomial mixed model.
RINGKASAN
Berbagai survei umumnya dirancang untuk menduga parameter populasi
untuk area besar, misalnya untuk wilayah nasional atau regional (provinsi,
kabupaten/kota) dan pendugaan parameternya didasarkan pada rancangan atau
dikatakan sebagai pendugaan langsung. Untuk pendugaan parameter wilayah
yang lebih kecil, umumnya jumlah contoh kurang mencukupi jika digunakan
untuk menduga berdasarkan rancangan.
Di Indonesia, kebutuhan untuk melakukan pendugaan di area kecil mulai
dirasakan terutama untuk merancang dan mengevaluasi kebijakan dan program
pembangunan di level kabupaten /kota. Salah satu indikator yang mengukur hasil
pembangunan di suatu wilayah adalah Indeks Pembangunan Manusia (IPM).
IPM dihitung oleh Badan Pusat Satistik (BPS) dengan menggunakan data dasar
hasil Survai Sosial Ekonomi Nasional (Susenas). Susenas dilakukan oleh BPS
tiap tahun, dirancang untuk menduga parameter sosial-ekonomi level nasional
atau regional sehingga tidak cukup representatif untuk pendugaan parameter
tingkat kecamatan.
Penggunaan data Susenas untuk pendugaan parameter di tingkat
kecamatan atau desa akan menghadapi dua persoalan statistika yaitu:
1)terbatasnya jumlah data karena Susenas ditujukan untuk menduga parameter
berskala nasional atau regional (provinsi sampai kabupaten/kota). 2) penarikan
contohnya memiliki peluang tidak sama karena rancangan penarikan contoh
dalam Susenas adalah penarikan contoh gerombol dua tahap yaitu mengambil
blok sensus pada tahap pertama dan pada tahap ke dua mengambil rumah
tangga pada blok sensus yang terpilih. Oleh karena itu penarikan contoh dalam
Susenas memiliki peluang tidak sama.
Penelitian ini bertujuan untuk mengembangkan model SAE untuk
menduga Indeks Pendidikan yang merupakan salah satu komponen IPM. Indeks
Pendidikan diukur dengan angka melek huruf dan rata-rata lama sekolah di
suatu wilayah. Angka melek huruf diukur dengan proporsi penduduk berusia 10
tahun ke atas yang bisa baca tulis, sedangkan rata-rata lama sekolah diukur dari
proporsi penduduk berusia 10 tahun ke atas di tiap level pendidikan tertentu.
Proporsi penduduk berusia 10 tahun ke atas yang bisa baca tulis adalah
parameter dari sebuah distribusi Binomial, sedangkan proporsi penduduk
berusia 10 tahun ke atas di tiap level pendidikan tertentu merupakan parameter
dari distribusi Multinomial.
Dalam penelitian disertasi ini, pengembangan model SAE untuk peubah
respon Binomial dan Multinomial berbasis pada penarikan contoh berpeluang
tidak sama mengacu kepada beberapa penelitian tentang pengembangan model
SAE untuk peubah respon binomial dan multinomial, serta pengembangan model
SAE yang memperhitungkan peluang penarikan contoh. Pendugaan parameter
area dilakukan dengan menggunakan pendekatan Bayes.
Dengan melakukan simulasi, diperoleh bahwa model SAE untuk peubah
respon binomial menggunakan sebaran prior logit normal melalui pendekatan
Bayes empirik yang dikembangkan dengan memperhitungkan peluang penarikan
contoh memberikan penduga yang paling baik karena dapat menurunkan bias
dan KTG dari penduga. Dengan mengaplikasikan model SAE logit normal
terbobot melalui pendekatan Bayes, dihasilkan perbedaan antara nilai parameter
populasi dengan prediksinya relatif kecil. Kabupaten Sumenep memiliki rata-
rata bias sebesar 0,0628 dan nilai KTG sebesar 0,0149 dan untuk Kabupaten
Pasuruan rata-rata biasnya sebesar 0,0136 dengan KTG sebesar 0,0212.
Sementara itu metode pendugaan area kecil yang dikembangkan
berdasarkan penarikan contoh informatif yaitu dengan menyertakan model
peluang penarikan contoh dalam bentuk fungsi eksponensial memberikan rata-
rata bias relatif yang rendah namun memberikan akar rata-rata kuadrat bias
relatif maupun KTG yang lebih tinggi dibandingkan dengan metode pendugaan
menggunakan sebaran prior logit normal terbobot. Besarnya nilai KTG lebih
banyak disebabkan karena ragam pendugaan yang relatif besar sehingga
walaupun memberikan bias yang kecil maka KTG akan cenderung tinggi.
Penurunan bias dari model SAE eksponensial ini menunjukkan bahwa
memperhitungkan peluang penarikan contoh dalam model SAE akan dapat
menurunkan bias. Pfefferman (2010) mengatakan bahwa mengabaikan peluang
penarikan contoh dalam model SAE akan menghasilkan bias pendugaan karena
dengan mengabaikan peluang penarikan contoh, maka pendugaan parameter
model untuk area/unit yang terambil sebagai contoh sama dengan area/unit yang
tidak terambil sebagai contoh.
Berdasarkan hasil simulasi maupun aplikasi di Kabupaten Sumenep dan
Pasuruan membuktikan bahwa model SAE untuk peubah respon binomial
menggunakan model campuran logit normal terbobot memberikan hasil yang
paling akurat dalam pendugaan parameter proporsi area kecil.
Selanjutnya pendugaan area kecil untuk respon multinomial dilakukan
dengan cara yang sama yaitu melalui model campuran logit multinomial terbobot.
Pendugaan KTG dilakukan dengan menggunakan metode Jackknife. Dari hasil
aplikasi di Kabupaten Sumenep dan Pasuruan, penduga KTG untuk logit
multinomial terbobot melalui pendekatan Bayes juga memberikan nilai penduga
KTG yang sangat kecil yaitu pada kisaran antara 1,14 x 10-7 sampai 8,17 x10-7
karena pada mumnya kondisi blok sensus di tiap kecamatan relatif sama.
Besarnya KTG tersebut sangat dipengaruhi oleh homogenitas atau heterogenitas
dari nilai respon dari area yang satu ke area yang lain.
Dengan menggunakan metode Jackknife, nilai dugaan KTG untuk
pendugaan area kecil di tiap-tiap katagori bervariasi tergantung kepada
heterogenitas nilai dugaan proporsi dari area ke area. Semakin heterogen maka
akan menghasilkan nilai dugaan KTG yang cenderung lebih besar. Hal yang
sama juga ditemui pada pendugaan area kecil yang memperhitungkan peluang
penarikan contoh.
Besarnya KTG yang dihasilkan oleh metode SAE yang menyertakan
fungsi eksponensial dari peluang percontohan perlu dikaji lebih dalam karena
bias yang dihasilkan relatif sangat kecil sehingga kemungkinan besarnya KTG
disebabkan oleh ragam pendugaan yang besar. Perlu dikembangkan model yang
serupa tetapi dapat menurunkan ragam pendugaan.
@ Hak Cipta Institut Pertanian Bogor (IPB), Tahun 2012
Hak Cipta Dilindungi Undang-undang
1. Dilarang mengutip sebagian atau seluruhnya karya tulis ini tanpa
mencantumkan atau menyebutkan sumber:
a. Pengutipan hanya untuk kepentingan pendidikan, penelitian,
penulisan karya ilmiah, penyusunan laporan, penulisan kritik atau
tinjauan suatu masalah
b. Pengutipan tidak merugikan kepentingan yang wajar IPB
2. Dilarang mengumumkan atau memperbanyak sebagian atau seluruh
karya tulis ini dalam bentuk apapun tanpa ijin IPB.
PRAKATA
Puji syukur penulis panjatkan kehadirat Allah SWT, karena atas rahmat dan
hidayah-Nyalah akhirnya disertasi dengan judul “Model Bayes untuk Pendugaan
Area Kecil dengan Penarikan Contoh Berpeluang Tidak Sama Pada Kasus
Respon Binomial dan Multinomial”, dengan aplikasi Pendugaan Indeks
Pendidikan Level Kecamatan di Jawa Timur ini dapat diselesaikan dengan baik.
Selain untuk memenuhi syarat memperoleh gelar doktor pada program
studi Statistika-IPB, disertasi ditujukan untuk menghasilkan metode statistik yang
dapat digunakan oleh pemerintah atau pihak lain untuk melakukan pendugaan
area kecil yang memiliki jumlah data terbatas tanpa perlu menambah contoh
dengan memanfaatkan informasi yang ada sehingga dapat mengurangi biaya
penelitian.
Selama pelaksanaan penelitian dan penyelesaian disertasi ini, penulis
banyak mendapatkan bantuan dari berbagai pihak baik secara moril dan meteriil
sehingga disertasi ini dapat terselesaikan dengan baik. Pada kesempatan ini
secara khusus penulis mengucapkan terima kasih kepada :
1. Bapak Prof. Dr. Ir. Khairil Anwar Notodiputro, Bapak Dr. I Wayan
Mangku dan Bapak Dr Kusman Sadik selaku dosen pembimbing yang
telah banyak memberikan arahan, bimbingan dan saran hingga
disertasi ini bias diselesaikan dengan baik.
2. Seluruh dosen dan karyawan Departemen Statistika FMIPA IPB yang
telah menjadi teman diskusi, memberikan saran dan dorongan moril.
3. Seluruh dosen dan karyawan Sekolah Pascasarjana IPB yang telah
memberikan layanan pengajaran dan administrasi yang baik.
4. Seluruh dosen dan karyawan Jurusan Statistika FMIPA ITS,
5. Para peneilti dan karyawan BPS Pusat dan Provinsi Jawa Timur yang
banyak membantu memberikan data dan penjelasan terkait data
Susenas dan Sensus Penduduk
6. Para peneiliti dan karyawan Pusat Penelitian Potensi daerah dan
Pemberdayaan Masyarakat (PDPM), LPPM-ITS yang telah
memberikan bantuin moril dan materiil selama penulis melaksanakan
studi S3 dan menyelesaikan penelitian disertasi
7. Suami dan anak-anak tercinta serta seluruh keluarga yang senantiasa
memberikan dorongan semangat, doa yang ikhlas dan telah
mendampingi penulis selama studi S3 dan menyelesaikan penelitian
disertasi.
8. Teman-teman sesama mahasiswa program Pasca Sarjana di
Departemen Statistika-IPB serta berbagai pihak lain yang tidak dapat
penulis sebutkan satu persatu.
Akhir kata, dengan segala kerendahan hati, penulis menyadari bahwa
disertasi ini masih jauh dari sempurna, oleh karena itu penulis sangat
mengharapkan saran dan masukan yang bermanfaat untuk memperbaiki tulisan
disertasi ini. Namun demikian, penulis berharap tulisan ini dapat bermanfaat bagi
mereka yang memerlukannya. Semoga Allah SWT senantiasa memberikan
kebaikan untuk kita semua.
Bogor, September 2012
Agnes Tuti Rumiati
RIWAYAT HIDUP
Penulis dilahirkan di kota Mojokerto, Jawa Timur pada tanggal 24 Juli 1957 dari
pasangan Bapak JH Soeratman (alm) dan Ibu P Sri Woelan (alm). Penulis merupakan anak
pertama dari lima bersaudara dan menikah dengan Ir. Nus Irwansyah, MBA dan telah
dikaruniai dua anak yaitu Duta Perdana MA dan Rizqi Yoshita.
Pendidikan Sarjana ditempuh di Jurusan Matematika, FIPIA – ITS lulus pada tahun
1982 dengan pembimbing Bapak I Nyoman Latra, MS. Pada tahun 1996, penulis
memperoleh gelar Master of Science dari School of Mathematics and Statistics, The
University of Sheffield, United Kingdom dengan pembimbing tesis Professor John Biggins.
Sejak tahun 2008 penulis menempuh Program Doktor pada Program Studi Statistika
Sekolah Pascasarjana IPB. Sejak tahun 1985 sampai dengan saat ini penulis bekerja
sebagai dosen di Jurusan Statistika, FMIPA-ITS dan peneliti di Pusat Penelitian Potensi
daerah dan Pemberdayaan Masyarakat (PDPM), Lembaga Penelitian dan Pengabdian
Masyarakat (LPPM)-ITS. Selama mengikuti pendidikan Program Doktor, penulis telah menghasilkan beberapa
karya ilmiah yang telah dipublikasikan dalam seminar nasional serta jurnal ilmiah,
diantaranya :
1. Rumiati, AT, Notodiputro AK, Mangku IW dan Sadik K, 2012. Empirical Bayesian
Method for The Estimation of Literacy Rate at Sub-district Level. Case Study:
Sumenep District of East Java Province, IPTEK, The Journal for Technology and
Science, Vol. 23, No. 1, February 2012.
2. Rumiati, AT, Regresi Polinomial local untuk Data Survey Berskala Besar, Studi
kasus: Model Pengeluaran Rumah Tangga berdasarkan Data Susenas Jawa Timur
2006. Prosiding pada Seminar Nasional Statistika, 7 Nopember 2009. Jurusan ITS-
Surabaya.
i
DAFTAR ISI
Halaman
DAFTAR TABEL .......................................................................................... v
DAFTAR GAMBAR ...................................................................................... vi
DAFTAR LAMPIRAN .................................................................................. viii
I. Pendahuluan ....................................................................................... 1
1.1. Latar Belakang ............................................................................. 1
1.2. Tujuan Penelitian .......................................................................... 5
1.3. Ruang Lingkup ............................................................................. 5
1.4. Kebaruan ..................................................................................... 7
1.5. Sistematika Disertasi.................................................................... 8
II. Tinjauan pustaka ................................................................................ 11
2.1. Pendahuluan ................................................................................ 11
2.2 Model Dasar Pendugaan Area Kecil ............................................ 11
2.2.1. Pendugaan Area Kecil Berbasis Area ............................... 12
2.2.2. Pendugaan Area Kecil Berbasis Unit ................................ 13
2.3 Pendugaan Parameter Model Pendugaan Area kecil ................... 14
2.3.1. Metode Prediksi Tak-bias Linier Terbaik (PTLT) dan
Prediksi Tak-bias Linier Terbaik Empirik (PTLTE) ........... 14
2.3.2 Pendugaan Parameter Model SAE Melalui Pendekatan
Bayes................................................................................ 16
2.4. Peluang Penarikan Contoh .......................................................... 18
2.5. Model SAE dengan Memperhitungkan Peluang Penarikan
Contoh ......................................................................................... 21
2.6 Indeks Pembangunan Manusia (IPM) .......................................... 23
2.6.1. Cara Perhitungan IPM ...................................................... 24
2.6.2. Indikator Pendidikan/ Pengetahuan .................................. 26
2.7. Survei Sosial Ekonomi Nasional (Susenas) ................................. 27
2.7.1. Kerangka Percontohan dan Metode Penarikan Contoh .... 27
2.7.2. Penentuan Bobot .............................................................. 28
ii
III. Model Bayes untuk Pendugaan Area Kecil Berbasis Peubah Respon Binomial ................................................................................ 30
3.1 Pendahuluan ............................................................................... 30
3.2 Metode Pendugaan Langsung Melalui Pendekatan Bayes.......... 32
3.2.1. Pendugaan Bayes Menggunakan Sebaran Prior Beta .... 32
3.2.2. Pendekatan Bayes Menggunakan Sebaran Prior Logit-
Normal.............................................................................. 35
3.3. Metode Pendugaan Tak Langsung Melalui Pendekatan Bayes . . 36
3.4. Aplikasi : Pendugaan Angka Melek Huruf di Tingkat
Kecamatan, Kabupaten Sumenep Berbasis Data Susenas ......... 39
3.4.1. Pendugaan Langsung ...................................................... 40
3.4.2. Pendugaan Tak Langsung .............................................. 43
3.5. Pembahasan ............................................................................... 45
IV. Model SAE Berbasis Sebaran Respon Multinomial Melalui Pendekatan Bayes .............................................................................. 47
4.1. Pendahuluan .............................................................................. 47
4.2. Model SAE untuk Respon Multinomial ....................................... 48
4.2.1. Pendugaan Parameter Model ......................................... 49
4.2.2. Pendugaan Ragam ......................................................... 52
4.2.3. Pendugaan Parameter Area Melalui Pendekatan Bayes .
54
4.3. Aplikasi: Pendugaan Rata-Rata Lama Sekolah Tingkat
Kecamatan di Jawa Timur Berbasis Data Susenas 2010 ........... 56
4.3.1. Pengukuran Peubah Respon dan Peubah Penyerta ....... 56
4.3.2. Hasil Eksplorasi Data ...................................................... 57
4.3.3. Pendugaan Rata-rata Lama Sekolah di Tingkat
Kecamatan ..................................................................... 58
4.4. Pembahasan .............................................................................. 60
V. Model Bayes Pendugaan Area Kecil untuk Respon Binomial dan Multinomial Berbasis Penarikan Contoh Berpeluang Tidak Sama.....................................................................................................
62
5.1. Pendahuluan .............................................................................. 62
5.2. Penyertaan Peluang Penarikan Contoh pada Model SAE........... 63
iii
5.3. Pendugaan Area Kecil Menggunakan Model Campuran Linier
Terbobot ...................................................................................... 70
5.4. Pengembangan Model Bayes SAE Berbasis Penarikan Contoh
Berpeluang Tidak Sama untuk Respon Binomial ......................... 71
5.4.1. Penentuan Bobot ............................................................ 72
5.4.2. Metode Pendugaan Parameter Area Kecil dengan
Menyertakan Peluang Penarikan Contoh yang Bersifat
Eksponensial .................................................................. 73
5.4.3. Metode Pendugaan Parameter Area Kecil
menggunakan Model Linier Campuran Terbobot ........... 74
5.4.4. Evaluasi Terhadap Penduga............................................ 74
5.4.5. Simulasi............................................................................ 75
5.4.6. Aplikasi : Pendugaan Angka Melek Huruf di Kabupaten
Sumenep dan Kabupaten Pasuruan Provinsi Jawa
Timur............................................................................ 78
5.5 Model SAE Berbasis Penarikan Contoh Berpeluang Tidak
Sama Untuk Peubah Respon Multinomial .................................. 80
5.5.1. Pengembangan model SAE: Model Campuran Logit
Multinomial Terbobot........................................................ 80
5.5.2. Aplikasi: Pendugaan rata-rata lama sekolah di tingkat
kecamatan di Kabupaten Sumenep dan Kabupaten
Pasuruan..........................................................................
82
5.6. Perhitungan Indeks Pendidikan di Kabupaten Sumenep dan
Pasuruan ..................................................................................... 84
5.7 Pembahasan................................................................................ 86
5.7.1. Model SAE untuk respon Binomial dengan
memperhitungkan peluang penarikan contoh.................. 86
5.7.2. Model SAE untuk respon Multinomial dengan
memperhitungkan peluang penarikan contoh.................. 87
IV. Pembahasan ...................................................................................... 88
6.1. Pendahuluan………………………………………………………. 88
6.2. Perbandingan metode pendugaan langsung dan tak langsung
untuk pendugaan area kecil melalui pendekatan Bayes............ 88
iv
6.3. Pengaruh peluang penarikan contoh dalam Model SAE untuk
respon Binomial dalam peningkatan kualitas penduga............... 90
6.4. Pengembangan model SAE berbasis pada peubah respon
Multinomial dengan penarikan contoh berpeluang tidak sama... 90
VII Kesimpulan dan Saran ………………………………………………… 93
7.1. Kesimpulan…………………………………………………………. 93
7.2. Saran………………………………………………………………… 94
Daftar Pustaka …………………………………………………………………. 95
Daftar Istilah ……………………………………………………………………. 99
Lampiran ……………………………………………………………………….. 100
v
DAFTAR TABEL
Halaman
Tabel 2.1 Peubah dan sumber data dari masing-masing komponen IPM ... 24
Tabel 2.2. Nilai Maksimum dan Nilai Minimum Indikator Komponen IPM ..... 25 Tabel 2.3. Konversi tahun untuk tingkat/kelas pendidikan yang ditamatkan . 26
Tabel 3.2. Rata-rata pendugaan angka melek huruf dan KTG kecamatan di
Kabupeten Sumenep dan Kabupaten Pasuruan menggunakan
pendekatan Bayes ...................................................................... 46
Tabel 4.1. Klasifikasi tingkat pendidikan tertinggi penduduk usia 10 tahun
ke atas ........................................................................................... 56
Tabel 4.2. Rata-rata dugaan proporsi penduduk pada jenjang pendidikan
tertentu dan rata-rata nilai KTG dugaan tiap kecamatan di
Kabupaten Sumenep dan Kabupaten Pasuruan .......................... 58
Tabel 5.1. Nilai rata-rata bias relatif dan rata-rata kuadrat bias relatif untuk
model terbobot dan model eksponensial ..................................... 78
Tabel 5.2. Hasil Simulasi Dugaan pi
78
(proporsi penduduk usia 10 tahun ke
atas yang bisa baca tulis) untuk tiap blok sensus di Kecamatan
Lenteng, Kabupaten Sumenep....................................
Tabel 6.1 Perbandingan kualitas penduga untuk model SAE untuk respon
Binomial dengan dan tanpa memperhatikan peluang penarikan
contoh........................................................................................... 91
vi
DAFTAR GAMBAR
Halaman
Gambar 1.1 Kerangka Penelitian Pengembangan Model SAE untuk
Peubah Respon Binomial…....................................................... 6
Gambar 1.2 Kerangka Penelitian Pengembangan Model SAE untuk
Peubah Respon Multinomial...................................................... 7
Gambar 3.1 Proporsi Penduduk 10 tahun ke atas yang bisa baca tulis
berdasarkan data Susenas tahun 2010 di Kabupaten
Sumenep dan Pasuruan........................................................... 39
Gambar 3.2 Hasil Pendugaan angka melek huruf dengan menggunakan
metode klasik dan Metode Bayes .......................................... 42
Gambar 3.3 Plot dari nilai dugaan KTG menggunakan sebaran prior Beta
dan Logit-Normal melalui metode pendugaan langsung.......... 43
Gambar 3.4 Hubungan kemampuan baca tulis dengan usia berdasarkan
jenis kelamin di Kabupaten Sumenep dan Kabupaten
Pasuruan ............................................................................... 44
Gambar 3.5 Plot hasil dugaan angka melek huruf dan KTG di Kabupaten
Sumenep .................................................................... ………. 45
Gambar 3.6 Plot hasil dugaan paramater pi
Pasuruan.............................................................................
(angka melek huruf) dan KTG di Kabupaten
45
Gambar 4.1 Proporsi penduduk berusia 10 tahun ke atas berdasarkan
lama sekolah berdasarkan data Susenas 2010 di Kabupaten
Sumenep dan Kabupaten Pasuruan........................................ 57
Gambar 4.2 Plot Hasil dugaan proporsi penduduk berusia 10 tahun keatas
di tiap jenjang pendidikan di Kabupaten Sumenep dan
Kabupaten Sumenep .............................................................. 59
Gambar 4.3 Plot Hasil Proporsi Penduduk Berusia 10 tahun keatas di tiap
jenjang pendidikan dan Nilai Dugaan KTG di Kabupaten
Pasuruan ................................................................................ 59
Gambar 4.4 Plot Hasil Dugaan Angka Melek Huruf dan Nilai KTG Dugaan
di Kabupaten Sumenep .......................................................... 60
vii
Gambar 5.1 Plot hasil simulasi pendugaan pi (angka melek huruf) untuk
tiap blok sensus di Kecamatan Lenteng, Kabupaten Sumenep 77
Gambar 5.2 Plot hasil simulasi bias pendugaan pi
77
untuk tiap blok sensus
di Kecamatan Lenteng, Kabupaten Sumenep .....................
Gambar 5.3 Nilai dugaan, parameter populasi, dan bias dugaan angka
melek huruf di Kabupaten Sumenep......................................... 79
Gambar 5.4 Nilai dugaan, parameter populasi, dan bias dugaan angka
melek huruf di Kabupaten Pasuruan....................................... 79
Gambar 5.5 Nilai dugaan proporsi penduduk pada tiap jenjang pendidikan
tertentu dan Dugaan KTG Menggunakan Model SAE logit
multinomial terbobot di Kabupaten Sumenep........................... 83
Gambar 5.6 Nilai dugaan proporsi penduduk pada tiap jenjang pendidikan
tertentu dan Dugaan KTG menggunakan model SAE logit
multinomial terbobot di Kabupaten Pasuruan........................... 84
Gambar 5.7 Nilai dugaan rata-rata lama sekolah menggunakan model
SAE logit multinomial terbobot di Kabupaten Sumenep dan
Pasuruan.................................................................................... 84
Gambar 5.8 Prediksi Indeks Pendidikan di Kabupaten Sumenep dan
Kabupaten Pasuruan Menggunakan Model SAE………………. 85
Gambar 5.9 Peta Tematik Indeks Pendidikan di Kabupaten Sumenep……. 85
Gambar 5.10 Peta Tematik Indeks Pendidikan di Kabupaten Pasuruan……. 86
viii
DAFTAR LAMPIRAN
Halaman
Lampiran 1 Program SAS untuk pendugaan model SAE ...................... 100
Lampiran 2 Program Matlab untuk perhitungan pendugaan area kecil
melalui pendugaan langsung melalui sebaran prior logit
normal ................................................................................ 101
Lampiran 3 Program Matlab untuk perhitungan pendugaan area kecil
melalui pendugaan langsung melalui sebaran prior beta .... 103
Lampiran 4 Program Matlab untuk perhitungan pendugaan area kecil
melalui pendugaan tak langsung (berbasis model) melalui
sebaran prior logit normal tanpa bobot ............................... 105
Lampiran 5 Program Matlab untuk perhitungan pendugaan area kecil
melalui pendugaan tak langsung melalui sebaran prior
logit normal dengan memperhitungkan bobot peluang ....... 107
Lampiran 6 Jumlah penduduk usia 10 tahun keatas berdasarkan data
sensus dan susenas serta jumlah blok sensus di tiap
kecamatan di Kabupaten Sumenep .................................... 109
Lampiran 7 Jumlah penduduk usia 10 tahun keatas berdasarkan data
sensus dan susenas serta jumlah blok sensus di tiap
kecamatan di Kabupaten Pasuruan .................................... 110
Lampiran 8 Hasil Pendugaan Paramater pi (proporsi penduduk berusia
10 tahun ke atas yang bisa baca tulis) dan KTG untuk
masing-masing kecamatan di Kabupaten Sumenep ........... 111
Lampiran 9 Hasil Pendugaan Paramater pi (proporsi penduduk berusia
10 tahun ke atas yang bisa baca tulis) dan KTG untuk
masing-masing kecamatan di Kabupaten Pasuruan ........... 112
Lampiran 10 Hasil pendugaan proporsi penduduk pada tiap tingkat
pendidikan tertinggi di Kabupaten Sumenep ...................... 113
Lampiran 11 Hasil pendugaan KTG untuk pendugaan proporsi
penduduk pada tiap tingkat pendidikan tertinggi di
Kabupaten Sumenep .......................................................... 114
Lampiran 12 Hasil pendugaan proporsi penduduk pada tiap tingkat
pendidikan tertinggi di Kabupaten Pasuruan ...................... 115
ix
Lampiran 13 Hasil pendugaan KTG untuk pendugaan proporsi
penduduk pada tiap tingkat pendidikan tertinggi di
Kabupaten Pasuruan .......................................................... 116
Lampiran 14 Hasil pendugaan angka melek huruf di tiap kecamatan
berdasarkan model campuran logit normal terbobot dan
model campuran logit normal terbobot di Kabupaten
Sumenep ............................................................................ 117
Lampiran 15 Hasil pendugaan angka melek huruf di tiap kecamatan
berdasarkan model campuran logit normal terbobot di
Kabupaten Pasuruan .......................................................... 118
Lampiran 16 Hasil pendugaan angka melek huruf di tiap kecamatan
berdasarkan model campuran logit multinomial terbobot
di Kecamatan Pragaan, Kabupaten Sumenep .................... 119
Lampiran 17 Pendugaan KTG untuk penduga proporsi penduduk di
tiap jenjang pendidikan berdasarkan model campuran logit
multinomial terbobot di Kabupaten Sumenep ..................... 120
Lampiran 18 Hasil pendugaan proporsi penduduk di tiap jenjang
pendidikan berdasarkan model campuran logit
multinomial terbobot di Kabupaten Pasuruan .................... 121
Lampiran 19 Penduga KTG untuk penduga proporsi penduduk di tiap
jenjang pendidikan berdasarkan model campuran logit
multinomial terbobot di Kabupaten Pasuruan ................... 122
Lampiran 20 Prediksi Indeks Pendidikan di Kabupaten Sumenep
menggunakan model SAE …………………………………... 123
Lampiran 21 Prediksi Indeks Pendidikan di Kabupaten Pasuruan
menggunakan model SAE …………………………………… 124
Lampiran 22 Hubungan antara Proprosi Penduduk untuk tiap jenjang
pendidikan Berdasarkan Usia dan jenis kelamin di
kabupaten Sumenep .......................................................... 125
Lampiran 23 Hubungan antara Proprosi Penduduk untuk tiap jenjang
pendidikan dengan Usia dan jenis kelamin di kabupaten
Pasuruan ........................................................................... 126
1
BAB I Pendahuluan
1.1. Latar Belakang
Berbagai survei umumnya dirancang untuk menduga parameter populasi
untuk area besar, misalnya untuk wilayah nasional atau regional (provinsi,
kabupaten/kota) dan pendugaan parameternya didasarkan pada rancangan atau
dikatakan sebagai pendugaan langsung. Untuk pendugaan parameter wilayah
yang lebih kecil, umumnya jumlah contoh kurang mencukupi jika digunakan
untuk pendugaan berdasarkan rancangan.
Dewasa ini telah dikembangkan sebuah metode pendugaan parameter di
suatu area dimana jumlah contohnya berukuran kecil dan bahkan tidak ada yaitu
Metode Pendugaan Area Kecil atau Small Area Estimation (SAE). Pendugaan
dalam SAE didasarkan pada model dan merupakan pendugaan tidak langsung.
Oleh karena itu dibutuhkan informasi tambahan dari peubah yang memiliki
hubungan dengan peubah yang sedang diamati yang disebut sebagai peubah
penyerta (auxiliary variable).
Model SAE pertama kali diperkenalkan oleh Fay & Heriot (1979), yaitu
model yang memperhitungkan dua jenis keragaman yang mencakup 1)
keragaman peubah respon yang tidak dapat diterangkan seluruhnya oleh
hubungan peubah respon dengan informasi tambahan yang disebut model
pengaruh tetap dan 2) keragaman spesifik area kecil yang tidak dapat
diterangkan oleh informasi tambahan, merupakan pengaruh acak area kecil.
Oleh karena itu model SAE mengandung dua komponen galat yaitu galat karena
model dan galat karena pendugaan parameter secara langsung. Rataan atau
tolal area kecil dapat dinyatakan sebagai kombinasi linier dari pengaruh tetap
dan pengaruh acak.
Secara aliran klasik, pendugaan parameter untuk model dasar SAE
biasanya menggunakan metode Prediksi Tak-bias Linier Terbaik (Best Linear
Unbiased Predictor) yaitu dengan meminimumkan Kuadrat Tengah Galat (KTG)
dari penduga. Pendugaan dengan Prediksi Tak-bias Linier Terbaik (PTLT) ini
tidak tergantung pada kenormalan dari pengaruh acak tetapi tergantung pada
ragam atau koragam dari pengaruh acak. Sedangkan komponen ragam-
2
koragam sering diduga dengan menggunakan metode Kemungkinan Maksimum
(Maximum Likelihood:ML) atau Kemungkinan Maksimum Berkendala (Restricted
Maximum Likelihood: REML) dengan mengasumsikan kenormalan. Dengan cara
tersebut pendugaan melalui proses dua tahap yang dikenal sebagai Prediksi
Tak-bias Linier Terbaik Empirik (PTLTE). Rao (2003) mengatakan bahwa
metode BLUP atau EBLUP hanya cocok untuk peubah kontinu, tetapi kurang
sesuai jika digunakan untuk pemodelan peubah respon bertipe diskrit.
Metode PTLT atau PTLTE dapat diaplikasikan untuk model linier
campuran yang banyak digunakan untuk pendugaan area kecil. Dalam
pendugaan parameter dari model linier campuran tersebut tidak dibutuhkan
kenormalan dari pengaruh acak dan galat , tetapi kenormalan dibutuhkan untuk
mendapatkan penduga KTG yang akurat (Rao, 2003). Model linier campuran itu
sendiri dirancang untuk peubah bertipe kontinu dan kurang sesuai untuk peubah
bertipe diskrit (biner atau cacahan). Untuk data biner atau cacahan, khususnya
model regresi logistik dan model log linier akan lebih tepat menggunakan
metode pendugaan melalui pendekatan Bayes, baik melalui metode Bayes
Empirik (Empirical Bayes) maupun metode Bayes Berhirarki (Hierarchical
Bayes).
Di Indonesia, beberapa peneliti yang mengembangkan model SAE
diantaranya adalah Kurnia et al. (2007), yang membahas pengaruh mis-
spesifikasi desain survey pada pendugaan area kecil. Selain itu Kurnia et al.
(2007) membahas tentang pendekatan non parameterik dalam SAE. Selanjutnya
Kurnia (2009) meneliti tentang prediksi terbaik empirik untuk model transformasi
logaritma di dalam pendugaan area kecil dengan penerapan pada data
Susenas. Peneliti yang lain adalah Sadik (2009) mengembangkan metode
prediksi tak-bias linear terbaik dan bayes berhirarki untuk pendugaan area kecil
berdasarkan model state space.
Beberapa peneliti yang telah mengembangkan model pendugaan area
kecil untuk data biner diantaranya adalah Malec et al. (1997), Boostra et al.
(2011), Jiang dan Lahiri (2001), Rao (2003), Clarke et al. (2006) dan Chandra et
al. (2009). Para peneliti tersebut umumnya menggunakan sebaran prior Beta
atau logit normal, sedangkan untuk pendugaan parameter digunakan metode
Kemungkinan Quasi Berpenalti (Penalized Quasi-Likelihood) dan pendugaan
ragam dengan menggunakan pendekatan ML atau REML. Metode SAE untuk
3
data biner yang dikembangkan oleh para peneliti tersebut tidak
memperhitungkan peluang percontohan dari data yang digunakan.
Model SAE berbasis sebaran multinomial telah dikembangkan oleh Molina
et al. (2007) dengan metode yang didasarkan pada aplikasi dari Model
Campuran Logit Multinomial (Multinomial Logit Mixed Model). Model SAE untuk
peubah multinomial oleh Molina mengasumsikan pengaruh acak yang sama
untuk semua katagori. Scealy (2010) mengembangkan model Molina et al.
(2007) dengan memasukkan pengaruh acak katagori. Untuk pendugaan
parameter model Scealy (2010) mengaplikasikan metode Kemungkinan Quasi
Berpenalti (KQB), pendekatan ML dan/atau REML. Metode tersebut kemudian
diaplikasikan untuk pendugaan parameter angkatan kerja di area kecil.
Pendugaan KTG untuk penduga parameter didekati melalui dua metode yaitu
bootstrap parametrik dan pendekatan analitik serta kemudian membandingkan
keduanya. Sceally (2010) menghasilkan bahwa metode boostrap parametrik
memberikan hasil lebih baik dibandingkan dengan pendekatan analitik, namun
perbedaannya sangat kecil.
Pada umumnya di dalam model SAE dianggap semua area terwakili dalam
contoh atau dianggap bahwa contoh area dipilih dengan peluang yang sama
(Pfeffermann 2010). Hanya ada beberapa studi yang memperhatikan struktur
peluang percontohan dengan menggunakan peluang tidak sama, misalnya Kott
(1990), Arora dan Lahiri (1997) serta Prasad dan Rao (1999). Pfeffermann
(2010) berbendapat bahwa pendugaan yang dilakukan tanpa memperhatikan
peluang penarikan contoh akan menghasilkan penduga yang berbias. Demikian
juga Lehtonen (2009) menyatakan bahwa dengan menyertakan bobot peluang
penarikan contoh ke dalam model, misalkan proporsional terhadap ukuran
populasi atau proportional to size (pps), dapat dihasilkan peningkatan akurasi
dan pengurangan bias. Lehtonen (2009) mengembangkan pendugaan langsung
di area kecil yang mengaplikasikan Model Generalized Regression (GREG)
dimana pendugaan parameter menggunakan metode PTLTE yang menyertakan
bobot unit contoh.
Model SAE yang memperhitungkan struktur peluang penarikan contoh
yang telah dikembangkan oleh para peneliti tersebut adalah untuk model SAE
dengan peubah respon normal. Pendugaan parameter menggunakan
pendekatan klasik yaitu mengaplikasikan PTLT atau PTLTE. Pengembangan
model SAE berbasis penarikan contoh berpeluang tidak sama khusus untuk data
4
biner dibahas oleh Chen et al. (2010) yang menggunakan pendekatan Bayes
Empirik dan Berhirarki.
Di Indonesia, kebutuhan untuk pendugaan area kecil misalkan kecamatan
atau desa makin meningkat, khususnya untuk menyusun kebijakan atau
perencanaan pembangunan oleh pemerintah daerah. Salah satu indikator yang
dijadikan dasar dalam perencanaan pembangunan adalah Indeks Pembangunan
Manusia (IPM) yang mengukur pencapaian hasil pembangunan di sebuah
wilayah (BPS 2005). IPM diukur dalam 3 dimensi dasar yaitu: 1)Hidup yang sehat
dan panjang umur yang diukur dengan harapan hidup saat kelahiran; 2)
Pengetahuan yang diukur dengan angka tingkat baca tulis pada orang dewasa
dan rata-rata lama sekolah serta 3) standar hidup layak yang diukur dengan daya
beli (UNDP 1998). IPM dapat digunakan untuk mengklasifikasikan apakah
sebuah wilayah adalah maju, berkembang atau terbelakang, Selain itu IPM juga
digunakan untuk mengukur pengaruh dari kebijakan ekonomi terhadap kualitas
hidup. Di Indonesia perhitungan IPM dilakukan oleh Badan Pusat Statistik (BPS)
yang secara resmi mempublikasikan IPM secara periodik setiap tahun untuk
tingkat provinsi dan kabupaten/kota.
Dewasa ini perhitungan IPM untuk tingkat kecamatan mulai dibutuhkan
untuk digunakan sebagai dasar perencanaan pembangunan di tingkat
Kabupaten. IPM untuk tingkat kecamatan, yang membandingkan hasil
pembangunan antar kecamatan, baru dilakukan oleh sebagian pemerintah
kabupaten/kota. Perhitungan IPM di tingkat kecamatan umumnya dilakukan
dengan cara klasik, yaitu menggunakan pendugaan langsung dengan cara
menambah jumlah contoh agar mencukupi. Sebagai contoh perhitungan IPM
untuk Kabupaten Probolinggo (Rumiati et al. 2007), Sumenep (Rumiati et al.
2008), Tuban (Rumiati et al. 2009) dilakukan dengan memanfaatkan data Survei
Sosial Ekonomi Nasional (Susenas) dan menambah jumlah data melalui survai.
Penggunaan data Susenas untuk pendugaan parameter di tingkat
kecamatan atau desa akan menghadapi dua persoalan statistik yaitu:
1)terbatasnya jumlah data karena Susenas ditujukan untuk menduga parameter
berskala nasional atau regional (provinsi sampai kabupaten/kota). 2) penarikan
contohnya memiliki peluang tidak sama karena rancangan penarikan contoh
dalam Susenas adalah penarikan contoh gerombol dua tahap yaitu mengambil
blok sensus pada tahap pertama dan pada tahap ke dua mengambil rumah
5
tangga pada blok sensus yang terpilih. Oleh karena itu penarikan contoh dalam
Susenas memiliki peluang tidak sama.
Dalam penelitian ini dibahas pengembangan metode SAE yang dapat
digunakan untuk menduga parameter pendidikan yang merupakan komponen
Indeks Pendidikan dalam IPM. Perhitungan Indeks Pendidikan melalui
pendugaan angka melek huruf dan rata-rata lama sekolah. Angka melek huruf
dihitung berdasarkan proporsi penduduk yang mampu baca dan tulis dari
penduduk yang berusia 10 tahun ke atas. Sedangkan rata-rata lama sekolah
dihitung berdasarkan proporsi penduduk yang telah berada pada jenjang
pendidikan tertentu yang dikalikan dengan lama menempuh pendidikan di
jenjang tersebut dibagi dengan jumlah penduduk. Jumlah penduduk yang bisa
baca tulis diasumsikan memiliki sebaran Binomial dan jumlah penduduk pada
tiap jenjang pendidikan diasumsikan memiliki sebaran Multinomial. Selanjutnya
karena perhitungan IPM menggunakan data Susenas, maka persoalan statistik
terkait dengan keterbatasan jumlah data dan ketidaksamaan peluang dalam
penarikan contoh. Oleh karena itu yang menjadi pertanyaan penelitian ini
adalah bagaimana model pendugaan area kecil untuk peubah respon binomial
dan multinomial pada kasus penarikan contoh berpeluang tidak sama.
Rao (2003) mengatakan bahwa untuk data biner atau cacahan, khususnya
model regresi logistik dan model log linier akan lebih tepat menggunakan
metode pendugaan melalui pendekatan Bayes. Oleh karena itu dalam penelitian
ini pendugaan area kecil dilakukan melalui pendekatan Bayes didasarkan pada
model SAE untuk peubah respon Binomial dan Multinomial berbasis peluang
penarikan contoh tidak sama. Selanjutnya model SAE yang dihasilkan
diaplikasikan untuk pendugaan Indeks Pendidikan kecamatan di Kabupaten
Sumenep dan Kabupaten Pasuruan, Provinsi Jawa Timur.
1.2. Tujuan Penelitian
1. Mengembangkan model SAE berbasis sebaran Binomial dan Multinomial
melalui pendekatan Bayes dengan penarikan contoh berpeluang tidak
sama.
2. Mengaplikasikan metode pendugaan area kecil yang diperoleh dari
tujuan pertama untuk menduga angka melek huruf dan rata-rata lama
sekolah ditingkat kecamatan dalam rangka menghitung Indeks Pendidikan
di Studi kasus Kabupaten Sumenep dan Pasuruan.
6
1.3. Ruang Lingkup
Ruang lingkup penelitian ini meliputi pengembangan metode pendugaan
area kecil untuk peubah respon Binomial dan Multinomial melalui pendekatan
Bayes. Pengembangan model SAE akan memperhatikan peluang penarikan
contoh mengingat penerapan dari metode SAE tersebut diaplikasikan untuk
menduga Indeks Pendidikan di tingkat kecamatan dengan data Susenas dimana
contohnya diambil berdasarkan peluang tidak sama.
Secara khusus model SAE yang akan dikaji merupakan model berbasis
unit dengan pendugaan parameter menggunakan metode Bayes Empirik
berdasarkan sebaran prior logit normal dari parameter (pi
Metode SAE yang dikembangkan untuk peubah respon Binomial dan
Multinomial berbasis peluang contoh tidak sama diaplikasikan untuk menduga
Indeks Pendidikan di tingkat kecamatan di Jawa Timur. Studi kasus yang diambil
adalah kabupaten Sumenep (yang mewakili daerah pertanian dan perkebunan)
dan Kabupaten Pasuruan (mewakili daerah industri) di Jawa Timur. Secara garis
besar kerangka penelitian dapat dilihat pada Gambar 1 dan Gambar 2.
) yang diduga. Metode
pendugaan parameter menggunakan integrasi numerik karena penyelesaian
persamaan secara analitik untuk model Bayes khususnya berbasis data biner
sulit ditemukan.
1.4. Kebaruan
Beberapa peneliti telah melakukan pengembangan model SAE untuk
peubah respon Binomial dan Multinomial yang berbasis data biner, baik melalui
pendekatan klasik maupun melalui pendekatan Bayes. Model SAE yang
dikembangkan umumnya tidak memperhatikan peluang penarikan contoh dan
menganggap contoh yang digunakan berdasarkan pada penarikan contoh secara
acak dengan peluang yang sama. Pendugaan parameter dalam penelitian ini
memperhitungkan cara penarikan contoh khususnya untuk penarikan contoh
berpeluang tidak sama.
Dengan menggunakan data Susenas, pendugaan IPM oleh BPS di
Indonesia hanya sampai tingkat kabupaten/ kota karena ketidak cukupan data
untuk area yang lebih kecil (kecamatan atau desa). Pendugaan IPM di level
kecamatan umumnya dilakukan dengan menambah jumlah contoh dimana
pendugaan parameter dilakukan secara langsung dan tanpa memperhitungan
peluang tiap unit contoh.
7
Tanpa memperhatikan peluang penarikan contoh
Model logit normal terbobot
Pendugaan Parameter Area : Pendekatan Bayes
Model logit normal
Pendugaan Parameter model SAE : PQL/REML
Model SAE dengan Fungsi Peluang Eksponensial
Dengan memperhatikan peluang penarikan contoh
Pendugaan Parameter model : Metode KM
Simulasi
Aplikasi
Perhitungan bobot area kecil (bloksensus )
Lokasi: Kecamatan Lenteng , Kabupaten Sumenep
Data Sensus Penduduk 2010
Perhitungan bobot individu
Penarikan contoh area (blok sensus) : 5 area
Penarikan contoh RT 16 RT
diulang 100 x
100 set contoh tanpa bobot
100 set contoh dengan bobot
Model logit normal terbobot
Model logit normal
1
2
2
Model SAE dengan menyertakan fungsi peluang penarikan contoh
Lokasi: Kabupaten Sumenep dan Pasuruan
Data Sensus Penduduk 2010
Data Susenas 2010 Model logit normal terbobot Perhitungan bobot area
kecil (bloksensus ) Perhitungan bobot individu
Perhitungan angka melek huruf di tiap kecamatan
Perhitungan bias Perhitungan KTG
Model logit normal tanpa bobot
PerhitunganBias, KTG
PerhitunganBias, KTG
Pengembangan Model
Gambar 1.1.
Kerangka Penelitian Pengembangan Model SAE untuk Peubah Respon Binomial Keterangan
1. Tahap pengembangan model SAE dengan respon binomial dengan memperhatikan struktur peluang
2. Simulasi dengan mengambil kecamatan Lenteng, yaitu dengan penarikan contoh gerombol dua tahap yang diulang sebanyak 100 kali
3. Aplikasi, menerapkan model terbaik yang diperoleh dari hasil aplikasi untuk menduga angka melek huruf di level kecamatan di Kabupaten Sumenep dan Pasuruan
8
Pengembangan Model
Pendugaan Parameter model SAE : KQB/KMB
Pendugaan Parameter Area : Pendekatan Bayes
Tanpa memperhatikan peluang penarikan contoh
Model logit multinomial terbobot
Pendugaan Parameter Area : Pendekatan Bayes
Model logit multinomial
Pendugaan Parameter model SAE : KQB/KMB
Dengan memperhatikan peluang penarikan contoh
Aplikasi
1
2 Lokasi: Kabupaten Sumenep dan Pasuruan
Data Susenas 2010 Model logit multinomial terbobot
Perhitungan bobot area kecil (bloksensus )
Perhitungan bobot individu
Perhitungan rata-rata lama sekolah di tiap kecamatan
Model logit multinomial tanpa bobot
Perhitungan KTG
Gambar 1.2. Kerangka Penelitian Pengembangan Model SAE untuk Peubah Respon
Multinomial
Keterangan 1. Tahap pengembangan model SAE dengan respon multinomial dengan
memperhatikan struktur peluang 2. Aplikasi, menerapkan model logit multinomial untuk pendugaan rata-rata lama
sekolah di level kecamatan di Kabupaten Sumenep dan Pasuruan
Dalam disertasi ini dibahas tentang pendugaan Indeks Pendidikan sebagai
salah satu komponen IPM di area kecil (kecamatan) didasarkan pada sebaran
Binomial untuk pendugaan angka melek huruf dan sebaran Multinomial untuk
pendugaan rata-rata lama sekolah. Kebaruan dari penelitan ini adalah:
1. Disertasi ini mengembangkan Metode SAE berbasis respon Binomial dan
Multinomial melalui pendekatan Bayes dengan memperhitungkan peluang
penarikan contoh.
2. Disertasi ini mengembangkan Metode Bayes SAE yang dapat
diaplikasikan untuk menduga Indeks Pendidikan di tingkat kecamatan
dengan memperhitungan bobot dalam percontohan Susenas. Pendekatan
9
semacam ini, yaitu pendugaan Bayes dengan memperhitungkan bobot
percontohan belum pernah dilakukan baik oleh BPS maupun oleh peneliti
lain. Oleh karena itu disertasi ini menghasilkan metode baru untuk
pendugaan Indeks Pendidikan dengan tingkat akurasi dan presisi yang
lebih tinggi.
1.5. Sistematika Disertasi
Disertasi ini terbagi menjadi 3 (tiga) bagian besar. Bagian pertama
membahas tentang pendugaan area kecil secara umum dan hal-hal yang terkait
dengan proses penarikan contoh serta perhitungan IPM. Bagian kedua
membahas perkembangan model SAE khususnya untuk sebaran respon
Binomial dan Multinomial dengan contoh penerapan dalam pendugaan angka
melek huruf dan rata-rata lama sekolah di level kecamatan di di dua kabupaten di
Jawa Timur. Bagian ketiga membahas pengembangan model SAE untuk
sebaran Binomial dan Multinomial berbasis pada penarikan contoh berpeluang
tidak sama dan penerapannya untuk pendugaan Indeks Pendidikan di level
Kecamatan di Jawa Timur. Secara rinci disertasi ini terbagi kedalam 7 bab. Bab 1
adalah pendahuluan yang berisi uraian latar belakang, yujuan, ruang lingkup dan
kebaruan dari disertasi.
Pada bab II dibahas tinjauan pustaka berisi tentang model dasar SAE dan
perkembangannya, meliputi pendugaan parameter menggunakan pendekatan
klasik dan pendekatan Bayes. Di dalam tinjauan pustaka juga dibahas tentang
metode penarikan contoh dalam Susenas serta penentuan bobot untuk
kepentingan pendugaan parameter dengan metode langsung. Selanjutnya pada
bab II ini juga dibahas tentang Indeks Pembangunan Manusia (IPM) dan Indeks
Pendidikan serta cara perhitungannya.
Pada bab III dibahas tentang pendugaan area kecil untuk respon Binomial,
khususnya untuk pendugaan parameter berbasis model dengan pendekatan
Bayes. Dalam bab ini juga disajikan pendugaan Bayes dengan metode langsung
(tidak berbasis model) yaitu dengan menggunakan sebaran prior Beta dan logit
normal. Model SAE untuk respon Binomial kemudian diaplikasikan untuk
pendugaan angka melek huruf di tingkat kecamatan di Kabupaten Sumenep dan
Kabupaten Pasuruan di provinsi Jawa Timur dengan menggunakan data
Susenas 2010.
Pada bab IV dibahas tentang pendugaan parameter untuk model SAE
10
berbasis peubah respon Multinomial. Dalam bab ini juga digunakan pendekatan
Bayes dengan mengembangkan model SAE untuk peubah respon Multinomial
yang dikembangkan oleh Sceally (2010) dimana pengaruh area dibedakan atas
katagori. Model SAE yang dikembangkan diaplikasikan untuk menduga rata-rata
lama sekolah untuk level kecamatan di kabupaten Sumenep berdasarkan
Susenas 2010.
Pada bab V dikaji pendugaan area kecil (SAE) berdasarkan penarikan
contoh berpeluang tidak sama. Kajian ini dimaksudkan untuk mempelajari cara
pemberian bobot terhadap unit percobaan maupun area yang terambil sebagai
contoh. Dalam bab ini dipelajari berbagai ide pengembangan model SAE terkait
dengan peluang penarikan contoh atau memperhitungkan peluang penarikan
contoh dalam pengembangan dalam pengembangan model SAE. Perhitungan
bobot penarikan contoh sesuai dengan proses penarikan contoh yang
diaplikasikan dalam Susenas. Model SAE yang memperhitungkan peluang
penarikan contoh diaplikasikan untuk menduga rata-rata lama sekolah untuk
level kecamatan di kabupaten Sumenep berdasarkan Susenas 2010.
Bab VI berisi pembahasan yang megintegrasikan semua hasil pengkajian
pengembangan metode SAE melalui pendekatan Bayes baik untuk respon
Binomial maupun Multinomial tanpa memperhitungkan atau dengan
memperhitungkan peluang penarikan contoh. Selain itu pada bab ini juga
dibahas hasil penerapan pendugaan Indeks Pendidikan di kabupaten Sumenep
dan Pasuruan
Bab VII adalah bab kesimpulan yang berisi rangkuman semua hasil
penelitian dan saran baik untuk penelitian ke depan maupun saran secara umum
kepada pemerintah.
11
BAB II Tinjauan Pustaka
2.1. Pendahuluan
Dalam bab ini dibahas berbagai metode terkait dengan metode pendugaan
area kecil, dimulai dengan pembahasan model dasar pendugaan area kecil
meliputi metode pendugaan parameter dan pendugaan Kuadrat Tengah Galat
(KTG), baik menggunakan cara klasik maupun melalui pendekatan Bayes. Kajian
pustaka selanjutnya adalah tentang pengembangan pendugaan SAE yang
memperhitungkan proses pengambilan contoh khususnya untuk pengambilan
contoh yang berpeluang tidak sama.
Karena model SAE yang dibahas dalam penelitian ini diaplikasikan untuk
menghitung Indeks Pendidikan yang merupakan salah satu komponen dari
Indeks Pembangunan Manusia, sehingga pada bab ini juga akan dijelaskan cara
dan dasar perhitungan IPM khususnya untuk Indeks Pendidikan.
Data yang digunakan adalah data Susenas untuk Provinsi Jawa Timur
tahun 2010 dan data Sensus Penduduk tahun 2010 khususnya di Kabupaten
Sumenep dan Pasuruan. Oleh karena itu juga dibahas metode penarikan contoh
Susenas dan cara pembobotan untuk pendugaan parameter berbasis data
Susenas.
2.2. Model Dasar Pendugaan Area Kecil
Berbagai survei umumnya dirancang untuk menduga parameter populasi
untuk wilayah atau area yang besar, misalnya untuk wilayah nasional/ regional
(provinsi/kabupaten/kota) dan pendugaan parameternya didasarkan pada
rancangan. Karena itu untuk area kecil umumnya jumlah contoh menjadi kurang
mencukupi terutama jika ingin digunakan pendugaan berdasarkan rancangan.
Oleh karena itu beberapa peneliti statistik telah mengembangkan Metode
Pendugaan Area Kecil atau Small Area Estimation (SAE) untuk pendugaan
parameter di suatu area dimana jumlah contohnya berukuran kecil.
Metode SAE ini pertama kali diperkenalkan oleh Fay & Heriot (1979),
merupakan pendugaan tidak langsung atau berdasarkan model (model based
12
estimation). Oleh karena itu untuk membangun model SAE dibutuhkan informasi
tambahan dari peubah yang memiliki hubungan dengan peubah yang sedang
diamati yang disebut sebagai peubah penyerta (auxiliary variable). Peubah
penyerta ini dapat diukur dari survai yang lain atau dalam catatan administrasi
dan diharapkan memiliki korelasi dengan peubah yang diamati. Dengan metode
SAE diharapkan adanya perbaikan efisiensi dari pendugaan parameter dalam
area kecil jika peubah penyerta tersedia.
Model SAE memperkenalkan model campuran yang menyertakan
pengaruh area spesifik yang memperhitungkan variasi antar area diluar yang
dapat dijelaskan oleh peubah penyerta yang ada di dalam model. Ketersediaan
data dari peubah penyerta akan sangat menentukan kesuksesan dalam
pembuatan model SAE.
Rao (2003) menyatakan bahwa penggunaan model SAE ini memberikan
beberapa keuntungan yaitu: 1) Diagnostik model dapat digunakan untuk
mendeteksi kecocokan dengan data, misalkan menggunakan analisis sisaan 2)
Pengukuran presisi area-spesifik dapat diasosiasikan dengan setiap pendugaan
setiap area kecil, 3) Model linier campuran seperti model regresi logistik dengan
pengaruh acak area–spesifik tetap dapat dilakukan, demikian juga untuk struktur
data yang cukup kompleks misalkan struktur data time series atau spasial; 4)
pengembangan metode untuk model pengaruh acak dapat dimanfaatkan untuk
mencapai akurasi dalam area kecil.
2.2.1. Pendugaan Area Kecil Berbasis Area
Misalkan terdapat M area kecil di dalam populasi, maka untuk kepentingan
pendugaan area kecil hanya diambil contoh sebanyak m area. Diasumsikan
bahwa parameter yang diperhatikan dalam area kecil ke-i, misalkan iθ dapat
dinyatakan sebagai sebuah fungsi yang menghubungkan parameter tersebut
dengan peubah pembantu yang diukur dari area kecil yaitu Tpiiii ),.....,z,z(z 21=z .
Rao (2003) mengatakan bahwa model linier yang menjelaskan hubungan
tersebut adalah:
iibTii υθ += βz i=1,2,........m, (2.1)
13
dimana bi ( )TPβββ ,.......,, 21=β adalah konstanta positif yang diketahui dan
adalah vektor koefisien regresi berukuran p x 1. Selanjutnya iυ adalah pengaruh
acak area spesifik diasumsikan memiliki sebaran ),0(~ 2υσυi
Jika penduga langsung iθ diketahui, maka iθ dapat dinyatakan sebagai :
iii e+=θθ , untuk i=1,2,........m, (2.2)
dimana :
iiipiip eVeE ψθθ == )(,0)( . (2.3)
Rao (2003) menjelaskan bahwa model SAE untuk tingkat area, terdiri dari
dua komponen model yaitu komponen model pendugaan langsung dan
pendugaan tak langsung. Kombinasi model pendugaan langsung (2.2) dan tak
langsung (2.1) dikenal sebagai Model Campuran Linier Terampat/MCLT
(Generalized Linear Mixed Model:GLMM) sebagai berikut:
iiiTii ebz ++= υβθ . (2.4)
Model area kecil seperti yang dijelaskan pada persamaan (2.4) di atas
dikenal sebagai model Fay-Heriot, dimana keragaman peubah respon di dalam
area kecil diasumsikan dapat diterangkan oleh hubungan peubah respon dengan
informasi tambahan yang disebut sebagai model pengaruh tetap. Selain itu
terdapat komponen keragaman spesifik area kecil yang tidak dapat diterangkan
oleh informasi tambahan dan disebut sebagai komponen pengaruh acak area
kecil. Gabungan dari dua asumsi tersebut membentuk model pengaruh
campuran.
2.2.2. Pendugaan Area Kecil Berbasis Unit
Pendugaan area kecil berbasis unit mengasumsikan bahwa data dari
peubah penyerta level unit x ij=(xij1,......xijp)T tersedia untuk setiap elemen ke j
pada area ke-i. Peubah yang diperhatikan adalah yij yang diasumsikan memiliki
hubungan dengan xij
ijiTijij exy ++= υβ
melalui model:
, j=1,......,ni
Pengaruh acak area
, i=1,........m. (2.5)
iυ diasumsikan merupakan peubah acak yang bersifat iid
sedangkan ijijij eke ~= dengan kij ije~adalah konstata dan adalah peubah acak
14
yang bersifat iid dan bebas terhadap iυ dimana 20)~( eijm eE = dan 2)~( eijem eV σ= .
Seringkali iυ dan eij diasumsikan memiliki sebaran peluang normal.
Dengan mengasumsikan bahwa percontohan si berukuran ni diambil dari
populasi di area ke-i berukuran Ni
+
+
=
= **** 1
1
i
i
i
ii
i
i
i
ii e
e
y
yυβ
X
Xy
(i=1,2...m) dan penarikan contoh dalam setiap
area diambil secara acak sederhana, sehingga model (2.5) dapat dinyatakan
dalam bentuk matriks:
(2.6)
*iy menyatakan unit-unit yang tidak terambil dalam percontohan. Jika iY adalah
rata-rata populasi di area ke-i, maka iY dapat ditulis sebagai:
*)1( iiiii YfyfY −+= (2.7)
dimana iii Nnf /= dan iy adalah rata-rata dari seluruh contoh di area ke-i dan
*iY menyatakan rata-rata elemen populasi dari bagian yang tidak terambil
sebagai contoh. Oleh karena itu untuk model SAE berbasis unit, pendugaan
parameter area kecil iY sama dengan menduga *iY jika data percontohan }{ iy
dan }{ iX tersedia.
2.3. Pendugaan Parameter Model SAE
2.3.1. Metode Prediksi Tak-bias Linier Terbaik (PTLT) dan Prediksi Tak-bias Linier Terbaik Empirik (PTLTE)
Parameter di area kecil, misalkan rataan atau tolal, dapat dinyatakan
sebagai kombinasi linier dari efek tetap dan efek acak seperti dinyatakan pada
persamaan (2.1) untuk model berbasis area dan persamaan (2.5) untuk model
berbasis unit.
Melalui pendekatan klasik, pendugaan parameter model SAE umumnya
mengaplikasikan metode PTLT dengan meminimumkan Kuadrat Tengah Galat
(KTG). Metode PTLT ini tidak tergantung pada kenormalan dari efek acak tetapi
tergantung pada ragam atau koragam dari efek acak. Untuk menduga komponen
ragam dan koragam umumnya digunakan metode ML atau REML dengan
mengasumsikan kenormalan. Dengan cara tersebut pendugaan dilakukan
melalui proses dua tahap yang dikenal sebagai PTLTE.
15
Misalkan data percontohan memenuhi model linier campuran terampat
berikut:
eZvXβy ++= (2.8)
dimana:
y adalah vektor data observasi berukuran n x 1
X dan Z adalah matriks berukuran n x p dan n x h yang diketahui
v dan e adalah berdistribusi saling bebas dengan rataan 0 dan ragam G
dan R yang tergantung pada parameter Tq ),.....( 1 δδ=δ , diasumsikan
bahwa δ adalah himpunan bagian dari ruang Euclidean sedemikian
hingga TyVar ZGZRVV +=== )()( δ adalah non singular untuk semua δ
yang terdapat dalam himpunan bagian tersebut, dimana Var (y) adalah
matrik ragam-koragam dari y.
Parameter yang akan diduga merupakan kombinasi linier: vm1 TT += βµ
(Rao 2003). Penduga dari µ adalah baT += βµ untuk a dan b diketahui dan
merupakan penduga tak bias jika )()ˆ( µµ EE = . Selanjutnya Kuadrat Tengah
Galat (KTG) didefinisikan sebagai 2)()ˆ( µµµ −= EKTG dan jika µ adalah
penduga tak bias dari µ, maka )()ˆ( µµµ −= VarKTG .
Pada Rao (2003), penduga PTLT µ yang meminimumkan KTG
dinyatakan dalam formula:
),~~~~~ βX(yVGZmβ1vmβ1y)t(δ(μ 1TTTTTH −+=+== − (2.9)
dimana:
yVXX)V(X(δββ 1T11T −−−== )~~ (2.10)
adalah penduga tak bias linier terbaik (Best Linear Estimator: BLUE) dari β dan
)βX(yVGZ(δvv 1T ~)~~ −== − . (2.11)
Penduga PTLT tergantung pada ragam δ yang biasanya tidak diketahui.
Jikaδ diduga dengan )(ˆˆ yδδ = , maka akan diperoleh Prediksi Tak-bias Linier
Terbaik Empirik (PTLTE) yang tetap merupakan penduga tak bias bagi µ.
Penduga δ diperoleh melalui metode ML atau REML.
Untuk model berbasis unit, dimana rataan area kecil ke-i dinyatakan oleh
fungsi: ii υµ += βXTi
~ . Untuk model percontohan ijeυβX~y iTijij ++= , j=1,..ni; i=1,....,m
dapat ditulis dalam bentuk matriks sebagai berikut:
16
iniii ei++= 1υβXy . (2.12)
Model SAE yang dinyatakan oleh (2.12) merupakan bentuk khusus dari
persamaan (2.8), dimana ,2υσ=iG dan )( 2
12
ijnjei kdiagRi≤≤+σ sehingga:
−=− T
iii
iijj
ei aa
aadiagV γ
σ)(1
21 . (2.13)
Dengan mengambil iiie a/)1/()/( 22 γγσσυ =− dimana ∑=j
iji aa , Tinii i
aaa ),....,( 1=
maka penduga PTLT dari µi
)~(~~~ βγβµ Tiaiai
Ti
Hi xy −+= X
adalah (Rao 2003):
(2.14)
dimana iay dan iax adalah rataan terbobot:
∑ ∑==j j
iijijiaiijijia axaxayay .,., //
β~ adalah penduga tak bias linier terbaik bagi β
∑ ∑ −−−=i
iii
Tiii
Ti yVXXVX )()(~ 111β (2.15)
∑ −== −−
j
Tiaiaii
Tijijijeiii
Ti xxaxxaAXVX )( .
21 γσ (2.16)
∑ −= −−
jijiaiiijijijeii
Ti yxayxayVX )( .
21 γσ . (2.17)
Penduga tak bias linier terbaik (2.14) dapat dinyatakan sebagai rata-rata terbobot
dari penduga regresi β~)( Tiaiia xXy −+ dan penduga regresi sintetik β~T
iX
berikut:
[ ] .~)1(~)(~ βγβγµ Tii
Tiaiiai
Hi XxXy −+−+= (2.19)
Bobot )10( ≤≤ ii γγ mengukur ragam model ( 2υσ ), relatif terhadap ragam total
ie a/22 σσυ + . Jika ragam model relatif kecil maka iγ akan kecil dan bobotnya akan
lebih besar di komponen sintetik.
2.3.2. Pendugaan Parameter Model SAE Melalui Pendekatan Bayes
Melalui pendekatan Bayes, pendugaan parameter di area kecil dapat
dilakukan dengan 2 cara yaitu pendugaan Bayes Empirik/BE (Empirical Bayes:
EB) dan Bayes Berhirarki /BH (Hierarchical Bayes:HB). Untuk pendekatan Bayes
Empirik, pendugaan didasarkan pada sebaran posterior yang diduga dari data,
sedangkan pada pendekatan Bayes berhirarki parameter model yang tidak
diketahui diperlakukan sebagai komponen acak yang memiliki sebaran prior
17
tertentu. Model pendugaan area kecil menggunakan Bayes telah dikembangkan
oleh beberapa peneliti diantaranya Gosh dan Rao (1994), You dan Rao (2000).
Pendekatan Bayes, baik Bayes Empirik maupun Bayes Berhirarki
merupakan metode yang dapat diaplikasikan secara lebih umum sehingga
banyak digunakan untuk data diskrit, misalkan untuk data biner dan data
cacahan.
Untuk peubah respons dengan sebaran normal, model dasar area dapat
dinyatakan sebagai model Bayes berhirarki dua tahap yaitu:
1) ),(~/ˆii
ind
ii N ψθθθ , i: 1,2,3,……,m (2.20)
2) ),(~ 22υσβθ i
Ti
ind
i bzN , i: 1,2,3,……,m (2.21)
Dimana β adalah vektor parameter regresi berukuran p x 1. Dalam pendekatan
Bayes, parameter model β dan 2υσ adalah peubah acak, dan model hirarki dua
tahap disebut model hirarki bebas bersyarat (conditionally independent
hierarchical model : CIHM) karena pasangan ( )ii θθ ,ˆ adalah bebas di antara area
i, untuk β dan 2υσ tertentu.
Penduga optimum dari θ i merupakan nilai harapan bersyarat dari θ i
βθ ,i
jika
diberikan dan 2υσ :
βγθγθσβθθ υTiiii
Biii zE )1(ˆˆ),,ˆ( 2 −+== (2.22)
dimana ( )ii
ii b
bψσ
σγυ
υ
+= 22
22
. Nilai harapan dari θ i merupakan nilai harapan dari
sebaran posterior (atau bersyarat) dari θ i βθ ,i jika diberikan dan 2υσ :
))(,ˆ(~,,ˆ 21
2iii
Biii gN ψγσθσβθθ υυ = .
(2.23)
Penduga ),(ˆˆ 2υσβθθ B
iBi = adalah penduga Bayes dibawah squared error
loss dan merupakan nilai optimum dari KTG, dimana 2)ˆ()ˆ( iBi
Bi EKTG θθθ −= ,
selalu lebih kecil dibandingkan dengan θ iθdan linier atau non linier dalam .
Jiang et al. (2002) menyatakan bahwa Biθ disebut prediksi terbaik (Best
Prediction: BP) dari penduga θ i karena diperoleh dengan tanpa mengasumsikan
parameter model.
18
Penduga Bayes Biθ tergantung pada parameter model β dan 2
υσ yang
diduga dengan menggunakan metode ML atau REML dari sebaran marjinal :
( ).,~ˆ 22ii
Ti
ind
i bzN ψσβθ υ + . (2.24)
Penduga parameter dinotasikan dengan β dan 2ˆυσ , sehingga dengan
menggantikan β untuk β dan 2ˆυσ untuk 2υσ , maka Penduga Bayes Empirik
(Empirical Bayes Prediction: EBP) untuk iθ adalah:
( ) .ˆ)ˆ1(ˆˆˆ,ˆˆˆ 2 βγθγσβθθ υTiiii
Bi
EBi z−+== (2.25)
Penduga BE, EBiθ adalah identik dengan penduga PTLTE yang dinotasikan
dengan Hiθ juga merupakan rataan dari estimasi densitas posterior ,
( )2ˆ,ˆ,ˆ υσβθθ if dari iθ , yaitu ( )iiEB
iN ψγθ ˆ,ˆ .
2.4. Peluang Penarikan Contoh
Metode pengambilan contoh berbasis peluang telah banyak dibahas oleh
beberapa peneliti. Metode pengambilan contoh berbasis peluang yang banyak
dibahas dan sering diaplikasikan adalah metode pengambilan contoh acak
sederhana (simple random sampling), metode pengambilan contoh berstrata
(stratified sampling), metode pengambilan contoh bergerombol (cluster sampling)
dan metode pengambilan contoh sistematik (systematic sampling). Masing-
masing metode pengambilan contoh memiliki konsekuensi terhadap perhitungan
pendugaan parameter. Dalam rangka mendapatkan penduga yang tak berbias
maka bobot peluang tersebut harus diperhitungkan dalam pendugaan parameter.
Misalkan akan diduga parameter total ∑= U jyY atau rataan NYY /= ,
dengan menggunakan contoh s yang diambil dari populasi U dengan peluang
p(s), maka dengan mengasumsikan semua elemen j ∈ s dapat diobservasi,
maka Y adalah penduga berbasis rancangan dari Y dan dikatakan tak bias jika:
YYspYE sp =∑= ˆ)()ˆ( . (2.26)
19
./ Nnwi =
./ hhi Nnw =
Ragam untuk Y adalah [ ]2)ˆ(ˆ)ˆ( YEYEYV ppp −= dan penduga untuk )ˆ(YVp
yang dinotasikan dengan )ˆ()ˆ( 2 YsYvp = dikatakan tak berbias jika
)ˆ()]ˆ([ 2 YVYSE pp == .
Untuk pengambilan contoh yang dirancang dengan bobot wj, dimana wj
jπ
merupakan jumlah elemen-elemen dalam populasi yang direpresentasikan oleh
contoh j sehingga, jika adalah peluang terambilnya contoh ke j maka
jjw π/1= . Bobot wj ∈ tergantung pada s dan elemen j (j s), sehingga
∑ ∈=
},{)(
sjsj spπ , j=1,2,....,N dan {s: j ∈ s} menyatakan jumlah dari semua
contoh s yang memuat elemen j. Oleh karena itu penduga Y dapat ditulis
sebagai:
jys jwY ∑=ˆ (2.27)
dimana Σs ∈ menyatakan jumlah j s.
Besarnya bobot wj ditentukan oleh metode penarikan contoh yang
diterapkan. Misalkan untuk pengambilan contoh acak sederhana setiap unit
percobaan memiliki bobot yang sama untuk terambil sebagai contoh yaitu 1/N
dimana N adalah jumlah unit percobaan dalam populasi yang diteliti. Sedangkan
metode penarikan contoh berbasis peluang yang lain akan memiliki bobot yang
berbeda tergantung kepada metode penarikan contoh yang digunakan. Pada
Cochran (1977) dan Shao J (1999) telah dibahas cara perhitungan bobot untuk
masing-masing metode penarikan contoh.
Metode pendugaan parameter secara langsung dengan
memperhitungankan bobot percontohan dikenal sebagai Horvitz-Thompson
Estimator untuk berbagai cara penarikan contoh (Shao 1999). Jika wi adalah
adalah bobot untuk contoh ke-i, maka untuk berbagai metode penarikan contoh
perhitungan bobot wi
1. Penarikan Contoh Acak Sederhana (PCAS)
sebagai berikut:
2. Penarikan Contoh Berstrata (PCB)
Jika i dalam stratum h, maka :
3. Penarikan Contoh Gerombol (PCG)
20
∑∑ ∑∈∈ =
==11 1
ˆSi
iSi
N
jijs Y
kMy
kMY
i
2
1
2
1)1(
)ˆ( ∑=
−
−
−=
M
iis M
YYMk
MkNYVar
.1ˆ11 1
∑∑∑∈=∈
==Si i
iN
jij
Si ipps N
YkNy
NkNY
i
)/( iii MNkmw =
∑∑∈∈
=iSj
ijSi i
is y
nN
kMY
21
ˆ
.1ˆ21
∑∑∈∈
=iSj
ijSi i
pps ynk
NY
Misalkan Pyi ∈ adalah sebuah kelompok (cluster) daniiNii yyy ,.....1=
dimana Mi
.1∑=
=M
iiNN
adalah ukuran dari cluster ke-i, i=1,2.....N. Jumlah unit dalam P
adalah
Penarikan Contoh Gerombol Satu Tahap
Penarikan contoh dilakukan dengan cara memilih yi dengan meng-
observasi semua yij
Oleh karena itu jika digunakan cara PCAS dengan w
.
i
∑=
=k
iiNn
1
=k/N maka total contoh
adalah dan
(2.28)
dimana ragam penduganya adalah:
(2.29)
S1 adalah penarikan contoh tahap pertama.
Jika pemilihan contoh proposional terhadap ukuran populasi (propotional
to size: pps) maka wi=kNi
/N. Sehingga Horvitz-Thompson estimator:
(2.30)
Penarikan contoh bergerombol dua tahap
Untuk pemilihan secara acak sederhana (PCAS) pada tahap pertama dan
pada tahap kedua dipilih mi contoh dari setiap cluster yi,
maka penduga Horvitz-Thompson adalah
(2.31)
dimana S2i menyatakan perontohan gerombol pada tahap ke dua. Untuk
pemilihan secara pps pada tahap pertama dan ni adalah contoh dari yi
(2.32)
yang
dipilih pada tahap ke dua, maka:
21
4. Penarikan contoh Sistematik
P={y1,.....yN} adalah populasi dengan ukuran N=nk. Untuk memilih contoh
berukuran n maka pada pemilihan pertahap diambil contoh j secara acak dari
{1,.....k} sehingga contoh yang terambil adalah: { yj, yj+k,, ..,yj+(n-1)k), maka
wi=k-1.
dimana
2.5. Model SAE dengan Memperhitungkan Peluang Penarikan Contoh.
Pfefferman et al (1998) memperhitungkan peluang penarikan contoh
dalam pengembangan model SAE berdasarkan penarikan contoh dua tahap.
Didefinisikan peubah indikator I
Penduga Horvitz-Thompson adalah
(2.33)
i dan Iij dimana Ii=1 jika area ke i terambil sebagai
contoh dan Iij
si∈ =1 jika unit ke j diambil sebagai contoh dari area ke i yang sudah
terambil sebagai contoh atau . Dengan membagi U ke dalam M area
dengan Ni NNM
ii =∑
=1 adalah banyaknya unit di area ke-i, sehingga , maka
penarikan contoh dua tahap pada polulasi U tersebut adalah sebagai berikut:
1) Tahap pertama memilih m area dengan peluang )( siPi ∈=π .
2) Tahap ke dua diambil ni )|(/ sisjP iij ∈∈=πunit dengan peluang
dari area yang telah terambil sebagai contoh pada tahap pertama,
maka bobot penarikan contoh tahap satu adalah iiw π/1= dan untuk
tahap ke dua adalah ijijw // /1 π= .
Pada tahap pertama, fungsi kepadatan peluang (probablity density
function: pdf) untuk pengaruh ui
si∈
dibedakan atas area yang terambil dan tidak
terambil sebagai contoh:
Pada area yang terambil sebagai contoh ( ):
)1()()|1(
)1|()(=
====
i
ipiibayes
ii
def
is IPufuIP
Iufuf
(2.34)
Pada area yang tidak terambil sebagai contoh ( si∉ ) :
)0()()|0(
)0|()(=
====
i
ipiibayes
ii
def
ic IPufuIP
Iufuf (2.35)
∑=
−+=n
tktjsy ykY
1)1(
ˆ
.)ˆ( YYE sy =
22
Pada tahap ke dua, fungsi kepadatan peluang percontohan (sample pdf)
dan fungsi kepadatan peluang komplemen percontohan (sample-complement
pdf) dari yij
),|1(),|(),,|1(
)1,,|(),|(iijij
iijijpiijijijijiijij
def
iijijs uyIPuxyfuxyIP
Iuxyfuxyf=
====
didefinisikan serupa dengan (2.34) dan (2.35), yaitu :
Untuk unit yang terambil sebagai contoh adalah
(2.36)
Untuk unit yang tidak terambil sebagai contoh
),|0(),|(),,|1(
)0,,|(),|(iijij
iijijpiijijijijiijij
def
iijijc uyIPuxyfuxyIP
Iuxyfuxyf=
==== (2.37)
Jika ),( 21 υυ diukur pada elemen-elemen Ui∈ dan ),( ii wπ menyatakan
peluang contoh (sample inclusion probabilities) dan bobot percontohan (sampling
weight), dengan mendefinisikan Ep adalah nilai harapan dibawah populasi, Es
adalah nilai harapan dibawah percontohan dan Ec adalah nilai harapan
dibawah komplemen contoh, maka fungsi kepadatan peluang dari ),( 21 υυ
adalah:
Untuk area yang terambil sebagai contoh:
)|()|(),|(
),|()|(2
21212121
iip
iipiiipiiiis E
fEsiff
υπυυυυπ
υυυυ =∈= (2.38)
sehingga:
)|()|()|(
2
2121
iis
iiisiip wE
wEEυυυυυ = (2.39)
dimana:
)|(1)|(
22
iisiip wE
Eυ
υπ = (2.40)
Untuk area yang tidak terambil sebagai contoh adalah:
]|1[()|(],|)1[(
]|1[()|(],|)1[(
),|()|(
2
2121
2
21212121
iis
iisiiis
iip
iipiiipiiiic
wEfwE
EfE
siff
υυυυυ
υπυυυυπ
υυυυ
−−
=
−
−=∉=
(2.41)
23
Oleh karena itu nilai harapan dari komplemen contoh adalah:
]|1[(],|)1[(
)|1[(]|)1[(
)|(
2
21
2
2121
iis
iiis
iip
iiipiic
wEwEE
EE
υυυ
υπυυπ
υυ
−−
=
−
−=
(2.42)
2.6. Indeks Pembangunan Manusia (IPM)
Indeks Pembangunan Manusia (IPM) / Human Development Index (HDI)
adalah pengukuran perbandingan dari tingkat pendidikan, kesehatan dan standar
hidup layak untuk semua negara seluruh dunia. IPM digunakan untuk
mengklasifikasikan apakah sebuah wilayah/negara adalah wilayah/negara maju,
berkembang atau terbelakang dan juga untuk mengukur pengaruh dari
kebijaksanaan ekonomi terhadap kualitas hidup. Indeks ini pada tahun 1990
dikembangkan oleh pemenang nobel India Amartya Sen dan Mahbub ul Haq
seorang ekonom Pakistan dibantu oleh Gustav Ranis dari Yale University dan
Lord Meghnad Desai dari London School of Economics dan sejak itu dipakai oleh
Program pembangunan PBB dan dipublikasikan dalam laporan IPM tahunan .
Komponen pembentuk IPM yaitu komponen kesehatan, pendidikan dan
standar hidup layak , masing masing diukur dengan Indeks Kesehatan, Indeks
Pendidikan dan Indeks Standar Hidup Layak. Indeks Kesehatan dihitung
berdasarkan jumlah anak lahir hidup dari wanita usia 15 – 49 tahun (Children
even born: CEB) dan jumlah anak masih hidup dari wanita usia 15 – 49 tahun
(children surviving : CS). Indeks Pendidikan diukur berdasarkan angka melek
huruf dan rata – rata lama sekolah penduduk usia 10 tahun ke atas, sedangkan
Indeks Standar Hidup Layak diukur dengan rata-rata pengeluaran konsumsi riil
per kapita pertahun
Di Indonesia, pengukuran IPM dilakukan oleh Badan Pusat Statistik (BPS).
Perhitungan dan publikasi IPM dilakukan oleh BPS tiap tahun untuk tingkat
propinsi (yang membandingkan tingkat keberhasilan pembangunan antar
propinsi), dan tingkat kabupaten/kota (membandingkan IPM antar
kabupaten/kota).
24
2.6.1. Cara Perhitungan IPM
Data dasar yang digunakan dalam pendugaan IPM pada umumnya adalah
data hasil survei Susenas yang diselenggarakan oleh BPS tiap tahun. BPS dan
UNFPA (1998) menjelaskan tentang cara penghitungan IPM dimana komponen
yang akan dihitung berdasarkan data survey adalah Indeks Kesehatan (yang
diduga berdasarkan angka harapan hidup dan angka kematian bayi), Indeks
Pendidikan (yang diduga dari rata-rata lama sekolah dan angka melek huruf)
serta Daya Beli (rasio antara penghasilan dan harga di wilayah tertentu) seperti
yang ditunjukkan oleh Tabel 2.1.
Tabel 2.1. Peubah dan sumber data dari masing-masing komponen IPM
Komponen IPM Peubah Sumber data
Pendidikan/pengetahuan*) • Angka melek huruf • Rata-rata lama sekolah
Susenas (BPS)
Kesehatan • Jumlah anak lahir hidup dari wanita usia 15-49 tahun (Children Even Born: CEB)
• Jumlah anak masih hidup dari wanita berusia 15-49 tahun (Children Surviving: CS)
Susenas (BPS Profil Kesehatan (Kemenkes)
Standar hidup layak • Pengeluaran konsumsi riil per kapita per tahun
Susenas (BPS)
*) Berdasarkan UNDP patokan usia penduduk 15 tahun ke atas, namun BPS
menggunakan patokan usia di atas 10 tahun
Keterangan: a. Indeks Pendidikan diukur dengan dua indikator yaitu Angka Melek Huruf
/AMH (literacy rate) dan Rata-rata Lama Sekolah/RLS (Mean Years of
Schooling: MYS). Angka melek huruf diolah dari peubah kemampuan
membaca dan menulis, sedangkan rata-rata lama sekolah dihitung
menggunakan tiga variabel secara simultan yaitu partisipasi sekolah,
tingkat/kelas yang sedang/ pernah dijalani, dan jenjang pendidikan
tertinggi yang ditamatkan
b. Indeks Kesehatan dihitung berdasarkan jumlah anak lahir hidup dari
wanita usia 15 – 49 tahun (Children even born: CEB) dan jumlah anak
masih hidup dari wanita usia 15 – 49 tahun (children surviving: CS).Usia
Hidup yang diukur dengan angka harapan hidup waktu lahir (e0). Metode
25
ini menggunakan dua macam data dasar yaitu rata-rata anak yang
dilahirkan hidup (live - births) dan rata-rata anak yang masih hidup (still
living) per wanita usia 15 – 49 tahun menurut kelompok umur lima
tahunan.
c. Indeks Kesejahteraan (Standar Hidup Layak) diukur dengan rata-rata
pengeluaran konsumsi riil per kapita pertahun. Standar Hidup Layak,
seringkali dihitung dengan menggunakan rata-rata pengeluaran per kapita
riil yang disesuaikan (adjusted real per capita expenditure).
Perhitungan indeks masing-masing komponen IPM dihitung dengan
formula sebagai berikut : Indeks (Xi) : = (Xi – Xmin)/(Xmax – Xmin) (2.43)
dimana :
Xi : Indikator komponen pembangunan manusia ke – i (i = 1,2,3).
Xmin : Nilai minimum Xi (lihat Tabel 2.2)
Xmax : Nilai maksimum Xi (lihat Tabel 2.2)
Nilai minimal Indeks (Xi) adalah 0 dan maksimum 1, namun untuk
mempermudah cara membaca skala dinyatakan dalam 100 (persamaan 2.43)
dikalikan 100, sehingga 0 < Indeks (Xi) <100). Angka IPM adalah dihitung
dengan rumus rata-rata sederhana dari masing-masing Indeks Xi
[ ])3()2()1(3/1 XXXIPM ++=
yaitu :
(2.44)
dimana :
X(1) : Indeks Kesehatan.
X(2) : Indeks Pendidikan = 2/3 (Indeks Melek Huruf) + 1/3 ( Indeks
rata-rata lama sekolah).
X(3) : Indeks standar hidup layak (sering diukur dengan konsumsi per
kapita yang disesuaikan.
Tabel 2.2 Nilai Maksimum dan Nilai Minimum Indikator Komponen IPM
Indikator Nilai Maksimum Nilai minimum Catatan
Angka Harapan Hidup 85 25 Standar UNDP
Angka Melek Huruf 100 0 Standar UNDP
Rata-rata lama sekolah 15 0
Konsumsi per kapita yang disesuaikan
737.720 300.000 (1996) 360.000 (1999)
(a) UNDP menggunakan GNP per capita riil yang disesuaikan (b)
26
Keterangan
a) Proyeksi konsumsi per kapita yang disesuaikan untuk Jakarta tahun 2018
setelah disesuaikan dengan rumus Atkinson. Proyeksi ini berdasarkan
asumsi pertumbuhan konsumsi per kapita 6,5 % selama periode 1993-
2018.
b) Setara dengan dua kali garis kemiskinan Propinsi Sulawesi Selatan
daerah pedesaan tahun 1990. Untuk tahun 1999 nilai minimum yang
disesuaikan adalah 360.000 (penyesuaian adanya krisis ekonomi).
2.6.2. Indikator Pendidikan/ Pengetahuan
Indikator pendidikan dihitung berdasarkan angka melek huruf dan rata-rata
lama sekolah. Angka melek huruf diduga berdasarkan proporsi jumlah penduduk
umur 10 tahun keatas yang mampu membaca dan menulis baik untuk huruf latin
maupun huruf lainnya. Sedangkan rata-rata lama sekolah dihitung berdasarkan
data yang didapat dari pertanyaan tentang jenjang dan jenis pendidikan tertinggi
yang pernah diduduki. Konversi tahun untuk tingkat pendidikan yang ditamatkan
dapat dilihat pada Tabel 2.3. Rumus yang digunakan untuk menghitung Rata-
rata Lama Sekolah (RLS) adalah:
(2.45)
dimana : fi = jumlah penduduk menurut jenjang pendidikan
wi
No
= penimbang setiap jenjang pendidikan.
Tabel 2.3. Konversi tahun untuk tingkat/kelas pendidikan yang ditamatkan
Tingkat pendidikan Konversi 1 Tidak pernah sekolah 0 2 SD 6 3 SLTP 9 4 SLTA 12 5 D1 13 6 D2 14 7 D3/akademi 15 8 D4/Sarjana 16 9 S2 /Master 18 10 S3/Doktor 21
Sumber :
UNDP dan BPS (2001)
Catatan :
Bila seseorang drops out kelas dua SLTA, maka konversi tahun lama pendidikannya adalah = 9 + 2 – 1 = 10 tahun
∑
∑=i
ii
fwfRLS
27
2.7. Survei Sosial Ekonomi Nasional (Susenas)
Susenas adalah survai yang diselenggarakan BPS tiap tahun, ditujukan
untuk memonitor perubahan tingkat kesejahteraan masyarakat Indonesia.
Jumlah contoh dalam Susenas 2010 mencakup sekitar 304.369 rumahtangga di
497 kabupaten/kota seluruh Indonesia, sehingga estimasi bisa dilakukan sampai
dengan tingkat kabupaten/kota (BPS 2010). Di Jawa Timur, Susenas
dilaksanakan dengan mengambil jumlah contoh sekitar 29.000 responden untuk
38 Kabupaten/kota atau 639 kecamatan.
2.7.1. Kerangka Percontohan dan Metode Penarikan Contoh
Kerangka percontohan untuk Susenas tahun 2010 berdasarkan listing
rumahtangga hasil listing Sensus Penduduk (SP) tahun 2010. Penarikan contoh
dalam survai Susenas menggunakan rancangan percontohan dua tahap untuk
daerah perkotaan dan tiga tahap untuk daerah pedesaan (BPS 2010).
Kerangka percontohan pemilihan tahap pertama adalah master sampel
blok sensus (BS) biasa kondisi 5 Mei 2010. Master BS tersebut disertai dengan
informasi banyaknya rumah tangga hasil listing SP2010, muatan blok sensus
dominan (pemukiman biasa, pemukiman mewah, pemukiman kumuh), informasi
daerah sulit/tidak sulit, dan klasifikasi desa/kelurahan (rural/urban). Kerangka
percontohan pemilihan tahap kedua adalah daftar rumah tangga biasa hasil
listing SP2010 dalam blok sensus.
Metode penarikan contoh yang digunakan yaitu penarikan contoh dua
tahap berstrata. Tahapan dari metode ini diuraikan sebagai berikut:
• Tahap pertama, memilih blok sensus dari secara pps (Probability
Proportional to Size) dengan size banyaknya rumah tangga hasil listing
SP2010 (Mi
• Tahap kedua, dari setiap blok sensus terpilih dipilih sejumlah rumah
tangga biasa (n=16) secara sistematik berdasarkan hasil listing SP2010.
).
Jumlah contoh blok sensus untuk penduga kabupaten/kota merupakan
jumlah contoh minimum untuk pendugaan di tingkat kabupaten/kota. Contoh blok
sensus dibedakan atas daerah perkotaan dan perdesaan yang diidentifikasi
berdasarkan daerah sulit atau tidak sulit. Alokasi jumlah contoh menurut daerah
perkotaan dan perdesaan di setiap kabupaten/kota dilakukan secara
28
proporsional terhadap proporsi akar jumlah rumah tangga dalam RBL1 dengan
akar biaya per unit.
n
cN
cN
mH
h h
h
h
h
h ×
=
∑=1
(2.46)
dengan:
hm : Jumlah contoh blok sensus dalam strata h
hN : Jumlah rumah tangga biasa dalam strata h
hc : Biaya per unit dalam strata h
m : Jumlah target contoh.
Kerangka contoh yang digunakan untuk pemilihan rumah tangga adalah
daftar rumah tangga biasa hasil listing SP2010. Pemilihan contoh rumah tangga
secara sistematik sampling dengan ukuran sampel rumah tangga yang harus
dipilih di setiap blok sensus adalah 16 rumah tangga. Nomor urut rumah tangga
yang terpilih sebagai contoh sudah ditetapkan dari BPS-RI.
2.7.2.Penentuan Bobot
Bobot penarikan contoh diperhitungkan dalam rangka mendapatkan
pendugaan tak bias untuk parameter di tiap Kabupaten/Kota. Misalkan pada
suatu kabupaten/kota target contoh blok sensus pada strata ke-h adalah nh
hiM
yang dipilih secara pps dengan size banyaknya rumah tangga hasil listing SP
2010 ( ), maka peluang contoh blok sensus ke-i terpilih sebagai contoh
menurut BPS (2010) adalah
(2.47)
sehingga fraksi penarikan contoh tahap pertamanya adalah
. (2.48)
Bila pada setiap blok sensus ditarik sejumlah rumah tangga (fixed size: m)
dengan equal probability, peluang bersyarat terpilihnya rumah tangga ke-j blok
,oh
hiM
ihi
hihi N
N
N
NPh
==∑
oh
hihM
ihi
hihhi N
Nm
N
Nmf
h
×=×=
∑
29
sensus ke-i dalam strata h, dan diketahui dari blok sensus ke-i adalah:
hiihj N
P 1| = , maka fraksi penarikan contoh tahap kedua adalah:
hiihj N
nf =| . Oleh
karena itu overall sampling fraction adalah:
fN
nmNn
NNmfff
oh
h
hioh
hihihjhihij =
×=×
×=×= | konstan. (2.49)
Overall sampling fraction f konstan untuk setiap blok sensus terpilih, maka
rancangan penarikan sampel tersebut dinamakan self-weighting design. Dengan
demikian design weight dapat dirumuskan sebagai berikut:
nmNWh
ohhij ×=
dimana:
hijW : bobot rumah tangga ke-j, blok sensus ke-i dalam strata h
ohN : banyaknya populasi rumah tangga biasa hasil listing SP2010
dalam strata h
hm : banyaknya contoh blok sensus dalam strata h
n : banyaknya contoh rumah tangga di blok sensus ke-i.
30
BAB III Model Bayes untuk Pendugaan Area Kecil Berbasis
Peubah Respon Binomial 3.1. Pendahuluan
Peubah respon yij merupakan peubah respon biner yang diukur pada area
ke-i dimana yij bernilai 1 atau 0. Sebagai contoh yij adalah peubah yang
mengukur kemampuan baca tulis, maka yij =1 jika individu tertentu di area ke–i
bisa baca dan tulis dan yij =0 jika tidak bisa baca tulis. Jika peubah yij
diasumsikan memiliki sebaran Bernoulli dengan parameter pi, maka fungsi
massa peluang dari yij
)1()|( iyiiij pppyf ji −=
adalah:
(3.1)
atau ditulis )(| ~ i
ind
iij pBernoullipy , untuk j=1,2,.....ni
∑= j iji yy
; i=1,2,.....,m. Selanjutnya
didefinisikan , adalah jumlah kejadian yang menjadi perhatian di area
ke-i , maka yi
iii yni
yi
i
iii pp
yn
pyf −−
= )1()|(
memiliki sebaran Binomial dengan fungsi peluang:
(3.2)
atau ditulis: ),(~| ii
ind
ii pnBinomialpy . Dalam contoh kasus penelitian ini, yi
Parameter area kecil yang ingin diduga adalah proporsi area kecil,
adalah jumlah individu di area ke-i yang bisa membaca dan menulis.
ij ijii NyYp /∑== , dimana ∑= j iji yy merupakan statistik minimum cukup
dari pi
ip
. Jika penarikan contoh dilakukan dengan metode acak sederhana, maka
penduga proporsi di area ke-i yaitu , diturunkan melalui metode pendugaan
peluang maksimum (ML), yaitu iiij
iji nynyp //ˆ ==∑ . Penduga ML ini
merupakan pendugaan langsung melalui pendekatan klasik.
Melalui pendekatan Bayes, pendugaan parameter ip dapat dilakukan
secara langsung yaitu dengan tidak memanfaatkan informasi tambahan dari
31
peubah penyerta dan pendugaan tidak langsung yaitu menggunakan model
dengan memanfaatkan informasi dari peubah penyerta.
Pendugaan langsung melalui pendekatan Bayes adalah menganggap
parameter pi
Untuk pendugaan berbasis model, digunakan transformasi fungsi logit
terhadap p
merupakan peubah yang memiliki distribusi tertentu. Dalam
pendugaan Bayes terdapat dua jenis informasi yaitu informasi prior diperoleh dari
sebaran prior dan informasi dari hasil survai. Untuk peubah binomial, sebaran
prior yang digunakan adalah sebaran beta atau logit normal.
ij atau logit (pij
Clarke et al. (2006) mengembangkan metode SAE berdasarkan data biner
untuk menduga angka pengangguran di area kecil. Pendugaan angka
pengangguran didasarkan pada data pengangguran dari Labour Force Survey
(LFS) dan data administratif. Peubah penyerta yang digunakan adalah usia yang
dibagi ke dalam 3 kelompok (16-24 tahun, 25-49 tahun dan lebih dari 50 tahun),
dan jenis kelamin. Pendugaan parameter model diperoleh dengan menggunakan
pendugaan Kemungkinan Quasi Berpenalti (KQB) atau Penalized Quasi
Likelihood (PQL) untuk pendugaan β dan µ dan menggunakan Kemungkinan
Maksimum Berkendala (KMB) atau Restricted Maximum Likelihood (REML)
untuk menduga σ. Untuk membuktikan konsistensi penduga parameter β
dilakukan dengan cara meregresikan nilai β berdasarkan dua data yaitu dari
pemerintah lokal dan dari parlemen, membandingkan CV (Coefficient of
Variation) keduanya, dan membandingkan standard error masing-masing dengan
standard error dari pendugaan langsung. Diperoleh hasil bahwa metode yang
digunakan memiliki konsistensi terhadap penduga dan memberikan nilai SE lebih
baik dibandingkan dengan pendugaan langsung
). Beberapa peneliti yang telah mengembangkan
model pendugaan area kecil untuk data biner melalui pendekatan Bayes adalah
Malec et al. (1997) mengembangkan Model SAE untuk data biner yang
diaplikasikan pada data survei di bidang kesehatan berbasis kombinasi area dan
unit. Pendugaan parameter yang dilakukan oleh Malec et al. (1997) adalah
metode Bayes berhirarki yang dibandingkan dengan metode standar dan metode
Bayes Empirik.
Chandra et al. (2009) mengembangkan pendugaan area kecil untuk
proporsi dalam survai bisnis. Metode pendugaan parameter yang mereka
kembangkan adalah Empirical Best Predictor (EBP) dibawah model linier
campuran terampat dan Model-Based Direct Estimator (MBDE). Selanjutnya
32
Boostra et al. (2011) mengembangkan pendugaan area kecil untuk status
tenaga kerja di Australia. Model yang digunakan adalah model berbasis unit,
yang merupakan model linier campuran dengan pengaruh area (dalam hal ini
area adalah kota). Metode pendugaan parameter model menggunakan
Kemungkinan Maksimum (KM). Untuk memilih kovariat dalam model dilakukan
diagnostik secara grafis. Diperoleh bahwa model SAE menghasilkan KTG lebih
kecil dari metode pendugaan yang lain.
3.2. Metode Pendugaan Langsung Melalui Pendekatan Bayes.
Melalui pendekatan Bayes Rao (2003) menyatakan bahwa, metode
pendugaan langsung untuk parameter ip dapat dilakukan melalui dua alternatif
cara yaitu: 1) dengan mengasumsikan bahwa parameter pi
[ ])1/(log)(log iii pppit −=
merupakan peubah
yang memiliki sebaran beta dengan parameter α dan β dan 2) dengan
menggunakan fungsi logit atau probit )(1ip−Φ yang
diasumsikan memiliki sebaran normal. Untuk alternatif 1, sebaran beta untuk
parameter parameter ip merupakan sebaran prior, sedangkan untuk alternatif 2,
sebaran priornya adalah menggunakan sebaran normal.
3.2.1. Pendugaan Bayes Menggunakan Sebaran Prior Beta
Untuk alternatif 1, dimana pendugaan Bayes diturunkan dengan
menggunakan sebaran prior Beta, maka parameter pi
0,0);,(~ >> βαβαBetapiid
i
dianggap sebagai sebuah
peubah acak yang memiliki sebaran peluang Beta atau ditulis
. Beta (α,β) menyatakan sebaran Beta dengan
parameter α dan β dengan bentuk fungsi peluang:
.0,0;)1()()()(),|( 11 >>−
ΓΓ+Γ
= −− βαβαβαβα βα
iii pppf (3.3)
Pendugaan Bayes untuk parameter pi diperoleh dengan mencari nilai ekspektasi
dari sebaran posterior untuk pi yaitu dengan mencari sebaran marjinal dari
sebaran bersama dari (yi, pi
), yaitu:
.)1()()()()1(),( 11 −−− −
ΓΓ+Γ
−
= βα
βαβα
iiyn
iyi
i
iii ppxpp
yn
pyf iii (3.4)
33
Dari persamaan (3.4) maka diperoleh sebaran posterior pi
yang
merupakan sebaran bersayarat dari pi jika yi
.)(
),/,(),,/(i
iiii yf
pyfypf βαβα =
diketahui yaitu:
(3.5)
Sebaran posterior pi α+iy merupakan sebebaran Beta dengan parameter ( )
dan ( β+− ii yn ), atau ditulis:
).,(~,,| βαβα +−+ iii
ind
ii ynybetayp (3.6)
Penduga Bayes dari pi
βααβαβα++
+==
i
iii
Bi n
yypEp ),,|(),(ˆ
dan varians posteriornya diberikan oleh:
(3.7)
dan
.))(1(
))((),,|( 2βαβαβαβα+++++
+−+=
ii
iiiii nn
ynyypV (3.8)
Penduga Bayes Empirik untuk pi
α
diperoleh dengan menggantikan α dan
β dengan penduganya yaitu dan β yang dapat diperoleh dengan dua cara
yaitu dengan menggunakan metode momen atau dengan memaksimumkan
fungsi kemungkinan dari sebaran posterior atau disebut sebagai metode KM
(Kemungkinan Maksimum), akan diperoleh nilai KMα dan KMβ .
Dengan menggunakan metode penduga momen, maka dugaan untuk α
dan β diperoleh dengan menyelesaikan persamaan berikut:
βα
αˆˆ
ˆˆ+
=p dan [ ]∑ −−−−
−−−=
++ i TiT
pT
mnnnppmppsn
)1(/)ˆ1(ˆ)1)(ˆ1(ˆ
1ˆˆ1
2
2
βα (3.9)
dimana 22 )ˆˆ)(/( ppnns ii Tip −=∑ , .∑= i iT nn
Sedangkan menggunakan metode peluang maksimum, MLα dan MLβ
diperoleh dengan memaksimumkan fungsi likelihood l(α,β) dari sebaran beta-
binomial BinomialBetayind
i −~,| βα :
)()()(
)()()(),(
1 βαβα
βαβαβα
ΓΓ+Γ
++Γ−+Γ+Γ
= ∏
=x
nyny
yn
li
iii
i
in
i
i
(3.10)
dimana fungsi sebarannya berbentuk:
34
.)()()(
)()()(),|(
βαβα
βαβαβα
ΓΓ+Γ
++Γ−+Γ+Γ
= x
nyny
yn
yfi
iii
i
ii
(3.11)
Rao (2003) menyatakan bahwa Fungsi (3.11) di atas dapat disederhanakan
menjadi:
∑
∑ ∑ ∑ ++−++++=
=
−
=
−−
=
−
=
m
i
y
h
yn
h
n
h
i ii ihhhcl
1
1
0
1
0
1
0)log()log()log(),( βαβαβα (3.12)
dimana ∑ +−
=
1
0)log(
iy
hhα akan sama dengan nol; jika yi ∑ +
−−
=
1
0)log(
ii yn
hhβ=0 dan sama
dengan nol jika yi=ni )/()( βααµ +==ijyE. dan )/(1 βατ += ,
)1/(1),( ++== βαρ ikij yyCorr untuk .kj ≠ Dengan menggunakan µ dan τmaka bentuk fungsi likelihoodnya menjadi:
.)1log()1log()log(),(1
0
1
0
1
01
+−+−+++= ∑ ∑ ∑∑
−
=
−−
=
−
==
i ii iy
h
yn
h
n
h
m
ihhhconstl ττµτµτµ
Selanjutnya penduga ML dapat diperoleh dengan metode Newton-Raphson
atau metode iteratif yang lain karena bentuk tertutup (closed –form) untuk MLα
dan MLβ tidak ada.
Dengan menggantikan α dan β dengan α dan β ke dalam persamaan
(3.7) dan (3.8) diperoleh penduga Bayes Empirik dari pi
pppp iiiBi
EBi ˆ)ˆ1(ˆˆ)ˆ,ˆ(ˆˆ γγβα −+==
yaitu:
(3.13)
dimana ( )βαγ ˆˆ/ˆ ++= iii nn .
Penduga Bayes Empirik dari parameter piEBip ( ) adalah rata-rata terbobot
dari penduga langsung p . Jika ni
ip
membesar maka bobot yang diberikan
kepada akan lebih besar. Persamaan penduga tersebut di atas serupa
dengan penduga Fay-Heriot untuk model berbasis area. Penduga EBip
mendekati tidak bias untuk piEBip jika m besar karena E( -pi) akan mendekati
nol.
35
Pendugaan KTG dapat dicari melalui metode Jackknife, yang
menghasilkan penduga )ˆ( EBipKTG yang mendekati tak bias. Penduga Jackknife
dari )ˆ( EBipKTG yaitu )ˆ( EB
ipktg diperoleh dengan cara menghitung :
[ ]∑ −−
−==
−−
m
liiilliiii ygyg
mmygM
11111 ),ˆ,ˆ(,ˆ,ˆ(1),ˆ,ˆ(ˆ βαβαβα
(3.14)
( )21
,2 ˆ1ˆ ∑ −−
==
−
m
l
EBi
EBlii pp
mmM (3.15)
dimana
)ˆ,ˆ,(ˆ σµiiEBi ykp =
)ˆ,ˆ,(ˆ , lliiEB
li ykp −−− = σµ
21)ˆˆ)(1ˆˆ(
)ˆ)(ˆ(),,|(),ˆ,ˆ(
βαβα
βαβασµ
+++++
+−+==
ii
iiiiiii
nnyny
ypVyg
dan ),ˆ,ˆ(1 illi yg −− σµ diperoleh dengan menggantikan µ dan σ dengan
l−µ dan l−σ (diperoleh dengan menghilangkan area ke-l)
Penduga ML diperoleh dari { }miny ii ,.....,1),,( ≠
iiEBi MMpktg 21
ˆˆ)ˆ( += (3.16)
3.2.2. Pendekatan Bayes Menggunakan Sebaran Prior Logit-Normal.
Transformasi fungsi logit pi [ ])1/(log)(log iii pppit −= yaitu diasumsikan
memiliki sebaran normal ),( 2σµN , ditulis:
[ ] ).,(~)1/(log)(log 2σµNpppitiid
iii −= (3.17) Dengan mendefinisikan σµ /])([log −= ii pitz , maka zi
akan memiliki sebaran normal standar N (0,1) atau ditulis
)1,0(~/])([log Npitz ii σµ−= maka pi
.1
)(i
i
z
z
ii eezup σµ
σµ
σµ +
+
+=+=
dapat dinyatakan sebagai fungsi µ dan σ sebagai berikut:
(3.18)
Penduga Bayes untuk pi ),,|(),(ˆ σµσµ iiBi ypEp = adalah yang diperoleh
dari nilai ekspektasi pi dari sebaran posterior pi jika yi, µ dan σ diketahui.
36
lmplementasi dari penduga Bayes Empirik lebih kompleks untuk model logit
normal karena tidak ada bentuk analitik untuk penduga Bayes dan varians
posterior dari pi . Untuk model logit-normal, Rao (2003) mengatakan bahwa
penduga Bayes dari pi
)1,0(~ Nzi
dapat dinyatakan sebagai rasio dari integral berdimensi
satu atas sebagai berikut:
{ }[ ]
{ }[ ]),(exp),(exp)(),,/(),(ˆ
2
21
zyhEzyhzhEypEp
i
iii
Bi σµ
σµσµσµσµ+
++==
(3.19)
dimana
).1log()())(,(2z
iii enyzzyh σµσµσµ ++−+=+
Ragam posteriornya adalah ),,|( σµii ypV , yang dapat dianggap merupakan
fungsi dari ( iy,,σµ ) atau ditulis sebagai ),,(),,|( 1 iiii ygypV σµσµ = :
[ ] .,(ˆ),,|(),,|(22 σµσµσµ B
iiiii pypEypV −= (3.20)
Pendugaan terhadap µ dan σ diperoleh dengan memaksimumkan fungsi
Log likelihood, l(µ,σ), untuk model logit-normal yaitu:
{ }[ ][ ].),(explog),(1
2∑=
++=m
ii zyhEconstl σµσµ
(3.21)
Selanjutnya dengan menggunakan pendugaan ML diperoleh penduga EB
dari pi )ˆ,ˆ(ˆˆ σµBi
EBi pp = , dengan menggantikan µ dan σ .
Pendugaan KTG
Perhitungan )ˆ( EBiJ pmse menggunakan penduga ML cukup rumit,
sebaliknya menggunakan metode momen seperti yang dilakukan oleh Jiang
(1998) lebih mudah dilakukan, yaitu dengan menyamakan:
)]([ˆ 1 zhEnpny TTi i σµ +==∑
[ ])()1()( 21
2 zhEnnyyi
iiii
i σµ +
−=− ∑∑ .
Perhitungan )]([)( 1 zhEpE i σµ += dan )]([)( 21
2 zhEpE i σµ += dilakukan dengan
menggunakan integrasi Monte Carlo.
Penduga Jackknife dari )ˆ( EBipMSE yaitu )ˆ( EB
ipmse diperoleh dengan
menggantikan )ˆ,ˆ,(ˆ σµiiEBi ykp = dan )ˆ,ˆ,(ˆ , llii
EBli ykp −−− = σµ dalam persamaan
(3.14) dan (3.15).
37
3.3. Metode Pendugaan Tak Langsung Melalui Pendekatan Bayes.
Sesuai dengan prosedur yang dilakukan oleh Malec et al. (1997),
diasumsikan bahwa tiap individu dalam populasi dapat dimasukkan ke dalam
kelompok yang saling terpisah (mutually exclucive and exhoustive) berdasarkan
pada status sosial-ekonomi atau status demografi tertentu. Misalkan Yij
merupakan peubah acak biner untuk individu ke-j dalam area i dimana i=1,2.....I;
j=1,......,Ni maka Yij merupakan peubah acak bebas Bernoulli dengan (Yij =1|
pij)=pij
,)(log iTijij xpit υβ +=
. Model yang menghubungkan parameter dengan kovariatnya adalah
model regresi logistik dengan efek acak area sebagai berikut:
).,0(~ 2υσυ N
iid
i (3.22) Model di atas disebut sebagai model linier logistik campuran yang
merupakan anggota dari model linier campuran terampat. Peubah tak bebasnya
adalah logit (pij) dan peubah bebas adalah X. Selanjutnya xij
Untuk kasus pendugaan proporsi penduduk yang bisa baca tulis, maka
dugaan proporsi penduduk yang bisa baca tulis p
adalah vektor
kovariat tetap dan diasumsikan tidak tergantung pada i.
i adalah jumlahan dari jumlah
penduduk dalam percontohan yang bisa baca tulis dibagi dengan jumlah
percontohan di area ke-i dan penduga pi
*)1( iiiii yfyfp −+=
dari individu yang tidak bisa baca tulis
yang tidak terambil sebagi contoh. Secara matematis ditulis sebagai berikut:
(3.23)
dimana:
{ }misjxy iijij ,....,1;),,( =∈
si adalah percontohan berukuran ni is′ dari area ke-i dan adalah unit-
unit yang tidak diambil contohnya.
fi = ni/Ni
iy
,
adalah rata-rata contoh (proporsi)
)/('
*ii
slili nNyy
i
−∑=∈
adalah rata-rata dari unit-unit yang tidak diambil
contohnya dalam area i. Penduga Bayes dari *
iy diberikan oleh:
( )υσβ ,,|ˆ )()( iciB
ci ypEp = )/( iisl il nNpi
−∑= ′∈
38
dimana:
yi
adalah dari contoh dalam area ke i.
),,,|( υσβiililil ypyEp = untuk isl ′∈ .
Penduga Bayes dari *iy adalah ( )υσβ ,,|ˆ )()( ici
Bci ypEp = , sehingga penduga
Bayes dari pi
.ˆ)1(),(ˆˆ )(B
ciiiiBi
Bi pfyfpp −+== υσβ
dapat dinyatakan sebagai:
(3.24)
Sehingga:
∑
∑
∑
=
∑=
∈
∈
i
i
sjiij
Tiji
l sjiij
Tijiil
liil
Bci
zyyxhE
zyyxhpE
ypEp
βσ
βσ
σβ υ
,,,exp
,,,exp(
,,|ˆ )(
(3.25)
dimana
( )[ ]..exp1log)(,, ∑∑∑∈∈∈
++−+
=
iii sj
Tiji
sjij
Tij
sjij
Tiji zxyzyxzyxh σβσββσ
(3.26)
Rao (2003) mengatakan bahwa pendugaan parameter model β dan υσ
dapat dilakukan melalui berbagai cara, diantaranya algoritma EM, MCMC seperti
yang disarankan oleh Mc Coullagh dan Searle (2001) dan KQB. Selain itu untuk
mendapatkan dugaan β dan υσ juga dapat digunakan metode momen.
Dengan menggunakan KM ataupun metode momen maka akan diperoleh
β dan υσ sehingga dapat diperoleh BE untuk pi
)ˆ,ˆ(ˆ υσβBi
EBi pp =
(proporsi di area ke i) yaitu
. Jika fiBip (sampling fraction) dapat diabaikan, maka dapat
diekspresikan sebagai:
.,,/1ˆ1
≈ ∑
=
iN
liil
i
Bi ypE
NP υσβ (3.27)
Ragam posterior Pi
,,,|,,/)1((
)ˆ()1(),,/(
2
2)(
*2
+
−=
−−=
∑∑′∈′∈
−
ii sliil
sliilili
Bciiiii
ypVyppEN
pyEfyPV
υυ
υ
σβσβ
σβ
tereduksi menjadi:
(3.28)
39
.,,,exp
,,,exp(,,|
2
2
=
∑
∑ ∑
∑
∈
∈
i
i
sjiij
Tiji
l sjiij
Tijiil
liil
zyyxhE
zyyxhpEypE
βσ
βσσβ υ (3.29)
Tidak ada bentuk analitik (closed form) untuk mendapatkan nilai ekspektasi
di atas sehingga perhitungan nilai ekspektasi dilakukan dengan metode numerik.
Pendugaaan )ˆ( EBipKTG dilakukan dengan metode Jackknife yaitu
dengan menggantikan )ˆ,ˆ,(ˆ σµiiEBi ykp = dan )ˆ,ˆ,(ˆ , llii
EBli ykp −−− = σµ dalam
persamaan (3.24) sampai dengan persamaan (3.29) sehingga diperoleh nilai
iM1ˆ dan iM 2
ˆ , sekaligus diperoleh nilai KTG yaitu iM1ˆ + iM 2
ˆ .
3.4. Aplikasi : Pendugaan Angka Melek Huruf di Tingkat Kecamatan, Kabupaten Sumenep Berbasis Data Susenas
Model SAE yang telah dibahas pada sub bab (3.2) dan (3.3) di atas
diaplikasikan pada pendugaan angka melek huruf di tingkat kecamatan disalah
satu Kabupaten di Jawa Timur yaitu Kabupaten Sumenep dan Kabupaten
Pasuruan Provinsi Jawa Timur. Data dasar yang digunakan adalah data Survei
Ekonomi Nasional (Susenas) yang dilakukan oleh BPS tahun 2010. Untuk
Kabupaten Sumenep, dari populasi sebesar 339.403 tangga diambil contoh
sebanyak 2307 rumah tangga dan rata-rata jumlah contoh di tiap kecamatan 86
rumah tangga.
Berdasarkan data Susenas Kabupaten Sumenep rata-rata proporsi yang
bisa baca dan tulis di tiap kecamatan sekitar 77.6%. Gambar 3.1 menunjukkan
bahwa terdapat dua kecamatan yang memiliki proporsi terendah yaitu kecamatan
Batuputih (39.5%) dan kecamatan Talango (58%), Angka melek huruf di
Kabupaten Pasuruan relatif lebih baik dibandingkan dengan Kabupaten
Sumenep, rata-rata proporsi yang bisa baca dan tulis di tiap kecamatan sekitar
90,07%. Di Kabupaten pasuruan terdapat tiga kecamatan yang memiliki proporsi
terendah yaitu kecamatan Puspo (75,5%), Lekok (75,5) dan kecamatan Nguling
(71%).
40
(a) Kabupaten Sumenep (b) Kabupaten Pasuruan
Gambar 3.1. Proporsi Penduduk 10 tahun ke atas yang bisa baca tulis berdasarkan data
Susenas tahun 2010 di Kabupaten Sumenep dan Pasuruan
0
0,2
0,4
0,6
0,8
1
1,2
Arj
asa
Sape
ken
Blut
oRa
'As
Kang
ayan
Man
ding
Gay
amG
ilige
nten
gKa
liang
etKo
ta S
umen
epPr
agaa
nN
ongg
unon
gD
asuk
Saro
nggi
Mas
alem
buBa
tuan
Gan
ding
Lent
eng
Ruba
ruA
mbu
nten
Gul
uk G
uluk
Paso
ngso
ngan
Dun
gkek
Bata
ng B
atan
gG
apur
aTa
lang
oBa
tupu
tih
Kecamatan
proporsi
0
0,2
0,4
0,6
0,8
1
1,2
Purw
osar
i
Keja
yan
Bang
il
Gem
pol
Rejo
so
Won
orej
o
Pand
aan
Beji
Tosa
ri
Suko
rejo
Tutu
r
Prig
en
Gon
dang
Wet
an
Lum
bang
Purw
odad
i
Gra
ti
Krat
on
Win
onga
n
Pasr
epan
Rem
bang
Pusp
o
Leko
k
Ngu
ling
Pohj
entr
ek
Kecamatan
proporsi
40
3.4.1. Pendugaan Langsung
Penduga langsung untuk proporsi penduduk berusia 10 tahun ke atas dan
nilai KTG nya adalah sebagai berikut:
1) Menggunakan metode klasik dengan rumus .//ˆ iiij
iji nynyp == ∑
2) Menggunakan pendekatan Bayes dengan sebaran prior beta.
Pendugaan α dan β menggunakan metode momen, yaitu dengan
menghitung α dan β menggunakan persamaan (3.9), dimana:
2)ˆˆ)(/(2 pipi Tninps −∑= , ∑= i inTn
p adalah proporsi penduduk yang bisa baca tulis dihitung dari contoh
ni
n
: ukuran contoh di kecamatan ke-i
T
Sedangkan penduga p
: jumlah contoh Susenas di Kabupaten Sumenep.
i
( )..ˆˆ/ˆ βαγ ++= iii nn
dihitung dengan menggunakan rumus (3.13)
dimana
Untuk pendugaan )ˆ( EBipKTG dilakukan dengan menggunakan
metode Jackknife, diperoleh dengan menggantikan )ˆ,ˆ,(ˆ σµiiEBi ykp =
dan )ˆ,ˆ,(ˆ , lliiEB
li ykp −−− = σµ dalam persamaan (3.14) Dan ),ˆ,ˆ(1 ii yg σµ dan
),ˆ,ˆ(1 illi yg −− σµ dalam persamaan (3.15) dimana:
21)ˆˆ)(1ˆˆ(
)ˆ)(ˆ(),,|(),ˆ,ˆ(
βαβα
βαβασµ
+++++
+−+==
ii
iiiiiii
nnyny
ypVyg
l−µ dan l−σ adalah dugaan dariµ dan σ yang dihitung dari data tanpa
kecamatan ke l.
Penduga )ˆ( EBipKTG adalah ii
EBij MMpktg 21
ˆˆ)ˆ( += diperoleh dari
persamaan (3.16).
3) Menggunakan fungsi logit(pi), maka penduga parameter pi
berikut:
menggunakan rumus pada persamaan (3.19). Selanjutnya integral
pembilang dan penyebut pada persamaan (3.19) dihitung dengan
langkah sebagai
1. Menghiitung penduga µ dan σ dari distribusi normal
[ ] ),(~)1/(log)(log 2σµNpppitiid
iii −=
41
µ = rata-rata dari logit (pij
σ
)
= standard deviasi dari logit (pij
2. Membangkitkan z dari distribusi N(0,1) dengan mengambil n=500,
kemudian untuk tiap nilai z dari langkah ke dua, hitung:
)
Aa { }[ ]),(exp)( 21 zyhzhE i σµσµ ++ =
= { } 221 2/1exp
21),(exp)( aaia zxzyhzh −++π
σµσµ , a=1,...500
dimanai
i
z
z
i eezh σµ
σµ
σµ +
+
+=+
1)(1 dan
)1log()())(,(2z
iii enyzzyh σµσµσµ ++−+=+
Atau:
22/1
21)1log()exp(
1aa
a
azz
iiaz
z
a exenyzxe
eA −+
+
+
+−++
=π
σµ σµσµ
σµ
Sehingga:
{ }[ ] xzyhzhE i 500
1),(exp)( 21 =++ σµσµ ∑a A
3. Menghitung
a
+−+= + )1log()(exp az
iiaa enyzB σµσµ x22/1
21
aze−
π
{ }[ ] aa
i BzyhE ∑=+500
2 5001),(exp σµ
Penduga Bayes dihitung dengan mencari rasio dari hasil pada
langkah ke -2 dan ke-3 diatas
Nilai KTG dihitung dengan menggunakan metode Jacknife menggunakan
rumus (3.16) namun dengan menghitung varians (pi
[ ]221 ,(ˆ),,|(),,|(),ˆ,ˆ( σµσµσµσµ B
iiiiiii pypEypVyg −==
) melalui rumus:
dimana: )]([)( 1 zhEpE i σµ += dan )]([)( 21
2 zhEpE i σµ +=
)]([ˆ 1 zhEnpny TTi i σµ +==∑
[ ])()1()( 2
12 zhEnnyy
iiii
ii σµ +
∑ −=−∑
Dengan mengaplikasikan metode momen seperti yang telah dijelaskan
oleh persamaan (3.9), pendugaan parameter α dan β menggunakan sebaran
prior Beta adalah:
42
Kabupaten Sumenep: α = 6.007941dan β =1.735254.
Kabupaten Pasuruan: α = 16,1824 dan β =1,6204..
Selanjutnya dengan menggunakan sebaran prior logit-normal pendugaan
proporsi di area kecil (kecamatan) dilakukan dengan cara numerik menggunakan
persamaan (3.19) yaitu dengan membangkitkan nilai z dari sebaran N(0,1)
n=500. Hasil pendugaan parameter (pi
) dengan mengaplikasikan metode
pendugaan langsung ditunjukkan oleh Lampiran 8 dan Lampiran 9, secara
grafis ditunjukkan oleh Gambar 3.2. Dapat dilihat bahwa untuk pendugaan
langsung, metode KM memberikan hasil yang hampir sama dengan metode
Bayes yang menggunakan sebaran prior logit normal, demikian juga dengan
pendekatan menggunakan sebaran prior beta.
(a) Kabupaten Sumenep (b) Kabupaten Pasuruan
Gambar 3.2.
Hasil Pendugaan angka melek huruf dengan menggunakan metode klasik dan Metode Bayes
Pada pendugaan proporsi dengan menggunakan sebaran prior logit
normal, sebaliknya untuk sebaran prior Beta, bobot untuk komponen contoh
pada iy yaitu ( )βαγ ˆˆ/ˆ ++= iii nn relatif besar yaitu sekitar 0.905 untuk
Kabupaten Sumenep dan 0,827 untuk kabupaten Pasuruan. Oleh karena itu
pendugaan Bayes secara langsung lebih dipengaruhi oleh komponen contoh
karena bobot untuk komponen populasi relatif kecil sehingga tidak memberikan
pengaruh yang berarti pada penduga Bayes.
Hasil dugaan KTG menggunakan metode Jackknife untuk pendugaan
langsung yang ditunjukkan oleh Gambar 3.3 memperlihatkan bahwa kedua
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1
0 5 10 15 20 25 30
Pendekatan Kalsik MLPendekatan Bayes Logit (pEB Logit)Pendekatan Bayes Beta (pEB Beta)
0,7
0,75
0,8
0,85
0,9
0,95
1
0 5 10 15 20 25
Pendekatan Kalsik ML
Pendekatan Bayes Logit (pEB Logit)
Pendekatan Bayes Beta (pEB Beta)
43
metode pendugaan langsung kurang memberikan akurasi yang bagus karena
menghasilkan nilai MSE relatif tinggi dan kurang stabil.
(a) Kabupaten Sumenep (b) Kabupaten Pasuruan
Gambar 3.3 Plot dari nilai dugaan KTG menggunakan sebaran prior Beta dan Logit-Normal
melalui metode pendugaan langsung
3.4.2. Pendugaan Tak Langsung
Melalui pendugaan tak langsung, angka melek huruf diduga melalui model
dengan peubah penyerta usia dan jenis kelamin. Peubah usia dibagai kedalam 5
katagori yaitu antara 10 -30 tahun, 30-40 tahun, 40-50 tahun, 50-60 tahun dan di
atas 60 tahun dan jenis kelamin dibedakan atas 2 katagori yaitu laki-laki dan
perempuan. Oleh karena itu setiap individu di area ke i dapat diklasifikasikan
kedalam k kelompok, k =1,2....10 yang merupakan kombinasi antara usia dan
jenis kelamin. Sedangkan peubah respon untuk model SAE adalah proporsi
penduduk berusia 10 tahun ke atas yang bisa baca tulis di kelompok ke k di area
ke i. Karena penarikan contoh dalam Susenas dilakukan dengan cara memilih
contoh blok sensus secara acak pada tahap pertama dan selanjutnya memilih
contoh keluarga dalam blok sensus yang terpilih pada tahap kedua, maka area
kecil yang dimaksud pada penelitian ini adalah blok sensus.
Gambar 3.4 yang menjelaskan hubungan antara kemampuan baca tulis
dengan usia dinyatakan dalam grafik, menunjukkan bahwa makin tinggi proporsi
usia, maka pendudukan yang bisa baca dan tulis semakin kecil. Terlihat bahwa
proporsi penduduk laki-laki yang bisa baca dan tulis cenderung lebih banyak
dibandingkan dengan penduduk perempuan. Berdasarkan uji korelasi dengan
0
0,001
0,002
0,003
0,004
0,005
0,006
0,007
0,008
0,009
0,01
0 5 10 15 20 25 30
KTG logit KTG beta
0
0,0005
0,001
0,0015
0,002
0,0025
0,003
0,0035
0,004
0,0045
0 5 10 15 20 25
KTG Logit KTG Beta
44
mengambil α=5% terbukti bahwa kemampuan baca tulis dipengaruhi oleh usia
dan jenis kelamin. Dengan demikian pendugaan tak langsung (berbasis model)
dapat dilakukan dengan memanfaatkan peubah jenis kelamin usia sebagai
peubah penyerta ke dalam model SAE.
(a) Kabupaten Sumenep (b) Kabupaten Pasuruan
Gambar 3.4.
Hubungan kemampuan baca tulis dengan usia berdasarkan jenis kelamin di Kabupaten Sumenep dan Kabupaten Pasuruan
Melalui pendugaan tak langsung yaitu dengan melalui model SAE,
pendugaan parameter model menggunakan metode KQB yang kemudian
digunakan untuk menduga *iy berdasarkan sebaran prior logit normal
menggunakan pendekatan Bayes Empirik (persamaan 3.25). Perhitungan nilai
harapan pembilang dan penyebut dari persamaan tersebut menggunakan
metode Montecarlo.
Hasil pendugaan parameter dan KTG menggunakan metode pendugaan
tak langsung untuk Kabupaten Sumenep dan kabupaten Pasuruan dapat dilihat
pada Lampiran 8 dan Lampiran 9. Dalam bentuk grafik dapat dilihat pada
Gambar 3.5 untuk Kabupaten Sumenep dan dan Gambar 3.6 untuk Kabupaten
Pasuruan.
Melalui pendekatan Bayes, berdasarkan pendugaan tak langsung, rata-
rata angka melek huruf kecamatan di Kabupaten Sumenep sebesar 0,827
dengan dugaan KTG sebesar 0,027. Kecamatan Batuputih yang memiliki angka
melek huruf terendah berdasarkan pendugaan langsung sebesar 0,510.
Sedangkan untuk Kabupaten Pasuruan, rata-rata angka melek huruf kecamatan
berdasarkan pendugaan langsung sebesar 0,927 dengan nilai KTG sebesar
0,995 0,965
0,853
0,721
0,573
0,9860,907
0,624
0,441
0,200
0,20
0,30
0,40
0,50
0,60
0,70
0,80
0,90
1,00
10-30 tahun
31-40 tahun
41-50 tahun
51-60 tahun
> 60 tahun
Laki-laki Perempuan
0,99 0,97 0,96
0,840,76
1,000,95
0,810,77
0,37
0,20
0,30
0,40
0,50
0,60
0,70
0,80
0,90
1,00
10-30 tahun
31-40 tahun
41-50 tahun
51-60 tahun
> 60 tahun
Laki-laki Perempuan
45
0,036. Kecamatan Nguling memiliki angka melek huruf terendah yaitu
berdasarkan pendugaan langsung sebesar 0,725 .
Gambar 3.5. Plot hasil dugaan angka melek huruf dan KTG di Kabupaten Sumenep
Gambar 3.6. Plot hasil dugaan paramater pi
Pasuruan (angka melek huruf) dan KTG di Kabupaten
3.5. Pembahasan
Pendugaan angka melek huruf (proporsi penduduk berusia 10 tahun ke
atas yang bisa baca tulis) seperti dijelaskan oleh Gambar 3.2 menunjukkan
bahwa metode pendugaan langsung melalui pendekatan Bayes Empirik
memberikan hasil yang hampir sama dengan metode pendugaan langsung
secara melalui pendekatan klasik. Hal ini disebabkan karena nilai dugaan α dan
β relative kecil dibandingkan dengan nilai n i iy sehingga bobot untuk yaitu
0,500
0,550
0,600
0,650
0,700
0,750
0,800
0,850
0,900
0,950
1,00010 30 50 70 80 10
0
120
140
160
180
200
220
240
250
Kecamatan
proporsi
Dugaan Angka Melek Huruf
0,00E+00
2,00E-02
4,00E-02
6,00E-02
8,00E-02
1,00E-01
1,20E-01
1,40E-01
10 30 50 70 80 100120140160180200220240250
Kecamatan
Dugaan KTG
KTG
0,700
0,750
0,800
0,850
0,900
0,950
1,000
10 30 50 70 90 110
130
150
170
190
210
230
Kecamatan
proporsi
Dugaan Angka Melek Huruf
0,00E+00
2,00E-02
4,00E-02
6,00E-02
8,00E-02
1,00E-01
1,20E-01
1,40E-01
1,60E-01
1,80E-01
10 30 50 70 90 110
130
150
170
190
210
230
Kecamatan
Dugaan KTG
KTG
46
( )βαγ ˆˆ/ˆ ++= iii nn sangat besar (sekitar 0.905). Demikian juga untuk pendugaan
Bayes Empirik dengan sebaran prior logit normal, bobot untuk komponen
populasi terlalu kecil sehingga sebaran prior tidak terlalu berpengaruh kepada
penduga Bayes.
Nilai pendugaan KTG pendugaan langsung cenderung rendah, baik untuk
pendugaan berbasis sebaran prior Beta maupun sebaran logit normal. Nilai KTG
untuk pendugaan angka melek huruf di kecamatan Batuputih jauh lebih tinggi
dibandingkan kecamatan yang lain karena nilai dugaan angka melek huruf di
Kecamatan Batuputih sangat rendah dibandingkan dengan kecamatan lainnya.
Tabel 3.2 menunjukkan rata-rata pendugaan angka melek huruf dan KTG
kecamatan di Kabupeten Sumenep dan kabupaten Pasuruan menggunakan
pendekatan Bayes.
Tabel 3.2. Rata-rata pendugaan angka melek huruf dan KTG kecamatan di Kabupeten Sumenep dan kabupaten Pasuruan menggunakan pendekatan Bayes
Metode
Kabupaten Sumenep Kabupaten Pasuruan
Rata-rata Kecamatan
Rata-rata KTG
Rata-rata Kecamatan
Rata-rata KTG
Pendugaan langsung
- Prior Beta 0,7789 0,0019 0,9034 0,0009
- Prior Logit-normal 0,7794 0,0026 0,9046 0,0012
Pendugaan Tak langsung (Model –logit normal) 0,827 0,027 0,927 0,036
Tabel 3.2 di atas menunjukkan bahwa pendugaan Bayes berbasis model
menunjukkan perbedaan yang cukup signifikan dengan metode tak langsung
baik melalui pendekatan klasik maupun Bayes.
Keberadaan peubah penyerta yaitu usia dan jenis kelamin sangat
berpengaruh pada penduga pi, karena bobot untuk komponen model lebih
dominan dibandingkan dengan bobot untuk komponen penduga langsung
disebabkan oleh kecilnya sampling fraction (f i=ni/Ni).
47
BAB IV. Model SAE Berbasis Sebaran Respon Multinomial Melalui
Pendekatan Bayes 4.1. Pendahuluan
Jika setiap hasil pengukuran dapat dikatagorikan ke dalam q katagori A1,
A2,........... Aq, maka proporsi pada katagori ke k, k=1,2....q dinyatakan oleh pk
dan dikatakan bahwa p1, p2,.....pq adalah paramater dari sebaran multinomial.
Model SAE untuk respon multinomial ditujukan untuk menduga parameter p1,
p2,.....pq
Model SAE berbasis pada sebaran multinomial telah dikembangkan oleh
beberapa peneliti diantaranya Molina et al. (2007) yang mengembangkan
metode SAE model Campuran Logit Multinomial (Multinomial Logit Mixed Model).
Dalam penelitiannya, Molina menerapkan Model Campuran Logit Multinomial
dengan memasukkan satu pengaruh acak area ke dalam model sehingga
pengaruh acak dianggap sama untuk setiap kelas multinomial.
untuk area kecil ke-i dimana jumlah contoh dia area tersebut tidak cukup
representatif. Dengan memperhatikan salah satu katagori sebagai kejadian
sukses dan menganggap katagori yang lain sebagai kejadian gagal, maka model
SAE untuk respon multinomial dapat dikembangkan dengan cara sama dengan
respon binomial.
Scealy (2010) berpendapat bahwa pengaruh acak setiap katagori tidak
sama, oleh karena itu Scealy mengembangkan model yang dikembangkan oleh
Molina et al. (2007) dengan memasukkan pengaruh acak katagori dengan
memperhitungkan korelasi antar katagori. Metode tersebut kemudian
diaplikasikan untuk pendugaan parameter angkatan kerja di area kecil.
Pendugaan KTG didekati dengan dua metode yaitu parametric bootstrap dan
pendekatan analitik (analytical approximations) dan kemudian membandingkan
keduanya. Untuk pendugaan parameter model, baik Molina (2007) maupun
Scealy (2010) mengaplikasikan metode pendugaan KQB dan untuk komponen
ragam melalui pendekatan KM atau KMB.
Vizcaino et al (2011) mengembangkan pendugaan area kecil berbasis
peubah respon multinomial untuk pendugaan indikator angkatan kerja di Galicia,
Spanyol berdasarkan data Labour Force Survey (LFS). Mereka menggunakan
48
model Campuran Logit Multinomial dimana pendugaan parameternya
menggunakan kombinasi metode KQB untuk memprediksi parameter β dan
pendugaan terhadap pengaruh acak menggunakan metode KMB. Untuk
pendugaan KTG, mereka menggunakan metode parameteric bootstrap seperti
yang dilakukan oleh Gonzalez-Manteiga et al. (2008).
Dalam penelitian ini model SAE berbasis pada sebaran multinomial yang
dikembangkan didasarkan pada pengembangan model yang dilakukan oleh
Scealy (2010) yaitu dengan mengaplikasikan model Campuran Logit Multinomial.
Dalam pengembangan model tersebut dimasukkan pengaruh acak area dimana
pengaruh acak dalam setiap area kecil tidak sama untuk setiap kelas multinomial
karena varians dari pengaruh acak diasumsikan tidak sama diantara setiap
katagori. Untuk pendugaan parameter model digunakan metode pendugaan
KQB dan untuk pendugaan komponen ragam digunakan KMB sedangkan
prediksi area kecil dilakukan dengan pendekatan Bayes. Pendugaan KTG
dengan metode Jackknife seperti telah dijelaskan pada Bab III.
Selanjutnya model SAE untuk peubah respon multinomial yang
dikembangkan diaplikasikan untuk pendugaan proporsi penduduk berusia 10
tahun ke atas yang telah/sedang menduduki jenjang pendidikan tertentu dalam
rangka menghitung rata-rata lama sekolah di tingkat kecamatan. Lokasi studi
yang diambil adalah Kabupaten Sumenep dan kabupaten Pasuruan Propinsi
Jawa Timur. Jenjang pendidikan terdiri dari 6 katagori yaitu
Katagori I: tidak pernah bersekolah (lama sekolah 0 tahun)
Katagori 2: putus SD (lama sekolah 1-3 tahun)
Katagori 3: SD (lama sekolah 4-6 tahun)
Katagori 4: SLTP (lama sekolah 7-9 tahun)
Katagori 5: SLTA (lama sekolah 10-12 tahun)
Katagori 6: Perguruan tinggi (lama sekolah 13 tahun ke atas)
4.2. Model SAE untuk Respon Multinomial
Untuk kasus multinomial, setiap hasil pengukuran hanya dapat
dikatagorikan ke dalam sejumlah katagori tertentu, misalnya q katagori. Untuk
area (ui
),......,(~| 11 −iqiiiik ppnMuy) tertentu sebaran peluang multinomial dapat dinyatakan sebagai:
(4.1)
49
Jika didefinisikan qq ppp +++= ......21γ . Maka sebaran peluang multinomial
(4.1) adalah :
( ) yiqiq
yii
iqi
iiiiqiqii pp
yyn
unyYyYP ............
,|,..., 11
111
=== ,i=1,2......m (4.2)
dimana ik
k ny =∑
−
−+1
1q
qni , k=1,2,....q-1.
Sebaran marjinal dari setiap komponen multinomial yik
),(~ ikiik pnBy
adalah Binomial:
. Jika Xik
( )
∑−==
−
=
1
11/log/log
q
kikikiqikik ppppθ
merupakan vektor kovariat tetap dan diasumsikan tidak tergantung pada i dan k, maka model linier yang didasarkan pada rasio
adalah:
ikkikik u+= βxθ , untuk i=1,....m dan k=1,....q (4.3)
dimana :
βk
x
adalah vektor parameter
ik
u
adalah vektor peubah penyerta pada katagori ke-k.
ik
Diasumsikan bahwa u
adalah pengaruh acak katagori ke-k pada area ke-i,
i
),(~ ii N W0u
memiliki sebaran multivariate normal
dengan fungsi sebaran peluang:
iiti
iif uWu
Wu 1
2/1 21exp
21)( −−=
π (4.4)
dimana dan ui
)(11
kqk
i diagW ϕ−≤≤
=
saling bebas dengan matriks varians kovarians dengan
. Peluang dari katagori ke –k dalam area ke-i adalah:
∑+
=−
=
1
1}exp{1
}exp{q
lil
ikikp
θ
θ, i=1,2,.............m dan k=1,2.......q-1. (4.5)
4.2.1. Pendugaan Parameter Model
Molina et.al. (2007) menduga parameter model βk dan u
dengan
menggunakan metode KQB. Keuntungan menggunakan metode KQB adalah
metode tersebut mudah diaplikasikan walaupun menurut Hazel et.al (2001)
50
metode KQB dapat menghasilkan bias terutama jika jumlah contoh dalam kelas
multinomial nijk
Pendugaan parameter dari model (4.3) diturunkan dari fungsi kemungkinan
untuk β, φ dan
kecil.
ttm
tt uuuu ),....,.( 21= . Dengan yij = (yij1, ......yijq)t untuk 1 = 1,....,m dan
j = 1,.....,nj
.)(|,.....()()|(),,(11 1
1
== ∏∏∏
== =
m
ii
m
i
n
jiijqij ufuyyfufuyfuL
i
ϕβ
, maka menurut Pawitan (2001), fungsi kemungkinan untuk parameter
β, φ dan u adalah adalah:
(4.6)
Idealnya pendugaan β dan φ dilakukan dengan menggunakan metode
kemungkinan maksimum yaitu dengan memaksimumkan L(β, φ) dimana:
[ ]
.....|,.....()(
)(|,.....()()|(),(
111
111
11 111
1 1
∏ ∏∫ ∫
∏∏∏∫∏∏
=−
=−
∞
∞−
∞
∞−
== =−
= =
=
==
m
idqd
n
jiijqiji
m
ii
m
i
n
jiijqij
m
i
n
j
duduuyyfuf
duufuyyfufuyfL
i
ii
ϕβ
(4.7)
Dengan memaksimumkan fungsi kemungkinan (4.7), pendugaan β dan φ
dapat diperoleh dengan menggunakan metode Monte-Carlo seperti dilakukan
oleh Hartzel et al (2001) atau integrasi numerik atau dengan metode Newton
Raphson. Molina et al (2007) menggunakan metode KQB yang diperkenalkan
oleh Breslow dan Clayton (1993). Jika diasumsikan φ diketahui, maka fungsi
kemungkinan menjadi:
∑ ∑∑+∑−== =
−
=
m
i
n
j
q
kijkijkii
m
i
ti
ipyuWucul
1 1
1
1log
21),(β (4.8)
dimana c adalah konstanta. Penduga kemungkinan maksimum diperoleh dengan
menurunkan satu kali mersamaan (4.8) dan menyamakannya dengan 0 sehingga
didapat penyelesaian dari sistem persamaan tersebut. Misalkan parameter β
terdiri dari bk komponen, karena masing-masing level katagori diasumsikan
memiliki nilai parameter βk yang berbeda, maka dengan mendefinisikan indeks
komponen βk dan Xijk dan komponen ke-b dari masing-masing parameter di level
ke k adalah βk(b). Oleh karena itu dengan mendefinisikan:
51
∑+
= −
=
+
1
11
q
ku
tijk
ikktijk
x
ux
ijk
e
epβ
β
untuk qk ...,2,1= ; 1...,2,1' −= qk ; inj ...,2,1= ; mi ...,2,1= b=1,........,Bj’
itu.selain
jika )1(log
')('
')('
)(' −
=−=
∂
∂
ijklijk
ijklik
lk
ijk
pxk'kpxp
β
maka dapat
diperoleh :
Untuk 1...,2,1' −= qk
∑ ∑ −=∂
∂= =
m
i
n
jijkijijklijk
lk
ipnyxu
1 1'')('
)(')(),log(
ββ
(4.9)
Turunan pertama terhadap pengaruh acak u adalah:
≠≠−==−
=∂
∂
itu selain 0 dan jika
dan jika 1log
''
''
''i'i k'kpi' i k'kp
up
jki
jki
ki
ijk
dan untuk j’=1,2....q-1, maka diperoleh:
.)()log(
1'''''
''
1 1 1 ∑∑ ∑ ∑
=
= = = −=∂
∂ ii n
jjkijijki
ki
m
i
n
j
q
k ijkijkpmy
u
py
Selanjutnya dicari dan untuk i=1,......m dan
=
−−
−
−
1.11
1111
1
q
iW
ϕϕ
ϕϕ
Untuk mendapatkan penduga dengan metode Newton Raphson dibutuhkan
turunan kedua dari , dan
Pendugaan parameter model untuk adalah
(4.10)
dimana:
52
dengan
(4.11)
4.2.2. Pendugaan Ragam
Untuk pendugaan komponen ragam digunakan metode kemungkinan
maksimum (KM) atau metode kemungkinan maksimum berkendala (KMB).
Pendekatan KM untuk pendugaan komponen ragam menghasilkan penduga
yang berbias seperti dinyatakan oleh Harville (1997) yang dikutip oleh Sceally
(2010). Oleh karena itu Molina et al (2007) menggunakan pendekatan KMB
untuk menduga komponen ragam.
Melalui metode KMB komponen pengaruh tetap β dipandang sebagai
parameter penggangu, sehingga sedapat mungkin diupayakan menghilangkan
pengaruh dari β untuk membentuk ML marjinal untuk komponen ragam. Dalam
model linier campuran normal seringkali dilakukan transformasi sedemikian
53
hingga bebas dari unsur β, kemudian dicari ML untuk komponen ragam dari data
baru hasil transformasi.
Sceally (2010) menyatakan bahwa pendekatan REML dalam kasus
multinomial adalah:
XVX 1t −− log21)(ϕl (4.12)
dimana
.ˆˆ21log
21log
21)( 11 uWuWΣZZW −− −+−−= ttl ϕ
(4.13)
Suku ke dua dari persamaan (4.12) disebut sebagai bagian penalty.
Penduga KMB diturunkan dengan memaksimumkan persamaan (4.12) terhadap
semua komponen ragam. Menurut Sceally (2010), metode KMB memang dapat
mengurangi bias namun ada kemungkinan akan menghasilkan ragam yang lebih
besar dibandingkan dengan metode KML.
Untuk menurunkan penduga komponen ragam dengan metode KMB
dibutuhkan turunan pertama dan ke dua dari XVX 1t −log . Turunan pertamanya
adalah
( )
∂∂
=∂
∂ −−−
−
XVXXVXXVX
1t1t
a
t
aTr
ϕϕ
11log,
dimana:
11111
−−−−−
∂∂
−=∂∂
−=∂ VZWZVVVVV t
aaa ϕϕϕ,
sehingga:
( )
∂∂
=∂
∂−−−−
−
XXXVXXVX
1t1t
111logVZWZVTr t
a
t
a ϕϕ.
Sedangkan turunan ke duanya adalah:
( )
( ) ( ) .
2log
11
12
∂∂
∂∂
−
∂∂
∂∂
=∂∂
∂
−−−−−−−−
−−−−−−
XVZWZVXXVXXVZWZVXXVX
XVZWZVZWZVXXVXXVX
1t11111t1111
1t1t111111
bb
baab
Tr
Tr
ϕϕ
ϕϕϕϕ
Mengikuti cara yang dilakukan Sceally (2010), didefinisikan *ϕS dan *
ϕJ sebagai:
54
t
qqqSS
∂
∂
∂
∂
∂
∂
∂
∂−=
−−
−−
−
−−
122111
*log
.....log
,log
,......log
21
ϕϕϕϕϕϕϕϕ
XVXXVXXVXXVX 11111111
dan
∂∂
∂
∂∂
∂
∂∂
∂
∂∂
∂
∂
∂
∂∂
∂
∂∂
∂
∂∂
∂
∂
∂
−=
−
−
−
−
−
−
−
−−−
−
−−−
12
2
12
2
11
2
12
2
22
2
11
2
11
2
21
2
12
2
*
log..........
loglog
.
.
log..........
loglog
log..........
loglog
21
qqq
q
q
JJ
ϕϕϕϕϕ
ϕϕϕϕϕ
ϕϕϕϕϕ
ϕϕ
XVXXVXXVX
XVXXVXXVX
XVXXVXXVX
111111
111111
111111
sehingga dengan β dan u diketahui dan dengan maka penduga φ adalah:
.)( *1*ϕϕϕϕ SJsebelumnyabaru −−= (4.14)
4.2.3. Pendugaan Parameter Area Melalui Pendekatan Bayes
Peubah respon yijk dianggap merupakan peubah acak biner untuk
individu ke-j dalam area i dalam katagori ke-k dimana i=1,2.....I; j=1,......,Ni,
k=1,2.....q-1 sehingga yijk merupakan peubah acak bebas Bernoulli dengan (Yijk
=1| pijk)=pijk
Model yang menghubungkan parameter dengan kovariatnya adalah
model regresi logistik dengan efek acak area seperti dinyatakan oleh persamaan
4.2. Jika L menyatakan banyaknya grup dari kombinasi katagori dari peubah pembantu dan s menyatakan kumpulan individu yang terambil sebagai contoh
sedangkan s’ adalah kumpulan individu yang tidak terambil sebagai contoh,
maka jumlah individu pada area ke –i dapat dinyatakan sebagai:
.
∑∑==
+=L
l
sil
L
l
sili yyY
1
'
1 (4.15)
dimana tqilil
sil yyy ),......( )1(1 −= dan 's
ily adalah vektor yang tidak diketahui dari unit
yang tidak terambil contohnya. Scealy (2010) mengatakan bahwa untuk
mendapatkan penduga dari Yi's
ily maka diduga dengan:
55
.1
,......,1
ˆ 1ˆ
ˆ
1ˆ
ˆ''
1
111
1
111
t
q
k
u
u
q
k
u
usil
sil
ikqtilk
iqqtilq
iktilk
itil
e
e
e
eny
++=
∑∑−
+
+
−+
+
−
−−−
β
β
β
β
x
x
x
x
(4.16)
Dengan asumsi ∑=
=q
k
sijk
sil yn
1
'' diketahui, maka proporsi unit pada katagori ke-k di
area ke-i pik
*)1( ikikikikik yfyfp −+=
adalah:
(4.17)
dimana: fik = nik/Nik
iky,
adalah rata-rata contoh (proporsi) di area ke i dan katagori ke k
)/('
*ikik
sliklik nNyy
i
−= ∑∈
adalah rata-rata dari unit-unit yang tidak diambil
contohnya dalam area i pada katagori ke-k. Penduga Bayes dari *
iky diturunkan dengan cara yang sama dengan penduga
Bayes untuk respon binomial yang telah dibahas pada Bab III, yaitu:
∑
∑
∑
=
∑=
∈
∈
ik
ik
sjkkikijk
Tijkik
l sjkkikikj
Tijkikikl
likikl
Bki
zyyxhE
zyyxhpE
ypEp
βσ
βσ
σβ υ
,,,exp
,,,exp(
,,|ˆ )(
(4.18)
dimana
( )[ ].exp1log
)(,,
∑
∑∑
∈
∈∈
++
−+
=
lk
ikki
sjkk
Tij
ikkksj
ijkTij
sjkkijk
Tijik
zx
yzyxzyxh
σβ
σββσ
(4.19)
Dengan menggantikan kβ dan υσ kˆ pada persamaan (4.9) dapat
diperoleh penduga Bayes empirik untuk pik
)ˆ,ˆ(ˆ υσβBik
EBik pp =
(proporsi pada katagori ke k di area
ke i) yaitu .
Pendugaaan )ˆ( EBkipKTG dilakukan dengan metode Jackknife seperti yang
dilakukan pada pendugaan SAE untuk peubah respon Binomial pada Bab III
56
yaitu dengan menggantikan )ˆ,ˆ,(ˆ σµikikEBik ykp = dan )ˆ,ˆ,(ˆ , llikik
EBlik ykp −−− = σµ
dalam persamaan (4.5) sampai dengan persamaan (4.6) sehingga diperoleh nilai
ikM1ˆ dan ikM 2
ˆ , sehingga diperoleh nilai MSE untuk pendugaan pada katagori ke
k dan area ke-i yaitu ikM1ˆ + ikM 2
ˆ .
4.3. Aplikasi: Pendugaan Rata-Rata Lama Sekolah Tingkat Kecamatan di Jawa Timur Berbasis Data Susenas 2010
4.3.1. Pengukuran Peubah Respon dan Peubah Penyerta.
Dalam penelitian ini, di setiap area kecil populasi dibagi dalam kelas-kelas
yang merupakan kombinasi peubah penyerta yaitu usia dan jenis kelamin. Usia
dibagi dalam 5 kelas dan jenis kelamin dibagi dalam 2 kelas (laki-laki dan
perempuan). Peubah respon yang diamati adalah proporsi penduduk yang telah
berada pada jenjang pendidikan tertinggi yang pernah ditempuh dimana jenjang
pendidikan diklasifikasi menjadi 6 seperti dijelaskan oleh Tabel 4.1. Data yang
digunakan dalam penelitian ini adalah data Susenas tahun 2010 dan data
Sensus Penduduk tahun 2010 di Jawa Timur khususnya untuk Kabupaten
Sumenep dan Kabupaten Pasuruan.
Tabel 4.1. Klasifikasi tingkat pendidikan tertinggi penduduk usia 10 tahun ke atas
Katagori (k) Lama sekolah (th) Titik tengah
1 0 0 2 1-3 2 3 4-6 5 4 7-9 6 5 10-12 11 6 >13 16 *)
*) maksimum 19 tahun
Proporsi penduduk di tiap jenjang pendidikan dipengaruhi oleh usia dan
jenis kelamin (lihat Lampiran 20). Semakin tinggi usia maka proporsi yang
pernah menempuh pendidikan menengah dan tinggi makin kecil. Sebaliknya
makin tinggi usia maka penduduk yang tidak pernah bersekolah makin banyak.
Bersarnya proporsi di tiap level pendidikan berbeda antara penduduk laki-laki
dan perempuan. Oleh karena itu usia dan jenis kelamin dapat diduga akan
57
memberikan pengaruh kepada nilai proporsi di tiap jenjang pendidikan dan layak
untuk dijadikan peubah penyerta.
4.3.2. Hasil Eksplorasi Data
Di Kabupaten Sumenep, hasil eksplorasi data (Gambar 4.1) menunjukkan
bahwa penduduk berusia 10 tahun ke atas yang belum pernah bersekolah cukup
tinggi yaitu 22,71%. Penduduk yang hanya menamatkan pendidikan sekolah
dasar adalah yang paling tinggi yaitu 28,25%, selanjutmya penduduk yang bisa
menyelesaikan pendidikan SMP 12,5%, SMA hanya 12 % dan perguruan tinggi
tidak sampai 4%.
(a) Kabupaten Sumenep (b) Kabupaten Pasuruan
Gambar 4.1
Proporsi penduduk berusia 10 tahun ke atas berdasarkan lama sekolah berdasarkan data Susenas 2010 di Kabupaten Sumenep dan Pasuruan
Sedangkan untuk Kabupaten Pasuruan penduduk berusia 10 tahun ke
atas yang belum pernah bersekolah cukup tinggi yaitu 8%. Penduduk yang
hanya menamatkan pendidikan sekolah dasar 34.24%, selanjutmya penduduk
yang bisa menyelesaikan pendidikan SMP 15%, SMA sekitar 14% dan perguruan
tinggi tidak sampai 4%
Grafik pada Lampiran 20 menunjukkan hubungan antara jenjang
pendidikan tertinggi yang pernah ditempuh oleh penduduk usia 10 tahun dengan
usia dan jenis kelamin. Terlihat dari grafik tersebut bahwa di Kabupaten
Sumenep, untuk penduduk yang tidak pernah bersekolah. Semakin tinggi usia
maka proporsi penduduk yang tidak pernah bersekolah makin tinggi, dimana
penduduk laki-laki memiliki proporsi lebih rendah dibandingkan dengan
22,7%
0,7%1,2%2,3%
4,5%4,2%
28,2%
1,7%2,9%
12,5%
1,0%1,8%
11,9%
0,1%0,9%0,6%
2,7%
0,0%
5,0%
10,0%
15,0%
20,0%
25,0%
30,0%
0 2 4 6 8 10 12 14 16
Lama Sekolah
tahun
7,8%
2,3%3,5%
4,5%5,0%4,9%
34,2%
1,4%2,3%
15,1%
1,2%0,9%
13,9%
0,2%0,2%0,6%2,0%
0,0%
5,0%
10,0%
15,0%
20,0%
25,0%
30,0%
35,0%
0 2 4 6 8 10 12 14 16
Lama Sekolah
tahun
58
penduduk perempuan. Sebaliknya semakin tinggi usia maka penduduk yang
mampu menamatkan sekolah SD, SLTP dan SLTA juga main kecil. Penduduk
laki-laki memiliki proporsi yang lebih tinggi dibandingkan dengan perempuan.
4.3.3. Pendugaan Rata-rata Lama Sekolah di Tingkat Kecamatan.
Seperti telah dijelaskan di atas bahwa yik
ikkikik u+= βxθ
merupakan peubah respon
multinomial, dalam penelitian ini mengukur jumlah penduduk berusia 10 tahun ke
atas yang memiliki jenjang pendidikan ke k, k=1,2...6 pada area ke-i.
Selanjutnya model linier yang diduga adalah dimana ikθ adalah
fungsi logit (pik ( )
−== ∑
−
=
1
11/log/log
q
kikikiqikik ppppθ) yaitu .
Dengan menggunakan data Susenas 2010, pendugaan parameter β dan
φ dalam penelitian ini adalah menggunakan metode PQL dengan cara
memaksimumkan fungsi likelihood seperti yang dinyatakan oleh persamaan
(4.6). Selanjutnya pendugaan ragam mengikuti metode yang disarankan oleh
Molina et al (2007) yaitu menggunakan pendekatan REML yang dilakukan
dengan memaksimumkan persamaan (4.11).
Hasil pendugaan pik
Gambar 4.2 dan Gambar 4.3 juga menjelaskan pendugaan KTG
menggunakan metode Jackknife. Secara rinci dugaan proporsi untuk tiap
katagori pendidikan dan nilai dugaan KTG dapat dilihat pada Lampiran 11. Nilai
KTG untuk masing-masing model sangat rendah, hal ini menunjukkan bahwa
nilai bias dan ragam dari dugaan sangat kecil (lihat Tabel 4.2).
(proporsi penduduk berusia sepuluh tahun ke atas
pada jenjang pendidikan ke k), k=1,2...,6) dapat dilihat pada Gambar 4.2 untuk
Kabupaten Sumenep dan Gambar 4.3. untuk Kabupaten Pasuruan. Prediksi
proporsi di tiap jenjang pendidikan penduduk dapat dilihat pada Lampiran 10.
Tabel 4.2. Rata-rata dugaan proporsi penduduk pada jenjang pendidikan tertentu dan rata-rata nilai KTG dugaan di Kabupaten Sumenep dan Pasuruan
Parameter Katagori
1 2 3 4 5 6 Kabupaten Sumenep Rata-rata proporsi 0.2405 0.0551 0.3941 0.1471 0.1105 0.0492 Rata-rata KTG 1.54E-09 5.14E-10 3.87E-09 1.02E-09 9.66E-10 6.42E-10 Kabupaten Pasuruan Rata-rata proporsi 0.0930 0.0895 0.4518 0.1355 0.0967 0.1335 Rata-rata KTG 1.06E-03 1.52E-03 6.76E-03 5.07E-03 6.21E-03 2.28E-02
59
Gambar 4.2. Plot Hasil dugaan proporsi penduduk berusia 10 tahun keatas di tiap jenjang
pendidikan dan nilai dugaan KTG di Kabupaten Sumenep
Gambar 4.3. Plot Hasil dugaan proporsi penduduk berusia 10 tahun keatas di tiap jenjang
pendidikan dan nilai dugaan KTG di Kabupaten Pasuruan
0,0000
0,1000
0,2000
0,3000
0,4000
0,5000
0,6000
0,7000
0,8000
10 30 50 70 80 100
120
140
160
180
200
220
240
250
Kecamatan
Nilai dugaan proporsi penduduk di tiap jenjang pendidikan
Tidak Sekolah Putus SD
Lulus SD Lulus SMP
Lulus SMA PT
prporsi
0,00E+00
5,00E-09
1,00E-08
1,50E-08
2,00E-08
2,50E-08
3,00E-08
10 30 50 70 80 100
120
140
160
180
200
220
240
250
Kecamatan
Nilai dugaan KTG
Tidak Sekolah Putus SD
Lulus SD Lulus SMP
Lulus SMA PT
KTG
0,0000
0,1000
0,2000
0,3000
0,4000
0,5000
0,6000
0,7000
0,8000
10 30 50 70 80 100
120
140
160
180
200
220
Kecamatan
Nilai dugaan proporsi penduduk di tiap jenjang pendidikan
Tidak Sekolah Putus SD
Lulus SD Lulus SMP
Lulus SMA PT
proporsi
0,00E+00
1,00E-01
2,00E-01
3,00E-01
4,00E-01
5,00E-01
6,00E-01
10 30 50 70 90 110
130
150
170
190
210
230
Nilai dugaan KTG
Tidak Sekolah Putus SD
Lulus SD Lulus SMP
Lulus SMA PT
KTG
60
Prediksi rata-rata lama sekolah di tiap kecamatan di Kabupaten Sumenep
dan Pasuruan dapat dilihat pada Gambar 4.4. Terilaht bahwa rata-rata lama
sekolah di Kabupaten Pasuruan lebih tinggi dibandingkan dengan rata-rata
lama sekolah di tiap kecamatan di Kabupaten Sumenep. Sebagian besar
kecamatan di Kabupaten Sumenep memiliki rata-rata lama sekolah kurang dari 6
tahun.
Gambar 4.4.
Plot Hasil dugaan angka melek huruf dan nilai KTG dugaan di Kabupaten Sumenep
4.4. Pembahasan
Dalam penelitian ini, pengaruh peubah penyerta yaitu usia dan jenis
kelamin terhadap peubah respon pada model SAE dengan peubah respon
multinomial dibedakan atas katagori. Untuk katagori 1 (tidak pernah bersekolah)
dan 2 (putus sekolah dasar) memiliki nilai dugaan parameter β positif, namun
untuk jenjang pendidikan lebih tinggi nilai β negatif.
Untuk model SAE khusus untuk jenjang pendidikan SD memiliki nilai KTG
yang relatif lebih besar dibandingkan dengan jenjang pendidikan yang lain
karena proporsi penduduk pada jenjang pendidikan SD lebih bervariasi dari
kecamatan ke kecamatan baik untuk Kabupaten Sumenep maupun kabupaten
Pasuruan. Sebaliknya nilai KTG untuk pendugaan proporsi penduduk yang
5,77
6,40
4,59
5,68
4,76
7,49
8,57
4,754,70
2,10
5,49
4,844,36
4,15
6,81
2,87
4,66
3,95
4,97
3,673,97
5,72
7,456,98
4,66
5,51
1,50
2,50
3,50
4,50
5,50
6,50
7,50
8,50
9,50
10 40 70 90 120
150
180
210
240
Kecamatan
Nilai dugaan rata-rata Lama Sekolah (tahun) di Kabupaten Sumenep
lama
sekolah
6,95
5,53
4,11
6,23
5,305,25
4,65
8,74
8,08
8,768,32
9,77
8,02
10,07
10,97
5,035,21
6,606,21
4,805,184,684,14
1,50
2,50
3,50
4,50
5,50
6,50
7,50
8,50
9,50
10,50
11,50
10 30 50 70 90 110
130
150
170
190
210
230
Kecamatan
Nilai dugaan rata-rata Lama Sekolah(tahun) di Kabupaten Pasuruan
lama
sekolah
61
putus sekolah SD (lama sekolah 0-3 tahun) sangat kecil karena proporsi
penduduk yang putus sekolah SD di semua kecamatan hampir sama, baik untuk
Kabupaten Pasuruan dan Kabupaten Sumenep. Nilai KTG dengan nilai peubah
respon yang heterogen seperti pada jenjang pendidikan SD relatif lebih tinggi
dibandingkan dengan model SAE yang didasarkan pada nilai peubah respon
yang homogen. Kenyataan ini menunjukkan bahwa pendugaan KTG dengan
metode Jackknife sangat tergantung kepada heterogenitas dari proprosi di
kecamatan, semakin homogen maka nilai KTG akan makin kecil.
62
BAB V Model Bayes Pendugaan Area Kecil untuk Respon
Binomial dan Multinomial Berbasis Penarikan Contoh Berpeluang Tidak Sama
5.1. Pendahuluan
Pada umumnya pengembangan model SAE dan pendugaannya
dilakukan dengan menganggap semua area terwakili dalam contoh atau
menganggap contoh area dipilih dengan peluang yang sama (Pfeffermann,
2010). Beberapa peneliti yaitu Kott (1990), Arora dan Lahiri (1997) serta Prasad
dan Rao (1999), yang mengembangkan model SAE yang memperhatikan
peluang pengambilan contoh menyatakan bahwa pendugaan yang dilakukan
tanpa memperhatikan peluang penarikan contoh akan menghasilkan penduga
yang berbias.
Model SAE yang dikembangkan dengan memperhitungkan peluang
penarikan contoh umumnya untuk peubah respon bertipe kontinu khususnya
peubah respon yang memiliki distribusi normal. Lehtonen et al. (2009)
mengaplikasikan Model Generalized Regresion (GREG) mengaplikasikan
metode PTLTE untuk pendugaan parameter area dengan menyertakan bobot
unit contoh. Penelitian oleh Lehtonen R (2009) tersebut menghasilkan
peningkatan akurasi dan mengurangi bias. Dengan memberikan bobot pada unit
contoh, You dan Rao (2002) mengembangkan model SAE dengan
mengaplikasikan metode Pseudo PTLTE untuk pendugaan parameter area kecil.
Model tersebut diterapkan untuk menduga produksi jagung di wilayah kecil (kota)
dan dihasilkan bahwa metode PTLTE semu (pseudo EBLUP) menghasilkan KTG
yang sedikit lebih kecil dibandingkan dengan metode PTLTE. Dalam bukunya
Rao (2003) juga membahas model SAE untuk peubah respon normal dimana
pendugaan parameter mengaplikasikan PTLT semu ( Pseudo –BLUP) atau
PTLTE. semu (Pseudo –EBLUP)
Pfefferman et al. (1998) juga telah membahas pengaruh peluang
penarikan contoh dari proses penarikan contoh gerombol dua tahap (multistage
cluster sampling) terhadap kualitas penduga model SAE. Pfefferman et al.(1998)
mengasumsikan bahwa peluang penarikan contoh memiliki korelasi dengan
63
karakteristik area atau unit percontohan, oleh karena itu disebut sebagai
percontohan informatif (informative sampling). Selanjutnya berdasarkan ide
Pfefferman tersebut, Eideh dan Nathan (2009) mengasumsikan bahwa peluang
penarikan contoh memiliki hubungan dalam bentuk fungsi eksponensial dengan
karakteristik area dan unit. Pengembangan model SAE yang dilakukan oleh
Eideh dan Nathan (2009) yaitu dengan menyertakan model eksponensial
tersebut ke dalam model SAE.
Seperti telah dijelaskan sebelumnya bahwa tujuan utama penelitian ini
adalah mengembangkan model SAE yang dapat diaplikasikan dalam menduga
Indeks Pendidikan yang merupakan salah satu komponen IPM di area kecil
dimana data dasar yang digunakan adalah Susenas yang penarikan contohnya
berpeluang tidak sama. Oleh karena ide pengembangan metode SAE yang
memperhatikan peluang penarikan contoh seperti yang telah dilakukan oleh para
peneliti di atas digunakan sebagai dasar pengembangan model SAE dengan
memperhitungkan peluang penarikan contoh yang dapat digunakan untuk
menduga komponen Indeks Pendidikan yaitu model SAE untuk respon binomial
dan multinomial. Pendugaan parameter area kecil dilakukan dengan pendekatan
Bayes. Selanjutnya metode tersebut akan diaplikasikan untuk menduga angka
melek huruf dan rata-rata lama sekolah di Kabupaten Sumenep dan Kabupaten
Pasuruan, Provinsi Jawa Timur.
5.2. Penyertaan Peluang Penarikan Contoh pada Model SAE.
Mengacu pada penelitian Pfefferman (1998), Eideh dan Nathan (2009)
mengembangkan model SAE berbasis peluang tidak sama dengan penarikan
contoh dua tahap yang mengasumsikan bahwa peluang penarikan contoh baik
untuk penarikan contoh area dan penarikan contoh unit memiliki hubungan
dengan karakteristik area dan unit dalam bentuk fungsi eksponensial.
Pada tahap pertama, misalkan pengaruh area yang dinyatakan dengan
peubah ui memiliki hubungan dengan karakteristik area zi, sehingga hubungan
antara peubah ui dan zi
),0(~,'u
ind
iiii Nzu σηηγ +=
dinyatakan oleh fungsi
(5.1)
Untuk tahap ke dua, diasumsikan terdapat peubah penyerta
xij=(xij1,......,xijr)’ yang mempengaruhi yij yang tersedia untuk semua kelompok
percontohan maka hubungan antara yij dan xij dinyatakan oleh fungsi:
64
),0(~, 2'e
ind
ijijijiij Neey σβµ ++= x (5.2)
dimana
Dengan cara lebih sederhana maka gabungan dari persamaan (5.1) dan (5.2)
adalah:
Mengikuti cara yang dikembangkan oleh Pfefferman (1998) yaitu dengan
memperhatikan peluang penarikan contoh, maka, fungsi kepadatan peluang
untuk dalam percontohan area ke-i adalah:
(5.3)
dimana
.
Eideh dan Nathan (2009) mengasumsikan bahwa rata-rata peluang terambilnya
area ke-i sebagai contoh dapat dinyatakan sebagai fungsi eksponensial dari
peubah yang menggambarkan karaketristik area sebagai berikut:
. (5.4)
Misalkan model matematik yang menghubungkan peluang penarikan
contoh ke-i dengan peubah area dinyatakan dalam bentuk fungsi eksponensial
sebagai berikut:
{ })'(exp),|(/1),|( iibiiipEiiisE zbzz +== µµπµπ (5.5)
dimana zi
iiw π/1=
adalah peubah yang menyatakan karakteristik area ke-i dan b adalah
parameter yang menghubungkan kedua peubah. Jika menyatakan
bobot dari area ke-i, maka persamaan (5.5) dapat dinyatakan sebagai:
{ })'(exp),|(/1),|( iiiiipiiis bEwE zbzz +−== µµπµ (5.6)
Berdasarkan persamaan (5.3), maka fungsi kepadatan peluang untuk
pengaruh acak ui dapat ditulis sebagai:
(5.7)
dimana:
. (5.8)
65
Dengan cara yang sama maka pada tahap kedua, fungsi kepekatan
peluang untuk yij
ij /π
dapat dituliskan dalam formula:
(5.9)
Selanjutnya peluang terambilnya contoh unit ke j pada area ke-i yaitu
diamsumsikan memiliki hubungan dengan karakteristik unit yang dinyatakan
sebagai peubah xij dalam bentuk fungsi eksponensial
ij /π
sebagai berikut:
. (5.10)
Sama dengan peluang area, model matematik yang menghubungkan
peluang ( ) atau bobot ( ijijw // /1 π= ) terambilnya unit ke-j pada area ke-i dengan
peubah penyerta adalah:
)(exp),,|( '| ijijiijijijp dyyE xdx +=µπ
(5.11)
(5.12)
Oleh karena itu fungsi kepadatan peluang untuk yij untuk µi dan xij
)',...,(,)',...,,1(,)',....,,( 10210 riqiiq dddzzbbb === dzb
tertentu
adalah:
(5.13)
dimana
(5.14)
Persamaan (5.8) dan (5.14) menunjukkan bahwa jika diasumsikan
peluang penarikan contoh memiliki hubungan dengan karakteristik area dan unit
dalam bentuk fungsi eksponensial, maka terjadi pergeseran rata-rata sebesar
untuk pengaruh area dan untuk unit.
Dengan mendefinisikan
dan )',...,,1( 2 ijrijij xx=x , maka dengan menggunakan metode penduga KM,
pendugaan vektor parameter B dan D adalah
(5.15)
(5.16)
dimana .
Untuk yij yang diasumsikan memiliki sebaran normal dan dengan
menyertakan peluang terambilnya contoh maka bentuk fungsi kepadatan
66
peluang yij untuk µi dan xij
1) Pendugaan Parameter Model SAE
diketahui dapat dinyatakan oleh persamaan (5.14).
Nilai harapan dan ragam dari sebaran tersebut adalah:
(5.17)
+ (5.18)
(5.19)
Selanjutnya pendugaan parameter model SAE dilakukan dengan
memaksimumkan fungsi kemungkinan baik untuk area dan unit yang terambil
sebagai contoh serta untuk area dan unit yang tidak terambil sebagai contoh.
Dalam pendugaan paramater, Eideh dan Nathan (2009) mengaplikasikan dua
cara yaitu melalui metode Kemungkinan Maksimum (Maximum Likelihood ) dan
metode Pendugaan Kemungkinan Maksimum Semu (KMS) atau Pseudo
Maximum Likelihood ). Metode KM tidak memperhitungkan bobot penarikan
contoh sehingga rancangan percontohan diabaikan, sedangkan metode KMS
memperhitungkan bobot penarikan contoh.
Jika mi adalah jumlah contoh pada area ke i dan penarikan contoh
dilakukan secara acak, maka untuk j=1,2....mi, sebaran yij
),........(iimij yy
akan saling bebas
dan masing-masing memiliki sebaran normal dengan rataan dan ragam, koragam
seperti dinyatakan oleh persamaan (5.17), (5.18) dan (5.19). Oleh karena itu
fungsi peluang bersama antara untuk percontohan area ke-i adalah:
x
. (5.20)
Metode Kemungkinan Maksimum
Fungsi kemungkinan diperoleh dari mentransformasikan persamaan
(5.20) dengan transformasi logaritma natural, yaitu:
67
Jika didefinisikan
,
maka fungsi likelihood diatas menjadi lebih sederhana dan merupakan fungsi
dari , yaitu:
. ( 5.21)
Dengan memaksimumkan fungsi kemungkinan yang dinyatakan oleh persamaan
(5.21) diatas maka akan diperoleh penduga . Jika parameter
informatif tidak diketahui maka parameter b dan d yang digunakan untuk
menghitung 20 µσβ b= dan 2
0 edσγ = dapat diduga dengan menggunakan
persamaan (5.15) dan (5.16).
Metode Kemungkinan Maksimum Semu
Alternatif lain untuk pendugaan parameter model SAE adalah dengan
menggunakan metode Kemungkinan Maksimum Semu (KMS). Metode KMS ini
dikembangkan oleh beberapa peneliti seperti Binder (1983), Asparouhov (2006)
dan Eideh dan Nathan (2009).
Pada kasus penarikan contoh dua tahap, peluang penarikan contoh untuk
unit ke-i pada area ke j adalah ijiij /πππ = , i=1,2......,N ; j=1,2......,Mi. Oleh
karena itu bobot percontohan adalah wij=wi wj/i iiw π/1= dimana dan
68
ijijw // /1 π= , i=1,2......N. Eideh dan Nathan (2009) menyatakan bahwa kontribusi
dari area ke-i pada log-likelihood sensus (untuk seluruh populasi) adalah:
Sehingga fungsi kemungkinan yang harus dimaksimumkan adalah:
Oleh karena itu penduga fungsi kemungkinan adalah:
(5.22)
Secara singkat persamaan (5.31) ditulis dalam bentuk:
. (5.23)
Penduga KMS adalah nilai-nilai yang diperoleh dengan cara memaksimumkan
persamaan (5.23) menggunakan metode numerik.
Pendugaan Ragam
(5.24)
dimana .
2) Pendugaan parameter pengaruh area
Sebaran percontohan bersyarat iimii yy ,......| 1µ tergantung pada sebaran
percontohan dari efek area pada tahap pertama dan sebaran iijy µ| pada tahap
kedua. Untuk iimii yy ,......| 1µ yang diasumsikan menyebar normal, maka
penduga Bayes untuk ii y|µ merupakan nilai tengah dari sebaran posterior
69
f( yang diperoleh dari: f( Nilai tengah untuk
sebaran posterior f( adalah:
Parameter rataan untuk sebaran normal di atas dapat dinyatakan sebagai:
(5.25)
dimana:
dan
Sehingga:
(5.26)
.
Pendugaan paramater di area yang terambil sebagai contoh
(5.27)
dimana .
70
Pendugaan parameter untuk area yang tidak terambil sebagai contoh
Untuk area yang tidak terambil sebagai contoh, maka peluang untuk
tidak terambil sebagai contoh adalah . Karena tidak ada unit yang diamati
atau terambil dalam percontohan maka pengaruh area yang tidak terambil
sebagai contoh bukan merupakan fungsi dari percontohan unit, sehingga:
}{
{ }2'
22'2'
, ˆˆ)5.0)(ˆexp)(ˆ1
ˆˆ5.0)ˆ(ˆexpˆˆ)(ˆˆ
µ
µµ
σ
σγσγµ
byzbzg
bzbbzgzy
jj
jjjscj
+−
+−= . (5.28)
Menurut Eideh dan Nathan (2006) Untuk model SAE seperti yang
dinyatakan oleh persamaan ijeiijxijy ++= µβ' dimana ii ηµµ += , maka
pendugaan parameter area ke-i yang terambil sebagai contoh adalah: 22'
, )1()ˆ)(1()ˆ(ˆ eiiiiiiis dbxy σφσφµφφµ µ −−+−+−= β (5.29)
dimana
Sedangkan dugaan parameter untuk area yang tidak terambil sebagai
contoh dinyatakan oleh persamaan :
)5.0ˆexp(1
)5.0ˆexp(ˆˆ
22
222
,µ
µµ
σµ
σµσµµ
bb
bbbjc
+−
+−= . (5.30)
5.3. Pendugaan Area Kecil Menggunakan Model Campuran Linier Terbobot.
Rao (2003) membahas model SAE berbasis penarikan contoh berpeluang
tidak sama untuk peubah respon normal. Model SAE dikembangkan dengan
memberikan bobot pada area survei dengan manggunakan rata-rata bobot level
unit .// iijk
ikijij wwwww =∑=
iwiTiw
ijiTij
jijij
jijiw
ex
exwywy
++=
++== ∑∑
µβ
µβ )( (5.31)
71
dimana ijj
ijiw ewe ∑= dengan 0)( =iweE dan iwej
ijeiw weV δσσ 222)( =∑=
dan ijj
ijiw xwx ∑= . Selanjutnya pendugaan parameter dilakukan dengan
mengaplikasikan metode PTLT atau PTLTE untuk persamaan (5.31) di atas.
Rao (2003) menyebut metode pendugaan untuk unit contoh berpeluang tidak
sama dengan istilah PTLT semu (pseudo BLUP) atau PTLTE semu (pseudo
EBLUP). You dan Rao (2002) mencoba menerapkan metode PTLTE semu
untuk menduga produksi jagung di wilayah kecil (kota) dan dihasilkan bahwa
metode PTLTE semu menghasilkan KTG yang sedikit lebih kecil dibandingkan
dengan PTLTE.
5.4. Pengembangan Model Bayes SAE Berbasis Penarikan Contoh Berpeluang Tidak Sama untuk Respon Binomial
Seperti telah dijelaskan pada Bab III, setiap individu dalam populasi
diklasifikasikan berdasarkan pada 2 peubah demografi yaitu usia (yang terdiri
dari 5 katagori) dan jenis kelamin (terdiri dari 2 katagori) sehingga terdapat
maksimum k=10 katagori. Jumlah individu yang berada dalam area ke i dan
katagori ke j (j=1,......ki) merupakan peubah Binomial dengan peluang pij.
Selanjutnya peubah respon yij didefinisikan sebagai fungsi logit(pij
ij
ijijij p
ppity
−==
1)(log
) yaitu
.
Dengan memperhatikan peluang penarikan contoh, maka dalam
penelitian ini pendugaan area kecil melalui pendekatan Bayes untuk peubah
respon Binomial didasarkan pada pengembangan 2 model SAE sebagai berikut:
1) Menggunakan model linier terampat untuk sebaran respon logit normal
dengan memberikan bobot penarikan contoh pada peubah respon yij =
logit (pij) dan peubah prediktor xij
2) Menggunakan model SAE dengan menyertakan peluang percontohan
dalam bentuk fungsi eksponensial seperti yang dikembangkan oleh Eideh
dan Nathan (2009).
.
Kedua metode di atas dibandingkan dengan metode SAE yang tidak
memperhitungkan bobot peluang dengan menggunakan model seperti pada
persamaan (3.23). Pendugaan proporsi di area kecil menggunakan pendekatan
72
Bayes dengan mengaplikasikan formula Bayes seperti yang ditunjukkan oleh
persamaan (3.25).
5.4.1. Penentuan Bobot
Bobot percontohan untuk penarikan contoh merupakan kebalikan dari
peluang penarikan contoh. Misalkan pada penarikan contoh dua tahap seperti
yang dilakukan dalam Susenas, maka bobot percontohan dihitung dari perkalian
fraksi penarikan contoh pada tahap satu dan tahap dua.
Jika di kecamatan tertentu contoh diambil dalam dua tahap dimana pada
tahap pertama dipilih blok sensus secara pps (proportional to size) dengan size
banyaknya rumah tangga hasil listing SP2010 ( iN ), maka peluang contoh pada
blok sensus ke-i untuk terpilih sebagai percontohan adalah NN
N
N iM
ii
ii =
∑=π . Dari
M area atau blok sensus yang ada dipilih m area kecil (blok sensus), sehingga
fraksi penarikan contoh tahap pertama adalah:
.N
Nn
N
Nnf iN
ii
ii
×=×=
∑ (5.32)
Bila pada blok sensus yang terpilih ditarik sejumlah rumah tangga (ni
ij|π
)
dengan peluang yang sama, maka peluang bersyarat terpilihnya individu ke-j
pada blok sensus ke-i dinyatakan sebagai , dimanai
ij N1
| =π . Jumlah individu
yang terpilih adalah ni
i
iij N
nf =|
, sehingga fraksi penarikan contoh pada tahap kedua
adalah . Sehingga overall sampling fraction adalah:
.| N
nmNn
NNm
fff i
i
iiijiij
×=×
×=×= (5.33)
Dengan demikian design weight dapat dirumuskan sebagai berikut:
iij nm
Nw×
= (5.34)
dengan:
ijw : bobot individu ke-j, blok sensus ke-i
N : banyaknya populasi listing SP2010 di kecamatan tertentu
73
m : banyaknya contoh blok sensus yang diambil di kecamatan tertentu
ni
ii N
mNw =
: banyaknya contoh individu di blok sensus ke-i.
5.4.2. Metode Pendugaan Parameter Area Kecil dengan Menyertakan Peluang Penarikan Contoh yang Bersifat Eksponensial.
Hubungan antara peluang penarikan contoh dengan karakteristik area
dan unit dinyatakan dalam bentuk fungsi eksponensial seperti dijelaskan oleh
persamaan (5.15) dan (5.21). Dalam penelitian ini bobot peluang terambilnya
contoh dihitung berdasarkan penarikan contoh dua tahap sehingga bobot
peluang penarikan contoh untuk tahap satu adalah dan bobot peluang
untuk unit seperti dinyatakan oleh persamaan (5.43) yaitu .i
ij nmNw×
=
Peubah yang diduga memiliki hubungan dengan peluang penarikan
contoh adalah peubah respon yaitu logit (pi) untuk penarikan contoh area dan
logit (pij) untuk unit. Peluang penarikan contoh untuk area adalah pps, tergantung
pada jumlah penduduk, dimana jumlah penduduk sangat dipengaruhi oleh maju
tidaknya suatu wilayah. Di Indonesia, semakin maju suatu wilayah, maka jumlah
penduduknya semakin besar dan tingkat pendidikannya juga makin baik artinya
angka melek hurufnya makin tinggi. Karena itu jika penarikan contoh area (blok
sensus) dilakukan secara pps, maka akan sangat beralasan menghubungkan
peluang penarikan contoh dengan angka melek huruf. Dengan kata lain peluang
area ke-i terambil sebagai contoh ( ) diasumsikan memiliki hubungan dengan
pi atau logit (pi
ii byw exp=
). melalui formula:
dimana yi =logit (pi). (5.35)
Sedangkan untuk level unit, diasumsikan memiliki hubungan dengan logit
(pij
ijij dyw exp=
) melalui formula:
dimana yij =logit (pij), (5.36)
oleh karena itu koefisien z i dan x ij pada persamaan (5.6) dan (5.12) diambil sama
dengan nol.
Jika seluruh area kecil dalam populasi dibedakan atas area yang terambil
sebagai contoh dan yang tidak terambil sebagai contoh, maka dengan
menggunakan formula (5.29) dan (5.30), parameter area ke-i yang terambil
sebagai contoh diduga dengan:
74
22', )1()ˆ)(1()ˆ(ˆ eiiiiiiis dbxy σφσφµφφµ µ −−+−+−= β (5.37)
sedangkan pendugaan parameter untuk area yang tidak terambil sebagai contoh:
)5.0ˆexp(1)5.0ˆexp(
ˆˆ22
222
,µ
µµ
σµσµσ
µµbbbbb
jc +−
+−= (5.38)
dimana
dan .
5.4.3. Metode Pendugaan Parameter Area Kecil menggunakan Model Linier Campuran Terbobot
Dengan memperhatikan peluang penarikan contoh, pengaruh bobot
penarikan contoh untuk pendugaan area kecil diwujudkan dalam model-logit
normal terbobot mengacu kepada cara Rao (2003) yang dinyatakan dalam
persamaan (5.31). Dalam penelitian ini bobot tiap individu yang berada pada
klasifikasi ke j pada area ke-i adalah wij, sehingga model SAE untuk yij=logit (pij
iwiTiwiji
Tijijijij exexwyw ++=++= µβµβ )(
)
terbobot adalah:
(5.39)
dimana [ ])1/(log)(log ijijijij pppity −== dan ijijiw ewe = , 0)( =iweE ,
iwej
ijeiw weV δσσ 222)( == ∑
Pendugaan parameter pada model (5.39) menggunakan metode KMB
yang diterapkan untuk model linier logistik terbobot.
)~(~~~ βγβµ Tiaiai
Tiij xy −+= X (5.40)
dimana ijij pitlog~ =µ .
Prediksi yang diperoleh adalah yij ijijij ywy ˆˆ ' = terbobot yaitu , sehingga
penduga yij ijijij wyy /ˆˆ '= tanpa bobot adalah . Selanjutnya pendugaan area kecil
menggunakan pendekatan Bayes seperti yang dijelaskan pada persamaan (3.25)
5.4.4. Evaluasi Terhadap Penduga
Evaluasi terhadap kualitas penduga didasarkan pada besarnya
simpangan dari nilai dugaan terhadap nilai parameter populasi yang diukur dari
75
Rata-rata Bias Relatif (RBR), Akar dari Rata-rata Kuadrat Bias Relatif (ARKBR)
dan Kuadrat Tengah Galat (KTG):
(5.41)
(5.42)
. (5.43)
5.4.5. Simulasi
Dalam rangka mengevaluasi sifat penduga, maka dilakukan studi
simulasi dengan mengambil salah satu kecamatan di Kabupaten Sumenep yaitu
kecamatan Lenteng yang terdiri dari 16 blok sensus dengan jumlah penduduk
48.696 jiwa. Jumlah penduduk berusia 10 tahun keatas 48.282 jiwa, teridiri dari
22.762 laki-laki dan 25.520 perempuan. Jumlah penduduk berusia 10 tahun ke
atas di tiap blok sensus sangat bervariasi, yaitu antara 559 jiwa sampai 7110
jiwa. Proporsi penduduk yang bisa baca tulis sekitar 74%, untuk laki-laki sebesar
80,53% dan perempuan hanya 69,32%.
1) Proses Penarikan contoh dan penentuan bobot Pada survai Susenas, blok sensus dipilih secara acak dengan peluang
proportional to size, oleh karena itu blok sensus merupakan area kecil yang
diamati.
Dalam simulasi ini, metode penarikan contoh dilakukan sesuai dengan
metode Susenas yaitu penarikan contoh dua tahap dimana pada tahap pertama
dipilih 5 blok sensus secara pps (Probability Proportional to Size) dengan size
banyaknya rumah tangga hasil senarai SP2010 (Ni
• Tahap pertama, peluang terambilnya contoh area (blok sensus) tertentu
adalah dimana N
) dan pada tahap kedua, dari
setiap blok sensus terpilih dipilih sejumlah 16 rumah tangga biasa secara acak
berdasarkan hasil listing SP2010. Penarikan contoh diulang sebanyak 100 kali Fraksi penarikan contoh pada tahap pertama sesuai dengan persamaan
(5.34) dan untuk tahap kedua sesuai dengan persamaan (5.35), yaitu:
i
• Tahap kedua, peluang terambilnya contoh dia area ke-i adalah
adalah jumlah populasi pada blok sensus
ke i dan N adalah jumlah populasi di seluruh kecamatan.
76
2) Pendugaan Area Kecil Sesuai dengan proses yang telah dijelaskan pada sub bab 5.3,
pendugaan parameter model dilakukan dengan 3 cara yaitu: a. Dengan menggunakan model SAE dengan tidak memperhitungkan bobot
seperti pada persamaan (3.23). Pendugaan proporsi di area kecil
menggunakan pendekatan Bayes dengan mengaplikasikan formula Bayes
seperti yang ditunjukkan oleh persamaan (3.25) b. Dengan memperhitungkan bobot penarikan contoh yang diasumsikan
memiliki hubungan eksponensial seperti ditunjukkan oleh persamaan
(5.35) dan (5.36). Pendugaan area kecil menggunakan rumus (5.37) dan
(5.38) c. Dengan memperhitungkan bobot penarikan contoh seperti ditunjukkan oleh
persamaan (5.39)
Evaluasi terhadap kualitas penduga didasarkan pada besarnya
simpangan dari nilai dugaan terhadap nilai parameter populasi yang diukur
dengan RBR, ARKBR dan KTG seperti pada rumus (5.41), (5.42) dan (5.43).
3) Hasil Simulasi
Nilai dugaan angka melek huruf (proporsi penduduk usia 10 tahun ke atas
yang bisa baca tulis) untuk tiap blok sensus di Kecamatan Lenteng, Kabupaten
Sumenep seperti dijelaskan pada Tabel 5.2 dan dalam bentuk grafik ditunjukkan
pada Gambar 5.1. Gambar 5.2 menjelaskan besarnya bias dugaan dari masing-
masing metode.
Gambar 5.1 maupun Gambar 5.2 menunjukkan bahwa metode pendugaan
parameter melalui pendekatan Bayes dengan menggunakan model logit normal
campuran terbobot memberikan hasil yang terbaik. Sedangkan untuk pendugaan
parameter yang menyertakan fungsi peluang dalam bentuk eksponensial memliki
bias yang lebih besar.
77
Gambar 5.1
Plot hasil simulasi pendugaan pi
Gambar 5.2
Plot hasil simulasi bias pendugaan p
(angka melek huruf) untuk tiap blok sensus di Kecamatan Lenteng, Kabupaten Sumenep
i
Hasil simulasi ini juga menunjukkan bahwa model logit normal campuran
terbobot dengan pendekatan Bayes memberikan nilai ARKBR dan KTG paling
kecil yaitu sebesar 0,0107 dibandingkan metode yang lain (lihatTabel 5.1).
Namun hasil perhitungan nilai rata-rata bias relatif (RBR) lebih tinggi
dibandingkan dengan dengan SAE yang menyertakan model peluang
eksponensial. Tingginya nilai KTG untuk model SAE eksponensial tersebut
disebabkan karena bias pada area (blok sensus) ke-7 sangat tinggi dan model
untuk tiap blok sensus di Kecamatan Lenteng, Kabupaten Sumenep
0,50,55
0,60,65
0,70,75
0,80,85
0,90,95
1
1 3 5 7 9 11 13 15 17
Populasi Model EksponensialModel logit normal Tanpa Bobot Model Logit normal dengan bobot
Dugaan Angka Melek Huruf
-0,200
-0,100
0,000
0,100
0,200
0,300
0,400
0,500
1 3 5 7 9 11 13 15 17
Bias Model EksponensialBias Model logit normal Tanpa BobotBias Model Logit normal dengan bobot
Bias Dugaan Angka Melek Huruf
78
nilai pendugaan dari hasil simulasi lebih menyebar dibandingkan dengan metode
yang lain .
Tabel 5.1. Nilai rata-rata bias relatif dan rata-rata kuadrat bias relatif untuk model terbobot dan model eksponensial
EBp KTG RBR RKBR Model Logit Normal 0,824 0,0203 0,1122 0,1430 Model Logit Normal Terbobot (W) 0,835 0,0107 0,0414 0,1298 Model Eksponensial 0,740 0,1172 -0,0009 0,2266 Populasi 0,741
Tabel 5.2. Hasil Simulasi Dugaan pi
Blok
(proporsi penduduk usia 10 tahun ke atas yang bisa baca tulis) untuk tiap blok sensus di Kecamatan Lenteng, Kabupaten Sumenep
ModelCampuran Logit Normal Tanpa Bobot
Model Campuran Logit Normal
Terbobot
Model- Eksponensial Populasi
EBp -TB EBp -B EBp - Exp p
1 0.910 0.899 0.890 0.882
2 0.863 0.773 0.942 0.735
3 0.885 0.844 0.905 0.818
4 0.885 0.887 0.925 0.868
5 0.817 0.866 0.791 0.754
6 0.803 0.671 0.894 0.618
7 0.871 0.616 0.948 0.515
8 0.849 0.779 0.879 0.723
9 0.869 0.930 0.800 0.828
10 0.819 0.859 0.790 0.737
11 0.797 0.810 0.640 0.726
12 0.822 0.868 0.732 0.757
13 0.857 0.944 0.691 0.828
14 0.803 0.810 0.553 0.707
15 0.753 0.668 0.794 0.613
16 0.848 0.821 0.844 0.758 Angka Melek Huruf Kecamatan Lenteng 0.741
5.4.6. Aplikasi : Pendugaan Angka Melek Huruf di Kabupaten Sumenep dan Kabupaten Pasuruan Provinsi Jawa Timur
Berdasarkan hasil simulasi, metode terbaik untuk pendugaan parameter
proporsi adalah model logit normal terbobot dimana pendugaan parameter area
dilakukan melalui pendekatan Bayes. Selanjutnya metode tersebut digunakan
untuk menduga angka melek huruf di Kabupaten Sumenep dan Pasuruan. Hasil
79
pendugaan parameter model SAE dengan menggunakan metode PQL dapat
dilihat pada Tabel 5.3
Gambar 5.3. menunjukkan hasil dugaan angka melek huruf di Kabupaten
Sumenep dan Kabupaten Pasuruan. Prediksi angka melek huruf di kabupaten
Sumenep adalah 0,8189 dimana nilai parameter populasi 0,7589.
(a) Nilai parameter vs dugaan (b) Nilai bias dugaan angka angka melek huruf melek huruf
Gambar 5.3
Nilai dugaan, parameter populasi dan bias dugaan angka melek huruf di Kabupaten Sumenep
(a) Nilai parameter vs dugaan (b) Nilai bias dugaan
angka melek huruf angka melek huruf
Gambar 5.4. Nilai dugaan, parameter populasi dan bias dugaan angka melek huruf di
Kabupaten Pasuruan
0,40
0,50
0,60
0,70
0,80
0,90
1,00
10 30 50 70 90 110
130
150
170
190
210
230
241
Prop
orsi
Kode Kecamatan
Populasi Model Bobot
-0,30-0,25-0,20-0,15-0,10-0,050,000,050,100,150,20
190 40 150
230 60 140
180
100 20 70 220 80 160
Bias
Kode Kecamatan
rata-rata bias = -0.0628
0,4000
0,5000
0,6000
0,7000
0,8000
0,9000
1,0000
10 30 50 70 90 110
130
150
170
200
220
240
Prop
orsi
Kode Kecamatan
Populasi Model Bobot
Kec. Beji
-0,3
-0,2
-0,1
0
0,1
0,2
0,3
0,4
0,5
0,6
50 70 110 90 200 20 60 130
100
230
190
140
Bias
Kode Kecamatan
rata-rata bias = 0.0136
80
Sedangkan untuk kabupaten Pasuruan, nilai prediksinya adalah 0,8808
dengan nilai parameter populasi: 0,9044. Terlihat bahwa perbedaan antara nilai
dugaan dan nilai parameter populasi relatif sangat kecil, artinya Model Logit
Normal Terbobot dapat menghasilkan bias yang sangat kecil.
Nilai KTG untuk dugaan tersebut adalah 0,0149 untuk Kabupaten
Sumenep dan untuk Kabupaten Pasuruan sedikit lebih besar yaitu 0,0202.
Tingginya nilai KTG di Kabupaten Pasuruan disebabkan karena bias dugaan
yang relatif tinggi di salah satu kecamatan yaitu di Kecamatan Tosari karena
proporsi penduduk berusia 10 tahun keatas yang bisa baca tulis di kecamatan
tersebut sangat rendah dibandingkan dengan kecamatan yang lain yaitu hanya
sekitar 50%.
5.5. Model SAE Berbasis Penarikan Contoh Berpeluang Tidak Sama
Untuk Peubah Respon Multinomial
5.5.1. Pengembangan model SAE: Model Campuran Logit Multinomial Terbobot
Sebaran marjinal dari setiap komponen multinomial yik
),(~ ikiik pnBy
adalah binomial:
. Jika Xik
( )
∑−==
−
=
1
11/log/log
q
kikikiqikik ppppθ
merupakan vektor kovariat tetap dan diasumsikan tidak
tidak tergantung pada i dan k, maka model linier yang didasarkan pada rasio
seperti yang dinyatakan oleh persamaan
(4.2) adalah ikkikik u+= βxθ , untuk i=1,....m dan k=1,....q Hasil pengembangan model SAE untuk respon binomial sebelumnya telah
disimpulkan bahwa model SAE terbaik untuk respon binomial yang menyertakan
peluang penarikan contoh adalah model campuran logit-normal terbobot. Oleh
karena itu dalam penelitian ini, bobot peluang juga diperhitungkan dalam model
SAE untuk peubah respon multinomial. Bobot peluang diberikan kepada setiap
unit percobaan sehingga pada model SAE yang dijelaskan oleh persamaan (4.2)
adalah .
/∑=j
ikijkik nww dimana wijk adalah bobot pengamatan ke j pada katagori
ke k di area ke i. Sehingga model SAE untuk logit (pik
][ ikeikukikikwikyikwikwy ++== βx
) terbobot dari peubah
respon multinomial adalah:
(5.52)
81
dimana
∑−
=−=
=
1
11/log/log
q
k ikpikpiqpikpiky dari percontohan.
Selanjutnya pendugaan parameter model dilakukan dengan metode PQL
dan REML sama seperti pada pendugaan parameter model SAE untuk respon
binomial untuk memperoleh pendugaan kwβ dan wkυσ dari model terbobot.
Untuk Xik, yaitu peubah penyerta dari populasi diketahui, maka nilai dugaan dari
logit (pikw ikukwikXikw += βθ ˆˆ) adalah . Untuk mendapatkan nilai
= iqpikpik /logθ maka ikwθ dikalikan dengan kebalikan bobot untuk setiap
katagori yaitu 1/wik.
Pendugaan parameter model (5.22) menggunakan metode PQL yang
diterapkan untuk model linier logistik terbobot. Prediksi yang diperoleh adalah yik
ikyikwiky ˆ'ˆ =
terbobot yaitu , sehingga penduga yik
iwwikyiky /'ˆˆ =
tanpa bobot adalah
. Selanjutnya pendugaan area kecil menggunakan pendekatan
Bayes seperti yang dijelaskan pada persamaan (3.25) yaitu dengan menduga
komponen *iky dari persamaan *)1( ikikikikik yfyfp −+= . pik adalah proporsi unit
populasi pada katagori ke-k di area ke-i yang dinyatakan sebagai jumlah dari
komponen percontohan dan komponen bukan percontohan dimana
f ik = nik/Nik
iky adalah fraksi percontohan untuk katagori ke k.
adalah rata-rata contoh (proporsi) di area ke i dan katagori ke k
*iky adalah rata-rata dari unit-unit yang tidak diambil contohnya pada
katagori ke-k dalam area i Pendugaan *
iky diturunkan dengan cara yang sama dengan penduga
Bayes untuk model SAE dengan peubah respon multinomial pada Bab IV yaitu
dengan persamaan (4.8). Penduga Bayes empirik untuk pik
)ˆ,ˆ(ˆ υσβBikpEB
ikp =
(proporsi pada
katagori ke k di area ke i) yaitu
Pendugaaan )ˆ( EBkipKTG dilakukan dengan metode Jackknife seperti
yang dilakukan pada pendugaan SAE untuk peubah respon Binomial pada Bab
III atau respon multinomial tanpa bobot pada Bab IV yaitu dengan menggantikan
82
)ˆ,ˆ,(ˆ σµikyikkEBikp = dan )ˆ,ˆ,(,ˆ llikyikkEB
likp −−=− σµ dalam persamaan (4.5)
sampai dengan persamaan (4.6) untuk memperoleh ikM1ˆ dan ikM2
ˆ . Dengan
demikian nilai KTG untuk pendugaan pada katagori ke k dan area ke-i
)ˆ( EBkipKTG = ikM1
ˆ + ikM2ˆ .
5.5.2. Aplikasi: Pendugaan Rata-rata Lama Sekolah di Tingkat Kecamatan di Kabupaten Sumenep dan Kabupaten Pasuruan.
Model SAE untuk respon multinomial terbobot seperti dijelaskan oleh persamaan (5.22) diaplikasikan untuk menghitung rata-rata lama sekolah kecamatan di Kabupaten Sumenep dan Kabupaten Pasuruan. Pendugaan rata-rata lama sekolah di tiap kecamatan didasarkan pada model area kecil yaitu blok sensus.
Melalui pendekatan Bayes, dengan menggunakan rumus (3.25), nilai
penduga proporsi penduduk di tiap jenjang pendidikan dan rata-rata nilai KTG
berdasarkan model SAE yang diperoleh ditunjukkan oleh Lampiran 17 dan
Lampiran 19 dan secara grafis ditunjukkan oleh Gambar 5.5 dan Gambar 5.6.
Dalam satu kecamatan, proporsi penduduk di tiap jenjang pendidikan
relatif sama dari satu blok sensus ke blok sensus yang lain relatif homogen,
sehingga dengan metode Jackknife, penduga KTG relatif sangat kecil yaitu
untuk Kabupaten Sumenep antara 3,9 x 10-11 sampai 1,2 x10-5, sedangkan untuk
Kabupaten Pasuruan antara 1,31. 10-11 sampai 1,37. 10-3.
Gambar 5.7 menunjukkan rata-rata lama sekolah di tiap kecamatan
berdasarkan model SAE logit multinomial terbobot. Untuk Kabupaten Sumenep,
rata-rata lama sekolah antara 3.99 tahun sampai 8,36 tahun dan di Kabupaten
Pasuruan antara 4,11 tahun sampai 10,97 tahun. Beberapa kecamatan di
Kabupaten Sumenep dan Pasuruan bahkan memiliki rata-rata lama sekolah
relatif rendah yaitu sekitar 4 tahun.
83
Gambar 5.5.
Nilai dugaan proporsi penduduk pada tiap jenjang pendidikan tertentu dan dugaan KTG menggunakan model SAE logit multinomial terbobot di Kabupaten
Sumenep
Gambar 5.6.
Nilai dugaan proporsi penduduk pada tiap jenjang pendidikan tertentu dan dugaan KTG menggunakan model SAE logit multinomial terbobot di Kabupaten
Pasuruan
0,0000
0,1000
0,2000
0,3000
0,4000
0,5000
0,6000
0,7000
10 30 50 70 80 100
120
140
160
180
200
220
240
250
Prop
orsi
Kecamatan
Dugaan proporsi di tiap jenjang pendidikan Kab. Sumenep
(dengan pembobotan)
Tidak Sekolah Putus SD
SD SMP
SMA PT
0,00E+00
1,00E-05
2,00E-05
3,00E-05
4,00E-05
5,00E-05
6,00E-05
7,00E-05
8,00E-05
9,00E-05
10 40 70 90 120
150
180
210
240
MSE
Kecamatan
Dugaan KTG(dengan pembobotan)
Tidak Sekolah Putus SDSD SMPSMA PT
0,0000
0,1000
0,2000
0,3000
0,4000
0,5000
0,6000
0,7000
0,8000
0,9000
10 30 50 70 90 110
130
150
170
190
210
230
Prop
orsi
Kecamatan
Pendugaan Tingkat Pendidikan Kab. Pasuruan
(dengan pembobotan)
Tidak Sekolah Putus SDSD SMPSMA PT
0,00E+00
1,00E-03
2,00E-03
3,00E-03
4,00E-03
5,00E-03
6,00E-03
7,00E-03
8,00E-03
9,00E-03
10 30 50 70 90 110
130
150
170
190
210
230
MSE
Kecamatan
MSE Pendugaan Tingkat Pendidikan Kab. Pasuruan
(dengan pembobotan)
Tidak Sekolah Putus SDSD SMPSMA PT
84
Gambar 5.7
Nilai dugaan rata-rata lama sekolah menggunakan model SAE logit multinomial terbobot di Kabupaten Sumenep dan Pasuruan
5.6. Perhitungan Indeks Pendidikan di Kabupaten Sumenep dan Pasuruan
Berdasarkan prediksi angka melek huruf dan rata-rata lama sekolah,
berikut ini dihitung nilai Indeks Pendidikan di tiap kecamatan menggunakan
rumus sebagai berikut:
Indeks Pendidikan = 2/3 I MH +1/3 IRLS
dimana: Indeks AMH/RLS: (Xi – Xmin)/ (Xmax – Xmin)
AMH: Angka melek huruf IMH: Indeks melek huruf
RLS: Rata-rata lama sekolah IRLS : Indeks Rata-rata lama sekolah
Dalam bentuk grafik nilai indeks pendidikan di tiap kecamatan
dikabupaten Sumenep dan Pasuruan dapat dilihat pada Gambar 5.8. Sedangkan
dalam peta tematik indeks pendidikan di Kabupaten Sumenep dan pasuruan
ditunjukkan pada Gambar 5.9. dan Gambar 5.10.
6,31
8,36
5,375,68
4,66
7,236,94
7,68
7,11
6,38
6,84
4,84
7,49
4,15
6,81
5,485,68
7,187,14
3,99
7,88
6,72
7,95
6,98
4,66
5,51
3,500
4,500
5,500
6,500
7,500
8,500
9,50010 40 70 90 12
0
150
180
210
240
Tahu
n
Kecamatan
Rata-rata Lama Sekolah di tiap kecamatan, Kabupaten Sumenep
6,29
5,53
4,11
5,625,30
4,454,65
8,31
7,26
8,278,467,99
9,32
6,616,46
5,03
6,166,386,21
7,68
4,60
5,415,97
3,500
4,500
5,500
6,500
7,500
8,500
9,500
10,500
10 30 50 70 90 110
130
150
170
190
210
230
Tahu
n
Kecamatan
Rata-rata Lama Sekolah di tiap kecamatan ,Kabupaten Pasuruan
85
Gambar 5.8.
Prediksi Indeks Pendidikan di kabupaten Sumenep dan Kabupaten Pasuruan menggunakan model SAE
Gambar 5.9.
Peta Tematik Indeks Pendidikan di kabupaten Sumenep
0,0010,0020,0030,0040,0050,0060,0070,0080,0090,00
10 40 70 100
130
160
190
220
241
Inde
ks
Kecamatan
Kabupaten Sumenep
0,00
10,00
20,00
30,00
40,00
50,00
60,00
70,00
80,00
90,00
10 40 70 100 130 160 200 230
Inde
ks
Kecamatan
Kabupaten Pasuruan
86
Gambar 5.10.
Peta Tematik Indeks Pendidikan di kabupaten Pasuruan
5.7. Pembahasan
5.7.1. Model SAE untuk respon Binomial dengan memperhitungkan peluang penarikan contoh.
Hasil simulasi menunjukkan bahwa metode pendugaan area kecil
menggunakan sebaran prior logit normal melalui pendekatan Bayes empirik yang
dikembangkan dengan memperhitungkan peluang penarikan contoh memberikan
penduga parameter proporsi area kecil yang paling baik karena dapat
menurunkan bias dan KTG dari penduga. Sementara itu metode pendugaan
area kecil yang dikembangkan berdasarkan penarikan contoh informatif yaitu
dengan menyertakan model peluang penarikan contoh dalam bentuk fungsi
eksponensial memberikan rata-rata bias relatif yang rendah namun memberikan
akar rata-rata kuadrat bias relatif maupun KGT yang lebih tinggi dibandingkan
dengan metode pendugaan menggunakan sebaran prior logit normal terbobot.
Besarnya nilai KTG lebih banyak disebabkan karena ragam pendugaan yang
relatif besar sehingga walaupun memberikan bias yang kecil maka KTG akan
cenderung tinggi. Penurunan bias dari model SAE eksponensial ini menunjukkan
87
bahwa memperhitungkan peluang penarikan contoh dalam model SAE akan
dapat menurunkan bias. Pfefferman (2010) mengatakan bahwa mengabaikan
peluang penarikan contoh dalam model SAE akan menghasilkan bias
pendugaan karena dengan mengabaikan peluang penarikan contoh, maka
pendugaan parameter model untuk area/unit yang terambil sebagai contoh sama
dengan area/unit yang tidak terambil sebagai contoh.
Dengan mengaplikasikan model SAE logit normal terbobot melalui
pendekatan Bayes, dihasilkan perbedaan antara nilai parameter populasi dengan
prediksinya relatif kecil, rata-rata bias relatif mutlak untuk Kabupaten Sumenep
0,0628 dengan KTG sebesar 0,0149. Untuk Kabupaten Pasuruan, rata-rata
bias relatif mutlak adalah 0,0136 dengan nilai KTG sebesar 0,0202. Oleh karena
itu, berdasarkan hasil simulasi maupun aplikasi di Kabupaten Sumenep dan
Pasuruan menunjukkan bahwa model SAE untuk peubah respon Binomial
menggunakan model campran logit normal terbobot memberikan hasil yang
paling akurat dalam pendugaan parameter proporsi area kecil.
5.7.2. Model SAE untuk respon Multinomial dengan memperhitungkan peluang penarikan contoh.
Oleh karena model campuran logit normal terbobot memberikan hasil yang
paling baik pada pendugaan area kecil untuk respon binomial, maka diterapkan
cara yang sama pada pendugaan area kecil untuk respon multinomial. Untuk
Kabupaten Sumenep, nilai pendugaan rata-rata lama sekolah antara 3,99 tahun
sampai 8,36 tahun. Untuk Kabupaten Pasuruan rata-rata lama sekolah antara
4,11 tahun sampai 10,92 tahun. Nilai dugaan KTG menggunakan metode
Jackknife relatif sangat kecil, tertinggi adalah 0,00137 karena pada umumnya
kondisi blok sensus di tiap kecamatan relatif sama. Besarnya KTG tersebut
sangat dipengaruhi oleh homogenitas atau heterogenitas dari nilai respon dari
area yang satu ke area yang lain.
88
BAB VI Pembahasan
6.1. Pendahuluan
Model pendugaan area kecil untuk respon Binomial dan Multinomial pada
dasarnya dikembangkan dari model SAE untuk data biner, dimana peubah yang
diamati hanya memiliki dua kemungkinan nilai yaitu 1 (jika berada pada katagori
tertentu yang menjadi perhatian) dan 0 (jika tidak berada dalam katagori tertentu
yang menjadi perhatian). Selanjutnya jika peubah yang diperhatikan adalah
jumlah kejadian tertentu yang diperhatikan maka peubah tersebut akan mengikuti
sebaran Binomial dengan parameter p yaitu proporsi kejadian dalam tiap n
contoh. Pendugaan parameter proporsi p dapat dilakukan melalui dua
pendekatan yaitu pendekatan klasik dan Bayes.
Pendugaan proporsi melalui pendekatan Bayes dapat dilakukan secara
langsung yang dilakukan dengan mengasumsikan bahwa parameter tersebut
berasal dari suatu distribusi tertentu yang disebut distribusi prior. Distribusi atau
sebaran prior yang sering digunakan untuk menduga parameter Binomial adalah
sebaran prior Beta yang merupakan conjugate dari fungsi massa peluang
Binomial dan sebaran prior logit normal, dimana peubah respon ditransormasikan
dalam fungsi logit.
Pendugaan area kecil berbasis pada data biner, baik untuk peubah respon
Binomial maupun multinomial menggunakan metode tak tangsung atau berbasis
model menggunakan sebaran prior logit normal. Pengembangan model SAE
untuk respon binomial dan multinomial dalam penelitian ini dilakukan dengan
memperhatikan peluang penarikan contoh.
6.2. Perbandingan metode pendugaan langsung dan tak langsung untuk pendugaan area kecil melalui pendekatan Bayes
Pendugaan proporsi di area kecil melalui pendekatan Bayes dapat
dilakukan dengan dua cara yaitu pendugaan langsung dan tak langsung yaitu
berbasis model. Perbandingan kualitas penduga didasarkan pada dua
pendekatan yang telah dibahas pada Bab III melalui studi kasus pendugaan
89
angka melek huruf di tingkat kecamatan dengan menyertakan dua peubah
penyerta yaitu usia dan jenis kelamin. Model SAE untuk peubah respon Binomial
melalui pendekatan Bayes didasarkan pada sebaran prior logit normal.
Pendugaan SAE tersebut merupakan model campuran logit normal dimana
pendugaan parameter yang sering dipakai oleh para peneliti adalah metode
Penalized Quasi-Likelihood (PQL) dan pendugaan ragam dengan pendekatan
ML dan/atau REML.
Melalui pendekatan bayes yaitu dengan menggunakan metode Bayes
Empirik, metode pendugaan langsung dengan sebaran prior Beta dan sebaran
prior logit normal memberikan hasil yang hampir sama dengan metode
pendugaan langsung secara klasik karena bobot untuk komponen populasi
terlalu kecil sehingga sebaran prior tidak terlalu berpengaruh kepada penduga
Bayes.. Untuk sebaran prior Beta, nilai dugaan α dan β relatif kecil dibandingkan
dengan jumlah contoh di tiap area (ni iy) sehingga bobot untuk yaitu
( )βαγ ˆˆ/ˆ ++= iii nn sangat besar, sekitar 0.905 untuk Kabupaten Sumenep dan
sekitar 0,827 untuk Kabupaten Pasuruan.
Nilai KTG pendugaan langsung cenderung tinggi, baik untuk pendugaan
berbasis sebaran prior Beta maupun sebaran logit normal, sedangkan untuk
pendugaan tak langsung melalui model SAE berbasis unit dengan peubah
respon logit (pij) dan sebaran prior logit normal cenderung memberikan nilai KTG
yang jauh lebih baik dapat dilihat dari rata-rata KTG pendugaan angka melek
huruf kecamatan di Kabupeten Sumenep dan kabupaten Pasuruan
menggunakan model SAE yang paling kecil dibandingkan kedua metode
pendugaan langsung. Karena bobot untuk komponen model lebih dominan yaitu
karena fraksi percontohan (sampling fraction), fi=ni/Ni, relatif kecil maka
keberadaan peubah penyerta yaitu usia dan jenis kelamin sangat berpengaruh
pada pendugaan parameter area kecil pi
Dari kajian tersebut diperoleh kesimpulan bahwa metode pendugaan tak
tangsung menghasilkan kualitas penduga yang lebih baik, artinya keberadaan
peubah penyerta dapat meningkatkan kualitas penduga terutama dapat
menurunkan ragam penduga sedangkan untuk pendugaan langsung, karena
jumlah contoh relatif kecil cenderung memberikan ragam yang besar. Model SAE
untuk respon Binomial melalui pendekatan Bayes yang dibahas pada Bab III
tidak memperhitungkan peluang percontohan dari data yang digunakan.
.
90
6.3. Pengaruh peluang penarikan contoh dalam Model SAE untuk respon Binomial dalam peningkatan kualitas penduga.
Pada Bab V dibahas pengembangan model SAE untuk respon Binomial
dengan memperhitungkan penarikan contoh dimana pendugaan parameter area
melalui pendekatan Bayes. Pengembangan model SAE yang memperhatikan
peluang penarikan contoh agar dapat diaplikasikan untuk menduga angka melek
huruf atau parameter lain yang berasal dari sebaran Binomial di area kecil di
Indonesia dengan menggunakan data Susenas tanpa menambah jumlah contoh.
Dengan memperhatikan peluang penarikan contoh, area kecil yang
digunakan adalah blok sensus. Dilakukan studi simulasi di salah satu kecamatan
(Kecamatan Lenteng, Kabupaten Sumenep) dengan mengaplikasikan tiga model
SAE, yaitu model SAE melalui pendekatan Bayes Empirik tanpa menyertakan
bobot peluang, model SAE logit normal terbobot dan model SAE yang
menyertakan bobot peluang penarikan contoh sebagai fungsi eksponensial dari
karakteristik area atau unit.
Hasil simulasi menunjukkan bahwa metode pendugaan area kecil
menggunakan model SAE logit normal terbobot memberikan penduga parameter
proporsi area kecil yang paling baik karena menurunkan besarnya KTG dan bias
dalam pendugaan. Metode pendugaan area kecil yang dikembangkan
berdasarkan percontohan informatif dimana peluang percontohan merupakan
fungsi eksponensial memberikan rata-rata bias relatif rendah namun
menghasilkan KTG lebih tinggi dibandingkan dengan metode pendugaan
menggunakan sebaran prior logit normal terbobot (Lihat Tabel 6.1). Hal ini
disebabkan adanya penambahan ragam yang disebabkan oleh penambahan
model peluang penarikan contoh dalam model SAE.
Aplikasi model campuran logit normal terbobot untuk menduga angka
melek huruf di kabupaten Sumenep dan Pasuruan juga membuktikan bahwa
metode tersebut menghasilkan rata-rata bias relatif dan KTG yang relatif kecil,
yaitu untuk Kabupaten Sumenep sebesar 0,0628 dan nilai KTG sebesar 0,0149
dan untuk Kabupaten Pasuruan sebesar 0,0136 dengan KTG sebesar 0,0202.
91
Tabel 6.1. Perbandingan kualitas penduga untuk model SAE untuk respon
Binomial dengan dan tanpa memperhatikan peluang penarikan contoh.
Model SAE EBp Rata-rata Bias relatif KTG
Simulasi
Model Logit Normal 0,8240 O,1122 0,0204
Model Logit Normal Terbobot 0,8350 0,0414 0,0107
Model Eksponensial 0,7400 -0,0009 0,1172
Aplikasi
Model Logit Normal Terbobot
• Kabupaten Sumenep 0,8189 -0,0628 0,0149
• Kabupaten Pasuruan 0,8808 0,0136 0,0202
Populasi • Kabupaten Sumenep 0,7589
• Kabupaten Pasuruan 0,9044
Dengan mengabaikan peluang penarikan contoh, maka pendugaan
parameter dengan mengasumsikan bahwa model berdasarkan percontohan
sama dengan model dari komplemen percontohan Oleh karena itu mengabaikan
peluang percontohan akan menghasilkan penduga yang bias (Pfefferman 2010)..
Dari hasil simulasi terlihat bahwa pendugaan berbasis model tanpa
memperhitungkan peluang penarikan contoh menghasilkan bias sekitar 0,1122
sementara dengan memperihutngkan penarikan contoh turun menjadi hanya
0.0414 untuk model logit normal terbobot dan 0,0009 untuk model eksponensial.
6.4. Pengembangan model SAE berbasis pada peubah respon Multinomial dengan penarikan contoh berpeluang tidak sama
Model SAE berbasis sebaran multinomial yang dikembangkan dalam
penelitian ini mengacu pada penelitian yang telah dilakukan oleh Molina et al.
(2007) dan Scealy (2010). Untuk pendugaan parameter model Scealy (2010)
mengaplikasikan metode KQB, pendekatan KM dan/atau KMB. Pendugaan
area kecil menggunakan pendekatan Bayes seperti yang dilakukan untuk model
SAE dengan respon Binomial.
Dalam aplikasi, peubah penyerta yang digunakan yaitu usia dan jenis
kelamin dimana pengaruh peubah penyerta terhadap peubah respon pada model
SAE dengan peubah respon multinomial dibedakan atas katagori. Untuk model
SAE tanpa memperhitungkan peluang penarikan contoh yang telah dibahas
pada bab IV, berdasarkan aplikasi pada pendugaan rata-rata lama sekolah di
kecamatan di kabupaten pasuruan dan Sumenep menghasilkan nilai dugaan
92
koefisien untuk peubah penyerta usia, parameter β positif untuk katagori 1
(tidak pernah bersekolah) dan 2 (putus sekolah dasar), namun untuk jenjang
pendidikan lebih tinggi menghasilkan nilai dugaan β negatif. Sedangkan untuk
peubah penyerta jenis kelamin, penduga β di katagori 3 (lulus SD) di kabupaten
Sumenep negatif sedangkan untuk katagori yang lain positif. Hal ini
menunjukkan bahwa pada kelompok tersebut proporsi laki-laki yang lulus SD
lebih kecil dibandingkan perempuan. Beberapa dengan Kabupaten Pasuruan,
nilai dugaan β untuk katagori 3,4 dan 5 (lulus SD, SLTP dan SLTA ) semuanya
negatif yang menunjukkan bahwa tingkat pendidikan perempuan lebih tinggi
dibandingkan laki-laki.
Dengan menggunakan metode Jackknife, nilai dugaan KTG untuk
pendugaan area kecil di tiap-tiap katagori bervariasi tergantung kepada
heterogenitas dari nilai dugaan proporsi dari area ke area. Semakin heterogen
(seperti pada jenjang pendidikan SD), maka akan menghasilkan nilai dugaan
KTG yang cenderung lebih besar. Hal yang sama juga ditemui pada pendugaan
area kecil yang memperhitungkan peluang penarikan contoh. Dengan
menggunakan metode Jackknife, hasil penduga KTG untuk logit multinomial
terbobot melalui pendekatan Bayes juga memberikan nilai penduga KTG yang
sangat kecil. Besarnya KTG tersebut sangat dipengaruhi oleh homogenitas atau
heterogenitas dari nilai respon dari area yang satu ke area yang lain.
93
BAB VII Kesimpulan Dan Saran
7.1. Kesimpulan
Melalui pendekatan Bayes Empirik , metode pendugaan langsung dengan
menggunakan sebaran prior Beta dan sebaran prior logit normal memberikan
hasil yang hampir sama dengan metode pendugaan langsung secara klasik
karena bobot untuk komponen populasi terlalu kecil sehingga sebaran prior tidak
terlalu berpengaruh kepada penduga Bayes.
Dengan menggunakan sebaran prior logit normal, pendugaan area kecil
menggunakan metode pendugaan tak tangsung menghasilkan kualitas penduga
yang lebih baik, artinya keberadaan peubah penyerta dapat meningkatkan
kualitas penduga terutama dapat menurunkan ragam penduga sedangkan untuk
pendugaan langsung, karena jumlah contoh relatif kecil cenderung memberikan
ragam yang besar
Melalui pendekatan Bayes, model SAE untuk respon Binomial yang
dikembangkan dengan memperhitungkan peluang penarikan contoh
menghasilkan penduga dengan kualitas yang lebih baik yaitu memberikan bias
dan nilai KTG yang sangat kecil. Penyertaan peluang penarikan contoh dalam
bentuk fungsi eksponensial pada model SAE menghasilkan penduga yang
memiliki bias sangat kecil namun menghasilkan KTG yang relatif lebih tinggi
dibandingkan dengan model SAE berdasarkan model campuran logit normal
terbobot. Oleh karena itu, melalui pendekatan Bayes, model campuran logit
normal terbobot menghasilkan kualitas penduga yang lebih baik dibandingkan
dengan model SAE yang menyertakan fungsi eksponensial dari peluang
penarikan contoh.
Melalui pendekatan bayes, model SAE berbasis sebaran multinomial
berdasarkan model campuran logit normal terbobot memberikan penduga
dengan KTG yang sangat kecil yaitu pada kisaran antara 1,3 x 10-11 sampai 1,37
x10
Dengan menggunakan metode Jackknife, nilai dugaan KTG untuk
pendugaan area kecil di tiap-tiap katagori bervariasi tergantung kepada
heterogenitas nilai dugaan proporsi dari area ke area. semakin heterogen
-3
94
(seperti pada jenjang pendidikan SD), maka akan menghasilkan nilai dugaan
KTG yang cenderung lebih besar. Hal yang sama juga ditemui pada pendugaan
area kecil yang memperhitungkan peluang penarikan contoh.
7.2. Saran
Dalam penelitian ini pengembangan model SAE untuk respon Binomial
maupun Multinomial yang memperhitungkan peluang penarikan contoh adalah
dengan memberikan bobot pada unit percontohan dan dengan menyertakan
model eksponsial dari peluang penarikan contoh dalam model SAE. Pendugaan
parameter model SAE menggunakan metode PQL dan REML dimana metode
tersebut masih memungkinkan adanya bias dalam pendugaan. Oleh karena itu
masih terbuka untuk mengembangkan metode pendugaan dengan cara yang
lain.
Besarnya KTG yang dihasilkan oleh metode SAE yang menyertakan
fungsi eksponensial dari peluang percontohan perlu dikaji lebih dalam karena
bias yang dihasilkan relatif sangat kecil sehingga kemungkinan besarnya KTG
disebabkan oleh ragam pendugaan yang besar. Perlu dikembangkan model yang
serupa tetapi dapat menurunkan ragam.
95
Daftar Pustaka
Arora V dan Lahiri P. 1997. On the Superiority of the Bayesian Method over the
BLUP in Small Area Estimation Problems. Statistica Sinica, 7, 1053–1064.
BPS dan UNFPA. 1998. Pemantauan Perkembangan Kesejahteraan Rakyat,
Pemanfaatan Data Susenas dan Data Sosial Kependudukan lainnya, Badan
Pusat Statistik. Jakarta
BPS. 2005. Kumpulan Metodologi Survei Sosial Tahun 2003-2005. Jakarta :
Badan Pusat Statistik (BPS).
BPS. 2010. Metodologi Survei Sosial Ekonomi Nasional 2010 Badan Pusat
Statistik. Jakarta
Boonstra HJ, Buelens B, Leufkens K and Smeets M 2011. Small Area Estimates
of Labour Status in Dutch Municipalities. Statistics Netherlands: The
Hague/Heerlen
Chen CX, Lumley T dan Wakefield J. 2010. The use os sampling in Bayesian
Hierarchical Models for Small Area Estimation. Technical Report no 583.
Department of Statistics University of Washington, Seatle, Washington, USA
Chandra H, Chambers R, dan Salvati N. 2009. Small Area Estimation of
Proportions in Business Survey. Working Paper. Centre for Statistical and
Survey Methodology The University of Wollongong.
Clarke P, Curtis D, Misoulis N dan Cruddas M.2006. Small Area Estimation of
Unemployment for Parliamentary Constituencies. 10th Meeting of the
National Statistics Methodology Advisory Committee
Cochran WG. 1977. Sampling Technique, 3rd
Eideh A, Nathan G. 2009. Two-stage informative cluster sampling—estimation
and prediction with applications for small-area models. Journal of Statistical
Planning and Inference 139
ed, New York; Wiley
Fay R E dan Herriot RA. 1979. Estimates of income for small places1 an
application of James-Stein procedures to census data. Journal of the
American Statistical Association 74, 269- 277.
Ghosh M dan Rao JNK. 1994. Small area estimation: an appraisal. Statistical
Sciences 9, 55-93.
96
Ghosh M, Natarajan K, Stroud TWF dan Carlin BP. 1998. Generalized linear
models for small-area estimation. Journal of the American Statistical
Association 93, 273-282.
Gonzalez-Manteiga W, Lombardia MJ, Molina I, Morales D dan Santamaria
L. 2007. Estimation of the mean squared error of predictors of small area
linear parameters under a logistic mixed model. Computational Statistics and
Data Analysis, 51, 2720-2733.
Harville DA. 1990. Discussion on Robinson paper. That BLUP is a good thing: the
estimation of random effects. Statistical Science. 6, 15-51.
Henderson CR. 1975. Best linear unbiased estimation and prediction under
selection model. Biometrics 31, 423-447.
Jiang J dan Lahiri P. 2001. Empirical Best Prediction for Small area inference
with binary data, Annals of the Institute of Statistical Mathematics, 53, 217-
243
Jiang J, Lahiri P dan Wan SM. 2002. A Unified Jackknife Theory. Annals of
Statistics, 30, in press.
Kurnia A dan Notodiputro KA. 2007. Pengaruh Misspesifikasi Desain Survey
Pada Pendugaan Area Kecil Dengan Pendekatan Generalized Regression.
Seminar Nasional Matematika dan Pendidikan Matemática, 24 November
2007, Universitas Negeri Yogyakarta, Kurnia A., Notodiputro, K.A. and Ibrahim,N.A. 2007. A Nonparametric Approach
in Small Area Estimation. Proceeding at the ICCS-IX, 12 - 14 December
2007. Universiti of Malaya, Shah Alam –Malaysia
Kurnia A. 2009. Prediksi Terbaik Empirik untuk Model Transformasi Logaritma
di Dalam Pendugaan Area Kecil dengan Penerapan Pada Data Susenas.
Disertasi. Sekolah Pasca Sarjana IPB, Bogor.
Kott PS. 1990. Robust small domain estimation using random effects modeling.
Survey Methodology 15, 3-12. 1
Lehtonen R, Myrskylä M, Särndal CE dan Veijanen A. 2009. Estimation for
domains and small areas under unequal probability sampling
97
Maiti T.1998. Hierarchical Bayes estimation of mortality rates for disease
mapping. Journal Statistical Planning and Inference 69, 339-348.
Malec D, Sedransk J, Moriarity CL dan Leclere FB. 1997. Small area inference
for binary variables in the National Helath Interview Survey. Journal of the
American Statistical Association 92: 815-826.
McCulloch CE. and Searle SR. 2001. Generalized, Linear, and Mixed Models.
New York: John Wiley & Sons, Inc.
Molina I, Saei A dan Lombardia MJ. 2007. Small Area Estimates of Labour Force
Participation under a Multinomial Logit Mixed Model. Journal of the Royal
Statistical Society; Series A (Statistics in Society), 170 (4), pp.975-1000
Pfeffermann D, Krieger A M, Rinot Y. 1998. Parametric Distributions of complex
survey data under informative probability sampling. Statistica Sinica
8,1087-1114
Pfeffermann D, Sverchkov M. 2007. Small area estimation using informative
probability sampling of areas and within the selected areas. Journal of the
American Statistical Association 102: 1427–1439.
Pfeffermann D and Sverchkov M .2010. Small Area Estimation Under Informative
Sampling. S3RI Methodology Working Paper M03/22, Southampton
Science Research Institute.
Prasad NGN dan Rao JNK. 1990. The Estimation of Mean Squared Errors of
Small Area Estimators. Journal of American Statistical Association, 85,
163-171.
Rao JNK. 2003. Small Area Estimation
Robinson GK.1991. That BLUB Is a Good Thing: The Estimation of Random
Effects. Statistical Science,6, 15-31.
. New York : John Wiley and Sons.
Rumiati AT, Sutikno dan Desi S.2002. Penyusunan IPM Kabupaten Probolinggo.
Bappeda Kabupaten Probolinggo.
Rumiati AT, Sutikno dan Desi S. 2007. Penyusunan IPM Kabupaten Sumenep.
Bappeda Kabupaten Sumenep.
Rumiati AT, Sutikno dan Desi S. 2009. Penyusunan IPM Kabupaten Tuban
Bappeda Kabupaten Tuban.
98
Sadik K. 2009. Metode Prediksi Tak-bias Linier Terbaik dan Bayes Berhirarki
Untuk Pendugaan Area Kecil Berdasarkan Model State Space. Disertasi.
Sekolah pasca Sarjana IPB, Bogor.
Scealy J. 2010. Small Area Estimation Using a Multinomial Logit Mixed Model
with Category Specific Random Effects. Australian Bureau of Statistics and
Australian National University
UNDP. 1990. Concept and Measurement of Human Development. Human
Development Report
You Y dan Rao JNK. 2000. Hierarchical Bayes estimation of small area means
using multi-level models. Survey Methodology, 26 173-181.
You Y dan Rao JNK. 2002. A Pseudo-Empirical Best Linear Unbiased Prediction
Approach to Small Area Estimation Using Survey Weights, Canadian
Journal of Statistic, 30: 431-439.
Vizcaino EL, Cortina MJL dan Gonzalez D M. 2011. Multinomial-based small
area estimation of labour force indicators in Galicia. X Congreso Galego de
Estatistica e Investigacion de Operacions. Pontevedra, 3-4-5 de Novembro
de 2011.
100
Lampiran 1. Program SAS untuk pendugaan model SAE
data bobot; input blok wi; datalines; 1 5.029 ... 19 9.852 20 7.900 ; data baca; input blok gender usia logit; datalines; 5 1 1 11.513 ... 15 2 4 -1.099 ; title 'Model tanpa Bobot'; proc mixed data=baca noclprint covtest scoring; class blok; model logit=gender usia/s outpm=d ddfm=kenwardroger ddfm=residual; random intercept/sub=blok; run; title 'Model dengan Bobot'; data bbaca; merge baca bobot; by blok; gender=gender*wi; usia=usia*wi; logit=logit*wi; if logit^=. then output; keep blok gender usia logit; run; proc mixed data=bbaca noclprint covtest scoring; class blok; model logit=gender usia/s outpm=d ddfm=kenwardroger ddfm=residual; random intercept/sub=blok; run; *) Base SAS and SAS/STAT software. Two versions of the %GLIMMIX macro are available, one for use with Version 6.12 of the SAS System, one for use with Version 8 or later.
Save the %GLIMMIX macro definition. Replace the text within quotes in the following statement with the location of the %GLIMMIX macro definition file on your system. In your SAS program or in the SAS editor window, specify this statement to define the %GLIMMIX macro and make it available for use:
%inc "<location of your file containing the GLIMMIX macro>";
By default, %GLIMMIX uses restricted/residual psuedo likelihood (REPL). The default is PQL with an extra-dispersion parameter to find the parameter estimates of the generalized linear mixed model you specify. The macro calls PROC MIXED iteratively until convergence, which is decided using the relative deviation of the variance/covariance parameter estimates. An extra-dispersion scale parameter is estimated by default.
101
Lampiran 2. Program Matlab untuk perhitungan pendugaan area kecil melalui pendugaan langsung melalui sebaran prior logit normal
function [pEB,MSE]=bayeslogit(phat,n,y) %function 'bayeslogit' adalah pendugaan bayes metode pendugaan langsung dengan menggunakan %prior Normal fungsi logit. % Input yang dibutuhkan adalah 'phat', 'n', 'y' %'phat' adalah proporsi penduduk yang bisa membaca didapatkan dari sampel berupa % konstanta; %'n' adalah vektor yang berisi ukuran sampel dalam tiap kecamatan, misalkan % banyak kecamatan adalah m maka ukuran vektor 'n' adalah mx1; %'y'adalah vektor yang berisi jumlah penduduk yang bisa membaca ukuran %vektor 'y' sama dengan vektor 'n'; %Output dari function ini adalah MSE berupa vektor berukuran mx1 dan %penduga Bayes dari prior Normal fungsi logit (pEB) %menghitung banyak kecamatan m=length(n); %mencari nilai rata-rata logit (a) dan standard deviasi logit (b) [a,b]=prior(phat,n,y); %mencari vektor penduga Bayes (pEB) dan vektor g [pEB,g]=Z(phat,n,y,a,b); %menghilangkan kecamatan ke-l for l=1:m j=1; for i=1:m if i~=l nl(j,1)=n(i,1); yl(j,1)=y(i,1); j=j+1; else j=j; end end %mencari parameter prior dari hasil eliminasi [a,b]=prior(phat,nl,yl); %menghitung penduga Bayes berdasarkan parameter eliminasi [pEBl(:,l),gl(:,l)]=Z(phat,n,y,a,b); deltag(:,l)=gl(:,l)-g; deltap(:,l)=pEBl(:,l)-pEB; end %perhitungan MSE for i=1:m M1(i,1)=g(i,1)-((m-1)/m)*sum(deltag(i,:)); M2(i,1)=((m-1)/m)*sum(deltap(i,:).^2); end MSE=M1+M2;
102
end function [miu,sigma]=prior(phat,n,y) %function 'prior' digunakan untuk menduga parameter dari logit m=length(n); %mencari logit for i=1:m n1=n(i,1);y1=y(i,1); p1=y1/n1;logit(i,1)=log(p1/(1-p1)); end; miu=mean(logit);%perhitungan rata-rata logit sigma=std(logit);%perhitungan standard deviasi logit end function [pEB,g]=Z(phat,n,y,miu,sigma) %function 'Z' digunakan untuk mencari penduga Bayes menggunakan prior %Normal fungsi logit m=length(n); z=randn(500,1); %membangkitan 500 data ~N(0,1) for i=1:m n1=n(i,1);y1=y(i,1); p1=y1/n1;p(i,1)=p1; for j=1:500 par=miu+sigma*z(j,1); h1=exp(par)/(1+exp(par)); h2=par*y1-n1*log(1+exp(par)); nz=(1/(2*pi))*exp(-1/2*((z(j,1)^2))); A(j,1)=h1*exp(h2)*nz; B(j,1)=exp(h2)*nz; end EA=mean(A); EB=mean(B); pEB(i,1)=EA/EB; %menghitung penduga Bayes g(i,1)=((y1+miu)*(n1-y1+sigma))/ ((miu+n1+sigma+1)*((miu+n1+sigma)^2)); end end
103
Lampiran 3. Program Matlab untuk perhitungan pendugaan area kecil melalui pendugaan langsung melalui sebaran prior beta
function [ pEB,MSE ] = bayesbeta(phat,n,y) %function 'bayesbeta' adalah pendugaan bayes metode pendugaan langsung dengan menggunakan %prior beta. % Input yang dibutuhkan adalah 'phat', 'n', 'y' %'phat' adalah proporsi penduduk yang bisa membaca didapatkan dari sampel berupa % konstanta; %'n' adalah vektor yang berisi ukuran sampel dalam tiap kecamatan, misalkan % banyak kecamatan adalah m maka ukuran vektor 'n' adalah mx1; %'y'adalah vektor yang berisi jumlah penduduk yang bisa membaca ukuran %vektor 'y' sama dengan vektor 'n'; %Output dari function ini adalah MSE berupa vektor berukuran mx1 dan %penduga Bayes dari prior Beta (pEB) %menghitung banyak kecamatan m=length(n); %mencari nilai alpha (a) dan beta (b) [a,b]=prior(phat,n,y); %mencari penduga Bayes (pEB) dan nilai g [pEB,g]=B(phat,n,y,a,b); %menghilangkan kecamatan ke-l for l=1:m j=1; for i=1:m if i~=l nl(j,1)=n(i,1); yl(j,1)=y(i,1); j=j+1; else j=j; end end [a,b]=prior(phat,nl,yl); [pEBl(:,l),gl(:,l)]=B(phat,n,y,a,b); deltag(:,l)=gl(:,l)-g; deltap(:,l)=pEBl(:,l)-pEB; end %perhitungan MSE for i=1:m
104
M1(i,1)=g(i,1)-((m-1)/m)*sum(deltag(i,:)); M2(i,1)=((m-1)/m)*sum(deltap(i,:).^2); end MSE=M1+M2; end function [a,b]=prior(phat,n,y) %function 'prior' adalah fungsi yang bertujuan mencari nilai alpha (a) dan %beta(b) pada pendugaan bayes metode pendugaan langsung dengan menggunakan %prior beta. %menghitung jumlah sampel total nt=sum(n); %menghitung banyak kecamatan m=length(n); %menghitung nilai sp square sp2=0; for i=1:m n1=n(i,1);y1=y(i,1); p1=y1/n1;p(i,1)=p1; sp=(n1/nt)*((p1-phat)^2); sp2=sp2+sp; end; %menghitung nilai a dan b berdasarkan 2 persamaan yang telah ditentukan per6=(nt*sp2-phat*(1-phat)*(m-1))/(phat*(1-phat)*(nt-sum(n.^2)/(nt-(m-1)))); d=solve('(a/(a+b))-phat','(1/(a+b+1))-per6','a','b'); a=subs(subs(d.a,'phat',phat),'per6',per6); b=subs(subs(d.b,'phat',phat),'per6',per6); end function [pEB,g]=B(phat,n,y,a,b) %function 'B' adalah fungsi untuk menghitung penduga Bayes (pEB) dengan menggunakan %prior beta. m=length(n); for i=1:m y1=y(i,1);n1=n(i,1);p1=y1/n1;p(i,1)=p1; g(i,1)=((y1+a)*(n1-y1+b))/((a+n1+b+1)*((a+n1+b)^2)); gm(i,1)=n1/(n1+a+b); pEB(i,1)=gm(i,1)*p(i,1)+(1-gm(i,1))*phat;%menghitung penduga Bayes end; end
105
Lampiran 4. Program Matlab untuk perhitungan pendugaan area kecil melalui pendugaan tak langsung (berbasis model) melalui sebaran prior logit normal tanpa bobot
function [pEB,MSE,p]=bayesunit(N,D,k,x,y,B,sig) m=length(N); %mengubah bentuk x [a,b]=size(x); c(:,1)=ones(a,1); for i=1:b c(:,i+1)=x(:,i); end x=c; %mengubah bentuk k q=length(x); t=1; k1(1,1)=t; for h=2:q if k(h,1)==k(h-1,1) k1(h,1)=t; else t=t+1; k1(h,1)=t; end end k=k1; %mencari vektor penduga Bayes (pEB) dan vektor g [pEB,g,p]=U(N,D,k,x,y,B(:,1),sig(1,1)); %menghilangkan kecamatan ke-l for l=1:m %menghitung penduga Bayes berdasarkan parameter eliminasi [pEBl(:,l),gl(:,l)]=U(N,D,k,x,y,B(:,l+1),sig(l+1,1)); deltag(:,l)=gl(:,l)-g; deltap(:,l)=pEBl(:,l)-pEB; end %perhitungan MSE for i=1:m M1(i,1)=g(i,1)-((m-1)/m)*sum(deltag(i,:)); M2(i,1)=((m-1)/m)*sum(deltap(i,:).^2); end MSE=M1+M2; end function [pEB,g,p]=U(N,D,k,x,y,B,sig) m=length(N); z=randn(500,1); %membangkitan 500 data ~N(0,1) A1=zeros;A12=zeros;B1=zeros; for i=1:m [q,w]=size(x);j=1; xa=zeros(1,w);ya=zeros; for h=1:q if k(h,1)==i xa(j,:)=x(h,:);
106
ya(j,1)=y(h,1); j=j+1; end end n1=j-1;N1=N(i,1); f1=n1/N1;Y1=sum(ya);D1=D(i,1); [s,t]=size(xa);miu=xa*B; v=(1-(D1/(sig+D1)))*(ya-miu); sigv=std(v); xy=xa'*ya; for j=1:500 par=miu+sigv*z(j,1); h1=0;h2b=0;h12=0;h13=0; for u=1:s par1=par(u,:); h1=h1+(exp(par1)/(1+exp(par1))); h13=h13+((exp(par1)/(1+exp(par1)))*1-(exp(par1)/(1+exp(par1)))); h12=h12+((exp(par1)/(1+exp(par1)))^2); h2b=h2b+(log(1+exp(par1))); end h2=xy'*B+sigv*z(j,1)*Y1-h2b; nz=(1/sqrt(2*pi))*exp(-1/2*((z(j,1)^2))); A1(j,1)=h1*exp(h2)*nz;A13(j,1)=h13*exp(h2)*nz; A12(j,1)=h12*exp(h2)*nz; B1(j,1)=exp(h2)*nz; end EA(i,1)=mean(A1);EA1=mean(A12);EB(i,1)=mean(B1);EA2=mean(A13); pEB(i,1)=f1*(Y1/n1)+(1-f1)*(1/s)*(EA(i,1)/EB(i,1)); %menghitung penduga Bayes v(i,1)=(EA1/EB(i,1))-(EA(i,1)/EB(i,1))^2; g(i,1)=(N1^-2)*((EA2/EB(i,1))+v(i,1)); end miu1=x*B; for u=1:q miu2=miu1(u,:); h1=(exp(miu2)/(1+exp(miu2))); p(u,i)=h1; end end
107
Lampiran 5. Program Matlab untuk perhitungan pendugaan area kecil melalui pendugaan tak langsung melalui sebaran prior logit normal dengan memperhitungkan bobot peluang
function [pEB,MSE,p]=bayesunit(N,D,k,x,y,B,sig,w) m=length(N); %mengubah bentuk x [a,b]=size(x); c(:,1)=ones(a,1); for i=1:b c(:,i+1)=x(:,i); end x=c; %mengubah bentuk k q=length(x); t=1; k1(1,1)=t; for h=2:q if k(h,1)==k(h-1,1) k1(h,1)=t; else t=t+1; k1(h,1)=t; end end k=k1; %mencari vektor penduga Bayes (pEB) dan vektor g [pEB,g,p]=U(N,D,k,x,y,B(:,1),sig(1,1),w); %menghilangkan kecamatan ke-l for l=1:m %menghitung penduga Bayes berdasarkan parameter eliminasi [pEBl(:,l),gl(:,l)]=U(N,D,k,x,y,B(:,l+1),sig(l+1,1),w); deltag(:,l)=gl(:,l)-g; deltap(:,l)=pEBl(:,l)-pEB; end %perhitungan MSE for i=1:m M1(i,1)=g(i,1)-((m-1)/m)*sum(deltag(i,:)); M2(i,1)=((m-1)/m)*sum(deltap(i,:).^2); end MSE=M1+M2; end function [pEB,g,p]=U(N,D,k,x,y,B,sig,w) m=length(N); z=randn(500,1); %membangkitan 500 data ~N(0,1) A1=zeros;A12=zeros;B1=zeros; for i=1:m [q,w]=size(x);j=1; xa=zeros(1,w);ya=zeros; for h=1:q if k(h,1)==i
108
xa(j,:)=x(h,:); ya(j,1)=y(h,1); wa(j,1)=w(h,1); j=j+1; end end n1=j-1;N1=N(i,1); f1=n1/N1;Y1=sum(ya);D1=D(i,1); xa1(:,1)=xa(:,1); xa1(:,2)=xa(:,2).*wa; xa1(:,3)=xa(:,3).*wa; [s,t]=size(xa);miu=(xa1*B)./wa; v=(1-(D1/(sig+D1)))*(ya-miu); sigv=std(v); xy=xa'*ya; for j=1:500 par=miu+sigv*z(j,1); h1=0;h2b=0;h12=0;h13=0; for u=1:s par1=par(u,:); h1=h1+(exp(par1)/(1+exp(par1))); h13=h13+((exp(par1)/(1+exp(par1)))*1-(exp(par1)/(1+exp(par1)))); h12=h12+((exp(par1)/(1+exp(par1)))^2); h2b=h2b+(log(1+exp(par1))); end h2=xy'*B+sigv*z(j,1)*Y1-h2b; nz=(1/sqrt(2*pi))*exp(-1/2*((z(j,1)^2))); A1(j,1)=h1*exp(h2)*nz;A13(j,1)=h13*exp(h2)*nz; A12(j,1)=h12*exp(h2)*nz; B1(j,1)=exp(h2)*nz; end EA(i,1)=mean(A1);EA1=mean(A12);EB(i,1)=mean(B1);EA2=mean(A13); pEB(i,1)=f1*(Y1/n1)+(1-f1)*(1/s)*(EA(i,1)/EB(i,1)); %menghitung penduga Bayes v(i,1)=(EA1/EB(i,1))-(EA(i,1)/EB(i,1))^2; g(i,1)=(N1^-2)*((EA2/EB(i,1))+v(i,1)); end miu1=x*B; for u=1:q miu2=miu1(u,:); h1=(exp(miu2)/(1+exp(miu2))); p(u,i)=h1; end end
109
Lampiran 6. Jumlah penduduk usia 10 tahun keatas berdasarkan data sensus dan susenas serta jumlah blok sensus di tiap kecamatan di Kabupaten Sumenep
Kode Kecamatan Jumlah blok
sensus (populasi)
Jumlah blok sensus
percontohan (Susenas)
Sensus Susenas
10 Pragaan 14 4 51657 157 20 Bluto 20 2 38456 88 30 Saronggi 14 1 29270 41 40 Giligenteng 8 1 22340 43 50 Talango 8 3 32439 134 60 Kalianget 7 2 32884 99 70 Kota Sumenep 20 5 58880 261 71 Batuan 7 0 10154 0 80 Lenteng 20 3 48282 146 90 Ganding 14 3 31254 117 100 Guluk Guluk 12 1 44010 45 110 Pasongsongan 10 2 36302 85 120 Ambunten 15 1 31347 44 130 Rubaru 11 2 31008 92 140 Dasuk 15 1 25583 50 150 Manding 11 1 24230 42 160 Batuputih 14 2 37334 81 170 Gapura 17 2 32170 70 180 Batang 16 2 44897 88 190 Dungkek 15 2 32105 79 200 Nonggunong 8 1 11686 33 210 Gayam 10 2 28939 75 220 Ra'As 9 2 30428 71 230 Sapeken 9 2 33763 99 240 Arjasa 25 3 49728 130 241 Kangayan 8 1 17074 33 250 Masalembu 4 1 17783 52
110
Lampiran 7. Jumlah penduduk usia 10 tahun keatas berdasarkan data sensus dan susenas serta jumlah blok sensus di tiap kecamatan di Kabupaten Pasuruan
Kode Kecamatan Jumlah blok
sensus (populasi)
Jumlah blok sensus
percontohan (Susenas)
Sensus Susenas
10 Purwodadi 13 2 54636 91
20 Tutur 12 1 44136 41
30 Puspo 7 1 22478 45
40 Tosari 8 2 15607 92
50 Lumbang 12 1 27863 39
60 Pasrepan 17 2 41914 89
70 Kejayan 25 1 50967 56
80 Wonorejo 15 3 45738 143
90 Purwosari 15 3 64165 134
100 Prigen 14 2 69430 95
110 Sukorejo 19 4 67012 175
120 Pandaan 18 4 87397 180
130 Gempol 15 4 101608 191
140 Beji 14 3 64587 137
150 Bangil 15 3 65835 137
160 Rembang 17 1 48850 54
170 Kraton 25 4 66710 191
180 Pohjentrek 9 0 22888 0
190 GondangWetan 20 3 41788 145
200 Rejoso 16 1 35718 51
210 Winongan 28 1 33833 33
220 Grati 15 3 62221 132
230 Lekok 11 3 56191 155
240 Nguling 15 2 46354 77
111
Lampiran 8. Hasil Pendugaan Paramater pi (proporsi penduduk berusia 10 tahun ke atas yang bisa baca tulis) dan KTG untuk masing-masing kecamatan di Kabupaten Sumenep
No Kecamatan Pendekatan
Klasik Pendekatan Bayes
Logit Beta Model Logit
KM pEB Logit
KTG logit
pEB Beta
KTG beta
pEB Model
KTG Model
1 Pragaan 0,8521 0,8468 0,0011 0,8484 0,00086 0.911 0,0053
2 Bluto 0,9348 0,9123 0,0009 0,9228 0,00075 0.927 0,0039
3 Saronggi 0,8272 0,8234 0,0019 0,8231 0,00165 0.758 0,0109
4 Giligenteng 0,8684 0,8472 0,0036 0,8535 0,00278 0.960 0,0013
5 Talango 0,5802 0,6075 0,0035 0,5976 0,00283 0.911 0,0180
6 Kalianget 0,8615 0,8488 0,0022 0,8529 0,00175 0.945 0,0093
7 Kota Sumenep 0,8571 0,8507 0,0011 0,8529 0,00090 0.965 0,0005
8 Batuan 0,7865 0,7896 0,0020 0,7860 0,00175
9 Lenteng 0,7375 0,7489 0,0026 0,7412 0,00220 0.669 0,0109
10 Ganding 0,7556 0,7634 0,0023 0,7575 0,00189 0.851 0,0066
11 Guluk Guluk 0,6696 0,6812 0,0023 0,6767 0,00186 0.928 0,1210
12 Pasongsongan 0,6489 0,6643 0,0029 0,6589 0,00226 0.881 0,0813
13 Ambunten 0,6750 0,6916 0,0029 0,6842 0,00251 0.812 0,0460
14 Rubaru 0,7010 0,7141 0,0022 0,7068 0,00200 0.863 0,0726
15 Dasuk 0,8372 0,8274 0,0034 0,8285 0,00282 0.866 0,0754
16 Manding 0,8837 0,8691 0,0016 0,8752 0,00119 0.937 0,1241
17 Batuputih 0,3950 0,4413 0,0093 0,4184 0,00213 0.510 0,0153
18 Gapura 0,6429 0,6609 0,0032 0,6544 0,00253 0.789 0,0273
19 Batang Batang 0,6437 0,6609 0,0031 0,6548 0,00244 0.665 0,0140
20 Dungkek 0,6471 0,6644 0,0031 0,6581 0,00248 0.765 0,0172
21 Nonggunong 0,8462 0,8327 0,0037 0,8352 0,00297 0.611 0,0091
22 Gayam 0,8806 0,8637 0,0020 0,8702 0,00154 0.679 0,0131
23 Ra'As 0,8977 0,8809 0,0014 0,8883 0,00106 0.897 0,00006
24 Sapeken 0,9412 0,9194 0,0008 0,9299 0,00063 0.981 0,0001
25 Arjasa 0,9874 0,9625 0,0004 0,9778 0,00016 0.825 0,0043
26 Kangayan 0,8919 0,8622 0,0033 0,8726 0,00257 0.757 0,0063
27 Masalembu 0,8108 0,8085 0,0042 0,8055 0,00352 0.832 0,0045
112
Lampiran 9. Hasil Pendugaan Paramater pi (proporsi penduduk berusia 10 tahun ke atas yang bisa baca tulis) dan KTG untuk masing-masing kecamatan di Kabupaten Pasuruan
Kecamatan
Pendekatan Klasik
Pendekatan Bayes Beta Logit (direct) Model Logit
KM pEB Beta
KTG Brta
pEB Logit
KTG logit
pEB Model
KTG Model
10 Purwodadi 0.912 0.9116 0.0007 0.9152 0.0009 0,966 0,00109 20 Tutur 0.927 0.9214 0.0012 0.9229 0.0018 0,933 0,11890 30 Puspo 0.756 0.7990 0.0029 0.8138 0.0042 0,785 0,04028 40 Tosari 0.935 0.9306 0.0006 0.9304 0.0007 0,968 0,00052 50 Lumbang 0.923 0.9187 0.0013 0.9209 0.0020 0,958 0,13149 60 Pasrepan 0.843 0.8537 0.0012 0.8601 0.0016 0,849 0,00584 70 Kejayan 0.982 0.9645 0.0005 0.9521 0.0006 0,984 0,16321 80 Wonorejo 0.958 0.9526 0.0003 0.9485 0.0003 0,970 0,00000 90 Purwosari 0.985 0.9762 0.0002 0.9655 0.0002 0,979 0,00040 100 Prigen 0.926 0.9236 0.0006 0.9249 0.0008 0,958 0,00168 110 Sukorejo 0.931 0.9294 0.0003 0.9295 0.0004 0,978 0,00023 120 Pandaan 0.944 0.9413 0.0003 0.9399 0.0003 0,973 0,00090 130 Gempol 0.969 0.9635 0.0002 0.9580 0.0002 0,982 0,00024 140 Beji 0.942 0.9379 0.0004 0.9366 0.0004 0,980 0,00042 150 Bangil 0.971 0.9637 0.0002 0.9567 0.0003 0,980 0,00036 160 Rembang 0.815 0.8382 0.0020 0.8490 0.0028 0,857 0,07384 170 Kraton 0.880 0.8821 0.0005 0.8863 0.0006 0,928 0,00343 190 GondangWetan 0.924 0.9225 0.0004 0.9237 0.0005 0,946 0,00173 200 Rejoso 0.961 0.9474 0.0008 0.9409 0.0009 0,984 0,15661 210 Winongan 0.879 0.8894 0.0020 0.8987 0.0032 0,914 0,10660 220 Grati 0.886 0.8891 0.0007 0.8944 0.0008 0,881 0,00392
230 Lekok 0.755 0.7707 0.0011 0.7781 0.0016 0,842 0,00752 240 Nguling 0.714 0.7508 0.0023 0.7596 0.0030 0,725 0,00531
113
Lampiran 10. Hasil pendugaan proporsi pada tiap tingkat pendidikan tertinggi di Kabupaten Sumenep
Kecamatan Proporsi penduduk berusia 10 tahun keatas tiap
kategori jenjang pendidikan Rata-rata
Lama Sekolah 1 2 3 4 5 6
10 Pragaan 0,1504 0,0417 0,4259 0,2708 0,0628 0,0484 5,77
20 Bluto 0,1134 0,0603 0,3943 0,1947 0,1967 0,0405 6,40
30 Saronggi 0,2819 0,1111 0,3317 0,1420 0,1039 0,0295 4,59
40 Giligenteng 0,0869 0,0679 0,6062 0,1003 0,0846 0,0540 5,68
50 Talango 0,3472 0,0859 0,2525 0,1277 0,1141 0,0726 4,76
60 Kalianget 0,0937 0,0397 0,3430 0,1769 0,2141 0,1325 7,49
70 Kota Sumenep 0,0747 0,0382 0,2240 0,1659 0,3331 0,1640 8,57
80 Lenteng 0,3419 0,0336 0,3378 0,1144 0,1209 0,0515 4,75
90 Ganding 0,2558 0,1030 0,4063 0,0918 0,0996 0,0436 4,70
100 Guluk Guluk 0,6860 0,0906 0,0918 0,0371 0,0586 0,0358 2,10
110 Pasongsongan 0,1603 0,0341 0,5457 0,1012 0,1178 0,0408 5,49
120 Ambunten 0,1952 0,0343 0,5893 0,0993 0,0460 0,0359 4,84
130 Rubaru 0,2655 0,0625 0,5239 0,0553 0,0502 0,0425 4,36
140 Dasuk 0,2706 0,0266 0,5994 0,0477 0,0266 0,0292 4,15
150 Manding 0,1067 0,0399 0,2999 0,3403 0,1678 0,0454 6,81
160 Batuputih 0,5146 0,0467 0,3448 0,0287 0,0344 0,0308 2,87
170 Gapura 0,2785 0,0868 0,3960 0,1074 0,0724 0,0588 4,66
180 Batang Batang 0,3418 0,1032 0,3852 0,0582 0,0766 0,0349 3,95
190 Dungkek 0,3004 0,0594 0,3132 0,1575 0,1239 0,0456 4,97
200 Nonggunong 0,3791 0,0326 0,4807 0,0326 0,0425 0,0326 3,67
210 Gayam 0,3244 0,0308 0,5327 0,0350 0,0445 0,0326 3,97
220 Ra'As 0,0550 0,0364 0,3971 0,3552 0,0352 0,0301 5,72
230 Sapeken 0,0520 0,0337 0,2146 0,5168 0,1367 0,0463 7,45
240 Arjasa 0,2071 0,0257 0,1120 0,3133 0,3138 0,0280 6,98
241 Kangayan 0,2194 0,0267 0,5757 0,1091 0,0425 0,0267 4,66
250 Masalembu 0,1494 0,0814 0,5228 0,0463 0,1538 0,0463 5,51
114
Lampiran 11. Hasil pendugaan KTG untuk pendugaan proporsi penduduk pada tiap tingkat pendidikan tertinggi di Kabupaten Sumenep
Kecamatan KTG dari penduga area kecil untuk tiap kategori
1 2 3 4 5 6
10 Pragaan 6,33E-10 1,29E-10 2,92E-09 1,27E-09 1,69E-10 1,29E-10
20 Bluto 3,14E-10 1,78E-10 3,53E-09 4,07E-10 5,29E-10 1,07E-10
30 Saronggi 1,39E-09 3,97E-10 1,70E-09 4,67E-10 3,08E-10 8,75E-11
40 Giligenteng 6,32E-10 4,20E-10 5,39E-09 4,18E-10 3,18E-10 2,05E-10
50 Talango 1,77E-09 2,96E-10 1,31E-09 4,98E-10 2,19E-10 1,40E-10
60 Kalianget 4,88E-10 3,37E-10 2,99E-09 2,02E-09 2,28E-09 1,40E-09
70 Kota Sumenep 3,40E-10 2,15E-10 1,71E-09 1,35E-09 2,59E-09 1,29E-09
90 Ganding 1,96E-09 9,12E-11 2,05E-09 4,37E-10 2,78E-10 1,30E-10
100 Guluk Guluk 1,40E-09 3,06E-10 2,92E-09 3,36E-10 3,42E-10 1,53E-10
110 Pasongsongan 9,88E-09 1,50E-09 1,64E-09 2,07E-09 1,97E-09 1,22E-09
120 Ambunten 1,78E-10 8,62E-10 5,64E-09 5,47E-10 5,01E-10 1,74E-10
130 Rubaru 7,50E-10 1,94E-09 6,68E-09 1,59E-09 1,88E-09 2,40E-09
140 Dasuk 9,75E-10 7,28E-10 5,32E-09 7,67E-10 7,82E-10 6,57E-10
150 Manding 9,16E-10 1,65E-09 6,36E-09 1,55E-09 1,65E-09 1,76E-09
160 Batuputih 1,28E-09 1,73E-09 1,51E-09 2,23E-09 4,48E-10 1,20E-10
170 Gapura 3,03E-09 6,95E-11 1,55E-09 3,76E-11 4,27E-11 3,81E-11
180 Batang Batang 1,77E-09 1,77E-11 2,99E-09 3,53E-10 1,81E-10 1,49E-10
190 Dungkek 1,50E-09 2,47E-10 2,15E-09 2,29E-11 1,14E-10 5,42E-11
200 Nonggunong 1,51E-09 8,04E-11 1,62E-09 6,58E-10 4,40E-10 1,67E-10
210 Gayam 4,80E-09 5,24E-10 2,42E-08 5,87E-11 6,58E-09 5,05E-09
220 Ra'As 1,67E-09 9,88E-10 5,21E-09 9,73E-10 9,35E-10 6,90E-10
230 Sapeken 1,85E-10 7,79E-11 2,03E-09 1,87E-09 6,86E-11 5,82E-11
240 Arjasa 4,73E-10 1,97E-10 1,05E-09 5,14E-09 5,72E-10 1,86E-10
241 Kangayan 7,44E-10 4,20E-11 2,40E-10 1,20E-09 1,23E-09 1,10E-10
250 Masalembu 7,72E-10 4,04E-11 3,75E-09 2,36E-10 6,19E-11 3,90E-11
115
Lampiran 12. Hasil pendugaan proporsi penduduk pada tiap tingkat pendidikan tertinggi di Kabupaten Pasuruan
Kecamatan
Proporsi penduduk berusia 10 tahun keatas tiap kategori jenjang pendidikan
Rata-rata
Lama Sekolah 1 2 3 4 5 6
10 Purwodadi 0,0461 0,0387 0,5549 0,1466 0,0500 0,1637 5,92 20 Tutur 0,0621 0,0557 0,6654 0,1325 0,0547 0,0296 6,95 30 Puspo 0,2393 0,0969 0,5685 0,0311 0,0311 0,0330 5,53 40 Tosari 0,0525 0,0669 0,6066 0,1192 0,0391 0,1156 4,11 50 Lumbang 0,0851 0,0760 0,6528 0,0959 0,0537 0,0363 6,23 60 Pasrepan 0,1561 0,1602 0,4562 0,0775 0,0419 0,1081 5,30 70 Kejayan 0,1111 0,1167 0,6709 0,0496 0,0245 0,0271 5,25 80 Wonorejo 0,0434 0,0933 0,2721 0,1760 0,0666 0,3485 4,65 90 Purwosari 0,0413 0,0713 0,3673 0,1516 0,1290 0,2396 8,74 100 Prigen 0,0659 0,0459 0,3456 0,0737 0,1267 0,3422 8,08 110 Sukorejo 0,0342 0,0827 0,2998 0,1743 0,1905 0,2184 8,76 120 Pandaan 0,0431 0,0571 0,2177 0,1337 0,1300 0,4184 8,32 130 Gempol 0,0422 0,0487 0,2319 0,2897 0,3358 0,0516 9,77 140 Beji 0,0516 0,0359 0,3694 0,2352 0,2330 0,0749 8,02 150 Bangil 0,0245 0,0351 0,1555 0,1165 0,1429 0,5255 10,07 160 Rembang 0,1821 0,1274 0,4123 0,1470 0,1046 0,0267 10,97 170 Kraton 0,1053 0,0832 0,6053 0,1228 0,0497 0,0336 5,03 190 Gondangwetan 0,0769 0,1388 0,3590 0,1649 0,1631 0,0972 5,21 200 Rejoso 0,0320 0,0964 0,4698 0,2832 0,0891 0,0295 6,60 210 Winongan 0,1179 0,1863 0,5229 0,0773 0,0549 0,0408 6,21 220 Grati 0,1125 0,0776 0,6230 0,1001 0,0424 0,0444 4,80 230 Lekok 0,1651 0,1130 0,5396 0,1166 0,0366 0,0290 5,18 240 Nguling 0,2486 0,1554 0,4245 0,1019 0,0337 0,0358 4,68
116
Lampiran 13. Hasil pendugaan KTG untuk pendugaan proporsi penduduk pada tiap tingkat pendidikan tertinggi di Kabupaten Pasuruan
Kecamatan KTG dari penduga area kecil untuk tiap kategori jenjang
pendidikan (10-10)
1 2 3 4 5 6
10 Purwodadi 2,65E-10 2,09E-10 5,14E-09 3,38E-10 3,11E-10 1,06E-09
20 Tutur 8,84E-10 9,64E-10 8,54E-09 6,40E-10 1,01E-09 5,26E-10
30 Puspo 6,61E-10 6,01E-10 5,77E-09 8,93E-10 8,93E-10 9,39E-10
40 Tosari 4,84E-10 1,03E-09 1,20E-08 8,33E-10 2,03E-10 4,66E-10
50 Lumbang 5,56E-10 6,08E-10 8,02E-09 7,00E-10 8,47E-10 5,71E-10
60 Pasrepan 1,67E-09 1,57E-09 3,44E-09 5,34E-10 3,31E-10 8,21E-10
70 Kejayan 7,78E-10 7,98E-10 8,48E-09 1,24E-09 1,32E-09 1,55E-09
80 Wonorejo 6,22E-10 8,01E-10 3,57E-09 2,04E-09 5,85E-10 2,89E-09
90 Purwosari 2,06E-10 3,98E-10 2,87E-09 9,23E-10 3,22E-10 5,91E-10
100 Prigen 7,53E-10 6,68E-10 4,20E-09 1,16E-09 1,16E-09 3,39E-09
110 Sukorejo 1,30E-10 2,45E-10 1,29E-09 9,59E-10 1,04E-09 1,21E-09
120 Pandaan 1,93E-10 2,26E-10 9,67E-10 6,36E-10 5,88E-10 1,96E-09
130 Gempol 3,20E-11 4,69E-11 4,15E-10 8,80E-10 1,07E-09 1,69E-10
140 Beji 1,45E-10 8,17E-11 2,44E-09 9,84E-10 4,58E-10 1,42E-10
150 Bangil 2,45E-02 3,51E-02 1,55E-01 1,17E-01 1,43E-01 5,26E-01
160 Rembang 6,06E-10 1,01E-09 2,50E-09 9,06E-10 1,19E-09 2,84E-10
170 Kraton 2,13E-10 1,16E-10 3,96E-09 3,06E-10 8,44E-11 5,94E-11
190 Gondangwetan 2,59E-10 7,67E-10 1,87E-09 5,59E-10 8,26E-10 5,52E-10
200 Rejoso 1,81E-09 1,40E-09 3,98E-09 9,85E-10 1,46E-09 4,74E-10
210 Winongan 3,64E-10 1,03E-10 5,13E-09 8,47E-10 9,76E-10 7,29E-10
220 Grati 5,43E-10 2,68E-10 5,64E-09 1,50E-10 6,85E-11 1,18E-10
230 Lekok 3,69E-10 2,30E-10 3,50E-09 2,29E-10 5,19E-11 4,08E-11
240 Nguling 8,37E-10 7,11E-10 3,01E-09 4,15E-10 1,12E-10 1,18E-10
117
Lampiran 14. Hasil pendugaan angka melek huruf di tiap kecamatan berdasarkan model campuran logit normal terbobot dan model campuran logit normal terbbot di Kabupaten Sumenep
Kecamatan p-Populasi pEB Bias
Pragaan 0.8458 0.922 0,0762 Bluto 0.8542 0.903 0,0488 Saronggi 0.8104 0.758 -0,0524 Giligenteng 0.7700 0.960 0,19 Talango 0.6610 0.849 0,188 Kalianget 0.8358 0.943 0,1072 Kota Sumenep 0.9404 0.962 0,0216 Guluk Guluk 0.7524 0.663 -0,0894 Pasongsongan 0.8522 0.750 -0,1022 Ambunten 0.8621 0.928 0,0659 Rubaru 0.7093 0.810 0,1007 Dasuk 0.6478 0.811 0,1632 Manding 0.7136 0.938 0,2244 Batuputih 0.7710 0.866 0,095 Gapura 0.7506 0.937 0,1864 Batang Batang 0.5866 0.478 -0,1086 Dungkek 0.6568 0.728 0,0712 Nonggunong 0.5769 0.649 0,0721 Gayam 0.5299 0.790 0,2601 Ra'As 0.7459 0.611 -0,1349 Sapeken 0.7104 0.692 -0,0184 Arjasa 0.8655 0.815 -0,0505 Kangayan 0.8834 0.974 0,0906 Masalembu 0.9212 0.825 -0,0962 Pragaan 0.9243 0.757 -0,1673 Bluto 0.7706 0.832 0,0614
MSE 0.01498
118
Lampiran 15. Hasil pendugaan angka melek huruf di tiap kecamatan berdasarkan model campuran logit normal terbobot di Kabupaten Pasuruan
Kecamatan Populasi pEB Bias
Purwodadi 0,9212 0,96 0,0388 Tutur 0,9243 0,933 0,0087 Puspo 0,7706 0,785 0,0144 Tosari 0,831 0,968 0,137 Lumbang 0,78 0,958 0,178 Pasrepan 0,8038 0,811 0,0072 Kejayan 0,8706 0,984 0,1134 Wonorejo 0,8622 0,87 0,0078 Purwosari 0,9329 0,971 0,0381 Prigen 0,9248 0,902 -0,0228 Sukorejo 0,9104 0,987 0,0766 Pandaan 0,9618 0,936 -0,0258 Gempol 0,9513 0,94 -0,0113 Beji 0,9684 0,436 -0,5324 Bangil 0,9804 0,959 -0,0214 Rembang 0,8634 0,857 -0,0064 Kraton 0,8937 0,975 0,0813 Gondangwetan 0,9345 0,87 -0,0645 Rejoso 0,959 0,984 0,025 Winongan 0,8877 0,914 0,0263 Grati 0,9124 0,87 -0,0424 Lekok 0,803 0,768 -0,035 Nguling 0,8834 0,579 -0,3044
MSE 0.02020
119
Lampiran 16. Hasil pendugaan proporsi penduduk di tiap jenjang pendidikan berdasarkan model campuran logit multinomial terbobot di Kabupaten Sumenep
Kecamatan Proporsi Rata-
rata 1 2 3 4 5 6 Pragaan 0.1039 0.0462 0.4106 0.2741 0.1217 0.0435 6.309 Bluto 0.0936 0.0657 0.2666 0.1676 0.0966 0.3099 8.362 Saronggi 0.1124 0.2176 0.3504 0.1629 0.1124 0.0442 5.368 Giligenteng 0.0869 0.0679 0.6062 0.1003 0.0846 0.0540 5.683 Talango 0.6046 0.0886 0.2169 0.0890 0.0658 0.1353 4.660 Kalianget 0.1634 0.0503 0.4462 0.1651 0.2399 0.0648 7.231 Kota Sumenep 0.0410 0.0261 0.6453 0.0566 0.0414 0.1895 6.936 Batuan Lenteng 0.2367 0.0243 0.2297 0.0952 0.0808 0.3333 7.681 Ganding 0.0664 0.0664 0.5168 0.0927 0.0664 0.2018 7.114 Guluk Guluk 0.1650 0.1244 0.2733 0.1347 0.1989 0.1037 6.385 Pasongsongan 0.0558 0.0460 0.5792 0.0893 0.0561 0.1737 6.837 Ambunten 0.1955 0.0343 0.5889 0.0994 0.0460 0.0360 4.835 Rubaru 0.1593 0.0506 0.3617 0.0606 0.0665 0.3013 7.495 Dasuk 0.2707 0.0266 0.5994 0.0477 0.0266 0.0292 4.146 Manding 0.1067 0.0399 0.2999 0.3403 0.1678 0.0454 6.806 Batuputih 0.4107 0.0345 0.2533 0.0222 0.0246 0.2547 5.477 Gapura 0.2838 0.0624 0.3424 0.0775 0.0487 0.1851 5.677 Batang 0.2390 0.0686 0.2736 0.0301 0.0567 0.3320 7.184 Dungkek 0.0648 0.0655 0.5039 0.0903 0.0648 0.2106 7.140 Nonggunong 0.3490 0.0374 0.5039 0.0427 0.0471 0.0373 3.995 Gayam 0.1897 0.0172 0.3559 0.0228 0.0360 0.3785 7.880 Ra'As 0.0629 0.0483 0.3562 0.2218 0.0346 0.1852 6.719 Sapeken 0.0502 0.0375 0.1905 0.4548 0.1681 0.0989 7.949 Arjasa 0.2071 0.0257 0.1120 0.3134 0.3137 0.0280 6.976 Kangayan 0.2193 0.0267 0.5756 0.1091 0.0425 0.0267 4.659 Masalembu 0.1494 0.0814 0.5229 0.0463 0.1537 0.0463 5.510
120
Lampiran 17. Penduga KTG untuk penduga proporsi penduduk di tiap jenjang pendidikan berdasarkan model campuran logit multinomial terbobot di Kabupaten Sumenep
Kecamatan MSE
1 2 3 4 5 6 Pragaan 3.18E-07 8.31E-09 5.19E-08 2.66E-08 2.94E-09 1.14E-09 Bluto 3.13E-09 5.47E-09 5.52E-09 3.55E-09 1.89E-09 4.32E-09 Saronggi 1.29E-06 4.85E-06 1.24E-05 2.70E-06 1.29E-06 5.08E-07 Giligenteng 8.16E-07 5.02E-07 3.69E-05 1.04E-06 7.41E-07 4.73E-07 Talango 3.51E-07 4.51E-08 1.08E-07 4.31E-08 2.94E-08 6.82E-08 Kalianget 2.82E-06 1.02E-06 1.53E-05 1.00E-05 7.46E-06 1.95E-06 Kota Sumenep 6.61E-09 1.32E-10 1.06E-08 5.58E-10 3.87E-10 1.42E-09 Batuan Lenteng 5.46E-09 1.40E-09 1.81E-09 2.64E-10 7.07E-10 2.71E-09 Ganding 1.21E-05 2.04E-07 2.09E-05 3.68E-07 2.37E-07 3.02E-07 Guluk Guluk 2.89E-06 1.66E-06 7.73E-06 1.99E-06 4.14E-06 2.16E-06 Pasongsongan 6.62E-09 4.63E-10 8.86E-09 9.41E-10 5.32E-10 1.58E-09 Ambunten 4.45E-08 1.89E-09 3.66E-07 1.18E-08 3.09E-09 2.98E-09 Rubaru 4.90E-09 5.23E-10 3.87E-09 6.47E-10 6.34E-10 2.62E-09 Dasuk 1.41E-09 7.46E-11 4.39E-09 1.32E-10 7.46E-11 7.89E-11 Manding 3.62E-10 1.31E-10 1.81E-09 2.19E-09 8.01E-10 2.16E-10 Batuputih 5.94E-09 4.33E-10 1.79E-09 2.81E-10 2.44E-10 2.46E-09 Gapura 1.35E-06 2.04E-07 3.91E-07 8.86E-08 4.29E-08 1.38E-07 Batang 1.59E-09 7.53E-10 1.07E-09 2.13E-10 6.93E-10 3.76E-09 Dungkek 2.32E-09 1.04E-09 3.86E-09 1.82E-09 1.41E-09 8.98E-09 Nonggunong 4.03E-09 2.46E-10 4.79E-09 2.46E-10 3.15E-10 2.42E-10 Gayam 4.21E-09 1.52E-10 5.80E-09 2.25E-10 4.06E-10 4.14E-09 Ra'As 0.00E+00 8.37E-05 0.00E+00 0.00E+00 0.00E+00 0.00E+00 Sapeken 8.50E-10 4.79E-10 1.64E-09 5.65E-09 1.03E-09 5.85E-10 Arjasa 7.43E-10 4.19E-11 2.40E-10 1.20E-09 1.23E-09 1.10E-10 Kangayan 7.72E-10 4.04E-11 3.75E-09 2.36E-10 6.19E-11 3.90E-11 Masalembu 5.99E-10 3.01E-10 4.10E-09 1.56E-10 6.26E-10 1.85E-10
121
Lampiran 18. Hasil pendugaan proporsi penduduk di tiap jenjang pendidikan berdasarkan model campuran logit multinomial terbobot di Kabupaten Pasuruan
Kecamatan Proporsi
1 2 3 4 5 6 Purwodadi 0,0512 0,0450 0,6220 0,0935 0,1099 0,0783 6,293
Tutur 0,0621 0,0557 0,6654 0,1325 0,0547 0,0296 5,530
Puspo 0,2396 0,0968 0,5684 0,0311 0,0311 0,0330 4,106
Tosari 0,2068 0,1125 0,3179 0,2758 0,0700 0,0573 5,622
Lumbang 0,0852 0,0760 0,6528 0,0959 0,0537 0,0363 5,301
Pasrepan 0,0774 0,3935 0,3765 0,0542 0,0261 0,0734 4,455
Kejayan 0,1112 0,1167 0,6708 0,0496 0,0245 0,0271 4,647
Wonorejo 0,1020 0,0563 0,3593 0,0829 0,0159 0,3836 8,309
Purwosari 0,0451 0,0767 0,5024 0,2352 0,1827 0,0482 7,256
Prigen 0,1302 0,0761 0,5135 0,1207 0,2581 0,1205 8,272
Sukorejo 0,0285 0,0511 0,2106 0,2989 0,2973 0,1135 8,463
Pandaan 0,0385 0,0535 0,2828 0,2507 0,2991 0,0807 7,986
Gempol 0,0259 0,0368 0,1704 0,2306 0,3495 0,1868 9,323
Beji 0,0618 0,0360 0,4025 0,2685 0,1017 0,1294 6,607
Bangil 0,0299 0,0693 0,6312 0,0833 0,0586 0,1277 6,458
Rembang 0,1821 0,1274 0,4123 0,1470 0,1045 0,0267 5,029
Kraton 0,0646 0,0706 0,5000 0,2204 0,0957 0,0488 6,164
GondangWetan 0,1276 0,1920 0,2978 0,1035 0,1049 0,1741 6,380
Rejoso 0,0321 0,0964 0,4698 0,2832 0,0891 0,0295 6,215
Winongan 0,0012 0,0158 0,1289 0,8002 0,0503 0,0038 7,685
Grati 0,1254 0,1450 0,6303 0,0289 0,0261 0,0442 4,602
Lekok 0,1207 0,0936 0,5520 0,1495 0,0406 0,0567 5,412
Nguling 0,1314 0,1053 0,4887 0,0925 0,0205 0,1623 5,973
122
Lampiran 19. Penduga KTG untuk penduga proporsi penduduk di tiap jenjang pendidikan berdasarkan model campuran logit multinomial terbobot di Kabupaten Pasuruan
Kecamatan KTG
1 2 3 4 5 6 Purwodadi 4,22E-04 4,22E-04 5,26E-06 1,26E-07 2,75E-05 1,97E-05 Tutur 8,84E-10 9,64E-10 8,54E-09 6,40E-10 1,01E-09 5,26E-10 Puspo 6,63E-10 6,02E-10 5,77E-09 8,93E-10 8,93E-10 9,39E-10 Tosari 6,42E-04 4,71E-05 6,07E-06 3,01E-06 9,40E-06 1,18E-05 Lumbang 5,56E-10 6,08E-10 8,02E-09 7,00E-10 8,47E-10 5,71E-10 Pasrepan 1,37E-03 2,25E-03 1,03E-06 1,15E-06 2,14E-06 6,44E-06 Kejayan 7,77E-10 7,99E-10 8,48E-09 1,24E-09 1,32E-09 1,55E-09 Wonorejo 2,27E-05 5,90E-06 3,75E-05 5,41E-06 9,67E-07 1,53E-05 Purwosari 1,50E-09 2,73E-09 2,54E-08 9,02E-09 1,59E-08 4,26E-09 Prigen 4,28E-06 1,21E-05 1,80E-04 1,15E-05 8,03E-03 3,61E-03 Sukorejo 1,59E-09 2,35E-09 2,00E-08 2,70E-08 3,01E-08 5,25E-09 Pandaan 9,16E-09 2,62E-08 5,84E-08 3,68E-08 6,00E-08 2,51E-08 Gempol 2,66E-09 1,82E-09 2,50E-08 3,64E-08 6,45E-08 3,36E-08 Beji 3,63E-10 1,90E-10 4,03E-09 2,55E-09 7,28E-10 8,85E-10 Bangil 2,26E-07 3,22E-08 7,37E-08 1,45E-07 1,95E-08 5,00E-08 Rembang 6,06E-10 1,01E-09 2,50E-09 9,06E-10 1,19E-09 2,85E-10 Kraton 3,73E-09 3,07E-10 4,94E-09 1,28E-09 2,66E-11 1,31E-11 GondangWetan 8,87E-10 3,09E-09 4,92E-09 1,69E-09 7,23E-10 1,23E-09 Rejoso 1,81E-09 1,40E-09 3,98E-09 9,85E-10 1,46E-09 4,74E-10 Winongan 1,21E-09 1,20E-09 8,52E-10 1,12E-08 1,15E-09 9,27E-11 Grati 2,44E-09 1,86E-09 5,90E-09 5,59E-10 8,39E-10 2,22E-09 Lekok 6,41E-08 5,40E-08 6,12E-07 1,14E-07 2,48E-08 5,10E-08 Nguling 2,46E-05 1,77E-06 1,10E-05 1,32E-06 2,63E-06 2,26E-05
123
Lampiran 20. Prediksi Indeks Pendidikan di Kabupaten Sumenep menggunakan model SAE
Kode Kecamatan Indeks Melek Huruf
Indeks Rata-rata Lama Sekolah
Indeks Pendidikan
Rata-rata Lama
Sekolah 10 Pragaan 92.2 42.058 75.486 6.31 20 Bluto 90.3 55.743 78.781 8.36 30 Saronggi 75.8 35.789 62.463 5.37 40 Giligenteng 96 37.888 76.629 5.68 50 Talango 84.9 31.064 66.955 4.66 60 Kalianget 94.3 48.204 78.935 7.23 70 Kota Sumenep 96.2 46.237 79.546 6.94 80 Lenteng 66.3 51.203 61.268 7.68 90 Ganding 75 47.428 65.809 7.11 100 Guluk Guluk 92.8 42.564 76.055 6.38 110 Pasongsongan 81 45.583 69.194 6.84 120 Ambunten 81.1 32.235 64.812 4.84 130 Rubaru 93.8 49.965 79.188 7.49 140 Dasuk 86.6 27.643 66.948 4.15 150 Manding 93.7 45.373 77.591 6.81 160 Batuputih 47.8 36.514 44.038 5.48 170 Gapura 72.8 37.848 61.149 5.68 180 Batang 64.9 47.891 59.230 7.18 190 Dungkek 79 47.598 68.533 7.14 200 Nonggunong 61.1 26.632 49.611 3.99 210 Gayam 69.2 52.533 63.644 7.88 220 Ra'As 81.5 44.794 69.265 6.72 230 Sapeken 97.4 52.995 82.598 7.95 240 Arjasa 82.5 46.505 70.502 6.98 241 Kangayan 75.7 31.061 60.820 4.66 250 Masalembu 83.2 36.733 67.711 5.51
124
Lampiran 21. Prediksi Indeks Pendidikan di Kabupaten Pasuruan menggunakan model SAE
Kode Kecamatan Indeks Melek Huruf
Indeks Rata-rata Lama Sekolah
Indeks Pendidikan
Rata-rata Lama
Sekolah 10 Purwodadi 96 41.953 77.984 6.29 20 Tutur 93.3 36.864 74.488 5.53 30 Puspo 78.5 27.371 61.457 4.11 40 Tosari 96.8 37.483 77.028 5.62 50 Lumbang 95.8 35.343 75.648 5.30 60 Pasrepan 81.1 29.697 63.966 4.45 70 Kejayan 98.4 30.982 75.927 4.65 80 Wonorejo 87 55.396 76.465 8.31 90 Purwosari 97.1 48.375 80.858 7.26 100 Prigen 90.2 55.145 78.515 8.27 110 Sukorejo 98.7 56.418 84.606 8.46 120 Pandaan 93.6 53.240 80.147 7.99 130 Gempol 94 62.152 83.384 9.32 140 Beji 43.6 44.049 43.750 6.61 150 Bangil 95.9 43.053 78.284 6.46 160 Rembang 85.7 33.524 68.308 5.03 170 Kraton 97.5 41.094 78.698 6.16 180 Pohjentrek 87 42.534 72.178 6.35 190 GondangWetan 98.4 41.431 79.410 6.38 200 Rejoso 91.4 51.230 78.010 6.21 210 Winongan 87 30.677 68.226 7.68 220 Grati 76.8 36.079 63.226 4.60 230 Lekok 57.9 39.819 51.873 5.41 240 Nguling 96 41.953 77.984 5.97
125
Lampiran 22. Hubungan antara Proprosi Penduduk untuk tiap jenjang pendidikan dengan Usia dan jenis kelamin di kabupaten Sumenep
0,02
0,09
0,23
0,310,35
0,03
0,09
0,27 0,26
0,36
0,00
0,05
0,10
0,15
0,20
0,25
0,30
0,35
0,40
0,45
0,50
10-30 tahun
31-40 tahun
41-50 tahun
51-60 tahun
> 60 tahun
0 tahun (tidak sekolah)
laki-lakiperempuan
0,34
0,25 0,24
0,11
0,06
0,40
0,30
0,19
0,08
0,030,00
0,10
0,20
0,30
0,40
0,50
10-30 tahun
31-40 tahun
41-50 tahun
51-60 tahun
> 60 tahun
Lulus SD
laki-lakiperempuanusia
0,41
0,11
0,20 0,20
0,09
0,00
0,10
0,20
0,30
0,40
0,50
10-30 tahun
31-40 tahun
41-50 tahun
51-60 tahun
> 60 tahun
Putus SD (3 tahun)
laki-laki
perempuanUsia
0,57
0,22
0,130,08
0,02
0,66
0,22
0,080,04 0,01
-0,10
0,00
0,10
0,20
0,30
0,40
0,50
0,60
0,70
10-30 tahun
31-40 tahun
41-50 tahun
51-60 tahun
> 60 tahun
Lulus SMP
laki-lakiperempuan
Usia
0,60
0,21
0,10 0,070,02
0,59
0,25
0,110,05 0,01
-0,10
0,00
0,10
0,20
0,30
0,40
0,50
0,60
0,70
10-30 tahun
31-40 tahun
41-50 tahun
51-60 tahun
> 60 tahun
SMA
laki-laki
perempuan
Usia
0,42
0,30
0,140,08 0,06
0,69
0,13 0,16
0,03 0
-0,10
0,00
0,10
0,20
0,30
0,40
0,50
0,60
0,70
10-30 tahun
31-40 tahun
41-50 tahun
51-60 tahun
> 60 tahun
PT
laki-lakiperempuanUsia
Usia
126
Lampiran 23. Hubungan antara Proprosi Penduduk untuk tiap jenjang pendidikan dengan Usia dan jenis kelamin di kabupaten Pasuruan.
0,00
0,05
0,10
0,15
0,20
0,25
0,30
0,35
0,40
0,45
0,50
10-30 tahun
31-40 tahun
41-50 tahun
51-60 tahun
> 60 tahun
0 tahun (tidak sekolah)
laki-lakiperempuan
0,37
0,11
0,20 0,21
0,12
0,22
0,16
0,260,23
0,12
0,00
0,10
0,20
0,30
0,40
0,50
10-30 tahun
31-40 tahun
41-50 tahun
51-60 tahun
> 60 tahun
Putus SD
laki-lakiperempuan
0,36
0,25
0,20
0,13
0,06
0,45
0,27
0,14
0,10
0,040,00
0,10
0,20
0,30
0,40
0,50
10-30 tahun
31-40 tahun
41-50 tahun
51-60 tahun
> 60 tahun
Lulus SD
laki-laki
perempuanUsia
0,52
0,27
0,100,07
0,03
0,66
0,18
0,100,06
0,01
-0,10
0,00
0,10
0,20
0,30
0,40
0,50
0,60
0,70
10-30 tahun
31-40 tahun
41-50 tahun
51-60 tahun
> 60 tahun
SMP
laki-laki
0,62
0,21
0,120,04 0,01
0,65
0,28
0,04 0,02 0,01-0,10
0,00
0,10
0,20
0,30
0,40
0,50
0,60
0,70
10-30 tahun
31-40 tahun
41-50 tahun
51-60 tahun
> 60 tahun
Lulus SMA
laki-lakiperempu…
Usia
0,37 0,37
0,24
0,03 0
0,60
0,200,17
0,03 0
-0,10
0,00
0,10
0,20
0,30
0,40
0,50
0,60
0,70
10-30 tahun
31-40 tahun
41-50 tahun
51-60 tahun
> 60 tahun
PT
laki-laki
perempuanUsia
Usia Usia
Usia
99
Daftar Istilah dan Singkatan
NO Bahasa Indonesia Bahasa Inggris
1 Angka melek huruf Literacy rate
2 Akar dari Rata-rata Kuadrat Bias Relatif
(ARKBR)
Relative root mean square error
(RRMSE)
3 Bayes empirik (BE ) Empirical Bayes (EB
4 Bayes berhirarki (BH) Hierarchical Bayes (HB).
5 Bias relatif Relative bias RB)
6 Fraksi Percontohan Sampling fraction
7 Indeks Pembangunan Manusia (IPM) Human Developmen Index (HDI)
8 Kemungkinan Maksimum (KM) Maximum likelihood (ML)
9 Kemungkinan Maksimum Berkendala (KMB) Restricted maximum likelihood ( REML)
10 Kuadrat Tengah Galat (KTG) Mean square error (MSE)
11 Pendugaan Area Kecil Small area estimation (SAE).
12 Peubah penyerta Auxiliary variable
13 Prediksi tak-bias linier terbaik (PTLT ) Best linear unbiased predictor: (BLUP)
14 Prediksi tak-bias linier terbaik empirik
(PTLTE).
Empirical best linear unbiased predictor
(EBLUP)
15 Prediksi tak-bias linier terbaik semu Pseudo EBLUP
16 Kelompok yang saling terpisah Mutually exclucive and exhoustive
17 Model Campuran Logit Multinomial Multinomial logit mixed model.
18 Model Campuran Linier Terampat/MCLT Generalized linear mixed model
(GLMM)
19 Kemungkinan Maksimum Semu (KMS) Pseudo maximum likelihood (PML).
20 Kemungkinan Quasi Berpenalti (KQB) Penalized Quasi-likelihood (PQL)
21 Pengambilan contoh acak sederhana Simple random sampling (SRS)
22 Pengambilan contoh berstrata Stratified sampling
23 Pengambilan contoh bergerombol Cluster sampling
24 Pengambilan contoh sistematik Systematic sampling.
25 Rata-rata lama sekolah (RLS) Mean year of schooling (MYS)