pemodelan pengeluaran per kapita per kabupaten/kota di ... · per kabupaten/kota di kalimantan...

14
IndoMS Journal on Statistics Vol. xx, No. xx (2012), Hlm. xx—xx. 1 PEMODELAN PENGELUARAN PER KAPITA PER KABUPATEN/KOTA DI KALIMANTAN BARAT MENGGUNAKAN METODE HIRARKI BAYESIAN Retno Pertiwi 1 , Nur Iriawan 2 1 Program Pasca Sarjana, Institut Teknologi Sepuluh November, Surabaya 2 Institut Teknologi Sepuluh November, Surabaya Kampus ITS Sukolilo, Surabaya, 60111 E-mail: 1 [email protected] , 2 [email protected] Abstract Per capita expenditure approach is one of the human welfare measure. Infrastructure capital is one of the factors that impact the welfare. The aim of this research is to get the most accurate model that depict the relation between infrastructure investment and per capita expenditure. This research using two level hierarchical Bayesian as the method. At first level we found that the distribution of Lognormal 2 parameters, Lognormal 3 parameters, and Weibull 3 parameters are the fit distribution for the data. The result of deviance and SPD shows that 3 parameters Lognormal is the most accurate model. The result of the model shows that each of regencies has different relation between infrastructure and the threshold of per capita expenditure. It indicates the government policies in infrastructure gave the different impact for each regencies. Keywords : hierarchical Bayesian, regional development, per capita expenditure Abstrak Pendekatan pengeluaran per kapita merupakan salah satu ukuran dalam melihat tingkat kesejahteraan hidup. Salah satu faktor yang mempengaruhi tingkat kesejahteraan adalah kondisi infrastruktur. Tujuan penelitian adalah mendapatkan model yang tepat dalam menggambarkan hubungan infrastruktur dengan pengeluaran per kapita. Metode yang digunakan adalah hirarki Bayesian dua level. Tahap pertama, diketahui distribusi yang sesuai dengan pola persebaran pengeluaran per kapita adalah distribusi Lognormal 2 parameter, Lognormal 3 parameter, dan Weibull 3 parameter. Hasil dari nilai SPD dan devians didapatkan Lognormal 3 parameter sebagai model yang paling tepat. Parameter threshold menjadi parameter yang dimodelkan pada tahap dua yang menunjukkan pergeseran pengeluaran per kapita. Hasil dari pemodelan didapatkan bahwa hubungan variabel infrastruktur dan threshold pengeluaran per kapita antara kabupaten satu dengan yang lain berbeda-beda. Hal ini mengindikasikan pengaruh kebijakan antar kabupaten memberikan dampak yang berbeda terhadap pengeluaran per kapita daerah tersebut. Kata kunci : hirarki Bayesian, pembangunan daerah, pengeluaran per kapita

Upload: dotram

Post on 02-Mar-2019

214 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: PEMODELAN PENGELUARAN PER KAPITA PER KABUPATEN/KOTA DI ... · PER KABUPATEN/KOTA DI KALIMANTAN BARAT MENGGUNAKAN METODE HIRARKI BAYESIAN ... Teorema 2 Misalnya, terdapat data Y yang

IndoMS Journal on Statistics Vol. xx, No. xx (2012), Hlm. xx—xx.

1

PEMODELAN PENGELUARAN PER KAPITA PER KABUPATEN/KOTA DI KALIMANTAN BARAT

MENGGUNAKAN METODE HIRARKI BAYESIAN

Retno Pertiwi1, Nur Iriawan2 1Program Pasca Sarjana, Institut Teknologi Sepuluh November, Surabaya

2Institut Teknologi Sepuluh November, Surabaya

Kampus ITS Sukolilo, Surabaya, 60111 E-mail: [email protected], [email protected]

Abstract

Per capita expenditure approach is one of the human welfare measure. Infrastructure capital is one of the factors that impact the welfare. The aim of this research is to get the most accurate model that depict the relation between infrastructure investment and per capita expenditure. This research using two level hierarchical Bayesian as the method. At first level we found that the distribution of Lognormal 2 parameters, Lognormal 3 parameters, and Weibull 3 parameters are the fit distribution for the data. The result of deviance and SPD shows that 3 parameters Lognormal is the most accurate model. The result of the model shows that each of regencies has different relation between infrastructure and the threshold of per capita expenditure. It indicates the government policies in infrastructure gave the different impact for each regencies.

Keywords : hierarchical Bayesian, regional development, per capita expenditure

Abstrak

Pendekatan pengeluaran per kapita merupakan salah satu ukuran dalam melihat tingkat kesejahteraan hidup. Salah satu faktor yang mempengaruhi tingkat kesejahteraan adalah kondisi infrastruktur. Tujuan penelitian adalah mendapatkan model yang tepat dalam menggambarkan hubungan infrastruktur dengan pengeluaran per kapita. Metode yang digunakan adalah hirarki Bayesian dua level. Tahap pertama, diketahui distribusi yang sesuai dengan pola persebaran pengeluaran per kapita adalah distribusi Lognormal 2 parameter, Lognormal 3 parameter, dan Weibull 3 parameter. Hasil dari nilai SPD dan devians didapatkan Lognormal 3 parameter sebagai model yang paling tepat. Parameter threshold menjadi parameter yang dimodelkan pada tahap dua yang menunjukkan pergeseran pengeluaran per kapita. Hasil dari pemodelan didapatkan bahwa hubungan variabel infrastruktur dan threshold pengeluaran per kapita antara kabupaten satu dengan yang lain berbeda-beda. Hal ini mengindikasikan pengaruh kebijakan antar kabupaten memberikan dampak yang berbeda terhadap pengeluaran per kapita daerah tersebut. Kata kunci : hirarki Bayesian, pembangunan daerah, pengeluaran per kapita

Page 2: PEMODELAN PENGELUARAN PER KAPITA PER KABUPATEN/KOTA DI ... · PER KABUPATEN/KOTA DI KALIMANTAN BARAT MENGGUNAKAN METODE HIRARKI BAYESIAN ... Teorema 2 Misalnya, terdapat data Y yang

1. Pendahuluan Latar Belakang

Sejak tahun 1999, Negara Republik Indonesia mulai menerapkan otonomi daerah sebagai kebijakan baru yang memuat pembagian wewenang antara pusat dan daerah. Pengaruh dari kebijakan tersebut, pemerintah daerah memiliki wewenang yang lebih dalam meningkatkan kesejahteraan masyarakat di daerahnya. Perencanaan dan strategi yang tepat terhadap pembangunan ekonomi daerah sangat menentukan kualitas dari daerah tersebut. Salah satu produk dari kebijakan daerah adalah pembangunan infrastruktur. Infrastruktur fisik merupakan komponenn dasar perekonomian dan aspek utama dalam pemerataan pembangunan dan kesejahteraan (otonomi daerah) di dalam kondisi nasional yang beragam. Beberapa penelitian yang melihat hubungan antara modal infrastruktur dengan pertumbuhan ekonommi antara lain dilakukan oleh Agarwalla [1], Duffy-Deno dan Eberts [2], Shah [3], dan Tewari [4]. Berdasarkan latar belakang tersebut, penelitian ini akan melihat keterkaitan kebijakan yang dibuat oleh pemerintah daerah dengan pengeluara per kapita sebagai salah satu ukuran tingkat kesejahteraan. Adapun permasalahan pada penelitian ini hanya akan dibatasi pada bidang infrastruktur dasar pembangunan daerah. Pengeluaran per kapita di Provinsi Kalimantan Barat pada tahun 2009 akan menjadi studi kasus dalam penelitian. Data observasi memiliki struktur yang berhirarki, yaitu unit rumah tangga per kecamatan, dan unit kecamatan per kabupaten. Permasalahan yang akan diangkat juga berhirarki, yaitu ingin melihat karakteristik pengeluaran di level kecamatan, dan memodelkan variabel pendukung kebijakan daerah di level kabupaten/kota. Berangkat dari dua hal tersebut, maka penyelesaian dalam observasi ini pun akan berhirarki. Beberapa penelitian yang menggunakan konsep hirarki dalam penelitiannya diantaranya dilakukan oleh Ha dkk [5] yang mengimplementasikan metode multilevel mixed linear, Zimmer dkk [6] dengan model hirarki liniernya, dan Anderson dan Wells [7] dengan menggunakan pendekatan Bayesian hirarki regresi. Pada penelitian ini jumlah unit pengamatan tidak setimbang dan bervariasi baik pada level 1 maupun level 2, sehingga pemodelan dengan menggunakan hirarki Bayesian diharapkan mampu mengatasi permasalahan tersebut. Tujuan dari penelitian ini diantaranya ingin mendapatkan gambaran karakteristik dari distribusi pengeluaran per kapita per kecamatan secara keseluruhan di Provinsi Kalimantan Barat khususnya. Selain itu, dari beberapa distribusi yang akan dimodelkan, diharapkan akan mendapat model yang paling akurat dalam menggambarkan hubungan pengeluaran per kapita dengan variabel infrastruktur. Membangun distribusi yang dibutuhkan dalam model yang tidak tersedia dalam program WinBUGS 1.4.3 juga menjadi tujuan lain dari penelitian. Pembangunan Ekonomi Daerah

Alexander [8] mengatakan bahwa teori pembangunan ekonomi daerah merupakan sebuah teori ekonomi dasar yang mengasumsikan bahwa ekonomi pada daerah lokal dibagi ke dalam dua komponen, yaitu : (1) komponen dasar, yaitu produksi barang dan jasa diperuntukkan bagi konsumsi luar (ekspor); (2) komponen non-dasar, yaitu menyediakan barang dan jasa untuk kebutuhan konsumsi lokal. Menurut Stimson dkk [9], pembangunan ekonomi terdiri dari dua dimensi, yaitu dimensi proses dan produk. Produk dari pembangunan ekonomi diantaranya adalah ketenagakerjaan, kekayaan/kesejahteraan, investasi, infrastruktur,

Page 3: PEMODELAN PENGELUARAN PER KAPITA PER KABUPATEN/KOTA DI ... · PER KABUPATEN/KOTA DI KALIMANTAN BARAT MENGGUNAKAN METODE HIRARKI BAYESIAN ... Teorema 2 Misalnya, terdapat data Y yang

IndoMS Journal on Statistics Vol. xx, No. xx (2012), Hlm. xx—xx.

3

dan lain-lain. Dimensi proses diantaranya terdiri dari kebijakan, perencanaan, strategi, dan lain sebagainya (Gambar 1).

Pembangunan Ekonomi Daerah

Produk

Proses

- Ketenagakerjaan- Kesejahteraan- Investasi- Infrastruktur

- Kebijakan- Perencanaan- Strategi- Aplikasi Sumber Daya

Gambar 1 Dimensi Pembangunan Ekonomi Daerah (Sumber : Stimson [9])

Hirarki Model Hirarki model merupakan suatu analisis multi-level. Model dikatakan berhirarki (multilevel) dapat dilihat dari dua sisi, pertama adalah dari struktur datanya yang berkelompok, dan yang kedua dikarenakan model itu sendiri berhirarki dimana parameter dari persamaan regresi dijelaskan oleh hiperparameter pada level di atasnya [10].

Kecamatan 1- RT 1- RT 2- …- RT N

... Kecamatan M- RT 1- RT 2- …- RT N

Kabupaten

Tingkat 2

Tingkat 1

Gambar 2 Struktur Data Berdasarkan Tingkatan Wilayah

Gambar 2 menunjukkan adanya struktur data yang berhiraki untuk setiap level

wilayah. Pada tingkat 1, unit pengamatannya adalah Rumah Tangga (RT) per kecamatan,

Page 4: PEMODELAN PENGELUARAN PER KAPITA PER KABUPATEN/KOTA DI ... · PER KABUPATEN/KOTA DI KALIMANTAN BARAT MENGGUNAKAN METODE HIRARKI BAYESIAN ... Teorema 2 Misalnya, terdapat data Y yang

sementara pada tingkat kedua adalah kecamatan per kabupaten. Regresi konvensional satu level tidak lagi sesuai untuk digunakan ketika terdapat data yang bersarang pada suatu kelompok. Hal ini dikarenakan data tidak lagi bersifat independen [11]. Ketergantungan (dependency) yang dimaksud adalah jika struktur kelompok tersebut diabaikan, maka standard error akan menjadi bias, dan inferensia terhadap pengaruh prediktor menjadi tidak sesuai [12]. Analisis Bayesian

Inferensia Bayesian memiliki keuntungan dalam melakukan pemodelan statistik dan analisis data. Dalam pendekatan klasik atau frekuentis, parameter merupakan suatu nilai yang konstan, dimana parameter adalah sebuah peluang sampel dari populasi [13]. Pada perspektif Bayesian, parameter merupakan suatu pola yang memiliki distribusi sendiri. Distribusi ini menggambarkan ketidakpastian peneliti terhadap nilai parameter. Teorema 1 Misal 𝒀′ = (𝑦1, … ,𝑦𝑛) adalah vektor dari n pengamatan dengan distribusi peluang 𝑝(𝒚|𝜽) bergantung pada nilai parameternya 𝜽′ = (𝜃1, … ,𝜃𝑘). Dimana 𝜽 adalah vektor yang terdiri dari 𝑘 elemen parameter dan memiliki distribusi peluang 𝑝(𝜽). Maka

𝑝(𝒀|𝜽)𝑝(𝜽) = 𝑝(𝒀,𝜽) = 𝑝(𝜽|𝒀)𝑝(𝒀) (1)

Diberikan data pengamatan y, distribusi bersyarat dari 𝜃 adalah

𝑝(𝜽|𝒚) = 𝑝(𝒀|𝜽)𝑝(𝜽)𝑝(𝒀) (2)

dimana batas jumlah atau integral diambil dari range θ, dan 𝑝(𝒀) bernilai konstan. Sehingga persamaan (1) dapat ditulis sebagai berikut

𝑝(𝜽|𝒚) = 𝑐 𝑝(𝒀|𝜽)𝑝(𝜽). (3)

Diberikan data Y, 𝑝(𝒀|𝜽) merupakan sebuah fungsi dari θ, bukan Y. Maka oleh Fisher [14], dinamakan fungsi dari θ dengan syarat y dan ditulis sebagai 𝑙(𝜽|𝒀). Sementara c dikatakan sebagai normalized constant. Sehingga rumus Bayes dapat ditulis sebagai berikut :

𝑝(𝜽|𝒀) = 𝑐 𝑙(𝜽|𝒀)𝑝(𝜽) (4)

Teorema Bayes menceritakan distribusi peluang untuk θ posterior terhadap data Y adalah proporsional dengan produk dari distribusi untuk θ prior dan likelihood untuk 𝜽 dengan 𝒀 diketahui. Sehingga

𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑠𝑖 𝑝𝑜𝑠𝑡𝑒𝑟𝑖𝑜𝑟 ∝ 𝑙𝑖𝑘𝑒𝑙𝑖ℎ𝑜𝑜𝑑 𝑥 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑠𝑖 𝑝𝑟𝑖𝑜𝑟 (5)

Distribusi Prior

Distribusi prior menampilkan suatu informasi yang terdahulu (sebelumnya) mengenai parameter [15]. Macam-macam prior diantaranya adalah :

1. Conjugate dan Non-Conjugate Prior Conjugate prior merupakan prior yang dikaitkan dengan pola model likelihood dari datanya.

Page 5: PEMODELAN PENGELUARAN PER KAPITA PER KABUPATEN/KOTA DI ... · PER KABUPATEN/KOTA DI KALIMANTAN BARAT MENGGUNAKAN METODE HIRARKI BAYESIAN ... Teorema 2 Misalnya, terdapat data Y yang

IndoMS Journal on Statistics Vol. xx, No. xx (2012), Hlm. xx—xx.

5

2. Informative dan Non-Informative Prior Prior dikatakan informative ataupun non-informative dilihat dari sudah diketahui pola atau frekuensi dari data observasi atau belum.

3. Proper dan Improper Prior [16] Distribusi prior improper apabila fungsi yang digunakan sebagai “densitas peluang prior” memiliki integral yang infinit (tidak dapat diselesaikan)

4. Pseudo-prior [17] Prior terkait dengan pemberian nilainya yang disetarakan dengan hasil elaborasi dari frekuentis.

Hirarki Bayesian

Hirarki Bayesian dikatakan “berhirarki” dikarenakan memiliki paling tidak dua level/tingkatan. Pemilihan diffuse prior cenderung akan meningkatkan kesempatan model mejadi sulit teridentifikasi, terutama dalam model hirarki yang rumit dengan sampel data yang sedikit [18]. Dilihat dari perspektif Bayesian, hirarki model akan menghasilkan overparameter. Namun dengan menggunakan prior yang sesuai (proper) tidak ada masalah dalam kemampuan mengidentifikasi [19]. Distribusi prior hirarki untuk generalized linear model adalah suatu cara untuk mencocokkan struktur data yang kompleks dan memasukkan lebih banyak variabel penjelas tanpa harus bermasalah dengan ‘overfitting’ [20]. Statistik Devians

Devians merupakan salah satu ukuran statistik yang digunakan untuk membandingkan ketepatan dari dua atau lebih model. Devians merupakan perkalian dari negatif 2 dengan log-likelihoodnya :

𝑑𝑒𝑣𝑖𝑎𝑛𝑠:𝐷(𝑦,𝜃) = −2 log𝑝(𝑦|𝜃) (6)

Devians adalah proporsional terhadap Mean Square Error (MSE) jika model berdistribusi normal dengan varians yang konstan. Semakin kecil nilai devians, maka model akan semakin baik.

Bayes Faktor Bayes Faktor adalah suatu alat pemilihan model dalam statistik Bayesian. Menurut

Kass dan Rafterry [21], Bayes Faktor membandingkan dua model dengan mempertimbangkan rata-ratanya untuk melihat bagaimana model tersebut cocok dengan data yang diobservasi, dimana rata-rata (prior tertimbang) mengenai semua nilai yang memungkinkan untuk parameter [22]. Teorema 2 Misalnya, terdapat data Y yang akan dimodelkan ke dalam dua cara/hipotesis. Sehingga peluang densitas dari data Y berada di bawah model H1 dan model H2 adalah 𝑃(𝒀|𝐻1) dan 𝑃(𝒀|𝐻2). Peluang prior dari 𝐻1 dan 𝐻2 adalah 𝑝(𝐻1) dan 𝑃(𝐻2) = 1 − 𝑃(𝐻1), dan peluang posterior adalah 𝑃(𝐻1|𝒀) dan 𝑃(𝐻2|𝒀). Dari teorema Bayes didapatkan :

𝑃(𝐻𝑘|𝒀) = 𝑃(𝒀|𝐻𝑘)𝑝(𝐻𝑘)𝑃(𝒀|𝐻1)𝑝(𝐻1)+𝑃(𝒀|𝐻2)𝑝(𝐻2)

, 𝑘 = 1,2 , (7)

Page 6: PEMODELAN PENGELUARAN PER KAPITA PER KABUPATEN/KOTA DI ... · PER KABUPATEN/KOTA DI KALIMANTAN BARAT MENGGUNAKAN METODE HIRARKI BAYESIAN ... Teorema 2 Misalnya, terdapat data Y yang

sehingga 𝑃(𝐻1|𝒀)𝑃(𝐻2|𝒀) = 𝑃(𝒀|𝐻1)𝑝(𝐻1)

𝑃(𝒀|𝐻2)𝑝(𝐻2) , (8)

dan Bayes Faktor adalah

𝐵12 = 𝑃(𝒀|𝐻1)𝑃(𝒀|𝐻2) (9)

Sehingga persamaan (8) di atas dapat ditulis sebagai

Posterior odds = Bayes faktor x Prior odds (10)

Densitas dari 𝑃(𝒀|𝐻𝑘) didapatkan dengan mengintegralkan likelihood dari fungsi dikali prior.

𝑃(𝒀|𝐻𝑘) = ∫𝑃(𝒀|𝜽𝒌,𝐻𝑘)𝜋(𝜽𝒌|𝐻𝑘) 𝑑𝜽𝒌 , (11)

dimana 𝜽𝒌 adalah vektor parameter pada kondisi 𝐻𝑘, dan 𝜋(𝜽𝑘|𝐻𝑘) adalah densitas prior, sementara 𝑃(𝒀|𝜽𝒌,𝐻𝑘) adalah fungsi likelihood dari 𝜽𝒌 [16]. Interpretasi dari nilai Bayes Faktor berdasarkan Kass dan Rafftery [22] dapat dilihat pada Tabel 1. Tabel 1 Interpretasi nilai Bayes Faktor

Log10(BF12) BF12 Bukti keandalan 𝑯𝟏 dan 𝑯𝟐 pada data 0 – ½ 1 – 3.2 Tidak ada ½ - 1 3.2 – 10 Cukup kuat 1 – 2 10 – 100 Kuat > 2 > 100 Sangat Kuat

Sumber : Kass dan Raftery [22] Keterangan : 𝐻1 : model 1 𝐻2 : model 2

Sistem Perkalian Distribusi (SPD) Prinsip awal pengembangan model statistik SPD adalah dengan menganggap model-

model yang diduga representatif memodelkan data yang ada dianggap saling independen. Model tersebut kemudian dibuat dalam suatu fungsi gabungan yang direpresentasikan dalam bentuk perkalian serta masing-masing dipangkatkan dengan 𝜆𝑘,𝑘 = 1,2, … ,𝐾, 𝑑𝑎𝑛 ∑ 𝜆𝑘 =𝐾

𝑘=11, dimana k adalah banyaknya distribusi atau model penyusun fungsi SPD [23].

Terdapat dua distribusi 𝑓1(𝑥,𝜃) dan 𝑓2(𝑥,𝜔), maka berdasarkan model yang dikembangkan Cox (1962) dan Carota et al. (1996) bentuk SPD-nya adalah sebagai berikut :

𝑓𝑆𝑃𝐷(𝑥, 𝜆,𝜃,𝜔) = 𝐶(𝜆,𝜃,𝜔)𝑓1𝜆(𝑥,𝜃)𝑓2

1−𝜆(𝑥,𝜔) (12)

dimana, 𝐶(𝜆,𝜃,𝜔) adalah konstanta normalitas yang bisa didapatkan dari

𝐶(𝜆,𝜃,𝜔) = �∫ 𝑓1𝜆(𝑥,𝜃)𝑓2

1−𝜆(𝑥,𝜔)∞−∞ 𝑑𝑥�

−1 (13)

dengan 𝐶(𝜆,𝜃,𝜔) adalah suatu konstanta, maka persamaan (12) dapat ditulis sebagai berikut

Page 7: PEMODELAN PENGELUARAN PER KAPITA PER KABUPATEN/KOTA DI ... · PER KABUPATEN/KOTA DI KALIMANTAN BARAT MENGGUNAKAN METODE HIRARKI BAYESIAN ... Teorema 2 Misalnya, terdapat data Y yang

IndoMS Journal on Statistics Vol. xx, No. xx (2012), Hlm. xx—xx.

7

𝑓𝑆𝑃𝐷(𝑥, 𝜆,𝜃,𝜔) ∝ 𝑓1𝜆(𝑥,𝜃)𝑓2

1−𝜆(𝑥,𝜔) (14)

Model ini kemudian dikembangkan oleh Iriawan [23], untuk k distribusi sehingga diperoleh SPD sebagai berikut

𝑓𝑆𝑃𝐷(𝑥,𝛬,𝛩) = 𝐶(𝛬,𝛩)∏ 𝑓𝑘𝜆𝑘(𝑥, 𝜃𝑘)𝐾

𝑘=1 (15)

dengan 𝛬 = (𝜆1,𝜆2, … , 𝜆𝑘),𝛩 = (𝜃1,𝜃2, … ,𝜃𝑘), 0 < 𝜆𝑘 < 1,∑ 𝜆𝑘 = 1𝐾𝑘=1 dan 𝐶(𝛬,𝛩) adalah

konstanta normalitas. Model SPD seperti yang telah dijelaskan seperti di atas adalah model yang cukup

kompleks apalagi jika melebihi 2 distribusi. Oleh karena itu digunakan prinsip MCMC dalam melakukan penghitungan secara numerik (simulasi).

Interpretasi dari nilai λ adalah sebagai berikut : • Jika λ > 0,5 maka 𝑓𝑆𝑃𝐷(𝑥, 𝜆,𝜃,𝜔) cenderung didominasi oleh distribusi 𝑓1(𝑥,𝜃) • Jika λ < 0,5 maka 𝑓𝑆𝑃𝐷(𝑥, 𝜆,𝜃,𝜔) cenderung didominasi oleh distribusi 𝑓2(𝑥,𝜔)

Nilai Bayes Faktor dapat diperoleh dari SPD dengan bantuan MCMC yang dihitung dengan cara sebagai berikut :

(a) Untuk dua komponen dalam SPD 𝐵𝑓12 = 𝐵𝑎𝑛𝑦𝑎𝑘𝑛𝑦𝑎 𝜆(𝑔)>0,5 𝑑𝑖𝑝𝑒𝑟𝑜𝑙𝑒ℎ 𝑑𝑎𝑟𝑖 𝑁 𝑖𝑡𝑒𝑟𝑎𝑠𝑖

𝐵𝑎𝑛𝑦𝑎𝑘𝑛𝑦𝑎 𝜆(𝑔)<0,5 𝑑𝑖𝑝𝑒𝑟𝑜𝑙𝑒ℎ 𝑑𝑎𝑟𝑖 𝑁 𝑖𝑡𝑒𝑟𝑎𝑠𝑖 , (16)

(b) Untuk m-komponen dalam SPD

𝐵𝑓12 = 𝐵𝑎𝑛𝑦𝑎𝑘𝑛𝑦𝑎 𝜆1(𝑔)>𝜆2

(𝑔) 𝑑𝑖𝑝𝑒𝑟𝑜𝑙𝑒ℎ 𝑑𝑎𝑟𝑖 𝑁 𝑖𝑡𝑒𝑟𝑎𝑠𝑖𝐵𝑎𝑛𝑦𝑎𝑘𝑛𝑦𝑎 𝜆2

(𝑔)>𝜆1(𝑔) 𝑑𝑖𝑝𝑒𝑟𝑜𝑙𝑒ℎ 𝑑𝑎𝑟𝑖 𝑁 𝑖𝑡𝑒𝑟𝑎𝑠𝑖

, (17)

dimana 𝜆(𝑔)adalah banyaknya distribusi pertama dapat dibangkitkan dari sebanyak N-kali iterasi MCMC untuk SPD dengan dua komponen penyusun, dan 𝜆𝑘

(𝑔) adalah banyaknya distribusi ke-k, k=1,2,...,K dapat dibangkitkan dari N-kali iterasi MCMC untuk SPD dengan k-komponen penyusun [23].

2. Metode

Data Sumber data yang digunakan adalah hasil kegiatan Survei Sosial Ekonomi Nasional (Susenas) 2009 dan Potensi Desa (Podes) 2008 BPS Kalimantan Barat. Variabel yang digunakan bersumber dari penelitian Agarwalla [1] dan Majmuder [24] yang disesuaikan dengan ketersediaan data. Rincian variabel penelitian dapat dilihat pada Tabel 2.

Page 8: PEMODELAN PENGELUARAN PER KAPITA PER KABUPATEN/KOTA DI ... · PER KABUPATEN/KOTA DI KALIMANTAN BARAT MENGGUNAKAN METODE HIRARKI BAYESIAN ... Teorema 2 Misalnya, terdapat data Y yang

Tabel 2 Rincian variabel penelitian

Variabel Deskripsi Y Pengeluaran per kapita per kecamatan (Rp) X1 Rasio SD Negeri dan SMP Negeri per 10.000 penduduk per kecamatan X2 Rasio SMU Negeri dan SMK Negeri per 10.000 penduduk per kecamatan X3 Rasio Puskesmas dan Puskesmas Pembantu (Pustu) per 10.000 penduduk per kecamatan X4 Rasio dokter per 10.000 penduduk per kecamatan X5 Persentase keluarga yang sudah menggunakan listrik PLN per kecamatan X6 Persentase jalan desa yang dapat dilalui kendaraan roda empat per kecamatan X7 Total Bantuan pemerintah kabupaten/kota per kecamatan (juta rupiah)

Tahap Penelitian

Sesuai dengan tujuan penelitian yang telah dijabarkan pada bab sebelumnya, maka metode dan tahapan penelitian yang akan dilakukan adalah sebagai berikut : 1. Tahap Mengetahui Karakteristik Distribusi Pengeluaran Per kapita per Kecamatan

a. Melakukan uji kesesuaian distribusi pengeluaran per kapita per kecamatan. b. Mendapatkan distribusi yang sesuai dengan karakteristik pengeluaran per kapita c. Mencari statistik deskriptif pengeluaran per kapita d. Menganalisis karakteristik berdasarkan statistik deskriptif dan hasil distribusi serta

parameter yang telah didapatkan pada tahap (a)

2. Tahap Mendapatkan Model yang Tepat a. Menentukan distribusi-distribusi yang diduga tepat untuk memodelkan pengeluaran

per kapita berdasarkan hasil uji distribusi yang telah dilakukan sebelumnya b. Menentukan parameter yang akan menjadi variabel respons dalam pemoelan regresi

linier c. Membuat formula distribusi posterior d. Menyusun algoritma komputasional e. Mengimplementasikan algoritma ke dalam program WinBUGS f. Tahap penyelesaian akhir

3. Tahap Penambahan Distribusi Lognormal 3 Parameter ke dalam WinBUGS

a. Mempersiapkan software yang akan digunakan untuk membangun distribusi. b. Menentukan fungsi likelihood dari distribusi Lognormal 3 parameter c. Menentukan prior untuk parameter 𝜇, 𝜏, dan 𝛾 d. Mendeklarasikan fungsi likelihood dan prior yang sudah dibuat ke dalam prosedur

WBDev. e. Melakukan kompilasi program.

Page 9: PEMODELAN PENGELUARAN PER KAPITA PER KABUPATEN/KOTA DI ... · PER KABUPATEN/KOTA DI KALIMANTAN BARAT MENGGUNAKAN METODE HIRARKI BAYESIAN ... Teorema 2 Misalnya, terdapat data Y yang

IndoMS Journal on Statistics Vol. xx, No. xx (2012), Hlm. xx—xx.

9

3. Hasil dan Pembahasan

Karakteristik Pola Pengeluaran per Kapita per Kecamatan Dilihat dari plot data, seperti yang digambarkan pada Gambar 3, terdapat dua ciri dari pola pengeluaran per kapita per kecamatan di Kalimantan Barat. yaitu bernilai positif lebih dari nol, dan memiliki ekor yang menceng ke kanan. Berdasarkan hasil uji kesesuaian distribusi didapatkan distribusi yang sesuai untuk data pengeluaran per kapita per kecamatan di Kalimantan Barat secara berurutan adalah distribusi Lognormal 3 parameter, Lognormal 2 parameter, dan Weibull 3 parameter. Ketiga distribusi ini mengakomodir bentuk dari karakteristik pengeluaran per kapita seperti yang telah disebutkan sebelumnya yaitu bernilai positif, memiliki ekor yang cenderung menceng ke kanan dan pengeluaran yang mengumpul di sisi kiri.

1200

000

1000

000

8000

00

6000

00

4000

00

2000

00

40

30

20

10

0

1200

000

9000

00

6000

00

3000

00

20

15

10

5

0

1800

000

1500

000

1200

000

9000

00

6000

00

3000

00

40

30

20

100

5250

000

4500

000

3750

000

3000

000

2250

000

1500

000

7500

000

160

120

80

40

0

pp1

Freq

uenc

y

pp2

pp3 pp4

Histogram Pengeluaran per Kapita4 Kecamatan di Kalimantan Barat

Gambar 3 Histogram Data Pengeluaran per Kapita di Beberapa Kecamatan di Kalimantan

Barat (pp1: Kabupaten Sambas Kecamatan Pemangkat, pp2 : Kabupaten Ketapang Kecamatan Tumbang Titi, pp3: Kabupaten Sekadau Kecamatan Sekadau Hilir

pp4 : Kabupaten Kubu Raya Kecamatan Sungai Raya) Gambar 3 dapat dilihat bahwa persebaran pengeluaran per kapita untuk masing-

masing kecamatan di Kalimantan barat belum setimbang. Pengelompokkan pengeluaran berada di sisi kiri garafik, sementara ekor yang panjang di sisi kanan menunjukkan masih terdapat kesenjangan untuk setiap kecamatan. Hal ini menandakan bahwa terdapat sebagian kecil penduduk yang berpendapatan (berpengeluaran) jauh melebihi kelompok mayoritas. Pemodelan Pengeluaran Per kapita Parameter yang digunakan sebagai variabel respon pada level dua untuk distribusi Lognormal 2 parameter, berbeda dengan yang digunakan pada distribusi Lognormal dan Weibull 3 parameter. Pada Lognormal 2 parameter, parameter yang dimodelkan adalah

Page 10: PEMODELAN PENGELUARAN PER KAPITA PER KABUPATEN/KOTA DI ... · PER KABUPATEN/KOTA DI KALIMANTAN BARAT MENGGUNAKAN METODE HIRARKI BAYESIAN ... Teorema 2 Misalnya, terdapat data Y yang

parameter lokasi 𝜇, sementara pada Lognormal dan Weibull 3 parameter menggunakan parameter threshold 𝛾. Pemilihan ketiga parameter ini berdasarkan pada besar pengaruh terhadap pergeseran tingkat pengeluaran per kapita. Distribusi prior yang digunakan baik untuk parameter distribusi maupun parameter koefisien regresi berdasarkan pada conjugate dan informative prior. Nilai parameter dari distribusi prior diperoleh dari data yang ada dan posterior dari prior yang diperbaharui secara berulang. Berdasarkan hasil pemodelan dua tahap yang dilakukan dengan menggunakan program WinBUGS 1.4.3 modifikasi, didapatkan bahwa ketujuh koefisien regresi dari variabel penjelas dalam model tahap 2 bernilai signifikan. Hal ini dapat dilihat dari interval posterior dengan tingkat peluang 95% interval dari koefisien regresi tidak boleh berada di titik nol. Uji Kebaikan Model

Penghitungan kinerja dari WinBUGS dilakukan dengan melakukan iterasi sebanyak 10000 kali, jumlah sampel dimulai dari 5000, dan thin 40. Tabel 3 Total Waktu yang Digunakan (detik) dan Nilai Devians dari Pemodelan Regresi

dengan Menggunakan 3 Distribusi yang Berbeda

KAB LOGNORMAL 2P LOGNORMAL 3P WEIBULL 3P Waktu Devians Waktu Devians Waktu Devians

6101 165 16220 1475 16150 1345 16160 6102 155 16260 1693 16230 748 16230 6103 171 15990 2605 15930 664 15970 6104 117 17170 3406 17110 1182 17150 6105 208 16110 1613 16040 824 16080 6106 193 16200 3508 16140 1449 16200 6107 142 16050 2994 16010 1023 16080 6108 121 15050 2964 15030 980 15050 6109 124 16310 2344 16290 1036 16330 6110 125 16290 2381 16260 1140 16300 6111 54 10940 1746 10880 779 10920 6112 255 17130 2606 17100 1108 17190 6171 56 17180 1695 17170 1109 17190 6172 85 16940 1849 16930 1167 16990

Dari Tabel 3, dapat dilihat bahwa penggunaan waktu paling minimum, adalah pada

saat menjalankan program dengan menggunakan distribusi Lognormal 2 parameter. Hal ini dikarenakan adanya perbedaan jumlah parameter yang digunakan, dimana semakin banyak parameter cenderung akan membutuhkan waktu proses yang lebih lama. Dilihat dari nilai devians, nilai devians paling kecil berada pada Lognormal 3 parameter, yang berarti model yang paling sesuai untuk distribusi pengeluaran adalah model Lognormal 3 parameter. Hal ini didukung dengan nilai SPD yang secara keseluruhan, nilai proporsi lambda untuk model Lognormal 3 parameter adalah yang paling besar dibandingkan dengan dua model lainnya (lihat Tabel 4).

Page 11: PEMODELAN PENGELUARAN PER KAPITA PER KABUPATEN/KOTA DI ... · PER KABUPATEN/KOTA DI KALIMANTAN BARAT MENGGUNAKAN METODE HIRARKI BAYESIAN ... Teorema 2 Misalnya, terdapat data Y yang

IndoMS Journal on Statistics Vol. xx, No. xx (2012), Hlm. xx—xx.

11

Tabel 4 Nilai Bayes Faktor, SPD, dan MSE Terkecil untuk Tiga Model Distribusi pada Masing-Masing Kabupaten/Kota di Kalimantan Barat

KAB BAYES FAKTOR SPD MSE Terkecil

BF21 BF23 BF31 MODEL 1 MODEL 2 MODEL 3 6101 6.5232 2.1547 3.0274 0.248 0.4564 0.2956 200100

6102 0.9920 0.6023 1.6470 0.3154 0.3076 0.377 173600

6103 6.3074 2.1449 2.9406 0.2493 0.4542 0.22964 211000

6104 1.4557 1.0641 1.5491 0.3023 0.3467 0.3284 60520

6105 9.8451 3.5907 2.7418 0.2255 0.5171 0.229 100700

6106 9.8723 3.6366 2.7147 0.2205 0.5209 0.2305 87930

6107 1.4197 0.9492 1.4957 0.3131 0.3499 0.3369 154100

6108 1.4398 0.9153 1.5730 0.3143 0.3502 0.3355 127700

6110 1.2792 0.8742 1.4633 0.309 0.3462 0.3448 125400

6111 1.3277 0.8899 1.4920 0.3093 0.3495 0.3412 369200

6112 1.4796 0.9752 1.5172 0.3148 0.355 0.3301 54500

6171 1.4369 0.8934 1.6084 0.317 0.3475 0.3355 530300

6172 0.9695 0.6159 1.5741 0.3249 0.3577 0.3174 236300

Keterangan: Model 1 : Distribusi Lognormal 2 parameter Model 2 : Distribusi Lognormal 3 parameter Model 3 : Distribusi Weibull 3 parameter

Berdasarkan hasil nilai BF pada tabel 4, dapat dilihat secara rata-rata nilai BF baik

untuk BF21, BF23, maupun BF31 rata-rata berada di antara nilai 0 – 3.2, terkecuali untuk beberapa kabupaten/kota. hal ini mengindikasikan bahwa walaupun menggunakan distribusi Lognormal 3 parameter lebih tepat untuk memodelkan pengeluaran per kapita, namun ternyata dari segi besarnya keandalan tidak begitu signifikan dibandingkan dengan kedua model lainya. Membangun Distribusi Lognormal 3 Parameter dalam WinBUGS

Keterbatasan software WinBUGS dalam menyediakan distribusi, menyebabkan peneliti perlu menambahkan distribusi Lognormal 3 parameter ke dalam aplikasi WinBUGS. Penambahan distribusi ini dilakukan dengan menggunakan software pendukung WBDev dan BlackBox Component Builder.

Secara umum, template untuk merancang distribusi baru sudah disediakan oleh WBDev melalui “WBDevUnivariateTempalte” sehingga yang perlu dilakukan hanya mengubah struktur yang ada didalamnya disesuaikan dengan distribusi yang akan dibangun. Langkah pertama yang harus dilakukan adalah mendeklarasikan jumlah parameter yang akan digunakan dalam distribusi. Distribusi Lognormal 3 parameter, memiliki 3 parameter yang harus didefinisikan, yaitu parameter mu, tau, dan lokasi. Ketiga parameter itu adalah berbentuk scalar yang didefinisikan oleh “s”. Adapun kode di dalam WBDev adalah sebagai berikut :

Page 12: PEMODELAN PENGELUARAN PER KAPITA PER KABUPATEN/KOTA DI ... · PER KABUPATEN/KOTA DI KALIMANTAN BARAT MENGGUNAKAN METODE HIRARKI BAYESIAN ... Teorema 2 Misalnya, terdapat data Y yang

CONST imu = 0; itau = 1; iloc = 2; PROCEDURE DeclareArgTypes (OUT args: ARRAY OF CHAR); BEGIN args := "sss"; END DeclareArgTypes;

Batasan domain, batasan dari nilai y untuk distribusi Lognormal 3 parameter adalah

𝛾 ≤ 𝑦 ≤ ∞. PROCEDURE NaturalBounds (node: WBDevUnivariate.Node; OUT lower, upper: REAL); VAR loc: REAL; BEGIN loc := node.arguments[iloc][0].Value(); lower := loc; upper := INF; END NaturalBounds;

Mendeklarasikan fungsi log likelihood dari Lognormal 3 parameter ke dalam modul WBDev.

PROCEDURE LogFullLikelihood (node: WBDevUnivariate.Node; OUT value: REAL); VAR x, mu, tau, loc: REAL; BEGIN x := node.value; mu := node.arguments[imu][0].Value(); tau := node.arguments[itau][0].Value(); loc := node.arguments[iloc][0].Value(); value := 0.5 * (Math.Ln(tau) – Math.Ln(2 * Math.Pi() ) ) – math.Ln(x-loc) - (tau/2) * ( Math.Ln(x - loc) - mu) * ( Math.Ln(x - loc) - mu); END LogFullLikelihood; Mendeklarasikan fungsi prior ke dalam modul WBDev

PROCEDURE LogPrior (node: WBDevUnivariate.Node; OUT value: REAL);

VAR x, mu, tau, loc: REAL; BEGIN x := node.value; mu := node.arguments[imu][0].Value(); tau := node.arguments[itau][0].Value(); loc := node.arguments[iloc][0].Value(); value := -0.5*tau * (Math.Ln(x - loc) - mu)* (Math.Ln(x - loc) - mu); END LogPrior;

Page 13: PEMODELAN PENGELUARAN PER KAPITA PER KABUPATEN/KOTA DI ... · PER KABUPATEN/KOTA DI KALIMANTAN BARAT MENGGUNAKAN METODE HIRARKI BAYESIAN ... Teorema 2 Misalnya, terdapat data Y yang

IndoMS Journal on Statistics Vol. xx, No. xx (2012), Hlm. xx—xx.

13

4. Kesimpulan

Berdasarkan hasil analisa yang telah dilakukan pada bab sebelumnya, maka diperoleh kesimpulan sebagai berikut : 1. Pola distribusi pengeluaran per kapita per kecamatan di Kalimantan barat secara umum

memiliki sifat cenderung mengelompok di suatu nilai, dengan beberapa rumah tangga memiliki pengeluaran per kapita yang jauh melebihi rata-rata dari pengeluaran per kapita. Hasil uji kesesuaian distribusi, terdapat tiga distribusi yang sesuai untuk kondisi pengeluaran per kapita di Kalimantan Barat, yaitu Lognormal 2 parameter, Lognormal 3 parameter, dan Weibull 3 parameter.

2. Pada pemodelan regresi, parameter yang digunakan sebagai variabel respon berbeda-beda, dimana untuk Lognormal 2 parameter adalah parameter 𝜇, Lognormal 3 parameter dan Weibull 3 parameter menggunakan parameter threshold 𝛾. Hasil eksekusi dengan menggunakan WinBUGS 1.4.3 didapatkan nilai devians dan SPD terkecil berada pada model distribusi Lognormal 3 parameter. Parameter threshold menjadi parameter yang dimodelkan pada tahap dua yang menunjukkan pergeseran pengeluaran per kapita. Hasil dari pemodelan didapatkan bahwa hubungan variabel infrastruktur dan threshold pengeluaran per kapita antara kabupaten satu dengan yang lain berbeda-beda. Hal ini mengindikasikan pengaruh kebijakan antar kabupaten memberikan dampak yang berbeda terhadap pengeluaran per kapita daerah tersebut.

3. Keterbatasan distribusi Lognormal 3 parameter yang tidak tersedia di WinBUGS dapat diatasi dengan membangun distribusi Lognormal 3 parameter menggunakan software pendukung WBDev dan BlackBox Component Builder untuk kemudian digunakan sebagai fasilitas tambahan di WinBUGS.

Ucapan terima kasih. Penelitian ini sangat didukung oleh Badan Pusat Statistik Republik Indonesia, sebagai program peningkatan kualitas sumber daya manusia yang merupakan salah satu program dalam STATCAP-CERDAS 2010-2014. Daftar Pustaka [1] Agarwalla, A., 2011, “Estimating the Contribution of Infrastructure in Regional

Prodductivity Growth in India”, Indian Institute of management. [2] Duffy-Deno, K.T. dan Eberts, R.W., 1989, “Public Infrastructure and Regional Economic

Development: A Simultaneous Equation Approach”, The Federal Reserve Bank of Cleveland Working Paper, No. 8909.

[3] Shah, N., 1970, “Overall Summary: Infrastructure for the Indian Economy, in Dagli, Validal eds”, Infrastructure for the Indian Economy.

[4] Tewari, R.T., 1984, “Economic Infrastructure and Regional Development in India”, Man and Development, Vol. 6, No. 4.

[5] Ha, I.D., dan Lee. Y., 2005, “Multilevel Mixed Linear Models for Survival Data”, Lifetime Data Analysis, 11, 131-142.

[6] Zimmer, Z., Wen, M., dan Kaneda, T., 2010, “A multi-level analysis of urban/rural and socioeconomic differences in functional health status transition among Older Chinese”, Social Science & Medicine 71, 559-567.

Page 14: PEMODELAN PENGELUARAN PER KAPITA PER KABUPATEN/KOTA DI ... · PER KABUPATEN/KOTA DI KALIMANTAN BARAT MENGGUNAKAN METODE HIRARKI BAYESIAN ... Teorema 2 Misalnya, terdapat data Y yang

[7] Anderson, W., dan Wells, M.T., 2010, “A Bayesian Hierarchical Regression Approach to Clustered and Longitudinal Data in Empirical Legal Studies”, Journal of Empirical Legal Studies, Volume 7, Issue 4, 634-663.

[8] Alexander, J.W., 1954, “The Basic-Nonbasic Concept of Urban Economic Function”, Economic Geography, 30, 246-261.

[9] Stimson, R.J., Stough, R., dan Roberts, B.H., 2006, “Regional economic Development : Analysis and Planning Strategies”, Applied Mathematical Sciences, vol 138, Springer.

[10] Gelman, A., dan Hill, J., 2006, Data Analysis Using Regression and Multilevel/Hierarchical Models, Cambridge University Press.

[11] Congdon, P. D., 2010, Applied Bayesian Hierarchical Methods, Chapman & Hall/CRC. [12] Hox, J., 2002, Multilevel analysis : Techniques and Application,. Mahwah, NJ: Lawrence

Erlbaum Associates. [13] Raudenbush, S.W., dan Bryk, A.S., 2002, Hierarchical Linear Models, Applications and

Data Analysis Methods, Second Edition, Sage Publication. [14] Fisher, R. A., 1922, “On Mathematical Foundation of Theoretical Statistics”, Phil. Trans.

Roy. Soc., Series A, 222-309. [15] Box, G. E., dan Tiao, G. C., 1973, Bayesian Inference in Statistical Analysis, Addison-

Wesley Publishing Company, Inc. [16] Gelman, A., 2002, “Prior Distribution”, Encyclopedia of Environmetrics, Volume 3, 1634-

1637. [17] Carlin, B.P., dan Chib, S., 1995, “Bayesian Model Choice via Markov Chain Monte Carlo

Methods”, Journal of the Royal Statistical Society, Series B (Methodological), Vol. 57, Issue 3, 473-484.

[18] Gelfand A., dan Sahu S., 1999, “Indentifiability, improper priors, and Gibbs sampling for generalized linear models”, Journal of the American Statistical Association, 94, hal. 247-253.

[19] Gelfand A., Carlin B.P., dan Trevisani M., 2001, “On Computational Using Gibbs Sampling for Multilevel Models”, Statistica Sinica 11, 981-1003.

[20] Gelman, A., Carlin, J.B., Stern H.S., dan Rubin, D.B., 2004, Bayesian Data Analysis, Second Edition, Chapman & Hall/CRC.

[21] Kass, R.E., dan Raftery, A.E., 1995, “Bayes Factors”, Journal of the American Statistical Association, Vol. 90, No. 430, 773-795.

[22] Lodewyckx, T., dkk, 2011, “A Tutorial on Bayes Factor Estiamtion with the Product Space Method”, Journal of Mathematical Psychology, 1-17.

[23] Iriawan, N., 2000b, “Pemilihan Model Menggunakan Struktur Perkalian Distribusi”, Kappa 1 (1), 37-44.

[24] Majmuder, R., 2007, “Infrastructure and Regional Development in India”, Munich RePEc Archive Paper, No. 4814.