halaman judulrepository.its.ac.id/50710/1/1316201016_master_thesis.pdfatas dasar harga berlaku....

92
HALAMAN JUDUL TESIS – SS14 2501 INTERVAL KONFIDENSI UNTUK PARAMETER MODEL REGRESI SEMIPARAMETRIK BIRESPON DENGAN PENDEKATAN SPLINE TRUNCATED (Aplikasi Pada Data Kemiskinan dan Pengeluaran Per Kapita Makanan Provinsi Jawa Timur) ZAHROTUL AZIZAH NRP. 06211650010016 DOSEN PEMBIMBING Prof. Dr. Drs. I Nyoman Budiantara, M.Si Dr. Ismaini Zain, M.Si PROGRAM MAGISTER DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA, KOMPUTASI DAN SAINS DATA INSTITUT TEKNOLOGI SEPULUH NOPEMBER SURABAYA 2018

Upload: others

Post on 28-Jan-2021

1 views

Category:

Documents


0 download

TRANSCRIPT

  • HALAMAN JUDUL

    TESIS – SS14 2501

    INTERVAL KONFIDENSI UNTUK PARAMETER MODEL REGRESI SEMIPARAMETRIK BIRESPON DENGAN PENDEKATAN SPLINE TRUNCATED (Aplikasi Pada Data Kemiskinan dan Pengeluaran Per Kapita Makanan Provinsi Jawa Timur)

    ZAHROTUL AZIZAH NRP. 06211650010016

    DOSEN PEMBIMBING Prof. Dr. Drs. I Nyoman Budiantara, M.Si Dr. Ismaini Zain, M.Si

    PROGRAM MAGISTER DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA, KOMPUTASI DAN SAINS DATA INSTITUT TEKNOLOGI SEPULUH NOPEMBER SURABAYA 2018

  • HALAMAN JUDUL

    TESIS – SS14 2501

    CONFIDENCE INTERVAL FOR PARAMETER OF BIRESPONSE SEMIPARAMETRIC REGRESSION MODEL BASED ON SPLINE TRUNCATED APPROACH (Applied on Percentage of Poverty and Food Expenditure per Capita Data in East Java Province)

    ZAHROTUL AZIZAH NRP. 06211650010016

    SUPERVISOR Prof. Dr. Drs. I Nyoman Budiantara, M.Si Dr. Ismaini Zain, M.Si

    MAGISTER PROGRAM STATISTICS DEPARTMENT FACULTY OF MATHEMATICS, COMPUTATION, DAN DATA SCIENCE INSTITUT TEKNOLOGI SEPULUH NOPEMBER SURABAYA 2018

  • v

    INTERVAL KONFIDENSI UNTUK PARAMETER MODEL REGRESI

    SEMIPARAMETRIK BIRESPON DENGAN PENDEKATAN SPLINE

    TRUNCATED

    (APLIKASI PADA DATA KEMISKINAN DAN PENGELUARAN PER

    KAPITA MAKANAN PROVINSI JAWA TIMUR)

    Nama Mahasiswa : Zahrotul Azizah

    NRP : 06211650010016

    Pembimbing 1 : Prof. Dr. I Nyoman Budiantara, M.Si

    Pembimbing 2 : Dr. Ismaini Zain, M.Si

    ABSTRAK

    Interval konfidensi merupakan salah satu permasalahan penting di dalam

    statistika inferensi pada regresi, namun pada interval konfidensi untuk regresi

    semiparametrik belum banyak dilakukan. Beberapa penelitian sebelumnya yang

    membahas mengenai interval konfidensi parameter model regresi menggunakan

    pendekatan bayesian, sedangkan pada penelitian ini konstruksi interval konfidensi

    dilakukan dengan metode pivotal quantity, karena dinilai lebih mudah karena tidak

    melibatkan distribusi prior. Pendekatan dalam regresi semiparametrik yang

    digunakan pada penelitian ini yaitu spline truncated. Pada kasus nyata, jika

    ditemukan adanya dua variabel respon yang saling berkorelasi, maka dalam

    memodelkan dengan menggunakan regresi dianalisis dengan model regresi

    birespon. Selanjutnya, interval konfidensi untuk parameter model regresi birespon

    semiparametrik dengan pendekatan spline truncated diaplikasikan pada data

    kemiskinan dan pengeluaran per kapita makanan Jawa Timur. Berdasarkan hasil

    penelitian dengan tingkat signifikansi sebesar 0,05 diperoleh bahwa persentase

    kemiskinan dipengaruhi oleh rata-rata lama sekolah, gini ratio, angka partisipasi

    sekolah, tingkat pengangguran terbuka, dan PDRB atas harga berlaku, sedangkan

    pengeluaran per kapita makanan dipengaruhi oleh rata-rata lama sekolah dan PDRB

    atas dasar harga berlaku. Model diperoleh dengan GCV minimum sebesar 4,189,

    MSE sebesar 2,698 dan nilai 𝑅2 sebesar 91,05 %.

    Kata kunci : Regresi Semiparametrik Birespon Spline Truncated, Interval

    Konfidensi untuk Parameter Regresi, Persentase Kemiskinan, Pengeluaran per

    Kapita Makanan.

  • vi

    Halaman ini sengaja dikosongkan.

  • vii

    CONFIDENCE INTERVAL FOR PARAMETER OF BIRESPONSE

    SEMIPARAMETRIC REGRESSION MODEL BASED ON SPLINE

    TRUNCATED APPROACH

    (APPLIED ON PERCENTAGE OF POVERTY AND FOOD

    EXPENDITURE PER CAPITA DATA IN EAST JAVA PROVINCE)

    Name of Student : Zahrotul Azizah

    NRP : 06211650010016

    Supervisor : Prof. Dr. I Nyoman Budiantara, M.Si

    Co-Supervisor : Dr. Ismaini Zain, M.Si

    ABSTRACT

    Confidence interval is one of the important problems in inference statistics

    of regression, but the confidence interval for semiparametric regression has not

    been widely performed. Some previous studies that discussed the confidence

    interval of regression model parameters using bayesian approach, whereas in this

    research confidence interval construction is done by pivotal quantity method, it is

    considered easier because it doesn’t involve prior distribution. The approach in

    semiparametric regression used in this study is spline truncated. In the real case, if

    there is found the existence of two correlation response variables, then in modeling

    used regression method is analyzed by biresponses regression model. Subsequently,

    the confidence interval for parameters of semiparametric biresponses regression

    model with the spline truncated approach was applied to poverty percentage data

    and per capita food expenditure in East Java. Based on the result of the research

    with significance level of 0,05, it is found that the percentage of poverty is

    influenced by the average of school duration, gini ratio, school participation rate,

    open unemployment rate, and GRDP (Gross Regional Domestic Product) over

    current price, while per capita food expenditure is influenced by the average of

    school duration and GRDP at current price. The model was obtained with minimum

    GCV of 4.189, MSE of 2,698 and R2 of 91.05%.

    Keywords: Spline Truncated Semiparametric Biresponses Regression, Confidence

    Interval for Parameters of Regression, Percentage of Poverty, Per Capita Food

    Expenditure.

  • viii

    -Halaman ini sengaja dikosongkan-

  • ix

    KATA PENGANTAR

    Puji syukur penulis ucapkan kepada Allah SWT atas rahmat dan kasihNya,

    penulis dapat menyelesaikan penulisan Tesis dengan judul “Interval Konfidensi

    untuk Parameter Model Regresi Semiparametrik Birespon dengan

    Pendekatan Spline Truncated (Aplikasi pada Data Persentase Kemiskinan

    dan Pengeluaran Per Kapita Makanan)” ini dengan baik. Tesis ini disusun untuk

    memenuhi salah satu syarat memperoleh gelar Magister Sains (M.Si) di Jurusan

    Statistika, Fakultas Matematika, Komputasi, dan Sains Data, Institut Teknologi

    Sepuluh Nopember Surabaya.

    Terselesaikannya Tesis ini tidak lepas dari dukungan berbagai pihak yang

    telah memberikan bantuan kepada penulis. Oleh karena itu, pada kesempatan ini

    penulis ingin menyampaikan terima kasih kepada:

    1. Orang tua penulis, Bapak Masyhudi dan Ibu Mufarokah dan adik penulis,

    Ulyatur Rosyidah dan Alifatul Mujahadah yang selalu menyemangati, memberi

    motivasi, kasih sayang serta dukungan kepada penulis,

    2. Prof. Dr. Drs. I Nyoman Budiantara, M.Si. dan Dr. Ismaini Zain, M.Si, selaku

    dosen pembimbing dalam penyusunan Tesis ini, yang telah banyak memberikan

    ilmu, saran, dan penuh kesabaran serta bersedia meluangkan waktu untuk

    membimbing penulis selama ini,

    3. Dr. Vita Ratnasari, M.Si dan Dr. Sutikno, M.Si, selaku dosen penguji, yang

    telah banyak memberikan masukan guna kesempurnaan Tesis ini,

    4. Dr. Suhartono selaku Ketua Jurusan Statistika dan Dr.rer.pol. Heri Kuswanto,

    M.Si., selaku Ketua Program Pascasarjana Jurusan Statistika, yang telah

    memberikan waktu untuk mendukung terselesainya Tesis ini,

    5. Dr. Setyawan, M.Si, selaku dosen wali penulis yang telah memberikan

    dukungan moril dan arahan selama penulis menempuh studi,

    6. Bapak dan Ibu dosen Jurusan Statistika, Fakultas Matematika, Komputasi, dan

    Sains Data, Institut Teknologi Sepuluh Nopember, yang telah mendidik dan

    membekali penulis dengan berbagai ilmu pengetahuan selama masa

    perkuliahan, serta seluruh staf administrasi akademik, laboratorium, dan ruang

  • x

    baca Statistika yang telah memberikan pelayanan dan fasilitas selama

    perkuliahan,

    7. Rekan-rekan pengerjaan Tesis nonparametrik, Imraatil Husni, Alvita R.D.,

    Suprapto, Khaerul Umam, Rafael T., dan Fendi A. yang telah berjuang dan

    belajar bersama selama pengerjaan Tesis,

    8. Dr. Nur Chamidah, M.Si dan Eko Tjahjono, M.Si selaku dosen pembimbing

    skripsi penulis dan dosen-dosen S-1 Statistika Unair yang telah memotivasi

    penulis untuk melanjutkan studi master,

    9. Silvyah rahmi, Jauhara Rana B., dan Bahagiati M. yang telah menjadi keluarga

    kedua penulis selama menempuh studi master di Institut Teknologi Sepuluh

    Nopember,

    10. Bagus Aji S., Umi Tri Ruhana, Della Destylawati, Lussi Agustin, Bayyinah,

    Fitriana Dz., dan Aulia Dwi R. yang senantiasa memberi semangat kepada

    penulis selama perkuliahan dan pengerjaan Tesis,

    11. Rekan seperjuangan Magister Statistika angkatan 2016, terima kasih atas

    kerjasama, saran, dan kebersamaannya,

    12. Semua pihak yang tidak dapat disebutkan satu persatu, yang telah membantu

    dan menyumbangkan pikiran guna terselesaikan Tesis ini.

    Penulis menyadari bahwa dalam tulisan Tesis ini masih banyak kekurangan,

    sehingga kritik dan saran yang bersifat membangun dari berbagai pihak sangat

    diharapkan demi penulisan yang lebih baik lagi di masa yang akan datang. Semoga

    tulisan ini memberikan manfaat bagi semua dan bermanfaat untuk pengembangan

    ilmu pengetahuan khususnya di bidang Statistika.

    Surabaya, Januari 2018

    Penulis

  • xi

    DAFTAR ISI

    HALAMAN JUDUL ...................................................................................... i

    HALAMAN PENGESAHAN ........................................................................ iii

    ABSTRAK ...................................................................................................... v

    ABSTRACT .................................................................................................... vii

    KATA PENGANTAR .................................................................................... ix

    DAFTAR ISI ................................................................................................... xi

    DAFTAR TABEL .......................................................................................... xiii

    DAFTAR GAMBAR ...................................................................................... xv

    BAB 1 PENDAHULUAN .............................................................................. 1

    1.1 Latar Belakang ..................................................................................... 1

    1.2 Rumusan Masalah ................................................................................ 4

    1.3 Tujuan Penelitian ................................................................................. 4

    1.4 Manfaat Penelitian ............................................................................... 5

    1.5 Batasan Masalah................................................................................... 5

    BAB 2 TINJAUAN PUSTAKA ..................................................................... 7

    2.1 Analisis Regresi ................................................................................... 7

    2.2 Spline Truncated .................................................................................. 8

    2.2.1 Spline Truncated dalam Regresi Nonparametrik ....................... 8

    2.2.2 Spline Truncated dalam Regresi Semiparametrik ..................... 9

    2.3 Regresi Semiparametrik Birespon Spline Truncated ........................... 9

    2.4 Pemilihan Titik Knot Optimal .............................................................. 12

    2.5 Interval Konfidensi Parameter Regresi ................................................ 12

    2.6 Weighted Least Square ........................................................................ 14

    2.7 Aljabar Matriks .................................................................................... 15

    2.8 Persentase Kemiskinan, Pengeluaran Per Kapita Makanan, dan Faktor

    yang diduga Berpengaruh .................................................................... 16

    BAB 3 METODOLOGI PENELITIAN ....................................................... 19

    3.1 Sumber Data ......................................................................................... 19

    3.2 Variabel Penelitian ............................................................................... 19

  • xii

    3.3 Struktur Data Penelitian........................................................................ 20

    3.4 Tahapan Penelitian ............................................................................... 21

    BAB 4 HASIL DAN PEMBAHASAN

    4.1 Kajian Interval Konfidensi untuk Parameter Model Regresi

    Semiparametrik Birespon dengan Pendekatan Spline Truncated........ 25

    4.1.1 Interval Konfidensi saat Variansi Eror Diketahui ....................... 33

    4.1.2 Interval Konfidensi saat Variansi Eror Tidak Diketahui ............. 36

    4.2 Aplikasi pada Data Persentase Kemiskinan dan Pengeluaran per Kapita

    Makanan di Provinsi Jawa Timur ......................................................... 43

    4.2.1 Deskriptif Persentase Kemiskinan, Pengeluaran Per Kapita Makanan dan

    Faktor yang Diduga Mempengaruhinya ................................................... 43

    4.2.2 Pengujian Korelasi Antar Variabel Respon ........................................... 50

    4.2.3 Identifikasi Variabel Komponen Parametrik dan Nonparametrik .......... 50

    4.2.4 Aplikasi Data Model Regresi Semiparametrik Birespon dengan

    Pendekatan Spline Truncated ................................................................... 52

    BAB 5 KESIMPULAN DAN SARAN

    5.1 Kesimpulan .......................................................................................... 57

    5.2 Saran .................................................................................................... 58

    DAFTAR PUSTAKA ............................................................................... .... 59

    Lampiran .......................................................................................................... 65

  • xiii

    DAFTAR TABEL

    Tabel 2.1 Penelitian Sebelumnya terkait Faktor-faktor yang Memengaruhi

    Kemiskinan ........................................................................................ 17

    Tabel 3.1 Variabel Penelitian ............................................................................... 19

    Tabel 3.2 Struktur Data Penelitian ....................................................................... 20

    Tabel 4.1 Statistika Deskriptif Variabel Penelitian .............................................. 43

    Tabel 4.2 Tabel Identifikasi Linieritas dengan Scatter Plot ................................. 50

    Tabel 4.3 Tabel Identifikasi Linieritas dengan Ramsey Test ................................ 51

    Tabel4.4 Hasil Identifikasi Komponen Parametrik dan Nonparametrik Berdasarkan

    Hasil Uji Ramsey .................................................................................. 52

    Tabel 4.5 Nilai GCV untuk Spline Linear Satu Knot ........................................... 53

    Tabel 4.6 Interval Konfidensi untuk Parameter ................................................... 54

  • xiv

    -Halaman ini sengaja dikosongkan-

  • xv

    DAFTAR GAMBAR

    Gambar 4.1 Persentase Kemiskinan Berdasarkan Kabupaten/Kota di Jawa Timur

    Tahun 2015 ...................................................................................... 45

    Gambar 4.2 Pengeluaran per Kapita Makanan berdasarkan Kabupaten/kota di

    Jawa Timur 2015 .............................................................................. 47

    Gambar 4.3 Scatter Plot Variabel Persentase Kemiskinan dan Variabel yang

    Diduga Berpengaruh ........................................................................ 48

    Gambar 4.4 Scatter Plot Variabel Pendapatan per Kapita Makanan dan Variabel

    yang Diduga Berpengaruh................................................................ 49

  • xvi

    Halaman ini sengaja dikosongkan.

  • 1

    BAB 1

    PENDAHULUAN

    1.1 Latar Belakang

    Interval konfidensi merupakan salah satu persoalan yang penting dalam hal

    inferensi regresi (Nafi’ dan Budiantara, 2008). Interval konfidensi untuk parameter

    model regresi digunakan pada penentuan variabel prediktor yang signifikan

    berpengaruh terhadap variabel respon dengan melihat jika interval konfidensi

    memuat nilai nol, maka variabel prediktor tidak berpengaruh secara signifikan

    terhadap variabel respon. Interval konfidensi untuk parameter model regresi

    parametrik telah dilakukan, namun konstruksi interval konfidensi untuk parameter

    model regresi semiparametrik belum banyak dilakukan.

    Konstruksi interval konfidensi regresi nonparametrik dilakukan oleh

    beberapa peneliti seperti Wahba (1983) dan Wang (1998) untuk model regresi

    spline smoothing menggunakan pendekatan bayesian yang melibatkan distribusi

    prior improper sehingga secara matematis sulit dilakukan. Pendekatan yang dinilai

    lebih mudah dibandingkan pendekatan bayesian dalam hal konstruksi interval

    konfidensi yaitu pendekatan pivotal quantity dimana pada pendekatan ini tidak

    melibatkan distribusi prior sehinga diperoleh model yang sederhana dan inferensi

    statistika yang relatif mudah (Eubank, 1988). Peneliti yang menggunakan

    pendekatan pivotal quantity untuk konstruksi interval konfidensi yaitu Loklomin

    (2017) menggunakan metode untuk konstruksi interval konfidensi untuk parameter

    model regresi semiparametrik, namun dalam hal ini hanya melibatkan satu respon

    sehingga belum mengakomodasi interval konfidensi untuk regresi semiparametrik

    birespon, padahal menurut Welsh dan Yee (2006), birespon merupakan masalah

    yang menarik dibahas karena kedua variabel responnya saling berkorelasi.

    Beberapa metode estimasi yang terdapat dalam regresi semiparametrik

    antara lain spline, kernel, lokal linier, polinomial lokal, dan deret fourier (Hardle,

    1990). Namun, dari beberapa metode estimasi tersebut, spline merupakan metode

    yang paling diminati oleh peneliti dalam bidang regresi semiparametrik, hal

    tersebut didasari karena spline memiliki interpretasi statistik dan visual yang sangat

    baik (Eubank, 1999; Budiantara 2009). Spline merupakan potongan polinomial

  • 2

    tersegmen sehingga memiliki fleksibilitas lebih dari polinomial biasa, oleh karena

    itu spline memiliki kelebihan lebih efektif dalam hal penyesuaian diri terhadap

    karakteristik lokal suatu data (Fajriyyah dan Budiantara, 2015). Salah satu basis

    fungsi yang digunakan pada spline yaitu spline truncated (Lyche and Morken,

    2008).

    Spline truncated merupakan model polinomial tersegmen yaitu memiliki

    perubahan pola perilaku kurva yang berbeda pada interval yang berlainan yang

    ditandai dengan adanya titik knot. Estimasi kurva regresi semiparametrik spline

    truncated dapat dilakukan dengan memilih parameter smoothing, yaitu orde,

    banyaknya titik knot, dan titik knot. Pemilihan parameter smoothing yang optimal

    dilakukan penulis dengan menggunakan kriteria Generalized Cross Validation

    (GCV) yaitu dengan memilih nilai GCV yang minimum. GCV digunakan karena

    memiliki sifat optimal asimtotik yang tidak dimiliki metode lain (Wahba, 1990).

    Penelitian mengenai Regresi semiparametrik dengan pendekatan spline

    telah dilakukan antara lain Wibowo, Haryatmi, dan Budiantara (2013), Marina dan

    Budiantara (2013), Sugiantari dan Budiantara (2013), Yani, Srinadi, dan Sumarjaya

    (2017), dan Pratiwi, Budiantara, dan Wibowo (2017), namun pada beberapa

    penelitian tersebut terbatas hanya membahas kasus dengan satu variabel respon

    sehingga belum bisa mengakomodasi kasus dengan dua variabel respon.

    Selanjutnya, beberapa penelitian yang membahas mengenai regresi birespon spline

    dilakukan oleh Wulandari dan Budiantara (2014) dan Nurdiana, Herhyanto, dan

    Dasari (2017) dengan pendekatan nonparametrik, sedangkan Wibowo dkk. (2012)

    membahas model semiparametrik multirespon. Beberapa penelitian di atas, masih

    dalam batas mengestimasi parameter dan belum melakukan inferensi lebih lanjut

    terkait interval konfidensi. Pada penelitian ini, interval konfidensi parameter model

    regresi birespon semiparametrik spline truncated diaplikasikan pada data persentase

    kemiskinan dan pengeluaran per kapita makanan.

    Kemiskinan merupakan permasalahan sosial kependudukan yang utamanya

    perlu mendapat perhatian khusus karena salah satu sasaran dalam pembangunan

    nasional adalah menurunkan tingkat kemiskinan (Rahmawati, Ispriyanti, dan

    Warsito, 2017). Kemiskinan merupakan persoalan yang sangat kompleks dan

    kronis, oleh karena itu dibutuhkan analisis yang tepat dan melibatkan semua

  • 3

    komponen permasalahan dalam penangannnya (Prawoto, 2009). Pada era

    Sustainable Development Goals (SDG’s) ini, kemiskinan ditempatkan pada poin

    pertama yang harus diraih yaitu terciptanya dunia tanpa kemiskinan sehingga

    pengentasan kemiskinan merupakan prioritas bagi semua Negara, salah satunya

    Indonesia.

    Pada Tahun 2000, jumlah penduduk miskin di Indonesia mencapai 38,74

    juta jiwa dan seiring bertambahnya tahun jumlah penduduk miskin di Indonesia

    memiliki kecenderungan menurun hingga pada tahun 2015 jumlah penduduk

    miskin sejumlah 28,51 juta jiwa (BPS 2015; Ishartono, 2016). Meskipun begitu,

    jumlah tersebut merupakan angka yang masih besar mengingat bahwa target SDGs

    adalah dunia tanpa kemiskinan atau dengan kata lain Indonesia masih sangat jauh

    untuk mencapai tujuan tersebut. Kemiskinan di Indonesia yang cukup tinggi

    didukung dengan fakta bahwa Indonesia merupakan Negara dengan urutan ke-5

    dengan persentase populasi garis kemiskinan terbanyak di Asia Tenggara yaitu

    sebesar 10,9% yang didasarkan pada data BPS tahun 2014 (Basic Statistic, 2017).

    Di Indonesia, Jawa Timur merupakan provinsi dengan jumlah penduduk miskin

    terbanyak yaitu sebanyak 4.638.530 (BPS, 2016). Walaupun Jawa Timur

    berkontribusi pada Produk Domestik Bruto nasional yang cukup tinggi yaitu

    tercatat oleh BPS (2016) sebesar 14,85% , namun tidak serta merta menjadikan

    Jawa Timur sebagai provinsi yang rendah tingkat kemiskinannya.

    Pengukuran kesejahteraan penduduk suatu daerah selain diukur dari

    persentase kemiskinan dapat pula diukur melalui pengeluaran per kapita makanan

    (Badan Ketahanan Pangan, 2015). Secara fakta, persentase penduduk miskin dan

    pengeluaran per kapita makanan berkorelasi signifikan pada kajian data awal.

    Kasus kemiskinan dan pengeluaran per kapita makanan beserta faktor-faktor yang

    mempengaruhi telah dibahas oleh beberapa peneliti antara lain Wulandari dan

    Budiantara (2014) dan Putri (2017). Wulandari dan Budiantara (2014) serta Putri

    (2017) mendapatkan model untuk persentase kemiskinan dan pengeluaran per

    kapita makanan dengan memuat variabel prediktor antara lain tingkat kesempatan

    kerja, laju pertumbuhan ekonomi, tingkat pengangguran terbuka, dan tingkat

    pastisipasi angkatan kerja, namun Putri (2017) menggunakan pendekatan Penalized

    Spline, sedangkan Wulandari dan Budiantara (2014) menggunakan pendekatan

  • 4

    Spline. Penelitian lain yaitu Merdekawati dan Budiantara (2013) melakukan

    pemodelan regresi spline truncated multivariabel memperoleh hasil bahwa

    pertumbuhan ekonomi, tingkat pengangguran terbuka, dan tingkat pendidikan

    berpengaruh terhadap kemiskinan. Berdasarkan kajian awal data diperoleh bahwa

    pola data mengikuti pola semiparametrik sehingga syarat untuk aplikasi regresi

    semiparametrik birespon telah terpenuhi.

    1.2 Rumusan Masalah

    Berdasarkan latar belakang yang telah diuraikan di atas, maka rumusan

    masalah pada penelitian ini adalah sebagai berikut :

    1. Bagaimana mendapatkan interval konfidensi untuk parameter model regresi

    semiparametrik birespon dengan pendekatan spline truncated?

    2. Bagaimana memodelkan persentase kemiskinan dan pengeluaran per kapita

    makanan di Provinsi Jawa Timur dan variabel-variabel apa saja yang

    berpengaruh menggunakan interval konfidensi untuk parameter model

    regresi semiparametrik birespon dengan pendekatan spline truncated?

    1.3 Tujuan Penelitian

    Berdasarkan rumusan masalah yang telah diperoleh di atas, maka tujuan

    penelitian adalah sebagai berikut :

    1. Mengkaji interval konfidensi untuk parameter model regresi

    semiparametrik birespon dengan pendekatan spline truncated.

    2. Mengestimasi model data persentase kemiskinan dan pengeluaran per

    kapita makanan di Provinsi Jawa Timur dan mengetahui variabel-variabel

    yang berpengaruh menggunakan interval konfidensi untuk parameter model

    regresi semiparametrik birespon dengan pendekatan spline truncated.

    1.4 Manfaat Penelitian

    Adapun manfaat yang diharapkan dalam penelitian ini adalah :

    1. Menambah wawasan keilmuan mengenai interval konfidensi parameter

    model regresi semiparametrik birespon dengan pendekatan spline

    truncated.

  • 5

    2. Memberikan informasi kepada pemerintah untuk mengetahui variabel-

    variabel yang mempengaruhi kemiskinan di Provinsi Jawa Timur.

    3. Hasil penelitian diharapkan menjadi bahan masukan dan acuan untuk

    penelitian-penelitian selanjutnya.

    1.5 Batasan Masalah

    Batasan yang digunakan pada penelitian ini adalah konstruksi interval

    konfidensi untuk parameter model regresi semiparametrik birespon menggunakan

    model spline linier. Pendekatan yang digunakan untuk mengkonstruksi interval

    konfidensi pada Tesis ini adalah pendekatan pivotal quantity. Interval konfidensi

    yang terbentuk digunakan untuk pengujian hipotesis dua arah. Data yang digunakan

    dalam penelitian ini adalah data sekunder yang diambil dari publikasi BPS tahun

    2015. Banyaknya titik knot pada spline linier yang digunakan adalah satu titik knot.

    Pemilihan titik knot optimal dilakukan menggunakan metode GCV.

  • 6

    Halaman ini sengaja dikosongkan

  • 7

    BAB 2

    TINJAUAN PUSTAKA

    2.1 Analisis Regresi

    Analisis regresi merupakan suatu metode statistik yang digunakan untuk

    mengetahui hubungan fungsional antara variabel respon dan prediktor. Berikut

    adalah model persamaan regresi :

    1 2i 0 1 1i 2 2i l li iy =β +β x +β x +...β x +ε ;i , ,...,n (2.1)

    dengan y merupakan variabel dependen sedangkan x merupakan variabel

    independen. Persamaan (2.1) dapat dinyatakan dalam bentuk matriks sesuai

    persamaan (2.2).

    y = Xβ +ε (2.2)

    dengan

    11 1

    12 2

    1 1

    1

    1

    1

    l

    l

    n l n

    x x

    x xX

    x x

    , dan

    1

    2=

    n

    ε .

    Analisis regresi memiliki dua pendekatan yaitu parametrik dan

    nonparametrik (Eubank, 1998). Regresi parametrik merupakan pendekatan regresi

    yang memiliki asumsi bentuk kurva regresi diketahui. Pada regresi parametrik,

    selain diasumsikan kurva regresi diketahui, terdapat beberapa asumsi terkait model

    pada persamaan (2.2) yaitu residual diasumsikan identik, independen, dan

    berdistribusi normal 2~ IIDN( , )ε 0 I .

    Selain regresi parametrik, regresi nonprametrik merupakan pendekatan

    metode regresi dimana bentuk kurva regresinya tidak diketahui. Model regresi

    nonparametrik dapat ditulis sebagai berikut :

    1 2i i iy =f(t )+ε , i , ,...,n (2.3)

    Regresi nonparametrik sangat memerhatikan fleksibilitas, dan hanya diasumsikan

    bentuk fungsinya mulus (Eubank, 1988).

    Beberapa kasus menyatakan variabel respon diketahui pola hubungannya

    dengan salah satu variabel prediktor, tetapi dengan variabel prediktor yang lain

  • 8

    tidak diketahui bentuk pola hubungannya. Dalam keadaan seperti ini, maka

    digunakan pendekatan regresi semiparametrik. Regresi semiparametrik adalah

    gabungan antara regresi parametrik dan regresi nonparametrik. Model regresi

    semiparametrik dapat ditulis sebagai berikut (Wu dan Zhang, 2006):

    , 1,2, ,nTi i i iy f t i βx (2.4)

    dengan 𝑦𝑖 adalah subjek ke-i , ix adalah vektor komponen parametrik pengamatan

    ke-i, 𝑓(𝑡𝑖) adalah fungsi regresi dan 𝜀𝑖 adalah error random, 𝜀𝑖~𝑁(0, 𝜎2).

    2.2 Uji Ramsey

    Uji linearitas digunakan untuk mengindentifikasi apakah model yang

    digunakan fungsi parametrik yang digunakan adalah fungsi linear atau tidak. Uji ini

    dikembangkan oleh Ramsey pada tahun 1969 yang biasa disebut general test of

    specification atau RESET (Pamungkas, 2013). Uji ini bertujuan untuk menghasilkan

    F hitung, dengan prosedur kerja yaitu

    Hipotesis:

    0 :H antara variabel respon dan variabel prediktor terdapat hubungan linier

    1 :H antara variabel respon dan variabel prediktor tidak terdapat hubungan linier

    Prosedur mendapatkan statistik uji:

    1. Mendapatkan fitted value dari variabel respon dengan cara melakukan analisis

    regresi linear.

    2. Variabel fitted yang telah dikuadratkan tersebut diregresikan bersama dengan

    model semula sebagai variabel prediktor baru.

    3. Menghitung

    2 2

    2

    /

    1 /

    R new R old pF

    R new n k

    , daerah penolakan :

    ; , 1 > . hitung tabel k n kF F

    dengan

    p= Jumlah variabel prediktor yang baru masuk

    n= Jumlah data

    k= banyaknya parameter dalam model regresi baru

    2R new= nilai dari persamaan regresi baru

    2 R old nilai dari persamaan regresi lama

  • 9

    2.3 Spline Truncated

    Spline truncated merupakan pendekatan regresi nonparametrik paling

    populer. Salah satu kelebihan dari spline truncated yaitu model ini mengikuti pola

    sesuai pergerakannya dengan adanya titik knot (Astuti, 2017). Secara umum, fungsi

    spline berderajat p dengan titik-titik knot 1 2, ,.., rK K K dapat ditulis dalam bentuk

    sebagaimana pada persamaan (2.5) berikut (Hardle, 1990).

    01 1

    g(t )p r

    pj

    i j i p k i k

    j k

    t t K

    (2.5)

    dan fungsi truncated diberikan oleh persamaan (2.6)

    , t

    0 , t

    i k i k

    i k

    i k

    t K Kt K

    K

    (2.6)

    Regresi spline adalah regresi yang bentuk kurva regresinya didekati oleh fungsi

    spline. Regresi spline dapat didekati dengan nonparametrik maupun

    semiparametrik, hal ini didasarkan pada pola data yang didapatkan.

    2.2.1 Spline Truncated dalam Regresi Nonparametrik

    Secara umum, model regresi nonparametrik spline dapat dituliskan sebagai

    berikut.

    01 1

    ( ) , 1, 2, , n;p r

    pj

    j i p k i ki

    j k

    it i k=1,2,...K ,t t r

    (2.7)

    dimana p adalah derajat polinomial dan r adalah banyak titik knot pada fungsi

    truncated, dengan 𝜀𝑖 adalah error random, 𝜀𝑖~𝑁(0, 𝜎2). Model regresi

    nonparametrik spline pada persamaan (2.7) dapat disajikan dalam bentuk matriks

    sebagai berikut:

    η(t) = Zα +ε (2.8)

    dengan 0 1 1( )T

    p p p r α ,

    1 1 1 1 1

    2 2 2 1 2

    1

    1

    1

    1

    P Pp

    r

    P Pp

    r

    P Pp

    n n n n r

    t t t K t K

    t t t K t K

    t t t K t K

    Z ,

    dan 1 2T

    nε merupakan vektor residual.

  • 10

    2.2.2 Spline Truncated dalam Regresi Semiparametrik

    Regresi semiparametrik diterapkan pada data yang sebagian variabel

    prediktornya diketahui bentuk kurva regresinya dan sebagian yang lain tidak

    diketahui, Eubank (1998) menyebut hal ini sebagai partial linier model untuk kurva

    yang diketahui berbentuk linier. Mengacu pada persamaan (2.4) dan (2.5), jika

    diberikan data berpasangan 1 2i i i( x ,t , y ), i , ,..,n dimana iy adalah variabel respon

    sedangkan ix adalah variabel prediktor yang mengikuti pola parametrik dan it

    adalah variabel prediktor yang mengikuti pola nonparametrik, model regresi

    semiparametrik spline truncated dapat ditulis menjadi:

    1 1

    , 1, 2, , np r

    pj

    0 1 i 0 j i p k i k

    j k

    i iβ +β x α ty t K i

    (2.9)

    Persamaan (2.9) dapat disajikan dalam bentuk matriks berikut

    y = X +β Zα +ε

    Cω +ε (2.10)

    dengan C X Z dan

    βω =

    α.

    2.3 Regresi Semiparametrik Birespon Spline Truncated

    Analisis regresi birespon merupakan suatu analisis yang digunakan untuk

    mengetahui hubungan fungsional antara dua variabel respon dan variabel prediktor.

    Secara umum, Wang, Guo, dan Brown (2000) menyatakan model regresi birespon

    dapat ditulis dalam bentuk

    , i 1,2, , ni i ix y f ε (2.11)

    dengan 1 2,

    T

    i i iy yy , 1 2,T

    i i ix f x f xf adalah vektor dari fungsi

    regresi, serta 1 2,

    T

    i i iε adalah vektor dari error pengukuran dengan mean 0

    dan variansi ∑ .𝑖 Indeks 𝑖 menyatakan banyak pengamatan pada 𝑦𝑖(1) dan 𝑦𝑖

    (2)

    dengan kedua variabel respon saling berkorelasi.

    Model regresi semiparametrik birespon Spline Truncated digunakan pada

    kasus yang memiliki dua variabel respon yang memenuhi sifat regresi

  • 11

    semiparametrik. Diberikan pasangan data 1 2

    1 2 1 2

    ( ) ( )

    i i li i i qi i i( x ,x ,...,x ,t ,t ,...,t , y , y ) ,

    dengan 1 2i , ,..,n 1( )iy merupakan variabel respon pertama pada pengamatan ke-

    i dan 2( )

    iy menyatakan variabel respon ke dua pada pengamatan ke-i. Hubungan

    antara 1 2i i li( x ,x ,...,x ) dan 1 2( ) ( )

    i i( y , y ) diasumsikan mengikuti model regresi

    parametrik, sedangkan 1 2i i qi(t ,t ,...,t ) dan 1 2( ) ( )

    i i( y , y )diasumsikan mengikuti model

    regresi nonparametrik. Mengacu persamaan (2.4) dan (2.11) maka jika persamaan

    tersebut didekati dengan fungsi spline multivariabel, maka persamaan dapat ditulis.

    1 1 1 1 1 1 1 1

    1 2 1 2

    ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )

    i i i li i i qi iy g (x ) g (x ) ... g (x ) (t ) (t ) ... (t )

    (2.12)

    2 2 2 2 2 2 2 2

    1 2 1 2

    ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )

    i i i li i i qi iy g (x ) g (x ) ... g (x ) (t ) (t ) ... (t )

    (2.13)

    Secara sederhana persamaan (2.12) dan (2.13) dapat ditulis ulang sebagai berikut.

    1 1 1 1

    1 1

    ql( ) ( ) ( ) ( )

    i ji mi i

    j m

    y g (x ) (t )

    (2.14)

    2 2 2 2

    1 1

    ql( ) ( ) ( ) ( )

    i ji mi i

    j m

    y g (x ) (t )

    (2.15)

    dengan

    1

    (1) (1) (1) (1)

    0

    1 1

    (1) ( )mi

    rpp

    j

    j mi p k mi k

    j k

    t Kt t

    2

    (2) (2) (2) (2)

    0

    1 1

    (2) ( ; 1,2 .) , ..mi

    rpp

    j

    j mi p k mi k

    j k

    tt t K m q

    1 1 1 1 1

    0 1 2 l

    ( ) ( ) ( ) ( ) ( )

    1i 2i 1i 1i 2i lig (x ,x ,...,x )=β +β x +β x +...+β x

    2 2 2 2 2

    0 1 2 l

    ( ) ( ) ( ) ( ) ( )

    1i 2i 1i 1i 2i lig (x ,x ,...,x )=β +β x +β x +...+β x

    Persamaan (2.14) dan (2.15) jika ditulis dalam bentuk matriks dapat ditulis

    sebagai berikut :

    y = Xβ + Zα +ε (2.16)

    Persamaan (2.16) dapat ditulis kembali menjadi:

    y = Cω +ε (2.17)

  • 12

    dengan C = X Z dan T

    ω β α .

    2.4 Pemilihan Titik Knot Optimal

    Pemilihan titik knot merupakan hal yang sangat penting dalam regresi spline.

    Titik knot merupakan suatu titik dimana data mengalami perubahan pada selang

    interval tertentu. Menurut Wahba (1990) dan Wang (1998), metode pemilihan titik

    knot optimal dilakukan dengan metode Generalized cross validation (GCV). Titik

    knot optimal diperoleh melalui pemilihan nilai GCV terkecil (Budiantara, 2005).

    Fungsi GCV dirumuskan sebagai berikut (Hardle,1990):

    21

    1

    21

    ˆ,

    n

    i iin y t

    GCV C C C Cn t

    kkr I

    T -1 TA = ( )

    A (2.18)

    Dengan kA merupakan suatu matriks yang memuat knot k.

    2.5 Interval Konfidensi Parameter Regresi

    Interval konfidensi parameter regresi merupakan persoalan inferensi yang

    penting dalam regresi spline. Langkah-langkah untuk mendapatkan estimasi

    interval untuk suatu parameter dalam regresi dijelaskan oleh Montgomery, Peck,

    dan Vining (2012) dengan menggunakan metode pivotal quantity sebagai berikut.

    Model regresi linier berganda telah disajikan pada persamaan (2.2),

    berdasarkan model, diketahui bahwa iy berdistribusi normal dengan mean

    0 1

    l

    j jjx

    dan varians 𝜎2. Langkah pertama yang harus dilakukan yaitu

    mengetahui estimasi parameter, dalam hal ini pada metode regresi linier berganda

    digunakan metode ordinary least square (OLS). Mengacu pada persamaan (2.2)

    diperoleh estimator ̂ dengan metode OLS (Kutner, Nachtsheim, dan Neter, 2004):

    ˆ T T -1β (X X) X y (2.19)

    dengan memperhatikan bahwa β̂ kombinasi linier dari y , maka

    2 1ˆ ~ ( , ( ) )N Tβ β X X , sehingga untuk masing-masing estimator berdistribusi

    normal 2ˆ ~ ( , C )j j jjN , dimana jjC merupakan elemen diagonal ke-j dari

  • 13

    matriks 1

    '

    X X . Untuk membentuk suatu pivotal quantity untuk β , perlu

    diperhatikan definisi tentang pivotal quantity berikut.

    Jika Q=q(x1,x2,…,xn) adalah sebuah variabel random yang merupakan fungsi dari

    X1,…,Xn dan , dan fungsi distribusinya tidak bergantung pada atau parameter

    lain, maka Q disebut pivotal quantity .

    Distribusi dari variabel random umumnya tidak memiliki pivotal quantity

    yang pasti, artinya terdapat berbagai kemungkinan bentuk pivotal quantity, namun

    teorema limit pusat sering kali digunakan untuk konstruksi interval konfidensi

    untuk mayoritas distribusi dengan ukuran sampel besar.

    Akibatnya, diperoleh pivotal quantity

    20 1

    j j

    j

    jj

    ˆT , j , ,..,l

    C

    (2.20)

    Variabel random ( )~

    a

    BT t

    A

    a

    , jika dan hanya jika memenuhi tiga syarat yaitu

    ~ (0,1)B N , ( )A ~ a , dan A dan B independen.

    Dengan pembuktian dengan berdasar syarat-syarat tersebut di atas, didapatkan

    bahwa T berdistribusi t dengan derajat bebas n-l, dimana 𝜎2 diestimasi dengan

    varians error. Untuk mendapatkan interval konfidensi terpendek diperlukan

    optimasi Lagrange yaitu jika merupakan fungsi distribusi kumulatif dari pivotal

    quantity Q=q(x1,x2,…,xp) dan didapatkan fungsi probabilitas untuk suatu interval

    konfidensi

    1 2( ( , , ..., ) ) 1

    p(b) - (a) P a Q x x x b

    Untuk mendapatkan interval konfidensi terpendek maka dicari

    , ,1 2 p U LL(x ,x ,..., x )a b minimum dengan penyelesaian optimasi Lagrange :

    , ,

    { ( )} {( ) }a b R a b R

    a, b a bMin Min

  • 14

    Berdasarkan hasil pada persamaan (2.20) dan Teorema 4, didapat interval

    konfidensi terpendek berukuran (1 ) 100% untuk koefisien regresi

    , 0,1,..,j j l adalah sebagai berikut.

    2 2

    , ,2 2

    ˆ ˆˆ ˆj jj j j jjn p n p

    t C t C (2.21)

    2.6 Weighted Least Square

    Metode Ordinary Least Square (OLS) mengasumsikan bahwa terdapat

    variansi konstan dalam error yang pada umumnya disebut keadaan

    homoskedastisitas. Metode Weighted Least Square (WLS) dapat digunakan ketika

    asumsi variansi konstan dalam error dilanggar atau dalam kata lain disebut

    heteroskedastisitas (Greene, 2003). Berikut diberikan model :

    y Xβ ε (2.22)

    Dengan error diasumsikan berdistribusi normal multivariat dengan mean 0 dan

    matriks variansi-kovariansi non konstan sebagai berikut :

    2

    1

    2

    2

    2

    0 0

    0 0

    0 0 0 n

    =

    Dalam metode OLS, berikut adalah fungsi yang diminimumkan untuk

    mengestimasi parameter

    2

    T T T T T T

    T T T T T

    Q

    T

    T

    ε

    y y β X y y Xβ β X Xβ

    y y β X y β X Xβ

    ε

    y - Xβ y - Xβ (2.23)

    Persamaan (2.27) selanjutnya didiferensiasi terhadap β dengan proses sebagai

    berikut:

    1

    2

    0 2 2

    ˆ

    T T T T T

    T T

    T T

    Q

    y y β X y β X Xβ

    β β

    X y X Xβ

    β X X X y

  • 15

    sehingga diperoleh estimator OLS sebagai berikut.

    ˆ T -1 Tβ = (X X) X y (2.24)

    Jika kita mendefinisikan invers dari matriks variansi kovariansi sebagai pembobot

    untuk estimasi parameter yaitu 2

    1i

    i

    , maka matriks V merupakan suatu matriks

    diagonal yang berisi pembobot untuk estimasi parameter sebagai berikut.

    1

    2

    n

    0 0

    0 0

    0 0 0

    V

    Pada metode WLS fungsi yang diminimumkan untuk mengestimasi parameter

    dirumuskan sebagai berikut

    2

    T T T T T T

    T T T T T

    Q

    Ty - Xβ V y - Xβ

    y Vy β X Vy y VXβ β X VXβ

    y Vy β X Vy β X VXβ

    (2.25)

    Estimator WLS didapat dengan meminimumkan persamaan (2.25) dengan

    memenuhi 0Q

    β sebagai berikut.

    1

    2

    0 2 2

    ˆ

    T T T T T

    T T

    T T

    Q

    y Vy β X Vy β X VXβ

    β β

    X Vy X VXβ

    β X VX X Vy

    sehingga diperoleh estimator WLS pada persamaan (2.26).

    ˆ T -1 Tβ = (X VX) X Vy (2.26)

    2.7 Aljabar Matriks

    Beberapa teorema dasar terkait dengan aljabar matriks yang digunakan

    untuk menyelesaikan estimasi parameter dan interval konfidensi berdasarkan

    Rencher dan Scaalje (2007) adalah sebagai berikut.

    Teorema 1.

  • 16

    Diberikan vektor a dan x , dimana 1 2, , ,..,T T T pa x x a a a a a memuat

    konstanta, maka

    T Ta x x aa

    x x

    Teorema 2.

    Matriks A dikatakan idempoten jika AA = A

    Teorema 3.

    Jika A matriks berukuran nxp dan B matriks berukuran pxn, maka

    ( ) ( )tr trAB BA

    Teorema 4.

    Jika matriks A mempunyai rank r serta simetris dan idempoten, maka

    ( ) ( )rank A tr A r

    Teorema 5.

    Jika 2~ ( , )y N I dan A matriks simetris dengan rank r, maka

    2/Ty y A

    berdistribusi 2 2, / 2Tr A jika dan hanya jika A idempotent.

    Teorema 6.

    Jika 2~ ( , )y N I maka Ty yB dan

    Ty yA adalah independen jika dan hanya jika

    0BA atau 0AB .

    2.8 Persentase Kemiskinan, Pengeluaran per Kapita Makanan dan Faktor

    yang Diduga Berpengaruh

    Kemiskinan menurut BPS (2014) didefinisikan sebagai ketidakmampuan

    dari sisi ekonomi untuk memenuhi kebutuhan dasar seperti pangan, sandang,

    pendidikan, kesehatan, dan perumahan. Sedangkan berdasarkan Undang-Undang

    No. 24 Tahun 2004, kemiskinan adalah kondisi sosial ekonomi seseorang atau

    sekelompok orang yang tidak terpenuhinya hak-hak dasarnya untuk

    mempertahankan dan mengembangkan kehidupan yang bermartabat. Pengukuran

    kesejahteraan penduduk di suatu daerah dapat diukur dengan persentase kemiskinan

    dan pengeluaran per kapita makanan. Persentase kemiskinan merupakan persentase

  • 17

    penduduk yang berada di bawah garis kemiskinan, sedangkan pengeluaran per

    kapita makanan yaitu biaya yang dikeluarkan untuk konsumsi semua anggota

    rumah tangga selama sebulan untuk makanan dibagi dengan banyaknya anggota

    rumah tangga tersebut (BPS, 2017).

    Beberapa pertimbangan yang digunakan sebagai dasar pemilihan variabel

    penelitian adalah beberapa penelitian yang dilakukan sebelumnya pada Tabel 2.1

    berikut.

    Tabel 2.1 Penelitian Sebelumnya terkait Faktor yang Memengaruhi Kemiskinan

    Peneliti Judul Variabel Prediktor

    Astiti dkk.

    (2016)

    Analisis regresi nonparametrik

    spline multivariat untuk

    pemodelan indikator kemiskinan

    di Indonesia.

    Angka melek huruf, rata-

    rata lama sekolah, angka

    partisipasi sekolah, PDRB

    per kapita, tingkat

    pengangguran terbuka.

    Budiantara,

    I.N.,

    Wulandari

    (2015)

    Analisis Faktor-Faktor yang

    Mempengaruhi Persentase

    Penduduk Miskin dan

    Pengeluaran Perkapita Makanan

    di Jawa Timur Menggunakan

    Regresi Nonparametrik Birespon

    Spline.

    Tingkat kesempatan kerja,

    laju pertumbuhan ekonomi,

    tingkat pengangguran

    terbuka, dan tingkat

    partisipasi angkatan kerja .

    Merdekawati

    dan

    Budiantara

    (2013)

    Pemodelan Regresi Spline

    Truncated Multivariabel pada

    Faktor-Faktor yang

    Mempengaruhi Kemiskinan di

    Kabupaten/Kota Provinsi Jawa

    Tengah.

    Pertumbuhan ekonomi,

    tingkat pengangguran

    terbuka, dan tingkat

    pendidikan

    Rahmawati

    dkk (2017)

    Pemodelan kasus kemiskinan di

    jawa tengah menggunakan

    regresi nonparametrik metode B-

    spline.

    Angka melek huruf, tingkat

    pengangguran terbuka,

    angka partisipasi sekolah,

    dan PDRB per kapita

    Rumahorbo

    (2014)

    Analisis Faktor-faktor yang

    Mempengaruhi Jumlah Penduduk

    Miskin Provinsi Sumatera Utara

    Pertumbuhan ekonomi,

    pendapatan per kapita,

    tingkat pengangguran

    terbuka, dan inflasi

  • 18

    Tabel 2.1 (Lanjutan)

    Peneliti Judul Variabel Prediktor

    Cheema dan

    Sial (2012)

    Poverty, Income Inequality, and

    Growth in Pakistan:

    A Pooled Regression Analysis.

    Gini rasio, Rata-rata

    pengeluaran per kapita,

    Indeks Pembangunan

    Manusia

    Iradian

    (2005)

    Inequality, poverty, and growth:

    cross-country evidence.

    Gini Rasio, PDRB per

    kapita, Belanja pemerintah

    Lee (2014) Globalization : Income Inequality

    and poverty : Theory and

    empirics.

    PDB, gini rasio, Trade

    (Ekspor + Impor),

    Pendidikan

    Berdasarkan penelitian sebelumnya yang telah disebutkan, beberapa faktor

    yang diduga mempengaruhi persentase kemiskinan dan pengeluaran per kapita

    makanan beserta penjelasannya adalah sebagai berikut berdasarkan definisi dari

    BPS (2016):

    1. Rata-rata lama sekolah menggambarkan jumlah tahun yang digunakan oleh

    penduduk usia 15 tahun keatas dalam menjalani pendidikan formal.

    2. Tingkat pengangguran terbuka adalah persentase jumlah pengangguran

    terhadap jumlah angkatan kerja.

    3. PDRB atas dasar harga berlaku yaitu nilai PDRB yang disusun atas dasar harga

    berlaku pada periode penyusunan.

    4. Angka partisipasi kasar SMA adalah proporsi anak sekolah pada jenjang SMA

    terhadap penduduk pada kelompok usia 16-18 tahun dimana sejak tahun 2007

    pendidikan non formal (Paket A, Paket B, dan Paket C) turut diperhitungkan.

    5. Gini ratio merupakan suatu ukuran kemerataan yang dihitung dengan

    membandingkan luas antara diagonal dan kurva lorenz (daerah A) dibagi

    dengan luas segitiga di bawah diagonal. Rasio gini digunakan untuk mengukur

    derajat ketidakmerataan pendapatan. Rasio Gini bernilai antara 0 dan 1. Nilai

    1 menunjukkan complete inequality atau perfectly inequal, koefisien Gini

    bernilai 0 menunjukkan adanya pemerataan pendapatan yang sempurna, atau

    setiap orang memiliki pendapatan yang sama.

  • 19

    BAB 3

    METODOLOGI PENELITIAN

    3.1 Sumber Data

    Penelitian ini menggunakan data sekunder tahun 2015 dari publikasi Badan

    Pusat Statistik Provinsi Jawa Timur dengan unit observasi meliputi 38

    kabupaten/kota di Provinsi Jawa Timur.

    3.2 Variabel Penelitian

    Variabel-variabel penelitian yang digunakan pada penelitian ini disajikan

    pada Tabel 3.1.

    Tabel 3.1 Variabel Penelitian

    Variabel Keterangan Variabel Skala Data (1)y

    PePersentase kemiskinan Rasio

    (2)y Pengeluaran per kapita makanan Rasio

    1x Angka partisipasi kasar SMA Rasio

    2x Gini ratio Rasio

    3x Tingkat Pengangguran Terbuka Rasio

    4x Rata-rata lama sekolah Rasio

    5x PDRB atas harga berlaku Rasio

    Adapun penjelasan dari variabel-variabel dalam penelitian ini adalah

    sebagai berikut.

    a. Variabel Respon

    Variabel respon yang digunakan pada penelitian ini adalah persentase

    kemiskinan dan pengeluaran per kapita makanan. Persentase kemiskinan yaitu

    persentase penduduk yang berada di bawah garis kemiskinan, sedangkan

    pengeluaran per kapita makanan yaitu biaya yang dikeluarkan untuk konsumsi

    semua anggota rumah tangga selama sebulan untuk makanan dibagi dengan

    banyaknya anggota rumah tangga tersebut.

  • 20

    b. Variabel Prediktor

    Varibel prediktor yang diduga mempengaruhi persentase kemiskinan dan

    indeks kedalaman kemiskinan pada penelitian ini terdapat lima variabel

    prediktor. Variabel prediktor tersebut adalah sebagai berikut.

    1. Rata-rata lama sekolah menggambarkan jumlah tahun yang digunakan oleh

    penduduk usia 15 tahun keatas dalam menjalani pendidikan formal.

    2. Tingkat pengangguran terbuka adalah persentase jumlah pengangguran

    terhadap jumlah angkatan kerja

    3. PDRB atas dasar harga berlaku yaitu nilai PDRB yang disusun atas dasar

    harga berlaku pada tahun perhitungan.

    4. Angka partisipasi Kasar SMA adalah proporsi anak sekolah pada jenjang

    SMA terhadap penduduk pada kelompok usia 16-18 tahun

    5. Gini ratio merupakan suatu ukuran kemerataan pendapatan yang dihitung

    dengan membandingkan luas antara diagonal dan kurva lorenz (daerah A)

    dibagi dengan luas segitiga di bawah diagonal.

    3.3 Struktur Data Penelitian

    Unit observasi yang digunakan dalam penelitian ini adalah sebanyak 38

    kabupaten/kota di Provinsi Jawa Timur dan banyaknya variabel prediktor terdiri

    dari lima variabel yang terdiri dari dua komponen parametrik dan tiga komponen

    nonparametrik. Sehingga, struktur data penelitian yang digunakan adalah sebagai

    berikut.

    Tabel 3.2 Struktur Data Penelitian

    Kabupaten/ Kota (1)y (2)y 1x 2x 3x 4x 5x

    1 (1)1y

    (2)

    1y 11x 21x 31x 41x 51x

    2 (1)2y

    (2)

    2y 12x 22x 32x 42x 52x

    38 (1)38y

    (2)

    38y 1(38)x 2(38)x 3(38)x 4(38)x 5(38)x

  • 21

    3.4 Langkah-Langkah Penelitian

    Langkah-langkah untuk menjawab tujuan penelitian dalam penelitian ini

    yaitu sebagai berikut :

    3.4.1 Kajian Interval Konfidensi untuk Parameter Model Regresi

    Semiparametrik Birespon dengan Pendekatan Spline Truncated

    1. Diberikan data berpasangan (1) (2)

    1 2 1 2( , ,.., , , ,.., , , )l qx x x t t t y y yang mengikuti

    model regresi :

    1 2( , ,.., ,l 1 2 qx x x t ,t ,..,t ) y f ε

    dengan :

    (d) (d) (d) (d)1 2, , 1, 2T

    ny y y d

    (1)

    (2)

    yy y

    y

    (1)

    1 2

    1 2 (2)

    1 2

    ( , ,.., ,( , ,.., ,

    ( , ,.., ,

    l 1 2 q

    l 1 2 q

    l 1 2 q

    x x x t ,t ,..,t )x x x t ,t ,..,t )

    x x x t ,t ,..,t )

    ff

    f,

    (d)

    1 1 2

    (d)

    2 1 2(d)

    1 2

    (d)

    1 2

    ( , ,.., ,

    ( , ,.., ,( , ,.., , , 1, 2

    ( , ,.., ,

    l 1 2 q

    l 1 2 q

    l 1 2 q

    n l 1 2 q

    f x x x t ,t ,..,t )

    f x x x t ,t ,..,t )x x x t ,t ,..,t ) d

    f x x x t ,t ,..,t )

    f

    1 (d) (d) (d)1 22

    , , 1, 2T

    d n d

    εε ε

    ε

    2. Model regresi multivariabel diasumsikan bersifat aditif

    1 2

    1 1

    ( , ,.., , ) ( ) ( )ql

    i i li 1i 2i qi j ji m mi i

    j m

    x x x t ,t ,..,t x t

    f g η ε

    dimana 1

    ( )l

    j ji

    j

    x

    g adalah komponen parametrik dan 1

    ( )q

    m mi

    m

    t

    η adalah

    komponen nonparametrik.

    3. Komponen parametrik 1

    ( )l

    j ji

    j

    g x

    dapat dihampiri dengan fungsi linier

    1

    1

    l

    j ji

    j

    x

    .

  • 22

    4. Komponen nonparametrik 1

    (t )q

    m mi

    m

    dihampiri menggunakan spline linier

    dengan r knot

    20 2 2( )1 1

    ( ) , 1, 2, , n;p r

    ph

    h mi p k mi k

    h k

    m mit t Kt i k=1,2,...,r

    5. Diberikan model regresi semiparametrik birespon multivariabel dengan

    pendekatan spline truncated linier mengikuti persamaan berikut.

    y = Cω +ε

    dengan C = X Z dan 1 2T

    T Tω ω ω

    (1) (2) ( )1 1 1 1 10 11 1;T T T Td

    l ω ω ω ω

    (1) (2)2 2 2T T T

    ω ω ω

    1 1 1 1 1

    ( )

    2 20 21 2 2( 1) 2( ) 21 2 2( 1) 2( )q q q q

    Td

    P P P r P P P r ω

    X merupakan matriks yang memuat prediktor komponen parametrik dan Z

    adalah matriks yang memuat komponen nonparametrik dengan ~ ( , )Nε 0 Σ

    6. Mendapatkan estimasi untuk parameter ω menggunakan metode Weighted

    Least Square dengan langkah-langkah sebagai berikut:

    i. Membentuk fungsi L

    ( )L T

    y - C ω W y - C ω

    ii. Meminimumkan persamaan L dengan menyelesaikan persamaan

    berikut.

    ( )0

    L

    ω

    ω

    iii. Mendapatkan estimasi dari ω yaitu ω̂ .

    7. Mencari distribusi dari ω̂ .

    8. Mencari Pivotal Quantity untuk parameter ω̂ .

    Misalkan 1 2 ,( , ,.., )1 2 qv l t ,t ,..,tQ x x x

    Pivotal Quantity untuk parameter

    (1) (2)

    1 1

    2 2 2q q

    m m

    m m

    v r r,v=1,2,..., l+ q

    .

  • 23

    9. Menyelesaikan persamaan dalam probabilitas

    (1) ( 2 )1 1

    1 2 .( , ) 1 , 1, 2,..... 2 2, ,..,q q

    m m

    m m

    v v 1 2 q vl r rP a Q t ,t ,..,t b v l + qx x x

    10. Menghitung panjang interval konfidensi 1 yaitu :

    ,v va b

    11. Membentuk fungsi Lagrange :

    , , ( , ) ( ) ( ) (1 )v v v v v vG a b a b b a

    dimana fungsi kumulatif distribusi dari pivotal quantity, dan konstanta

    Lagrange.

    12. Melakukan optimasi terhadap fungsi Lagrange dengan menghitung

    derivatif parsial:

    , ,0

    v v

    v

    G a b

    a

    , ,0

    dv dv

    dv

    G a b

    b

    , ,0

    dv dvG a b

    13. Dari langkah (13) diatas diperoleh interval konfidensi (1 ) 100% untuk

    parameter v .

    3.4.2 Aplikasi pada Data Persentase Kemiskinan dan Pengeluaran per Kapita

    Makanan di Jawa Timur

    Tujuan kedua dari tesis ini yaitu mengestimasi model data kemiskinan di

    Provinsi Jawa Timur dan mengetahui variabel-variabel yang berpengaruh

    menggunakan interval konfidensi parameter model regresi semiparametrik

    birespon dengan pendekatan spline truncated. Untuk menjawab tujuan kedua,

    dilakukan langkah-langkah sebagai berikut :

    1. Menguji korelasi variabel persentase kemiskinan dan pengeluaran per

    kapita makanan.

    2. Membuat scatter plot antara variabel respon dengan variabel prediktor.

  • 24

    3. Menentukan variabel komponen parametrik berdasarkan pola data antara

    variabel respon dan prediktor.

    4. Menentukan variabel komponen nonparametrik berdasarkan pola data

    antara variabel respon dan variabel prediktor.

    5. Memodelkan data menggunakan regresi semiparametrik birespon spline

    truncated linier, dimana spline yang digunakan adalah satu knot, dua knot,

    tiga knot dan kombinasi knot.

    6. Memilih titik knot optimal dengan metode GCV.

    7. Menghitung MSE dan R2 sebagai bagian dari kriteria kebaikan model.

    8. Menghitung interval konfidensi untuk parameter model regresi

    semiparametrik birespon dengan pendekatan spline truncated linier.

    9. Mengambil kesimpulan dengan menentukan variabel prediktor yang

    berpengaruh secara signifikan terhadap variabel respon.

  • 25

    BAB 4

    PEMBAHASAN

    4.1 Kajian Interval Konfidensi untuk Parameter Model Regresi

    Semiparametrik Birespon dengan Pendekatan Spline Truncated

    Konstruksi interval konfidensi dapat dilakukan dengan beberapa

    pendekatan, salah satu pendekatan adalah Pivotal Quantity. Pivotal Quantity

    merupakan sebuah statistik yang fungsi distribusinya tidak memuat parameter.

    Langkah yang harus dilakukan untuk mendapatkan interval konfidensi untuk

    parameter model regresi yaitu mendapatkan estimasi dari parameter dan mencari

    distribusi dari parameter. Pengestimasian parameter regresi birespon

    semiparametrik dengan pendekatan spline truncated dalam penelitian ini dibahas

    dengan menggunakan metode Weighted Least Square.

    Diberikan data berpasangan (1) (2)

    1 2 1 2( , ,.., , , ,.., , , )l qx x x t t t y y yang mengikuti

    model regresi :

    1 2( , ,.., ,l 1 2 qx x x t ,t ,..,t ) y f ε (4.1)

    dengan :

    (d) (d) (d) (d)1 2, , 1, 2T

    ny y y d

    (1)

    (2)

    yy y

    y

    (1)

    1 2

    1 2 (2)

    1 2

    ( , ,.., ,( , ,.., ,

    ( , ,.., ,

    l 1 2 q

    l 1 2 q

    l 1 2 q

    x x x t ,t ,..,t )x x x t ,t ,..,t )

    x x x t ,t ,..,t )

    ff

    f

    (d)

    1 1 2

    (d)

    2 1 2(d)

    1 2

    (d)

    1 2

    ( , ,.., ,

    ( , ,.., ,( , ,.., , , 1, 2

    ( , ,.., ,

    l 1 2 q

    l 1 2 q

    l 1 2 q

    n l 1 2 q

    f x x x t ,t ,..,t )

    f x x x t ,t ,..,t )x x x t ,t ,..,t ) d

    f x x x t ,t ,..,t )

    f

    (1)

    ( ) (d) (d) (d)

    1 2(2), , 1, 2

    Td

    n d

    εε ε

    ε.

    Model regresi pada persamaan 4.1 diasumsikan bersifat aditif dengan penjabaran

    sebagai berikut.

  • 26

    1 2

    0 0

    ( , ,.., , ) ( ) ( )ql

    i i li 1i 2i qi j ji m mi

    j m

    x x x t ,t ,..,t x t

    f g η (4.2)

    dimana 1

    ( )l

    j ji

    j

    x

    g adalah komponen parametrik dengan banyaknya variabel

    prediktor sejumlah l dan 1

    ( )q

    m mi

    m

    t

    η adalah komponen nonparametrik dengan

    banyaknya variabel prediktor sejumlah q. Kurva komponen parametrik dengan l

    variabel prediktor didekati dengan fungsi linier

    10 11 1 12 1 1

    0

    ( ) ...l

    j ji i i l li

    j

    x x x x

    g ω ω ω ω (4.3)

    dengan

    (1)

    (2)( )

    ji

    ji

    ji

    g (x )x

    g (x )

    g

    (1)

    1

    1 (2)

    1

    , 0,1, 2,...,j

    j

    j

    j l

    ω

    dimana , 1,2,...,j j l merupakan parameter komponen parametrik linier. Persamaan

    (4.3) dapat dinyatakan dalam bentuk matriks menjadi

    1 2 1( , ,..., )lx x x g Xω (4.4)

    dengan

    (1)

    1 2 (2)( , ,..., ) 1 2 ll

    1 2 l

    (x ,x ,...,x )x x x

    (x ,x ,...,x )

    gg

    g

    (d)

    1 1 1

    (d)

    (d) 2 2 2

    (d)

    ln

    , d 1,2

    1 2 l

    1 2 l

    1 2 l

    1n 2n

    g (x ,x ,...,x )

    g (x ,x ,...,x )(x ,x ,...,x )

    g (x ,x ,...,x )

    g

    11 21 1

    (1)12 22 2(1) (2)

    (2)

    1 2 2

    1

    10,

    0

    1

    l

    l

    n n l

    x x x

    x x x

    x x x

    XX X X

    X

  • 27

    Kurva komponen nonparametrik dengan q variabel prediktor didekati dengan

    fungsi spline truncated linier. ( )mitη merupakan suatu vektor yang terdiri dari fungsi

    spline truncated untuk variabel prediktor ke-m pada respon 1 dan respon 2

    (d) (d) (d) (d) (d) (d) (d) (d) (d)

    20 21 22 1 23 2 2( 1)(t ) t (t ) (t ) ... (t )m m m m mm mi mi mi m mi m r mi rmK K K

    (d) (d) (d) (d)

    20 21 2( 1)

    1

    = t (t )m m m

    r

    mi k mi km

    k

    K

    (4.5)

    dengan (d) (d)

    (d)

    (d)

    (t ), t(t )

    0 , t

    mi km mi km

    mi km

    mi km

    K KK

    K

    .

    Sehingga ( )

    1

    ( )q

    d

    m mi

    m

    t

    dapat dituliskan kembali sebagai berikut.

    ( ) (d) (d) (d)

    21 2( 1)

    1 1 1 1

    ( ) t (t )d

    m m

    rq q qd

    m mi mi k mi km

    m m m k

    t K

    (4.6)

    Persamaan (4.6) dapat dituliskan dalam notasi matriks pada persamaan (4.7).

    ( ) ( ) ( )( )

    d d dη t Z ω (4.7)

    Persamaan (4.7) merupakan fungsi regresi nonparametik yang didekati dengan

    spline truncated linier untuk variabel respon ke-d, penulisan untuk fungsi regresi

    birespon dapat dituliskan dalam persamaan (4.8).

    2( )t η Zω (4.8)

    dengan

    (1) (2)( ) ( ) ( )T

    η t η t η t ,

    (d)

    1 1 1

    (d)

    2 2 2(d)

    (d)

    , d 1,2

    1 2 q

    1 2 q

    1n tn qn

    (t ,t ,...,t )

    (t ,t ,...,t )( )

    (t ,t ,...,t )

    η t

    (1)

    (2)

    0,

    0

    Z

    ZZ

  • 28

    1 1 111 11 11

    (d) 2 2 112 12 12

    1 1 1 1

    (d) (d)(d) (d)111 1(d) (d)(d) (d)111 1

    (d) (d) (d) (d)11 1 1

    (t ) (t )(t ) (t )

    (t ) (t )(t ) (t )

    (t ) (t ) (t ) (t )

    q q q

    q q q

    n n n qn qn q

    tt q qrr

    tt q qrr

    t tr q qr

    K KK K

    K KK K

    K K K K

    Z

    (1) (2)2 2T

    ω ωω

    1 1 2 21 2( )2 21 22 21 22 21 222( 1) 2( 1) 2( 1) q q qdT

    r r r ω

    Pada persamaan (4.3) dan (4.6), masing-masing telah diberikan fungsi regresi

    untuk komponen parametrik dan fungsi regresi dengan pendekatan spline truncated

    untuk komponen nonparametrik, kedua persamaan tersebut ditulis kembali dengan

    berdasarkan persamaan (4.2) dan (4.1) pada persamaan (4.9) berikut.

    1

    2

    (1) (1) (1) (1) (1) (1) (1) (1)

    10 0 11 1 1 21 2( 1)

    1 1 1

    (2) (2) (2) (2) (2) (2) (2) (2)

    10 0 11 1 1 21 2( 1)

    1 1 1

    ... t (t )

    ... t (t )

    m m

    m m

    rq q

    i i i l li mi k mi km i

    m m k

    rq q

    i i i l li mi k mi km i

    m m k

    y x x x K

    y x x x K

    (4.9)

    untuk setiap pengamatan ke-i, i=1,2,...,n. (1)

    iy merupakan variabel respon

    pengamatan ke-i pada respon pertama, sedangkan (2)

    iy merupakan variabel respon

    pengamatan ke-i pada respon ke dua . Persamaan (4.9) dapat ditulis kembali dalam

    notasi matriks menjadi:

    1 2 y Xω Zω ε (4.10)

    Karena adanya syarat terpenuhinya korelasi antara variabel respon satu dengan dua,

    maka dibutuhkan matriks pembobot variansi kovariansi dalam mengestimasi

    regresi semiparametrik birespon berdasarkan estimator spline truncated dengan

    meminimumkan kriteria Weighted Least Square (WLS) yaitu dengan

    meminimumkan fungsi berikut:

    1 2 1 2L T

    Xω Zω Xωy W y Zω= (4.11)

    dengan memisalkan 1* y y Xω dengan mengasumsikan 1ω diketahui maka

    persamaan (4.11) dapat ditulis kembali pada persamaan (4.12) berikut.

  • 29

    2 2* *L T

    ω W yZy Zω= (4.12)

    Persamaan (4.12) dapat diuraikan sebagai berikut.

    2 2

    *

    *

    2

    L

    T

    T T

    T

    T T T T

    2 2 2 2

    T T T T

    2 2 2

    = y W y

    y * Wy *-y * W y

    Zω Zω

    Zω - ω Z W ω Z WZω

    ω Z W

    * +

    y * Wy * ω+ Z* WZωy

    (4.13)

    Nilai 2ω̂ dapat diperoleh dengan meminimumkan persamaan (4.13). Syarat

    perlu agar persamaan (4.13) mencapai minimum adalah dengan memenuhi

    2

    0L

    ω

    , sehingga diperoleh :

    2

    2

    2

    1

    2

    *

    *

    2 0

    0

    ˆ

    L

    T

    T

    T

    T

    T

    T

    T

    T

    Wy * 2Zω

    Wy *

    Wy

    Z Z Wy

    - Z WZω

    - Z Z WZω

    Z WZω Z

    ω WZ

    (4.14)

    Berdasarkan persamaan (4.10) dan (4.14) dengan memisalkan 1* y y Xω maka

    didapatkan nilai dugaan dari *y yaitu ˆ *y dinyatakan pada persamaan (4.15).

    2ˆ* *y A y (4.15)

    dengan 2A merupakan matriks hat untuk komponen nonparametrik yaitu

    1

    2

    TTA Z WZ ZWZ .

    Mengacu pada persamaan (4.11), nilai dugaan untuk 1ω didapat dengan

    pendiferensialan fungsi L dengan menggunakan metode WLS dengan penguraian

    fungsi L sebagai berikut.

  • 30

    1 2 1 2

    2 2 2

    1 2 1 1 2

    2

    2 2 2 2

    2 21 1 2 2

    2

    1

    ( ) ( )

    T

    T T T

    T T T

    T T

    T

    T

    T

    L

    1

    T

    1

    T

    T

    1

    1

    = y W y

    y y W y y

    (I - A )y - (I - A ) W (I - A )y - (I - A )

    y (I - A ) W(I - A )y y (I - A

    Xω Zω Xω Zω

    ) W(I - A )

    (I - A ) W(I - A )y (I - A ) W(I - A )

    Xω Xω Xω

    Xω Xω

    ω

    y (I - A

    X ω

    W

    X

    (

    X

    )

    ω

    A A

    12 2 2

    21 2

    2

    T T

    T T

    T

    T

    1

    I - A )y (I - A ) W(I - A )y

    (I - A ) W(

    ω X

    I - Aω )X Xω

    (4.16)

    Selanjutnya, Syarat perlu agar persamaan (4.16) mencapai minimum adalah

    dengan memenuhi 1

    0L

    ω

    , sehingga diperoleh :

    2 2 2 2

    2 2 2 2

    2 2 2 2

    1

    2 0

    0

    2

    T T

    T T

    T T

    T

    T T

    TTT

    L

    1

    1

    1

    (I - A ) W(I - A )y (I - A ) W(I - A )

    (I - A ) W(I - A )y (I - A ) W(I - A )

    (

    X X Xωω

    X

    I - A ) W(I - A ) (

    X Xω

    X Xω I - A ) W(I - AX )y

    2 2 21

    2ˆ T TT T

    1 (I - A ) W(I - A ) (I - A ) W(I -X X X Aω )y (4.17)

    Setelah mendapatkan nilai dugaan dari parameter 1ω dan 2ω , selanjutnya

    didapatkan persamaan untuk menghitung ŷ dengan mensubtitusikan nilai 1ω̂ dan

    2ω̂ sebagai berikut.

    1

    1

    2 2 2 2

    2

    1 2

    1

    1

    2 2 2

    *

    ˆ ˆ ˆ

    T T

    T

    T T

    T T T

    T T

    T T

    T

    T

    Z Z W y

    Z Z W

    Xω Zy

    (I - A ) W(I - A ) (I - A ) W(I - A )y Z WZ

    (I - A ) W(I - A ) (I - A ) W(

    ω

    X X X X

    X X X X I - A )y Z WZ

    21

    2 2 2

    T T T T

    X X Xy X (I - A ) W(I - A ) (I - A ) W(I - A )y (4.18)

    Misalkan 21

    1 2 2 2

    T TT T

    (I - A ) W(I - A )A X X (I - A ) WX (I - AX ) merupakan

    matriks hat untuk komponen parametrik, sehingga persamaan (4.18) dapat ditulis

    kembali pada persamaan (4.19).

  • 31

    =

    ˆ

    I

    I

    I

    -1T T

    -1T T

    -1T T

    T

    1 1

    1 1

    1 1

    1 1

    T

    T

    2

    Z Z W

    Z Z W

    Z Z W

    A Ay y + Z WZ y - y

    y + Z WZ - y

    Z WZ -

    A A

    A

    A

    A

    A - A

    y

    y

    (4.19)

    Jika I 1 12A A -A A , maka persamaan (4.19) dapat ditulis dalam bentuk lain

    berikut.

    ˆ y Ay (4.20)

    dengan A merupakan matriks hat gabungan antara komponen parametrik dan

    nonparametrik atau dapat disebut matriks hat semiparametrik.

    Untuk memudahkan konstruksi interval konfidensi untuk parameter regresi

    birespon semiparametrik, persamaan (4.10) dapat disederhanakan pada persamaan

    (4.21) berikut.

    y Cω ε (4.21)

    dengan X ZC dan 1 2T

    T T ω ωω .

    Teorema 7.

    Jika diberikan ( , )f x,t ω Cω merupakan fungsi dari x, t , dan ω dimana

    ( , )f x,t ω merupakan fungsi regresi semiparametrik birespon, maka

    1

    ˆ

    TT

    C Wyω C WC merupakan penduga dari ω .

    Bukti.

    Nilai ω̂ didapatkan dengan metode WLS yaitu sebagai berikut.

    2

    T T T T

    T TT T

    T

    T

    T

    L

    Tω ω

    ω C ω

    = y C W y C

    y ω C ω

    ω C

    Wy Wy y WC WC

    y Wy W ω Cy WCω

    dengan menderivatifkan 0L

    ω, didapat:

  • 32

    1

    2

    ˆ

    2

    0

    T T

    T T

    T T

    T T

    L

    C C ωω

    C C ω

    C ω C

    ω

    Wy WC

    Wy WC

    WC Wy

    WCC C Wy

    sehingga

    1

    ˆ

    TT C Wyω C WC (4.22)

    Lemma 1.

    Jika 2 1

    ~ ( , )N

    ε 0 W , sehingga 2 1

    ~ ( , )N

    Cωy W , maka 2 1ˆ ~ ( , )( )N Tω ω C WC .

    Bukti :

    Model pada persamaan (4.21) dengan asumsi 2 1

    ~ ( , )N

    ε 0 W maka

    2 1~ ( , )N

    Cωy W , oleh karena y berdistribusi normal, maka persamaan (4.22)

    yang merupakan kombinasi linier dari y juga berdistribusi normal dengan nilai

    harapan dan variansinya dicari berikut.

    1

    1

    1

    = ( )

    ˆ

    =

    E

    E

    E

    T

    T

    T

    T

    T

    T

    C Wy

    C W y

    C W

    ω C WC

    C WC

    C WC Cω

    ω

    (4.23)

    1

    1 1

    1 12 1

    1 12

    12

    ( )

    ˆ

    T

    T

    Var

    Var

    I

    Var

    T

    T T

    T T

    T

    T

    T T

    T T

    T T

    T

    C Wy

    C W y C W

    C W W C W

    C

    ω C WC

    C WC C WC

    C WC C WC

    C WC WC C WC

    C WC

    (4.24)

  • 33

    Dengan memperhatikan persamaan (4.23) dan (4.24), maka ˆ ~ ( , )Nω ω Σ , dengan

    1

    2

    TΣ C WC . Selanjutnya, akan dirancang interval konfidensi (1 ) 100%x

    untuk v , (1) (2)

    1 1

    1, 2,..., (2 2 2 )q q

    m m

    m m

    v l q r r

    untuk kasus variansi error (

    2 1 W ) diketahui dan variansi error ( 2 1 W ) tidak diketahui.

    4.1.1 Interval Konfidensi Saat Asumsi Variansi Error ( 2 1 W ) Diketahui

    Pada subbab ini dibahas mengenai konstruksi interval konfidensi terpendek

    (1 ) 100%x untuk v , (1) (2)

    1 1

    1, 2,..., (2 2 2 )q q

    m m

    m m

    v l q r r

    untuk kasus

    variansi error ( 2 1 W ) diketahui.

    Teorema 8.

    Jika 1 2 1 2

    ˆ( , , ..., , t , t , ..., t )

    v v

    v l l

    vv

    Z x x x

    ω ω

    merupakan suatu pivotal quantity dengan

    asumsi variansi eror diketahui , maka interval konfidensi untuk v

    ω diberikan oleh:

    /2 /2ˆ ˆ( ) 1

    v vv v v vvP Z Z

    ω ω ω .

    Bukti:

    Diambil sebuah transformasi yang merupakan pivotal quantity dengan

    asumsi variansi eror diketahui:

    1 2 1 2

    ˆ( , ,..., , t , t ,..., t ) v vv l l

    vv

    Z x x x

    ω ω (4.25)

    dengan vv merupakan elemen diagonal ke-v dari Σ . Variabel random Z ~ (0,1)v N

    karena merupakan kombinasi linier dari ˆ vω dengan pembuktian nilai ekspektasi

    dan variansinya sebagai berikut.

    ˆ

    0

    E Z E

    E E

    v vv

    vv

    v v

    vv

    ω ω

    ω ω

  • 34

    2

    ˆ

    1 0

    1

    Z v vvvv

    v v

    vv

    vv

    vv

    Var Var

    Var Var

    ω ω

    ω ω

    Karena Σ diketahui maka Zv merupakan pivotal quantity untuk parameter regresi

    ˆ .vω Interval konfidensi (1 ) dapat diperoleh dengan menyelesaikan persamaan

    dalam probabilitas

    1 2 1 2 l( ( , ,..., , t , t ,..., t ) ) 1v v l vP a Z x x x b

    dengan va dan vb merupakan elemen bilangan riil, v va b . Apabila persamaan

    (4.25) disubstitusi pada persamaan (4.26), maka bentuknya menjadi

    ˆ( ) 1v vv v

    vv

    P a b

    ω ω (4.26)

    Persamaan (4.26) jika ditulis kembali akan didapatkan interval konfidensi untuk

    parameter model regresi birespon semiparametrik berikut:

    ˆ ˆ( ) 1v v vv v v v vvP b a ω ω ω (4.27)

    Konsep yang digunakan pada penelitian ini yaitu interval konfidensi terpendek

    sehingga nilai va dan vb harus ditentukan dan memenuhi kondisi dimana panjang

    interval konfidensi ( ( , )v va b ) terpendek didapatkan. Interval konfidensi terpendek

    didapat dengan menyelesaikan optimasi bersyarat berikut dengan metode lagrange

    , ,{ ( )} {( ) }

    v v v v vv

    v v v va b R a b Ra ,b a bMin Min

    (4.28)

    dengan syarat

    ( ) 1v

    v

    b

    v va

    z dz atau ( ) ( ) (1 ) 0v vb a

    merupakan fungsi probabilitas (0,1)N dan merupakan fungsi probabilitas

    kumulatif (0,1)N . Langkah selanjutnya untuk mendapatkan nilai va dan vb maka

  • 35

    dilakukan derivatif parsial terhadap fungsi Langrange yang dibentuk pada

    persamaan (4.29)

    ( , , ) ( ) ( ( ) ( ) (1 ))v v v v vv v vF a b b a b a (4.29)

    dengan merupakan konstanta lagrange. Berikut adalah derivatif parsial fungsi

    lagrange pada persamaan (4.29) terhadap masing-masing , ,v va b dan .

    ( , , )

    '( ) 0v v vv vv

    F a ba

    a

    (4.30)

    ( , , )

    '( ) 0v v vv vv

    F a bb

    b

    (4.31)

    ( , , )( ) ( ) (1 ) 0v v v v

    v

    F a bb a

    b

    (4.32)

    Berdasarkan persamaan (4.30) dan (4.31) diperoleh

    '( ) 0

    '( ) 0

    '( ) '( ) 0

    '( ) '( ) 0

    ( ) ( )

    vv v

    vv v

    v v

    v v

    v v

    a

    b

    b a

    b a

    b a

    (4.32)

    Penyelesaian persamaan (4.32) adalah v vb a atau v vb a , tetapi penyelesaian

    yang memenuhi kondisi distribusi normal standar yaitu v vb a sehingga jika

    penyelesaian tersebut disubstitusikan pada persamaan (4.27) maka persamaan

    tersebut dapat ditulis kembali menjadi

    ˆ ˆ( ) 1v v vv v v v vvP b b ω ω ω (4.33)

    dimana vb diperoleh dari ( )2v

    v vb

    z dz

    atau dalam aplikasi sering ditulis dengan

    2

    Z yang nilainya dapat dilihat dalam tabel distribusi normal standar sehingga

    persamaan (4.33) dapat ditulis kembali pada persamaan (4.34).

    /2 /2ˆ ˆ( ) 1v vv v v vvP Z Z ω ω ω (4.34)

  • 36

    4.1.2 Interval Konfidensi Saat Asumsi Variansi Error ( 2 1 W ) Tidak

    Diketahui

    Pada subbab ini dibahas mengenai konstruksi interval konfidensi terpendek

    (1 ) 100%x untuk v , (1) (2)

    1 1

    1, 2,..., (2 2 )q q

    m m

    m m

    v l q r r

    untuk kasus variansi

    error ( 2 1 W ) tidak diketahui.

    Teorema 9.

    Jika 1 2 1 2

    2

    ˆ( , ,..., , t , t ,..., t ) v vv l l

    vv

    T x x xr

    ω ω merupakan suatu pivotal quantity dengan

    asumsi variansi eror ( 2 1 W ) tidak diketahui, maka interval konfidensi untuk vω

    adalah:

    1 1

    , ,2 2

    ˆ ˆ( ) 1

    T T

    vv vvv v vc cc c

    r rP t t

    T TT Ty C W y y CI - C I - C W yC WC C WC

    ω ω ω

    dengan (1) (2)

    1 1

    2 2 2 2q q

    m m

    m m

    c n l q r r

    .

    Bukti:

    Pivotal quantity dengan asumsi 2 1 W tidak diketahui didapatkan pada

    persamaan (4.36).

    1 2 1 22

    ˆ( , ,..., , t , t ,..., t ) v vv l l

    vv

    T x x xr

    ω ω (4.36)

    di mana vvr merupakan elemen diagonal ke v dari matriks 1

    TC WC . Variabel

    random ( )~ aB

    T tA

    a

    , jika dan hanya jika memenuhi tiga syarat yaitu ~ (0,1)B N

    , ( )A ~ a , dan A dan B independen. Persamaan (4.36) agar menyerupai bentuk

    BT

    A

    a

    dapat diubah menjadi persamaan (4.37) berikut.

  • 37

    1 2 1 22

    2

    ( , ,..., , t , t ,..., t )1

    ˆ

    vvv vv l l

    vvvv

    v v

    vv

    rT x x x x

    rr

    r

    ω ω

    ω ω (4.37)

    Karena 2 tidak diketahui, maka nilai 2 didekati dengan MSE.

    1 1

    (1) (2)

    1 1

    (1) (2)

    1 1

    (1) (2)

    1 1

    2 2 2 2

    ˆ ˆ

    2 2 2 2

    ˆ ˆ

    2 2 2 2

    q q

    m m

    m m

    q q

    m m

    m m

    q q

    m m

    m m

    n l q r r

    MSE

    n l q r r

    n l q r r

    T TT

    T

    T

    T

    Ty - C C Wy C yy C W-

    (y - y

    C WC C WC

    ) (y - y)

    (y - Cω) (y - Cω)

    1

    (

    1

    1

    1) (2)

    1 1

    (1) (2)

    1 1

    1

    2 2 2 2

    2 2 2 2

    q q

    m m

    m m

    T

    q q

    m m

    m

    T

    m

    n l q r r

    n l q r r

    T T

    T

    T

    T

    T T

    T T

    C W y C W y

    y C W

    I - C I -

    C W y

    C

    I - C I - C

    C WC C WC

    C WC C WC

    (4.38)

    Matriks T T T

    y A Ay y Ay jika A merupakan matriks idempoten, matriks A pada

    persamaan (4.38) yaitu 1

    TT CA C WI - C WC . Berikut adalah pembuktian

    matriks A merupakan matriks idempoten sesuai dengan Teorema 2 :

    1 1

    1 1 1

    1 1

    2

    2

    T T

    T T T

    T T

    T T

    T T T

    T T

    AA I C I C

    I C C C

    I C

    C W C W

    C W C W C W

    C W C WCI

    C WC C WC

    C WC C WC C WC

    C WC C WC

    `

    1

    TT C WI C C WC (4.39)

  • 38

    Matriks A terbukti merupakan matriks idempoten sehingga persamaan (4.38) dapat

    ditulis kembali pada persamaan (4.40).

    (1) (2

    1 1

    1

    )2 2 2 2

    q q

    m m

    m m

    T

    n l q r r

    MSE

    TTyI Cy C- WC WC

    (4.40)

    Mengacu pada persamaan (4.37) dan (4.40), maka pivotal quantity untuk parameter

    ˆvω adalah sebagai berikut:

    (1) (2)

    1

    1

    1

    1 2 1 2

    2 2 2 2

    ˆ

    ( , ,..., , t , t ,..., t )T

    q q

    m m

    m m

    v v

    vv

    v l l

    n l q r r

    rT x x x

    TTI - Cy C W yC WC

    ω ω

    2

    1

    2

    (1) (2)

    1 1

    ˆ

    2 2 2 2

    T

    v v

    vv

    q q

    m m

    m m

    r

    n l q r r

    TTI - Cy C W yC WC

    ω ω

    (4.41)

    Selanjutnya, akan dibuktikan bahwa 1 2 1 2 ( )( , ,..., , t , t ,..., t ) ~v l l aT x x x t dengan

    derajat bebas (1) (2)

    1 1

    2 2 2 2q q

    m m

    m m

    n l q r r

    .

    1. Misalkan 2

    ˆv v

    vv

    Zr

    ω ω, karena Z merupakan kombinasi linier dari ˆ vω , maka Z

    berdistribusi normal dengan mean ( )E Z dan Var( )Z :

    2

    2

    2

    ˆ( )

    1

    0

    v v

    vv

    v v

    vv

    v v

    vv

    E Z Er

    Er

    r

    ω ω

    ω ω

    ω ω

  • 39

    2

    2

    2

    2

    ˆ( )

    1

    v v

    vv

    v v

    vv

    vv

    vv

    Var Z Varr

    Varr

    r

    r

    ω ω

    ω ω

    Sehingga terbukti bahwa Z ~ (0,1)N .

    2. Jika 2 1~ ( , )N y Cω W , sesuai dengan Teorema 5, maka

    2

    2

    12,2

    ~h

    T

    T

    Cω ACω

    y Ayjika dan hanya jika A idempoten dengan h adalah rank

    dari A. Pembuktian bahwa A idempoten telah dibuktikan pada persamaan

    (4.39). Selanjutnya, dicari rank dari A.

    (1) ( 2)

    1 1

    2

    2

    1

    1

    1

    1

    2 2

    ( )

    ( )

    2

    2

    q q

    m m

    m m

    n

    l q r r

    rank rank

    trace

    trace trace

    n trace

    n trace I

    T

    T

    T

    T

    T

    T

    T

    T

    A I - C C W

    C W

    C

    I - C

    I C W

    C CW

    C WC

    C WC

    C WC

    C WC

    (1) (2)

    1 1

    2 2 2 2q q

    m m

    m m

    n l q r r

    Setelah mendapatkan rank dari A, akan dihitung 2

    1( )

    2

    T

    Cω ACω

    1

    1

    2 2

    2

    2

    1 1( ) ( )

    2 2

    1

    2

    1

    2

    0

    T T

    T T T T

    T T T T

    T

    T

    T

    T

    Cω ACω Cω I - C Cω

    ω C

    C

    Cω ω C C Cω

    ω C C

    W

    C W

    ω ω C CIω

    C WC

    C WC

  • 40

    Sehingga (1) ( 2)

    2 2 2 2

    1 1

    ~q q

    n l q r rm mm m

    Ty Ay .

    3. Jika 2~ ( , )N y Cω W maka By dan

    Ty Ay independen sesuai dengan Teorema 6

    jika dan hanya jika 0BA , dengan 1

    ˆ

    TT C Wy Byω C WC sehingga

    1

    TTB C WC WC

    1 1

    1 1 1

    1 1

    0

    T T

    T T T

    T T

    T T

    T T T

    T T

    C W C W

    C W C W C W

    B

    C W C W

    A I - C

    C

    C WC C WC

    C WC C WC C WC

    C WC C WC

    Berdasarkan uraian tersebut pada poin 1, 2, dan 3 dapat ditarik kesimpulan bahwa

    (1) ( 2)

    1 1

    (2n 2 2 2 )

    ~ q qm m

    m m

    vl q r r

    T t

    dan merupakan pivotal quantity untuk parameter model

    regresi ω̂ saat 2σ W tidak diketahui. Interval konfidensi (1 ) dapat diperoleh

    dengan menyelesaikan persamaan dalam probabilitas

    1 2 1 2 l( ( , ,..., , t , t ,..., t ) ) 1v v l vP a T x x x b

    dengan va dan vb merupakan elemen bilangan riil, v va b . Apabila persamaan

    (4.41) disubstitusi pada persamaan (4.42) maka interval konfidensi dapat ditulis

    sebagai berikut.

    1

    (1) (2)

    1 1

    ˆ( ) 1

    2 2 2 2

    T

    v vv v

    vvq q

    m m

    m m

    P a b

    r

    n l q r r

    TTI - Cy C W y

    ω

    WC

    ω

    C

    (4.42)

    Persamaan (4.42) jika ditulis kembali akan didapatkan interval konfidensi untuk

    parameter model regresi birespon semiparametrik berikut:

  • 41

    1

    1

    (1) (2)

    1 1

    (1) (2)

    1 1

    ˆ(

    2 2 2 2

    ˆ ) 1

    2 2 2 2

    T

    T

    v v vv vq q

    m m

    m m

    v v vvq q

    m m

    m m

    P b r

    n l q r r

    a r

    n l q r r

    T

    T

    T

    T

    I -y C W y

    y C W y

    C

    I - C

    C WC

    C WC

    ω ω

    ω

    (4.43)

    Konsep yang digunakan pada penelitian ini yaitu interval konfidensi terpendek

    sehingga nilai va dan vb harus ditentukan dan memenuhi kondisi dimana panjang

    interval konfidensi ( ( , )v va b ) terpendek didapatkan. Interval konfidensi terpendek

    didapat dengan menyelesaikan optimasi bersyarat berikut dengan metode lagrange

    1

    (1) (2)

    1 1

    , ,{ ( )} ( )

    2 2 2 2

    v v v v

    v v v

    T

    v

    vvq q

    m m

    m m

    a b R a b Ra ,b a b r

    n l q r r

    Min Min

    TTI - CCy W yC WC

    (4.44)

    dengan syarat

    (t ) 1v

    v

    b

    v va

    dt atau ( ) ( )