perpustakaan.uns.ac.id digilib.uns.ac... · pemilihan model regresi linear terbaik adalah memilih...

38
PEMILIHAN MODEL REGRESI TERBAIK DENGAN BAYESIAN INFORMATION CRITERION (BIC) oleh NURUL KUSTINAH M0106057 SKRIPSI ditulis dan diajukan untuk memenuhi sebagian persyaratan memperoleh gelar Sarjana Sains Matematika FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS SEBELAS MARET SURAKARTA 2012 perpustakaan.uns.ac.id digilib.uns.ac.id commit to user

Upload: trinhdat

Post on 25-Mar-2019

226 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: perpustakaan.uns.ac.id digilib.uns.ac... · Pemilihan model regresi linear terbaik adalah memilih model regresi linear ... menentukan variansi dan kovariansi yang asimtotik dari estimator

PEMILIHAN MODEL REGRESI TERBAIK DENGAN

BAYESIAN INFORMATION CRITERION (BIC)

oleh

NURUL KUSTINAH

M0106057

SKRIPSI

ditulis dan diajukan untuk memenuhi sebagian persyaratan

memperoleh gelar Sarjana Sains Matematika

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

UNIVERSITAS SEBELAS MARET SURAKARTA

2012

perpustakaan.uns.ac.id digilib.uns.ac.id

commit to user

Page 2: perpustakaan.uns.ac.id digilib.uns.ac... · Pemilihan model regresi linear terbaik adalah memilih model regresi linear ... menentukan variansi dan kovariansi yang asimtotik dari estimator

ii

SKRIPSI

PEMILIHAN MODEL REGRESI TERBAIK DENGAN

BAYESIAN INFORMATION CRITERION (BIC)

yang disiapkan dan disusun oleh NURUL KUSTINAH

M0106057

dibimbing oleh Pembimbing I

Dra. Yuliana Susanti, M.Si

NIP. 19611219 198703 2 001

Pembimbing II

Bowo Winarno, S.Si, M.Kom

NIP. 19810430 200812 1 001

telah dipertahankan di depan Dewan Penguji

pada hari Senin, 2 Januari 2012

dan dinyatakan telah memenuhi syarat.

Anggota Tim Penguji

1. Dra. Respatiwulan, M.Si

NIP. 19680611 199302 2 001

2. Drs. Siswanto, M.Si

NIP. 19670813 199203 1 002

Tanda Tangan

1.

2.

Surakarta, 2 Januari 2012

Disahkan oleh

Fakultas Matematika dan Ilmu Pengetahuan Alam

Dekan

Ir. Ari Handono Ramelan, MSc., PhD

NIP. 19610223 198601 1 001

Ketua Jurusan Matematika

Irwan Susanto, DEA

NIP. 19710511 199512 1 001

perpustakaan.uns.ac.id digilib.uns.ac.id

commit to user

Page 3: perpustakaan.uns.ac.id digilib.uns.ac... · Pemilihan model regresi linear terbaik adalah memilih model regresi linear ... menentukan variansi dan kovariansi yang asimtotik dari estimator

iii

ABSTRAK

Nurul Kustinah, 2011. PEMILIHAN MODEL REGRESI TERBAIK DENGAN BAYESIAN INFORMATION CRITERION (BIC). Fakultas Matematika dan Ilmu Pengetahuan Alam. Universitas Sebelas Maret.

Pemilihan model regresi linear terbaik adalah memilih model regresi linear

yang memiliki kecocokan dengan data. Terdapat beberapa kriteria sebagai tolak ukur untuk menilai suatu kecocokan model dengan data, salah satu satunya adalah BIC.

BIC merupakan metode pemilihan model terbaik dari beberapa kandidat model. Kriteria pemilihan model dengan menggunakan BIC didasarkan pada teorema Bayesian dan metode MLE. Tujuan dari penelitian ini adalah mengkaji ulang metode BIC dan menerapkannya dalam pemilihan model regresi terbaik. Berdasarkan hasil penelitian menunjukkan bahwa BIC memiliki bentuk umum yaitu

� ��|�� = −2ln ������� + �� ln �. Dalam memilih model regresi terbaik dengan BIC dilakukan dengan memilih model dengan nilai BIC terkecil yang didapat dari

���������� = ln2� + ln� ! + "#

$ln � + 1.

Kata kunci: regresi linear, teorema Bayesian, MLE, BIC.

perpustakaan.uns.ac.id digilib.uns.ac.id

commit to user

Page 4: perpustakaan.uns.ac.id digilib.uns.ac... · Pemilihan model regresi linear terbaik adalah memilih model regresi linear ... menentukan variansi dan kovariansi yang asimtotik dari estimator

iv

ABSTRACT

Nurul Kustinah, 2011. THE BEST SELECTION REGRESSION MODEL WITH BAYESIAN INFORMATION CRITERION (BIC). Faculty of Mathematics and Natural Sciences. Sebelas Maret University.

The best regression model selection is method for selection the most appropriate fit between the regression model and the data. There are several criterias as a benchmark to evaluate the suitability of the model with data, one of them is BIC.

BIC is a method in model selection to choose the best of several candidate models. Criteria for model selection using BIC is based on Bayesian theorem and MLE. The aims of this research are to review the BIC and apply it in the best regression model selection. Based on the results, BIC has the general form

� ��|�� = −2ln ������� + �� ln �. In selecting the best regression model with BIC performed by selecting the model with the smallest BIC value obtained from

���������� = ln2� + ln� ! + "#

$ln � + 1.

Keywords: linear regression, Bayesian theorem, MLE, BIC.

perpustakaan.uns.ac.id digilib.uns.ac.id

commit to user

Page 5: perpustakaan.uns.ac.id digilib.uns.ac... · Pemilihan model regresi linear terbaik adalah memilih model regresi linear ... menentukan variansi dan kovariansi yang asimtotik dari estimator

v

MOTO

“Sesungguhnya sesudah kesulitan itu ada kemudahan.”

(QS. Alam Nasyrah: 6)

“Dan Dia mendapatimu sebagai seorang yang bingung, lalu Dia beri petunjuk.” (QS: Ad-Duhaa ayat 7)

“Jangan pernah menghindar dan selalu berkata tidak, majulah ke depan, hadapi

hidupmu dan berkatalah, ya, aku bisa!”

perpustakaan.uns.ac.id digilib.uns.ac.id

commit to user

Page 6: perpustakaan.uns.ac.id digilib.uns.ac... · Pemilihan model regresi linear terbaik adalah memilih model regresi linear ... menentukan variansi dan kovariansi yang asimtotik dari estimator

vi

PERSEMBAHAN

Alhamdulillahirobbil ‘aalamiin...

Karya ini kupersembahkan untuk

Ibu dan Bapak tercinta

Yang tiada henti mendoakan aku

Kakakku Mas Rochim dan mbak Ita

Adikku Tirta dan Riyanti

Kak Gilang dan keluarga atas semua fasilitasnya

Valui Aditya dengan bantuan laptopnya

Damar, Bili, Uswa, Desi, Umi, Siti & Ahmad yang memberi semangat

perpustakaan.uns.ac.id digilib.uns.ac.id

commit to user

Page 7: perpustakaan.uns.ac.id digilib.uns.ac... · Pemilihan model regresi linear terbaik adalah memilih model regresi linear ... menentukan variansi dan kovariansi yang asimtotik dari estimator

vii

KATA PENGANTAR

Puji syukur penulis panjatkan kehadirat Tuhan Yang Maha Esa atas segala

rahmat dan hidayah-Nya sehingga penulis dapat menyelesaikan skripsi ini. Selain

itu, penulis mengucapkan terima kasih kepada seluruh pihak yang telah membantu

dalam penyusunan skripsi ini.

1. Dra. Yuliana Susanti, M.Si dan Bowo Winarno, S.Si, M.Kom selaku Dosen

Pembimbing I dan Dosen Pembimbing II yang telah memberikan bimbingan

kepada penulis.

2. Endah Krisna Murti yang telah memberi bantuan diskusi materi kepada

penulis.

3. Semua pihak yang telah membantu sehingga skripsi ini dapat selesai.

Semoga skripsi ini bermanfaat untuk semua pihak.

Surakarta, 2 Januari 2012

Penulis

perpustakaan.uns.ac.id digilib.uns.ac.id

commit to user

Page 8: perpustakaan.uns.ac.id digilib.uns.ac... · Pemilihan model regresi linear terbaik adalah memilih model regresi linear ... menentukan variansi dan kovariansi yang asimtotik dari estimator

viii

DAFTAR ISI

Halaman

JUDUL ..................................................................................................... i

PENGESAHAN ....................................................................................... ii

ABSTRAK ............................................................................................. iii

ABSTRACT ............................................................................................. iv

MOTO ..................................................................................................... v

PERSEMBAHAN ................................................................................. vi

KATA PENGANTAR ........................................................................... vii

DAFTAR ISI .......................................................................................... viii

DAFTAR GAMBAR .............................................................................. ix

DAFTAR TABEL ................................................................................. xi

BAB I PENDAHULUAN ..................................................................... 1

1.1 Latar Belakang Masalah ................................................................ 1

1.2 Rumusan Masalah ..................................................................... 2

1.3 Tujuan Penelitian ..................................................................... 2

1.4 Manfaat Penelitian ..................................................................... 2

BAB II LANDASAN TEORI .................................................................. 3

2.1 Tinjauan Pustaka ..................................................................... 3

2.1.1 Probabilitas Bersyarat .................................................... 3

2.1.2 Estimasi Maksimum Likelihood ...................................... 4

2.1.3 Distribusi Prior dan Distribusi Posterior ........................ 5

2.1.4 Teorema Bayes ................................................................ 6

2.1.5 Faktor Bayes ..................................................................... 7

2.1.6 Uji Asumsi Klasik .............................................................. 8

2.1.7 Analisis Model Regresi .................................................... 11

2.2 Kerangka Pemikiran ..................................................................... 12

BAB III METODE PENELITIAN .......................................................... 13

BAB IV PEMBAHASAN ...................................................................... 14

4.1 Bayesian information criterion(BIC) ............................................... 14

perpustakaan.uns.ac.id digilib.uns.ac.id

commit to user

Page 9: perpustakaan.uns.ac.id digilib.uns.ac... · Pemilihan model regresi linear terbaik adalah memilih model regresi linear ... menentukan variansi dan kovariansi yang asimtotik dari estimator

ix

4.2 BIC dalam Regresi ...................................................................... 17

4.3 Contoh Aplikasi pemilihan Model Regresi Terbaik dengan BIC........ 19

BAB V PENUTUP .................................................................................. 26

5.1 Kesimpulan ................................................................................... 26

5.2 Saran ............................................................................................... 26

DAFTAR PUSTAKA ............................................................................... 27

LAMPIRAN

perpustakaan.uns.ac.id digilib.uns.ac.id

commit to user

Page 10: perpustakaan.uns.ac.id digilib.uns.ac... · Pemilihan model regresi linear terbaik adalah memilih model regresi linear ... menentukan variansi dan kovariansi yang asimtotik dari estimator

x

DAFTAR GAMBAR

Halaman Gambar 2.1

Gambar 4.1

Pola plot residu terhadap &� ..................................................

Plot probabilitas dari residu ...........................................…..

9

20

Gambar 4.2 Plot residu dengan &� .............................................……….. 21

perpustakaan.uns.ac.id digilib.uns.ac.id

commit to user

Page 11: perpustakaan.uns.ac.id digilib.uns.ac... · Pemilihan model regresi linear terbaik adalah memilih model regresi linear ... menentukan variansi dan kovariansi yang asimtotik dari estimator

xi

DAFTAR TABEL

Halaman Tabel 4.1 Hasil Uji Multikolinearitas …………............…………….… 21

Tabel 4.2 Hasil Uji F .............................................................................. 23

Tabel 4.3 Hasil Uji t ................................................................................ 24

Tabel 4.4 Nilai BIC dari model ............................................................... 24

perpustakaan.uns.ac.id digilib.uns.ac.id

commit to user

Page 12: perpustakaan.uns.ac.id digilib.uns.ac... · Pemilihan model regresi linear terbaik adalah memilih model regresi linear ... menentukan variansi dan kovariansi yang asimtotik dari estimator

1

BAB I

PENDAHULUAN

1.1 Latar Belakang Masalah

Analisis regresi adalah teknik statistik yang digunakan untuk menyelidiki

dan memodelkan hubungan antara variabel-variabel yang terdiri dari variabel

independen dan variabel dependen. Model regresi adalah suatu cara untuk

mengetahui kecenderungan perubahan variabel dependen Y yang berubah sesuai

perubahan variabel independen X. Model regresi dapat digunakan untuk beberapa

tujuan antara lain untuk deskripsi data, estimasi dan prediksi. Penerapan dari

regresi sangat banyak dan dapat ditemukan hampir disetiap bidang ilmu

pengetahuan. Penerapan regresi diantaranya dapat ditemukan dalam analisis

runtun waktu, ilmu ekonomi, biologi, dan ilmu sosial (Sembiring,1995).

Pada analisis regresi hubungan antara variabel dependen (Y) dan beberapa

variabel independen (X) dapat dinyatakan dengan suatu model regresi linear yaitu

� = �� + ���� + ⋯ + �� + , dengan � adalah banyaknya variabel independen, �

adalah parameter dan � adalah sesatan random dengan asumsi �~ ��� �(0; ��),

untuk � = 1,2, … , � (Neter dan Wasserman, 1996).

Ada beberapa metode pemilihan model regresi terbaik, diantaranya adalah

metode Akaike’s Information Criterion (AIC) dan Bayesian Information Criterion

(BIC). BIC merupakan salah satu kriteria pemilihan model terbaik dimana konsep

dari metode ini dikemukakan oleh Schwarz (1978). Perumusan BIC menggunakan

teorema Bayesian untuk menentukan probabilitas posterior. Estimasi parameter

dalam model regresi menggunakan MLE. Kemudian BIC digunakan untuk

pemilihan model regresi. Hasil pemilihan model dengan BIC cukup akurat karena

jumlah parameter dalam model diperhatikan. Dalam penelitian ini, penulis

mengkaji ulang metode BIC dan menerapkannya dalam regresi linear.

perpustakaan.uns.ac.id digilib.uns.ac.id

commit to user

Page 13: perpustakaan.uns.ac.id digilib.uns.ac... · Pemilihan model regresi linear terbaik adalah memilih model regresi linear ... menentukan variansi dan kovariansi yang asimtotik dari estimator

2

1.2 Perumusan Masalah

Berdasarkan uraian dalam latar belakang masalah, dapat dirumuskan

permasalahan yaitu bagaimana menurunkan ulang metode BIC dan penerapan BIC

dalam pemilihan model regresi terbaik.

1.3 Tujuan Penelitian

Tujuan yang ingin dicapai adalah menjelaskan metode BIC dan

menerapkan BIC dalam regresi linear.

1.4 Manfaat Penelitian

Memberikan pemahaman yang lebih tentang BIC untuk pemilihan model

regresi terbaik dan sebagai bahan referensi penelitian yang akan datang.

perpustakaan.uns.ac.id digilib.uns.ac.id

commit to user

Page 14: perpustakaan.uns.ac.id digilib.uns.ac... · Pemilihan model regresi linear terbaik adalah memilih model regresi linear ... menentukan variansi dan kovariansi yang asimtotik dari estimator

3

BAB II

LANDASAN TEORI

2.1 Tinjauan Pustaka

Pada bagian pertama dari bab ini diberikan tinjauan pustaka yang terdiri

dari definisi maupun teorema sebagai dasar pengertian untuk mempermudah

pembahasan selanjutnya. Pada bagian kedua dari bab ini disusun kerangka

pemikiran yang menjelaskan alur dalam penulisan skripsi ini. Berikut ini akan

diberikan beberapa definisi dan pengertian yang mendukung pemilihan model

regresi terbaik berdasarkan metode BIC.

2.1.1 Probabilitas bersyarat

Pengertian tentang probabilitas bersyarat peristiwa A jika diketahui B telah

terjadi ditulis sebagai ���|�� pada dua kejadian independen dan fungsi likelihood

diberikan pada definisi dan teorema berikut menurut Bain dan Engelhardt(1992).

Definisi 2.1. Diberikan suatu percobaan dengan S sebagai ruang sampel dan

A1, A2, A3,… ,An merupakan kejadian asing yang mungkin terjadi. Sebuah fungsi

yang mengawankan nilai real dari P(A) dengan setiap kejadian A disebut

probabilitas dari A, dinotasikan P(A), jika memenuhi :

1. ���� ≥ 0 untuk setiap � himpunan bagian

2. P (S) = 1

3. � �⋃ ��� = ∑ � ��������� ��� .

Probabilitas terjadinya suatu peristiwa A, bila diketahui peristiwa B telah terjadi

disebut probabilitas bersyarat dan dinotasikan ���|��.

Definisi 2.2 S suatu ruang sampel dan A, B adalah peristiwa-peristiwa di dalam

S. Probabilitas bersyarat P(A|B) didefinisikan sebagai

���|�� = ���∩������ .

perpustakaan.uns.ac.id digilib.uns.ac.id

commit to user

Page 15: perpustakaan.uns.ac.id digilib.uns.ac... · Pemilihan model regresi linear terbaik adalah memilih model regresi linear ... menentukan variansi dan kovariansi yang asimtotik dari estimator

4

Definisi 2.3. S adalah suatu ruang sampel dari suatu percobaan. A1 , A2, ... , Ak

adalah peristiwa-peristiwa di dalam S, sedemikian hingga �� ∩ �� = ∅ untuk

setiap � ≠ � dan ⋃ ������ = .

Dikatakan bahwa A1 , A2, ... , Ak membentuk partisi dalam S.

Teorema 2.1. (Teorema Probabilitas Total). Jika A=[ A1 , A2, ... , Ak] adalah

partisi S dan B sebarang peristiwa anggota S, maka

P(B)=P(B|A1)P(A1)+P(B|A2)P(A2)+ ... +P(B|Ak)P(Ak).

2.1.2 Estimasi Maksimum Likelihood

Pengertian tentang estimasi maksimum likelihood yang diberikan pada

definisi berikut menurut Bain dan Engelhardt(1992).

Definisi 2.4. Fungsi kepadatan bersama dari n variabel random ��, ��, … , ��

pada �, �, … , � dilambangkan dengan !� �, �, … , �; #� dengan # $ % dimana

% adalah ruang parameter yang tidak diketahui dinyatakan dengan fungsi

likelihood. Untuk �, �, … , � yang tetap fungsi likelihood adalah fungsi dari #

dan dinotasikan &�#�. Jika ��, ��, … , �� mewakili sampel random dari !� , #�

maka,

&�#� = ∏ !� �; #� = !� �; #�!� �; #� … !� �; #����� .

Definisi 2.5. Misalkan &�#� = !� �, �, … , �; #� dengan # $ %, adalah fungsi

kepadatan bersama dari variabel random ��, �� … , ��. Untuk himpunan

pengamatan � �, �, … , ��, suatu nilai #( dalam % yang memaksimumkan &�#�

disebut sebagai estimator maksimum likelihood dari #. Secara sistematis ditulis,

!) �, �, … , �; #(* = !� �, �, … , �; #�+,-./0 .

Memaksimumkan log &�#� lebih mudah dibandingkan memaksimumkan

&�#� sehingga dapat ditulis sebagai,

log !) �, �, … , �; #(* = !� �, �, … , �; #�+,-./0 .

perpustakaan.uns.ac.id digilib.uns.ac.id

commit to user

Page 16: perpustakaan.uns.ac.id digilib.uns.ac... · Pemilihan model regresi linear terbaik adalah memilih model regresi linear ... menentukan variansi dan kovariansi yang asimtotik dari estimator

5

Apabila Ω adalah interval terbuka dari L(#� yang differensiabel dan

diasumsikan maksimum pada Ω, maka estimator maksimum likelihood dari #

diperoleh dengan menyelesaikan persamaan

23456�+�2+ = 0.

Jika terdapat lebih dari satu penyelesaian untuk # maka dicari

penyelesaian yang memaksimumkan L(#� dengan membandingkan penyelesaian

untuk # yang telah diperoleh. Kemudian dicari turunan kedua dari L(#�. Bila

nilainya negatif maka penyelesaian untuk # tersebut merupakan estimator

maksimum.

Kegunaan MLE dalam mendapatkan estimator parameter dari suatu

distribusi dapat digunakan untuk menyusun suatu matriks yang disebut matriks

informasi Fisher. Invers dari matriks ini disebut matriks invarian-kovarian. Untuk

menentukan variansi dan kovariansi yang asimtotik dari estimator maka

dikonstruksikan sebuah matriks informasi I dengan elemen ke-�8 adalah :

I�9 = : ;<�log&�#; �<#�#9 @

Invers matriks, IA� adalah matriks varian-kovarian dari #(. Var )#(�* = I�� dan cov )#(� , #9* = I�9.

2.1.3 Distribusi Prior dan Distribusi Posterior

Definisi distribusi prior dan distribusi posterior di bawah ini menurut

Larson (1974).

Deinisi 2.6. Distribusi prior dari suatu parameter # merupakan fungsi kepadatan

probabilitas yang menggambarkan tingkat keyakinan nilai #.

Sebagaimana ditulis oleh Larson, distribusi prior tersebut diperoleh sebelum

melakukan analisis data.

Definisi 2.7. Fungsi kepadatan posterior untuk # merupakan fungsi kepadatan

probabilitas bersyarat # diberikan nilai sampel y, sehingga

perpustakaan.uns.ac.id digilib.uns.ac.id

commit to user

Page 17: perpustakaan.uns.ac.id digilib.uns.ac... · Pemilihan model regresi linear terbaik adalah memilih model regresi linear ... menentukan variansi dan kovariansi yang asimtotik dari estimator

6

!�#|B� = C�D,+�C�D� .

Secara umum, distribusi posterior menggambarkan tingkat keyakinan terhadap

kemungkinan nilai parameter # setelah diberikan nilai sampel.

2.1.4 Teorema Bayes

Percobaan awal yang telah dilakukan akan berpengaruh terhadap hasil

percobaan sekarang. Untuk menghitung probabilitas kejadian sekarang dengan

syarat kejadian awal dijelaskan dalam teorema Bayes. Teorema 2.2 di bawah ini

diambil dari Bain dan Engelhardt (1992), sedangkan teorema 2.3 dan teorema 2.4

diambil dari Walpole dan Myers (1995).

Teorema 2.2. Jika A dan B adalah dua kejadian sebarang, maka

��� ∪ �� = ���� + ���� − ��� ∩ ��.

Akibatnya jika A dan B adalah kejadian yang saling asing, maka � ∩ � = ∅

sehingga ��� ∪ �� = ���� + ����. Selanjutnya jika ��, ��, … , �� saling asing,

maka ���� ∪ �� ∪ … ∪ ��� = ����� + ����� + ⋯ + �����.

Teorema 2.3. Misal kejadian ��, ��, … , �� merupakan kejadian yang saling asing

dari ruang sampel S dengan ����� ≠ 0 untuk � = 1,2, … , �. Maka untuk setiap

kejadian A anggota S,

���� = ∑ ���� ∩ ������ = ∑ ��������� ���|���.

Teorema 2.4. Misal kejadian ��, ��, … , �� merupakan kejadian yang saling asing

dari ruang sampel S dengan ���� ≠ 0 untuk � = 1,2, … , �. Misalkan A suatu

kejadian sebarang dalam S dengan ���� ≠ 0, maka

���K|�� = ���L∩��∑ ���M∩��NMOP

= ���L����|�L�∑ ���M�NMOP ���|�M� , untuk Q = 1,2, … , �.

Teorema 2.4 disebut sebagai teorema Bayes. Teorema Bayes memberikan aturan

untuk menghitung probabilitas bersyarat peristiwa �K diberikan A, jika masing-

masing probabilitas tak bersyarat �K dan probabilitas bersyarat A yang diberikan

�K diketahui. Untuk selanjutnya, ���K� disebut probabilitas prior, ���|�K�

disebut sebagai fungsi likelihood dan ���K|�� disebut fungsi probabilitas

posterior.

perpustakaan.uns.ac.id digilib.uns.ac.id

commit to user

Page 18: perpustakaan.uns.ac.id digilib.uns.ac... · Pemilihan model regresi linear terbaik adalah memilih model regresi linear ... menentukan variansi dan kovariansi yang asimtotik dari estimator

7

2.1.5 Faktor Bayes

Dari sampel random = { �, �, … , �} diberikan T model, yaitu :

{U�, U�, … , UV}. Misalkan bahwa !�( |#�) adalah fungsi kepadatan U� dari data

dan W�#�� merupakan fungsi kepadatan priornya, dimana parameter #� tidak

diketahui serta #�$Θ�, untuk i=1, 2, ... , T. Jika distribusi prior dari model-model tersebut adalah ��#��, ��#��, … , ��#V�

maka distribusi posteriornya adalah

��U�| � = ��#��Z�� �∑ ��#��V��� Z� �

dengan

Z�� � = [ !�� |#��W��#��\#�. Z�� � adalah distribusi marginal dari data sampel pada model U�. Jadi rasio probabilitas posterior untuk 2 model U9 dan U� adalah

�)U9] * =�)#9*Z9� �

∑ �)#9*Z9� �V�����#��Z�� �∑ �)#9*Z9� �V���

= �)#8*Z8� ���#��Z�� �

= �)#9*^�#�� �9�� �

dengan �9�� � adalah faktor Bayes untuk model U9 dan U� dari data sampel ,

ditulis

�9�� � = ._�0�.N�0�.

Faktor Bayes sangatlah berhubungan dengan distribusi prior, hal ini

dikarenakan faktor Bayes didefinisikan dengan rasio dari distribusi marginal yang

bergantung pada nilai-nilai absolut dari prior-prior W� (Kass and Raftery, 1995).

perpustakaan.uns.ac.id digilib.uns.ac.id

commit to user

Page 19: perpustakaan.uns.ac.id digilib.uns.ac... · Pemilihan model regresi linear terbaik adalah memilih model regresi linear ... menentukan variansi dan kovariansi yang asimtotik dari estimator

8

2.1.6 Uji Asumsi Klasik

2.1.6.1 Normalitas

Gujarati (1995) menjelaskan bahwa pada regresi linear klasik diasumsikan

bahwa tiap `� didistribusikan secara normal dengan `�~b�0, c��.

Salah satu cara untuk menguji asumsi kenormalan adalah dengan uji

Kolmogorov-Smirnov.

Pengujian hipotesis yang digunakan adalah sebagai berikut :

a. de : Data berdistribusi normal

d� ∶ Data tidak berdistribusi normal

b. Tingkat signifikasi �h�

c. Daerah kritis: de ditolak jika ij�kl�m > ik/opV d. Statistik uji

ij�kl�m = Zq |re���� − �����|, � = 1,2, … , s.

dengan,

re����: fungsi distribusi frekuensi kumulatif relatif dari distribusi teoritis di

bawah de.

�����: distribusi frekuensi kumulatif pengamatan sebanyak sampel.

e. Kesimpulan : Jika de ditolak maka data tidak berdistribusi normal.

2.1.6.2 Heteroskedastisitas

Uji heterokedastisitas bertujuan untuk mengetahui apakah variansi `� konstan. Pendeteksian kesamaan variansi dapat dilakukan dengan membuat plot

sisa terhadap t(�. Plot yang diperoleh seharusnya tidak menghasilkan pola tertentu

dan terkumpul di sekitar garis lurus yang melalui titik nol.

Montgomery dan Peck (1992) menggambarkan beberapa plot sisa terhadap

t(� sebagai berikut

perpustakaan.uns.ac.id digilib.uns.ac.id

commit to user

Page 20: perpustakaan.uns.ac.id digilib.uns.ac... · Pemilihan model regresi linear terbaik adalah memilih model regresi linear ... menentukan variansi dan kovariansi yang asimtotik dari estimator

9

(a) (b)

(c) (d)

Gambar 2.1 Pola plot residu terhadap t(�

Jika hasil plot mirip pola pada Gambar 2.1a maka berarti asumsi

homogenitas variansi dipenuhi karena titik tersebar. Pada Gambar 2.1b

menunjukkan bahwa titik tersebar dengan variansi tidak konstan

(heteroskedastisitas). Pola pada Gambar 2.1c seharusnya tidak akan muncul

kecuali kalau ada kesalahan dalam perhitungan. Pola Gambar 2.1d menunjukkan

model yang digunakan kurang tepat, atau perlu dilakukan transformasi.

2.1.6.3 Mutikolinearitas

Menurut Montgomery dan Peck (1992), salah satu cara mendeteksi adanya

multikolinearitas dalam model adalah dengan nilai tolerance dan VIF (Variance

Inflation Factors). Matriks u = �� ′��A� adalah matriks untuk mendeteksi adanya

multikolinearitas dengan u99 merupakan diagonal matriks u yang dapat ditulis

vwr9 = u99 = 1�1 − x9��

`�

`�

`�

`�

t(� t(�

t(� t(�i

perpustakaan.uns.ac.id digilib.uns.ac.id

commit to user

Page 21: perpustakaan.uns.ac.id digilib.uns.ac... · Pemilihan model regresi linear terbaik adalah memilih model regresi linear ... menentukan variansi dan kovariansi yang asimtotik dari estimator

10

dengan x9� adalah nilai koefisien determinasi atau x� ketika �� yang diregresikan

dengan variabel bebas selain ��. vwr9 adalah faktor perubahan variansi dalam

variabel bebas ke-j. Nilai vwr > 10 menunjukkan multikolinearitas yang kuat.

2.1.6.4 Autokorelasi

Autokorelasi adalah suatu keadaan kesalahan gangguan dari periode

tertentu berkorelasi dengan kesalahan gangguan dari periode sebelumnya. Jika

kesalahan gangguan periode y dengan y − 1 berkorelasi maka terjadi korelasi

tingkat pertama. Autokorelasi dapat dideteksi dengan berbagai cara antara lain

dengan uji Durbin Watson. Langkah-langkah pengujian autokorelasi dengan

Durbin Watson adalah sebagai berikut (Gujarati, 1995):

1. Melakukan regresi kuadrat terkecil biasa dan memperoleh residu

2. Menghitung nilai \ (statistik Durbin Watson ), dengan

\ = ∑ �$k − $kA����k��∑ $k��k��

3. Mencari nilai \6 (batas bawah Durbin Watson) dan \z (batas atas Durbin

Watson) untuk ukuran sampel dan banyaknya variabel independen tertentu.

4. Jika de adalah tidak terdapat autokorelasi positif, maka jika

\ < \6: menolak de

\ > \z: tidak menolak de \6 ≤ \ ≤ \z: pengujian tidak meyakinkan

5. Jika de adalah tidak terdapat autokorelasi negatif, maka jika

\ > 4 − \6: menolak de \ < 4 − \z: tidak menolak de

4 − \z ≤ \ ≤ 4 − \6: pengujian tidak meyakinkan

6. Jika de adalah tidak terdapat autokorelasi positif atau negatif, maka jika

\ < \6: menolak de

\ > 4 − \6: menolak de

\z < \ < 4 − \z: tidak menolak de

\6 ≤ \ ≤ \z: pengujian tidak meyakinkan

4 − \z ≤ \ ≤ 4 − \6: pengujian tidak meyakinkan

perpustakaan.uns.ac.id digilib.uns.ac.id

commit to user

Page 22: perpustakaan.uns.ac.id digilib.uns.ac... · Pemilihan model regresi linear terbaik adalah memilih model regresi linear ... menentukan variansi dan kovariansi yang asimtotik dari estimator

11

2.1.7 Analisis Model Regresi

2.1.7.1 Uji Serempak (Uji F)

Menurut Supranto (1995) uji serempak dilakukan untuk mengetahui

apakah variabel independen berpengaruh secara bersama-sama terhadap variabel

dependen. Sebelum pengujian hipotesis akan dicari perumusan rj�kl�mterlebih

dahulu

rj�kl�m = ��x/�^ − 1���/�s − ^� = x�x

x�

dengan,

x�x: Rataan Kuadrat Regresi

x�: Rataan Kuadrat Sisa

Pengujian hipotesis yang digunakan adalah sebagai berikut :

a. de : �� = �� = ⋯ = �� = 0 (variabel independen secara bersama-sama tidak

mempunyai pengaruh yang signifikan terhadap variabel dependen)

d� ∶ �9 ≠ 0, untuk 8 = 1, 2, … , � (variabel independen secara bersama-sama

mempunyai pengaruh yang signifikan terhadap variabel dependen)

b. Tingkat signifikasi �h�

c. Daerah kritis: de ditolak jikarj�kl�m > r��,�A�,�A�� d. Statistik uji

rj�kl�m = x�xx�

e. Kesimpulan : Jika de ditolak maka variabel independen secara bersama-sama

mempunyai pengaruh yang signifikan terhadap variabel dependen.

2.1.7.2 Uji Parsial (Uji t)

Menurut Supranto (1995) uji parsial dilakukan untuk mengetahui pengaruh

variabel independen secara individual terhadap variabel dependen, dengan

menganggap variabel independen lainnya konstan.

Pengujian hipotesis yang digunakan adalah sebagai berikut :

a. de : �9 = 0, untuk 8 = 1, 2, … , � (tidak ada pengaruh yang signifikan antara

variabel independen ke-j terhadap variabel dependen)

perpustakaan.uns.ac.id digilib.uns.ac.id

commit to user

Page 23: perpustakaan.uns.ac.id digilib.uns.ac... · Pemilihan model regresi linear terbaik adalah memilih model regresi linear ... menentukan variansi dan kovariansi yang asimtotik dari estimator

12

d� ∶ �9 ≠ 0, untuk 8 = 1, 2, … , � (ada pengaruh yang signifikan antara variabel

indenpenden ke-j terhadap variabel dependen)

b. Tingkat signifikasi �h�

c. Daerah kritis, de ditolak jika yj�kl�m > y��/�,�A�� atau −yj�kl�m < y��/�,�A�� d. Statistik uji

yj�kl�m = �9:��9�

dengan,

�9 = koefisien regresi independen �9

:)�9* = sesatan standar dari koefisien regrsi �9.

e. Kesimpulan : Jika de ditolak maka ada pengaruh yang signifikan antara

variabel independen ke-j terhadap variabel dependen.

2.2 Kerangka Pemikiran

BIC merupakan suatu metode pemilihan model dengan menerapkan

beberapa teorema Bayesian dan MLE dalam penurunan rumusnya. Selanjutnya

hasil penurunan rumus yang diperoleh diterapkan dalam regresi linear. Rumus

yang diperoleh untuk regresi diterapkan untuk menentukan model terbaik pada

suatu data. Data diregresikan dengan regresi linear kemudian sesatan model diuji

dengan asumsi klasik regresi linear yaitu normalitas, tidak terdapat

multikolinearitas, tidak terdapat heteroskedastisitas dan tidak terdapat

autokorelasi. Kemudian model dipilih sebagai model terbaik menurut metode BIC.

perpustakaan.uns.ac.id digilib.uns.ac.id

commit to user

Page 24: perpustakaan.uns.ac.id digilib.uns.ac... · Pemilihan model regresi linear terbaik adalah memilih model regresi linear ... menentukan variansi dan kovariansi yang asimtotik dari estimator

13

BAB III

METODE PENELITIAN

Pada penelitian ini, metode yang digunakan adalah studi literatur dan

penerapan kasus, dengan pengumpulan bahan melalui buku-buku referensi dan

karya ilmiah yang meliputi hasil-hasil penelitian dan jurnal. Adapun langkah

penelitian sebagai berikut.

1. Menurunkan rumus Bayesian Information Criterion (BIC) sehingga diperoleh

bentuk umum BIC.

2. Menentukan rumus BIC berdasarkan bentuk umum yang diperoleh pada

langkah nomor 1 untuk memilih model regresi terbaik.

3. Menentukan data yang digunakan kemudian uji residu data dengan uji asumsi

klasik regresi linear

4. Pilih model regresi terbaik dengan metode BIC, dimana nilai BIC dihitung

dengan cara

a. Hitung nilai � � � dari masing-masing kombinasi model

b. Hitung nilai ��

�ln dari masing-masing kombinasi model

c. Hitung nilai ln2�

d. Hitung nilai BIC dari masing-masing kombinasi model yang diperoleh dari

��������� = ln2� + ln� � � +��

�ln + 1

e. Pilih model dengan nilai BIC terkecil sebagai model terbaik

perpustakaan.uns.ac.id digilib.uns.ac.id

commit to user

Page 25: perpustakaan.uns.ac.id digilib.uns.ac... · Pemilihan model regresi linear terbaik adalah memilih model regresi linear ... menentukan variansi dan kovariansi yang asimtotik dari estimator

14

BAB IV

PEMBAHASAN

BIC merupakan metode pemilihan model terbaik dari beberapa kandidat

model. Konsep BIC pertama kali diperkenalkan oleh Schwarz (1978), BIC yang

dikembangkan oleh Schwarz ini menggunakan beberapa teorema Bayesian,

sehingga BIC dikenal juga dengan Schwarz’s Bayesian Information Criterion

(SBIC) dan ada juga yang menyebutnya dengan Schwarz Bayesian Criterion

(SBC). Metode pemilihan model dengan menggunakan BIC didasarkan pada

metode MLE dan teorema Bayesian. Dalam memilih model terbaik dengan

metode BIC dipilih model dengan nilai BIC terkecil. Semakin kecil nilai BIC

semakin baik modelnya. Hal ini dikarenakan dengan meningkatnya ��� akan

meningkatkan nilai BIC. Oleh karena itu, dipilih nilai BIC terkecil (Fathurahman,

2009).

4.1 Bayesian Information Criterion (BIC)

BIC adalah metode pemilihan model dari beberapa kandidat model.

Bentuk umum BIC dicari untuk n data sampel � = ���, ��, … , ���, berdasarkan

data sampel tersebut akan dipilih suatu model terbaik dari l model yang mungkin

yaitu �, �, … , �, dimana � ∈ � �, �, … , �� dan � ∈ �1,2, … , ��. Model �

digambarkan dengan probabilitas ����|���, dimana ��� � adalah vektor

parameter dari � dan ����|�� merupakan fungsi likelihoodnya dengan ���

adalah estimasi maksimum likelihood dari parameter ��. Misalkan ���� adalah

prior diskrit pada model �, �, … , � dan ����|�� adalah prior untuk parameter

�� dari model �.

Dengan menerapkan teorema Bayes, joint posterior dari � dan �� dapat

ditulis menjadi :

����, ���|�� = ��������|������|�� ���

perpustakaan.uns.ac.id digilib.uns.ac.id

commit to user

Page 26: perpustakaan.uns.ac.id digilib.uns.ac... · Pemilihan model regresi linear terbaik adalah memilih model regresi linear ... menentukan variansi dan kovariansi yang asimtotik dari estimator

15

dimana ��� merupakan distribusi marginal dari �.

Berdasarkan data sampel, probabilitas posterior model � dapat ditulis

!��|�� = "��� # $�%&|'�(� %&|��)%&*�'� (4.1).

Dalam pemilihan model dengan aturan Bayes, akan memilih model �

yang memberikan probabilitas posterior terbesar. Meminimumkan nilai

−2ln.!��|��/ sebagai lawan memaksimumkan !��|��. Sehingga diperoleh

−2ln.!��|��/ = 2ln. ���/ − 2ln.����/ − 2ln0# ����|��g� ��|��2��∞

3 4.

Karena nilai ��� suatu konstanta tetap untuk model �, maka untuk tujuan

model seleksi bentuk 2�5 � ���� dapat disederhanakan, sehingga diperoleh

−2ln�!��|��)∝ −2ln(����)−2ln0# ����|�� g� ��|��2��∞

3 4 = 7 ��|�� (4.2).

Pada bentuk # L���|�� g� ��|��2��∞

3 , dengan mengambil ekspansi deret taylor

orde ke-2 dari log Likelihood di sekitar ��, bentuk ln����|�� dapat ditulis

ln����|�� ≈ ln�.���:�/ + .�� − ���/′ <ln�.���:�/<��

+ 12 .�� − ���/′ <�ln�.���:�/

<��<� ′� .�� − ���/

= ln�.���:�/ − �� .�� − ���/′[5Ι>���� , ��] .�� − ���/ (4.3)

dengan

Ι>.��� , �/ = − ��

@ABCD.%E&:'/@%&@%′& .

Ι>.��� , �/ merupakan rata-rata pengamatan matriks informasi Fisher.

Dengan mengubah bentuk persamaan (4.3) ke dalam bentuk anti ln menjadi

����|�� ≈ L.���:�/exp �− �� .�� − ���/′ [5Ι>����, ��] .�� − ���/� (4.4)

Dari persamaan (4.4) maka bentuk # ����|�� g� ��|��2��∞

3 dalam persamaan

(4.2) dapat ditulis menjadi

∫ �(��|�) g( ��|�)2��∞

0 =∫ �(����)∞

0 exp {− 1

2(�� − ���)′ [5Ι̂(���, �)]

(�� − ���)}g( ��|�)2�� (4.5).

perpustakaan.uns.ac.id digilib.uns.ac.id

commit to user

Page 27: perpustakaan.uns.ac.id digilib.uns.ac... · Pemilihan model regresi linear terbaik adalah memilih model regresi linear ... menentukan variansi dan kovariansi yang asimtotik dari estimator

16

Karena g� ��|��2�� = 1 maka persamaan (4.5) dapat ditulis menjadi

# ����|�� g� θJ|k�2��∞

3 = # �.���:�/∞

3 exp L− �� .�� − ���/′ M5Ι>.��� , �/N.�� − ���/O

g� ��|��2��

= �.���:�/ P exp∞

3Q− 1

2 .�� − ���/′ M5Ι>.��� , �/N.�� − ���/R

= �.���:�/� 2πnΙ>θ�J

�ST�

= �.���:�/2πST� nUST� [Ι>.��� , �/] sehingga

7 ��|�� = −2 ln.����/ − 2ln VP ����|�� g� ��|��2��∞

3W

= −2 ln.����/ − 2ln{ �.���:�/2πXTA nUXTA [Ι>.��� , �/]}

= −2 ln.����/ − 2ln �.���:�/ + pJ ln 5 − ST� ln2π+ ln Ι>.��� , �/ (4.6).

Karena bentuk −2 ln.����/, − ST� ln2π dan ln Ι�.��� , �/ suatu konstanta tetap untuk

model �, persamaan (4.6) dapat disederhanakan menjadi

7 ��|�� ∝ −2ln�����|��+Y� ln 5

= −2ln���|����+Y� ln 5 (4.7)

dengan,

�.�:���/ : fungsi maksimum likelihood

Y� : jumlah parameter model �

5 : banyaknya data.

Model yang dipilih dengan persamaan (4.7) adalah model yang memberikan nilai

BIC minimum (Cavanaugh, J.2005).

perpustakaan.uns.ac.id digilib.uns.ac.id

commit to user

Page 28: perpustakaan.uns.ac.id digilib.uns.ac... · Pemilihan model regresi linear terbaik adalah memilih model regresi linear ... menentukan variansi dan kovariansi yang asimtotik dari estimator

17

4.2 BIC dalam Regresi

Metode BIC didasarkan pada metode MLE. Metode MLE ini digunakan

untuk mencari fungsi maksimum likelihood dari model. Sebelum melakukan

pemilihan model dalam kasus regresi linear dengan metode BIC, residu data harus

memenuhi asumsi klasik regresi linear.

Untuk mendapatkan model terbaik perlu dilihat semua kombinasi yang

mungkin dari variabel independen yang berpengaruh terhadap model dan variabel

dependennya. Dari kombinasi yang diperoleh tersebut dipilih model terbaik.

Kombinasi yang paling baik untuk dijadikan model regresi terbaik dapat dilihat

dari nilai BIC yang diperoleh. Nilai BIC yang dipilih adalah nilai BIC terkecil

diantara beberapa kombinasi tersebut. Nilai BIC terkecil yang dimiliki model

berarti variansinya juga terkecil diantara model yang lain. Ini berarti bahwa residu

model yang dipilih kecil sehingga model cukup akurat. Untuk menentukan nilai

BIC dalam model regresi linear perlu diketahui rumus yang digunakan. Penurunan

rumus tersebut dapat diketahui berdasarkan penjelasan di bawah ini.

Bentuk �.�:���/ dalam persamaan (4.7) disubtitusikan dengan fungsi

maksimum likelihood untuk regresi linear yaitu ��Z|�, [, ��� sehingga diperoleh

7\] = −2ln��Z|�, [, ��� + Y� ln 5 (4.8)

dengan,

��Z|�, [, ��� : fungsi maksimum likelihood

Y� : banyaknya parameter

5 : banyaknya data.

Karena residu data mengikuti distribusi normal maka dapat dituliskan bentuk

umum fungsi likelihoodnya, sebagai berikut

��Z|�, [, ��� = ∏ �√�"`A�ab� c�Y d− �

��efU'fg�A

`A h (4.9)

perpustakaan.uns.ac.id digilib.uns.ac.id

commit to user

Page 29: perpustakaan.uns.ac.id digilib.uns.ac... · Pemilihan model regresi linear terbaik adalah memilih model regresi linear ... menentukan variansi dan kovariansi yang asimtotik dari estimator

18

Selanjutnya persamaan (4.7) diubah ke dalam bentuk ln sehingga

ln ��Z|�, [, ��� = − 52 ln�2�� − 5

2 ln �� − 12 i j�ka − �a[��

�� l�

ab�

ln ��Z|�, [, ��� = − 52 �2�� − 5

2 ln �� − 12 j�Z − �[�′�Z − �[�

�� l

ln ��Z|�, [, ��� = − �� ln�2�� − �

� ln �� − ��`A MZ′Z − 2[′�′Z + [′�′�[N (4.10)

dimana Y adalah vektor 5�1 dan � adalah matriks 5��.

Kemudian untuk memperoleh [> , dicari turunan pertama dari bentuk

ln ��Z|�, [, ��� terhadap [ sama dengan nol, maka diperoleh

<�5�<[ = − 1

2�� jZ′Z − 2[′�′Z + [′�′�[<[ l = 0

<�5�<[ = − 1

2�� [−2�′Z + 2�′�[] = 0

1�� [� ′Z − �′�[] = 0

� ′�[ = �′Z

Kemudian mengalikan kedua ruas dengan ��′ ��U� diperoleh

��′ ��U�� ′�[ = ��′ ��U�� ′Z.

Sehingga diperoleh persamaan untuk [> sebagai berikut

[> = ��′ ��U��′ Z.

Kemudian untuk memperoleh ���, dicari turunan pertama dari bentuk

ln��Z|�, [, ��� terhadap �� sama dengan nol, maka diperoleh

<ln�<�� = − 5

2�� + 12�n [�Z − �[�′�Z − �[�] = 0

12�n [�Z − �[�′�Z − �[�] = 5

2��

�`A [�Z − �[�′�Z − �[�] = 5 (4.11)

Sehingga diperoleh persamaan untuk ��� sebagai berikut

��� = �� [�Z − �[�′�Z − �[�].

perpustakaan.uns.ac.id digilib.uns.ac.id

commit to user

Page 30: perpustakaan.uns.ac.id digilib.uns.ac... · Pemilihan model regresi linear terbaik adalah memilih model regresi linear ... menentukan variansi dan kovariansi yang asimtotik dari estimator

19

Persamaan (4.10) disubtitusikan ke dalam persamaan (4.8), maka diperoleh

7\]opqopra = −2 s− 52 ln�2�� − 5

2 ln �� − 12�� MZ′Z − 2[′�′Z + [′�′�[Nt + Y� ln 5

= 5 ln 2� + 5 ln �� + �`A [Z′Z − 2[′� ′Z + [′� ′�[] + Y� ln 5 (4.12)

Dengan mensubtitusikan persamaan (4.11) ke dalam persamaan (4.12), maka

diperoleh

7\]opqopra = 5 ln 2� +5 ln � u � + 5 + Y� ln 5

= 5 ln 2� + 5 ln �� + Y�5 ln 5 + 5

= 5 �ln 2� + ln �� + v&� ln 5 + 1� (4.13)

Karena 5 konstan maka untuk pemilihan model persamaan (4.13) dapat

disederhanakan menjadi

7\]opqopra = ln 2� + ln ��� + v&� ln 5 + 1 (4.14)

Model yang baik adalah model yang memiliki nilai variansi yang kecil.

Sehingga dalam menentukan model terbaik dengan BIC dipilih model yang

memiliki nilai BIC yang terkecil sesuai persamaan (4.14).

4.3 Contoh Aplikasi Pemilihan Model Regresi Terbaik dengan BIC

Metode BIC dapat diterapkan dalam regresi linear. Sebagai penerapan dari

metode BIC digunakan data dari Badan Pusat Statistik tahun 2009 dengan

produksi padi sebagai Z, jumlah benih sebagai ��, luas panen sebagai ��, dan

produktivitas padi sebagai �w, yang dapat dilihat pada lampiran 1. Data diuji

apakah ada pelanggaran asumsi klasik yaitu normalitas, tidak terdapat

multikolinearitas, tidak terdapat heteroskedastisitas dan tidak terdapat

autokorelasi. Data diregresikan dengan regresi linear biasa, diperoleh persamaan

Z� = −927579.8 + 5.466520�� + 5.496041�� + 15769.99�w (lampiran5). Kemudian

residu dari persamaan regresi linear tersebut diuji memenuhi asumsi normalitas,

multikolinearitas heteroskedastisitas dan autokorelasi.

perpustakaan.uns.ac.id digilib.uns.ac.id

commit to user

Page 31: perpustakaan.uns.ac.id digilib.uns.ac... · Pemilihan model regresi linear terbaik adalah memilih model regresi linear ... menentukan variansi dan kovariansi yang asimtotik dari estimator

20

1. Asumsi Normalitas

Pengujian kenormalan digunakan untuk mengetahui apakah residu

berdistribusi normal atau tidak. Plot kenormalan untuk residu dari model

produksi padi disajikan pada gambar 4.1.

8000

00

6000

00

4000

00

2000

000

-20000

0

-400

000

-60000

0

-800

000

99

95

90

80

70

6050

40

30

20

10

5

1

RESI1

Percent

Mean -7.05547E-11

StDev 312079

N 33

KS 0.141

P-Value 0.095

Probability Plot of RESI1Normal

Gambar 4.1 Plot probabilitas dari residu

Gambar 4.1 terlihat bahwa pola penyebaran residu mengikuti garis lurus, ini

berarti asumsi kenormalan pada residu dipenuhi. Untuk menguji kenormalan

dapat juga digunakan uji Kolmogorov-Smirnov sebagai berikut

a. �3 ∶ residu berdistribusi normal

�� ∶ residu tidak berdistribusi normal

b. Tingkat signifikasi ��� = 0.05

c. Daerah kritis, �3 ditolak jika p-value < � = 0.05

d. Statistik uji

Dari Gambar 4.1 terlihat bahwa p-value = 0.095

e. Kesimpulan

Karena nilai p-value = 0.095 > 0.05 maka �3 tidak ditolak yang berarti

residu berdistribusi normal.

perpustakaan.uns.ac.id digilib.uns.ac.id

commit to user

Page 32: perpustakaan.uns.ac.id digilib.uns.ac... · Pemilihan model regresi linear terbaik adalah memilih model regresi linear ... menentukan variansi dan kovariansi yang asimtotik dari estimator

21

2. Uji Multikolinearitas

Uji multikolinieritas bertujuan untuk mengetahui apakah terdapat korelasi

antara variabel independen dalam model regresi. Berdasarkan perhitungan

nilai VIF sesuai lampiran 2 didapatkan,

Tabel.4.1 Hasil Uji Multikolinearitas

No Variabel VIF Kesimpulan

1 �� 1.196 Tidak terdapat multikolinearitas

2 �� 1.488 Tidak terdapat multikolinearitas

3 �w 1.336 Tidak terdapat multikolinearitas

Berdasarkan tabel 4.1 diperoleh nilai VIF semua variabel independen kurang

dari 10 sehingga asumsi tidak terdapat multikolinearitas terpenuhi.

3. Uji Heteroskedastisitas

120000001000000080000006000000400000020000000

500000

250000

0

-250000

-500000

-750000

Fitted Value

Residual

Versus Fits(response is y)

Gambar 4.2. Plot residu dengan Z�

Berdasarkan gambar 4.2 menunjukkan plot tidak membentuk pola tertentu

sehingga asumsi tidak terdapat heteroskedastisitas terpenuhi.

4. Uji Autokorelasi

Autokorelasi diartikan sebagai korelasi antara anggota serangkaian observasi

yang diurutkan menurut waktu. Uji non autokorelasi dapat dideteksi dengan

uji Durbin Watson (d).

perpustakaan.uns.ac.id digilib.uns.ac.id

commit to user

Page 33: perpustakaan.uns.ac.id digilib.uns.ac... · Pemilihan model regresi linear terbaik adalah memilih model regresi linear ... menentukan variansi dan kovariansi yang asimtotik dari estimator

22

a. �3 ∶ � = 0, artinya tidak ada autokorelasi

�� ∶ � ≠ 0, artinya ada autokorelasi

b. Tingkat signifikasi ��� = 0.05

c. Daerah kritis: Pada �=3 dan 5=33 serta � = 0.05 diperoleh nilai

2$ = 1.26 dan 2� = 1.65 sesuai lampiran 4, sehingga 4 − 2$ = 2.74 dan

4 − 2� = 2.35

d. Statistik Uji

Berdasarkan uji Durbin Watson (d) didapatkan nilai 2�a���q = 1.724

sesuai lampiran 3.

e. Kesimpulan

Karena 2� = 1.6511 < 2�a���q = 1.724 < 4 − 2� = 2.3455, maka

dapat disimpulkan asumsi tidak terdapat autokorelasi terpenuhi.

Selanjutnya dilakukan pengujian parameter yaitu uji simultan dan uji

parsial. Uji simultan untuk model dengan tiga variabel independen yaitu, ��, ��

dan �w adalah

a. �3 ∶ [a = 0, � = 1,2,3 (variabel independen ��, �� dan �w secara simultan tidak

berpengaruh terhadap variabel dependen Y)

b. �� ∶ [a ≠ 0, � = 1,2,3.(variabel independen ��, �� dan �w secara simultan

berpengaruh terhadap variabel dependen Y)

c. Tingkat signifikasi ��� = 0.05

d. Daerah Kritis, �3 ditolak jika ��a���q > ���,vU�,�Uv� e. Statistik Uji

Dari tabel 4.2 terlihat bahwa ��a���q = 901.71

f. Kesimpulan

Karena nilai ��a���q = 901.71 > ��3.3�,w,��� = 3.93 maka �3 ditolak yang

berarti bahwa variabel independen ��, �� dan �w secara simultan berpengaruh

terhadap variabel dependen Y.

perpustakaan.uns.ac.id digilib.uns.ac.id

commit to user

Page 34: perpustakaan.uns.ac.id digilib.uns.ac... · Pemilihan model regresi linear terbaik adalah memilih model regresi linear ... menentukan variansi dan kovariansi yang asimtotik dari estimator

23

Tabel 4.2 Hasil Uji F

Sumber variasi Derajat

bebas

Jumlah

kuadrat

Rata-rata

kuadrat

��a���q P-value

Regresi 3 2.90714E+14 9.69048E+13 901.71 0.000

Sisa 29 3.11658E+12 1.07468E+11

Total 32 2.93831E+14

Kemudian dilakukan uji parsial untuk mengetahui ada atau tidaknya

pengaruh ��, ��, dan �w terhadap Y. Uji parsial untuk model dengan tiga variabel

independen yaitu, ��, �� dan �w adalah

a. �3 : [� = 0, untuk � = 1, 2,3 (tidak ada pengaruh yang signifikan antara

variabel independen ke-j terhadap variabel dependen)

�� ∶ [� ≠ 0, untuk � = 1, 2,3 (ada pengaruh yang signifikan antara variabel

indenpenden ke-j terhadap variabel dependen)

b. Tingkat signifikasi ��� = 0.05

c. Daerah kritis, �3 ditolak jika ��a���q > ���/�,�Uv� atau −��a���q < ���/�,�Uv� atau p-value < � = 0.05

d. Statistik uji Dari tabel 4.3 terlihat bahwa

a. Nilai �ℎ���5� variabel �� sebesar 1.45

b. Nilai �ℎ���5� variabel �� sebesar 40.98

c. Nilai �ℎ���5� variabel �w sebesar 2.26

e. Kesimpulan : a. Karena ��a���q = 1.45 > ��3.3��,��� = 2.045 maka �3 tidak ditolak yang

berarti bahwa tidak ada pengaruh yang signifikan dari variabel independen

�� terhadap variabel dependen Z.

b. Karena ��a���q = 40.98 > ��3.3��,��� = 2.045 maka �3 ditolak yang berarti

bahwa ada pengaruh yang signifikan dari variabel independen �� terhadap

variabel dependen Z.

c. Karena ��a���q = 2.26 > ��3.3��,��� = 2.045 maka �3 ditolak yang berarti

bahwa ada pengaruh yang signifikan dari variabel independen �w terhadap

variabel dependen Z.

perpustakaan.uns.ac.id digilib.uns.ac.id

commit to user

Page 35: perpustakaan.uns.ac.id digilib.uns.ac... · Pemilihan model regresi linear terbaik adalah memilih model regresi linear ... menentukan variansi dan kovariansi yang asimtotik dari estimator

24

Tabel 4.3 Hasil Uji t Variabel Koefisien ��a���q p-value

Konstanta -927580 -3.21 0.003

X� 5.467 1.45 0.157 X� 5.4960 40.98 0.000 Xw 15765 2.26 0.031

Karena �� tidak mempunyai pengaruh yang signifikan terhadap Z maka

variabel �� tidak dimasukkan dalam kombinasi model, hanya kombinasi model

dari variabel �� dan �w yang akan dimasukkan dalam kombinasi model dan

dipilih sebagai model terbaik menurut metode BIC. Sehingga ada 2� = 4

kombinasi model dan ada 3 kombinasi model yang akan dipilih.

Nilai BIC dalam tabel 4.4 menurut rumus pada persamaan (4.14) dapat

dihitung dengan:

a. Hitung nilai � u � dari masing-masing kombinasi model

b. Hitung nilai v&� ln5 dari masing-masing kombinasi model

c. Hitung nilai ln2�

d. Hitung nilai BIC dari masing-masing kombinasi model yang diperoleh

dari ln2� + ln� u � + v&� ln5 + 1

e. Pilih model dengan nilai BIC terkecil.

Tabel 4.4 Nilai BIC dari Model

No Variabel

independen ln� u �

Y�5 Y�5 ln5

7\]opq =

ln 2� + ln ��� + Y�5 ln 5 + 1

1 X� 25.5057 0.0606 0.21189 28.5550

2 Xw 29.4816 0.0606 0.21189 32.5309

3 X�, Xw 25.3405 0.0909 0.31783 28.4957

perpustakaan.uns.ac.id digilib.uns.ac.id

commit to user

Page 36: perpustakaan.uns.ac.id digilib.uns.ac... · Pemilihan model regresi linear terbaik adalah memilih model regresi linear ... menentukan variansi dan kovariansi yang asimtotik dari estimator

25

Model terbaik menurut metode BIC adalah model dengan nilai BIC

terkecil. Berdasarkan tabel 4.4 model yang memiliki nilai BIC terkecil adalah

model yang dipengaruhi oleh variabel independen �� dan �w yaitu variabel

independen luas panen dan produktivitas padi. Model tersebut mempunyai BIC

sebesar 28.4957. Sehingga berdasarkan output minitab pada lampiran 5 diperoleh

persamaan Z� = −938452 + 5.56�� + 16454�w. Hal ini berarti, untuk setiap

kenaikan satu hektar luas panen menaikkan nilai produksi padi sebesar 5.56 ton

dan untuk setiap kenaikan satu kuintal/hektar produktivitas padi menaikkan nilai

produksi padi sebesar 16454 ton. Jika �� dan �w bernilai nol maka produksi padi

sebesar −938452 ton. Berarti, jika �� dan �w bernilai nol maka produksi padi

akan mengalami kerugian sebesar 938452 ton.

perpustakaan.uns.ac.id digilib.uns.ac.id

commit to user

Page 37: perpustakaan.uns.ac.id digilib.uns.ac... · Pemilihan model regresi linear terbaik adalah memilih model regresi linear ... menentukan variansi dan kovariansi yang asimtotik dari estimator

26

BAB V

PENUTUP

5.1 Kesimpulan

Berdasarkan hasil dari pembahasan pada bab 4 dapat ditarik suatu kesimpulan

sebagai berikut :

1. Bentuk umum BIC yang dirumuskan dengan menerapkan teorema Bayes dalam

mencari probabilitas posterior model ��, dapat ditulis

� ��|� = −2ln�������� + �� ln �.

2. Model regresi terbaik dengan metode BIC diperoleh dengan memilih model yang

memiliki nilai BIC terkecil. Nilai BIC dalam regresi dihitung dengan

���������� = ln2� + ln ! " + #$

%ln� + 1.

5.2 Saran

BIC merupakan salah satu metode pemilihan model yang memiliki hasil

cukup akurat. Bagi pembaca yang tertarik pada pemilihan model terbaik dengan BIC

dapat mengembangkan penggunaan BIC dalam analisis runtun waktu.

perpustakaan.uns.ac.id digilib.uns.ac.id

commit to user

Page 38: perpustakaan.uns.ac.id digilib.uns.ac... · Pemilihan model regresi linear terbaik adalah memilih model regresi linear ... menentukan variansi dan kovariansi yang asimtotik dari estimator

27

DAFTAR PUSTAKA

Bain, L.J, and Engelhardt, M. (1992). Introduction to Probability and Mathematical

Statistic, Second ed.,Duxbury Press, Inc, California.

Cavanaugh, J. (2005) Model Selection, The Schwarz Information criterion (SIC).

Department Biostatistics. The University of Lowa. google search:Bayesian

Information Criterion+BIC.

Fathurahman, M. (2009) Pemilihan Model Regresi Terbaik Menggunakan Metode

Akaike’s Information Criterion dan Schwarz Information Criterion. Jurnal

Informatika Mulawarman. Vol 4. 37– 41.

Gujarati, D. (1995). Basic Econometrics. McGraw Hill Inc., Singapore.

Kass, R. E. and Raftery, A. E. (1995) Bayes Factor. Journal of The American

Statistical Associations. Vol. 90. 773-795.

Larson, H. J. (1974). Introduction to Probability Theory and Statistical Inference.

John Wiley & Sons, Inc, New York.

Montgomery, D.C, and Peck, E.A. (1992). Introduction to Linear Regression Analysis second edition. John Wiley & Sons, Inc, New York.

Neter, J and Wasserman,W. (1996). Applied Linear Regression Models. The

McGraw-Hill Companies.

Schwarz, G. (1978). Estimating the Dimension of Model. Annals of Statistic 6.

Sembiring, R.K. (1995). Analisis Regresi. Penerbit ITB. Bandung.

Supranto, J. (1995). Ekonometrika Buku I. LPFE-UI1. Jakarta.

Walpole, R. E. dan Myers, R. H.(1995). Ilmu Peluang dan Statistika untuk Insinyur

dan Ilmuwan. Terjemahan R. K. Sembiring. Edisi Kedua. ITB. Bandung.

perpustakaan.uns.ac.id digilib.uns.ac.id

commit to user