teknik pemilihan variabel
TRANSCRIPT
-
8/16/2019 Teknik Pemilihan Variabel
1/14
Teknik Pemilihan Variabel
Willey (hal. 289-291)
Salah satu tujuan analisis regresi adalah untuk tujuan prediksi. Semakinbanyak variabel yang berada dalam model akan semakin baik model
tersebut dalam melakukan ungsi prediksinya. !amun" banyaknya variabelyang masuk memberikan permasalahan dalam sulitnya mengumpulkan datadan kontrol setiap variabel.Sehingga diperlukan adanya seleksi variabel yaitumemilih variabel yang benar-benar memberikan inormasi dalam keakuratanprediksi.
Se#ara umum" teknik pemilihan variabel untuk jumlah variabel prediktoryang banyak terbagi atas Forward Selection Procedure, BackwardElimination Procedure,dan Stepwise Method. $etode seleksi variabeldilakukan dengan #ara memasukkan atau mengeliminasi variabel prediktorsatu per satu pada setiap tahapannya.
%. Forward Selection Procedure&rosedur forward selection dimulai dengan sebuah persamaan yangterdiri dari suku konstanta" tidak terdiri dari variable prediktor. variabelpertama yang masuk dalam persamaan adalah variabel yang memilikikorelasi sederhana tertinggi dengan variabel respon '. ika koesienregresi signikan berbeda dari * maka tetap dipakai dalam persamaan"dan dilakukan pen#arian variable kedua. +ariable yang masuk kedalam persamaan sebagai variable kedua adalah variable yangmemiliki korelasi tertinggi dengan '" setelah ' telah disesuaikandengan dampak dari variabel pertama. kemudian koesien regresi dari
variable kedua diuji. ika signikan" maka dilakukan pen#arian terhadapvariable ketiga dengan #ara yang sama. &rosedur dihentikan saatpemasukan variable terakhir tidak memiliki koesien regresi dan tidaksignikan atau semua variable masuk dalam persamaan. ,oesienregresi yang signikan dari variable terakhir dilihat dari uji-t daripersamaan terakhir.
ontoh1. /i berikan data sebagai berikut
0abel. 1
! ' 1 2 3 4
1 1*1 2 55 1.2 422 125 4 52 1.5 26
3 98 9 69 2.4 45
4 59 7 73 2.6 67
7 118 3 88 2.9 35
6 114 1 73 2.5 28
5 11* 3 82 2.8 29
-
8/16/2019 Teknik Pemilihan Variabel
2/14
8 94 2 61 2.6 22
9 96 8 6* 2.4 48
1* 53 6 64 2.1 42
11 1*8 2 56 1.8 34
12 124 7 54 2.2 11
13 82 6 7* 1.7 6114 89 9 75 1.6 73
17 56 1 52 2 52
16 1*9 3 54 2.8 36
15 123 2 99 2.6 15
18 127 6 81 2.7 48
0entukanlah model regresi terbaik dengan menggunakan prosedur
forward selection α =0.1
aabangkah menggunakan prosedur orard sele#tion dengan bantuan$initab adalah sebagai berikut1. :nput data
2. ,lik Stat → Regression → Regression → Fit Regression Model
3. Setelah itu" akan mun#ul kotak dialog
-
8/16/2019 Teknik Pemilihan Variabel
3/14
&ilih ' sebagai responses variabel dan 1" 2"3" dan 4 sebagai
prediktor variabel. ,emudian pilih submenu Stepwise
4. ,emudian mun#ul kotak dialog sebagai berikut
-
8/16/2019 Teknik Pemilihan Variabel
4/14
&ada kolom Method pilih Forward Selection. ,emudian pada kolom Alpa kita masukkan niai alpa yang diminta (dalam #ontoh soal ini
*.1). kemudian" jika kita menginginkan nilai yang dieroleh darisetiap step pemilihan varibel" kita dapat memilih Details aboutmethod pada kolom Display the table of model selection details.Setelah itu kita dapatkan output dari $initab sebagai berikut
-
8/16/2019 Teknik Pemilihan Variabel
5/14
-
8/16/2019 Teknik Pemilihan Variabel
6/14
,esimpulan;anya 2 dan 4 yang sebaiknya digunakan dalam model. 1 dan 3tidak signikan terhadap perubahan '
-
8/16/2019 Teknik Pemilihan Variabel
7/14
-
8/16/2019 Teknik Pemilihan Variabel
8/14
,esimpulan;anya 2 dan 4 yang sebaiknya digunakan dalam model. 1 dan 3
tidak signikan terhadap perubahan '
. Stepwise Method$etode stepwise adalah suatu metode pemilihan model dalam regresi
dengan #ara menyisipkan variabel predi#tor satu demi satu sampai
diperoleh persamaan regresi yang yang terbaik. $etode stepwise
membangun sebuah model regresi dengan menambahkan atau
menghapus sebuah variabel prediktor pada setiap tahapnya. +ariabel
yang pertama kali masuk adalah variabel yang paling signikan
terhadap variabel respon" variabel yang masuk kedua adalah variabel
yang signikan berikutnya. Setelah variabel tertentu masuk ke dalammodel maka variabel lain yang ada di dalam model dievaluasi" jika ada
variabel yang tidak signikan maka variabel tersebut dikeluarkan.
ontoh. /engan menggunakan data pada tabel.1 tentukanlah model terbaik
dengan menggunakan prosedur stepwise.
aabangkah menggunakan prosedur orard sele#tion dengan bantuan$initab sama seperti langkah sebelumnya. ;anya berbeda padalangkah ke 4. Saat langkah 4" pada kolom $ethod kita pilih stepwise./engan demikian kita akan mendapatkan output $initab sebagaiberikut
-
8/16/2019 Teknik Pemilihan Variabel
9/14
-
8/16/2019 Teknik Pemilihan Variabel
10/14
,esimpulan;anya 2 dan 4 yang sebaiknya digunakan dalam model. 1 dan 3tidak signikan terhadap perubahan '
atihan1. Seorang sosiolog meneliti tentang kasus pembunuhan yang baru-baru
ini terjadi. $enurut studi di %merika Serikat tentang tingkatpembunuhan per 1**.*** penduduk (') yang dipengaruhi oleh ukuranpopulasi (1)" persentase keluarga dengan pendapatan tahunankurang dari = 7.*** (2)" dan tingkat pengangguran (3). /atadiambil dari 2* kota.
0abel.2
! 1 2 3 '
1 785 16.7 6.2 11.2
2 643 2*.7 6.4 13.4
3 637 26.3 9.3 4*.5
4 692 16.7 7.3 7.3
7 1248 19.2 5.3 24.86 643 16.7 7.9 12.5
5 1964 2*.2 6.4 2*.9
8 1731 21.3 5.6 37.5
9 513 15.2 4.9 8.5
1* 549 14.3 6.4 9.6
11 5897 18.1 6 14.7
-
8/16/2019 Teknik Pemilihan Variabel
11/14
12 562 23.1 5.4 26.9
13 2593 19.1 7.8 17.5
14 541 24.5 8.6 36.2
17 627 18.6 6.7 18.1
16 874 24.9 8.3 28.9
15 516 15.9 6.5 14.918 921 22.4 8.6 27.8
19 797 2*.2 8.4 21.5
2* 3373 16.9 6.5 27.5
Carilah model regresi terbaik antara Y, X1, X2, X3 pada taraf uji 5% dan 10% dengan
menggunakan prosedur:
a step!ise
b ba"k!ard elimination
ja!aban:
a.#tep!ise
$angkah 1 atriks &orelasi
X1 X2 X3 Y
X1 1
X2 '01(3) 1
X3 '0233* 0)15*2 1 Y '00(+1 0)3+) 0)(*)* 1
-ari matriks di atas .ariable X3 paling tinggi nilai korelasin/a dengan .ariable respon Yr x 3 y=0.865 -engan demikian, .ariable X3 /ang pertama dimasukkan ke dalam persamaan
regresi
#umber
.ariasi -f ## # hit 05 10 2
egresiX3 1 13)+( 13)++ 53*1 **1 301 0+5
esidu *(+(02 25)
otal 1 1)552
-
8/16/2019 Teknik Pemilihan Variabel
12/14
ji se"ara keseluruhan untuk .ariabel X3 menunjukkan bah!a persamaan regresi ini n/ata
se"ara statistik dengan 2 4 0+5
$angkah 2: enghitung koefisien korelasi parsial orde ke'1 untuk memilih .ariabel selanjutn/a
X1 dan X26
r /71873 4 02+(0*+
r /71873 624 00+(202
r /72873 624 021**123
-ari perhitungan di atas, tampak bah!a koefisien korelasi parsial .ariabel X2 paling
tinggi, sehingga .ariabel X2 dimasukkan ke dalam model
$angkah 3 : menge.aluasi model Y 4 fX3,X26
9nalisis arians egresi ;arsial
#umber
.ariasi -f ## # hit 05 10 2
egresi
X3,X2,X16 3 1,51),1*5 50(0*) 2*02 32* 2*( 0)1)
X18 X2, X36 1 302)55* 302)55 1** ** 305
X28 X1, X36 1 *122 *12 *51 ** 305
X38 X1, X26 1 2003*(5 2003*+ 51 ** 305
esidu 1( 33+15+1 210((1
otal 1 1)55202 +5*22
-ari ketiga nilai 'parsial, baik pada taraf n/ata 5% maupun taraf n/ata 10%, tern/ata .ariabel
X1 /ang terke"il dan tidak signifikan, sehingga harus dikeluarkan dari persamaan -engandemikian, .ariabel /ang terpilih adalah X2 dan X3dan prosedur stepwise selesai, dengan
persamaan akhir :
;ersamaan Y 4 fX3, X26:
Y 4 '3*0+25 < 122331 X2 < *3)3( X3,
-
8/16/2019 Teknik Pemilihan Variabel
13/14
2 4 )02%
b. ba"k!ard elimination
$angkah 1 : =entuk persamaan lengkap dan analisis .arians tertera di
ba!ah ini :
>.aluasi model ;ersamaan Y 4 fX3, X 2, X 16
Yest4 '3(+(*252) < 0000+(23+ X1 < 1121+*211 X2 < *+1)213+2 X3
9nalisis arian egresi ;arsial
#umber
.ariasi -b ?& ?& hit 05 10 2
egresi
X3,X2,X16 3 1,51),1*5
50(0*
) 2*02 32* 2*( 0)1)
X18 X2,
X36 1 302)55*
302)5
5 1** ** 305
X28 X1,
X36 1 *122
*12
*51 ** 305
X38 X1,
X26 1 2003*(5
2003*
+ 51 ** 305
esidu 1( 33+15+1210((
1
otal 1 1)55202
+5*2
2
-ari tabel 9nalisis arians ';arsial, tampak bah!a ariabel X1 mempun/ai @ilai '
parsial terke"il dan tidak n/ata, sehingga harus dikeluarkan dari model
$angkah 2 : menge.aluasi model tanpa men/ertakan ariabel X1 :
Y 4 fX2, X36
9nalisis arians egresi ;arsial
#umber
.ariasi -f ## # hit 05 10 2
egresi
X3,X26 2 1,*)+,1*5 +*33 3**3 35 2*( 0)02
X28X36 1 10025+ 1002( 3(* **5 303
-
8/16/2019 Teknik Pemilihan Variabel
14/14
X38X26 1 1+51 1+52 )31 **5 303
esidu 1+ 3(+3*2(21(0)
*
otal 1 1)55202+5*2
2
odel ;ersamaan baru Y 4 fX3,X26:
Y 4 '3*0+25 < 122331 X2 < *3)3( X3,
2 4 )020%
odel persamaan ini signifikan dengan @ilai hitung keseluruhan 3*3A n/ata baik
pada taraf 5% maupun pada taraf 10%6 dengan nilai koefisien determinan,
2
4 )02%dan signifikan @ilai 'parsial .ariabel X3 dan X2 juga n/ata, sehingga kedua .ariabel
tersebut harus dipertahankan &arena tidak terdapat lagi .ariabel /ang dikeluarkan dari
odel, maka persamaan akhir egresi dengan prosedur backward elimination adalah:
Y 4 '3*0+25 < 122331 X2 < *3)3( X3,
2 4 )020%
&esimpulan :
-ari &edua "ara pemilihan model regresi terbaik, tern/ata untuk kasus sosial di atassemuan/a konsisten Ban/a ariabel X2 pendapatan keluarga6 dan X3tingkat
pengangguran6 saja /ang terpilih dan signifikan memberikan kontribusi dalam
menentukan tinggi rendahn/a Y $aju bunuh diri6
Sumber
• >ernasuprihartiningsih.blogspot.#o.id>2*11>*1>model-regresi-
terbaik-stepise.html• le>>>/>&unya?2*Wulan>0ugas?2*,uliah>semester?2*6>%nreg>,ursus
?2*Statistika?2*anjut.pd •
http://ernasuprihartiningsih.blogspot.co.id/2011/01/model-regresi-terbaik-stepwise.htmlhttp://ernasuprihartiningsih.blogspot.co.id/2011/01/model-regresi-terbaik-stepwise.htmlhttp://d/Punya%20Wulan/Tugas%20Kuliah/semester%206/Anreg/Kursus%20Statistika%20Lanjut.pdfhttp://d/Punya%20Wulan/Tugas%20Kuliah/semester%206/Anreg/Kursus%20Statistika%20Lanjut.pdfhttp://d/Punya%20Wulan/Tugas%20Kuliah/semester%206/Anreg/Kursus%20Statistika%20Lanjut.pdfhttp://d/Punya%20Wulan/Tugas%20Kuliah/semester%206/Anreg/Kursus%20Statistika%20Lanjut.pdfhttp://ernasuprihartiningsih.blogspot.co.id/2011/01/model-regresi-terbaik-stepwise.htmlhttp://ernasuprihartiningsih.blogspot.co.id/2011/01/model-regresi-terbaik-stepwise.html