regresi dengan variabel dummy dg minitab
DESCRIPTION
regresi dummyTRANSCRIPT
-
REGRESI DENGAN VARIABEL DUMMY
Nama lain Regresi Dummy adalah Regresi Kategori. Re-gresi ini menggunakan prediktor kualitatif (yang bukan
dummy dinamai prediktor kuantitatif). Pembahasan pada regresi ini hanya untuk satu macam variabel dummy
dan dikhususkan pada penaksiran parameter dan kemaknaan pengaruh prediktor.
Contoh (menggunakan minitab) Suatu penelitian bertujuan memodelkan hubungan antara kandungan Suspended Solids dengan pH pada air yang
keluar dari outlet sistim pembersihan batubara. Sistim menggunakan tiga macam Polymer. Model dugaan ada-
lah :
Yi = 0 + 1X1i + 2Z1i + 3Z2i + i , i = 1, 2, ... , 18.
Polimer sebagai variabel dummy yang terdiri dari tiga le-vel, yaitu 1, 2, dan 3, dinyatakan oleh tiga variabel,
yaitu Z1, Z2, dan Z3. Command untuk mendapatkan nilai-nilai variabel dummy dengan MINITAB adalah :
MTB > INDICATOR C14 C15 C16 C17
MTB > name C15 Z1
MTB > name C16 Z2
MTB > name C17 Z3
dengan :
C14 adalah kolom yang memuat variabel dummy,
pada contoh soal ini adalah Polymer.
C15 C17 menyatakan asal Polymer, yang kemu- dian dinamai Z1, Z2, dan Z3; Z1 bernilai 1
menunjukkan eksperimen menggunakan
Polymer 1, begitu pula dengan Z2 dan Z3.
Hasil eksperimen beserta nilai-nilai variabel dummy di-tampilkan pada tabel berikut:
pH (X)
Suspended Solid (Y)
Polymer Z1 Z2 Z3
6,5 292 1 1 0 0
6,9 329 1 1 0 0
7,8 352 1 1 0 0
8,4 378 1 1 0 0
8,8 392 1 1 0 0
9,2 410 1 1 0 0
6,7 198 2 0 1 0
6,9 227 2 0 1 0
7,5 277 2 0 1 0
7,9 297 2 0 1 0
8,7 364 2 0 1 0
9,2 375 2 0 1 0
6,5 167 3 0 0 1
7 225 3 0 0 1
7,2 247 3 0 0 1
7,6 268 3 0 0 1
8,7 288 3 0 0 1
9,2 342 3 0 0 1
Sumber : Classical And Modern Regression, Second
Edition, oleh Raymond H Myers, 1990, ha-
laman 143.
-
Keluaran pengolahan data adalah sebagai berikut :
MTB > Regress 'Suspended Solid' 4 'pH' 'Z1' 'Z2' 'Z3';
SUBC> Constant;
SUBC> Brief 2.
Regression Analysis: Suspended Solid versus pH; Z1; Z2; Z3 * Z3 is highly correlated with other X variables
* Z3 has been removed from the equation.
The regression equation is
Suspended Solid = - 162 + 54,3 pH + 90,0 Z1 +
27,2 Z2
Predictor Coef SE Coef T P
Constant -161,90 37,43 -4,32 0,001
pH 54,294 4,755 11,42 0,000
Z1 90,00 11,05 8,14 0,000
Z2 27,17 11,01 2,47 0,027
S = 19,0464 R-Sq = 94,0% R-Sq(adj) = 92,8%
Analysis of Variance
Source DF SS MS F P
Regression 3 80182 26727 73,68 0,000
Residual Error 14 5079 363
Total 17 85260
Source DF Seq SS
pH 1 54856
Z1 1 23118
Z2 1 2208
Munculnya peringatan : * Z3 is highly corre-lated with other X variables, dan * Z3 has been removed from the equation, menunjukkan bahwa hanya diperlukan Z1 dan Z2; berarti untuk satu
prediktor dummy dengan tiga level (pada kasus ini Polymer terdiri dari level 1, 2, dan 3) cukup dinyatakan oleh
dua variabel dummy, Z1 dan Z2. Dengan demikian, pada pengolahan data yang digunakan sebagai prediktor
kualitatif adalah Z1 dan Z2, bukan Polymer.
Kemaknaan pengaruh Polymer dideteksi melalui Jumlah Kuadrat Regresi kontribusi Z1 dan Z2, yang dinotasikan
),|,( 1032 R , dan didapatkan dengan menjum-lahkan SS Sequential Z1 dengan Z2, yaitu :
),|,( 1032 R = 23118 + 2208 = 25326
Proses pengujian hipotesis secara lengkap adalah sebagai berikut :
i. Perumusan hipotesis,
H0 : 2 = 0 dan 3 = 0 , berarti pengaruh Polyner ter- hadap kandungan Suspended
Solid tidak bermakna,
H1 : 2 atau 3 tidak nol.
ii. = 0,05
iii. Statistik Uji :
77,69363
25326),|,( 1032 MSE
RF
iv. Bila H0 benar maka F~ F2,14, sehingga titik kritis ada-
lah F2,14, 0,05 = 3,74.
v. Kesimpulan : tolak H0, karena statistik uji F >
F2,14, 0,05 , sehingga Polymer berpengaruh pada kan-
-
dungan SS.
Kesimpulan ini berdasarkan pada anggapan bahwa pe-ngaruh prediktor pH dan Polymer bersifat aditif, bukan
interaktif. Ciri aditif ialah kemiringan garis regresi sama atau garis regresi ke tiga Polymer sejajar, seperti yang
di-tampilkan pada Plot berikut ini.
pH
Ka
nd
un
ga
n S
usp
en
de
d S
olid
9,59,08,58,07,57,06,5
450
400
350
300
250
200
Variable
Y Polimer1
Y Polimer2
Y Polimer3
Plot Suspended Solid Pada Polimer1, Polimer2, Polimer3 terhadap pH
Model dugaan untuk Polymer 1, Polymer 2, dan Polymer 3 masing-masing adalah sebagai berikut :
Model pada Polymer 1 didapat dengan cara mensubsti-tusikan nilai Z1=1 dan Z2=0 pada model regresi hasil
pengolahan data,
Suspended Solid = - 162 + 54,3 pH + 90,0
Suspended Solid = - 72 + 54,3 pH
Model pada Polymer 2 didapat dengan cara mensubsti-tusikan nilai Z1=0 dan Z2=1 pada model regresi hasil
pengolahan data,
Suspended Solid = - 162 + 54,3 pH + 27,2
Suspended Solid = - 134,8 + 54,3 pH
Model pada Polymer 3, Z1=0 dan Z2=0, Suspended Solid = - 162 + 54,3 pH
Contoh Soal Berikut ini adalah data Pengeluaran Untuk Makanan dan Pendapatan Bersih para Pria dan Wanita lajang. Jenis
Ke-lamin merupakan variabel kategori, dengan Pria diberi nilai 0 dan Wanita diberi nilai 1. Datanya sebagai
beri- kut:
Pengamatan
ke
Pengeluaran
untuk
makanan
Y
($)
Pendapatan
Bersih
X
($)
Jenis
Kelamin
D
1 1983 11557 1
2 2987 29387 1
3 2993 31463 1
4 3156 29554 1
5 2706 25137 1
6 2217 14952 1
7 2230 11589 0
8 3757 33328 0
9 3821 36151 0
10 3291 35448 0
11 3429 32988 0
12 2533 20437 0
Lakukan analisa deperti penjelasan di atas!