regresi dengan variabel dummy dg minitab

3
REGRESI DENGAN VARIABEL DUMMY Nama lain Regresi Dummy adalah Regresi Kategori. Re-gresi ini menggunakan prediktor kualitatif (yang bukan dummy dinamai prediktor kuantitatif). Pembahasan pada regresi ini hanya untuk satu macam variabel dummy dan dikhususkan pada penaksiran parameter dan kemaknaan pengaruh prediktor. Contoh (menggunakan minitab) Suatu penelitian bertujuan memodelkan hubungan antara kandungan Suspended Solids dengan pH pada air yang keluar dari outlet sistim pembersihan batubara. Sistim menggunakan tiga macam Polymer. Model dugaan ada- lah : Y i = 0 + 1 X 1i + 2 Z 1i + 3 Z 2i + i , i = 1, 2, ... , 18. Polimer sebagai variabel dummy yang terdiri dari tiga le-vel, yaitu 1, 2, dan 3, dinyatakan oleh tiga variabel, yaitu Z 1 , Z 2 , dan Z 3. Command untuk mendapatkan nilai-nilai variabel dummy dengan MINITAB adalah : MTB > INDICATOR C14 C15 C16 C17 MTB > name C15 ‘Z1’ MTB > name C16 ‘Z2’ MTB > name C17 ‘Z3’ dengan : C14 adalah kolom yang memuat variabel dummy, pada contoh soal ini adalah Polymer. C15 C17 menyatakan asal Polymer, yang kemu- dian dinamai Z1, Z2, dan Z3; Z1 bernilai 1 menunjukkan eksperimen menggunakan Polymer 1, begitu pula dengan Z2 dan Z3. Hasil eksperimen beserta nilai-nilai variabel dummy di-tampilkan pada tabel berikut: pH (X) Suspended Solid (Y) Polymer Z1 Z2 Z3 6,5 292 1 1 0 0 6,9 329 1 1 0 0 7,8 352 1 1 0 0 8,4 378 1 1 0 0 8,8 392 1 1 0 0 9,2 410 1 1 0 0 6,7 198 2 0 1 0 6,9 227 2 0 1 0 7,5 277 2 0 1 0 7,9 297 2 0 1 0 8,7 364 2 0 1 0 9,2 375 2 0 1 0 6,5 167 3 0 0 1 7 225 3 0 0 1 7,2 247 3 0 0 1 7,6 268 3 0 0 1 8,7 288 3 0 0 1 9,2 342 3 0 0 1 Sumber : Classical And Modern Regression, Second Edition, oleh Raymond H Myers, 1990, ha- laman 143.

Upload: muthia-nadhira-faladiba

Post on 15-Sep-2015

591 views

Category:

Documents


93 download

DESCRIPTION

regresi dummy

TRANSCRIPT

  • REGRESI DENGAN VARIABEL DUMMY

    Nama lain Regresi Dummy adalah Regresi Kategori. Re-gresi ini menggunakan prediktor kualitatif (yang bukan

    dummy dinamai prediktor kuantitatif). Pembahasan pada regresi ini hanya untuk satu macam variabel dummy

    dan dikhususkan pada penaksiran parameter dan kemaknaan pengaruh prediktor.

    Contoh (menggunakan minitab) Suatu penelitian bertujuan memodelkan hubungan antara kandungan Suspended Solids dengan pH pada air yang

    keluar dari outlet sistim pembersihan batubara. Sistim menggunakan tiga macam Polymer. Model dugaan ada-

    lah :

    Yi = 0 + 1X1i + 2Z1i + 3Z2i + i , i = 1, 2, ... , 18.

    Polimer sebagai variabel dummy yang terdiri dari tiga le-vel, yaitu 1, 2, dan 3, dinyatakan oleh tiga variabel,

    yaitu Z1, Z2, dan Z3. Command untuk mendapatkan nilai-nilai variabel dummy dengan MINITAB adalah :

    MTB > INDICATOR C14 C15 C16 C17

    MTB > name C15 Z1

    MTB > name C16 Z2

    MTB > name C17 Z3

    dengan :

    C14 adalah kolom yang memuat variabel dummy,

    pada contoh soal ini adalah Polymer.

    C15 C17 menyatakan asal Polymer, yang kemu- dian dinamai Z1, Z2, dan Z3; Z1 bernilai 1

    menunjukkan eksperimen menggunakan

    Polymer 1, begitu pula dengan Z2 dan Z3.

    Hasil eksperimen beserta nilai-nilai variabel dummy di-tampilkan pada tabel berikut:

    pH (X)

    Suspended Solid (Y)

    Polymer Z1 Z2 Z3

    6,5 292 1 1 0 0

    6,9 329 1 1 0 0

    7,8 352 1 1 0 0

    8,4 378 1 1 0 0

    8,8 392 1 1 0 0

    9,2 410 1 1 0 0

    6,7 198 2 0 1 0

    6,9 227 2 0 1 0

    7,5 277 2 0 1 0

    7,9 297 2 0 1 0

    8,7 364 2 0 1 0

    9,2 375 2 0 1 0

    6,5 167 3 0 0 1

    7 225 3 0 0 1

    7,2 247 3 0 0 1

    7,6 268 3 0 0 1

    8,7 288 3 0 0 1

    9,2 342 3 0 0 1

    Sumber : Classical And Modern Regression, Second

    Edition, oleh Raymond H Myers, 1990, ha-

    laman 143.

  • Keluaran pengolahan data adalah sebagai berikut :

    MTB > Regress 'Suspended Solid' 4 'pH' 'Z1' 'Z2' 'Z3';

    SUBC> Constant;

    SUBC> Brief 2.

    Regression Analysis: Suspended Solid versus pH; Z1; Z2; Z3 * Z3 is highly correlated with other X variables

    * Z3 has been removed from the equation.

    The regression equation is

    Suspended Solid = - 162 + 54,3 pH + 90,0 Z1 +

    27,2 Z2

    Predictor Coef SE Coef T P

    Constant -161,90 37,43 -4,32 0,001

    pH 54,294 4,755 11,42 0,000

    Z1 90,00 11,05 8,14 0,000

    Z2 27,17 11,01 2,47 0,027

    S = 19,0464 R-Sq = 94,0% R-Sq(adj) = 92,8%

    Analysis of Variance

    Source DF SS MS F P

    Regression 3 80182 26727 73,68 0,000

    Residual Error 14 5079 363

    Total 17 85260

    Source DF Seq SS

    pH 1 54856

    Z1 1 23118

    Z2 1 2208

    Munculnya peringatan : * Z3 is highly corre-lated with other X variables, dan * Z3 has been removed from the equation, menunjukkan bahwa hanya diperlukan Z1 dan Z2; berarti untuk satu

    prediktor dummy dengan tiga level (pada kasus ini Polymer terdiri dari level 1, 2, dan 3) cukup dinyatakan oleh

    dua variabel dummy, Z1 dan Z2. Dengan demikian, pada pengolahan data yang digunakan sebagai prediktor

    kualitatif adalah Z1 dan Z2, bukan Polymer.

    Kemaknaan pengaruh Polymer dideteksi melalui Jumlah Kuadrat Regresi kontribusi Z1 dan Z2, yang dinotasikan

    ),|,( 1032 R , dan didapatkan dengan menjum-lahkan SS Sequential Z1 dengan Z2, yaitu :

    ),|,( 1032 R = 23118 + 2208 = 25326

    Proses pengujian hipotesis secara lengkap adalah sebagai berikut :

    i. Perumusan hipotesis,

    H0 : 2 = 0 dan 3 = 0 , berarti pengaruh Polyner ter- hadap kandungan Suspended

    Solid tidak bermakna,

    H1 : 2 atau 3 tidak nol.

    ii. = 0,05

    iii. Statistik Uji :

    77,69363

    25326),|,( 1032 MSE

    RF

    iv. Bila H0 benar maka F~ F2,14, sehingga titik kritis ada-

    lah F2,14, 0,05 = 3,74.

    v. Kesimpulan : tolak H0, karena statistik uji F >

    F2,14, 0,05 , sehingga Polymer berpengaruh pada kan-

  • dungan SS.

    Kesimpulan ini berdasarkan pada anggapan bahwa pe-ngaruh prediktor pH dan Polymer bersifat aditif, bukan

    interaktif. Ciri aditif ialah kemiringan garis regresi sama atau garis regresi ke tiga Polymer sejajar, seperti yang

    di-tampilkan pada Plot berikut ini.

    pH

    Ka

    nd

    un

    ga

    n S

    usp

    en

    de

    d S

    olid

    9,59,08,58,07,57,06,5

    450

    400

    350

    300

    250

    200

    Variable

    Y Polimer1

    Y Polimer2

    Y Polimer3

    Plot Suspended Solid Pada Polimer1, Polimer2, Polimer3 terhadap pH

    Model dugaan untuk Polymer 1, Polymer 2, dan Polymer 3 masing-masing adalah sebagai berikut :

    Model pada Polymer 1 didapat dengan cara mensubsti-tusikan nilai Z1=1 dan Z2=0 pada model regresi hasil

    pengolahan data,

    Suspended Solid = - 162 + 54,3 pH + 90,0

    Suspended Solid = - 72 + 54,3 pH

    Model pada Polymer 2 didapat dengan cara mensubsti-tusikan nilai Z1=0 dan Z2=1 pada model regresi hasil

    pengolahan data,

    Suspended Solid = - 162 + 54,3 pH + 27,2

    Suspended Solid = - 134,8 + 54,3 pH

    Model pada Polymer 3, Z1=0 dan Z2=0, Suspended Solid = - 162 + 54,3 pH

    Contoh Soal Berikut ini adalah data Pengeluaran Untuk Makanan dan Pendapatan Bersih para Pria dan Wanita lajang. Jenis

    Ke-lamin merupakan variabel kategori, dengan Pria diberi nilai 0 dan Wanita diberi nilai 1. Datanya sebagai

    beri- kut:

    Pengamatan

    ke

    Pengeluaran

    untuk

    makanan

    Y

    ($)

    Pendapatan

    Bersih

    X

    ($)

    Jenis

    Kelamin

    D

    1 1983 11557 1

    2 2987 29387 1

    3 2993 31463 1

    4 3156 29554 1

    5 2706 25137 1

    6 2217 14952 1

    7 2230 11589 0

    8 3757 33328 0

    9 3821 36151 0

    10 3291 35448 0

    11 3429 32988 0

    12 2533 20437 0

    Lakukan analisa deperti penjelasan di atas!