variabel kualitatif dengan dummi

7
MODUL 12 VARIABEL DUMMY  Ada kalanya kita melakukan suatu regresi dimana va ria bel penj el as atau va ria bel tergantung berupa data kategorikal (sering disebut data nominal). Misalnya laki-laki dan perempuan, desa-kota, industri pangan, sandang, dan peralatan. Cont oh ki ta ingi n menget ahui jeni s kelami n, lokasi , dan industri terhadap upah, 1. Peng aruh jenis kelamin at as u pah, mode lnya , pah ! a " b1#$% " e #i mana #$ % adal ah Dummy  jeni s kelamin (laki -laki dan &anita) '. Pengar uh lokasi terhadap upah, apakah desa lebih rendah upahnya dari kota, modelnya, pah ! a " b1#% " e dimana #% adalah dummy  lokasi *. Peng aruh indus tri t erhad ap u pah, model nya pah ! a " b1#+# " e dimana #+# adalah dummy  setiap klasiikasi industri

Upload: daith-dharma

Post on 16-Oct-2015

14 views

Category:

Documents


0 download

DESCRIPTION

Statistik Variabel Dummy

TRANSCRIPT

MODUL 12

MODUL 12

VARIABEL DUMMYAda kalanya kita melakukan suatu regresi dimana variabel penjelas atau variabel tergantung berupa data kategorikal (sering disebut data nominal). Misalnya laki-laki dan perempuan, desa-kota, industri pangan, sandang, dan peralatan.

Contoh kita ingin mengetahui jenis kelamin, lokasi, dan industri terhadap upah,

1. Pengaruh jenis kelamin atas upah, modelnya,

Upah = a + b1DJK + e

Dimana DJK adalah Dummy jenis kelamin (laki-laki dan wanita)

2. Pengaruh lokasi terhadap upah, apakah desa lebih rendah upahnya dari kota, modelnya,

Upah = a + b1DLOK + e

dimana DLOK adalah dummy lokasi

3. Pengaruh industri terhadap upah, modelnya

Upah = a + b1DIND + e

dimana DIND adalah dummy setiap klasifikasi industri

Untuk memudahkan lihat contoh data berikut:

IndustriKode IndustriUpah

Pangan31500

Sandang32522

Sandang32530

Pangan31512

Peralatan logam38600

Peralatan logam38642

Pangan31540

Pangan31520

Sandang32580

Sandang32570

Cara Membuat Variabel Dummy

Untuk dapat membedakan pengaruh masing-masing industri atas upah kita akan membuat variabel dummy. Caranya adalah memberi nilai 1 pada kategori tersebut dan memberi nol bagi kategori lainnya data berubah menjadi sebagai berikut.

IndustriKode IndustriUpahDpanganDsandangDalat

Pangan31500100

Sandang32520010

Sandang32530010

Pangan31520100

Peralatan logam38600001

Peralatan logam38640001

Pangan31540100

Pangan31520100

Sandang32580010

Sandang32570010

Sekarang perhatikan upah rata-rata untuk masing-masing industri:

Pangan =

Sandang =

Peralatan=

Jika kita memiliki 3 dummy variabel maka kita bisa memasukkan 2 variabel dummy, sedangkan yang satu akan berfungsi menjadi benchmark atau pematok. Besarnya benchmark tidak lain adalah intercept atau nilai a.

Contoh:

Upah = a + b1 Dsandang + b2 Dalat + e

Dari data di atas hasilnya adalah sebagai berikut

Upah = 520 + 30 Dsandang + 100 Dalat

Jadi rata-rata upah industri pangan yang tidak dimasukkan ke dalam model menjadi intersep (benchmark) beda upah sandang terhadap pangan adalah nilai b1=30 dan beda upah rata-rata industri peralatan terhadap industri pangan adalan 100.

Sebaliknya jika yang tidak dimasukkan dalam regresi adalah industri peralatan, maka hasil regresi akan berubah sebagai berikut,

Upah = 620 - 100 Dpangan - 70 Dsandang

Sekarang intersep (a) menjadi rerata industri alat, dan beda upah pangan terhadap industri alat adalah minus 100 dan beda upah industri alat adalah minus 70.

Kesimpulannya jika kita punya n variabel dummy, maka kita dapat memasukkan n-1 variabel dalam model regresi, dan yang menjadi intersep adalah nilai rata-rata variabel yang tidak dimasukkan.

Perhatikan cara memaknai parameter hasil regresi yang menggunakan dummy di atas.

Sekarang kita akan memasukkan data pendidikan pada data yang kita miliki di atas, data lengkapnya menjadi sebagai berikut.

IndustriKode IndustriUpahDpanganDsandangDalat

Pangan31500106

Sandang32520019

Sandang32530019

Pangan31520109

Peralatan logam386000012

Peralatan logam386400011

Pangan31540109

Pangan31520106

Sandang325800112

Sandang32570019

Hasil di atas dapat kita ringkas dan sajikan sebagai berikut:

Makna hasil regresi sekarang adalah sebagai berikut:

Pada tingkat pendidikan yang sama, maka upah industri sandang adalah minus 18,6 di bawah industri pangan (industri yang tidak diikutkan dalam regresi). Upah industri peralatan pada tingkat pendidikan yang sama adalah 49,9 di atas industri pangan. Mengapa angkanya menjadi semakin kecil dari sebelumnya?

Hal ini disebabkan adanya perbedaan pendidikan di ketiga industri, perbedaan upah tidak semata disebabkan oleh perbedaan industri tetapi juga disebabkan oleh perbedaan pendidikan. Ini dapat juga dikatakan bahwa pendidikan menjadi variabel KONTROL yan bertugas memurnikan pengaruh perbedaan industri atas upah.

LATIHAN

Sekarang buatlah analisis dengan data berikut.

INDUSTRILABAKAPITAL

A1010

A1211

A1412

A129

B1313

B1523

B1125

B1016

B1831

C2040

C2250

C2352

A2020

A1130

B1540

Buatlah model analisis yang menjawab pertanyaan penelitian berikut:

1. Apakah ketiga industri memiliki laba benar-benar yang berbeda? Buatlah dummy variabelnya.

2. Apakah laba itu disebabkan oleh beda industri atau modal, berapa sumbangan masing-masing?

3. Mana variabel yang signifikan?

4. Tunjukkan ketepatan modelnya.

5. Ujilah asumsi klasiknya.

6. Sajikan hasil regresi secara internasional sebagaimana modul 6

Soal di atas hanya dapat dipecahkan melalui program paket karena variabelnya menjadi banyak. Gunakan SPSS

Upah =448,4 - 18,62 Dsandang + 49,9 Dalat + 10,5 Pendidik

(12,)** (-1,04) (2,287)** (2,486)**

R2 = 0,839

F= 0,4

_1153872362.unknown

_1153872403.unknown

_1153872312.unknown