model pilihan kualitatif - · pdf filedimana s: peubah acak menyebar normal dgn nilai tengah...

Post on 27-Feb-2018

231 Views

Category:

Documents

6 Downloads

Preview:

Click to see full reader

TRANSCRIPT

MODEL PILIHAN KUALITATIF

OlehBambang Juanda

Seringkali dalam suatu survei kita berhadapan dengan peubah kualitatif yang mempunyai skala pengukuran nominal atau ordinal. Nilai-nilai peubah respons kualitatif ini terbatas (limited dependent variable), bahkan sering hanya bernilai dua kemungkinan saja. Misalnya, apakah seseorang membeli mobil atau tidak; memilih atau tidak dalam Pilkada (pemilihan kepala daerah); punya penyakit jantung koroner atau tidak; dan masih banyak contoh lainnya. Peubah kualitatif yang hanya mempunyai dua kemungkinan nilai ini disebut peubah biner.

Seringkali dalam suatu survei kita berhadapan dengan peubah kualitatif yang mempunyai skala pengukuran nominal atau ordinal. Nilai-nilai peubah respons kualitatif ini terbatas (limited dependent variable), bahkan sering hanya bernilai dua kemungkinan saja. Misalnya, apakah seseorang membeli mobil atau tidak; memilih atau tidak dalam Pilkada (pemilihan kepala daerah); punya penyakit jantung koroner atau tidak; dan masih banyak contoh lainnya. Peubah kualitatif yang hanya mempunyai dua kemungkinan nilai ini disebut peubah biner.

Meskipun logis kita memperkirakan suatu hubungan langsung antara pendapatan dan perilaku pembelian, namun kita tidak dapat yakin apakah masing-masing konsumen dengan pendapatan tertentu pasti akan membeli produk. Oleh karena itu, tujuan model pilihan kualitatifadalah menentukan peluang bahwa individu dengan karakteristik-karakteristik tertentu akan memilih suatu pilihan tertentu dari beberapa alternatif yang tersedia. Jika pilihannya hanya ada dua alternatif disebut model pilihan biner.

Meskipun logis kita memperkirakan suatu hubungan langsung antara pendapatan dan perilaku pembelian, namun kita tidak dapat yakin apakah masing-masing konsumen dengan pendapatan tertentu pasti akan membeli produk. Oleh karena itu, tujuan model pilihan kualitatifadalah menentukan peluang bahwa individu dengan karakteristik-karakteristik tertentu akan memilih suatu pilihan tertentu dari beberapa alternatif yang tersedia. Jika pilihannya hanya ada dua alternatif disebut model pilihan biner.

Overview

ContinuousLinear

RegressionAnalysis

Response Analysis

Continuous

Categorical

RegressionAnalysis

- -Model Peluang Linear

-Model Probit

IlustrasiStudi mengenai pengaruh tingkat pendapatan, jenis kelamin dan umur terhadap membeli tidaknya seseorang pada suatu produk yang dijual dengan harga tertentu.

Peubah Penjelas (bebas): umur, jenis kelamin dan tingkat pendapatan

Peubah Respons(Y): membeli (=1) atau tidak (=0)

Ilustrasi utk 1 Peubah BebasStudi mengenai pengaruh tk pendapatan atau jenis kelamin (X) terhadap membeli tidaknya seseorang (Y) pada suatu produk yang dijual dengan harga tertentu.

Peubah Penjelas (bebas): Tk Pendapatan: X = Rp …… juta

atau Jenis Kelamin: X= 1, jika Pria0, jika Wanita

Peubah Respons: Y = 1, jika membeli 0, jika tidak membeli

Peubah Penjelas (bebas): Tk Pendapatan: X = Rp …… juta

atau Jenis Kelamin: X= 1, jika Pria0, jika Wanita

1. Model Peluang LinearYi = + Xi + εi (10.1)

Dimana Xi = nilai karakteristik (misalnya pendapatan) individu ke-i,Yi = 1 , jika pilihan kesatu dipilih (misalnya membeli mobil)

0 , jika pilihan kedua dipilih (tidak membeli mobil).εi = peubah acak yang menyebar bebas dengan nilai tengah 0.

Untuk menginterpretasikan persamaan (10.1) kita tentukan nilai harapan dari masing-masing pengamatan peubah respons Yi :

E(Yi) = + Xi (10.2)Karena Yi hanya mempunyai kemungkinan dua macam nilai (1 dan 0), kita dapat menggambarkan sebaran peluang Y dengan memisalkan:

Pi = P(Yi=1) dan 1-Pi = P(Yi=0), sehingga E(Yi) = 1 (Pi) + 0 (1-Pi) = Pi. (10.3)

model (10.1) peluang bahwa individu konsumen ke-i dengan pendapatan tertentu (Xi) akan membeli mobil.

Slope garis mengukur pengaruh perubahan 1 unit pendapatan terhadap perubahan peluang membeli mobil

Yi = + Xi + εi (10.1)Dimana Xi = nilai karakteristik (misalnya pendapatan) individu ke-i,

Yi = 1 , jika pilihan kesatu dipilih (misalnya membeli mobil)0 , jika pilihan kedua dipilih (tidak membeli mobil).

εi = peubah acak yang menyebar bebas dengan nilai tengah 0.Untuk menginterpretasikan persamaan (10.1) kita tentukan nilai harapan dari masing-masing pengamatan peubah respons Yi :

E(Yi) = + Xi (10.2)Karena Yi hanya mempunyai kemungkinan dua macam nilai (1 dan 0), kita dapat menggambarkan sebaran peluang Y dengan memisalkan:

Pi = P(Yi=1) dan 1-Pi = P(Yi=0), sehingga E(Yi) = 1 (Pi) + 0 (1-Pi) = Pi. (10.3)

model (10.1) peluang bahwa individu konsumen ke-i dengan pendapatan tertentu (Xi) akan membeli mobil.

Slope garis mengukur pengaruh perubahan 1 unit pendapatan terhadap perubahan peluang membeli mobil

Dugaan Model Peluang Linear

+ Xi , jika 0<(+Xi)<1Pi = 1 , jika (+Xi) ≥ 1

0 , jika (+Xi) ≤ 0 (10.4)

Sebaran Peluang bagi εi

Yi εi Peluang

1 1- - Xi Pi1 1- - Xi Pi

0 - - Xi 1 - Pi

E(εi) = (1- - Xi) Pi + (- - Xi) (1-Pi) = 0 sehingga Pi = + Xi

(1-Pi) = 1 - - Xi

Ragam komponen sisaan

Jadi, peubah Y menyebar menurut sebaran (distribusi) peluang Bernouli. Masalah heteroskedastisitas

)1()1()()1()( 222iiiiiii PPPXPXE

E(εi) = (1- - Xi) Pi + (- - Xi) (1-Pi) = 0 sehingga Pi = + Xi

(1-Pi) = 1 - - Xi

Ragam komponen sisaan

Jadi, peubah Y menyebar menurut sebaran (distribusi) peluang Bernouli. Masalah heteroskedastisitas

)1()1()()1()( 222iiiiiii PPPXPXE

)()1()](1[)()()( 2222iiiiiiiii EPPYEYEYEYEYVar

Kendala dalam model peluang linear perlu transformasi model (linear) awal sedemikian rupa sehingga prediksi nilai Y berada dalam selang (0;1) untuk semua nilai peubah bebas X. Salah satu bentuk transformasi yang mempunyai karakteristik seperti ini adalah fungsi peluang kumulatif (cumulative probability function), F.[1] Sebaran peluangnya dapat direpresentasikan dalam bentuk:

Pi = F( + Xi) = F(Zi)

Sebenarnya banyak fungsi peluang kumulatif yang mungkin dapat digunakan, namun disini hanya dua macam yang dipertimbangkan, yaitu fungsi peluang normal danlogistik kumulatif.

[1] Fungsi peluang kumulatif adalah F(xi)=Peluang (X≤xi)

Kendala dalam model peluang linear perlu transformasi model (linear) awal sedemikian rupa sehingga prediksi nilai Y berada dalam selang (0;1) untuk semua nilai peubah bebas X. Salah satu bentuk transformasi yang mempunyai karakteristik seperti ini adalah fungsi peluang kumulatif (cumulative probability function), F.[1] Sebaran peluangnya dapat direpresentasikan dalam bentuk:

Pi = F( + Xi) = F(Zi)

Sebenarnya banyak fungsi peluang kumulatif yang mungkin dapat digunakan, namun disini hanya dua macam yang dipertimbangkan, yaitu fungsi peluang normal danlogistik kumulatif.

[1] Fungsi peluang kumulatif adalah F(xi)=Peluang (X≤xi)

Model ProbitPi = F( + Xi) = F(Zi)

asumsikan ada suatu indeks Zi yg bernilai kontinu secara teoritis, yg ditentukan oleh nilai peubah penjelas X shg dapat ditulis:

Zi = + Xiasumsikan bahwa Z merupakan peubah acak yang menyebar normal sehingga peluang bahwa Z lebih kecil (atau sama dengan) Zi dapat dihitung dari fungsi peluang normal kumulatif. Untuk fungsi peluang normal baku kumulatif dapat dituliskan dalam rumus:

dimana s: peubah acak menyebar normal dgn nilai tengah 0 dan ragam1. Dgn rumus transformasi diatas, peubah Pi akan bernilai dlm selang (0;1). Pi menggambarkan peluang individu berkarakteristik (berpendapatan) Ximemilih pilihan-1 (beli mobil). Karena nilai peluang ini diukur berdasarkan luas daerah dibawah kurva normal baku dari - sampai Zi, maka peluang pilihan-1 (beli mobil) makin tinggi jika nilai indeks Zi makin tinggi. Untuk menduga indeks Zi, kita menggunakan kebalikan (inverse) dari fungsi normal baku kumulatif (10.9) dengan:

Zi = F-1(Pi) = + Xi

iZ

sii dseZFP 22

2

1)(

Pi = F( + Xi) = F(Zi) asumsikan ada suatu indeks Zi yg bernilai kontinu secara teoritis, yg ditentukan oleh nilai peubah penjelas X shg dapat ditulis:

Zi = + Xiasumsikan bahwa Z merupakan peubah acak yang menyebar normal sehingga peluang bahwa Z lebih kecil (atau sama dengan) Zi dapat dihitung dari fungsi peluang normal kumulatif. Untuk fungsi peluang normal baku kumulatif dapat dituliskan dalam rumus:

dimana s: peubah acak menyebar normal dgn nilai tengah 0 dan ragam1. Dgn rumus transformasi diatas, peubah Pi akan bernilai dlm selang (0;1). Pi menggambarkan peluang individu berkarakteristik (berpendapatan) Ximemilih pilihan-1 (beli mobil). Karena nilai peluang ini diukur berdasarkan luas daerah dibawah kurva normal baku dari - sampai Zi, maka peluang pilihan-1 (beli mobil) makin tinggi jika nilai indeks Zi makin tinggi. Untuk menduga indeks Zi, kita menggunakan kebalikan (inverse) dari fungsi normal baku kumulatif (10.9) dengan:

Zi = F-1(Pi) = + Xi

iZ

sii dseZFP 22

2

1)(

Hubungan Nilai Indeks Z dan Sebaran Peluang Normal Kumulatifnya

Z F(Z) Z F(Z)-3.0 .001 0.5 .691-2.5 .006 1.0 .841-2.0 .023 1.5 .933-2.0 .023 1.5 .933-1.5 .067 2.0 .977-1.0 .159 2.5 .994-0.5 .309 3.0 .9990.0 .500 3.5 .999

Model (Peluang) Linear vs Model Probit

Model Linear

Meskipun model probit lebih menarik dari model peluang linear, namun untuk menduga parameter koefisiennya menggunakan pendugaan kemungkinan maksimum (maximum likelihood, ML) non linear. Selain itu, justifikasi atau interpretasi koefisiennya agak terbatas. Oleh karena itu sebaiknya menggunakan model logit yang dibahas dalam subbab berikut

Meskipun model probit lebih menarik dari model peluang linear, namun untuk menduga parameter koefisiennya menggunakan pendugaan kemungkinan maksimum (maximum likelihood, ML) non linear. Selain itu, justifikasi atau interpretasi koefisiennya agak terbatas. Oleh karena itu sebaiknya menggunakan model logit yang dibahas dalam subbab berikut

menggunakan peubah penjelasnya (dpt peubah kategorik atau peubah numerik) untuk menduga peluang kejadian tertentu dari peubah respons kategori.

)(

)(

10

10

1)/1(

i

i

X

X

iie

eXYE

Model Regresi Logistik (Model logit)

Model Logit Sederhana :

)()( 1

1

1

1)(

10XgXii

eePXP

i

Sebaran Logistik menyerupai kurva berbentuk S, sehingga interpretasinya logis. 0 ≤ E(Y/X) ≤ 1

Interpretasi: Peluang kejadian tertentu dari peubah respons kategori(misalnya membeli) jika pendapatannya Xi

Transformasi Logit Peluang kejadian tertentu dari peubah respons kategori (pi), ditransformasi shg

i indeks semua kasus (observasi 1,2,..,n).pi peluang kejadian (misalnya, membeli) terjadi

untuk kasus ke-i.log adalah natural log (bilangan dasar e).

logit( ) logpp

pi

i

i

1ii Xxg 10)(

Peluang kejadian tertentu dari peubah respons kategori (pi), ditransformasi shg

i indeks semua kasus (observasi 1,2,..,n).pi peluang kejadian (misalnya, membeli) terjadi

untuk kasus ke-i.log adalah natural log (bilangan dasar e).

Fungsi g(x) sudah Linear dalam Parameter, dan -~ ≤ g(x) ≤ ~, shg dpt diduga dgn OLS

Assumption (peubah X berskala Interval)

Pi

Predictor (X)

Transformasilogit

Predictor (X)

Interpretasi Koefisien Model LogitUtk Peubah Bebas biner, mis Jenis Kelamin (X=1, X=0)

)(101

1)1(1

e

P

0

0

1)0(

e

eP

)(

)(

10

10

1)1(

e

eP

01

1)0(1

e

P

)(

)(

10

10

1)(

i

i

X

X

ie

eXP

X=1 X=0

Y=1

Y=0 )(101

1)1(1

e

P01

1)0(1

e

P

Y=0

P(1) : Peluang membeli produk utk konsumen Pria

P(0) : Peluang membeli produk utk konsumen Wanita )1(1

)1(

P

POdd pria

)0(1

)0(

P

POddwanita

1 1Jumlah

eP

P

P

POddsRatio

)0(1

)0(/

)1(1

)1( 1

Interpretasi Koefisien

1 = g(X+1) – g(X)

utk X biner: 1 = g(1) – g(0)

ii

i

i XXgXP

XP10)(

)(1

)(log

))0(1/()0(

))1(1/()1(log

)01(1

)0(log

)1(1

)1(log

PP

PP

P

P

P

P

Ukuran Asosiasi

1

)0(1/)0(

)1(1/)1( e

PP

PP

Odds Ratio:

“Berapa kali Kemungkinan membeli utk konsumen Pria dibandingkan Konsumen Wanita”

Interpretasi Pendekatan Peluang Relatif P(1)/P(0) ini berlaku bila P(x) kecil

Utk X kontinu, exp(1) : Berapa kali Kemungkinan membelinya jika X naik 1 unit

Ukuran Asosiasi

Properties of the Odds RatioODDS RATIO

OF GROUP A TO GROUP BNo

Association

=x+1=x

0-0.5

• SK (1-) 100% bagi Odds Ratio: exp(c ± z/2 c s)

• Dlm realitas P(x) jika x berbeda 1 unit (12 dgn 1011) dapat cukup berbeda. →Dilema utk peubah kontinu dimodelkan linear dlm model logit. Jika yakin bahwa logit tdk linear dgn covariate grouping (Dummy)

^^

Note:

Multiple Logistic Regression

Purchase Gender Income AgePurchase Gender Income Age

logit (pi) = 0 + 1X1 + 2X2 + 3X3

Ilustrasi model utk mengkaji pengaruh jenis kelamin (X1), umur (X2), dan tingkat pendapatan (X2) terhadap membeli tidaknya seseorang pada suatu produk yang dijual dengan

harga tertentu.

logit (pi) = iiii

i

i XXXXgXP

XP3322110)(

)(1

)(log

)(

)(

332210

332210

1)(

iii

iii

XXX

XXX

ie

eXP

logit (pi) = iiii

i

i XXXXgXP

XP3322110)(

)(1

)(log

Utk Peubah Bebas X kontinu, seringkali 1 unit terlalu kecil atau besar utk dipertimbangkan Pendugaan utk perubahan “c” unit

1),()(

cexcxc

g(x+c) – g(x) = c 1

Odds Ratio-nya:

Pengujian Model dgn p Peubah Bebas

Uji Model secara keseluruhan:H0: 1= 2=…=p=0H1: ada j≠0Likelihood Ratio Test Statistics (G) ~Uji parsial koefisien:

H0: j=0H1: j≠0WaldTest Statistics (W) ~ Z

2(p)

Uji Model secara keseluruhan:H0: 1= 2=…=p=0H1: ada j≠0Likelihood Ratio Test Statistics (G) ~Uji parsial koefisien:

H0: j=0H1: j≠0WaldTest Statistics (W) ~ Z

(p)

Categorical Variables Codings

132 1,000 ,000144 ,000 1,000155 ,000 ,000240 1,000191 ,000

LowM ediumHigh

INCO M E

Fem aleM ale

G ENDER

Frequ ency (1) (2)Param eter codin g

Classification Tablea

236 33 87,7131 31 19,1

61,9

O bserved01

PURCHASE

O verall Percentage

Step 10 1

PURCHASE PercentageCorrect

Predicted

The cut value is ,500a.

Variables in the Equation

.025 .018 1 .974 1 .160 1 .026

.511 .209 5 .954 1 .015 1 .66712 .305 2 .002

-.787 .253 9 .676 1 .002 .455-.686 .243 7 .945 1 .005 .503

-1 .325 .720 3 .382 1 .066 .266

A G EG E ND E R(1 )IN CO M EIN CO M E (1 )IN CO M E (2 )Constan t

S tep1

a

B S .E . W a ld d f S ig . E xp(B)

V a riab le(s) en tered on s tep 1 : A G E , G E ND ER , IN CO M E.a .

Variables in the Equation

.025 .018 1 .974 1 .160 1 .026

.511 .209 5 .954 1 .015 1 .66712 .305 2 .002

-.787 .253 9 .676 1 .002 .455-.686 .243 7 .945 1 .005 .503

-1 .325 .720 3 .382 1 .066 .266

A G EG E ND E R(1 )IN CO M EIN CO M E (1 )IN CO M E (2 )Constan t

S tep1

a

B S .E . W a ld d f S ig . E xp(B)

V a riab le(s) en tered on s tep 1 : A G E , G E ND ER , IN CO M E.a .

Adjusted Odds Ratio

Predictor

Gender

Outcome

PurchaseGender Purchase

Controlling for

Types of Logistic Regression

Response Variable

Yes No

BinaryTwoCategories

Type ofLogistic Regression

BinaryYes No

Categories Binary

Nominal

Ordinal

Threeor

MoreCategories

top related