regresi beta binomial.pptx

23
Seminar Proposal Skripsi “PENANGANAN OVERDISPERSI MENGGUNAKAN REGRESI BETA BINOMIAL PADA REGRESI LOGISTIK” PROGRAM STUDI STATISTIKA JURUSAN MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS BRAWIJAYA MALANG 10 Juli 2013

Upload: dindarinai9985

Post on 26-Oct-2015

57 views

Category:

Documents


3 download

TRANSCRIPT

Seminar Proposal Skripsi“PENANGANAN OVERDISPERSI MENGGUNAKAN

REGRESI BETA BINOMIAL PADA REGRESI LOGISTIK”

PROGRAM STUDI STATISTIKAJURUSAN MATEMATIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAMUNIVERSITAS BRAWIJAYA

MALANG10 Juli 2013

Latar Belakang

Kemiskinan di Indonesia

Data kemiskinan oleh BPS

Pembentukan TNP2K

Perencanaan dan Evaluasi

Kebijakan

Analisis Data Kemiskinan

Data Kemiskinan per kab/kota

di Pulau Jawa

Data Proporsi

Regresi linier

sederhana

(Hajarisman 2005:26) Peubah

respon tidak saling bebas

Regresi Logistik

Ragam Pengamatan

> Ragam dugaan

Overdispersi pada regresi

logistik(Kurnia

dkk:2002)

Kesalahan dalam

penarikan kesimpulan

(Saefuddin dan Setiabudi,2011:3)Regresi Logistik

Over-dispersi

Metode Williams

Regresi Beta

Binomial

•Faktor – faktor apa saja yang berpengaruh pada proporsi kemiskinan per kabupaten/kota di Pulau Jawa dengan penanganan overdispersi menggunakan regresi beta binomial?

Rumusan

Masalah

•Data yang digunakan adalah data kemiskinan per kabupaten/kota di Pulau Jawa tahun 2008.•Pemeriksaan goodness of fit didasarkan pada statistik uji likelihood ratio test.•Pemilihan model terbaik dilihat dari nilai AIC terkecil

Batasan Masalah

•Mengetahui faktor–faktor yang berpengaruh pada proporsi kemiskinan per kabupaten/kota di Pulau Jawa dengan penanganan overdispersi menggunakan regresi beta binomial.

Tujuan Peneliti

an

•Menentukan peubah yang berpengaruh terhadap kemiskinan.•Menambah pengetahuan aplikasi statistika.

Manfaat Peneliti

an

Tinjauan PustakaGeneralized Linear Model (GLM)

Regresi Logistik

Statistik uji DevianceEstimasi Parameter Regresi Logistik

Regresi Beta BinomialEstimasi Parameter Regresi Beta Binomial

MultikolinieritasPengujian Signifikansi Parameter Regresi

Pemilihan Model TerbaikInterpretasi Koefisien Regresi Logistik

Kemiskinan

Overdispersi

Generalized Linear Model (GLM)

• menghubungkan peubah respon dengan distribusi tidak normal dan memodelkannya dengan nilai harapan (Agresti,2002:116)

GLM

•terdiri dari peubah respon yang saling bebas antar pengamatan

Random component

1,...,i j ijj

x i N Systematic component

Link function

( ) , 1,...,i j ijj

g x i N

Regresi Logistik

mengikuti sebaran Binomial (n, ) apabila n>2, dengan peluang :

Peubah respon

Respon biner

Respon binomial : berbentuk count Ramsey dan Schafer

(2013:639)

Y

( ) (1 )y n ynP Y y

y

0,1,2,...,y n

banyaknya pengamatann

Regresi Logistik

• Yaitu GLM dengan komponen acak binomial dan fungsi penghubung logit (Agresti,2002:123).

( , )i i iY B n ( )i i i iE Y n

var( ) (1 )i i i iY n

( ) log log1

i ii i

i i i

gn

log1

ij ij

ji

x

01

01

exp( )1,...,

) 1,...,

1 exp( )

p

j ijj

i p

j ijj

xi N

j px

x

Estimasi Parameter Regresi Logistik

• Fungsi kepekatan peluang bersama dari fungsi binomial adalah (Agresti, 2002:192) :

1

!( ) 1 ( )

!( )!

i i

i

n yNyi

i ii i i i

n

y n y

x x

1

( ) 1 ( )i i

i

n yNy

i ii

L

β x x

1

0 01 1

( ) ln

ln

(

1N

i j ij i j iji

p p

j j

l L

l y x n exp x

β

β

β

0

0

1

1 1

1

ˆ

ˆ

ˆˆ

ˆ1

p

ijN Nj

i

j

ij i ij pi ij

ijjj

exp xl

y x n x

exp x

β

1 1

0,        1, ,ˆN N

i ij i i iji i

y x n x j p

x

Non linier metode iteratif Newton Raphson

Estimasi Parameter Regresi Logistik

0 1

( ( (, , ...,

p

l l l

β β βu'

2 (( )(1 ( ))ab ia ib i

ia b

lh x x n

i i

βx x

( ) ( )12( ( ( ) ( ) ' ( )t tL L (t) (t) (t) (t)β β u β β β β H β β

1 ( ) 1 ( )( )t t (t ) (t)β β H u

2( 1) ( ) ( ) ( 1)ˆ ˆ t t t tj j j jc 0c

Statistik uji Deviance

Ramsey dan Schafer (2013:648 ) model dikatakan mengalami

overdispersi apabila : .

2

1

i N

ii

D d

ˆsign 2 log logˆ ˆi i i

i i i i i i ii i i i i

Y n Yd Y n Y n Y

n n n

1D

N p

Overdispersi

• yaitu keadaan di mana ragam pengamatan lebih besar daripada ragam dugaan (ragam distribusi binomial) (Agresti, 2002:7).

• Penyebab overdispersi : korelasi antara peubah respon biner (Hajarisman, 2005:26)

• Apabila tidak terdapat korelasi antara peubah biner, maka ragam pengamatan sesuai dengan ragam distribusi binomial

( ) ( )i ij i iE y E Y n var( ) var( ) cov( , )i ij ij iky Y Y Y 1 1 1i i i in n

0

Regresi Beta Binomial

• Menurut Agresti (2002:554) sebaran beta binomial adalah gabungan sebaran beta dengan binomial.

1

0

( ; , ) ( ) ( )f y f y f d

Fungsi kepadatan peluang distribusi binomial

Fungsi kepadatan peluang distribusi beta

( ) (1 )y n ynf y

y

1 1( )( ) (1 )

( ) ( )f

11 1

0

( )( ; , ) (1 ) (1 )

( ) ( )y n yn

f y dy

1

1 1

0 0

1

0

( ) (1 )

( ; , )(1 )

y n y

k k

n

k

k kn

f yy

k

Regresi Beta Binomial

Apabila terdapat p peubah bebas, maka model regresi beta binomial dapat dituliskan sebagai berikut (Agresti, 2002:555) :

( )E Y n1 ( 1)

var( ) (1 )(1 )

nY n

1 1 2 2logit( ) ...i i i p ipx x x

Estimasi Parameter Regresi Beta Binomial1 ( 1)

var( ) (1 )(1 )

ii i

nY n

var( ) (1 )i i iY n 1

1 1

0 0

1

0

( ) (1 )

( , )

(1 )

i i i

i

y n y

k ki

ni i

k

k kn

Ly

k

1 1 1

0 0 0

( , ) ln( ) ln(1 ) ln(1 )i i i iy n y n

i k i k i k

l k k k

Metode iterasi Newton RaphsonT

dl dl

d d

S

2 2

2

2 2

2

d l d l

d d d

d l d l

d d d

O 11 1

1

m m

m m

O S

1 ( 1)i in

Multikolinieritas

• Hosmer dan Lemeshow (2000:140-141) Adanya kolinearitas di antara peubah bebas akan mengakibatkan galat baku penduga yang besar.

• multikolinearitas tidak hanya pada hubungan linear yang bersifat sempurna tetapi juga pada kondisi di mana peubah bebas saling berkorelasi tetapi tidak secara sempurna (Gujarati,1991:158).

• Pendeteksian masalah multikolinearitas :

• VIF lebih dari 10 terdapat masalah multikolinearitas

2 1(1 )i iVIF R

Pengujian Signifikansi Parameter Regresi

Secara simultanmenggunakan likelihood ratio test. Statistik uji

ini dapat digunakan sebagai goodness of fit

Secara parsial

: 00 1 2 pH H1: paling sedikit ada satu j di mana 0 , ,j j 1 p

0 (2 ln

(p

LG

L

β

β2

(1 ; )vG hipotesis nol ditolak

0 : 0jH

1 : 0 , ,jH j 1 p

ˆ

ˆ ˆ( )j

j

WSE

)j P( z W hipotesis nol ditolak

Pemilihan Model Terbaik

Model terbaik adalah model yang memiliki nilai AIC terkecil (Kutner dkk, 2004:580).

2ln ( ) 2AIC L p

Interpretasi Koefisien Regresi Logistik

Odds adalah perbandingan peluang suatu kejadian sukses dengan peluang kejadian gagal.

Menurut Kutner dkk (2004:567)jX X 0

1

logit )p

i j ijj

x

x 0 1ˆlogit j jX X

1jX X 0 1ˆlogit 1 1j jX X

1ˆ ˆlogit 1 logitjX X

)logit ) log log

1 )i

ii

odds

xx

x

2 1 1log logodds odds

1logOR

1OR exp

Kemiskinan

Status wilayah

(PDRB) Per Kapita Atas Dasar Harga Berlaku

IPM

Tingkat Partisipasi Angkatan Kerja

Pengeluaran per kapita yang disesuaikan

Proporsi Kemisinan di Pulau Jawa

Metode Penelitian

Diagram Alir

Terima kasih