deteksi influence

Post on 14-Jun-2015

1.012 Views

Category:

Education

8 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Deteksi Influence

Analisis Eksplorasi Data

ST1312

Outlier(Sekelompok) Data yang terpisah/terpencil dari kumpulannyaMengapa penting ?Mengapa penting ?•Jika berpengaruh thd model model tidak merepresentasikan data dengan tepatMengapa sesuatu yang sedikit bisa mempengaruhi Mengapa sesuatu yang sedikit bisa mempengaruhi kesimpulan ?kesimpulan ?Dunia dibentuk oleh para outlier : Diktator sangat kejam, penemuan ilmuwan sangat pintar, miss world sangat cantik, koruptor paling rakus, permainan harga oleh pedagang sangat kaya, kebijakan satu orang sangat berkuasa terhadap rakyatnya

Outlier tak berpengaruh

Marlboro

Outlier berpengaruhkasus data time series

Dugaan : beda satuan = kasus Mars

Kasus ‘Telkom’ USA

Outlier berpengaruhkasus clustering

Outlier :1. Tidak berpengaruh2. Berpengaruh Influence

Regresi dengan/tanpa outlierThe regression equation is Sale = 5.02 + 20.5 AdvPredictor Coef SE Coef T PConstant 5.019 0.710 7.07 0.000Adv 20.505 1.025 20.00 0.000S = 0.9807 R-Sq = 97.6% R-Sq(adj) = 97.3%

Tanpa MarlboroThe regression equation is Sale = 5.03 + 20.5 AdvPredictor Coef SE Coef T PConstant 5.035 1.857 2.71 0.024Adv2 20.476 3.291 6.22 0.000S = 1.034 R-Sq = 81.1% R-Sq(adj) = 79.0%

Beberapa alat pendeteksi influence

1. Leverage (hi=vii=rii)

Alat pendeteksi pencilan pada variabel prediktor (X) (tanpa dihubungkan respon)

Leverage observasi ke-i (hi) adalah elemen diagonal ke-i. Leverage observasi ke-i hi > 3p/n disebut Unusual observation/ observasi yang jauh dari “seharusnya”.

p= banyak parameter termasuk 0

n= banyak observasi

Beberapa alat pendeteksi influence

2. Cook’s DistanceAlat pendeteksi pencilan yang mengkombinasi

leverage dan Studentized Residual untuk mengukur seberapa jauh kombinasi X,Y menyimpang dari “seharusnya”

Cook’s Distance(i) mengukur jarak antar koefisien jika observasi ke-i dimasukkan dan tidak pada model.

MSE p

bbXXbb i

TTTi

> F.5,p,0-p

Beberapa alat pendeteksi influence

3. DFFITAlat pendeteksi pencilan berdasarkan

perbedaan nilai Y-hat dengan dan tanpa pengamatan ke-i

n

p2

)Ys(

YY i

Beberapa alat pendeteksi influence

4. DFBetasAlat pendeteksi pencilan berdasarkan

perbedaan nilai koefisien regresi dengan dan tanpa pengamatan ke-i

n

2

)s(b

bb

j

ijj

Beberapa alat pendeteksi influence

5. CovRatioRasio determinan matriks koefisien regresi

dengan dan tanpa pengamatan ke-i

n

2

)cov(

cov

i

Tips mengatasi Influence

Apa penyebabnya ?Apa penyebabnya ?• Salah ukur, salah entry, kejadian luar

biasa Cari tahu sebabnyaSolusi ?Solusi ?• Modelkan tersendiri

– Dummy variable (Regr, Time Series), – Model Intervensi (Time Series)

• Anggap Missing Value (Time Series, Regr, ANOVA dsb)

Contoh

• SPSS Data world95

• MinitabExh_regr

SPSS

Data>Select Cases…

Data tertentu

Analyze>Regression>Linear…

syntax

respon

prediktor

Deteksi influence

Klik save

Minitab

File>open worksheet…>exh_regr

Stat>regression>regression

top related