deteksi influence

20

Click here to load reader

Upload: dessybudiyanti

Post on 14-Jun-2015

1.012 views

Category:

Education


8 download

TRANSCRIPT

Page 1: Deteksi Influence

Deteksi Influence

Analisis Eksplorasi Data

ST1312

Page 2: Deteksi Influence

Outlier(Sekelompok) Data yang terpisah/terpencil dari kumpulannyaMengapa penting ?Mengapa penting ?•Jika berpengaruh thd model model tidak merepresentasikan data dengan tepatMengapa sesuatu yang sedikit bisa mempengaruhi Mengapa sesuatu yang sedikit bisa mempengaruhi kesimpulan ?kesimpulan ?Dunia dibentuk oleh para outlier : Diktator sangat kejam, penemuan ilmuwan sangat pintar, miss world sangat cantik, koruptor paling rakus, permainan harga oleh pedagang sangat kaya, kebijakan satu orang sangat berkuasa terhadap rakyatnya

Page 3: Deteksi Influence

Outlier tak berpengaruh

Marlboro

Page 4: Deteksi Influence

Outlier berpengaruhkasus data time series

Dugaan : beda satuan = kasus Mars

Kasus ‘Telkom’ USA

Page 5: Deteksi Influence

Outlier berpengaruhkasus clustering

Outlier :1. Tidak berpengaruh2. Berpengaruh Influence

Page 6: Deteksi Influence

Regresi dengan/tanpa outlierThe regression equation is Sale = 5.02 + 20.5 AdvPredictor Coef SE Coef T PConstant 5.019 0.710 7.07 0.000Adv 20.505 1.025 20.00 0.000S = 0.9807 R-Sq = 97.6% R-Sq(adj) = 97.3%

Tanpa MarlboroThe regression equation is Sale = 5.03 + 20.5 AdvPredictor Coef SE Coef T PConstant 5.035 1.857 2.71 0.024Adv2 20.476 3.291 6.22 0.000S = 1.034 R-Sq = 81.1% R-Sq(adj) = 79.0%

Page 7: Deteksi Influence

Beberapa alat pendeteksi influence

1. Leverage (hi=vii=rii)

Alat pendeteksi pencilan pada variabel prediktor (X) (tanpa dihubungkan respon)

Leverage observasi ke-i (hi) adalah elemen diagonal ke-i. Leverage observasi ke-i hi > 3p/n disebut Unusual observation/ observasi yang jauh dari “seharusnya”.

p= banyak parameter termasuk 0

n= banyak observasi

Page 8: Deteksi Influence

Beberapa alat pendeteksi influence

2. Cook’s DistanceAlat pendeteksi pencilan yang mengkombinasi

leverage dan Studentized Residual untuk mengukur seberapa jauh kombinasi X,Y menyimpang dari “seharusnya”

Cook’s Distance(i) mengukur jarak antar koefisien jika observasi ke-i dimasukkan dan tidak pada model.

MSE p

bbXXbb i

TTTi

> F.5,p,0-p

Page 9: Deteksi Influence

Beberapa alat pendeteksi influence

3. DFFITAlat pendeteksi pencilan berdasarkan

perbedaan nilai Y-hat dengan dan tanpa pengamatan ke-i

n

p2

)Ys(

YY i

Page 10: Deteksi Influence

Beberapa alat pendeteksi influence

4. DFBetasAlat pendeteksi pencilan berdasarkan

perbedaan nilai koefisien regresi dengan dan tanpa pengamatan ke-i

n

2

)s(b

bb

j

ijj

Page 11: Deteksi Influence

Beberapa alat pendeteksi influence

5. CovRatioRasio determinan matriks koefisien regresi

dengan dan tanpa pengamatan ke-i

n

2

)cov(

cov

i

Page 12: Deteksi Influence

Tips mengatasi Influence

Apa penyebabnya ?Apa penyebabnya ?• Salah ukur, salah entry, kejadian luar

biasa Cari tahu sebabnyaSolusi ?Solusi ?• Modelkan tersendiri

– Dummy variable (Regr, Time Series), – Model Intervensi (Time Series)

• Anggap Missing Value (Time Series, Regr, ANOVA dsb)

Page 13: Deteksi Influence

Contoh

• SPSS Data world95

• MinitabExh_regr

Page 14: Deteksi Influence

SPSS

Page 15: Deteksi Influence

Data>Select Cases…

Data tertentu

Page 16: Deteksi Influence

Analyze>Regression>Linear…

syntax

respon

prediktor

Deteksi influence

Page 17: Deteksi Influence

Klik save

Page 18: Deteksi Influence

Minitab

File>open worksheet…>exh_regr

Page 19: Deteksi Influence

Stat>regression>regression

Page 20: Deteksi Influence