deteksi influence
TRANSCRIPT
Deteksi Influence
Analisis Eksplorasi Data
ST1312
Outlier(Sekelompok) Data yang terpisah/terpencil dari kumpulannyaMengapa penting ?Mengapa penting ?•Jika berpengaruh thd model model tidak merepresentasikan data dengan tepatMengapa sesuatu yang sedikit bisa mempengaruhi Mengapa sesuatu yang sedikit bisa mempengaruhi kesimpulan ?kesimpulan ?Dunia dibentuk oleh para outlier : Diktator sangat kejam, penemuan ilmuwan sangat pintar, miss world sangat cantik, koruptor paling rakus, permainan harga oleh pedagang sangat kaya, kebijakan satu orang sangat berkuasa terhadap rakyatnya
Outlier tak berpengaruh
Marlboro
Outlier berpengaruhkasus data time series
Dugaan : beda satuan = kasus Mars
Kasus ‘Telkom’ USA
Outlier berpengaruhkasus clustering
Outlier :1. Tidak berpengaruh2. Berpengaruh Influence
Regresi dengan/tanpa outlierThe regression equation is Sale = 5.02 + 20.5 AdvPredictor Coef SE Coef T PConstant 5.019 0.710 7.07 0.000Adv 20.505 1.025 20.00 0.000S = 0.9807 R-Sq = 97.6% R-Sq(adj) = 97.3%
Tanpa MarlboroThe regression equation is Sale = 5.03 + 20.5 AdvPredictor Coef SE Coef T PConstant 5.035 1.857 2.71 0.024Adv2 20.476 3.291 6.22 0.000S = 1.034 R-Sq = 81.1% R-Sq(adj) = 79.0%
Beberapa alat pendeteksi influence
1. Leverage (hi=vii=rii)
Alat pendeteksi pencilan pada variabel prediktor (X) (tanpa dihubungkan respon)
Leverage observasi ke-i (hi) adalah elemen diagonal ke-i. Leverage observasi ke-i hi > 3p/n disebut Unusual observation/ observasi yang jauh dari “seharusnya”.
p= banyak parameter termasuk 0
n= banyak observasi
Beberapa alat pendeteksi influence
2. Cook’s DistanceAlat pendeteksi pencilan yang mengkombinasi
leverage dan Studentized Residual untuk mengukur seberapa jauh kombinasi X,Y menyimpang dari “seharusnya”
Cook’s Distance(i) mengukur jarak antar koefisien jika observasi ke-i dimasukkan dan tidak pada model.
MSE p
bbXXbb i
TTTi
> F.5,p,0-p
Beberapa alat pendeteksi influence
3. DFFITAlat pendeteksi pencilan berdasarkan
perbedaan nilai Y-hat dengan dan tanpa pengamatan ke-i
n
p2
)Ys(
YY i
Beberapa alat pendeteksi influence
4. DFBetasAlat pendeteksi pencilan berdasarkan
perbedaan nilai koefisien regresi dengan dan tanpa pengamatan ke-i
n
2
)s(b
bb
j
ijj
Beberapa alat pendeteksi influence
5. CovRatioRasio determinan matriks koefisien regresi
dengan dan tanpa pengamatan ke-i
n
2
)cov(
cov
i
Tips mengatasi Influence
Apa penyebabnya ?Apa penyebabnya ?• Salah ukur, salah entry, kejadian luar
biasa Cari tahu sebabnyaSolusi ?Solusi ?• Modelkan tersendiri
– Dummy variable (Regr, Time Series), – Model Intervensi (Time Series)
• Anggap Missing Value (Time Series, Regr, ANOVA dsb)
Contoh
• SPSS Data world95
• MinitabExh_regr
SPSS
Data>Select Cases…
Data tertentu
Analyze>Regression>Linear…
syntax
respon
prediktor
Deteksi influence
Klik save
Minitab
File>open worksheet…>exh_regr
Stat>regression>regression