analisis regresi 1 · persamaan garis regresi linier sederhana ... (response is akar y) ... ragam...

37
Itasia & Y Angraini Dep. Statistika FMIPA-IPB Analisis Regresi 1 Pokok Bahasan : Diagnosa Model Melalui Pemeriksaan Sisaan dan Identifikasi Pengamatan Berpengaruh

Upload: vudang

Post on 06-Mar-2019

252 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Analisis Regresi 1 · persamaan garis regresi linier sederhana ... (response is akar Y) ... Ragam tidak homogen (perlu analisis kuadrat

Itasia & Y Angraini Dep. Statistika FMIPA-IPB

Analisis Regresi 1

Pokok Bahasan :

Diagnosa Model Melalui Pemeriksaan Sisaan dan Identifikasi Pengamatan

Berpengaruh

Page 2: Analisis Regresi 1 · persamaan garis regresi linier sederhana ... (response is akar Y) ... Ragam tidak homogen (perlu analisis kuadrat

Itasia & Y Angraini Dep. Statistika FMIPA-IPB

Sisaan

Sisaan adalah menyimpangnya nilai amatan yi

terhadap dugaan nilai harapannya

Sisaan untuk suatu amatan ke-i:

Sisaan baku

iiy xbb]x|[Y E ]x|[Y E 10ii

iii yye

s

e

s

yyr i

yy

iii

ii

ˆ

ˆBisa digunakan untuk memeriksa kebenaran

menyebar N(0,1)

i

Kurang tepat sebab ragam (ei) = s2 (1-hii)

n

k

k

i

ii

ii

ii

xx

xxnh

hs

er

1

2

21

, )1(

Page 3: Analisis Regresi 1 · persamaan garis regresi linier sederhana ... (response is akar Y) ... Ragam tidak homogen (perlu analisis kuadrat

Itasia & Y Angraini Dep. Statistika FMIPA-IPB

Contoh: menghitung sisaan

i 1 2 3 4 5 6 7 8 9 10 11 12 13

Y 10.98 11.13 12.51 8.4 9.27 8.73 6.36 8.5 7.82 9.14 8.24 12.19 11.88

X1 20 20 23 20 21 22 11 23 21 20 20 21 21

i 14 15 16 17 18 19 20 21 22 23 24 25

Y 9.57 10.94 9.58 10 8.11 6.83 8.88 7.7 8.47 8.86 10.4 11.08

X1 19 23 20 22 22 11 23 20 21 20 20 22

Berikut adalah 1 set (25 pengamatan) data berpasangan x1i dan yi

yang didapat dari sebuah percobaan. Dari data ini ingin diketahui model matematika hubungan antara x1 dan Y.

Page 4: Analisis Regresi 1 · persamaan garis regresi linier sederhana ... (response is akar Y) ... Ragam tidak homogen (perlu analisis kuadrat

Itasia & Y Angraini Dep. Statistika FMIPA-IPB

Contoh: menghitung sisaan

εxββY 10

X1

Y

2422201816141210

13

12

11

10

9

8

7

6

Scatterplot of Y vs X1 Dari tebaran x1 terhadap Y digunakan persamaan garis regresi linier sederhana ordo satu :

Dengan Minitab didapatkan dugaan persamaannya : = 3.56 + 0.290 X1

Untuk setiap amatan dihitung nilai dugaannya, kemudian hitung sisaannya

(lanjutan)

Y

Page 5: Analisis Regresi 1 · persamaan garis regresi linier sederhana ... (response is akar Y) ... Ragam tidak homogen (perlu analisis kuadrat

Itasia & Y Angraini Dep. Statistika FMIPA-IPB

Contoh: menghitung sisaan

i 1 2 3 4 5 6 7 8 9 10 11 12 13

y 10.98 11.13 12.51 8.40 9.27 8.73 6.36 8.50 7.82 9.14 8.24 12.19 11.88

y_duga 9.35 9.35 10.22 9.35 9.64 9.93 6.75 10.22 9.64 9.35 9.35 9.64 9.64

sisaan 1.63 1.78 2.29 -0.95 -0.37 -1.20 -0.39 -1.72 -1.82 -0.21 -1.11 2.55 2.24

i 14 15 16 17 18 19 20 21 22 23 24 25

y 9.57 10.94 9.58 10.09 8.11 6.83 8.88 7.68 8.47 8.86 10.36 11.08

y_duga 9.06 10.22 9.35 9.93 9.93 6.75 10.22 9.35 9.64 9.35 9.35 9.93

sisaan 0.51 0.72 0.23 0.16 -1.82 0.08 -1.34 -1.67 -1.17 -0.49 1.01 1.15

(lanjutan)

Y duga = 3.56 + 0.290 X1 sisaan ke i = amatan ke-i – dugaan pd titik x ke-i

Page 6: Analisis Regresi 1 · persamaan garis regresi linier sederhana ... (response is akar Y) ... Ragam tidak homogen (perlu analisis kuadrat

Itasia & Y Angraini Dep. Statistika FMIPA-IPB

Informasi-informasi yang Didapat Melalui Sisaan

Bisa melihat pola sebaran peubah acak Y

Melalui sisaan, kita dapat mengetahui apakah asumsi-asumsi yang disyaratkan pada pendugaan dengan MKT dipenuhi atau tidak

Melalui sisaan, kita juga dapat menguji parameter regresi, sehingga kita perlu mengetahui sebaran sisaan

Melalui sisaan, kita juga bisa melihat apakah model yang kita pilih pas atau tidak

Melalui sisaan, kita juga bisa melihat apakah sebuah pengamatan merupakan pencilan atau bukan

Melalui sisaan, kita juga bisa melihat apakah sebuah pengamatan merupakan pengamatan berpengaruh atau bukan

Page 7: Analisis Regresi 1 · persamaan garis regresi linier sederhana ... (response is akar Y) ... Ragam tidak homogen (perlu analisis kuadrat

Itasia & Y Angraini Dep. Statistika FMIPA-IPB

Pemeriksaan Pola Sebaran Peubah Respon Y

Acaknya Y disebabkan karena acaknya eror

Bentuk sebaran Y = bentuk sebaran eror

Memeriksa bentuk sebaran Y = memeriksa bentuk sebaran eror

MODEL REGRESI εxββY 10

E [ Y | xi ]

Acak Fix Acak

Page 8: Analisis Regresi 1 · persamaan garis regresi linier sederhana ... (response is akar Y) ... Ragam tidak homogen (perlu analisis kuadrat

Itasia & Y Angraini Dep. Statistika FMIPA-IPB

Plot Sisaan untuk:Pemeriksaan Bentuk Sebaran

Sisaan

Frek

uens

i

3210-1-2-3

4

3

2

1

0

Normal

Histogram Sisaan

Tebaran sisaan dan histogram di samping untuk melihat :BENTUK SEBARAN SISAAN, simetri atau tidak

HASIL DIAGNOSA : Sebaran sisaan agak menjulur ke kanan

Page 9: Analisis Regresi 1 · persamaan garis regresi linier sederhana ... (response is akar Y) ... Ragam tidak homogen (perlu analisis kuadrat

Itasia & Y Angraini Dep. Statistika FMIPA-IPB

Plot Sisaan untuk:Pemeriksaan Sebaran Normal

Sisaan

Pe

lua

ng

no

rm

al

543210-1-2-3-4

99

95

90

80

70

60

50

40

30

20

10

5

1

Normal - 95% CI

Probability Plot of Sisaan Plot sisaan terhadap peluang Normal untuk :

Mencocokkan apakah sebaran sisaan merupakan sebaran Normal atau tidak. Ya jika pola tebaran membentuk garis lurus

Hasil Diagnosa :bisa dianggap lurus menyebar Normal

Page 10: Analisis Regresi 1 · persamaan garis regresi linier sederhana ... (response is akar Y) ... Ragam tidak homogen (perlu analisis kuadrat

Itasia & Y Angraini Dep. Statistika FMIPA-IPB

Plot Sisaan untuk:Melihat Ketidakpasan Model

Plot sisaan terhadap y_duga masih berpola (kuadratik)

Sisaan masih mengandung komponen kuadratik

Model belum pas

model harus ditambah dg komponen kuadratik

y_duga

sis

aa

n

200150100500

40

30

20

10

0

-10

-20

-30

-40

Plot sisaan vs y_duga

Plot SISAAN vs Y duga

Page 11: Analisis Regresi 1 · persamaan garis regresi linier sederhana ... (response is akar Y) ... Ragam tidak homogen (perlu analisis kuadrat

Itasia & Y Angraini Dep. Statistika FMIPA-IPB

Plot Sisaan untuk :Pemeriksaan Asumsi MKT

y_duga

sis

aa

n

10.510.09.59.08.58.07.57.0

3

2

1

0

-1

-2

Plot Sisaan vs y_duga

terpenuhi ji ,0][ 3.

penuhi tidak ter ]E[ 2.

terpenuhi 0][ .1

22

i

ji

i

E

E

Kondisi Gauss-Markov

Pada tebaran sisaan terhadap nilai dugaan Y dapat dilihat :

- Sisaan di sekitar nilai nol / tidak

nilai harapan

- Lebar pita sisaan sama atau tidak

untuk semua nilai dugaan

kehomogenan ragam

- Tebaran berpola atau tidak

ketidakpasan model

sisaan bebas atau tidak

Plot SISAAN vs Y duga

Page 12: Analisis Regresi 1 · persamaan garis regresi linier sederhana ... (response is akar Y) ... Ragam tidak homogen (perlu analisis kuadrat

Itasia & Y Angraini Dep. Statistika FMIPA-IPB

Pola tebaran sisaan yang tidak memenuhi asumsi MKT:

Ragam tidak homogen (perlu analisis kua-

drat terkecil terboboti; atau transformasi

thdp Y)

Penyimpangan terhadap persamaan

regresi bersifat sistematis; atau karena

tdk disertakannya kedalam model

Model tidak pas (perlu suku-suku lain

dalam model atau transformasi thdp Y)

Pola tebaran sisaan memenuhi asumsi MKT: berpusat di NOL, lebar pita sama, tidak berpola

Pola Tebaran Sisaan terhadap

0

iY

Page 13: Analisis Regresi 1 · persamaan garis regresi linier sederhana ... (response is akar Y) ... Ragam tidak homogen (perlu analisis kuadrat

Itasia & Y Angraini Dep. Statistika FMIPA-IPB

Transformasi untuk :Menghomogenkan Ragam

Transformasi terhadap peubah respon Y

YY*1b

Yln Y*2b

Y

1Y* 3 b

Y

1 Y* 4b jika

: Anggap 2

ba Setelah respon Y ditransformasi,

lakukan analisis regresi seperti biasa,

sisaan harus diperiksa lagi, jika masih

belum memenuhi asumsi, model

diubah, kemungkinan ada suku

nonlinier yg belum masuk model,

atau lakukan pendugaan dg MKT

terboboti.

Page 14: Analisis Regresi 1 · persamaan garis regresi linier sederhana ... (response is akar Y) ... Ragam tidak homogen (perlu analisis kuadrat

Itasia & Y Angraini Dep. Statistika FMIPA-IPB

Contoh Transformasi untuk Menghomogenkan Ragam

Fitted Value

Re

sid

ua

l

252015105

10

5

0

-5

-10

Residuals Versus the Fitted Values(response is Y)

Fitted Value

Re

sid

ua

l

5,04,54,03,53,02,5

1,0

0,5

0,0

-0,5

-1,0

-1,5

Residuals Versus the Fitted Values(response is akar Y)

Plot Sisaan vs Y duga “data asli” Plot Sisaan vs “data transformasi Y*= “YY

Page 15: Analisis Regresi 1 · persamaan garis regresi linier sederhana ... (response is akar Y) ... Ragam tidak homogen (perlu analisis kuadrat

Itasia & Y Angraini Dep. Statistika FMIPA-IPB

Plot Sisaan untuk:Pemeriksaan Kebebasan Sisaan

Plot sisaan terhadap urutan untuk :

Memeriksa apakah sisaan bebas satu dengan lainnya atau tidak. Bebas jika tdk membentuk pola.

Hasil Diagnosa :Tebaran tidak membentuk pola Sisaan saling bebasurutan

RES

I1

121086420

2

1

0

-1

-2

Scatterplot of RESI1 vs urutan

Page 16: Analisis Regresi 1 · persamaan garis regresi linier sederhana ... (response is akar Y) ... Ragam tidak homogen (perlu analisis kuadrat

Itasia & Y Angraini Dep. Statistika FMIPA-IPB

Pola tebaran sisaan yang menginformasikan bahwa pengaruh waktu belum diperhitungkan

Ragam tidak homogen (perlu analisis kuadrat

terkecil terboboti)

Suatu suku linier dalam waktu harus

ditambahkan ke dalam model

Suku linier dan kuadratik dalam waktu perlu

ditambahkan ke dalam model

Pengaruh waktu jangka panjang tidak mempengaruhi data.

Pola Tebaran Sisaan terhadap Urutan Waktu

Page 17: Analisis Regresi 1 · persamaan garis regresi linier sederhana ... (response is akar Y) ... Ragam tidak homogen (perlu analisis kuadrat

Itasia & Y Angraini Dep. Statistika FMIPA-IPB

Plot Sisaan untuk:Pemeriksaan Pengaruh Waktu

Plot sisaan terhadap urutan waktu yg jaraknya sama.

Perhatikan :

lebar pita sama/tidak

berpola/tidak

Hasil Diagnosa :• Lebar pita sama homogen

• Tebaran tidak membentuk pola tidak perlu ditambahkan penga-

ruh waktu ke dalam modelurutan

RES

I1

121086420

2

1

0

-1

-2

Scatterplot of RESI1 vs urutan

Page 18: Analisis Regresi 1 · persamaan garis regresi linier sederhana ... (response is akar Y) ... Ragam tidak homogen (perlu analisis kuadrat

Itasia & Y Angraini Dep. Statistika FMIPA-IPB

Sisaan Terstandardkan(Sisaan Terbakukan)

s

e

s

yyr i

yy

iii

ii

ˆ

ˆ Bisa digunakan untuk memeriksa kebenaran

menyebar N(0,1)

i

ragam(ei)= s2, kurang tepat ragam(ei) = s2 (1- hii)

2

21

, )1( xx

xxnh

hs

er

k

i

ii

ii

ii

SISAAN TERBAKUKAN :

ei = sisaan amatan ke-i

n = banyaknya pengamatan

s2 = dugaan bagi ragam Yi KTsisaan

hii = unsur diagonal ke-i matriks H = X(X’X)-1X’

Pd sebaran Normal Baku peluang nilai ri

terletak antara -1,96 s.d 1,96 adalah 95%. | ri|>2 patut dicurigai

Sisaan akan memiliki

ragam yg relatif besar

jika xi di sekitar x

Page 19: Analisis Regresi 1 · persamaan garis regresi linier sederhana ... (response is akar Y) ... Ragam tidak homogen (perlu analisis kuadrat

Itasia & Y Angraini Dep. Statistika FMIPA-IPB

Sisaan Terstandarkan (Sisaan Baku)(lanjutan)

Fitted Value

Re

sid

ua

l

2,82,62,42,22,01,81,61,41,21,0

1,0

0,5

0,0

-0,5

-1,0

Residuals Versus the Fitted Values(response is ln(y))

FITS1

SR

ES

1

2,82,62,42,22,01,81,61,41,21,0

2

1

0

-1

-2

-3

-4

Scatterplot of SRES1 vs FITS1

Plot Sisaan ei vs Dugaan Y Plot Sisaan Baku ri vs Dugaan Y

Pola tebaran plot sisaan ei dan ri tidak berbeda. pemeriksaan sisaan thdp pola tebaran, keduanya dapat digunakan

Page 20: Analisis Regresi 1 · persamaan garis regresi linier sederhana ... (response is akar Y) ... Ragam tidak homogen (perlu analisis kuadrat

Itasia & Y Angraini Dep. Statistika FMIPA-IPB

Nilai PRESSPRESS = Prediction Sum of Squares, adalah prosedur

yang merupakan kombinasi dari: semua kemung-kinan regresi, analisis sisaan, dan teknik validasi.

Digunakan untuk mengukur validitas model.

2i,-i

2

,

e

ˆPRESS

iii yy

2

2 PRESS1R

yyi

PRED

yi : nilai respon pada x=xi (data lengkap)

: nilai ramalan y pd x=xi yg diramal

melalui dugaan persamaan regresi

dari data tanpa amatan ke-i

Model valid jika memiliki PRESS yg kecil

iiy ,ˆ

2

1 1

n

i ii

i

h

e=

R2pred adalah statistik la-

innya yg berhub dg PRESS. Model valid jika R2

pred besar.

Page 21: Analisis Regresi 1 · persamaan garis regresi linier sederhana ... (response is akar Y) ... Ragam tidak homogen (perlu analisis kuadrat

Itasia & Y Angraini Dep. Statistika FMIPA-IPB

Nilai PRESS(lanjutan)PROSEDUR PRESS

Mis. k adalah banyaknya peubah dalam suatu persamaan regresi,

n adalah banyaknya amatan

kyy 11ˆ

nknkk yyyyyy ˆ ..., ,ˆ ,ˆ3322

2

1

ˆ

n

i

iki yyPRESS

Langkah-langkahnya:

1. Sisihkan amatan ke-1, amatan ke-1 tidak digunakan, data tinggal n-1.

2. Dugalah semua ”kemungkinan model regresi” thdp n-1 data tersebut. (jika

k=1 banyaknya ”kemungkinan model” hanya 1)

3. Ramal y1 dengan model yang didapat pd no.2. (lakukan untuk semua

kemungkinan model hanya 1 jika k=1)

4. Hitung perbedaan y1 yg disisihkan tadi dengan hasil no.3.

5. Ulangi langkah 1-4 dengan menyisihkan amatan ke-2, ke-3,...., ke-n.

Didapat

6. Untuk setiap model regresi yang mungkin hitung :

7. Pilih model yang relatif memiliki nilai PRESS terkecil, dan melibatkan

peubah penjelas sedikit.

Page 22: Analisis Regresi 1 · persamaan garis regresi linier sederhana ... (response is akar Y) ... Ragam tidak homogen (perlu analisis kuadrat

Itasia & Y Angraini Dep. Statistika FMIPA-IPB

Nilai PRESS (lanjutan)

Y XDugaan Garis Regresi dg Data

tanpa amatan ke-i

ramalan Yi

tnp amatan

ke-iei,-i

e i,-ikuadrat

7,46 10 Y tnp 1 = 3,01 + 0,505 X tnp 1 8,06 -0,6 0,36

6,77 8 Y tnp 2 = 3,05 + 0,497 X tnp 2 7,026 -0,256 0,06553

12,74 13 Y tnp 3 = 4,01 + 0,345 X tnp 3 8,495 4,245 18,02003

7,11 9 Y tnp 4 = 3,04 + 0,500 X tnp 4 7,54 -0,43 0,18490

7,81 11 Y tnp 5 = 2,95 + 0,514 X tnp 5 8,604 -0,794 0,63043

8,84 14 Y tnp 6 = 2,46 + 0,577 X tnp 6 10,538 -1,698 2,88320

6,08 6 Y tnp 7 = 2,97 + 0,502 X tnp 7 5,982 0,098 0,00960

5,39 4 Y tnp 8 = 2,72 + 0,526 X tnp 8 4,824 0,566 0,32035

8,15 12 Y tnp 9 = 2,84 + 0,528 X tnp 9 9,176 -1,026 1,05267

6,42 7 Y tnp 10 = 3,03 + 0,498 X tnp10 6,516 -0,096 0,00921

5,73 5 Y tnp 11 = 2,88 + 0,511 X tnp11 5,435 0,295 0,08703

Total = PRESS = 23,6229

Contoh Proses PRESS, untuk n=11 dan k=1

Page 23: Analisis Regresi 1 · persamaan garis regresi linier sederhana ... (response is akar Y) ... Ragam tidak homogen (perlu analisis kuadrat

Itasia & Y Angraini Dep. Statistika FMIPA-IPB

Output Minitab untuk data contoh tsb

Nilai PRESS(lanjutan)

The regression equation isY = 3,00 + 0,500 X

Predictor Coef SE Coef T PConstant 3,002 1,124 2,67 0,026X 0,4997 0,1179 4,24 0,002

S = 1,23631 R-Sq = 66,6% R-Sq(adj) = 62,9%

PRESS = 23,6210 R-Sq(pred) = 42,70%

Analysis of VarianceSource DF SS MS F PRegression 1 27,470 27,470 17,97 0,002Residual Error 9 13,756 1,528Total 10 41,226

• Hasil PRESS melalui proses

= hasil Minitab

• Untuk k=1 hanya ada 1 model

• Amatan ke-3 memberikan

simpangan ramalan terbesar

• Amatan ke-3 dapat dipandang

sebagai amatan berpengaruh

• Dugaan parameter regresi

tanpa amatan ke-3 sangat

berbeda dg lainnya dugaan

yg ini relatif yg benar/baik

Keluarkan amatan ke-3 dari analisis. Cek nilai PRESS-nya. Cek nilai R2nya

Page 24: Analisis Regresi 1 · persamaan garis regresi linier sederhana ... (response is akar Y) ... Ragam tidak homogen (perlu analisis kuadrat

Itasia & Y Angraini Dep. Statistika FMIPA-IPB

The regression equation is

Y tnp 3 = 4,01 + 0,345 X tnp 3

Predictor Coef SE Coef T P

Constant 4,00619 0,00221 1811,78 0,000

X tnp 3 0,345334 0,000237 1454,74 0,000

S = 0,00308655 R-Sq = 100,0

PRESS = 0,000174853 R-Sq(pred) = 100,00%

Analysis of Variance

Source DF SS MS F P

Regression 1 20,161 20,161 2116264,34 0,000

Residual Error 15 0,000 0,000

Total 16 20,161

Output Minitab data lengkap Output Minitab data tanpa amatan ke-3

The regression equation is

Y = 3,00 + 0,500 X

Predictor Coef SE Coef T P

Constant 3,002 1,124 2,67 0,026

X 0,4997 0,1179 4,24 0,002

S = 1,23631 R-Sq = 66,6%

PRESS = 23,6210 R-Sq(pred) = 42,70%

Analysis of Variance

Source DF SS MS F P

Regression 1 27,470 27,470 17,97 0,002

Residual Error 9 13,756 1,528

Total 10 41,226

Nilai PRESS (lanjutan)

Menyisihkan amatan ke-3 mempengaruhi dugaan parameter, menurunkan nilai PRESS

Dari sisi model, “persamaan tanpa amatan ke-3” yg terbaik.

R-Sq(pred)=100,00% model sangat valid PELUANG salah memprediksi = 0

Page 25: Analisis Regresi 1 · persamaan garis regresi linier sederhana ... (response is akar Y) ... Ragam tidak homogen (perlu analisis kuadrat

Itasia & Y Angraini Dep. Statistika FMIPA-IPB

X

Y

15,012,510,07,55,0

13

12

11

10

9

8

7

6

5

4

Fitted Line PlotY = 3,002 + 0,4997 X

X tnp 3

Y t

np

3

15,012,510,07,55,0

9

8

7

6

5

Fitted Line PlotY tnp 3 = 4,006 + 0,3453 X tnp 3

Nilai PRESS (lanjutan)

Dugaan garis regresi dg data lengkap

PRESS = 23,6210 R-Sq(pred) = 42,70%

Dugaan garis regresi tanpa amatan ke-3

PRESS = 0,000174853 R-Sq(pred) = 100,0%

Semakin kecil nilai PRESS-nya model semakin valid semakin baik untuk

memprediksi. Setiap 1 model regresi thdp 1 set data memiliki 1 nilai PRESS

Page 26: Analisis Regresi 1 · persamaan garis regresi linier sederhana ... (response is akar Y) ... Ragam tidak homogen (perlu analisis kuadrat

Itasia & Y Angraini Dep. Statistika FMIPA-IPB

Pencilan

Bisa jadi terletak pada tiga atau empat simpanganbaku atau lebih jauh lagi dari rata-rata sisaannya.

Keberadaan pencilan harus diperiksa denganseksama, apakah pencilan itu merupakan kesalahandalam pencatatan amatan atau pencilan tersebutmuncul dari kombinasi keadaan yang tidak biasayang mungkin saja sangat penting dan perludiselidiki lebih jauh.

“Pencilan adalah pengamatan yang nilai mutlak sisaan-nya jauh lebih besar daripada sisaan-sisaan lainnya”

Page 27: Analisis Regresi 1 · persamaan garis regresi linier sederhana ... (response is akar Y) ... Ragam tidak homogen (perlu analisis kuadrat

Itasia & Y Angraini Dep. Statistika FMIPA-IPB

Pencilan

dugaan-Y2

Sis

aa

n b

aku

-2

1098765

3

2

1

0

-1

Scatterplot of Sisaan baku-2 vs dugaan-Y2

dugaan-Y2

sis

aa

n2

1098765

3

2

1

0

-1

Scatterplot of sisaan2 vs dugaan-Y2

Plot antara Sisaan ei vs dugaan Yi Plot antara Sisaan ri vs dugaan Yi

• Dugaan persamaan regresi Y = 3.00 + 0.500 X dgn R-Sq = 66.6%• Pola tebaran sisaan thdp ei dan ri sama• Ada sisaan yang nilainya sangat besar potensi sebagai pencilan

(lanjutan)

Page 28: Analisis Regresi 1 · persamaan garis regresi linier sederhana ... (response is akar Y) ... Ragam tidak homogen (perlu analisis kuadrat

Itasia & Y Angraini Dep. Statistika FMIPA-IPB

Pencilan

MENDETEKSI PENCILAN

• Hitung nilai

dengan

ii

ii

hs

er

1

n

i

k

i

xx

xx

niih

1

2

21

Yi Xi ri

7.46 10 -0.46018

6.77 8 -0.19633

12.74 13 2.99999

7.11 9 -0.33085

7.81 11 -0.59695

8.84 14 -1.13497

6.08 6 0.07042

5.39 4 0.3807

8.15 12 -0.75518

6.42 7 -0.06974

5.73 5 0.21188

(lanjutan)

• Jika nilai |ri|>2, amatan tsbdapat dikatakan sebagaipencilan

Page 29: Analisis Regresi 1 · persamaan garis regresi linier sederhana ... (response is akar Y) ... Ragam tidak homogen (perlu analisis kuadrat

Itasia & Y Angraini Dep. Statistika FMIPA-IPB

Pencilan (lanjutan)

X-3

Y-3

15,012,510,07,55,0

13

12

11

10

9

8

7

6

5

Scatterplot of Y-3 vs X-3

X tnp pclan

Y t

np

pcla

n

15,012,510,07,55,0

13

12

11

10

9

8

7

6

5

Scatterplot of Y tnp pclan vs X tnp pclan

Y = 4.01 + 0.345 X

Predictor Coef SE Coef PConstant 4.00565 0.00292 0.000X 0.345390 0.000321 0.000

S = 0.00308168 R-Sq = 100.0%

Y = 3.00 + 0.500 X

Predictor Coef SE Coef T PConstant 3.002 1.124 2.67 0.026X 0.4997 0.1179 4.24 0.002

S = 1.23631 R-Sq = 66.6%

DATA LENGKAP DATA TANPA PENCILAN

Page 30: Analisis Regresi 1 · persamaan garis regresi linier sederhana ... (response is akar Y) ... Ragam tidak homogen (perlu analisis kuadrat

Itasia & Y Angraini Dep. Statistika FMIPA-IPB

Pencilan

dugaan tnppcl

s b

aku

tn

p p

cl

98765

2.0

1.5

1.0

0.5

0.0

-0.5

-1.0

-1.5

Scatterplot of s baku tnp pcl vs dugaan tnppcl

Plot sisaan baku (ri) vs dugaan Y

Tebaran tidak berpola, menyebar di se-kitar nilai nol, lebar pita relatif sama

Mengeluarkan data pencilan dari analisis:• mampu memperbaiki pola tebaran sisaan yang tadinya berpola (garis lurus)• harus dilakukan dengan kehati-hatian yang tinggi.

(lanjutan)

Data Lengkap Data Tanpa Pencilan

Tebaran berpola, karena (1) ada pencilan, atau (2) model tidak pas

dugaan-Y2

sis

aa

n2

1098765

3

2

1

0

-1

Scatterplot of sisaan2 vs dugaan-Y2

Page 31: Analisis Regresi 1 · persamaan garis regresi linier sederhana ... (response is akar Y) ... Ragam tidak homogen (perlu analisis kuadrat

Itasia & Y Angraini Dep. Statistika FMIPA-IPB

Amatan Berpengaruh

AMATAN BERPENGARUH :

berkaitan dengan besarnya perubahan yang terjadi pada

dugaan parameter regresi jika pengamatan tersebut disisihkan

X1 1 1 1 1,2 1,2 1,2 1,3 1,3 1,3 1,4 1,4 1,4 1,5 1,5 1,5 1,6 1,6 1,6 4,0

Y1 2,11 1,39 0,78 2,02 2,46 3,67 2,56 1,74 1,88 5,15 2,41 2,00 3,56 3,09 0,78 4,29 3,33 3,10 15,00

X1

Y1

4,03,53,02,52,01,51,0

16

14

12

10

8

6

4

2

0

Scatterplot of Y1 vs X1

Unusual Observations

Obs X1 Y1 Fit SE Fit Residual St Resid10 1,40 5,147 2,895 0,244 2,252 2,19 R15 1,50 0,776 3,345 0,243 -2,569 -2,50 R19 4,00 15,000 14,576 1,009 0,424 1,34 X

R denotes an observation with a large standardized residual.X denotes an observation whose X value gives it large influence.

Page 32: Analisis Regresi 1 · persamaan garis regresi linier sederhana ... (response is akar Y) ... Ragam tidak homogen (perlu analisis kuadrat

Itasia & Y Angraini Dep. Statistika FMIPA-IPB

Amatan Berpengaruh

The regression equation is

Y1 = - 3,39 + 4,49 X1

S = 1,05749 R-Sq = 88,8% R-Sq(adj) = 88,1%

Analysis of VarianceSource DF SS MS F PRegression 1 150,10 150,10 134,22 0,000Residual Error 17 19,01 1,12Total 18 169,11

Unusual ObservationsObs X1 Y1 Fit SE Fit Residual St Resid10 1,40 5,147 2,895 0,244 2,252 2,19 R15 1,50 0,776 3,345 0,243 -2,569 -2,50 R19 4,00 15,000 14,576 1,009 0,424 1,34 X

R denotes an observation with a large standardized residual.X denotes an observation whose X value gives it large influence.

(lanjutan)

OUTPUT MINITAB

Hasil analisis regresi dari

data tersebut menunjukkan

bahwa ada 3 amatan yg

aneh, yaitu amatan ke

10,15, dan 19. Amatan 10

dan 15 berpotensi sebagai

pencilan. Amatan 19

berpotensi sebagai amatan

berpengaruh

Bandingkan dg data tanpa

amatan 19. Apakah

perubahan dugaan para-

meter regresi cukup nyata?

Page 33: Analisis Regresi 1 · persamaan garis regresi linier sederhana ... (response is akar Y) ... Ragam tidak homogen (perlu analisis kuadrat

Itasia & Y Angraini Dep. Statistika FMIPA-IPB

The regression equation is

Y1 = - 1,26 + 2,88 X1

S = 1,03065 R-Sq = 25,4% R-Sq(adj) = 20,8%

Analysis of Variance

Source DF SS MS F PRegression 1 5,797 5,797 5,46 0,033Residual Error 16 16,996 1,062Total 17 22,793

Unusual ObservationsObs X1 Y1 Fit SE Fit Resid St Resid10 1,40 5,147 2,764 0,256 2,383 2,39 R15 1,50 0,776 3,052 0,318 -2,276 -2,32 R

The regression equation is

Y1 = - 3,39 + 4,49 X1

S = 1,05749 R-Sq = 88,8% R-Sq(adj) = 88,1%

Analysis of Variance

Source DF SS MS F P

Regression 1 150,10 150,10 134,22 0,000

Residual Error 17 19,01 1,12

Total 18 169,11

Unusual Observations

Obs X1 Y1 Fit SE Fit Resid St Resid

10 1,40 5,147 2,895 0,244 2,252 2,19 R

15 1,50 0,776 3,345 0,243 -2,569 -2,50 R

19 4,00 15,000 14,576 1,009 0,424 1,34 X

Analisis Regresi thdp Data Lengkap An Regresi thdp Data Tanpa Amatan 19

Penyisihan “pengamatan berpengaruh” mengubah

secara berarti dugaan persamaan regresi

Amatan Berpengaruh(lanjutan)

Page 34: Analisis Regresi 1 · persamaan garis regresi linier sederhana ... (response is akar Y) ... Ragam tidak homogen (perlu analisis kuadrat

Itasia & Y Angraini Dep. Statistika FMIPA-IPB

X1

Y1

4,03,53,02,52,01,51,0

16

14

12

10

8

6

4

2

0

Fitted Line PlotY1 = - 3,394 + 4,493 X1

Amatan Berpengaruh(lanjutan)

Dugaan Garis Regresi Data Lengkap Dugaan Grs Regresi Data Tnp Amatan 19

X1 tnp amatan 19

Y1

tn

p a

ma

tan

19

4,03,53,02,52,01,51,0

16

14

12

10

8

6

4

2

Fitted Line PlotY1 tnp amatan 19 = - 1,265 + 2,878 X1 tnp amatan 19

Penyisihan AMATAN BERPENGARUH menyebabkan perubahan dugaan kemiringan garis. BERBAHAYA, apabila pemanfaatan hasil analisis regresi bertumpu pada

pemaknaan parameter

Page 35: Analisis Regresi 1 · persamaan garis regresi linier sederhana ... (response is akar Y) ... Ragam tidak homogen (perlu analisis kuadrat

Itasia & Y Angraini Dep. Statistika FMIPA-IPB

Pengaruh titik data ke-i diukur dengan jarak :

Keterangan:

s2 = dugaan bagi ragam Yi = KTsisaan

hii = unsur diagonal ke-i matriks H = X(X’X)-1X’

Nilai Di dibandingkan dengan F (p,n-p; 1-α). Dengan n = banyaknya

pengamatan dan p = banyaknya parameter

Di > F (p,n-p;1-α). menandakan bahwa amatan ke-i berpengaruh.

ph

h

hs

eD

ii

ii

ii

ii

1

11

22

21

Amatan Berpengaruh(lanjutan)

Statistik Uji untuk Mendeteksi Amatan Berpengaruh

Page 36: Analisis Regresi 1 · persamaan garis regresi linier sederhana ... (response is akar Y) ... Ragam tidak homogen (perlu analisis kuadrat

Itasia & Y Angraini Dep. Statistika FMIPA-IPB

Amatan Berpengaruh(lanjutan)

X (i) Y (i) e (i) r (i) D (i)

1 2,11 1,01 1,00 0,30

1 1,39 0,30 0,29 0,09

1 0,78 -0,32 -0,32 -0,09

1,2 2,02 0,02 0,02 0,01

1,2 2,46 0,46 0,45 0,11

1,2 3,67 1,68 1,64 0,45

1,3 2,56 0,11 0,11 0,03

1,3 1,74 -0,71 -0,69 -0,17

1,3 1,88 -0,56 -0,55 -0,13

1,4 5,15 2,25 2,19 0,59

1,4 2,41 -0,49 -0,47 -0,11

1,4 2,00 -0,90 -0,87 -0,21

1,5 3,56 0,21 0,21 0,05

1,5 3,09 -0,26 -0,25 -0,06

1,5 0,78 -2,57 -2,50 -0,72

1,6 4,29 0,50 0,49 0,11

1,6 3,33 -0,47 -0,45 -0,11

1,6 3,10 -0,70 -0,68 -0,16

4 15,00 0,42 1,34 4,40

Dugaan persamaan regresi DATA LENGKAP

: Y1 = - 3,39 + 4,49 X1

Banyaknya parameter = 2 p = 2

Banyaknya pengamatan = 19 n = 19

Pengamatan ke -19 memiliki nilai D19 = 4,40

Dengan α = 5%

Nilai tabel F(p,n-p; 1-α) = F (2,17; 0,95) = 3,59

D19 > F (2,17; 0,95)

Dengan α = 5%, amatan ke 19 (terakhir)

merupakan amatan berpengaruh.

CONTOH PENGGUNAAN Di

Page 37: Analisis Regresi 1 · persamaan garis regresi linier sederhana ... (response is akar Y) ... Ragam tidak homogen (perlu analisis kuadrat

Itasia & Y Angraini Dep. Statistika FMIPA-IPB

Amatan Berpengaruh(lanjutan)