hdi indonesia tahun 2002

8
Tugas Analisis Regresi Outlier dan Permasalahannya  Cucu Sumarni (1307201740) Is Anjar W (1307201721) Human Development Index(HDI) Indonesia Tahun 2002 PROVINSI RATA- RATA LAMA WAKTU SEKOLAH* (X) HDI (Y) 1 NAD 7.8 66 2 SUMUT 8.4 68.8 SUM!AR 8 67." 4 RIAU 8. 6#.1 " $AM!I 7.4 67.1 6 SUMSEL 7.1 66 7 !EN%KULU 7.6 66.2 8 LAMPUN% 6.# 6".8 # !A!EL 6.6 6".4 1& DKI 1&.4 7".6 11 $A!AR 7.2 6".8 12 $ATEN% 6." 66. 1 DIY 8.1 7&.8 14 $ATIM 6." 64.1 1" !ANTEN 7.# 66.6 16 !ALI 7.6 67." 17 NT! ".8 "7.8 18 NTT 6 6&. 1# KAL!AR 6. 62.# 2& KALTEN% 7.6 6#.1 21 KALSEL 7 64. 22 KALTIM 8." 7& 2 SULUT 8.6 71. 24 SULTEN% 7. 64.4 2" SULSEL 6.8 6". 26 SULTRA 7. 64.1 27 %ORONTALO 6." 64.1 28 MALUKU 8 66." 2# MALUKU UTARA 8.4 6".8 & PAPUA 6 6&.1 Sumber: !S "et: # $sia %& tahun 'e atas # "husus AD *alu'u *alu'u $tara dan !apua data rata+rata lama ,a'tu se'olah 'eadaan tahun 200- %

Upload: rindang08

Post on 17-Oct-2015

6 views

Category:

Documents


0 download

DESCRIPTION

HDI Indonesia

TRANSCRIPT

HDI Indonesia Tahun 2002

Tugas Analisis Regresi

Outlier dan Permasalahannya Cucu Sumarni (1307201740)Is Anjar W (1307201721)Human Development Index(HDI) Indonesia Tahun 2002

PROVINSIRATA-RATA LAMA WAKTU SEKOLAH*

(X)HDI(Y)

1NAD7.866

2SUMUT8.468.8

3SUMBAR867.5

4RIAU8.369.1

5JAMBI7.467.1

6SUMSEL7.166

7BENGKULU7.666.2

8LAMPUNG6.965.8

9BABEL6.665.4

10DKI10.475.6

11JABAR7.265.8

12JATENG6.566.3

13DIY8.170.8

14JATIM6.564.1

15BANTEN7.966.6

16BALI7.667.5

17NTB5.857.8

18NTT660.3

19KALBAR6.362.9

20KALTENG7.669.1

21KALSEL764.3

22KALTIM8.570

23SULUT8.671.3

24SULTENG7.364.4

25SULSEL6.865.3

26SULTRA7.364.1

27GORONTALO6.564.1

28MALUKU866.5

29MALUKU UTARA8.465.8

30PAPUA660.1

Sumber: BPSKet: * Usia 15 tahun ke atas* Khusus NAD, Maluku, Maluku Utara dan Papua data rata-rata lama waktu sekolah keadaan tahun 2003

The regression equation is

Dari model ini, kita lihat terdapat hubungan yang positif antara Rata-rata lama sekolah (lamanya seseorang mengenyam pendidikan) dengan Human Development Index/HDI artinya semakin lama penduduk mengenyam pendidikan maka HDI suatu daerah/provinsi akan semakin meningkat sebanyak 3.1821 persen. Jika suatu daerah dimana rata-rata lama pendidikan penduduknya nol maka HDI terendahnya sebesar 42.564.

Predictor Coef SE Coef T P

Constant 42.564 2.259 18.84 0.000

X 3.1821 0.3021 10.53 0.000

S = 1.59520 R-Sq = 79.8% R-Sq(adj) = 79.1%Dengan uji parameter, kita dapatkan bahwa b0 = 42.564 dan b1(Rata-rata lama sekolah) = 3.1821 mempunyai pengaruh yang signifikan, dan model ini menjelaskan sekitar 79.1 persen dari keadaan data yang sebenarnya.

Analysis of Variance

Source DF SS MS F P

Regression 1 282.24 282.24 110.92 0.000

Residual Error 28 71.25 2.54

Lack of Fit 20 58.74 2.94 1.88 0.182

Pure Error 8 12.51 1.56

Total 29 353.49

Dari ANOVA dapat kita lihat Mean Square Error/MSE yang dihasilkan adalah sebesar 2.54 sehingga F hitung didapatkan 110.92. P-value Lack of Fit = 0.182 > 0.05 menunjukkan bahwa model regresi yang diperoleh sudah sesuai (terima H0 : tidak ada lack of fit/model sesuai)

Unusual Observations

Obs X Y Fit SE Fit Residual St Resid

10 10.4 75.600 75.657 0.948 -0.057 -0.04 X

17 5.8 57.800 61.020 0.568 -3.220 -2.16R

29 8.4 65.800 69.293 0.417 -3.493 -2.27R

Outlier:Dari hasil plot data, didapatkan data yang outlier, antara lain: DKI Jakarta (data ke 10) NTB (data ke-17)

Maluku Utara (data ke 29)Penyebab Outlier

DKI Jakarta merupakan kota metropolitan dimana sarana pendidikan dan kesehatan sangat memadai dibanding daerah lainnya dan pendapatan per kapita juga paling tinggi diantara provinsi lainnya.

NTB merupakan outlier, hal ini terjadi karena hampir setiap kabupaten di NTB tergolong HDI terendah (lowest HDI), misalnya Lombok Timur(56.1), Lombok Barat(55.0), Lombok Tengah(53.9), Sumba Barat (53.4). Hal ini didukung rendahnya tingkat pendidikan dan kesehatan di daerah tersebut. Sedangkan Maluku Utara termasuk outlier karena HDI rendah tetapi tingkat pendidikan tinggi. Hal ini disebabkan ada faktor lain yang berpengaruh terhadap penurunan HDI di provinsi tersebut yang kontribusinya lebih tinggi dibanding pendidikan, misalnya tingkat kematian di daerah tersebut yang relatif tinggi dibanding daerah lain dan sarana kesehatan yang minim.Pengaruh Outlier terhadap ModelJika data outlier dikeluarkan, dalam hal ini yang dikeluarkan dari pengamatan adalah NTB dan Maluku Utara. Sedangkan DKI Jakarta tidak dikeluarkan karena meskipun termasuk outlier tetapi masih mempunyai pola/kecenderungan yang sama dengan daerah lainnya. Hal ini terlihat dari plotnya yang tepat berada pada garis regresi.Setelah out lier dikeluarkan, modelnya berubah menjadi:

Scatter plot juga menunjukkan adanya perubahan kemiringan garis regresi, artinya b0 dan b1 mengalami perubahan.

Predictor Coef SE Coef T P

Constant 43.385 2.043 21.24 0.000

X 3.1039 0.2726 11.39 0.000

S = 1.34345 R-Sq = 83.3% R-Sq(adj) = 82.7%

Dengan adanya perubahan b0 menjadi 43.385 dan b1 sebesar 3.1039, maka R-Sq(adj) meningkat menjadi 82.7 persen.Analysis of Variance

Source DF SS MS F P

Regression 1 233.96 233.96 129.63 0.000

Residual Error 26 46.93 1.80

Lack of Fit 19 38.91 2.05 1.79 0.220

Pure Error 7 8.01 1.14

Total 27 280.88

Setelah outlier dikeluarkan, ANOVA menunjukkan bahwa MSE yang dihasilkan juga menjadi lebih kecil yaitu sebesar 1.80 sedangkan nilai F hitung menjadi lebih besar yaitu 129.63 dan p-value lack of fit juga lebih besar yaitu 0.220 artinya peluang H0 (tidak ada lack of fit) diterima menjadi lebih besar.KesimpulanJika kita bandingkan dengan model pertama (dengan outlier), walaupun sama-sama signifikan dan modelnya sesuai, model kedua (outlier dikeluarkan) menghasilkan Mean Square Error/MSE yang lebih kecil dan F hitung yang lebih besar. Dengan demikian model kedua lebih bagus. Model kedua dapat menjelaskan variasi data sebesar 82.7 persen relatif lebih tinggi dibanding model pertama(79.1 persen).UraianNilaiR2(adj)

%MSEFLack of Fit

01

Model dengan outlier (Model I)42.564 3.1821 79.12.54110.92 p-value = 0.182 (tidak ada lack of fit)

Model tanpa outlier (Model II)43.385 3.1039 82.71.80129.63 p-value = 0.220 (tidak ada lack of fit)

Uji Asumsi Residual

NormalityIndependcyHomokedasticity

p-value>0.15 (Normal)Tdk ada autokorelasiPola residual random

p-value>0.15 (Normal)Tdk ada autokorelasiPola residual random

Dengan demikian out lier dapat menyebabkan tingkat akurasi model berubah, sehingga jika ditujukan untuk peramalan maka kita harus berhati-hati dengan data outlier. Lampiran

Uji Asumsi Residual Model I1. Tidak ada Autokorelasi

2. Normality

P-value > 0.15 terima H0 : i berdistribusi Normal

3. Homoskedastisitas

Pola residual acak/random dan berada di sekitar nol mengindikasikan variasi residual identik(homoskedastisitas)

Uji Asumsi Residual Model II

1. Tidak ada Autokorelasi

2. Normality

P-value > 0.15 terima H0 : i berdistribusi Normal

3. Homoskedastisitas

Pola residual acak/random dan berada di sekitar nol mengindikasikan variasi residual identik(homoskedastisitas)

Y = 43.4 + 3.10 X

Y = 42.6 + 3.18 X

EMBED MtbGraph.Document

EMBED MtbGraph.Document

EMBED MtbGraph.Document

PAGE 1

_1252947163

_1252948128

_1252948298

_1252948358

_1252948252

_1252947267

_1252947781

_1252945159

_1252947111

_1252917755