tugas denis n walidah

15
TUGAS ANALISIS REGRESI LANJUTAN “Regresi Ridge dan Regresi Komponen Utama“ Dosen Pengampu : Achmad Efendi, S.Si M.Si Phd Disusun oleh : Denisia Gani Amawati (125090506111002) Walidah Purnaningsih ( 125090500111038) STATISTIKA B 2012 PROGRAM STUDI STATISTIKA JURUSAN MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS BRAWIJAYA 1

Upload: walidahp

Post on 12-Jan-2016

239 views

Category:

Documents


5 download

DESCRIPTION

kedua

TRANSCRIPT

TUGAS ANALISIS REGRESI LANJUTAN“Regresi Ridge dan Regresi Komponen Utama“

Dosen Pengampu : Achmad Efendi, S.Si M.Si Phd

Disusun oleh :Denisia Gani Amawati (125090506111002)Walidah Purnaningsih ( 125090500111038)

STATISTIKA B 2012

PROGRAM STUDI STATISTIKAJURUSAN MATEMATIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAMUNIVERSITAS BRAWIJAYA

MALANG2015

1

METODE

A. REGRESI KOMPONEN UTAMA1. Masukkan data di lembar kerja Minitab dengan cara mengcopy dari Ms. Excel.

a. Klik Stat Regression Regression. Untuk mengetahui VIF b. Lalu akan muncul kotak dialog Regression masukkan Y ke kolom Respons

dan X1,X2,X3,X4 ke kolom Predictors.c. Pada pilihan Options pilih Variance Inflation Factor kemudian OK

2. Setelah itu lakukan standarisasi dengan cara klik Calc Standardizea. Lalu akan muncul kotak dialog Standardize masukkan semua variabel

prediktor pada Input colomn(s) pada Store result in isikan Z1-Z4 untuk hasil standarisasi.

b. Kemudian klik OK3. Klik Stat Multivariate Principal Component . Untuk mencari komponen

utamaa. Lalu akan muncul kotak dialog Principal Component Analysis masukkan Z1

dan Z2 (hasil standarisasi) ke kolom Variables pilih Covariance pada pilihan Type of Matrix karena data yang kita masukkan hasil standarisasi,

b. Kemudian klik Storage pada kolom Coefficients tidak diisi, pada kolom Scores diisi W1-W4 kemudian klik OK.

4. Membentuk persamaan W dari koefisien yang diperoleh di langkah 3 berdasarkan komponen utama.

5. Klik Stat Regression Regression. Untuk meregresikan W.a. Lalu akan muncul kotak dialog Regression masukkan Y ke kolom Respons

dan W1- W2 ke kolom Predictors. b. kemudian klik OK

6. Masukkan persamaan W (pada langkah 4) ke model regresi (yang diperoleh dari langkah 5) sehingga didapatkan yduga

7. Klik Stat Basic Statistics Store Descriptive Statistics. Untuk mencari rata-rata dan ragama. Akan muncul kotak dialog Descriptive Statistics masukkan X1 - X4 ke

kolom Variables klik Statistics.b. Kemudian centang Mean dan Variance klik OK

B. REGRESI RIDGE1. Masukkan data di lembar kerja Minitab dengan cara mengcopy dari Ms. Excel.

a. Klik Stat Regression Regression b. Lalu akan muncul kotak dialog Regression masukkan Y ke kolom Respons

dan X1,X2,X3,X4 ke kolom Predictors. c. Pada pilihan Options pilih Variance Inflation Factor klik OK.

2. Setelah itu lakukan standarisasi dengan cara, klik Calc Standardize.

2

a. Lalu akan muncul kotak dialog Standardize masukkan semua variabel penjelas pada Input colomn (s) , pada Store result in isikan Z1-Z4 untuk hasil standarisasi klik OK.

3. Copy hasil standarisasi di lembar kerja Ms. Exel4. Copy nilai b0, b1, b2, b3, b4 dan KTG dari output minitab ke lembar kerja Ms. Exel

5. Menghitung rumus dengan langkah sebagai berikut :

a. Menghitung dengan memanfaatkan nilai b0, b1, b2, b3, b4 dan KTG

yang sudah di copy pada langkah nomor 4.b. Nilai b0, b1, b2 dan b3, b4 di transpose dengan cara blok 4 cell kosong

(sebanyak ) lalu tulis =TRANSPOSE(b).

c. Lalu menghitung dengan cara tulis =MMULT(b’,b) kemudian tekan

ctrl+shift+enter.

d. Lalu masukkan pada rumus sehingga diperoleh nilai

e. Membuat matriks identitas berukuran 5x5 (sebanyak )

f. Menghitung LI blok cell kosong berukuran 5x5 lalu tulis =(L*mi) tekan ctrl+shift+enter.

g. Lalu nilai z0, z1, z2, z3, dan z4 di transpose blok 12x5 cell kosong copy z0 - z4 klik kanan paste special centang transpose lalu ok .

h. Menghitung Z’Z dengan cara blok cell kosong berukuran 5x5 lalu tulis =MMULT(Zt,Z) tekan ctrl+shift+enter .

i. Menghitung Z’Z+LI dengan cara blok cell kosong berukuran 5x5 lalu tulis =(Z’Z+LI) tekan ctrl+shift+enter .

j. Menghitung invers dari Z’Z+LI blok cell kosong berukuran 5x5 lalu tulis =MINVERSE(Z’Z+LI) tekan ctrl+shift+enter .

k. Menghitung Z’Y blok cell kosong berukuran 5x1 lelu tulis =MMULT(Zt,Y) tekan ctrl+shift+enter .

l. Menghitung blok cell kosong berukuran 5x1 lalu tulis

=MMULT( ) tekan ctrl+shift+enter .

6. Menghitung nilai = - … - dengan langkah sebagai berikut :

a. Mencari dan (sebanyak variabel penjelas) tulis

=AVERAGE(nilai-nilai Xi) untuk mencari rata-rata Xi =VAR(nilai-nilai Xi) untuk mencari ragam Xi tekan enter.

3

b. Nilai sementara yang diperoleh dimasukkan kedalam rumus =

- … - .

7. Nilai , dan sementara dimasukkan kedalam rumus .

HASIL DAN PEMBAHASAN

A. REGRESI KOMPONEN UTAMA1. Data

Deskripsi data CRBT (X1) : Jumlah konsumsi beras rumah tangga (ton/tahun)JPB (X2) : Jumlah produksi beras (dalam ton/tahun)NIB (X3) : Neto impor beras (dalam ton)NEB (X4) : Neto ekspor beras (dalam ton)INF (Y) : Rata-rata tingkat inflasi (%/tahun)

Y X1 X2 X3 X4

17.6 8.8 2589 83.1 158.2

10.9 8.5 1186 24.2 96.2

9.2 7.7 291 4.5 31.8

16.2 4.9 1276 9.1 95

10.1 9.6 6633 158.2 407.2

11.7 10 12125 132.2 101.6

17.9 11.5 36717 501.5 1180.6

21.1 11.6 43319 904 1807.5

14.7 11.2 10530 227.6 470

.7 10.7 3931 66.6 151.4

8.4 10 1536 43.4 93.8

32.8 6.8 61400 1253 3293.4

2. OUTPUT DAN INTERPRETASIa. Uji Asumsi Multikolinieritas

: tidak terdapat multikolinieritas

4

: terdapat multikolinieritas

Berdasarkan output tersebut dapat diketahui bahwa variabel X2,X3 dan X4 memiliki nilai VIF > 10. Hanya variable X1 yang VIF < 10. Hal ini mengindikasikan bahwa data tersebut mengandung multikolinieritas. Untuk itu harus dilakukan perbaikan pada model dengan menggunakan metode regresi komponen utama.

Dari hasil ANOVA diatas dapat diketahui bahwa p-value = 0.002 < 0.05, artinya H0

ditolak dan dapat disimpulkan bahwa data tersebut mengandung multikolinieritas.b. Penentuan Komponen Utama

Berdasarkan output tersebut dapat diketahui bahwa komponen yang dapat mewakili dari 4 komponen adalah 1 komponen utama sesuai kriteria 75 % dari proporsi kumulatif keragaman dan sesuai kriteria nilai eigen value minimal 1.

Dilihat dari nilai proporsi komponen utama, kontribusi proporsi keragaman

menjelaskan 99.2% keragaman dari Y. Ini berarti komponen 2 dapat disertakan

dalam model, karena nilai keragaman data asal yang dapat dijelaskan oleh komponen utama bernilai besar.

5

Regression Analysis: Y versus X1, X2, X3, X4 The regression equation isY = 21.3 - 1.21 X1 + 0.000122 X2 + 0.0136 X3 - 0.00148 X4Predictor Coef SE Coef T P VIFConstant 21.315 5.560 3.83 0.006X1 -1.2080 0.6208 -1.95 0.093 1.936X2 0.0001223 0.0002449 0.50 0.633 30.092X3 0.01362 0.02169 0.63 0.550 91.816X4 -0.001476 0.007834 -0.19 0.856 72.648S = 3.02014 R-Sq = 88.4% R-Sq(adj) = 81.8%Analysis of VarianceSource DF SS MS F PRegression 4 488.86 122.22 13.40 0.002Residual Error 7 63.85 9.12Total 11 552.71

Principal Component Analysis: Z1, Z2, Z3, Z4 Eigenanalysis of the Correlation MatrixEigenvalue 2.9630 1.0070 0.0235 0.0065Proportion 0.741 0.252 0.006 0.002Cumulative 0.741 0.992 0.998 1.000Variable PC1 PC2 PC3 PC4Z1 0.055 0.992 0.097 0.061Z2 0.576 0.039 -0.807 0.123Z3 0.579 -0.015 0.297 -0.759Z4 0.574 -0.120 0.501 0.637

c. Persamaan WBerdasarkan nilai PC2 dari komponen utama yang dapat mewakili dari 4

komponen tersebut dapat dibentuk persamaan W sebagai berikut :

d. Regresi antara variabel respon dengan W2

Berdasarkan output tersebut dapat diketahui bahwa model regresi yang

terbentuk antara Y denganW2 adalah kemudian persamaan W2 dimasukkan ke model regresi sehingga didapatkan y duga sementara sebagai berikut :

)

e. Nilai rata-rata dan ragam (statistika deskriptif)

Berikut merupakan hasil dari rumus = - … - untuk mencari b0

dan hasil dari rumus untuk mencari b1, b2,b3 dan b4

- =

=

= 4.96960

6

The regression equation isY = 14.9 - 2.25 W2Predictor Coef SE Coef T P VIFConstant 14.858 2.034 7.31 0.000W2 -2.254 2.117 -1.06 0.312 1.000

S = 7.04596 R-Sq = 10.2% R-Sq(adj) = 1.2%

Analysis of VarianceSource DF SS MS F PRegression 1 56.25 56.25 1.13 0.312Residual Error 10 496.46 49.65Total 11 552.71

- =

=

= 0.000003189

- =

=

= 0.00005924

- =

=

= 0.000180785

- = Z - - -

= 14.9 – 4.96960 – 0.000003189 -0.00005924 -0.000180785 = 9.93016B. REGRESI RIDGE1. DATACRBT (X1) : Jumlah konsumsi beras rumah tangga (ton/tahun)JPB (X2) : Jumlah produksi beras (dalam ton/tahun)NIB (X3) : Neto impor beras (dalam ton)NEB (X4) : Neto ekspor beras (dalam ton)INF (Y) : Rata-rata tingkat inflasi (%/tahun)

Y X1 X2 X3 X4

17.6 8.8 2589 83.1 158.2

10.9 8.5 1186 24.2 96.2

9.2 7.7 291 4.5 31.8

16.2 4.9 1276 9.1 95

10.1 9.6 6633 158.2 407.2

11.7 10 12125 132.2 101.6

17.9 11.5 36717 501.5 1180.6

21.1 11.6 43319 904 1807.5

7

14.7 11.2 10530 227.6 470

.7 10.7 3931 66.6 151.4

8.4 10 1536 43.4 93.8

32.8 6.8 61400 1253 3293.4

2. OUTPUT DAN INTERPRETASI

: tidak terdapat multikolinieritas

: terdapat multikolinieritas

Berikut merupakan output yang diperolah dari analisis regresi ridge (gulud) sebagai metode untuk menangani multikolinieritas dengan menggunakan software minitab dan Ms. Exel :

Berdasarkan output tersebut dapat diketahui bahwa variabel X2,X3 dan X4 memiliki nilai VIF > 10. Hanya variable X1 yang VIF < 10. Hal ini mengindikasikan bahwa data tersebut mengandung multikolinieritas. Untuk itu harus dilakukan perbaikan pada model dengan menggunakan metode regresi komponen utama.

Dari hasil ANOVA diatas dapat diketahui bahwa p-value = 0.002 < 0.05, artinya H0 ditolak dan dapat disimpulkan bahwa data tersebut mengandung multikolinieritas.

No. Variabel Hasil Keterangan

1 b’b 455.7887Berasal dari perkalian antara b transpose dengan b (hasil dari minitab)

8

Regression Analysis: Y versus X1, X2, X3, X4 The regression equation isY = 21.3 - 1.21 X1 + 0.000122 X2 + 0.0136 X3 - 0.00148 X4Predictor Coef SE Coef T P VIFConstant 21.315 5.560 3.83 0.006X1 -1.2080 0.6208 -1.95 0.093 1.936X2 0.0001223 0.0002449 0.50 0.633 30.092X3 0.01362 0.02169 0.63 0.550 91.816X4 -0.001476 0.007834 -0.19 0.856 72.648

S = 3.02014 R-Sq = 88.4% R-Sq(adj) = 81.8%

Analysis of Variance

Source DF SS MS F PRegression 4 488.86 122.22 13.40 0.002Residual Error 7 63.85 9.12

Total 11 552.71

2 L 0.080037091 Berasal dari rumus

3 LIBerasal dari perkalian antara L dengan matriks identitas

4 Z’ZBerasal antara perkalian antara Z transpose dengan Z, yang mana Z adalah hasil dari srandarisasi data

5 Z’Z+LIBerasal dari penjumlahan matriks Z’Z dengan matriks LI

6 Inverse dari matriks Z’Z+LI

7 Z’YBerasal dari perkalian antara Z (hasil srandarisasi) transpose dengan Y (data awal)

8Berasal dari perkalian antara matriks [Z’Z+LI] inverse dengan matriks Z’Y

9xbar 1, xbar 2, xbar 3

Nilai rata-rata dari X1, X2 dan X3

1

var 1, var 2, var 3

Nilai ragam dari X1, X2 dan X3

1b0 19.78895778

Berasal dari rumus = -

… -

1 b1,b2,b3

Berasal dari rumus

9

Berdasarkan langkah-langkah tersebut, persamaan regresi yang diperolah adalah sebagai berikut :

a. Persamaan regresi sementara :

14.75988845 - 2.261687196Z1 + 2.55045864Z2 + 3.597199099Z3 +

0.343015552Z4

Dari persamaan regresi tersebut dapat disimpulkan bahwa : Rata-rata tingkat inflasi adalah 14.75988845 persen pertahun. Jika konsumsi beras rumah tangga bertambah 1 ton pertahun maka rata-rata tingkat

inflasi bertambah 2.261687196 persen pertahun dengan jumlah produksi beras, neto impor beras, dan neto ekspor beras dianggap konstan.

Jika jumlah produksi beras bertambah 1 ton pertahun maka rata-rata inflasi bertambah 2.55045864 persen pertahun dengan jumlah produksi beras, neto impor beras, dan neto ekspor beras dianggap konstan.

Jika neto impor beras bertambah 1 ton maka rata-rata tingkat inflasi bertambah 3.597199099 persen pertahun dengan jumlah produksi beras, neto impor beras, dan neto ekspor beras dianggap konstan.

Jika neto ekspor beras bertambah 1 ton maka rata-rata tingkat inflasi bertambah 0.343015552 persen pertahun dengan jumlah produksi beras, neto impor beras, dan neto ekspor beras dianggap konstan.

Dari persamaan regresi tersebut dapat disimpulkan bahwa :b. Persamaan regresi tanpa multikolinieritas :

19.7889577- 0.542933257 6.12826E-09 +2.22372E-05 + 3.49462E-07

Dari persamaan regresi tersebut dapat disimpulkan bahwa : Rata-rata tingkat inflasi adalah 19.7889577 persen pertahun Jika konsumsi beras rumah tangga bertambah 1 ton pertahun maka rata-rata tingkat

inflasi bertambah 0.542933257 persen pertahun (bisa juga dianggap tetap karena peningkatan yang cukup kecil) dengan jumlah produksi beras, neto impor beras, dan neto ekspor beras dianggap konstan.

Jika jumlah produksi beras bertambah 1 ton pertahun maka rata-rata inflasi bertambah 6.12826E-09 persen pertahun dengan jumlah produksi beras, neto impor beras, dan neto ekspor beras dianggap konstan.

Jika neto impor beras bertambah 1 ton maka rata-rata tingkat inflasi bertambah

2.22372E-05 persen pertahun dengan jumlah produksi beras, neto impor beras, dan

neto ekspor beras dianggap konstan. Jika neto ekspor beras bertambah 1 ton maka rata-rata tingkat inflasi bertambah

3.49462E-07persen pertahun dengan jumlah produksi beras, neto impor beras, dan neto ekspor beras dianggap konstan.

10