materipusdiklat.bps.go.id/diklat/bahan_diklat/bt_analisis...materi pengertian korelasi dan regresi...

Post on 30-Aug-2020

98 Views

Category:

Documents

13 Downloads

Preview:

Click to see full reader

TRANSCRIPT

MateriPengertian Korelasi dan Regresi

Analisis Korelasi

Analisis Regresi Linier

Korelasi dalam Regresi Linier Berganda

Pengujian Model Regresi Berganda

Asumsi dan Pelanggaran Asumsi Klasik

Analisis Regresi Logistik

Pengertian Korelasi dan Regresi

VS

Ada hubungan gaji dan pendidikan ???

Ada hubungan gaji dan jenis kelamin ???

hubungan gaji dan pendidikan = korelasi Y dan X1

hubungan gaji dan jenis kelamin = korelasi Y dan X2

Variabel

Variabel

Variabel

Korelasi = hubungan antar 2 variabel

Aktifitas kehidupan manusia

SEBABJIKA

• MENDUNG

• PACEKLIK

• MISKIN

• TIDAK BER-KB

• KEKERINGAN

• TIKET PESAWAT MURAH

AKIBATMAKA

• HUJAN

• HARGA NAIK

• PENYAKIT

• BANYAK ANAK

• PRODUKSI TURUN

• ORANG NAIK PESAWAT

Pendidikan memengaruhi gaji ???, berapa besar pengaruhnya???

Jenis kelamin memengaruhi gaji???, berapa besar pengaruhnya???

X 1 lebih besar Y lebih besar

X2 laki-laki Y lebih besar

Y = β0 + 1X1 + 2X2 +

Yi = β0 + 1X1i + 2X2i + i i = 1, 2, …, n

OLSYi = b0 + b1X1i + b2X2i i = 1, 2, …, n

Analisis Korelasi

. . ..

..

... .

.

..

..

.. ..

.

Positif (r > 0) Negatif (r < 0)

Tidak ada korelasi (r

= 0)Tidak ada korelasi (r

= 0)

Positif kuat (r = 0.8)

Positif lemah (r = 0.4)

Koefisien Korelasi

i X Y X2 Y2 XY

1 X1 Y1 X12 Y1

2 X1Y1

2 X2 Y2 X22 Y2

2 X2Y2

3 X3 Y3 X32 Y3

2 X3Y3

… … … … … …

n Xn Yn Xn2 Yn

2 XnYn

X Y X2 Y2 XY

i X =Harga

(Juta Rp)

Y = Demand

(ton)X2 Y2 XY

1 8 3 64 9 24

2 7 4 49 16 28

3 7 5 49 25 35

4 7 6 49 36 42

5 6 6 36 36 36

6 6 7 36 49 42

7 6 8 36 64 48

8 6 9 36 81 54

9 5 10 25 100 50

10 5 10 25 100 50

X Y X2 Y2 XY

63 68 405 516 409

= -0.93106

Interpretasi… ?

i X1 X2 Y

1 X11 X21 Y1

2 X12 X22 Y2

3 X13 X23 Y3

… … … …

n X1n X2n Yn

X1 X2 Y

i X1 =Harga

(Juta Rp)

X2 = Income

(Juta Rp)

Y = Demand

(ton)

1 8 10 3

2 7 10 4

3 7 8 5

4 7 5 6

5 6 4 6

6 6 3 7

7 6 2 8

8 6 2 9

9 5 1 10

10 5 1 10

X1 X2 Y

63 46 68

rYX1 = -0.931

rYX2 = -0.951

rX1X2= 0.901

rYX2.X1 = -0.71

rYX1.X2 = -0.55

rX1X2.Y = 0.143

Interpretasi???

Koefisien korelasi Kekuatan Hubungan

0,00 Tidak ada hubungan

0,01 – 0,09 Hubungan kurang berarti

0,10 – 0,29 Hubungan lemah

0,30 – 0,49 Hubungan moderat

0,50 – 0,69 Hubungan kuat

0,70 – 0,89 Hubungan sangat kuat

> 0,90 Hubungan mendekati sempurna

(VERSI DE VAUS)

Koefisien korelasi Kekuatan Hubungan

0 Zero

0,1 – 0,3 Weak

0,4 – 0,6 Moderate

0,7 – 0,9 Strong

1 Perfect

(VERSI DANCEY AND REIDY)

Analisis Regresi Linier

Survey upah dan pendidikan terhadap 100 responden

GAJI (juta Rp)

oo

oo

oo

o

DIDIK (tahun)12 20

20

15

oo

o

o

o

o

o

o

o

o

o

o

oo

o

GAJI = α + DIDIK

α

> 0 hubungan +

ESTIMASI REGRESI

GAJI (juta Rp)

oo

oo

oo

o

DIDIK (tahun)12 20

25

17

oo

o

o

o

o

o

o

o

o

o

o

oo

o

GAJI = 5 + 1 DIDIK

5

1

Untuk setiap penambahan

lama pendidikan 1 tahun, gaji

meningkat 1 () juta rupiah per

bulan

Jika pendidikan = 0, gaji

sebesar 5 (α) juta rupiah per

bulan

RESIDUAL

GAJI (juta Rp)

oo

oo

oo

o

DIDIK (tahun)12

17

oo

o

o

o

o

o

o

o

o

o

o

oo

o

20} 3

GAJI = α + DIDIK +

Faktor-faktor lain yang

mempengaruhi gaji tetapi

tidak ada dalam model

Regresi Linier

Sederhana Y = a + bX

Berganda Y = b0 + b1X1 + b2X2 + … + bkkXk

• Dependent variable

• Explained variable

• Predictand

• Regressand

• Response variable

Y

• Independent variable

• Explanatory variable

• Predictor

• Regressor

• Stimulus atau control variable

X

Variabel dalam regresi linier

Y = a + bXY = variabel dependentX = variabel independenta = intersepb = slope

Persamaan matematik

Yi = α + Xi + i

Y = variabel dependentX = variabel independentα = parameter populasi = parameter populasi

Persamaan regresi

Yi = a + bXi

Y = variabel dependentX = variabel independenta = koefisien regresib = koefisien regresi

Estimasi

Berapa a dan b ?

i X =Harga

(Juta Rp)

Y = Demand

(ton)

1 8 3

2 7 4

3 7 5

4 7 6

5 6 6

6 6 7

7 6 8

8 6 9

9 5 10

10 5 10

0

2

4

6

8

10

12

0 2 4 6 8 10

SUMMARY

OUTPUT

Regression Statistics

Multiple R 0.93

R Square 0.87

Adjusted R

Square 0.85

Standard Error 0.94

Observations 10

ANOVA

df SS MS F Signif F

Regression 1 46.5 46.5 52.1 9.1E-05

Residual 8 7.1 0.9

Total 9 53.6

Coefficients

Standard

Error t Stat P-value

Intercept 21.9 2.1 10.4 0.0

X Variable 1 -2.4 0.3 -7.2 0.0

Y = 21.9 – 2.4X Interpretasi

Yi = + Xi + i i = 1, 2, …, 10

OLS

Investasi

Suku bunga IHS Inflasi Politik

Investasi = 0 + 1(suku bunga) + 2(IHS) + 3(Inflasi) + 4(Politik) +

Y = 0 + 1X1 + 2X2 + 3X3 + 4X4 +

Yi = 0 + 1X1i + 2X2i + 3X3i + 4X4i + i i = 1, 2, …, n

n observasi

OLS

Yi = b0 + b1X1i + b2X2i + b3X3i + b4X4i

Bentuk umum Yi = 0 + 1X1i + 2X2i + … + kXki + i i = 1, 2, …, n

Pengeluaran ruta barang tahan lama

(juta Rp)

Pendapatan

(juta Rp)

Jumlah ART

(orang)

Y = 3,92 + 2,50X1 - 0,48X2

b0 b1 b2

Interpretasi:

b0 = 3,02 besarnya pengeluaran barang tahan lama jika tidak ada pendapatan dan ART

adalah 3,02 juta rupiah

b1 = 2,50 kenaikan pendapatan 1 juta rupiah sedangkan jumlah ART tetap

meningkatkan pengeluaran bahan tahan lama 2,50 juta rupiah

b2 = - 0,48 bertambahnya jumlah ART satu orang menurunkan pengeluaran barang

tahan lama 0,48 juta rupiah

Y = b0 + b1 X1 + b2 X2

n

XbXbYb

2211

0

YXYXnA 11

2

2

2

2 )( XXnB

2121 XXXXnC

YXYXnD 22

2

1

2

1 )( XXnE

2CEBF

F

CDABb

1

F

ACDEb

2

i X1 X2 Y X1Y X2Y X12 X2

2 X1X2

1 8 10 3 24 30 64 100 80

2 7 10 4 28 40 49 100 70

3 7 8 5 35 40 49 64 56

4 7 5 6 42 30 49 25 35

5 6 4 6 36 24 36 16 24

6 6 3 7 42 21 36 9 18

7 6 2 8 48 16 36 4 12

8 6 2 9 54 18 36 4 12

9 5 1 10 50 10 25 1 5

10 5 1 10 50 10 25 1 5

X1 X2 Y X1Y X2Y X1

2 X22 X1X2

63 46 68 409 239 405 324 317

b0 = 15,086 b1 = -1,015 b2 = -0,41

Y = 15,086 – 1,015 X1 – 0,41X2

PetaniPupuk = X1

(kg)Pestisida = X2

(gram)Jagung = Y

(kg)

1 5 3 44

2 10 4 49

3 12 4 59

4 13 5 60

5 18 10 67

6 24 11 70

7 29 15 80

8 32 16 85

9 37 18 87

10 40 24 89

1. Buat estimasi persamaan regresi Y dan X1

2. Buat estimasi persamaan regresi Y, X1, dan X2

3. Dengan menggunakan persamaan regresi no (2) berapa jumlahpanen jagung jika menggunakan pupuk 10 kg/are dan pestisida 5 gram/are

Korelasi dalam RegresiLinier Berganda

1. Ukuran statistik yang menunjukkan seberapa besarkemampuan semua variabel bebas dalam menjelaskanvariabilitas variabel terikat

2. Ukuran statistik yang menunjukkan berapa banyak variasidalam data dapat dijelaskan oleh model regresi yang dibangun

2

2

2

)(

)ˆ(11

YY

YY

SST

SSER

0 ≤ R2 ≤ 1R2 ↑: kemampuan X menjelaskan variabilitas Y semakin baik

X semakin banyak R2 ↑

2

22112

i

iiii

Y

YXbYXbR

KOEFISIEN DETERMINASI

i] X1 X2 Y X1Y X2Y X12 X2

2 X1X2

1 8 10 3 24 30 64 100 80

2 7 10 4 28 40 49 100 70

3 7 8 5 35 40 49 64 56

4 7 5 6 42 30 49 25 35

5 6 4 6 36 24 36 16 24

6 6 3 7 42 21 36 9 18

7 6 2 8 48 16 36 4 12

8 6 2 9 54 18 36 4 12

9 5 1 10 50 10 25 1 5

10 5 1 10 50 10 25 1 5

X1 X2 Y X1Y X2Y X1

2 X22 X1X2

63 46 68 409 239 405 324 317

b0 = 15,086

b1 = -1,015

b2 = -0,41

932,06,53

)8,73)(41,0()4,19)(015,1(2

22112

i

iiii

y

yxbyxbR

Ukuran statistik yang menunjukkan seberapa besar

kemampuan faktor-faktor selain variabel bebas

dalam menjelaskan variabilitas variabel terikat

Koefisien non-determinasi = 1 – R2

2. KOEFISIEN NON-DETERMINASI

Untuk mengukur hubungan linier antara variabeltak bebas Y dengan variabel bebas X1, X2, …, Xk

r = √R2 ; -1 ≤ r ≤ 1

KOEFISIEN KORELASI LINIER BERGANDA

Petunjuk

1. Tugas individu

2. Gunakan data sekunder dari www.bps.go.id

3. Buat model regresi linier berganda dengan 2 – 3 variabel

bebas

4. Interpretasikan hasilnya

STUDI KASUS

Pengujian Model RegresiBerganda

• Untuk menguji apakah masing-masing X1, X2, …, dan Xk berpengaruhsignifikan (nyata) pada Y

• Uji –t dengan statistik uji student-t (by William Sealy Gosset)

• Langkah-langkah uji parsial

1. Tentukan hipotesis H0: j = 0H1: j 0 ; j = 1, 2, …, k

2. Tentukan daerah kritis (daerah penolakan H0)

Tabel-t dengan df = n-(k+1)

3. Hitung t-hitung

4. Tentukan Keputusan

Yi = 0 + 1X1i + 2X2i + … + kXki + i i = 1, 2, …, n

Y = b0 + b1X1 + b2X2 + … + bkXk

UJI SIGNIFIKANSI PARSIAL

• Untuk menguji apakah X1, X2, …, dan Xk secara bersama-sama(simultan) berpengaruh signifikan (nyata) pada Y

• Uji –F dengan statistik uji F

• Langkah-langkah uji simultan

1. Tentukan hipotesis H0: 1 = 2 = ….. = k = 0H1: minimal ada 1 j 0 ; j = 1, 2, …, k

2. Tentukan daerah kritis (daerah penolakan H0)

Tabel F dengan df pembilang = (k-1) dan df penyebut = (n-k)

3. Hitung F-hitung F = {R2/(k-1)} / {(1-R2)/(n-k)}

R2 = koefisien determinasi

4. Tentukan Keputusan

Yi = 0 + 1X1i + 2X2i + … + kXki + i i = 1, 2, …, n

Y = b0 + b1X1 + b2X2 + … + bkXk

UJI SIGNIFIKANSI SIMULTAN

• Untuk menguji apakah r berada cukup jauh dari suatu nilaitertentu 0 sebagai alasan untuk menolak H0 bahwa = 0

• Langkah-langkah pengujian

1. Tentukan hipotesis

2 arah: H0: = 0 (tidak ada korelasi linier)

H1: 0 (ada korelasi linier)

1 arah: H0: = 0 (tidak ada korelasi linier)

H1: > 0 (ada korelasi inier positif)

atau H0: = 0 (tidak ada korelasi linier)

H1: < 0 (ada korelasi linier negatif)

2. Tentukan daerah kritis (daerah penolakan H0)

Tabel-t dengan df = n-(k+1)

3. Hitung t-hitung t = (|R|(n-k-1))/(1-R2)

4. Tentukan Keputusan

UJI KOEFISIEN KORELASI

Asumsi dan PelanggaranAsumsi Klasik

Multikolinieritas

Heteroskedastisitas

Normalitas

Autokorelasi

ASUMSI KLASIK

• Untuk mengukur tingkat asosiasi (keeratan) hubungan ataupengaruh antar variabel bebas melalui koefisien korelasi (r)

• Beberapa pendapat:

jika r > 0,60

jika 0,5 < r < 0,90

• Statistik yang digunakan

• Nilai tolerance besarnya tingkat kesalahan yang dibenarkan secara statistik > 0,1 (tidak terjadi multikol)

• Nilai VIF faktor inflasi penyimpangan baku kuadrat < 10,0 (tidak terjadi multikol)

MULTIKOLINIERITAS

Hasil uji F signifikan Hasil uji t tidak signifikan

R2 besar Hasil uji t tidak signifikan

rYX1.X2 > R2 rYX2.X1 > R2 rX1X2.Y > R2

DETEKSI MULTIKOLINIERITAS

Untuk menguji ada tidaknya multikolinearitas, kita dapatmenggunakan nilai Toleransi atau VIF (Variance Inflation Factor), dengan rumus sebagai berikut :

Jika nilai Toleransi kurang dari 0,1 atau nilai VIF melebihi 10maka hal tersebut menunjukkan bahwa multikolinearitas adalahmasalah yang pasti terjadi antar variabel bebas.

• Nilai varians residu (error) tidak sama atau hetero

• Sering terjadi pada data CS (Cross Section)

• Deteksi:

• Metode grafik pola error data

• Uji korelasi rank spearman

HETEROSKEDASTISITAS

• Terjadi korelasi antar observasi (antar residu)

• Terjadi pada data TS

• Deteksi:

• Grafik

• Uji DW (Durbin Watson)

AUTOKORELASI

Analisis Regresi Logistik

• Analisis regresi dengan variabel dependen dikotomi

• Tidak ada asumsi hubungan linier antara variabel dependen dan independen

• Model:

log(p/(1-p)) = 0 + 1X1 + 2X2 + ... + kXk

p = p(Y=1)

• Interpretasi koefisien:

• Menjelaskan hub fungsional variabel dependen dan independen

• Menentukan unit perubahan setiap variabel bebas

• Mendapatkan nilai odds ratio (rasio peluang) yang menunjukkan perbandingkan tingkat kecenderungan kedua kategori dalam satu variabel bebas

PENGERTIAN

• Regresi logistik menghasilkan odds ratio (rasio peluang) terkait nilai setiap prediktor

• Odds (peluang) suatu kegiatan adalah: probabilitas hasil yang muncul dibagi probabiltias kejadian yang tidak terjadi

• Odds ratio adalah: sekumpulan peluang yang dibagi dengan peluang lainnya

• Odds ratio = exp(j) : resiko terjadinya peristiwa y=1 pada kategori xj = 1 adalah sebesar exp(j)

• Odds ratio juga digunakan untuk menunjukkan kecenderungan hubungan suatu variabel X dan Y

Petunjuk

1. Tugas individu2. Gunakan data sekunder dari instansi masing-masing3. Buat model regresi linier berganda dengan 2 – 3 variabel bebas4. Uji Asumsi5. Interpretasikan hasilnya6. Hasil studi kasus dibuat semacam laporan dengan format:

Bab I. Pendahuluan meliputi materi pembelajaran;Bab II Studi Kasus meliputi Gambaran Data, Langkah Kerja;Bab III. Pembahasan meliputi Hasil Analisis (Deskriptif, Korelasi,Regresi)Bab IV. Kesimpulan

STUDI KASUS

TERIMA KASIH

top related