statistika analisis korelasi dan regresi linier sederhana

23
STATISTIKA PERTEMUAN 6 ANALISIS KORELASI DAN REGRESI LINIER SEDERHANA Dosen Pengasuh : NURYADI, M.Si

Upload: abdurrahman-adil-amrullah

Post on 18-Jan-2016

231 views

Category:

Documents


8 download

DESCRIPTION

STATISTIKA - ANALISIS KORELASI DANREGRESI LINIER SEDERHANA

TRANSCRIPT

Page 1: Statistika ANALISIS KORELASI DAN REGRESI LINIER SEDERHANA

STATISTIKA

PERTEMUAN 6ANALISIS KORELASI DANREGRESI LINIER SEDERHANA

Dosen Pengasuh :NURYADI, M.Si

Page 2: Statistika ANALISIS KORELASI DAN REGRESI LINIER SEDERHANA

BAHASAN PERTEMUAN 6

ARTI ANALISA KORELASI

ARTI KOEFISIEN DETERMINASI

METODE Least Square UNTUK REGRESI

RAMALAN MENGGUNAKAN REGRESI DATA BERKELOMPOK, RANK, DAN KUALITATIF

TUJUAN :

Menjelaskan pentingnya analisis hubungan

Menjelaskan dan Menghitung koefisien korelasi dan regresi sederhana

Memahami dan menerapkan regresi dan korelasi

Menggunakan tehnik ramalan dari analisis regresi

Page 3: Statistika ANALISIS KORELASI DAN REGRESI LINIER SEDERHANA

(1) ARTI ANALISA KORELASI

Pada semua kejadian, baik ekonomi maupun lainnya, pasti ada faktor yg menyebabkan terjadinya kejadian tsb (Misal : menurunnya hasil penjualan tektil, mungkin disebabkan karena kalah bersaing dengan tekstil impor; menurunnya produksi padi mungkin karena pupuknya berkurang; dll).

Kejadian tsb dapat dinyatakan dengan “perubahan nilai variabel” (Misal : jika X = variabel harga, maka naik-turunnya harga dapat dinyatakan dengan perubahan nilai X. Jika Y = variabel hasil penjualan, maka naik-turunnya hasil penjualan dapat dinyatakan dengan perubahan nilai Y).

Jadi, hubungan antara dua kejadian dapat dinyatakan dengan “hubungan dua variabel”.

Dalam pertemuan ini, hanya akan dibahas “hubungan linier antara dua variabel X dan Y”. Hubungan linier dan nonlinier lebih dari dua variabel akan dibahas pada pertemuan berikutnya.

Page 4: Statistika ANALISIS KORELASI DAN REGRESI LINIER SEDERHANA

ARTI ANALISA KORELASI (lanjutan)

Jika variabel X dan Y mempunyai hubungan, maka variabel X yang sudah diketahui nilainya dapat digunakan untuk memperkirakan atau menaksir Y.

Variabel Y yang nilainya akan diperkirakan disebut “variabel tidak bebas (dependent variable)”, sedangkan nilai X yang digunakan untuk memperkirakan nilai Y disebut “variabel bebas (independent variable)”.

Jadi, analisis korelasi memungkinkan “untuk menduga sesuatu”, baik secara “kualitatif” (Misal : akan turun hujan, akan lulus ujian, harga beras akan naik, dll) maupun “kuantitatif” (Misal : produksi padi akan mencapai 16 juta ton, penerimaan negara naik 15%, dll).

Salah satu cara untuk melakukan perkirakan dari dua variabel tsb adalah dengan menggunakan “garis regresi”.

Page 5: Statistika ANALISIS KORELASI DAN REGRESI LINIER SEDERHANA

(2) KOEFISIEN KORELASI DAN KEGUNAANNYA

Hubungan dua variabel ada “positif” atau “negatif”. Hubungan X dan Y dikatakan positif jika “kenaikan / penurunan nilai X” umumnya diikuti oleh “kenaikan / penurunan nilai Y”. Sebaliknya, dikatakan negatif jika “kenaikan / penurunan nilai X” diikuti oleh “penurunan / kenaikan nilai Y”

Contoh Hubungan "Positif" Contoh Hubungan "Negatif"Variabel X Variabel Y Variabel X Variabel Y

Pupuk Produksi Jumlah Akseptor ProduksiBiaya Iklan Hasil Penjualan Harga Barang Hasil Penjualan

Berat Badan Tekanan Darah Pendapatan Kejahatan

Page 6: Statistika ANALISIS KORELASI DAN REGRESI LINIER SEDERHANA

KOEFISIEN KORELASI DAN KEGUNAANNYA

Apabila bentuk diagram pencar “tidak teratur” artinya “kenaikan / penurunan nilai X” umumnya tidak diikuti oleh “kenaikan / penurunan nilai Y”, maka dikatakan X dan Y “TIDAK BERKORELASI”. Artinya, “variabel X tidak mempengaruhi Y”

dan dikatakan X dan Y bebas (independent).

X Y 1 43 42 2

1.5 32.5 32 6

2.5 51.5 5

Page 7: Statistika ANALISIS KORELASI DAN REGRESI LINIER SEDERHANA

KOEFISIEN KORELASI DAN KEGUNAANNYA

Kuat atau tidaknya hubungan antara X dan Y apabila dapat dinyatakan dengan “FUNGSI LINIER”, diukur dengan suatu nilai yang disebut “KOEFISIEN KORELASI ( r ) ” dengan nilai paling sedikit -1 dan paling besar +1.

Jadi : -1 ≤ r ≤ +1

Artinya :

r = +1, hubungan X dan Y sempurna dan positif (mendekati +1 menggambarkan hubungan sangat kuat dan positif).

r = -1, hubungan X dan Y sempurna dan negatif (mendekati -1 menggambarkan hubungan sangat kuat dan negatif).

r = 0, hubungan X dan Y lemah sekali (tidak ada hubungan).

“Naik/turunnya nilai Y yang bervariasi” tidak semata-mata disebabkan oleh X dan Y, karena masih ada “FAKTOR LAIN”. Misal : jika Y = hasil penjualan, X = biaya iklan, maka naik/turunnya Y selain disebabkan oleh X, juga oleh faktor (variabel) lain seperti pendapatan masyarakat, selera, harga, dll.

Page 8: Statistika ANALISIS KORELASI DAN REGRESI LINIER SEDERHANA

KOEFISIEN KORELASI DAN KEGUNAANNYA

Terkait dengan hal tsb, muncul pertanyaan “BERAPA BESARNYA KONTRBUSI VARIABEL X TERHADAP NAIK/TURUNYYA NILAI Y”.

Jawaban dari pertanyaan tsb, maka harus dihitung suatu koefisien yang disebut “KOEFISIEN PENENTUAN (coefficient of determination” yang biasa disimbolkan (KP) dengan rumus :

KP = r2

Contoh :

Jika r = 0.9 maka nilai KP = (0.9)2 = 0.81 (81%), yaitu besarnya sumbangan variabel X terhadap naik/turunnya Y adalah 81%. Sedangkan 19% merupakan sumbangan faktor (variabel) lain.

Page 9: Statistika ANALISIS KORELASI DAN REGRESI LINIER SEDERHANA

(3) RUMUS KOEFISIEN KORELASI ( r )

n

i

i

n

i

i

n

i

ii

yx

yxr

1

2

1

2

1

n

i

i

iYi

n

i

i

ii

Yn

Y

YY

Xn

X

XXx

1

1

1

,

1

,Jika :

Rumus 1 :

2

11

2

1

2

1

2

1 1 1

)()(

n

i

i

n

i

i

n

i

n

i

ii

n

i

n

i

n

i

iiii

YYnXXn

YXYXnrRumus 2 :

Page 10: Statistika ANALISIS KORELASI DAN REGRESI LINIER SEDERHANA

Contoh Hitung Koefisien Korelasi ( r )

Halaman 163 :

X adalah persentase kenaikan biaya iklan dan Y adalah persentase kenaikan hasi penjualan, nilai keduanya seperti pada tabel. Hitung koefisien korelasi ( r ) ?

X 1 2 4 5 7 9 10 12Y 2 4 5 7 8 10 12 14

Langkah menghitung, buatlah lembar kerja seperti tabel berikut yang disusun berdasarkan rumus r

X Y X-Xr Y-Yr x2 y2 xy ( x ) ( y )

1 2 -5.25 -5.75 27.5625 33.0625 30.18752 4 -4.25 -3.75 18.0625 14.0625 15.93754 5 -2.25 -2.75 5.0625 7.5625 6.18755 7 -1.25 -0.75 1.5625 0.5625 0.93757 8 0.75 0.25 0.5625 0.0625 0.18759 10 2.75 2.25 7.5625 5.0625 6.1875

10 12 3.75 4.25 14.0625 18.0625 15.937512 14 5.75 6.25 33.0625 39.0625 35.9375

Rata_2 6.25 7.75 Σ 0 0 107.5 117.5 111.5

X Y X2 Y2 XY1 2 1 4 22 4 4 16 84 5 16 25 205 7 25 49 357 8 49 64 569 10 81 100 90

10 12 100 144 12012 14 144 196 168

Σ 50 62 420 598 499

Untuk Rumus 1 :

Untuk Rumus 2 :

Page 11: Statistika ANALISIS KORELASI DAN REGRESI LINIER SEDERHANA

Selanjutnya nilai-nilai tsb masukan dalam rumus :

n

i

i

n

i

i

n

i

ii

yx

yxr

1

2

1

2

1 99.05.1175.107

5.111r

Nilai r = 0.99, hubungan antara X dan Y sangat kuat dan positif, artinya kenaikan biaya iklan umumnya menaikkan hasil penjualan.

Selanjutnya, dari nilai r, dihitung nilai KP = r2 = (0.99)2 = 0.9821 ≈ 0.98 = 98%. Artinya : kontribusi biaya iklim terhadap variasi hasil penjualan adalah 98%, sedangkan sisanya 2% merupakan kontribusi faktor lain, seperti daya beli masyarakat.

Rumus 1 :

Rumus 2 :2

11

2

1

2

1

2

1 1 1

)()(

n

i

i

n

i

i

n

i

n

i

ii

n

i

n

i

n

i

iiii

YYnXXn

YXYXnr 99.0

)62()598(8)50()420(8

)62)(50()499(822

r

Page 12: Statistika ANALISIS KORELASI DAN REGRESI LINIER SEDERHANA

(4) RUMUS KOEFISIEN KORELASI ( r )(DATA BERKELOMPOK)

2222 )()()()(

))(()(

vvuu

vu

vffvnuffun

vfufuvfnr

Contoh (halaman 168) :

100 mahasiswa AIS melaksanakan ujian statistik dan matematik. Asumsi : jika kemampuan matematik (X) rendah, maka kemampuan statistik (Y) juga rendah, dan sebaliknya. Hasil nilai ujian yang diperoleh sebagai berikut :

Matematika 40-49 50-59 60-69 70-79 80-89 90-99 JumlahStatistika

(1) (2) (3) (4) (5) (6) (7) (8)90-99 2 4 4 1080-89 1 4 6 5 1670-79 5 10 8 1 2460-69 1 4 9 5 2 2150-59 3 6 6 2 1740-49 3 5 4 12

Jumlah 7 15 25 23 20 10 100

Page 13: Statistika ANALISIS KORELASI DAN REGRESI LINIER SEDERHANA

Menghitung Koefisien Korelasi ( r )(Data Berkelompok)

Dari tabel sebelumnya, menunjukkan hubungan nilai matematik dan statistik merupakan dua tabel frekuensi berikut :

Kelas Nilai Nilai Tengah Matematika (X) u fu

40-49 44.5 -2 750-59 54.5 -1 1560-69 64.5 0 2570-79 74.5 1 2380-89 84.5 2 2090-99 94.5 3 10

Kelas Nilai Nilai Tengah Statistika (X) u fu

90-99 94.5 2 1080-89 84.5 1 1670-79 74.5 0 2460-69 64.5 -1 2150-59 54.5 -2 1740-49 44.5 -3 12

Tabel menunjukkan bahwa u dan v masing-masing adalah skala baru dari X dan Y.

Kelas atau nilai tengah yang harus diberi “nilai 0” untuk kelas genap (seperti contoh), “pilihlah kelas yang dekat dengan nilai tengah”, yaitu untuk X (64.5 atau 74.5) diberi nilai 0, jadi u = 0. Demikian juga untuk Y.

f adalah frekuensi untuk tiap sel, jadi fu = frekuensi untuk X atau u, dan fv = frekuensi untuk Y atau v.

Page 14: Statistika ANALISIS KORELASI DAN REGRESI LINIER SEDERHANA

Jika dua tabel frekuensi tersebut digabung, akan diperoleh tabel berikut :

Selenjutnya, untuk perhitungan r dibuat “tabel korelasi” seperti berikut (perhatikan perubahan letak u, v, fu dan fv ) :

u -2 -1 0 1 2 3 fv

v (1) (2) (3) (4) (5) (6) (7) (8)2 2 4 4 101 1 4 6 5 160 5 10 8 1 24-1 1 4 9 5 2 21-2 3 6 6 2 17-3 3 5 4 12fu 7 15 25 23 20 10 100

(I) (II) (III) (IV) (V)v fv vfv v2fv uvf

2 4 4 2 10 20 40 44 1 4 6 5 1 16 16 16 31 5 10 8 1 0 24 0 0 01 4 9 5 2 -1 21 -21 21 -33 6 6 2 -2 17 -34 68 203 5 4 -3 12 -36 108 33

(VI) u -2 -1 0 1 2 3 100 -55 253 125(VII) fu 7 15 25 23 20 10 100(VIII) ufu -14 -15 0 23 40 30 64(IX) u2fu 28 15 0 23 80 90 236(X) uvf 32 31 0 -1 24 39 125

Keterangan :

Cara menghitung nilai pada setiap baris dan kolom, dijelaskan pada halaman : 169 - 171

Page 15: Statistika ANALISIS KORELASI DAN REGRESI LINIER SEDERHANA

Berdasarkan nilai jumlah (Σ) pada kolom dan baris tabel tersebut diperoleh :

Σufu = 64, Σu2fu = 236, Σvfv = -55, Σv2fv = 253, Σuvf = 125, dan n = 100

2222 )()()()(

))(()(

vvuu

vu

vffvnuffun

vfufuvfnr

77.07686.0)55()253(100)64()236(100

)55)(64()125(10022

r

Kesimpulan :

Hubungan nilai matematik dan statistik “cukup kuat dan positif”. Artinya, nilai matematik yang diperoleh akan mempengaruhi nilai statistik.

Pada umumnya, mahasiswa dengan nilai matematik yang rendah akan memperoleh nilai statistik yang rendah; sebaliknya jika nilai matematik tinggi, maka nilai statistik yang akan dicapai juga tinggi.

Page 16: Statistika ANALISIS KORELASI DAN REGRESI LINIER SEDERHANA

(5) PENGERTIAN KORELASI RANK

KORELASIRANK

ANALISIS DATASTATISTIK DITU-

JUKAN UNTUK

MENGETAHUI RANKING SUATU DATA,

MINIMAL 2 DATA

RUMUS KOEFISEN RANK DINAMAKAN RUMUS SPEARMAN

nganrankbanyakpasan

nkpasanganraselisihd

anann

dr

i

n

ii

rank

,

dim,)1(

61

21

2

Page 17: Statistika ANALISIS KORELASI DAN REGRESI LINIER SEDERHANA

Contoh Soal dan Bahasan (Halaman 174)

NO NAMA ROKOK Rank JONI Rank TONO d d2

1 Kansas 9 8 1 1

2 Jarum 5 3 2 4

3 555 10 9 1 1

4 Bentoel 1 2 (1) 1

5 Mascot 8 7 1 1

6 Salem 7 10 (3) 9

7 Gentong 3 4 (1) 1

8 Minakjinggo 4 6 (2) 4

9 Gudang Garam 2 1 1 1

10 Dunhill 6 5 1 1

∑   55 55 - 24

Koefisien Rank (Spearman) :

85,0)1100.(10

2461

)1(

61

21

2

x

nn

dr

n

ii

rank

Page 18: Statistika ANALISIS KORELASI DAN REGRESI LINIER SEDERHANA

(6) KORELASI DATA KUALITATIF

KORELASIKUALITATIF

UKURAN STATISTIK

UNTUK MENGUKUR KUATNYA HUBUNGAN BERSYARAT DATA

KUALITATIF (KOEFISIEN BERSYARAT)

RUMUS

nCc

2

2

p

i

q

j

q

j

ij

p

i

q

i

j

p

i

ij bservasibanyaknyaonnnfin1 1 1111

arapanfrekuensihn

nne jiij

.

Besarnya C tergantung pada banyaknya baris dan kolom (r), batas

atas C dapat dirumuskan :

r

rCc

1

RUMUS

khikuadrate

efp

i

q

j ij

ijij

1 1

22 )(

dimana :

fij = nij = frek.observasi (baris i kolom j)i = 1, 2, ….., pi

j = 1, 2, …., qi

Page 19: Statistika ANALISIS KORELASI DAN REGRESI LINIER SEDERHANA

Contoh Soal dan Penyelesaian (Hal. 178-179)

Pendidikan Kurang Cukup Sangat Cukup ∑

Tidak tamat SLA 82 65 12 159

Tamat SLTA 59 112 24 195

Pernah Masuk PT 37 94 42 173

∑ 178 271 78 527

Carilah Koefisien Bersyarat dari hasil penelitian hubungan antara Tingkat pendidikan ibu rumah tangga dengan konsumsi susu dari anggota keluarga?

PENDIDIKAN K (f) ẹ (f-e)^2 C (f) e (f-e)^2 SC(f) e (f-e)^2 ∑

TIDAK TAMAT SD 82,0 53,7 14,9 65,0 81,8 3,4 12,0 23,5 5,7 159,0

TAMAT SLTA 59,0 65,9 0,7 112,0 100,3 1,4 24,0 28,9 0,8 195,0

PERNAH MASUK PT 37,0 58,4 7,9 94,0 89,0 0,3 42,0 25,6 10,5 173,0

∑ 178,0 178,0 23,49 271,0 271,0 5,1 78,0 78,0 17,0 527,0

arapanfrekuensihn

nne jiij

.khikuadrat

e

efp

i

q

j ij

ijij

1 1

22 )(

Page 20: Statistika ANALISIS KORELASI DAN REGRESI LINIER SEDERHANA

Penyelesaian

45)(

1 1

22

p

i

q

j ij

ijij

e

ef

ategorifrekuensikf ij

arapanfrekuensihn

nne jiij

.

28,052745

452

2

n

Cc

Page 21: Statistika ANALISIS KORELASI DAN REGRESI LINIER SEDERHANA

Bentuk Umum Persamaan Regresi Linear

Bentuk Umum :

Keterangan : Y = variabel terikat X = Variabel Bebas; a, dan b konstanta

bxaY

22 )(

)).((

xxn

yxxynb

xbYa

(7) TEKNIK RAMALAN DAN ANALISIS REGRESI

Page 22: Statistika ANALISIS KORELASI DAN REGRESI LINIER SEDERHANA

Contoh Soal dan PenyelesaianSUATU PABRIK ROTI INGIN MENCARI KAITAN HUBUNGAN ANTARA JUMLAH PRODUKSI ROTI (X) DAN JUMLAH JAM KERJA (Y).DITANYA : Hitung r, R, KOEFISIEN a, b, dan BERAPA JAM KERJA YANG DIBUTUHKAN UNTUK MENGHASILKAN 75 PRODUK ?

NO PRO (X) JAKER (Y)

1 30 73

2 20 50

3 60 128

4 80 170

5 40 87

6 50 108

7 60 135

8 30 69

9 70 148

10 60 132

99,0

)()(

..

1 1

22

1 1

21

2

1 1 1

n

i

n

iii

n

i

n

ii

n

i

n

i

n

iiiii

YYnXXn

YXYXnr

0,2)(

)).((22

xxn

yxxynb

10 xbYa

R=r2=0.992=0.98

Ẏ = a + bX=10+2,0x(75)=160

Page 23: Statistika ANALISIS KORELASI DAN REGRESI LINIER SEDERHANA