ekspektasi varian kovarian korelasi regresi

18
6.1 Pengertian Umum Banyak permasalahan yang datanya dinyatakan oleh lebih dari sebuah variabel. Hubungan antara dua atau lebih variabel dapat dinyatakan secara matematika sehingga merupakan suatumodel yang dapat digunakan untuk berbagai keperluan analisis, misalnya: peramalan (prediction), perpanjangan (extension), perbaikan atau pengecekan ketelitian data, atau pe ngisan datapadapriode kosong untuk kasus hidrologi. Analisis regresi adalah analisis yang membahas hubungan fungsional dua variabel atau lebih. Analisis korelasi (correlation analisys) adalah analisis yang membahas tentang derajat hubungan dalam analisis regresi disebut. Tujuan regresi adalah untuk melihat hubungan antara 2 variabel atau lebih. 6.2 Nilai Harapan Misalkan adalah variabel acak dengan distribusi probabilitas (). Mean atau ekspektasi atau nilai harapan dari X adalah = () = ∑ (), (6. 1) = () = ∫ () , −∞ (6. 2) Ekspektasi atau nilai rata-rata atau nilai mean dari variabel acak dengan fungsi kerapatan peluang dan nilai i x untuk = 1, 2, . .. adalah () = ∑ ( =1 ) (6. 3) Teorema 1 Jika adalah variabel acak diskrit, nilai mean dari fungsi = () adalah () = [()] = ∑ ( ) ( = ) (6. 4) Teorema 2 Misalkan dan adalah variabel acak diskrit maka a. untuk sembarang konstanta , aEa a dan E aX aE X b. EX Y EX EY c. terdapat kontanta ,, abc E aX bY c aE X bE Y c Sifat-sifat ekspektasi:

Upload: dewi-purnamasari

Post on 29-Jan-2016

81 views

Category:

Documents


2 download

DESCRIPTION

Varian kovarian

TRANSCRIPT

Page 1: Ekspektasi Varian Kovarian Korelasi Regresi

6.1 Pengertian Umum

Banyak permasalahan yang datanya dinyatakan oleh lebih dari sebuah variabel. Hubungan

antara dua atau lebih variabel dapat dinyatakan secara matematika sehingga merupakan suatu model

yang dapat digunakan untuk berbagai keperluan analisis, misalnya: peramalan (prediction),

perpanjangan (extension), perbaikan atau pengecekan ketelitian data, atau pe ngisan data pada priode

kosong untuk kasus hidrologi. Analisis regresi adalah analisis yang membahas hubungan fungsional

dua variabel atau lebih. Analisis korelasi (correlation analisys) adalah analisis yang membahas

tentang derajat hubungan dalam analisis regresi disebut. Tujuan regresi adalah untuk melihat

hubungan antara 2 variabel atau lebih.

6.2 Nilai Harapan

Misalkan 𝑋 adalah variabel acak dengan distribusi probabilitas 𝑓(𝑥). Mean atau ekspektasi

atau nilai harapan dari X adalah

𝜇 = 𝐸(𝑋) = ∑ 𝑥𝑓(𝑥), 𝑗𝑖𝑘𝑎 𝑋 𝑑𝑖𝑠𝑘𝑟𝑖𝑡

𝑥

(6. 1)

𝜇 = 𝐸(𝑋) = ∫ 𝑥𝑓(𝑥) 𝑑𝑥, 𝑗𝑖𝑘𝑎 𝑋 𝑘𝑜𝑛𝑡𝑖𝑛𝑢 ∞

−∞

(6. 2)

Ekspektasi atau nilai rata-rata atau nilai mean dari variabel acak 𝑋 dengan fungsi kerapatan

peluang 𝑓 dan nilai ix untuk 𝑖 = 1, 2, . .. adalah

𝐸(𝑋) = ∑ 𝑥𝑖𝑓(

𝑖=1

𝑥𝑖)

(6. 3)

Teorema 1

Jika 𝑋 adalah variabel acak diskrit, nilai mean dari fungsi 𝑌 = 𝑔(𝑋) adalah

𝐸 (𝑌) = 𝐸[𝑔(𝑋)] = ∑ 𝑔(𝑥𝑖)

𝑖

𝑃(𝑋 = 𝑥𝑖)

(6. 4)

Teorema 2

Misalkan 𝑋 dan 𝑌 adalah variabel acak diskrit maka

a. untuk sembarang konstanta ,a E a a dan E aX aE X

b. E X Y E X E Y

c. terdapat kontanta , ,a b c

E aX bY c aE X bE Y c

Sifat-sifat ekspektasi:

Page 2: Ekspektasi Varian Kovarian Korelasi Regresi

a. Jika X merupakan variabel acak dengan pdf fx(x) dan u(X) adalah fungsi dari X, maka ekspektasi

dari u(X) adalah:

, jika X diskrit

, jika X kontinu

x

x

x

u x f x

E u Xu x f x dx

(6. 5)

b. Sifat linear ekspektasi

E ag X bh X aE g X bE h X

(6. 6)

6.3 Variansi

Mean dari variabel acak X adalah suatu nilai yang penting dalam statistik karena nilai tersebut

menggambarkan dimana distribusi probabilitas berpusat. Meskipun demikian mean tidak cukup untuk

memberikan gambaran tentang bentuk suatu distribusi.Untuk mengetahui bentuk suatu distribusi,

perlu diketahui variabilitas distribusi tersebut. Salah satu ukuran variabilitas dalam statistik adalah

variansi. Variansi dari variabel acak X atau variansi dari distribusi probabilitas X dinyatakan dengan

Var X atau dinotasikan dengan 2

x atau 2 .

Misalkan X adalah variabel acak dengan distribusi probabilitas f x dan mean . Variansi

dari X adalah

2 22

x

E X x f x , jika X diskrit

(6. 7)

2 22 E X x f x dx , jika X kontinu

(6. 8)

Akar kuadrat positif ddari variansi dinamakan standar deviasi dari 𝑋.

Teorema 3

Variansi variabel acak X adalah

2 2 2E X

(6. 9)

Bukti :

Untuk kasus diskrit dapat dituliskan

22 2 22

x x

x f x x x f x

2 22x x x

x f x xf x f x

Page 3: Ekspektasi Varian Kovarian Korelasi Regresi

karena x

xf x dan 1x

f x untuk setiap distribusi probabilitas diskrit maka

2 2 2 22x

x f x

sehingga diperoleh

2 2 2 2 2

x

x f x E X

(6. 10)

Nilai 𝑥 – 𝜇 disebut penyimpangan suatu pengamatan dari rataannya. Karena penyimpangan

ini dikuadratkan lalu dirata-ratakan, maka 𝜎2 akan lebih kecil untuk kelompok nilai 𝑥 yang dekat

dengan 𝜇 dibandingkan dengan kelompok nilai 𝑥 yang jauh dari 𝜇.

Dengan kata lain, jika nilai-nilai 𝑥 cenderung terkonsentrasi di dekat rataannya, maka

variansinya kecil. Sedangkan jika jauh dari rataan maka variansinya besar.

Variansi untuk peubah acak lain yang bergantung pada 𝑋, yaitu 𝑔(𝑋), diberikan dalam

Teorema 4.

Misalkan 𝑋 adalah peubah acak dengan distribusi peluang 𝑓(𝑥). Variansi dari peubah acak 𝑔(𝑋)

adalah:

𝜎𝑔(𝑋)2 = 𝐸[( 𝑔(𝑋) − 𝜇𝑔(𝑋))]2 = ∑ [( 𝑔(𝑋) − 𝜇𝑔(𝑋) )]

2

𝑥 𝑓(𝑥), 𝑗𝑖𝑘𝑎 𝑋 𝑑𝑖𝑠𝑘𝑟𝑖𝑡

(6. 11)

𝜎𝑔(𝑋)2 = 𝐸[( 𝑔(𝑋) − 𝜇𝑔(𝑋))]2 = ∫ [( 𝑔(𝑋) − 𝜇𝑔(𝑋))]

2∞

−∞ 𝑓(𝑥) 𝑑𝑥, 𝑗𝑖𝑘𝑎 𝑋 𝑘𝑜𝑛𝑡𝑖𝑛𝑢

(6. 12)

6.4 Sifat-Sifat Variansi

Teorema 5.

Jika a dan b adalah konstanta maka

𝜎𝑎𝑋 + 𝑏2 = 𝑎2𝜎𝑋

2 = 𝑎2𝜎2

(6. 13)

Akibat 1: Jika a = 1, maka

𝜎𝑎𝑋 + 𝑏2 = 𝜎𝑋

2 = 𝜎2

(6. 14)

Akibat 2: Jika b = 0, maka

𝜎𝑎𝑋 2 = 𝑎2𝜎𝑋

2 = 𝑎2𝜎2

(6. 15)

Page 4: Ekspektasi Varian Kovarian Korelasi Regresi

Teorema 6.

Jika X dan Y adalah peubah acak dengan distribusi peluang 𝑓(𝑥, 𝑦) maka :

𝜎𝑎𝑋 + 𝑏𝑌2 = 𝑎2𝜎𝑋

2 + 𝑏2𝜎𝑌2 + 2𝑎𝑏𝜎𝑋𝑌

(6. 16)

Akibat 1: Jika X dan Y peubah acak saling bebas, maka:

𝜎𝑎𝑋 + 𝑏𝑌2 = 𝑎2𝜎𝑋

2 + 𝑏2𝜎𝑌2

(6. 17)

Akibat 2: Jika X dan Y variabel random saling bebas, maka:

𝜎𝑎𝑋 − 𝑏𝑌2 = 𝑎2𝜎𝑋

2 + 𝑏2𝜎𝑌2

(6. 18)

6.5 Kovariansi

Salah satu ukuran kekuatan hubungan linear antara dua variabel acak kontinu adalah dengan

menentukan seberapa banyak kedua variabel tersebut co-vary, yaitu bervariasi bersama-sama. Jika

salah satu variabel meningkat (atau menurun) sebagai akibat peningkatan (atau penurunan) variabel

pasangannya, maka dua variabel tersebut dinamakan covary. Namun jika satu variabel tidak berubah

dengan meningkatnya (atau penurunan) variabel lain, maka variabel tersebut tidak co-vary. Statistik

untuk mengukur berapa banyak kedua variabel covary dalam sampel pengamatan adalah kovarian.

Selain mengukur besarnya kekuatan hubungan di antara dua variabel, kovarian juga

menentukan arah hubungan dari kedua variabel tersebut.

Apabila nilainya positif, berati bahwa apabila nilai x berada di atas nilai rata-ratanya, maka

nilai y juga berada di atas nilai rata-rata y, dan sebaliknya (Searah).

Nilai kovarian negatif menunjukkan bahwa apabila nilai x berada di atas nilai rata-ratanya

sedangkan nilai y berada di bawah nilai rata-ratanya (berlawanan arah).

Terakhir, apabila nilai kovarian mendekati nol, menandakan bahwa kedua variabel tersebut

tidak saling berhubungan.

Jika 𝑋 dan 𝑌 dua peubah acak bebas dengan rataan x dan y , maka kovarians peubah acak

𝑋 dan 𝑌 didefinisikan sebagai

𝜎𝑋𝑌 = 𝐸[(𝑋 − 𝜇𝑥)(𝑌 − 𝜇𝑦)]

(6. 19)

Misalkan 𝑋 dan 𝑌 adalah variabel acak dengan distribusi peluang gabungan 𝑓(𝑥, 𝑦). Kovariansi

dari 𝑋 dan 𝑌 adalah

𝜎𝑋𝑌 = 𝐸[(𝑋 − 𝜇𝑥)(𝑌 − 𝜇𝑦)] = ∑ ∑(𝑥 − 𝜇𝑥)(𝑦 − 𝜇𝑦)

𝑦𝑥

𝑓(𝑥, 𝑦), 𝑗𝑖𝑘𝑎 𝑋 𝑑𝑎𝑛 𝑌 𝑑𝑖𝑠𝑘𝑟𝑖𝑡

(6. 20)

Page 5: Ekspektasi Varian Kovarian Korelasi Regresi

Dan

𝜎𝑋𝑌 = 𝐸[(𝑋 − 𝜇𝑥)(𝑌 − 𝜇𝑦)] = ∫ ∫ (𝑥 − 𝜇𝑥)(𝑦 − 𝜇𝑦)∞

−∞

−∞

𝑓(𝑥, 𝑦) 𝑑𝑥𝑑𝑦,

𝑗𝑖𝑘𝑎 𝑋 𝑑𝑎𝑛 𝑌 𝑘𝑜𝑛𝑡𝑖𝑛𝑢

(6. 21)

Interpretasi:

• Kovariansi antara dua peubah acak menunjukkan sifat asosiasi (hubungan) antara keduanya;

• Jika kedua peubah tersebut bergerak kearah yang sama (nilai 𝑥 berada di atas nilai rata-

ratanya, maka nilai 𝑦 juga berada di atas nilai rata-rata y) maka hasil kali (𝑋 − 𝜇𝑥 )(𝑌 − 𝜇𝑦)

cenderung bernilai positif;

• Jika kedua peubah tersebut bergerak ke arah berlawanan (nilai 𝑥 berada di atas nilai rata-

ratanya sedangkan nilai 𝑦 berada di bawah nilai rata-ratanya), maka hasil kali (𝑋 − 𝜇𝑥 )(𝑌 −

𝜇𝑦) cenderung akan bernilai negatif.

• Terakhir, apabila nilai kovarian mendekati nol, menandakan bahwa kedua variabel tersebut

tidak saling berhubungan.

• Tanda kovariansi (+ atau -) menunjukkan apakah hubungan antara kedua peubah acak positif

atau negatif.

Rumus alternatif untuk kovariansi:

𝜎𝑋𝑌 = 𝐸[(𝑋 − 𝜇𝑥)(𝑌 − 𝜇𝑦)] = 𝐸(𝑋𝑌−𝜇𝑋𝜇𝑌)

(6. 22)

6.5.1 Sifat-Sifat Kovariansi

Sifat- sifat kovarian adalah sebagai berikut

Jika X dan Y diskrit:

𝜇𝑥 = < 𝑥 > = ∑ ∑ 𝑥𝑓(𝑥, 𝑦)

𝑦𝑥

(6. 23)

𝜇𝑥𝑦 = < 𝑦 > = ∑∑ 𝑦𝑓(𝑥, 𝑦)

𝑦𝑥

(6. 24)

𝜇𝑥𝑦 = < 𝑥𝑦 > = ∑ ∑ 𝑥𝑦 𝑓(𝑥, 𝑦)

𝑦𝑥

(6. 25)

Page 6: Ekspektasi Varian Kovarian Korelasi Regresi

Jika X dan Y kontinyu

𝜇𝑥 = < 𝑥 > = ∫ ∫ 𝑥𝑓(𝑥, 𝑦)𝑑𝑥𝑑𝑦

−∞

−∞

(6. 26)

𝜇𝑦 = < 𝑦 > = ∫ ∫ 𝑦𝑓(𝑥, 𝑦)𝑑𝑥𝑑𝑦

−∞

−∞

(6. 27)

𝜇𝑥𝑦 = < 𝑥𝑦 > = ∫ ∫ 𝑥𝑦𝑓(𝑥, 𝑦)𝑑𝑥𝑑𝑦

−∞

−∞

(6. 28)

6.6 Persamaan Korelasi

Persaman korelasi antara nilai 𝑥 dan 𝑦 adalah

𝜌(𝑥, 𝑦) =𝜎𝑥𝑦

𝜇𝑥 𝜇𝑦 , −1 ≤ 𝜌(𝑥, 𝑦) ≤ 1

(6. 29)

hasil perhitungan dari persamaan 2.11 disebut sebagai harga/notasi Korelasi. Penjelasan dari

harga/notasi korelasi adalah sebagai berikut :

• HARGA (-)

Ada hubungan tapi terbalik (jika 𝑥 mengecil maka 𝑦 membesar atau sebaliknya)

• HARGA (+)

Ada hubungan tetapi sebanding (𝑥 mengecil maka 𝑦 mengecil atau sebaliknya)

• HARGA (0)

Tidak ada hubungan

Contoh Soal 6.1 :

Berikut ini adalah fungsi distribusi probabilitas bersama antara variabel X dan Y. Carilah kovariansi X

dg Y

f(x,y) x Jumlah

baris

0 1 2 h(y)

y 0 3/28 29/28 3/28 15/28

1 3/14 3/14 0 6/14

2 1/28 0 0 1/28

g(x) 10/28 15/28 3/28 1

Page 7: Ekspektasi Varian Kovarian Korelasi Regresi

Langkah 1:

Pertama hitung mean masing-masing variabel:

Langkah 2:

Kemudian hitung E(XY)=

E(XY)=0+0+0+0+3/14+0+0+0+0 = 3/14

Langkah 3:

6.7 Analisis Regresi

Analisis regresi mempelajari bentuk hubungan antara satu atau lebih peubah bebas (𝑋)

dengan satu peubah tak bebas (𝑌). Dalam penelitian peubah bebas (𝑋) biasanya peubah yang

ditentukan oleh peneliti secara bebas misalnya dosis obat, lama penyimpanan, kadar zat pengawet,

umur ternak dan sebagainya. Disamping itu peubah bebas bisa juga berupa peubah tak bebasnya,

misalnya dalam pengukuran panjang badan dan berat badan sapi, karena panjang badan lebih mudah

diukur maka panjang badan dimasukkan kedalam peubah bebas (𝑋), sedangkan berat badan

dimasukkan peubah tak bebas (𝑌). sedangkan peubah tak bebas (𝑌) dalam penelitian berupa respon

yang diukur akibat perlakuan/peubah bebas (𝑋). Misalnya jumlah sel darah merah akibat pengobatan

dengan dosis tertentu, jumlah mikroba daging setelah disimpan beberapa hari, berat ayam pada umur

tertentu dan sebagainya.

Bentuk hubungan antara peubah bebas (𝑋) dengan peubah tak bebas (𝑌) bisa dalam bentuk

polinom derajat satu (linear) polinom derajat dua (kuadratik). Polinom derajat tiga (Kubik) dan

seterusnya. Disamping itu bisa juga dalam bentuk lain misalnya eksponensial, logaritma, sigmoid dan

sebagainya. Bentuk-bentuk ini dalam analisis regresi-korelasi biasanya ditransformasi supaya menjadi

bentuk polinom.

Untuk menjelaskan bagaimana hubungan antara dua variabel, perhatikan data yang

tercantum dalam tabel berikut :

HARI

KE

PENGUNJUNG

(Xi)

BELANJA

(Yi)

HARI

KE

PENGUNJUNG

(Xi)

BELANJA

(Yi)

1 35 32 16 40 38

4/328/3*228/15*114/5*0)(][ x

X xxgXE

2/128/1*27/3*128/15*0)(][ x

Y yyhYE

0*)2*2()0)(1*2()28/1)(0*2()0)(2*1()14/3)(1*1()14/3(*)0*1(

)28/3)(2*0()28/9)(1*0()28/3)(0*0(),(][xy

yxxyfXYE

56

9)

2

1)(

4

3(

14

3][ YXXY XYE

Page 8: Ekspektasi Varian Kovarian Korelasi Regresi

2

3

4

5

6

7

8

9

10

11

12

13

14

15

39

34

40

31

43

40

30

34

39

33

32

36

40

43

36

31

38

29

42

33

29

29

36

31

31

33

37

36

17

18

19

20

21

22

23

24

25

26

27

28

29

30

41

32

34

30

35

36

37

39

41

33

34

36

38

37

37

30

30

28

35

29

34

35

36

32

32

34

37

34

Tabel 6. 1 Banyak pengunjung dan belanja di suatu toko swalayan selama 30 hari

Tabel 2.1 merupakan gambaran banyak pengunjung (dinyatakan dengan 𝑋𝑖) dan yang

berbelanja (dinyatakan dengan 𝑌𝑖) yang telah dicatat oleh seseorang pengusaha di tokonya.

Kebiasaan yang digunakan dalam penentuan simbol-simbol yang lazim, ialah 𝑋𝑖 untuk hal yang

diperkirakan lebih tepat dapat digolongkan ke dalam variabel yang sifatnya bebas, sedangkan 𝑌𝑖untuk

variabel yang diperkirakan akan bergantung pada 𝑋𝑖 .

Bentuk dari model persamaan regresi untuk populasi secara umum adalah sebgai berikut

mkXXXfY ,...,,/,...,, 2121

(6. 30)

Dimana m ,...,, 21 parameter-parameter yang terdapat dalam regresi itu. Regresi yang

sederhana untuk populasi dengan sebuah variabel bebas yang dikenal dengan regresi linier dengan

model:

XY 21 , 1 dan 2 parameternya.

(6. 31)

Untuk satu variabel bebas (regresi linier):

Page 9: Ekspektasi Varian Kovarian Korelasi Regresi

1 dan

2 dari sebuah sampel acak dapat ditaksir oleh a dan b maka persamaan regresinya

adalah

bXaY

(6. 32)

Untuk fonemena dua variabel bebas ( regresi non linier):

Parameter-parameternya 1 ,

2 dan 3 dari sebuah sampel acak dapat ditaksir oleh a, b dan

c maka persamaan regresinya berupa parabola yaitu

cbXaXY 2

(6. 33)

6.8 Regresi Linear

Scatter diagram (diagram pencar) adalah suatu diagram yang digunakan untuk melihat secara

visual apakah ada hubungan antara 2 variabel.

Gambar 6. 1 Contoh Diagram Pencar

Sumber: http://www.spcforexcel.com/files/images/scatterpic.gif

Dengan menggunakan diagram pencar dapat dilihat apakah ada sesuatu hubungan yang

berarti diantara titik-titik itu pada atau sekitar garis lurus? Jika demikian halnya, cukup alasan bagi

kita untuk menduga bahwa antara variabel-variabel itu ada hubungan linear. Dalam hal lainnya, antara

variabel-variabel itu diduga terdapat hubungan non linear.

Setelah diketahui bentuk hubungan antara variabel itu, tugas selanjutnya ialah menentukan

hubungan tersebut dirumuskan dalam suatu persamaan matematis. Kemudian disusun dalam suatu

persamaan garis yang merepresentasikan persamaan matematisnya. Garis ini dikenal dengan nama

garis regresi. Jika hubungan 𝑌 = 𝑓(𝑋) itu linear, maka garis yang didapat adalah garis regresi linear.

Dalam hal lainnya didapat regresi nonlinear.

Page 10: Ekspektasi Varian Kovarian Korelasi Regresi

Oleh karena regresi linear merupakan bentuk regresi yang paling mudah ditelaah, kecuali itu

juga karena banyak regresi nonlinear yang dapat diselesaikan dengan bantuan regresi linear, maka di

sini terutama hanyalah regresi tersebut yang akan dibicarakan.

Bagaimanakah menentukan persamaan regresi yang linear ini? Yang paling mudah ialah

dengan jalan kira-kira menurut penglihatan kita. Pada kumpulan titik-titik itu ditarik sebuah garis lurus

yang akan paling dekat titik-titik itu berkerumun sekitar garis yang ditarik tadi.Sesudah itu ditentukan

bagaimana persamaannya.

Meskipun cara tersebut sangat mudah dilakukan namun untuk penelitian jarang dilakukan

oleh karena kecuali terlalu kasar hasilnya, juga terlalu subyektif dan ini sedapat mungkin harus

dihindarkan. Karenanya akan ditinjau cara yang dianggap cukup baik dan sering digunakan. Cara yang

dimaksud adalah METODA KUADRAT TERKECIL. Sebelum cara ini dibicarakan, terlebih dahulu akan

ditinjau seperlunya macam-macam regresi linear yang mungkin, sehubungan dengan variabel bebas.

Di atas dikatakan, bahwa jika variabel 𝑿 yang diketahui terlebih dahulu dan kemudian 𝒀

ditentukan berdasarkan 𝑿 ini, maka ditentukan hubungan 𝒀 = 𝒇(𝑿). Rumusan hubungan ini lebih

dikenal dengan nama regresi 𝒀 atas 𝑿.

Jika regresi 𝑌 atas 𝑋 ini linear, maka persamaannnya dapat dituliskan dalam bentuk linear :

𝑌 = 𝛼 + 𝛽𝑋 + 𝜀

(6. 34)

dengan

Y = variabel tak bebas

X = variabel bebas

= koefisien intercept

= koefisien slope/ gradien

= error

Model tersebut ditaksir dengan :

�̂� = 𝑎 + 𝑏𝑋

(6. 35)

Dengan �̂� berarti taksiran nilai 𝑋 untuk harga Y yang diketahui. Tiap pengamatan akan memenuhi :

(6. 36)

Sehingga error yang terjadi :

(6. 37)

Untuk menentukan koefisien-koefisien 𝑎 dan 𝑏 ini akan digunakan Metoda Kuadrat Terkecil.

Ternyata bahwa untuk regresi linear, harga-harga 𝑎 dan 𝑏 dapat dihitung berdasarkan sekumpulan

data sebanyak 𝑛 buah dengan menggunakan sistem persamaan :

ii bXaY ˆ

)(ˆiiiii bXaYYY

Page 11: Ekspektasi Varian Kovarian Korelasi Regresi

1 1

2

1 1 1i

n n

i i

i i

n n n

i i i

i i i

Y an b X

X Y a X b X

(6. 38)

Pasangan persamaan 6.38 disebut persamaan-persamaan normal untuk bentuk regresi

Setelah diselesaikan, akan didapat harga-harga 𝑎 dan 𝑏 yang dicari dengan persamaan

2

1 1 1 1

2

2

1 1

1 1 1

2

2

1 1

i

i

n n n n

i i i i i

i i i i

n n

i

i i

n n n

i i i i

i i i

n n

i

i i

Y X X X Y

a

n X X

n X Y X Y

b

n X X

(6. 39)

6.9 Regresi Non Linear

Setelah dipelajari seperlunya mengenai bentuk hubungan linear antara dua variabel X dan Y

sekarang akan diperhatikan bentuk hubungan nonlinear antar dua variabel. Tidak akan dibicarakan

secara luas dan mendalam mengenai regresi nonlinear ini, tetapi hanya merupakan suatu tinjauan

singkat saja, tinjauan yang pada umumnya dapat ditelaah berdasarkan teori regresi linear.

Meskipun terdapat banyak sekali bentuk regresi non linear yang biasa digunakan tetapi di sini

hanyalah akan ditinjau beberapa saja yang penting dan termudah. Untuk regresi nonlinear Y atas X

yang akan ditinjau di sini, antara lain berbentuk lengkungan :

a. Parabola kuadratis dengan persamaan 2Y a bX cX

(6. 40)

b. Parabola kubis dengan persamaan 2 3Y a bX cX dX

(6. 41)

c. Logaritmis dengan persamaan : bY aX

(6. 42)

d. Hiperbola dengan persamaan :

Page 12: Ekspektasi Varian Kovarian Korelasi Regresi

1Y

a bX

(6. 43)

6.10 Regresi Linear Berganda

Ada banyak kenyataan bahwa pengamatan akan terdiri atas lebih dari dua variabel. Sehingga

yang harus digunakan adalah regresi dengan variabel bebas lebih dari satu.

Contoh :

1. Harga beras tidak saja hanya ditentukan oleh adanya persediaan, tetapi juga oleh harga

bensin, upah buruh dan sebagainya.

2. Produksi telur ayam tidak saja bergantung pada banyaknya ayam petelur yang ada saja, tetapi

juga dari banyak makanan yang diberikan, umur ayam dan barangkali masih ada faktor

lainnya.

Apabila ada satu variabel terikat Y dan k variabel bebas 1 2, ,..., kX X X sehingga terdapat

hubungan semacam garis regresi Y atas 1 2, ,..., kX X X . Dalam bagian ini akan dijelaskan secara

singkat bagaimana garis regresi yang dimaksud dapat ditentukan dan yang akan ditinjau di sini

hanyalah garis regresi Y atas 1 2, ,..., kX X X yang paling sederhana ialah yang dikenal dengan nama

regresi linear berganda. Persamaan umum untuk regresi linear berganda ini adalah :

0 1 1 ... k kY a a X a X

(6. 44)

Dimana 0 1, ,..., ka a a harus ditentukan dari data hasil pengamatan. Mudah dilihat bahwa

regresi di atas ini merupakan perluasan dari regresi linear sederhana.

Pertanyaan yang timbul adalah bagaimana koefisien-koefisien 0 1, ,..., ka a a ditentukan ?

Secara sama dengan regresi linear sederhana, maka dipergunakan Metode Kuadrat Terkecil. Oleh

karena ada k+1 parameter yang harus dicari maka diperlukan k+1 persamaan. Dapat dibayangkan

bahwa hal itu memerlukan metode penyelesaian yang lebih baik dan karenanya memerlukan

matematika yang lebih tinggi lebih-lebih untuk variabel yang cukup banyak.

6.11 Analisis Korelasi

Hubungan antara dua variabel 𝑋 dan 𝑌 yang diperoleh dinyatakan dalam bentuk persamaan

matematis yang dalam statistika dikenal dengan nama garis regresi. Jika 𝑋 merupakan variabel bebas

dan 𝑌 variabel tak bebas, regresi 𝑌 atas 𝑋 dapat digunakan untuk meramalkan nilai 𝑌 apabila nilai 𝑋

diketahui.

Dalam banyak soal, jika nilai-nilai pengamatan terdiri atas lebih dari sebuah variabel, bukan

saja regresinya yang perlu dihitung, tetapi juga kekuatan hubungan antara variabel -variabel itu.

Ukuran yang digunakan untuk itu adalah koefisien korelasi. Korelasi dapat bersifat linier atau tidak

Page 13: Ekspektasi Varian Kovarian Korelasi Regresi

linier. Korelasi dikatakan linier jika pada scatter diagram (diagram pencar) semua titik terlihat

mengelompok disekitar garis lurus.

Untuk keperluan analisis tentang korelasi ini, seperti biasa akan dibedakan antara statistik

(ialah koefisien korelasi untuk data dalam sampel) dan parameter (untuk menyatakan koefisien

korelasi populasi). Koefisien korelasi untuk sampel, jadi merupakan statistik, akan dinyatakan dengan

𝒓 sedangkan parameternya dengan 𝜌 (baca : rho).

Dalam bagian berikut ini akan diuraikan bagaimana 𝒓 dihitung dan selanjutnya akan diberikan

penjelasan mengenai pengujian derajat asosiasi.

6.11.1 Koefisien Korelasi

Karena ternyata korelasi dan regresi berhubungan erat, maka untuk menentukan ukuran

asosiasi atau koefisien korelasi, perlu terpenuhi syarat-syarat :

1. Koefisien korelasi harus besar apabila derajat asosiasi tinggi dan harus kecil apabila derajat

asosiasi rendah.

2. Koefisien korelasi harus bebas daripada satuan yang digunakan untuk me ngukur variabel.

Untuk mencapai kedua syarat di atas, maka untuk menentukan koefisien korelasi r biasa

digunakan statistik :

1

1

n

i i

i

x y

X X Y Y

rn S S

(6. 45)

Inilah rumus koefisien korelasi yang pertama yang disebut Koefisien Korelasi Person atau

Product Moment.

Koefisien korelasi 𝑟 menunjukkan apakah cukup beralasan bagi kita untuk menyatakan ada

atau tidak adanya hubungan linear antara variabel-variabel 𝑋 dan 𝑌. Rumus lain yang juga sering

dipergunakan adalah :

1 1 1

2 2

2

1 1 1 1

n n n

i i i i

i i i

n n n n

i i i i

i i i i

n X Y X Y

r

n X X n Y Y

(6. 46)

Dengan menggunakan perhitungan matematika, ternyata dapat dibuktikan bahwa batas-

batas koefisien korelasi itu berada dalam daerah / interval :

-1 r 1

Tanda positif menyatakan bahwa antara variabel-variabel itu terdapat korelasi positif atau

korelasi langsung yang berarti nilai variabel 𝑋 yang kecil berpasangan dengan nilai variabel 𝑌 yang

kecil serta nilai variabel 𝑋 yang besar berpasangan dengan nilai variabel 𝑌 yang besar pula.

Page 14: Ekspektasi Varian Kovarian Korelasi Regresi

Korelasi positif menunjukkan letak titik-titik dalam diagram pencar berada sekitar garis lurus

yang koefisien arahnya positif. Makin dekat letak titik-titik itu pada garis lurus, makin kuatlah korelasi

positif itu dan harganya makin dekat kepada satu.

Jika variabel 𝑋 yang besar berpasangan dengan 𝑌 yang kecil dan jika 𝑋 kecil berpasangan

dengan 𝑌 yang besar, akan diperoleh Korelasi negatif atau korelasi invers.

Dilihat dari diagram pencarnya, letak titik-titik akan berada sekitar sebuah garis lurus yang

koefisien arahnya negatif. Makin dekat letak titik-titik itu pada garis yang dimaksud, makin dekat pula

nilai 𝑟 kepada -1. Dan akhirnya jika titik-titik itu terletak pada garis lurus yang koefisien arahnya

negatif didapat harga 𝑟 = −1.

Dalam prakteknya jarang sekali didapatkan diagram pencar yang letak titik-titiknya pada

sebuah garis lurus seperti dalam gambar 2.1 sangat jarang. Yang sering didapati adalah bentuk yang

menyebabkan nilai koefisien korelasi tidak sama dengan 1 atau -1. Makin terpencar letak titik-titik

itu dari sebuah garis lurus, makin dekatlah 𝑟 kepada nol.

Setelah dikenal apa arti koefisien korelasi, masih ada ukuran lain yang sebenarnya lebih

mudah untuk ditafsirkan dalam penggunaannya. Ukuran tersebut ialah yang dinamakan koefisien

determinasi yang tiada lain daripada kuadrat koefisien korelasi. Jadi :

Koefisien Determinasi = r2

(6. 47)

Karena sudah diketahui bahwa koefisien korelasi berada −1 𝑟 + 1, maka tentulah

koefisien determinasi mulai dari nol sampai dengan 1, atau :

0 r2 1

Koefisien determinasi biasanya dinyatakan dengan persen. Sedangkan penafsirannya adalah

jika r = 0,94 sehingga r2 = 0,8836 atau 88,36% maka ditafsirkan sebagai 88,36% variasi suatu variabel

yang disebabkan oleh variabel lainnya.

Koefisien determinasi banyak digunakan dalam penjelasan tambahan untuk hasil perhitungan

koefisien regresi.

6.11.2 Menghitung r Untuk Data Berkelompok

Rumus-rumus 6.45 dan 6.46 adalah rumus-rumus untuk menentukan 𝑟 apabila datanya masih

belum disusun dalam daftar distribusi frekuensi. Rumus-rumus 6.45 dan 6.46 pula cukup

menyenangkan untuk digunakan apabila datanya tidak terlalu banyak. Jika data yang sedang dicari

korelasinya itu banyak sekali, dengan menggunakan rumus-rumus tersebut akan memakan waktu

yang lama dari perhitungannya. Oleh karena itu perlu ada usaha untuk mempersingkatnya. Jalan yang

lazim ditempuh ialah terlebih dahulu menyusun data ke dalam daftar distribusi frekuensi. Oleh karena

kita sedang berhadapan dengan penelitian yang terdiri atas dua variabel, maka kitapun akan

memperoleh dua distribusi frekuensi. Kedua distribusi frekuensi ini harus disajikan dalam daftar yang

berklasifikasi dua, sedemikian sehingga dampaknya banyak seperti daftar kontingensi. Banyak baris

sesuai dengan banyak kelas interval distribusi frekuensi variabel yang satu, sedangkan banyak kolom

sesuai dengan banyak kelas interval dari distribusi frekuensi variabel kedua. Untuk variabel yang satu,

yang terdapat dalam baris, kelas-kelas intervalnya mulai dari atas ke bawah disusun seperti biasa,

Page 15: Ekspektasi Varian Kovarian Korelasi Regresi

yakni dari data yang kecil hingga yang paling besar. Variabel yang terdapat dalam kolom, kelas-kelas

intervalnya dari kiri ke kanan yang dimulai dari data yang kecil hingga yang besar.

Frekuensi data dalam daftar ini akan didapati dalam tiap-tiap sel. Jadi frekuensi dalam setiap

sel merupakan banyak data yang ada dalam kelas interval variabel yang satu dan juga yang ada dalam

kelas interval variabel yang lain.

Untuk itu dipergunakan rumus berikut :

2 2

2 2 -

x y

x x

n fuv f u f v

r

n f u f u n fuv fuv

(6. 48)

dimana :

u = koding untuk variabel X

v = koding untuk variabel Y

fx = frekuensi kelas interval dari variabel X

fy = frekuensi kelas interval dari variabel Y

f = frekuensi dalam tiap sel

n = banyak data.

6.11.3 Korelasi Rank

Ada kalanya ingin diketahui korelasi antara dua variabel tidak berdasarkan pada pasangan

data dimana nilai sebenarnya diketahui. Umpamanya saja, kita telah melakukan penelitian mengenai

tingkatan menyenangi merk sepatu olahraga bagi prajurit A dan prajurit B anggota TNI AL. Hasilnya

dinyatakan dalam tabel di bawah ini. Untuk sepatu yang paling disukai, diberi nilai 1 dan yang paling

tidak disukai diberi nilai 10. Urut-urutan nilai tersebut dinamakan RANK. Berdasarkan rank tersebut,

dapatlah ditentukan hubungan / korelasi antara keddua variabel. Ukuran yang diperoleh biasa

dinamakan koefisien korelasi rank atau biasa juga dikenal dengan koefisien korelasi spearman dan

disimbulkan dengan 𝑟′ (baca : er -aksen) untuk membedakan dengan koefisien korelasi yang sudah

dikenal.

Rumus untuk menghitung koefisien korelasi spearman adalah:

2

1

2

6

11

n

i

i

d

rn n

(6. 49)

dengan di = selisih tiap pasang rank

n = banyaknya pasangan data

Page 16: Ekspektasi Varian Kovarian Korelasi Regresi

6.11.4 Korelasi Berganda

Korelasi berganda merupakan korelasi dari beberapa variabel bebas secara serentak dengan

variabel terikat

Misalkan ada k variabel bebas, 1 2, ,..., kX X X dan satu variabel terikat Y dalam suatu persamaan

regresi linear 0 1 1 ... k kY a a X a X maka besarnya korelasi bergandanya adalah :

1

1 1 2 2

, ,..., 2

...k

k k

y x x

a x y a x y a x yr

y

(6. 50)

dengan

1

1 1

2

2 2

k

k k

X Yx y X Y

n

X Yx y X Y

n

Yy Y

n

(6. 51)

6.11.5 Korelasi Parsial

Korelasi parsial adalah korelasi antara sebuah variabel tak bebas dengan sebuah variabel

bebas tertentu dengan variabel-variabel bebas lain dianggap tetap/konstan. Koefisien korelasi parsial

dinyatakan dengan perumusan

Untuk dua variabel bebas :

Korelasi parsial Y dengan X1 dengan X2 dianggap konstan adalah :

1 2 1 2

1 2

1 22

.2 21 1

YX

YX YX X X

YX X

X X

r r rr

r r

(6. 52)

Korelasi parsial Y dengan X2 dengan X1 dianggap konstan adalah :

2 1 1 2

2 1

1 1 2

.2 21 1

YX

YX YX X X

YX X

X X

r r rr

r r

(6. 53)

Page 17: Ekspektasi Varian Kovarian Korelasi Regresi

Contoh soal 6.2 :

Diketahui suatu penelitian terhadap hubungan antara nilai biaya periklanan dengan tingkat penjualan

dari sebuah koperasi adalah sebagai berikut : (dalam ribuan rupiah)

No Biaya periklanan Tingkat Penjualan

1 50 40

2 51 46

3 52 44

4 53 55

5 54 49

a. Tentukan persamaan regresinya ?

b. Berapa besarnya koefisien korelasi dan koefisien determinasinya ?

c. Berapa besarnya kesalahan standar estimasinya ?

d. Bagaimana hubungan antara variabel biaya periklanan dengan tingkat penjualan? (r)

e. Berapa proporsi keragaman tingkat penjualan yang dapat di jelaskan oleh biaya periklanan

dalam hubungan linier tersebut? (r2)

Jawab:

a. Menentukan persamaan regresinya

Langkah 1 :

Menentukan variable X dan variable Y. Dalam soal ini variable biaya periklanan merupakan

variable (X) dan tingkat penjualan merupakan variable (Y).

Langkah 2:

Membuat table regresi sederhana

No X Y XY X2 Y2

1 50 40 2000 2500 1600

2 51 46 2346 2601 2116

3 52 44 2288 2704 1936

4 53 55 2915 2809 3025

5 54 49 2646 2916 2401

Total 260 234 12195 13530 11078

Page 18: Ekspektasi Varian Kovarian Korelasi Regresi

Langkah 3 :

Menentukan koefisien a dan koefisien b

Langkah 4:

Menentukan persamaan regresi linier sederhana

Y = a + b (X)

Maka persamaan regresi dalam soal ini adalah :

Y = -93,6 + 2,7 (X)

b. Menentukan koefisien korelasi dan koefisien determinasinya.

Koefisien Korelasi

6.93

5

))260)(7.2(234(

n

xb-y a

xb y a

7.2)260()13530)(5(

)234)(260()12195)(5(

x xn

x -xy .n b

222

y

76.0

))234()11078)(5)(()260()13530)(5((

)234)(260()12195)(5(

})(}{)({

22

1 1 1 1

2222

1 1 1

n

i

n

i

n

i

n

i

iiii

n

i

n

i

n

i

iiii

xy

yynxxn

yxyxn

r