analisis regresi

16
ANALISIS REGRESI A. Prinsip Statistik Sebagai contoh data pengukuran debit rata-rata tahunan sungai Serang di Stasiun Bendungan, Kab. Kulon Progo selama 15 tahun : Tabel 1. Debit Sungai Tahun y i (debit) y i - ȳ (y i – ȳ) 2 (m 3 /d) 1971 8,52 1,486 2,208 1972 3,33 -3,704 13,720 1973 7,85 0,816 0,666 1974 7,65 0,616 0,379 1975 10,91 3,876 15,023 1976 4,17 -2,864 8,202 1977 3,40 -3,634 13,206 1978 8,00 0,966 0,933 1979 13,4 6,366 40,526 1980 5,40 -1,634 2,670 1981 8,87 1,836 3,371 1982 4,73 -2,304 5,308 1983 7,40 0,366 0,134 1984 6,88 -0,154 0,024 1985 5,00 -2,034 4,137 y i = 105,51 (y i – ȳ) 2 = 110,507

Upload: hermen-freitas

Post on 28-Jun-2015

313 views

Category:

Documents


9 download

TRANSCRIPT

y i

n

ANALISIS REGRESI

A. Prinsip Statistik

Sebagai contoh data pengukuran debit rata-rata tahunan sungai Serang di

Stasiun Bendungan, Kab. Kulon Progo selama 15 tahun :

Tabel 1. Debit Sungai

Tahunyi (debit)

yi - ȳ (yi – ȳ)2

(m3/d)

1971 8,52 1,486 2,208

1972 3,33 -3,704 13,720

1973 7,85 0,816 0,666

1974 7,65 0,616 0,379

1975 10,91 3,876 15,023

1976 4,17 -2,864 8,202

1977 3,40 -3,634 13,206

1978 8,00 0,966 0,933

1979 13,4 6,366 40,526

1980 5,40 -1,634 2,670

1981 8,87 1,836 3,371

1982 4,73 -2,304 5,308

1983 7,40 0,366 0,134

1984 6,88 -0,154 0,024

1985 5,00 -2,034 4,137

∑yi = 105,51 ∑ (yi – ȳ)2 = 110,507

Nilai rata-rata :

ȳ

y i

n

105.51

15

D2

n 1

110.5

15 1 2.809

i = 1 sampai n

ȳ

Deviasi Standar :

Untuk mengukur penyebaran data terhadap nilai rata-rata.

σ = ; D = ∑ (yi – ȳ)2

Makin besar penyebaran data maka σ makin besar.

Varians :

Merupakan kuardrat dari deviasi standar.

σ2 = ∑ (yi – y)2 = 110,507 = 7,893

n-1 15 – 1

B. Metode Kuadrat Terkecil

Gambar 1. Kurva mewakili titik-titik data

Teknik tersebut dilakukan dengan prosedur berikut :

1. Gambar titik-titik data pada sistem koordinat x-y. akan terlihat ‘trend’

kumpulan data, kemudian dapat ditentukan bentuk kurva lurus/lengkung.

7.034

0

0

0

2. Pilih suatu fungsi g(x) yang mewakili f(x) :

g(x) = a0 + a1x + a2x2 + …… + arxr

a0, a1, a2, ……., ar : parameter

3. Tentukan parameter a0, a1, a2, ……., ar sedemikian rupa sehingga g (xi ; a0, a1,

…., ar) melalui sedekat mungkin titik-titik data.

4. Koordinat titik-titik data : M (xi, yi) ; i=1, 2, …., n

Fungsi yang dipilih : g (xi ; a0, a1, …., ar)

Selisih ordinat :

Ei = MiGi = yi – g (xi ; a0, a1, …., ar)

= yi – (a0 + a1xi + a2xi2 + …… + arxi

r)

5. Pilih fungsi g(x) yang mempunyai kesalahan Ei terkecil. Dalam metode ini

jumlah kuadrat dari kesalahan adalah terkecil.

D2 ∑ Ei2 ∑ (yi – g(xi))2

6. Dicari parameter a0, a1, a2, ……., ar sedemikian sehingga D2 minimum. D2

minimum jika turunan pertama terhadap a0, a1, a2, ……., ar adalah nol :

∂D2

∂a0

∂D2

∂a1

.

.

∂D2

∂ar

7. Dari persamaan tahap 6 akan diperoleh nilai-nilai parameter a0, a1, a2, …….,

ar. Dengan demikian persamaan kurva terbaik yang mewakili titik-titik data

telah diperoleh.

x

n

152

10 15.2

y

n

186

10 18.6

C. Metode Kuadrat Terkecil Untuk Kurva Linier

Bentuk paling sederhana dari regresi kuadrat terkecil adalah apabila kurva yang

mewakili titik-titik data merupakan garis lurus, sehingga persamaannya :

g(x) = a + bx

Dalam hal ini, a0 = a dan a1 = b.

Contoh :

Tentukan persamaan garis yang mewakili data berikut

x 4 6 8 10 14 16 20 22 24 28

y 30 28 22 28 14 22 16 8 20 8

Penyelesaian :

Tabel 2. Hitungan regresi linier

No xi yi xi yi Xi2

1 4 30 120 16

2 6 18 108 36

3 8 22 176 64

4 10 28 280 100

5 14 14 196 196

6 16 22 352 256

7 20 16 320 400

8 22 8 176 484

9 24 20 480 576

10 28 8 224 784

∑ 152 186 2432 2912

Nilai rata-rata x dan y :

xF

ȳ

nx iyi x i y i

nx i2

x i 2

10 2432 152 186

10 2912 1522

3952

6016

Persamaan garis yang mewakili titik-titik data adalah :

Y = a + bx

Dengan :

b

a = ȳ - b xF = 18.6 + 0.6569 x 15.2 = 28.5849

Jadi persamaan garis adalah :

y = 28,5849 – 0,6569 x

Penggambaran titik-titik data pada sistem koordinat x-y diberikan dalam

Gambar 2, yang dapat diwakili oleh garis lurus.

Gambar 2. Sebaran titik-titik data pada sistem koordinat

D. Linierisasi Kurva Tidak Linier

Sering dijumpai bahwa sebaran titik-titik pada sistem koordinat mempunyai

kecenderungan ‘trend’ yang berupa kurva lengkung, sehingga persamaan pada

0.6569

poin C tidak dapat digunakan. Agar persamaan regresi linier dapat digunakan

untuk mempresentasikan kurva lengkung, maka perlu dilakukan transformasi

koordinat sedemikian sehingga sebaran titik data bisa dipresentasikan dalam

kurva linier.

Gambar 3. Titik data didekati dengan garis lurus dan lengkung

Contoh :

Tentukan persamaan kurva lengkung yang mewakili data berikut :

x 1 2 3 4 5

y 0,5 1,7 3,4 5,7 8,4

1. Transformasi log

Misalkan persamaan kurva yang dicari :

y = axb

transformasi dengan fungsi log :

log y = log axb

log y = log a + b log x

Dilakukan transformasi berikut :

p = log y B = b

A = log a q = log x

Sehingga persamaan di atas dapat ditulis dalam bentuk :

logx i

n

2.0971

5 0.4158

logy i

n

2.1411

5 0.42822

nq ipi q i p i

nq i2

q i 2

5 1.4240( ) 2.0791( ) 2.1411( )

5 1.1692( ) 2.07912

1.7572

p = A + B q

Tabel 3. Hitungan regresi linier dengan transformasi log

No xi yi qi = log xi pi = log yi qipi qi2

1

2

3

4

5

1

2

3

4

5

0,5

1,7

3,4

5,7

8,4

0

0.3010

0.4771

0,6020

0,6990

-0,3010

0,2304

0,5315

0,7559

0,9243

0

0,0693

0,2536

0,4550

0,6461

0

0,0906

0,2276

0,3624

0,4886

∑ 15 19,7 2,0791 2,1411 1,4240 1,1692

Dari tabel didapat parameter berikut :

qF

pF

Koefisien B :

B

Koefisien A :

A = p – B q = 0,42822 – 1,7572 x 0,4158 = -0,3024

Persamaan transformasi :

p = -0,3024 + 1,7572 q

Karena : A = log a -0,3024 = log a

a = 0,4984

B = b b = 1,7572

Persamaan yang dicari : y = 0,4984 x1,7572

q i

n

15

5 3

p i

n

4.93

5 0.986

nq ipi q i p i

nq i2

q i 2

5 21.6425( ) 15 4.93( )

5 55( ) 152

34.2625

50 0.68525

2. Transformasi ln

Misalkan persamaan kurva : y = aebx

Transformasi dengan fungsi ln :

ln y = ln aebx

= ln a + ln aebx

ln y = ln a + b x

Dilakukan transformasi berikut :

p = ln y A = ln a

q = x B = b

Sehingga persamaan di atas dapat ditulis dalam bentuk :

p =A + B q

Tabel 4. Hitungan regresi linier dengan transformasi ln

No xi = qi yi qi2 = xi

2 pi = ln yi qipi

1

2

3

4

5

1

2

3

4

5

0,5

1,7

3,4

5,7

8,4

1

4

9

16

25

-0,6931

0,5306

1,2238

1,7405

2,1282

-0,6931

1,0612

3,6714

6,962

10,641

∑ 15 19,7 55 4,93 21,6425

Dari tabel 4 didapat beberapa parameter berikut :

qF

pF

Koefisien B :

B

Dt2

D2

Dt2

Dt2

D2

Dt2

40.132 0.00238

40.132 0.99997

Koefisien A :

A = p – B q = 0,986 – 0,68525 x 3,0 = -1, 06975

Persamaan transformasi : p = -1, 06975 + 0,68525 q

A = ln a -1, 06975 = ln a a = 0,3431

B = b b = 0,68525

Persamaan yang dicari : y = 0,3431 e0,68525 x

Untuk memilih salah satu dari kedua hasil yang terbaik, dihitung nilai koefisien korelasi :

r

Dt = ∑ (yi – ȳ)2

D = ∑ (yi – a0 - a1 x)2

Tabel 5. Hitungan koefisien korelasi

No xi yi

Transformasi log Transformasi ln

g(xi) D2 Dt2 g(xi) D2 Dt

2

1

2

3

4

5

1

2

3

4

5

0,5

1,7

3,4

5,7

8,4

0,4984

1,6848

3,4354

5,6953

8,4296

0,000003

0,000231

0,00125

0,000022

0,000876

11,8336

5,0176

0,2916

3,0976

19,8916

0,8635

1,3563

2,6912

5,3401

10,5963

0,03367

0,11813

0,50240

0,12953

4,82373

11,8336

5,0176

0,2916

3,0976

19,8916

∑ 0,00238 40, 132 ∑ 5,00746 40, 132

Nilai r untuk transformasi log :

r

Dt2

D2

Dt2

40.132 5.60746

40.132 0.92751

n

x i

x i2

x i

x i2

x i3

x i2

x i3

x i4

a0

a1

a2

y i

x iyi

x i2

yi

Nilai r untuk transformasi ln :

r

Koefisien korelasi r transformasi log lebih besar dari pada transformasi ln,

sehingga transformasi log lebih baik.

E. Regresi Polinomial

Persamaan polynomial order r :

y = a0 + a1x + a2x2 + …… + arxr

Jumlah kuadrat kesalahan :

D2 = ∑ (yi – (a0 + a1 xi + a2xi2 + …… + arxir))2

Contoh :

Cari persamaan kurva polynomial order dua dari data :

xi 0 1 2 3 4 5

yi 2,1 7,7 13,6 27,2 40,9 61,1

Persamaan polynomial order 2 :

g(x) = a0 + a1x + a2x2

Ei = yi + g(x)

Ei2 = ∑ (yi - a0 - a1x - a2x2)2

D2 = ∑ Ei2

Dideferensial D2 terhadap tiap koefisien polynomial kemudian disamadengankan nol menghasilkan bentuk :

Tabel 6. Hitungan regresi polinomial order dua

No xi yi xi2 xi

3 xi4 xiyi Xi

2yi

1

2

3

4

5

6

0

1

2

3

4

5

2,1

7,7

13,6

27,2

40,9

61,1

0

1

4

9

16

25

0

1

8

27

64

125

0

1

16

81

256

625

0

7,7

27,2

81,6

163,6

305,5

0

7,7

54,4

244,8

654,4

1527,5

152,6 55 225 979 585,6 2488,8

Diperoleh sistem persamaan :

6a0 + 15a1 + 55a2 = 152,6

15a0 + 55a1 + 225a2 = 585,6

55a0 + 225a1 + 979a2 = 2488,8

Penyelesaian persamaan :

a2 = 1,860714

a1 = 2,359286

a0 = 2,478571

Persamaan kurva :

y = 2,478571 + 2,359286 x + 1,860714 x2

F. Regresi Linier Dengan Banyak Variabel

Untuk y sebagai fungsi linier terhadap x1 dan x2 :

y = a0 + a1x1 + a2x2

Jumlah kuadrat kesalahan :

D2 = ∑ (yi – (a0 + a1 x1,i + a2x2,i))2

2 y( i a0 a1 x1 i a2 x2 i 0

0

0

2 x 1 i yi a0 a1 x1 i a2 x2 i

2 x 2 i yi a0 a1 x1 i a2 x2 i

n

x 1 i

x 2 i

x 1 i

x 1 i 2

x 1 i x2 i

x 2 i

x 1 i x2 i

x 2 i 2

a0

a1

a2

y i

x 1 i yi

x 2 i yi

Variable yang diamati merupakan fungsi dari 2 variabel. Kuadrat kesalahan :

∂D2

∂a0

∂D2

∂a1

∂D2

∂a2

Persamaan tersebut dapat ditulis dalam bentuk berikut :

n a0 + ∑ x1,i a1 + ∑ x2,i a2 = ∑ yi

∑ x1,i a0 + ∑ x1,i2 a1 + ∑ x1,i x2,i a2 = ∑ x1,i yi

∑ x2,i a0 + ∑ x1,i x2,i a1 + ∑ x2,i2 a2 = ∑ x2,i yi

Dalam notasi matriks :

Contoh :

Buat persamaan kurva yang mewakili data berikut :

x1 0 2 2,5 1 4 7

x2 0 1 2 3 6 2

y 5 10 9 0 3 27

Tabel 7. Hitungan regresi linier dengan banyak variable

No y x1 x2 x12 x2

2 x1x2 x1y x2y

1

2

3

5

10

9

0

2

2,5

0

1

2

0

4

6,25

0

1

4

0

2

5

0

20

22,5

0

10

18

4

5

6

0

3

27

1

4

7

3

6

2

1

16

49

9

36

4

3

24

14

0

12

189

0

18

55

∑ 54 16,5 76,25 54 48 243,5 101

Diperoleh persamaan :

6 16,5 14 a0 54

16,5 76,25 48 a1 = 243,5

14 48 54 a2 101

Diperoleh hasil :

a0 = 5

a1 = 4

a2 = -5

Sehingga persamaan kurva : y = 5 + 4 x1 – 3 x2