BAB 4harlan_johan.staff.gunadarma.ac.id/Downloads/files/64611/Metode... · Data bivariat jika dikelompokkan ... distribusi frekuensi bivariat, suatu bentuk penyajian ... Diagram tebar

116

BAB 4

ANALISIS REGRESI LINEAR 1

4.1 DATA BIVARIAT

� Paparan Data Bivariat

Data bivariat adalah data dengan pasangan (dua) variabel berbeda,

yang berasal dari subjek yang sama. Data bivariat yang akan dibahas dalam

bab ini adalah data berskala kontinu, atau sekurang-kurangnya numerik.

Paparan (layout) data bivariat tersebut secara umum diperlihatkan pada

matriks 4.1.

Matriks 4.1. Paparan data bivariat

Subjek Variabel 1 Variabel 2

1 11X 21X

2 12X 22X

. . . . . . . . .

i 1iX 2i

X

. . . . . . . . .

n 1nX 2n

X

Contoh 4.1:

Pada pengambilan sampel acak 48 orang mahasiswa Fakultas Ilmu

Komputer Universitas Gunadarma, 2002, diperoleh data tinggi dan berat

badan mereka, yang disajikan dalam bentuk dataset (database; basis data)

seperti terlihat pada tabel 4.1 di bawah ini.

117

Tabel 4.1. Tinggi dan berat badan 48 orang mahasiswa Fakultas Ilmu

Komputer Universitas Gunadarma, 2002

No TB BB No TB BB No TB BB No TB BB

1 174 84 13 171 65 25 176 70 37 160 52

2 159 55 14 177 95 26 158 60 38 155 48

3 156 72 15 168 50 27 157 55 39 172 49

4 154 44 16 151 44 28 158 50 40 167 59

5 159 64 17 154 47 29 175 89 41 163 47

6 155 53 18 160 49 30 173 70 42 176 54

7 160 45 19 164 42 31 155 50 43 156 53

8 160 61 20 171 55 32 161 51 44 160 50

9 155 64 21 171 54 33 169 80 45 168 71

10 158 62 22 173 80 34 145 43 46 159 46

11 174 53 23 171 68 35 154 45 47 171 54

12 162 54 24 170 64 36 158 51 48 170 55

TB: tinggi badan (dalam cm); BB: berat badan (dalam kg)

� Distribusi Frekuensi Bivariat

Data bivariat jika dikelompokkan (dikategorikan) akan menghasilkan

distribusi frekuensi bivariat, suatu bentuk penyajian distribusi frekuensi dua

variabel sekaligus. Tabel yang diperoleh disebut juga tabel silang atau tabel r

× c (terdiri atas r baris dan c kolom).

Contoh 4.2:

Lihat kembali data tinggi dan berat badan 48 orang mahasiswa

Gunadarma pada contoh 4.1. Kategorisasi data bivariat tersebut

menghasilkan distribusi frekuensi bivariat dalam bentuk tabel silang 3×3

seperti terlihat pada tabel 4.2 di bawah ini.

118

Tabel 4.2. Distribusi mahasiswa menurut tinggi dan berat badan ,

Fakultas Ilmu Komputer, Universitas Gunadarma , 2002 (N = 48)

Tinggi

badan (cm)

Berat badan (kg) Jumlah

< 50 50-59 > 60

< 160 7 7 5 19

160-169 4 6 3 13

> 170 1 6 9 16

Jumlah 12 19 17 48

Nilai-nilai pada kolom terkanan dan baris terbawah yang dinamakan

‘distribusi marginal’ merupakan distribusi frekuensi (univariat) untuk

masing-masing variabel.

Contoh 4.3:

Contoh lain untuk distribusi frekuensi bivariat tampak pada tabel 4.3,

yang menunjukkan distribusi hipotetis karyawan sebuah perusahaan menurut

lama masa kerja dan besar gaji bulanannya.

Tabel 4.3. Distribusi karyawan perusahaan ABC menurut masa kerja

dan gaji bulanan

Masa kerja

(tahun)

Gaji (dalam ratusan ribu rupiah) Jumlah

< 1000 1000-1999 > 2000

< 5 30 4 0 34

5-9 23 17 2 42

> 10 2 6 4 12

Jumlah 55 27 6 88

Dari tabel silang dapat diperkirakan secara kasar kemungkinan

adanya hubungan anatara kedua variabel, serta arah hubungan tersebut.

Hubungan antara dua variabel numerik yang terikat dalam struktur data

bivariat demikian seandainya ada dinamakan ‘asosiasi statistik’. Secara

statistik, hubungan antara dua variabel tersebut dianalisis dengan:

1. Analisis kolerasi: untuk hubungan tanpa arah (variabel baris ↔variabel kolom).

2. Analisis regresi sederhana: untuk hubungan yang memiliki arah

(variabel independen →variabel dependen) .

119

4.2. ANALISIS KORELASI

� Diagram Tebar

Analisis korelasi adalah analisis statistik yang ditujukan untuk

mengukur keeratan hubungan antara dua variabel yang terikat dalam

struktur data bivariat. Dua variabel demikian dapat disajikan secara grafik

dengan ‘diagram tebar’ (scatter diagram), dengan tiap titik menyatakan satu

pasangan nilai, yaitu nilai pada sumbu X (merepresentasikan variabel

pertama) dan nilai pada sumbu Y (merepresentasikan variabel kedua).

Manfaat diagram tebar adalah untuk memperkirakan besar (tingkat

keeratan) dan arah hubungan antar dua variabel tersebut. Besar dan dua arah

hubungan itu dinyatakan secara kuantitatif dengan koefisien korelasi

(sampel) r:

1) Arah hubungan:

� Hubungan positif ( )0 :r > jika X membesar, maka Y juga

membesar.

� Hubungan negatif ( )0 :r < jika X membesar, maka Y mengecil,

dan sebaliknya.

2) Besar hubungan:

1 1r− ≤ ≤ (4.1)

� Hubungan kuat: r mendekati 1

� Hubungan lemah: r mendekati 0

Perhatikan bahwa:

- Perhitungan korelasi dapat dilakukan dengan dan tanpa melalui analisis

regresi

- Tingkat korelasi yang kuat (‘bermakna’ secara statistik) belum tentu

menunjukkan hubungan kausal (sebab-akibat)

120

Diagram 4.1. Diagram tebar beberapa contoh data bivariat dengan

berbagai niali korelasi

� Koefisien Korelasi Pearson

Korelasi antara dua variabel yang berskala kontinu dinamakan

koefisiensi korelasi Pearson atau koefisien korelasi produk-momen:

- Koefisien korelasi untuk populasi: ρ

- Koefisien korelasi untuk sampel: ˆr ρ=

121

Koefisien korelasi r bernilai 1+ jika:

a. Setiap titik pada diagram tebar, yaitu tiap pasangan nilai ( );i i

X Y

terletak pada satu garis lurus, yaitu garis regresi 0 1Y b b X= + dengan

1 0.b >

b. Garis lurus tersebut membentuk sudut lancip dengan sumbu horizontal

:X 0 00 90ϕ< < dengan 1 b tg ϕ=

Koefisien korelasi r bernilai 1− jika:

a. Setiap titik pada diagram tebar, yaitu tiap pasangan nilai ( );i i

X Y

terletak pada satu garis lurus, yaitu garis regresi 0 1Y b b X= + dengan

1 0.b <

b. Garis lurus tersebut membentuk sudut tumpul dengan sumbu horizontal

:X 0 090 180ϕ< < dengan 1 b tg ϕ=

Rumus definisi:

( )( )

( )i i

2

i

2

i( )

X X Y Yr

X X Y Y

− −=

− −

∑∑ ∑

(4.2)

Rumus operasional:

( )

i i

22

i i 2 2

11

( )( )

( )

X YX Y

nrYX

X Yn n

−=

− −

∑ ∑∑

∑∑∑ ∑

(4.3)

Dengan lambang-lambang xxS , yyS , dan xyS :

( )

2

2 2 ixx i

i i

i

X

S X X Xn

= − = −∑

∑ ∑ (4.4.a)

( )

2

2 2

iyy i

i i

i

Y

S Y Y Yn

= − = −∑

∑ ∑ (4.4.b)

122

( )( )

i i

xy i i i i

X Y

S X X Y Y X Yn

= − − = −∑ ∑

∑ ∑ (4.4.c)

serta xS dan yS :

( )

2

ii

x xxS S X X= = −∑ (4.5.a)

( )

2

ii

y yyS S Y Y= = −∑ (4.5.b)

maka rumus operasional untuk r dapat dituliskan sebagai:

yy

xy xy

x yxx

S Sr

S SS S= = (4.6)

Contoh 4.4 (korelasi dengan rumus definisi):

Misalkan dimiliki data hipotesis variabel X yang menyatakan nilai

tes 1 (Matematika) dan variabel Y yang menyatakan nilai tes 2 (Bahasa

Inggris) 7 orang calon mahasiswa. Untuk menghitung koefisien korelasi

antara variabel X dan Y dengan menggunakan rumus definisi, terlebih

dahulu disusun tabel perhitungan seperti pada tabel 4.4 berikut.

Tabel 4.4. Contoh perhitungan koefisien korelasi dengan menggunakan

rumus definisi

Siswa iX iY ( )iX X− ( )2

iX X− ( )iY Y− ( )2

iY Y− ( )( )i iX X Y Y− −

A 90 94 10 100 17 289 170

B 82 66 2 4 −11 121 −22

C 66 69 −14 196 −8 64 112

D 70 86 −10 100 9 81 −90

E 95 72 15 225 −5 25 −75

F 97 88 17 289 11 121 187

G 60 64 −20 400 −13 169 260

Jumlah 560 539 1,314 870 542

i :X nilai tes 1; i :Y Nilai tes 2

123

560

807

X = = 539

777

Y = =

( )( )

( ) ( )

i i

2 2

i i

X X Y Yr

X X Y Y

− −=

− −

∑

∑ ∑

= ( ) ( )

5420.51

1,314 870=

Contoh 4.5 (korelasi dengan rumus operasional):

Lihat kembali data nilai tes Matematika dan bahasa Inggris pada

contoh 4.4. Untuk menghitung koefisien korelasi dengan menggunakan

rumus operasional, disusun tabel perhitungan seperti terlihat pada tabel 4.5.

Tabel 4.5. Contoh perhitungan koefisien korelasi dengan menggunakan

rumus operasional

Siswa iX iY 2iX 2

iY iX iY

A 90 94 8,100 8,836 8,460

B 82 66 6,724 4,356 5,412

C 66 69 4,356 4,761 4,554

D 70 86 4,900 7,396 6,020

E 95 72 9,025 5,184 6,840

F 97 88 9,409 7,744 8,536

G 60 64 3,600 4,096 3,840

Jumlah 560 539 46,114 42,373 43,662

i :X Nilai tes 1; i :Y Nilai tes 2

( )( )

( ) ( )

i i

2 2

i i 2 2

i i

X YX Y

nr

X YX Y

n n

−=

− −

∑ ∑∑

∑ ∑∑ ∑

( )( )

2 2

560 53943,662

7 0.51560 539

46,114 42,3737 7

−= =

− −

atau:

124

( )( )

2

i 22

xx i

2

i 22

i

1 i

xy i i

xy

x y

56046,114 1,314

7

53942,373 870

7

560 53943,662 542

7

5420.51

1,314 870

i

yy

i

i i

i

X

S Xn

Y

S Yn

X Y

S X Yn

Sr

S S

= − = − =

= = =

∑∑

∑ ∑∑

4.3. ANALISIS REGRESI LINEAR SEDERHANA

� Garis Regresi dan Model Regresi Linear

Analisis regresi adalah analisis statistik yang ditujukan untuk

memperoleh persamaan garis yang menunjukkan hubungan antara dua

variabel yang terikat dalam struktur data bivariat, dalam bentuk persamaan

garis regresi (diagram 4.2).

Persamaan garis regresi:

0 1 Y Xβ β= + (populasi) (4.7.a)

0 1 Y b b X= + (sampel) (4.7.b)

125

Diagram 4.2. Contoh diagram tebar data bivariat dan garis regresinya

1) Nilai Y -prediksi ˆ( ) :Y= adalah nilai prediksi variabel Y untuk setiap

nilai X tertentu.

� Dalam populasi: i 0 1 i Y Xβ β= +

� Dalam sampel: i 0 1 i Y Xβ β= +

2) Nilai Y -sesungguhnya i ( ) :Y= adalah nilai variabel Y sesungguhnya

untuk setiap nilai X tertentu. Pasangan nilai-nilai X dan Y

sesungguhnya menyatakan titik-titik yang ada pada diagram tebar.

Hubungan tiap nilai X tertentu dengan pasangan nilai Y

sesungguhnya, dinyatakan dalam suatu model, yang dinamakan model

regresi linear.

� Dalam populasi: i 0 1 i i Y Xβ β ε= + + (4.8.a)

dengan i i i ˆY Yε = −

� Dalam sampel: i 0 1 i i Y b b X e= + + (4.8.b)

dengan i i i ˆe Y Y= −

0 β : intersep (intercept); estimatornya adalah: 0 0

ˆ bβ =

1β : kemiringan (slope;koefisien regresi); estimatornya adalah: 1 1

ˆ bβ =

iε : galat acak (random error): i ˆ eε =

126

Persamaan garis regresi juga berlaku bagi pasangan nilai rerata X

dan rerata Y :

0 1 Y b b X= + (4.9)

Asumsi yang harus dipenuhi pada model regresi linear ini antara lain

yaitu:

� Nilai-nilai iY independen satu sama lain (asumsi independensi).

� Himpunan nilai-nilai iY untuk tiap nilai iX tertentu [distribusi (Y | X)]

berdistribusi normal dengan variansi yang sama (asumsi

homoskedastitas; lihat diagram 4.3).

Diagram 4.3. Asumsi homoskedastitas pada model regresi linear

� Koefisien Regresi 0b dan 1b

Koefisiensi regresi 0 b dan 1 b pada analisis regresi linear diestimasi

dengan menggunakan metode kuadrat terkecil (ordinary least square; OLS),

yaitu penentuan nilai 0 b dan 1 b sedemikian hingga menghasilkan nilai

minimum untuk 2

i e∑ . Dengan metode ini diperoleh rumus definisi untuk

koefisien regresi 1 b , yaitu:

( )( )

( )i i xy

1 2

xx i

X X Y YSb

S X X

− −= =

−

∑∑

(4.10)

Dalam praktik, yang digunakan untuk perhitungan adalah rumus

operasional:

127

( )( )

( )

i i

2

1

2

1

i

X Yb X Y

n

XX

n

= −

−

∑ ∑∑

∑∑

(4.11)

dengan:

0 1 b Y b X= − (4.9.a)

Contoh 4.6:

Misalkan dimiliki data hipotetis bagi 8 orang tenaga penjual

(salesman), yang menyatakan lama bekerja sebagai tenaga penjual dalam

tahun dan jumlah penjualan mingguannya dalam ribuan rupiah. Misalkan

hubungan antara lama bekerja (variabel X ) dan jumlah penjualan (variabel

Y ) dinyatakan dalam model regresi linear:

i 0 1 i i Y Xβ β ε= + +

Estimator 0 β dan 1 β adalah 0 b dan 1 b , yang perhitungannya

disajikan dengan menggunakan tabel 4.6 di bawah ini.

Tabel 4.6. Contoh perhitungan koefisien regresi untuk data 8 orang

tenaga penjual

Penjual iX iY iX iY 2iX 2

iY

A 6 90 540 36 8,100

B 5 60 300 25 3,600

C 3 40 120 9 1,600

D 1 30 30 1 900

E 4 30 120 16 900

F 3 50 150 9 2,500

G 6 80 480 36 6,400

H 2 20 40 4 400

Jumlah 30 400 1,780 136 24,400

iX : Lama berjualan (dalam tahun)

iY : Jumlah penjualan (dalam ribuan rupiah)

30

3.758

X = = 400

508

Y = =

128

( ) ( )

2

i 22

XX i

i i

xy i i

xy

1

0 1

30136 23.5

8

30 4001,780 280

8

28011.91

23.5

50 11.91 3.75 5.32

i

i i

i

xx

X

S Xn

X Y

S X Yn

Sb

S

b Y b X

= − = − =

= = =

= − = − =

∑∑

∑ ∑∑

Estimasi persamaan regresi: ˆ 5.32 11.91Y X= +

Misalkan seorang penjual memiliki lama penjualan 4 tahun, maka

taksiran (estimasi) jumlah penjualannya adalah:

4iX =

ˆiY = ( )( )i

5.32 11.91 5.32 11.91 4 52.98X+ = + =

Hubungan antara 1 b dengan r :

( )

2

1 i y

xi

Y Y Sb

r SX X

−= =

−

∑∑

(4.12)

� Variansi pada Model Regresi

Pada diagram 4.4, tampak bahwa:

( ) ( ) ( )2

i i i i ˆ ˆY Y Y Y Y Y− = − + −

129

Diagram 4.4. Dasar Penguraian variansi pada model regresi linear

Secara matematis, dapat dibuktikan bahwa:

( )2

i Y Y−∑ = ( )

2

i Y Y−∑ + ( )2

i i ˆY Y−∑

atau: JKT = JKR + JKG (4.13)

JKT : Jumlah Kuadrat Total (SSTo, Total Sum of Squares) = yy S

JKR : Jumlah Kuadrat Regresi (SSR, Regression Sum of Squares)

JKG : Jumlah Kuadrat Galat (Error Sum of Squares) = 2

i e∑

Rumus definisi:

JKT = yy S = ( )

2

i Y Y−∑ (4.14)

JKR = 1b .yy S =

( )2

xy

xx

S

S =

( )( )

( )i i

2

i

2

X X Y Y

X X

− −

−

∑∑

(4.15)

Rumus operasional:

JKT = yy S =

2i

i

Y∑ −

2

ii

Y

n

∑

; db = n – 1 (4.16)

130

JKR = ( )

2

xy

xx

S

S =

( )

2

i ii i

i

X YX Y

n

XX

n

−

∑ ∑∑

∑∑

; db = 1 (4.17)

JKG = JKT – JKR ; db = n – 2 (4.13.a)

� Kuadrat Rerata

Kuadrat Rerata ( ) =mean square Jumlah Kuadrat

derajat bebas

� Kuadrat Rerata Regresi (KRR; regression mean square; MSR)

KRR = 1

JKR (4.18)

� Kuadrat Rerata Galat (KRG; error mean square; MSE)

KRG = 2

JKG

n − (4.19)

Contoh 4.7:

Lihat kembali data pada contoh 4.6:

xx 23.5S = xy 280S =

2

i 22

yy i

40024,400 4,400

8

i

Y

S Yn

= − = − =∑

∑

yy 4,400JKT S= =

( )

22

xy

2

xx

2803,336.17

23.5

SJKR

S= = =

atau ( )1 xy

280. 280 3,336.17

23.5JKR b S= = =

131

4,400 3,336.17 1.063.83JKG JKT JKR= − = − =

� Koefisien Determinasi

Koefisien determinasi adalah proporsi variansi yang dapat dijelaskan

oleh model regresi.

2

R = JKR

JKT =

JKT JKG

JKT

− = 1 −

JKG

JKT (4.20)

2

R = ( )( )

2

ˆ

i

Y Y

−

∑

∑ = 1 −

( )( )

2

ˆi i

i

Y Y

−

∑

∑ (4.20.a)

Akar koefisiensi determinasi sama dengan koefisien korelasi:

R = r (4.21)

sehingga:

( )( )( )

( ) ( )

2

i i

2 i i

xy 2

2 2

xx yy i i 2 2

i i

X YX Y

nSR

S S X YX Y

n n

−

= = − −

∑ ∑∑

∑ ∑∑ ∑

(4.22)

Contoh 4.8:

Lihat kembali data pada contoh 4.6 dan 4.7.

3,336.17JKR = 4,400JKT =

Koefisien determinasi adalah:

2

3,336.170.76

4,400

JKRR

JKT= = =

2

0.76 0.87R R= = =

xx 23.5S = yy 4,400S = xy

280S =

Koefisien korelasi: xy

xx yy

Sr

S S=

132

( )( )

2800.87

23.5 4,400= =

Tampak bahwa: R = r

Koefisien korelasi r juga dapat dihitung sebagai berikut:

1 11.91b = (contoh 4.6)

xx 23.5S = (contoh 4.6)

yy 4,400S JKT= = (contoh 4.7)

Dengan menggunakan rumus:

( )( )

2

i y 1

2

x i

Y Y Sb

r SX X

−= =

−

∑∑

diperoleh: 11.91

r =

4, 400

23.5

r = 0.87

4.4. INFERENSI STATISTIK PADA MODEL REGRESI

DAN MODEL KORELASI

� Uji ANOVA (Uji F) untuk 0H : 1ββββ = 0

- Hipotesis: 0H : 1β = 0 (4.23.a)

1H : 1β ≠ 0 (4.23.b)

- Statistik pengujinya adalah:

( )uji

/1

/ 2

KRR JKRF

KRG JKG n= =

− (4.24)

yang berdistribusi F dengan derajat bebas pembilang 1 dan derajat bebas

penyebut ( )2 .n −

- Daerah kritis: F > ( )1; 2 ;nF α− (4.25)

(tabel nilai kritis distribusi F dapat dilihat pada Addendum C)

133

Hasil perhitungan disajikan dalam bentuk tabel ANOVA (analisis

variansi) seperti terlihat pada tabel 4.7 di bawah ini.

Tabel 4.7. Tabel ANOVA untuk persamaan garis regresi ˆiY = 0b + 1 ib X

Sumber

variansi JK db KR ujiF

tabelF

Regresi JKR 1 KRR = 1

JKR

ujiF = KRR

KRG ( )1; 2 ;nF

α−

Galat JKG n – 2 KRG = 2

JKG

n −

Total JKT n – 1

Contoh 4.9:

Lihat kembali data penjualan pada contoh 4.6. Pada contoh 4.7 telah

dihitung nilai-nilai JKT, JKR, dan JKG-nya ( )8 :n =

4,400JKT = 3,336.17JKR = 1,063.83JKG =

Diperoleh:

3,336.17

3,336.171 1

JKRKRR = = =

1,063.83

177.302 6

JKGKRG

n= = =

−

Untuk uji hipotesis 0 1 : 0H β = dengan uji F dan tingkat signifikansi

0.05,a = disusun tabel analisis variansi berikut:

Tabel 4.8. Tabel ANOVA untuk persamaan regresi ˆ 5.32 11.91XY = +

Sumber

variansi JK db KR ujiF

tabelF

Regresi 3,336.17 1 3,336.17

ujiF = 3,336.17

177.30

= 18.82

1; 6; 0.05F

= 5.99

Galat 1,063.83 6 177.30

Total 4,400 7

134

Nilai uji

18.82F = lebih besar daripada nilai titik kritis

( )1;6;0.05 5.99,F =

sehingga 0 1 : 0H β =

ditolak pada tingkat signifikansi 0.05.a =

� Distribusi F

Statistik penguji pada uji ANOVA untuk model regresi linear

berdistribusi F, yang cuplikan nilai-nilainya diperlihatkan pada tabel 4.9 di

bawah ini (tabel lengkap nilai kritis distribusi F terdapat pada Addendum C).

Distribusi F memiliki derajat bebas pembilang (numerator; baris teratas pada

tabel) dan derajat bebas penyebut (denominator; kolom terkiri pada tabel).

Bentuk distribusinya dapat berbeda-beda, tergantung pada derajat bebas

pembilang dan derajat bebas penyebut., tetapi nilai-nilai F seluruhnya adalah

positif (di sisi kanan sumbu vertikal), sehingga uji hipotesis dengan statistik

penguji yang berdistribusi F selalu adalah uji 1-ekor, namun merupakan uji

2-sisi.

Diagram 4.5. Distribusi F dengan berbagai derajat bebas pembilang dan

derajat bebas penyebut.

Tabel distribusi F biasanya dibuat terpisah untuk berbagai nilai ,a

dan yang disajikan pada tabel 4.9 adalah nilai-nilai distribusi F untuk

0.05.a = Nilai-nilai distribusi F selengkapnya dapat dilihat pada Addendum

C.

135

Tabel 4.9. Cuplikan tabel F untuk α = 0.05 [α = P (F > ( ) ; ;n d αF ]

� Uji t (2-sisi) untuk 0H : 1ββββ = 0 dan Interval Konfidensi 1ββββ

- Hipotesis: 0 1 : 0H β = (4.26.a)

1 1 : 0H β ≠ (4.26.b)

- Statistik pengujinya adalah:

ujit = ( )1

1ˆ

b

SE b = 1

x

b

s S (4.27)

yang berdistribusi t dengan db ( )2 .n −

2s = ( )2

JKG

n − =

( )( )

2ˆ

2

i iY Y

n

−

∑ = KRG (4.28)

- Daerah kritis (daerah penolakan) adalah:

t > ( )2 ; 2nt α− (4.29)

136

Interval konfidensi untuk adalah:

1b + ( )2 ; 2nt α− . ( )1

ˆSE b

yaitu: 1b + ( )2 ; 2nt α− .

x

s

S (4.30)

Contoh 4.10:

Lihat kembali data penjualan pada contoh 4.6. Dalam contoh tersebut

telah diperoleh estimasi persamaan regresi:

ˆ 5.32 11.91Y X= +

Untuk menguji hipotesis 0 1 : 0,H β = statistik pengujinya adalah:

( )1 1

uji

x 1 ˆ /

b bt

s SSE b= =

yang berdistribusi tdengan db ( )2 .n −

( )

2 177.302

JKGs KRG

n= = =

− xx 23.5S =

( )1

x

177.30ˆ 2.74723.5

sSE b

S= = =

( )1

uji

1

11914.34

ˆ 2.747

bt

SE b= = =

Dengan 0.05,a = daerah kritis untuk hipotesis 0 1 : 0H β =

adalah

( )6;0.025 | |t t> atau | t | 2.447,> sehingga 0 H ditolak.

Interval konfidensi 95% untuk 1 β adalah:

atau:

( ) ( )

[ ]

1 1 6;0.025 ˆ.

11.91 2.447 2.747

5.19;18.64

b t SE b±

±

( )1 a−1 β

137

Uji Hipotesis untuk Koefisien Korelasi r

- Hipotesis: 0H : ρ = 0 (4.31.a)

1H : ρ ≠ 0 (4.31.b)

- Statistik pengujinya adalah:

ujit =

( ) ( )21 2

r

r n− − (4.32)

yang berdistribusi dengan db

- Daerah kritis (daerah penolakan) adalah:

t > ( )2 ; 2nt α− (4.33)

Contoh 4.11:

Lihat kembali data penjualan pada contoh 4.6. Pada contoh 4.8 telah

dihitung:

0.87r =

Untuk menilai apakah koefisien korelasi ini berbeda secara bermakna

dengan nol (tidak ada korelasi), maka dilakukan uji hipotesis 0 : 0H ρ = .

Statistik pengujinya adalah:

( ) ( ) ( )uji

2 2

0.874.34

1 / 2 1 0.87 / 6

rt

r n= = =

− − −

yang berdistribusi t dengan db ( )2 .n −

Dengan 0.05,a = daerah kritis adalah |t|>( )2 ;a/ 2

,n

t−

yaitu |t|>( )6;0.025

t atau

|t|>2.447, sehingga 0 H ditolak.

t ( )2 .n −

138

LAMPIRAN 4A: UKURAN SAMPEL MINIMUM UNTUK

UJI HIPOTESIS PADA MODEL REGRESI DAN MODEL

KORELASI

Ukuran Sampel untuk Model Regresi Linear

Rumus perhitungan ukuran sampel minimum yang dibutuhkan untuk

uji hipotesis pada model regresi linear tidak dapat disajikan dalam bentuk

sederhana, karena menggunakan distribusi F-sentral serta distribusi F-non-

sentral yang memerlukan pemahaman teoretis di luar ruang lingkup

pembahasan pada buku teks ini. Jika diperlukan, ukuran sampel minimum

yang dibutuhkan untuk uji hipotesis pada model regresi linear dapat

ditentukan dengan menggunakan salah satu program komputer yang ada

untuk perhitungan ukuran sampel dan kekuatan uji hipotesis, misalnya PASS

2000.

Contoh IV.1:

Misalkan akan ditentukan ukuran sampel minimum yang dibutuhkan

untuk melakukan uji hipotesis terhadap model regresi linear

i 0 1 i i Y Xβ β ε= + + . Misalkan pula dipilih tingkat signifikansi 0.05,a =

kekuatan uji ( )1 0.80,β− = dan diketahui dari penelitian terdahulu bahwa

( ) 1.SD X = Dengan memasukkan nilai-nilai spesifikasi ini pada progam

komputer PASS 2000, diperoleh ukuran sampel minimum yang dibutuhkan

pada berbagai nilai minimum koefisien regresi 1 β yang diharapkan untuk

dideteksi serta berbagai tingkat korelasi antara variabel X dan Y (tabel IV.1).

Tabel IV.1. Ukuran sampel minimum untuk uji F terhadap hipotesis

0H : 1ββββ = 0 pada model regresi linear iY = 0ββββ + 1ββββ iX + iεεεε *)

ρ 1 3 5 7 9

0.2 191 191 191 191 191

0.4 44 44 44 44 44

0.6 17 17 17 17 17

0.8 7 7 7 7 7

*) α = 0.05, (1 – β) = 0.80, dan SD (X) = 1

1 β

139

Ukuran Sampel untuk Model Korelasi

Pada uji hipotesis 0 : 0H ρ = vs 1 : 0H ρ > , misalkan besar korelasi

minimum yang diharapkan untuk dideteksi adalah R, sehingga untuk

perhitungan ukuran sampel minimum yang dibutuhkan, hipotesisnya dapat

dituliskan sebagai 0 0 : 0H ρ ρ= = dan A 1 :H Rρ ρ= = .

Transformasi koefisien korelasi sampel r berdistribusi normal

standar:

0.5z = In1

1

r

+

−

dengan standard error:

( )1

3SE z

n=

−

Misalkan c menyatakan titik kritis pada uji hipotesisis, dan

diasumsikan bahwa standard error kedua distribusi sampling menurut 0 H

dan A H adalah sama, maka dengan merujuk pada distribusi sampling 0 H

diperoleh:

c = 0 + Zα1

3n −

sedangkan dengam merujuk pada distribusi A H diperoleh:

c = 0.5 1

ln1

R

+

− − Z β

1

3n −

Selanjutnya: 0 + Zα1

3n − = 0.5

1ln

1

R

+

− − Z β

1

3n −

1

3n − =

10.5ln

1

R

Z Zα β

+

−+

dan diperoleh ukuran sampel minimum yang dibutuhkan untuk mendeteksi

korelasi minimum sebesar R:

n =

2

21

0.5 ln1

Z Z

R

α β +

+ −

+ 3

140

LAMPIRAN 4B: CONTOH ANALISIS REGRESI LINEAR

SEDERHANA DENGAN PROGAM KOMPUTER

Sebagai contoh, di bawah ini diperlihatkan keluaran tiga program

komputer, SPSS 12.0 for Windows, Minitab Realease 14, dan Stata/SE 8.0

for Windows untuk analisis data pada Latihan 4 Bagian Kedua (usia dan

tekanan darah sistolik), dengan analisis regresi linear sederhana.

SPSS 12.0 FOR WINDOWS

Regression Variables Entered/Removed(b)

Model

Variables Entered

Variables Removed

Method

1 USIA(a) . Enter

a All requested variables entered b Dependent Variable: TENSI

Model Summary

Model

R

R Square

Adjusted R Square

Std. Error of the Estimate

1 .349(a) .122 -.097 25.749

a Predictors: (Constant), USIA ANOVA(b)

Model

Sum of Squares

df

Mean Square

F

Sig.

1 Regression Residual Total

368.825 2652.009 3020.833

1 4 5

368.825 663.002

.556 .497(a)

a Predictors: (Constant), USIA b Dependent Variable: TENSI

Coefficient(a)

Model

Unstandardized Coefficients

Standardized Coefficients

t

Sig.

B Std. Error Beta

1 (Constant) USIA

92.897 .887

62.920 1.189

.349

1.476 .746

.214 .497

a Dependent Variable: TENSI

141

MINITAB RELEASE 14

-------------- 1/27/2005 6:11:45 PM -----------------------------------------

Welcome to Minitab, press F1 for help.

Regression Analysis: TENSI versus USIA

The regession equation is

TENSI = 92.9 + 0.89 USIA

Predictor Coef SE Coef T P

Constant 92.90 62.92 1.48 0.214

USIA 0.887 1.189 0.75 0.497

S = 25.7488 R-Sq = 12.2% R-Sq (adj) = 0.0%

Analysis of Variance

Source DF SS MS F P

Regression 1 368.8 368.8 0.56 0.497

Residual Error 4 2652.0 663.0

Total 5 3020.8

STATA/SE 8.0 FOR WINDOWS

. regress TENSI USIA

Source | SS df MS Number of obs = 6

---------|------------------------- F(1, 4) = 0.56

Model | 368.824802 1 368.824802 Prob>F = 0.4972

Residual | 2652.00852 4 663.002133 R-squared = 0.1221

---------|------------------------- Adj R-squared = -0.0974

Total | 3020.83333 5 604.166667 Root MSE = 25.749

142

------+-----------------------------------------------------

TENSI | Coef. Std.Err. t P>|t| [95%Conf.Interval]

------|-----------------------------------------------------

USIA | .8869534 1.189182 0.75 0.497 -2.414744 4.188651

_cons | 92.89726 62.91996 1.48 0.214 -81.79656 267.5911

------+-----------------------------------------------------

143

LATIHAN 4

Bagian Pertama

Pilihlah satu jawaban yang paling benar!

Untuk soal No. 1 s.d. 6:

Diketahui: 7X = 34Y = 8n =

2

400X =∑ 1,931XY =∑ 2

9,576Y =∑

1. ( )2

iX X− =∑

A. 8 C. 136

B. 27 D. 328

2. ( )2

iY Y− =∑

A. 8 C. 136

B. 27 D. 328

3. ( )2

iX X−∑ ( )

2

iY Y− =∑

A. 8 C. 136

B. 27 D. 328

4. Dengan pembagi ( )1 ,n − ( )Var X adalah:

A. 1.14 C. 19.43

B. 3.86 D. 46.26

5. Dengan pembagi ( )1 ,n − ( )Var Y adalah:

A. 1.14 C. 19.43

B. 3.86 D. 46.26

6. Koefisien korelasi r adalah:

A. 0.45 C. 0.61

B. 0.53 D. 0.72

144

7. Jika r menyatakan koefisien Pearson antara variabel X dan Y dan

diketahui r < 0, maka:

A. Untuk nilai X yang besar, nilai Y juga cenderung besar.

B. Untuk nilai X yang besar, nilai Y cenderung kecil.

C. Untuk nilai X yang kecil, nilai Y cenderung besar

D. B) dan C) benar.

8. Misalkan dimiliki himpunan data bivariat ( )2 2X Y− , . . . , ( )8 8

X Y−

dan r menyatakan koefisien korelasi X dengan Y. Jika gambaran

titik-titik data tersebut pada diagram tebar (scatter diagram)

membentuk titik-titik sudut segi delapan beraturan, maka:

A. r > 0 C. r < 0

B. r = 0 D. Semuanya salah.

9. Proporsi variansi yang dapat dijelaskan oleh suatun model regresi

dinamakan:

A. Koefisien korelasi C. Koefisien regresi

B. Koefisien determinasi D. Koefisien konkordansi

10. Misalkan dimiliki garis regresi 0 1

ˆi iY b b X= + , dan r menyatakan

koefisien korelasi X dengan Y:

A. Jika r = 0, maka 1 0b =

B. Jika r = −1, maka 1b = −1

C. Jika 1r = + , maka 1 1b = +

D. Yang benar lebih daripada satu.

11.

145

Kedua gambar di atas menunjukkan diagram tebar dan garis regresi 2

sampel data bivariat, masing-masing dengan estimasi garis regresi

1 1Y a b X= + dan koefisien korelasi 1r serta garis regresi 2 2Y a b X= +

dan koefisien korelasi 2r . Jika kedua diagram dibuat dengan skala

pengukuran yang sama, maka:

A. 1 2b b> dan 1 2r r> C. 1 2b b< dan 1 2r r>

B. 1 2b b> dan 1 2r r< D. 1 2b b< dan 1 2r r<

12. Misalkan dimiliki 2 himpunan data bivariat, masing-masing dengan

estimasi garis regresi 1 1Y a b X= + dan koefisien korelasi 1r serta

garis regresi 2 2Y a b X= + dan koefisien korelasi 2r . Jika diketahui

1 2 0b b> > , maka:

A. 1 0r > dan 2 0r > C. 1 2 0r r> >

B. 1 0r < dan 2 0r < D. 2 1 0r r> >

13. Dimiliki data bivariat dengan variabel independen X dan variabel

dependen Y serta estimasi garis regresi 0 1

ˆ .Y b b X= + Jika pada

diagram tebar ( );X Y seluruh titik-titik ( );i i

X Y terletak pada garis

regresi 0 1

ˆ ,Y b b X= + maka:

A. JKR = 0 C. JKR = JKG

B. JKR =1 D. JKR = JKT

14. Dari himpunan data bivariat (X ; Y) diketahui koefisien korelasinya

0r = , maka bagi model regresi 0 1i i iY b b X e= + + berlaku:

A. JKR = 0 C. JKR = JKG

B. JKR =1 D. JKR = JKT

15. Data bivariat dengan variabel independen X dan variabel dependen

Y menghasilkan estimasi garis regresi 0 1Y b b X= + dan koefisien

korelasi r. Jika diketahui bahwa uji hipotesis 0 1: 0H β =

menghasilkan statistik penguji 1t dan uji hipotesis 0 : 0H ρ =

menghasilkan statistik penguji 2t , maka:

A. 1 2t t< C. 1 2t t>

B. 1 2t t= D. Semuanya salah

146

16. Koefisien determinasi pada analisis regresi linear menyatakan:

A. Proporsi variansi variabel dependen yang dapat ‘dijelaskan’

oleh model regresi.

B. Proporsi variansi variabel dependen yang tidak dapat

‘dijelaskan’ oleh model regresi.

C. Proporsi variansi variabel independen yang dapat ‘dijelaskan’

oleh model regresi.

D. Proporsi variansi variabel independen yang tidak dapat

‘dijelaskan’ oleh model regresi.

17. Secara kuantitatif, besar koefisien determinasi adalah sama dengan:

A. Koefisien korelasi.

B. Kuadrat korefisien korelasi.

C. Akar (positif) koefisien korelasi.

D. Semuanya salah

18. Pada model regresi linear sederhana, nilai kuadrat rerata regresinya

(regression mean square):

A. Lebih besar daripada nilai jumlah kuadrat regresi (regression

sum of squares)

B. Sama dengan nilai jumlah kuadrat regresi.

C. Lebih kecil daripada nilai jumlah kuadrat regresi.

D. Semuanya mungkin benar.

Bagian Kedua

Pilihlah satu jawaban yang paling benar!

Dimiliki data usia (dalam tahun) dan tekanan darah sistolik (dalam

mm Hg) kelompok subjek yang terdiri dari enam orang dewasa sebagai

berikut:

Subjek (i) 1 2 3 4 5 6

Usia ( )iX 47 52 37 53 65 59

Tekanan darah ( )iY 135 110 140 120 150 180

1. Nilai harapan usia kelompok tersebut (dalam tahun) adalah:

A. 50.33 C. 55.28

B. 52.17 D. 57.12

147

2. Nilai harapan tekanan darah sistolik mereka (dalam mm Hg) adalah:

A. 122 C. 139

B. 128 D. 145

3. Jika garis regresi tekanan darah sistolik terhadap usia dinyatakan

sebagai 0 1Y Xβ β= + dengan variabel Y menyatakan tekanan darah

sistolik dan variabel X menyatakan usia subjek, maka estimasi 0β

adalah:

A. 0.887 C. 36.453

B. 12.757 D. 92.897

4. Estimasi 1β adalah:

A. 0.887 C. 36.453

B. 12.757 D. 92.897

5. Koefisien korelasi antara usia dengan tekanan darah sistolik subjek

adalah:

A. 0.122 C. 0.910

B. 0.349 D. 0.954

6. Jumlah kuadrat regresi adalah:

A. 368.82 C. 2,652.01

B. 663.00 D. 3,020.83

7. Jumlah kuadrat galat adalah:

A. 368.82 C. 2,652.01

B. 663.00 D. 3,020.83

8. Kuadrat rerata galat adalah:

A. 368.82 C. 2,652.01

B. 663.00 D. 3,020.83

9. Koefisien determinasi model regresi di atas adalah:

A. 0.122 C. 0.910

B. 0.349 D. 0.954

10. Untuk subjek berusia 50 tahun, nilai prediksi tekanan darah

sistoliknya (dalam mm Hg) adalah:

A. 112 C. 137

B. 125 D. 150

148

11. Estimasi standard error 1β ( )1ˆˆ[ ]SE β adalah:

A. /x

KRG S = 30.62 C. / xKRG S = 1.19

B. /xx

KRG S = 1.41 D. / xxKRG S = 0.05

12. Pada uji statistik terhadap hipotesis 0 1: 0H β = , diperoleh statistik

penguji sebesar:

A. 0.746ujit = C. Keduanya benar

B. 0.556ujiF = D. Keduanya salah

13. Dengan tingkat signifikansi α = 0.05, nilai kritis bagi uji hipotesis

pada soal No. 12 di atas adalah:

A. 2.776t = C. Keduanya benar.

B. 7.709F = D. Keduanya salah.

14. Pada uji hipotesis 0 : 0H ρ = , kesimpulan yang diperoleh ialah:

A. Pada tingkat signifikansi 0.05α = , 0H tidak ditolak

B. Pada tingkat signifikansi 0.05α = , 0H ditolak

C. Keduanya benar

D. Keduanya salah

Bagian Ketiga

Pilihlah satu jawaban yang paling benar!

Data berikut menyatakan nilai tes keterampilan (X) dan produktivitas

kerja per minggu (Y) 8 orang karyawan.

Siswa (i) 1 2 3 4 5 6 7 8

Tes keterampilan ( )iX 6 9 3 8 7 5 8 10

Produktivitas kerja ( )iY 30 49 18 42 39 25 41 52

149

1. Jika garis regresi produktivitas kerja terhadap nilai tes keterampilan

dinyatakan sebagai 0 1Y Xβ β= + dengan variabel Y menyatakan

produktivitas kerja dan variabel X menyatakan nilai tes keterampilan,

maka estimasi 0β adalah:

A. 0.982 C. 1.028

B. 0.991 D. 5.139

2. Estimasi 1β adalah:

A. 0.982 C. 1.028

B. 0.991 D. 5.139

3. Koefisien korelasi antara nilai tes masuk dengan nilai ujian akhir

siswa adalah:

A. 0.982 C. 1.028

B. 0.991 D. 5.139

4. Koefisien determinasi model regresi di atas adalah:

A. 0.982 C. 1.028

B. 0.991 D. 5.139

5. Nilai harapan produktivitas kerja jika nilai tes keterampilan = 8

adalah:

A. 41.00 C. 42.14

B. 41.50 D. 42.28

6. Jumlah kuadrat regresi (regression sum of squares) adalah:

A. 2.88 C. 950.69

B. 17.31 D. 968.00

7. Jumlah kuadrat galat (error sum of squares) adalah:

A. 2.88 C. 950.69

B. 17.31 D. 968.00

8. Kuadrat rerata galat (error mean squares) adalah:

A. 2.88 C. 950.69

B. 17.31 D. 968.00

150

9. Estimasi standard error1β ( )1

ˆˆ[ ]SE β adalah:

A. /x

KRG S = 0.48 C. / xKRG S = 0.28

B. /xx

KRG S = 0.08 D. / xxKRG S = 0.05

10. Pada uji statistik terhadap hipotesis 0 1: 0H β = , diperoleh statistik

penguji sebesar:

A. 18.16ujit = C. Keduanya benar

B. 329.61ujiF = D. Keduanya salah

11. Pada uji F, daerah kritis uji hipotesis 0 1: 0H β = adalah:

A. F > 5.99 untuk α = 0.05; F > 12.25 untuk α = 0.01

B. F > 5.99 untuk α = 0.05; F > 13.74 untuk α = 0.01

C. ` F > 234 untuk α = 0.05; F > 5,859 untuk α = 0.01

D. F > 237 untuk α = 0.05; F > 5,928 untuk α = 0.01

12. Berdasarkan nilai statistik penguji, tersebut maka pada uji F terhadap

0 1: 0H β = disimpulkan bahwa 0H :

A. Ditolak pada α = 0.01 dan pada α = 0.05

B. Ditolak pada α = 0.01; tidak ditolak pada α = 0.05

C. Tidak ditolak pada α = 0.01; ditolak pada α = 0.05

D. Tidak ditolak pada α = 0.01 dan pada α = 0.05

151

BAB 5

ANALISIS REGRESI LINEAR II

5.1. ANALISIS REGRESI LINEAR GANDA

� Model dan Estimasi Parameter

Bentuk umum dengan (p – 1) variabel independen (p menyatakan

jumlah koefisien regresi ) adalah:

iY = 0β + 1β 1iX + . . . + 1pβ − ( );1 ipX

− + iε (5.1)

Contoh 5.1:

Contoh model dengan 2 variabel independen yaitu:

iY = 0β + 1β 1iX + 2β 2iX + iε

Persamaan garis regresi-nya adalah:

ˆiY = 0β + 1β 1iX + 2β 2iX

iY : Tinggi badan anak

1iX : Tinggi badan ayah

2iX : Tinggi badan ibu

Estimasi koefisien regresi diperoleh dengan metode kuadrat kecil

(least square method; ordinary least square; OLS) dan perhitungannya

secara operasional dapat dilakukan dengan menggunakan:

1. Metode eliminasi

2. Aljabar matriks

3. Program statistika komputer

Catatan:

Dalam aljabar matriks diperhitungkan adanya p variabel independen,

yaitu dengan menggunakan variabel 0X yang nilainya selalu sama dengan 1,

sehingga model yang digunakan dapat dituliskan sebagai:

152

iY = 0β 0X + 1β 1iX + . . . + 1pβ − ( );1 ipX

− + iε

� Metode Kuadrat Terkecil (Least Square Method; Ordinary

Least Square / OLS)

a. Regresi linear sederhana

Misalkan dimiliki estimasi model dan garis regresi-nya:

iY = 0b + 1b iX + ie (5.2.a)

ˆiY = 0b + 1b iX (5.2.b)

Maka residual ie adalah:

ie = iY − ˆiY (5.3)

= iY − 0b − 1b iX

Misalkan: Q = 2ie∑ = ( )2

0 1 i iY b b X− −∑ (5.4)

minQ jika: 0

Q

b

∂

∂ = 0 dan

1

Q

b

∂

∂ = 0 (5.4.a)

0

Q

b

∂

∂ = 2 ( )( )0 1 1 i iY b b X− − −∑

= −2 ( )0 1 i iY b b X− −∑ = 0

n 0b + 1b iX∑ − iY∑ = 0 (I)

1

Q

b

∂

∂ = 2 ( )( )0 1 1 i i iY b b X X− − −∑

= −2 ( )( )0 1 i i iX Y b b X− −∑ = 0

0b iX∑ + 1b 2iX∑ − i iX Y∑ = 0 (II)

Persamaan I dan II disebut sebagai ‘persamaan normal’. Dengan

menyelesaikan persamaan normal I dan II:

n 0b + 1b iX∑ − iY∑ = 0 (I)

0b iX∑ + 1b 2iX∑ − i iX Y∑ = 0 (II)

diperoleh rumus 1b (dan 0b ).

153

b. Regresi linear ganda dengan 2 variabel independen (p = 3)

Misalkan dimiliki estimasi model dan garis regresi:

iY = 0b + 1b 1iX + 2b 2iX + ie (5.5.a)

ˆiY = 0b + 1b 1iX + 2b 2iX (5.5.b)

maka residual ie adalah:

ie = iY − ˆiY

= iY − 0b − 1b 1iX − 2b 2iX

Misalkan: Q = 2ie∑ = ( )2

0 1 1 2 2 i i iY b b X b X− − −∑ (5.6)

minQ jika: 0

Q

b

∂

∂ = 0 ,

1

Q

b

∂

∂ = 0 , dan

2

Q

b

∂

∂ = 0 (5.6.a)

0

Q

b

∂

∂ = 2 ( )( )0 1 1 2 2 1 i i iY b b X b X− − − −∑

= −2 ( )0 1 1 2 2 i i iY b b X b X− − −∑ = 0

n 0b + 1b 1iX∑ + 2b 2iX∑ − iY∑ = 0 (I)

1

Q

b

∂

∂ = 2 ( )( )0 1 1 2 2 1 i i i iY b b X b X X− − − −∑

= −2 ( )( )1 0 1 1 2 2 ii i iX Y b b X b X− − −∑ = 0

0b 1iX∑ + 1b 21iX∑ + 2b 1 2i iX X∑ − 1 iiX Y∑ = 0 (II)

2

Q

b

∂

∂ = 2 ( )( )0 1 1 2 2 2 i i i iY b b X b X X− − − −∑

= −2 ( )( )2 0 1 1 2 2 ii i iX Y b b X b X− − −∑ = 0

0b 2iX∑ + 1b 1 2i iX X∑ + 2b 22iX∑ − 2 iiX Y∑ = 0 (III)

Dengan menyelesaikan persamaan normal I, II, dan III (metode eliminasi):

n 0b + 1b 1iX∑ + 2b 2iX∑ − iY∑ = 0 (I)

0b 1iX∑ + 1b 21iX∑ + 2b 1 2i iX X∑ − 1 iiX Y∑ = 0 (II)

0b 2iX∑ + 1b 1 2i iX X∑ + 2b 22iX∑ − 2 iiX Y∑ = 0 (III)

diperoleh nilai-nilai 0b , 1b , dan 2b .

154

c. Regresi linear ganda dengan 3 variabel independen (p = 4)

Misalkan dimiliki estimasi model dan garis regresi:

iY = 0b + 1b 1iX + 2b 2iX + 3b 3iX + ie (5.7.a)

ˆiY = 0b + 1b 1iX + 2b 2iX + 3b 3iX (5.7.b)

Seperti cara di atas, dengan memisalkan Q = 2

ie∑ dan menyamakan

derivat parsial-nya terhadap 0b , 1b , 2b dan 3b masing-masing sama dengan

nol, diperoleh empat persamaan normal I, II, III, dan IV:

n 0b + 1b 1iX∑ + 2b 2iX∑ + 3b 3iX∑ − iY∑ = 0 (I)

0b 1iX∑ + 1b 21iX∑ + 2b 1 2i iX X∑ + 3b 1 3i iX X∑ − 1 iiX Y∑ = 0 (II)

0b 2iX∑ + 1b 1 2i iX X∑ + 2b 22iX∑ + 3b 2 3i iX X∑ − 2 iiX Y∑ = 0 (III)

0b 3iX∑ + 1b 1 3i iX X∑ + 2b 2 3i iX X∑ + 3b 23iX∑ − 3 iiX Y∑ = 0 (IV)

yang selanjutnya diselesaikan dengan metode eliminasi, sehingga

menghasilkan nilai-nilai 0b , 1b , 2b , dan 3b .

� Metode Eliminasi

Contoh 5.2:

Misalkan dimiliki data seperti pada tabel 5.1 berikut:

Tabel 5.1. Contoh data untuk peragaan metode eliminasi pada analisis

regresi linear ganda

i 1 2 3 4 5 6

iY

26 31 26 38 18 27

1iX

2 6 6 11 1 1

2iX

5 5 8 5 12 6

155

i 7 8 9 10 11 12

iY

26 26 32 25 40 26

1iX

4 6 4 4 10 2

2iX

7 9 4 8 5 3

n = 12 1iX∑ = 57

2iX∑ = 77

iY∑ = 341

21iX∑ = 387

22iX∑ = 563

1 2i iX X∑ = 347

1 iiX Y∑ = 1,797 2 iiX Y∑ = 2,083

Dengan menyelesaikan:

n 0b + 1b 1iX∑ + 2b 2iX∑ − iY∑ = 0 (I)

0b 1iX∑ + 1b 21iX∑ + 2b 1 2i iX X∑ − 1 iiX Y∑ = 0 (II)

0b 2iX∑ + 1b 1 2i iX X∑ + 2b 22iX∑ − 2 iiX Y∑ = 0 (III)

yaitu:

12 0b + 57 1b + 77 2b − 341 = 0 (I)

57 0b + 387 1b + 347 2b − 1,797 = 0 (II)

77 0b + 947 1b + 563 2b − 2,083 = 0 (III)

Diperoleh penyelesaian:

(I) ×19 ⇒

228 0b + 1,083 1b + 1,463 2b − 6,479 = 0

(II) × 4 ⇒

228 0b + 1,548 1b + 1,388 2b − 7,188 = 0

−465 1b + 75 2b + 709 = 0 (IV)

(I) ×77 ⇒

924 0b + 4,389 1b + 5,929 2b − 26,257 = 0

(III) × 12 ⇒

924 0b + 4,164 1b + 6,756 2b − 24,996 = 0

225 1b − 827 2b − 1,261 = 0 (V)

(IV) × −15 ⇒

6,975 1b − 1,125 2b − 10,635 = 0

(V) × 31 ⇒

6,975 1b −25,637 2b −39,091 = 0

24,512 2b +28,456 = 0

2b = −1.161

(V) ⇒

225 1b − (827)(−1.161) – 1.261 = 0

225 1b + 960.065 – 1.261 = 0

1b = 1.337

156

(I) ⇒ 12 0b + (57)(1.337) + (77)(−1.161) − 341 = 0

12 0b + 76.237 – 89.389 − 341 = 0

0b = 29.513

Estimasi persamaan garis regresi adalah:

ˆiY = 29.513 + 1.337 1iX − 1.161 2iX

Sebagai bahan perbandingan, pada bagan 5.1 diperlihatkan hasil

pengolahan data yang sama dengan progam komputer Minitab Release 14.

Bagan 5.1. Contoh keluaran program komputer untuk analisis regresi

linear ganda: estimasi koefisien regresi

Regression Analysis: Y versus X1, X2

The regression equation is

Y = 29.5 + 1.34 X1 - 1.16 X2

Predictor Coef SE Coef T P

Constant 29.513 2.112 13.97 0.000

X1 1.3375 0.1945 6.88 0.000

X2 -1.1609 0.2527 -4.59 0.001

S = 2.05089 R-Sq = 90.5% R-Sq (adj) = 88.3%

� Penguraian Jumlah Kuadrat dan Uji Hipotesis

A. Jumlah Kuadrat

1. Jumlah Kuadrat Total:

JKT = ( )

2

iY Y−∑

JKT =

( )2

2 ii

YY

n

∑−∑ ; db = n – 1 (5.8)

2. Jumlah Kuadrat Galat

JKG = ( )2 2ˆ

i i ie Y Y= −∑ ∑

JKG = 2

iY∑ − 0b iY∑ − 1b 1 iiX Y∑ − . . . − 1pb − ( )1 , ip i

X Y−∑ (5.9)

157

db = n – p

3. Jumlah Kuadrat Regresi:

JKR = JKT − JKG ; db = p – 1 (5.10)

B. Uji hipotesis

Untuk menguji hipotesis 0H : 1β = 2β = . . . = 1pβ − = 0 digunakan

uji F dengan statistik penguji:

ujiF = ( )( )

1JKR p

JKG n p

−

− (5.11)

yang berdistribusi F dengan db pembilang (p – 1) dan db penyebut (n – p).

Tabel 5.2 Tabel ANOVA untuk uji 0H : 1ββββ = 2ββββ = . . . = 1ββββ p- = 0

Sumber

variasi JK db KR ujiF

tabelF

Regresi JKR p − 1 KRR = 1

JKR

p − ujiF = KRR

KRG ( ) ( )1 , ;p n p

F α− −

Galat JKG n – p KRG =

JKG

n p−

Total JKT n − 1

Pengujian terhadap masing-masing koefisien regresi ( 0H : iβ = 0)

dapat dilakukan dengan uji Wald dengan statistik penguji:

ujit =

( )

ˆ

ˆˆ

j

jSE

β

β (5.12)

yang berdistribusi t dengan derajat bebas 1. Nilai-nilai

( )ˆˆjSE β umumnya

diperoleh dari keluaran program komputer (lihat contoh pada bagan 5.1).

Contoh 5.3:

Lihat kembali data pada contoh 5.2. Perhitungan jumlah kuadrat dan

kuadrat rerata-nya adalah:

158

JKT =

( )2

2

ii

YY

n

∑−∑

= 10,087 − 2

341

12 = 396.917

JKG = 2iY∑ − 0b i

Y∑ − 1b 1 iiX Y∑ − 2b 2 iiX Y∑

= 10,087 – (29.513)(341) – (1.337)(1,797) – (−1.161)(2,083)

= 37.885

JKR = JKT – JKG

= 396.917 – 37.885 = 359.061

dan: KRR = 1

JKR

p −

= 359.061

2 = 179.531

KRG = JKG

n p−

= 37.855

9 = 4.206

Tabel ANOVA-nya dan uji F untuk hipotesis 0H : 1β = 2β = 0

dengan tingkat signifikansi α = 0.05 diperlihatkan pada tabel 5.3.

Tabel 5.3 Tabel ANOVA untuk model regresi

iY = 29.513 + 1.337 1iX − 1.161 2iX + ie

Sumber

variasi JK db KR ujiF

tabelF

Regresi 359.061 2 179.531 ujiF = 179.531

4.206 ( )2,9;0.05

F =

4.26 Galat 37.855 9 4.206 = 42.68

Total 396.917 11

Sebagai perbandingan, pada bagan 5.2 diperlihatkan hasil pengolahan

data yang sama dengan progam komputer Minitab Release 14.

159

Bagan 5.2. Contoh keluaran program komputer untuk analisis regresi

linear ganda: tabel ANOVA

Regression Analysis: Y versus X1, X2

Analysis of Variance

Source DF SS MS F P

Regression 2 359.06 179.53 42.68 0.000

Residual Error 9 37.86 4.21

Total 11 396.92

Source DF Seq SS

X1 1 270.26

X2 1 88.80

� Koefisien Determinasi Ganda

Koefisien determinasi ganda menyatakan proporsi variansi Y yang

dapat dijelaskan oleh (p − 1) variabel independen secara bersama.

2R =

JKR

JKT =

JKT JKG

JKT

−= 1 −

JKG

JKT (5.13)

Contoh 5.4:

Lihat kembali data pada contoh 5.2. Pada contoh 5.3 telah dihitung

nilai-nilai jumlah kuadrat-nya:

JKR = 359.061 JKT =396.917

2R =

JKR

JKT

=

359.061

396.917 = 0.905

(pada keluaran program komputer di bagian akhir contoh 5.2, nilai koefisien

determinasi 2R adalah 90.5%)

160

5.2 VARIABEL INDIKATOR

� Pengertian Variabel Indikator

Variabel-variabel pada model regresi linear dalam pembahasan

terdahulu, baik variabel independen maupun dependen selalu berskala

kontinu ataupun sekurang-kurangnya numerik. Adakalanya harus digunakan

variabel independen ataupun dependen yang berskala kategorik, baik

dikotomi ataupun politomi. Inklusi variabel independen yang berskala

kategorik dalam model regresi linear harus dilakukan dalam bentuk variabel

indikator (variabel dummy), sedangkan jika variabel dependen yang berskala

kategorik dianjurkan untuk menggunakan model regresi logistik.

Nilai-nilai bagi variabel indikator hanya dinyatakan sebagai 0 atau 1,

walaupun kadang-kadang yang digunakan adalah nilai +1 dan −1.

� Variabel Indikator bagi Variabel Berskala Dikotomi

Misalkan jenis kelamin yang berskala dikotomi (pria dan wanita)

akan digunakan sebagai variabel independen dalam model regresi linear,

maka digunakan variabel indikator X dengan kriteria nilai:

X = 1 jika subjek berjenis kelamin pria,

X = 0 jika subjek berjenis kelamin wanita

� Variabel Indikator bagi Variabel Berskala Politomi

Variabel kategorik dengan r kategori direpresentasikan sebagai (r –

1) variabel indikator. Representasi variabel indikator untuk variabel

kategorik dengan tiga dan empat kategori diperlihatkan pada tabel 5.4.a dan

5.4.b.

Tabel 5.4. Variabel indikator untuk variabel kategorik

a. Dengan tiga kategori

Kategori Variabel indikator

1X 2X

I 0 0

II 1 0

III 1 1

161

b. Dengan empat kategori

Kategori Variabel indikator

1X 2X 3X

I 0 0 0

II 1 0 0

III 1 1 0

IV 1 1 1

Contoh 5.5:

Dimiliki data skala L (Lie; Kebohongan) MMPI-2, usia, jenis

kelamin, dan fakultas 8 orang mahasiswa Gunadarma seperti terlihat pada

tabel 5.5. Dari data tersebut hendak diestimasi model regresi linear dengan

skala L sebagai variabel dependen; serta usia, jenis kelamin, dan fakultas

sebagai variabel independen.

Tabel 5.5. Skala L MMPI-2 pada 8 orang mahasiswa Gunadarma, 2002

No. subjek Skala L Usia (th) Jenis kelamin Fakultas

1 6 19 Wanita Psikologi

2 2 18 Pria Teknik Industri

3 8 18 Wanita Ilmu Komputer

4 4 19 Pria Ilmu Komputer

5 3 21 Pria Ekonomi

6 5 21 Pria Ilmu Komputer

7 6 20 Pria Ilmu Komputer

8 6 19 Wanita Ilmu Komputer

Skala L dinyatakan sebagai variabel dependen Y; usia yang berskala

kontinu (dalam tahun) dinyatakan sebagai variabel independen pertama 1X ;

jenis kelamin yang berskala dikotomi dinyatakan sebagai variabel

independen kedua 2X dengan kriteria:

2X = 1 untuk mahasiswa pria

2X = 0 untuk mahasiswa wanita.

Fakultas yang terdiri atas 4 kategori dinyatakan dengan 3 varibel

indikator 3X , 4X , dan 5X dengan kriteria seperti terlihat pada tabel 5.6.

162

Tabel 5.6. Representasi fakultas mahasiswa Gunadarma dalam bentuk

variabel indikator

Fakultas Variabel indikator

3X 4X 5X

Ilmu Komputer 0 0 0

Ekonomi 1 0 0

Teknik Industri 1 1 0

Psikologi 1 1 1

Model regresi yang digunakan ialah:

iY = 0β + 1β 1iX + 2β 2iX + 3β 3iX + 4β 4iX + 5β 5iX + iε

Model diestimasi dari basis pada tabel 5.7 yang disusun sebagai representasi

untuk data pada tabel 5.5.

Tabel 5.7. Basis data skala L MMPI-2 8 orang mahasiswa Gunadarma,

2002

No. Y 1X 2X 3X 4X 5X

1 6 19 0 1 1 1

2 2 18 1 1 1 0

3 8 18 0 0 0 0

4 4 19 1 0 0 0

5 3 21 1 1 0 0

6 5 21 1 0 0 0

7 6 20 1 0 0 0

8 6 19 0 0 0 0

5.3 KOEFISIEN KORELASI GANDA DAN KOEFISIEN

KORELASI PARSIAL

� Koefisien Korelasi Ganda

Koefisien korelasi ganda menyatakan:

- Korelasi antara variabel dependen Y dengan himpunan (p – 1) variabel

independen secara bersama, yaitu Y dengan { 1X , 2X , . . . , 1pX − };

atau:

163

- Korelasi antara variabel independen Y dengan prediksi Y yang

dihasilkan oleh model regresi ganda dengan (p – 1) variabel

independen, yaitu Y dengan Y .

ˆYY

r = ( ) 1, 2, . . . , 1y p

r−

= ( )( )

( ) ( )22

ˆ ˆ

i i

Y Y Y Y

− −∑

− −∑ ∑

(5.14.a)

atau: ˆYY

r =

( )

( ) ( )2

22 2

ˆˆ

i i

iii i

Y YYY

n

YYY Y

n n

∑ ∑−∑

∑∑ − −∑ ∑

(5.14.b)

Nilai kuadratnya sama dengan koefisien determinasi ganda:

( )2

ˆYYr =

( )( ) 1, 2, . . . , 1

2

y pr

− = 2R (5.15)

Contoh 5.6:

Lihat kembali data pada contoh 5.2 dan estimasi persamaan garis

regresinya ˆiY = 29.513 + 1.337 1iX − 1.161 2iX . Untuk menghitung koefisien

korelasi gandanya terlebih dahulu dihitung nilai-nilai prediksi ˆiY dengan

menggunakan persamaan garis regresi estimasi tersebut dan hasilnya

diperlihatkan pada tabel 5.8. serta diagram 5.1.

Tabel 5.8. Daftar nilai variabel dependen iY dan prediksinya untuk

contoh perhitungan koefisien korelasi ganda

i 1 2 3 4 5 6

iY 26 31 26 38 18 27

ˆiY 26.38 31.73 28.25 38.42 16.92 23.88

i 7 8 9 10 11 12

iY 26 26 32 25 40 26

ˆiY 26.74 27.09 30.22 25.58 37.08 28.70

164

Diagram 5.1. Diagram tebar variabel dependen Y dan nilai-nilai

prediksinya Y

Korelasi antara Y dan ˆiY dapat dihitung dengan menggunakan rumus

korelasi ataupun dengan regresi linear:

ˆYY

r = 0.9511

Koefisien determinasi ganda adalah:

2R = ( )2

ˆYYr

= 20.9511 = 0.905

Atau sebaliknya, koefisien korelasi ganda dapat dihitung sebagai akar positif

koefisien determinasi ganda. Pada contoh 5.4 telah dihitung nilai koefisien

determinasi ganda:

2R = 0.905

ˆYYr = 2R

165

= 0.905 = 0.9511

� Koefisien Korelasi Parsial

Koefisien korelasi parsial menyatakan korelasi antara variabel

dependen Y dengan salah satu variabel independen jX yang disesuaikan

dengan (memperhitungkan keberadaan satu atau lebih) variabel independen

lainnya:

Misalnya pada persamaan garis regresi:

ˆiY = 0β + 1β 1iX + 2β 2iX + 3β 3iX

1. Korelasi antara variabel dependen Y dan variabel independen 1X

dengan memperhitungkan pengaruh variabel independen 2X adalah:

12y

r =

( )( )1 2 12

2 22 12

.

1 1

y y

y

r r r

r r

−

− − (5.16.a)

1yr : Koefisien korelasi antara Y dan 1X

2yr : Koefisien korelasi antara Y dan 2X

12r : Koefisien korelasi antara 1X dan 2X

2. Korelasi antara variabel dependen Y dan variabel independen 1X

dengan memperhitungkan pengaruh variabel independen 3X adalah:

13y

r =

( )( )1 3 13

2 23 13

.

1 1

y y

y

r r r

r r

−

− − (5.16.b)

3. Korelasi antara variabel dependen Y dan variabel independen 1X

dengan memperhitungkan pengaruh variabel independen 2X dan 3X

secara bersama adalah:

123y

r =

( )( )3 212 13 2

2 2

3 2 13 2

.

1 1

yy

y

r r r

r r

−

− −

=

( )( )2 313 12 3

2 2

2 3 12 3

.

1 1

yy

y

r r r

r r

−

− −

(5.16.c)

1yr : Koefisien korelasi antara Y dan 1X

2yr : Koefisien korelasi antara Y dan 2X

12r : Koefisien korelasi antara 1X dan 2X

166

Contoh 5.7:

Misalkan dari persamaan regresi ˆiY = 0b + 1b 1iX + 2b 2iX + 3b 3iX

diketahui matriks korelasi Y, 1X , 2X , dan 3X :

Tabel 5.9. Contoh penyajian matriks korelasi Y, 1X , 2X , dan 3X untuk

perhitungan koefisien korelasi parsial

Y 1X 2X 3X

Y 1.00

1X 0.64 1.00

2X 0.51 0.27 1.00

3X 0.74 0.56 0.28 1.00

Maka:

12yr =

( )( )1 2 12

2 22 12

.

1 1

y y

y

r r r

r r

−

− − 13 2

r = ( )( )

13 12 23

2 212 23

.

1 1

r r r

r r

−

− −

=

( )( )

( )( )2 2

0.64 0.51 0.27

1 0.51 1 0.27

−

− −

=

( )( )

( )( )2 2

0.56 0.27 0.28

1 0.27 1 0.28

−

− −

= 0.61 = 0.52

13yr =

( )( )1 3 13

2 23 13

.

1 1

y y

y

r r r

r r

−

− − 3 2y

r = ( )( )

3 2 23

2 22 23

.

1 1

y y

y

r r r

r r

−

− −

=

( )( )

( )( )2 2

0.64 0.74 0.56

1 0.74 1 0.56

−

− −

=

( )( )

( )( )2 2

0.74 0.51 0.28

1 0.51 1 0.28

−

− −

= 0.40 = 0.72

123yr =

( )( )3 212 13 2

2 2

3 2 13 2

.

1 1

yy

y

r r r

r r

−

− −

=

( )( )

( )( )2 2

0.61 0.72 0.52

1 0.72 1 0.52

−

− −

= 0.39

167

LAMPIRAN 5A: MODEL REGRESI LOGISTIK

Dalam bab 5, subbab 5.2 telah dibahas mengenai penggunaan

variabel indikator untuk merepresentasikan variabel independen kategorik

dalam model regresi linear. Adakalanya dalam model regresi didapatkan juga

variabel dependen kategorik, baik yang berskala dikotomi ataupun politomi.

Dalam keadaan demikian, model regresi yang digunakan bukan lagi model

regresi linear sebagaimana yang telah dibahas dalam bab 4 dan 5, melainkan

model regresi logistik (model logit).

Model regresi logistik sederhana (simple logistic regression), dengan

satu variabel independen X dan variabel dependen Y berskala dikotomi

adalah:

logit ( )P Y = ln ( )

( )1

P Y

− = 0β + 1β X (5.17)

atau: ( )P Y = ( )0 1

1

1 exp Xβ β+ − + (5.17.a)

dengan ( )P Y menyatakan probabilitas bahwa variabel dependen Y bernilai

sama dengan satu.

Apabila variabel independen X lebih daripada satu, digunakan model

regresi logistik ganda (multiple logistic regression):

logit ( )P Y = ln ( )

( )1

P Y

− = 0β + 1β 1X + . . . + 1pβ − 1pX −

atau: ( )P Y = ( )0 1 1 1 1

1

1 exp ... p pX Xβ β β − −+ − + + + (5.18.a)

168

Jika variabel dependen Y berskala politomi, digunakan model regresi

politomi yang dibedakan atas:

- Model regresi logistik multinomial: digunakan jika variabel dependen Y

berskala politomi nominal.

- Model regresi logistik ordinal: digunakan jika variabel dependen Y

berskala politomi ordinal.

Untuk estimasi koefisien regresi pada model regresi logistik, yang

digunakan bukan metode kuadrat terkecil, melainkan metode likelihood

maksimum (maximum likelihood method), yaitu pencarian nilai parameter

yang jika dimasukkan dalam model akan memaksimumkan probabilitas

untuk memperoleh distribusi nilai sebagaimana yang ada dalam sampel.

Estimasi koefisien regresi dengan metode likelihood maksimum tak

dapat dilakukan dengan menggunakan rumus-rumus yang relatif sederhana

seperti pada estimasi koefisien model regresi linear dengan metode kuadrat

kecil. Di sini diperlukan proses iterasi yang cukup panjang menggunakan

program komputer.

Contoh V.I:

Dimiliki data nyeri kepala pada 218 orang mahasiswa Gunadarma

dengan variabel dependen NKTT (nyeri kepala ada / NKTT = 1; nyeri kepala

tidak ada / NKTT = 0). Sebagai variabel independen digunakan variabel

Usia (dalam tahun), Sex (jenis kelamin pria / Sex = 1; jenis kelamin wanita

/ Sex = 0), dan BMI (indeks massa tubuh; dalam kg/m2). Hasil pengolahan

data yang menggunakan model regresi logistik ganda dengan program Stata

8.0 diperlihatkan pada bagan V.1 di bawah ini.

169

Bagan V.I Contoh keluaran progam komputer untuk analisis regresi

logistik ganda dengan program komputer Stata 8.0

. logit NKTT Usia Sex BMI

Iteration 0: log likelihood = -151.09691

Iteration 1: log likelihood = -148.66589

Iteration 2: log likelihood = -148.66472

Logit estimates Number of obs = 218

LR chi2(3) = 4.86

Prob>chi2 = 0.1820

Log likelihood = -148.66472 Pseudo R2 = 0.0161

NKTT Coef. Std. Err. z P>|z| [95%Conf.Interval]

Usia 0.1399613 0.1132984 1.24 0.217 -0.0820994 0.3620219

Sex -0.3150595 0.3001361 -1.05 0.294 -0.9033155 0.2731965

BMI 0.0521261 0.0371095 1.40 0.160 -0.0206072 0.1248594

_cons -3.658059 2.386413 -1.53 0.125 -8.335342 1.019224

170

LATIHAN 5

Bagian Pertama

Pilihlah satu jawaban yang paling benar!

1. Estimasi koefisien regresi pada model regresi linear dilakukan

dengan:

A. Meminimumkan kuadrat jumlah residual

B. Meminimumkan jumlah kuadrat residual

C. Memaksimumkann kuadrat jumlah residual

D. Memaksimumkan jumlah kuadrat residual

2. Residual dalam diagram tebar menyatakan jarak dari titik tebar ke

garis regresinya, yang diukur sebagai:

A. Jarak dari titik tebar tegak lurus ke garis regresi.

B. Jarak dari titik tebar dalam arah vertikal ke garis regresi.

C. Jarak dari titik tebar dalam arah horizontal ke garis regresi.

D. Semuanya salah

3. Aplikasi metode kuadrat terkecil terhadap persamaan garis regresi

0 1 1 2 2ˆi i iY X Xβ β β= + + akan menghasilkan:

A. Dua persamaan normal

B. Tiga persamaan normal

C. Empat persamaan normal

D. Semuanya salah

4. Jumlah kuadrat total pada model regresi linear ganda adalah:

A. Kuadrat jumlah deviasi variabel dependen terhadap reratanya

B. Kuadrat jumlah deviasi variabel independen terhadap reratanya

C. Jumlah kuadrat deviasi variabel dependen terhadap reratanya

D. Jumlah kuadrat deviasi variabel independen terhadap reratanya

5. Jumlah kuadrat galat pada model regresi linear ganda adalah:

A. Kuadrat jumlah residual variabel dependen

B. Kuadrat jumlah residual variabel independen

C. Jumlah kuadrat residual variabel dependen

D. Jumlah kuadrat residual variabel independen

171

6. Untuk menguji hipotesis 0 1 2 1: ... 0pH β β β −= = = = pada model

regresi linear ganda digunakan:

A. Uji t C. Uji F

B. Uji Wald D. Semuanya benar

7. Pada model regresi 0 1 1 2 2 3 3i i i i iY X X X eβ β β β= + + + + dengan ukuran

sampel n = 25, derajat bebas untuk jumlah galat-nya adalah:

A. 3 C. 22

B. 21 D. 24

8. Proporsi variansi dependen pada model regresi linear ganda yang

dapat dijelaskan oleh seluruh variabel independen yang ada dalam

model secara bersama dinamakan:

A. Koefisien korelasi biserial C. Koefisien korelasi ganda

B. Koefisien korelasi parsial D. Korelasi determinasi ganda

9. Variabel kategorik yang direpresentasikan oleh empat variabel

indikator dalam suatu model regresi linear memiliki:

A. Tiga kategori C. Lima kategori

B. Empat kategori D. Semuanya salah

10. Korelasi antara variabel dependen pada model regresi linear ganda

dengan himpunan keseluruhan variabel independen yang ada dalam

model secara bersama dinamakan :

A. Koefisien korelasi biserial C. Koefisien korelasi ganda

B. Koefisien korelasi parsial D. Korelasi determinasi ganda

11. Nilai koefisien korelasi ganda sama dengan:

A. Akar positif koefisien determinasi ganda

B. Akar negatif koefisien determinasi ganda

C. Koefisien determinasi ganda

D. Kuadrat koefisien determinas ganda

12. Korelasi antara variabel dependen pada model regresi linear ganda

dengan salah satu variabel independen dengan memperhitungkan

keberadaan variabel independen lain dalam model dinamakan:

A. Koefisien korelasi biserial C. Koefisien korelasi ganda

B. Koefisien korelasi parsial D. Korelasi determinasi ganda

172

Bagian Kedua

Pilihlah satu jawaban yang paling benar!

Dimiliki data tentang kepuasan kerja pada sekelompok karyawan

universitas swasta di Jakarta yang akan diolah dengan model regresi linear

ganda. Variabel dependen yaitu kepuasan kerja (KEPUASAN) akan

diregresikan terhadap variabel independen pusat pengendalian (locus of

control; LOCUS), pola perilaku (pattern of behavior; POLA), dan

pemenuhan harapan penggajian (PHP). Data diolah dengan program SPSS

12.0, dan keluarannya diperlihatkan pada bagan-bagan di bawah ini.

Model Summary

Model

R

R Square

Adjusted R Square

Std. Error of the Estimate

1 .834(a) .696 .684 9.725

ANOVA(b)

Model

Sum of Squares

df

Mean Square

F

Sig.

1 Regression Residual Total

17298.096 7566.607 24864.702

3 80 83

5766.032 94.583

60.963 .000(a)

a Predictors: (Constant), PHP, POLA, LOCUS b Dependent Variable: KEPUASAN Coefficients(a)

Model

Unstandardized Coefficients

Standardized Coefficients

t

Sig.

B Std. Error Beta

1 (Constant) LOCUS POLA PHP

-21.340 1.052 1.909 1.430

14.297 .278 .416 .219

.284 .298 .493

-1.493 3.780 4.588 6.534

.139

.000

a Dependent Variable: KEPUASAN

173

1. Jumlah karyawan yang menjadi anggota sampel adalah:

A. 60 orang C. 84 orang

B. 80 orang D. 85 orang

2. Jika LOCUS = 0, POLA = 0, dan PHP = 0, maka nilai KEPUASAN

adalah:

A. -21.340 C. 1.909

B. 1.052 D. 1.430

3. Estimasi persamaan garis regresi adalah:

A. KEPUASAN = -21.340 + 1.052 LOCUS + 1.909 POLA + 1.430

PHP

B. KEPUASAN =14.297 + 0.278 LOCUS + 0.416 POLA + 0.219

PHP

C. KEPUASAN = -1.439 + 3.780 LOCUS + 4.588 POLA + 6.534

PHP

D. Semuanya salah

4. Kuadrat rerata galat adalah:

A. 94.583 C. 7,566.607

B. 5,766.032 D. 17,298.096

5. Derajat bebas jumlah kuadrat regresi adalah:

A. 3 C. 83

B. 80 D. Semuanya salah

6. Koefisien korelasi ganda adalah:

A. 0.684 C. 0.834

B. 0.696 D. Semuanya salah

7. Koefisien determinasi ganda adalah:

A. 0.684 C. 0.834

B. 0.696 D. Semuanya salah

8. Statistik penguji untuk uji hipotesis 0 1 2 3: 0H β β β= = = adalah:

A. 3.780 C. 6.534

B. 4.588 D. 60.963

9. Statistik penguji untuk uji hipotesis 0 2: 0H β = adalah:

A. 3.780 C. 6.534

B. 4.588 D. 60.963

174

10. Dengan tingkat signifikansi α = 0.01, maka kesimpulan bagi uji

hipotesis 0 1 2 3: 0H β β β= = = adalah:

A. 0H ditolak

B. 0H tidak ditolak

C. A) dan B) keduanya mungkin benar

D. Tak dapat dibuat kesimpulan

175

BAB 6

ANALISIS VARIANSI

Analisis variansi (analysis of variance; ANOVA) adalah metode

statistika untuk menganalisis hubungan antara:

� Variabel independen kategorik yang jumlah kategorinya lebih daripada

dua dengan:

� Variabel dependen numerik.

Ikhtisar analisis yang digunakan dalam Metode Statistika Parametrik

untuk mengkaji hubungan antara dua variabel dapat dilihat pada lampiran

6A.

Variabel independen kategorik pada ANOVA dinamakan ‘perlakuan’

(treatment; tritmen) dan masing-masing kategorinya disebut ‘taraf’

perlakuan. Berdasarkan jumlah variabel independennya (jumlah perlakuan),

dikenal analisis variansi 1-arah (one-way ANOVA), analisis variansi 2-arah

(two-way ANOVA), dan seterusnya.

6.1. ANALISIS VARIANSI 1-ARAH

Contoh 6.1:

Beberapa contoh analisis variansi 1-arah yaitu:

a. Misalkan dimiliki lima (k = 5) metode pengajaran dan sejumlah siswa,

maka terdapat lima populasi hipotetis, masing-masing terdiri atas siswa

yang diajar dengan satu metode pengajaran tertentu. Dengan ANOVA

hendak dibandingkan rerata nilai ujian kelima kelompok siswa.

b. Misalkan terdapat tiga (k = 3) kota, hendak dibandingkan rerata

penghasilan bulanan keluarga di tiga kota tersebut.

c. Misalkan dimiliki empat (k = 4) varietas padi, hendak dibandingkan

rerata produksi per ha sawah yang ditanami dengan empat varietas padi

tersebut.

176

� Variansi Dalam-Kelompok dan Variansi Antar-Kelompok

Misalkan dimiliki tiga kelompok data 1Y , 2Y , dan 3Y ,

ketiganya

berasal dari populasi normal dengan rerata 1µ , 2µ , dan 3µ

dan variansi yang

sama 2σ (diasumsikan

21σ =

22σ =

23σ =

2σ ). Misalkan pula hendak diuji

apakah ketiga kelompok data 1Y , 2Y , dan 3Y ‘dapat dianggap’ berasal dari

satu populasi yang sama atau berasal dari dua atau lebih populasi yang

berbeda.

Dalam konteks analisis variansi, variansi untuk masing-masing

kelompok data 1Y , 2Y , dan 3Y , yaitu 2σ disebut sebagai variansi ‘dalam

kelompok’ (within group), sedangkan variansi antar nilai-nilai rerata 1µ , 2µ ,

dan 3µ disebut sebagai variansi ‘antar kelompok’ (between groups).

Semakin ‘terpisah’ ketiga kelompok data 1Y , 2Y , dan 3Y , semakin

besar pula probabilitas bahwa ketiganya berasal dari populasi berbeda ( 0H :

1µ = 2µ = 3µ ditolak). Pada diagram 6.1 tampak bahwa ketiganya akan

‘terpisah’ jika:

- Variansi antar-kelompok lebih besar,

- Variansi dalam-kelompok lebih kecil;

atau dengan kata lain:

va riansi antar-kelompok

variansi dalam-kelompok lebih besar

177

Diagram 6.1. Tiga kelompok data yang dapat berasal dari satu populasi

yang sama atau dua/lebih populasi yang berbeda. Atas: ketiganya berasal dari populasi yang sama, variansi dalam-kelompok

yang besar dan atau variansi antar-kelompok yang kecil.

Bawah: ketiganya berasal dari populasi berbeda, variansi dalam kelompok

kecil dan /atau variansi antar kelompok besar.

Jika yang hendak diuji adalah hipotesis 0H : 1µ = 2µ = 3µ maka 0H

akan ditolak ( 1Y , 2Y , dan 3Y dianggap berasal dari populasi berbeda) jika

nilai va riansi antar-kelompok

variansi dalam-kelompok-nya melebihi nilai tertentu yang ada pada

tabel nilai distribusi sampling.

Pada pembahasan selanjutnya dalam analisis variansi, Y merupakan

satu variabel (variabel dependen) dengan subskrip 1, 2, dan 3 menyatakan

kelompok-kelompok (taraf-taraf perlakuan).

� Model dan Struktur Data

Struktur data pada analisis variansi 1-arah diperlihatkan pada matriks

6.1, yaitu struktur data yang digunakan untuk rancangan randomisasi lengkap

(completely randomized design).

178

Matriks 6.1. Struktur data pada analisis variansi 1-arah

Kategori

(taraf)

perlakuan

Kategori (taraf) perlakuan

Total 1 2 . . . k

Data

11y 21y 1ky

12y 22y 2ky

. . . . . . . . . . . .

11ny 22ny

kk ny

Jumlah

kolom 1y . 2y .

ky .

y. .

Ukuran

sampel 1n 2n . . . kn n

Rerata

sampel 1y 2y . . . ky y

Rerata

populasi 1µ 2µ . . . kµ µ

Variansi

sampel 21s 2

2s . . . 2ks 2

s

Model pada analisis variansi 1-arah (model dalam populasi) adalah:

ijY = µ + 1τ + ijε (6.1)

µ : rerata populasi

1τ : efek perlakuan ke-i

ijε : galat pada subjek ke-j dalam kelompok perlakuan ke-i

Estimasi diperoleh dari penguraian nilai observasi yang ada dalam

sampel:

ijy = y + ( iy − y ) + ( ijy − iy ) (6.2)

atau:

Nilai observasi = rerata utama + deviasi oleh perlakuan + galat

ijy : nilai observasi (pada subjek) ke-j dalam kelompok perlakuan ke-i

iy : nilai rerata observasi pada kelompok perlakuan ke-i

y : nilai rerata utama (grand mean)

179

� Penguraian dan Perhitungan Jumlah Kuadrat

Estimasi untuk model pada analisis variansi 1-arah dapat dituliskan

sebagai:

ijy − y = ( iy − y ) + ( ijy − iy )

Secara matematis dapat dibuktikan bahwa:

( )2

1 1

ik

iji j

n

y y= =

−∑∑ = ( )2

1

k

ii

y y=

−∑ + ( )2

1 1

ik

iji j

n

y yi

= =

−∑∑

JKT = JKP + JKG (6.3)

� Jumlah Kuadrat Total (JKT; total sum of squares; SSTo):

JKT = ( )2

1 1

ik

iji j

n

y y= =

−∑∑ = 2

1 1

ik

iji j

n

y= =∑∑ −

2

1 1

ik

iji j

n

y

n

= =

∑∑

JKT = 2

1 1

ik

iji j

n

y= =∑∑ −

( )

2y

n

. . ; db = n – 1 (6.4)

� Jumlah Kuadrat Perlakuan (JKP; treatment sum of squares; SSTr):

JKP = ( )2

1

k

ii

y y=

−∑ =

2

1

i

ijkj

i j

n

y

n

=

∑

∑ −

2

1 1

ik

iji j

n

y

n

= =

∑∑

JKP = ( )

2

1

ki

i i

y

n=∑ . −

( )

2y

n

. . ; db = k – 1 (6.5)

� Jumlah Kuadrat Galat (JKG, residual sum of squares; error sum of

squares; SSE):

JKG = ( )2

1 1

ik

iji j

n

y yi

= =

−∑∑ = JKT – JKP

JKG = JKT – JKP ; db = (n – 1) – (k – 1) (6.3.a)

db = n − k

180

� Kuadrat Rerata

Kuadrat rerata adalah jumlah kuadrat dibagi derajat bebasnya:

Kuadrat rerata (mean square) = jumlah kuadrat

derajat bebas

Kuadrat rerata pada analisis variansi merupakan estimator untuk

variansi:

- Kuadrat rerata perlakuan merupakan estimator bagi variansi antar-

kelompok (between-groups variance).

- Kuadrat rerata galat merupakan estimator bagi variansi dalam

kelompok (within-group variance).

� Kuadrat rerata perlakuan (KRP; treatment mean square; MSTr):

KRP = -1

JKP

k (6.6)

� Kuadrat rerata galat (KRG; error mean square; MSE):

KRG = -

JKG

n k (6.7)

Dengan asumsi 21σ =

22σ =

23σ =

2σ , maka KRG (MSE) merupakan

estimator bagi 2σ (seperti 2

pooleds yang juga menjadi estimator bagi 2σ pada

uji t dengan variansi sama 21σ =

22σ =

2σ ).

� Tabel ANOVA untuk Analisis Variansi 1-Arah

Hasil perhitungan nilai-nilai jumlah kuadrat, kuadrat rerata, dan

statistik penguji (beserta nilai titik kritis) biasanya disajikan dalam sebuah

tabel ANOVA, yang bentuk umumnya diperlihatkan pada tabel 6.1 di bawah

ini.

181

Tabel 6.1. Tabel ANOVA 1-arah

Sumber

variasi JK db KR ujiF

tabelF

Perlakuan JKP k − 1

KRP

= -1

JKP

k

ujiF

= KRP

KRG

( ) ( )1 ; ;k n kF

α− −

Galat JKG n – k

KRG

= -

JKG

n k

Total JKT n − 1

JK: jumlah kuadrat; KR: kuadrat rerata

� Langkah-langkah Uji Hipotesis

Langkah-langkah uji hipotesis pada ANOVA adalah sebagai berikut:

1. Jenis uji statistik: analisis variansi 1-arah.

2. Hipotesis: 0H : 1µ = 2µ = . . . = kµ (6.8.a)

1H : Tidak semua nilai rerata sama (6.8.b)

atau: iµ ≠ jµ untuk paling sedikit satu pasangan nilai (i; j)

3. Tingkat signifikansi: α = 0.01, 0.05, atau 0.10.

4. Daerah kritis: F > ( ) ( )1 ; ;k n kF

α− − (6.9)

5. Statistik penguji:

ujiF = KRP

KRG =

( )( )

1JKP k

JKG n k

−

− (6.10)

yang berdistribusi F dengan derajat bebas pembilang (k – 1) dan derajat

bebas penyebut (n – k).

5. Kesimpulan: 0H ditolak jika statistik uji terletak pada daerah kritis dan

0H tidak ditolak jika statistik uji tidak terletak pada daerah kritis.

� Hubungan Antara Analisis Regresi dan Analisis Variansi

Analisis regresi dan analisis variansi sesungguhnya merupakan dua

teknik analisis data yang identik, yang tergolong dalam ‘model linear’.

Perbedaannya terletak pada model yang digunakan untuk

Analisis regresi menekankan penyajian koefisien regresi serta hubungan

antara variabel independen dan variabel dependen, sedangkan analisis

variansi menekankan penyajian fa

jumlah kuadrat-jumlah kuadrat rerata, serta uji hipotesis (lihat diagram 6.2).

Diagram 6.2. Analisis regresi dan analisis variansi.

(a) Analisis regresi:

1µ = E (Y | 1X = 50), 2µ = E (

(b) Analisis variansi: Taraf perlakuan hanya dinyatakan sebagai kelompok

I, II, dan III.

Data yang sama akan memberikan hasil uji hipotesis (nilai

sama pula jika diolah baik dengan analisis regresi maupun analisis variansi.

Contoh 6.2:

Untuk membandingkan penghasilan tahunan keluarga (dalam jutaan

rupiah) di tiga kota A, B, dan C, diambil sampel acak masing

keluarga dari kota A, kota B, dan kota

berikut:

182

Perbedaannya terletak pada model yang digunakan untuk menjelaskan data.

Analisis regresi menekankan penyajian koefisien regresi serta hubungan

antara variabel independen dan variabel dependen, sedangkan analisis

variansi menekankan penyajian faktor-faktor eksperimental, penguraian

t rerata, serta uji hipotesis (lihat diagram 6.2).

Diagram 6.2. Analisis regresi dan analisis variansi.

(Y | 2X = 60), 3µ = E (Y | 3X = 70).

: Taraf perlakuan hanya dinyatakan sebagai kelompok

Data yang sama akan memberikan hasil uji hipotesis (nilai-p) yang

a diolah baik dengan analisis regresi maupun analisis variansi.

Untuk membandingkan penghasilan tahunan keluarga (dalam jutaan

, diambil sampel acak masing-masing empat

ota C. Hasil pengamatan adalah sebagai

183

Tabel 6.2. Data penghasilan tahunan keluarga di kota A, B, dan C

Perlakuan Total

1 2 3

19 16 13

18 11 16

21 13 18

18 14 11

iy . 76 54 58 188

2ij

j

y∑ 1,450 742 870 3,062

JKT = 2

1 1

ik

iji j

n

y= =∑∑ −

( )

2y

n

. .

= 2

19

1 +

218

1 + . . . +

216

1 + . . . +

211

1 −

2188

12

= 3,062 − 2

188

12 = 116.67

JKP = ( )

2

1

ki

i i

y

n=∑ .

− ( )

2y

n

. .

= 2

76

4 +

254

4 +

258

4 −

2188

12 = 68.67

JKG = JKT – JKP = 116.67 – 68.67 = 48

Uji hipotesis:

1. Jenis uji statistik: analisis variansi 1-arah

2. Hipotesis: 0H : 1µ = 2µ = 3µ

1H : Tidak semua nilai rerata sama

3. Tingkat signifikansi: α = 0.05.

4. Daerah kritis: F > 2; 9; 0.05F yaitu F > 4.26

5. Statistik penguji:

ujiF = KRP

KRG =

( )( )

1JKP k

JKG n k

−

184

yang berdistribusi F dengan derajat bebas pembilang (k – 1) = 3 – 1 = 2

dan derajat bebas penyebut (n – k) = 12 – 3 = 9.

Perhitungan: lihat tabel

Tabel 6.3. Tabel ANOVA untuk perbandingan penghasilan tahunan

keluarga di kota A, B, dan C

Sumber variasi JK db KR ujiF tabelF

Perlakuan 68.67 2 34.33 6.44 4.26

Galat 48 9 5.33

Total 116.67 11

6. Kesimpulan: 0H ditolak karena ujiF = 6.44 > tabelF = 4.26, sehingga

dapat disimpulkan bahwa pada tingkat signifikansi 0.05 terdapat

perbedaan yang bermakna secara statistik antara penghasilan tahunan

keluarga di tiga kota A, B dan C.

Catatan:

Pada keputusan untuk menolak 0H dengan ANOVA hanya dapat

disimpulkan bahwa tidak semua nilai rerata sama, namun untuk mengetahui

nilai rerata mana saja yang berbeda dengan yang lainnya, ataupun nilai rerata

mana yang lebih besar / lebih kecil, harus dilakukan analisis lebih lanjut,

yaitu dengan perbandingan ganda (multiple comparisons; lihat lampiran 6E).

6.2. ANALISIS VARIANSI 2-ARAH DENGAN INTERAKSI

Contoh 6.3:

Beberapa contoh analisis variansi 2-arah yaitu:

a. Misalkan dimiliki siswa pada tiga sekolah (r = 3) dan empat metode

pengajaran (c = 4) untuk diteliti. Hendak dibandingkan ketiga sekolah,

keempat metode pengajaran, dan dapat pula diteliti kemungkinan efek

interaksi antara sekolah dengan metode pengajaran.

b. Misalkan terdapat tiga kota (r = 3). Pekerja di ketiga kota tersebut

dibedakan menurut jenis kelaminnya (c = 2). Hendak dibandingkan

penghasilan rata-rata pekerja pria dan wanita, penghasilan rata-rata

pekerja di ketiga kota, dan kemungkinan efek interaksi antara kota

dengan jenis kelamin.

185

c. Misalkan dimiliki empat varietas padi (r = 4) dan tiga jenis pupuk (c =

3). Hendak dibandingkan produksi rata-rata per ha sawah yang

ditanami keempat varietas padi, menggunakan ketiga jenis pupuk, serta

kemungkinan interaksi varietas padi dengan jenis pupuk.

Nilai-nilai populasi untuk tiap sel (tiap subkelompok) menurut taraf-

taraf kedua perlakuan secara skematis diperlihatkan pada matriks 6.2 di

bawah ini.

Matriks 6.2. Nilai populasi untuk tiap sel menurut taraf-taraf perlakuan

pada analisis variansi 2-arah

Variabel

pertama

Variabel kedua

1 2 . . . c

1 11µ

12µ . . . 1cµ

1µ .

2 21µ

22µ . 2cµ

2µ .

. . . . . . . . . .

r 1rµ

2rµ . . . rcµ

rµ .

1µ .

2µ . . . . cµ . µ

ijµ :

Rerata bagi anggota populasi yang tergolong dalam taraf ke-i variabel

pertama dan taraf ke-j variabel kedua; i = 1, 2, . . . , r ; j = 1, 2, . . . , c

� Model dan Struktur Data:

� Pada model ini,didapatkan observasi lebih daripada satu per sel: k >1; k

= 1, 2, . . . , h

� Ada estimasi interaksi

� Umumnya digunakan untuk rancangan faktorial r × c (factorial design,

factorial experiment), yaitu dengan melakukan randomisasi terhadap

keseluruhan r × c sel sekaligus.

186

Matriks 6.3. Struktur data pada analisis variansi 2-arah dengan

rancangan faktorial

Variabel

pertama

Variabel kedua

1 2 . . . c

1 111y , 112y , . .

. , 11hy

121y , 122y , . .

. , 12hy . . .

1 1cy , 1 2cy , . .

. , 1 hcy

2 211y , 212y , . .

. , 21hy

221y , 222y , . .

. , 22hy .

2 1cy , 2 2cy , . .

. , 2 hcy

. . . . . . . . . . .

r 11ry , 12ry , . .

. , 1hry

21ry , 22ry , . .

. , 2hry . . .

1rcy , 2rcy , . .

. , hrcy

ijky : Nilai observasi ke-k pada sel (i; j); i = 1, 2, . . . , r ; j = 1, 2, . . . , c;

k = 1, 2, . . . , h

Model (dalam populasi):

ijkY = µ + iα +

jβ + ( )ij

αβ + ijkε (6.11)

Estimasinya (penguraian nilai observasi dalam sampel):

ijky = y + ( iy − y ) + ( jy − y ) + ( ijy − iy − jy + y ) + ( ijky − ijy )

(6.12)

atau: Nilai observasi = Rerata utama + Efek faktor A

+ Efek faktor B + Efek interaksi + Galat

� Penguraian dan Perhitungan Jumlah Kuadrat:

ijky − y = ( iy − y ) + ( jy − y ) + ( ijy − iy − jy + y )

+ ( ijky − ijy )

Secara matematis dapat dibuktikan bahwa:

( )2

ijki j k

y y−∑∑∑ = ( )2

ii

y y−∑ + ( )2

jj

y y−∑

+ ( )2

ij i ji j

y y y y− − +∑∑ + ( )2

ijijki j k

y y−∑∑∑

•

187

atau:

Jumlah Kuadrat Total = Jumlah Kuadrat A + Jumlah Kuadrat B

+ Jumlah Kuadrat Interaksi + Jumlah Kuadrat Galat

(6.13)

Didefinisikan:

1) ijT = ijkk

y∑ : Jumlah observasi pada sel (i; j) (6.14.a)

2) iy . =

1

c

ijj

T=∑ : Jumlah observasi baris ke-i variabel A (6.14.b)

3) jy . =

1

r

iji

T=∑ : Jumlah observasi kolom ke-j variabel B (6.14.c)

4)

y . . = 1 1

r c

iji j

T= =∑∑ : Jumlah semua observasi (6.14.d)

5) C = ( )

2y

rch

. . (6.14.e)

Matriks 6.4. Data jumlah nilai observasi pada tiap sel

A B

1 2 . . . c iy .

1 11T 12T . . . 1cT 1y .

2 21T 22T . . . 2cT 2y .

. . . . . . . . . . . . . . . .

r 1rT 2rT . . . rcT ry .

jy . 1y .

2y . . cy .

y . .

ijT : Jumlah (total) nilai observasi pada sel ke-(i; j); i = 1, 2, . . . , r ; j =

1, 2, . . . , c.

iy . : Jumlah nilai observasi taraf (baris) ke-i variabel A; i = 1, 2, . . . , r.

jy . : Jumlah nilai observasi taraf (kolom) ke-j variabel B; j = 1, 2, . . . , c.

188

Selanjutnya dapat dihitung:

1) Jumlah Kuadrat Total:

JKT = 2ijk

i j k

y∑∑∑ − C ; db = rch − 1 (6.15)

2) Jumlah Kuadrat A:

JKA = ( )

2

i

y

ch∑ .

− C

; db = r – 1 (6.16)

3) Jumlah Kuadrat B:

JKB = ( )

2

j

y

rh∑

. − C

; db = c – 1 (6.17)

4) Jumlah Kuadrat Sel:

JKA + JKB + JKAB =

2ij

i j

T

h∑∑ − C ; db = rc – 1 (6.18)

5) Jumlah Kuadrat Interaksi:

JKAB = JK Sel – JKA – JKB ; db = (r – 1)(c – 1) (6.19)

6) Jumlah Kuadrat Galat:

JKG = JKT – (JKA + JKB + JKAB)

JKG = JKT – JK Sel ; db = rc(h – 1) (6.13.a)

189

� Tabel ANOVA untuk Analisis Variansi 2-Arah Dengan Interaksi

Tabel 6.4. Tabel ANOVA 2-arah untuk model dengan interaksi

Sumber variasi JK db KR ujiF tabelF

A JKA r – 1 KRA = 1

JKA

r − AF =

KRA

KRG ( ) ( ) 1 ; 1 ;r rc h

Fα− −

B JKB c – 1 KRB = 1

JKB

c − BF =

KRB

KRG ( ) ( ) 1 ; 1 ;c rc h

Fα− −

Interaksi JKAB (r – 1)(c – 1) KRAB = ( ) ( )1 1

JKAB

r c− −

ABF = KRAB

KRG ( )( ) ( ) 1 1 ; 1 ;r c r c h

Fα− − −

Galat JKG rc(h – 1) KRG = ( )1

JKG

rc h −

Total JKT rch – 1

190

Contoh 6.4:

Misalkan terhadap 12 ekor tikus percobaan diberikan dua macam diet

(A1 dan A2) serta tiga macam stressor (B1, B2, dan B3), lalu diukur

pertambahan berat badannya (dalam gram) setelah lama periode tertentu.

Diperoleh data sebagai berikut:

Tabel 6.5. Data kenaikan berat badan tikus percobaan untuk variabel A

dan variabel B

Variabel A Variabel B

1 2 3

1 11, 19, 16 38, 12, 21 37, 53, 53

2 20, 11, 2 27, 20, 26 62, 59, 48

Hasil perhitungan awal untuk melakukan analisis variansi

diperlihatkan pada tabel 6.6.

Tabel 6.6 Tabel nilai ijT dan ∑ 2ijk

k

y untuk variabel A dan variabel B

Variabel A Variabel B

iy . 2ijk

j k

y∑∑ 2

ijj

T∑ 1 2 3

1 46;

738

71;

2,029

143;

6,987 260 9,754 27,606

2 33;

525

73;

1,805

169;

9,629 275 11,959 34,979

jy . 79 144 312 535

2ijk

i k

y∑∑ 1,263 3,834 16,616 21,713

2ij

i

T∑ 3,205 10,370 49,010 62,585

Hipotesis nol: AH : 1α =

2α = 0

BH : 1β =

2β = 3β = 0

ABH : ( )11

αβ = ( )12

αβ = ( )13

αβ = ( )21

αβ = ( )22

αβ =

( )23

αβ = 0

191

Perhitungan:

JKT = 211

1 +

219

1 + . . . +

248

1 −

2535

18

= 21,713 − 2535

18 = 5,811.61 (db = 17)

JKA = 2260

9 +

2275

9 −

2535

18 = 12.50 (db = 1)

JKB = 219

6 +

2144

6 +

2312

6 −

2535

18

= 4,818.78 (db = 2)

JK Sel = JKA + JKB + JKAB

=

246

3 +

233

3 + . . . +

2169

3 −

2535

18

= 4,960.28 (db = 5)

JKAB = 4,960.28 – (12.50 +4,818.78)

= 129 (db = 2)

JKG = JKT – JK Sel

= JKT – (JKA + JKB + JKAB)

= 5,811.61 – 4,960.28 = 851.33 (db = 12)

Tabel 6.7. Tabel ANOVA untuk variabel A dan variabel B

Sumber variasi JK db KR ujiF tabelF

(α = 0.05)

Baris (A) 12.50 1 12.50 0.18 4.75

Kolom (B) 4,818.78 2 2,409.39 33.96 3.89

Interaksi (AB) 129 2 64.50 0.91 3.89

Galat 851.33 12 70.94

Total 5,811.61 17

Sebagai kesimpulan, pada tingkat signifikansi α = 0.05:

- AH tidak ditolak

- BH ditolak

- ABH tidak ditolak

192

6.3. ANALISIS VARIANSI 2-ARAH TANPA INTERAKSI

� Model dan Struktur Data

� Pada model ini, hanya ada satu observasi untuk tiap sel: k = 1

� Tidak ada (tidak dapat dilakukan) estimasi interaksi.

� Umumnya digunakan untuk rancangan blok randomisasi lengkap

(completely randomized block design), yaitu dengan melakukan

randomisasi dalam tiap blok (intra-blok). Perhatikan bahwa dengan tidak

dilakukannya randomisasi antar-blok, penilaian terhadap efek blok tidak

memiliki validasi yang sama dengan penilaian terhadap efek perlakuan.

Matriks 6.5. Struktur data pada analisis variansi 2-arah dengan

rancangan blok randomisasi lengkap

Variabel pertama

(perlakuan)

Variabel kedua (blok)

1 2 . . . c

1 11y 12y . . . 1cy

2 21y 22y . 2cy

. . . . . . . . . . .

r 1ry 2ry . . . rcy

Model:

ijY = µ + iα +

jβ + ijε (6.20)

Estimasinya (penguraian nilai observasi) adalah:

ijy = y + ( iy − y ) + ( jy − y ) + ( ijy − iy − jy + y )

atau:

Nilai observasi = Rerata utama + Efek perlakuan + Efek blok + Galat

� Penguraian dan Perhitungan Jumlah Kuadrat

ijy − y = ( iy − y ) + ( jy − y ) + ( ijy − iy − jy + y )

Secara sistematis, dapat dibuktikan bahwa:

193

( )2

iji j

y y−∑∑ = ( )2

ii j

y y−∑∑ + ( )2

ji j

y y−∑∑

+ ( )2

ij i ji j

y y y y− − +∑∑

atau:

Jumlah Kuadrat Total = Jumlah Kuadrat A + Jumlah Kuadrat B

+ Jumlah Kuadrat Galat (6.22)

Didefinisikan:

1) iy . =

1ij

j

c

y=∑ : Jumlah observasi baris ke-i variabel A (6.23.a)

2) jy . =

1ij

i

r

y=∑ : Jumlah observasi kolom ke-j variabel B (6.23.b)

3)

y . . = 1 1

iji j

r c

y= =∑∑ : Jumlah semua observasi (6.23.c)

4) C = ( )

2y

rc

. . (6.23.d)

Diperoleh:

� Jumlah Kuadrat Total:

JKT = 2ij

i j

y∑∑ − C ; db = rc – 1 (6.24)

� Jumlah Kuadrat A:

JKA = ( )

2

i

y

c∑ − C ; db = r – 1 (6.25)

� Jumlah Kuadrat B:

JKB = ( )

2

j

y

r∑ − C ; db = c – 1 (6.26)

� Jumlah Kuadrat Galat:

JKG = JKAB = JKT – JKA – JKB ; db = (r – 1)(c – 1) (6.22.a)

194

� Tabel ANOVA untuk Analisis Variansi 2-Arah Tanpa Interaksi

Tabel 6.8. Tabel ANOVA 2-arah untuk model tanpa interaksi

Sumber

variasi JK db KR ujiF

tabelF

A JKA r – 1 KRA = 1

JKA

r − AF =

KRA

KRAB ( ) ( )( ) 1 ; 1 1 ;r r c

Fα− − −

B JKB c – 1 KRB = 1

JKB

c − BF =

KRB

KRAB ( ) ( )( ) 1 ; 1 1 ;c r c

Fα− − −

Galat JKAB (r – 1)(c – 1) KRAB = ( ) ( )1 1

JKAB

r c− −

Total JKT rc – 1

195

Contoh 6.5:

Misalkan terhadap residivis pengguna narkotika mantan penghuni

empat rumah tahanan (blok B1, B2, B3, dan B4) yang telah menjalani salah

satu di antara tiga program rehabilitasi (perlakuan A1, A2, atau A3),

dilakukan pengamatan untuk menentukan lamanya periode remisi (jumlah

hari mereka terbebas dari penggunaan ulang narkotika). Data hasil

pengamatan disajikan pada tabel 6.9 berikut.

Tabel 6.9. Data periode remisi pengguna narkotika untuk variabel A

(perlakuan) dan variabel B (blok)

Perlakuan

(A)

Blok (B) iy .

2ij

j

y∑ 1 2 3 4

1 35 24 28 21 108 3,026

2 19 14 14 13 60 922

3 21 16 21 14 72 1,334

jy . 75 54 63 48 240

2ij

i

y∑ 2,027 1,028 1,421 806 5,282

Hipotesis nol: AH : 1α =

2α = 3α = 0

BH : 1β =

2β = 3β =

4β = 0

Perhitungan:

JKT = 235

1 +

224

1 + . . . +

214

1 −

2240

12

= 5,282 − 2240

12 = 482 (db = 11)

JKA = 2108

4 +

260

4 +

272

4 −

2240

12

= 312 (db = 2)

JKB = 275

3 +

254

3 +

263

3 +

248

3 −

2240

12

= 138 (db = 3)

JKG = 482 – (312 + 138) = 32 (db = 6)

196

Tabel 6.10. Tabel ANOVA untuk data hipotetis variabel A dan variabel

B

Sumber variasi JK db KR ujiF tabelF (α = 0.05)

Perlakuan (A) 312 2 156 29.25 5.14

Blok (B) 138 3 46 8.625 4.76

Galat 32 6 5.33

Total 482 11

Kesimpulan yang diperoleh, yaitu pada tingkat signifikansi 5%

terdapat efek perlakuan maupun blok yang bermakna secara statistik

terhadap variabel dependen.

197

LAMPIRAN 6A: IKHTISAR METODE STATISTIKA PARAMETRIK UNTUK

ANALISIS HUBUNGAN ANTAR DUA VARIABEL

Analisis statistik yang lazim digunakan dalam Metode Statistika Parametrik untuk menguji hubungan antar dua

variabel (satu variabel independen dan satu variabel dependen ialah uji t / uji Z, analisis variansi, analisis regresi linear,

analisis regresi logistik, dan uji khi-kuadrat . Ikhtisar penggunaannya diperlihatkan pada matrik VI.1 di bawah ini.

Matriks VI.1. Ikhtisar metode statistika parametrik untuk analisis hubungan antar 1 variabel independen dengan

1 variabel dependen

Variabel independen

Variabel dependen

Numerik Kategorik

Dikotomi Politomi

Numerik Analisis Regresi

Linear

Analisis Regresi

Logistik

Analisis Regresi

Logistik Politomi

Kategorik Dikotomi Uji t / uji Z

Uji khi-kuadrat Politomi Analisis Variansi

Selain itu masih didapatkan berbagai analisis statistik lain yang relatif lebih jarang digunakan untuk menguji

hubungan antar 1 variabel independen dengan satu 1 variabel dependen, namun dalam keadaan tertentu mungkin saja

dijadikan pilihan utama untuk menganalisis data yang tersedia

198

LAMPIRAN 6B: ANALISIS VARIANSI MODEL

TETAP DAN MODEL ACAK

Dalam analisis variansi dikenal dua model, yaitu model tetap (fixed

model; model I) dan model acak (random model; model II). Pada model

tetap, taraf-taraf perlakuan yang diuji dalam analisis variansi mencakup

seluruh taraf yang mungkin ada, sedangkan pada model acak, taraf-taraf

yang diuji hanya merupakan sampel dari keseluruhan taraf yang ada dalam

populasi.

Contoh VI.1:

a. Sebuah pabrik memproduksi dan menjual makanan kaleng berisi

kaleng ikan tuna dalam bentuk empat kemasan, yang masing-masing

dinamakan kemasan I, II, III, dan IV. Untuk dapat meningkatkan

pemasaran, manajer peruasahaan melakukan riset pasar dengan

mengumpulkan data penjualan keempat bentuk kemasan dan

melakukan analisis variansi dengan hipotesis 0H : 1µ =

2µ = 3µ =

4µ ; iµ menyatakan rerata penjualan dengan kemasan ke-i per bulan di

masing-masing toko.

Analisis variansi di sini termasuk dalam model tetap (model I), karena

hanya ada empat kemasan di pabrik tersebut dan keempatnya diuji

dalam analisis.

b. Sebuah perusahaan hipermarket yang memiliki ratusan karyawan di

bagian pelayanan konsumen memilih lima orang di antaranya secara

acak, masing-masing untuk dinilai oleh sekelompok konsumen.

Hipotesis yang hendak diuji ialah 0H : 1µ =

2µ = 3µ =

4µ = 5µ ;

jµ

menyatakan rerata penilaian konsumen bagi karyawan ke-j.

Analisis variansi di sini termasuk dalam model acak (model II), karena

jumlah karyawan tidak hanya lima, melainkan ratusan dan kelima

orang tersebut dipilih secara acak dari populasi karyawan. Tujuan

penelitian sebenarnya adalah untuk menilai seberapa besar variasi

pelayanan yang diberikan oleh karyawan terhadap konsumen, karena

199

itu hasil yang diperoleh akan digeneralisasikan terhadap seluruh

populasi karyawan.

Pada ANOVA 2-arah, salah satu variabel independennya

(perlakuannya) mungkin tergolong dalam model I, dan variabel independen

lainnya tergolong dalam model II. Model ANOVA demikian dinamakan

model campuran (mixed model; model III).

Pada ANOVA 2-arah dengan interaksi, terdapat perbedaan statistik

penguji untuk ketiga model tersebut (lihat matriks VI.2). Seluruh

pembahasan mengenai ANOVA 2-arah dan contoh-contohnya pada bab 8

menggunakan model tetap.

Matriks IV.2. Statistik penguji untuk model tetap, model acak, dan

model campuran pada ANOVA 2-arah dengan interaksi

Faktor Model tetap

(A dan B tetap)

Model acak

(A dan B acak)

Model campuran

(A tetap, B acak)

A AF = KRA

KRG AF =

KRA

KRAB AF =

KRA

KRAB

B BF = KRB

KRG BF =

KRB

KRAB BF =

KRB

KRAB

AB ABF = KRAB

KRG ABF =

KRAB

KRG ABF =

KRAB

KRG

200

LAMPIRAN 6C: INTERAKSI PADA ANOVA DAN

MODEL REGRESI

Dalam bab 6, subbab 6.2 serta lampiran 6B telah dibahas beberapa

contoh serta uji hipotesis untuk interaksi pada ANOVA. Misalkan dimiliki 2

perlakuan A dan B, masing-masing dengan dua taraf perlakuan, 1A dan

2A

serta 1B dan

2B . Rerata variabel dependen Y untuk kombinasi taraf-taraf

perlakuan ini masing-masing adalah 11µ ,

12µ , 21µ dan

22µ (lihat tabel

VI.1).

Tabel VI.1 Rerata variabel dependen Y pada rancangan percobaan 2×2

1B

2B

1A 11µ

12µ

2A 21µ

22µ

Dengan model:

ijk

Y = µ + iα +

jβ + ( ) ij

αβ + ijk

ε (6.27)

maka: 11µ = µ +

1α + 1β + ( )

11αβ (6.28.a)

12µ = µ +

1α + 2β + ( )

12αβ (6.28.b)

21µ = µ +

2α + 1β + ( )

21αβ (6.28.c)

22µ = µ +

2α + 2β + ( )

22αβ (6.28.d)

Diagram VI.1 Rancangan percobaan 2×2

Kiri: Tanpa interaksi, 12µ −

11µ = 22µ −

21µ .

Kanan: Dengan interaksi, 12µ −

11µ ≠ 22µ −

21µ .

201

Dalam keadaan tanpa interaksi (diagram VI.1 kiri), maka:

12µ −

11µ = 22µ −

21µ (6.29)

Jika interaksi ada (diagram VI.1 kanan), maka:

12µ −

11µ ≠ 22µ −

21µ (6.30)

Interaksi juga dapat ditemukan pada model regresi, misalnya pada

model regresi linear dengan 2 variabel independen:

iY =

0β + 1β

1iX + 2β

2iX + iε (6.31.a)

jika terdapat interaksi antara variabel independen 1X dan

2X , model yang

digunakan adalah:

iY =

0β + 1β

1iX + 2β

2iX + 3β

1iX 2iX +

iε (6.31.b)

Uji hipotesis untuk suku interaksi 3β

1X 2X , yaitu uji terhadap

hipotesis 0H :

3β = 0 dapat dilakukan dengan uji Wald.

Contoh VI.2:

Misalkan dimiliki data hipotetis untuk penjualan biskuit merek

tertentu. Biskuit ini dibuat dalam 2 bentuk, bundar dan persegi, serta 2

warna, coklat dan kuning. Contoh data penjualan hipotetis untuk kombinasi

masing-masing bentuk dan warna, dengan dan tanpa interaksi diperlihatkan

pada tabel VI.2.

Tabel VI.2. Contoh data penjualan biskuit dengan 2 bentuk dan 2

warna*)

a. Tanpa interaksi b. Dengan interaksi

Coklat Kuning Coklat Kuning

Bundar 30 28 Bundar 32 22

Persegi 26 24 Persegi 24 30

*) dalam ribuan kotak

202

LAMPIRAN 6D: UKURAN SAMPEL MINIMUM

UNTUK UJI HIPOTESIS PADA ANALISIS

VARIANSI

Untuk menentukan ukuran sampel minimum yang dibutuhkan pada

uji hipotesis 0H :

1µ = 2µ = . . . =

kµ vs 1H :

iµ ≠ jµ untuk paling sedikit

satu pasangan nilai (i ; j) dengan uji F pada analisis variansi, dapat

digunakan pendekatan kekuatan uji minimum (minimum power for a given

decision rule), namun pendekatan ini memerlukan pembahasan mengenai

distribusi F non-sentral sebagai distribusi sampling menurut hipotesis

alternatif beserta tabelnya yang berada di luar ruang lingkup pembahasan

buku teks ini. Di sini hanya akan dibahas perhitungan ukuran sampel

minimum untuk analisis variansi dengan penggunaan kelompok kontrol

sebagai salah satu kelompok perbandingan.

Misalkan hendak dilakukan analisis variansi untuk membandingkan

rerata k kelompok perbandingan. Sampel berukuran minimum yang

dibutuhkan terdiri atas:

a. Satu kelompok kontrol (control group), dengan ukuran kelompok cn .

b. (k – 1) kelompok uji (test groups), masing-masing dengan ukuran

kelompok tn .

Ukuran sampel seluruhnya adalah:

n = (k – 1) tn +

cn (6.32)

Pada perbandingan rerata (ataupun proporsi) beberapa kelompok,

acapkali ada salah satu kelompok yang dijadikan sebagai kelompok kontrol

(kelompok pembanding), yang biasanya tidak diberi perlakuan apapun atau

diberi perlakuan dengan intensitas terendah. Kelompok-kelompok uji

berukuran sama besar, yaitu masing-masing berukuran tn , sedangkan ukuran

kelompok kontrol dapat sama besar ataupun lebih besar daripada ukuran satu

kelompok uji.

203

Perbandingan ukuran satu kelompok uji tn dengan ukuran kelompok

kontrol cn dinamakan ‘rasio alokasi uji-kontrol’ (test-control allocation

ratio):

λ =

t

c

n

n (6.33)

Pada bab 3, subbab 3.1 telah dibahas mengenai ukuran sampel

minimum yang dibutuhkan untuk mendeteksi perbedaan minimum sebesar d

= ( 1µ −

2µ ) pada uji hipotesis dua kelompok perbandingan 0H :

1µ − 2µ

1µ − 2µ < 0 vs

1H : 1µ −

2µ > 0, yaitu:

n = ( )

( )

2 2

2

1 2

2 Z Zα β σ

µ µ

+

−

Untuk k kelompok perbandingan dengan uji 2-sisi, ukuran kelompok

kontrol adalah:

cn =

( )

2 2

2

1

c t

Z Zα β

λσ

λ

µ µ

++

−

(6.34)

cµ : rerata populasi kontrol

tµ : rerata populasi uji

d = ( )c tµ µ− : perbedaan minimum yang hendak dideteksi antara rerata

populasi kontrol dan populasi uji

Ukuran satu kelompok uji adalah:

tn = λ cn (6.33.a)

Untuk λ = 1 (alokasi uniform), maka:

204

cn =

( )( )

2 2

2

c t

Z Zα β σ

µ µ

+

−

(6.35)

dan: tn = cn (6.36)

Tampak bahwa rumus yang diperoleh serupa dengan rumus bab 3,

subbab 3.1 untuk dua kelompok perbandingan dengan kelompok kontrol

sebagai kelompok 1 dan kelompok uji sebagai kelompok 2.

Contoh VI.3:

Lihat kembali contoh 6.2 tentang perbandingan rerata penghasilan

tahunan keluarga di tiga kota A, B, dan C. Misalkan sebelum penelitian

dilaksanakan terlebih dahulu dilakukan perhitungan ukuran sampel minimum

untuk mendeteksi adanya perbedaan rerata penghasilan sekurang-kurangnya

6 juta rupiah dibandingkan dengan kota A sebagai kelompok kontrol dengan

tingkat signifikansi 5% dan kekuatan uji 80%. Dengan perhitungan dalam

jutaan rupiah, maka:

d = ( )c tµ µ− = 6

α = 0.05 2

Zα

= 1.96

1 – β = 0.80 Zβ = 0.84

Jika pada penelitian pendahuluan didapatkan estimasi standar deviasi

adalah 5 juta rupiah:

σ = 5

maka dengan rasio alokasi uji-kontrol λ = 1:

cn =

( )( )

22

2

1

c t

Z Zβα

λσ

λ

µ µ

++

−

205

=

( )2 2

2

1 11.96 0.84 5

1

6

+ +

= 10.90 ≈ 11

tn = λ cn = (1)(11) = 11

Ukuran sampel seluruhnya adalah:

n = (k – 1) tn + cn

= (2)(11) + 11 = 33

206

LAMPIRAN 6E: PERBANDINGAN GANDA

(MULTIPLE COMPARISONS)

Jika pada analisis variansi hipotesis 0H :

1µ = 2µ = . . . =

kµ

ditolak, maka langkah berikutnya ialah mencari kelompok mana saja di

antara k kelompok yang diperbandingkan yang berbeda dengan kelompok

lainnya. Metode pencarian kelompok-kelompok yang berbeda demikian

dinamakan ‘perbandingan ganda’ (multiple comparisons).

Dikenal berbagai metode dalam perbandingan ganda, antara lain

metode Tukey, metode Scheffé, metode Bonferroni, dan sebagainya. Di

sini hanya akan dibahas salah satu yang termudah di antara berbagai metode

tersebut, yaitu metode Bonferroni.

Misalkan h

L menyatakan selisih 2 nilai rerata yang diperbandingkan:

h

L = i jµ µ− (6.37)

maka interval konfidensi perbandingan ganda 100(1 – α)% untuk h

L ; h = 1,

2, . . . , m; dengan m menyatakan jumlah perbandingan, adalah:

ˆh

L − B . ( )

ˆh

s L < h

L <

ˆh

L + B . ( )

ˆh

s L (6.38)

dengan: B = ( ) ( ) ; 2n k m

tα−

(6.39)

k menyatakan jumlah taraf perlakuan (jumlah populasi yang

diperbandingkan).

Contoh VI.4:

Lihat data pada contoh 6.2. Akan dihitung interval konfidensi

perbandingan ganda (interval konfidensi simultan) 100(1 – α)% untuk

( )1 2µ µ− , ( )1 3µ µ− , dan ( )3 2µ µ− sekaligus.

Pada contoh 6.2, m = 3, h = 1, 2, 3; dan dengan memisalkan:

1L = ( )1 2µ µ−

2L = ( )1 3µ µ−

3L = ( )3 2µ µ−

maka interval konfidensi perbandingan ganda 95% untuk 1L ,

2L , dan 3L

adalah:

207

1L − B . ( )

1ˆs L <

1L < 1L + B . ( )

1ˆs L

2L − B . ( )

2ˆs L <

2L < 2L + B . ( )

2ˆs L

3L − B . ( )

3ˆs L <

3L < 3L + B . ( )

3ˆs L

k = 3 (k menyatakan jumlah taraf perlakuan / jumlah populasi yang

diperbandingkan)

n = 12

B = ( ) ( ) ; 2n k m

tα−

= ( ) ( )( ) 12 3 ; 0.05 2 3

t−

= ( ) 9; 0.0083

t = 2.93

1L = ( )1 2y y−

2L = ( )1 3y y−

3L = ( )3 2y y−

1y = 76

4 = 19 2y =

54

4 = 13.5 3y =

58

4 = 14.5

1L = 19 – 13.5 = 5.5

2L = 19 – 14.5 = 4.5

3L = 14.5 – 13.5 = 1

( )

ˆh

s L = s1 1

i jn n+ =

1 1

i j

KRGn n

+

karena: 2

s = KRG = JKG

n k−

in = jn = 4 dan KRG = 5.33, sehingga:

( )

ˆh

s L = 1 1

5.334 4

+

= 1.63

5.5 – (2.93) . (1.63) < 1L < 5.5 + (2.93) . (1.63)

4.5 – (2.93) . (1.63) < 2L < 4.5 + (2.93) . (1.63)

1 – (2.93) . (1.63) < 3L < 1 + (2.93) . (1.63)

yaitu: 0.71 < 1L < 10.29

−0.29 < 2L < 9.29

208

−3.79 < 3L < 5.79

Gambaran akhir di sini biasanya diberikan sebagai berikut:

2µ 3µ 1µ

Gambaran ini menyatakan bahwa:

a. Urutan nilai dari yang terkecil sampai dengan yang terbesar adalah: 2µ

− 3µ − 1µ .

b. 2µ tidak berbeda dengan 3µ , 3µ tidak berbeda dengan 1µ , tetapi 2µ

berbeda dengan 1µ .

209

LATIHAN 6

Bagian Pertama

Pilihlah satu jawaban yang paling benar!

1. Misalkan dimiliki data nilai ujian statistika tiga kelas A, B, dan C.

Apabila dilakukan 3 kali uji kesamaan 2 rerata dengan uji t (multiple

t-test;; A vs B, A vs C, dan B vs C), masing-masing dengan tingkat

signifikansi α = 0.05, maka probabilitas untuk sekurang-kurangnya

mendapatkan satu kali kesalahan tipe I adalah:

A. 0.05 C. 0.053

B. 3 × 0.05 D. 1 – 0.953

2. Untuk menguji hubungan antara variabel independen kategorik

dengan variabel dependen kontinu / numerik, metode statistika yang

dianjurkan penggunaannya adalah:

A. Analisis variansi C. Analisis regresi logistik.

B. Analisis regresi linear D. Uji khi-kuadrat Pearson.

3. Pada analisis variansi terhadap suatu himpunan data, akan diperoleh

kesimpulan yang mengarah pada adanya perbedaan nilai rerata

(mean) antar kelompok perlakuan, jika :

A. Variansi antar-kelompok dan variansi dalam-kelompok besar.

B. Variansi antar-kelompok dan variansi dalam-kelompok kecil.

C. Variansi antar-kelompok besar dan variansi dalam-kelompok

kecil.

D. Variansi antar-kelompok kecil dan variansi dalam-kelompok

besar.

4. Pada uji ANOVA, variansi dalam-kelompok (within-group)

diestimasi oleh:

A. Jumlah kuadrat perlakuan (treatment sum of squares).

B. Kuadrat rerata perlakuan (treatment mean square).

C. Jumlah kuadrat galat (error sum of squares).

D. Kuadrat rerata galat (error mean square).

Untuk soal No. 5 s.d. 10:

Sebuah pabrik benang mempunyai lima mesin pintal A, B, C, D, dan

E yang diharapkan dapat menghasilkan benang yang memiliki kekuatan

210

sama. Untuk memeriksanya, diambil sampel acak masing-masing 6 potong

benang dari hasil produksi tiap mesin. Pemeriksaan kekuatannya

menghasilkan data sebagai berikut:

Mesin

A B C D E

4.2 3.9 4.1 3.6 3.8

4.1 3.8 4.0 3.9 3.6

4.2 3.7 4.2 3.5 3.9

4.3 3.8 4.0 4.0 3.5

4.4 3.6 4.1 4.1 3.7

4.0 3.5 3.8 3.8 3.6

5. Hipotesis nol dan hipotesi alternatif analisis variansi ini dirumuskan

sebagai:

A. 0 1 2 3 4 5:H µ µ µ µ µ= = = =

0 1 2 3 4 5:H µ µ µ µ µ≠ ≠ ≠ ≠

B. 0 1 2 3 4 5:H µ µ µ µ µ= = = =

1 :H semua 1µ , i = 1, 2, 3, 4, 5, tidak sama

C. 0 1 2 3 4 5:H µ µ µ µ µ= = = =

1 :H tidak semua 1µ , i = 1, 2, 3, 4, 5, sama

D. 0 1 2 3 4 5: 0H µ µ µ µ µ= = = = =

1 :H tidak semua 1µ = 0, i = 1, 2, 3, 4, 5

6. JKT sama dengan:

A. 1.2444 C. 4.2144

B. 1.8470 D. 4.4124

7. JKG sama dengan:

A. 6.8 C. 0.68

B. 9.5 D. 0.95

8. Dengan α = 0.05, daerah kritis hipotesis ini adalah:

A. F > 4.34 C. F > 2.78

B. F > 4.22 D. F > 2.76

211

9. Nilai statistik penguji ujiF sama dengan:

A. 10.768 C. 18.213

B. 13.182 D. 31.281

10. Berdasarkan nilai statistik penguji, tersebut maka terhadap

0 1 2 3 4 5:H µ µ µ µ µ= = = = disimpulkan bahwa:

A. 0H tidak ditolak pada 0.01α =

B. 0H tidak ditolak pada 0.05α =

C. 0H ditolak pada 0.10α =

D. Semuanya salah.

Untuk soal No. 11 s.d. 15:

Ibu Leoni menyatakan pendapatnya bahwa siswa pada berbagai

tingkatan sekolah dan mahasiswa menghabiskan waktu sama banyaknya

untuk menonton acara TV. Untuk membuktikan pendapatnya ia mengambil

sampel acak beberapa siswa SMP, SMU, dan mahasiswa, serta menanyakan

berapa menit mereka menonton TV sejak pulang sekolah / kuliah sampai

dengan waktu tidur setiap hari. Diperoleh data berikut:

Siswa SMP Siswa SMU Mahasiswa

459 115 272

311 153 88

152 201 374

293 30 178

11. JKT (Jumlah Kuadrat Total; Total Sum of Squares) adalah:

A. 12,037.28 C. 108,335.5

B. 64,586.17 D. 172, 921.67

12. JKP (Jumlah Kuadrat Perlakuan; Treatment Sum of Squares) adalah:

A. 12,037.28 C. 108,335.5

B. 64,586.17 D. 172, 921.67

13. KRG ( Jumlah Kuadrat Galat; Error Mean Squares) adalah:

A. 12,037.28 C. 108,335.5

B. 64,586.17 D. 172, 921.67

212

14. Untuk uji hipotesis 0 1 2 3: ,H µ µ µ= = statistik pengujinya adalah:

A. 0.37 C. 1.68

B. 0.60 D. 2.69

15. Dengan tingkat signifikansi 0.05,α = diperoleh kesimpulan:

A. Terdapat perbedaan lama menonton TV antar siswa SMP,

SMU, dan mahasiswa yang bermakna.

B. Ditemukan perbedaan lama menonton TV antar siswa SMP,

SMU, dan mahasiswa yang bermakna secara statistik.

C. Tidak ditemukan perbedaan lama menonton TV antar siswa

SMP, SMU, dan mahasiswa yang bermakna secara statistik.

D. Semuanya salah.

Bagian Kedua

Pilihlah satu jawaban yang paling benar!

Dua macam pupuk ( P dan Q ) digunakan dalam kuantitas 1 kg dan 2

kg per petak. Dilakukan eksperimen faktorial 2×2 dengan empat observasi

replikasi dengan hasil sebagai berikut:

B: Dosis pemupukan

1 kg 2 kg

A: Jenis pupuk P 17, 16, 15, 18 13, 13, 14, 12

Q 21, 20, 19, 18 14, 16, 16, 14

Selanjutnya dilakukan analisis variansi dengan hipotesis:

1 2: 0A

H α α= =

1 2: 0B

H β β= =

( ) ( ) ( ) ( )11 12 21 22

: 0ABH αβ αβ αβ αβ= = = =

1. JKA sama dengan:

A. 2.5 C. 25

B. 6.4 D. 64

2. JKB sama dengan:

A. 2.5 C. 25

B. 6.4 D. 64

213

3. JKAB sama dengan:

A. 1 C. 3

B. 2.5 D. 6.4

4. JKG sama dengan:

A. 16 C. 25

B. 20 D. 64

5. KRA sama dengan:

A. 6.4 C. 20

B. 16 D. 25

6. KRB sama dengan:

A. 16 C. 25

B. 20 D. 64

7. KRAB sama dengan:

A. 0.3 C. 1.6

B. 1 D. 3

8. KRG sama dengan:

A. 1.333 C. 3.625

B. 2.673 D. 13.331

9. A

F sama dengan:

A. 1.875 C. 18.750

B. 7.815 D. 48.000

10. B

F sama dengan:

A. 4.800 C. 18.750

B. 7.815 D. 48.000

11. AB

F sama dengan:

A. 0.750 C. 2.673

B. 1.875 D. 7.815

214

12. Dengan tingkat signifikansi 5%α = disimpulkan:

A. A

H tidak ditolak

B. B

H ditolak

C. AB

H ditolak

D. Ketiga hipotesis semuanya ditolak

Bagian Ketiga

Pilihlah satu jawaban yang paling benar!

B: Pekerja

B1 B2 B3 B4

A: Tipe mesin

A1 44 46 34 43

A2 38 40 36 38

A3 47 52 44 46

Selanjutnya dilakukan analisis variansi dengan hipotesis:

1 2 3: 0A

H α α α= = =

1 2 3 4: 0B

H β β β β= = = =

1. Pada uji analisis variansi 2-arah (two-way ANOVA) terhadap data

dengan 1 pengamatan / observasi per sel, model statistik yang dapat

digunakan ialah:

A. ij i j ijy µ α β ε= + + +

B. ( )ij i j ijkijy µ α β αβ ε= + + + +

C. Keduanya dapat digunakan.

D. Keduanya tidak dapat digunakan.

2. JKA ( jumlah kuadrat A ) sama dengan:

A. 29.5 C. 173.17

B. 98 D. 300.67

3. JKB ( jumlah kuadrat B ) sama dengan:

A. 29.5 C. 173.17

B. 98 D. 300.67

215

4. JKG ( jumlah kuadrat galat)

A. 29.5 C. 173.17

B. 98 D. 300.67

5. KRA (kuadrat rerata A) sama dengan:

A. 4.92 C. 86.58

B. 32.67 D. 119.25

6. KRB (kuadrat rerata B) sama dengan:

A. 4.92 C. 86.58

B. 32.67 D. 119.25

7. KRG (kuadrat rerata galat) sama dengan:

A. 4.92 C. 86.58

B. 32.67 D. 119.25

8. A

F sama dengan:

A. 3.58 C. 17.61

B. 6.64 D. 32.29

9. B

F sama dengan:

A. 3.58 C. 17.61

B. 6.64 D. 32.29

10. Dengan tingkat signifikansi 5%α = disimpulkan:

A. A

H tidak ditolak C. Keduanya benar

B. B

H ditolak D. Keduanya salah

216

BAB 7

ANALISIS DATA KATEGORIK

7.1. PENYAJIAN DATA KATEGORIK

� Bentuk Umum Tabulasi Silang

Data kategorik disajikan dalam bentuk tabel r × c (tabulasi silang,

tabel kontijensi), dengan menyatakan jumlah baris (row) dan c menyatakan

jumlah kolom (column). Bentuk-bentuk umum penyajian data kategorik

diperlihatkan pada tabel 7.1 berikut:

Tabel 7.1. Beberapa bentuk umum tabulasi silang r x c

a. Tabel 1 × c (c > 2)

1O 2O . . . cO

iO : Observasi (frekuensi pengamatan) pada kategorik (kolom) ke-i;

i = 1, 2, . . . , c

b. Tabel 2 × 2

11O 12O

21O 22O

c. Tabel 2 × c (c > 2)

11O 12O . . . 1cO

21O 22O . . . 2cO

ijO : Observasi (frekuensi pengamatan) pada kategori (baris) ke-

i, kolom ke-j; i = 1, 2; j = 1, 2, . . . , c

217

d. Tabel r × c (r > 2 dan c > 2)

11O 12O . . . 1cO

21O 22O . . . 2cO

. . . . . . . . . . . .

1rO 2rO . . . rcO

ijO : Observasi (frekuensi pengamatan) pada baris ke-i, kolom

ke-j; i = 1, 2, . . . , r; j = 1, 2, . . . , c

Contoh 7.1:

- Misalkan diambil sampel acak 350 orang lulusan SMU (1 sampel),

dicatat jenis kelaminnya dan ditanyai keinginannya untuk melanjutkan

sekolah. Hasil yang diperoleh diperlihatkan pada tabel 2×2 di bawah

ini:

Tabel 7.2. Jenis kelamin dan keinginan melanjutkan pendidikan

Jenis kelamin Melanjutkan sekolah

Ingin Tidak Jumlah

Pria 163 80 243

Wanita 46 61 107

Jumlah 209 141 350

- Misalkan dimiliki data tentang kerutan wajah 2 kelompok subjek (2

sampel), perokok berat dan perokok ringan / bukan perokok, yang

disajikan dalam bentuk tabel 2×2:

Tabel 7.3. Intensitas merokok dan kerutan wajah (2 proporsi binomial)

a. Tabel frekuensi

Perokok Kerutan wajah

Nyata Tidak Jumlah

Berat 127 73 200

Ringan/tidak 59 141 200

218

b. Tabel proporsi

Perokok Kerutan wajah

Nyata Tidak Jumlah

Berat 0.635 0.365 1.000

Ringan/tidak 0.295 0.705 1.000

Keterangan: 1p = 0.635 ; 1q = 0.365 ;

2p = 0.295 ; 2q = 0.705 ;

- Misalkan dimiliki data tentang insomnia pada 3 kelompok usia wanita

(3 sampel; muda, dewasa, dan tua), yang disajikan dalam bentuk tabel

3×2:

Tabel 7.4. Insomnia pada berbagai kelompok usia wanita (3 proporsi

binomial)

Kelompok usia Insomnia

Ada Tidak ada Jumlah

18-34 th 19 41 60

35-54 th 23 37 60

55-74 th 33 27 60

Keterangan: 1p = 0.317 ; 1q = 0.683 ;

2p = 0.383 ; 2q = 0.617 ;

3p = 0.550 ; 3q = 0.450 ;

� Frekuensi Observasi dan Frekuensi Harapan

Frekuensi dalam sel-sel pada tabel 7.1 serta tabel-tabel frekuensi pada

contoh 7.1 di atas merupakan frekuensi pengamatan / observasi (observed),

yang dinyatakan dengan lambang O, dengan ijO menyatakan frekuensi

pengamatan pada baris ke-i dan kolom ke-j (sel ke-ij). Untuk tabel 2×2,

bentuk umumnya diperlihatkan pada tabel 7.5 berikut.

219

Tabel 7.5. Bentuk umum tabel 2×2 dengan frekuensi observasi (‘tabel

observasi’)

Variabel A Variabel B

B1 B2 Jumlah

A1 a = 11O b = 12O 1n = a + b

A2 c = 21O d = 22O 2n = c + d

Jumlah 1m = a + c

2m = b + d n

Jumlah baris ( 1n dan

2n ) serta jumlah kolom ( 1m dan

2m ) disebut

sebagai frekuensi ‘marginal’ (tepi). Untuk perhitungan statistik, masing-

masing jumlah baris dan kolom ini diasumsikan memiliki nilai tetap (fixed

margin).

Frekuensi harapan (expected) untuk tiap sel dinyatakan dengan E,

dengan ijE menyatakan frekuensi harapan pada baris ke-i dan kolom ke-j

(sel ke-ij), dihitung berdasarkan asumsi fixed margin dengan rumus:

ijE = i jn m

n (7.1)

Secara stokastik, frekuensi harapan pada tabel r×c menyatakan frekuensi

yang diharapkan akan terjadi jika variabel baris (variabel A ) tidak memiliki

asosiasi statistik dengan variabel kolom (variabel B). Untuk tabel 2×2 seperti

pada tabel 7.5, penyajiannya dalam bentuk frekuensi harapan serta rumus-

rumus perhitungannya adalah:

Tabel 7.6. Bentuk umum tabel 2×2 dengan frekuensi harapan (‘tabel

harapan’)

Variabel A Variabel B

B1 B2 Jumlah

A1 11E 12E 1n = 11E + 12E

A2 21E 22E 2n = 21E + 22E

Jumlah 1m = 11E + 21E 2m = 12E + 22E n

220

11E = 1 1n m

n 12E = 1 2n m

n )

21E = 2 1n m

n 22E = 2 2n m

n ) (7.1.a)

Perhatikan bahwa frekuensi marginal (jumlah baris dan jumlah

kolom) pada tabel harapan selalu bernilai sama dengan frekuensi marginal

pada tabel observasi.

Contoh 7.2:

Lihat kembali data tentang jenis kelamin dan keinginan melanjutkan

pendidikan pada contoh 7.1. Data pada tabel 7.2 adalah tabel observasi, dan

frekuensi harapan masing-masing sel adalah (lihat tabel 7.7):

11E = 1 1n m

n =

( )( )243 209

350 = 145.1

12E = 1 2n m

n =

( )( )243 141

350 = 97.91

21E = 2 1n m

n =

( ) ( )107 209

350 = 63.9

22E = 2 2n m

n =

( )( )107 141

350 = 43.1

Tabel 7.7. Tabel harapan untuk data jenis kelamin dan keinginan

melanjutkan pendidikan

Jenis kelamin Melanjutkan sekolah

Ingin Tidak Jumlah

Pria 145.1 97.9 243

Wanita 63.9 43.1 107

Jumlah 209 141 350

221

� Uji Hipotesis untuk Tabulasi Silang dengan Data

Kategorik

Uji statistik untuk data kategorik yang disajikan dalam bentuk

tabulasi silang umumnya dilakukan dengan membandingkan data frekuensi

pengamatan (observed; ijO ) dengan data frekuensi harapan (expected; ijE ).

Beberapa uji statistik untuk data kategorik tersebut yaitu:

1. Uji khi-kuadrat (chi-square) Pearson, digunakan untuk tabel r×c (r >

2; c > 2) dengan syarat tidak ada sel dengan frekuensi harapan ijE

bernilai kurang daripada 5. Uji khi-kuadrat Pearson dibedakan atas :

a. Uji homogenitas (uji perbandingan proporsi): digunakan bagi

data yang berasal dari 2 sampel atau lebih, untuk menguji

kesamaan (homogenitas) proporsi antar sampel.

b. Uji independensi: digunakan bagi data yang berasal 1 sampel,

untuk menguji ada tidaknya asosiasi statistik antar variabel baris

dengan variabel kolom.

2. Uji eksak Fisher: digunakan untuk tabel 2×2 jika ada sel dengan

frekuensi harapan ijE yang bernilai kurang daripada 5.

3. Uji kebaikan-suai (goodness of fit): digunakan untuk tabel 1×c, yaitu

untuk menguji apakah data sampel berasal dari (berdistribusi sesuai

dengan) suatu populasi tertentu, misalnya populasi normal

4. Uji McNemar: digunakan untuk data kategorik berpasangan yang

disajikan dalam bentuk tabel 2×2.

� Distribusi Khi-kuadrat

Kecuali uji eksak Fisher , seluruh uji hipotesis untuk data kategorik

yang disebutkan di atas menggunakan statistik penguji yang ber-distribusi

khi-kuadrat, yang cuplikan distribusinya diperlihatkan pada tabel 7.8 di

bawah ini (tabel lengkap nilai kritis distribusi khi-kuadrat dapat dilihat pada

Addendum D).

Bentuk distribusi khi-kuadrat berbeda-beda, tergantung pada derajat

bebasnya, namun seluruhnya bernilai positif (terletak di kanan sumbu

vertikal), sehingga seperti pada uji F, uji hipotesis dengan statistik penguji

yang berdistribusi khi-kuadrat selalu adalah uji 2-sisi, walaupun dengan

memperhatikan gambaran distribusinya, uji tersebut adalah uji 1-ekor (one-

tail test).

222

Tabel 7.8. Cuplikan tabel distribusi khi-kuadrat [P (2χ >

2

αχ )]

db α

0.100 0.050 0.025 0.010

1 2.71 3.84 5.02 6.63

2 4.61 5.99 7.38 0.21

. . . . .

9 14.7 16.9 19.0 21.7

10 16.0 18.3 20.5 23.2

. . . . .

19 27.2 30.1 32.9 36.2

20 28.4 31.4 34.2 37.6

. . . . .

29 39.1 42.6 45.7 49.6

30 40.3 43.8 47.0 50.9

40 51.8 55.8 59.3 63.7

50 63.2 67.5 71.4 76.2

60 74.4 79.1 83.3 88.4

223

7.2. UJI HOMOGENITAS

� Tabel 2×2

Misalkan dimiliki data kategorik yang paparannya disajikan dalam

bentuk umum tabel 2×2 berikut:

Tabel 7.9. Bentuk umum paparan data pada tabel 2×2

Variabel A Variabel B

B BC Jumlah

A a b 1n = a + b

AC c d 2n = c + d

Jumlah 1m = a + c 2m = b + d n

Uji homogenitas khi-kuadrat untuk tabel 2×2 memberikan hasil yang

sama dengan uji kesamaan 2 proporsi dengan pendekatan normal (uji Z),

masing-masing hipotesis:

0H : 1P = 2P vs 1H : 1P ≠ 2P (7.2)

dan: 1P = 1p = a

a b+ =

1

a

n ; 2P = 2p =

c

c d+ =

2

c

n

Perhatikan bahwa uji kesamaan 2 proporsi dengan uji Z hanya boleh

dilakukan untuk sampel berukuran besar ( 1n > 30 dan 2n > 30), sedangkan

uji homogenitas khi-kuadrat sendiri hanya boleh dilakukan jika tidak ada sel

dengan frekuensi harapan yang lebih kecil daripada 5.

Statistik penguji pada uji khi-kuadrat homogenitas adalah:

ujiW = 2ujiχ =

( )2

ij ij

i j ij

O E

E

−∑∑ (7.3)

yang berdistribusi khi-kuadrat dengan derajat bebas (r – 1)(c – 1). Untuk

tabel 2×2, derajat bebasnya adalah satu. Daerah kritis adalah:

W > ( )2

1;αχ (7.4)

ujiW = 2ujiχ bernilai sama dengan ( )

2

ujiZ ; ujiZ adalah statistik

penguji pada uji kesamaan 2 proporsi dengan uji Z. Khusus untuk tabel 2×2,

rumus 7.3 untuk statistik penguji di atas dapat dijabarkan menjadi:

224

ujiW = ( )

1

2

2 1 2

n ad bc

n n m m

− (7.5)

Jika 0H ditolak, disimpulkan bahwa ada perbedaan yang bermakna

secara statistik antara proporsi peristiwa B dalam kelompok A dengan

proporsi peristiwa B dalam kelompok AC; sedangkan jika 0H tidak ditolak,

disimpulkan bahwa tidak ada perbedaan yang bermakna secara statistik

antara proporsi peristiwa B dalam kelompok A dengan proporsi peristiwa B

dalam kelompok AC.

Contoh 7.3:

Anggota 2 sampel acak yang masing-masing terdiri atas 100 orang

pria dan 100 orang wanita ditanyai pendapatnya terhadap pernyataan:

‘Wanita mempunyai hak dan kewajiban yang sama dengan pria’. Diperoleh

jawaban sebagai berikut:

Tabel 7.10. Pendapat tentang hak dan kewajiban menurut reponden

wanita pria dan wanita

Jenis kelamin Sikap

Setuju Tidak setuju Jumlah

Pria 30 70 100

Wanita 45 55 100

Jumlah 75 125 200

Uji hipotesis:

1. Jenis uji statistik: uji khi-kuadrat (uji homogenitas).

2. Hipotesis: 0H : 1P = 2P

1H : 1P ≠ 2P

3. Tingkat signifikansi: α = 0.05.

4. Daerah kritis: W >

21; 05χ atau W > 3.84.

5. Statistik penguji:

ujiW = 2ujiχ =

( )

1

2

2 1 2

n ad bc

n n m m

−

225

=

( ) ( )( ) ( ) ( )

( )( )( )( )

2200 30 55 70 45

100 100 75 125

− = 4.80

yang berdistribusi 2χ dengan derajat bebas 1.

6. Kesimpulan: karena W > 3.84, 0H ditolak, sehingga pada tingkat

signifikansi 0.05 terdapat perbedaan yang bermakna secara statistik

antara pria dan wanita mengenai sikapnya terhadap hak dan kewajiban

pria dan wanita.

� Tabel r×2

Bentuk umum paparan data untuk tabel r×2 dapat disajikan

sebagaimana terlihat pada tabel 7.11 di bawah ini.

Tabel 7.11. Bentuk umum paparan data untuk tabel r×2

a. Tabel observasi

Variabel A Variabel B

B BC Jumlah

1A 1a = 11O

1b = 12O 1n

2A 2a = 21O

2b = 22O 2n

. . . . . . . . . . . .

rA ra = 1rO

rb = 2rO rn

Jumlah 1m 2m n

b. Tabel proporsi

Variabel A Variabel B

B BC Jumlah

1A 1p 1q 1

2A 2p 2q 1

. . . . . . . . . . . .

rA rp rq 1

Jumlah 1m 2m 1

226

Hipotesis yang diuji adalah:

0H : 1P = 2P = . . . = rP (7.6)

dengan: 1P = 1p = 1

1

a

n, 2P = 2p = 2

2

a

n, . . . , ˆ

rP = rp = r

r

a

n.

Frekuensi di atas merupakan frekuensi pengamatan (observed), sedangkan

untuk uji statistik harus dihitung pula frekuensi harapannya (expected)

dengan rumus:

ijE = i jn m

n

Statistik pengujinya adalah:

ujiW = 2ujiχ =

( )2

ij ij

i j ij

O E

E

−∑∑ (7.7)

yang berdistribusi khi- kuadrat dengan derajat bebas (r – 1)(c – 1) dan daerah

kritis:

W > ( )( )

2

1 1 ;r c αχ

− − (7.8)

Untuk tabel kontijensi dengan r > 2 dan/atau c > 2, rumus statistik

penguji ini tidak dapat dijabarkan lebih lanjut seperti pada rumus 7.5 untuk

tabel 2×2.

Contoh 7.4:

Untuk membandingkan proporsi perokok di antara berbagai tingkatan

jabatan akademik dosen di DKI Jakarta, dilakukan wawancara terhadap

sampel acak 50 orang guru besar, 70 lektor kepala, 100 lektor, dan 100

asisten ahli dengan hasil sebagai berikut ( ijO ):

227

Tabel 7.12. Kebiasaan merokok pada beberapa tingkatan jabatan

akademik

a. Tabel observasi

Jabatan akademik Kebiasaan merokok

Ya Tidak Jumlah

Guru besar 6 44 50

Lektor kepala 18 52 70

Lektor 26 74 100

Asisten ahli 35 65 100

Jumlah 85 235 320

b. Tabel harapan

Jabatan

akademik

Kebiasaan merokok

Ya Tidak Jumlah

Guru besar ( )( )50 85

320 = 13.28

( ) ( )50 235

320 = 36.72 50

Lektor

kepala

( )( )70 85

320 = 18.59

( )( )70 235

320 = 51.41 70

Lektor ( )( )100 85

320 = 26.56

( ) ( )100 235

320 = 73.44 100

Asisten ahli ( )( )100 85

320 = 26.56

( ) ( )100 235

320 = 73.44 100

Jumlah 85 235 320

Uji hipotesis:

1. Jenis uji statistik: uji khi-kuadrat (uji homogenitas).

2. Hipotesis: 0H : 1P = 2P = 3P = 4P

1H : iP ≠ jP untuk paling sedikit salah satu pasangan nilai

i, j.

3. Tingkat signifikansi: α = 0.05.

4. Daerah kritis: W >

23; 05χ , yaitu W > 7.815

5. Statistik penguji:

228

ujiW = 2ujiχ =

( )2

2

1 1

rij ij

i j ij

O E

E= =

−∑∑ =

= ( )26 13.28

13.28

− +

( )244 36.72

36.72

− +

( )218 18.59

18.59

− +

( )252 51.41

51.41

− +

( )226 26.56

26.56

− +

( ) 274 73.44

73.44

− +

( )235 26.56

26.56

− +

( )265 73.44

73.44

− = 9.127

yang berdistribusi 2χ dengan derajat bebas (r − 1)(c – 1) = (3)(1) = 3.

6. Kesimpulan: Karena W > 7.815, 0H ditolak, sehingga pada tingkat

signifikansi 0.05 terdapat perbedaan yang bermakna secara statistik

antara proporsi perokok pada keempat tingkatan jabatan akademik

dosen di DKI Jakarta.

� Tabel r×c

Bentuk umum paparan data untuk tabel r×c dapat diperlihatkan pada

tabel 7.13 di bawah ini.

Tabel 7.13. Bentuk umum paparan data untuk tabel r×c

Variabel A Variabel B

Jumlah 1B

2B . . . cB

1A 11O 12O . . . 1cO 1n

2A 21O 22O . . . 2cO 2n

. . . . . . . . . . . . . . . . . .

rA 1rO 2rO . . . rcO rn

Jumlah 1m 2m . . . cm n

Contoh 7.5:

Dari empat jurusan pada Akademi KLM diambil sampel acak yang

terdiri atas 100 orang mahasiswa untuk tiap jurusan. Tiap mahasiswa

ditanyai pendapatnya terhadap pernyataan “Aplikasi komputer sangat perlu

229

dipelajari oleh semua mahasiswa akademi ini”. Pendapat mahasiswa

diklasifikasikan berupa: Setuju, netral, dan tidak setuju.

Hasil pengumpulan pendapat mahasiswa tersebut disajikan pada tabel

7.14.a, sedangkan frekuensi harapannya pada tabel 7.14.b dihitung dengan

menggunakan rumus ijE = i jn m

n.

Tabel 7.14. Pendapat mahasiswa mengenai keperluan untuk

mempelajari aplikasi komputer

a. Tabel observasi

Jurusan Pendapat

Jumlah Setuju Netral Tidak setuju

A 47 18 35 100

B 60 12 28 100

C 68 11 21 100

D 73 7 20 100

Jumlah 248 48 104 100

b. Tabel harapan

Jurusan Pendapat

Jumlah Setuju Netral Tidak setuju

A 62 12 26 100

B 62 12 26 100

C 62 12 26 100

D 62 12 26 100

Jumlah 248 48 104 100

Uji hipotesis:

1. Jenis uji statistik: Uji khi-kuadrat (uji homogenitas).

2. Hipotesis: 0H : 1iP = 1P ; 2iP = 2P ; . . . ; i = 1, 2, . . . , r

1H : 0H tidak benar

3. Tingkat signifikansi: α = 0.05.

4. Daerah kritis: W > ( )

2

6; 0.05χ , yaitu W > 12.592.

5. Statistik penguji:

230

ujiW = 2ujiχ =

( )2

1 1

r cij ij

i j ij

O E

E= =

−∑∑ =

= ( )247 62

62

− +

( )218 12

12

− +

( )235 26

26

− + . . . +

( )27 12

12

− +

( )220 26

26

− = 17.01

yang berdistribusi 2χ dengan derajat bebas (r – 1)(c – 1) = (3)(2) = 6.

6. Kesimpulan: Karena W > 12.592, 0H ditolak, sehingga pada tingkat

signifikansi 0.05 terdapat perbedaan yang bermakna secara statistik

antara distribusi pendapat terhadap pernyataan “Aplikasi komputer

sangat perlu dipelajari oleh semua mahasiswa akademi ini” di keempat

jurusan akademi KLM.

231

7.3. UJI INDEPENDENSI

� Tabel 2×2

Pada uji indepedensi yang hendak diuji ialah apakah peristiwa A dan

B merupakan kejadian yang saling berkaitan (dependen) / memiliki asosiasi

dengan hipotesis:

0H : ( )P A B = ( )CP A B = ( )P A ) (7.9.a)

atau: 0H : ( )P B A = ( )CP B A = ( )P B ) (7.9.b)

atau: 0H : ( )P A B∩ = ( )P A ( )P B ) (7.9.c)

Jika 0H ditolak, disimpulkan bahwa ada asosiasi yang bermakna

secara statistik antara peristiwa A dengan peristiwa B, sedangkan jika 0H

tidak ditolak, disimpulkan bahwa tidak ada asosiasi yang bermakna secara

statistik antara peristiwa A dengan peristiwa B..

Statistik penguji dan daerah kritis untuk uji indepedensi sama seperti

pada uji homogenitas.

Contoh 7.6:

Pemeriksaan untuk penyakit gula (diabetes mellitus; DM) dan

jantung koroner (PJK) terhadap sampel acak 200 orang pria berusia 50-65

tahun memberikan hasil sebagai berikut:

Tabel 7.15. Diabetes mellitus dan penyakit jantung koroner pada pria

usia lanjut

DM PJK

Ada: B Tidak ada: BC Jumlah

Ada: A 16 20 36

Tidak ada: AC 32 132 164

Jumlah 48 152 200

232

Uji hipotesis:

1. Jenis uji statistik: uji khi-kuadrat (uji independensi).

2. Hipotesis: 0H : A dan B independen, yaitu:

0H : ( )P A B = ( )CP A B = ( )P A

atau: 0H : ( )P B A = ( )CP B A = ( )P B

atau: 0H : ( )P A B∩ = ( )P A ( )P B

1H : 0H tidak benar, atau A dan B tidak independen.

3. Tingkat signifikansi: α = 0.05.

4. Daerah kritis: W > ( )

2

1; 0.05χ atau W > 3.84.

5. Statistik penguji:

ujiW = 2ujiχ =

( )

1

2

2 1 2

n ad bc

n n m m

−

=

( ) ( ) ( ) ( )( )

( )( )( )( )

2200 16 132 20 32

36 164 48 152

− = 10.06

yang berdistribusi 2χ dengan derajat bebas 1.

5. Kesimpulan: Karena W > 3.84, 0H ditolak, sehingga pada tingkat

signifikansi 0.05 terdapat asosiasi yang bermakna secara statistik antara

kejadian DM dan PJK pada kelompok pria berusia 50-65 tahun.

� Tabel r×c

Bentuk hipotesis yang diuji di sini sama seperti untuk tabel 2×2,

yaitu:

0H : ( )P A B = ( )CP A B = ( )P A ) (7.10.a)

atau: 0H : ( )P B A = ( )CP B A = ( )P B ) (7.10.b)

atau: 0H : ( )P A B∩ = ( )P A ( )P B ) (7.10.c)

233

sedangkan statistik penguji dan daerah kritisnya sama seperti pada uji

homogenetis untuk tabel r×c.

Contoh 7.7:

Sampel acak yang terdiri atas 1,000 orang responden diklasifikasi-

silangkan menurut kebiasaan merokok (berat, sedang, tidak merokok) dan

tinggi badan (tinggi, sedang, pendek). Frekuensi pengamatan beserta

frekuensi harapannya (dalam kurung) adalah sebagai berikut:

Tabel 7.16. Tinggi badan dan kebiasaan merokok

Kebiasaan

merokok

Tinggi badan Jumlah

Tinggi Sedang Pendek

Berat 102 (127) 290 (282) 132 (114) 524

Sedang 102 (85) 182 (188) 64 (76) 348

Tidak merokok 39 (31) 67 (69) 22 (28) 128

Jumlah 243 539 218 1000

Keterangan: Angka-angka dalam kurung menyatakan frekuensi

harapan.

Uji hipotesis:

1. Jenis uji statistik: uji khi-kuadrat (uji indepedensi).

2. Hipotesis: 0H : Kebiasaan merokok dan tinggi badan independen.

1H : 0H tidak benar.

3. Tingkat signifikansi: α = 0.01.

4. Daerah kritis: W > ( )

2

4; 0.01χ yaitu W > 13.277.

5. Statistik penguji:

ujiW = 2ujiχ =

( )2

1 1

3 3ij ij

i j ij

O E

E= =

−∑∑

= ( )2102 127

127

− +

( )2290 282

282

− +

( )2132 114

114

− + . . . +

234

( )267 69

69

− +

( )222 28

28

− = 16.93

yang berdistribusi

2χ dengan derajat bebas (r – 1)(c – 1) = (2)(2) = 4.

6. Kesimpulan: Karena W > 13.277, 0H ditolak, sehingga pada tingkat

signifikansi 0.01 terdapat asosiasi yang bermakna secara statistik antara

kebiasaan merokok dan tinggi badan.

235

LAMPIRAN 7A: UKURAN ASOSIASI PADA

TABEL KONTIJENSI

Dalam pembahasan terdahulu telah ditunjukkan bahwa keeratan

hubungan antara dua variabel yang berskala kontinu / numerik dapat diukur

dengan koefisien korelasi Pearson. Untuk dua variabel berskala kategorik

yang datanya disajikan dalam bentuk tabel kontijensi, terdapat berbagai

ukuran untuk menyatakan keeratan hubungan antara kedua variabel tersebut,

namun tidak ada satupun di antaranya yang diterima sebagai ukuran tunggal

asosiasi terbaik, walaupun ada satu atau beberapa di antaranya yang lebih

banyak digunakan daripada yang lain. Di sini hanya akan dibahas beberapa

ukuran asosiasi (measures of association; ukuran ketergantungan; measures

of dependence), terutama untuk kontijensi 2×2.

Tabel VII.1. Bentuk umum tabel 2×2 untuk pembahasan ukuran

asosiasi

Variabel A Variabel B

B1 B2 Jumlah

A1 a b 1n

A2 c d 2n

Jumlah 1m 2m n

� Koefisien phi:

φ =

2uji

n

χ (7.11)

� Koefisien kontijensi Pearson:

P =

2

uji

ujin

χ

χ+ (7.12)

� Koefisien kontijensi Cramer (dapat digunakan untuk tabel r×c):

C = ( )

2

1

uji

n q

χ

− (7.13)

236

dengan: q = min (r ; c)

� Ukuran Q Yule (Yule’s Q):

Q = ad bc

ad bc

−

+ (7.14)

Untuk n besar, Q berdistribusi normal dengan variansi:

( )ˆˆVar Q = 1

4( )2

2ˆ1 Q−

1 1 1 1

a b c d

+ + +

(7.15)

sehingga dapat dihitung interval konfidensi 100(1 − α)%-nya.

� Rasio imbangan (rasio odds; odds ratio):

ˆOR = ad

bc (7.16)

Untuk n besar, transformasi logaritma rasio imbangan ln ˆOR

berdistribusi normal dengan variansi:

ˆVar (ln ˆOR ) = 1 1 1 1

a b c d

+ + +

(7.17)

sehingga dapat dihitung interval konfidensi 100(1 − α)%-nya.

Nilai rasio imbangan berkisar antara nol sampai dengan tak berhingga.

Tidak adanya asosiasi antara variabel baris dengan variabel kolom

dinyatakan dengan nilai rasio imbangan sama dengan satu.

Contoh VII.1:

Lihat kembali data pria berpenyakit DM dan PJK pada contoh 7.6,

yang disajikan kembali di bawah ini:

Tabel 7.15. Diabetes melitus dan penyakit jantung koroner pada pria

usia lanjut

DM PJK

Ada: B Tidak ada: BC Jumlah

Ada: A a = 16 b = 20 36

Tidak ada: AC c = 32 d = 132 164

Jumlah 48 152 n = 200

237

Pada contoh 7.6 telah dihitung nilai statistik penguji 2ujiχ = 10.06.

a. Koefisien phi adalah:

φ =

2uji

n

χ

= 10.06

200 = 0.224

b. Koefisien kontijensi Pearson adalah:

P =

2

uji

ujin

χ

χ+

=10.06

200 10.06+ = 0.219

c. Koefisien kontijensi Cramer adalah:

C = ( )

2

1

uji

n q

χ

−

Untuk tabel 2×2, q = min (r ; c) = 2 sehingga koefisien kontijensi

Cramer bernilai sama dengan koefisien phi:

C = 0.224

d. Ukuran Q Yule adalah:

Q = ad bc

ad bc

−

+

= ( )( ) ( ) ( )( )( ) ( ) ( )

16 132 20 32

−

+ = 0.535

Standard error Q adalah:

( )ˆˆSE Q = ( )221 1 1 1 1ˆ1

4Q

a b c d

− + + +

= ( )2

21 1 1 1 11 0.535

4 16 20 32 132

− + + +

= 0.139

Interval konfidensi 95% ukuran Q adalah:

Q + 0.025Z . ( )ˆˆSE Q

238

atau: 0.535 + (1.96)(0.139)

yaitu: [0.263 ; 0.807]

e. Rasio imbangan adalah:

ˆOR = ad

bc

= ( )( )( ) ( )

16 132

20 32 = 3.3

Transformasi logaritma ˆOR adalah:

ln ˆOR = ln 3.3 = 1.194

Standard error ln ˆOR adalah:

ˆSE (ln ˆOR ) = 1 1 1 1

a b c d

+ + +

= 1 1 1 1

16 20 32 132

+ + +

= 0.389

Interval konfidensi 95% ln OR adalah:

ln ˆOR ± 0.025Z . ˆSE (ln ˆOR )

atau: 1.194 + (1.96)(0.389)

yaitu: [0.431 ; 1.956]

Interval konfidensi 95% OR adalah:

[exp 0.431 ; exp 1.956]

yaitu: [1.540 ; 7.074]

239

LAMPIRAN 7B: UKURAN SAMPEL MINIMUM

UNTUK UJI KESAMAAN BEBERAPA PROPORSI

Pada bab 3, subbab 3.4 telah dibahas cara penentuan ukuran sampel

minimum untuk uji kesamaan 2 proporsi, sedangkan dalam lampiran 6D

pada pembahasan mengenai ukuran sampel minimum untuk uji kesamaan

beberapa nilai rerata telah dijelaskan mengenai kelompok kontrol serta

alokasi rasio uji-kontrol. Konsep-konsep dalam pembahasan terdahulu

tersebut akan digunakan kembali pada penentuan ukuran sampel minimum

untuk uji kesamaan beberapa proporsi pada tabel kontijensi r×2 di sini.

Misalkan hendak dilakukan uji homogenitas khi-kuadrat untuk

mengkaji kesamaan proporsi pada k kelompok perbandingan dengan sampel

berukuran minimum yang dibutuhkan, yang terdiri atas:

a. Satu kelompok kontrol (control group), dengan ukuran kelompok cn .

b. (k – 1) kelompok uji (test groups), masing-masing dengan ukuran

kelompok tn .

Ukuran sampel seluruhnya adalah:

n = (k – 1) tn + cn (7.18)

Perbandingan ukuran satu kelompok uji tn dengan ukuran kelompok

kontrol cn dinamakan ‘rasio alokasi uji-kontrol’ (test-control allocation

ratio):

λ = t

c

n

n (7.19)

Ukuran kelompok kontrol minimum adalah:

cn =

( )

2

1c c t t

c t

Z PQ Z P Q PQ

P P

α βλ

λλ

+ + +

− (7.20)

cP : proporsi pada populasi kontrol

tP : proporsi pada populasi uji

240

cQ = 1 − cP tQ = 1 − tP (7.21)

P = 1

c tP Pλ

λ

+

+ Q = 1 − P (7.22)

d = ( c tP P− ) : perbedaan minimum yang hendak dideteksi antara

proporsi pada populasi kontrol dan populasi uji.

Ukuran satu kelompok uji adalah:

tn = λ cn (7.19.a)

Untuk λ = 1 (alokasi uniform), maka:

cn = ( )

( )

2

2 2 c c t t

c t

Z PQ Z P Q PQ

P P

α β + +

− (7.23)

dan: tn = cn (7.24)

Contoh VII.2:

Lihat kembali data tentang insomnia pada 3 kelompok usia pada

contoh 7.1, tabel 7.4. Misalkan sebelum penelitian terlebih dahulu dilakukan

perhitungan ukuran sampel minimum untuk mendeteksi adanya perbedaan

proporsi penderita insomnia sebesar 0.10 pada 2 kelompok usia 18-34 tahun

dan 35-54 tahun, dibandingkan dengan proporsi penderita insomnia pada

kelompok usia 55-74 tahun sebagai kelompok kontrol. Hasil penelitian

pendahuluan menunjukkan estimasi proporsi penderita insomnia pada

kelompok kontrol sebesar 50%. Dengan tingkat signifikansi 5% dan

kekuatan uji 80%, maka:

k = 3 d = 0.10

ˆcP = cp = 0.50

ˆtP = tp = cp − d = 0.50 – 0.10 = 0.40

cq = 1 − cp = 1 – 0.50 = 0.50

tq = 1 − tp = 1 – 0.40 = 0.60

α = 0.05 2Zα = 1.96

1 – β = 0.80 Zβ = 0.84

Dengan alokasi uniform, maka λ = 1, sehingga:

241

p = 2

c tp p s+ =

0.50 0.40

2

+ = 0.45

q = 1 − p = 1 – 0.45 = 0.55

Ukuran minimum kelompok kontrol adalah:

cn = ( )

( )

2

2 2 c c t t

c t

Z PQ Z P Q PQ

P P

α β + +

−

= ( ) ( )( ) ( )( ) ( )( )

2

1.96 2 0.45 0.55 0.84 0.50 0.50 0.40 0.60

0.10

+ +

= 387.35 ≈ 388

Ukuran minimum satu kelompok uji adalah:

tn = cn = 388

Ukuran sampel seluruhnya adalah:

n = (k – 1) tn + cn

= (2)(388) + 388 = 1,164

242

LATIHAN 7

Bagian Pertama

Pilihlah satu jawaban yang paling benar!

1. Uji 2-sisi (two-sided test) adalah pengujian terhadap hipotesis

0 :H οθ θ= , sedangkan uji 2-ekor (two-tail test) yaitu uji dengan

daerah kritis (daerah penolakan) berada di kedua ekor distribusi

sampling. Kedua istilah ini memiliki pengertian yang serupa pada:

A. Uji t C. Keduanya benar

B. Uji khi-Kuadrat D. Keduanya salah

2. Untuk menguji hubungan antara variabel independen kategorik

dengan variabel dependen kategorik, metode statistik yang digunakan

adalah:

A. Uji .Z C. Analisis regresi linear.

B. Analisis variansi D. Uji khi-kuadrat Pearson

3. Penggunaan uji khi-kuadrat bagi data kategorik antara lain adalah

untuk:

A. Uji homogenitas

B. Uji independensi

C. Uji kebaikan-suai (goodness-of-fit)

D. Semuanya benar

4. Pada uji khi-kuadrat terhadap tabel kontijensi r×c (r baris dan c

kolom), statistik penguji yang dihasilkan memiliki derajat bebas

sebesar:

A. r×c C. (r – 1) × (c – 1)

B. (r×c) − 1 D. Semuanya salah.

5. Data yang dianalisis dengan uji independensi berasal dari:

A. Satu sampel C. Tiga sampel

B. Dua sampel D. Semuanya salah.

243

6. Pada sampel 100 orang mahasiswa wanita teradapat 25 orang

penderita nyeri kepala kronis, sedangkan pada sampel 100 orang

mahasiswa pria hanya pada 14 penderita kelainan yang sama. Untuk

mengkaji ada tidaknya perbedaan proporsi penderita nyeri kepala

diantara mahasiswa pria dan wanita secara statistik digunakan:

A. Uji Z untuk kesamaan proporsi

B. Uji khi-kuadrat

C. Keduanya dapat digunakan

D. Keduanya tidak dapat digunakan

7. Frekuensi harapan pada tabel r×c menyatakan:

A. Frekuensi yang diharapkan akan terjadi jika variabel baris

memiliki asosiasi dengan variabel kolom.

B. Frekuensi yang diharapkan akan terjadi jika variabel baris tidak

memiliki asosiasi dengan variabel kolom.

C. Frekuensi yang diharapkan akan terjadi jika variabel baris dan

variabel kolom tidak independen.

D. Semuanya salah.

8. Frekuensi marginal pada tabel harapan:

A. Lebih kecil daripada frekuensi marginal pada tabel observasi.

B. Sama besar dengan frekuensi marginal pada tabel observasi.

C. Lebih besar daripada frekuensi marginal pada tabel observasi.

D. Semuanya salah.

9. Hipotesis 0H : A dan B independen dapat juga dinyatakan sebagai:

A. ( ) ( )P A B P B A= C. ( ) ( ) ( )P A B P A P B∪ =

B. ( ) ( )CP A B P A B= D. Semuanya benar

10. Data untuk mengkaji hubungan usia(muda, dewasa, tua) dengan

kebiasaan merokok (bukan perokok, perokok ringan, perokok berat)

yang disajikan dalam bentuk tabulasi silang memiliki derajat bebas:

A. 1 C. 6

B. 4 D. 9

244

Bagian Kedua

Pilihlah satu jawaban yang paling benar!

Untuk soal No. 1 s.d. 6:

Untuk menguji kebenaran dugaan bahwa kelompok orang usia lanjut

lebih sedikit tidurnya dibandingkan kelompok orang usia muda, diambil

sampel acak 250 orang berusia 30-40 tahun dan 250 orang berusia 60-70

tahun, lalu ditanyakan kebiasaan tidurnya. Hasilnya adalah sebagai berikut:

Jam tidur

(jam/hari)

Umur (tahun)

30-40 60-70

< 8 172 120

> 8 78 130

1. Uji statistik untuk data di atas tergolong dalam:

A. Uji indepedensi C. Keduanya benar

B. Uji homogenitas D. Keduanya salah

2. Jika 1P menyatakan proporsi orang usia muda yang tidurnya kurang

daripada 8 jam/hari, dan 2P menyatakan proporsi hal yang sama pada

orang usia lanjut, maka dengan menggunakan uji khi-kuadrat untuk

data di atas, hipotesis yang diujiialah:

A. 0 1 2:H P P≤ C. 0 1 2:H P P≥

B. 0 1 2:H P P= D. Semuanya salah

3. Statistik penguji untuk data di atas besarnya adalah:

A. 1.712 C. 4.452

B. 3.425 D. 22.26

4. Statistik penguji tersebut berdistribusi khi-kuadrat dengan derajat

bebas:

A. 1 C. 3

B. 2 d. 4

5. Dengan tingkat signifikansi 5%α = , nilai kritis untuk statistik

penguji ialah:

A. 3.84 C. 9.49

B. 5.02 D. 11.14

245

6. Kesimpulan yang diperoleh:

A. Pada tingkat signifikansi 5%, terdapat perbedaan proporsi

individu yang tidur lebih sedikit yang bermakna secara statistik di

antara kelompok usia muda dan kelompok usia lanjut.

B. Pada tingkat signifikansi 5%, tidak terdapat perbedaan proporsi

individu yang tidur lebih sedikit yang bermakna secara statistik di

antara kelompok usia muda dan kelompok usia lanjut.

C. Pada tingkat signifikansi 10%, tidak terdapat perbedaan proporsi

individu yang tidur lebih sedikit yang bermakna secara statistik di

antara kelompok usia muda dan kelompok usia lanjut.

D. Semuanya salah.

Untuk soal No. 7 s.d. 12:

Polusi sulfur dioksida di udara dapat menyebabkan kerusakan

tanaman. Untuk mempelajari pengaruhnya terhadap berbagai jenis sayuran

kebun, 40 tanaman masing-masing jenis sayuran ditanam dalam rumah hijau

yang terpolusi sulfur dioksida dengan hasil sebagai berikut:

Kerusakan daun Jenis sayuran

Kubis Bayam Tomat

Parah 32 28 19

Sedikit/tidak rusak 8 12 21

7. Frekuensi observasi tanaman bayam yang rusak parah adalah:

A. 12 C. 28

B. 19 D. 32

8. Frekuensi harapan tanaman kubis yang rusak parah adalah:

A. 13.67 C. 28.00

B. 26.33 D. 32.00

9. Nilai ( )ij ijO E− untuk tanaman tomat yang sedikit / tidak rusak

adalah:

A. 5.33− C. 5.33

B. 7.33− D. 7.33

10. Nilai ( )2

ij ijO E− untuk tanaman kubis yang sedikit / tidak rusak

adalah:

A. 2.78 C. 205.44

B. 32.11 D. 336.11

246

11. Nilai ( )2

/ij ij ijO E E− untuk tanaman tomat yang rusak parah adalah:

A. 1.08 C. 2.08

B. 2.04 D. 3.39

12. Statistik penguji besarnya adalah:

A. 3.67 C. 5.92

B. 3.88 D. 9.85

Bagian Ketiga

Untuk soal No. 1 s.d. 4:

Tabel di bawah ini menunjukkan hasil uji coba sebuah vaksin baru

terhadap hewan ternak, yaitu jumlah ternak yang hidup dan mati pada saat

wabah.

Fatal Non-fatal

Vaksinasi 6 114

Tanpa vaksinasi 18 162

1. Uji statistik yang relevan untuk menganalisis data di atas ialah:

A. Uji khi-kuadrat Pearson C. Uji eksak Fisher

B. Uji McNemar D. Semuanya benar

2. Dengan menggunakan uji khi-kuadrat, statistik penguji untuk data di

atas besarnya adalah:

A. 1.355 C. 4.765

B. 2.446 D. 12.36

3. Dengan tingkat signifikansi 5%,α = nilai kritis untuk statistik

penguji ialah:

A. 3.84 C. 9.49

B. 5.02 D. 11.14

247

4. Kesimpulan yang diperoleh yaitu:

A. Pada tingkat signifikansi 5%, terdapat perbedaan proporsi

kematian ternak yang bermakna secara signifikansi di antara

kelompok dengan vaksinasi dan kelompok tanpa vaksinasi.

B. Pada tingkat signifikansi 5%, tidak terdapat perbedaan proporsi

kematian ternak yang bermakna secara statistik di antara

kelompok dengan vaksinasi dan kelompok tanpa vaksinasi.

C. Pada tingkat signifikansi 10%, terdapat perbedaan proporsi

kematian ternak yang bermakna secara statistik di antara

kelompok dengan vaksinasi dan kelompok tanpa vaksinasi.

D. Semuanya salah.

Untuk soal No. 5 s.d. 7:

Seorang pekerja sosial berdasarkan hasil wawancaranya terhadap

pasangan-pasangan suami istri yang mengurus perceraian, hendak meneliti

apakah ada kaitan masa penjajakan pra-nikah (lama hubungan sebelum

menikah) dengan usia perkawinan (lama perkawainan dapat dipertahankan).

Data yang ada yaitu:

Masa penjajagan pra-nikah Usia perkawinan

< 4 tahun > 4 tahun

Kurang daripada ½ tahun 11 8

½ - 1 ½ tahun 28 24

Lebih daripada 1 ½ tahun 21 19

5. Untuk menguji 0 :H tidak ada asosiasi antara masa penjajagan pra-

nikah dengan usia perkawinan, statistik pengujinya besarnya adalah:

A. 0.15 C. 3.84

C. 1.33 D. 4.11

6. Dengan tingkat signifikansi 5%α = , nilai kritis untuk statistik

penguji adalah:

A. 3.841 C. 5.991

B. 5.024 D. 7.378

248

7. Kesimpulan yang diperoleh yaitu:

A. Pada tingkat signifikansi 1%, terdapat asosiasi yang bermakna

secara statistik antara masa penjajagan pra-nikah dengan usia

perkawainan.

B. Pada tingkat signifikansi 5%, terdapat asosiasi yang bermakna

secara statistik antara masa penjajagan pra-nikah dengan usia

perkawinan.

C. Pada tingkat signifikansi 10%, terdapat asosiasi yang bermakna

secara statistik penjajagan pra-nikah dengan usia perkawinan.

D. Semuanya salah.

249

BAB 8

ANALISIS DATA KATEGORIK II

8.1. UJI EKSAK FISHER

Dalam pengambilan sampel di lapangan yang umumnya selalu

dilakukan dalam bentuk tanpa pengembalian, penggunaan distribusi binomial

sebagai dasar perhitungan probabilitas dianggap valid apabila sampel

berukuran cukup besar. Pada uji khi-kuadrat Pearson yang didasarkan atas

selisih 2 proporsi binomial, dibutuhkan ukuran sampel yang cukup besar

yang dinyatakan dalam bentuk persyaratan bahwa tidak ada sel dengan

frekuensi harapan lebih kecil daripada lima.

Adanya frekuensi harapan yang lebih kecil daripada lima pada salah

satu sel dalam tabel 2×2 mengindikasikan ukuran sampel yang terlalu kecil

untuk dianalisis dengan menggunakan distribusi binomial dan uji khi-kuadrat

Pearson, dan dalam keadaan tersebut perhitungan probabilitas didasarkan

atas distribusi hipergeometrik, yaitu dengan uji eksak Fisher.

Pada uji eksak Fisher tidak ada statistik penguji, dan uji hipotesis

dilakukan dengan menghitung secara langsung nilai p-nya.

Contoh 8.1:

Misalkan dimiliki data keinginan bunuh diri pada 20 penderita

psikokis dan 20 penderita neurosis sebagai berikut:

Tabel 8.1. Keinginan bunuh diri pada pasien psikokis dan neurosis

Tipe pasien Keinginan bunuh diri

Ada Tidak ada Jumlah

Psikosis a = 2 (4) b = 18 (16) 1n = 20

Neurosis c = 6 (4) d = 14 (16) 2n = 20

Jumlah 1m = 8 2m = 32 n = 40

Keterangan: Angka dalam kurung menyatakan frekuensi harapan

Nilai p mencakup probabilitas komposisi data yang sama dengan dan

lebih ekstrim daripada data sampel. Data sampel menunjukkan nilai 11O

= a

= 2.

250

Misalkan 1P menyatakan proporsi yang berkeinginan bunuh diri dari

pada populasi penderita psikosis dan 2P menyatakan proporsi serupa pada

populasi penderita neurosis. Pada pengujian hipotesis 0H : 1P >

2P,

komposisi data yang lebih ekstrim daripada a = 2 mencakup nilai-nilai a = 1 dan a = 0 (lihat tabel 8.2.a dan 8.2.b).

Tabel 8.2. Tabel dengan frekuensi sel yang lebih ekstrim daripada

pengamatan

(a) (b)

1 19 20 0 20 20

7 13 20 8 12 20

8 32 40 8 32 40

Atas dasar distribusi hipergeometrik, probabilitas untuk mendapatkan

nilai a sebagai frekuensi pengamatan untuk sel kiri atas (dan komposisi

keseluruhan tabel) adalah:

P (a) = 1 2

1

n na c

nm

C C

C =

1 2

! !1 2! ! ! !

!

! !

n n

a b c d

n

m m

P (a) = 1 2 1 2! ! ! !

! ! ! ! !

n n m m

a b c d n (8.1)

Nilai p 1-sisi adalah (lihat perhitungan pada tabel 8.3):

p = P (a = 2) + P (a = 1) + P (a = 0)

Tabel 8.3. Perhitungan nilai p satu-sisi

a P (a)

2 20! 20! 8! 32!

2! 18! 6! 14! 40! = 0.0958

1 20! 20! 8! 32!

1! 19! 7! 13! 40! = 0.0202

0 20! 20! 8! 32!

0! 20! 8! 12! 40! = 0.0016

p P (2) + P (1) + P (0) = 0.1176

251

Dengan tingkat signifikansi α = 0.05, nilai p yang diperoleh lebih

besar daripada α, sehingga hipotesis nol yang menyatakan tidak ada

hubungan antara tipe kelainan jiwa pasien dengan keinginan bunuh diri tidak

ditolak.

Dikenal tiga versi uji eksak Fisher:

1. Uji eksak Fisher 1-sisi: Merupakan bentuk yang lazim digunakan,

seperti pada contoh 8.1 diatas.

2. Uji eksak Fisher-Irwin 2-sisi: Nilai p 2-sisi diperoleh sebagai hasil

penjumlahan nilai p 1-sisi pada uji eksak Fisher 1-sisi ditambah dengan

probabilitas di pihak yang berseberangan pada distribusi probabilitas a

(lihat contoh 8.2).

3. Uji eksak Fisher 2-sisi: Nilai p diperoleh dengan mengali-duakan nilai

p 1-sisi pada uji eksak Fisher 1-sisi. Pada contoh 8.1 , nilai p 1-sisi

adalah 0.1176, sehingga p 2-sisi adalah (2)(0.1176) = 0.2352.

Contoh 8.2:

Lihat kembali data pada soal 8.1 (tabel 8.1). Secara teoretis, rentang

nilai a berkisar antara 0 s.d. 2. Pada uji eksak Fisher 1-sisi (soal 8.1) telah

dihitung nilai p 1-sisi sebagai penjumlahan probabilitas P (a = 2) + P (a = 1)

+ P (a = 0) = 0.1176.

Pada pihak yang ‘berseberangan’ akan dihitung nilai p sebagai

penjumlahan probabilitas P (a = 6) + P (a = 7) + P (a = 8). Penyajian

datanya diperlihatkan pada tabel 8.4, sedangkan perhitungan pada tabel 8.5.

Tabel 8.4. Tabel dengan frekuensi sel yang lebih ekstrim daripada

pengamatan

(a) (b)

6 14 20 7 13 20

2 18 20 1 19 20

8 32 40 8 32 40

(c)

8 12 20

0 20 20

8 32 40

252

Tabel 8.5. Perhitungan nilai p 1-sisi

a P (a)

6 20! 20! 8! 32!

6! 14! 2! 18! 40! = 0.0958

7 20! 20! 8! 32!

7! 13! 1! 19! 40! = 0.0202

8 20! 20! 8! 32!

8! 12! 0! 20! 40! = 0.0016

p P (6) + P (7) + P (8) = 0.1176

Diperoleh nilai p 2-sisi uji Fisher-Irwin:

p = [P (2) + P (1) + P (0)] + [P (6) + P (7) + P (8)]

= 0.1176 + 0.1176 = 0.2352

Tampak di sini bahwa distribusi probabilitas a kurang lebih simetris:

P (a = 2) ≈ P (a = 6); P (a = 1) ≈ P (a = 7); dan P (a = 0) ≈ P (a = 8);

sehingga hasil uji eksak Fisher-Irwin 2-sisi (nilai p-nya) di sini tepat sama

dengan hasil uji eksak Fisher 2-sisi, walaupun begitu hal ini tidak selalu

terjadi demikian.

253

8.2. UJI KEBAIKAN-SUAI (UJI GOODNESS-OF-FIT)

Uji kebaikan-suai (goodness-of-fit) adalah uji statistik untuk menilai

sejauh mana kesesuaian data sampel yang ada dengan bentuk distribusi yang

dispesifikasikan dalam hipotesis nol. Bentuk distribusi menurut hipotesis nol

tersebut dapat berupa:

a. Distribusi data lampau (tanpa disertai spesifikasi bentuk

distribusinya).

b. Distribusi tertentu, misalnya distribusi normal, distribusi Poisson, dan

sebagainya.

� Uji Normalitas

Yang akan dibahas di sini hanya uji kebaikan-suai yang terbanyak

digunakan dalam praktik, yaitu uji normalitas (uji goodness-of-fit distribusi

normal). Uji ini digunakan untuk menilai apakah data sampel yang diperoleh

dapat dianggap berasal dari populasi normal. Selain uji normalitas khi-

kuadrat yang dibahas di sini masih ada beberapa uji normalitas lain, misalnya

uji Kolmogorov-Smirnov (uji Lilliefors), uji Shapiro-Wilk, dan sebagainya.

Uji normalitas khi-kuadrat sebenarnya bukanlah diperuntukkan bagi

analisis data kategorik murni, karena data sampel akan diuji berskala kontinu

atau sekurang-kurangnya numerik, yang untuk pengujiannya terlebih dahulu

harus dikategorisasikan. Distribusi frekuensi yang diperoleh sebagai hasil

kategorisasi ini disajikan sebagai tabel observasi dalam bentuk tabel 1×c

(lihat tabel 7.1.a) atau dapat pula dalam bentuk tabel r×1.

Uji khi-kuadrat untuk normalitas data terdiri atas 2 tahap, yaitu

perhitungan frekuensi harapan dan uji hipotesis.

� Perhitungan Frekuensi Harapan

Frekuensi harapan diperoleh dengan mengkategorisasikan distribusi

normal tertentu yang memiliki rerata dan standar deviasi yang

dispesifikasikan dalam hipotesis. Jika rerata dan standar deviasi ini tidak

dispesifikasikan, harus digunakan nilai-nilai estimasinya yang diperoleh dari

sampel.

Contoh 8.3:

Misalkan dimiliki data usia hidup 40 aki merek PQR dengan

distribusi frekuensi seperti terlihat tabel 8.6 (jika data yang ada berskala

254

kontinu harus terlebih dahulu dikategorisasikan, lihat buku teks Metode

Statistika I, bab 2: Peringkasan Data). Tabel distribusi frekuensi ini

merupakan tabel observasi untuk uji normalitas khi-kuadrat.

Tabel 8.6. Distribusi frekuensi usia hidup 40 aki merek PQR

Usia hidup (tahun) jf

1.45−1.95 2

1.95−2.45 1

2.45−2.95 4

2.95−3.45 15

3.45−3.95 10

3.95−4.45 5

4.45−4.95 3

n = jj

f∑ 40

Langkah-langkah perhitungan frekuensi harapan:

1. Cari parameter populasi normal (µ dan σ):

Untuk menghitung frekuensi harapan seandainya sampel di atas berasal

dari populasi normal, perlu diketahui parameter populasinya, yaitu

rerata dan standar deviasi populasi. Karena nilai-nilai ini tak diketahui,

harus dihitung estimasinya, yaitu rerata dan standar deviasi sampel

(untuk perhitungan rerata dan standar deviasi data tak berkelompok,

lihat kembali buku teks Metode Statistika I, bab 3: Ukuran Statistik).

Tabel 8.7. Perhitungan rerata dan standar deviasi distribusi usia hidup

40 aki merek PQR

Interval kelas jf jX jf jX jf

2jX

1.45-1.95 2 1.7 3.4 5.78

1.95-2.45 1 2.2 2.2 4.84

2.45-2.95 4 2.7 10.8 29.16

2.95-3.45 15 3.2 48.0 153.60

3.45-3.95 10 3.7 37.0 136.90

3.95-4.45 5 4.2 21.0 88.20

4.45-4.95 3 4.7 14.1 66.27

jj

f∑ j j

j

f X∑ 2j j

j

f X∑

255

x =

j jj

jj

f X

f

∑

∑ (8.2)

= 136.5

40 = 3.4125

s =

2

1

j j j j jj j j

jj

f X f X f

f

−

∑ ∑ ∑

∑ (8.3)

=

2484.75 136.5 40

40 1

−

− = 0.6969

2. Transformasi batas kelas menjadi nilai Z:

Dengan menggunakan transformasi:

jZ = jX µ

σ

−

batas-batas kelas ditransformasikan ke dalam distribusi normal standar

(distribusi Z), nilai µ dan σ yang tidak diketahui disubstitusikan dengan

estimatornya x dan s:

jZ = jX x

s

− (8.4)

256

Tabel 8.8. Transformasi batas kelas distribusi normal menjadi batas

kelas distribusi Z

Batas kelas

distribusi normal: jX Batas kelas distribusi Z: jZ = jX x

s

−

1.95 1.95 3.4125

0.6969

− = −2.10

2.45 2.45 3.4125

0.6969

− = −1.38

2.95 2.95 3.4125

0.6969

− = −0.66

3.45 3.45 3.4125

0.6969

− = 0.05

3.95 3.95 3.4125

0.6969

− = 0.77

4.45 4.45 3.4125

0.6969

− = 1.49

3. Tentukan luas area masing-masing kelas:

Dengan menggunakan tabel Z, tentukan luas area masing-masing kelas

dalam distribusi Z:

Tabel 8.9. Penentuan luas area masing-masing dalam distribusi Z

Interval kelas Luas area

Z < −2.10 0.0179

−2.10 < Z < −1.38 0.0659

−1.38 < Z < −0.66 0.1708

−0.66 < Z < 0.05 0.2653

0.05 < Z < 0.77 0.2595

0.77 < Z < 1.49 0.1525

Z > 1.49 0.0681

Jumlah luas area 1.0000

4. Hitung frekuensi harapan:

Frekuensi harapan untuk tiap kelas sesuai dengan luas areanya masing-

masing.

257

Tabel 8.10. Perhitungan frekuensi harapan untuk tiap kelas pada

distribusi Z

Interval kelas Frekuensi harapan ( jE )

1.45−1.95 0.0179 × 40 = 0.72

1.95−2.45 0.0659 × 40 = 2.64

2.45−2.95 0.1708 × 40 = 6.83

2.95−3.45 0.2653 × 40 = 10.61

3.45−3.95 0.2595 × 40 = 10.38

3.95−4.45 0.1525 × 40 = 6.10

4.45−4.95 0.0681 × 40 = 2.72

Jumlah 40

5. Penggabungan kelas:

Untuk digunakan dalam uji khi-kuadrat kebaikan-suai, tidak boleh ada

sel dengan frekuensi harapan lebih kecil daripada 5, sehingga jika perlu

harus dilakukan penggabungan kelas interval:

Tabel 8.11. Tabel harapan untuk distribusi frekuensi 40 aki merek PQR

No Kelas interval Frekuensi harapan

1 < 2.95 10.19

2 2.95 − 3.45 10.61

3 3.45 − 3.95 10.38

4 > 3.95 8.82

Jumlah 40

� Uji Hipotesis

Setelah tabel observasi diperoleh dan tabel harapannya disusun, dapat

dilakukan uji normalitas khi-kuadrat dengan langkah-langkah sebagai

berikut:

1. Jenis uji statistik: uji kebaikan-suai (uji khi-kuadrat).

2. Hipotesis:

0H : Sampel acak berasal dari populasi normal ) (8.5.a)

1H : Distribusi populasi tidak normal ) (8.5.b)

3. Tingkat signifikansi: α = 0.01, 0.05, atau 0.10.

258

4. Daerah kritis: W >

2

;k αχ

(8.6)

5. Statistik penguji:

ujiW = 2ujiχ =

( )2

1

cj j

j j

O E

E=

−

∑ (8.7)

yang berdistribusi 2χ dengan derajat bebas k, yaitu c dikurangi jumlah

kuantitas data observasi (data sampel) yang digunakan untuk

menghitung frekuensi harapan. Kuantitas yang diperlukan seluruhnya

ada 3, yaitu n (jumlah pengamatan), x (rerata sampel), dan s (standar

deviasi sampel).

6. Kesimpulan:

0H ditolak : Sampel dianggap tidak berasal dari populasi

normal.

0H tidak ditolak : Sampel dianggap berasal dari populasi normal.

Contoh 8.4:

Lihat data pada contoh 8.3. Hendak diuji apakah data sampel tersebut

berasal dari populasi normal.

Tabel 8.12. Distribusi frekuensi observasi dan harapan usia hidup 40 aki

merek PQR

No kelas 1 2 3 4

jO 7 15 10 8

jE 10.19 10.61 10.38 8.82

Uji hipotesis:

1. Jenis uji statistik: uji kebaikan-suai (uji khi-kuadrat).

2. Hipotesis:

0H : Sampel acak berasal dari populasi normal

1H : Sampel acak berasal dari populasi tidak normal

3. Tingkat signifikansi: α = 0.05.

4. Daerah kritis: W >

2

1; 0.05χ , yaitu W > 3.84.

259

5. Statistik penguji:

ujiW = 2ujiχ =

( )2

4

1

j j

O E

E=

−

∑

= ( )27 10.19

10.19

− +

( )215 10.61

10.61

− +

( )210 10.38

10.38

− +

( )28 8.82

8.82

− = 2.91

yang berdistribusi 2χ dengan derajat bebas k.

Digunakan 3 kuantitas sampel pada perhitungan frekuensi harapan,

yaitu ukuran sampel n, rerata sampel x , dan standar deviasi s, sehingga

k = c – 3 = 4 – 3 = 1.

6. Kesimpulan: Karena W > 3.84, ujiW tidak terletak pada daerah kritis

dan 0H tidak ditolak, sehingga data sampel dapat dianggap berasal dari

populasi normal.

260

8.3. UJI MCNEMAR

Uji McNemar digunakan untuk data kategorik dikotomi berpasangan.

Pengertian data ‘berpasangan’ di sini adalah sama seperti pada uji t berpasangan, yaitu data untuk dua variabel yang sama, yang berasal dari:

- Subjek yang sama pada bagian yang berbeda, misalnya bagian kiri dan

kanan tubuh.

- Subjek yang sama pada waktu yang berlainan, misalnya sebelum dan

sesudah ‘perlakuan’.

- Subjek berpasangan, misalnya pasangan anak kembar, pasangan subjek

yang ‘dipadankan’ (di-matched), dan sebagainya.

Bentuk umum paparan data kategorik berpasangan ‘sebelum’ dan

‘sesudah’ perlakuan diperlihatkan pada tabel 8.13. Pada uji McNemar yang

dipentingkan hanyalah frekuensi f dan g, yaitu jumlah subjek yang

mengalami perubahan ‘sebelum’ dan ‘sesudah’ perlakuan.

Tabel 8.13. Bentuk umum paparan data pada uji McNemar

iX = Sebelum perlakuan iY = Sesudah perlakuan

iY = 1 iY = 0

iX = 1 e f

iX = 0 g h

Langkah-langkah uji hipotesis:

1. Jenis uji statistik: Uji McNemar

2. Hipotesis: 0H : P (f) = P (g) = 0.5 ) (8.8.a)

1H : P (f) ≠ P (g) ) (8.8.b)

(hanya untuk responden yang menjalani perubahan)

3. Tingkat signifikansi: α

4. Daerah kritis: W > ( )

2

1;αχ (8.9)

5. Statistik penguji:

ujiW = ( )2

f g

−

+ (8.10)

261

yang berdistribusi khi-kuadrat dengan derajat bebas 1.

Jika hipotesis nol ditolak, disimpulkan bahwa ada perubahan yang

terkait dengan perlakuan yang telah diberikan, dengan kata lain perlakuan

dianggap efektif untuk menghasilkan perubahan.

Contoh 8.5:

Misalkan dilakukan pengumpulan pendapat dari 100 responden yang

dipilih secara acak, apakah akan memilih calon presiden dari Partai

Demokrat atau Partai Republik. Pengumpulan pendapat dilakukan sebelum

dan sesudah debat calon.

Tabel 8.14. Pilihan responden sebelum dan sesudah debat calon

presiden

iX = Sebelum iY = Sesudah

Demokrat Republik

Demokrat e = 63 f = 21

Republik g = 4 h = 12

Uji hipotesis:

1. Jenis uji statistik: Uji McNemar

2. Hipotesis: 0H : P (f) = P (g) = 0.5

1H : P (f) ≠ P (g)

3. Tingkat signifikansi: α = 0.05.

4. Daerah kritis: W > ( )

2

1; 0.05χ , yaitu W > 3.84.

5. Statistik penguji:

ujiW = ( )2

f g

−

+

= ( )221 4

21 4

−

+ = 11.56

yang berdistribusi khi-kuadrat dengan derajat bebas 1.

6. Kesimpulan: Karena W > 3.84, 0H

ditolak, sehingga disimpulkan

bahwa pada tingkat signifikansi 0.05 ada perubahan pilihan responden

yang bermakna secara statistik sebagai hasil menyaksikan debat.

262

Uji McNemar digunakan untuk sampel berukuran besar. Untuk data

berpasangan kategorik yang berskala dikotomi, jika sampel berukuran kecil

digunakan uji tanda, yang akan diuraikan dalam pembahasan Metode

Statistika Non-Parametrik.

263

LAMPIRAN 8A: UKURAN KESEPAKATAN

Data berpasangan dapat diperoleh untuk variabel yang sama, namun

dikumpulkan oleh dua pengamat yang berbeda. Data demikian apabila

berskala kategorik dikotomi, termasuk dalam jenis data yang dapat dianalisis

dengan uji McNemar. Paparan data berpasangan tersebut diperlihatkan pada

tabel VIII.1.

Tabel VIII.1. Tabel observasi untuk paparan data berpasangan dari dua

pengamat berbeda pada tabel 2×2

Pengamat A Pengamat B

Jumlah BY = 1 BY = 0

AY = 1 e f 11n

AY = 0 g h 10n

Jumlah 21n 20n n

Hipotesis yang perlu dibuktikan ialah bahwa pengamat A

memperoleh hasil observasi yang berbeda daripada pengamat B, yang jika

dikonversikan menjadi hipotesis alternatif yaitu 1H : P (f) ≠ P (g), dengan

komplemen hipotesis nol-nya 0H : P (f) = P (g) = 0.5.

Jika hipotesis nol tidak ditolak, langkah selanjutnya yang perlu

dilakukan adalah menilai besar kesesuaian yang ada antara hasil observasi

pengamat A dengan pengamat B, yang dinyatakan dalam bentuk ‘ukuran

kesepakatan’ (measure of agreement). Walaupun ukuran kesepakatan yang

dibahas di sini adalah untuk data berpasangan yang diperoleh dari 2

pengamat dalam bentuk tabel 2×2, ukuran tersebut dapat pula digunakan

untuk setiap jenis data berpasangan yang disajikan dalam bentuk tabel 2×2.

Untuk pembahasan selanjutnya, paparan data pada tabel VIII.1

disajikan kembali dalam bentuk tabel proporsi seperti terlihat pada tabel

VIII.2.

264

Tabel VIII.2. Tabel proporsi untuk paparan data berpasangan dari dua

pengamat berbeda pada tabel 2×2

Pengamat A Pengamat B

Jumlah BY = 1 BY = 0

AY = 1 ep fp

1p

AY = 0 gp h

p 1q

Jumlah 2p 2q 1

ep = e

n

fp =

f

n

gp = g

n

hp =

h

n

1p = ep + f

p = 11n

n 1q = gp +

hp = 1 − 1p

2p = ep + gp = 21n

n 2q =

fp +

hp = 1 − 2p

Estimasi ukuran kesepakatan berdasarkan data sampel adalah:

κ = ( )

1 2 2 1

2 e gh fp p p p

p q p q

−

+ (8.11)

Contoh VIII.1:

Dua orang dokter spesialis paru, A dan B, secara terpisah memeriksa

100 foto Röntgen paru pengunjung rumah sakit untuk menilai ada tidaknya

gambaran tuberkulosis paru. Hasil pemeriksaan adalah sebagai berikut:

Tabel VIII.3. Contoh data berpasangan untuk pembacaan foto Rontgen

paru

a. Tabel observasi

Dokter A Dokter B

Jumlah Tb paru (+) Tb paru (−)

Tb paru (+) e = 20 f = 4 11n = 24

Tb paru (−) g = 10 h = 66 10n = 76

Jumlah 21n = 30 20n = 70 n = 100

265

b. Tabel proporsi

Dokter A Dokter B

Jumlah Tb paru (+) Tb paru (−)

Tb paru (+) ep = 0.20 fp = 0.04

1p = 0.24

Tb paru (−) gp = 0.10 h

p = 0.66 1q = 0.76

Jumlah 2p = 0.30 2q = 0.70 1

Estimasi ukuran kesepakatan antara hasil pembacaan foto Röntgen

dokter A dengan dokter B adalah:

κ = ( )

1 2 2 1

2 e gh fp p p p

p q p q

−

+

= ( ) ( ) ( ) ( )

( ) ( ) ( ) ( )

2 0.20 0.66 0.04 0.10

0.24 0.70 0.30 0.76

− +

= 0.646

266

LAMPIRAN 8B: KOREKSI KONTINUITAS YATES

UNTUK UJI DATA KATEGORIK

Statistik penguji pada uji kuadrat untuk tabel kontijensi 2×2,

( ) [ ]2

1 2 1 2n ad bc n n m m −

sebenarnya berdistribusi diskret, namun di-

aproksimasi dengan distribusi khi-kuadrat yang merupakan distribusi

kontinu. Karena itu, Yates (dibaca: yeits) pada tahun 1934 menganjurkan

penggunaan ‘koreksi kontinuitas’ untuk statistik penguji tersebut (matrik

VIII.1). Pengunaan koreksi kontinuitas juga dianjurkan bagi statistik penguji

pada uji khi-kuadrat untuk tabel kontijensi r×c serta uji McNemar.

Matriks VIII.1. Statistik penguji pada uji khi-kuadrat Pearson dan uji

Mc Nemar dengan dan tanpa koreksi kontinuitas

Uji Statistik Statistik penguji

Tanpa koreksi Dengan koreksi

Uji khi-

kuadrat

Pearson

Tabel 2×2 ( )

1

2

2 1 2

n ad bc

n n m m

−

( )

1 2 1 2

20.5n ad bc n

n n m m

− −

Tabel r×c ( )

2

ij ij

i j ij

O E

E

−

∑∑ ( )

2

0.5ij ij

i j ij

O E

E

− −

∑∑

Uji McNemar ( )2

f g

−

+

( )2

1f g

f g

− −

+

Sebagian ahli statistika menolak penggunaan koreksi kontinuitas

Yates dengan alasan bahwa penggunaan koreksi cenderung menyebabkan uji

bersifat ‘over-konservatif’ (tingkat signifikansi aktual jauh lebih kecil

daripada tingkat signifikansi yang dinyatakan). Kecuali dalam lampiran ini,

pada seluruh pembahasan mengenai uji khi-kuadrat dalam buku teks Metode

Statistika II ini digunakan statistika penguji tanpa koreksi kontinuitas.

267

LATIHAN 8

Bagian Pertama

Pilihlah satu jawaban yang paling benar!

1. Uji eksak Fisher digunakan untuk:

A. Tabel 2x2 C. Tabel r x 2; 2r >

B. Tabel 2 x ; 2c c > D. Semuanya benar

2. Perhitungan probabilitas pada uji eksak Fisher didasarkan atas:

A. Distribusi normal C. Distribusi Poisson

B. Distribusi hipergeometrik D. Semuanya salah

3. Perhitungan nilai p pada uji eksak Fisher mencakup:

A. Probabilitas komposisi data yang sama dengan data sampel.

B. Probabilitas komposisi data yang lebih ekstrim daripada data

sampel.

C. Keduanya benar.

D. Keduanya salah.

Untuk soal No. 4 s.d. 8:

Dimiliki struktur tabel berikut:

B1 B2

A1 a b 1n

A2 c d 2n

1m

2m n

4. Probabilitas untuk mendapatkan struktur tabel tersebut adalah:

A. ( )( ) ( ) ( )

1 2 2 2

a b c d

n n m m n C.

1 2 2 2

! ! ! !

! ! ! ! !

a b c d

n n m m n

B. ( ) ( )( )( ) ( )

1 2 2 2n n m m

a b c d n D. 1 2 2 2

! ! ! !

! ! ! ! !

n n m m

a b c d n

268

5. Jika diketahui untuk tabel di atas: n = 30; 1n = 15;

1m = 10; dan c =

3; maka probabilitas untuk mendapatkan komposisi data tersebut

adalah:

A. 0.0001 C. 0.0225

B. 0.0025 D. 0.0975

6. Untuk data pada soal No. 5, nilai ( )1P c = adalah:

A. 0.0001 C. 0.0225

B. 0.0025 D. 0.0975

7. Pada uji eksak Fisher 1-sisi untuk data soal No. 5, nilai p adalah:

A. 0.0001 C. 0.0251

B. 0.0026 D. 0.1225

8. Kesimpulan yang diperoleh untuk uji 0

:H variabel baris dan

variabel kolom independen terhadap data soal No. 5 adalah:

A.

0H tidak ditolak pada tingkat signifikansi 0.05α =

B.

0H ditolak pada tingkat signifikansi 0.10α =

C. A) dan B) benar.

D. A) dan B) salah.

Bagian Kedua

Pilihlah satu jawaban yang paling benar!

Dimiliki data penghasilan bulanan 160 keluarga di sebuah desa

(dalam ribuan rupiah):

Penghasilan bulanan Banyak keluarga

129.5-139.5 9

139.5-149.5 18

149.5-159.5 23

159.5-169.5 23

169.5-179.5 26

179.5-189.5 22

189.5-199.5 18

199.5-205.5 15

209.5-219.5 6

269

1. Rerata dan standar deviasi sampel di atas adalah:

A. 165.75 dan 18.260 C. 175.000 dan 22.740

B. 172.50 dan 21.568 D. 183.50 dan 24.680

2. Seandainya sampel di atas benar berasal dari populasi normal, luas

area kelas interval ketiga ( )149.5 159.5X< < adalah:

A. 6.30% C. 13.20%

B. 7.93% D. 17.00%

3. Frekuensi harapan kelas interval keenam ( )179.5 189.5X< < adalah:

A. 10.08 C. 17.47

B. 12.69 D. 25.55

4. Dengan 5%,α = daerah kritis untuk uji kebaikan-suai (goodness-of-

fit) distribusi normal terhadap sampel di atas adalah:

A. 7.815W > C. 14.449W >

B. 12.592W > D. 16.919W >

5. Deviasi frekuensi observasi pada kelas interval kelima terhadap nilai

harapannya ( )5 5O E− adalah:

A. −2.99 C. 1.90

B. −1.08 D. 4.94

6. Nilai ( )8 8 8

2/O E E− adalah:

A. 0.171 C. 2.222

B. 0.308 D. 2.426

7. Nilai statistik penguji pada uji kebaikan-suai distribusi normal untuk

sampel di atas adalah:

A. 3.9815 C. 6.3969

B. 4.1706 D. 6.4978

8. Dengan 5%,α = kesimpulan uji kebaikan-suai distribusi normal

terhadap sampel di atas yaitu:

A. Sampel dapat dianggap berasal dari populasi normal.

B. Sampel tidak berasal dari populasi normal.

C. Belum dapat dibuat kesimpulan.

D. Semuanya salah.

270

Bagian Ketiga

Pilihlah satu jawaban yang paling benar!

Misalkan dua orang psikiater secara terpisah memeriksa 85 orang

pengunjung yang sama disebuah rumah sakit jiwa dengan hasil penelitian

sebagai berikut:

Psikiater A Psikiater B

Jumlah Psikosis Neurosis

Psikosis 4 5 9

Neurosis 1 75 76

Jumlah 5 80 85

1. Uji statistik yang relevan untuk mengkaji ada tidaknya perbedaan

yang bermakna diantara kedua psikiater dalam mendiagnosis

pasiennya adalah:

A. Uji khi-kuadrat Pearson C. Uji McNemar

B. Uji eksak fisher D. Semuanya salah

2. Jika 1

P menyatakan proporsi penderita psikosis di antara pengunjung

rumah sakit menurut psikiater A, dan 2

P menyatakan proporsi serupa

menurut psikiater B, maka estimasi 1

P dan 2

P berdasarkan data

sampel masing-masing adalah:

A.

1 2ˆ ˆ4 9; 1 76P P= = C.

1 2ˆ ˆ4 9; 4 5P P= =

B.

. 1 2ˆ ˆ4 5; 5 80P P= = D.

1 2ˆ ˆ9 85; 5 85P P= =

3. Jika paparan data berpasangan tersebut disajikan seperti pada tabel

2×2 di bawah ini, hipotesis nol-nya adalah:

Y = 0 Y = 1

X = 1 a b

X = 0 c d

A. ( ) ( )P a P b= C. ( ) ( )P a P d=

B. ( ) ( )P c P d= D. ( ) ( )P b P c=

271

4. Dengan uji statistik yang relevan menurut jawaban soal No. 1, nilai

statistik penguji-nya adalah:

A. 0.32 C. 2.67

B. 0.67 D. 27.04

5. Dengan tingkat signifikansi 10%, daerah kritis untuk uji statistik

tersebut adalah:

A. 2.71W > C. 5.02W >

B. 3.84W > D. 7.81W >

6. Kesimpulan yang diperoleh dari uji statistik tersebut adalah:

A. Tidak ditemukan perbedaan yang bermakna secara statistik antara

hasil penilaian psikiater A dengn psikiater B pada tingkat

signifikansi 10%

B. Ditemukan perbedaan yang bermakna secara statistik antara hasil

penilaian psikiater A dengan psikiater B pada tingkat signifikansi

5%

C. Ditemukan perbedaan yang bermakna secara statistik antara hasil

penilaian psikiater A dengan psikiater B pada tingkat signifikansi

1%

D. Semuanya salah

272

BAB 9

STATISTIKA NON-PARAMETRIK I

9.1. PENGERTIAN STATISTIKA NON-PARAMETRIK

� Definisi dan Penggunaan

Prosedur non-parametrik adalah ‘prosedur statistika . . . yang berlaku

berdasarkan atas sejumlah asumsi yang relatif sederhana mengenai populasi

sumber data’ (Hollander & Wolfe, 1973).

Hipotesis pada Statistika Non-Parametrik tidak memuat parameter

untuk distribusi tertentu, sehingga ada yang menyatakan bahwa Statistika

Non-Parametrik lebih tepat dinamakan Statistika Bebas-Distribusi

(distribution-free statistics).

Metode statistika non-parametrik digunakan untuk:

a. Data numerik (berskala rasio dan interval; lihat matriks 9.1).

b. Data kategorik (berskala ordinal dan nominal).

Matriks 9.1. Penggunaan metode statistika parametrik dan non-

parametrik untuk data numerik

Untuk data numerik dengan populasi sebarang dan sampel kecil,

hanya dapat digunakan metode non-parametrik. Dalam keadaan lainnya pada

matriks 9.1 dapat digunakan baik metode parametrik maupun non-

parametrik, tetapi uji non-parametrik akan menghasilkan kekuatan uji yang

lebih lemah dan kurang efisien dibandingkan dengan uji parametrik.

Ukuran sampel Distribusi populasi

Normal Sebarang

Besar Parametrik Parametrik

Kecil Parametrik Non-Parametrik

273

� Keunggulan Metode Statistika Non-Parametrik

Keunggulan Metode Statistika Non-Parametrik antara lain yaitu:

1) Dapat digunakan tanpa tergantung pada bentuk distribusi populasi

sumber data (distribution-free statistics) / memerlukan lebih sedikit

asumsi mengenai populasi sumber data.

2) Dapat digunakan pada sampel ukuran kecil ataupun untuk data yang

berskala lebih rendah daripada interval / dapat diaplikasikan dalam

situasi yang tidak memungkinkan penggunaan prosedur teori normal.

3) Umumnya mudah untuk dipahami.

4) Hanya sedikit kurang efisien dibandingkan metode statistika parametrik

jika populasinya normal, namun dapat lebih efisien daripada metode

statistika parametrik jika populasinya tidak normal.

� Kelemahan Metode Statistika Non-Parametrik

Kelemahan Metode Statistika Non-Parametrik yaitu:

1) Tidak semua uji parametrik memiliki counterpart-nya dalam statistika

non-parametrik.

2) Uji hipotesis non-parametrik memberikan hasil yang lebih lemah

dibandingkan dengan uji hipotesis parametrik.

3) Estimasi interval non-parametrik memiliki presisi lebih rendah

dibandingkan dengan estimasi interval parametrik.

Beberapa uji non-parametrik sebagai counter-part uji statistik

parametrik yang telah dipelajari sebelumnya diperlihatkan pada matriks 9.2.

274

Matriks 9.2. Beberapa uji parametrik dan counter-part non-parametrik-

nya

Metode

parametrik Metode non-parametrik

Dua sampel

independen Uji t

Uji jumlah rank Wilcoxon

(uji Mann-Whitney)

Dua sampel

berpasangan Uji t berpasangan

- Uji tanda

- Uji rank bertanda Wilcoxon

Tiga / lebih sampel

independen

ANOVA satu-

arah Uji Kruskal-Wallis

Tiga / lebih sampel

berpasangan

ANOVA dua-

arah

(rancangan blok)

Uji Friedman

Koefisien korelasi Koefisien

korelasi Pearson

Koefisien korelasi

Spearman

� Estimasi interval non-parametrik

Metode Statistika Non-Parametrik umumnya lebih banyak mencakup

prosedur uji hipotesis, sedangkan pengestimasian interval relatif agak jarang

dikerjakan. Beberapa prosedur pengestimasian interval yang tercakup dalam

metode statistika non-parametrik antara lain:

- Estimasi berdasarkan teorema Chebyshev (lihat lampiran 2C)

- Metode bootstrapping (lihat lampiran 9A)

275

9.2. UJI TANDA (SIGN TEST)

Uji tanda merupakan counterpart non-parametrik bagi uji t

berpasangan, namun selain untuk pasangan data kontinu atau numerik seperti

pada uji t berpasangan, uji tanda juga dapat digunakan untuk himpunan

pasangan data ordinal.

Persyaratan:

� Data berpasangan ( 1X ; 1Y ), ( 2X ;

2Y ), . . . , ( nX ; nY ); iX dan

iY tidak

independen.

� Skala pengukuran sekurang-kurangnya ordinal dalam tiap pasangan,

sehingga tiap pasangan dapat digolongkan sebagaim ‘plus’, ‘minus’,

atau ‘nol’:

- Plus jika : iX > iY atau iX −

iY > 0 (9.1.a)

- Minus jika : iX < iY atau iX −

iY < 0 (9.1.b)

- Nol jika : iX = iY (tie; tidak digunakan dalam analisis)

� Uji tanda digunakan untuk sampel berukuran kecil (penentuan daerah

kritis dilakukan dengan menggunakan tabel binomial kumulatif yang

umumnya hanya memuat nilai n sampai dengan 20, 25, atau 30). Untuk

sampel berukuran lebih besar digunakan uji McNemar.

Langkah-langkah uji hipotesis:

1. Jenis uji statistik: Uji tanda.

2. Hipotesis:

a. 0H : P (+) = P (−) vs 1H : P (+) ≠ P (−) ) (9.2.a)

b. 0H : P (+) < P (−) vs 1H : P (+) > P (−) ) (9.2.b)

c. 0H : P (+) > P (−) vs 1H : P (+) < P (−) ) (9.2.c)

dengan: P (+) = P ( iX > iY ) ) (9.3.a)

dan: P (−) = P ( iX < iY ) ) (9.3.b)

3. Tingkat signifikansi: α = 0.01, 0,05, atau 0.10.

276

4. Daerah kritis untuk n < 20:

(n = banyaknya ‘+’ dan ‘−‘ dalam sampel = n’ − banyaknya ‘nol’)

a. 1H : P (+) ≠ P (−)

Cari t, yaitu nilai y yang sesuai dengan 1α ≈ α/2 pada tabel

probabilitas binomial kumulatif (dengan n yang sesuai dan p =

0.50; buku Metode Statistika I, Addendum B2). Daerah kritis

adalah:

T < t atau T > n – t (9.4.a)

b. 1H : P (+) > P (−)

Cari t, yaitu nilai y yang sesuai dengan 1α ≈ α pada tabel

binomial kumulatif (dengan n yang sesuai dan p = ½). Daerah

kritis:

T > n’ − t (9.4.b)

c. 1H : P (+) < P (−)

Cari t, yaitu nilai y yang sesuai dengan 1α ≈ α pada tabel

binomial kumulatif (dengan n yang sesuai dan p = ½). Daerah

kritis:

T < t (9.4.c)

5. Statistik penguji:

ujiT = banyaknya ‘+’ dalam sampel (9.5)

6. Kesimpulan: 0H ditolak jika statistik penguji terletak pada daerah

kritis dan 0H tidak ditolak jika statistik penguji tidak terletak pada

daerah kritis.

Contoh 9.1:

Misalkan hendak ditentukan daerah kritis untuk uji tanda jika jumlah

‘plus’ dan ‘minus’ dalam sampel adalah 17, dan akan dilakukan uji hipotesis

2-sisi dengan tingkat signifikansi α = 0.005.

n = 17 α / 2 = 0.025

Pada tabel probabilitas binomial kumulatif (buku teks metode

Statistika I, Addendum B2) untuk n = 17 dan p = 0.05, tampak bahwa nilai

1α yang paling mendekati α/2 = 0.025 adalah 1α = 0.0245. Nilai t = x yang

277

bersesuaian dengan 1α = 0.0245 adalah t = x = 4, sehingga area penolakan

pada sisi kiri adalah T < t, yaitu:

T < 4,

sedangkan area penolakan pada sisi kanan adalah T > n – t, yaitu:

T > 13

(lihat diagram 9.1)

Diagram 9.1. Daerah kritis pada uji tanda dua-sisi dengan n = 17 dan α

= 0.05

Contoh 9.2:

Sebuah pabrik sabun hendak membuat kemasan baru yang

diharapkan lebih menarik daripada kemasan lama. Untuk itu dilakukan

survei terhadap sampel acak konsumen, yang dimimta memilih kemasan

baru (B) atau lama (A). Jika seseorang memilih B diberi tanda ‘+’, jika yang

dipilih A diberi tanda ‘−‘. Dari 16 orang konsumen, 10 orang lebih suka B.

Uji hipotesis:

1. Jenis uji statistik: Uji tanda

2. Hipotesis: 0H : P (+) < P (−)

1H : P (+) > P (−)

3. Tingkat signifikansi: α = 0.05.

4. Daerah kritis (n = 16):

Pada tabel binomial kumulatif dengan n = 16 dan p = ½ diperoleh t = y

= 4 untuk 1α = 0.038 (paling dekat dengan α = 0.05).

278

Daerah kritis adalah T > n – t atau T > 12.

5. Statistik penguji:

ujiT = 10

6. Kesimpulan: Statistik penguji ujiT tidak terletak pada daerah kritis,

sehingga 0H tidak ditolak dan disimpulkan pada tingkat signifikansi α

= 0.05, tidak terdapat perbedaan preferensi yang bermakna antara

kemasan sabun baru dengan kemasan lama.

279

9.3. UJI RANK BERTANDA WILCOXON (WILCOXON

SIGNED RANK TEST)

Uji rank bertanda Wilcoxon (Wilcoxon signed rank test) juga

merupakan counter-part non-parametrik bagi uji t berpasangan seperti uji

tanda, tetapi berbeda dengan uji tanda, uji rank bertanda Wilcoxon hanya

dapat digunakan untuk pasangan data kontinu atau numerik (tidak dapat

untuk pasangan data ordinal).

Persyaratan:

� Data berpasangan ( 1X ; 1Y ), ( 2X ;

2Y ), . . . , ( nX ; nY ); iX dan

iY tidak

independen.

� Skala pengukuran sekurang-kurangnya interval dalam tiap pasangan,

sehingga untuk tiap pasangan dapat dihitung:

iD = iY − iX (9.6)

dan ditentukan nilai iR , yaitu:

iR = rank iD jika iD > 0 ) (9.7.a)

iR = −rank iD jika iD < 0 ) (9.7.b)

� Dua atau lebih iD yang sama disebut ties, dan diberikan peringkat

rata-ratanya.

Contoh 9.3:

Misalkan dimiliki 10 pasangan nilai data berikut (tabel 9.1).

Perhatikan cara menentukan iR :

280

Tabel 9.1. Sepuluh pasangan nilai data dan penentuan iR −nya

No iX iY iD =

iY − iX iD Rank iD iR

1 5 7 2 2 2.5 2.5

2 4 4 0 0 − −

3 6 2 −4 4 5.5 −5.5

4 9 7 −2 2 2.5 −2.5

5 6 6 0 0 − −

6 3 8 5 5 7 7

7 5 6 1 1 1 1

8 7 3 −4 4 5.5 −5.5

9 2 9 7 7 8 8

10 4 7 3 3 4 4

Nilai-nilai iD sebelum diurutkan disajikan sendiri secara terpisah

pada tabel 9.2, dan setelah diurutkan menurut besarnya (di-ranking), hasilnya

diperlihatkan pada tabel 9.3 beserta nilai-nilai iR −nya.

Tabel 9.2. Nilai-nilai iD untuk kesepuluh pasangan nilai data

No 1 2 3 4 5 6 7 8 9 10

iD 2 0 4 2 0 5 1 4 7 3

Tanda iD + − − + + − + +

Tabel 9.3. Hasil pengurutan nilai-nilai iD beserta nilai-nilai iR untuk

kesepuluh pasangan nilai data

iD 1 2 2 3 4 4 5 7

Rank iD 1 2.5 2.5 4 5.5 5.5 7 8

Tanda iD + + − + − − + +

iR 1 2.5 −2.5 4 −5.5 −5.5 7 8

281

Langkah-langkah uji hipotesis:

Setelah nilai-nilai iR ditentukan, dapat dilakukan uji hipotesis

dengan langkah-langkah sebagai berikut:

1. Jenis uji statistik: Uji rank bertanda Wilcoxon.

2 Hipotesis:

a. 0H : E ( iD ) = 0 vs 1H : E ( iD ) ≠ 0 ) (9.8.a)

b. 0H : E ( iD ) < 0 vs 1H : E ( iD ) > 0 ) (9.8.b)

c. 0H : E ( iD ) > 0 vs 1H : E ( iD ) < 0 ) (9.8.c)

3. Tingkat signifikansi: α = 0.01, 0.05, atau 0.10.

4. Daerah kritis jika tidak ada ties dan n < 50:

a. 1H : E ( iD ) ≠ 0 T < 2

wα

atau T > 1 2

wα−

(9.9.a)

b. 1H : E ( iD ) > 0 T > 1w α−

(9.9.b)

c. 1H : E ( iD ) < 0 T <

wα (9.9.c)

α adalah tingkat signifikansi, sedangkan nilai

wα diperoleh dari tabel

kuantil statistik penguji rank bertanda Wilcoxon untuk α < 0.05 (Addendum E).

Jika α > 0.50,

wα diperoleh dengan rumus:

wα = ( )1

2

n n + 1w α−

(9.10)

n menyatakan jumlah pasangan tersisa setelah dikurangi jumlah

pasangan dengan iD = 0.

5. Statistik penguji:

ujiT = ( )1

jika positifn

i ii

R D=

∑ (9.11)

Jika terdapat banyak ties atau n > 50, digunakan pendekatan normal

dengan statistik penguji:

282

ujiZ = 1

2

1

n

ii

n

ii

R

=

∑

(9.12)

yang berdistribusi normal standar. Untuk rumus 9.12 dengan

pendekatan normal ini digunakan seluruh nilai iR , baik yang bertanda

positif maupun negatif.

6. Kesimpulan: 0H tidak ditolak jika statistik penguji tidak terletak pada

daerah kritis.

Contoh 9.4:

Misalkan hendak diteliti apakah anak yang lahir lebih dahulu pada

pasangan kembar memiliki skor agresivitas yang lebih tinggi dibandingkan

dengan adik kembarnya. Diperoleh hasil pengamatan sebagai berikut (tabel

9.4):

Tabel 9.4. Skor agresivitas 12 pasangan anak kembar

No 1 2 3 4 5 6 7 8 9 10 11 12

iX 86 71 77 68 91 72 77 91 70 71 88 87

iY 88 77 76 64 96 72 65 90 65 80 81 72

iX : Skor agresivitas anak lahir pertama

iY : Skor agresivitas anak lahir kedua

Pada pengolahan data diperoleh nilai-nilai iD , Rank iD , dan iR

seperti terlihat tabel 9.5 di bawah ini:

Tabel 9.5. Penentuan iR untuk skor agresivitas 12 pasangan anak

kembar

No 1 2 3 4 5 6 7 8 9 10 11 12

iD 2 6 −1 −4 5 0 −12 −1 −5 9 −7 −15

Rank

iD 3 7 1.5 4 5.5 − 10 1.5 5.5 9 8 11

iR 3 7 −1.5 −4 5.5 − −10 −1.5 −5.5 9 −8 −11

283

Uji hipotesis untuk data di atas yaitu:

1. Jenis uji statistik: Uji rank bertanda Wilcoxon.

2. Hipotesis: 0H : E ( iD ) > 0

1H : E ( iD ) < 0

3. Tingkat signifikansi: α = 0.05.

4. Daerah kritis:

Karena didapatkan beberapa ties, akan digunakan statistik penguji

dengan pendekatan normal dengan daerah kritis untuk 1H : E ( iD ) < 0

adalah:

Z < 0.05Z , yaitu Z < −1.64.

Jika digunakan rumus 9.11, maka daerah kritis adalah:

T < 0.05w atau T < 14.

5. Statistik penguji:

Statistik penguji dengan pendekatan normal adalah:

1

n

ii

R=

∑ = 3 + 7 + . . . – 11 = −17

2

1

n

ii

R=

∑ = 23 + 27 + . . . − ( )2

11 = 505

ujiZ = 1

2

1

n

ii

n

ii

R

=

∑

= 17

505

− = −0.76

Jika digunakan rumus 9.11, maka statistik penguji adalah:

ujiT = ( )1

jika positifn

i ii

R D=

∑ = 3 + 7 + 5.5 + 9 = 24.5

6. Kesimpulan: Statistik penguji ujiZ = −0.76 tidak terletak pada daerah

kritis, sehingga 0H tidak ditolak dan disimpulkan pada tingkat

signifikansi α 0.05 tidak terdapat perbedaan skor agresivitas yang

bermakna antara anak lahir pertama dan anak lahir kedua pada

pasangan kembar. Statistik penguji ujiT = 24.5 juga tidak terletak pada

daerah kritis, sehingga memberikan hasil yang sama dengan

pendekatan normal.

284

LAMPIRAN 9A: INTERVAL KONFIDIENSI

BOOTSTRAP

Bootstrapping tergolong dalam salah satu metode non-parametrik

untuk memperoleh inferensi statistik, yang sebagaimana metode non-

parametrik lainnya, menunjukkan manfaat terbesar apabila distribusi

sampling tidak diketahui.

Dasar metode bootstrapping ialah dengan menganggap sampel

sebagai suatu populasi, dan menerapkan proses ‘resampling’ (sampling

dengan pengembalian) untuk menghasilkan estimasi distribusi sampling

statistik secara empiris.

Misalkan dimiliki sampel awal berukuran n yang dalam metode

bootstrapping dianggap sebagai populasi dan hendak dilakukan estimasi

interval terhadap rerata populasi sesungguhnya µ. Terhadap sampel awal ini

diterapkan proses resampling, yaitu pengambilan subsampel berukuran n

dengan pengembalian. Dari sampel awal berukuran n dapat diperoleh

sebanyak nn subsampel, namun yang dianjurkan ialah mengambil sekurang-

kurangnya 1,000 subsampel untuk melakukan pengestimasian interval

terhadap rerata populasi µ.

Contoh IX.1:

Misalkan dimiliki data sampel dengan n = 4:

1X = 3 2X = 7 3X = 5 4X = 8

Dari sampel berukuran n = 4 ini, dilakukan proses resampling dengan ukuran

subsampel n = 4 untuk menghitung interval konfidensi bootstrap 95% bagi

rerata populasi µ (dari sampel berukuran 4 dengan proses resampling

berukuran 4 hanya akan diperoleh 44 = 256 subsampel, tetapi tujuannya di

sini adalah untuk menjelaskan prosedur perhitungan interval konfidensi

bootstrap).

Diperoleh 256 subsampel dengan rerata masing-masing seperti

terlihat pada tabel IX.1.

285

Tabel IX.1. Contoh daftar hasil proses resampling untuk metode

bootstrapping

No Anggota resample Rerata

subsampel 1 2 3 4

1 3 3 3 3 3.00

2 3 3 3 7 4.00

3 3 3 3 5 3.50

4 3 3 3 8 4.25

5 3 3 7 3 4.00

6 3 3 7 7 5.00

7 3 3 7 5 4.50

8 3 3 7 8 5.25

9 3 3 5 3 3.50

. . . . . . . . . . . . . . . . . .

253 8 8 8 3 6.75

254 8 8 8 7 7.75

255 8 8 8 5 7.25

256 8 8 8 8 8.00

Proses resampling menghasilkan distribusi sampling nilai rerata

subsampel, yang diperlihatkan pada diagram IX.1.

286

Diagram IX.1. Contoh distribusi sampling nilai rerata subsampel

Dari distribusi sampling ini, interval konfidensi bootstrap dapat

ditentukan secara empiris, yaitu setelah nilai-nilainya diurutkan menurut

besarnya (di-ranking):

( )1

X , ( )2

X , . . . , ( )256

X

(lihat tabel IX.2.)

287

Tabel IX.2. Nilai-nilai rerata subsampel yang telah diurutkan menurut

besarnya

( )1X 3.00 . . . . . .

( )2X 3.50 ( )250

X 7.50

( )3X 3.50 ( )251

X 7.50

( )4X 3.50 ( )252

X 7.75

( )5X 3.50 ( )253

X 7.75

( )6X 4.00 ( )254

X 7.75

( )7X 4.00 ( )255

X 7.75

. . . . . . ( )256X 8.00

Maka interval konfidensi bootstrap 95% untuk rerata populasi µ

mencakup 95% × 256 = 243.2 nilai-nilai rerata subsampel 2.5% ekornya (kiri

dan kanan) masing-masing mencakup (256 – 243.2)/2 = 6.4 ≈ 6 nilai rerata

subsampel, sehingga interval konfidensi bootstrap 95% adalah:

[( )7

X ; ( )250

X ]

yaitu: [4.00 ; 7.50]

288

LATIHAN 9

Bagian Pertama

Pilihlah satu jawaban yang paling benar!

1. Syarat penggunaan metode Statistika Non-Parametrik yaitu:

A. Distribusi populasi tidak diketahui.

B. Ukuran sampel kecil.

C. A) dan B) benar.

D. A) dan B) salah.

2. Inferensi statistik hanya mungkin dilakukan dengan Metode Statistika

Non-Parametrik jika:

A. Ukuran sampel kecil dan distribusi populasi normal.

B. Ukuran sampel kecil dan distribusi populasi sebarang.

C. Ukuran sampel besar dan distribusi populasi normal.

D. Ukuran sampel besar dan distribusi populasi sebarang.

3. Yang merupakan padanan yang sesuai bagi uji parametrik dan uji

non-parametrik di antara pasangan berikut yaitu:

A. Uji t independen dan uji jumlah rank (rank sum) Wilcoxon.

B. Uji t berpasangan dan uji rank bertanda (sign rank) Wilcoxon,

C. ANOVA 1-arah dan uji Kruskal Wallis.

D. Semuanya benar.

Untuk soal No. 4 s.d. 11:

Tujuh orang mahasiswa mencoba sebuah diet untuk menurunkan

berat badan, dengan hasil sebagai berikut:

Mahasiswa 1 2 3 4 5 6 7

BB pra-diet 87 95 94 91 100 92 94

BB pasca-diet 82 93 91 89 101 94 90

BB: Berat badan

Hendak diuji apakah diet tersebut efektif untuk menurunkan berat badan.

4. Uji yang relevan untuk menilai efektivitas diet tersebut ialah:

A. Uji tanda C. A) dan B) benar

B. Uni rank bertanda Wilcoxon D. A) dan B) salah

289

5. Seandainya diketahui data di atas berasal dari populasi normal, maka

uji parametrik yang relevan menilai efektivitas diet adalah:

A. Uji t C. Uji t berpasangan

B. Uji Z D. Uji khi-kuadrat

6. Jika P (+) = P (BB pra-diet > BB pasca-diet), maka 0H yang sesuai

bagi uji tanda ialah:

A.

( ) ( )0 :H P P+ = −

C. ( ) ( )0 :H P P+ ≥ −

B.

( ) ( )0 :H P P+ ≤ − D. Semua salah

7. Nilai kritis untuk uji tanda diperoleh ialah:

A. Tabel Z C. Tabel khi-kuadrat

B. Tabel t D. tabel binomial

8. Pada uji tanda, dengan tingkat signifikansi 5%, nilai t yang sesuai

adalah:

A. 0 C. 2

B. 1 D. 3

9. Nilai t di atas diperoleh untuk 1α =

A. 0.0078 C. 0.0625

B. 0.0357 D. 0.1094

10. Statistik penguji untuk uji tanda adalah:

A. 1 C. 5

B. 3 D. 7

11. Daerah kritis untuk uji tanda ialah:

A. T < 1 C. T > 6

B. T < 1 D. T < 6

290

Bagian Kedua

Pilihlah satu jawaban yang paling benar!

1. Jika 1D = BB pasca-diet – BB pra-diet, maka 0H yang sesuai bagi

uji rank bertanda Wilcoxon adalah:

A.

( )0 : 0iH E D ≤

C. ( )0 : 0iH E D =

B.

( )0 : 0iH E D ≥

D. Semuanya salah

2. Dengan uji rank bertanda Wilcoxon, jumlah ties(s) adalah:

A. 0 C. 2

B. 1 D. 3

3. Nilai iR∑ dan

2

iR∑ adalah:

A. 4 dan 10 C. 20 dan 138

B. −4 dan 10 D. −20 dan 138

4. Dengan pendekatan normal, nilai statistik penguji untuk uji rank

bertanda Wilcoxon adalah:

A. 1.70ujiZ = C. 4ujiT =

B. 1.70ujiZ = − D. 20ujiT = −

5. Tanpa menggunakan pendekatan normal, nilai statistik penguji uji

rank bertanda Wilcoxon adalah:

A. 1.70ujiZ = C. 4ujiT =

B. 1.70ujiZ = − D. 20ujiT = −

6. Tanda menggunakan pendekatan normal, pada tingkat signifikansi

5% daerah kritis untuk uji rank bertanda Wilcoxon adalah:

A. T < 4 C. T > 24

B. T < 4 D. T > 24

291

7. Kesimpulan yang diperoleh pada uji hipotesis ialah:

A. Dengan uji tanda, 0H ditolak.

B. Dengan uji rank bertanda Wilcoxon (pendekatan normal), 0H

ditolak..

C. Dengan uji rank bertanda Wilcoxon (tanpa pendekatan normal),

0H ditolak.

D. Semuanya salah.

292

BAB 10

STATISTIKA NON-PARAMETRIK II

10.1. UJI JUMLAH RANK WILCOXON (WILCOXON

RANK SUM TEST; UJI MANN-WHITNEY)

Uji jumlah rank Wilcoxon (Wilcoxon rank sum test; uji Mann-

Whitney) merupakan counter part non-parametrik bagi uji t independen,

yaitu uji bagi ukuran tengah 2 populasi data independen yang berskala

kontinu atau numerik.

Uji ini dikembangkan secara terpisah oleh Wilcoxon pada tahun 1945

serta Mann dan Whitney pada tahun 1947. Perbedaan uji jumlah rank

Wilcoxon dengan uji Mann-Whitney terletak pada rumus statistik penguji

yang tampaknya berbeda, namun sebenarnya memiliki dasar pemahaman

yang sama.

Persyaratan:

� Data dua kelompok 1X , 2X , . . . , nX ; dan 1Y ,

2Y , . . . , nY ; yang

saling independen.

� Skala pengukuran sekurang-kurangnya ordinal, sehingga dapat

ditentukan nilai R ( iX ) dan R ( iY ) (ranking) untuk tiap nilai data iX

dan iY pada kelompok gabungan yang telah diurutkan.

� Dua atau lebih data yang sama disebut ties, dan diberikan peringkat

rata-ratanya.

Contoh 10.1:

Misalkan dimiliki data berikut yang hendak ditentukan rank-nya (tabel

10.1):

293

Tabel 10.1. Contoh data untuk penentuan i

R pada uji jumlah rank

Wilcoxon

X Y

7.3 6.3 4.2 12.6 11.8 16.0

12.5 11.4 2.7 5.6 8.3 1.0

9.1 3.2 15.3 5.9 14.8 4.0

Penentuan rank dilakukan sebagai berikut (tabel 10.2):

Tabel 10.2. Penentuan rank pada uji jumlah rank Wilcoxon untuk data

pada tabel 10.1

X Y Rank X Y Rank

1.0 1 8.3 10

2.7 2 9.1 11

3.2 3 11.4 12

4.0 4 11.8 13

4.2 5 12.5 14

5.6 6 12.6 15

6.3 7.5 14.8 16

6.3 7.5 15.3 17

7.3 9 16.0 18

Langkah-langkah uji hipotesis:

1. Jenis uji statistik: Uji jumlah rank Wilcoxon (uji Mann-Whitney).

2. Hipotesis:

a. 0H : E (X) = E (Y) vs 1H : E (X) ≠ E (Y) ) (10.1.a)

b. 0H : E (X) < E (Y) vs 1H : E (X) > E (Y) ) (10.1.b)

c. 0H : E (X) > E (Y) vs 1H : E (X) < E (Y) ) (10.1.c)

3. Tingkat signifikansi: α = 0.01, 0.05, atau 0.10.

4. Daerah kritis (untuk n < 20 dan m < 20):

a. 1H : E (X) ≠ E (Y) T < 2

wα

atau T > 1 2

wα−

) (10.2.a)

b. 1H : E (X) > E (Y) T > 1w α− ) (10.2.b)

c. 1H : E (X) < E (Y) T <

wα ) (10.2.c)

294

α adalah tingkat signifikansi, sedangkan nilai

wα diperoleh dari tabel

statistik uji Wilcoxon (lihat Addendum F). Nilai 1w α− diperoleh

dengan rumus:

1w α− = n (N + 1) −

wα (10.3)

Jika banyak ties, dan akan digunakan statistik penguji ujiT yang

berdistribusi normal standar, daerah kritis untuk ketiga hipotesis di atas

masing-masing adalah:

a. T ′ < −2

Zα

atau T ′ > 2

Zα

b. T ′ > Zα

c. T ′ < − Zα

5. Statistik penguji:

ujiT = 1

n

ii

R=∑ (10.4)

Jika banyak ties, ujiT dikurangi dengan reratanya dan dibagi dengan

standar deviasinya:

'

ujiT =

( )( )( )

2

1

2

1

1 4 1

uji

N

ii

NT n

nm NnmR

N N N=

+−

− −∑

(10.5.a)

yang berdistribusi normal standar dengan N menyatakan ukuran sampel

seluruhnya dan 2

1

N

ii

R=∑ menyatakan penjumlahan seluruh kuadrat nilai-

nilai rank:

N = n + m (10.5.b)

dan: 2

1

N

ii

R=∑ = ( ){ } ( ){ }

22

1 1

n m

i ji j

R X R Y= =

+

∑∑

2

1

N

ii

R=∑ = ( )

2

1

n

ii

R X=

∑ + ( )2

1

m

jj

R Y=

∑ (10.5.c)

295

6. Kesimpulan: 0H ditolak jika statistik penguji terletak pada daerah

kritis dan 0H tidak ditolak jika statistik penguji tidak terletak pada

daerah kritis.

Contoh 10.2:

Lihat kembali data pada contoh 10.1. Misalkan X menyatakan nilai tes

kebugaran fisik anak desa dan Y adalah nilai tes kebugaran fisik anak kota.

Hendak diuji kebenaran dugaan bahwa kebugaran fisik anak desa lebih baik

daripada kebugaran fisik anak kota.

Uji hipotesis:

1. Jenis uji statistik: Uji jumlah rank Wilcoxon (uji Mann-Whitney).

2. Hipotesis: 0H : E (X) < E (Y)

1H : E (X) > E (Y)

3. Tingkat signifikansi: α = 0.05.

4. Daerah kritis:

Pada tabel statistik uji jumlah rank Wilcoxon untuk n = 6 dan m = 12

diperoleh 0.05w = 39. Dengan rumus

1w α− = n (N + 1) −

wα ,

diperoleh:

0.95w = n (N + 1) −

0.05w

= (6)(18 + 1) – 39 = 75

Daerah kritis adalah T > 0.95w atau T > 75.

5. Statistik penguji:

ujiT = 1

n

ii

R=∑

= 2 + 5 + 7.5 + 9 + 12 + 14 = 49.5

6. Kesimpulan: statistik penguji T = 49.5 tidak terletak pada daerah kritis,

sehingga 0H tidak ditolak dan disimpulkan pada tingkat signifikansi α

= 0.05, tidak terdapat perbedaan yang bermakna antara kebugaran fisik

anak desa dengan anak kota.

296

10.2 KOEFISIEN KORELASI SPEARMAN

Misalkan dimiliki data bivariat ( 1X ; 1Y ), ( 2X ;

2Y ), . . . , ( nX ; nY ),

maka koefisien korelasi Pearson (koefisien korelasi produk momen) antara

variabel X dan Y adalah:

Pr = xy

xx yy

S

S S

=

( )( )

( ) ( )

1

2 2

1 1

n

i ii

n n

i ii i

X X Y Y

=

= =

− −

∑

∑ ∑

dengan syarat iX dan iY sekurang-kurangnya berskala interval.

Pada Statistika Non-Parametrik, untuk data skala ordinal diperlukan

ukuran korelasi lain, namun dengan persyaratan umum yang serupa seperti

pada koefisien korelasi Pearson:

1. Nilai ukuran berkisar antara −1 dan +1.

2. Jika nilai-nilai X yang lebih besar cenderung berpasangan dengan nilai-

nilai Y yang lebih besar, ukuran korelasi haruslah positif, dan jika

kecenderungannya kuat maka nilai ukuran korelasi mendekati +1.

3. Jika nilai-nilai X yang lebih besar cenderung berpasangan dengan nilai-

nilai Y yang lebih kecil, ukuran korelasi haruslah negatif, dan jika

kecenderungannya kuat maka nilai ukuran korelasi mendekati −1.

4. Jika nilai-nilai X berpasangan secara acak dengan nilai-nilai Y, maka

nilai ukuran korelasi mendekati nol.

Jika nilai-nilai iX dan iY pada rumus koefisien korelasi Pearson

diganti dengan nilai-nilai rank-nya [R ( iX ) dan R ( iY )], diperoleh ukuran

koefisien korelasi rank Spearman yang dapat digunakan untuk data berskala

ordinal:

Sr =

( ) ( )

2

1

2 2

1 1

1

2

1 1

2 2

n

i ii

n n

i ii i

nR X R Y n

n nR X n R Y n

=

= =

+ −

+ + − −

∑

∑ ∑

(10.6)

Jika tidak ada tie, dapat digunakan rumus yang lebih sederhana:

297

Sr = 1 −

( ) ( )

( )

2

1

2

6

1

n

i ii

R X R Y

n n

=

−

∑ (10.7)

atau: Sr = 1 −

( )2

6

1

T

n n − (10.7.a)

dengan: T = ( ) ( )2

1

n

i ii

R X R Y=

− ∑ (10.7.b)

Contoh 10.3:

Misalkan hendak dinilai kebenaran dugaan adanya korelasi

agresivitas antar anggota pasangan kembar ganda. Untuk itu dilakukan tes

psikologi pada 12 pasangan kembar dengan hasil skala agresivitas sebagai

berikut:

Tabel 10.3. Skor agresivitas anak lahir pertama dan anak lahir kedua

pada 12 pasangan anak kembar

i 1 2 3 4 5 6 7 8 9 10 11 12

iX 86 71 77 68 91 72 77 91 70 71 88 87

iY 88 77 76 64 96 72 65 90 65 80 81 72

iX : Skor agresivitas anak lahir pertama

iY : Skor agresivitas anak lahir kedua

Nilai-nilai R ( iX ) dan R ( iY ) adalah:

Tabel 10.4. Nilai-nilai R (i

X ) dan R ( i

Y ) untuk skor agresivitas 12

pasangan anak kembar

i 1 2 3 4 5 6 7 8 9 10 11 12

iX 8 3.5 6.5 1 11.5 5 6.5 11.5 2 3.5 10 9

iY 10 7 6 1 12 4.5 2.5 11 2.5 8 9 4.5

298

( )1

n

ii

R X=∑ = 8 ( )

2

1

n

ii

R X=∑ = 648.5

( )1

n

ii

R Y=∑ = 78 ( )

2

1

n

ii

R Y=∑ = 649

( ) ( )1

n

i ii

R X R Y=∑ = 611.25

21

2

nn

+

= 2

12 112

2

+

= 507

Koefisien korelasi Spearman adalah:

Sr =

( ) ( )

2

1

2 2

1 1

1

2

1 1

2 2

n

i ii

n n

i ii i

nR X R Y n

n nR X n R Y n

=

= =

+ −

+ + − −

∑

∑ ∑

= ( )( )

611.25 507

648.5 507 649 507

−

− − = 0.736

Jika hendak digunakan rumus 10.6, terlebih dahulu dihitung nilai

( ) ( )2

i iR X R Y −

Tabel 10.5 Perhitungan nilai ( ) ( )2

-i i

R X R Y untuk skor agresivitas

12 pasangan anak kembar

i R ( iX ) R ( iY ) ( ) ( )

2

i iR X R Y −

1 8 10 4

2 3.5 7 12.25

3 6.5 s 6 0.25

4 1 1 0

5 11.5 12 0.25

6 5 4.5 0.25

7 6.5 2.5 16

8 11.5 11 0.25

9 2 2.5 0.25

10 3.5 8 20.25

11 10 9 1

12 9 4.5 20.25

T = 75

299

Koefisien korelasi Spearman dengan rumus penyederhanaan adalah:

Sr = 1 −

( )2

6

1

T

n n −

= 1 − ( )( )

( )2

6 75

12 12 1− = 0.738

Diperoleh hasil yang praktis hampir sama dengan hasil terdahulu

(perbedaan disebabkan adanya satu tie).

Dengan menggunakan nilai-nilai sesungguhnya (bukan rank),

diperoleh nilai koefisien korelasi Pearson sebesar 0.735.

300

10.3. UJI KORELASI RANK SPEARMAN

Terhadap nilai koefisien korelasi Spearman yang diperoleh dapat pula

dilakukan uji hipotesis untuk menguji apakah korelasi yang ditemukan

memiliki kemaknaan statistik. Hipotesis yang diuji yaitu:

� Uji satu-sisi:

A. 0H : X dan Y independen

1H : Nilai-nilai X yang besar cenderung berpasangan dengan

nilai-nilai Y yang besar; atau:

0H : ρ = 0 vs 1H : ρ > 0 (10.8.a)

B. 0H : X dan Y independen

1H : Nilai-nilai X yang kecil cenderung berpasangan dengan

nilai-nilai Y yang besar; atau:

0H : ρ = 0 vs 1H : ρ < 0 (10.8.b)

� Uji dua-sisi:

0H : X dan Y independen

1H : Nilai-nilai X yang besar cenderung berpasangan dengan

nilai-nilai Y yang besar, atau nilai-nilai X yang kecil

cenderung berpasangan dengan nilai-nilai Y yang besar;

atau:

0H : ρ = 0 vs 1H : ρ ≠ 0 (10.8.c)

Nilai-nilai kritisnya untuk uji satu arah dan n < 30 dapat dilihat pada

tabel nilai kritis koefisien korelasi rank Spearman (Addendum G).

Contoh 10.4:

Lihat kembali data pada contoh 10.3. Hendak diuji, apakah terdapat

korelasi yang bermakna secara statistik antara skala agresivitas anak pertama

dengan anak kedua pada pasangan kembar ganda.

301

Uji hipotesis:

1. Jenis uji statistik: Uji korelasi rank Spearman.

2. Hipotesis:

0H : X dan Y independen

1H : Nilai-nilai X yang besar cenderung berpasangan dengan nilai-

nilai Y yang besar.

3. Tingkat signifikansi: α = 0.05.

4. Daerah kritis:

Pada tabel nilai kritis koefisien korelasi rank Spearman, daerah kritis

untuk n = 12 dan tingkat signifikansi α = 0.05 adalah r > 0.4965.

5. Statistik penguji:

Statistik penguji adalah nilai koefisien korelasi itu sendiri (rumus 10.6),

yaitu:

Sr = 0.736

6. Kesimpulan: Koefisien korelasi Sr = 0.736 lebih besar daripada nilai

kritis 0.4965, sehingga 0H ditolak dan disimpulkan bahwa tingkat

signifikansi α = 0.05 terdapat korelasi yang bermakna secara statistik

antara skala agresivitas anak pertama dan kedua pada pasangan kembar

ganda.

302

LAMPIRAN 10A: STATISTIK U MANN-

WHITNEY

Dalam subbab 10.1 telah disebutkan bahwa uji Mann-Whitney dan

uji jumlah rank Wilcoxon pada hakekatnya adalah sama, walaupun keduanya

memiliki rumus perhitungan statistik penguji yang berbeda. Statistik penguji

uji Mann-Whitney, yang dikenal juga sebagai stastistik U Mann-Whitney

adalah:

ujiU = ( )1 1

;n m

i ji j

X Yφ= =∑∑ (10.8)

dengan: ( );a bφ = 1 jika

0 untuk lainnya

b a<

Secara sederhana dapat dijelaskan bahwa ( )1

;m

i jj

X Yφ=∑ menyatakan

banyaknya nilai jY yang lebih kecil daripada suatu nilai iX tertentu. Telah

dinyatakan pula dalam pembahasan subbab 10.1 bahwa statistik penguji pada

uji Mann-Whitney dan uji jumlah rank Wilcoxon adalah sama secara

matematis, dan pada contoh berikut diperlihatkan bahwa besar keduanya

adalah sama.

Contoh X.1:

Lihat kembali contoh data nilai tes kebugaran fisik anak kota dan

anak desa pada contoh 10.1. Pada contoh 10.2 telah dihitung nilai statistik

penguji untuk uji jumlah rank Wilcoxon, yaitu ujiT = 49.5.

Hubungan antara ujiT untuk uji jumlah rank Wilcoxon dengan

statistik U Mann-Whitney dapat dinyatakan sebagai:

ujiT = U + ( )1

2

n n + (10.9)

Untuk menghitung statistik U Mann-Whitney, data tersebut disajikan

kembali pada tabel X.1 di bawah ini.

303

Tabel X.1. Contoh perhitungan statistik U Mann-Whitney

X Y ( )1

;m

i jj

X Yφ=∑

1.0

2.7 1

3.2

4.0

4.2 3

5.6

6.3

6.3 4.5

7.3 5

8.3

9.1

11.4 7

11.8

12.5 8

12.6

14.8

15.3

16.0

( )1 1

;n m

i ji j

X Yφ= =∑∑ 28.5

Perhatikan bahwa:

- Ada 1 nilai Y yang lebih kecil daripada 1X = 2.7, sehingga

( )1

;m

i jj

X Yφ=∑ = 1.

- Ada 3 nilai Y yang lebih kecil daripada 2X = 4.2, sehingga

( )1

;m

i jj

X Yφ=∑ = 3.

- Ada 4 nilai Y yang lebih kecil daripada 3X = 6.3 dan 1 nilai Y yang

sama dengan 3X = 6.3, sehingga ( )1

;m

i jj

X Yφ=∑ = 4.5.

- Dan seterusnya.

304

Statistik penguji untuk uji jumlah rank Wilcoxon dapat dihitung dari

statistik U Mann-Whitney:

ujiT = U + ( )1

2

n n +

= 28.5 + ( )6 6 1

2

+ = 49.5

Jika dibandingkan dengan statistik penguji pada uji rank Wilcoxon,

statistik U Mann-Whitney lebih mudah untuk dijelaskan dan juga lebih

mudah untuk dihitung pada sampel berukuran kecil, namun untuk sampel

besar, statistik penguji pada uji jumlah rank Wilcoxon lebih praktis untuk

digunakan.

305

LATIHAN 10

Bagian Pertama

Pilihlah satu jawaban yang paling benar!

Untuk soal No. 1 s.d. 7:

Dalam sebuah laboratorium, sepuluh orang pria dan sepuluh orang

wanita dites untuk menentukan suhu ruang yang paling nyaman bagi tiap

peserta tes masing-masing. Hasil yang diperoleh yaitu:

Pria : 23,22,25,24,24,23,24,23,23,24

Wanita: 24,25,26,26,23,26,26,26,26,27

Hendak diuji apakah ada perbedaan yang bermakna antara suhu ruang

yang paling nyaman bagi pria dan wanita.

1. Seandainya diketahui bahwa suhu ruang yang paling nyaman bagi

pria dan wanita berdistribusi normal, uji paling relevan bagi data di

atas ialah:

A. Uji t

B. Uji t berpasangan

C. Uji rank bertanda Wilcoxon

D. Uji jumlah rank bertanda Wilcoxon

2. Seandainya distribusi suhu ruang yang paling nyaman bagi pria dan

wanita tidak diketahui, uji yang paling relevan bagi data di atas ialah:

A. Uji t

B. Uji t berpasangan

C. Uji rank bertanda Wilcoxon

D. Uji jumlah rank bertanda Wilcoxon

3. Jika X menyatakan suhu ruang yang paling nyaman bagi pria dan Y

suhu ruang yang paling nyaman bagi wanita, maka dengan uji

Wilcoxon, hipotesis nol yang sesuai bagi tujuan uji diatas ialah:

A. ( ) ( )0 :H E X E Y= C. ( ) ( )0 :H E X E Y≥

B. ( ) ( )0 :H E X E Y≤ D. Semuanya salah

306

4. Nilai ( )1

n

ii

R X=∑ adalah:

A. 61 C. 144

B. 66 D. 149

5. Tanpa memperhitungkan keberadaan ties, dengan tingkat signifikansi

5%, daerah kritis untuk uji hipotesis ini adalah:

A. T < 79 atau T > 131 C. T > 127

B. T < 83 D. Semuanya salah

6. Nilai statistik penguji dengan memperhitungkan keberadaan ties

ialah:

A. −0.42 C. 0.37

B. −0.37 D. 0.42

7. Dengan memperhitungkan keberadaan ties serta tingkat signifikansi

yang sama seperti pada soal No. 5, daerah kritis untuk uji hipotesis

ini adalah:

A. T ’ < −1.96 atau T ’ > 1.96 C. T ‘ > 1.64

B. T ‘ < −1.64 D. Semuanya salah

8. Kesimpulan uji hipotesis yaitu:

A. Tidak ada perbedaan yang bermakna antara suhu ruang yang

paling nyaman bagi pria dan wanita.

B. Ada perbedaan yang bermakna antara suhu ruang yang paling

nyaman bagi pria dan dan wanita.

C. Suhu ruang yang paling nyaman bagi pria secara bermakna

lebih tinggi daripada suhu ruang yang paling nyaman bagi

wanita.

D. Semuanya salah.

Untuk soal No. 9 s.d. 15:

Data di bawah ini menunjukkan kadar nikotin 16 batang rokok yang

dipilih secara acak dari 2 merek rokok.

Hendak A: 0.29,0.57,0.36,0.46,0.16,0.82,0.66,0.34

Hendak B: 0.42,0.65,0.51,0.40,0.63,0.47,1.24,0.43

Hendak diuji apakah kadar nikotin pada rokok merek A secara

bermakna lebih rendah daripada kadar nikotin pada rokok merek B.

307

9. Uji non parametrik yang paling relevan bagi di atas ialah:

A. Uji rank bertanda Wilcoxon

B. Uji jumlah rank Wilcoxon (uji Mann-Whitney)

C. Keduanya benar

D. Keduanya salah

10. Jika X menyatakan kadar nikotin pada rokok merek A dan Y kadar

nikotin pada rokok merek B, maka dengan uji Mann-Whitney,

hipotesis nol yang sesuai bagi tujuan uji di atas ialah:

A. ( ) ( )0 :H E X E Y= C. ( ) ( )0 :H E X E Y≥

B. ( ) ( )0 :H E X E Y≤ D. Semuanya salah

11. Nilai 1R = ( )1

n

iiR X

=∑ adalah:

A. 58 C. 78

B. 66 D. 136

12. Nilai ( )2

1

m

jj

R R Y=

=∑ adalah:

A. 58 C. 78

B. 66 D. 136

13. Nilai statistik U Mann-Whitney ialah:

A. 11 C. 42

B. 22 D. 96

14. Untuk uji 1-sisi, nilai p 1-sisi yang bersesuaian dengan nilai statistik

U di atas adalah:

A. p < 0.05 C. p > 0.10

B. 0.05 < p < 0.10 D. Semuanya salah

15. Pada tingkat signifikansi α = 0.05, kesimpulan uji hipotesis adalah:

A. Tidak ada perbedaan yang bermakna antara kadar nikotin

dalam rokok merek A dan rokok merek B.

B. Ada perbedaan yang bermakna antara kadar nikotin dalam

rokok merek A dan rokok merek B.

C. Kadar nikotin dalam rokok merek A secara bermakna lebih

rendah daripada kadar nikotin dalam rokok merek B.

D. Semuanya salah

308

Bagian Kedua

Pilihlah satu jawaban yang paling benar!

Untuk soal No. 1 s.d. 6:

Misalkan dimiliki data hasil tes psikologi dan hasil tes akademik

delapan orang siswa seperti terlihat di bawah ini:

Siswa 1 2 3 4 5 6 7 8

X 76 67 93 70 68 89 65 82

Y 84 57 88 62 76 65 63 74

X : Hasil tes psikologi

Y : Hasil tes akademik

1. Koefisien korelasi produk momen Pearson adalah:

A. 0.3018 C. 0.6190

B. 0.5494 D. 0.8333

2. Nilai ( ) ( )2

1

n

i ii

T R X R Y=

= − ∑ adalah:

A. 0 C. 14

B. 7 D. 32

3. Dengan rumus penyederhanaan, koefisien korelasi rank Spearman

adalah:

A. 0.5494 C. 0.7440

B. 0.6190 D. 0.9167

4. Untuk menguji ada tidaknya korelasi hasil tes psikologi dengan hasil

tes akademik adalah:

A. Uji satu-sisi untuk korelasi positif

B. Uji satu-sisi untuk korelasi negatif

C. Uji dua-sisi

D. Semuanya salah

5. Dengan tingkat signifikansi 5%, daerah kritis uji korelasi rank di sini

adalah:

A. r > 0.463 C. r > 0.619

B. r > 0.591 D. r > 0.786

309

6. Kesimpulan yang paling tepat uji korelasi rank ini adalah:

A. Ada korelasi yang bermakna secara statistik antara hasil tes

psikologi dengan hasil tes akademik.

B. Ada korelasi positif yang bermakna secara statistik antara

hasil tes psikologi dengan hasil tes akademik.

C. Ada korelasi negatif yang bermakna secara statistiok antara

hasil tes psikologi dengan hasil tes akademik.

D. Tidak ada korelasi yang bermakna secara statistik antara hasil

tes psikologi dengan hasil tes akademik.

310

KEPUSTAKAAN

Aczel AD. Complete Business Statistics. Homewood, Illinois: Richard D

Irwin, Inc, 1989.

Bhattacharyya GK, RA Johnson. Statistical Concepts and Methods. New

York: John Wiley & Sons, 1977.

Conover WJ. Practical Nonparametric Statistics, Third Edition. New York:

John Wiley & Sons, Inc, 1999.

Draper NR, H Smith. Applied Regression Analysis, Second Edition. New

York: John Wiley & Sons, Inc, 1981.

Everitt BS. The Analysis of Contingency Tables. London: Chapman and Hall,

1977.

Everitt BS. The Cambridge Dictionary of Statistics. Cambridge: Cambridge

University Press, 1998.

Fienberg SE. The Analysis of Cross-Classified Categorical Data, Second

Edition. Cambridge: The Massachusetts Institute of Technology, 1987.

Fleiss JL. Statistical Methods for Rates and Proportions, Second Edition.

New York: John Wiley & Sons, 1981.

Fox J. Linear Statistical Models and Related Methods-With Application to

Social Research. New York: John Wiley & Sons, 1984.

Harlan J. Metode Statistika 1. Jakarta: Penerbit Gunadarma, 2004.

Hollander M, DA Wolfe. Nonparametric Statistical Methods. New York:

John Wiley & Sons, 1973.

Hosmer DW, S Lemeshow. Applied Logistic Regression. New York: John

Wiley & Sons, 1989.

Kleinbaum DG, LL Kupper, KE Muller. Applied Regression Analysis and

Other Multivariable Methods, Second Edition. Boston: PWS-KENT

Publishing Company, 1988.

Lemeshow S, DW Hosmer Jr, J Klar, et al. Adequacy of Sample Size in

Health Studies. Chichester: New York: John Wiley & Sons, 1990.

Mooney CZ, RD Duval. Bootstrapping: A Nonparametric Approach to

Statistical Inference. Newbury Park: Sage Publications, 1993.

Neter J, W Wasserman. Applied Linear Statistical Models: Regression,

Analysis of Variance, and Experimental Designs. Homewood, Illinois:

Richard D Irwin, Inc, 1977.

311

Sanders DH. Statistics: A First Course, Fifth Edition. New York: McGraw-

Hill, Inc, 1995.

Siegel S. Statistik Nonparametrik untuk Ilmu-ilmu Sosial (terjemahan Z

Suyuti). Jakarta: PT Gramedia, 1986.

Snedecor GW, WG Cochran. Statistical Methods, Seventh Edition. Ames,

Iowa: The Iowa State University Press, 1982.

Steel RGD, JH Torrie. Principles and Procedures of Statistics: A Biometrical

Approach, Second Edition. Auckland: The McGraw-Hill International

Book Company, 1981.

Subiyakto H. Statistika 2. Jakarta: Penerbit Gunadarma, 1994.

Upton GJG. The Analysis of Cross-tabulated Data. Chichester: John Wiley

& Sons, 1980.

Addendum A: Distribusi Z

313

ADDENDUM A: DISTRIBUSI Z

( )P Z Zα> = α

Sumber: GEP Box, et al, Statistics for Experimenters, John Wiley & Sons, 1978.

Addendum B: Nilai Kritis Distribusi t

314

ADDENDUM B: NILAI KRITIS DISTRIBUSI t

α = ( )P t tα>

Sumber: M Merrington, Table of Percentage Points of the t-Distribution, Biometrika 32

(1941) p 300.

ADDENDUM C: NILAI KRITIS DISTRIBUSI F

( )P F Fα> = α

Nilai Kritis Distribusi F (Lanjutan)

db1 : derajat bebas pembilang (numerator); db2 : derajat bebas penyebut (denominator)

Sumber: M Merrington & CM Thompson, Tables of Percentage of the Inverted Beta (F)-Distribution, Biometrika 33 (1943) pp 73-88.

318

ADDENDUM D: NILAI KRITIS DISTRIBUSI 2χχχχ

( )2 2P αχ χ> = α

Sumber: CM Thompson, Tables of Percentage Points of the2

χ -Distribution, Biometrika 32

(1941) pp 188-89.

319

ADDENDUM E: KUANTIL STATISTIK PENGUJI RANK BERTANDA WILCOXON

n

α ( )1

2

n n+ .005 .01 .025 .05 .10 .20 .30 .40 .50

4 0 0 0 0 1 3 3 4 5 10

5 0 0 0 1 3 4 5 6 7.5 15

6 0 0 1 3 4 6 8 9 10.5 21

7 0 1 3 4 6 9 11 12 14 28

8 1 2 4 6 9 12 14 16 18 36

9 2 4 6 9 11 15 18 20 22.5 45

10 4 6 9 11 15 19 22 25 27.5 55

11 6 8 11 14 18 23 27 30 33 66

12 8 10 14 18 22 28 32 36 39 78

13 10 13 18 22 27 33 38 42 45.5 91

14 13 16 22 26 32 39 44 48 52.5 105

15 16 20 26 31 37 45 51 55 60 120

16 20 24 30 36 43 51 58 63 68 136

17 24 28 35 42 49 58 65 71 76.5 153

18 28 33 41 48 56 66 73 80 85.5 171

19 33 38 47 54 63 74 82 89 95 190

20 38 44 53 61 70 83 91 98 105 210

21 44 50 59 68 78 91 100 108 115.5 231

22 49 56 67 76 87 100 110 119 126.5 253

23 55 63 74 84 95 110 120 130 138 276

24 62 70 82 92 105 120 131 141 150 300

25 69 77 90 101 114 131 143 153 162.5 325

26 76 85 99 111 125 142 155 165 175.5 351

27 84 94 108 120 135 154 167 178 189 378

28 92 102 117 131 146 166 180 192 203 406

29 101 111 127 141 158 178 193 206 217.5 435

30 110 121 138 152 170 191 207 220 232.5 465

31 119 131 148 164 182 205 221 235 248 496

32 129 141 160 176 195 219 236 250 264 528

33 139 152 171 188 208 233 251 266 280.5 561

34 149 163 183 201 222 248 266 282 297.5 595

35 160 175 196 214 236 263 283 299 315 630

36 172 187 209 228 251 279 299 317 333 666

37 184 199 222 242 266 295 316 335 351.5 703

38 196 212 236 257 282 312 334 353 370.5 741

39 208 225 250 272 298 329 352 372 390 780

40 221 239 265 287 314 347 371 391 410 820

41 235 253 280 303 331 365 390 411 430.5 861

42 248 267 295 320 349 384 409 431 451.5 903

43 263 282 311 337 366 403 429 452 473 946

44 277 297 328 354 385 422 450 473 495 990

45 292 313 344 372 403 442 471 495 517.5 1035

46 308 329 362 390 423 463 492 517 540.5 1081

47 324 346 379 408 442 484 514 540 564 1128

48 340 363 397 428 463 505 536 563 588 1176

49 357 381 416 447 483 527 559 587 612.5 1225

50 374 398 435 467 504 550 583 611 637.5 1275

Sumber: HL Harter & DB Owen, Selected Tables in Mathematical Statistics, Vol. 1 (1970).

Untuk α > 0.50: wα

= ( )1

2

n n+ ‒

1w

α−

320

ADDENDUM F: KUANTIL STATISTIK PENGUJI JUMLAH RANK WILCOXON

P (T < wα

) < αααα

n ∝∝∝∝ m

2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

2 0.001 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3

0.005 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 4 4

0.01 3 3 3 3 3 3 3 3 3 3 3 4 4 4 4 4 4 5 5

0.025 3 3 3 3 3 3 4 4 4 5 5 5 5 5 5 6 6 6 6

0.05 3 3 3 4 4 4 5 5 5 5 6 6 7 7 7 7 8 8 8

0.10 3 4 4 5 5 5 6 6 7 7 8 8 8 9 9 10 10 11 11

3 0.001 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 7 7 7 7

0.005 6 6 6 6 6 6 6 7 7 7 8 8 8 9 9 9 9 9 10

0.01 6 6 6 6 6 7 7 8 8 8 9 9 9 10 10 11 11 11 12

0.025 6 6 6 7 8 8 9 9 10 10 11 11 12 12 13 13 14 14 15

0.05 6 7 7 8 9 9 10 11 11 12 12 13 14 14 15 16 16 17 18

0.10 7 8 8 9 10 11 12 12 13 14 15 16 17 17 18 19 20 21 22

4 0.001 10 10 10 10 10 10 10 10 11 11 11 12 12 12 13 13 14 14 14

0.005 10 10 10 10 11 11 12 12 13 13 14 14 15 16 16 17 17 18 19

0.01 10 10 10 11 12 12 13 14 14 15 16 16 17 18 18 19 20 20 21

0.025 10 10 11 12 13 14 15 15 16 17 18 19 20 21 22 22 23 24 25

0.05 10 11 12 13 14 15 16 17 18 19 20 21 22 23 25 26 27 38 29

0.10 11 12 14 15 16 17 18 20 21 22 23 24 26 27 28 29 31 32 33

5 0.001 15 15 15 15 15 15 16 17 17 18 18 19 19 20 21 21 22 23 23

0.005 15 15 15 16 17 17 18 19 20 21 22 23 23 24 25 26 27 28 29

0.01 15 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32

0.025 15 16 17 18 19 21 22 23 24 25 27 28 29 30 31 33 34 35 36

0.05 16 17 18 20 21 22 24 25 27 28 29 31 32 34 35 36 38 39 41

0.10 17 18 20 21 23 24 26 28 29 31 33 34 36 38 39 41 43 44 46

321

KUANTIL STATISTIK PENGUJI JUMLAH RANK WILCOXON (Lanjutan)

n ∝∝∝∝ m

2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

6 0.001 21 21 21 21 21 21 23 24 25 26 26 27 28 29 30 31 32 33 34

0.005 21 21 22 23 24 25 26 27 28 29 31 32 33 34 35 37 38 39 40

0.01 21 21 23 24 25 26 28 29 20 31 33 34 35 37 38 40 41 42 44

0.025 21 23 24 25 27 28 30 32 33 35 36 38 39 41 43 44 46 47 49

0.05 22 24 25 27 29 30 32 34 36 38 39 41 43 45 47 48 50 52 54

0.10 23 25 27 29 31 33 35 37 39 41 43 45 47 49 51 53 56 58 60

7 0.001 28 28 28 28 29 30 31 32 34 35 36 37 38 39 40 42 43 44 45

0.005 28 28 29 30 32 33 35 36 38 39 41 42 44 45 47 48 50 51 53

0.01 28 29 30 32 33 35 36 38 40 41 43 45 46 48 50 52 53 55 57

0.025 29 31 33 35 37 40 42 44 46 48 50 53 55 57 59 62 64 66 68

0.05 29 31 33 35 37 40 42 44 46 48 50 53 55 57 59 62 64 66 68

0.10 30 33 35 37 40 42 45 47 50 52 55 57 60 62 65 67 70 72 75

8 0.001 36 36 36 37 38 39 41 42 43 45 46 48 49 51 52 54 55 57 56

0.005 36 36 38 39 41 43 44 46 48 50 52 54 55 57 59 61 63 65 67

0.01 36 37 39 41 43 44 46 48 50 52 54 56 59 61 63 65 67 69 71

0.025 37 39 41 43 45 47 50 52 54 56 59 61 63 66 68 71 73 75 78

0.05 38 40 42 45 47 50 52 55 57 60 63 65 68 70 73 76 78 81 84

0.10 39 42 44 47 50 53 56 59 61 64 67 70 73 76 79 82 85 88 91

9 0.001 45 45 45 47 48 49 51 53 54 56 58 60 61 63 65 67 69 71 72

0.005 45 46 47 49 51 53 55 57 59 62 64 66 68 70 73 75 77 79 82

0.01 45 47 49 51 53 55 57 60 62 64 67 69 72 74 77 79 82 84 86

0.025 46 48 50 53 56 58 61 63 66 69 72 74 77 80 83 85 88 91 94

0.05 47 50 52 55 58 61 64 67 70 73 76 79 82 85 88 91 94 97 100

0.10 48 51 55 58 61 64 78 71 74 77 81 84 87 91 94 98 101 104 108

10 0.001 55 55 56 57 59 61 62 64 66 68 70 73 75 77 79 81 83 85 88

0.005 55 56 58 60 62 65 67 69 72 74 77 80 82 85 87 90 93 95 98

0.01 55 57 59 62 64 67 69 72 75 78 80 83 86 89 92 94 97 100 103

0.025 59 62 66 69 73 77 80 84 88 92 95 99 103 107 110 114 118 122 126

0.05 57 60 63 67 70 73 76 80 83 87 90 93 97 100 104 107 111 114 118

0.10 59 62 66 69 73 77 80 84 88 92 95 99 103 107 110 114 118 122 126

322

KUANTIL STATISTIK PENGUJI JUMLAH RANK WILCOXON

(Lanjutan)

n ∝∝∝∝ m

2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

11 0.001 66 66 67 69 71 73 75 77 79 82 84 87 89 91 94 96 99 101 104

0.005 66 67 69 72 74 77 80 83 85 88 91 94 97 100 103 106 109 112 115

0.01 66 68 71 74 76 79 82 85 89 92 95 98 101 104 108 111 114 117 120

0.025 67 70 73 76 80 83 86 90 93 97 100 104 107 111 114 118 122 125 129

0.05 68 72 75 79 83 86 90 94 98 101 105 109 113 117 121 124 128 132 136

0.10 70 74 78 82 86 90 94 98 103 107 111 115 119 124 128 132 136 140 145

12 0.001 78 78 79 81 83 86 88 91 93 96 98 102 104 106 110 113 116 118 121

0.005 78 80 82 85 88 91 94 97 100 103 106 110 113 116 120 123 126 130 133

0.01 78 81 84 87 90 93 86 100 103 107 110 114 117 121 125 128 132 135 139

0.025 80 83 86 90 93 97 101 105 108 112 16 120 124 128 132 136 140 144 148

0.05 81 84 88 92 96 100 105 109 111 117 121 126 130 134 139 143 147 151 156

0.10 83 87 91 96 100 105 109 114 118 123 128 132 137 142 146 151 156 160 165

13 0.001 91 91 93 95 97 100 103 106 109 112 115 118 121 124 127 130 134 137 140

0.005 91 93 95 99 102 105 109 112 116 119 123 126 130 134 137 141 145 149 152

0.01 92 94 97 101 104 108 112 115 119 123 127 131 135 149 143 147 151 155 159

0.025 93 96 100 104 108 112 116 120 125 129 133 137 142 146 151 155 159 164 168

0.05 94 98 102 107 111 116 120 125 129 134 139 143 148 153 157 162 167 172 176

0.10 96 101 105 110 115 120 125 130 135 140 145 150 455 160 166 171 176 181 186

14 0.001 105 105 104 109 112 115 118 121 125 128 131 135 138 142 145 149 152 156 160

0.005 105 107 110 113 117 121 124 128 132 136 140 144 148 152 156 160 164 169 173

0.01 106 111 115 119 123 128 132 137 142 146 151 156 161 165 170 175 181 184 189

0.025 107 111 115 119 123 128 132 137 142 146 151 156 161 168 170 175 180 184 189

0.05 109 113 117 122 127 132 137 145 147 152 157 162 167 172 177 183 188 193 198

0.10 110 116 121 126 131 137 142 147 153 158 164 169 175 180 186 191 197 203 208

15 0.001 120 120 122 125 128 133 135 158 142 145 149 153 157 161 164 168 172 176 180

0.005 120 123 126 129 133 137 141 145 150 154 158 163 167 172 176 181 185 190 194

0.01 121 124 128 132 136 140 145 149 154 158 163 168 175 177 182 187 191 196 201

0.025 122 126 131 135 140 145 150 155 160 498 170 175 181 185 194 496 201 206 211

0.05 124 128 133 139 155 159 154 160 165 171 176 182 187 193 198 204 209 215 221

0.10 126 131 137 143 148 154 160 166 172 178 184 189 195 201 207 213 219 225 231

323

KUANTIL STATISTIK PENGUJI JUMLAH RANK WILCOXON (Lanjutan)

n ∝∝∝∝ m

2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

16 0.001 136 136 139 142 145 148 152 156 160 164 168 172 176 180 195 189 193 197 202

0.005 136 139 142 146 150 155 159 164 168 173 178 182 187 192 197 101 107 211 216

0.01 137 140 144 149 153 158 163 168 173 178 183 188 193 198 203 208 213 219 224

0.025 138 143 148 152 158 163 168 174 179 184 190 196 201 207 212 218 223 229 235

0.05 140 145 151 156 162 167 173 179 185 191 197 202 208 214 220 226 232 238 244

0.10 142 148 154 160 166 173 179 185 191 198 204 211 217 223 130 136 243 149 256

17 0.001 153 154 156 159 163 167 171 175 179 183 188 192 197 201 206 211 215 220 224

0.005 153 156 160 164 169 179 179 183 188 193 198 203 208 214 219 224 229 235 240

0.01 154 158 162 167 172 177 182 187 192 198 203 109 214 220 225 231 236 242 247

0.025 156 160 165 171 176 182 188 193 199 205 211 217 223 229 235 241 247 253 259

0.05 157 163 169 174 180 187 193 199 205 211 218 224 231 237 243 250 256 263 269

0.10 160 166 172 179 185 192 199 206 212 219 226 233 239 246 253 260 167 274 281

18 0.001 171 172 175 178 182 186 190 195 199 204 209 214 218 223 228 233 238 243 243

0.005 171 174 178 183 188 193 193 203 204 214 219 225 230 236 242 247 253 259 264

0.01 172 176 181 186 191 196 202 208 213 219 225 231 237 242 248 254 260 266 272

0.025 174 179 184 190 196 202 208 214 220 227 233 239 246 252 258 265 271 278 284

0.05 176 181 188 194 200 207 213 220 227 233 240 247 254 260 267 274 281 288 295

0.10 178 185 192 199 206 213 220 227 234 241 249 256 263 270 278 285 292 300 307

19 0.001 190 191 194 198 202 206 211 216 220 225 231 236 241 246 251 257 262 268 273

0.005 191 194 198 203 208 213 219 224 230 236 242 248 254 260 265 272 278 284 290

0.01 192 195 200 206 211 217 223 229 235 241 247 254 260 266 273 279 285 195 298

0.025 193 198 204 210 216 223 229 236 243 249 256 263 269 276 283 290 297 304 310

0.05 195 201 208 214 221 228 235 242 249 256 263 271 278 285 292 300 307 314 321

0.10 198 205 242 249 227 234 242 249 257 264 272 280 288 295 303 300 319 326 334

20 0.001 210 211 214 218 223 227 232 237 243 248 253 259 265 270 276 281 287 293 299

0.005 211 214 219 224 229 235 241 247 253 259 265 271 278 284 290 297 303 310 216

0.01 212 216 221 227 233 239 245 251 258 264 271 278 284 291 298 304 311 318 325

0.025 213 219 225 231 238 245 251 250 266 273 280 287 294 301 309 316 323 330 338

0.05 215 222 229 236 243 250 258 265 273 280 288 295 303 311 318 326 334 341 349

0.10 218 226 233 241 249 257 265 273 281 289 297 305 313 321 330 338 346 354 362

Sumber: WJ Conover, Practical Nonparametric Statistics,3rd

Ed, John Wiley & Sons, 1999.

ADDENDUM G: NILAI KRITIS KOEFISIEN KORELASI SPEARMAN

n α

0.10 0.05 0.025 0.01 0.005 0.001

4 0.8000 0.8000

5 0.7000 0.8000 0.9000 0.9000

6 0.6000 0.7714 0.8286 0.8857 0.9429

7 0.5357 0.6786 0.7500 0.8571 0.8929 0.9643

8 0.5000 0.6190 0.7143 0.8095 0.8571 0.9286

9 0.4667 0.5833 0.6833 0.7667 0.8167 0.9000

10 0.4424 0.5515 0.6364 0.7333 0.7818 0.8667

11 0.4182 0.5273 0.6091 0.7000 0.7455 0.8364

12 0.3986 0.4965 0.5804 0.6713 0.7203 0.8112

13 0.3791 0.4780 0.5549 0.6429 0.6978 0.7857

14 0.3626 0.4593 0.5341 0.6220 0.6747 0.7670

15 0.3500 0.4429 0.5179 0.6000 0.6500 0.7464

16 0.3382 0.4265 0.5000 0.5794 0.6324 0.7265

17 0.3260 0.4118 0.4853 0.5637 0.6152 0.7083

18 0.3148 0.3994 0.4696 0.5480 0.5975 0.6904

19 0.3070 0.3895 0.4579 0.5333 0.5825 0.6737

20 0.2977 0.3789 0.4451 0.5203 0.5684 0.6586

21 0.2909 0.3688 0.4351 0.5078 0.5545 0.6455

22 0.2829 0.3597 0.4241 0.4963 0.5426 0.6318

23 0.2767 0.3518 0.4150 0.4852 0.5306 0.6186

24 0.2704 0.3435 0.4061 0.4748 0.5200 0.6070

25 0.2646 0.3362 0.3977 0.4654 0.5100 0.5962

26 0.2588 0.3299 0.3894 0.4564 0.5002 0.5856

27 0.2540 0.3236 0.3822 0.4481 0.4915 0.5757

28 0.2490 0.3175 0.3749 0.4401 0.4828 0.5660

29 0.2443 0.3113 0.3685 0.4320 0.4744 0.5567

30 0.2400 0.3059 0.3620 0.4251 0.4665 0.5479

Sumber GJ Glasser &RF Winter, Critical Values of The Coefficient of Rank Correlation for

Testing the Hypothesis of Independence, Biometrika 48 (1961) pp 444-448 (Appendix).

bab 4harlan_johan.staff.gunadarma.ac.id/downloads/files/64611/metode... · data bivariat jika...

Documents

bab vi membandingkan bibit tebar f2 media jagung dengan...

satriaukuran gejala pusat data belum dikelompokkan

paula tebar 5e

analisis bivariat data kategorik dan numerik uji t dan …...

model probit biner bivariat pada pemberian imunisasi dasar

tebar berkah ramadhan -...

pengaruh perbedaan padat tebar terhadap laju...

model regresi probit bivariat -...

pemodelan log linier dan regresi logistik biner bivariat...

optimasi tebar benih dan tebar pakan pada...

kata pengantar -...

bab xviii 18_analisis... · 2012-09-17 · diagram tebar...

analisis univariat, bivariat

analisis bivariat

analisis bivariat data kategorik dan kategorik uji …...

tebar karya ubeditorial dengan mengucap syukur kepada tuhan...

bivariat 2014

pemodelan log linier dan regresi logistik biner bivariat

menghitung korelasi bivariat menggunakan spss

peran dan tanggung jawab divisi kreatif dalam event suzuki...