bab 4harlan_johan.staff.gunadarma.ac.id/downloads/files/64611/metode... · data bivariat jika...
Post on 26-Apr-2019
230 Views
Preview:
TRANSCRIPT
116
BAB 4
ANALISIS REGRESI LINEAR 1
4.1 DATA BIVARIAT
� Paparan Data Bivariat
Data bivariat adalah data dengan pasangan (dua) variabel berbeda,
yang berasal dari subjek yang sama. Data bivariat yang akan dibahas dalam
bab ini adalah data berskala kontinu, atau sekurang-kurangnya numerik.
Paparan (layout) data bivariat tersebut secara umum diperlihatkan pada
matriks 4.1.
Matriks 4.1. Paparan data bivariat
Subjek Variabel 1 Variabel 2
1 11X 21X
2 12X 22X
. . . . . . . . .
i 1iX 2i
X
. . . . . . . . .
n 1nX 2n
X
Contoh 4.1:
Pada pengambilan sampel acak 48 orang mahasiswa Fakultas Ilmu
Komputer Universitas Gunadarma, 2002, diperoleh data tinggi dan berat
badan mereka, yang disajikan dalam bentuk dataset (database; basis data)
seperti terlihat pada tabel 4.1 di bawah ini.
117
Tabel 4.1. Tinggi dan berat badan 48 orang mahasiswa Fakultas Ilmu
Komputer Universitas Gunadarma, 2002
No TB BB No TB BB No TB BB No TB BB
1 174 84 13 171 65 25 176 70 37 160 52
2 159 55 14 177 95 26 158 60 38 155 48
3 156 72 15 168 50 27 157 55 39 172 49
4 154 44 16 151 44 28 158 50 40 167 59
5 159 64 17 154 47 29 175 89 41 163 47
6 155 53 18 160 49 30 173 70 42 176 54
7 160 45 19 164 42 31 155 50 43 156 53
8 160 61 20 171 55 32 161 51 44 160 50
9 155 64 21 171 54 33 169 80 45 168 71
10 158 62 22 173 80 34 145 43 46 159 46
11 174 53 23 171 68 35 154 45 47 171 54
12 162 54 24 170 64 36 158 51 48 170 55
TB: tinggi badan (dalam cm); BB: berat badan (dalam kg)
� Distribusi Frekuensi Bivariat
Data bivariat jika dikelompokkan (dikategorikan) akan menghasilkan
distribusi frekuensi bivariat, suatu bentuk penyajian distribusi frekuensi dua
variabel sekaligus. Tabel yang diperoleh disebut juga tabel silang atau tabel r
× c (terdiri atas r baris dan c kolom).
Contoh 4.2:
Lihat kembali data tinggi dan berat badan 48 orang mahasiswa
Gunadarma pada contoh 4.1. Kategorisasi data bivariat tersebut
menghasilkan distribusi frekuensi bivariat dalam bentuk tabel silang 3×3
seperti terlihat pada tabel 4.2 di bawah ini.
118
Tabel 4.2. Distribusi mahasiswa menurut tinggi dan berat badan ,
Fakultas Ilmu Komputer, Universitas Gunadarma , 2002 (N = 48)
Tinggi
badan (cm)
Berat badan (kg) Jumlah
< 50 50-59 > 60
< 160 7 7 5 19
160-169 4 6 3 13
> 170 1 6 9 16
Jumlah 12 19 17 48
Nilai-nilai pada kolom terkanan dan baris terbawah yang dinamakan
‘distribusi marginal’ merupakan distribusi frekuensi (univariat) untuk
masing-masing variabel.
Contoh 4.3:
Contoh lain untuk distribusi frekuensi bivariat tampak pada tabel 4.3,
yang menunjukkan distribusi hipotetis karyawan sebuah perusahaan menurut
lama masa kerja dan besar gaji bulanannya.
Tabel 4.3. Distribusi karyawan perusahaan ABC menurut masa kerja
dan gaji bulanan
Masa kerja
(tahun)
Gaji (dalam ratusan ribu rupiah) Jumlah
< 1000 1000-1999 > 2000
< 5 30 4 0 34
5-9 23 17 2 42
> 10 2 6 4 12
Jumlah 55 27 6 88
Dari tabel silang dapat diperkirakan secara kasar kemungkinan
adanya hubungan anatara kedua variabel, serta arah hubungan tersebut.
Hubungan antara dua variabel numerik yang terikat dalam struktur data
bivariat demikian seandainya ada dinamakan ‘asosiasi statistik’. Secara
statistik, hubungan antara dua variabel tersebut dianalisis dengan:
1. Analisis kolerasi: untuk hubungan tanpa arah (variabel baris ↔variabel kolom).
2. Analisis regresi sederhana: untuk hubungan yang memiliki arah
(variabel independen →variabel dependen) .
119
4.2. ANALISIS KORELASI
� Diagram Tebar
Analisis korelasi adalah analisis statistik yang ditujukan untuk
mengukur keeratan hubungan antara dua variabel yang terikat dalam
struktur data bivariat. Dua variabel demikian dapat disajikan secara grafik
dengan ‘diagram tebar’ (scatter diagram), dengan tiap titik menyatakan satu
pasangan nilai, yaitu nilai pada sumbu X (merepresentasikan variabel
pertama) dan nilai pada sumbu Y (merepresentasikan variabel kedua).
Manfaat diagram tebar adalah untuk memperkirakan besar (tingkat
keeratan) dan arah hubungan antar dua variabel tersebut. Besar dan dua arah
hubungan itu dinyatakan secara kuantitatif dengan koefisien korelasi
(sampel) r:
1) Arah hubungan:
� Hubungan positif ( )0 :r > jika X membesar, maka Y juga
membesar.
� Hubungan negatif ( )0 :r < jika X membesar, maka Y mengecil,
dan sebaliknya.
2) Besar hubungan:
1 1r− ≤ ≤ (4.1)
� Hubungan kuat: r mendekati 1
� Hubungan lemah: r mendekati 0
Perhatikan bahwa:
- Perhitungan korelasi dapat dilakukan dengan dan tanpa melalui analisis
regresi
- Tingkat korelasi yang kuat (‘bermakna’ secara statistik) belum tentu
menunjukkan hubungan kausal (sebab-akibat)
120
Diagram 4.1. Diagram tebar beberapa contoh data bivariat dengan
berbagai niali korelasi
� Koefisien Korelasi Pearson
Korelasi antara dua variabel yang berskala kontinu dinamakan
koefisiensi korelasi Pearson atau koefisien korelasi produk-momen:
- Koefisien korelasi untuk populasi: ρ
- Koefisien korelasi untuk sampel: ˆr ρ=
121
Koefisien korelasi r bernilai 1+ jika:
a. Setiap titik pada diagram tebar, yaitu tiap pasangan nilai ( );i i
X Y
terletak pada satu garis lurus, yaitu garis regresi 0 1Y b b X= + dengan
1 0.b >
b. Garis lurus tersebut membentuk sudut lancip dengan sumbu horizontal
:X 0 00 90ϕ< < dengan 1 b tg ϕ=
Koefisien korelasi r bernilai 1− jika:
a. Setiap titik pada diagram tebar, yaitu tiap pasangan nilai ( );i i
X Y
terletak pada satu garis lurus, yaitu garis regresi 0 1Y b b X= + dengan
1 0.b <
b. Garis lurus tersebut membentuk sudut tumpul dengan sumbu horizontal
:X 0 090 180ϕ< < dengan 1 b tg ϕ=
Rumus definisi:
( )( )
( )i i
2
i
2
i( )
X X Y Yr
X X Y Y
− −=
− −
∑∑ ∑
(4.2)
Rumus operasional:
( )
i i
i i
22
i i 2 2
11
( )( )
( )
X YX Y
nrYX
X Yn n
−=
− −
∑ ∑∑
∑∑∑ ∑
(4.3)
Dengan lambang-lambang xxS , yyS , dan xyS :
( )
2
2 2 ixx i
i i
i
i
X
S X X Xn
= − = −∑
∑ ∑ (4.4.a)
( )
2
2 2
iyy i
i i
i
i
Y
S Y Y Yn
= − = −∑
∑ ∑ (4.4.b)
122
( )( )
i i
i i
i i
xy i i i i
X Y
S X X Y Y X Yn
= − − = −∑ ∑
∑ ∑ (4.4.c)
serta xS dan yS :
( )
2
ii
x xxS S X X= = −∑ (4.5.a)
( )
2
ii
y yyS S Y Y= = −∑ (4.5.b)
maka rumus operasional untuk r dapat dituliskan sebagai:
yy
xy xy
x yxx
S Sr
S SS S= = (4.6)
Contoh 4.4 (korelasi dengan rumus definisi):
Misalkan dimiliki data hipotesis variabel X yang menyatakan nilai
tes 1 (Matematika) dan variabel Y yang menyatakan nilai tes 2 (Bahasa
Inggris) 7 orang calon mahasiswa. Untuk menghitung koefisien korelasi
antara variabel X dan Y dengan menggunakan rumus definisi, terlebih
dahulu disusun tabel perhitungan seperti pada tabel 4.4 berikut.
Tabel 4.4. Contoh perhitungan koefisien korelasi dengan menggunakan
rumus definisi
Siswa iX iY ( )iX X− ( )2
iX X− ( )iY Y− ( )2
iY Y− ( )( )i iX X Y Y− −
A 90 94 10 100 17 289 170
B 82 66 2 4 −11 121 −22
C 66 69 −14 196 −8 64 112
D 70 86 −10 100 9 81 −90
E 95 72 15 225 −5 25 −75
F 97 88 17 289 11 121 187
G 60 64 −20 400 −13 169 260
Jumlah 560 539 1,314 870 542
i :X nilai tes 1; i :Y Nilai tes 2
123
560
807
X = = 539
777
Y = =
( )( )
( ) ( )
i i
2 2
i i
X X Y Yr
X X Y Y
− −=
− −
∑
∑ ∑
= ( ) ( )
5420.51
1,314 870=
Contoh 4.5 (korelasi dengan rumus operasional):
Lihat kembali data nilai tes Matematika dan bahasa Inggris pada
contoh 4.4. Untuk menghitung koefisien korelasi dengan menggunakan
rumus operasional, disusun tabel perhitungan seperti terlihat pada tabel 4.5.
Tabel 4.5. Contoh perhitungan koefisien korelasi dengan menggunakan
rumus operasional
Siswa iX iY 2iX 2
iY iX iY
A 90 94 8,100 8,836 8,460
B 82 66 6,724 4,356 5,412
C 66 69 4,356 4,761 4,554
D 70 86 4,900 7,396 6,020
E 95 72 9,025 5,184 6,840
F 97 88 9,409 7,744 8,536
G 60 64 3,600 4,096 3,840
Jumlah 560 539 46,114 42,373 43,662
i :X Nilai tes 1; i :Y Nilai tes 2
( )( )
( ) ( )
i i
i i
2 2
i i 2 2
i i
X YX Y
nr
X YX Y
n n
−=
− −
∑ ∑∑
∑ ∑∑ ∑
( )( )
2 2
560 53943,662
7 0.51560 539
46,114 42,3737 7
−= =
− −
atau:
124
( )( )
( )( )
2
i 22
xx i
2
2
i 22
i
1 i
xy i i
xy
x y
56046,114 1,314
7
53942,373 870
7
560 53943,662 542
7
5420.51
1,314 870
i
i
i
yy
i
i i
i
X
S Xn
Y
S Yn
X Y
S X Yn
Sr
S S
= − = − =
= − = − =
= − = − =
= = =
∑∑
∑∑
∑ ∑∑
4.3. ANALISIS REGRESI LINEAR SEDERHANA
� Garis Regresi dan Model Regresi Linear
Analisis regresi adalah analisis statistik yang ditujukan untuk
memperoleh persamaan garis yang menunjukkan hubungan antara dua
variabel yang terikat dalam struktur data bivariat, dalam bentuk persamaan
garis regresi (diagram 4.2).
Persamaan garis regresi:
0 1 Y Xβ β= + (populasi) (4.7.a)
0 1 Y b b X= + (sampel) (4.7.b)
125
Diagram 4.2. Contoh diagram tebar data bivariat dan garis regresinya
1) Nilai Y -prediksi ˆ( ) :Y= adalah nilai prediksi variabel Y untuk setiap
nilai X tertentu.
� Dalam populasi: i 0 1 i Y Xβ β= +
� Dalam sampel: i 0 1 i Y Xβ β= +
2) Nilai Y -sesungguhnya i ( ) :Y= adalah nilai variabel Y sesungguhnya
untuk setiap nilai X tertentu. Pasangan nilai-nilai X dan Y
sesungguhnya menyatakan titik-titik yang ada pada diagram tebar.
Hubungan tiap nilai X tertentu dengan pasangan nilai Y
sesungguhnya, dinyatakan dalam suatu model, yang dinamakan model
regresi linear.
� Dalam populasi: i 0 1 i i Y Xβ β ε= + + (4.8.a)
dengan i i i ˆY Yε = −
� Dalam sampel: i 0 1 i i Y b b X e= + + (4.8.b)
dengan i i i ˆe Y Y= −
0 β : intersep (intercept); estimatornya adalah: 0 0
ˆ bβ =
1β : kemiringan (slope;koefisien regresi); estimatornya adalah: 1 1
ˆ bβ =
iε : galat acak (random error): i ˆ eε =
126
Persamaan garis regresi juga berlaku bagi pasangan nilai rerata X
dan rerata Y :
0 1 Y b b X= + (4.9)
Asumsi yang harus dipenuhi pada model regresi linear ini antara lain
yaitu:
� Nilai-nilai iY independen satu sama lain (asumsi independensi).
� Himpunan nilai-nilai iY untuk tiap nilai iX tertentu [distribusi (Y | X)]
berdistribusi normal dengan variansi yang sama (asumsi
homoskedastitas; lihat diagram 4.3).
Diagram 4.3. Asumsi homoskedastitas pada model regresi linear
� Koefisien Regresi 0b dan 1b
Koefisiensi regresi 0 b dan 1 b pada analisis regresi linear diestimasi
dengan menggunakan metode kuadrat terkecil (ordinary least square; OLS),
yaitu penentuan nilai 0 b dan 1 b sedemikian hingga menghasilkan nilai
minimum untuk 2
i e∑ . Dengan metode ini diperoleh rumus definisi untuk
koefisien regresi 1 b , yaitu:
( )( )
( )i i xy
1 2
xx i
X X Y YSb
S X X
− −= =
−
∑∑
(4.10)
Dalam praktik, yang digunakan untuk perhitungan adalah rumus
operasional:
127
( )( )
( )
i i
i i
2
1
2
1
i
X Yb X Y
n
XX
n
= −
−
∑ ∑∑
∑∑
(4.11)
dengan:
0 1 b Y b X= − (4.9.a)
Contoh 4.6:
Misalkan dimiliki data hipotetis bagi 8 orang tenaga penjual
(salesman), yang menyatakan lama bekerja sebagai tenaga penjual dalam
tahun dan jumlah penjualan mingguannya dalam ribuan rupiah. Misalkan
hubungan antara lama bekerja (variabel X ) dan jumlah penjualan (variabel
Y ) dinyatakan dalam model regresi linear:
i 0 1 i i Y Xβ β ε= + +
Estimator 0 β dan 1 β adalah 0 b dan 1 b , yang perhitungannya
disajikan dengan menggunakan tabel 4.6 di bawah ini.
Tabel 4.6. Contoh perhitungan koefisien regresi untuk data 8 orang
tenaga penjual
Penjual iX iY iX iY 2iX 2
iY
A 6 90 540 36 8,100
B 5 60 300 25 3,600
C 3 40 120 9 1,600
D 1 30 30 1 900
E 4 30 120 16 900
F 3 50 150 9 2,500
G 6 80 480 36 6,400
H 2 20 40 4 400
Jumlah 30 400 1,780 136 24,400
iX : Lama berjualan (dalam tahun)
iY : Jumlah penjualan (dalam ribuan rupiah)
30
3.758
X = = 400
508
Y = =
128
( ) ( )
( ) ( )
2
i 22
XX i
i i
xy i i
xy
1
0 1
30136 23.5
8
30 4001,780 280
8
28011.91
23.5
50 11.91 3.75 5.32
i
i
i i
i
xx
X
S Xn
X Y
S X Yn
Sb
S
b Y b X
= − = − =
= − = − =
= = =
= − = − =
∑∑
∑ ∑∑
Estimasi persamaan regresi: ˆ 5.32 11.91Y X= +
Misalkan seorang penjual memiliki lama penjualan 4 tahun, maka
taksiran (estimasi) jumlah penjualannya adalah:
4iX =
ˆiY = ( )( )i
5.32 11.91 5.32 11.91 4 52.98X+ = + =
Hubungan antara 1 b dengan r :
( )
( )
2
2
1 i y
xi
Y Y Sb
r SX X
−= =
−
∑∑
(4.12)
� Variansi pada Model Regresi
Pada diagram 4.4, tampak bahwa:
( ) ( ) ( )2
i i i i ˆ ˆY Y Y Y Y Y− = − + −
129
Diagram 4.4. Dasar Penguraian variansi pada model regresi linear
Secara matematis, dapat dibuktikan bahwa:
( )2
i Y Y−∑ = ( )
2
i Y Y−∑ + ( )2
i i ˆY Y−∑
atau: JKT = JKR + JKG (4.13)
JKT : Jumlah Kuadrat Total (SSTo, Total Sum of Squares) = yy S
JKR : Jumlah Kuadrat Regresi (SSR, Regression Sum of Squares)
JKG : Jumlah Kuadrat Galat (Error Sum of Squares) = 2
i e∑
Rumus definisi:
JKT = yy S = ( )
2
i Y Y−∑ (4.14)
JKR = 1b .yy S =
( )2
xy
xx
S
S =
( )( )
( )i i
2
i
2
X X Y Y
X X
− −
−
∑∑
(4.15)
Rumus operasional:
JKT = yy S =
2i
i
Y∑ −
2
ii
Y
n
∑
; db = n – 1 (4.16)
130
JKR = ( )
2
xy
xx
S
S =
( )
2
2
2
i ii i
i
i
X YX Y
n
XX
n
−
−
∑ ∑∑
∑∑
; db = 1 (4.17)
JKG = JKT – JKR ; db = n – 2 (4.13.a)
� Kuadrat Rerata
Kuadrat Rerata ( ) =mean square Jumlah Kuadrat
derajat bebas
� Kuadrat Rerata Regresi (KRR; regression mean square; MSR)
KRR = 1
JKR (4.18)
� Kuadrat Rerata Galat (KRG; error mean square; MSE)
KRG = 2
JKG
n − (4.19)
Contoh 4.7:
Lihat kembali data pada contoh 4.6:
xx 23.5S = xy 280S =
2
i 22
yy i
40024,400 4,400
8
i
i
Y
S Yn
= − = − =∑
∑
yy 4,400JKT S= =
( )
22
xy
2
xx
2803,336.17
23.5
SJKR
S= = =
atau ( )1 xy
280. 280 3,336.17
23.5JKR b S= = =
131
4,400 3,336.17 1.063.83JKG JKT JKR= − = − =
� Koefisien Determinasi
Koefisien determinasi adalah proporsi variansi yang dapat dijelaskan
oleh model regresi.
2
R = JKR
JKT =
JKT JKG
JKT
− = 1 −
JKG
JKT (4.20)
2
R = ( )( )
2
2
ˆ
i
Y Y
Y Y
−
−
∑
∑ = 1 −
( )( )
2
2
ˆi i
i
Y Y
Y Y
−
−
∑
∑ (4.20.a)
Akar koefisiensi determinasi sama dengan koefisien korelasi:
R = r (4.21)
sehingga:
( )( )( )
( ) ( )
2
i i
2 i i
xy 2
2 2
xx yy i i 2 2
i i
X YX Y
nSR
S S X YX Y
n n
−
= = − −
∑ ∑∑
∑ ∑∑ ∑
(4.22)
Contoh 4.8:
Lihat kembali data pada contoh 4.6 dan 4.7.
3,336.17JKR = 4,400JKT =
Koefisien determinasi adalah:
2
3,336.170.76
4,400
JKRR
JKT= = =
2
0.76 0.87R R= = =
xx 23.5S = yy 4,400S = xy
280S =
Koefisien korelasi: xy
xx yy
Sr
S S=
132
( )( )
2800.87
23.5 4,400= =
Tampak bahwa: R = r
Koefisien korelasi r juga dapat dihitung sebagai berikut:
1 11.91b = (contoh 4.6)
xx 23.5S = (contoh 4.6)
yy 4,400S JKT= = (contoh 4.7)
Dengan menggunakan rumus:
( )( )
2
i y 1
2
x i
Y Y Sb
r SX X
−= =
−
∑∑
diperoleh: 11.91
r =
4, 400
23.5
r = 0.87
4.4. INFERENSI STATISTIK PADA MODEL REGRESI
DAN MODEL KORELASI
� Uji ANOVA (Uji F) untuk 0H : 1ββββ = 0
- Hipotesis: 0H : 1β = 0 (4.23.a)
1H : 1β ≠ 0 (4.23.b)
- Statistik pengujinya adalah:
( )uji
/1
/ 2
KRR JKRF
KRG JKG n= =
− (4.24)
yang berdistribusi F dengan derajat bebas pembilang 1 dan derajat bebas
penyebut ( )2 .n −
- Daerah kritis: F > ( )1; 2 ;nF α− (4.25)
(tabel nilai kritis distribusi F dapat dilihat pada Addendum C)
133
Hasil perhitungan disajikan dalam bentuk tabel ANOVA (analisis
variansi) seperti terlihat pada tabel 4.7 di bawah ini.
Tabel 4.7. Tabel ANOVA untuk persamaan garis regresi ˆiY = 0b + 1 ib X
Sumber
variansi JK db KR ujiF
tabelF
Regresi JKR 1 KRR = 1
JKR
ujiF = KRR
KRG ( )1; 2 ;nF
α−
Galat JKG n – 2 KRG = 2
JKG
n −
Total JKT n – 1
Contoh 4.9:
Lihat kembali data penjualan pada contoh 4.6. Pada contoh 4.7 telah
dihitung nilai-nilai JKT, JKR, dan JKG-nya ( )8 :n =
4,400JKT = 3,336.17JKR = 1,063.83JKG =
Diperoleh:
3,336.17
3,336.171 1
JKRKRR = = =
1,063.83
177.302 6
JKGKRG
n= = =
−
Untuk uji hipotesis 0 1 : 0H β = dengan uji F dan tingkat signifikansi
0.05,a = disusun tabel analisis variansi berikut:
Tabel 4.8. Tabel ANOVA untuk persamaan regresi ˆ 5.32 11.91XY = +
Sumber
variansi JK db KR ujiF
tabelF
Regresi 3,336.17 1 3,336.17
ujiF = 3,336.17
177.30
= 18.82
1; 6; 0.05F
= 5.99
Galat 1,063.83 6 177.30
Total 4,400 7
134
Nilai uji
18.82F = lebih besar daripada nilai titik kritis
( )1;6;0.05 5.99,F =
sehingga 0 1 : 0H β =
ditolak pada tingkat signifikansi 0.05.a =
� Distribusi F
Statistik penguji pada uji ANOVA untuk model regresi linear
berdistribusi F, yang cuplikan nilai-nilainya diperlihatkan pada tabel 4.9 di
bawah ini (tabel lengkap nilai kritis distribusi F terdapat pada Addendum C).
Distribusi F memiliki derajat bebas pembilang (numerator; baris teratas pada
tabel) dan derajat bebas penyebut (denominator; kolom terkiri pada tabel).
Bentuk distribusinya dapat berbeda-beda, tergantung pada derajat bebas
pembilang dan derajat bebas penyebut., tetapi nilai-nilai F seluruhnya adalah
positif (di sisi kanan sumbu vertikal), sehingga uji hipotesis dengan statistik
penguji yang berdistribusi F selalu adalah uji 1-ekor, namun merupakan uji
2-sisi.
Diagram 4.5. Distribusi F dengan berbagai derajat bebas pembilang dan
derajat bebas penyebut.
Tabel distribusi F biasanya dibuat terpisah untuk berbagai nilai ,a
dan yang disajikan pada tabel 4.9 adalah nilai-nilai distribusi F untuk
0.05.a = Nilai-nilai distribusi F selengkapnya dapat dilihat pada Addendum
C.
135
Tabel 4.9. Cuplikan tabel F untuk α = 0.05 [α = P (F > ( ) ; ;n d αF ]
� Uji t (2-sisi) untuk 0H : 1ββββ = 0 dan Interval Konfidensi 1ββββ
- Hipotesis: 0 1 : 0H β = (4.26.a)
1 1 : 0H β ≠ (4.26.b)
- Statistik pengujinya adalah:
ujit = ( )1
1ˆ
b
SE b = 1
x
b
s S (4.27)
yang berdistribusi t dengan db ( )2 .n −
2s = ( )2
JKG
n − =
( )( )
2ˆ
2
i iY Y
n
−
−
∑ = KRG (4.28)
- Daerah kritis (daerah penolakan) adalah:
t > ( )2 ; 2nt α− (4.29)
136
Interval konfidensi untuk adalah:
1b + ( )2 ; 2nt α− . ( )1
ˆSE b
yaitu: 1b + ( )2 ; 2nt α− .
x
s
S (4.30)
Contoh 4.10:
Lihat kembali data penjualan pada contoh 4.6. Dalam contoh tersebut
telah diperoleh estimasi persamaan regresi:
ˆ 5.32 11.91Y X= +
Untuk menguji hipotesis 0 1 : 0,H β = statistik pengujinya adalah:
( )1 1
uji
x 1 ˆ /
b bt
s SSE b= =
yang berdistribusi tdengan db ( )2 .n −
( )
2 177.302
JKGs KRG
n= = =
− xx 23.5S =
( )1
x
177.30ˆ 2.74723.5
sSE b
S= = =
( )1
uji
1
11914.34
ˆ 2.747
bt
SE b= = =
Dengan 0.05,a = daerah kritis untuk hipotesis 0 1 : 0H β =
adalah
( )6;0.025 | |t t> atau | t | 2.447,> sehingga 0 H ditolak.
Interval konfidensi 95% untuk 1 β adalah:
atau:
( ) ( )
( ) ( )
[ ]
1 1 6;0.025 ˆ.
11.91 2.447 2.747
5.19;18.64
b t SE b±
±
( )1 a−1 β
137
Uji Hipotesis untuk Koefisien Korelasi r
- Hipotesis: 0H : ρ = 0 (4.31.a)
1H : ρ ≠ 0 (4.31.b)
- Statistik pengujinya adalah:
ujit =
( ) ( )21 2
r
r n− − (4.32)
yang berdistribusi dengan db
- Daerah kritis (daerah penolakan) adalah:
t > ( )2 ; 2nt α− (4.33)
Contoh 4.11:
Lihat kembali data penjualan pada contoh 4.6. Pada contoh 4.8 telah
dihitung:
0.87r =
Untuk menilai apakah koefisien korelasi ini berbeda secara bermakna
dengan nol (tidak ada korelasi), maka dilakukan uji hipotesis 0 : 0H ρ = .
Statistik pengujinya adalah:
( ) ( ) ( )uji
2 2
0.874.34
1 / 2 1 0.87 / 6
rt
r n= = =
− − −
yang berdistribusi t dengan db ( )2 .n −
Dengan 0.05,a = daerah kritis adalah |t|>( )2 ;a/ 2
,n
t−
yaitu |t|>( )6;0.025
t atau
|t|>2.447, sehingga 0 H ditolak.
t ( )2 .n −
138
LAMPIRAN 4A: UKURAN SAMPEL MINIMUM UNTUK
UJI HIPOTESIS PADA MODEL REGRESI DAN MODEL
KORELASI
Ukuran Sampel untuk Model Regresi Linear
Rumus perhitungan ukuran sampel minimum yang dibutuhkan untuk
uji hipotesis pada model regresi linear tidak dapat disajikan dalam bentuk
sederhana, karena menggunakan distribusi F-sentral serta distribusi F-non-
sentral yang memerlukan pemahaman teoretis di luar ruang lingkup
pembahasan pada buku teks ini. Jika diperlukan, ukuran sampel minimum
yang dibutuhkan untuk uji hipotesis pada model regresi linear dapat
ditentukan dengan menggunakan salah satu program komputer yang ada
untuk perhitungan ukuran sampel dan kekuatan uji hipotesis, misalnya PASS
2000.
Contoh IV.1:
Misalkan akan ditentukan ukuran sampel minimum yang dibutuhkan
untuk melakukan uji hipotesis terhadap model regresi linear
i 0 1 i i Y Xβ β ε= + + . Misalkan pula dipilih tingkat signifikansi 0.05,a =
kekuatan uji ( )1 0.80,β− = dan diketahui dari penelitian terdahulu bahwa
( ) 1.SD X = Dengan memasukkan nilai-nilai spesifikasi ini pada progam
komputer PASS 2000, diperoleh ukuran sampel minimum yang dibutuhkan
pada berbagai nilai minimum koefisien regresi 1 β yang diharapkan untuk
dideteksi serta berbagai tingkat korelasi antara variabel X dan Y (tabel IV.1).
Tabel IV.1. Ukuran sampel minimum untuk uji F terhadap hipotesis
0H : 1ββββ = 0 pada model regresi linear iY = 0ββββ + 1ββββ iX + iεεεε *)
ρ 1 3 5 7 9
0.2 191 191 191 191 191
0.4 44 44 44 44 44
0.6 17 17 17 17 17
0.8 7 7 7 7 7
*) α = 0.05, (1 – β) = 0.80, dan SD (X) = 1
1 β
139
Ukuran Sampel untuk Model Korelasi
Pada uji hipotesis 0 : 0H ρ = vs 1 : 0H ρ > , misalkan besar korelasi
minimum yang diharapkan untuk dideteksi adalah R, sehingga untuk
perhitungan ukuran sampel minimum yang dibutuhkan, hipotesisnya dapat
dituliskan sebagai 0 0 : 0H ρ ρ= = dan A 1 :H Rρ ρ= = .
Transformasi koefisien korelasi sampel r berdistribusi normal
standar:
0.5z = In1
1
r
r
+
−
dengan standard error:
( )1
3SE z
n=
−
Misalkan c menyatakan titik kritis pada uji hipotesisis, dan
diasumsikan bahwa standard error kedua distribusi sampling menurut 0 H
dan A H adalah sama, maka dengan merujuk pada distribusi sampling 0 H
diperoleh:
c = 0 + Zα1
3n −
sedangkan dengam merujuk pada distribusi A H diperoleh:
c = 0.5 1
ln1
R
R
+
− − Z β
1
3n −
Selanjutnya: 0 + Zα1
3n − = 0.5
1ln
1
R
R
+
− − Z β
1
3n −
1
3n − =
10.5ln
1
R
R
Z Zα β
+
−+
dan diperoleh ukuran sampel minimum yang dibutuhkan untuk mendeteksi
korelasi minimum sebesar R:
n =
2
21
0.5 ln1
Z Z
R
R
α β +
+ −
+ 3
140
LAMPIRAN 4B: CONTOH ANALISIS REGRESI LINEAR
SEDERHANA DENGAN PROGAM KOMPUTER
Sebagai contoh, di bawah ini diperlihatkan keluaran tiga program
komputer, SPSS 12.0 for Windows, Minitab Realease 14, dan Stata/SE 8.0
for Windows untuk analisis data pada Latihan 4 Bagian Kedua (usia dan
tekanan darah sistolik), dengan analisis regresi linear sederhana.
SPSS 12.0 FOR WINDOWS
Regression Variables Entered/Removed(b)
Model
Variables Entered
Variables Removed
Method
1 USIA(a) . Enter
a All requested variables entered b Dependent Variable: TENSI
Model Summary
Model
R
R Square
Adjusted R Square
Std. Error of the Estimate
1 .349(a) .122 -.097 25.749
a Predictors: (Constant), USIA ANOVA(b)
Model
Sum of Squares
df
Mean Square
F
Sig.
1 Regression Residual Total
368.825 2652.009 3020.833
1 4 5
368.825 663.002
.556 .497(a)
a Predictors: (Constant), USIA b Dependent Variable: TENSI
Coefficient(a)
Model
Unstandardized Coefficients
Standardized Coefficients
t
Sig.
B Std. Error Beta
1 (Constant) USIA
92.897 .887
62.920 1.189
.349
1.476 .746
.214 .497
a Dependent Variable: TENSI
141
MINITAB RELEASE 14
-------------- 1/27/2005 6:11:45 PM -----------------------------------------
Welcome to Minitab, press F1 for help.
Regression Analysis: TENSI versus USIA
The regession equation is
TENSI = 92.9 + 0.89 USIA
Predictor Coef SE Coef T P
Constant 92.90 62.92 1.48 0.214
USIA 0.887 1.189 0.75 0.497
S = 25.7488 R-Sq = 12.2% R-Sq (adj) = 0.0%
Analysis of Variance
Source DF SS MS F P
Regression 1 368.8 368.8 0.56 0.497
Residual Error 4 2652.0 663.0
Total 5 3020.8
STATA/SE 8.0 FOR WINDOWS
. regress TENSI USIA
Source | SS df MS Number of obs = 6
---------|------------------------- F(1, 4) = 0.56
Model | 368.824802 1 368.824802 Prob>F = 0.4972
Residual | 2652.00852 4 663.002133 R-squared = 0.1221
---------|------------------------- Adj R-squared = -0.0974
Total | 3020.83333 5 604.166667 Root MSE = 25.749
142
------+-----------------------------------------------------
TENSI | Coef. Std.Err. t P>|t| [95%Conf.Interval]
------|-----------------------------------------------------
USIA | .8869534 1.189182 0.75 0.497 -2.414744 4.188651
_cons | 92.89726 62.91996 1.48 0.214 -81.79656 267.5911
------+-----------------------------------------------------
143
LATIHAN 4
Bagian Pertama
Pilihlah satu jawaban yang paling benar!
Untuk soal No. 1 s.d. 6:
Diketahui: 7X = 34Y = 8n =
2
400X =∑ 1,931XY =∑ 2
9,576Y =∑
1. ( )2
iX X− =∑
A. 8 C. 136
B. 27 D. 328
2. ( )2
iY Y− =∑
A. 8 C. 136
B. 27 D. 328
3. ( )2
iX X−∑ ( )
2
iY Y− =∑
A. 8 C. 136
B. 27 D. 328
4. Dengan pembagi ( )1 ,n − ( )Var X adalah:
A. 1.14 C. 19.43
B. 3.86 D. 46.26
5. Dengan pembagi ( )1 ,n − ( )Var Y adalah:
A. 1.14 C. 19.43
B. 3.86 D. 46.26
6. Koefisien korelasi r adalah:
A. 0.45 C. 0.61
B. 0.53 D. 0.72
144
7. Jika r menyatakan koefisien Pearson antara variabel X dan Y dan
diketahui r < 0, maka:
A. Untuk nilai X yang besar, nilai Y juga cenderung besar.
B. Untuk nilai X yang besar, nilai Y cenderung kecil.
C. Untuk nilai X yang kecil, nilai Y cenderung besar
D. B) dan C) benar.
8. Misalkan dimiliki himpunan data bivariat ( )2 2X Y− , . . . , ( )8 8
X Y−
dan r menyatakan koefisien korelasi X dengan Y. Jika gambaran
titik-titik data tersebut pada diagram tebar (scatter diagram)
membentuk titik-titik sudut segi delapan beraturan, maka:
A. r > 0 C. r < 0
B. r = 0 D. Semuanya salah.
9. Proporsi variansi yang dapat dijelaskan oleh suatun model regresi
dinamakan:
A. Koefisien korelasi C. Koefisien regresi
B. Koefisien determinasi D. Koefisien konkordansi
10. Misalkan dimiliki garis regresi 0 1
ˆi iY b b X= + , dan r menyatakan
koefisien korelasi X dengan Y:
A. Jika r = 0, maka 1 0b =
B. Jika r = −1, maka 1b = −1
C. Jika 1r = + , maka 1 1b = +
D. Yang benar lebih daripada satu.
11.
145
Kedua gambar di atas menunjukkan diagram tebar dan garis regresi 2
sampel data bivariat, masing-masing dengan estimasi garis regresi
1 1Y a b X= + dan koefisien korelasi 1r serta garis regresi 2 2Y a b X= +
dan koefisien korelasi 2r . Jika kedua diagram dibuat dengan skala
pengukuran yang sama, maka:
A. 1 2b b> dan 1 2r r> C. 1 2b b< dan 1 2r r>
B. 1 2b b> dan 1 2r r< D. 1 2b b< dan 1 2r r<
12. Misalkan dimiliki 2 himpunan data bivariat, masing-masing dengan
estimasi garis regresi 1 1Y a b X= + dan koefisien korelasi 1r serta
garis regresi 2 2Y a b X= + dan koefisien korelasi 2r . Jika diketahui
1 2 0b b> > , maka:
A. 1 0r > dan 2 0r > C. 1 2 0r r> >
B. 1 0r < dan 2 0r < D. 2 1 0r r> >
13. Dimiliki data bivariat dengan variabel independen X dan variabel
dependen Y serta estimasi garis regresi 0 1
ˆ .Y b b X= + Jika pada
diagram tebar ( );X Y seluruh titik-titik ( );i i
X Y terletak pada garis
regresi 0 1
ˆ ,Y b b X= + maka:
A. JKR = 0 C. JKR = JKG
B. JKR =1 D. JKR = JKT
14. Dari himpunan data bivariat (X ; Y) diketahui koefisien korelasinya
0r = , maka bagi model regresi 0 1i i iY b b X e= + + berlaku:
A. JKR = 0 C. JKR = JKG
B. JKR =1 D. JKR = JKT
15. Data bivariat dengan variabel independen X dan variabel dependen
Y menghasilkan estimasi garis regresi 0 1Y b b X= + dan koefisien
korelasi r. Jika diketahui bahwa uji hipotesis 0 1: 0H β =
menghasilkan statistik penguji 1t dan uji hipotesis 0 : 0H ρ =
menghasilkan statistik penguji 2t , maka:
A. 1 2t t< C. 1 2t t>
B. 1 2t t= D. Semuanya salah
146
16. Koefisien determinasi pada analisis regresi linear menyatakan:
A. Proporsi variansi variabel dependen yang dapat ‘dijelaskan’
oleh model regresi.
B. Proporsi variansi variabel dependen yang tidak dapat
‘dijelaskan’ oleh model regresi.
C. Proporsi variansi variabel independen yang dapat ‘dijelaskan’
oleh model regresi.
D. Proporsi variansi variabel independen yang tidak dapat
‘dijelaskan’ oleh model regresi.
17. Secara kuantitatif, besar koefisien determinasi adalah sama dengan:
A. Koefisien korelasi.
B. Kuadrat korefisien korelasi.
C. Akar (positif) koefisien korelasi.
D. Semuanya salah
18. Pada model regresi linear sederhana, nilai kuadrat rerata regresinya
(regression mean square):
A. Lebih besar daripada nilai jumlah kuadrat regresi (regression
sum of squares)
B. Sama dengan nilai jumlah kuadrat regresi.
C. Lebih kecil daripada nilai jumlah kuadrat regresi.
D. Semuanya mungkin benar.
Bagian Kedua
Pilihlah satu jawaban yang paling benar!
Dimiliki data usia (dalam tahun) dan tekanan darah sistolik (dalam
mm Hg) kelompok subjek yang terdiri dari enam orang dewasa sebagai
berikut:
Subjek (i) 1 2 3 4 5 6
Usia ( )iX 47 52 37 53 65 59
Tekanan darah ( )iY 135 110 140 120 150 180
1. Nilai harapan usia kelompok tersebut (dalam tahun) adalah:
A. 50.33 C. 55.28
B. 52.17 D. 57.12
147
2. Nilai harapan tekanan darah sistolik mereka (dalam mm Hg) adalah:
A. 122 C. 139
B. 128 D. 145
3. Jika garis regresi tekanan darah sistolik terhadap usia dinyatakan
sebagai 0 1Y Xβ β= + dengan variabel Y menyatakan tekanan darah
sistolik dan variabel X menyatakan usia subjek, maka estimasi 0β
adalah:
A. 0.887 C. 36.453
B. 12.757 D. 92.897
4. Estimasi 1β adalah:
A. 0.887 C. 36.453
B. 12.757 D. 92.897
5. Koefisien korelasi antara usia dengan tekanan darah sistolik subjek
adalah:
A. 0.122 C. 0.910
B. 0.349 D. 0.954
6. Jumlah kuadrat regresi adalah:
A. 368.82 C. 2,652.01
B. 663.00 D. 3,020.83
7. Jumlah kuadrat galat adalah:
A. 368.82 C. 2,652.01
B. 663.00 D. 3,020.83
8. Kuadrat rerata galat adalah:
A. 368.82 C. 2,652.01
B. 663.00 D. 3,020.83
9. Koefisien determinasi model regresi di atas adalah:
A. 0.122 C. 0.910
B. 0.349 D. 0.954
10. Untuk subjek berusia 50 tahun, nilai prediksi tekanan darah
sistoliknya (dalam mm Hg) adalah:
A. 112 C. 137
B. 125 D. 150
148
11. Estimasi standard error 1β ( )1ˆˆ[ ]SE β adalah:
A. /x
KRG S = 30.62 C. / xKRG S = 1.19
B. /xx
KRG S = 1.41 D. / xxKRG S = 0.05
12. Pada uji statistik terhadap hipotesis 0 1: 0H β = , diperoleh statistik
penguji sebesar:
A. 0.746ujit = C. Keduanya benar
B. 0.556ujiF = D. Keduanya salah
13. Dengan tingkat signifikansi α = 0.05, nilai kritis bagi uji hipotesis
pada soal No. 12 di atas adalah:
A. 2.776t = C. Keduanya benar.
B. 7.709F = D. Keduanya salah.
14. Pada uji hipotesis 0 : 0H ρ = , kesimpulan yang diperoleh ialah:
A. Pada tingkat signifikansi 0.05α = , 0H tidak ditolak
B. Pada tingkat signifikansi 0.05α = , 0H ditolak
C. Keduanya benar
D. Keduanya salah
Bagian Ketiga
Pilihlah satu jawaban yang paling benar!
Data berikut menyatakan nilai tes keterampilan (X) dan produktivitas
kerja per minggu (Y) 8 orang karyawan.
Siswa (i) 1 2 3 4 5 6 7 8
Tes keterampilan ( )iX 6 9 3 8 7 5 8 10
Produktivitas kerja ( )iY 30 49 18 42 39 25 41 52
149
1. Jika garis regresi produktivitas kerja terhadap nilai tes keterampilan
dinyatakan sebagai 0 1Y Xβ β= + dengan variabel Y menyatakan
produktivitas kerja dan variabel X menyatakan nilai tes keterampilan,
maka estimasi 0β adalah:
A. 0.982 C. 1.028
B. 0.991 D. 5.139
2. Estimasi 1β adalah:
A. 0.982 C. 1.028
B. 0.991 D. 5.139
3. Koefisien korelasi antara nilai tes masuk dengan nilai ujian akhir
siswa adalah:
A. 0.982 C. 1.028
B. 0.991 D. 5.139
4. Koefisien determinasi model regresi di atas adalah:
A. 0.982 C. 1.028
B. 0.991 D. 5.139
5. Nilai harapan produktivitas kerja jika nilai tes keterampilan = 8
adalah:
A. 41.00 C. 42.14
B. 41.50 D. 42.28
6. Jumlah kuadrat regresi (regression sum of squares) adalah:
A. 2.88 C. 950.69
B. 17.31 D. 968.00
7. Jumlah kuadrat galat (error sum of squares) adalah:
A. 2.88 C. 950.69
B. 17.31 D. 968.00
8. Kuadrat rerata galat (error mean squares) adalah:
A. 2.88 C. 950.69
B. 17.31 D. 968.00
150
9. Estimasi standard error1β ( )1
ˆˆ[ ]SE β adalah:
A. /x
KRG S = 0.48 C. / xKRG S = 0.28
B. /xx
KRG S = 0.08 D. / xxKRG S = 0.05
10. Pada uji statistik terhadap hipotesis 0 1: 0H β = , diperoleh statistik
penguji sebesar:
A. 18.16ujit = C. Keduanya benar
B. 329.61ujiF = D. Keduanya salah
11. Pada uji F, daerah kritis uji hipotesis 0 1: 0H β = adalah:
A. F > 5.99 untuk α = 0.05; F > 12.25 untuk α = 0.01
B. F > 5.99 untuk α = 0.05; F > 13.74 untuk α = 0.01
C. ` F > 234 untuk α = 0.05; F > 5,859 untuk α = 0.01
D. F > 237 untuk α = 0.05; F > 5,928 untuk α = 0.01
12. Berdasarkan nilai statistik penguji, tersebut maka pada uji F terhadap
0 1: 0H β = disimpulkan bahwa 0H :
A. Ditolak pada α = 0.01 dan pada α = 0.05
B. Ditolak pada α = 0.01; tidak ditolak pada α = 0.05
C. Tidak ditolak pada α = 0.01; ditolak pada α = 0.05
D. Tidak ditolak pada α = 0.01 dan pada α = 0.05
151
BAB 5
ANALISIS REGRESI LINEAR II
5.1. ANALISIS REGRESI LINEAR GANDA
� Model dan Estimasi Parameter
Bentuk umum dengan (p – 1) variabel independen (p menyatakan
jumlah koefisien regresi ) adalah:
iY = 0β + 1β 1iX + . . . + 1pβ − ( );1 ipX
− + iε (5.1)
Contoh 5.1:
Contoh model dengan 2 variabel independen yaitu:
iY = 0β + 1β 1iX + 2β 2iX + iε
Persamaan garis regresi-nya adalah:
ˆiY = 0β + 1β 1iX + 2β 2iX
iY : Tinggi badan anak
1iX : Tinggi badan ayah
2iX : Tinggi badan ibu
Estimasi koefisien regresi diperoleh dengan metode kuadrat kecil
(least square method; ordinary least square; OLS) dan perhitungannya
secara operasional dapat dilakukan dengan menggunakan:
1. Metode eliminasi
2. Aljabar matriks
3. Program statistika komputer
Catatan:
Dalam aljabar matriks diperhitungkan adanya p variabel independen,
yaitu dengan menggunakan variabel 0X yang nilainya selalu sama dengan 1,
sehingga model yang digunakan dapat dituliskan sebagai:
152
iY = 0β 0X + 1β 1iX + . . . + 1pβ − ( );1 ipX
− + iε
� Metode Kuadrat Terkecil (Least Square Method; Ordinary
Least Square / OLS)
a. Regresi linear sederhana
Misalkan dimiliki estimasi model dan garis regresi-nya:
iY = 0b + 1b iX + ie (5.2.a)
ˆiY = 0b + 1b iX (5.2.b)
Maka residual ie adalah:
ie = iY − ˆiY (5.3)
= iY − 0b − 1b iX
Misalkan: Q = 2ie∑ = ( )2
0 1 i iY b b X− −∑ (5.4)
minQ jika: 0
Q
b
∂
∂ = 0 dan
1
Q
b
∂
∂ = 0 (5.4.a)
0
Q
b
∂
∂ = 2 ( )( )0 1 1 i iY b b X− − −∑
= −2 ( )0 1 i iY b b X− −∑ = 0
n 0b + 1b iX∑ − iY∑ = 0 (I)
1
Q
b
∂
∂ = 2 ( )( )0 1 1 i i iY b b X X− − −∑
= −2 ( )( )0 1 i i iX Y b b X− −∑ = 0
0b iX∑ + 1b 2iX∑ − i iX Y∑ = 0 (II)
Persamaan I dan II disebut sebagai ‘persamaan normal’. Dengan
menyelesaikan persamaan normal I dan II:
n 0b + 1b iX∑ − iY∑ = 0 (I)
0b iX∑ + 1b 2iX∑ − i iX Y∑ = 0 (II)
diperoleh rumus 1b (dan 0b ).
153
b. Regresi linear ganda dengan 2 variabel independen (p = 3)
Misalkan dimiliki estimasi model dan garis regresi:
iY = 0b + 1b 1iX + 2b 2iX + ie (5.5.a)
ˆiY = 0b + 1b 1iX + 2b 2iX (5.5.b)
maka residual ie adalah:
ie = iY − ˆiY
= iY − 0b − 1b 1iX − 2b 2iX
Misalkan: Q = 2ie∑ = ( )2
0 1 1 2 2 i i iY b b X b X− − −∑ (5.6)
minQ jika: 0
Q
b
∂
∂ = 0 ,
1
Q
b
∂
∂ = 0 , dan
2
Q
b
∂
∂ = 0 (5.6.a)
0
Q
b
∂
∂ = 2 ( )( )0 1 1 2 2 1 i i iY b b X b X− − − −∑
= −2 ( )0 1 1 2 2 i i iY b b X b X− − −∑ = 0
n 0b + 1b 1iX∑ + 2b 2iX∑ − iY∑ = 0 (I)
1
Q
b
∂
∂ = 2 ( )( )0 1 1 2 2 1 i i i iY b b X b X X− − − −∑
= −2 ( )( )1 0 1 1 2 2 ii i iX Y b b X b X− − −∑ = 0
0b 1iX∑ + 1b 21iX∑ + 2b 1 2i iX X∑ − 1 iiX Y∑ = 0 (II)
2
Q
b
∂
∂ = 2 ( )( )0 1 1 2 2 2 i i i iY b b X b X X− − − −∑
= −2 ( )( )2 0 1 1 2 2 ii i iX Y b b X b X− − −∑ = 0
0b 2iX∑ + 1b 1 2i iX X∑ + 2b 22iX∑ − 2 iiX Y∑ = 0 (III)
Dengan menyelesaikan persamaan normal I, II, dan III (metode eliminasi):
n 0b + 1b 1iX∑ + 2b 2iX∑ − iY∑ = 0 (I)
0b 1iX∑ + 1b 21iX∑ + 2b 1 2i iX X∑ − 1 iiX Y∑ = 0 (II)
0b 2iX∑ + 1b 1 2i iX X∑ + 2b 22iX∑ − 2 iiX Y∑ = 0 (III)
diperoleh nilai-nilai 0b , 1b , dan 2b .
154
c. Regresi linear ganda dengan 3 variabel independen (p = 4)
Misalkan dimiliki estimasi model dan garis regresi:
iY = 0b + 1b 1iX + 2b 2iX + 3b 3iX + ie (5.7.a)
ˆiY = 0b + 1b 1iX + 2b 2iX + 3b 3iX (5.7.b)
Seperti cara di atas, dengan memisalkan Q = 2
ie∑ dan menyamakan
derivat parsial-nya terhadap 0b , 1b , 2b dan 3b masing-masing sama dengan
nol, diperoleh empat persamaan normal I, II, III, dan IV:
n 0b + 1b 1iX∑ + 2b 2iX∑ + 3b 3iX∑ − iY∑ = 0 (I)
0b 1iX∑ + 1b 21iX∑ + 2b 1 2i iX X∑ + 3b 1 3i iX X∑ − 1 iiX Y∑ = 0 (II)
0b 2iX∑ + 1b 1 2i iX X∑ + 2b 22iX∑ + 3b 2 3i iX X∑ − 2 iiX Y∑ = 0 (III)
0b 3iX∑ + 1b 1 3i iX X∑ + 2b 2 3i iX X∑ + 3b 23iX∑ − 3 iiX Y∑ = 0 (IV)
yang selanjutnya diselesaikan dengan metode eliminasi, sehingga
menghasilkan nilai-nilai 0b , 1b , 2b , dan 3b .
� Metode Eliminasi
Contoh 5.2:
Misalkan dimiliki data seperti pada tabel 5.1 berikut:
Tabel 5.1. Contoh data untuk peragaan metode eliminasi pada analisis
regresi linear ganda
i 1 2 3 4 5 6
iY
26 31 26 38 18 27
1iX
2 6 6 11 1 1
2iX
5 5 8 5 12 6
155
i 7 8 9 10 11 12
iY
26 26 32 25 40 26
1iX
4 6 4 4 10 2
2iX
7 9 4 8 5 3
n = 12 1iX∑ = 57
2iX∑ = 77
iY∑ = 341
21iX∑ = 387
22iX∑ = 563
1 2i iX X∑ = 347
1 iiX Y∑ = 1,797 2 iiX Y∑ = 2,083
Dengan menyelesaikan:
n 0b + 1b 1iX∑ + 2b 2iX∑ − iY∑ = 0 (I)
0b 1iX∑ + 1b 21iX∑ + 2b 1 2i iX X∑ − 1 iiX Y∑ = 0 (II)
0b 2iX∑ + 1b 1 2i iX X∑ + 2b 22iX∑ − 2 iiX Y∑ = 0 (III)
yaitu:
12 0b + 57 1b + 77 2b − 341 = 0 (I)
57 0b + 387 1b + 347 2b − 1,797 = 0 (II)
77 0b + 947 1b + 563 2b − 2,083 = 0 (III)
Diperoleh penyelesaian:
(I) ×19 ⇒
228 0b + 1,083 1b + 1,463 2b − 6,479 = 0
(II) × 4 ⇒
228 0b + 1,548 1b + 1,388 2b − 7,188 = 0
−465 1b + 75 2b + 709 = 0 (IV)
(I) ×77 ⇒
924 0b + 4,389 1b + 5,929 2b − 26,257 = 0
(III) × 12 ⇒
924 0b + 4,164 1b + 6,756 2b − 24,996 = 0
225 1b − 827 2b − 1,261 = 0 (V)
(IV) × −15 ⇒
6,975 1b − 1,125 2b − 10,635 = 0
(V) × 31 ⇒
6,975 1b −25,637 2b −39,091 = 0
24,512 2b +28,456 = 0
2b = −1.161
(V) ⇒
225 1b − (827)(−1.161) – 1.261 = 0
225 1b + 960.065 – 1.261 = 0
1b = 1.337
156
(I) ⇒ 12 0b + (57)(1.337) + (77)(−1.161) − 341 = 0
12 0b + 76.237 – 89.389 − 341 = 0
0b = 29.513
Estimasi persamaan garis regresi adalah:
ˆiY = 29.513 + 1.337 1iX − 1.161 2iX
Sebagai bahan perbandingan, pada bagan 5.1 diperlihatkan hasil
pengolahan data yang sama dengan progam komputer Minitab Release 14.
Bagan 5.1. Contoh keluaran program komputer untuk analisis regresi
linear ganda: estimasi koefisien regresi
Regression Analysis: Y versus X1, X2
The regression equation is
Y = 29.5 + 1.34 X1 - 1.16 X2
Predictor Coef SE Coef T P
Constant 29.513 2.112 13.97 0.000
X1 1.3375 0.1945 6.88 0.000
X2 -1.1609 0.2527 -4.59 0.001
S = 2.05089 R-Sq = 90.5% R-Sq (adj) = 88.3%
� Penguraian Jumlah Kuadrat dan Uji Hipotesis
A. Jumlah Kuadrat
1. Jumlah Kuadrat Total:
JKT = ( )
2
iY Y−∑
JKT =
( )2
2 ii
YY
n
∑−∑ ; db = n – 1 (5.8)
2. Jumlah Kuadrat Galat
JKG = ( )2 2ˆ
i i ie Y Y= −∑ ∑
JKG = 2
iY∑ − 0b iY∑ − 1b 1 iiX Y∑ − . . . − 1pb − ( )1 , ip i
X Y−∑ (5.9)
157
db = n – p
3. Jumlah Kuadrat Regresi:
JKR = JKT − JKG ; db = p – 1 (5.10)
B. Uji hipotesis
Untuk menguji hipotesis 0H : 1β = 2β = . . . = 1pβ − = 0 digunakan
uji F dengan statistik penguji:
ujiF = ( )( )
1JKR p
JKG n p
−
− (5.11)
yang berdistribusi F dengan db pembilang (p – 1) dan db penyebut (n – p).
Tabel 5.2 Tabel ANOVA untuk uji 0H : 1ββββ = 2ββββ = . . . = 1ββββ p- = 0
Sumber
variasi JK db KR ujiF
tabelF
Regresi JKR p − 1 KRR = 1
JKR
p − ujiF = KRR
KRG ( ) ( )1 , ;p n p
F α− −
Galat JKG n – p KRG =
JKG
n p−
Total JKT n − 1
Pengujian terhadap masing-masing koefisien regresi ( 0H : iβ = 0)
dapat dilakukan dengan uji Wald dengan statistik penguji:
ujit =
( )
ˆ
ˆˆ
j
jSE
β
β (5.12)
yang berdistribusi t dengan derajat bebas 1. Nilai-nilai
( )ˆˆjSE β umumnya
diperoleh dari keluaran program komputer (lihat contoh pada bagan 5.1).
Contoh 5.3:
Lihat kembali data pada contoh 5.2. Perhitungan jumlah kuadrat dan
kuadrat rerata-nya adalah:
158
JKT =
( )2
2
ii
YY
n
∑−∑
= 10,087 − 2
341
12 = 396.917
JKG = 2iY∑ − 0b i
Y∑ − 1b 1 iiX Y∑ − 2b 2 iiX Y∑
= 10,087 – (29.513)(341) – (1.337)(1,797) – (−1.161)(2,083)
= 37.885
JKR = JKT – JKG
= 396.917 – 37.885 = 359.061
dan: KRR = 1
JKR
p −
= 359.061
2 = 179.531
KRG = JKG
n p−
= 37.855
9 = 4.206
Tabel ANOVA-nya dan uji F untuk hipotesis 0H : 1β = 2β = 0
dengan tingkat signifikansi α = 0.05 diperlihatkan pada tabel 5.3.
Tabel 5.3 Tabel ANOVA untuk model regresi
iY = 29.513 + 1.337 1iX − 1.161 2iX + ie
Sumber
variasi JK db KR ujiF
tabelF
Regresi 359.061 2 179.531 ujiF = 179.531
4.206 ( )2,9;0.05
F =
4.26 Galat 37.855 9 4.206 = 42.68
Total 396.917 11
Sebagai perbandingan, pada bagan 5.2 diperlihatkan hasil pengolahan
data yang sama dengan progam komputer Minitab Release 14.
159
Bagan 5.2. Contoh keluaran program komputer untuk analisis regresi
linear ganda: tabel ANOVA
Regression Analysis: Y versus X1, X2
Analysis of Variance
Source DF SS MS F P
Regression 2 359.06 179.53 42.68 0.000
Residual Error 9 37.86 4.21
Total 11 396.92
Source DF Seq SS
X1 1 270.26
X2 1 88.80
� Koefisien Determinasi Ganda
Koefisien determinasi ganda menyatakan proporsi variansi Y yang
dapat dijelaskan oleh (p − 1) variabel independen secara bersama.
2R =
JKR
JKT =
JKT JKG
JKT
−= 1 −
JKG
JKT (5.13)
Contoh 5.4:
Lihat kembali data pada contoh 5.2. Pada contoh 5.3 telah dihitung
nilai-nilai jumlah kuadrat-nya:
JKR = 359.061 JKT =396.917
2R =
JKR
JKT
=
359.061
396.917 = 0.905
(pada keluaran program komputer di bagian akhir contoh 5.2, nilai koefisien
determinasi 2R adalah 90.5%)
160
5.2 VARIABEL INDIKATOR
� Pengertian Variabel Indikator
Variabel-variabel pada model regresi linear dalam pembahasan
terdahulu, baik variabel independen maupun dependen selalu berskala
kontinu ataupun sekurang-kurangnya numerik. Adakalanya harus digunakan
variabel independen ataupun dependen yang berskala kategorik, baik
dikotomi ataupun politomi. Inklusi variabel independen yang berskala
kategorik dalam model regresi linear harus dilakukan dalam bentuk variabel
indikator (variabel dummy), sedangkan jika variabel dependen yang berskala
kategorik dianjurkan untuk menggunakan model regresi logistik.
Nilai-nilai bagi variabel indikator hanya dinyatakan sebagai 0 atau 1,
walaupun kadang-kadang yang digunakan adalah nilai +1 dan −1.
� Variabel Indikator bagi Variabel Berskala Dikotomi
Misalkan jenis kelamin yang berskala dikotomi (pria dan wanita)
akan digunakan sebagai variabel independen dalam model regresi linear,
maka digunakan variabel indikator X dengan kriteria nilai:
X = 1 jika subjek berjenis kelamin pria,
X = 0 jika subjek berjenis kelamin wanita
� Variabel Indikator bagi Variabel Berskala Politomi
Variabel kategorik dengan r kategori direpresentasikan sebagai (r –
1) variabel indikator. Representasi variabel indikator untuk variabel
kategorik dengan tiga dan empat kategori diperlihatkan pada tabel 5.4.a dan
5.4.b.
Tabel 5.4. Variabel indikator untuk variabel kategorik
a. Dengan tiga kategori
Kategori Variabel indikator
1X 2X
I 0 0
II 1 0
III 1 1
161
b. Dengan empat kategori
Kategori Variabel indikator
1X 2X 3X
I 0 0 0
II 1 0 0
III 1 1 0
IV 1 1 1
Contoh 5.5:
Dimiliki data skala L (Lie; Kebohongan) MMPI-2, usia, jenis
kelamin, dan fakultas 8 orang mahasiswa Gunadarma seperti terlihat pada
tabel 5.5. Dari data tersebut hendak diestimasi model regresi linear dengan
skala L sebagai variabel dependen; serta usia, jenis kelamin, dan fakultas
sebagai variabel independen.
Tabel 5.5. Skala L MMPI-2 pada 8 orang mahasiswa Gunadarma, 2002
No. subjek Skala L Usia (th) Jenis kelamin Fakultas
1 6 19 Wanita Psikologi
2 2 18 Pria Teknik Industri
3 8 18 Wanita Ilmu Komputer
4 4 19 Pria Ilmu Komputer
5 3 21 Pria Ekonomi
6 5 21 Pria Ilmu Komputer
7 6 20 Pria Ilmu Komputer
8 6 19 Wanita Ilmu Komputer
Skala L dinyatakan sebagai variabel dependen Y; usia yang berskala
kontinu (dalam tahun) dinyatakan sebagai variabel independen pertama 1X ;
jenis kelamin yang berskala dikotomi dinyatakan sebagai variabel
independen kedua 2X dengan kriteria:
2X = 1 untuk mahasiswa pria
2X = 0 untuk mahasiswa wanita.
Fakultas yang terdiri atas 4 kategori dinyatakan dengan 3 varibel
indikator 3X , 4X , dan 5X dengan kriteria seperti terlihat pada tabel 5.6.
162
Tabel 5.6. Representasi fakultas mahasiswa Gunadarma dalam bentuk
variabel indikator
Fakultas Variabel indikator
3X 4X 5X
Ilmu Komputer 0 0 0
Ekonomi 1 0 0
Teknik Industri 1 1 0
Psikologi 1 1 1
Model regresi yang digunakan ialah:
iY = 0β + 1β 1iX + 2β 2iX + 3β 3iX + 4β 4iX + 5β 5iX + iε
Model diestimasi dari basis pada tabel 5.7 yang disusun sebagai representasi
untuk data pada tabel 5.5.
Tabel 5.7. Basis data skala L MMPI-2 8 orang mahasiswa Gunadarma,
2002
No. Y 1X 2X 3X 4X 5X
1 6 19 0 1 1 1
2 2 18 1 1 1 0
3 8 18 0 0 0 0
4 4 19 1 0 0 0
5 3 21 1 1 0 0
6 5 21 1 0 0 0
7 6 20 1 0 0 0
8 6 19 0 0 0 0
5.3 KOEFISIEN KORELASI GANDA DAN KOEFISIEN
KORELASI PARSIAL
� Koefisien Korelasi Ganda
Koefisien korelasi ganda menyatakan:
- Korelasi antara variabel dependen Y dengan himpunan (p – 1) variabel
independen secara bersama, yaitu Y dengan { 1X , 2X , . . . , 1pX − };
atau:
163
- Korelasi antara variabel independen Y dengan prediksi Y yang
dihasilkan oleh model regresi ganda dengan (p – 1) variabel
independen, yaitu Y dengan Y .
ˆYY
r = ( ) 1, 2, . . . , 1y p
r−
= ( )( )
( ) ( )22
ˆ ˆ
ˆ ˆ
i i
i i
Y Y Y Y
Y Y Y Y
− −∑
− −∑ ∑
(5.14.a)
atau: ˆYY
r =
( )
( ) ( )2
22 2
ˆˆ
ˆˆ
i i
i i
iii i
Y YYY
n
YYY Y
n n
∑ ∑−∑
∑∑ − −∑ ∑
(5.14.b)
Nilai kuadratnya sama dengan koefisien determinasi ganda:
( )2
ˆYYr =
( )( ) 1, 2, . . . , 1
2
y pr
− = 2R (5.15)
Contoh 5.6:
Lihat kembali data pada contoh 5.2 dan estimasi persamaan garis
regresinya ˆiY = 29.513 + 1.337 1iX − 1.161 2iX . Untuk menghitung koefisien
korelasi gandanya terlebih dahulu dihitung nilai-nilai prediksi ˆiY dengan
menggunakan persamaan garis regresi estimasi tersebut dan hasilnya
diperlihatkan pada tabel 5.8. serta diagram 5.1.
Tabel 5.8. Daftar nilai variabel dependen iY dan prediksinya untuk
contoh perhitungan koefisien korelasi ganda
i 1 2 3 4 5 6
iY 26 31 26 38 18 27
ˆiY 26.38 31.73 28.25 38.42 16.92 23.88
i 7 8 9 10 11 12
iY 26 26 32 25 40 26
ˆiY 26.74 27.09 30.22 25.58 37.08 28.70
164
Diagram 5.1. Diagram tebar variabel dependen Y dan nilai-nilai
prediksinya Y
Korelasi antara Y dan ˆiY dapat dihitung dengan menggunakan rumus
korelasi ataupun dengan regresi linear:
ˆYY
r = 0.9511
Koefisien determinasi ganda adalah:
2R = ( )2
ˆYYr
= 20.9511 = 0.905
Atau sebaliknya, koefisien korelasi ganda dapat dihitung sebagai akar positif
koefisien determinasi ganda. Pada contoh 5.4 telah dihitung nilai koefisien
determinasi ganda:
2R = 0.905
ˆYYr = 2R
165
= 0.905 = 0.9511
� Koefisien Korelasi Parsial
Koefisien korelasi parsial menyatakan korelasi antara variabel
dependen Y dengan salah satu variabel independen jX yang disesuaikan
dengan (memperhitungkan keberadaan satu atau lebih) variabel independen
lainnya:
Misalnya pada persamaan garis regresi:
ˆiY = 0β + 1β 1iX + 2β 2iX + 3β 3iX
1. Korelasi antara variabel dependen Y dan variabel independen 1X
dengan memperhitungkan pengaruh variabel independen 2X adalah:
12y
r =
( )( )1 2 12
2 22 12
.
1 1
y y
y
r r r
r r
−
− − (5.16.a)
1yr : Koefisien korelasi antara Y dan 1X
2yr : Koefisien korelasi antara Y dan 2X
12r : Koefisien korelasi antara 1X dan 2X
2. Korelasi antara variabel dependen Y dan variabel independen 1X
dengan memperhitungkan pengaruh variabel independen 3X adalah:
13y
r =
( )( )1 3 13
2 23 13
.
1 1
y y
y
r r r
r r
−
− − (5.16.b)
3. Korelasi antara variabel dependen Y dan variabel independen 1X
dengan memperhitungkan pengaruh variabel independen 2X dan 3X
secara bersama adalah:
123y
r =
( )( )3 212 13 2
2 2
3 2 13 2
.
1 1
yy
y
r r r
r r
−
− −
=
( )( )2 313 12 3
2 2
2 3 12 3
.
1 1
yy
y
r r r
r r
−
− −
(5.16.c)
1yr : Koefisien korelasi antara Y dan 1X
2yr : Koefisien korelasi antara Y dan 2X
12r : Koefisien korelasi antara 1X dan 2X
166
Contoh 5.7:
Misalkan dari persamaan regresi ˆiY = 0b + 1b 1iX + 2b 2iX + 3b 3iX
diketahui matriks korelasi Y, 1X , 2X , dan 3X :
Tabel 5.9. Contoh penyajian matriks korelasi Y, 1X , 2X , dan 3X untuk
perhitungan koefisien korelasi parsial
Y 1X 2X 3X
Y 1.00
1X 0.64 1.00
2X 0.51 0.27 1.00
3X 0.74 0.56 0.28 1.00
Maka:
12yr =
( )( )1 2 12
2 22 12
.
1 1
y y
y
r r r
r r
−
− − 13 2
r = ( )( )
13 12 23
2 212 23
.
1 1
r r r
r r
−
− −
=
( )( )
( )( )2 2
0.64 0.51 0.27
1 0.51 1 0.27
−
− −
=
( )( )
( )( )2 2
0.56 0.27 0.28
1 0.27 1 0.28
−
− −
= 0.61 = 0.52
13yr =
( )( )1 3 13
2 23 13
.
1 1
y y
y
r r r
r r
−
− − 3 2y
r = ( )( )
3 2 23
2 22 23
.
1 1
y y
y
r r r
r r
−
− −
=
( )( )
( )( )2 2
0.64 0.74 0.56
1 0.74 1 0.56
−
− −
=
( )( )
( )( )2 2
0.74 0.51 0.28
1 0.51 1 0.28
−
− −
= 0.40 = 0.72
123yr =
( )( )3 212 13 2
2 2
3 2 13 2
.
1 1
yy
y
r r r
r r
−
− −
=
( )( )
( )( )2 2
0.61 0.72 0.52
1 0.72 1 0.52
−
− −
= 0.39
167
LAMPIRAN 5A: MODEL REGRESI LOGISTIK
Dalam bab 5, subbab 5.2 telah dibahas mengenai penggunaan
variabel indikator untuk merepresentasikan variabel independen kategorik
dalam model regresi linear. Adakalanya dalam model regresi didapatkan juga
variabel dependen kategorik, baik yang berskala dikotomi ataupun politomi.
Dalam keadaan demikian, model regresi yang digunakan bukan lagi model
regresi linear sebagaimana yang telah dibahas dalam bab 4 dan 5, melainkan
model regresi logistik (model logit).
Model regresi logistik sederhana (simple logistic regression), dengan
satu variabel independen X dan variabel dependen Y berskala dikotomi
adalah:
logit ( )P Y = ln ( )
( )1
P Y
P Y
− = 0β + 1β X (5.17)
atau: ( )P Y = ( )0 1
1
1 exp Xβ β+ − + (5.17.a)
dengan ( )P Y menyatakan probabilitas bahwa variabel dependen Y bernilai
sama dengan satu.
Apabila variabel independen X lebih daripada satu, digunakan model
regresi logistik ganda (multiple logistic regression):
logit ( )P Y = ln ( )
( )1
P Y
P Y
− = 0β + 1β 1X + . . . + 1pβ − 1pX −
atau: ( )P Y = ( )0 1 1 1 1
1
1 exp ... p pX Xβ β β − −+ − + + + (5.18.a)
168
Jika variabel dependen Y berskala politomi, digunakan model regresi
politomi yang dibedakan atas:
- Model regresi logistik multinomial: digunakan jika variabel dependen Y
berskala politomi nominal.
- Model regresi logistik ordinal: digunakan jika variabel dependen Y
berskala politomi ordinal.
Untuk estimasi koefisien regresi pada model regresi logistik, yang
digunakan bukan metode kuadrat terkecil, melainkan metode likelihood
maksimum (maximum likelihood method), yaitu pencarian nilai parameter
yang jika dimasukkan dalam model akan memaksimumkan probabilitas
untuk memperoleh distribusi nilai sebagaimana yang ada dalam sampel.
Estimasi koefisien regresi dengan metode likelihood maksimum tak
dapat dilakukan dengan menggunakan rumus-rumus yang relatif sederhana
seperti pada estimasi koefisien model regresi linear dengan metode kuadrat
kecil. Di sini diperlukan proses iterasi yang cukup panjang menggunakan
program komputer.
Contoh V.I:
Dimiliki data nyeri kepala pada 218 orang mahasiswa Gunadarma
dengan variabel dependen NKTT (nyeri kepala ada / NKTT = 1; nyeri kepala
tidak ada / NKTT = 0). Sebagai variabel independen digunakan variabel
Usia (dalam tahun), Sex (jenis kelamin pria / Sex = 1; jenis kelamin wanita
/ Sex = 0), dan BMI (indeks massa tubuh; dalam kg/m2). Hasil pengolahan
data yang menggunakan model regresi logistik ganda dengan program Stata
8.0 diperlihatkan pada bagan V.1 di bawah ini.
169
Bagan V.I Contoh keluaran progam komputer untuk analisis regresi
logistik ganda dengan program komputer Stata 8.0
. logit NKTT Usia Sex BMI
Iteration 0: log likelihood = -151.09691
Iteration 1: log likelihood = -148.66589
Iteration 2: log likelihood = -148.66472
Logit estimates Number of obs = 218
LR chi2(3) = 4.86
Prob>chi2 = 0.1820
Log likelihood = -148.66472 Pseudo R2 = 0.0161
NKTT Coef. Std. Err. z P>|z| [95%Conf.Interval]
Usia 0.1399613 0.1132984 1.24 0.217 -0.0820994 0.3620219
Sex -0.3150595 0.3001361 -1.05 0.294 -0.9033155 0.2731965
BMI 0.0521261 0.0371095 1.40 0.160 -0.0206072 0.1248594
_cons -3.658059 2.386413 -1.53 0.125 -8.335342 1.019224
170
LATIHAN 5
Bagian Pertama
Pilihlah satu jawaban yang paling benar!
1. Estimasi koefisien regresi pada model regresi linear dilakukan
dengan:
A. Meminimumkan kuadrat jumlah residual
B. Meminimumkan jumlah kuadrat residual
C. Memaksimumkann kuadrat jumlah residual
D. Memaksimumkan jumlah kuadrat residual
2. Residual dalam diagram tebar menyatakan jarak dari titik tebar ke
garis regresinya, yang diukur sebagai:
A. Jarak dari titik tebar tegak lurus ke garis regresi.
B. Jarak dari titik tebar dalam arah vertikal ke garis regresi.
C. Jarak dari titik tebar dalam arah horizontal ke garis regresi.
D. Semuanya salah
3. Aplikasi metode kuadrat terkecil terhadap persamaan garis regresi
0 1 1 2 2ˆi i iY X Xβ β β= + + akan menghasilkan:
A. Dua persamaan normal
B. Tiga persamaan normal
C. Empat persamaan normal
D. Semuanya salah
4. Jumlah kuadrat total pada model regresi linear ganda adalah:
A. Kuadrat jumlah deviasi variabel dependen terhadap reratanya
B. Kuadrat jumlah deviasi variabel independen terhadap reratanya
C. Jumlah kuadrat deviasi variabel dependen terhadap reratanya
D. Jumlah kuadrat deviasi variabel independen terhadap reratanya
5. Jumlah kuadrat galat pada model regresi linear ganda adalah:
A. Kuadrat jumlah residual variabel dependen
B. Kuadrat jumlah residual variabel independen
C. Jumlah kuadrat residual variabel dependen
D. Jumlah kuadrat residual variabel independen
171
6. Untuk menguji hipotesis 0 1 2 1: ... 0pH β β β −= = = = pada model
regresi linear ganda digunakan:
A. Uji t C. Uji F
B. Uji Wald D. Semuanya benar
7. Pada model regresi 0 1 1 2 2 3 3i i i i iY X X X eβ β β β= + + + + dengan ukuran
sampel n = 25, derajat bebas untuk jumlah galat-nya adalah:
A. 3 C. 22
B. 21 D. 24
8. Proporsi variansi dependen pada model regresi linear ganda yang
dapat dijelaskan oleh seluruh variabel independen yang ada dalam
model secara bersama dinamakan:
A. Koefisien korelasi biserial C. Koefisien korelasi ganda
B. Koefisien korelasi parsial D. Korelasi determinasi ganda
9. Variabel kategorik yang direpresentasikan oleh empat variabel
indikator dalam suatu model regresi linear memiliki:
A. Tiga kategori C. Lima kategori
B. Empat kategori D. Semuanya salah
10. Korelasi antara variabel dependen pada model regresi linear ganda
dengan himpunan keseluruhan variabel independen yang ada dalam
model secara bersama dinamakan :
A. Koefisien korelasi biserial C. Koefisien korelasi ganda
B. Koefisien korelasi parsial D. Korelasi determinasi ganda
11. Nilai koefisien korelasi ganda sama dengan:
A. Akar positif koefisien determinasi ganda
B. Akar negatif koefisien determinasi ganda
C. Koefisien determinasi ganda
D. Kuadrat koefisien determinas ganda
12. Korelasi antara variabel dependen pada model regresi linear ganda
dengan salah satu variabel independen dengan memperhitungkan
keberadaan variabel independen lain dalam model dinamakan:
A. Koefisien korelasi biserial C. Koefisien korelasi ganda
B. Koefisien korelasi parsial D. Korelasi determinasi ganda
172
Bagian Kedua
Pilihlah satu jawaban yang paling benar!
Dimiliki data tentang kepuasan kerja pada sekelompok karyawan
universitas swasta di Jakarta yang akan diolah dengan model regresi linear
ganda. Variabel dependen yaitu kepuasan kerja (KEPUASAN) akan
diregresikan terhadap variabel independen pusat pengendalian (locus of
control; LOCUS), pola perilaku (pattern of behavior; POLA), dan
pemenuhan harapan penggajian (PHP). Data diolah dengan program SPSS
12.0, dan keluarannya diperlihatkan pada bagan-bagan di bawah ini.
Model Summary
Model
R
R Square
Adjusted R Square
Std. Error of the Estimate
1 .834(a) .696 .684 9.725
ANOVA(b)
Model
Sum of Squares
df
Mean Square
F
Sig.
1 Regression Residual Total
17298.096 7566.607 24864.702
3 80 83
5766.032 94.583
60.963 .000(a)
a Predictors: (Constant), PHP, POLA, LOCUS b Dependent Variable: KEPUASAN Coefficients(a)
Model
Unstandardized Coefficients
Standardized Coefficients
t
Sig.
B Std. Error Beta
1 (Constant) LOCUS POLA PHP
-21.340 1.052 1.909 1.430
14.297 .278 .416 .219
.284 .298 .493
-1.493 3.780 4.588 6.534
.139
.000
.000
.000
a Dependent Variable: KEPUASAN
173
1. Jumlah karyawan yang menjadi anggota sampel adalah:
A. 60 orang C. 84 orang
B. 80 orang D. 85 orang
2. Jika LOCUS = 0, POLA = 0, dan PHP = 0, maka nilai KEPUASAN
adalah:
A. -21.340 C. 1.909
B. 1.052 D. 1.430
3. Estimasi persamaan garis regresi adalah:
A. KEPUASAN = -21.340 + 1.052 LOCUS + 1.909 POLA + 1.430
PHP
B. KEPUASAN =14.297 + 0.278 LOCUS + 0.416 POLA + 0.219
PHP
C. KEPUASAN = -1.439 + 3.780 LOCUS + 4.588 POLA + 6.534
PHP
D. Semuanya salah
4. Kuadrat rerata galat adalah:
A. 94.583 C. 7,566.607
B. 5,766.032 D. 17,298.096
5. Derajat bebas jumlah kuadrat regresi adalah:
A. 3 C. 83
B. 80 D. Semuanya salah
6. Koefisien korelasi ganda adalah:
A. 0.684 C. 0.834
B. 0.696 D. Semuanya salah
7. Koefisien determinasi ganda adalah:
A. 0.684 C. 0.834
B. 0.696 D. Semuanya salah
8. Statistik penguji untuk uji hipotesis 0 1 2 3: 0H β β β= = = adalah:
A. 3.780 C. 6.534
B. 4.588 D. 60.963
9. Statistik penguji untuk uji hipotesis 0 2: 0H β = adalah:
A. 3.780 C. 6.534
B. 4.588 D. 60.963
174
10. Dengan tingkat signifikansi α = 0.01, maka kesimpulan bagi uji
hipotesis 0 1 2 3: 0H β β β= = = adalah:
A. 0H ditolak
B. 0H tidak ditolak
C. A) dan B) keduanya mungkin benar
D. Tak dapat dibuat kesimpulan
175
BAB 6
ANALISIS VARIANSI
Analisis variansi (analysis of variance; ANOVA) adalah metode
statistika untuk menganalisis hubungan antara:
� Variabel independen kategorik yang jumlah kategorinya lebih daripada
dua dengan:
� Variabel dependen numerik.
Ikhtisar analisis yang digunakan dalam Metode Statistika Parametrik
untuk mengkaji hubungan antara dua variabel dapat dilihat pada lampiran
6A.
Variabel independen kategorik pada ANOVA dinamakan ‘perlakuan’
(treatment; tritmen) dan masing-masing kategorinya disebut ‘taraf’
perlakuan. Berdasarkan jumlah variabel independennya (jumlah perlakuan),
dikenal analisis variansi 1-arah (one-way ANOVA), analisis variansi 2-arah
(two-way ANOVA), dan seterusnya.
6.1. ANALISIS VARIANSI 1-ARAH
Contoh 6.1:
Beberapa contoh analisis variansi 1-arah yaitu:
a. Misalkan dimiliki lima (k = 5) metode pengajaran dan sejumlah siswa,
maka terdapat lima populasi hipotetis, masing-masing terdiri atas siswa
yang diajar dengan satu metode pengajaran tertentu. Dengan ANOVA
hendak dibandingkan rerata nilai ujian kelima kelompok siswa.
b. Misalkan terdapat tiga (k = 3) kota, hendak dibandingkan rerata
penghasilan bulanan keluarga di tiga kota tersebut.
c. Misalkan dimiliki empat (k = 4) varietas padi, hendak dibandingkan
rerata produksi per ha sawah yang ditanami dengan empat varietas padi
tersebut.
176
� Variansi Dalam-Kelompok dan Variansi Antar-Kelompok
Misalkan dimiliki tiga kelompok data 1Y , 2Y , dan 3Y ,
ketiganya
berasal dari populasi normal dengan rerata 1µ , 2µ , dan 3µ
dan variansi yang
sama 2σ (diasumsikan
21σ =
22σ =
23σ =
2σ ). Misalkan pula hendak diuji
apakah ketiga kelompok data 1Y , 2Y , dan 3Y ‘dapat dianggap’ berasal dari
satu populasi yang sama atau berasal dari dua atau lebih populasi yang
berbeda.
Dalam konteks analisis variansi, variansi untuk masing-masing
kelompok data 1Y , 2Y , dan 3Y , yaitu 2σ disebut sebagai variansi ‘dalam
kelompok’ (within group), sedangkan variansi antar nilai-nilai rerata 1µ , 2µ ,
dan 3µ disebut sebagai variansi ‘antar kelompok’ (between groups).
Semakin ‘terpisah’ ketiga kelompok data 1Y , 2Y , dan 3Y , semakin
besar pula probabilitas bahwa ketiganya berasal dari populasi berbeda ( 0H :
1µ = 2µ = 3µ ditolak). Pada diagram 6.1 tampak bahwa ketiganya akan
‘terpisah’ jika:
- Variansi antar-kelompok lebih besar,
- Variansi dalam-kelompok lebih kecil;
atau dengan kata lain:
va riansi antar-kelompok
variansi dalam-kelompok lebih besar
177
Diagram 6.1. Tiga kelompok data yang dapat berasal dari satu populasi
yang sama atau dua/lebih populasi yang berbeda. Atas: ketiganya berasal dari populasi yang sama, variansi dalam-kelompok
yang besar dan atau variansi antar-kelompok yang kecil.
Bawah: ketiganya berasal dari populasi berbeda, variansi dalam kelompok
kecil dan /atau variansi antar kelompok besar.
Jika yang hendak diuji adalah hipotesis 0H : 1µ = 2µ = 3µ maka 0H
akan ditolak ( 1Y , 2Y , dan 3Y dianggap berasal dari populasi berbeda) jika
nilai va riansi antar-kelompok
variansi dalam-kelompok-nya melebihi nilai tertentu yang ada pada
tabel nilai distribusi sampling.
Pada pembahasan selanjutnya dalam analisis variansi, Y merupakan
satu variabel (variabel dependen) dengan subskrip 1, 2, dan 3 menyatakan
kelompok-kelompok (taraf-taraf perlakuan).
� Model dan Struktur Data
Struktur data pada analisis variansi 1-arah diperlihatkan pada matriks
6.1, yaitu struktur data yang digunakan untuk rancangan randomisasi lengkap
(completely randomized design).
178
Matriks 6.1. Struktur data pada analisis variansi 1-arah
Kategori
(taraf)
perlakuan
Kategori (taraf) perlakuan
Total 1 2 . . . k
Data
11y 21y 1ky
12y 22y 2ky
. . . . . . . . . . . .
11ny 22ny
kk ny
Jumlah
kolom 1y . 2y .
ky .
y. .
Ukuran
sampel 1n 2n . . . kn n
Rerata
sampel 1y 2y . . . ky y
Rerata
populasi 1µ 2µ . . . kµ µ
Variansi
sampel 21s 2
2s . . . 2ks 2
s
Model pada analisis variansi 1-arah (model dalam populasi) adalah:
ijY = µ + 1τ + ijε (6.1)
µ : rerata populasi
1τ : efek perlakuan ke-i
ijε : galat pada subjek ke-j dalam kelompok perlakuan ke-i
Estimasi diperoleh dari penguraian nilai observasi yang ada dalam
sampel:
ijy = y + ( iy − y ) + ( ijy − iy ) (6.2)
atau:
Nilai observasi = rerata utama + deviasi oleh perlakuan + galat
ijy : nilai observasi (pada subjek) ke-j dalam kelompok perlakuan ke-i
iy : nilai rerata observasi pada kelompok perlakuan ke-i
y : nilai rerata utama (grand mean)
179
� Penguraian dan Perhitungan Jumlah Kuadrat
Estimasi untuk model pada analisis variansi 1-arah dapat dituliskan
sebagai:
ijy − y = ( iy − y ) + ( ijy − iy )
Secara matematis dapat dibuktikan bahwa:
( )2
1 1
ik
iji j
n
y y= =
−∑∑ = ( )2
1
k
ii
y y=
−∑ + ( )2
1 1
ik
iji j
n
y yi
= =
−∑∑
JKT = JKP + JKG (6.3)
� Jumlah Kuadrat Total (JKT; total sum of squares; SSTo):
JKT = ( )2
1 1
ik
iji j
n
y y= =
−∑∑ = 2
1 1
ik
iji j
n
y= =∑∑ −
2
1 1
ik
iji j
n
y
n
= =
∑∑
JKT = 2
1 1
ik
iji j
n
y= =∑∑ −
( )
2y
n
. . ; db = n – 1 (6.4)
� Jumlah Kuadrat Perlakuan (JKP; treatment sum of squares; SSTr):
JKP = ( )2
1
k
ii
y y=
−∑ =
2
1
i
ijkj
i j
n
y
n
=
=
∑
∑ −
2
1 1
ik
iji j
n
y
n
= =
∑∑
JKP = ( )
2
1
ki
i i
y
n=∑ . −
( )
2y
n
. . ; db = k – 1 (6.5)
� Jumlah Kuadrat Galat (JKG, residual sum of squares; error sum of
squares; SSE):
JKG = ( )2
1 1
ik
iji j
n
y yi
= =
−∑∑ = JKT – JKP
JKG = JKT – JKP ; db = (n – 1) – (k – 1) (6.3.a)
db = n − k
180
� Kuadrat Rerata
Kuadrat rerata adalah jumlah kuadrat dibagi derajat bebasnya:
Kuadrat rerata (mean square) = jumlah kuadrat
derajat bebas
Kuadrat rerata pada analisis variansi merupakan estimator untuk
variansi:
- Kuadrat rerata perlakuan merupakan estimator bagi variansi antar-
kelompok (between-groups variance).
- Kuadrat rerata galat merupakan estimator bagi variansi dalam
kelompok (within-group variance).
� Kuadrat rerata perlakuan (KRP; treatment mean square; MSTr):
KRP = -1
JKP
k (6.6)
� Kuadrat rerata galat (KRG; error mean square; MSE):
KRG = -
JKG
n k (6.7)
Dengan asumsi 21σ =
22σ =
23σ =
2σ , maka KRG (MSE) merupakan
estimator bagi 2σ (seperti 2
pooleds yang juga menjadi estimator bagi 2σ pada
uji t dengan variansi sama 21σ =
22σ =
2σ ).
� Tabel ANOVA untuk Analisis Variansi 1-Arah
Hasil perhitungan nilai-nilai jumlah kuadrat, kuadrat rerata, dan
statistik penguji (beserta nilai titik kritis) biasanya disajikan dalam sebuah
tabel ANOVA, yang bentuk umumnya diperlihatkan pada tabel 6.1 di bawah
ini.
181
Tabel 6.1. Tabel ANOVA 1-arah
Sumber
variasi JK db KR ujiF
tabelF
Perlakuan JKP k − 1
KRP
= -1
JKP
k
ujiF
= KRP
KRG
( ) ( )1 ; ;k n kF
α− −
Galat JKG n – k
KRG
= -
JKG
n k
Total JKT n − 1
JK: jumlah kuadrat; KR: kuadrat rerata
� Langkah-langkah Uji Hipotesis
Langkah-langkah uji hipotesis pada ANOVA adalah sebagai berikut:
1. Jenis uji statistik: analisis variansi 1-arah.
2. Hipotesis: 0H : 1µ = 2µ = . . . = kµ (6.8.a)
1H : Tidak semua nilai rerata sama (6.8.b)
atau: iµ ≠ jµ untuk paling sedikit satu pasangan nilai (i; j)
3. Tingkat signifikansi: α = 0.01, 0.05, atau 0.10.
4. Daerah kritis: F > ( ) ( )1 ; ;k n kF
α− − (6.9)
5. Statistik penguji:
ujiF = KRP
KRG =
( )( )
1JKP k
JKG n k
−
− (6.10)
yang berdistribusi F dengan derajat bebas pembilang (k – 1) dan derajat
bebas penyebut (n – k).
5. Kesimpulan: 0H ditolak jika statistik uji terletak pada daerah kritis dan
0H tidak ditolak jika statistik uji tidak terletak pada daerah kritis.
� Hubungan Antara Analisis Regresi dan Analisis Variansi
Analisis regresi dan analisis variansi sesungguhnya merupakan dua
teknik analisis data yang identik, yang tergolong dalam ‘model linear’.
Perbedaannya terletak pada model yang digunakan untuk
Analisis regresi menekankan penyajian koefisien regresi serta hubungan
antara variabel independen dan variabel dependen, sedangkan analisis
variansi menekankan penyajian fa
jumlah kuadrat-jumlah kuadrat rerata, serta uji hipotesis (lihat diagram 6.2).
Diagram 6.2. Analisis regresi dan analisis variansi.
(a) Analisis regresi:
1µ = E (Y | 1X = 50), 2µ = E (
(b) Analisis variansi: Taraf perlakuan hanya dinyatakan sebagai kelompok
I, II, dan III.
Data yang sama akan memberikan hasil uji hipotesis (nilai
sama pula jika diolah baik dengan analisis regresi maupun analisis variansi.
Contoh 6.2:
Untuk membandingkan penghasilan tahunan keluarga (dalam jutaan
rupiah) di tiga kota A, B, dan C, diambil sampel acak masing
keluarga dari kota A, kota B, dan kota
berikut:
182
Perbedaannya terletak pada model yang digunakan untuk menjelaskan data.
Analisis regresi menekankan penyajian koefisien regresi serta hubungan
antara variabel independen dan variabel dependen, sedangkan analisis
variansi menekankan penyajian faktor-faktor eksperimental, penguraian
t rerata, serta uji hipotesis (lihat diagram 6.2).
Diagram 6.2. Analisis regresi dan analisis variansi.
(Y | 2X = 60), 3µ = E (Y | 3X = 70).
: Taraf perlakuan hanya dinyatakan sebagai kelompok
Data yang sama akan memberikan hasil uji hipotesis (nilai-p) yang
a diolah baik dengan analisis regresi maupun analisis variansi.
Untuk membandingkan penghasilan tahunan keluarga (dalam jutaan
, diambil sampel acak masing-masing empat
ota C. Hasil pengamatan adalah sebagai
183
Tabel 6.2. Data penghasilan tahunan keluarga di kota A, B, dan C
Perlakuan Total
1 2 3
19 16 13
18 11 16
21 13 18
18 14 11
iy . 76 54 58 188
2ij
j
y∑ 1,450 742 870 3,062
JKT = 2
1 1
ik
iji j
n
y= =∑∑ −
( )
2y
n
. .
= 2
19
1 +
218
1 + . . . +
216
1 + . . . +
211
1 −
2188
12
= 3,062 − 2
188
12 = 116.67
JKP = ( )
2
1
ki
i i
y
n=∑ .
− ( )
2y
n
. .
= 2
76
4 +
254
4 +
258
4 −
2188
12 = 68.67
JKG = JKT – JKP = 116.67 – 68.67 = 48
Uji hipotesis:
1. Jenis uji statistik: analisis variansi 1-arah
2. Hipotesis: 0H : 1µ = 2µ = 3µ
1H : Tidak semua nilai rerata sama
3. Tingkat signifikansi: α = 0.05.
4. Daerah kritis: F > 2; 9; 0.05F yaitu F > 4.26
5. Statistik penguji:
ujiF = KRP
KRG =
( )( )
1JKP k
JKG n k
−
−
184
yang berdistribusi F dengan derajat bebas pembilang (k – 1) = 3 – 1 = 2
dan derajat bebas penyebut (n – k) = 12 – 3 = 9.
Perhitungan: lihat tabel
Tabel 6.3. Tabel ANOVA untuk perbandingan penghasilan tahunan
keluarga di kota A, B, dan C
Sumber variasi JK db KR ujiF tabelF
Perlakuan 68.67 2 34.33 6.44 4.26
Galat 48 9 5.33
Total 116.67 11
6. Kesimpulan: 0H ditolak karena ujiF = 6.44 > tabelF = 4.26, sehingga
dapat disimpulkan bahwa pada tingkat signifikansi 0.05 terdapat
perbedaan yang bermakna secara statistik antara penghasilan tahunan
keluarga di tiga kota A, B dan C.
Catatan:
Pada keputusan untuk menolak 0H dengan ANOVA hanya dapat
disimpulkan bahwa tidak semua nilai rerata sama, namun untuk mengetahui
nilai rerata mana saja yang berbeda dengan yang lainnya, ataupun nilai rerata
mana yang lebih besar / lebih kecil, harus dilakukan analisis lebih lanjut,
yaitu dengan perbandingan ganda (multiple comparisons; lihat lampiran 6E).
6.2. ANALISIS VARIANSI 2-ARAH DENGAN INTERAKSI
Contoh 6.3:
Beberapa contoh analisis variansi 2-arah yaitu:
a. Misalkan dimiliki siswa pada tiga sekolah (r = 3) dan empat metode
pengajaran (c = 4) untuk diteliti. Hendak dibandingkan ketiga sekolah,
keempat metode pengajaran, dan dapat pula diteliti kemungkinan efek
interaksi antara sekolah dengan metode pengajaran.
b. Misalkan terdapat tiga kota (r = 3). Pekerja di ketiga kota tersebut
dibedakan menurut jenis kelaminnya (c = 2). Hendak dibandingkan
penghasilan rata-rata pekerja pria dan wanita, penghasilan rata-rata
pekerja di ketiga kota, dan kemungkinan efek interaksi antara kota
dengan jenis kelamin.
185
c. Misalkan dimiliki empat varietas padi (r = 4) dan tiga jenis pupuk (c =
3). Hendak dibandingkan produksi rata-rata per ha sawah yang
ditanami keempat varietas padi, menggunakan ketiga jenis pupuk, serta
kemungkinan interaksi varietas padi dengan jenis pupuk.
Nilai-nilai populasi untuk tiap sel (tiap subkelompok) menurut taraf-
taraf kedua perlakuan secara skematis diperlihatkan pada matriks 6.2 di
bawah ini.
Matriks 6.2. Nilai populasi untuk tiap sel menurut taraf-taraf perlakuan
pada analisis variansi 2-arah
Variabel
pertama
Variabel kedua
1 2 . . . c
1 11µ
12µ . . . 1cµ
1µ .
2 21µ
22µ . 2cµ
2µ .
. . . . . . . . . .
r 1rµ
2rµ . . . rcµ
rµ .
1µ .
2µ . . . . cµ . µ
ijµ :
Rerata bagi anggota populasi yang tergolong dalam taraf ke-i variabel
pertama dan taraf ke-j variabel kedua; i = 1, 2, . . . , r ; j = 1, 2, . . . , c
� Model dan Struktur Data:
� Pada model ini,didapatkan observasi lebih daripada satu per sel: k >1; k
= 1, 2, . . . , h
� Ada estimasi interaksi
� Umumnya digunakan untuk rancangan faktorial r × c (factorial design,
factorial experiment), yaitu dengan melakukan randomisasi terhadap
keseluruhan r × c sel sekaligus.
186
Matriks 6.3. Struktur data pada analisis variansi 2-arah dengan
rancangan faktorial
Variabel
pertama
Variabel kedua
1 2 . . . c
1 111y , 112y , . .
. , 11hy
121y , 122y , . .
. , 12hy . . .
1 1cy , 1 2cy , . .
. , 1 hcy
2 211y , 212y , . .
. , 21hy
221y , 222y , . .
. , 22hy .
2 1cy , 2 2cy , . .
. , 2 hcy
. . . . . . . . . . .
r 11ry , 12ry , . .
. , 1hry
21ry , 22ry , . .
. , 2hry . . .
1rcy , 2rcy , . .
. , hrcy
ijky : Nilai observasi ke-k pada sel (i; j); i = 1, 2, . . . , r ; j = 1, 2, . . . , c;
k = 1, 2, . . . , h
Model (dalam populasi):
ijkY = µ + iα +
jβ + ( )ij
αβ + ijkε (6.11)
Estimasinya (penguraian nilai observasi dalam sampel):
ijky = y + ( iy − y ) + ( jy − y ) + ( ijy − iy − jy + y ) + ( ijky − ijy )
(6.12)
atau: Nilai observasi = Rerata utama + Efek faktor A
+ Efek faktor B + Efek interaksi + Galat
� Penguraian dan Perhitungan Jumlah Kuadrat:
ijky − y = ( iy − y ) + ( jy − y ) + ( ijy − iy − jy + y )
+ ( ijky − ijy )
Secara matematis dapat dibuktikan bahwa:
( )2
ijki j k
y y−∑∑∑ = ( )2
ii
y y−∑ + ( )2
jj
y y−∑
+ ( )2
ij i ji j
y y y y− − +∑∑ + ( )2
ijijki j k
y y−∑∑∑
•
•
187
atau:
Jumlah Kuadrat Total = Jumlah Kuadrat A + Jumlah Kuadrat B
+ Jumlah Kuadrat Interaksi + Jumlah Kuadrat Galat
(6.13)
Didefinisikan:
1) ijT = ijkk
y∑ : Jumlah observasi pada sel (i; j) (6.14.a)
2) iy . =
1
c
ijj
T=∑ : Jumlah observasi baris ke-i variabel A (6.14.b)
3) jy . =
1
r
iji
T=∑ : Jumlah observasi kolom ke-j variabel B (6.14.c)
4)
y . . = 1 1
r c
iji j
T= =∑∑ : Jumlah semua observasi (6.14.d)
5) C = ( )
2y
rch
. . (6.14.e)
Matriks 6.4. Data jumlah nilai observasi pada tiap sel
A B
1 2 . . . c iy .
1 11T 12T . . . 1cT 1y .
2 21T 22T . . . 2cT 2y .
. . . . . . . . . . . . . . . .
r 1rT 2rT . . . rcT ry .
jy . 1y .
2y . . cy .
y . .
ijT : Jumlah (total) nilai observasi pada sel ke-(i; j); i = 1, 2, . . . , r ; j =
1, 2, . . . , c.
iy . : Jumlah nilai observasi taraf (baris) ke-i variabel A; i = 1, 2, . . . , r.
jy . : Jumlah nilai observasi taraf (kolom) ke-j variabel B; j = 1, 2, . . . , c.
188
Selanjutnya dapat dihitung:
1) Jumlah Kuadrat Total:
JKT = 2ijk
i j k
y∑∑∑ − C ; db = rch − 1 (6.15)
2) Jumlah Kuadrat A:
JKA = ( )
2
i
i
y
ch∑ .
− C
; db = r – 1 (6.16)
3) Jumlah Kuadrat B:
JKB = ( )
2
j
j
y
rh∑
. − C
; db = c – 1 (6.17)
4) Jumlah Kuadrat Sel:
JKA + JKB + JKAB =
2ij
i j
T
h∑∑ − C ; db = rc – 1 (6.18)
5) Jumlah Kuadrat Interaksi:
JKAB = JK Sel – JKA – JKB ; db = (r – 1)(c – 1) (6.19)
6) Jumlah Kuadrat Galat:
JKG = JKT – (JKA + JKB + JKAB)
JKG = JKT – JK Sel ; db = rc(h – 1) (6.13.a)
189
� Tabel ANOVA untuk Analisis Variansi 2-Arah Dengan Interaksi
Tabel 6.4. Tabel ANOVA 2-arah untuk model dengan interaksi
Sumber variasi JK db KR ujiF tabelF
A JKA r – 1 KRA = 1
JKA
r − AF =
KRA
KRG ( ) ( ) 1 ; 1 ;r rc h
Fα− −
B JKB c – 1 KRB = 1
JKB
c − BF =
KRB
KRG ( ) ( ) 1 ; 1 ;c rc h
Fα− −
Interaksi JKAB (r – 1)(c – 1) KRAB = ( ) ( )1 1
JKAB
r c− −
ABF = KRAB
KRG ( )( ) ( ) 1 1 ; 1 ;r c r c h
Fα− − −
Galat JKG rc(h – 1) KRG = ( )1
JKG
rc h −
Total JKT rch – 1
190
Contoh 6.4:
Misalkan terhadap 12 ekor tikus percobaan diberikan dua macam diet
(A1 dan A2) serta tiga macam stressor (B1, B2, dan B3), lalu diukur
pertambahan berat badannya (dalam gram) setelah lama periode tertentu.
Diperoleh data sebagai berikut:
Tabel 6.5. Data kenaikan berat badan tikus percobaan untuk variabel A
dan variabel B
Variabel A Variabel B
1 2 3
1 11, 19, 16 38, 12, 21 37, 53, 53
2 20, 11, 2 27, 20, 26 62, 59, 48
Hasil perhitungan awal untuk melakukan analisis variansi
diperlihatkan pada tabel 6.6.
Tabel 6.6 Tabel nilai ijT dan ∑ 2ijk
k
y untuk variabel A dan variabel B
Variabel A Variabel B
iy . 2ijk
j k
y∑∑ 2
ijj
T∑ 1 2 3
1 46;
738
71;
2,029
143;
6,987 260 9,754 27,606
2 33;
525
73;
1,805
169;
9,629 275 11,959 34,979
jy . 79 144 312 535
2ijk
i k
y∑∑ 1,263 3,834 16,616 21,713
2ij
i
T∑ 3,205 10,370 49,010 62,585
Hipotesis nol: AH : 1α =
2α = 0
BH : 1β =
2β = 3β = 0
ABH : ( )11
αβ = ( )12
αβ = ( )13
αβ = ( )21
αβ = ( )22
αβ =
( )23
αβ = 0
191
Perhitungan:
JKT = 211
1 +
219
1 + . . . +
248
1 −
2535
18
= 21,713 − 2535
18 = 5,811.61 (db = 17)
JKA = 2260
9 +
2275
9 −
2535
18 = 12.50 (db = 1)
JKB = 219
6 +
2144
6 +
2312
6 −
2535
18
= 4,818.78 (db = 2)
JK Sel = JKA + JKB + JKAB
=
246
3 +
233
3 + . . . +
2169
3 −
2535
18
= 4,960.28 (db = 5)
JKAB = 4,960.28 – (12.50 +4,818.78)
= 129 (db = 2)
JKG = JKT – JK Sel
= JKT – (JKA + JKB + JKAB)
= 5,811.61 – 4,960.28 = 851.33 (db = 12)
Tabel 6.7. Tabel ANOVA untuk variabel A dan variabel B
Sumber variasi JK db KR ujiF tabelF
(α = 0.05)
Baris (A) 12.50 1 12.50 0.18 4.75
Kolom (B) 4,818.78 2 2,409.39 33.96 3.89
Interaksi (AB) 129 2 64.50 0.91 3.89
Galat 851.33 12 70.94
Total 5,811.61 17
Sebagai kesimpulan, pada tingkat signifikansi α = 0.05:
- AH tidak ditolak
- BH ditolak
- ABH tidak ditolak
192
6.3. ANALISIS VARIANSI 2-ARAH TANPA INTERAKSI
� Model dan Struktur Data
� Pada model ini, hanya ada satu observasi untuk tiap sel: k = 1
� Tidak ada (tidak dapat dilakukan) estimasi interaksi.
� Umumnya digunakan untuk rancangan blok randomisasi lengkap
(completely randomized block design), yaitu dengan melakukan
randomisasi dalam tiap blok (intra-blok). Perhatikan bahwa dengan tidak
dilakukannya randomisasi antar-blok, penilaian terhadap efek blok tidak
memiliki validasi yang sama dengan penilaian terhadap efek perlakuan.
Matriks 6.5. Struktur data pada analisis variansi 2-arah dengan
rancangan blok randomisasi lengkap
Variabel pertama
(perlakuan)
Variabel kedua (blok)
1 2 . . . c
1 11y 12y . . . 1cy
2 21y 22y . 2cy
. . . . . . . . . . .
r 1ry 2ry . . . rcy
Model:
ijY = µ + iα +
jβ + ijε (6.20)
Estimasinya (penguraian nilai observasi) adalah:
ijy = y + ( iy − y ) + ( jy − y ) + ( ijy − iy − jy + y )
atau:
Nilai observasi = Rerata utama + Efek perlakuan + Efek blok + Galat
� Penguraian dan Perhitungan Jumlah Kuadrat
ijy − y = ( iy − y ) + ( jy − y ) + ( ijy − iy − jy + y )
Secara sistematis, dapat dibuktikan bahwa:
193
( )2
iji j
y y−∑∑ = ( )2
ii j
y y−∑∑ + ( )2
ji j
y y−∑∑
+ ( )2
ij i ji j
y y y y− − +∑∑
atau:
Jumlah Kuadrat Total = Jumlah Kuadrat A + Jumlah Kuadrat B
+ Jumlah Kuadrat Galat (6.22)
Didefinisikan:
1) iy . =
1ij
j
c
y=∑ : Jumlah observasi baris ke-i variabel A (6.23.a)
2) jy . =
1ij
i
r
y=∑ : Jumlah observasi kolom ke-j variabel B (6.23.b)
3)
y . . = 1 1
iji j
r c
y= =∑∑ : Jumlah semua observasi (6.23.c)
4) C = ( )
2y
rc
. . (6.23.d)
Diperoleh:
� Jumlah Kuadrat Total:
JKT = 2ij
i j
y∑∑ − C ; db = rc – 1 (6.24)
� Jumlah Kuadrat A:
JKA = ( )
2
i
i
y
c∑ − C ; db = r – 1 (6.25)
� Jumlah Kuadrat B:
JKB = ( )
2
j
j
y
r∑ − C ; db = c – 1 (6.26)
� Jumlah Kuadrat Galat:
JKG = JKAB = JKT – JKA – JKB ; db = (r – 1)(c – 1) (6.22.a)
194
� Tabel ANOVA untuk Analisis Variansi 2-Arah Tanpa Interaksi
Tabel 6.8. Tabel ANOVA 2-arah untuk model tanpa interaksi
Sumber
variasi JK db KR ujiF
tabelF
A JKA r – 1 KRA = 1
JKA
r − AF =
KRA
KRAB ( ) ( )( ) 1 ; 1 1 ;r r c
Fα− − −
B JKB c – 1 KRB = 1
JKB
c − BF =
KRB
KRAB ( ) ( )( ) 1 ; 1 1 ;c r c
Fα− − −
Galat JKAB (r – 1)(c – 1) KRAB = ( ) ( )1 1
JKAB
r c− −
Total JKT rc – 1
195
Contoh 6.5:
Misalkan terhadap residivis pengguna narkotika mantan penghuni
empat rumah tahanan (blok B1, B2, B3, dan B4) yang telah menjalani salah
satu di antara tiga program rehabilitasi (perlakuan A1, A2, atau A3),
dilakukan pengamatan untuk menentukan lamanya periode remisi (jumlah
hari mereka terbebas dari penggunaan ulang narkotika). Data hasil
pengamatan disajikan pada tabel 6.9 berikut.
Tabel 6.9. Data periode remisi pengguna narkotika untuk variabel A
(perlakuan) dan variabel B (blok)
Perlakuan
(A)
Blok (B) iy .
2ij
j
y∑ 1 2 3 4
1 35 24 28 21 108 3,026
2 19 14 14 13 60 922
3 21 16 21 14 72 1,334
jy . 75 54 63 48 240
2ij
i
y∑ 2,027 1,028 1,421 806 5,282
Hipotesis nol: AH : 1α =
2α = 3α = 0
BH : 1β =
2β = 3β =
4β = 0
Perhitungan:
JKT = 235
1 +
224
1 + . . . +
214
1 −
2240
12
= 5,282 − 2240
12 = 482 (db = 11)
JKA = 2108
4 +
260
4 +
272
4 −
2240
12
= 312 (db = 2)
JKB = 275
3 +
254
3 +
263
3 +
248
3 −
2240
12
= 138 (db = 3)
JKG = 482 – (312 + 138) = 32 (db = 6)
196
Tabel 6.10. Tabel ANOVA untuk data hipotetis variabel A dan variabel
B
Sumber variasi JK db KR ujiF tabelF (α = 0.05)
Perlakuan (A) 312 2 156 29.25 5.14
Blok (B) 138 3 46 8.625 4.76
Galat 32 6 5.33
Total 482 11
Kesimpulan yang diperoleh, yaitu pada tingkat signifikansi 5%
terdapat efek perlakuan maupun blok yang bermakna secara statistik
terhadap variabel dependen.
197
LAMPIRAN 6A: IKHTISAR METODE STATISTIKA PARAMETRIK UNTUK
ANALISIS HUBUNGAN ANTAR DUA VARIABEL
Analisis statistik yang lazim digunakan dalam Metode Statistika Parametrik untuk menguji hubungan antar dua
variabel (satu variabel independen dan satu variabel dependen ialah uji t / uji Z, analisis variansi, analisis regresi linear,
analisis regresi logistik, dan uji khi-kuadrat . Ikhtisar penggunaannya diperlihatkan pada matrik VI.1 di bawah ini.
Matriks VI.1. Ikhtisar metode statistika parametrik untuk analisis hubungan antar 1 variabel independen dengan
1 variabel dependen
Variabel independen
Variabel dependen
Numerik Kategorik
Dikotomi Politomi
Numerik Analisis Regresi
Linear
Analisis Regresi
Logistik
Analisis Regresi
Logistik Politomi
Kategorik Dikotomi Uji t / uji Z
Uji khi-kuadrat Politomi Analisis Variansi
Selain itu masih didapatkan berbagai analisis statistik lain yang relatif lebih jarang digunakan untuk menguji
hubungan antar 1 variabel independen dengan satu 1 variabel dependen, namun dalam keadaan tertentu mungkin saja
dijadikan pilihan utama untuk menganalisis data yang tersedia
198
LAMPIRAN 6B: ANALISIS VARIANSI MODEL
TETAP DAN MODEL ACAK
Dalam analisis variansi dikenal dua model, yaitu model tetap (fixed
model; model I) dan model acak (random model; model II). Pada model
tetap, taraf-taraf perlakuan yang diuji dalam analisis variansi mencakup
seluruh taraf yang mungkin ada, sedangkan pada model acak, taraf-taraf
yang diuji hanya merupakan sampel dari keseluruhan taraf yang ada dalam
populasi.
Contoh VI.1:
a. Sebuah pabrik memproduksi dan menjual makanan kaleng berisi
kaleng ikan tuna dalam bentuk empat kemasan, yang masing-masing
dinamakan kemasan I, II, III, dan IV. Untuk dapat meningkatkan
pemasaran, manajer peruasahaan melakukan riset pasar dengan
mengumpulkan data penjualan keempat bentuk kemasan dan
melakukan analisis variansi dengan hipotesis 0H : 1µ =
2µ = 3µ =
4µ ; iµ menyatakan rerata penjualan dengan kemasan ke-i per bulan di
masing-masing toko.
Analisis variansi di sini termasuk dalam model tetap (model I), karena
hanya ada empat kemasan di pabrik tersebut dan keempatnya diuji
dalam analisis.
b. Sebuah perusahaan hipermarket yang memiliki ratusan karyawan di
bagian pelayanan konsumen memilih lima orang di antaranya secara
acak, masing-masing untuk dinilai oleh sekelompok konsumen.
Hipotesis yang hendak diuji ialah 0H : 1µ =
2µ = 3µ =
4µ = 5µ ;
jµ
menyatakan rerata penilaian konsumen bagi karyawan ke-j.
Analisis variansi di sini termasuk dalam model acak (model II), karena
jumlah karyawan tidak hanya lima, melainkan ratusan dan kelima
orang tersebut dipilih secara acak dari populasi karyawan. Tujuan
penelitian sebenarnya adalah untuk menilai seberapa besar variasi
pelayanan yang diberikan oleh karyawan terhadap konsumen, karena
199
itu hasil yang diperoleh akan digeneralisasikan terhadap seluruh
populasi karyawan.
Pada ANOVA 2-arah, salah satu variabel independennya
(perlakuannya) mungkin tergolong dalam model I, dan variabel independen
lainnya tergolong dalam model II. Model ANOVA demikian dinamakan
model campuran (mixed model; model III).
Pada ANOVA 2-arah dengan interaksi, terdapat perbedaan statistik
penguji untuk ketiga model tersebut (lihat matriks VI.2). Seluruh
pembahasan mengenai ANOVA 2-arah dan contoh-contohnya pada bab 8
menggunakan model tetap.
Matriks IV.2. Statistik penguji untuk model tetap, model acak, dan
model campuran pada ANOVA 2-arah dengan interaksi
Faktor Model tetap
(A dan B tetap)
Model acak
(A dan B acak)
Model campuran
(A tetap, B acak)
A AF = KRA
KRG AF =
KRA
KRAB AF =
KRA
KRAB
B BF = KRB
KRG BF =
KRB
KRAB BF =
KRB
KRAB
AB ABF = KRAB
KRG ABF =
KRAB
KRG ABF =
KRAB
KRG
200
LAMPIRAN 6C: INTERAKSI PADA ANOVA DAN
MODEL REGRESI
Dalam bab 6, subbab 6.2 serta lampiran 6B telah dibahas beberapa
contoh serta uji hipotesis untuk interaksi pada ANOVA. Misalkan dimiliki 2
perlakuan A dan B, masing-masing dengan dua taraf perlakuan, 1A dan
2A
serta 1B dan
2B . Rerata variabel dependen Y untuk kombinasi taraf-taraf
perlakuan ini masing-masing adalah 11µ ,
12µ , 21µ dan
22µ (lihat tabel
VI.1).
Tabel VI.1 Rerata variabel dependen Y pada rancangan percobaan 2×2
1B
2B
1A 11µ
12µ
2A 21µ
22µ
Dengan model:
ijk
Y = µ + iα +
jβ + ( ) ij
αβ + ijk
ε (6.27)
maka: 11µ = µ +
1α + 1β + ( )
11αβ (6.28.a)
12µ = µ +
1α + 2β + ( )
12αβ (6.28.b)
21µ = µ +
2α + 1β + ( )
21αβ (6.28.c)
22µ = µ +
2α + 2β + ( )
22αβ (6.28.d)
Diagram VI.1 Rancangan percobaan 2×2
Kiri: Tanpa interaksi, 12µ −
11µ = 22µ −
21µ .
Kanan: Dengan interaksi, 12µ −
11µ ≠ 22µ −
21µ .
201
Dalam keadaan tanpa interaksi (diagram VI.1 kiri), maka:
12µ −
11µ = 22µ −
21µ (6.29)
Jika interaksi ada (diagram VI.1 kanan), maka:
12µ −
11µ ≠ 22µ −
21µ (6.30)
Interaksi juga dapat ditemukan pada model regresi, misalnya pada
model regresi linear dengan 2 variabel independen:
iY =
0β + 1β
1iX + 2β
2iX + iε (6.31.a)
jika terdapat interaksi antara variabel independen 1X dan
2X , model yang
digunakan adalah:
iY =
0β + 1β
1iX + 2β
2iX + 3β
1iX 2iX +
iε (6.31.b)
Uji hipotesis untuk suku interaksi 3β
1X 2X , yaitu uji terhadap
hipotesis 0H :
3β = 0 dapat dilakukan dengan uji Wald.
Contoh VI.2:
Misalkan dimiliki data hipotetis untuk penjualan biskuit merek
tertentu. Biskuit ini dibuat dalam 2 bentuk, bundar dan persegi, serta 2
warna, coklat dan kuning. Contoh data penjualan hipotetis untuk kombinasi
masing-masing bentuk dan warna, dengan dan tanpa interaksi diperlihatkan
pada tabel VI.2.
Tabel VI.2. Contoh data penjualan biskuit dengan 2 bentuk dan 2
warna*)
a. Tanpa interaksi b. Dengan interaksi
Coklat Kuning Coklat Kuning
Bundar 30 28 Bundar 32 22
Persegi 26 24 Persegi 24 30
*) dalam ribuan kotak
202
LAMPIRAN 6D: UKURAN SAMPEL MINIMUM
UNTUK UJI HIPOTESIS PADA ANALISIS
VARIANSI
Untuk menentukan ukuran sampel minimum yang dibutuhkan pada
uji hipotesis 0H :
1µ = 2µ = . . . =
kµ vs 1H :
iµ ≠ jµ untuk paling sedikit
satu pasangan nilai (i ; j) dengan uji F pada analisis variansi, dapat
digunakan pendekatan kekuatan uji minimum (minimum power for a given
decision rule), namun pendekatan ini memerlukan pembahasan mengenai
distribusi F non-sentral sebagai distribusi sampling menurut hipotesis
alternatif beserta tabelnya yang berada di luar ruang lingkup pembahasan
buku teks ini. Di sini hanya akan dibahas perhitungan ukuran sampel
minimum untuk analisis variansi dengan penggunaan kelompok kontrol
sebagai salah satu kelompok perbandingan.
Misalkan hendak dilakukan analisis variansi untuk membandingkan
rerata k kelompok perbandingan. Sampel berukuran minimum yang
dibutuhkan terdiri atas:
a. Satu kelompok kontrol (control group), dengan ukuran kelompok cn .
b. (k – 1) kelompok uji (test groups), masing-masing dengan ukuran
kelompok tn .
Ukuran sampel seluruhnya adalah:
n = (k – 1) tn +
cn (6.32)
Pada perbandingan rerata (ataupun proporsi) beberapa kelompok,
acapkali ada salah satu kelompok yang dijadikan sebagai kelompok kontrol
(kelompok pembanding), yang biasanya tidak diberi perlakuan apapun atau
diberi perlakuan dengan intensitas terendah. Kelompok-kelompok uji
berukuran sama besar, yaitu masing-masing berukuran tn , sedangkan ukuran
kelompok kontrol dapat sama besar ataupun lebih besar daripada ukuran satu
kelompok uji.
203
Perbandingan ukuran satu kelompok uji tn dengan ukuran kelompok
kontrol cn dinamakan ‘rasio alokasi uji-kontrol’ (test-control allocation
ratio):
λ =
t
c
n
n (6.33)
Pada bab 3, subbab 3.1 telah dibahas mengenai ukuran sampel
minimum yang dibutuhkan untuk mendeteksi perbedaan minimum sebesar d
= ( 1µ −
2µ ) pada uji hipotesis dua kelompok perbandingan 0H :
1µ − 2µ
1µ − 2µ < 0 vs
1H : 1µ −
2µ > 0, yaitu:
n = ( )
( )
2 2
2
1 2
2 Z Zα β σ
µ µ
+
−
Untuk k kelompok perbandingan dengan uji 2-sisi, ukuran kelompok
kontrol adalah:
cn =
( )
( )
2 2
2
1
c t
Z Zα β
λσ
λ
µ µ
++
−
(6.34)
cµ : rerata populasi kontrol
tµ : rerata populasi uji
d = ( )c tµ µ− : perbedaan minimum yang hendak dideteksi antara rerata
populasi kontrol dan populasi uji
Ukuran satu kelompok uji adalah:
tn = λ cn (6.33.a)
Untuk λ = 1 (alokasi uniform), maka:
204
cn =
( )( )
2 2
2
2
c t
Z Zα β σ
µ µ
+
−
(6.35)
dan: tn = cn (6.36)
Tampak bahwa rumus yang diperoleh serupa dengan rumus bab 3,
subbab 3.1 untuk dua kelompok perbandingan dengan kelompok kontrol
sebagai kelompok 1 dan kelompok uji sebagai kelompok 2.
Contoh VI.3:
Lihat kembali contoh 6.2 tentang perbandingan rerata penghasilan
tahunan keluarga di tiga kota A, B, dan C. Misalkan sebelum penelitian
dilaksanakan terlebih dahulu dilakukan perhitungan ukuran sampel minimum
untuk mendeteksi adanya perbedaan rerata penghasilan sekurang-kurangnya
6 juta rupiah dibandingkan dengan kota A sebagai kelompok kontrol dengan
tingkat signifikansi 5% dan kekuatan uji 80%. Dengan perhitungan dalam
jutaan rupiah, maka:
d = ( )c tµ µ− = 6
α = 0.05 2
Zα
= 1.96
1 – β = 0.80 Zβ = 0.84
Jika pada penelitian pendahuluan didapatkan estimasi standar deviasi
adalah 5 juta rupiah:
σ = 5
maka dengan rasio alokasi uji-kontrol λ = 1:
cn =
( )( )
22
2
2
1
c t
Z Zβα
λσ
λ
µ µ
++
−
205
=
( )2 2
2
1 11.96 0.84 5
1
6
+ +
= 10.90 ≈ 11
tn = λ cn = (1)(11) = 11
Ukuran sampel seluruhnya adalah:
n = (k – 1) tn + cn
= (2)(11) + 11 = 33
206
LAMPIRAN 6E: PERBANDINGAN GANDA
(MULTIPLE COMPARISONS)
Jika pada analisis variansi hipotesis 0H :
1µ = 2µ = . . . =
kµ
ditolak, maka langkah berikutnya ialah mencari kelompok mana saja di
antara k kelompok yang diperbandingkan yang berbeda dengan kelompok
lainnya. Metode pencarian kelompok-kelompok yang berbeda demikian
dinamakan ‘perbandingan ganda’ (multiple comparisons).
Dikenal berbagai metode dalam perbandingan ganda, antara lain
metode Tukey, metode Scheffé, metode Bonferroni, dan sebagainya. Di
sini hanya akan dibahas salah satu yang termudah di antara berbagai metode
tersebut, yaitu metode Bonferroni.
Misalkan h
L menyatakan selisih 2 nilai rerata yang diperbandingkan:
h
L = i jµ µ− (6.37)
maka interval konfidensi perbandingan ganda 100(1 – α)% untuk h
L ; h = 1,
2, . . . , m; dengan m menyatakan jumlah perbandingan, adalah:
ˆh
L − B . ( )
ˆh
s L < h
L <
ˆh
L + B . ( )
ˆh
s L (6.38)
dengan: B = ( ) ( ) ; 2n k m
tα−
(6.39)
k menyatakan jumlah taraf perlakuan (jumlah populasi yang
diperbandingkan).
Contoh VI.4:
Lihat data pada contoh 6.2. Akan dihitung interval konfidensi
perbandingan ganda (interval konfidensi simultan) 100(1 – α)% untuk
( )1 2µ µ− , ( )1 3µ µ− , dan ( )3 2µ µ− sekaligus.
Pada contoh 6.2, m = 3, h = 1, 2, 3; dan dengan memisalkan:
1L = ( )1 2µ µ−
2L = ( )1 3µ µ−
3L = ( )3 2µ µ−
maka interval konfidensi perbandingan ganda 95% untuk 1L ,
2L , dan 3L
adalah:
207
1L − B . ( )
1ˆs L <
1L < 1L + B . ( )
1ˆs L
2L − B . ( )
2ˆs L <
2L < 2L + B . ( )
2ˆs L
3L − B . ( )
3ˆs L <
3L < 3L + B . ( )
3ˆs L
k = 3 (k menyatakan jumlah taraf perlakuan / jumlah populasi yang
diperbandingkan)
n = 12
B = ( ) ( ) ; 2n k m
tα−
= ( ) ( )( ) 12 3 ; 0.05 2 3
t−
= ( ) 9; 0.0083
t = 2.93
1L = ( )1 2y y−
2L = ( )1 3y y−
3L = ( )3 2y y−
1y = 76
4 = 19 2y =
54
4 = 13.5 3y =
58
4 = 14.5
1L = 19 – 13.5 = 5.5
2L = 19 – 14.5 = 4.5
3L = 14.5 – 13.5 = 1
( )
ˆh
s L = s1 1
i jn n+ =
1 1
i j
KRGn n
+
karena: 2
s = KRG = JKG
n k−
in = jn = 4 dan KRG = 5.33, sehingga:
( )
ˆh
s L = 1 1
5.334 4
+
= 1.63
5.5 – (2.93) . (1.63) < 1L < 5.5 + (2.93) . (1.63)
4.5 – (2.93) . (1.63) < 2L < 4.5 + (2.93) . (1.63)
1 – (2.93) . (1.63) < 3L < 1 + (2.93) . (1.63)
yaitu: 0.71 < 1L < 10.29
−0.29 < 2L < 9.29
208
−3.79 < 3L < 5.79
Gambaran akhir di sini biasanya diberikan sebagai berikut:
2µ 3µ 1µ
Gambaran ini menyatakan bahwa:
a. Urutan nilai dari yang terkecil sampai dengan yang terbesar adalah: 2µ
− 3µ − 1µ .
b. 2µ tidak berbeda dengan 3µ , 3µ tidak berbeda dengan 1µ , tetapi 2µ
berbeda dengan 1µ .
209
LATIHAN 6
Bagian Pertama
Pilihlah satu jawaban yang paling benar!
1. Misalkan dimiliki data nilai ujian statistika tiga kelas A, B, dan C.
Apabila dilakukan 3 kali uji kesamaan 2 rerata dengan uji t (multiple
t-test;; A vs B, A vs C, dan B vs C), masing-masing dengan tingkat
signifikansi α = 0.05, maka probabilitas untuk sekurang-kurangnya
mendapatkan satu kali kesalahan tipe I adalah:
A. 0.05 C. 0.053
B. 3 × 0.05 D. 1 – 0.953
2. Untuk menguji hubungan antara variabel independen kategorik
dengan variabel dependen kontinu / numerik, metode statistika yang
dianjurkan penggunaannya adalah:
A. Analisis variansi C. Analisis regresi logistik.
B. Analisis regresi linear D. Uji khi-kuadrat Pearson.
3. Pada analisis variansi terhadap suatu himpunan data, akan diperoleh
kesimpulan yang mengarah pada adanya perbedaan nilai rerata
(mean) antar kelompok perlakuan, jika :
A. Variansi antar-kelompok dan variansi dalam-kelompok besar.
B. Variansi antar-kelompok dan variansi dalam-kelompok kecil.
C. Variansi antar-kelompok besar dan variansi dalam-kelompok
kecil.
D. Variansi antar-kelompok kecil dan variansi dalam-kelompok
besar.
4. Pada uji ANOVA, variansi dalam-kelompok (within-group)
diestimasi oleh:
A. Jumlah kuadrat perlakuan (treatment sum of squares).
B. Kuadrat rerata perlakuan (treatment mean square).
C. Jumlah kuadrat galat (error sum of squares).
D. Kuadrat rerata galat (error mean square).
Untuk soal No. 5 s.d. 10:
Sebuah pabrik benang mempunyai lima mesin pintal A, B, C, D, dan
E yang diharapkan dapat menghasilkan benang yang memiliki kekuatan
210
sama. Untuk memeriksanya, diambil sampel acak masing-masing 6 potong
benang dari hasil produksi tiap mesin. Pemeriksaan kekuatannya
menghasilkan data sebagai berikut:
Mesin
A B C D E
4.2 3.9 4.1 3.6 3.8
4.1 3.8 4.0 3.9 3.6
4.2 3.7 4.2 3.5 3.9
4.3 3.8 4.0 4.0 3.5
4.4 3.6 4.1 4.1 3.7
4.0 3.5 3.8 3.8 3.6
5. Hipotesis nol dan hipotesi alternatif analisis variansi ini dirumuskan
sebagai:
A. 0 1 2 3 4 5:H µ µ µ µ µ= = = =
0 1 2 3 4 5:H µ µ µ µ µ≠ ≠ ≠ ≠
B. 0 1 2 3 4 5:H µ µ µ µ µ= = = =
1 :H semua 1µ , i = 1, 2, 3, 4, 5, tidak sama
C. 0 1 2 3 4 5:H µ µ µ µ µ= = = =
1 :H tidak semua 1µ , i = 1, 2, 3, 4, 5, sama
D. 0 1 2 3 4 5: 0H µ µ µ µ µ= = = = =
1 :H tidak semua 1µ = 0, i = 1, 2, 3, 4, 5
6. JKT sama dengan:
A. 1.2444 C. 4.2144
B. 1.8470 D. 4.4124
7. JKG sama dengan:
A. 6.8 C. 0.68
B. 9.5 D. 0.95
8. Dengan α = 0.05, daerah kritis hipotesis ini adalah:
A. F > 4.34 C. F > 2.78
B. F > 4.22 D. F > 2.76
211
9. Nilai statistik penguji ujiF sama dengan:
A. 10.768 C. 18.213
B. 13.182 D. 31.281
10. Berdasarkan nilai statistik penguji, tersebut maka terhadap
0 1 2 3 4 5:H µ µ µ µ µ= = = = disimpulkan bahwa:
A. 0H tidak ditolak pada 0.01α =
B. 0H tidak ditolak pada 0.05α =
C. 0H ditolak pada 0.10α =
D. Semuanya salah.
Untuk soal No. 11 s.d. 15:
Ibu Leoni menyatakan pendapatnya bahwa siswa pada berbagai
tingkatan sekolah dan mahasiswa menghabiskan waktu sama banyaknya
untuk menonton acara TV. Untuk membuktikan pendapatnya ia mengambil
sampel acak beberapa siswa SMP, SMU, dan mahasiswa, serta menanyakan
berapa menit mereka menonton TV sejak pulang sekolah / kuliah sampai
dengan waktu tidur setiap hari. Diperoleh data berikut:
Siswa SMP Siswa SMU Mahasiswa
459 115 272
311 153 88
152 201 374
293 30 178
11. JKT (Jumlah Kuadrat Total; Total Sum of Squares) adalah:
A. 12,037.28 C. 108,335.5
B. 64,586.17 D. 172, 921.67
12. JKP (Jumlah Kuadrat Perlakuan; Treatment Sum of Squares) adalah:
A. 12,037.28 C. 108,335.5
B. 64,586.17 D. 172, 921.67
13. KRG ( Jumlah Kuadrat Galat; Error Mean Squares) adalah:
A. 12,037.28 C. 108,335.5
B. 64,586.17 D. 172, 921.67
212
14. Untuk uji hipotesis 0 1 2 3: ,H µ µ µ= = statistik pengujinya adalah:
A. 0.37 C. 1.68
B. 0.60 D. 2.69
15. Dengan tingkat signifikansi 0.05,α = diperoleh kesimpulan:
A. Terdapat perbedaan lama menonton TV antar siswa SMP,
SMU, dan mahasiswa yang bermakna.
B. Ditemukan perbedaan lama menonton TV antar siswa SMP,
SMU, dan mahasiswa yang bermakna secara statistik.
C. Tidak ditemukan perbedaan lama menonton TV antar siswa
SMP, SMU, dan mahasiswa yang bermakna secara statistik.
D. Semuanya salah.
Bagian Kedua
Pilihlah satu jawaban yang paling benar!
Dua macam pupuk ( P dan Q ) digunakan dalam kuantitas 1 kg dan 2
kg per petak. Dilakukan eksperimen faktorial 2×2 dengan empat observasi
replikasi dengan hasil sebagai berikut:
B: Dosis pemupukan
1 kg 2 kg
A: Jenis pupuk P 17, 16, 15, 18 13, 13, 14, 12
Q 21, 20, 19, 18 14, 16, 16, 14
Selanjutnya dilakukan analisis variansi dengan hipotesis:
1 2: 0A
H α α= =
1 2: 0B
H β β= =
( ) ( ) ( ) ( )11 12 21 22
: 0ABH αβ αβ αβ αβ= = = =
1. JKA sama dengan:
A. 2.5 C. 25
B. 6.4 D. 64
2. JKB sama dengan:
A. 2.5 C. 25
B. 6.4 D. 64
213
3. JKAB sama dengan:
A. 1 C. 3
B. 2.5 D. 6.4
4. JKG sama dengan:
A. 16 C. 25
B. 20 D. 64
5. KRA sama dengan:
A. 6.4 C. 20
B. 16 D. 25
6. KRB sama dengan:
A. 16 C. 25
B. 20 D. 64
7. KRAB sama dengan:
A. 0.3 C. 1.6
B. 1 D. 3
8. KRG sama dengan:
A. 1.333 C. 3.625
B. 2.673 D. 13.331
9. A
F sama dengan:
A. 1.875 C. 18.750
B. 7.815 D. 48.000
10. B
F sama dengan:
A. 4.800 C. 18.750
B. 7.815 D. 48.000
11. AB
F sama dengan:
A. 0.750 C. 2.673
B. 1.875 D. 7.815
214
12. Dengan tingkat signifikansi 5%α = disimpulkan:
A. A
H tidak ditolak
B. B
H ditolak
C. AB
H ditolak
D. Ketiga hipotesis semuanya ditolak
Bagian Ketiga
Pilihlah satu jawaban yang paling benar!
B: Pekerja
B1 B2 B3 B4
A: Tipe mesin
A1 44 46 34 43
A2 38 40 36 38
A3 47 52 44 46
Selanjutnya dilakukan analisis variansi dengan hipotesis:
1 2 3: 0A
H α α α= = =
1 2 3 4: 0B
H β β β β= = = =
1. Pada uji analisis variansi 2-arah (two-way ANOVA) terhadap data
dengan 1 pengamatan / observasi per sel, model statistik yang dapat
digunakan ialah:
A. ij i j ijy µ α β ε= + + +
B. ( )ij i j ijkijy µ α β αβ ε= + + + +
C. Keduanya dapat digunakan.
D. Keduanya tidak dapat digunakan.
2. JKA ( jumlah kuadrat A ) sama dengan:
A. 29.5 C. 173.17
B. 98 D. 300.67
3. JKB ( jumlah kuadrat B ) sama dengan:
A. 29.5 C. 173.17
B. 98 D. 300.67
215
4. JKG ( jumlah kuadrat galat)
A. 29.5 C. 173.17
B. 98 D. 300.67
5. KRA (kuadrat rerata A) sama dengan:
A. 4.92 C. 86.58
B. 32.67 D. 119.25
6. KRB (kuadrat rerata B) sama dengan:
A. 4.92 C. 86.58
B. 32.67 D. 119.25
7. KRG (kuadrat rerata galat) sama dengan:
A. 4.92 C. 86.58
B. 32.67 D. 119.25
8. A
F sama dengan:
A. 3.58 C. 17.61
B. 6.64 D. 32.29
9. B
F sama dengan:
A. 3.58 C. 17.61
B. 6.64 D. 32.29
10. Dengan tingkat signifikansi 5%α = disimpulkan:
A. A
H tidak ditolak C. Keduanya benar
B. B
H ditolak D. Keduanya salah
216
BAB 7
ANALISIS DATA KATEGORIK
7.1. PENYAJIAN DATA KATEGORIK
� Bentuk Umum Tabulasi Silang
Data kategorik disajikan dalam bentuk tabel r × c (tabulasi silang,
tabel kontijensi), dengan menyatakan jumlah baris (row) dan c menyatakan
jumlah kolom (column). Bentuk-bentuk umum penyajian data kategorik
diperlihatkan pada tabel 7.1 berikut:
Tabel 7.1. Beberapa bentuk umum tabulasi silang r x c
a. Tabel 1 × c (c > 2)
1O 2O . . . cO
iO : Observasi (frekuensi pengamatan) pada kategorik (kolom) ke-i;
i = 1, 2, . . . , c
b. Tabel 2 × 2
11O 12O
21O 22O
c. Tabel 2 × c (c > 2)
11O 12O . . . 1cO
21O 22O . . . 2cO
ijO : Observasi (frekuensi pengamatan) pada kategori (baris) ke-
i, kolom ke-j; i = 1, 2; j = 1, 2, . . . , c
217
d. Tabel r × c (r > 2 dan c > 2)
11O 12O . . . 1cO
21O 22O . . . 2cO
. . . . . . . . . . . .
1rO 2rO . . . rcO
ijO : Observasi (frekuensi pengamatan) pada baris ke-i, kolom
ke-j; i = 1, 2, . . . , r; j = 1, 2, . . . , c
Contoh 7.1:
- Misalkan diambil sampel acak 350 orang lulusan SMU (1 sampel),
dicatat jenis kelaminnya dan ditanyai keinginannya untuk melanjutkan
sekolah. Hasil yang diperoleh diperlihatkan pada tabel 2×2 di bawah
ini:
Tabel 7.2. Jenis kelamin dan keinginan melanjutkan pendidikan
Jenis kelamin Melanjutkan sekolah
Ingin Tidak Jumlah
Pria 163 80 243
Wanita 46 61 107
Jumlah 209 141 350
- Misalkan dimiliki data tentang kerutan wajah 2 kelompok subjek (2
sampel), perokok berat dan perokok ringan / bukan perokok, yang
disajikan dalam bentuk tabel 2×2:
Tabel 7.3. Intensitas merokok dan kerutan wajah (2 proporsi binomial)
a. Tabel frekuensi
Perokok Kerutan wajah
Nyata Tidak Jumlah
Berat 127 73 200
Ringan/tidak 59 141 200
218
b. Tabel proporsi
Perokok Kerutan wajah
Nyata Tidak Jumlah
Berat 0.635 0.365 1.000
Ringan/tidak 0.295 0.705 1.000
Keterangan: 1p = 0.635 ; 1q = 0.365 ;
2p = 0.295 ; 2q = 0.705 ;
- Misalkan dimiliki data tentang insomnia pada 3 kelompok usia wanita
(3 sampel; muda, dewasa, dan tua), yang disajikan dalam bentuk tabel
3×2:
Tabel 7.4. Insomnia pada berbagai kelompok usia wanita (3 proporsi
binomial)
Kelompok usia Insomnia
Ada Tidak ada Jumlah
18-34 th 19 41 60
35-54 th 23 37 60
55-74 th 33 27 60
Keterangan: 1p = 0.317 ; 1q = 0.683 ;
2p = 0.383 ; 2q = 0.617 ;
3p = 0.550 ; 3q = 0.450 ;
� Frekuensi Observasi dan Frekuensi Harapan
Frekuensi dalam sel-sel pada tabel 7.1 serta tabel-tabel frekuensi pada
contoh 7.1 di atas merupakan frekuensi pengamatan / observasi (observed),
yang dinyatakan dengan lambang O, dengan ijO menyatakan frekuensi
pengamatan pada baris ke-i dan kolom ke-j (sel ke-ij). Untuk tabel 2×2,
bentuk umumnya diperlihatkan pada tabel 7.5 berikut.
219
Tabel 7.5. Bentuk umum tabel 2×2 dengan frekuensi observasi (‘tabel
observasi’)
Variabel A Variabel B
B1 B2 Jumlah
A1 a = 11O b = 12O 1n = a + b
A2 c = 21O d = 22O 2n = c + d
Jumlah 1m = a + c
2m = b + d n
Jumlah baris ( 1n dan
2n ) serta jumlah kolom ( 1m dan
2m ) disebut
sebagai frekuensi ‘marginal’ (tepi). Untuk perhitungan statistik, masing-
masing jumlah baris dan kolom ini diasumsikan memiliki nilai tetap (fixed
margin).
Frekuensi harapan (expected) untuk tiap sel dinyatakan dengan E,
dengan ijE menyatakan frekuensi harapan pada baris ke-i dan kolom ke-j
(sel ke-ij), dihitung berdasarkan asumsi fixed margin dengan rumus:
ijE = i jn m
n (7.1)
Secara stokastik, frekuensi harapan pada tabel r×c menyatakan frekuensi
yang diharapkan akan terjadi jika variabel baris (variabel A ) tidak memiliki
asosiasi statistik dengan variabel kolom (variabel B). Untuk tabel 2×2 seperti
pada tabel 7.5, penyajiannya dalam bentuk frekuensi harapan serta rumus-
rumus perhitungannya adalah:
Tabel 7.6. Bentuk umum tabel 2×2 dengan frekuensi harapan (‘tabel
harapan’)
Variabel A Variabel B
B1 B2 Jumlah
A1 11E 12E 1n = 11E + 12E
A2 21E 22E 2n = 21E + 22E
Jumlah 1m = 11E + 21E 2m = 12E + 22E n
220
11E = 1 1n m
n 12E = 1 2n m
n )
21E = 2 1n m
n 22E = 2 2n m
n ) (7.1.a)
Perhatikan bahwa frekuensi marginal (jumlah baris dan jumlah
kolom) pada tabel harapan selalu bernilai sama dengan frekuensi marginal
pada tabel observasi.
Contoh 7.2:
Lihat kembali data tentang jenis kelamin dan keinginan melanjutkan
pendidikan pada contoh 7.1. Data pada tabel 7.2 adalah tabel observasi, dan
frekuensi harapan masing-masing sel adalah (lihat tabel 7.7):
11E = 1 1n m
n =
( )( )243 209
350 = 145.1
12E = 1 2n m
n =
( )( )243 141
350 = 97.91
21E = 2 1n m
n =
( ) ( )107 209
350 = 63.9
22E = 2 2n m
n =
( )( )107 141
350 = 43.1
Tabel 7.7. Tabel harapan untuk data jenis kelamin dan keinginan
melanjutkan pendidikan
Jenis kelamin Melanjutkan sekolah
Ingin Tidak Jumlah
Pria 145.1 97.9 243
Wanita 63.9 43.1 107
Jumlah 209 141 350
221
� Uji Hipotesis untuk Tabulasi Silang dengan Data
Kategorik
Uji statistik untuk data kategorik yang disajikan dalam bentuk
tabulasi silang umumnya dilakukan dengan membandingkan data frekuensi
pengamatan (observed; ijO ) dengan data frekuensi harapan (expected; ijE ).
Beberapa uji statistik untuk data kategorik tersebut yaitu:
1. Uji khi-kuadrat (chi-square) Pearson, digunakan untuk tabel r×c (r >
2; c > 2) dengan syarat tidak ada sel dengan frekuensi harapan ijE
bernilai kurang daripada 5. Uji khi-kuadrat Pearson dibedakan atas :
a. Uji homogenitas (uji perbandingan proporsi): digunakan bagi
data yang berasal dari 2 sampel atau lebih, untuk menguji
kesamaan (homogenitas) proporsi antar sampel.
b. Uji independensi: digunakan bagi data yang berasal 1 sampel,
untuk menguji ada tidaknya asosiasi statistik antar variabel baris
dengan variabel kolom.
2. Uji eksak Fisher: digunakan untuk tabel 2×2 jika ada sel dengan
frekuensi harapan ijE yang bernilai kurang daripada 5.
3. Uji kebaikan-suai (goodness of fit): digunakan untuk tabel 1×c, yaitu
untuk menguji apakah data sampel berasal dari (berdistribusi sesuai
dengan) suatu populasi tertentu, misalnya populasi normal
4. Uji McNemar: digunakan untuk data kategorik berpasangan yang
disajikan dalam bentuk tabel 2×2.
� Distribusi Khi-kuadrat
Kecuali uji eksak Fisher , seluruh uji hipotesis untuk data kategorik
yang disebutkan di atas menggunakan statistik penguji yang ber-distribusi
khi-kuadrat, yang cuplikan distribusinya diperlihatkan pada tabel 7.8 di
bawah ini (tabel lengkap nilai kritis distribusi khi-kuadrat dapat dilihat pada
Addendum D).
Bentuk distribusi khi-kuadrat berbeda-beda, tergantung pada derajat
bebasnya, namun seluruhnya bernilai positif (terletak di kanan sumbu
vertikal), sehingga seperti pada uji F, uji hipotesis dengan statistik penguji
yang berdistribusi khi-kuadrat selalu adalah uji 2-sisi, walaupun dengan
memperhatikan gambaran distribusinya, uji tersebut adalah uji 1-ekor (one-
tail test).
222
Tabel 7.8. Cuplikan tabel distribusi khi-kuadrat [P (2χ >
2
αχ )]
db α
0.100 0.050 0.025 0.010
1 2.71 3.84 5.02 6.63
2 4.61 5.99 7.38 0.21
. . . . .
. . . . .
. . . . .
9 14.7 16.9 19.0 21.7
10 16.0 18.3 20.5 23.2
. . . . .
. . . . .
. . . . .
19 27.2 30.1 32.9 36.2
20 28.4 31.4 34.2 37.6
. . . . .
. . . . .
. . . . .
29 39.1 42.6 45.7 49.6
30 40.3 43.8 47.0 50.9
40 51.8 55.8 59.3 63.7
50 63.2 67.5 71.4 76.2
60 74.4 79.1 83.3 88.4
223
7.2. UJI HOMOGENITAS
� Tabel 2×2
Misalkan dimiliki data kategorik yang paparannya disajikan dalam
bentuk umum tabel 2×2 berikut:
Tabel 7.9. Bentuk umum paparan data pada tabel 2×2
Variabel A Variabel B
B BC Jumlah
A a b 1n = a + b
AC c d 2n = c + d
Jumlah 1m = a + c 2m = b + d n
Uji homogenitas khi-kuadrat untuk tabel 2×2 memberikan hasil yang
sama dengan uji kesamaan 2 proporsi dengan pendekatan normal (uji Z),
masing-masing hipotesis:
0H : 1P = 2P vs 1H : 1P ≠ 2P (7.2)
dan: 1P = 1p = a
a b+ =
1
a
n ; 2P = 2p =
c
c d+ =
2
c
n
Perhatikan bahwa uji kesamaan 2 proporsi dengan uji Z hanya boleh
dilakukan untuk sampel berukuran besar ( 1n > 30 dan 2n > 30), sedangkan
uji homogenitas khi-kuadrat sendiri hanya boleh dilakukan jika tidak ada sel
dengan frekuensi harapan yang lebih kecil daripada 5.
Statistik penguji pada uji khi-kuadrat homogenitas adalah:
ujiW = 2ujiχ =
( )2
ij ij
i j ij
O E
E
−∑∑ (7.3)
yang berdistribusi khi-kuadrat dengan derajat bebas (r – 1)(c – 1). Untuk
tabel 2×2, derajat bebasnya adalah satu. Daerah kritis adalah:
W > ( )2
1;αχ (7.4)
ujiW = 2ujiχ bernilai sama dengan ( )
2
ujiZ ; ujiZ adalah statistik
penguji pada uji kesamaan 2 proporsi dengan uji Z. Khusus untuk tabel 2×2,
rumus 7.3 untuk statistik penguji di atas dapat dijabarkan menjadi:
224
ujiW = ( )
1
2
2 1 2
n ad bc
n n m m
− (7.5)
Jika 0H ditolak, disimpulkan bahwa ada perbedaan yang bermakna
secara statistik antara proporsi peristiwa B dalam kelompok A dengan
proporsi peristiwa B dalam kelompok AC; sedangkan jika 0H tidak ditolak,
disimpulkan bahwa tidak ada perbedaan yang bermakna secara statistik
antara proporsi peristiwa B dalam kelompok A dengan proporsi peristiwa B
dalam kelompok AC.
Contoh 7.3:
Anggota 2 sampel acak yang masing-masing terdiri atas 100 orang
pria dan 100 orang wanita ditanyai pendapatnya terhadap pernyataan:
‘Wanita mempunyai hak dan kewajiban yang sama dengan pria’. Diperoleh
jawaban sebagai berikut:
Tabel 7.10. Pendapat tentang hak dan kewajiban menurut reponden
wanita pria dan wanita
Jenis kelamin Sikap
Setuju Tidak setuju Jumlah
Pria 30 70 100
Wanita 45 55 100
Jumlah 75 125 200
Uji hipotesis:
1. Jenis uji statistik: uji khi-kuadrat (uji homogenitas).
2. Hipotesis: 0H : 1P = 2P
1H : 1P ≠ 2P
3. Tingkat signifikansi: α = 0.05.
4. Daerah kritis: W >
21; 05χ atau W > 3.84.
5. Statistik penguji:
ujiW = 2ujiχ =
( )
1
2
2 1 2
n ad bc
n n m m
−
225
=
( ) ( )( ) ( ) ( )
( )( )( )( )
2200 30 55 70 45
100 100 75 125
− = 4.80
yang berdistribusi 2χ dengan derajat bebas 1.
6. Kesimpulan: karena W > 3.84, 0H ditolak, sehingga pada tingkat
signifikansi 0.05 terdapat perbedaan yang bermakna secara statistik
antara pria dan wanita mengenai sikapnya terhadap hak dan kewajiban
pria dan wanita.
� Tabel r×2
Bentuk umum paparan data untuk tabel r×2 dapat disajikan
sebagaimana terlihat pada tabel 7.11 di bawah ini.
Tabel 7.11. Bentuk umum paparan data untuk tabel r×2
a. Tabel observasi
Variabel A Variabel B
B BC Jumlah
1A 1a = 11O
1b = 12O 1n
2A 2a = 21O
2b = 22O 2n
. . . . . . . . . . . .
rA ra = 1rO
rb = 2rO rn
Jumlah 1m 2m n
b. Tabel proporsi
Variabel A Variabel B
B BC Jumlah
1A 1p 1q 1
2A 2p 2q 1
. . . . . . . . . . . .
rA rp rq 1
Jumlah 1m 2m 1
226
Hipotesis yang diuji adalah:
0H : 1P = 2P = . . . = rP (7.6)
dengan: 1P = 1p = 1
1
a
n, 2P = 2p = 2
2
a
n, . . . , ˆ
rP = rp = r
r
a
n.
Frekuensi di atas merupakan frekuensi pengamatan (observed), sedangkan
untuk uji statistik harus dihitung pula frekuensi harapannya (expected)
dengan rumus:
ijE = i jn m
n
Statistik pengujinya adalah:
ujiW = 2ujiχ =
( )2
ij ij
i j ij
O E
E
−∑∑ (7.7)
yang berdistribusi khi- kuadrat dengan derajat bebas (r – 1)(c – 1) dan daerah
kritis:
W > ( )( )
2
1 1 ;r c αχ
− − (7.8)
Untuk tabel kontijensi dengan r > 2 dan/atau c > 2, rumus statistik
penguji ini tidak dapat dijabarkan lebih lanjut seperti pada rumus 7.5 untuk
tabel 2×2.
Contoh 7.4:
Untuk membandingkan proporsi perokok di antara berbagai tingkatan
jabatan akademik dosen di DKI Jakarta, dilakukan wawancara terhadap
sampel acak 50 orang guru besar, 70 lektor kepala, 100 lektor, dan 100
asisten ahli dengan hasil sebagai berikut ( ijO ):
227
Tabel 7.12. Kebiasaan merokok pada beberapa tingkatan jabatan
akademik
a. Tabel observasi
Jabatan akademik Kebiasaan merokok
Ya Tidak Jumlah
Guru besar 6 44 50
Lektor kepala 18 52 70
Lektor 26 74 100
Asisten ahli 35 65 100
Jumlah 85 235 320
b. Tabel harapan
Jabatan
akademik
Kebiasaan merokok
Ya Tidak Jumlah
Guru besar ( )( )50 85
320 = 13.28
( ) ( )50 235
320 = 36.72 50
Lektor
kepala
( )( )70 85
320 = 18.59
( )( )70 235
320 = 51.41 70
Lektor ( )( )100 85
320 = 26.56
( ) ( )100 235
320 = 73.44 100
Asisten ahli ( )( )100 85
320 = 26.56
( ) ( )100 235
320 = 73.44 100
Jumlah 85 235 320
Uji hipotesis:
1. Jenis uji statistik: uji khi-kuadrat (uji homogenitas).
2. Hipotesis: 0H : 1P = 2P = 3P = 4P
1H : iP ≠ jP untuk paling sedikit salah satu pasangan nilai
i, j.
3. Tingkat signifikansi: α = 0.05.
4. Daerah kritis: W >
23; 05χ , yaitu W > 7.815
5. Statistik penguji:
228
ujiW = 2ujiχ =
( )2
2
1 1
rij ij
i j ij
O E
E= =
−∑∑ =
= ( )26 13.28
13.28
− +
( )244 36.72
36.72
− +
( )218 18.59
18.59
− +
( )252 51.41
51.41
− +
( )226 26.56
26.56
− +
( ) 274 73.44
73.44
− +
( )235 26.56
26.56
− +
( )265 73.44
73.44
− = 9.127
yang berdistribusi 2χ dengan derajat bebas (r − 1)(c – 1) = (3)(1) = 3.
6. Kesimpulan: Karena W > 7.815, 0H ditolak, sehingga pada tingkat
signifikansi 0.05 terdapat perbedaan yang bermakna secara statistik
antara proporsi perokok pada keempat tingkatan jabatan akademik
dosen di DKI Jakarta.
� Tabel r×c
Bentuk umum paparan data untuk tabel r×c dapat diperlihatkan pada
tabel 7.13 di bawah ini.
Tabel 7.13. Bentuk umum paparan data untuk tabel r×c
Variabel A Variabel B
Jumlah 1B
2B . . . cB
1A 11O 12O . . . 1cO 1n
2A 21O 22O . . . 2cO 2n
. . . . . . . . . . . . . . . . . .
rA 1rO 2rO . . . rcO rn
Jumlah 1m 2m . . . cm n
Contoh 7.5:
Dari empat jurusan pada Akademi KLM diambil sampel acak yang
terdiri atas 100 orang mahasiswa untuk tiap jurusan. Tiap mahasiswa
ditanyai pendapatnya terhadap pernyataan “Aplikasi komputer sangat perlu
229
dipelajari oleh semua mahasiswa akademi ini”. Pendapat mahasiswa
diklasifikasikan berupa: Setuju, netral, dan tidak setuju.
Hasil pengumpulan pendapat mahasiswa tersebut disajikan pada tabel
7.14.a, sedangkan frekuensi harapannya pada tabel 7.14.b dihitung dengan
menggunakan rumus ijE = i jn m
n.
Tabel 7.14. Pendapat mahasiswa mengenai keperluan untuk
mempelajari aplikasi komputer
a. Tabel observasi
Jurusan Pendapat
Jumlah Setuju Netral Tidak setuju
A 47 18 35 100
B 60 12 28 100
C 68 11 21 100
D 73 7 20 100
Jumlah 248 48 104 100
b. Tabel harapan
Jurusan Pendapat
Jumlah Setuju Netral Tidak setuju
A 62 12 26 100
B 62 12 26 100
C 62 12 26 100
D 62 12 26 100
Jumlah 248 48 104 100
Uji hipotesis:
1. Jenis uji statistik: Uji khi-kuadrat (uji homogenitas).
2. Hipotesis: 0H : 1iP = 1P ; 2iP = 2P ; . . . ; i = 1, 2, . . . , r
1H : 0H tidak benar
3. Tingkat signifikansi: α = 0.05.
4. Daerah kritis: W > ( )
2
6; 0.05χ , yaitu W > 12.592.
5. Statistik penguji:
230
ujiW = 2ujiχ =
( )2
1 1
r cij ij
i j ij
O E
E= =
−∑∑ =
= ( )247 62
62
− +
( )218 12
12
− +
( )235 26
26
− + . . . +
( )27 12
12
− +
( )220 26
26
− = 17.01
yang berdistribusi 2χ dengan derajat bebas (r – 1)(c – 1) = (3)(2) = 6.
6. Kesimpulan: Karena W > 12.592, 0H ditolak, sehingga pada tingkat
signifikansi 0.05 terdapat perbedaan yang bermakna secara statistik
antara distribusi pendapat terhadap pernyataan “Aplikasi komputer
sangat perlu dipelajari oleh semua mahasiswa akademi ini” di keempat
jurusan akademi KLM.
231
7.3. UJI INDEPENDENSI
� Tabel 2×2
Pada uji indepedensi yang hendak diuji ialah apakah peristiwa A dan
B merupakan kejadian yang saling berkaitan (dependen) / memiliki asosiasi
dengan hipotesis:
0H : ( )P A B = ( )CP A B = ( )P A ) (7.9.a)
atau: 0H : ( )P B A = ( )CP B A = ( )P B ) (7.9.b)
atau: 0H : ( )P A B∩ = ( )P A ( )P B ) (7.9.c)
Jika 0H ditolak, disimpulkan bahwa ada asosiasi yang bermakna
secara statistik antara peristiwa A dengan peristiwa B, sedangkan jika 0H
tidak ditolak, disimpulkan bahwa tidak ada asosiasi yang bermakna secara
statistik antara peristiwa A dengan peristiwa B..
Statistik penguji dan daerah kritis untuk uji indepedensi sama seperti
pada uji homogenitas.
Contoh 7.6:
Pemeriksaan untuk penyakit gula (diabetes mellitus; DM) dan
jantung koroner (PJK) terhadap sampel acak 200 orang pria berusia 50-65
tahun memberikan hasil sebagai berikut:
Tabel 7.15. Diabetes mellitus dan penyakit jantung koroner pada pria
usia lanjut
DM PJK
Ada: B Tidak ada: BC Jumlah
Ada: A 16 20 36
Tidak ada: AC 32 132 164
Jumlah 48 152 200
232
Uji hipotesis:
1. Jenis uji statistik: uji khi-kuadrat (uji independensi).
2. Hipotesis: 0H : A dan B independen, yaitu:
0H : ( )P A B = ( )CP A B = ( )P A
atau: 0H : ( )P B A = ( )CP B A = ( )P B
atau: 0H : ( )P A B∩ = ( )P A ( )P B
1H : 0H tidak benar, atau A dan B tidak independen.
3. Tingkat signifikansi: α = 0.05.
4. Daerah kritis: W > ( )
2
1; 0.05χ atau W > 3.84.
5. Statistik penguji:
ujiW = 2ujiχ =
( )
1
2
2 1 2
n ad bc
n n m m
−
=
( ) ( ) ( ) ( )( )
( )( )( )( )
2200 16 132 20 32
36 164 48 152
− = 10.06
yang berdistribusi 2χ dengan derajat bebas 1.
5. Kesimpulan: Karena W > 3.84, 0H ditolak, sehingga pada tingkat
signifikansi 0.05 terdapat asosiasi yang bermakna secara statistik antara
kejadian DM dan PJK pada kelompok pria berusia 50-65 tahun.
� Tabel r×c
Bentuk hipotesis yang diuji di sini sama seperti untuk tabel 2×2,
yaitu:
0H : ( )P A B = ( )CP A B = ( )P A ) (7.10.a)
atau: 0H : ( )P B A = ( )CP B A = ( )P B ) (7.10.b)
atau: 0H : ( )P A B∩ = ( )P A ( )P B ) (7.10.c)
233
sedangkan statistik penguji dan daerah kritisnya sama seperti pada uji
homogenetis untuk tabel r×c.
Contoh 7.7:
Sampel acak yang terdiri atas 1,000 orang responden diklasifikasi-
silangkan menurut kebiasaan merokok (berat, sedang, tidak merokok) dan
tinggi badan (tinggi, sedang, pendek). Frekuensi pengamatan beserta
frekuensi harapannya (dalam kurung) adalah sebagai berikut:
Tabel 7.16. Tinggi badan dan kebiasaan merokok
Kebiasaan
merokok
Tinggi badan Jumlah
Tinggi Sedang Pendek
Berat 102 (127) 290 (282) 132 (114) 524
Sedang 102 (85) 182 (188) 64 (76) 348
Tidak merokok 39 (31) 67 (69) 22 (28) 128
Jumlah 243 539 218 1000
Keterangan: Angka-angka dalam kurung menyatakan frekuensi
harapan.
Uji hipotesis:
1. Jenis uji statistik: uji khi-kuadrat (uji indepedensi).
2. Hipotesis: 0H : Kebiasaan merokok dan tinggi badan independen.
1H : 0H tidak benar.
3. Tingkat signifikansi: α = 0.01.
4. Daerah kritis: W > ( )
2
4; 0.01χ yaitu W > 13.277.
5. Statistik penguji:
ujiW = 2ujiχ =
( )2
1 1
3 3ij ij
i j ij
O E
E= =
−∑∑
= ( )2102 127
127
− +
( )2290 282
282
− +
( )2132 114
114
− + . . . +
234
( )267 69
69
− +
( )222 28
28
− = 16.93
yang berdistribusi
2χ dengan derajat bebas (r – 1)(c – 1) = (2)(2) = 4.
6. Kesimpulan: Karena W > 13.277, 0H ditolak, sehingga pada tingkat
signifikansi 0.01 terdapat asosiasi yang bermakna secara statistik antara
kebiasaan merokok dan tinggi badan.
235
LAMPIRAN 7A: UKURAN ASOSIASI PADA
TABEL KONTIJENSI
Dalam pembahasan terdahulu telah ditunjukkan bahwa keeratan
hubungan antara dua variabel yang berskala kontinu / numerik dapat diukur
dengan koefisien korelasi Pearson. Untuk dua variabel berskala kategorik
yang datanya disajikan dalam bentuk tabel kontijensi, terdapat berbagai
ukuran untuk menyatakan keeratan hubungan antara kedua variabel tersebut,
namun tidak ada satupun di antaranya yang diterima sebagai ukuran tunggal
asosiasi terbaik, walaupun ada satu atau beberapa di antaranya yang lebih
banyak digunakan daripada yang lain. Di sini hanya akan dibahas beberapa
ukuran asosiasi (measures of association; ukuran ketergantungan; measures
of dependence), terutama untuk kontijensi 2×2.
Tabel VII.1. Bentuk umum tabel 2×2 untuk pembahasan ukuran
asosiasi
Variabel A Variabel B
B1 B2 Jumlah
A1 a b 1n
A2 c d 2n
Jumlah 1m 2m n
� Koefisien phi:
φ =
2uji
n
χ (7.11)
� Koefisien kontijensi Pearson:
P =
2
2
uji
ujin
χ
χ+ (7.12)
� Koefisien kontijensi Cramer (dapat digunakan untuk tabel r×c):
C = ( )
2
1
uji
n q
χ
− (7.13)
236
dengan: q = min (r ; c)
� Ukuran Q Yule (Yule’s Q):
Q = ad bc
ad bc
−
+ (7.14)
Untuk n besar, Q berdistribusi normal dengan variansi:
( )ˆˆVar Q = 1
4( )2
2ˆ1 Q−
1 1 1 1
a b c d
+ + +
(7.15)
sehingga dapat dihitung interval konfidensi 100(1 − α)%-nya.
� Rasio imbangan (rasio odds; odds ratio):
ˆOR = ad
bc (7.16)
Untuk n besar, transformasi logaritma rasio imbangan ln ˆOR
berdistribusi normal dengan variansi:
ˆVar (ln ˆOR ) = 1 1 1 1
a b c d
+ + +
(7.17)
sehingga dapat dihitung interval konfidensi 100(1 − α)%-nya.
Nilai rasio imbangan berkisar antara nol sampai dengan tak berhingga.
Tidak adanya asosiasi antara variabel baris dengan variabel kolom
dinyatakan dengan nilai rasio imbangan sama dengan satu.
Contoh VII.1:
Lihat kembali data pria berpenyakit DM dan PJK pada contoh 7.6,
yang disajikan kembali di bawah ini:
Tabel 7.15. Diabetes melitus dan penyakit jantung koroner pada pria
usia lanjut
DM PJK
Ada: B Tidak ada: BC Jumlah
Ada: A a = 16 b = 20 36
Tidak ada: AC c = 32 d = 132 164
Jumlah 48 152 n = 200
237
Pada contoh 7.6 telah dihitung nilai statistik penguji 2ujiχ = 10.06.
a. Koefisien phi adalah:
φ =
2uji
n
χ
= 10.06
200 = 0.224
b. Koefisien kontijensi Pearson adalah:
P =
2
2
uji
ujin
χ
χ+
=10.06
200 10.06+ = 0.219
c. Koefisien kontijensi Cramer adalah:
C = ( )
2
1
uji
n q
χ
−
Untuk tabel 2×2, q = min (r ; c) = 2 sehingga koefisien kontijensi
Cramer bernilai sama dengan koefisien phi:
C = 0.224
d. Ukuran Q Yule adalah:
Q = ad bc
ad bc
−
+
= ( )( ) ( ) ( )( )( ) ( ) ( )
16 132 20 32
16 132 20 32
−
+ = 0.535
Standard error Q adalah:
( )ˆˆSE Q = ( )221 1 1 1 1ˆ1
4Q
a b c d
− + + +
= ( )2
21 1 1 1 11 0.535
4 16 20 32 132
− + + +
= 0.139
Interval konfidensi 95% ukuran Q adalah:
Q + 0.025Z . ( )ˆˆSE Q
238
atau: 0.535 + (1.96)(0.139)
yaitu: [0.263 ; 0.807]
e. Rasio imbangan adalah:
ˆOR = ad
bc
= ( )( )( ) ( )
16 132
20 32 = 3.3
Transformasi logaritma ˆOR adalah:
ln ˆOR = ln 3.3 = 1.194
Standard error ln ˆOR adalah:
ˆSE (ln ˆOR ) = 1 1 1 1
a b c d
+ + +
= 1 1 1 1
16 20 32 132
+ + +
= 0.389
Interval konfidensi 95% ln OR adalah:
ln ˆOR ± 0.025Z . ˆSE (ln ˆOR )
atau: 1.194 + (1.96)(0.389)
yaitu: [0.431 ; 1.956]
Interval konfidensi 95% OR adalah:
[exp 0.431 ; exp 1.956]
yaitu: [1.540 ; 7.074]
239
LAMPIRAN 7B: UKURAN SAMPEL MINIMUM
UNTUK UJI KESAMAAN BEBERAPA PROPORSI
Pada bab 3, subbab 3.4 telah dibahas cara penentuan ukuran sampel
minimum untuk uji kesamaan 2 proporsi, sedangkan dalam lampiran 6D
pada pembahasan mengenai ukuran sampel minimum untuk uji kesamaan
beberapa nilai rerata telah dijelaskan mengenai kelompok kontrol serta
alokasi rasio uji-kontrol. Konsep-konsep dalam pembahasan terdahulu
tersebut akan digunakan kembali pada penentuan ukuran sampel minimum
untuk uji kesamaan beberapa proporsi pada tabel kontijensi r×2 di sini.
Misalkan hendak dilakukan uji homogenitas khi-kuadrat untuk
mengkaji kesamaan proporsi pada k kelompok perbandingan dengan sampel
berukuran minimum yang dibutuhkan, yang terdiri atas:
a. Satu kelompok kontrol (control group), dengan ukuran kelompok cn .
b. (k – 1) kelompok uji (test groups), masing-masing dengan ukuran
kelompok tn .
Ukuran sampel seluruhnya adalah:
n = (k – 1) tn + cn (7.18)
Perbandingan ukuran satu kelompok uji tn dengan ukuran kelompok
kontrol cn dinamakan ‘rasio alokasi uji-kontrol’ (test-control allocation
ratio):
λ = t
c
n
n (7.19)
Ukuran kelompok kontrol minimum adalah:
cn =
( )
2
2
2
1c c t t
c t
Z PQ Z P Q PQ
P P
α βλ
λλ
+ + +
− (7.20)
cP : proporsi pada populasi kontrol
tP : proporsi pada populasi uji
240
cQ = 1 − cP tQ = 1 − tP (7.21)
P = 1
c tP Pλ
λ
+
+ Q = 1 − P (7.22)
d = ( c tP P− ) : perbedaan minimum yang hendak dideteksi antara
proporsi pada populasi kontrol dan populasi uji.
Ukuran satu kelompok uji adalah:
tn = λ cn (7.19.a)
Untuk λ = 1 (alokasi uniform), maka:
cn = ( )
( )
2
2
2 2 c c t t
c t
Z PQ Z P Q PQ
P P
α β + +
− (7.23)
dan: tn = cn (7.24)
Contoh VII.2:
Lihat kembali data tentang insomnia pada 3 kelompok usia pada
contoh 7.1, tabel 7.4. Misalkan sebelum penelitian terlebih dahulu dilakukan
perhitungan ukuran sampel minimum untuk mendeteksi adanya perbedaan
proporsi penderita insomnia sebesar 0.10 pada 2 kelompok usia 18-34 tahun
dan 35-54 tahun, dibandingkan dengan proporsi penderita insomnia pada
kelompok usia 55-74 tahun sebagai kelompok kontrol. Hasil penelitian
pendahuluan menunjukkan estimasi proporsi penderita insomnia pada
kelompok kontrol sebesar 50%. Dengan tingkat signifikansi 5% dan
kekuatan uji 80%, maka:
k = 3 d = 0.10
ˆcP = cp = 0.50
ˆtP = tp = cp − d = 0.50 – 0.10 = 0.40
cq = 1 − cp = 1 – 0.50 = 0.50
tq = 1 − tp = 1 – 0.40 = 0.60
α = 0.05 2Zα = 1.96
1 – β = 0.80 Zβ = 0.84
Dengan alokasi uniform, maka λ = 1, sehingga:
241
p = 2
c tp p s+ =
0.50 0.40
2
+ = 0.45
q = 1 − p = 1 – 0.45 = 0.55
Ukuran minimum kelompok kontrol adalah:
cn = ( )
( )
2
2
2 2 c c t t
c t
Z PQ Z P Q PQ
P P
α β + +
−
= ( ) ( )( ) ( )( ) ( )( )
2
2
1.96 2 0.45 0.55 0.84 0.50 0.50 0.40 0.60
0.10
+ +
= 387.35 ≈ 388
Ukuran minimum satu kelompok uji adalah:
tn = cn = 388
Ukuran sampel seluruhnya adalah:
n = (k – 1) tn + cn
= (2)(388) + 388 = 1,164
242
LATIHAN 7
Bagian Pertama
Pilihlah satu jawaban yang paling benar!
1. Uji 2-sisi (two-sided test) adalah pengujian terhadap hipotesis
0 :H οθ θ= , sedangkan uji 2-ekor (two-tail test) yaitu uji dengan
daerah kritis (daerah penolakan) berada di kedua ekor distribusi
sampling. Kedua istilah ini memiliki pengertian yang serupa pada:
A. Uji t C. Keduanya benar
B. Uji khi-Kuadrat D. Keduanya salah
2. Untuk menguji hubungan antara variabel independen kategorik
dengan variabel dependen kategorik, metode statistik yang digunakan
adalah:
A. Uji .Z C. Analisis regresi linear.
B. Analisis variansi D. Uji khi-kuadrat Pearson
3. Penggunaan uji khi-kuadrat bagi data kategorik antara lain adalah
untuk:
A. Uji homogenitas
B. Uji independensi
C. Uji kebaikan-suai (goodness-of-fit)
D. Semuanya benar
4. Pada uji khi-kuadrat terhadap tabel kontijensi r×c (r baris dan c
kolom), statistik penguji yang dihasilkan memiliki derajat bebas
sebesar:
A. r×c C. (r – 1) × (c – 1)
B. (r×c) − 1 D. Semuanya salah.
5. Data yang dianalisis dengan uji independensi berasal dari:
A. Satu sampel C. Tiga sampel
B. Dua sampel D. Semuanya salah.
243
6. Pada sampel 100 orang mahasiswa wanita teradapat 25 orang
penderita nyeri kepala kronis, sedangkan pada sampel 100 orang
mahasiswa pria hanya pada 14 penderita kelainan yang sama. Untuk
mengkaji ada tidaknya perbedaan proporsi penderita nyeri kepala
diantara mahasiswa pria dan wanita secara statistik digunakan:
A. Uji Z untuk kesamaan proporsi
B. Uji khi-kuadrat
C. Keduanya dapat digunakan
D. Keduanya tidak dapat digunakan
7. Frekuensi harapan pada tabel r×c menyatakan:
A. Frekuensi yang diharapkan akan terjadi jika variabel baris
memiliki asosiasi dengan variabel kolom.
B. Frekuensi yang diharapkan akan terjadi jika variabel baris tidak
memiliki asosiasi dengan variabel kolom.
C. Frekuensi yang diharapkan akan terjadi jika variabel baris dan
variabel kolom tidak independen.
D. Semuanya salah.
8. Frekuensi marginal pada tabel harapan:
A. Lebih kecil daripada frekuensi marginal pada tabel observasi.
B. Sama besar dengan frekuensi marginal pada tabel observasi.
C. Lebih besar daripada frekuensi marginal pada tabel observasi.
D. Semuanya salah.
9. Hipotesis 0H : A dan B independen dapat juga dinyatakan sebagai:
A. ( ) ( )P A B P B A= C. ( ) ( ) ( )P A B P A P B∪ =
B. ( ) ( )CP A B P A B= D. Semuanya benar
10. Data untuk mengkaji hubungan usia(muda, dewasa, tua) dengan
kebiasaan merokok (bukan perokok, perokok ringan, perokok berat)
yang disajikan dalam bentuk tabulasi silang memiliki derajat bebas:
A. 1 C. 6
B. 4 D. 9
244
Bagian Kedua
Pilihlah satu jawaban yang paling benar!
Untuk soal No. 1 s.d. 6:
Untuk menguji kebenaran dugaan bahwa kelompok orang usia lanjut
lebih sedikit tidurnya dibandingkan kelompok orang usia muda, diambil
sampel acak 250 orang berusia 30-40 tahun dan 250 orang berusia 60-70
tahun, lalu ditanyakan kebiasaan tidurnya. Hasilnya adalah sebagai berikut:
Jam tidur
(jam/hari)
Umur (tahun)
30-40 60-70
< 8 172 120
> 8 78 130
1. Uji statistik untuk data di atas tergolong dalam:
A. Uji indepedensi C. Keduanya benar
B. Uji homogenitas D. Keduanya salah
2. Jika 1P menyatakan proporsi orang usia muda yang tidurnya kurang
daripada 8 jam/hari, dan 2P menyatakan proporsi hal yang sama pada
orang usia lanjut, maka dengan menggunakan uji khi-kuadrat untuk
data di atas, hipotesis yang diujiialah:
A. 0 1 2:H P P≤ C. 0 1 2:H P P≥
B. 0 1 2:H P P= D. Semuanya salah
3. Statistik penguji untuk data di atas besarnya adalah:
A. 1.712 C. 4.452
B. 3.425 D. 22.26
4. Statistik penguji tersebut berdistribusi khi-kuadrat dengan derajat
bebas:
A. 1 C. 3
B. 2 d. 4
5. Dengan tingkat signifikansi 5%α = , nilai kritis untuk statistik
penguji ialah:
A. 3.84 C. 9.49
B. 5.02 D. 11.14
245
6. Kesimpulan yang diperoleh:
A. Pada tingkat signifikansi 5%, terdapat perbedaan proporsi
individu yang tidur lebih sedikit yang bermakna secara statistik di
antara kelompok usia muda dan kelompok usia lanjut.
B. Pada tingkat signifikansi 5%, tidak terdapat perbedaan proporsi
individu yang tidur lebih sedikit yang bermakna secara statistik di
antara kelompok usia muda dan kelompok usia lanjut.
C. Pada tingkat signifikansi 10%, tidak terdapat perbedaan proporsi
individu yang tidur lebih sedikit yang bermakna secara statistik di
antara kelompok usia muda dan kelompok usia lanjut.
D. Semuanya salah.
Untuk soal No. 7 s.d. 12:
Polusi sulfur dioksida di udara dapat menyebabkan kerusakan
tanaman. Untuk mempelajari pengaruhnya terhadap berbagai jenis sayuran
kebun, 40 tanaman masing-masing jenis sayuran ditanam dalam rumah hijau
yang terpolusi sulfur dioksida dengan hasil sebagai berikut:
Kerusakan daun Jenis sayuran
Kubis Bayam Tomat
Parah 32 28 19
Sedikit/tidak rusak 8 12 21
7. Frekuensi observasi tanaman bayam yang rusak parah adalah:
A. 12 C. 28
B. 19 D. 32
8. Frekuensi harapan tanaman kubis yang rusak parah adalah:
A. 13.67 C. 28.00
B. 26.33 D. 32.00
9. Nilai ( )ij ijO E− untuk tanaman tomat yang sedikit / tidak rusak
adalah:
A. 5.33− C. 5.33
B. 7.33− D. 7.33
10. Nilai ( )2
ij ijO E− untuk tanaman kubis yang sedikit / tidak rusak
adalah:
A. 2.78 C. 205.44
B. 32.11 D. 336.11
246
11. Nilai ( )2
/ij ij ijO E E− untuk tanaman tomat yang rusak parah adalah:
A. 1.08 C. 2.08
B. 2.04 D. 3.39
12. Statistik penguji besarnya adalah:
A. 3.67 C. 5.92
B. 3.88 D. 9.85
Bagian Ketiga
Untuk soal No. 1 s.d. 4:
Tabel di bawah ini menunjukkan hasil uji coba sebuah vaksin baru
terhadap hewan ternak, yaitu jumlah ternak yang hidup dan mati pada saat
wabah.
Fatal Non-fatal
Vaksinasi 6 114
Tanpa vaksinasi 18 162
1. Uji statistik yang relevan untuk menganalisis data di atas ialah:
A. Uji khi-kuadrat Pearson C. Uji eksak Fisher
B. Uji McNemar D. Semuanya benar
2. Dengan menggunakan uji khi-kuadrat, statistik penguji untuk data di
atas besarnya adalah:
A. 1.355 C. 4.765
B. 2.446 D. 12.36
3. Dengan tingkat signifikansi 5%,α = nilai kritis untuk statistik
penguji ialah:
A. 3.84 C. 9.49
B. 5.02 D. 11.14
247
4. Kesimpulan yang diperoleh yaitu:
A. Pada tingkat signifikansi 5%, terdapat perbedaan proporsi
kematian ternak yang bermakna secara signifikansi di antara
kelompok dengan vaksinasi dan kelompok tanpa vaksinasi.
B. Pada tingkat signifikansi 5%, tidak terdapat perbedaan proporsi
kematian ternak yang bermakna secara statistik di antara
kelompok dengan vaksinasi dan kelompok tanpa vaksinasi.
C. Pada tingkat signifikansi 10%, terdapat perbedaan proporsi
kematian ternak yang bermakna secara statistik di antara
kelompok dengan vaksinasi dan kelompok tanpa vaksinasi.
D. Semuanya salah.
Untuk soal No. 5 s.d. 7:
Seorang pekerja sosial berdasarkan hasil wawancaranya terhadap
pasangan-pasangan suami istri yang mengurus perceraian, hendak meneliti
apakah ada kaitan masa penjajakan pra-nikah (lama hubungan sebelum
menikah) dengan usia perkawinan (lama perkawainan dapat dipertahankan).
Data yang ada yaitu:
Masa penjajagan pra-nikah Usia perkawinan
< 4 tahun > 4 tahun
Kurang daripada ½ tahun 11 8
½ - 1 ½ tahun 28 24
Lebih daripada 1 ½ tahun 21 19
5. Untuk menguji 0 :H tidak ada asosiasi antara masa penjajagan pra-
nikah dengan usia perkawinan, statistik pengujinya besarnya adalah:
A. 0.15 C. 3.84
C. 1.33 D. 4.11
6. Dengan tingkat signifikansi 5%α = , nilai kritis untuk statistik
penguji adalah:
A. 3.841 C. 5.991
B. 5.024 D. 7.378
248
7. Kesimpulan yang diperoleh yaitu:
A. Pada tingkat signifikansi 1%, terdapat asosiasi yang bermakna
secara statistik antara masa penjajagan pra-nikah dengan usia
perkawainan.
B. Pada tingkat signifikansi 5%, terdapat asosiasi yang bermakna
secara statistik antara masa penjajagan pra-nikah dengan usia
perkawinan.
C. Pada tingkat signifikansi 10%, terdapat asosiasi yang bermakna
secara statistik penjajagan pra-nikah dengan usia perkawinan.
D. Semuanya salah.
249
BAB 8
ANALISIS DATA KATEGORIK II
8.1. UJI EKSAK FISHER
Dalam pengambilan sampel di lapangan yang umumnya selalu
dilakukan dalam bentuk tanpa pengembalian, penggunaan distribusi binomial
sebagai dasar perhitungan probabilitas dianggap valid apabila sampel
berukuran cukup besar. Pada uji khi-kuadrat Pearson yang didasarkan atas
selisih 2 proporsi binomial, dibutuhkan ukuran sampel yang cukup besar
yang dinyatakan dalam bentuk persyaratan bahwa tidak ada sel dengan
frekuensi harapan lebih kecil daripada lima.
Adanya frekuensi harapan yang lebih kecil daripada lima pada salah
satu sel dalam tabel 2×2 mengindikasikan ukuran sampel yang terlalu kecil
untuk dianalisis dengan menggunakan distribusi binomial dan uji khi-kuadrat
Pearson, dan dalam keadaan tersebut perhitungan probabilitas didasarkan
atas distribusi hipergeometrik, yaitu dengan uji eksak Fisher.
Pada uji eksak Fisher tidak ada statistik penguji, dan uji hipotesis
dilakukan dengan menghitung secara langsung nilai p-nya.
Contoh 8.1:
Misalkan dimiliki data keinginan bunuh diri pada 20 penderita
psikokis dan 20 penderita neurosis sebagai berikut:
Tabel 8.1. Keinginan bunuh diri pada pasien psikokis dan neurosis
Tipe pasien Keinginan bunuh diri
Ada Tidak ada Jumlah
Psikosis a = 2 (4) b = 18 (16) 1n = 20
Neurosis c = 6 (4) d = 14 (16) 2n = 20
Jumlah 1m = 8 2m = 32 n = 40
Keterangan: Angka dalam kurung menyatakan frekuensi harapan
Nilai p mencakup probabilitas komposisi data yang sama dengan dan
lebih ekstrim daripada data sampel. Data sampel menunjukkan nilai 11O
= a
= 2.
250
Misalkan 1P menyatakan proporsi yang berkeinginan bunuh diri dari
pada populasi penderita psikosis dan 2P menyatakan proporsi serupa pada
populasi penderita neurosis. Pada pengujian hipotesis 0H : 1P >
2P,
komposisi data yang lebih ekstrim daripada a = 2 mencakup nilai-nilai a = 1 dan a = 0 (lihat tabel 8.2.a dan 8.2.b).
Tabel 8.2. Tabel dengan frekuensi sel yang lebih ekstrim daripada
pengamatan
(a) (b)
1 19 20 0 20 20
7 13 20 8 12 20
8 32 40 8 32 40
Atas dasar distribusi hipergeometrik, probabilitas untuk mendapatkan
nilai a sebagai frekuensi pengamatan untuk sel kiri atas (dan komposisi
keseluruhan tabel) adalah:
P (a) = 1 2
1
n na c
nm
C C
C =
1 2
! !1 2! ! ! !
!
! !
n n
a b c d
n
m m
P (a) = 1 2 1 2! ! ! !
! ! ! ! !
n n m m
a b c d n (8.1)
Nilai p 1-sisi adalah (lihat perhitungan pada tabel 8.3):
p = P (a = 2) + P (a = 1) + P (a = 0)
Tabel 8.3. Perhitungan nilai p satu-sisi
a P (a)
2 20! 20! 8! 32!
2! 18! 6! 14! 40! = 0.0958
1 20! 20! 8! 32!
1! 19! 7! 13! 40! = 0.0202
0 20! 20! 8! 32!
0! 20! 8! 12! 40! = 0.0016
p P (2) + P (1) + P (0) = 0.1176
251
Dengan tingkat signifikansi α = 0.05, nilai p yang diperoleh lebih
besar daripada α, sehingga hipotesis nol yang menyatakan tidak ada
hubungan antara tipe kelainan jiwa pasien dengan keinginan bunuh diri tidak
ditolak.
Dikenal tiga versi uji eksak Fisher:
1. Uji eksak Fisher 1-sisi: Merupakan bentuk yang lazim digunakan,
seperti pada contoh 8.1 diatas.
2. Uji eksak Fisher-Irwin 2-sisi: Nilai p 2-sisi diperoleh sebagai hasil
penjumlahan nilai p 1-sisi pada uji eksak Fisher 1-sisi ditambah dengan
probabilitas di pihak yang berseberangan pada distribusi probabilitas a
(lihat contoh 8.2).
3. Uji eksak Fisher 2-sisi: Nilai p diperoleh dengan mengali-duakan nilai
p 1-sisi pada uji eksak Fisher 1-sisi. Pada contoh 8.1 , nilai p 1-sisi
adalah 0.1176, sehingga p 2-sisi adalah (2)(0.1176) = 0.2352.
Contoh 8.2:
Lihat kembali data pada soal 8.1 (tabel 8.1). Secara teoretis, rentang
nilai a berkisar antara 0 s.d. 2. Pada uji eksak Fisher 1-sisi (soal 8.1) telah
dihitung nilai p 1-sisi sebagai penjumlahan probabilitas P (a = 2) + P (a = 1)
+ P (a = 0) = 0.1176.
Pada pihak yang ‘berseberangan’ akan dihitung nilai p sebagai
penjumlahan probabilitas P (a = 6) + P (a = 7) + P (a = 8). Penyajian
datanya diperlihatkan pada tabel 8.4, sedangkan perhitungan pada tabel 8.5.
Tabel 8.4. Tabel dengan frekuensi sel yang lebih ekstrim daripada
pengamatan
(a) (b)
6 14 20 7 13 20
2 18 20 1 19 20
8 32 40 8 32 40
(c)
8 12 20
0 20 20
8 32 40
252
Tabel 8.5. Perhitungan nilai p 1-sisi
a P (a)
6 20! 20! 8! 32!
6! 14! 2! 18! 40! = 0.0958
7 20! 20! 8! 32!
7! 13! 1! 19! 40! = 0.0202
8 20! 20! 8! 32!
8! 12! 0! 20! 40! = 0.0016
p P (6) + P (7) + P (8) = 0.1176
Diperoleh nilai p 2-sisi uji Fisher-Irwin:
p = [P (2) + P (1) + P (0)] + [P (6) + P (7) + P (8)]
= 0.1176 + 0.1176 = 0.2352
Tampak di sini bahwa distribusi probabilitas a kurang lebih simetris:
P (a = 2) ≈ P (a = 6); P (a = 1) ≈ P (a = 7); dan P (a = 0) ≈ P (a = 8);
sehingga hasil uji eksak Fisher-Irwin 2-sisi (nilai p-nya) di sini tepat sama
dengan hasil uji eksak Fisher 2-sisi, walaupun begitu hal ini tidak selalu
terjadi demikian.
253
8.2. UJI KEBAIKAN-SUAI (UJI GOODNESS-OF-FIT)
Uji kebaikan-suai (goodness-of-fit) adalah uji statistik untuk menilai
sejauh mana kesesuaian data sampel yang ada dengan bentuk distribusi yang
dispesifikasikan dalam hipotesis nol. Bentuk distribusi menurut hipotesis nol
tersebut dapat berupa:
a. Distribusi data lampau (tanpa disertai spesifikasi bentuk
distribusinya).
b. Distribusi tertentu, misalnya distribusi normal, distribusi Poisson, dan
sebagainya.
� Uji Normalitas
Yang akan dibahas di sini hanya uji kebaikan-suai yang terbanyak
digunakan dalam praktik, yaitu uji normalitas (uji goodness-of-fit distribusi
normal). Uji ini digunakan untuk menilai apakah data sampel yang diperoleh
dapat dianggap berasal dari populasi normal. Selain uji normalitas khi-
kuadrat yang dibahas di sini masih ada beberapa uji normalitas lain, misalnya
uji Kolmogorov-Smirnov (uji Lilliefors), uji Shapiro-Wilk, dan sebagainya.
Uji normalitas khi-kuadrat sebenarnya bukanlah diperuntukkan bagi
analisis data kategorik murni, karena data sampel akan diuji berskala kontinu
atau sekurang-kurangnya numerik, yang untuk pengujiannya terlebih dahulu
harus dikategorisasikan. Distribusi frekuensi yang diperoleh sebagai hasil
kategorisasi ini disajikan sebagai tabel observasi dalam bentuk tabel 1×c
(lihat tabel 7.1.a) atau dapat pula dalam bentuk tabel r×1.
Uji khi-kuadrat untuk normalitas data terdiri atas 2 tahap, yaitu
perhitungan frekuensi harapan dan uji hipotesis.
� Perhitungan Frekuensi Harapan
Frekuensi harapan diperoleh dengan mengkategorisasikan distribusi
normal tertentu yang memiliki rerata dan standar deviasi yang
dispesifikasikan dalam hipotesis. Jika rerata dan standar deviasi ini tidak
dispesifikasikan, harus digunakan nilai-nilai estimasinya yang diperoleh dari
sampel.
Contoh 8.3:
Misalkan dimiliki data usia hidup 40 aki merek PQR dengan
distribusi frekuensi seperti terlihat tabel 8.6 (jika data yang ada berskala
254
kontinu harus terlebih dahulu dikategorisasikan, lihat buku teks Metode
Statistika I, bab 2: Peringkasan Data). Tabel distribusi frekuensi ini
merupakan tabel observasi untuk uji normalitas khi-kuadrat.
Tabel 8.6. Distribusi frekuensi usia hidup 40 aki merek PQR
Usia hidup (tahun) jf
1.45−1.95 2
1.95−2.45 1
2.45−2.95 4
2.95−3.45 15
3.45−3.95 10
3.95−4.45 5
4.45−4.95 3
n = jj
f∑ 40
Langkah-langkah perhitungan frekuensi harapan:
1. Cari parameter populasi normal (µ dan σ):
Untuk menghitung frekuensi harapan seandainya sampel di atas berasal
dari populasi normal, perlu diketahui parameter populasinya, yaitu
rerata dan standar deviasi populasi. Karena nilai-nilai ini tak diketahui,
harus dihitung estimasinya, yaitu rerata dan standar deviasi sampel
(untuk perhitungan rerata dan standar deviasi data tak berkelompok,
lihat kembali buku teks Metode Statistika I, bab 3: Ukuran Statistik).
Tabel 8.7. Perhitungan rerata dan standar deviasi distribusi usia hidup
40 aki merek PQR
Interval kelas jf jX jf jX jf
2jX
1.45-1.95 2 1.7 3.4 5.78
1.95-2.45 1 2.2 2.2 4.84
2.45-2.95 4 2.7 10.8 29.16
2.95-3.45 15 3.2 48.0 153.60
3.45-3.95 10 3.7 37.0 136.90
3.95-4.45 5 4.2 21.0 88.20
4.45-4.95 3 4.7 14.1 66.27
jj
f∑ j j
j
f X∑ 2j j
j
f X∑
255
x =
j jj
jj
f X
f
∑
∑ (8.2)
= 136.5
40 = 3.4125
s =
2
2
1
j j j j jj j j
jj
f X f X f
f
−
−
∑ ∑ ∑
∑ (8.3)
=
2484.75 136.5 40
40 1
−
− = 0.6969
2. Transformasi batas kelas menjadi nilai Z:
Dengan menggunakan transformasi:
jZ = jX µ
σ
−
batas-batas kelas ditransformasikan ke dalam distribusi normal standar
(distribusi Z), nilai µ dan σ yang tidak diketahui disubstitusikan dengan
estimatornya x dan s:
jZ = jX x
s
− (8.4)
256
Tabel 8.8. Transformasi batas kelas distribusi normal menjadi batas
kelas distribusi Z
Batas kelas
distribusi normal: jX Batas kelas distribusi Z: jZ = jX x
s
−
1.95 1.95 3.4125
0.6969
− = −2.10
2.45 2.45 3.4125
0.6969
− = −1.38
2.95 2.95 3.4125
0.6969
− = −0.66
3.45 3.45 3.4125
0.6969
− = 0.05
3.95 3.95 3.4125
0.6969
− = 0.77
4.45 4.45 3.4125
0.6969
− = 1.49
3. Tentukan luas area masing-masing kelas:
Dengan menggunakan tabel Z, tentukan luas area masing-masing kelas
dalam distribusi Z:
Tabel 8.9. Penentuan luas area masing-masing dalam distribusi Z
Interval kelas Luas area
Z < −2.10 0.0179
−2.10 < Z < −1.38 0.0659
−1.38 < Z < −0.66 0.1708
−0.66 < Z < 0.05 0.2653
0.05 < Z < 0.77 0.2595
0.77 < Z < 1.49 0.1525
Z > 1.49 0.0681
Jumlah luas area 1.0000
4. Hitung frekuensi harapan:
Frekuensi harapan untuk tiap kelas sesuai dengan luas areanya masing-
masing.
257
Tabel 8.10. Perhitungan frekuensi harapan untuk tiap kelas pada
distribusi Z
Interval kelas Frekuensi harapan ( jE )
1.45−1.95 0.0179 × 40 = 0.72
1.95−2.45 0.0659 × 40 = 2.64
2.45−2.95 0.1708 × 40 = 6.83
2.95−3.45 0.2653 × 40 = 10.61
3.45−3.95 0.2595 × 40 = 10.38
3.95−4.45 0.1525 × 40 = 6.10
4.45−4.95 0.0681 × 40 = 2.72
Jumlah 40
5. Penggabungan kelas:
Untuk digunakan dalam uji khi-kuadrat kebaikan-suai, tidak boleh ada
sel dengan frekuensi harapan lebih kecil daripada 5, sehingga jika perlu
harus dilakukan penggabungan kelas interval:
Tabel 8.11. Tabel harapan untuk distribusi frekuensi 40 aki merek PQR
No Kelas interval Frekuensi harapan
1 < 2.95 10.19
2 2.95 − 3.45 10.61
3 3.45 − 3.95 10.38
4 > 3.95 8.82
Jumlah 40
� Uji Hipotesis
Setelah tabel observasi diperoleh dan tabel harapannya disusun, dapat
dilakukan uji normalitas khi-kuadrat dengan langkah-langkah sebagai
berikut:
1. Jenis uji statistik: uji kebaikan-suai (uji khi-kuadrat).
2. Hipotesis:
0H : Sampel acak berasal dari populasi normal ) (8.5.a)
1H : Distribusi populasi tidak normal ) (8.5.b)
3. Tingkat signifikansi: α = 0.01, 0.05, atau 0.10.
258
4. Daerah kritis: W >
2
;k αχ
(8.6)
5. Statistik penguji:
ujiW = 2ujiχ =
( )2
1
cj j
j j
O E
E=
−
∑ (8.7)
yang berdistribusi 2χ dengan derajat bebas k, yaitu c dikurangi jumlah
kuantitas data observasi (data sampel) yang digunakan untuk
menghitung frekuensi harapan. Kuantitas yang diperlukan seluruhnya
ada 3, yaitu n (jumlah pengamatan), x (rerata sampel), dan s (standar
deviasi sampel).
6. Kesimpulan:
0H ditolak : Sampel dianggap tidak berasal dari populasi
normal.
0H tidak ditolak : Sampel dianggap berasal dari populasi normal.
Contoh 8.4:
Lihat data pada contoh 8.3. Hendak diuji apakah data sampel tersebut
berasal dari populasi normal.
Tabel 8.12. Distribusi frekuensi observasi dan harapan usia hidup 40 aki
merek PQR
No kelas 1 2 3 4
jO 7 15 10 8
jE 10.19 10.61 10.38 8.82
Uji hipotesis:
1. Jenis uji statistik: uji kebaikan-suai (uji khi-kuadrat).
2. Hipotesis:
0H : Sampel acak berasal dari populasi normal
1H : Sampel acak berasal dari populasi tidak normal
3. Tingkat signifikansi: α = 0.05.
4. Daerah kritis: W >
2
1; 0.05χ , yaitu W > 3.84.
259
5. Statistik penguji:
ujiW = 2ujiχ =
( )2
4
1
j j
j j
O E
E=
−
∑
= ( )27 10.19
10.19
− +
( )215 10.61
10.61
− +
( )210 10.38
10.38
− +
( )28 8.82
8.82
− = 2.91
yang berdistribusi 2χ dengan derajat bebas k.
Digunakan 3 kuantitas sampel pada perhitungan frekuensi harapan,
yaitu ukuran sampel n, rerata sampel x , dan standar deviasi s, sehingga
k = c – 3 = 4 – 3 = 1.
6. Kesimpulan: Karena W > 3.84, ujiW tidak terletak pada daerah kritis
dan 0H tidak ditolak, sehingga data sampel dapat dianggap berasal dari
populasi normal.
260
8.3. UJI MCNEMAR
Uji McNemar digunakan untuk data kategorik dikotomi berpasangan.
Pengertian data ‘berpasangan’ di sini adalah sama seperti pada uji t berpasangan, yaitu data untuk dua variabel yang sama, yang berasal dari:
- Subjek yang sama pada bagian yang berbeda, misalnya bagian kiri dan
kanan tubuh.
- Subjek yang sama pada waktu yang berlainan, misalnya sebelum dan
sesudah ‘perlakuan’.
- Subjek berpasangan, misalnya pasangan anak kembar, pasangan subjek
yang ‘dipadankan’ (di-matched), dan sebagainya.
Bentuk umum paparan data kategorik berpasangan ‘sebelum’ dan
‘sesudah’ perlakuan diperlihatkan pada tabel 8.13. Pada uji McNemar yang
dipentingkan hanyalah frekuensi f dan g, yaitu jumlah subjek yang
mengalami perubahan ‘sebelum’ dan ‘sesudah’ perlakuan.
Tabel 8.13. Bentuk umum paparan data pada uji McNemar
iX = Sebelum perlakuan iY = Sesudah perlakuan
iY = 1 iY = 0
iX = 1 e f
iX = 0 g h
Langkah-langkah uji hipotesis:
1. Jenis uji statistik: Uji McNemar
2. Hipotesis: 0H : P (f) = P (g) = 0.5 ) (8.8.a)
1H : P (f) ≠ P (g) ) (8.8.b)
(hanya untuk responden yang menjalani perubahan)
3. Tingkat signifikansi: α
4. Daerah kritis: W > ( )
2
1;αχ (8.9)
5. Statistik penguji:
ujiW = ( )2
f g
f g
−
+ (8.10)
261
yang berdistribusi khi-kuadrat dengan derajat bebas 1.
Jika hipotesis nol ditolak, disimpulkan bahwa ada perubahan yang
terkait dengan perlakuan yang telah diberikan, dengan kata lain perlakuan
dianggap efektif untuk menghasilkan perubahan.
Contoh 8.5:
Misalkan dilakukan pengumpulan pendapat dari 100 responden yang
dipilih secara acak, apakah akan memilih calon presiden dari Partai
Demokrat atau Partai Republik. Pengumpulan pendapat dilakukan sebelum
dan sesudah debat calon.
Tabel 8.14. Pilihan responden sebelum dan sesudah debat calon
presiden
iX = Sebelum iY = Sesudah
Demokrat Republik
Demokrat e = 63 f = 21
Republik g = 4 h = 12
Uji hipotesis:
1. Jenis uji statistik: Uji McNemar
2. Hipotesis: 0H : P (f) = P (g) = 0.5
1H : P (f) ≠ P (g)
3. Tingkat signifikansi: α = 0.05.
4. Daerah kritis: W > ( )
2
1; 0.05χ , yaitu W > 3.84.
5. Statistik penguji:
ujiW = ( )2
f g
f g
−
+
= ( )221 4
21 4
−
+ = 11.56
yang berdistribusi khi-kuadrat dengan derajat bebas 1.
6. Kesimpulan: Karena W > 3.84, 0H
ditolak, sehingga disimpulkan
bahwa pada tingkat signifikansi 0.05 ada perubahan pilihan responden
yang bermakna secara statistik sebagai hasil menyaksikan debat.
262
Uji McNemar digunakan untuk sampel berukuran besar. Untuk data
berpasangan kategorik yang berskala dikotomi, jika sampel berukuran kecil
digunakan uji tanda, yang akan diuraikan dalam pembahasan Metode
Statistika Non-Parametrik.
263
LAMPIRAN 8A: UKURAN KESEPAKATAN
Data berpasangan dapat diperoleh untuk variabel yang sama, namun
dikumpulkan oleh dua pengamat yang berbeda. Data demikian apabila
berskala kategorik dikotomi, termasuk dalam jenis data yang dapat dianalisis
dengan uji McNemar. Paparan data berpasangan tersebut diperlihatkan pada
tabel VIII.1.
Tabel VIII.1. Tabel observasi untuk paparan data berpasangan dari dua
pengamat berbeda pada tabel 2×2
Pengamat A Pengamat B
Jumlah BY = 1 BY = 0
AY = 1 e f 11n
AY = 0 g h 10n
Jumlah 21n 20n n
Hipotesis yang perlu dibuktikan ialah bahwa pengamat A
memperoleh hasil observasi yang berbeda daripada pengamat B, yang jika
dikonversikan menjadi hipotesis alternatif yaitu 1H : P (f) ≠ P (g), dengan
komplemen hipotesis nol-nya 0H : P (f) = P (g) = 0.5.
Jika hipotesis nol tidak ditolak, langkah selanjutnya yang perlu
dilakukan adalah menilai besar kesesuaian yang ada antara hasil observasi
pengamat A dengan pengamat B, yang dinyatakan dalam bentuk ‘ukuran
kesepakatan’ (measure of agreement). Walaupun ukuran kesepakatan yang
dibahas di sini adalah untuk data berpasangan yang diperoleh dari 2
pengamat dalam bentuk tabel 2×2, ukuran tersebut dapat pula digunakan
untuk setiap jenis data berpasangan yang disajikan dalam bentuk tabel 2×2.
Untuk pembahasan selanjutnya, paparan data pada tabel VIII.1
disajikan kembali dalam bentuk tabel proporsi seperti terlihat pada tabel
VIII.2.
264
Tabel VIII.2. Tabel proporsi untuk paparan data berpasangan dari dua
pengamat berbeda pada tabel 2×2
Pengamat A Pengamat B
Jumlah BY = 1 BY = 0
AY = 1 ep fp
1p
AY = 0 gp h
p 1q
Jumlah 2p 2q 1
ep = e
n
fp =
f
n
gp = g
n
hp =
h
n
1p = ep + f
p = 11n
n 1q = gp +
hp = 1 − 1p
2p = ep + gp = 21n
n 2q =
fp +
hp = 1 − 2p
Estimasi ukuran kesepakatan berdasarkan data sampel adalah:
κ = ( )
1 2 2 1
2 e gh fp p p p
p q p q
−
+ (8.11)
Contoh VIII.1:
Dua orang dokter spesialis paru, A dan B, secara terpisah memeriksa
100 foto Röntgen paru pengunjung rumah sakit untuk menilai ada tidaknya
gambaran tuberkulosis paru. Hasil pemeriksaan adalah sebagai berikut:
Tabel VIII.3. Contoh data berpasangan untuk pembacaan foto Rontgen
paru
a. Tabel observasi
Dokter A Dokter B
Jumlah Tb paru (+) Tb paru (−)
Tb paru (+) e = 20 f = 4 11n = 24
Tb paru (−) g = 10 h = 66 10n = 76
Jumlah 21n = 30 20n = 70 n = 100
265
b. Tabel proporsi
Dokter A Dokter B
Jumlah Tb paru (+) Tb paru (−)
Tb paru (+) ep = 0.20 fp = 0.04
1p = 0.24
Tb paru (−) gp = 0.10 h
p = 0.66 1q = 0.76
Jumlah 2p = 0.30 2q = 0.70 1
Estimasi ukuran kesepakatan antara hasil pembacaan foto Röntgen
dokter A dengan dokter B adalah:
κ = ( )
1 2 2 1
2 e gh fp p p p
p q p q
−
+
= ( ) ( ) ( ) ( )
( ) ( ) ( ) ( )
2 0.20 0.66 0.04 0.10
0.24 0.70 0.30 0.76
− +
= 0.646
266
LAMPIRAN 8B: KOREKSI KONTINUITAS YATES
UNTUK UJI DATA KATEGORIK
Statistik penguji pada uji kuadrat untuk tabel kontijensi 2×2,
( ) [ ]2
1 2 1 2n ad bc n n m m −
sebenarnya berdistribusi diskret, namun di-
aproksimasi dengan distribusi khi-kuadrat yang merupakan distribusi
kontinu. Karena itu, Yates (dibaca: yeits) pada tahun 1934 menganjurkan
penggunaan ‘koreksi kontinuitas’ untuk statistik penguji tersebut (matrik
VIII.1). Pengunaan koreksi kontinuitas juga dianjurkan bagi statistik penguji
pada uji khi-kuadrat untuk tabel kontijensi r×c serta uji McNemar.
Matriks VIII.1. Statistik penguji pada uji khi-kuadrat Pearson dan uji
Mc Nemar dengan dan tanpa koreksi kontinuitas
Uji Statistik Statistik penguji
Tanpa koreksi Dengan koreksi
Uji khi-
kuadrat
Pearson
Tabel 2×2 ( )
1
2
2 1 2
n ad bc
n n m m
−
( )
1 2 1 2
20.5n ad bc n
n n m m
− −
Tabel r×c ( )
2
ij ij
i j ij
O E
E
−
∑∑ ( )
2
0.5ij ij
i j ij
O E
E
− −
∑∑
Uji McNemar ( )2
f g
f g
−
+
( )2
1f g
f g
− −
+
Sebagian ahli statistika menolak penggunaan koreksi kontinuitas
Yates dengan alasan bahwa penggunaan koreksi cenderung menyebabkan uji
bersifat ‘over-konservatif’ (tingkat signifikansi aktual jauh lebih kecil
daripada tingkat signifikansi yang dinyatakan). Kecuali dalam lampiran ini,
pada seluruh pembahasan mengenai uji khi-kuadrat dalam buku teks Metode
Statistika II ini digunakan statistika penguji tanpa koreksi kontinuitas.
267
LATIHAN 8
Bagian Pertama
Pilihlah satu jawaban yang paling benar!
1. Uji eksak Fisher digunakan untuk:
A. Tabel 2x2 C. Tabel r x 2; 2r >
B. Tabel 2 x ; 2c c > D. Semuanya benar
2. Perhitungan probabilitas pada uji eksak Fisher didasarkan atas:
A. Distribusi normal C. Distribusi Poisson
B. Distribusi hipergeometrik D. Semuanya salah
3. Perhitungan nilai p pada uji eksak Fisher mencakup:
A. Probabilitas komposisi data yang sama dengan data sampel.
B. Probabilitas komposisi data yang lebih ekstrim daripada data
sampel.
C. Keduanya benar.
D. Keduanya salah.
Untuk soal No. 4 s.d. 8:
Dimiliki struktur tabel berikut:
B1 B2
A1 a b 1n
A2 c d 2n
1m
2m n
4. Probabilitas untuk mendapatkan struktur tabel tersebut adalah:
A. ( )( ) ( ) ( )
1 2 2 2
a b c d
n n m m n C.
1 2 2 2
! ! ! !
! ! ! ! !
a b c d
n n m m n
B. ( ) ( )( )( ) ( )
1 2 2 2n n m m
a b c d n D. 1 2 2 2
! ! ! !
! ! ! ! !
n n m m
a b c d n
268
5. Jika diketahui untuk tabel di atas: n = 30; 1n = 15;
1m = 10; dan c =
3; maka probabilitas untuk mendapatkan komposisi data tersebut
adalah:
A. 0.0001 C. 0.0225
B. 0.0025 D. 0.0975
6. Untuk data pada soal No. 5, nilai ( )1P c = adalah:
A. 0.0001 C. 0.0225
B. 0.0025 D. 0.0975
7. Pada uji eksak Fisher 1-sisi untuk data soal No. 5, nilai p adalah:
A. 0.0001 C. 0.0251
B. 0.0026 D. 0.1225
8. Kesimpulan yang diperoleh untuk uji 0
:H variabel baris dan
variabel kolom independen terhadap data soal No. 5 adalah:
A.
0H tidak ditolak pada tingkat signifikansi 0.05α =
B.
0H ditolak pada tingkat signifikansi 0.10α =
C. A) dan B) benar.
D. A) dan B) salah.
Bagian Kedua
Pilihlah satu jawaban yang paling benar!
Dimiliki data penghasilan bulanan 160 keluarga di sebuah desa
(dalam ribuan rupiah):
Penghasilan bulanan Banyak keluarga
129.5-139.5 9
139.5-149.5 18
149.5-159.5 23
159.5-169.5 23
169.5-179.5 26
179.5-189.5 22
189.5-199.5 18
199.5-205.5 15
209.5-219.5 6
269
1. Rerata dan standar deviasi sampel di atas adalah:
A. 165.75 dan 18.260 C. 175.000 dan 22.740
B. 172.50 dan 21.568 D. 183.50 dan 24.680
2. Seandainya sampel di atas benar berasal dari populasi normal, luas
area kelas interval ketiga ( )149.5 159.5X< < adalah:
A. 6.30% C. 13.20%
B. 7.93% D. 17.00%
3. Frekuensi harapan kelas interval keenam ( )179.5 189.5X< < adalah:
A. 10.08 C. 17.47
B. 12.69 D. 25.55
4. Dengan 5%,α = daerah kritis untuk uji kebaikan-suai (goodness-of-
fit) distribusi normal terhadap sampel di atas adalah:
A. 7.815W > C. 14.449W >
B. 12.592W > D. 16.919W >
5. Deviasi frekuensi observasi pada kelas interval kelima terhadap nilai
harapannya ( )5 5O E− adalah:
A. −2.99 C. 1.90
B. −1.08 D. 4.94
6. Nilai ( )8 8 8
2/O E E− adalah:
A. 0.171 C. 2.222
B. 0.308 D. 2.426
7. Nilai statistik penguji pada uji kebaikan-suai distribusi normal untuk
sampel di atas adalah:
A. 3.9815 C. 6.3969
B. 4.1706 D. 6.4978
8. Dengan 5%,α = kesimpulan uji kebaikan-suai distribusi normal
terhadap sampel di atas yaitu:
A. Sampel dapat dianggap berasal dari populasi normal.
B. Sampel tidak berasal dari populasi normal.
C. Belum dapat dibuat kesimpulan.
D. Semuanya salah.
270
Bagian Ketiga
Pilihlah satu jawaban yang paling benar!
Misalkan dua orang psikiater secara terpisah memeriksa 85 orang
pengunjung yang sama disebuah rumah sakit jiwa dengan hasil penelitian
sebagai berikut:
Psikiater A Psikiater B
Jumlah Psikosis Neurosis
Psikosis 4 5 9
Neurosis 1 75 76
Jumlah 5 80 85
1. Uji statistik yang relevan untuk mengkaji ada tidaknya perbedaan
yang bermakna diantara kedua psikiater dalam mendiagnosis
pasiennya adalah:
A. Uji khi-kuadrat Pearson C. Uji McNemar
B. Uji eksak fisher D. Semuanya salah
2. Jika 1
P menyatakan proporsi penderita psikosis di antara pengunjung
rumah sakit menurut psikiater A, dan 2
P menyatakan proporsi serupa
menurut psikiater B, maka estimasi 1
P dan 2
P berdasarkan data
sampel masing-masing adalah:
A.
1 2ˆ ˆ4 9; 1 76P P= = C.
1 2ˆ ˆ4 9; 4 5P P= =
B.
. 1 2ˆ ˆ4 5; 5 80P P= = D.
1 2ˆ ˆ9 85; 5 85P P= =
3. Jika paparan data berpasangan tersebut disajikan seperti pada tabel
2×2 di bawah ini, hipotesis nol-nya adalah:
Y = 0 Y = 1
X = 1 a b
X = 0 c d
A. ( ) ( )P a P b= C. ( ) ( )P a P d=
B. ( ) ( )P c P d= D. ( ) ( )P b P c=
271
4. Dengan uji statistik yang relevan menurut jawaban soal No. 1, nilai
statistik penguji-nya adalah:
A. 0.32 C. 2.67
B. 0.67 D. 27.04
5. Dengan tingkat signifikansi 10%, daerah kritis untuk uji statistik
tersebut adalah:
A. 2.71W > C. 5.02W >
B. 3.84W > D. 7.81W >
6. Kesimpulan yang diperoleh dari uji statistik tersebut adalah:
A. Tidak ditemukan perbedaan yang bermakna secara statistik antara
hasil penilaian psikiater A dengn psikiater B pada tingkat
signifikansi 10%
B. Ditemukan perbedaan yang bermakna secara statistik antara hasil
penilaian psikiater A dengan psikiater B pada tingkat signifikansi
5%
C. Ditemukan perbedaan yang bermakna secara statistik antara hasil
penilaian psikiater A dengan psikiater B pada tingkat signifikansi
1%
D. Semuanya salah
272
BAB 9
STATISTIKA NON-PARAMETRIK I
9.1. PENGERTIAN STATISTIKA NON-PARAMETRIK
� Definisi dan Penggunaan
Prosedur non-parametrik adalah ‘prosedur statistika . . . yang berlaku
berdasarkan atas sejumlah asumsi yang relatif sederhana mengenai populasi
sumber data’ (Hollander & Wolfe, 1973).
Hipotesis pada Statistika Non-Parametrik tidak memuat parameter
untuk distribusi tertentu, sehingga ada yang menyatakan bahwa Statistika
Non-Parametrik lebih tepat dinamakan Statistika Bebas-Distribusi
(distribution-free statistics).
Metode statistika non-parametrik digunakan untuk:
a. Data numerik (berskala rasio dan interval; lihat matriks 9.1).
b. Data kategorik (berskala ordinal dan nominal).
Matriks 9.1. Penggunaan metode statistika parametrik dan non-
parametrik untuk data numerik
Untuk data numerik dengan populasi sebarang dan sampel kecil,
hanya dapat digunakan metode non-parametrik. Dalam keadaan lainnya pada
matriks 9.1 dapat digunakan baik metode parametrik maupun non-
parametrik, tetapi uji non-parametrik akan menghasilkan kekuatan uji yang
lebih lemah dan kurang efisien dibandingkan dengan uji parametrik.
Ukuran sampel Distribusi populasi
Normal Sebarang
Besar Parametrik Parametrik
Kecil Parametrik Non-Parametrik
273
� Keunggulan Metode Statistika Non-Parametrik
Keunggulan Metode Statistika Non-Parametrik antara lain yaitu:
1) Dapat digunakan tanpa tergantung pada bentuk distribusi populasi
sumber data (distribution-free statistics) / memerlukan lebih sedikit
asumsi mengenai populasi sumber data.
2) Dapat digunakan pada sampel ukuran kecil ataupun untuk data yang
berskala lebih rendah daripada interval / dapat diaplikasikan dalam
situasi yang tidak memungkinkan penggunaan prosedur teori normal.
3) Umumnya mudah untuk dipahami.
4) Hanya sedikit kurang efisien dibandingkan metode statistika parametrik
jika populasinya normal, namun dapat lebih efisien daripada metode
statistika parametrik jika populasinya tidak normal.
� Kelemahan Metode Statistika Non-Parametrik
Kelemahan Metode Statistika Non-Parametrik yaitu:
1) Tidak semua uji parametrik memiliki counterpart-nya dalam statistika
non-parametrik.
2) Uji hipotesis non-parametrik memberikan hasil yang lebih lemah
dibandingkan dengan uji hipotesis parametrik.
3) Estimasi interval non-parametrik memiliki presisi lebih rendah
dibandingkan dengan estimasi interval parametrik.
Beberapa uji non-parametrik sebagai counter-part uji statistik
parametrik yang telah dipelajari sebelumnya diperlihatkan pada matriks 9.2.
274
Matriks 9.2. Beberapa uji parametrik dan counter-part non-parametrik-
nya
Metode
parametrik Metode non-parametrik
Dua sampel
independen Uji t
Uji jumlah rank Wilcoxon
(uji Mann-Whitney)
Dua sampel
berpasangan Uji t berpasangan
- Uji tanda
- Uji rank bertanda Wilcoxon
Tiga / lebih sampel
independen
ANOVA satu-
arah Uji Kruskal-Wallis
Tiga / lebih sampel
berpasangan
ANOVA dua-
arah
(rancangan blok)
Uji Friedman
Koefisien korelasi Koefisien
korelasi Pearson
Koefisien korelasi
Spearman
� Estimasi interval non-parametrik
Metode Statistika Non-Parametrik umumnya lebih banyak mencakup
prosedur uji hipotesis, sedangkan pengestimasian interval relatif agak jarang
dikerjakan. Beberapa prosedur pengestimasian interval yang tercakup dalam
metode statistika non-parametrik antara lain:
- Estimasi berdasarkan teorema Chebyshev (lihat lampiran 2C)
- Metode bootstrapping (lihat lampiran 9A)
275
9.2. UJI TANDA (SIGN TEST)
Uji tanda merupakan counterpart non-parametrik bagi uji t
berpasangan, namun selain untuk pasangan data kontinu atau numerik seperti
pada uji t berpasangan, uji tanda juga dapat digunakan untuk himpunan
pasangan data ordinal.
Persyaratan:
� Data berpasangan ( 1X ; 1Y ), ( 2X ;
2Y ), . . . , ( nX ; nY ); iX dan
iY tidak
independen.
� Skala pengukuran sekurang-kurangnya ordinal dalam tiap pasangan,
sehingga tiap pasangan dapat digolongkan sebagaim ‘plus’, ‘minus’,
atau ‘nol’:
- Plus jika : iX > iY atau iX −
iY > 0 (9.1.a)
- Minus jika : iX < iY atau iX −
iY < 0 (9.1.b)
- Nol jika : iX = iY (tie; tidak digunakan dalam analisis)
� Uji tanda digunakan untuk sampel berukuran kecil (penentuan daerah
kritis dilakukan dengan menggunakan tabel binomial kumulatif yang
umumnya hanya memuat nilai n sampai dengan 20, 25, atau 30). Untuk
sampel berukuran lebih besar digunakan uji McNemar.
Langkah-langkah uji hipotesis:
1. Jenis uji statistik: Uji tanda.
2. Hipotesis:
a. 0H : P (+) = P (−) vs 1H : P (+) ≠ P (−) ) (9.2.a)
b. 0H : P (+) < P (−) vs 1H : P (+) > P (−) ) (9.2.b)
c. 0H : P (+) > P (−) vs 1H : P (+) < P (−) ) (9.2.c)
dengan: P (+) = P ( iX > iY ) ) (9.3.a)
dan: P (−) = P ( iX < iY ) ) (9.3.b)
3. Tingkat signifikansi: α = 0.01, 0,05, atau 0.10.
276
4. Daerah kritis untuk n < 20:
(n = banyaknya ‘+’ dan ‘−‘ dalam sampel = n’ − banyaknya ‘nol’)
a. 1H : P (+) ≠ P (−)
Cari t, yaitu nilai y yang sesuai dengan 1α ≈ α/2 pada tabel
probabilitas binomial kumulatif (dengan n yang sesuai dan p =
0.50; buku Metode Statistika I, Addendum B2). Daerah kritis
adalah:
T < t atau T > n – t (9.4.a)
b. 1H : P (+) > P (−)
Cari t, yaitu nilai y yang sesuai dengan 1α ≈ α pada tabel
binomial kumulatif (dengan n yang sesuai dan p = ½). Daerah
kritis:
T > n’ − t (9.4.b)
c. 1H : P (+) < P (−)
Cari t, yaitu nilai y yang sesuai dengan 1α ≈ α pada tabel
binomial kumulatif (dengan n yang sesuai dan p = ½). Daerah
kritis:
T < t (9.4.c)
5. Statistik penguji:
ujiT = banyaknya ‘+’ dalam sampel (9.5)
6. Kesimpulan: 0H ditolak jika statistik penguji terletak pada daerah
kritis dan 0H tidak ditolak jika statistik penguji tidak terletak pada
daerah kritis.
Contoh 9.1:
Misalkan hendak ditentukan daerah kritis untuk uji tanda jika jumlah
‘plus’ dan ‘minus’ dalam sampel adalah 17, dan akan dilakukan uji hipotesis
2-sisi dengan tingkat signifikansi α = 0.005.
n = 17 α / 2 = 0.025
Pada tabel probabilitas binomial kumulatif (buku teks metode
Statistika I, Addendum B2) untuk n = 17 dan p = 0.05, tampak bahwa nilai
1α yang paling mendekati α/2 = 0.025 adalah 1α = 0.0245. Nilai t = x yang
277
bersesuaian dengan 1α = 0.0245 adalah t = x = 4, sehingga area penolakan
pada sisi kiri adalah T < t, yaitu:
T < 4,
sedangkan area penolakan pada sisi kanan adalah T > n – t, yaitu:
T > 13
(lihat diagram 9.1)
Diagram 9.1. Daerah kritis pada uji tanda dua-sisi dengan n = 17 dan α
= 0.05
Contoh 9.2:
Sebuah pabrik sabun hendak membuat kemasan baru yang
diharapkan lebih menarik daripada kemasan lama. Untuk itu dilakukan
survei terhadap sampel acak konsumen, yang dimimta memilih kemasan
baru (B) atau lama (A). Jika seseorang memilih B diberi tanda ‘+’, jika yang
dipilih A diberi tanda ‘−‘. Dari 16 orang konsumen, 10 orang lebih suka B.
Uji hipotesis:
1. Jenis uji statistik: Uji tanda
2. Hipotesis: 0H : P (+) < P (−)
1H : P (+) > P (−)
3. Tingkat signifikansi: α = 0.05.
4. Daerah kritis (n = 16):
Pada tabel binomial kumulatif dengan n = 16 dan p = ½ diperoleh t = y
= 4 untuk 1α = 0.038 (paling dekat dengan α = 0.05).
278
Daerah kritis adalah T > n – t atau T > 12.
5. Statistik penguji:
ujiT = 10
6. Kesimpulan: Statistik penguji ujiT tidak terletak pada daerah kritis,
sehingga 0H tidak ditolak dan disimpulkan pada tingkat signifikansi α
= 0.05, tidak terdapat perbedaan preferensi yang bermakna antara
kemasan sabun baru dengan kemasan lama.
279
9.3. UJI RANK BERTANDA WILCOXON (WILCOXON
SIGNED RANK TEST)
Uji rank bertanda Wilcoxon (Wilcoxon signed rank test) juga
merupakan counter-part non-parametrik bagi uji t berpasangan seperti uji
tanda, tetapi berbeda dengan uji tanda, uji rank bertanda Wilcoxon hanya
dapat digunakan untuk pasangan data kontinu atau numerik (tidak dapat
untuk pasangan data ordinal).
Persyaratan:
� Data berpasangan ( 1X ; 1Y ), ( 2X ;
2Y ), . . . , ( nX ; nY ); iX dan
iY tidak
independen.
� Skala pengukuran sekurang-kurangnya interval dalam tiap pasangan,
sehingga untuk tiap pasangan dapat dihitung:
iD = iY − iX (9.6)
dan ditentukan nilai iR , yaitu:
iR = rank iD jika iD > 0 ) (9.7.a)
iR = −rank iD jika iD < 0 ) (9.7.b)
� Dua atau lebih iD yang sama disebut ties, dan diberikan peringkat
rata-ratanya.
Contoh 9.3:
Misalkan dimiliki 10 pasangan nilai data berikut (tabel 9.1).
Perhatikan cara menentukan iR :
280
Tabel 9.1. Sepuluh pasangan nilai data dan penentuan iR −nya
No iX iY iD =
iY − iX iD Rank iD iR
1 5 7 2 2 2.5 2.5
2 4 4 0 0 − −
3 6 2 −4 4 5.5 −5.5
4 9 7 −2 2 2.5 −2.5
5 6 6 0 0 − −
6 3 8 5 5 7 7
7 5 6 1 1 1 1
8 7 3 −4 4 5.5 −5.5
9 2 9 7 7 8 8
10 4 7 3 3 4 4
Nilai-nilai iD sebelum diurutkan disajikan sendiri secara terpisah
pada tabel 9.2, dan setelah diurutkan menurut besarnya (di-ranking), hasilnya
diperlihatkan pada tabel 9.3 beserta nilai-nilai iR −nya.
Tabel 9.2. Nilai-nilai iD untuk kesepuluh pasangan nilai data
No 1 2 3 4 5 6 7 8 9 10
iD 2 0 4 2 0 5 1 4 7 3
Tanda iD + − − + + − + +
Tabel 9.3. Hasil pengurutan nilai-nilai iD beserta nilai-nilai iR untuk
kesepuluh pasangan nilai data
iD 1 2 2 3 4 4 5 7
Rank iD 1 2.5 2.5 4 5.5 5.5 7 8
Tanda iD + + − + − − + +
iR 1 2.5 −2.5 4 −5.5 −5.5 7 8
281
Langkah-langkah uji hipotesis:
Setelah nilai-nilai iR ditentukan, dapat dilakukan uji hipotesis
dengan langkah-langkah sebagai berikut:
1. Jenis uji statistik: Uji rank bertanda Wilcoxon.
2 Hipotesis:
a. 0H : E ( iD ) = 0 vs 1H : E ( iD ) ≠ 0 ) (9.8.a)
b. 0H : E ( iD ) < 0 vs 1H : E ( iD ) > 0 ) (9.8.b)
c. 0H : E ( iD ) > 0 vs 1H : E ( iD ) < 0 ) (9.8.c)
3. Tingkat signifikansi: α = 0.01, 0.05, atau 0.10.
4. Daerah kritis jika tidak ada ties dan n < 50:
a. 1H : E ( iD ) ≠ 0 T < 2
wα
atau T > 1 2
wα−
(9.9.a)
b. 1H : E ( iD ) > 0 T > 1w α−
(9.9.b)
c. 1H : E ( iD ) < 0 T <
wα (9.9.c)
α adalah tingkat signifikansi, sedangkan nilai
wα diperoleh dari tabel
kuantil statistik penguji rank bertanda Wilcoxon untuk α < 0.05 (Addendum E).
Jika α > 0.50,
wα diperoleh dengan rumus:
wα = ( )1
2
n n + 1w α−
(9.10)
n menyatakan jumlah pasangan tersisa setelah dikurangi jumlah
pasangan dengan iD = 0.
5. Statistik penguji:
ujiT = ( )1
jika positifn
i ii
R D=
∑ (9.11)
Jika terdapat banyak ties atau n > 50, digunakan pendekatan normal
dengan statistik penguji:
282
ujiZ = 1
2
1
n
ii
n
ii
R
R
=
=
∑
∑
(9.12)
yang berdistribusi normal standar. Untuk rumus 9.12 dengan
pendekatan normal ini digunakan seluruh nilai iR , baik yang bertanda
positif maupun negatif.
6. Kesimpulan: 0H tidak ditolak jika statistik penguji tidak terletak pada
daerah kritis.
Contoh 9.4:
Misalkan hendak diteliti apakah anak yang lahir lebih dahulu pada
pasangan kembar memiliki skor agresivitas yang lebih tinggi dibandingkan
dengan adik kembarnya. Diperoleh hasil pengamatan sebagai berikut (tabel
9.4):
Tabel 9.4. Skor agresivitas 12 pasangan anak kembar
No 1 2 3 4 5 6 7 8 9 10 11 12
iX 86 71 77 68 91 72 77 91 70 71 88 87
iY 88 77 76 64 96 72 65 90 65 80 81 72
iX : Skor agresivitas anak lahir pertama
iY : Skor agresivitas anak lahir kedua
Pada pengolahan data diperoleh nilai-nilai iD , Rank iD , dan iR
seperti terlihat tabel 9.5 di bawah ini:
Tabel 9.5. Penentuan iR untuk skor agresivitas 12 pasangan anak
kembar
No 1 2 3 4 5 6 7 8 9 10 11 12
iD 2 6 −1 −4 5 0 −12 −1 −5 9 −7 −15
Rank
iD 3 7 1.5 4 5.5 − 10 1.5 5.5 9 8 11
iR 3 7 −1.5 −4 5.5 − −10 −1.5 −5.5 9 −8 −11
283
Uji hipotesis untuk data di atas yaitu:
1. Jenis uji statistik: Uji rank bertanda Wilcoxon.
2. Hipotesis: 0H : E ( iD ) > 0
1H : E ( iD ) < 0
3. Tingkat signifikansi: α = 0.05.
4. Daerah kritis:
Karena didapatkan beberapa ties, akan digunakan statistik penguji
dengan pendekatan normal dengan daerah kritis untuk 1H : E ( iD ) < 0
adalah:
Z < 0.05Z , yaitu Z < −1.64.
Jika digunakan rumus 9.11, maka daerah kritis adalah:
T < 0.05w atau T < 14.
5. Statistik penguji:
Statistik penguji dengan pendekatan normal adalah:
1
n
ii
R=
∑ = 3 + 7 + . . . – 11 = −17
2
1
n
ii
R=
∑ = 23 + 27 + . . . − ( )2
11 = 505
ujiZ = 1
2
1
n
ii
n
ii
R
R
=
=
∑
∑
= 17
505
− = −0.76
Jika digunakan rumus 9.11, maka statistik penguji adalah:
ujiT = ( )1
jika positifn
i ii
R D=
∑ = 3 + 7 + 5.5 + 9 = 24.5
6. Kesimpulan: Statistik penguji ujiZ = −0.76 tidak terletak pada daerah
kritis, sehingga 0H tidak ditolak dan disimpulkan pada tingkat
signifikansi α 0.05 tidak terdapat perbedaan skor agresivitas yang
bermakna antara anak lahir pertama dan anak lahir kedua pada
pasangan kembar. Statistik penguji ujiT = 24.5 juga tidak terletak pada
daerah kritis, sehingga memberikan hasil yang sama dengan
pendekatan normal.
284
LAMPIRAN 9A: INTERVAL KONFIDIENSI
BOOTSTRAP
Bootstrapping tergolong dalam salah satu metode non-parametrik
untuk memperoleh inferensi statistik, yang sebagaimana metode non-
parametrik lainnya, menunjukkan manfaat terbesar apabila distribusi
sampling tidak diketahui.
Dasar metode bootstrapping ialah dengan menganggap sampel
sebagai suatu populasi, dan menerapkan proses ‘resampling’ (sampling
dengan pengembalian) untuk menghasilkan estimasi distribusi sampling
statistik secara empiris.
Misalkan dimiliki sampel awal berukuran n yang dalam metode
bootstrapping dianggap sebagai populasi dan hendak dilakukan estimasi
interval terhadap rerata populasi sesungguhnya µ. Terhadap sampel awal ini
diterapkan proses resampling, yaitu pengambilan subsampel berukuran n
dengan pengembalian. Dari sampel awal berukuran n dapat diperoleh
sebanyak nn subsampel, namun yang dianjurkan ialah mengambil sekurang-
kurangnya 1,000 subsampel untuk melakukan pengestimasian interval
terhadap rerata populasi µ.
Contoh IX.1:
Misalkan dimiliki data sampel dengan n = 4:
1X = 3 2X = 7 3X = 5 4X = 8
Dari sampel berukuran n = 4 ini, dilakukan proses resampling dengan ukuran
subsampel n = 4 untuk menghitung interval konfidensi bootstrap 95% bagi
rerata populasi µ (dari sampel berukuran 4 dengan proses resampling
berukuran 4 hanya akan diperoleh 44 = 256 subsampel, tetapi tujuannya di
sini adalah untuk menjelaskan prosedur perhitungan interval konfidensi
bootstrap).
Diperoleh 256 subsampel dengan rerata masing-masing seperti
terlihat pada tabel IX.1.
285
Tabel IX.1. Contoh daftar hasil proses resampling untuk metode
bootstrapping
No Anggota resample Rerata
subsampel 1 2 3 4
1 3 3 3 3 3.00
2 3 3 3 7 4.00
3 3 3 3 5 3.50
4 3 3 3 8 4.25
5 3 3 7 3 4.00
6 3 3 7 7 5.00
7 3 3 7 5 4.50
8 3 3 7 8 5.25
9 3 3 5 3 3.50
. . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . .
253 8 8 8 3 6.75
254 8 8 8 7 7.75
255 8 8 8 5 7.25
256 8 8 8 8 8.00
Proses resampling menghasilkan distribusi sampling nilai rerata
subsampel, yang diperlihatkan pada diagram IX.1.
286
Diagram IX.1. Contoh distribusi sampling nilai rerata subsampel
Dari distribusi sampling ini, interval konfidensi bootstrap dapat
ditentukan secara empiris, yaitu setelah nilai-nilainya diurutkan menurut
besarnya (di-ranking):
( )1
X , ( )2
X , . . . , ( )256
X
(lihat tabel IX.2.)
287
Tabel IX.2. Nilai-nilai rerata subsampel yang telah diurutkan menurut
besarnya
( )1X 3.00 . . . . . .
( )2X 3.50 ( )250
X 7.50
( )3X 3.50 ( )251
X 7.50
( )4X 3.50 ( )252
X 7.75
( )5X 3.50 ( )253
X 7.75
( )6X 4.00 ( )254
X 7.75
( )7X 4.00 ( )255
X 7.75
. . . . . . ( )256X 8.00
Maka interval konfidensi bootstrap 95% untuk rerata populasi µ
mencakup 95% × 256 = 243.2 nilai-nilai rerata subsampel 2.5% ekornya (kiri
dan kanan) masing-masing mencakup (256 – 243.2)/2 = 6.4 ≈ 6 nilai rerata
subsampel, sehingga interval konfidensi bootstrap 95% adalah:
[( )7
X ; ( )250
X ]
yaitu: [4.00 ; 7.50]
288
LATIHAN 9
Bagian Pertama
Pilihlah satu jawaban yang paling benar!
1. Syarat penggunaan metode Statistika Non-Parametrik yaitu:
A. Distribusi populasi tidak diketahui.
B. Ukuran sampel kecil.
C. A) dan B) benar.
D. A) dan B) salah.
2. Inferensi statistik hanya mungkin dilakukan dengan Metode Statistika
Non-Parametrik jika:
A. Ukuran sampel kecil dan distribusi populasi normal.
B. Ukuran sampel kecil dan distribusi populasi sebarang.
C. Ukuran sampel besar dan distribusi populasi normal.
D. Ukuran sampel besar dan distribusi populasi sebarang.
3. Yang merupakan padanan yang sesuai bagi uji parametrik dan uji
non-parametrik di antara pasangan berikut yaitu:
A. Uji t independen dan uji jumlah rank (rank sum) Wilcoxon.
B. Uji t berpasangan dan uji rank bertanda (sign rank) Wilcoxon,
C. ANOVA 1-arah dan uji Kruskal Wallis.
D. Semuanya benar.
Untuk soal No. 4 s.d. 11:
Tujuh orang mahasiswa mencoba sebuah diet untuk menurunkan
berat badan, dengan hasil sebagai berikut:
Mahasiswa 1 2 3 4 5 6 7
BB pra-diet 87 95 94 91 100 92 94
BB pasca-diet 82 93 91 89 101 94 90
BB: Berat badan
Hendak diuji apakah diet tersebut efektif untuk menurunkan berat badan.
4. Uji yang relevan untuk menilai efektivitas diet tersebut ialah:
A. Uji tanda C. A) dan B) benar
B. Uni rank bertanda Wilcoxon D. A) dan B) salah
289
5. Seandainya diketahui data di atas berasal dari populasi normal, maka
uji parametrik yang relevan menilai efektivitas diet adalah:
A. Uji t C. Uji t berpasangan
B. Uji Z D. Uji khi-kuadrat
6. Jika P (+) = P (BB pra-diet > BB pasca-diet), maka 0H yang sesuai
bagi uji tanda ialah:
A.
( ) ( )0 :H P P+ = −
C. ( ) ( )0 :H P P+ ≥ −
B.
( ) ( )0 :H P P+ ≤ − D. Semua salah
7. Nilai kritis untuk uji tanda diperoleh ialah:
A. Tabel Z C. Tabel khi-kuadrat
B. Tabel t D. tabel binomial
8. Pada uji tanda, dengan tingkat signifikansi 5%, nilai t yang sesuai
adalah:
A. 0 C. 2
B. 1 D. 3
9. Nilai t di atas diperoleh untuk 1α =
A. 0.0078 C. 0.0625
B. 0.0357 D. 0.1094
10. Statistik penguji untuk uji tanda adalah:
A. 1 C. 5
B. 3 D. 7
11. Daerah kritis untuk uji tanda ialah:
A. T < 1 C. T > 6
B. T < 1 D. T < 6
290
Bagian Kedua
Pilihlah satu jawaban yang paling benar!
1. Jika 1D = BB pasca-diet – BB pra-diet, maka 0H yang sesuai bagi
uji rank bertanda Wilcoxon adalah:
A.
( )0 : 0iH E D ≤
C. ( )0 : 0iH E D =
B.
( )0 : 0iH E D ≥
D. Semuanya salah
2. Dengan uji rank bertanda Wilcoxon, jumlah ties(s) adalah:
A. 0 C. 2
B. 1 D. 3
3. Nilai iR∑ dan
2
iR∑ adalah:
A. 4 dan 10 C. 20 dan 138
B. −4 dan 10 D. −20 dan 138
4. Dengan pendekatan normal, nilai statistik penguji untuk uji rank
bertanda Wilcoxon adalah:
A. 1.70ujiZ = C. 4ujiT =
B. 1.70ujiZ = − D. 20ujiT = −
5. Tanpa menggunakan pendekatan normal, nilai statistik penguji uji
rank bertanda Wilcoxon adalah:
A. 1.70ujiZ = C. 4ujiT =
B. 1.70ujiZ = − D. 20ujiT = −
6. Tanda menggunakan pendekatan normal, pada tingkat signifikansi
5% daerah kritis untuk uji rank bertanda Wilcoxon adalah:
A. T < 4 C. T > 24
B. T < 4 D. T > 24
291
7. Kesimpulan yang diperoleh pada uji hipotesis ialah:
A. Dengan uji tanda, 0H ditolak.
B. Dengan uji rank bertanda Wilcoxon (pendekatan normal), 0H
ditolak..
C. Dengan uji rank bertanda Wilcoxon (tanpa pendekatan normal),
0H ditolak.
D. Semuanya salah.
292
BAB 10
STATISTIKA NON-PARAMETRIK II
10.1. UJI JUMLAH RANK WILCOXON (WILCOXON
RANK SUM TEST; UJI MANN-WHITNEY)
Uji jumlah rank Wilcoxon (Wilcoxon rank sum test; uji Mann-
Whitney) merupakan counter part non-parametrik bagi uji t independen,
yaitu uji bagi ukuran tengah 2 populasi data independen yang berskala
kontinu atau numerik.
Uji ini dikembangkan secara terpisah oleh Wilcoxon pada tahun 1945
serta Mann dan Whitney pada tahun 1947. Perbedaan uji jumlah rank
Wilcoxon dengan uji Mann-Whitney terletak pada rumus statistik penguji
yang tampaknya berbeda, namun sebenarnya memiliki dasar pemahaman
yang sama.
Persyaratan:
� Data dua kelompok 1X , 2X , . . . , nX ; dan 1Y ,
2Y , . . . , nY ; yang
saling independen.
� Skala pengukuran sekurang-kurangnya ordinal, sehingga dapat
ditentukan nilai R ( iX ) dan R ( iY ) (ranking) untuk tiap nilai data iX
dan iY pada kelompok gabungan yang telah diurutkan.
� Dua atau lebih data yang sama disebut ties, dan diberikan peringkat
rata-ratanya.
Contoh 10.1:
Misalkan dimiliki data berikut yang hendak ditentukan rank-nya (tabel
10.1):
293
Tabel 10.1. Contoh data untuk penentuan i
R pada uji jumlah rank
Wilcoxon
X Y
7.3 6.3 4.2 12.6 11.8 16.0
12.5 11.4 2.7 5.6 8.3 1.0
9.1 3.2 15.3 5.9 14.8 4.0
Penentuan rank dilakukan sebagai berikut (tabel 10.2):
Tabel 10.2. Penentuan rank pada uji jumlah rank Wilcoxon untuk data
pada tabel 10.1
X Y Rank X Y Rank
1.0 1 8.3 10
2.7 2 9.1 11
3.2 3 11.4 12
4.0 4 11.8 13
4.2 5 12.5 14
5.6 6 12.6 15
6.3 7.5 14.8 16
6.3 7.5 15.3 17
7.3 9 16.0 18
Langkah-langkah uji hipotesis:
1. Jenis uji statistik: Uji jumlah rank Wilcoxon (uji Mann-Whitney).
2. Hipotesis:
a. 0H : E (X) = E (Y) vs 1H : E (X) ≠ E (Y) ) (10.1.a)
b. 0H : E (X) < E (Y) vs 1H : E (X) > E (Y) ) (10.1.b)
c. 0H : E (X) > E (Y) vs 1H : E (X) < E (Y) ) (10.1.c)
3. Tingkat signifikansi: α = 0.01, 0.05, atau 0.10.
4. Daerah kritis (untuk n < 20 dan m < 20):
a. 1H : E (X) ≠ E (Y) T < 2
wα
atau T > 1 2
wα−
) (10.2.a)
b. 1H : E (X) > E (Y) T > 1w α− ) (10.2.b)
c. 1H : E (X) < E (Y) T <
wα ) (10.2.c)
294
α adalah tingkat signifikansi, sedangkan nilai
wα diperoleh dari tabel
statistik uji Wilcoxon (lihat Addendum F). Nilai 1w α− diperoleh
dengan rumus:
1w α− = n (N + 1) −
wα (10.3)
Jika banyak ties, dan akan digunakan statistik penguji ujiT yang
berdistribusi normal standar, daerah kritis untuk ketiga hipotesis di atas
masing-masing adalah:
a. T ′ < −2
Zα
atau T ′ > 2
Zα
b. T ′ > Zα
c. T ′ < − Zα
5. Statistik penguji:
ujiT = 1
n
ii
R=∑ (10.4)
Jika banyak ties, ujiT dikurangi dengan reratanya dan dibagi dengan
standar deviasinya:
'
ujiT =
( )( )( )
2
2
1
1
2
1
1 4 1
uji
N
ii
NT n
nm NnmR
N N N=
+−
+−
− −∑
(10.5.a)
yang berdistribusi normal standar dengan N menyatakan ukuran sampel
seluruhnya dan 2
1
N
ii
R=∑ menyatakan penjumlahan seluruh kuadrat nilai-
nilai rank:
N = n + m (10.5.b)
dan: 2
1
N
ii
R=∑ = ( ){ } ( ){ }
22
1 1
n m
i ji j
R X R Y= =
+
∑∑
2
1
N
ii
R=∑ = ( )
2
1
n
ii
R X=
∑ + ( )2
1
m
jj
R Y=
∑ (10.5.c)
295
6. Kesimpulan: 0H ditolak jika statistik penguji terletak pada daerah
kritis dan 0H tidak ditolak jika statistik penguji tidak terletak pada
daerah kritis.
Contoh 10.2:
Lihat kembali data pada contoh 10.1. Misalkan X menyatakan nilai tes
kebugaran fisik anak desa dan Y adalah nilai tes kebugaran fisik anak kota.
Hendak diuji kebenaran dugaan bahwa kebugaran fisik anak desa lebih baik
daripada kebugaran fisik anak kota.
Uji hipotesis:
1. Jenis uji statistik: Uji jumlah rank Wilcoxon (uji Mann-Whitney).
2. Hipotesis: 0H : E (X) < E (Y)
1H : E (X) > E (Y)
3. Tingkat signifikansi: α = 0.05.
4. Daerah kritis:
Pada tabel statistik uji jumlah rank Wilcoxon untuk n = 6 dan m = 12
diperoleh 0.05w = 39. Dengan rumus
1w α− = n (N + 1) −
wα ,
diperoleh:
0.95w = n (N + 1) −
0.05w
= (6)(18 + 1) – 39 = 75
Daerah kritis adalah T > 0.95w atau T > 75.
5. Statistik penguji:
ujiT = 1
n
ii
R=∑
= 2 + 5 + 7.5 + 9 + 12 + 14 = 49.5
6. Kesimpulan: statistik penguji T = 49.5 tidak terletak pada daerah kritis,
sehingga 0H tidak ditolak dan disimpulkan pada tingkat signifikansi α
= 0.05, tidak terdapat perbedaan yang bermakna antara kebugaran fisik
anak desa dengan anak kota.
296
10.2 KOEFISIEN KORELASI SPEARMAN
Misalkan dimiliki data bivariat ( 1X ; 1Y ), ( 2X ;
2Y ), . . . , ( nX ; nY ),
maka koefisien korelasi Pearson (koefisien korelasi produk momen) antara
variabel X dan Y adalah:
Pr = xy
xx yy
S
S S
=
( )( )
( ) ( )
1
2 2
1 1
n
i ii
n n
i ii i
X X Y Y
X X Y Y
=
= =
− −
− −
∑
∑ ∑
dengan syarat iX dan iY sekurang-kurangnya berskala interval.
Pada Statistika Non-Parametrik, untuk data skala ordinal diperlukan
ukuran korelasi lain, namun dengan persyaratan umum yang serupa seperti
pada koefisien korelasi Pearson:
1. Nilai ukuran berkisar antara −1 dan +1.
2. Jika nilai-nilai X yang lebih besar cenderung berpasangan dengan nilai-
nilai Y yang lebih besar, ukuran korelasi haruslah positif, dan jika
kecenderungannya kuat maka nilai ukuran korelasi mendekati +1.
3. Jika nilai-nilai X yang lebih besar cenderung berpasangan dengan nilai-
nilai Y yang lebih kecil, ukuran korelasi haruslah negatif, dan jika
kecenderungannya kuat maka nilai ukuran korelasi mendekati −1.
4. Jika nilai-nilai X berpasangan secara acak dengan nilai-nilai Y, maka
nilai ukuran korelasi mendekati nol.
Jika nilai-nilai iX dan iY pada rumus koefisien korelasi Pearson
diganti dengan nilai-nilai rank-nya [R ( iX ) dan R ( iY )], diperoleh ukuran
koefisien korelasi rank Spearman yang dapat digunakan untuk data berskala
ordinal:
Sr =
( ) ( )
( ) ( )
2
1
2 2
1 1
1
2
1 1
2 2
n
i ii
n n
i ii i
nR X R Y n
n nR X n R Y n
=
= =
+ −
+ + − −
∑
∑ ∑
(10.6)
Jika tidak ada tie, dapat digunakan rumus yang lebih sederhana:
297
Sr = 1 −
( ) ( )
( )
2
1
2
6
1
n
i ii
R X R Y
n n
=
−
−
∑ (10.7)
atau: Sr = 1 −
( )2
6
1
T
n n − (10.7.a)
dengan: T = ( ) ( )2
1
n
i ii
R X R Y=
− ∑ (10.7.b)
Contoh 10.3:
Misalkan hendak dinilai kebenaran dugaan adanya korelasi
agresivitas antar anggota pasangan kembar ganda. Untuk itu dilakukan tes
psikologi pada 12 pasangan kembar dengan hasil skala agresivitas sebagai
berikut:
Tabel 10.3. Skor agresivitas anak lahir pertama dan anak lahir kedua
pada 12 pasangan anak kembar
i 1 2 3 4 5 6 7 8 9 10 11 12
iX 86 71 77 68 91 72 77 91 70 71 88 87
iY 88 77 76 64 96 72 65 90 65 80 81 72
iX : Skor agresivitas anak lahir pertama
iY : Skor agresivitas anak lahir kedua
Nilai-nilai R ( iX ) dan R ( iY ) adalah:
Tabel 10.4. Nilai-nilai R (i
X ) dan R ( i
Y ) untuk skor agresivitas 12
pasangan anak kembar
i 1 2 3 4 5 6 7 8 9 10 11 12
iX 8 3.5 6.5 1 11.5 5 6.5 11.5 2 3.5 10 9
iY 10 7 6 1 12 4.5 2.5 11 2.5 8 9 4.5
298
( )1
n
ii
R X=∑ = 8 ( )
2
1
n
ii
R X=∑ = 648.5
( )1
n
ii
R Y=∑ = 78 ( )
2
1
n
ii
R Y=∑ = 649
( ) ( )1
n
i ii
R X R Y=∑ = 611.25
21
2
nn
+
= 2
12 112
2
+
= 507
Koefisien korelasi Spearman adalah:
Sr =
( ) ( )
( ) ( )
2
1
2 2
1 1
1
2
1 1
2 2
n
i ii
n n
i ii i
nR X R Y n
n nR X n R Y n
=
= =
+ −
+ + − −
∑
∑ ∑
= ( )( )
611.25 507
648.5 507 649 507
−
− − = 0.736
Jika hendak digunakan rumus 10.6, terlebih dahulu dihitung nilai
( ) ( )2
i iR X R Y −
Tabel 10.5 Perhitungan nilai ( ) ( )2
-i i
R X R Y untuk skor agresivitas
12 pasangan anak kembar
i R ( iX ) R ( iY ) ( ) ( )
2
i iR X R Y −
1 8 10 4
2 3.5 7 12.25
3 6.5 s 6 0.25
4 1 1 0
5 11.5 12 0.25
6 5 4.5 0.25
7 6.5 2.5 16
8 11.5 11 0.25
9 2 2.5 0.25
10 3.5 8 20.25
11 10 9 1
12 9 4.5 20.25
T = 75
299
Koefisien korelasi Spearman dengan rumus penyederhanaan adalah:
Sr = 1 −
( )2
6
1
T
n n −
= 1 − ( )( )
( )2
6 75
12 12 1− = 0.738
Diperoleh hasil yang praktis hampir sama dengan hasil terdahulu
(perbedaan disebabkan adanya satu tie).
Dengan menggunakan nilai-nilai sesungguhnya (bukan rank),
diperoleh nilai koefisien korelasi Pearson sebesar 0.735.
300
10.3. UJI KORELASI RANK SPEARMAN
Terhadap nilai koefisien korelasi Spearman yang diperoleh dapat pula
dilakukan uji hipotesis untuk menguji apakah korelasi yang ditemukan
memiliki kemaknaan statistik. Hipotesis yang diuji yaitu:
� Uji satu-sisi:
A. 0H : X dan Y independen
1H : Nilai-nilai X yang besar cenderung berpasangan dengan
nilai-nilai Y yang besar; atau:
0H : ρ = 0 vs 1H : ρ > 0 (10.8.a)
B. 0H : X dan Y independen
1H : Nilai-nilai X yang kecil cenderung berpasangan dengan
nilai-nilai Y yang besar; atau:
0H : ρ = 0 vs 1H : ρ < 0 (10.8.b)
� Uji dua-sisi:
0H : X dan Y independen
1H : Nilai-nilai X yang besar cenderung berpasangan dengan
nilai-nilai Y yang besar, atau nilai-nilai X yang kecil
cenderung berpasangan dengan nilai-nilai Y yang besar;
atau:
0H : ρ = 0 vs 1H : ρ ≠ 0 (10.8.c)
Nilai-nilai kritisnya untuk uji satu arah dan n < 30 dapat dilihat pada
tabel nilai kritis koefisien korelasi rank Spearman (Addendum G).
Contoh 10.4:
Lihat kembali data pada contoh 10.3. Hendak diuji, apakah terdapat
korelasi yang bermakna secara statistik antara skala agresivitas anak pertama
dengan anak kedua pada pasangan kembar ganda.
301
Uji hipotesis:
1. Jenis uji statistik: Uji korelasi rank Spearman.
2. Hipotesis:
0H : X dan Y independen
1H : Nilai-nilai X yang besar cenderung berpasangan dengan nilai-
nilai Y yang besar.
3. Tingkat signifikansi: α = 0.05.
4. Daerah kritis:
Pada tabel nilai kritis koefisien korelasi rank Spearman, daerah kritis
untuk n = 12 dan tingkat signifikansi α = 0.05 adalah r > 0.4965.
5. Statistik penguji:
Statistik penguji adalah nilai koefisien korelasi itu sendiri (rumus 10.6),
yaitu:
Sr = 0.736
6. Kesimpulan: Koefisien korelasi Sr = 0.736 lebih besar daripada nilai
kritis 0.4965, sehingga 0H ditolak dan disimpulkan bahwa tingkat
signifikansi α = 0.05 terdapat korelasi yang bermakna secara statistik
antara skala agresivitas anak pertama dan kedua pada pasangan kembar
ganda.
302
LAMPIRAN 10A: STATISTIK U MANN-
WHITNEY
Dalam subbab 10.1 telah disebutkan bahwa uji Mann-Whitney dan
uji jumlah rank Wilcoxon pada hakekatnya adalah sama, walaupun keduanya
memiliki rumus perhitungan statistik penguji yang berbeda. Statistik penguji
uji Mann-Whitney, yang dikenal juga sebagai stastistik U Mann-Whitney
adalah:
ujiU = ( )1 1
;n m
i ji j
X Yφ= =∑∑ (10.8)
dengan: ( );a bφ = 1 jika
0 untuk lainnya
b a<
Secara sederhana dapat dijelaskan bahwa ( )1
;m
i jj
X Yφ=∑ menyatakan
banyaknya nilai jY yang lebih kecil daripada suatu nilai iX tertentu. Telah
dinyatakan pula dalam pembahasan subbab 10.1 bahwa statistik penguji pada
uji Mann-Whitney dan uji jumlah rank Wilcoxon adalah sama secara
matematis, dan pada contoh berikut diperlihatkan bahwa besar keduanya
adalah sama.
Contoh X.1:
Lihat kembali contoh data nilai tes kebugaran fisik anak kota dan
anak desa pada contoh 10.1. Pada contoh 10.2 telah dihitung nilai statistik
penguji untuk uji jumlah rank Wilcoxon, yaitu ujiT = 49.5.
Hubungan antara ujiT untuk uji jumlah rank Wilcoxon dengan
statistik U Mann-Whitney dapat dinyatakan sebagai:
ujiT = U + ( )1
2
n n + (10.9)
Untuk menghitung statistik U Mann-Whitney, data tersebut disajikan
kembali pada tabel X.1 di bawah ini.
303
Tabel X.1. Contoh perhitungan statistik U Mann-Whitney
X Y ( )1
;m
i jj
X Yφ=∑
1.0
2.7 1
3.2
4.0
4.2 3
5.6
6.3
6.3 4.5
7.3 5
8.3
9.1
11.4 7
11.8
12.5 8
12.6
14.8
15.3
16.0
( )1 1
;n m
i ji j
X Yφ= =∑∑ 28.5
Perhatikan bahwa:
- Ada 1 nilai Y yang lebih kecil daripada 1X = 2.7, sehingga
( )1
;m
i jj
X Yφ=∑ = 1.
- Ada 3 nilai Y yang lebih kecil daripada 2X = 4.2, sehingga
( )1
;m
i jj
X Yφ=∑ = 3.
- Ada 4 nilai Y yang lebih kecil daripada 3X = 6.3 dan 1 nilai Y yang
sama dengan 3X = 6.3, sehingga ( )1
;m
i jj
X Yφ=∑ = 4.5.
- Dan seterusnya.
304
Statistik penguji untuk uji jumlah rank Wilcoxon dapat dihitung dari
statistik U Mann-Whitney:
ujiT = U + ( )1
2
n n +
= 28.5 + ( )6 6 1
2
+ = 49.5
Jika dibandingkan dengan statistik penguji pada uji rank Wilcoxon,
statistik U Mann-Whitney lebih mudah untuk dijelaskan dan juga lebih
mudah untuk dihitung pada sampel berukuran kecil, namun untuk sampel
besar, statistik penguji pada uji jumlah rank Wilcoxon lebih praktis untuk
digunakan.
305
LATIHAN 10
Bagian Pertama
Pilihlah satu jawaban yang paling benar!
Untuk soal No. 1 s.d. 7:
Dalam sebuah laboratorium, sepuluh orang pria dan sepuluh orang
wanita dites untuk menentukan suhu ruang yang paling nyaman bagi tiap
peserta tes masing-masing. Hasil yang diperoleh yaitu:
Pria : 23,22,25,24,24,23,24,23,23,24
Wanita: 24,25,26,26,23,26,26,26,26,27
Hendak diuji apakah ada perbedaan yang bermakna antara suhu ruang
yang paling nyaman bagi pria dan wanita.
1. Seandainya diketahui bahwa suhu ruang yang paling nyaman bagi
pria dan wanita berdistribusi normal, uji paling relevan bagi data di
atas ialah:
A. Uji t
B. Uji t berpasangan
C. Uji rank bertanda Wilcoxon
D. Uji jumlah rank bertanda Wilcoxon
2. Seandainya distribusi suhu ruang yang paling nyaman bagi pria dan
wanita tidak diketahui, uji yang paling relevan bagi data di atas ialah:
A. Uji t
B. Uji t berpasangan
C. Uji rank bertanda Wilcoxon
D. Uji jumlah rank bertanda Wilcoxon
3. Jika X menyatakan suhu ruang yang paling nyaman bagi pria dan Y
suhu ruang yang paling nyaman bagi wanita, maka dengan uji
Wilcoxon, hipotesis nol yang sesuai bagi tujuan uji diatas ialah:
A. ( ) ( )0 :H E X E Y= C. ( ) ( )0 :H E X E Y≥
B. ( ) ( )0 :H E X E Y≤ D. Semuanya salah
306
4. Nilai ( )1
n
ii
R X=∑ adalah:
A. 61 C. 144
B. 66 D. 149
5. Tanpa memperhitungkan keberadaan ties, dengan tingkat signifikansi
5%, daerah kritis untuk uji hipotesis ini adalah:
A. T < 79 atau T > 131 C. T > 127
B. T < 83 D. Semuanya salah
6. Nilai statistik penguji dengan memperhitungkan keberadaan ties
ialah:
A. −0.42 C. 0.37
B. −0.37 D. 0.42
7. Dengan memperhitungkan keberadaan ties serta tingkat signifikansi
yang sama seperti pada soal No. 5, daerah kritis untuk uji hipotesis
ini adalah:
A. T ’ < −1.96 atau T ’ > 1.96 C. T ‘ > 1.64
B. T ‘ < −1.64 D. Semuanya salah
8. Kesimpulan uji hipotesis yaitu:
A. Tidak ada perbedaan yang bermakna antara suhu ruang yang
paling nyaman bagi pria dan wanita.
B. Ada perbedaan yang bermakna antara suhu ruang yang paling
nyaman bagi pria dan dan wanita.
C. Suhu ruang yang paling nyaman bagi pria secara bermakna
lebih tinggi daripada suhu ruang yang paling nyaman bagi
wanita.
D. Semuanya salah.
Untuk soal No. 9 s.d. 15:
Data di bawah ini menunjukkan kadar nikotin 16 batang rokok yang
dipilih secara acak dari 2 merek rokok.
Hendak A: 0.29,0.57,0.36,0.46,0.16,0.82,0.66,0.34
Hendak B: 0.42,0.65,0.51,0.40,0.63,0.47,1.24,0.43
Hendak diuji apakah kadar nikotin pada rokok merek A secara
bermakna lebih rendah daripada kadar nikotin pada rokok merek B.
307
9. Uji non parametrik yang paling relevan bagi di atas ialah:
A. Uji rank bertanda Wilcoxon
B. Uji jumlah rank Wilcoxon (uji Mann-Whitney)
C. Keduanya benar
D. Keduanya salah
10. Jika X menyatakan kadar nikotin pada rokok merek A dan Y kadar
nikotin pada rokok merek B, maka dengan uji Mann-Whitney,
hipotesis nol yang sesuai bagi tujuan uji di atas ialah:
A. ( ) ( )0 :H E X E Y= C. ( ) ( )0 :H E X E Y≥
B. ( ) ( )0 :H E X E Y≤ D. Semuanya salah
11. Nilai 1R = ( )1
n
iiR X
=∑ adalah:
A. 58 C. 78
B. 66 D. 136
12. Nilai ( )2
1
m
jj
R R Y=
=∑ adalah:
A. 58 C. 78
B. 66 D. 136
13. Nilai statistik U Mann-Whitney ialah:
A. 11 C. 42
B. 22 D. 96
14. Untuk uji 1-sisi, nilai p 1-sisi yang bersesuaian dengan nilai statistik
U di atas adalah:
A. p < 0.05 C. p > 0.10
B. 0.05 < p < 0.10 D. Semuanya salah
15. Pada tingkat signifikansi α = 0.05, kesimpulan uji hipotesis adalah:
A. Tidak ada perbedaan yang bermakna antara kadar nikotin
dalam rokok merek A dan rokok merek B.
B. Ada perbedaan yang bermakna antara kadar nikotin dalam
rokok merek A dan rokok merek B.
C. Kadar nikotin dalam rokok merek A secara bermakna lebih
rendah daripada kadar nikotin dalam rokok merek B.
D. Semuanya salah
308
Bagian Kedua
Pilihlah satu jawaban yang paling benar!
Untuk soal No. 1 s.d. 6:
Misalkan dimiliki data hasil tes psikologi dan hasil tes akademik
delapan orang siswa seperti terlihat di bawah ini:
Siswa 1 2 3 4 5 6 7 8
X 76 67 93 70 68 89 65 82
Y 84 57 88 62 76 65 63 74
X : Hasil tes psikologi
Y : Hasil tes akademik
1. Koefisien korelasi produk momen Pearson adalah:
A. 0.3018 C. 0.6190
B. 0.5494 D. 0.8333
2. Nilai ( ) ( )2
1
n
i ii
T R X R Y=
= − ∑ adalah:
A. 0 C. 14
B. 7 D. 32
3. Dengan rumus penyederhanaan, koefisien korelasi rank Spearman
adalah:
A. 0.5494 C. 0.7440
B. 0.6190 D. 0.9167
4. Untuk menguji ada tidaknya korelasi hasil tes psikologi dengan hasil
tes akademik adalah:
A. Uji satu-sisi untuk korelasi positif
B. Uji satu-sisi untuk korelasi negatif
C. Uji dua-sisi
D. Semuanya salah
5. Dengan tingkat signifikansi 5%, daerah kritis uji korelasi rank di sini
adalah:
A. r > 0.463 C. r > 0.619
B. r > 0.591 D. r > 0.786
309
6. Kesimpulan yang paling tepat uji korelasi rank ini adalah:
A. Ada korelasi yang bermakna secara statistik antara hasil tes
psikologi dengan hasil tes akademik.
B. Ada korelasi positif yang bermakna secara statistik antara
hasil tes psikologi dengan hasil tes akademik.
C. Ada korelasi negatif yang bermakna secara statistiok antara
hasil tes psikologi dengan hasil tes akademik.
D. Tidak ada korelasi yang bermakna secara statistik antara hasil
tes psikologi dengan hasil tes akademik.
310
KEPUSTAKAAN
Aczel AD. Complete Business Statistics. Homewood, Illinois: Richard D
Irwin, Inc, 1989.
Bhattacharyya GK, RA Johnson. Statistical Concepts and Methods. New
York: John Wiley & Sons, 1977.
Conover WJ. Practical Nonparametric Statistics, Third Edition. New York:
John Wiley & Sons, Inc, 1999.
Draper NR, H Smith. Applied Regression Analysis, Second Edition. New
York: John Wiley & Sons, Inc, 1981.
Everitt BS. The Analysis of Contingency Tables. London: Chapman and Hall,
1977.
Everitt BS. The Cambridge Dictionary of Statistics. Cambridge: Cambridge
University Press, 1998.
Fienberg SE. The Analysis of Cross-Classified Categorical Data, Second
Edition. Cambridge: The Massachusetts Institute of Technology, 1987.
Fleiss JL. Statistical Methods for Rates and Proportions, Second Edition.
New York: John Wiley & Sons, 1981.
Fox J. Linear Statistical Models and Related Methods-With Application to
Social Research. New York: John Wiley & Sons, 1984.
Harlan J. Metode Statistika 1. Jakarta: Penerbit Gunadarma, 2004.
Hollander M, DA Wolfe. Nonparametric Statistical Methods. New York:
John Wiley & Sons, 1973.
Hosmer DW, S Lemeshow. Applied Logistic Regression. New York: John
Wiley & Sons, 1989.
Kleinbaum DG, LL Kupper, KE Muller. Applied Regression Analysis and
Other Multivariable Methods, Second Edition. Boston: PWS-KENT
Publishing Company, 1988.
Lemeshow S, DW Hosmer Jr, J Klar, et al. Adequacy of Sample Size in
Health Studies. Chichester: New York: John Wiley & Sons, 1990.
Mooney CZ, RD Duval. Bootstrapping: A Nonparametric Approach to
Statistical Inference. Newbury Park: Sage Publications, 1993.
Neter J, W Wasserman. Applied Linear Statistical Models: Regression,
Analysis of Variance, and Experimental Designs. Homewood, Illinois:
Richard D Irwin, Inc, 1977.
311
Sanders DH. Statistics: A First Course, Fifth Edition. New York: McGraw-
Hill, Inc, 1995.
Siegel S. Statistik Nonparametrik untuk Ilmu-ilmu Sosial (terjemahan Z
Suyuti). Jakarta: PT Gramedia, 1986.
Snedecor GW, WG Cochran. Statistical Methods, Seventh Edition. Ames,
Iowa: The Iowa State University Press, 1982.
Steel RGD, JH Torrie. Principles and Procedures of Statistics: A Biometrical
Approach, Second Edition. Auckland: The McGraw-Hill International
Book Company, 1981.
Subiyakto H. Statistika 2. Jakarta: Penerbit Gunadarma, 1994.
Upton GJG. The Analysis of Cross-tabulated Data. Chichester: John Wiley
& Sons, 1980.
Addendum A: Distribusi Z
313
ADDENDUM A: DISTRIBUSI Z
( )P Z Zα> = α
Sumber: GEP Box, et al, Statistics for Experimenters, John Wiley & Sons, 1978.
Addendum B: Nilai Kritis Distribusi t
314
ADDENDUM B: NILAI KRITIS DISTRIBUSI t
α = ( )P t tα>
Sumber: M Merrington, Table of Percentage Points of the t-Distribution, Biometrika 32
(1941) p 300.
ADDENDUM C: NILAI KRITIS DISTRIBUSI F
( )P F Fα> = α
Nilai Kritis Distribusi F (Lanjutan)
Nilai Kritis Distribusi F (Lanjutan)
db1 : derajat bebas pembilang (numerator); db2 : derajat bebas penyebut (denominator)
Sumber: M Merrington & CM Thompson, Tables of Percentage of the Inverted Beta (F)-Distribution, Biometrika 33 (1943) pp 73-88.
318
ADDENDUM D: NILAI KRITIS DISTRIBUSI 2χχχχ
( )2 2P αχ χ> = α
Sumber: CM Thompson, Tables of Percentage Points of the2
χ -Distribution, Biometrika 32
(1941) pp 188-89.
319
ADDENDUM E: KUANTIL STATISTIK PENGUJI RANK BERTANDA WILCOXON
n
α ( )1
2
n n+ .005 .01 .025 .05 .10 .20 .30 .40 .50
4 0 0 0 0 1 3 3 4 5 10
5 0 0 0 1 3 4 5 6 7.5 15
6 0 0 1 3 4 6 8 9 10.5 21
7 0 1 3 4 6 9 11 12 14 28
8 1 2 4 6 9 12 14 16 18 36
9 2 4 6 9 11 15 18 20 22.5 45
10 4 6 9 11 15 19 22 25 27.5 55
11 6 8 11 14 18 23 27 30 33 66
12 8 10 14 18 22 28 32 36 39 78
13 10 13 18 22 27 33 38 42 45.5 91
14 13 16 22 26 32 39 44 48 52.5 105
15 16 20 26 31 37 45 51 55 60 120
16 20 24 30 36 43 51 58 63 68 136
17 24 28 35 42 49 58 65 71 76.5 153
18 28 33 41 48 56 66 73 80 85.5 171
19 33 38 47 54 63 74 82 89 95 190
20 38 44 53 61 70 83 91 98 105 210
21 44 50 59 68 78 91 100 108 115.5 231
22 49 56 67 76 87 100 110 119 126.5 253
23 55 63 74 84 95 110 120 130 138 276
24 62 70 82 92 105 120 131 141 150 300
25 69 77 90 101 114 131 143 153 162.5 325
26 76 85 99 111 125 142 155 165 175.5 351
27 84 94 108 120 135 154 167 178 189 378
28 92 102 117 131 146 166 180 192 203 406
29 101 111 127 141 158 178 193 206 217.5 435
30 110 121 138 152 170 191 207 220 232.5 465
31 119 131 148 164 182 205 221 235 248 496
32 129 141 160 176 195 219 236 250 264 528
33 139 152 171 188 208 233 251 266 280.5 561
34 149 163 183 201 222 248 266 282 297.5 595
35 160 175 196 214 236 263 283 299 315 630
36 172 187 209 228 251 279 299 317 333 666
37 184 199 222 242 266 295 316 335 351.5 703
38 196 212 236 257 282 312 334 353 370.5 741
39 208 225 250 272 298 329 352 372 390 780
40 221 239 265 287 314 347 371 391 410 820
41 235 253 280 303 331 365 390 411 430.5 861
42 248 267 295 320 349 384 409 431 451.5 903
43 263 282 311 337 366 403 429 452 473 946
44 277 297 328 354 385 422 450 473 495 990
45 292 313 344 372 403 442 471 495 517.5 1035
46 308 329 362 390 423 463 492 517 540.5 1081
47 324 346 379 408 442 484 514 540 564 1128
48 340 363 397 428 463 505 536 563 588 1176
49 357 381 416 447 483 527 559 587 612.5 1225
50 374 398 435 467 504 550 583 611 637.5 1275
Sumber: HL Harter & DB Owen, Selected Tables in Mathematical Statistics, Vol. 1 (1970).
Untuk α > 0.50: wα
= ( )1
2
n n+ ‒
1w
α−
320
ADDENDUM F: KUANTIL STATISTIK PENGUJI JUMLAH RANK WILCOXON
P (T < wα
) < αααα
n ∝∝∝∝ m
2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
2 0.001 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3
0.005 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 4 4
0.01 3 3 3 3 3 3 3 3 3 3 3 4 4 4 4 4 4 5 5
0.025 3 3 3 3 3 3 4 4 4 5 5 5 5 5 5 6 6 6 6
0.05 3 3 3 4 4 4 5 5 5 5 6 6 7 7 7 7 8 8 8
0.10 3 4 4 5 5 5 6 6 7 7 8 8 8 9 9 10 10 11 11
3 0.001 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 7 7 7 7
0.005 6 6 6 6 6 6 6 7 7 7 8 8 8 9 9 9 9 9 10
0.01 6 6 6 6 6 7 7 8 8 8 9 9 9 10 10 11 11 11 12
0.025 6 6 6 7 8 8 9 9 10 10 11 11 12 12 13 13 14 14 15
0.05 6 7 7 8 9 9 10 11 11 12 12 13 14 14 15 16 16 17 18
0.10 7 8 8 9 10 11 12 12 13 14 15 16 17 17 18 19 20 21 22
4 0.001 10 10 10 10 10 10 10 10 11 11 11 12 12 12 13 13 14 14 14
0.005 10 10 10 10 11 11 12 12 13 13 14 14 15 16 16 17 17 18 19
0.01 10 10 10 11 12 12 13 14 14 15 16 16 17 18 18 19 20 20 21
0.025 10 10 11 12 13 14 15 15 16 17 18 19 20 21 22 22 23 24 25
0.05 10 11 12 13 14 15 16 17 18 19 20 21 22 23 25 26 27 38 29
0.10 11 12 14 15 16 17 18 20 21 22 23 24 26 27 28 29 31 32 33
5 0.001 15 15 15 15 15 15 16 17 17 18 18 19 19 20 21 21 22 23 23
0.005 15 15 15 16 17 17 18 19 20 21 22 23 23 24 25 26 27 28 29
0.01 15 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32
0.025 15 16 17 18 19 21 22 23 24 25 27 28 29 30 31 33 34 35 36
0.05 16 17 18 20 21 22 24 25 27 28 29 31 32 34 35 36 38 39 41
0.10 17 18 20 21 23 24 26 28 29 31 33 34 36 38 39 41 43 44 46
321
KUANTIL STATISTIK PENGUJI JUMLAH RANK WILCOXON (Lanjutan)
n ∝∝∝∝ m
2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
6 0.001 21 21 21 21 21 21 23 24 25 26 26 27 28 29 30 31 32 33 34
0.005 21 21 22 23 24 25 26 27 28 29 31 32 33 34 35 37 38 39 40
0.01 21 21 23 24 25 26 28 29 20 31 33 34 35 37 38 40 41 42 44
0.025 21 23 24 25 27 28 30 32 33 35 36 38 39 41 43 44 46 47 49
0.05 22 24 25 27 29 30 32 34 36 38 39 41 43 45 47 48 50 52 54
0.10 23 25 27 29 31 33 35 37 39 41 43 45 47 49 51 53 56 58 60
7 0.001 28 28 28 28 29 30 31 32 34 35 36 37 38 39 40 42 43 44 45
0.005 28 28 29 30 32 33 35 36 38 39 41 42 44 45 47 48 50 51 53
0.01 28 29 30 32 33 35 36 38 40 41 43 45 46 48 50 52 53 55 57
0.025 29 31 33 35 37 40 42 44 46 48 50 53 55 57 59 62 64 66 68
0.05 29 31 33 35 37 40 42 44 46 48 50 53 55 57 59 62 64 66 68
0.10 30 33 35 37 40 42 45 47 50 52 55 57 60 62 65 67 70 72 75
8 0.001 36 36 36 37 38 39 41 42 43 45 46 48 49 51 52 54 55 57 56
0.005 36 36 38 39 41 43 44 46 48 50 52 54 55 57 59 61 63 65 67
0.01 36 37 39 41 43 44 46 48 50 52 54 56 59 61 63 65 67 69 71
0.025 37 39 41 43 45 47 50 52 54 56 59 61 63 66 68 71 73 75 78
0.05 38 40 42 45 47 50 52 55 57 60 63 65 68 70 73 76 78 81 84
0.10 39 42 44 47 50 53 56 59 61 64 67 70 73 76 79 82 85 88 91
9 0.001 45 45 45 47 48 49 51 53 54 56 58 60 61 63 65 67 69 71 72
0.005 45 46 47 49 51 53 55 57 59 62 64 66 68 70 73 75 77 79 82
0.01 45 47 49 51 53 55 57 60 62 64 67 69 72 74 77 79 82 84 86
0.025 46 48 50 53 56 58 61 63 66 69 72 74 77 80 83 85 88 91 94
0.05 47 50 52 55 58 61 64 67 70 73 76 79 82 85 88 91 94 97 100
0.10 48 51 55 58 61 64 78 71 74 77 81 84 87 91 94 98 101 104 108
10 0.001 55 55 56 57 59 61 62 64 66 68 70 73 75 77 79 81 83 85 88
0.005 55 56 58 60 62 65 67 69 72 74 77 80 82 85 87 90 93 95 98
0.01 55 57 59 62 64 67 69 72 75 78 80 83 86 89 92 94 97 100 103
0.025 59 62 66 69 73 77 80 84 88 92 95 99 103 107 110 114 118 122 126
0.05 57 60 63 67 70 73 76 80 83 87 90 93 97 100 104 107 111 114 118
0.10 59 62 66 69 73 77 80 84 88 92 95 99 103 107 110 114 118 122 126
322
KUANTIL STATISTIK PENGUJI JUMLAH RANK WILCOXON
(Lanjutan)
n ∝∝∝∝ m
2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
11 0.001 66 66 67 69 71 73 75 77 79 82 84 87 89 91 94 96 99 101 104
0.005 66 67 69 72 74 77 80 83 85 88 91 94 97 100 103 106 109 112 115
0.01 66 68 71 74 76 79 82 85 89 92 95 98 101 104 108 111 114 117 120
0.025 67 70 73 76 80 83 86 90 93 97 100 104 107 111 114 118 122 125 129
0.05 68 72 75 79 83 86 90 94 98 101 105 109 113 117 121 124 128 132 136
0.10 70 74 78 82 86 90 94 98 103 107 111 115 119 124 128 132 136 140 145
12 0.001 78 78 79 81 83 86 88 91 93 96 98 102 104 106 110 113 116 118 121
0.005 78 80 82 85 88 91 94 97 100 103 106 110 113 116 120 123 126 130 133
0.01 78 81 84 87 90 93 86 100 103 107 110 114 117 121 125 128 132 135 139
0.025 80 83 86 90 93 97 101 105 108 112 16 120 124 128 132 136 140 144 148
0.05 81 84 88 92 96 100 105 109 111 117 121 126 130 134 139 143 147 151 156
0.10 83 87 91 96 100 105 109 114 118 123 128 132 137 142 146 151 156 160 165
13 0.001 91 91 93 95 97 100 103 106 109 112 115 118 121 124 127 130 134 137 140
0.005 91 93 95 99 102 105 109 112 116 119 123 126 130 134 137 141 145 149 152
0.01 92 94 97 101 104 108 112 115 119 123 127 131 135 149 143 147 151 155 159
0.025 93 96 100 104 108 112 116 120 125 129 133 137 142 146 151 155 159 164 168
0.05 94 98 102 107 111 116 120 125 129 134 139 143 148 153 157 162 167 172 176
0.10 96 101 105 110 115 120 125 130 135 140 145 150 455 160 166 171 176 181 186
14 0.001 105 105 104 109 112 115 118 121 125 128 131 135 138 142 145 149 152 156 160
0.005 105 107 110 113 117 121 124 128 132 136 140 144 148 152 156 160 164 169 173
0.01 106 111 115 119 123 128 132 137 142 146 151 156 161 165 170 175 181 184 189
0.025 107 111 115 119 123 128 132 137 142 146 151 156 161 168 170 175 180 184 189
0.05 109 113 117 122 127 132 137 145 147 152 157 162 167 172 177 183 188 193 198
0.10 110 116 121 126 131 137 142 147 153 158 164 169 175 180 186 191 197 203 208
15 0.001 120 120 122 125 128 133 135 158 142 145 149 153 157 161 164 168 172 176 180
0.005 120 123 126 129 133 137 141 145 150 154 158 163 167 172 176 181 185 190 194
0.01 121 124 128 132 136 140 145 149 154 158 163 168 175 177 182 187 191 196 201
0.025 122 126 131 135 140 145 150 155 160 498 170 175 181 185 194 496 201 206 211
0.05 124 128 133 139 155 159 154 160 165 171 176 182 187 193 198 204 209 215 221
0.10 126 131 137 143 148 154 160 166 172 178 184 189 195 201 207 213 219 225 231
323
KUANTIL STATISTIK PENGUJI JUMLAH RANK WILCOXON (Lanjutan)
n ∝∝∝∝ m
2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
16 0.001 136 136 139 142 145 148 152 156 160 164 168 172 176 180 195 189 193 197 202
0.005 136 139 142 146 150 155 159 164 168 173 178 182 187 192 197 101 107 211 216
0.01 137 140 144 149 153 158 163 168 173 178 183 188 193 198 203 208 213 219 224
0.025 138 143 148 152 158 163 168 174 179 184 190 196 201 207 212 218 223 229 235
0.05 140 145 151 156 162 167 173 179 185 191 197 202 208 214 220 226 232 238 244
0.10 142 148 154 160 166 173 179 185 191 198 204 211 217 223 130 136 243 149 256
17 0.001 153 154 156 159 163 167 171 175 179 183 188 192 197 201 206 211 215 220 224
0.005 153 156 160 164 169 179 179 183 188 193 198 203 208 214 219 224 229 235 240
0.01 154 158 162 167 172 177 182 187 192 198 203 109 214 220 225 231 236 242 247
0.025 156 160 165 171 176 182 188 193 199 205 211 217 223 229 235 241 247 253 259
0.05 157 163 169 174 180 187 193 199 205 211 218 224 231 237 243 250 256 263 269
0.10 160 166 172 179 185 192 199 206 212 219 226 233 239 246 253 260 167 274 281
18 0.001 171 172 175 178 182 186 190 195 199 204 209 214 218 223 228 233 238 243 243
0.005 171 174 178 183 188 193 193 203 204 214 219 225 230 236 242 247 253 259 264
0.01 172 176 181 186 191 196 202 208 213 219 225 231 237 242 248 254 260 266 272
0.025 174 179 184 190 196 202 208 214 220 227 233 239 246 252 258 265 271 278 284
0.05 176 181 188 194 200 207 213 220 227 233 240 247 254 260 267 274 281 288 295
0.10 178 185 192 199 206 213 220 227 234 241 249 256 263 270 278 285 292 300 307
19 0.001 190 191 194 198 202 206 211 216 220 225 231 236 241 246 251 257 262 268 273
0.005 191 194 198 203 208 213 219 224 230 236 242 248 254 260 265 272 278 284 290
0.01 192 195 200 206 211 217 223 229 235 241 247 254 260 266 273 279 285 195 298
0.025 193 198 204 210 216 223 229 236 243 249 256 263 269 276 283 290 297 304 310
0.05 195 201 208 214 221 228 235 242 249 256 263 271 278 285 292 300 307 314 321
0.10 198 205 242 249 227 234 242 249 257 264 272 280 288 295 303 300 319 326 334
20 0.001 210 211 214 218 223 227 232 237 243 248 253 259 265 270 276 281 287 293 299
0.005 211 214 219 224 229 235 241 247 253 259 265 271 278 284 290 297 303 310 216
0.01 212 216 221 227 233 239 245 251 258 264 271 278 284 291 298 304 311 318 325
0.025 213 219 225 231 238 245 251 250 266 273 280 287 294 301 309 316 323 330 338
0.05 215 222 229 236 243 250 258 265 273 280 288 295 303 311 318 326 334 341 349
0.10 218 226 233 241 249 257 265 273 281 289 297 305 313 321 330 338 346 354 362
Sumber: WJ Conover, Practical Nonparametric Statistics,3rd
Ed, John Wiley & Sons, 1999.
ADDENDUM G: NILAI KRITIS KOEFISIEN KORELASI SPEARMAN
n α
0.10 0.05 0.025 0.01 0.005 0.001
4 0.8000 0.8000
5 0.7000 0.8000 0.9000 0.9000
6 0.6000 0.7714 0.8286 0.8857 0.9429
7 0.5357 0.6786 0.7500 0.8571 0.8929 0.9643
8 0.5000 0.6190 0.7143 0.8095 0.8571 0.9286
9 0.4667 0.5833 0.6833 0.7667 0.8167 0.9000
10 0.4424 0.5515 0.6364 0.7333 0.7818 0.8667
11 0.4182 0.5273 0.6091 0.7000 0.7455 0.8364
12 0.3986 0.4965 0.5804 0.6713 0.7203 0.8112
13 0.3791 0.4780 0.5549 0.6429 0.6978 0.7857
14 0.3626 0.4593 0.5341 0.6220 0.6747 0.7670
15 0.3500 0.4429 0.5179 0.6000 0.6500 0.7464
16 0.3382 0.4265 0.5000 0.5794 0.6324 0.7265
17 0.3260 0.4118 0.4853 0.5637 0.6152 0.7083
18 0.3148 0.3994 0.4696 0.5480 0.5975 0.6904
19 0.3070 0.3895 0.4579 0.5333 0.5825 0.6737
20 0.2977 0.3789 0.4451 0.5203 0.5684 0.6586
21 0.2909 0.3688 0.4351 0.5078 0.5545 0.6455
22 0.2829 0.3597 0.4241 0.4963 0.5426 0.6318
23 0.2767 0.3518 0.4150 0.4852 0.5306 0.6186
24 0.2704 0.3435 0.4061 0.4748 0.5200 0.6070
25 0.2646 0.3362 0.3977 0.4654 0.5100 0.5962
26 0.2588 0.3299 0.3894 0.4564 0.5002 0.5856
27 0.2540 0.3236 0.3822 0.4481 0.4915 0.5757
28 0.2490 0.3175 0.3749 0.4401 0.4828 0.5660
29 0.2443 0.3113 0.3685 0.4320 0.4744 0.5567
30 0.2400 0.3059 0.3620 0.4251 0.4665 0.5479
Sumber GJ Glasser &RF Winter, Critical Values of The Coefficient of Rank Correlation for
Testing the Hypothesis of Independence, Biometrika 48 (1961) pp 444-448 (Appendix).
top related