bab 7. analisis korelasi dan regresi p · pdf fileberikut adalah contoh pasangan data fiktif...
Embed Size (px)
TRANSCRIPT

Kompetensi 181
BAB 7. ANALISIS KORELASI DAN REGRESI
eneliti sering dihadapkan pada data yang memiliki banyak peubah
(misalnya data Nilai ujian nasional, terdiri atas beberapa peubah seperti
jenis kelamin, identitas institusi, nilai ujian beberapa mata pelajaran).
Dalam hal data mengandung banyak peubah, seseorang peneliti mungkin
tertarik untuk mengetahui (menguji) apakah suatu peubah berhubungan dengan
peubah lainnya, baik dengan menghitung sebatas pada derajat asosiasi melalui
analisis korelasi, maupun dengan menentukan bentuk fungsi/model hubungannya
melalui analisis regresi. Pada bab ini akan dibahas analisis korelasi dan regresi
sederhana.
KOMPETENSI
Setelah menyelesaikan materi pada bab ini pembaca dapat menghitung korelasi
produk momen, memahami maknanya, dapat melakukan analisi regresi baik
dengan satu maupun banyak peubah, serta dapat menginterpretasikan hasilnya.
MATERI
Korelasi Produk Momen
Analisis regresi sederhana
P

182 ANALISIS KORELASI DAN REGRESI
Analisis regresi peubah ganda
Pengantar analisi regresi modern
7.1 ANALISIS KORELASI
Dalam analisis korelasi, kita menghitung derajat asosiasi antara satu peubah dengan
peubah lain (misalnya antara berat badan dan tinggi badan, antara berat badan
dengan kolesterol, antara nilai IQ dengan perolehan nilai ujian mata pelajaran
matematika dan sebagainya). Ada dua jenis ukuran korelasi yang banyak dipakai
yaitu:
1. Korelasi produk momen Pearson untuk mengukur derajat asosiasi antara
beberapa peubah dengan skala interval atau rasio.
2. Korelasi Spearman untuk mengukur derajat asosiasi antara beberapa peubah
dengan skala ordinal (rank).
Koefisien korelasi atau derajat asosiasi dua peubah (dinotasikan dengan r)
dihitung dengan rumus pada Pers. 7.1 yang sesungguhnya identik dan merupakan
modifikasi dari rumus pada Pers. 3.12.
Pers. 7.1 1 1 12 2
2 2
1 1 1 1
1
1 1
n n n
i i i ii i i
n n n n
i i i ii i i i
x y x ynr
x x y yn n
= = =
= = = =
−=
⎛ ⎞ ⎛ ⎞− −⎜ ⎟ ⎜ ⎟⎝ ⎠ ⎝ ⎠
∑ ∑ ∑
∑ ∑ ∑ ∑

Analisis Korelasi 183
Besarnya r berkisar antara 1 1r− ≤ ≤ . Ilustrasi grafik sebaran data dengan berbagai
nilai korelasi dapat disajikan dalam bentuk diagram pencar. Bentuk pencaran data
terkait dengan besarnya korelasi dapat diilustrasikan seperti pada Gambar 7.1.
1. Korelasi negatif menunjukan bahwa kedua peubah (X dan Y) memiliki
kecenderungan yang berlawanan (yaitu kenaikan nilai X, diikuti dengan
penurunan nilai Y, demikian juga sebaliknya penurunan nilai X diikuti dengan
kenaikan nilai Y), seperti pada Gambar 7.1 (a) dan Gambar 7.1 (b). Nilai r = -
1 menunjukkan kedua peubah berkorelasi negatif secara sempurna. Sebaran
data tepat membentuk garis lurus (hal yang dalam kenyatan jarang terjadi).
2. Korelasi nol (r=0) menunjukan bahwa kedua peubah tidak berkorelasi, yaitu
kenaikan atau penurunan nilai peubah X, tidak mempengaruhi nilai peubah Y,
seperti pada Gambar 7.1 (c).
3. Korelasi positif menunjukan bahwa kedua peubah memiliki kecenderungan
yang sama, yaitu kenaikan nilai X, diikuti dengan kenaikan nilai Y, demikian
juga sebaliknya penurunan nilai X diikuti dengan penurunan nilai Y,
sebagaimana diilustrasikan pada Gambar 7.1 (d), Gambar 7.1 (e) dan
Gambar 7.1 (f). Nilai r = 1 menunjukkan kedua peubah berkorelasi positif
secara sempurna.

184 ANALISIS KORELASI DAN REGRESI
40 45 50 55
-110
-100
-90
-80
(a) r=-0.99
X
Y
40 45 50 55
-120
-100
-90
-80
(b) r=-0.75
XY
40 45 50 55
-2-1
01
23
(c) r=0
X
Y
40 45 50 55
7080
9010
012
0
(d) r=0.60
X
Y
40 45 50 55
7080
9010
011
012
0(e) r=0.70
X
Y
40 45 50 55
8090
100
110
(f) r=0.99
X
Y
Gambar 7.1 Diagram pencar data (X,Y) dengan berbagai nilai korelasi
7.1.1 MENGHITUNG KORELASI SECARA MANUAL
Untuk ukuran sampel yang relatif kecil, perhitungan koefisien korelasi secara
manual menggunakan persamaan (8.1) masih mungkin dilakukan. Adanya Sebelum
komputer atau kalkulator, perhitungan secara manual banyak juga dilakukan
dengan mengunakan teknik yang disebut peta korelasi (lihat misalnya Hadi [8]).

Analisis Korelasi 185
Contoh 7.1
Berikut adalah contoh pasangan data fiktif dengan jumlah pasangan 10 sehinga
masih mungkin dihitung secara manual.
x y xy x2 y2 8 5.00 40 64 25
10 4.00 40 100 16 5 3.00 15 25 9 6 3.00 18 36 9 7 4.00 28 49 16 8 4.00 32 64 16 9 5.00 45 81 25 5 3.00 15 25 9
10 5.00 50 100 25 4 2.00 8 16 4
72 38 291 560 154 x∑ y∑ xy∑ 2x∑ 2y∑
7.2 3.8 29.1 56 15.4 x∑ /n y∑ /n xy∑ /n
2x∑ /n 2y∑ /n
Hasil perhitugan pada tabel di atas selanjutnya dimasukkan ke dalam rumus pada
persamaan 8.1 sehingga diperoleh:
2 2
291 1/10 72 38 17,4 0,8719,98560 72 /10 154 38 /10
r − × ×= = =
− −
Hasil yang sama diperoleh dengan menghitung mengunakan R.
7.1.2 MENGHITUNG KORELASI DENGAN RCOMMANDER
Ada dua macam korelasi yang dapat dihitung melalui RCommander, yaitu
1. Matriks korelasi yang sekaligus menghitung korelasi beberapa (lebih dari dua)
peubah (lihat Gambar 7.2).

186 ANALISIS KORELASI DAN REGRESI
2. Uji korelasi untuk menghitung dan menguji korelasi antara dua peubah. Dengan
uji ini kita dapat menguji apakah korelasi antara dua peubah signifikan atau
dapat diabaikan (Gambar 7.3).
Gambar 7.2 Menu dialog Matriks Korelasi untuk korelasi Pearson dan Spearman
Berikut adalah hasil keluaran matriks korelasi untuk empat peubah. Dalam matriks
ini yang dihitung hanya besarnya korelasi tanpa ada uji apakah korelasinya
bermakna atau tidak.
NFis NIng NMat Pkn
NFis 1.0000000 0.3040950 0.8152343 0.3533408
NIng 0.3040950 1.0000000 0.2653100 0.7178789
NMat 0.8152343 0.2653100 1.0000000 0.4906039
Pkn 0.3533408 0.7178789 0.4906039 1.0000000

Analisis Korelasi 187
Gambar 7.3 Menu dan Dialog Uji Korelasi Pearson dan Spearman
Salah satu korelasi dari empat peubah (misalnya antara NFis dengan Nmat) di atas
dapat diuji lebih jauh melalui uji korelasi. Hasil analisisnya adalah sebagai berikut
ini.
1. Pearson's product-moment correlation
2. data: DataSim$NFis and DataSim$NMat
3. t = 12.4323, df = 78, p-value < 2.2e-16
4. alternative hypothesis: true correlation is not equal to 0
5. 95 percent confidence interval:
0.7254628 0.8777313
6. sample estimates:
cor
0.8152343
Keterangan
1. Judul uji yaitu Uji korelas produk momen dari Pearson

188 ANALISIS KORELASI DAN REGRESI
2. Nama data dan peubah yang korelasinya diuji, yaitu data “DataSim” varianel
“NFis” dan “NMat”.
3. Besarnya nilai t hitung (12,43), derajat kebebasan (78) dan nilai peluang p
(<1%, yang berarti sangat signifikan).
4. Rumusan hipotesis alternatif (yaitu korelasi tidak sama dengan 0)
5. Interval keyakinan 95% dari korelasi populasi yaitu [0,73; 0,88].
6. Korelasi sampel (cor), yaitu 0,82 yang secara manual pada prinsipnya dapat
dihitung dengan menggunakan rumus pada persamaan Pers. 7.1.
Dari hasil uji dapat disimpulkan bahwa nilai korelasi kedua peubah tersebut adalah
0,82. Hasil ini sangat signifikan (p-value < 2.2e-16). Interval keyakinan 95%
korelasi populasi adalah 0,73 0,88.r≤ ≤
Koefisien korelasi hanya mengukur derajat asosiasi asosiasi dua peubah acak, yaitu
menjelaskan tren umum apakah kenaikan atau penurunan nilai pada salah satu
peubah akan diikuti dengan kenaikan atau penurunan pada nilai peubah yang lain.
Analisis korelasi belum bisa dijadikan alat untuk memprediksi nilai suatu peubah
apabila nilai peubah yang lain diketahui. Jika kepentingannya adalah untuk
memprediksi nilai suatu peubah berdasarkan nilai peubah yang lain, maka harus
dilakukan uji regresi.
7.2 ANALISIS REGRESI SEDERHANA
Jika dalam analisis korelasi peneliti hanya tertarik pada derajat asosiasi atau
kecenderungan umum dua buah peubah atau lebih, maka dalam analisis regresi
peneliti ingin memperoleh hubungan fungsional antara dua peubah yang
dinyatakan dalam bentuk ,Y a bX= + yang merupakan penduga dari fungsi yang
ada pada populasi yang biasa dinotasikan dengan 0 1, atau = ,Y X Y Xα β β β= + +
atau untuk peubah bebas lebih dari satu dinyatakan sebagai
0 1 1 2 2= ,...Y X Xβ β β+ + Melalui analisis regresi peneliti ingin menghitung nilai

Analisis Regresi Sederhana 189
penduga untuk jβ yang sesuai dengan data. Selain melakukan penghitungan nilai
penduga untuk jβ juga sekaligus melakukan uji apakah nilainya signifikan atau
dapat diabaikan (tidak signifikan).
Analisis regresi sederhana hanya terdiri atas satu peubah bebas (peubah
penjelas/eksplanatori) X dan satu peubah terikat (respon) Y dengan hubungan linier.
Kedua peubah ini merupakan peubah kuantitatif, khusus untuk Y harus dengan
skala interval atau rasio. Dengan visualisasi secara geometris (lihat Gambar 7.9)
dapat ditafsirkan bahwa dengan analisis regresi kita ingin menduga garis populasi
yang sesungguhnya tidak pernah diketahui (garis lurus putus-putus) berdasarkan
sampel pasangan data pada sampel. Persoalanvini merupakan persoalan estimasi uji
inferensi daam regresi. Garis regresi penduga ini dapat dipergunakan untuk
meramal (prediksi) rentang rata-rata nilai Y pada saat nilai X diketahui, demikian
juga rentang nilai-nilai Y pada saat nilai tertentu dari X .Persoalan yang terakhirt ini
merupakan persoalan prediksi dalam regresi

190 ANALISIS KORELASI DAN REGRESI
0 5 10 15 20 25
050
100
150
Diagram Pencar & Sabuk Keyakinan
x
y
Gambar 7.4 Ilustrasi Garis regresi populasi, regresi penduga dengan sabuk keyakinannya.
7.2.1 ESTIMASI DAN UJI INFERENSI PARAMETER REGRESI
Pendugan dengan metode statistika selain menghasilkan dugaan berupa garis
(garis lurus langsung), juga menghasilkan batas simpangan garis secara
keseluruhan yang membentuk sabuk keyakinan. Secara umum, pendugaan
termasuk baik, jika garis populasi masih berada didalam batas sabuk keyakinan
yang terbentuk. Secara geometris, kita mencari garis yang menjadi penduga garis
regresi populasi, adalah garis yang paling mewakili sebaran data yang kita miliki.

Analisis Regresi Sederhana 191
Garis yang paling mewakili adalah garis lurus sedemikian sehingga simpangan
titik-titik data terhadap garis menjadi minimum. Salah satu cara menentukan
penduga garis ini adalah dengan metode kuadrat terkecil yang pada dasarnya
meminumkan bentuk kuadrat
[ ]220 1( ) ,i iQ e y xβ β= = − +∑ ∑
terhadap parameter jβ untuk j=1,2. Dengan kata lain kita mencari 0 1,β β
sedemikian sehingga Pers. 7.2 memcapai nilai minimum.
Pers. 7.2 ( )2
0 11
n
ee ii
s y xβ β=
⎡ ⎤= − +⎣ ⎦∑
Penurunan secara matematus menghasilkan
Pers. 7.3 0 1 ,y xβ β= −) )
Pers. 7.4 1 1 11 2
2
1 1
1/,
1/
n n n
i i i ii i i
n n
i ii i
x y n x y
x n xβ = = =
= =
−=
⎛ ⎞− ⎜ ⎟⎝ ⎠
∑ ∑ ∑
∑ ∑
)
Pers. 7.5 1 ,xy
xx
ss
β =)
dengan
Pers. 7.6
2
2 11 1
1 1
,
nn n
ii in nii i
xy i i xx ii i
xx ys x y s x
n n== =
= =
⎛ ⎞⎜ ⎟⎝ ⎠= − = −∑∑ ∑
∑ ∑
Jika rumus pada Pers. 7.4 dikaitkan dengan rumus pada Pers. 8.1, maka dengan
pengetahuan matematika yang mencukupi dapat ditunjukkan bahwa
Pers. 7.7 1 ,xxy
y
srs
β =)
dengan ;x xx y yys s s s= =

192 ANALISIS KORELASI DAN REGRESI
Oleh karena sx dan sy adalah nonnegatif, maka tanda tanda koefisien regresi
(positif atau negatif) sama dengan koefisien korelasi. Selanjutnya dari Pers. 8.2 dan
8.3 diperoleh hubungan
1ee yy xys s sβ= − ,
dengan
2
2 1
1
n
ini
yy ii
ys y
n=
=
⎛ ⎞⎜ ⎟⎝ ⎠= −∑
∑ .
Selanjutnya penduga ragam populasi
Pers. 7.8 2σ = 2
2eess
n=
−.
Hal ini dijadikan dasar perhitungan kesalahan baku untukpenduga koefisien regresi
dengan memperhatikan bahwa:
1. Y adalah peubah acak dengan ragam 2,σ sementara X bukanlah peubah acak,
dan.
2. 2var( ) var( )ay c a y+ = untuk a dan c konstanta, maka kesalahan baku masing-
masing penduga adalah
Pers. 7.9 1 0
2 22 2 2 1,dan
xx xx
s xs s ss n sβ β
⎛ ⎞= = +⎜ ⎟
⎝ ⎠
3. rasio 1 1/ sββ)
dan 0 0/ sββ)
masing-masing menghasilkan distribusi t dengan
derajat kebebasan (n-2).
4. Sedangkan uji keseluruhan /( 2)
xx
ee
sFs n
=−
menghasilkan distribusi F dengan
derajat kebebasan (1,n-2). Secara praktis F diperoleh dari 21tβ

Analisis Regresi Sederhana 193
Selain melalui uji, kemanfaatan garis regresi yang diperoleh juga dilihat dari
besarnya koefisien determinasi (kuadrat korelasi). Garis regresi akan semakin baik,
jika nilai koefisien determinasinya mendekati 1. Dalam buku ini pembahasan lebih
difokuskan pada interpretasi hasil perhitungan dengan menggunakan komputer.
Prosedur pengujian analisis regresi sederhana adalah seperti berikut ini.
1. Rumusan Tujuan
Untuk menguji apakah ada hubungan atau hubungan linier signifikan antara
dua peubah yang ditunjukkan oleh 0 1Y a bX X Xα β β β= + = + = +) ) )) .
2. Asumsi
a. Data peubah respons Y bedistribusi Normal dengan ragam konstan
b. Sisa (residu), yaitu selisih antara data asli dengan garis regresi
berdistribusi normal dengan nilai-tengah nol dan ragam konstan.
c. Hubungan antara peubah X dan Y bersifat linier.
3. Rumusan Hipotesis untuk masing-masing koefisien
a. Hipotesis nihil
Ho: semua koefisien koefisien regresi sama dengan 0.
b. Ha untuk uji dua arah (two tails test)
Ha: Tidak semua semua koefisien regresi sama dengan 0.
4. Rumusan Hipotesis untuk uji keseluruhan
a. Hipotesis nihil
Garis regresi yang diperoleh tidak signifikan
b. Hipotesis alternatif

194 ANALISIS KORELASI DAN REGRESI
Garis regresi yang diperoleh signifikan
5. Rumus Manual (lihat persamaan-persamaan sebelumnya)
6. Kriteria
a. Uji masing-masing koefisien dilakukan dengan melihat nilai tmasing-
masing koefisien atau berdasarkanb p-value-nya. Berdasarkan nilai
kritis ,2, / 2nt α− untuk hipotesis dua arah, Ho ditolak jika dan hanya jika
2, / 2| | .hitung nt t α−≥ Sedangkan berdasarkan nilai p (p-value), Ho ditolak
dan Ha diterima jika p-value < 5%. Perhatikan bahwa nilai p berubah
sesuai jenis hipotesis alternatif yang dipilih (satu atau dua arah).
Kriteria ini yang banyak diimplemantasikan pada paket-paket statistika.
b. Uji keseluruhan dengan melihat nilaistatistik F dan menolak Ho
Secara grafis, contoh sebaran data asli dan sisa yang ideal memenuhi asumsi dapat
dilihat pada Gambar 7.5. Pada gambar tersebut terlihat bahwa data dan sisa
menyebar dengan lebar dari kiri ke kanan relatif sama (ragam konstan) dan
mengikuti garis lurus.
10 15 20 25 30
3040
5060
Sebaran Data Asli
x
y
30 40 50 60
-10
-50
510
Sisa
pred
sisa
Gambar 7.5 Diagram Pencar Data Asli (sebelah kiri) dan Sisa (sebelah kanan)
Contoh 7.2
Jika data pada Contoh 7.1 diteruskan dengan perhitungan koefisien regresi maka
akan diperoleh

Analisis Regresi Sederhana 195
( )
2
1 22
1/
1/
291 1/10 72 38 17,4 = = =0,48 41,6560-72 /10
i i i i
i i
x y n x y
x n xβ
−=
−
− × ×
∑ ∑ ∑
∑ ∑)
Sementara itu,
10 1/
= 3,8 0,42 7,2 0,788
i in y xnββ = −
− × =
∑ ∑)
)
Hasil yang sama diperoleh dengan menggunakan RCommander. Dialog analisis
regresi sederhana dengan RCommander dapat dilihat pada Gambar 7.6.
Gambar 7.6 Dialog regresi linier sederhana untuk peubah NFis dan NMat
Contoh 7.3
Berikut adalah uji regresi untuk peubah NFis (Y) dan NMat (X) dari DataSim.
Dialog untuk peubah ini dapat dilihat pada Gambar 7.6. Keluaran dari program
tersebut adalah seperti berikut ini. Keluaran tersebut diberi nomor untuk
memudahkan penjelasan.
1. Call:

196 ANALISIS KORELASI DAN REGRESI
lm(formula = NFis ~ NMat, data = DataSim)
2. Residuals:
Min 1Q Median 3Q Max
-29.4726 -2.6436 -0.5996 1.0129 34.2166
3. Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 8.55473 5.12003 1.671 0.0988 .
NMat 0.83811 0.06741 12.432 <2e-16 ***
---
4. Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
5. Residual standard error: 7.175 on 78 degrees of freedom
6. Multiple R-Squared: 0.6646, Adjusted R-squared: 0.6603
7. F-statistic: 154.6 on 1 and 78 DF, p-value: < 2.2e-16
Keterangan keluaran
1. Nama fungsi linier model (lm) R yang dipanggil, dengan data dan peubah
terkait. Pada contoh di atas data diambil dari DataSim dengan bentuk model
NFis=f(NMat), yaitu peubah respons adalah NFis dan peubah penjelas adalah
NMat. Dalam konteks ini peneliti ingin memperoleh hubungan fungsional
antara Nilai Ujian Fisika dengan Nilai Ujian Matematika.
2. Sebaran (statistik ringkas) dari kesalahan (sisa), yaitu penyimpangan antara
dugaan garis regresi dengan data.Sisa ini secara teoritis harus berpusat di 0
simetris dan dengan ragam konstan.
3. Hasil pendugaan koefisien dan uji signifikansinya. Pada contoh di atas
diperoleh:

Analisis Regresi Sederhana 197
a. intercept (titk potong/konstanta) a=8,55 dengan nilai p = 0,099. Angka
ini menunjukkan bahwa konstanta regresi tidak signifikan. Walaupun
nilainya cukup besar (8,55) tetapi secara statistik dapat diabaikan.
Dengan kata lain model yang lebih tepat adalah model Y=bX. Ini juga
menunjukkan bahwa pada saat tingkat nilai X=0, maka Y juga
cenderung 0. Namun kusus untuk uji konstanta (intercept), nilai 0,09%
dapat dianggap sebagai nilai marjinal (dekat dengan 5%),oleh karena itu
konstanta cenderung dibiarkan pada model.
b. Koefisien regresi untuk peubah NMat, b,besarnya 0,83 dengan nilai p
<2e-16. Ini menunjukkan bahwa koefisien ini sangat signifikan
(walaupun secara matematis nominalnya jauh lebih kecil dibanding
konstanta).
Pada perhitungan ini dapat dilihat bahwa
c. 0
8,551,67. 5,12
EstimatetStd Errorβ
== =
=
d. 10,8312,43
. 0,067Estimatet
Std Errorβ=
= ==
4. Tingkat signifikansi yang diperoleh (0%, 0,1%, 1%, 5%, 10% dan 100%)
5. Kesalahan baku dari sisa dan derajat kebebasannya (besarnya n-2).
6. Koefisien determinasi asli dan koefisien determinasi yang telah disesuaikan.
Koefisien determinasi yang baik adalah yang mendekati 1. Semakin mendekati
1, semakin baik. Koefisien determinasi yang rendah menunjukkan banyak data
yang pemyebar jauh dari garis regresi. Besarnya koefisien determinasi
berbanding terbalik dengan besarnya kesalahan baku sisa. Jika kesalahan baku
besar, koefisien determinasi cenderung kecil (Lihat contoh keluaran
berikutnya).

198 ANALISIS KORELASI DAN REGRESI
7. Uji signifikansi garis regresi secara keseluruhan yang menggunakan uji F
menghasilkan F=154,6 = (12,432)2 = 1
2tβ
pada derajat kebebasan (1 dan n-2).
Pada contoh ini hasilnya signifikan (p-value: < 2.2e-16).
Contoh di atas menunjukkan bahwa secara keseluruhan uji regresi menunjukkan
hasil yang signifikan (ada hubungan signifikan antara nilai Fisika dan Matematika),
tetapi hubungan yang diperoleh tidak cukup baik dipergunakan untuk prediksi
karena koefisien determinasinya relatif rendah (0,66). Ini menunjukkan bahwa
banyak nilai yang menyebar jauh dari garis regresi seperti ditunjukkan oleh
diagram pencar pada Gambar 7.7.
50 60 70 80 90
5060
7080
90
NMat
NFi
s
Gambar 7.7 Diagram Pencar Data NMat dan Nfis dengan koefisien determinasi relatif rendah

Analisis Regresi Sederhana 199
Contoh 7.4
Pada contoh berikut ini diberikan ilustrasi hasil analisis regresi antara peubah Y dan
X, dengan hasil yang signifikan baik pada koefisien maupun konstantanya serta
dengan koefisien determinasi yang lebih tinggi.
Residuals:
Min 1Q Median 3Q Max
-1.927959 -0.797888 -0.003435 0.696098 3.630627
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 4.93500 1.76506 2.796 0.00742 **
x -2.00117 0.03575 -55.973 < 2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 1.083 on 48 degrees of freedom
Multiple R-Squared: 0.9849, Adjusted R-squared: 0.9846
F-statistic: 3133 on 1 and 48 DF, p-value: < 2.2e-16
Hasil di atas menunjukkan bahwa uji regresi sangat signifikan, baik untuk
konstanta maupun koefisien regresinya (semua nilai-p nya kurang dari 1%)
demikian juga uji keseluruhan menggunakan uji F. Model yang diperoleh juga
dapat digunakan untuk prediksi dengan baik dengan koefisien determinasi yang
besar (0,98) dan kesalahan baku yang relatif kecil (1,08). Ini menunjukkan bahwa
hubungan kedua peubah hampir sempurna dan sebaran datanya tidak jauh dari garis
regresi, seperti ditunjukkan oleh diagram pencar pada Gambar 7.8.

200 ANALISIS KORELASI DAN REGRESI
40 45 50 55-1
10-1
00-9
0-8
0
x
y1
Gambar 7.8 Diagram Pencar X dan Y
7.2.2 PREDIKSI DALAM REGRESI
Setelah mendapat penduga regresi yang signifikan, yang ditunjukkan oleh adanya
uji signifikansi secara keseluruhan, selanjutnya kita dapat menggunakan hasik
tersebut untuk kepentingan prediksi nilai Y atau rata-rata Y pada saat nilai X
tertentu (misalnya x). Sebagaimana telah disebutkan sebelumnya, prediksi ini akan
bermanfaat atau lebih akurat apabila koefisien deterministiknya cukup besar
(mendekati 1) yang berarti data menyebar secara homogin dekat dengan garis
regresi. Secara umum ada dua jenis prediksi yang dapat dilakukan, seperti berikut
ini:
1. Prediksi nilai rata-rata Y pada saat nilai X tertentu, misalnya xp.
2. Prediksi nilai Y pada saat nilai X tertentu.
Prediksi di atas pada dasarnya adalah penduga interval dengan nilai penduga titik
0 1y xβ β= + . Kesalahan baku dari keduanya adalah sebagai berikut
Pers. 7.10 ( )2
2 1 peey
xx
x xs s
n s
⎡ ⎤−⎢ ⎥= +⎢ ⎥⎣ ⎦
dan ( )2
/ 21ˆ p
xx
x xy y t s
n sα
−= ± +

Analisis Regresi Sederhana 201
Pers. 7.11 $
( )2
2 11 peey
xx
x xs s
n s
⎡ ⎤−⎢ ⎥= + +⎢ ⎥⎣ ⎦
dan ( )2
/ 21ˆ 1 p
xx
x xy y t s
n sα
−= ± + +
Kedua prediksi di atas berbeda dalam lebar interval dugaan karena penduga rata-
rata dan penduga nilai tunggal nilai Y memiliki kasalahan baku yang berbeda.
Dengan R seseorang dapat menghitung prediksi tersebut sekaligus
mengilustrasikannya dalam bentuk grafik seperti pada Gambar 7.9. Pada gambar
tersebut prediksi dilakukan pada saat nilai X sama dengan rata-rata X, yaitu
x =12,5. Pada saat itu nilai penduga titiknya adalah 67,66 (10,76 + 4,55x ) dengan
penduga interval 95% untuk rata-rata 12,5|xy = adalah [62,13; 73,18] dan interval
penduga 95% dari 12,5|xy = adalah [28,18; 107,10]

202 ANALISIS KORELASI DAN REGRESI
0 5 10 15 20 25
050
100
150
Diagram Pencar & Sabuk Keyakinan
x
y
Gambar 7.9 Ilustrasi Garis regresi populasi, regresi prediksi nilaiY dan rata-rata Y pada saat nilai tertentu dari X dengan interval keyakinannya.
7.3 MODEL LINIER: REGRESI PEUBAH GANDA
RCommander menyediakan menu untuk analisis regresi dengan model yang lebih
kompleks yaitu model dengan lebih dari satu peubah bebas (penjelas) baik berupa
peubah kuantitatif maupun faktor (seperti jenis kelamin atau pengelompokan lain
dalam populasi). Dialog untuk model linier diberikan pada Gambar 7.10.
Dalam dialog itu ada beberapa hal yang harus diperhatikan yaitu:
Batas interval Y
Batas interval rata-rata Y

Model Linier: Regresi Peubah Ganda 203
1. Nama model yang terisi secara otomatis sesuai jenis regresi yang dipanggil
(linier model, GLM dan sebagainya)
2. Nama-nama peubah (dengan jenisnya). Kita bisa mengetahui peubah yang
berupa kuantitatif maupun faktor. Peubah-peubah ini bisa dipilih dengan
meng-klik.
3. Rumusan formula model. Model dalam R dinyatakan dalam bentuk
Y=f(X1,X2,...) dengan Y adalah peubah respons dan Xi adalah peubah bebas.
Secara umum untuk peubah kuantitatif penambahan beberapa peubah
kuantitatif dinyatakan dengan tanda “+”, misalnya X1+X2.
Gambar 7.10 Dialog Model Linier
Hasil analisis regresi dengan banyak peubah pada dasarnya sama dengan hasil
analisis sebelumnya hanya koefisien yang diestimasi lebih banyak yaitu konstanta
dan koefisien masing-masing peubah bebas. Berikut adalah contoh keluaran
analisis regresi untuk dua peubah bebas NMat dan NIng terhadap NFis. Misalkan
kita ingin menguji hubungan 0 1 2 NFis NMat NIngβ β β= + + . Dalam Formula
dituliskan

204 ANALISIS KORELASI DAN REGRESI
NFis ~ NMat + NIng
Keluaran yang dihasilkan adalah seperti berikut ini.
Call:
lm(formula = NFis ~ NMat + NIng, data = DataSim)
Residuals:
Min 1Q Median 3Q Max
-29.0987 -2.9626 -0.4881 1.7663 32.4172
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 1.67825 7.07947 0.237 0.813
NMat 0.81235 0.06950 11.689 <2e-16 ***
NIng 0.10519 0.07528 1.397 0.166
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Eksplorasi lebih jauh
1. Aktifkan salah satu data yang ada pada Ratau yang ada pada CD (format excel)
2. Lakukan uji regresi baik dengan 1 atau lebih peubah penjelas.
3. Periksa nilai pengujian masing-masing koefisien
4. Periksa nilai pengujian secara keseluruhan
5. Periksa nilai koefisien determinasinya
6. Jelaskankesimpulan anda terhadaphasil pengujian yang dilakukan.

Diagnostik Model Melalui Grafik 205
7.4 DIAGNOSTIK MODEL MELALUI GRAFIK
Pemeriksaan terhadap kecocokan analisis regresi dengan kondisi data yang
dianalisis disebut diagnostik model. Salah satu cara mendiagnostik model adalah
dengan melihat sebaran sisa (residu). Residu atau sisa adalah selisih antara nilai
observasi (observed value) dengan nilai dugaan yang diperoleh melalui garis
regresi (predicted value). Residu ini merupakan penduga dari kesalahan atau error.
Secara geometris, sebenarnya pencaran residu ini sama dengan pencaran data
hanya sumbu X nya ditransformasi berimpit dengan garis regresi.
Seperti telah disampaikan sebelumnya bahwa asumsi ideal untuk analisis regresi
linier adalah bahwa sisa menyebar normal dengan rata-rata 0 dan ragam konstan.
Syarat kekonstanan varians ditunjukkan oleh adanya sebaran merata sehingga lebar
sebaran dari kiri ke kanan relatif konstan. Adanya ketidak konstanan ragam
ditandai dengan lebar sebaran yang tidak sama dari kiri ke kanan. Data yang
mempunyai ragam konstan disebut bersifat homoskedastik sebaliknya disebut
bersifat heteroskedastik. Pemeriksaan model dengan RCommander dapat
dilakukan dengan memilih menu model dan opsi grafik pada plot diagnostik dasar
seperti terlihat pada Gambar 7.11
Diagnostik grafik ini menampilkan empat grafik dasar seperti berikut ini.
1. Grafik Nilai prediksi dengan sisa. Grafik ini menggambarkan hubungan antara
garis regresi yang diperoleh dengan sisa. Secara umum sebaran sisa harus
menunjukkan sebaran acak disekitar nilai nol dengan lebar yang relatif sama.
Apabila sebaran menunjukkan pola tertentu (misalnya membentuk kurva, lebar
tidak konstan), ini mengindikasikan bahwa model yang dipilih kurang baik.

206 ANALISIS KORELASI DAN REGRESI
Gambar 7.11 Menu dan Dialog Diagnostik Grafik
2. QQPlot Normal dari sisa yang telah dibakukan. QQ-Plot Normal pada dasarnya
adalah grafik yang mennyajikan sebaran quantil normal teoritis, dengan quantil
data. Apabila datanya berdistribusi normal maka sebarannya akan mendekati
garis lurus. Penyimpangan yang sangat mencolok pada ujung-ujung grafik
menunjukkan datanya menyimpang dari distribusi normal. Untuk data yang
tidakmemenuhi distribusi normal dapatdilakukan transformasi ataupun dengan
memilih alternatifregresi yang lain.
3. Grafik Nilai Prediksidengan akar Sisa baku. Penafsirannya sama dengan grafik
pertama, hanya yang diperiksa sekarang adalah sisa yang telah dibakukan
(standarized residual).
4. Grafik leverage terhadap sisa baku. Dalam grafik ini juga digambarkan batas
jarak Cook (Cook’s distance) untuk memeriksa adanya pencilan (outlier). Jika
ada nilai residu yang berada di luar batas jarak, ini mengindikasikan adanya
pencilan. Perlu diadakan pemeriksaan terhadap pencatatan dataapakah ada
kesalahan pencatatan atau tidak. Jika pencilan tidak banyak (1-2 observasi),
dapat dipertimbangkan mengecualikan observasi tersebut dalam analisis
regresi.

Diagnostik Model Melalui Grafik 207
30 40 50 60
-6-4
-20
24
Fitted values
Res
idua
ls
Residuals vs Fitted
43
22
50
-2 -1 0 1 2
-3-2
-10
12
Theoretical Quantiles
Stan
dard
ized
resi
dual
s Normal Q-Q
43
22
50
30 40 50 60
0.0
0.5
1.0
1.5
Fitted values
Stan
dard
ized
resi
dual
s Scale-Location43
2250
0.00 0.02 0.04 0.06 0.08
-3-1
01
2
Leverage
Stan
dard
ized
resi
dual
s
Cook's distance0.5
Residuals vs Leverage
43
2059
Gambar 7.12 Grafik Diagnostik untuk Model Regresi yang relatif memenuhi syarat kenormalan dan bebas dari pencilan.

208 ANALISIS KORELASI DAN REGRESI
35 40 45 50 55
-60
-20
2060
Fitted values
Res
idua
lsResiduals vs Fitted
313
20
-2 -1 0 1 2
-40
24
Theoretical Quantiles
Stan
dard
ized
resi
dual
s Normal Q-Q313
20
35 40 45 50 55
0.0
1.0
2.0
Fitted values
Stan
dard
ized
resi
dual
s Scale-Location313 20
0.00 0.02 0.04 0.06 0.08
-40
24
Leverage
Stan
dard
ized
resi
dual
s
Cook's distance10.5
0.51
Residuals vs Leverage
20
133
lm(y ~ x)
Gambar 7.13 Grafik Diagnostik untuk Model Regresi yang kurang memenuhi syarat kenormalan dan mengandung pencilan
Ada beberapa kondisi data yang menyimpang dari asumsi yang menjadi
persyaratan analisis regresi seperti berikut ini.
1. Hubungan antara respon dengan peubah penjelas tidak linier. Kondisi ini dapat
ditangani dengan melakukan transformasi pada peubah respon maupun pada
peubah penjelas,lalu menganalisis data yang telah ditransformasi sehingga
model yang dipergunakan tidak lagi sederhana seperti 0 1Y Xβ β= + , tetapi

Diagnostik Model Melalui Grafik 209
model yang telah ditransformasi seperti 0 1log( )Y Xβ β= + atau
0 1 log( )Y Xβ β= + dan sejenisnya.
2. Respon tidak menyebar normal, termasuk adanya pencilan maupun hasil
pengamatan ekstrim. Terhadap kondisi ini cara sederhana untuk menanganinya
adalah dengan mencoba analisis tanpa mengikut sertakan pencilan (terutama
kalau pencilannya hanya 1-2 pengamatan). Tentang persyaratan normal, secar
emperik telah dibuktikan oleh para praktisi melalui simulasi bahwa dampak
akibat penyimpangan terhadap distribusi normal tidak seserius seperti yang
dikhawatirkan (Stafsof [22]).
3. Respon menyebar dengan ragam tidak konstan. Jika respon tidak homogen
tetapi masih memenuhi distribusi normal, kondisi ini dapat ditangani dengan
memberikan pembobotan (dengan invers ragam) pada perhitungan estimasi
parameter. Metode ini disebut wighted least square yang secara umum telah
diimplementasikan pada paket-paket program statistika.
4. Untuk peubah penjelas lebih dari satu, terjadi korelasi signifikan di antara
beberapa peubah penjelas. Kondisi ini sering disebut multi kolinieritas. Hal ini
akan berakibat pada kurang akuratnya hasil estimasi parameter, karena dalam
perhitungannya akan melibatkan matriks yang mendekati singuler sehingga
inversnya sulit dihitung. Cara sederhana menangani kondisi ini adalah dengan
memilih hanya salahsatu dari peubah-peubah penjelas yang memiliki korelasi
tinggi. Misalnya jika ternyata peubah X1, X3, dan X4 berkorelasi signifikan,
maka cukup salah satu saja yang dimasukkan ke dalam model regresi.
Contoh 7.5
Dalam contoh berikut diilustrasikan analisis regresi dengan 1-2 nilai pencilan.
Analisis regresi dilakukan dua kali dengan mengikutsertakan seluruh data dan
mengecualikan data pencilan. Dapat kita lihat adanya perubahan signifikan dari
hasil kedua analisis tersebut.

210 ANALISIS KORELASI DAN REGRESI
Berikut adalah contoh Analisis regresi dengan data yang mengandung satu
pencilan. Data dianalisis dua kali msing-masing dengan menyertakan dan
mengabaikan pengamatan pencilan tersebut.
1. Analisis data lengkap yang mengandung pencilan
Call:
lm(formula = y1 ~ x1, data = DataSimReg)
Residuals:
Min 1Q Median 3Q Max
-17.842 -5.810 -1.492 2.713 86.675
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 31.3226 14.0512 2.229 0.0318 *
x1 2.6286 0.2769 9.492 1.43e-11 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 15.6 on 38 degrees of freedom
Multiple R-Squared: 0.7033, Adjusted R-squared: 0.6955
F-statistic: 90.09 on 1 and 38 DF, p-value: 1.426e-11

Diagnostik Model Melalui Grafik 211
2. Hasil analisis dengan mengecualikan pengamatan yang menjadi pencilan. Pada
analisis ini data pencilan dikeluarkan dari analisis (dianggap munculnya
pencilan sebagai akibat kesalahan pencatatan data).
Call:
lm(formula = y1 ~ x1, data = DataSimReg)
Residuals:
Min 1Q Median 3Q Max
-9.1295 -3.9094 0.5353 3.4954 10.4447
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 6.36779 4.74300 1.343 0.188
x1 3.08027 0.09286 33.171 <2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 5.037 on 37 degrees of freedom
(1 observation deleted due to missingness)
Multiple R-Squared: 0.9675, Adjusted R-squared: 0.9666
F-statistic: 1100 on 1 and 37 DF, p-value: < 2.2e-16
Ringkasan keduanya adalah sebagaimana disajikan dalam berikut (Diagram pencar
diberikan pada Gambar 7.14)
No Komponen Data Lengkap Mengecualikan

212 ANALISIS KORELASI DAN REGRESI
Pencilan*)
1 df 38 37
2 Koefisien
Konstanta 31,32 6,36
Koefisien X1 2,62 3,08
3 Koef Determinasi 0,70 0,97
Catatan :
*) Dalam analisis ini, Satu observasi diabaikan dan dianggap hilang (yaitu data
yang merupakan pencilan), sehingga derajat kebebasan berkurang satu.
30 40 50 60 70
100
120
140
160
180
200
220
x1
y1
30 40 50 60 70
100
120
140
160
180
200
220
x1
y1
Gambar 7.14 Diagram Pencar untuk Data Lengkap (kiri)dan untuk Data tanpa Pengamatan yang Dianggap Pencilan
Jika model memiliki residu yang menunjukkan adanya penyimpangan dari syarat
yang harus dipenuhi, maka sebaiknya dilakukan perbaikan model sehingga

Analisis Regresi Alternatif 213
persyaratan tersebut menjadi relatif terpenuhi. Salah satu yang biasanya dilakukan
adalah dengan mentransformasikan data dengan suatu fungsi yang sesuai.
Selanjutnya data hasil transformasi ini dianalisis dengan regresi klasik yang
menggunakan asumsi distribusi normal dengan hubangan linier.
7.5 ANALISIS REGRESI ALTERNATIF
Dalam kenyataannya,tidak semua data yang dihadapi memenuhi asumsi regresi
linier dengan baik. Selain melakukan hal-hal praktis seperti dianjurkan sebelumnya
(misalnya membuang pengamatan, tidak menyertakan beubah), kita dapat juga
melakukan hal lain yang lebih matematis, misalnya mentransformasikan data, atau
memilih alternatif regresi yang tergolong dalam regresi modern.
7.5.1 TRANSFORMSI DATA
Jika sebaran residu menunjukkan ketidaklinieran, transformasi yang bisa dilakukan
untuk mengatasi ketidak linieran diantaranya adalah seperti berikut ini.

214 ANALISIS KORELASI DAN REGRESI
1. Jika sebaran membentuk kurva naik dan terbuka ke atas maka transformasi
dapat dilakukan pada Y dan tranformasi yang bisa dicoba adalah Y1 = log(Y )
atau Y1 =√Y atau Y1 =1/Y seperti terlihat pada Gambar 7.15.
5 6 7 8 9 10
2040
6080
100
120
140
x
y
5 6 7 8 9 10
3.0
3.5
4.0
4.5
5.0
x
log(
y)
Gambar 7.15 Residu Data Asli dan Residu setelah Ditransformasi Logaritma padaY

Analisis Regresi Alternatif 215
2. Jika sebaran membentuk kurva naik dan terbuka kebawah maka transformasi
dilakukan pada X dan transformasi yang bisa dicoba adalah X1 = log(X) atau X1
= √X atau X1 =1/X seperti terlihat pada Gambar 7.16
200 600
4550
5560
65
x
y
4.5 5.5 6.5
4550
5560
65
log(x)
y
Gambar 7.16 Residu Data Asli dan Residu setelah Ditransformasi Logaritma pada X

216 ANALISIS KORELASI DAN REGRESI
3. Jika residu menyebar membentuk kurva menurun dan terbuka keatas maka
transformasi dapat dilakukan pada kedua X atau Y dengan salah satu
transformasi sebelumnya seperti pada Gambar 7.17.
0 400 800
3040
5060
70
x
y
3 4 5 6 7
3040
5060
70
log(x)
y
Gambar 7.17 Residu Data Asli dan Residu setelah Ditransformasi Logaritma
pada X
Selain masalah keliniearan, masalah yang sering muncul dalam analisis regresi
adalah ketidak seragaman sebaran atau ragam data. Untuk menyeragamkan atau
menghomoginkan varians, dapat dicoba beberapa transformasi diantaranya Y1 =
log(Y), atau Y1 =√Y atau Y1 =1/Y . Gambar 7.18 mengilustrasikan data asli yang

Analisis Regresi Alternatif 217
ragamnya tidakhomogin dan setelah melalui transformasi ragamnya menjadi
homogin.
Plot Data Asli
X
Y
10 20 30 40 50
5010
015
0
Plot Residu
Y-Prediksi
Res
idu
40 60 80 100
-40
020
4060
80
Plot Data Transformasi
X
log(
Y)
10 20 30 40 50
3.0
3.5
4.0
4.5
5.0
Plot Residu
Y-Prediksi
Res
idu
3.4 3.6 3.8 4.0 4.2 4.4 4.6 4.8
-1.0
-0.5
0.0
0.5
Gambar 7.18Transformasi untuk Menghomoginkan Ragams
Pada dasarnya transformasi data dilakukan agar data yang tidak memenuhi
peryaratan asumsi (kelinieran dan homoginitas varians)menjadi memenuhiasumsi
dan dapat dianalisis dengan metode regresi klasik, Namun, ada kalanya
transformasi untuk menangasi satu permasalahan (misalnya kelinieran), justru
mendatangkan persoalan baru (misalnya ketidak seragaman varians), seperti
diilustrasikan pada Gambar 7.19.

218 ANALISIS KORELASI DAN REGRESI
Plot Data Asli
X
Y
20 30 40 50
500
1000
1500
2000
2500
Plot Residu
Y-Prediksi
Res
idu
0 500 1000 1500 2000
-100
010
020
0
Plot Data Transformasi
log(X)
log(
Y)
2.6 2.8 3.0 3.2 3.4 3.6 3.8
5.0
5.5
6.0
6.5
7.0
7.5
Plot Residu
Y-Prediksi
Res
idu
5.0 5.5 6.0 6.5 7.0 7.5
-0.0
10.
00.
010.
02
Gambar 7.19 Transformasi kelinieran menyebabkan ketidakhomoginan ragam
7.5.2 PENGANTAR REGRESI ALTERNATIF
Ada beberapa kondisi yang menyimpang atau lebih kompleks dari asumsi yang
diperlukan untuk dapat melakukan analisis dengan regresi sederhana diantaranya:
1. Data mengandung peubah faktor/kualitatif dan kita ingin mengetahui apakah
faktor tersebut mempengaruhi hubungan antara peubah kuantitatif lainnya.
Misalnya apakah hubungan antara jumlah penghasilan dan jumlah pengeluaran
konsumtif dipengaruhi oleh jenis kelamin atau pendidikan. Untuk melakukan
analisis regresi seperti ini, secara teoritis kita dapat memperkenalkan peubah
boneka (dummy variabel) yang dapat dilihat pada Neter etal. [20], Wonnacott
& Wonnacott [35]. Aplikasi dengan R dapat dilihat pada Chamber & Hastie
[2], Vanables & Ripley [32]
2. Terjadi pencilan yang cukupsignifikan mempengaruhi hasil analisis. Untuk data
dengan pencilan yang pencilannya tidak mungkin dibuang begitu saja,ada

Analisis Regresi Alternatif 219
analisis regresi yang disebut regresi tegar (robust regression) yangdapat
mengurangi pengaruh adanyapencilan (lihat Venables & Ripley [32]
3. Respon berupa skala interval atau ordinal misalnya jumlah anak, jumlah istri
atau jumlah kendaraan roda empat yang dimiliki, lulus-gagal, jenis merek
barang yang banyak dipilih dan sejenisnya. Analisis regresi jenis ini termasuk
dalam model linier tergeneralisir atau lebih dikenal dengan GLM (Generalized
Linear Models). Analisis lain yang termasuk dalamkelompokinidiantaranya
adalah Regresi logistik atau analisis Probit/Logit (untuk respon dengan
distribusi Binomial atau bersekala nominal) dan log-linier untuk respon dengan
distribusi Poison atau bersekala ordinal). Referensi untuk model linier ini
diantaranya adalah McCullagh & Nelder [15], Chamber & Hastie [2], Vaeables
& Ripley [32].
4. Respon berupa peubah ganda, misalnya dalam eksperimen yang diamati
dampak lebih dari satu perlakuan (misalnya satu unit percobaan mendapat tiga
atau lebih perlakuan) atau pengaruh satu perlakuan dilihat dalam lebih dari dua
kurun waktu. (misalnya hubungan tekanan darah dan kolesterol yang diamati
pada pagi, siang, dan sore hari. Percobaan seperti ini sering disebut pengukuran
berulang (repeated meassure) atau studi jangka panjang (longoitudinal study).
Salah satu analisis regresi atau model linier yang banyak dipakai untuk ini
adalah GEE (generalized estimating equations) yang dipelopori oleh Liang &
Zeger [13], [36] dan Diggle et al.[3]
5. Terjadi korelasi yang signifikan (multi kolinieritas) diantara peubah penjelas.
Multi kolinieritas ini akan berakibat sulitnyamenghitung invers matriks yang
diuperlukan dalam menghitung estimasi parameter. Selain menghilangkan dari
model peubah yang berkorelasi, kondisi ini dapat juga ditangani melalui
beberapa jenis analisi regresi diantaranya adalah regresi gulud (Ridge
regression) Neter et al.[20], atau menggabungkan regresi dengan analisis
komponen utama

220 ANALISIS KORELASI DAN REGRESI
7.6 RINGKASAN DAN BACAAN LEBIH LANJUT
7.6.1 RINGKASAN
1. Korelasi dan regresi merupakan dua analisis yang saling terkait. Analisis
korelasi hanya mempelajari derajat asosiasi antara beberapa peubah sedangkan
analisis regresi mempelajari fungsi atau model hubungan antara beberapa
peubah yang diperlukan untuk memprediksi nilai suatu peubah bila nilai
peubah lain diketahui.
2. Kondisi hubungan dua peubah, secara kasar dapat dilihat melalui diagram
pencar. Pada diagram pencar data harus menyebar secara acak dengan
kecenderungan membentuk garis lurus.
3. Koefisien determinasi adalah kuadrat dari koefisien korelasi. Model dengan
koefisien determinasi tinggi (mendekati 1) menunjukkan data menyebar dekat
dengan garis regresi, karenanya model yang diperoleh bermanfaat dalam
melakukan prediksi.
7.6.2 BACAAN LEBIH JAUH
Analisis regresi atau modellinier telah berkembang dari analisis yang sederhana
sampai berbagai bentuk khusus untuk menangani kondisi data yang kompleks.
Pembahasan tentang regresi linier sederhana dapat dijumpai dalam banyak buku-
buku teks statistika (Hadi[8], Sujana[23], Mendenhall[16],[17]). Sedangkan untuk
regresi khusus (seperti regresi gulud, lihat Neter et al. [20]) dan regresi modern
(misalnya GLM, HGLM, regresi tegar), pembaca dapat membaca Statsoft [22],
Chamber & Hastie [2], Garson [5], McCullagh & Nelder [15], Vanables & Ripley
[32].

Ringkasan dan Bacaan Lebih Lanjut 221
DAFTAR PUSTAKA
[1] Baird JH.2003. How Statistics Can Lie. Green Section Recoed. [Agustus
2008]
[2] Chamber JM & Hastie TJ.1993. StatisticalModels in S.Chapman & Hall
[3] Diggle PJ, Liang K-Y & Zeger SL, 1994. Analysis of Longitudinal Data.
Oxford Science Publications.
[4] Faraway JJ. 2002. Practical Regression and Anova Using R. http://www.stat.
Isa.umic.edu/~faraway/book/
[5] Garson DG. StatNotes: Topics in Multivariate Analysis.
http://StatNote/www2.chass.ncsu.edu\garson/pa765/statnote.htm [Maret
2008]
[6] Gravetter FJ & Wallnau LB. 2004. Statistics for the Behavioral Sciences.
Thomson. International Student Eddition (6th Edition).
[7] Guilford JP & Fruchter. 1978. Fundamental Statistics in Psychology and
Education. International Student Edition(6th Edition). McGraw-Hill.
[8] Hadi S. 1982. Statistika. Andi Offset, Yogyakarta.

222 DAFTAR PUSTAKA
[9] Hair JF, Black WC, Babin BC, Anderson RE & Tatham RL. 2006.
Multivariate Analysis. Pearson, Prentice Hall.
[10] Hogg RV, McKean JW, Craig AT. 2005. Introduction to Mathematical
Statistics. 6-th edt. London: Pearson Education International
[11] Kuhnert P & Venables WN. 2005. An Introduction to R: Software for
Statistical Modelling & Computing. http://cran.r-project.org/
doc/contrib/Kuhnert+Venables-R_Course_Notes.zip
[12] Lewis P. MODULE: Basic Statistics. http://philosophy.hku.hk/think/stat/ 5
Agustus 2008]
[13] Liang K-Y. & Zeger.SL. 1986. Longitudinal data analysis using generalized
linear models. Biometrka.73:13-22.
[14] Maindonald JH. 2001. Using R for Data Analysis and Graphics An
Introduction. http://www.r.project.org.
[15] McCullagh P & Nelder JA. 1989. Generalized Linear Models. Chapman &
Hall
[16] Mendenhall W. 1979. Introduction to Probability and Statistics 5th edt.
Massachussets:Duxbury.
[17] Mendenhall W. 1993. Beginning Statistics A to Z. Duxbury
[18] Murrell, P. 2006. R Graphics. Chapman & Hall/CRC
[19] Nelder J.A. & Wedderburn, Generalized Linear Models. J.R.Statist.Soc.57:
359-407.
[20] Neter J. Wasserman, Kutner. (1985) Applied Statistical Model. Homewood,
Illinois :Irwin.
[21] NIST/SEMATECH e-Handbook of Statistical Methods,
http://www.itl.nist.gov/div898/handbook/, [Januari 2008]

Ringkasan dan Bacaan Lebih Lanjut 223
[22] StatSoft. 2006. Electronic Statistics Textbook. http://www.statsoftinc.com/
textbook/ stathome.html
[23] Sudjana. 1996. Metode Statistika. Tarsito, Bandung.
[24] Tirta.2005. Potensi dan Prospek Pemanfaatan OSS-R dalam Analisis Data dan
Pengajaran Statistika. Pancaran Pendidikan. XVIII (61): 195-208
[25] Tirta, IM.2005. Panduan Program Statistika R. Penerbit Universitas Jember
[26] Tirta IM, Lestari B & Dewi YS. 2006. Estimasi Efek Tetap dan Acak pada
Model Multiplikatif dengan Likelihood Bersama. Jurnal ILMU DASAR.
7:59-66.
[27] Tirta IM. 2007. Analisis Data dengan Respons tidak Saling Bebas dengan
paket hglm dan gee pada OSS-R. Makalah disampaikan pada Seminar
Nasional Statistika VIII di ITS Surabaya. 3 Nopember 2007.
[28] Tirta IM. 2007. Pengembangan Piranti Lunak Statistika Berbasis OSS-R
(Development of Statistical Software). disajikan dalam seminar Nasional Statistika
ke - 8 (SNS VIII) di FMIPA ITS surabaya pada tanggal 3 Nopember 2007
[29] Tirta IM.2007. R.GUI: Mendesain Paket Analisis dan Media Pembelajaran
Statistika. Penerbit Universitas Jember
[30] Tirta IM. 2008. Paket RcmdrPlugin.StatDemo. http://r.unej.ac.id
[31] Tirta IM. 2008. Paket StatDemo. http://r.unej.ac.id
[32] Venables WN & Ripley BD. 1994. Modern Applied Statistics with S-plus.
Springer.
[33] Vezalini J. 2002. Using R for Introductory Statistics.
http://www.r.project.org.
[34] Wackerly, DD., Mendenhall W., Scheafer RL., 1996. Mathematical Statistics
with Application. Massachussets:Duxbury.

224 DAFTAR PUSTAKA
[35] Wannacott TH & Wannacott RJ. 1990. Introductory Statisticsfor Business
and Economics. Williey International Edition.
[36] Zeger SL.& Liang KY. 1986. Longitudinal Data Analysis for Discrete and
Continuous Outcomes. Biometrics. 42: 121-130
[37] Zoonekyn V. 2005. Statistics with R. http://zoonek2.free.fr/
UNIX/48_R/all.html

Mengunduh dan Menginstal R 225
LAMPIRAN
MENGUNDUH DAN MENGINSTAL R
R adalah program open source yang dapat diunduh dari internet. Berikut diuraikan
cara mengunduh dan menginstal R terutama pada sistem opeasi Windows.
MENGUNDUH (MEN-DOWNLOAD) R
Ada beberapa cara yang dapat ditempuh untuk memperoleh program R beserta
peket-peket pendukung (library)nya diantaranya adalah sebagai berikut.
1. Mengunjungi situs http://www.cran.r-project.org, lalu memilih situs bayangan
(mirror) yang paling dekat dengan lokasi kita. Salah satu diantaranya adalah
situs yang ada di Australia yaitu http://cran.au.r-project.org. Pengguna dapat
mengunduh (download) program secara cuma-cuma.
2. Menghubungi Laboratorium Statistika Jurusan Matematika FMIPA Universitas
Jember. Kepada pengguna dikenakan biaya mengunduh (download) dan
pengemasan yang tidak mahal;
3. Menghubungi UPT Penerbitann Universitas Jember dan membeli salah satu
panduan atau manual tentang R yang berisi paket Program R, diantaranya
adalah Tirta [25] [29];

226 LAMPIRAN
4. Mengunjungi situs http://r.unej.ac.id yang menyediakan salah satu versi R yang
relatif masih baru.
Komponen program yang diperlukan untuk dapat menjalankan R dan R-
Commander dengan baik adalah:
1. program R untuk windows yang biasanya diberi nama R-Versi-win32.exe;
2. semua paket pendukung/pustaka/library versi windows yang dibutuhkan
seperti: aaMI_versi.zip,…, zoo_versi.zip;
3. bagi yang ingin menggunakan R melalui skrip pemrograman diperlukan juga
Tinn-R yaitu Tinn-R_versi_setup.exe.
4. Dalam notasi di atas, “versi” menunjukkan angka yang terkait dengan versi
program bersangkutan, misalnya 2.5.0; 7.0.1 dan sebagainya.
MENGINSTAL R
Setelah memperoleh file “R-versi-win32.exe”, maka instalasi dilakukan sebagai
berikut ini.
1. Klik “R-versi-win32.exe”, lalu akan muncul jendela dialog pemilihan bahasa.
Saat ini belum ada dialog berbahasa Indonesia, untuk itu pilih English dan klik
OK
Gambar 0.1 Tampilan Pemilihan Bahasa Instalasi

Mengunduh dan Menginstal R 227
2. Selanjutnya akan muncul dialog pembukaan, seperti berikut ini, kita tinggal
klik Next, lalu akan muncul dialog tentang informasi Copy Right. Sempatkan
membaca ketentuan yang berlaku, selanjutnya klik next.
Gambar 0.2 Tampilan Mulai Instalasi
Gambar 0.3 Tampilan Konfirmasi Lisensi GPL (General Public License)

228 LAMPIRAN
3. Untuk pemilihan direktori sebaiknya ikuti sesuai yang ada pada dialog,
misalnya C:\Program Files\R\... Kecuali, untuk yang menggunakan Windows
Vista, sebaiknya R diinstal tidak di hardisk C, tetapi di D atau E.
Gambar 0.4 Konfirmasi Direktori
4. Untuk dokumentasi, jika ruang hardisk anda cukup longgar sebaiknya pilih
semua dokumentasi terkait. Jika tidak, pilih yang penting diantaranya adalah:
HTML files help, Online (pdf) manual, Support files for tcltk, Message
Translation, PDF Reference manuals.

Mengunduh dan Menginstal R 229
Gambar 0.5 Tampilan Konfirmasi Komponen R
5. Kustomisasi atau pengaturan Opsi Startup, pilih yes. Dengan pilihan tersebut
selanjutnya akan muncul beberapa dialog berikut. Untuk mengatur agar
tampilan grafik dan jendela R terpisah, pilih SDI. Untuk dokumentasi
bantuan/help bisa pilih CHM atau HTML. Untuk Startup ikuti pilihan yang
telah disiapkan (default) R.

230 LAMPIRAN
Gambar 0.6 Tampilan Pemilihan Pengaturan Startup Aplikasi
Gambar 0.7 Tampilan Pemilihan Jenis Tampilan

Mengunduh dan Menginstal R 231
Gambar 0.8 Tampilan Pemilihan Bahasa Instalasi
Gambar 0.9 Tampilan Pemilihan Folder Startmenu
6. Untuk tugas tambahan (Additional Tasks), minimal bisa dipilih (di klik check),
Create desktop icon dan Create a Quick launch

232 LAMPIRAN
Gambar 0.10 Tampilan Pemilihan Task Tambahan
7. Selanjutnya proses instalasi akan dimulai
Gambar 0.11 Tampilan Proses Instalasi
8. Jika selesai akan muncul dialog terakhir berikut. Klik finish untuk
menyelesaikan instalasi R

Mengaktifkan R dan Menginstal Paket Tambahan 233
Gambar 0.12 Tampilan Akhir Proses Instalasi
MENGAKTIFKAN R DAN MENGINSTAL PAKET
TAMBAHAN
Untuk memanggil atau mengaktifkan R kita bisa klik icon R yang ada di desktop.
Untuk memunculkan menu atau dialog dalam Bahasa Indonesia lakukan
perubahan pada properties icon ini. Pada baris target ditulis
"C:\Program Files\R\R-2.5.0\bin\Rgui.exe" LANGUAGE=id
Perlu diketahui bahwa, sampai saat ini menu dan dialog dalam Bahasa Indonesia
hanya tersedia pada paket RCommander, belum sampai pada menu RGUI
(Rconsole). Untuk memulai R, kita dapat mengklik short cut yang ada pada
desktop, atau melalui Start Menu. Setelah R dipanggil, kita akan memperoleh
tampilan yang disebut Console R dengan RGUInya seperti pada Gambar 0.14 atau
Gambar 0.15 tergantung bahasa yang dipilih (Untuk menu RGUI belum ada
pilihan Bahasa Indonesia).

234 LAMPIRAN
Gambar 0.13 Mengatur Pilihan Bahasa Menu dan Dialog R

Mengaktifkan R dan Menginstal Paket Tambahan 235
Gambar 0.14 Tampilan Rconsole dalam Bahasa Inggris
Gambar 0.15 Tampilan Rconsole Dalam Bahasa Indonesia
Berikut adalah langkah-langkah untuk menginstal paket tambahan.

236 LAMPIRAN
1. Aktifkan menu Packages sepert terlihat pada Gambar 0.17 Memilih Paket
Tambahan
Paket-> Menginstal paket dari Zip lokal.
2. Selanjutnya pilih direktori tempat anda menaruh paket-paket tambahan
(library) dari R, seperti pada Error! Reference source not found.. Ada
beberapa paket penting yang harus diinstal untuk dapat mengikuti penjelasan
dalam buku ini yaitu:
a. Rcmdr beserta paket-paket terkait (car, dsb), merupakan paket RGUI
untuk analisis data yang dikembangkan oleh Fox dan dengan kontribusi
menu bahasa Indonesia oleh Tirta.
b. StatDemo_versi.zip merupakan paket khusus bernahasa Indonesia
untuk ilustrasi pembelajaran statistika yang dikembangkan oleh Tirta
[31]
c. RcmdrPlugin.StatDemo sama dengan statDemo di atas, tetapi
menunya bergabung dengan menu RCommander (Tirta [30])
d. RcmdrPlugin.hglm berisi paket hglm dan Menu GEE yang bergabung
dengan menu RCommander. Paket hglm ditulis oleh Tirta et al. [26],
sedangkan gee merupakan paket yang telah ada pada R, tetapi integrasi
menu dalam bahasa Indonesia di RCommander dibuat oleh Tirta[28].

Mengaktifkan R dan Menginstal Paket Tambahan 237
Gambar 0.16 Menu Menginstal Paket Tambahan
Gambar 0.17 Memilih Paket Tambahan

238 LAMPIRAN
STRUKTUR MENU RCOMMANDER
Panel-----|-- Data set aktif |-- Edit data set |-- Lihat data set |-- Model aktif |-- Submit (Eksekusi) Menu Data ------|--Data set Baru |--Impor data --------|--Dari Teks |--Dari SPSS |--Dari Minitab |--Data pada R -------|--Daftar data |--Data dari paket aktif Statistika-|--Ringkasan ---------|--Data set aktif |--Numerik |--Matriks korelasi |--Tabel kontingensi -|--Satu arah |--Multi arah |--Analisis dua arah |--Proporsi ----------|--Sampel Tunggal |--Sampel ganda |--Varians ----------|--Uji F beda varians |--Uji Bartlett |--Uji Levene |--Nonparametrik ------|--Uji Wilcoxon sampel tunggal |--Uji Wilcoxon sampel ganda |--Uji Kruskal Walis |--Regresi -----------|--Regresi Sederhana |--Model Linier |--Model Linier Tergeneralisir (GLM) |--Uji Beda ----------|--Uji t sampel tunggal |--Uji t sampel ganda |--Uji t sampel berpasangan |--Uji anava satu faktor |--Uji anava multi faktor |--Analisis ---------|--Reliabilitas skala dimensional |--Analisis Komponen Utama (RKU/PCA) |--Analisis faktor |--Analisis klaster Grafik-----|--Grafik indeks

Struktur Menu RCommander 239
|--Histogram |--Boxplot |--QQplot |--Diagram kuantil-kuantil |--Diagram pencar |--Matriks diagram Pencar |--Grafik garis |--Diagram rata-rata |--Grafik batang |--Grafik lingkaran |--Grafik 3D Distribusi-|--Distribusi Kontinu--|--Distribusi Normal |--Distribusi t |--Distribusi Chi-kuadrat |--Distribusi Seragam |-- ... |--Distribusi Gumbel -|--Distribusi Diskrit--|--Distribusi Binomial |--Distribusi Poisson |-- ... |--Distribusi Hipergeometrik Alat ------|--Aktifkan paket |--Aktifkan Plug-in |--Pilihan Bantuan ---|--Bantuan Commander |--Pengantar RCommander |--Bantuan data (jika ada) |--Tentang Rcmdr

240 LAMPIRAN
GLOSARIUM
Inferensi pengambilan kesimpulan terhadap sesuatu
berdasarkan sebagian informasi yang ada. Inferensi
dapat berupa pendugaan (estimasi) maupun
pengambilan kesimpulan (uji hipotesis)
Subjek (dalam penelitian) sekumpulan orang atau unit terkecil dalam penelitian
yang memiliki karakteristik yang menjadi perhatian.
Pustaka(Library) direktori yang memuat kumpulan paket-paket
program yang tersedia untuk R. Library dapat
ditambah maupun dikurangi sesuai kebutuhan
Skrip naskah yang berisi berbagai perintah yang harus
dilaksanakan oleh komputer melalui suatu bahasa
atau program tertentu.
CLI (Command Line
Interface)
program yang menjembatani komunikasi antara
komputer dengan pengguna dengan menggunakan
perintah-perintah yang ditulis dalam baris perintah,
tidak menggunakan grafis ataupun maouse. CLI
merupakan interface utama dari R.
GUI (Graphical User
Interface)
program menjembatani komunikasi antara komputer
dengan pengguna dengan menggunakan tampilan
grafis seperti menu atau ikon, yang biasanya siap
diklik dengan mouse. Program GUI untuk R biasa
disebut RGUI
Paket ( package) pada R kumpulan fungsi-fungsi dalam bahasa R yang
dikemas menjadi satu kesatuan sebagai aplikasi
metode analisis atau teori tetertentu
Plugn/Plug-in adalah program yang dapat digabungkan menjadi

GLOSARIUM 241
bagian dari proram lain yang lebih besar. Dalam
buku ini Paket-peket Plug-in R Commander,
menunya dapat digabungkan menjadi bagian dari
menu R Commander
Distribusi kontinu sebaran yang memiliki fungsi kepadatan dengan
daerah asal (domain) berupa himpunan interval
(misalnya seluruh bilangan real, bilangan real
nonnegatif, a x b≤ ≤ )
Distribusi diskrit sebaran yang memiliki fungsi kepadatan dengan
daerah asal (domain) berupa himpunan titik-titik
yang tercacah (misalnya sebagian himpunan bilangan
cacah, sebagian himpunan bilangan asli)
Antarmuka bagian program/alat yang menjembatani komunikasi
antara pengguna dengan komputer, antara alat ukur
dengan komputer, dan sejenisnya}
Alpha (α) Taraf signifikansi = peluang kesalahan tipe I,
peluang secara keliru menolak hipotesis null yang
benar.
AIC (Akaike's Information
Criterion)
salah satu kriteria yang dijadikan patokan memilih
modelyang baik dengan menghitung perimbangan
besarnya maksimum likelihooddan banyaknya
peubah yang dipergunakan dalam model, lebih
tepatnya AIC= -2 log-likelihood yang
dimaksimumkan + 2 banyaknya parameter dalam
model.
Analisis data eksploratori
(EDA)
Sekumpulan teknik untuk menampilkan data secara
visual dan bermakna.
Analisis variansi (ANAVA) Suatu teknik statistika untuk menguji beda nilai-
tengah kelompok lebih dari dua.

242 LAMPIRAN
ANAVA Satu arah Analisis variansi dengan pengelompokan hanya pada
satu peubah bebas.
b (Beta) Peluang kesalahan tipe II, yaitu peluang secara keliru
menerima hipotesis nol yang salah.
Bimodal Distribusi yang memiliki dua puncak atau peluang
maksimum.
Boxplot Presentasi grafik dari posisi median dan sebaran data.
Densitas Kurva yang menunjukkan niai peluang suatu
pengamatan pada interval nilai suatu peubah acak.
Derajat kebebasan (db) Angka yang mennjukkan banyaknya informasi yang
saling bebas setelah mengestimasi beberapa
parameter.
Deviasi baku Akar kuadrat dari variansi
Dispersi ukuran yang menyatakan sejauh mana data menyebar
terhadap nilai-tengah
Distribusi bersyarat Distribusi suatu peubah acak (Y) untuk nilai X yang
tetap.
Distribusi Binomial Distribusi yang menggambarkan peluang munculnya
sejumlah kejadian pada percobaan Bernouli
(misalnya peluang munculnya x Angka dari
pelemparan uang logam sebanyak n kali).
Distribusi normal baku Distribusi normal dengan nilai-tengah 0 dan deviasi
baku 1, dinotasikan dengan N(0,1).
Distribusi sampling Distribusi statistik dari pengambilan sampel yang
berulang-ulang yang berasal dari populasi tertentu.
Distribusi sampling beda
nilai-tengah
Distribution beda nilai-tengah dua kelompok sampel
dari pengambilan sampel berulang-ulang
Distribusi sampling nilai
tengah
Distribusi nilai-tengah dari pengambilan sampel
yang berulang-ulang yang berasal dari populasi
tertentu.

GLOSARIUM 243
Estimasi titik Nilai tertentu yang merupakan penduga suatu
parameter.
Faktor Istilah lain untuk peubah independen (umumnya
berupa peubah kualitatif) pada analisis variansi.
Hipotesis alternatif (HA) Disebut juga hipotesis kerja yaitu hipotesis yang
dirumuskan sesuai dengan hasil kajjian teori yang
melandasi penelitian.
Hipotesis nul (H0 ) Disebut juga hipotesis nihil, yaitu hipotesis yang
diuji pada prosedur statistika, yang menyatakan
kenetralan (tidak ada beda signifikan, tidak ada
hubungan signifikan dan sebagainya).
Histogram Grafik yang menggunakan segiempat sebagai
representasi frekuensi atau peluang dari observasi
pada setiap interval.
Homogenitas variansi Situasi dimana beberapa populasi atau subpopulasi
memiliki variansi yang sama.
Hubungan kurvilinier Situasi yang dapat diwakili oleh hubungan yang
tidak linier.
Intersep/ konstanta Koefisien dalam regresi yang menyatakan nilai Y,
pada saat nilai X sama dengan 0.
Interval keyakinan Disebut juga estimasi interval,yaitu suatu interval
yang memiliki peluang tertentu memuat parameter
yang diestimasi.
Jarak Cook Suatu ukuran yang menunjukkan pengaruh suatu
nilai pengamatan pada regresi berganda.
Kesalahan baku Deviasi baku dari distribusi sampling.
Kesalahan baku selisih nilai
tengah
Deviasibaku dari distribusi sampling beda nilai-
tengah.
Kesalahan prediksi Selisih antara nilai observasi dengan nilai prediksi.
Kesalahan sampling Variabilitas suatu nilai statistik sampelsatu ke sampel

244 LAMPIRAN
lainnya.
Kesalahan Tipe II Kesalahan secara keliru tidak menolak H0 yang salah.
Kesalahan Tipe I Kesalahan secara keliru menolak H0 yang benar.
Koefisien korelasi Suatu ukuran yang menunjukkan derajat hubungan
atau asosiasi antara beberapa peubah.
Kolinearitas Kondisi yang dimana peubah penjelas saling
berkorelasi satu sama lain.
Kombinasi Banyaknya cara sejumlah objek dapat dipilih tanpa
memperhatikan urutannya.
Kovariansi (sxy or covxy) Ukuran statistik yang menunjukkan derajat dua
peubah berubah bersama-sama.
Leverage Ukuran yang menunjukkan penyimpangan nilai
observasi terhadap nilai prediktor.
Matriks kovariansi (S) Suatu matriks yang menunjukkan nilai variansi dan
kovariansi antar beberapa peubah.
Model
Istilah lain untuk regresi peubah ganda, terdiri atas
model linier, model linier terampat/tegreneralisir,
model nonlinier, model linier campuran dan lain-lain
Model linier tergeneralisir
Disebut juga model linier terampat, yaitu analisis
Model/regresi untuk data dengan respon yang tidak
berdistribusi normal.
Model log-linear Model untuk menangani data kategori berganda.
Multikolinearitas Kondisi yang menunjukan adanya korelasi yang
tinggi di antara peubah-peubah prediktor.
Nilai kritis Suatu nilai statistik yang menjadi batas penerimaan
atau penolakan Ho .
Nilai-tengah bersyarat Nilai-tengah suatu peubah pada nilai tertentu dari
peubah yang lain.
Nilai-tengah geometrik Nilai tengah yang diambil dari n objek dengan

GLOSARIUM 245
menghitung akar pangkat n dari hasil kali (produk) n
objek tadi.
Outlier/pencilan Nilai observasi yang terletak jauh dari distribusi
kelompoknya.
p level Peluang kesalahan tipe I, yaitu peluang yang
menunjukkan bahwa hasil yang dicapai merupakan
hal yang kebetulan jika ternyata Ho benar.
Parameter Nilai yang menunjukkan pengukuran data populasi.
Peluang bersyarat Peluang suatu kejadian pada saat diketahui terjadinya
suatu kejadian lain.
Percobaan Bernoulli Percobaan dengan hasil salah satu dari dua kejadian
yang saling lepas misalnya lulus-gagal.
Populasi kumpulan seluruh data yang menjadi perhatian dalam
penelitian. Jadi populasi adalah seluruh subjek
penelitian beserta karakteristiknya yang menjadi
kepentingan
Regresi linier Analisis regresi dengan hubungan linier.
Regresi logistik Analisis regresi untuk data dengan respon bersifat
dikotomus (misalnya lulus/gagal).
Regresi multivariat Analisis degression lebih dari dua peubah bebas.
Residu/sisa Selisih antara nilaiobservasi Y dengan nilai
prediksinya (Y ).
Saling lepas (Mutually
exclusive)
Dua kejadian yang tidak bisa terjadi bersama-sama.
Sampling Prosedur unduk memperoleh sampel yang mewakili
populasi dengan baik (baik struktur maupun sifat-
sifatnya)
Skala Nominal Angka yang hanya dipakai untuk membedakan
objek.

246 LAMPIRAN
Skala ordinal Angka hanya dipakai untuk menunjukkan urutan
objek.
Skala rasio Skala yang memiliki nilai 0 mutlak dan rasio/
perbandingan memiliki makna.
Kesalahanbaku penduga Rata-rata deviasi kuadrat terhadap garis regresi
Statistik Angka-angka yang menunjukkan pengukuran pada
data.
Statistik Deskriptif Statistika yang mendeskripsikan sampel tanpa
menarik kesimpulan tentang populasi
Statistika inferensial Bagian statistika berkaitan dengan pengambilan
keputusan tentang parameter populasi asal asal
sampel.
Teorema limit pusat Teorema yang sifat alami dari sebaran sampel dari
nilai tengah. Apapun distribusinya jika sampling
dilakukan banyak kali, distribusi nilai tengah akan
mendekati distribusi normal
Tingkat Signifikansi Nilai yang menunjukkan batas maksimum peluang
kita secara keliru menolak H0 yang kenyataannya
benar.
Uji bebas distribusi Disebut juga uji nonparametrik, yaitu statistika yang
tidak bergantung pada asumsi distribusi atau asumsi
distribusi.
Uji Hipothesis Suatu proses pengambilan keputusan berkaitan
dengan nilai parameter populasi yang sebelumnya
telah dinyatakan.
Uji nonparametrik Uji statistik yang tidak bergantung pada estimasi
parameter atau asumsi distribusi.
Uji parametrik Uji statistika yang bergantung pada estimasi
parameter populasi atau asumsi distribsi populasi
Ukuran pemusatan Nilai yang menunjukkan pusat suatu distribusi.

GLOSARIUM 247
Unimodal Distribusi yang memiliki satu puncak atau
maksimum.
Peubah (dari data) karakteristik yang bervariasi antara satu subjek ke
subjek lain yang menjadi perhatian dari sampel atau
populasi
Peubah dikotomus Peubah yang hanya memiliki salah satu dai dua nilai
yang bebeda.
Peubah independen Peubah yang dikontrol dalam percobaan.
Peubah tetap Suatu peubah bebas (eksplanatori) yang nilainya
ditentukan peneliti.
Variansi population Variansi dari populasi yang dalam kenyataannya
diestimasi bukan dihitung.

248 LAMPIRAN
DAFTAR PERSAMAAN
Pers. 3.1 ( )( )( )
P A BP A| B =P B∩ ......................................................................... 48
Pers. 3.2 ( ) ( ) ( ), untuk P A B P A P B A B∪ = + ∩ = ∅ ...................................... 48
Pers. 3.3 ( ) 0, untuk P A B A B∩ = ∩ =∅ ........................................................ 48
Pers. 3.4 ( ) ( )A|| B P A = P A| B⇔ ................................................................... 49
Pers. 3.5 ( ) ( ) ( )A|| B P A B = P A P B⇔ ∩ × ................................................... 49
Pers. 3.6 ( ) ( ) ( ) ( ), untuk P A B P A P B P A B A B∪ = + − ∩ ∩ ≠∅ ................... 50
Pers. 3.7 ( ) (1 ) , 0,1,2,...,x n xnp x x n
xπ π −⎛ ⎞
= − =⎜ ⎟⎝ ⎠
............................................... 55
Pers. 3.8 1
1 n
ii
x xn =
= ∑ .......................................................................................... 57
Pers. 3.9 ( )
222
2 1 1
1
1
1 1
n n
i ini i
xi
x xx x nsn n
= =
=
⎛ ⎞− ⎜ ⎟− ⎝ ⎠= =− −
∑ ∑∑ ................................................ 60
Pers. 3.10 1 1 1
2 22 2
1 1 1 1
n n n
i i i ii i i
n n n n
i i i ii i i i
n x y x yr
n x x n y y
= = =
= = = =
⎛ ⎞⎛ ⎞− ⎜ ⎟⎜ ⎟⎝ ⎠⎝ ⎠=
⎡ ⎤ ⎡ ⎤⎛ ⎞ ⎛ ⎞− −⎢ ⎥ ⎢ ⎥⎜ ⎟ ⎜ ⎟⎝ ⎠ ⎝ ⎠⎢ ⎥ ⎢ ⎥⎣ ⎦ ⎣ ⎦
∑ ∑ ∑
∑ ∑ ∑ ∑................................... 61
Pers. 4.1 21 1( ) exp ;
22xf x xμσσ π
⎡ ⎤−⎛ ⎞= − −∞ < < ∞⎢ ⎥⎜ ⎟⎝ ⎠⎢ ⎥⎣ ⎦
.............................. 72

Daftar Persamaan 249
Pers. 4.2
2121( ) ;
2z
f z e zπ
−= − ∞ < < ∞ .................................... 72
Pers. 4.3 XZ μσ−
= sebaliknya X Zμ σ= + ................................................... 74
Pers. 4.4 1
n
i ii
Y a X=
= ∑ berdistribusi 2 2
1 1
, n n
i ii i
N a aμ σ= =
⎛ ⎞⎜ ⎟⎝ ⎠∑ ∑ ................................ 82
Pers. 4.52
1
1 ~ ( , )i
n
ni
X X Nn
σμ=
= ∑ atau ~ (0,1)n
XZ Nσ
μ−= ............................... 82
Pers. 7.1 1
1 n
ii
x xn
μ=
= = ∑ ................................................................................ 135
Pers. 7.2 ( )2
1
1
n
ii
x x
nσ =
−=
−
∑ ........................................................................ 135
Pers. 7.3 / 2 / 2n nx z x z
α ασ σμ− × < < + × . ................................................ 136
Pers. 7.4 1, / 2 1, / 2s s
n nn nx t x tα αμ− −− × < < + × ................................................ 136
Pers. 8.1 1 1 12 2
2 2
1 1 1 1
1
1 1
n n n
i i i ii i i
n n n n
i i i ii i i i
x y x ynr
x x y yn n
= = =
= = = =
−=
⎛ ⎞ ⎛ ⎞− −⎜ ⎟ ⎜ ⎟⎝ ⎠ ⎝ ⎠
∑ ∑ ∑
∑ ∑ ∑ ∑............................... 182
Pers. 8.2 ( )2
0 11
n
ee ii
s y xβ β=
⎡ ⎤= − +⎣ ⎦∑ ................................................................ 191
Pers. 8.3 0 1 ,y xβ β= −) )
.................................................................................... 191

250 LAMPIRAN
Pers. 8.4 1 1 11 2
2
1 1
1/,
1/
n n n
i i i ii i i
n n
i ii i
x y n x y
x n xβ = = =
= =
−=
⎛ ⎞− ⎜ ⎟⎝ ⎠
∑ ∑ ∑
∑ ∑
).......................................................... 191
Pers. 8.5 1 ,xy
xx
ss
β =)
........................................................................................... 191
Pers. 8.6
2
2 11 1
1 1
,
nn n
ii in nii i
xy i i xx ii i
xx ys x y s x
n n== =
= =
⎛ ⎞⎜ ⎟⎝ ⎠= − = −∑∑ ∑
∑ ∑ .............................. 191
Pers. 8.7 1 ,xxy
y
srs
β =)
dengan ;x xx y yys s s s= = .......................................... 191
Pers. 8.8 2σ = 2
2eess
n=
−. ............................................................................... 192
Pers. 8.9 1 0
2 22 2 2 1,dan
xx xx
s xs s ss n sβ β
⎛ ⎞= = +⎜ ⎟
⎝ ⎠...................................................... 192
Pers. 8.10 ( )2
2 1 peey
xx
x xs s
n s
⎡ ⎤−⎢ ⎥= +⎢ ⎥⎣ ⎦
dan ( )2
/ 21ˆ p
xx
x xy y t s
n sα
−= ± + .............. 200
Pers. 8.11 $
( )2
2 11 peey
xx
x xs s
n s
⎡ ⎤−⎢ ⎥= + +⎢ ⎥⎣ ⎦
dan ( )2
/ 21ˆ 1 p
xx
x xy y t s
n sα
−= ± + + .... 201

Daftar Contoh 251
DAFTAR CONTOH
Contoh 1.1. ............................................................................................................. 12
Contoh 1.2 .............................................................................................................. 13
Contoh 1.3 .............................................................................................................. 13
Contoh 3.1 .............................................................................................................. 48
Contoh 3.2 .............................................................................................................. 52
Contoh 3.3 .............................................................................................................. 53
Contoh 3.4. ............................................................................................................. 56
Contoh 3.5. ............................................................................................................. 56
Contoh 3.4 .............................................................................................................. 58
Contoh 3.5 .............................................................................................................. 59
Contoh 3.6 .............................................................................................................. 61
Contoh 4.1 .............................................................................................................. 75
Contoh 4.2 .............................................................................................................. 78
Contoh 4.3 .............................................................................................................. 80
Contoh 7.1 ............................................................................................................ 136
Contoh 7.2 ............................................................................................................ 137
Contoh 8.1 ............................................................................................................ 185
Contoh 8.2 ............................................................................................................ 194
Contoh 8.3 ............................................................................................................ 195
Contoh 8.4 ............................................................................................................ 199

252 LAMPIRAN
Contoh 8.5 ............................................................................................................ 209

INDEKS 253

254 LAMPIRAN
INDEKS
Alternatif ........................ 13, 200, 235
Anava ......... xx, 82, 83, 165, 194, 197
Animasi .................................... xv, 44
Berpasangan ............. 12, xx, 185, 196
Binomial.............................................
6, 25, 53, 79, 240, 241, 242, 243,
244, 246, 260, 263
Box-plot ......................................... 21
chi-kwadrat..................... 53, 107, 144
CIS ................................................... 9
Derajat .................................... 57, 208
Deskriptif ................... 5, 90, 127, 267
Determinasi .................................. 234
Deviasi ...............................................
........ xv, 57, 63, 168, 195, 263, 264
Diagnostik ..........................................
.................. xxi, 227, 228, 229, 230
Distribusi ............................................
xiv, xv, xvi, 25, 29, 32, 33, 34, 35,
52, 53, 56, 59, 60, 61, 62, 67, 68,
69, 70, 75, 76, 86, 106, 143, 240,
242, 260, 262, 263, 267
EDA ......................... 5, 108, 145, 262
Eksponensial ................ 25, 53, 60, 79
F 21, 53, 79, 81, 82, 113, 150, 195,
198, 217, 218, 221, 222, 224, 232,
233, 259
Frekuensi............................................
xv, xvii, xviii, 42, 43, 45, 106, 143
GUI.......... iv, 20, 21, 38, 39, 257, 261
HGLM............................................ 84
hipotesis .............................................
80, 165, 168, 169, 171, 173, 176,
177, 178, 179, 181, 183, 184, 186,
187, 189, 190, 195, 218
Hipotesis.............................................
9, 12, 14, 80, 168, 169, 172, 180,
186, 194, 199, 200, 218, 264
Histogram...........................................
xvi, xvii, xviii, xix, xx, 21, 78, 109,
110, 123, 146, 147, 160, 260, 264
Inferensial......................................... 6
Intervalxv, 36, 93, 130, 173, 184,
189, 214, 264
Keyakinan ...................... 7, xv, 36, 37

INDEKS Page 255
Korelasi ..............................................
xvii, xviii, xxi, 21, 57, 83, 107,
144, 207, 208, 209, 211, 212, 213,
214, 254
Kuantil................................................
xvii, xviii, xix, 54, 55, 113, 114,
122, 150, 151, 159
kumulatif ............ 59, 60, 73, 243, 248
Library.......................................... 261
Mean... 21, 32, 33, 36, 54, 56, 63, 195
Median ...............................................
xv, 54, 55, 56, 61, 62, 104, 105,
112, 141, 142, 149, 220, 223, 226,
232, 233, 247, 248, 249, 251
Modus........................... xv, 54, 56, 62
Nominal.......................... 92, 129, 266
Normal ...............................................
xv, xvi, 6, 21, 25, 32, 33, 34, 35,
42, 52, 53, 55, 56, 60, 67, 68, 69,
71, 73, 75, 76, 78, 79, 83, 87, 88,
113, 114, 150, 151, 172, 180, 186,
194, 217, 218, 228, 240, 241, 242,
248, 251, 260
Ordinal ................................... 92, 129
Parameter ........... 11, 32, 37, 165, 266
Pemusatan ................ 8, xv, 54, 62, 63
pencar .................................................
25, 109, 120, 146, 157, 209, 210,
222, 224, 260
Pencar.................................................
10, 11, xvii, xviii, xix, xx, xxi, 21,
120, 121, 122, 123, 157, 158, 159,
160, 219, 223, 224, 234, 260
Pencilan......................... xxi, 233, 234
Penyebaran ................................. 8, 57
plugin ............................................. 10
Plug-in..................... xiv, 31, 260, 261
Populasi.................................. 14, 266
Proporsi ..............................................
xxi, 21, 83, 165, 199, 200, 201,
202, 259
p-value................................................
106, 143, 173, 174, 177, 178, 181,
184, 185, 187, 188, 189, 190, 195,
201, 203, 213, 214, 218, 221, 222,
224, 232, 233
Ragam ............................. xvi, 69, 191
Range ....................................... 54, 57
Rasio................................. 44, 93, 130
Rcmdr......................... 20, 22, 30, 260

RCommander .................................... i
v, v, xiv, xvi, xviii, 10, 19, 20, 21,
22, 24, 25, 30, 31, 37, 38, 72, 74,
80, 87, 90, 94, 95, 97, 98, 101, 104,
108, 109, 113, 127, 131, 132, 134,
135, 138, 141, 145, 146, 150, 165,
171, 179, 186, 193, 211, 219, 225,
227, 259, 260
Regresi7, 12, 13, xv, xxi, 21, 36, 37,
84, 120, 157, 214, 225, 229, 230,
233, 234, 235, 244, 250, 254, 259,
266
Rentang ........................................ 242
Rerata28, 71, 80, 117, 118, 119, 154,
155, 156, 165, 170, 171, 179, 185,
195
Sampel8, 9, 12, xx, xxi, 14, 42, 49,
54, 76, 171, 175, 176, 182, 199,
201, 202, 259
SciViews ........................................ 20
signifikansi34, 35, 108, 145, 168,
222, 243, 246, 262
simetris ...............................................
34, 35, 52, 53, 55, 56, 60, 62, 67,
69, 86, 109, 112, 146, 149, 221,
240
StatDemo............................................
iv, v, 7, xiv, 10, 19, 21, 22, 23, 30,
31, 32, 41, 45, 62, 75, 87, 174, 179,
181, 185, 190, 257
Statistik...............................................
vi, 10, 11, xvi, xviii, 4, 15, 104,
141, 266, 267
Statistika.............................................
i, iii, iv, vi, 9, xiv, 4, 5, 6, 7, 9, 10,
15, 23, 25, 28, 30, 39, 42, 79, 80,
90, 127, 255, 256, 257, 259, 267
T .......... 33, 34, 81, 82, 168, 181, 182
Tinn-R ............................................ 20
Unimodal...................................... 267
Variansi ..............................................
57, 118, 155, 191, 193, 197, 259,
268
Wilcoxon................................ 21, 259
Z xv, 35, 68, 75, 78, 81, 82, 168, 256