web viewpermulaan regresi digunakan sebagai konsep dasar statistika oleh sir francis galton pada...
TRANSCRIPT
ANALISIS REGRESI LINIER
A. PENDAHULUAN
Pada pengujian hipotesis dengana chi-kuadrat untuk indepedensi dapat
diketahui ada atau tidaknya hubungan antara dua variabel atau lebih, tetapi tidak
dapat diketahui tentang bentuk dan eratnya hubungan tersebut. Bentuk dan eratnya
hubungan ini dapat diketahui melalui analisis regresi dan korelasi.
Permulaan regresi digunakan sebagai konsep dasar statistika oleh Sir Francis
Galton pada tahun 1877. Galton menggunakan istilah regresi untuk meramal satu
variabel dengan variabel lain. Misalnya, meramal tinggi badan anak-anak yang
dilahirkan oleh orang tua yang jangkung. Analisis regresi ini berkembang dan
digunakan untuk meramal lebih dari satu variabel yang dinamakan multiple
regresi. Dari analisis regresi dapat diketahui bentuk hubungan antara dua variabel,
sedangkan untuk mengetahui eratnya hubungan dapat diketahui dengan analisis
korelasi. Eratnya hubungan ini mempunyai arti penting karena makin erat
hubungan antara dua variabel maka semakin yakin terdapat hubungan antara dua
variabel tersebut yang merupakan hubungan sebab akibat.
Analisis regresi dan korelasi didasarkan atas hubungan atas hubungan yang
terjadi antara dua variabel atau lebih. Varibel yang digunakan untuk meramal
disebut variabel bebsa atau variabel independen, sedangkan variabel yang akan
diramal disebut variabel respons atau variabel dependen. Variabeldependen
biasanya terdiri dari satu variabel, sedangkan variabel independen dapat lebih dari
satu variabel. Misalnya keadaan kesehatan masyarakat suatu daerah dapat
1
dilakukan berdasarkan angka kesakitan. Di samping itu, dapat ditambahkan
beberapa variabel lain yang berkaitan dengan keadaan kesehatan, seperti keadaan
lingkungan dan keadaan sosial ekonomi.
Gambaran tentang hubungan antara dua variabel dapat diketahui melaui titik-
titik koordinat yang terdapat pada diagram pencar. Hubungan tersebut dapat
berupa garis lurus (linier) atau garis lengkung (kurva linier). Kedua bentuk
hubungan tersebut dapat berupa garis regresi positif atau negatif. Dikatakan
regresi positif bila perubahan yang terjadi pada variabel diikuti oleh perubahan
dengan arah yang sama pada variabel dependen sehingga garis yang dihasilkan
bergerak dari kiri bawah ke kanan atas. Sebaliknya, bila perubahan pada variabel
independen diikuti oleh variabel dependen dengan arah yang berlawanan disebut
regresi negatif sehingga garis yang dihasilkan bergerak dari kiri atas ke kanan
bawah.
B. DEFINISI
Analisis regresi merupakan suatu model matematis yang dapat digunakan
untuk mengetahui hubungan antara dua atau lebih variabel.
C. TUJUAN
Tujuan analisis regresi adalah untuk membuat perkiraan (prediksi) nilai suatu
variabel (variabel dependen) melalui variabel yang lain (variabel independen).
2
Tujuan analisis regresi ganda adalah untuk menemukan model regresi yang paling
sesuai menggambarkan faktor-faktor yang berhubungan dengan variabel
dependen. Pada prinsipnya, model regresi ganda dapat berguna untuk dua hal:
a. Prediksi
Memperkirakan variabel dependen dengan menggunakan informasi yang ada
pada sebuah atau beberapa variabel independen. Disini dapat diketahui secara
probabilitas nilai variabel dependen bila seseorang/individu mempunyai suatu
set variabel dengan independen tertentu.
b. Estimasi
Menguantifikiasi hubungan sebuah atau beberpaa variabel independen dengan
sebuah variabel dependen. Pada fungsi ini regresi dapat digunakan untuk
mengetahui variabel independen apa saja yang berhubungan dengan variabel
dependen. Selain itu kita juga dapat mengetahui seberapa besar hubungan
masing-masing independen terhadap variabel independen lainnya.
Dari analisis ini dapat diketahui variabel mana yang paling besar/dominan
mempengaruhi variabel dependen, yang ditunjukkan dari koefisien regresi (b)
yang sudah distandardisasi yaitu nilai beta.
D. MACAM-MACAM ANALISIS REGRESI LINIER
Terdapat dua macam analisis regresi linier yaitu:
1. Regresi Linier Sederhana
Sebagai contoh : untuk menghubungkan dua variabel numerik berat badan
dan tekanan darah sebagai variabel dependen, sehingga dengan regresi kita
3
dapat memperkirakan besarnya nilai tekanan darah jika diketahui data berat
badan.
Untuk melakukan prediksi digunakan persamaan garis yang dapat diperoleh
dengan berbagai cara/metode. Salah satu cara yang sering digunakan oleh
peneliti adalah dengan menggunakan metode kuadrat terkecil (least square).
Metode ini merupakan suatu metode pembuatan garis regresi dengan
meminimalkan jumlah kuadrat jarak antara nilai Y yang teramati dan Y yang
diramalkan oleh garis regresi itu.
Secara matematis digambarkan dengan persamaan berikut:
Y=a+bx
Ketika berhadapan pada kondisi ilmu sosial, ada kemungkinan terjadi
kesalahan atau penyimpangan pada hubungan antarvaribel, artinya untuk
beberapa nilai X yang sama kemungkinan diperoleh nilai Y yang berbeda.
Misalnya pada hubungan berat badan dengan tekanan darah, tidak setiap
orang yang berat badannya sama memiliki tekanan darah yang sama. Maka
persamaan garis yang dibetuk menjadi:
Y=a+bx+e
Y = Variabel dependen
X = Variabel independen
a = Intercept, perbedaan besarnya rata-rata variabel Y ketika variabel X=0
b = Slope, perkiraan besarnya perubahan nilai variabel Y bila nilai variabel
X berubah satu unit pengukuran
4
e = Nilai kesalahan (error) yaitu selisih atara nilai Y individual yang
teramati dengan nilai Y yang sesungguhnya pada titik X tertentu.
Kesalahan Standar Estimasi
Besarnya kesalahan standar estimasi (Se) menunjukkan ketepatan persamaan
estimasi untuk menjelaskan nilai variabel dependen yang sesungguhnya.
Semakin kecil nilai Se, makin tinggi ketepatan persamaan estimasi yang
dihasilkan untuk menjelaskan nilai variabel dependen yang sesunguhnya. Dan
sebaliknya, semakin besar nilai Se, makin rendah ketepatan persamaan estimasi
yang dihasilkan untuk menjelaskan nilai variabel dependen yang sesungguhnya
Koefisien Determinasi (R2)
Ukura yang penting dan sering digunakan dalam analisis regresi adalah
koefisien determinasi (R2). Koefisien determinasi berguna untuk mengetahui
5
seberapa besar variasi variabel dependen (Y) dapat dijelaskan oleh variabel
independen (X), atau dengan kata lain R2 menunjukkan seberapa jauh variabel
independen dapat memprediksi variabel dependen. Semakin besasr nilai R
square semakin baik/semakin tepat variabel independen memprediksi variabel
dependen. Besarnya nilai R square antara 0 s.d 1.
2. Regresi Linier Ganda
Dalan regresi linier ganda, variabel dependenya harus numerik, sedangkan
variabel independen boleh semuanya numerik dan boleh juga campuran
numerik dan kategorik.
Model persamaan regresi linier ganda merupakan perluasan regresi linier
sederhana, yaitu:
Y=a+b 1 X 1+b2 X 2+…+bkXk+e
Setiap melakukan analisis regresi linier ganda harus memenuhi
asumsi/persyaratan yang ditetapkan. Adapun asumsi yang digunakan dalam
regresi linier ganda antara lain:
1. Asumsi ekstensi (variabel random)
Untuk tiap nilai dari variaabel X (variabel independen), variabel Y
(dependen) adalah variabel random yang mempunyai mean dan varian
tertentu. Asumsi ini berkaitan dengan teknik pengambilan sampel. Untuk
memenuhi asumsi ini, sampel yang diambil harus dilakukan dengan
random.
6
2. Asumsi Independensi
Suatu keadaan dimana masing-masing nilai Y bebas satu sama lain. Jadi
nilai dari tiap-tiap individu saling berdiri sendiri. Tidak diperbolehkan nilai
observasi yang berbeda yang diukur dari satu individu diukur dua kali.
Untuk mengetahui asumsi ini dilakukan dengan cara mengeluarkan uji
durbin Watson, bila uji durbin -2 s.d +2 berarti asumsi indepedensi
terpenuhi, sebaliknya bila nilai uji Durbin <-2 atau >+2 berarti asumsi
tidak terpenuhi.
3. Asumsi Linieritas
Nilai mean dari variabel Y untuk suatu kombinasi X1, X2, X3,....., Xk
terletak pada garis/bidang linier yang dibentuk dari persamaan regresi.
Untuk mengetahui asumsi linieritas dapat diketahui dari uji ANOVA
(everali F test) bila hasilnya signifikan (p value<alpha) maka model
berbentuk linier.
4. Asumsi Homoscedascity
Varian nilai variabel Y sama untuk semua nilai variabel X.
Homoscedasticity dapat diketahui dengan melakukan pembuatan plot
residual. Bila titil tabaran tidak berpola tertentu dan menyebar merata
disekitaar garis titik nol maka dapat disebtu varian homogen pada setiap
nilai X dengan demikian asumsi homoscendasticity terpenuhi. Sebaliknya
bila titik tebaran membentuk pola tertentu misalnya mengelompok di
bawah atau di garis tengah nol, maka diduga variannya terjadi
heteroscedasticity.
7
5. Asumsi Normalitas
Variabel Y mempunyai distribusi normal untuk setiap pengamatan variabel
X. Dapat diketahui dari normal P-P plot residual, bila data menyebar di
sekitar garis diagonal dan mengikuti arah garis diagonal, maka model
regresi memenuhi model regresi tidak memenuhi asumsi normalitas.
Berikut langkah-langkah dalam pemodelan regresi linier ganda:
1. Melakukan analisis bivariat untuk menentukan variabel yang menjadi
kandidat model.
2. Lakukan analisis secara bersamaan, lakukan pemilihan variabel yang masuk
dalam model
3. Melakukan diagnostik regresi linier
4. Melakukan analisis interaksi
5. Penilaian reliabilitas model.
Analisis korelasi untuk numerik – numerik (variabel umur, berat ibu,
frekuensi ANC terhadap berat badan bayi)
E. CONTOH PENELITIAN DENGAN REGRESI LINIER
Judul penelitian : Analisis faktor resiko terjadinya kejadian BBLR pada ibu hamil
Di Kabupaten Muko-Muko.
Data yang digunakan adalah data LBW.SAV
8
Variabel independennya meliputi berat badan ibu dalam pounds (LWT), umur ibu
(AGE), riwayat merokok (SMOKE), frekuensi melakukan ANC (FTV). Variabel
dependennya berat badan bayi (BWT).
Kode variabel pada file data : LBW.SAV
Nama Definisi Operasional Hasil UkurId Nomor IdentitasBWT Berat badan bayi GramLWT Berat badan ibu pada saat menstruasi terakhir PoundsAGE Umur Ibu TahunSMOKE Kebiasaan merokok selama hamil 0 = tidak
1 = yaFTV Frekuensi periksa hamil pada trimester pertama 0,1,2, dst
LANGKAH PERTAMA
UJI ASUMSI UNIVARIATE NORMALITY
Variabel numerik harus berdistribusi NORMAL (terutama var dep),agar dapat
dianalisa dengan uji statistik parametric. Variabel numeric harus berdistribusi
normal. Pengujian variabel numeric ini dilakukan dengan uji Kolmogorov
Smirnov-1-sampel.
Langkah pada SPSS yaitu :
Klik “analyze” sorot dan klik “Nonparametric Test”
Kemudian sorot 1-sample-KS
9
Klik variabel numerik ke kolom “test variabel list”
Maka pada output akan muncul hasil sebagai berikut :
One-Sample Kolmogorov-Smirnov Test
10
weight at last
menstrual period
number of visits
to physician
during 1st
trimester
birthweight
(grams)
N 189 189 189
Normal Parametersa,b Mean 129.82 .79 2944.29
Std. Deviation 30.575 1.059 729.016
Most Extreme Differences Absolute .152 .302 .043
Positive .152 .302 .043
Negative -.075 -.227 -.043
Test Statistic .152 .302 .043
Asymp. Sig. (2-tailed) .000c .000c .200c,d
a. Test distribution is Normal.
b. Calculated from data.
c. Lilliefors Significance Correction.
d. This is a lower bound of the true significance.
Dari hasil analisis didapatkan variabel dependen nya mempunyai nilai-p
KS > 005 berarti asumsi normal variabel numeric untuk variabel
dependennya sudah terpenuhi.
PERMODELAN SELEKSI BIVARIAT
Seleksi bivariat masing-masing variabel independen dengan variabel dependen.
Variabel yang dapat masuk model multivariat adalah variabel pada analisis
bivariat mempunya nilai p (p value) < 0.25. namun ketentuan p value < 0,25 ini
tidaklah harus dipenuhi manakala dijumpai ada suatu variabel yang walaupun
pvalue-nya > 0,25 karena secara substansi sangat penting berhubungan dengan
variabel dependen, maka variabel tersebut diikutkan dalam model multivariat.
Uji yang digunakan pada analisis bivariat tergantung dari variabel yang
digunakan, bila : variabel independennya numerik maka uji yang digunakan uji
11
korelasi, sedangkan bila independennya kategorik maka uji yang digunakan uji T
atau uji anova.
Bivariat dengan uji korelasi : melakukan analisis bivariat untuk variabel
independen berjenis numerik yaitu variabel berat badan ibu pada saat
menstrusasi terakhir (LWT), umur (AGE) dan frekuensi periksa hamil (FTV)
pada trimester pertama.
Langkah nya :
klik “analysis”, sorot ke “correlate”, sorot dan klik “Bivariate”
muncul di layar menu “Bivariate Correlations”
pada kotak variables, isikan semua variabel numeric baik variabel
independen (LWT, AGE, FTV) maupun variabel dependennya (BWT)
klik tombol OK
12
Maka akan muncul hasil
Dari hasil analisis dengan korelasi didapatkan p value untuk variabel umur
(p=0,221), berat badan (p=0,010), dan frekuensi anc (0,423). Dari hasil ini dapat
disimpulkan bahwa variabel umur dan berat badan mempunyai nilai p < 0,25,
dengan demikian kedua variabel tersebut dapat dilanjutkan ke model multivariat.
13
Sedangkan untuk variabel frekuensi anc empunyai p value > 0,25 yaitu 0,423
sehingga tidak bisa masuk ke multivariat.
Bivariat uji T : melakukan analisis bivariat untuk variabel independen berjenis
kategorik : merokok. Maka langkah-langkah dalam SPSS nya sebagai berikut :
Pada menu utama SPSS, pilih menu “Analyze”, kemudian pilih sub menu
“Compare Means”, lalu pilih “Independen_Samples T-Test”
Pada layar tampak kotak yang ada di dalamnya ada kotak “Test variables”
dan “Grouping Variable”. Ket : kotak test variables tempat memasukkan
variabel numeriknya, sedangkan kotak grouping variable untuk memasukkan
variable kategoriknya, hati-hati jangan sampai terbalik.
klik “bwt” dan masukkan ke kotak “Test variable”
klik variabel “smoke” dan masukkan ke kotak “Grouping Variables”
klik OK
Maka akan muncul hasil sebagai berikut :
14
Hasil analisis hubungan merokok dengan berat bayi menghasilkan p value =
0,009, dengan demikian p value yang dihasilkan < 0,25 maka variabel merokok
dapat lanjut ke multivariat.
Langkah kedua
Permodelan Multivariat
Setelah tahap bivariat selesai, tahap berikutnya melakukan analisis multivariat
secara bersama-sama. Variabel yang valid dalam model multivariat adalah
variabel yang mempunyai p value < 0,05. Bila dalam model multivariate terdapat
variabel yang p value nya > 0,05, maka variabel tersebut harus dikeluarkan dalam
model. Pengeluaran variabel dilakukan tidak serempak, melainkan bertahap satu
per satu dikeluarkan dimulai dari p value yang terbesar. Adapun proses
selengkapya sebagai berikut :
15
Klik “Analyze” , sorot “regression”, sorot dan klik “linier” lalu muncul
“regresi linear”
pada kotak “dependen isikan variabel dependen (dalam hal ini berarti bwt)
dan kotak ‘independen’ isikan variabel independennya (dalam hal ini age,
lwt, smoke)
16
Regression
Model Summary
Model R R Square
Adjusted R
Square
Std. Error of the
Estimate
1 .265a .070 .055 708.691
a. Predictors: (Constant), age of mother, smoked during pregnancy,
weight at last menstrual period
ANOVAa
Model Sum of Squares df Mean Square F Sig.
1 Regression 7000336.310 3 2333445.437 4.646 .004b
Residual 92914962.261 185 502243.039
Total 99915298.571 188
a. Dependent Variable: birthweight (grams)
17
b. Predictors: (Constant), age of mother, smoked during pregnancy, weight at last menstrual
period
Coefficientsa
Model
Unstandardized Coefficients
Standardized
Coefficients
t Sig.B Std. Error Beta
1 (Constant) 2363.765 300.693 7.861 .000
weight at last menstrual
period4.020 1.720 .169 2.338 .020
smoked during pregnancy -268.146 105.791 -.180 -2.535 .012
age of mother 7.041 9.923 .051 .710 .479
a. Dependent Variable: birthweight (grams)
Dari kotak ‘model summary’ didapatkan nilai R Square sebesar 0,07 artinya
keempat variabel independen dapat menjelaskan variabel berat bayi sebesar 7 %
sedangkan sisanya dijelaskan oleh variabel lainnya. Dari hasil uji statistic (lihat
kotak anova) didapatkan p value 0,004 berarti persamaan garis regresi secara
keseluruhan sudah signifikan. Namun demikian prinsip permodelan harus yang
sederhana vaiabelnya sehingga masing-masing variabel independen perlu di cek p
valuenya, variabel yang p valuenya >0,05 dikeluarkan dari model.
Ternyata dari 3 variabel independen (lihat kolom sig di kotak Coefficients) ada 1
variabel yang p valuenya >0,05 yaitu umur (0,479). Tahap berikutnya
mengeluarkan variabel yang p valuenya >0,05, pengeluaran variabel dimulai dari
p value yang terbesar. Dengan demikian variabel yang dikeluarkan adalah umur
ibu.
Langkahnya :
Klik “analyze”, sorot “regression”sorot dan klik “Linier”
18
Di layar nampak pada kotak Dependen masih terisi ‘bwt’ lewati dan biarkan
saja. Pada kotak Independen juga masih lengkap dengan 3 variabel, namun
sekarang kita harus mengeluarkan variabel umur ibu dan masukkan ke kotak
Variable di sebelah kiri
Klik “OK, dan hasilnya akan seperti berikut :
RegressionModel Summary
Model R R Square
Adjusted R
Square
Std. Error of the
Estimate
1 .260a .068 .058 707.744
a. Predictors: (Constant), smoked during pregnancy, weight at last
menstrual period
ANOVAa
Model Sum of Squares df Mean Square F Sig.
1 Regression 6747500.652 2 3373750.326 6.735 .001b
Residual 93167797.920 186 500902.139
Total 99915298.571 188
a. Dependent Variable: birthweight (grams)
b. Predictors: (Constant), smoked during pregnancy, weight at last menstrual period
Coefficientsa
Model
Unstandardized Coefficients
Standardized
Coefficients
t Sig.B Std. Error Beta
1 (Constant) 2500.212 230.848 10.831 .000
weight at last menstrual
period4.238 1.690 .178 2.508 .013
smoked during pregnancy -270.924 105.577 -.182 -2.566 .011
a. Dependent Variable: birthweight (grams)
19
Setelah variabel umur ibu dikeluarkan, kita cek dulu apakah setelah dikeluarkan,
ada perubahan besar (berubah lebih ari 10%) untuk R square dan Coef. B. bila ada
perubahan yang besar maka variabel tersebut tidak jadi dikeluarkan dalam model
(tetap dipertahankan di dalam model). Untuk nilai R Square ternyata tidak ada
mengalami perubahan yaitu tetap 0,068. Sedangkan untuk Coefficient B ,
sekarang kita bandingkan niali coefficient B untuk variabel umur, berat ibu dan
status merokok antara sebelum dan sesudah variabel umur dikeluarkan, hasil
perhitungannya sebagai berikut :
Setelah variabel umur dikeluarkan, nilai R Square mengalami perubahan
yang sedikit yaitu 0,068. Sedangka untuk nilai coefficient B, hasil perhitungannya
sebagai berikut :
Variabel Masih Lengkap Umur dikeluarkan Perubahan Coef
Age 6,5 - -Lwt 3,97 4,23 2,36%Smoke -267,71 -270,92 0Ftv 13,74 - -
Dari hasil perhitunagn perubahan coef. B ternyata tidak ada yang yang lebih dari
10%, dengan demikian variabel umur kita keluarkan dari model.
Langkah Ketiga
UJI ASUMSI
Agar persamaan garis yang digunakan untuk memprediksi menghasilkan angka-
angka yang valid, maka persamaan yang dihasilkan harus memenuhi asumsi-
asumsi yang dipersyaratkan uji regresi linier ganda. Adapun uji asumsi sebagai
berikut :
20
Langkahnya :
Klik ‘Analyze’, sorot ‘Regression’, sorot dan klik ‘Linier’
Masukkan dalam kotak Dependen variabel ‘bwt’
Masukkan dalam kotak Independen variabel berat badan ibu (lwt) dan status
merokok(smoke)
Klik tombol ‘Statistics’
Klik kotak ‘Collinearity diagnostic’dan klik kotak ‘Covariance matrix’
(perintah ini untuk uji asumsi Multicoliniarity)
Klik kotak ‘Durbin-Watson’(perintah ini untuk uji asumsi Independensi)
21
Klik ‘continue’
Klik tombol “Plot”
Masukkan “SRESID” ke kotak Y dan masukkan ‘ZPRED’ ke kotak X
(perintah ini untuk uji asumsi Homoscedasity)
Klik kotak ‘Histogram’ dan kotak “Normal probability plot” (perintah ini
untuk uji asumsi Normality)
22
Klik ‘continue’
Hasilnya :
Asumsi Eksistensi (Variabel Random)
Untuk tiap nilai dari variabel X (variabel Independen), variabel Y
(dependen) adalah variabel random yang mempunyai mean dan varian
tertentu. Asumsi ini berkaitan dengan teknik pengambilan sampel. Untuk
memenuhi asumsi ini, sampel yang diambil harus dilakukan dengan
random. Cara mengetahui asumsi eksistensi degan cara melakukan analisis
deskriptif variabel residual dari model, bila residual menunjukkan adanya
mean yang mendekati nilai nol dan ada sebran (varian data standar deviasi)
maka asumsi ekstensi terpenuhi.
Hasil analisis sebagai berikut :
Residuals Statisticsa
Minimum Maximum Mean Std. Deviation N
Predicted Value 2568.31 3521.52 2944.29 189.449 189
Std. Predicted Value -1.985 3.047 .000 1.000 189
Standard Error of Predicted
Value65.998 221.763 86.009 23.584 189
Adjusted Predicted Value 2577.13 3498.87 2944.77 189.944 189
Residual -2030.124 1968.540 .000 703.970 189
Std. Residual -2.868 2.781 .000 .995 189
Stud. Residual -2.887 2.794 .000 1.002 189
Deleted Residual -2057.401 1986.522 -.482 714.411 189
Stud. Deleted Residual -2.946 2.847 -.001 1.008 189
Mahal. Distance .640 17.463 1.989 2.173 189
Cook's Distance .000 .084 .005 .009 189
Centered Leverage Value .003 .093 .011 .012 189
a. Dependent Variable: birthweight (grams)
23
Hasil dari output di atas menunjukkan bahwa angka residual dengan mean
0,000 dan standar deviasi 703,97. Dengan demikian asumsi Eksistensi
terpenuhi.
Asumsi Independensi
Suatu keadaan dimana masing-masing niali Y bebas satu sama lain. Jadi
niali dari tiap-tiap individu saling ebrdiri sendiri. Tidak diperbolehkan
nilai observasi yang berbeda yang diukur dari satu individu diukur dua
kali. Untuk mengetahui asumsi ini dilakukan dengan cara mengeluarkan
uji Durbin Watson, bila nilai Durbin -2 sampai dengan + 2 berarti asumsi
independensi terpenuhi, sebaliknya bila nilai Durbin Watson , -2 atau > +2
maka asumsi ini tidak terpenuhi.
Model Summaryb
Model R R Square
Adjusted R
Square
Std. Error of the
Estimate Durbin-Watson
1 .260a .068 .058 707.744 .303
a. Predictors: (Constant), weight at last menstrual period, smoked during pregnancy
b. Dependent Variable: birthweight (grams)
Dari hasil uji didapatkan koefisien Durbin Watson 0,303, maka dengan
demikian asumsi Independensi terpenuhi.
Asumsi Linieritas
Niali mean dari variabel Y untuk kombinasi X1, X2, X3….,Xk terletak pada
garis/bidang linier yang dibentuk dari persamaan regresi. Untuk
mengetahui asumsi linieritas dapat diketahui melalui uji ANOVA (overall
24
F test), bial hasilnya signifikan (p value < alpha) maka model berbentuk
linier. Hasil dari analisis sebagai berikut :
ANOVAa
Model Sum of Squares df Mean Square F Sig.
1 Regression 6747500.652 2 3373750.326 6.735 .001b
Residual 93167797.920 186 500902.139
Total 99915298.571 188
a. Dependent Variable: birthweight (grams)
b. Predictors: (Constant), weight at last menstrual period, smoked during pregnancy
Dari hasil analisis di atas didapatkan hasil uji anova 0,001, berarti asumsi
linieritas terpenuhi.
Asumsi Homoscedascity
Varian nilai variabel Y sama untuk semua nilai variabel X.
Homoscedascity dapat diketahui dengan melakukan pembuatan plot
residual. Bila titik tebaran tidak berpola tertentu dan menyebar merata di
sekitar garis titik nol maka dapat disebut varian homogeny pada setiap
niali X dengan demikian asumsi homoscedascity terpenuhi. Sebaliknya
bila titik tebaran membentuk pola tertentu misalnya mengelompok di
bawah atau di atas garis tengah nol, maka diduga variannya terjadi
heteroscedascity.
25
Dari hasil plot di atas terlihat tebaran titik mempunyai pola yang sama
antara titik-titik di atas dan di bawah garis diagonal 0. Dengan demikian
asumsi homoscedascity terpenuhi.
Asumsi Normalitas
Variabel Y mempunyai distribusi normal untuk setiap pengamatan
variabel X. dapat diketahui dari Normal P-P Plot Residual, bila data
menyebar di sekitar garis diagonal dan mengikuti arah garis diagonal,
maka model regresi memenuhi asumsi model regresi memenuhi asumsi
normalitas.
26
Dari grafik histogram dan grafik Normal P-P Plot teerbukti bahwa bentuk
distribusinya normal, maka berarti asumsi normality terpenuhi.
27
Diagnostic Multicollinearity
Dalam regresi linier tidak boleh terjadi sesame variabel independen
berkorelasi secara kuat (multicollinearity). Untuk mendeteksi collinearity
dapat diketahui dari nilai VIF (Variance Inflation Factor), bial nilai VIF
lebih dari 10 maka mengindikasikan telah terjadi collinearity.
Coefficientsa
Model
Unstandardized
Coefficients
Standardized
Coefficients
t Sig.
Collinearity Statistics
B Std. Error Beta Tolerance VIF
1 (Constant) 2500.212 230.848 10.831 .000
smoked during
pregnancy-270.924 105.577 -.182 -2.566 .011 .998 1.002
weight at last menstrual
period4.238 1.690 .178 2.508 .013 .998 1.002
a. Dependent Variable: birthweight (grams)
Dari hasil uji asumsi didapatkan nilai VIF tidak lebih dari 10, dengan
demikian tidak ada Multicollinearity antara sesama variabel Independen.
Dari hasil uji asumsi dan uji Kolinearitas ternyata semua asumsi terpenuhi
sehingga model dapat digunakan untuk memprediksi berat bayi.
Langkah selanjutnya adalah uji Interaksi, namun karena secara substansi
antara variabel dipandang tidak interaksi maka uji interaksi tidak
dilakukan.
Sehingga model yang terakhir adalah sebagai berikut :
Model Summaryb
Model R R Square
Adjusted R
Square
Std. Error of the
Estimate Durbin-Watson
28
1 .260a .068 .058 707.744 .303
a. Predictors: (Constant), weight at last menstrual period, smoked during pregnancy
b. Dependent Variable: birthweight (grams)
Coefficientsa
Model
Unstandardized
Coefficients
Standardized
Coefficients
t Sig.
Collinearity Statistics
B Std. Error Beta Tolerance VIF
1 (Constant) 2500.212 230.848 10.831 .000
smoked during
pregnancy-270.924 105.577 -.182 -2.566 .011 .998 1.002
weight at last
menstrual period4.238 1.690 .178 2.508 .013 .998 1.002
a. Dependent Variable: birthweight (grams)
Interpretasi model :
Setalah dilakukan analisis, ternyata variabel independen yang masuk model
regresi adalah berat badan ibu dan status merokok. Pada tabel “Model Summary”
terlihat koefisien determinasi (R Square) menunjukkan nilai 0,068 artinya bahwa
model regesi yang diperolah dapat menjelaskan 6,8% variasi variabel dependen
berat bayi. Atau dengan kata lain kedua variabel independen tersebut dapat
menjelaskan varaisi variabel berat bayi sebesar 6,8%. Kemudian pada kotak
“ANOVA”, kita lihat hasil uji F yang menunjukkan nilai P (sig) = 0,000, berarti
pada alpha 5% kita dapat menyatakan bahwa model regresi cocok (fit) dengan
data yang ada. Atau dapat diartikan kedua variabel tersebut secara signifikan
dapat untuk memprediksi variabel berat bayi.
29
Pada kotak “Coefficient”kita dapat memperoleh persamaan garisnya, pada kolom
B (di bagian Variabel In Equation) di atas, kita dapat mengetahui koefisien regresi
masing-masing variabel. Dari ahsil di ats persamaan regresi yang diperoleh adalah
Berat bayi = 2500 - 270,94 (smoke) + 4,238(lwt)
Dengan model persamaan ini, kita dapat memperkirakan berat bayi dengan
menggunakan variabel berat badan ibu dan merokok. Adapun arti koef. B untuk
masing-masing variabel adalah sebagai berikut :
- Setiap kenaikan berat badan ibu sebesar 1 kg, maka berat bayi akan naik
sebesar 4,238 gram setelah dikontrol variabel merokok.
- Pada ibu yang merokok berat bayinya akan lebih rendah sebesar 270,94 gram
setelah dikontrol variabel berat badan ibu.
Kolom Beta dapat digunakan untuk mengetahui variabel mana yang apling besar
peranannya (pengaruhnya) dalam menentukan variabel dependennya (berat bayi).
Semakin besar nilai Beta semakin besar pengaruhnya terhadap variabel
dependennya. Pada hasil di atas berarti variabel yang paling besar pengaruhnya
terhadap berat bayi adalah berat badan ibu.
30
DAFTAR PUSTAKA
Budiarto, E. Biostatistika Untuk Kedokteran dan Kesehatan Masyarakat.
Jakarta. EGC. 2001
Dahlan, S. Seri 10 Analisis Multivariat Regresi Linier. PT epidemiologi
Indonesia. Jakarta. 2012
Hastono, SP. Analisis Data Kesehatan. FKM UI. 2007
Hastono, SP dan Sabri, L. Statistik Kesehatan. Rajawali Pers. Jakarta. 2011
31