web viewpermulaan regresi digunakan sebagai konsep dasar statistika oleh sir francis galton pada...

ANALISIS REGRESI LINIER

A. PENDAHULUAN

Pada pengujian hipotesis dengana chi-kuadrat untuk indepedensi dapat

diketahui ada atau tidaknya hubungan antara dua variabel atau lebih, tetapi tidak

dapat diketahui tentang bentuk dan eratnya hubungan tersebut. Bentuk dan eratnya

hubungan ini dapat diketahui melalui analisis regresi dan korelasi.

Permulaan regresi digunakan sebagai konsep dasar statistika oleh Sir Francis

Galton pada tahun 1877. Galton menggunakan istilah regresi untuk meramal satu

variabel dengan variabel lain. Misalnya, meramal tinggi badan anak-anak yang

dilahirkan oleh orang tua yang jangkung. Analisis regresi ini berkembang dan

digunakan untuk meramal lebih dari satu variabel yang dinamakan multiple

regresi. Dari analisis regresi dapat diketahui bentuk hubungan antara dua variabel,

sedangkan untuk mengetahui eratnya hubungan dapat diketahui dengan analisis

korelasi. Eratnya hubungan ini mempunyai arti penting karena makin erat

hubungan antara dua variabel maka semakin yakin terdapat hubungan antara dua

variabel tersebut yang merupakan hubungan sebab akibat.

Analisis regresi dan korelasi didasarkan atas hubungan atas hubungan yang

terjadi antara dua variabel atau lebih. Varibel yang digunakan untuk meramal

disebut variabel bebsa atau variabel independen, sedangkan variabel yang akan

diramal disebut variabel respons atau variabel dependen. Variabeldependen

biasanya terdiri dari satu variabel, sedangkan variabel independen dapat lebih dari

satu variabel. Misalnya keadaan kesehatan masyarakat suatu daerah dapat

1

dilakukan berdasarkan angka kesakitan. Di samping itu, dapat ditambahkan

beberapa variabel lain yang berkaitan dengan keadaan kesehatan, seperti keadaan

lingkungan dan keadaan sosial ekonomi.

Gambaran tentang hubungan antara dua variabel dapat diketahui melaui titik-

titik koordinat yang terdapat pada diagram pencar. Hubungan tersebut dapat

berupa garis lurus (linier) atau garis lengkung (kurva linier). Kedua bentuk

hubungan tersebut dapat berupa garis regresi positif atau negatif. Dikatakan

regresi positif bila perubahan yang terjadi pada variabel diikuti oleh perubahan

dengan arah yang sama pada variabel dependen sehingga garis yang dihasilkan

bergerak dari kiri bawah ke kanan atas. Sebaliknya, bila perubahan pada variabel

independen diikuti oleh variabel dependen dengan arah yang berlawanan disebut

regresi negatif sehingga garis yang dihasilkan bergerak dari kiri atas ke kanan

bawah.

B. DEFINISI

Analisis regresi merupakan suatu model matematis yang dapat digunakan

untuk mengetahui hubungan antara dua atau lebih variabel.

C. TUJUAN

Tujuan analisis regresi adalah untuk membuat perkiraan (prediksi) nilai suatu

variabel (variabel dependen) melalui variabel yang lain (variabel independen).

2

Tujuan analisis regresi ganda adalah untuk menemukan model regresi yang paling

sesuai menggambarkan faktor-faktor yang berhubungan dengan variabel

dependen. Pada prinsipnya, model regresi ganda dapat berguna untuk dua hal:

a. Prediksi

Memperkirakan variabel dependen dengan menggunakan informasi yang ada

pada sebuah atau beberapa variabel independen. Disini dapat diketahui secara

probabilitas nilai variabel dependen bila seseorang/individu mempunyai suatu

set variabel dengan independen tertentu.

b. Estimasi

Menguantifikiasi hubungan sebuah atau beberpaa variabel independen dengan

sebuah variabel dependen. Pada fungsi ini regresi dapat digunakan untuk

mengetahui variabel independen apa saja yang berhubungan dengan variabel

dependen. Selain itu kita juga dapat mengetahui seberapa besar hubungan

masing-masing independen terhadap variabel independen lainnya.

Dari analisis ini dapat diketahui variabel mana yang paling besar/dominan

mempengaruhi variabel dependen, yang ditunjukkan dari koefisien regresi (b)

yang sudah distandardisasi yaitu nilai beta.

D. MACAM-MACAM ANALISIS REGRESI LINIER

Terdapat dua macam analisis regresi linier yaitu:

1. Regresi Linier Sederhana

Sebagai contoh : untuk menghubungkan dua variabel numerik berat badan

dan tekanan darah sebagai variabel dependen, sehingga dengan regresi kita

3

dapat memperkirakan besarnya nilai tekanan darah jika diketahui data berat

badan.

Untuk melakukan prediksi digunakan persamaan garis yang dapat diperoleh

dengan berbagai cara/metode. Salah satu cara yang sering digunakan oleh

peneliti adalah dengan menggunakan metode kuadrat terkecil (least square).

Metode ini merupakan suatu metode pembuatan garis regresi dengan

meminimalkan jumlah kuadrat jarak antara nilai Y yang teramati dan Y yang

diramalkan oleh garis regresi itu.

Secara matematis digambarkan dengan persamaan berikut:

Y=a+bx

Ketika berhadapan pada kondisi ilmu sosial, ada kemungkinan terjadi

kesalahan atau penyimpangan pada hubungan antarvaribel, artinya untuk

beberapa nilai X yang sama kemungkinan diperoleh nilai Y yang berbeda.

Misalnya pada hubungan berat badan dengan tekanan darah, tidak setiap

orang yang berat badannya sama memiliki tekanan darah yang sama. Maka

persamaan garis yang dibetuk menjadi:

Y=a+bx+e

Y = Variabel dependen

X = Variabel independen

a = Intercept, perbedaan besarnya rata-rata variabel Y ketika variabel X=0

b = Slope, perkiraan besarnya perubahan nilai variabel Y bila nilai variabel

X berubah satu unit pengukuran

4

e = Nilai kesalahan (error) yaitu selisih atara nilai Y individual yang

teramati dengan nilai Y yang sesungguhnya pada titik X tertentu.

Kesalahan Standar Estimasi

Besarnya kesalahan standar estimasi (Se) menunjukkan ketepatan persamaan

estimasi untuk menjelaskan nilai variabel dependen yang sesungguhnya.

Semakin kecil nilai Se, makin tinggi ketepatan persamaan estimasi yang

dihasilkan untuk menjelaskan nilai variabel dependen yang sesunguhnya. Dan

sebaliknya, semakin besar nilai Se, makin rendah ketepatan persamaan estimasi

yang dihasilkan untuk menjelaskan nilai variabel dependen yang sesungguhnya

Koefisien Determinasi (R2)

Ukura yang penting dan sering digunakan dalam analisis regresi adalah

koefisien determinasi (R2). Koefisien determinasi berguna untuk mengetahui

5

seberapa besar variasi variabel dependen (Y) dapat dijelaskan oleh variabel

independen (X), atau dengan kata lain R2 menunjukkan seberapa jauh variabel

independen dapat memprediksi variabel dependen. Semakin besasr nilai R

square semakin baik/semakin tepat variabel independen memprediksi variabel

dependen. Besarnya nilai R square antara 0 s.d 1.

2. Regresi Linier Ganda

Dalan regresi linier ganda, variabel dependenya harus numerik, sedangkan

variabel independen boleh semuanya numerik dan boleh juga campuran

numerik dan kategorik.

Model persamaan regresi linier ganda merupakan perluasan regresi linier

sederhana, yaitu:

Y=a+b 1 X 1+b2 X 2+…+bkXk+e

Setiap melakukan analisis regresi linier ganda harus memenuhi

asumsi/persyaratan yang ditetapkan. Adapun asumsi yang digunakan dalam

regresi linier ganda antara lain:

1. Asumsi ekstensi (variabel random)

Untuk tiap nilai dari variaabel X (variabel independen), variabel Y

(dependen) adalah variabel random yang mempunyai mean dan varian

tertentu. Asumsi ini berkaitan dengan teknik pengambilan sampel. Untuk

memenuhi asumsi ini, sampel yang diambil harus dilakukan dengan

random.

6

2. Asumsi Independensi

Suatu keadaan dimana masing-masing nilai Y bebas satu sama lain. Jadi

nilai dari tiap-tiap individu saling berdiri sendiri. Tidak diperbolehkan nilai

observasi yang berbeda yang diukur dari satu individu diukur dua kali.

Untuk mengetahui asumsi ini dilakukan dengan cara mengeluarkan uji

durbin Watson, bila uji durbin -2 s.d +2 berarti asumsi indepedensi

terpenuhi, sebaliknya bila nilai uji Durbin <-2 atau >+2 berarti asumsi

tidak terpenuhi.

3. Asumsi Linieritas

Nilai mean dari variabel Y untuk suatu kombinasi X1, X2, X3,....., Xk

terletak pada garis/bidang linier yang dibentuk dari persamaan regresi.

Untuk mengetahui asumsi linieritas dapat diketahui dari uji ANOVA

(everali F test) bila hasilnya signifikan (p value<alpha) maka model

berbentuk linier.

4. Asumsi Homoscedascity

Varian nilai variabel Y sama untuk semua nilai variabel X.

Homoscedasticity dapat diketahui dengan melakukan pembuatan plot

residual. Bila titil tabaran tidak berpola tertentu dan menyebar merata

disekitaar garis titik nol maka dapat disebtu varian homogen pada setiap

nilai X dengan demikian asumsi homoscendasticity terpenuhi. Sebaliknya

bila titik tebaran membentuk pola tertentu misalnya mengelompok di

bawah atau di garis tengah nol, maka diduga variannya terjadi

heteroscedasticity.

7

5. Asumsi Normalitas

Variabel Y mempunyai distribusi normal untuk setiap pengamatan variabel

X. Dapat diketahui dari normal P-P plot residual, bila data menyebar di

sekitar garis diagonal dan mengikuti arah garis diagonal, maka model

regresi memenuhi model regresi tidak memenuhi asumsi normalitas.

Berikut langkah-langkah dalam pemodelan regresi linier ganda:

1. Melakukan analisis bivariat untuk menentukan variabel yang menjadi

kandidat model.

2. Lakukan analisis secara bersamaan, lakukan pemilihan variabel yang masuk

dalam model

3. Melakukan diagnostik regresi linier

4. Melakukan analisis interaksi

5. Penilaian reliabilitas model.

Analisis korelasi untuk numerik – numerik (variabel umur, berat ibu,

frekuensi ANC terhadap berat badan bayi)

E. CONTOH PENELITIAN DENGAN REGRESI LINIER

Judul penelitian : Analisis faktor resiko terjadinya kejadian BBLR pada ibu hamil

Di Kabupaten Muko-Muko.

Data yang digunakan adalah data LBW.SAV

8

Variabel independennya meliputi berat badan ibu dalam pounds (LWT), umur ibu

(AGE), riwayat merokok (SMOKE), frekuensi melakukan ANC (FTV). Variabel

dependennya berat badan bayi (BWT).

Kode variabel pada file data : LBW.SAV

Nama Definisi Operasional Hasil UkurId Nomor IdentitasBWT Berat badan bayi GramLWT Berat badan ibu pada saat menstruasi terakhir PoundsAGE Umur Ibu TahunSMOKE Kebiasaan merokok selama hamil 0 = tidak

1 = yaFTV Frekuensi periksa hamil pada trimester pertama 0,1,2, dst

LANGKAH PERTAMA

UJI ASUMSI UNIVARIATE NORMALITY

Variabel numerik harus berdistribusi NORMAL (terutama var dep),agar dapat

dianalisa dengan uji statistik parametric. Variabel numeric harus berdistribusi

normal. Pengujian variabel numeric ini dilakukan dengan uji Kolmogorov

Smirnov-1-sampel.

Langkah pada SPSS yaitu :

Klik “analyze” sorot dan klik “Nonparametric Test”

Kemudian sorot 1-sample-KS

9

Klik variabel numerik ke kolom “test variabel list”

Maka pada output akan muncul hasil sebagai berikut :

One-Sample Kolmogorov-Smirnov Test

10

weight at last

menstrual period

number of visits

to physician

during 1st

trimester

birthweight

(grams)

N 189 189 189

Normal Parametersa,b Mean 129.82 .79 2944.29

Std. Deviation 30.575 1.059 729.016

Most Extreme Differences Absolute .152 .302 .043

Positive .152 .302 .043

Negative -.075 -.227 -.043

Test Statistic .152 .302 .043

Asymp. Sig. (2-tailed) .000c .000c .200c,d

a. Test distribution is Normal.

b. Calculated from data.

c. Lilliefors Significance Correction.

d. This is a lower bound of the true significance.

Dari hasil analisis didapatkan variabel dependen nya mempunyai nilai-p

KS > 005 berarti asumsi normal variabel numeric untuk variabel

dependennya sudah terpenuhi.

PERMODELAN SELEKSI BIVARIAT

Seleksi bivariat masing-masing variabel independen dengan variabel dependen.

Variabel yang dapat masuk model multivariat adalah variabel pada analisis

bivariat mempunya nilai p (p value) < 0.25. namun ketentuan p value < 0,25 ini

tidaklah harus dipenuhi manakala dijumpai ada suatu variabel yang walaupun

pvalue-nya > 0,25 karena secara substansi sangat penting berhubungan dengan

variabel dependen, maka variabel tersebut diikutkan dalam model multivariat.

Uji yang digunakan pada analisis bivariat tergantung dari variabel yang

digunakan, bila : variabel independennya numerik maka uji yang digunakan uji

11

korelasi, sedangkan bila independennya kategorik maka uji yang digunakan uji T

atau uji anova.

Bivariat dengan uji korelasi : melakukan analisis bivariat untuk variabel

independen berjenis numerik yaitu variabel berat badan ibu pada saat

menstrusasi terakhir (LWT), umur (AGE) dan frekuensi periksa hamil (FTV)

pada trimester pertama.

Langkah nya :

klik “analysis”, sorot ke “correlate”, sorot dan klik “Bivariate”

muncul di layar menu “Bivariate Correlations”

pada kotak variables, isikan semua variabel numeric baik variabel

independen (LWT, AGE, FTV) maupun variabel dependennya (BWT)

klik tombol OK

12

Maka akan muncul hasil

Dari hasil analisis dengan korelasi didapatkan p value untuk variabel umur

(p=0,221), berat badan (p=0,010), dan frekuensi anc (0,423). Dari hasil ini dapat

disimpulkan bahwa variabel umur dan berat badan mempunyai nilai p < 0,25,

dengan demikian kedua variabel tersebut dapat dilanjutkan ke model multivariat.

13

Sedangkan untuk variabel frekuensi anc empunyai p value > 0,25 yaitu 0,423

sehingga tidak bisa masuk ke multivariat.

Bivariat uji T : melakukan analisis bivariat untuk variabel independen berjenis

kategorik : merokok. Maka langkah-langkah dalam SPSS nya sebagai berikut :

Pada menu utama SPSS, pilih menu “Analyze”, kemudian pilih sub menu

“Compare Means”, lalu pilih “Independen_Samples T-Test”

Pada layar tampak kotak yang ada di dalamnya ada kotak “Test variables”

dan “Grouping Variable”. Ket : kotak test variables tempat memasukkan

variabel numeriknya, sedangkan kotak grouping variable untuk memasukkan

variable kategoriknya, hati-hati jangan sampai terbalik.

klik “bwt” dan masukkan ke kotak “Test variable”

klik variabel “smoke” dan masukkan ke kotak “Grouping Variables”

klik OK

Maka akan muncul hasil sebagai berikut :

14

Hasil analisis hubungan merokok dengan berat bayi menghasilkan p value =

0,009, dengan demikian p value yang dihasilkan < 0,25 maka variabel merokok

dapat lanjut ke multivariat.

Langkah kedua

Permodelan Multivariat

Setelah tahap bivariat selesai, tahap berikutnya melakukan analisis multivariat

secara bersama-sama. Variabel yang valid dalam model multivariat adalah

variabel yang mempunyai p value < 0,05. Bila dalam model multivariate terdapat

variabel yang p value nya > 0,05, maka variabel tersebut harus dikeluarkan dalam

model. Pengeluaran variabel dilakukan tidak serempak, melainkan bertahap satu

per satu dikeluarkan dimulai dari p value yang terbesar. Adapun proses

selengkapya sebagai berikut :

15

Klik “Analyze” , sorot “regression”, sorot dan klik “linier” lalu muncul

“regresi linear”

pada kotak “dependen isikan variabel dependen (dalam hal ini berarti bwt)

dan kotak ‘independen’ isikan variabel independennya (dalam hal ini age,

lwt, smoke)

16

Regression

Model Summary

Model R R Square

Adjusted R

Square

Std. Error of the

Estimate

1 .265a .070 .055 708.691

a. Predictors: (Constant), age of mother, smoked during pregnancy,

weight at last menstrual period

ANOVAa

Model Sum of Squares df Mean Square F Sig.

1 Regression 7000336.310 3 2333445.437 4.646 .004b

Residual 92914962.261 185 502243.039

Total 99915298.571 188

a. Dependent Variable: birthweight (grams)

17

b. Predictors: (Constant), age of mother, smoked during pregnancy, weight at last menstrual

period

Coefficientsa

Model

Unstandardized Coefficients

Standardized

Coefficients

t Sig.B Std. Error Beta

1 (Constant) 2363.765 300.693 7.861 .000

weight at last menstrual

period4.020 1.720 .169 2.338 .020

smoked during pregnancy -268.146 105.791 -.180 -2.535 .012

age of mother 7.041 9.923 .051 .710 .479


Dari kotak ‘model summary’ didapatkan nilai R Square sebesar 0,07 artinya

keempat variabel independen dapat menjelaskan variabel berat bayi sebesar 7 %

sedangkan sisanya dijelaskan oleh variabel lainnya. Dari hasil uji statistic (lihat

kotak anova) didapatkan p value 0,004 berarti persamaan garis regresi secara

keseluruhan sudah signifikan. Namun demikian prinsip permodelan harus yang

sederhana vaiabelnya sehingga masing-masing variabel independen perlu di cek p

valuenya, variabel yang p valuenya >0,05 dikeluarkan dari model.

Ternyata dari 3 variabel independen (lihat kolom sig di kotak Coefficients) ada 1

variabel yang p valuenya >0,05 yaitu umur (0,479). Tahap berikutnya

mengeluarkan variabel yang p valuenya >0,05, pengeluaran variabel dimulai dari

p value yang terbesar. Dengan demikian variabel yang dikeluarkan adalah umur

ibu.

Langkahnya :

Klik “analyze”, sorot “regression”sorot dan klik “Linier”

18

Di layar nampak pada kotak Dependen masih terisi ‘bwt’ lewati dan biarkan

saja. Pada kotak Independen juga masih lengkap dengan 3 variabel, namun

sekarang kita harus mengeluarkan variabel umur ibu dan masukkan ke kotak

Variable di sebelah kiri

Klik “OK, dan hasilnya akan seperti berikut :

RegressionModel Summary

Model R R Square

Adjusted R

Square

Std. Error of the

Estimate

1 .260a .068 .058 707.744

a. Predictors: (Constant), smoked during pregnancy, weight at last

menstrual period

ANOVAa


1 Regression 6747500.652 2 3373750.326 6.735 .001b

Residual 93167797.920 186 500902.139

Total 99915298.571 188


b. Predictors: (Constant), smoked during pregnancy, weight at last menstrual period

Coefficientsa

Model

Unstandardized Coefficients

Standardized

Coefficients

t Sig.B Std. Error Beta

1 (Constant) 2500.212 230.848 10.831 .000


period4.238 1.690 .178 2.508 .013

smoked during pregnancy -270.924 105.577 -.182 -2.566 .011


19

Setelah variabel umur ibu dikeluarkan, kita cek dulu apakah setelah dikeluarkan,

ada perubahan besar (berubah lebih ari 10%) untuk R square dan Coef. B. bila ada

perubahan yang besar maka variabel tersebut tidak jadi dikeluarkan dalam model

(tetap dipertahankan di dalam model). Untuk nilai R Square ternyata tidak ada

mengalami perubahan yaitu tetap 0,068. Sedangkan untuk Coefficient B ,

sekarang kita bandingkan niali coefficient B untuk variabel umur, berat ibu dan

status merokok antara sebelum dan sesudah variabel umur dikeluarkan, hasil

perhitungannya sebagai berikut :

Setelah variabel umur dikeluarkan, nilai R Square mengalami perubahan

yang sedikit yaitu 0,068. Sedangka untuk nilai coefficient B, hasil perhitungannya

sebagai berikut :

Variabel Masih Lengkap Umur dikeluarkan Perubahan Coef

Age 6,5 - -Lwt 3,97 4,23 2,36%Smoke -267,71 -270,92 0Ftv 13,74 - -

Dari hasil perhitunagn perubahan coef. B ternyata tidak ada yang yang lebih dari

10%, dengan demikian variabel umur kita keluarkan dari model.

Langkah Ketiga

UJI ASUMSI

Agar persamaan garis yang digunakan untuk memprediksi menghasilkan angka-

angka yang valid, maka persamaan yang dihasilkan harus memenuhi asumsi-

asumsi yang dipersyaratkan uji regresi linier ganda. Adapun uji asumsi sebagai

berikut :

20

Langkahnya :

Klik ‘Analyze’, sorot ‘Regression’, sorot dan klik ‘Linier’

Masukkan dalam kotak Dependen variabel ‘bwt’

Masukkan dalam kotak Independen variabel berat badan ibu (lwt) dan status

merokok(smoke)

Klik tombol ‘Statistics’

Klik kotak ‘Collinearity diagnostic’dan klik kotak ‘Covariance matrix’

(perintah ini untuk uji asumsi Multicoliniarity)

Klik kotak ‘Durbin-Watson’(perintah ini untuk uji asumsi Independensi)

21

Klik ‘continue’

Klik tombol “Plot”

Masukkan “SRESID” ke kotak Y dan masukkan ‘ZPRED’ ke kotak X

(perintah ini untuk uji asumsi Homoscedasity)

Klik kotak ‘Histogram’ dan kotak “Normal probability plot” (perintah ini

untuk uji asumsi Normality)

22

Klik ‘continue’

Hasilnya :

Asumsi Eksistensi (Variabel Random)

Untuk tiap nilai dari variabel X (variabel Independen), variabel Y

(dependen) adalah variabel random yang mempunyai mean dan varian

tertentu. Asumsi ini berkaitan dengan teknik pengambilan sampel. Untuk

memenuhi asumsi ini, sampel yang diambil harus dilakukan dengan

random. Cara mengetahui asumsi eksistensi degan cara melakukan analisis

deskriptif variabel residual dari model, bila residual menunjukkan adanya

mean yang mendekati nilai nol dan ada sebran (varian data standar deviasi)

maka asumsi ekstensi terpenuhi.

Hasil analisis sebagai berikut :

Residuals Statisticsa

Minimum Maximum Mean Std. Deviation N

Predicted Value 2568.31 3521.52 2944.29 189.449 189

Std. Predicted Value -1.985 3.047 .000 1.000 189

Standard Error of Predicted

Value65.998 221.763 86.009 23.584 189

Adjusted Predicted Value 2577.13 3498.87 2944.77 189.944 189

Residual -2030.124 1968.540 .000 703.970 189

Std. Residual -2.868 2.781 .000 .995 189

Stud. Residual -2.887 2.794 .000 1.002 189

Deleted Residual -2057.401 1986.522 -.482 714.411 189

Stud. Deleted Residual -2.946 2.847 -.001 1.008 189

Mahal. Distance .640 17.463 1.989 2.173 189

Cook's Distance .000 .084 .005 .009 189

Centered Leverage Value .003 .093 .011 .012 189


23

Hasil dari output di atas menunjukkan bahwa angka residual dengan mean

0,000 dan standar deviasi 703,97. Dengan demikian asumsi Eksistensi

terpenuhi.

Asumsi Independensi

Suatu keadaan dimana masing-masing niali Y bebas satu sama lain. Jadi

niali dari tiap-tiap individu saling ebrdiri sendiri. Tidak diperbolehkan

nilai observasi yang berbeda yang diukur dari satu individu diukur dua

kali. Untuk mengetahui asumsi ini dilakukan dengan cara mengeluarkan

uji Durbin Watson, bila nilai Durbin -2 sampai dengan + 2 berarti asumsi

independensi terpenuhi, sebaliknya bila nilai Durbin Watson , -2 atau > +2

maka asumsi ini tidak terpenuhi.

Model Summaryb

Model R R Square

Adjusted R

Square

Std. Error of the

Estimate Durbin-Watson

1 .260a .068 .058 707.744 .303

a. Predictors: (Constant), weight at last menstrual period, smoked during pregnancy

b. Dependent Variable: birthweight (grams)

Dari hasil uji didapatkan koefisien Durbin Watson 0,303, maka dengan

demikian asumsi Independensi terpenuhi.

Asumsi Linieritas

Niali mean dari variabel Y untuk kombinasi X1, X2, X3….,Xk terletak pada

garis/bidang linier yang dibentuk dari persamaan regresi. Untuk

mengetahui asumsi linieritas dapat diketahui melalui uji ANOVA (overall

24

F test), bial hasilnya signifikan (p value < alpha) maka model berbentuk

linier. Hasil dari analisis sebagai berikut :

ANOVAa


1 Regression 6747500.652 2 3373750.326 6.735 .001b

Residual 93167797.920 186 500902.139

Total 99915298.571 188


b. Predictors: (Constant), weight at last menstrual period, smoked during pregnancy

Dari hasil analisis di atas didapatkan hasil uji anova 0,001, berarti asumsi

linieritas terpenuhi.

Asumsi Homoscedascity

Varian nilai variabel Y sama untuk semua nilai variabel X.

Homoscedascity dapat diketahui dengan melakukan pembuatan plot

residual. Bila titik tebaran tidak berpola tertentu dan menyebar merata di

sekitar garis titik nol maka dapat disebut varian homogeny pada setiap

niali X dengan demikian asumsi homoscedascity terpenuhi. Sebaliknya

bila titik tebaran membentuk pola tertentu misalnya mengelompok di

bawah atau di atas garis tengah nol, maka diduga variannya terjadi

heteroscedascity.

25

Dari hasil plot di atas terlihat tebaran titik mempunyai pola yang sama

antara titik-titik di atas dan di bawah garis diagonal 0. Dengan demikian

asumsi homoscedascity terpenuhi.

Asumsi Normalitas

Variabel Y mempunyai distribusi normal untuk setiap pengamatan

variabel X. dapat diketahui dari Normal P-P Plot Residual, bila data

menyebar di sekitar garis diagonal dan mengikuti arah garis diagonal,

maka model regresi memenuhi asumsi model regresi memenuhi asumsi

normalitas.

26

Dari grafik histogram dan grafik Normal P-P Plot teerbukti bahwa bentuk

distribusinya normal, maka berarti asumsi normality terpenuhi.

27

Diagnostic Multicollinearity

Dalam regresi linier tidak boleh terjadi sesame variabel independen

berkorelasi secara kuat (multicollinearity). Untuk mendeteksi collinearity

dapat diketahui dari nilai VIF (Variance Inflation Factor), bial nilai VIF

lebih dari 10 maka mengindikasikan telah terjadi collinearity.

Coefficientsa

Model

Unstandardized

Coefficients

Standardized

Coefficients

t Sig.

Collinearity Statistics

B Std. Error Beta Tolerance VIF

1 (Constant) 2500.212 230.848 10.831 .000

smoked during

pregnancy-270.924 105.577 -.182 -2.566 .011 .998 1.002


period4.238 1.690 .178 2.508 .013 .998 1.002


Dari hasil uji asumsi didapatkan nilai VIF tidak lebih dari 10, dengan

demikian tidak ada Multicollinearity antara sesama variabel Independen.

Dari hasil uji asumsi dan uji Kolinearitas ternyata semua asumsi terpenuhi

sehingga model dapat digunakan untuk memprediksi berat bayi.

Langkah selanjutnya adalah uji Interaksi, namun karena secara substansi

antara variabel dipandang tidak interaksi maka uji interaksi tidak

dilakukan.

Sehingga model yang terakhir adalah sebagai berikut :

Model Summaryb

Model R R Square

Adjusted R

Square

Std. Error of the

Estimate Durbin-Watson

28

1 .260a .068 .058 707.744 .303

a. Predictors: (Constant), weight at last menstrual period, smoked during pregnancy

b. Dependent Variable: birthweight (grams)

Coefficientsa

Model

Unstandardized

Coefficients

Standardized

Coefficients

t Sig.

Collinearity Statistics

B Std. Error Beta Tolerance VIF

1 (Constant) 2500.212 230.848 10.831 .000

smoked during

pregnancy-270.924 105.577 -.182 -2.566 .011 .998 1.002

weight at last

menstrual period4.238 1.690 .178 2.508 .013 .998 1.002


Interpretasi model :

Setalah dilakukan analisis, ternyata variabel independen yang masuk model

regresi adalah berat badan ibu dan status merokok. Pada tabel “Model Summary”

terlihat koefisien determinasi (R Square) menunjukkan nilai 0,068 artinya bahwa

model regesi yang diperolah dapat menjelaskan 6,8% variasi variabel dependen

berat bayi. Atau dengan kata lain kedua variabel independen tersebut dapat

menjelaskan varaisi variabel berat bayi sebesar 6,8%. Kemudian pada kotak

“ANOVA”, kita lihat hasil uji F yang menunjukkan nilai P (sig) = 0,000, berarti

pada alpha 5% kita dapat menyatakan bahwa model regresi cocok (fit) dengan

data yang ada. Atau dapat diartikan kedua variabel tersebut secara signifikan

dapat untuk memprediksi variabel berat bayi.

29

Pada kotak “Coefficient”kita dapat memperoleh persamaan garisnya, pada kolom

B (di bagian Variabel In Equation) di atas, kita dapat mengetahui koefisien regresi

masing-masing variabel. Dari ahsil di ats persamaan regresi yang diperoleh adalah

Berat bayi = 2500 - 270,94 (smoke) + 4,238(lwt)

Dengan model persamaan ini, kita dapat memperkirakan berat bayi dengan

menggunakan variabel berat badan ibu dan merokok. Adapun arti koef. B untuk

masing-masing variabel adalah sebagai berikut :

- Setiap kenaikan berat badan ibu sebesar 1 kg, maka berat bayi akan naik

sebesar 4,238 gram setelah dikontrol variabel merokok.

- Pada ibu yang merokok berat bayinya akan lebih rendah sebesar 270,94 gram

setelah dikontrol variabel berat badan ibu.

Kolom Beta dapat digunakan untuk mengetahui variabel mana yang apling besar

peranannya (pengaruhnya) dalam menentukan variabel dependennya (berat bayi).

Semakin besar nilai Beta semakin besar pengaruhnya terhadap variabel

dependennya. Pada hasil di atas berarti variabel yang paling besar pengaruhnya

terhadap berat bayi adalah berat badan ibu.

30

DAFTAR PUSTAKA

Budiarto, E. Biostatistika Untuk Kedokteran dan Kesehatan Masyarakat.

Jakarta. EGC. 2001

Dahlan, S. Seri 10 Analisis Multivariat Regresi Linier. PT epidemiologi

Indonesia. Jakarta. 2012

Hastono, SP. Analisis Data Kesehatan. FKM UI. 2007

Hastono, SP dan Sabri, L. Statistik Kesehatan. Rajawali Pers. Jakarta. 2011

31

web viewpermulaan regresi digunakan sebagai konsep dasar statistika oleh sir francis galton pada...

Documents