finish regresi

Upload: rivan-mahmutz-ahmadinejat

Post on 30-Oct-2015

51 views

Category:

Documents


0 download

TRANSCRIPT

23

1BAB IPENDAHULUAN

1.1. LATAR BELAKANGIlmu statistik dapat memberikan gambaran suatu data. Selain itu statistik juga dapat digunakan sebagai alat pengukuran. Misalnya pengukuran terhadap keterkaitan antara variabel yang satu dengan yang lainnya. Salah satu analisa yang dapat dilakukan dalam pengukuran dengan statistik adalah dengan menggunakan regresi dan korelasi. Dalam regresi dan korelasi dibutuhkan dua variabel bebas dan satu variabel terikat. Misalnya saja dalam suatu kemacetan dapat disebabkan oleh banyaknya kendaraan dan jumlah penduduk. Untuk menentukan korelasi antara keturunan dan pola makan dengan diabetes dapat dilakukan dengan menentukan persamaan regresi dari tiap-tiap variabel tersebut dan korelasinya. Berdasarkan latar belakang diatas, maka penulis melakukan praktikum regresi dan korelasi antara diabetes dengan keturunan dan pola makan. Dimana praktikum ini digunakan untuk menentukan persamaan regresi, dan korelasi antara variabel-variabel tersebut.

11.2. PERUMUSAN MASALAHBerdasarkan latar belakang di atas, dapat dirumuskan : 1. Bagaimana menentukan persamaan regresi2. Bagaimana menentukan korelasi dari Y (Diabetes), X1 (Keturunan) dan X2 (Pola Makan).3. Bagaimana menentukan kuat hubungan linier antar variabel Y (Diabetes), X1 (Keturunan) dan X2 (Pola Makan).

1.3. TUJUAN PERCOBAANUntuk memudahkan dan mengetahui arah penelitian ini, maka penulis mempunyai tujuan percobaan seperti berikut :1. Mengetahui cara menentukan persamaan regresi2. Mengetahui korelasi dari Y (Diabetes), X1 (Keturunan) dan X2 (Pola makan).3. Mengetahui kuat hubungan linier antar variabel Y (Diabetes), X1 (Keturunan) dan X2 (Pola makan).

1.4. PEMBATASAN MASALAHDalam upaya mengarahkan pembahasan masalah pada tujuan utama agar tidak menyimpang dari ruang lingkup permasalahan, maka perlu diadakan pembatasan masalah sebagai berikut :

1. Pengambilan data dilakukan pada tanggal 14 mei 2013 dalam praktikum, berupa data diabetes yang merupakan variabel tak bebas (Y), keturunan dan pola makan yang merupakan variabel bebas pertama dan kedua (X1 dan X2) 2. Data yang dikumpulkan sebanyak 50 data dari masing-masing variabel.

1.5.METODOLOGI PEMECAHAN MASALAHAdapun metodologi pemecahan masalah atau metode penelitian yang digunakan dan dilakukan dalam percobaan ini adalah:1. Study pustaka.Study pustaka dilakukan dengan cara membaca buku untuk menggali informasi yang sesuai dengan apa yang akan dilakukan dalam pengumpulan data dan pengolahan data yaitu mengenai regresi dan korelasi. 2. Study lapangan.Mengadakan pengambilan data pada obyek yang berhubungan dengan masalah yang akan diteliti, yaitu data diabetes, keturunan dan pola makan. Data yang dikumpulkan sebanyak 50 data untuk masing-masing variabel.

1.6. SISTEMATIKA PENULISANSistematika penulisan yang digunakan dalam menyusun laporan ini adalah:

BAB I: PENDAHULUAN.Berisi tentang latar belakang, perumusan masalah, tujuan percobaan, pembatasan masalah, metode pemecahan masalah, dan sistematika penulisan.

BAB II: LANDASAN TEORI. Berisi tentang teori-teori yang berhubungan dengan percobaan, yaitu teori regresi linier sederhana, analisis regresi, regresi dan korelasi linier berganda.

BAB III: METODOLOGI PEMECAHAN MASALAH.Berisi tentang langkah-langkah pemecahan masalah dan kerangka pemecahan masalah.

BAB IV: PENGUMPULAN DAN PENGOLAHAN DATA.Berisi pengumpulan dan pengolahan data.

BAB V: ANALISIS DATAAnalisa data diabetes, keturunan dan pola makan dari hasil pengolahan data secara manual dan menggunakan SPSS.

BAB VI: KESIMPULAN.Berisi kesimpulan hasil praktikum regresi dan korelasi

1

BAB IILANDASAN TEORI

2.1DEFINISI REGRESI DAN KORELASI LINIERPenentuan teknik analisis yang akan digunakan dalam suatu analisis -- biasanya dibahas dalam metodologi penelitian -- sangat tergantung dari kerangka konseptual yang menjadi dasar analisis dan tujuan dari pelaksanaan analisis. Agar hasil analisis dapat ditafsirkan secara tepat, maka harus dihindari penggunaan teknik analisis yang tidak sesuai dengan skala pengukuran dari variabel yang digunakan dalam analisis. Dalam mengkaji hubungan antara dua variabel atau lebih, penting dipahami skala pengukuran dari setiap variabel tersebut, sehingga teknik analisis yang akan digunakan untuk menjelaskan hubungan atau kaitan antara variabel tersebut dapat dipilih yang paling sesuai. Apabila hal ini diabaikan, maka dapat menghasilkan interpretasi hasil yang kurang tepat (misleading). Sebagai contoh, analisis regresi mensyaratkan bahwa variabel yang digunakan paling tidak diukur secara interval, sehingga kalau ada salah satu variabel yang diukur secara nominal atau ordinal maka hasil yang diperoleh tidak dapat ditafsirkan secara tepat, oleh karena asumsi dalam penggunaan teknik ini yang tidak dapat dilanggar adalah bahwa variabel yang digunakan mengikuti distribusi normal.Pada bab ini teknik yang dibahas merupakan teknik analisis statistik inferensial, yaitu teknik yang mendasarkan pada pemanfaatan data yang diperoleh dari suatu sampel acak, sehingga hasilnya merupakan gambaran keadaan populasi dari mana sampel acak tersebut diambil. Teknik statistik semacam ini memberikan jaminan bahwa kesimpulan dan penafsiran dibuat dengan tingkat kesalahan yang rendah,[footnoteRef:2]5 biasanya dipakai 0,05 (5 %). [2: ]

Teknik analisis statistik yang dibahas dalam bab ini bersumber pada SPSS yang difokuskan hanya pada teknik yang dapat menjelaskan hubungan atau kaitan antara beberapa variabel, baik hubungan antara dua variabel (bivariate) maupun banyak variabel (multivariate). Pembahasan diutamakan pada cara membaca dan menafsirkan arti dari parameter yang diperoleh dari hasil pengolahan data yang terdapat pada output SPSS. Teknik analisis[footnoteRef:3]6 statistik yang dibahas meliputi Analisis Regresi, Analisis Path, Multiple Classification Analysis (MCA), Tabel Kontingensi, Model Logit, Model Log-Linear, Analisis Diskriminan, dan Analisis Faktor. Analisis Regresi Linier [3: ]

Analisis regresi merupakan alat yang dapat memberikan penjelasan hubungan antara dua jenis variabel yaitu hubungan antara variabel dependen atau variabel kriteria dengan variabel independen atau variabel prediktor[footnoteRef:4]7. Analisis hubungan antara dua variabel disebut sebagai analisis regresi sederhana jika hanya melibatkan satu variabel independen. Analisis disebut sebagai analisis regresi berganda jika melibatkan lebih dari satu variabel independen. [4: ]

Hubungan antara variabel dependen (Y) dengan variabel independen (X) dituliskan dalam model linier umum

di mana , i = 1,2,........p adalah koefisien regresi yang berarti besarnya perubahan pada , jika Xi bertambah satu satuan dan variabel yang lain konstan, adalah intercept. Residual e mengikuti distribusi normal dengan rata-rata 0 dan varians konstan sebesar 2. Asumsi dasar dalam analisis regresi adalah (i) setiap Y yang merupakan kombinasi linier atas X dan mengikuti distribusi normal, (ii) e tersebar secara acak dan tidak berpola mengikuti besarnya nilai X, (iii) tidak terdapat hubungan (korelasi) yang tinggi antar variabel X.

2.2 Analisis Regresi SederhanaAnalisis regresi sederhana hanya melibatkan satu variabel independen X, sehingga dalam persamaan (3.1) p=1, sehingga model liniernya adalah

Dengan model seperti pada persamaan (3.2) maka hipotesis yang diajukan untuk diuji adalah H0: 1 = 0 terhadap H1: 1 0. Untuk menolak H0 harus dapat dibuktikan secara empirik bahwa 1 0 atau 1 bermakna (significant) atau dengan kata lain ada hubungan linier regresi antara Y dan X seperti pada persamaan (3.2).Dalam output SPSS 9.0 for Windows untuk subprogram REGRESION, yang pertama perlu diketahui adalah apakah regresi Y pada X bermakna. Hal ini dapat dilihat pada output ANOVA sebagai berikut:

ANOVA

Sum ofSquaresDfMeanSquaresFSig.

Uji hipotesis untuk mengetahui apakah regresi Y pada X ada, Tabel ANOVA dengan =0,00 menunjukkan bahwa H0 ditolak regresi Y pada X bermakna.

Model1 Regresion Residual Total6475.18 3185.81 9660.99 1 83 84 6475.18 38.38

168.698 .000

Selanjutnya adalah untuk mengetahui besarnya estimate koefisien regresi () serta standard error-nya, ini dapat dilihat pada output COEFFICIENTS sebagai berikut:

COEFFICIENTS

Unstandardized Coefficients

Standardized CoefficientstSig.

= 47,17 (intercept)

= 0,307 (koeffisien regresi)

Y akan berubah sebesar 0,31 unit untuk setiap perubahan satu unit dari X.

BStd. Error

Beta

Model1(Constant)X47.170 .307 1.726 .024

.819 27.337 12.988 .000 .000

Dapat dilihat bahwa karena regresi linier sederhana, maka pada dua tabel di atas t2= F. Beta=0,819 yang merupakan koef. regresi baku sebenarnya adalah sama dengan r = koefisien korelasi antara Y dan X, karena beta dihitung berdasarkan vaiabel baku Z yang dihitung dengan cara

Koefisien determinasi r2 = 0,670 (yaitu nilai Beta dikuadratkan atau (0.819)2) berarti bahwa variasi Y yang dapat dijelaskan oleh model sebesar 67 persen. Beberapa statistik dan estimasi dari parameter dapat pula diperoleh seperti rata-rata dan standard deviasi serta korelasi dari Y dan X. Para pembaca lebih lanjut dianjurkan untuk membaca SPSS Base 9.0 Application Guide.

2.3 Analisis Regresi BergandaKalau satu variabel dependen Y perlu dijelaskan oleh lebih dari satu variabel independen X, maka kita perlu membuat model yang sesuai dengan tujuan studi. Model tersebut adalah regresi linier ganda (Multivariate Linear Regression) yang secara umum modelnya seperti pada persamaan (3.1). Selain berguna untuk dapat menjelaskan hubungan p variabel X secara bersama terhadap variabel Y, dengan analisis regresi ganda juga dapat diperoleh suatu penjelasan tentang peranan atau kontribusi relatif setiap variabel X terhadap variabel Y. Secara empirik walaupun misalnya model (3.1) signifikan, yang berarti bahwa secara bersama p variabel X dapat menjelaskan variabel Y, tidak berarti bahwa setiap variabel mempunyai pengaruh yang signifikan pada variabel Y. Suatu kajian tersendiri perlu dilakukan untuk kemudian dapat memilah variabel X yang berpengaruh secara parsial pada variabel Y.Dengan model pada persamaan (3.1) maka uji hipotesis-nya adalah:H0: 1 = 2 = .........= p = 0 dengan H1: salah satu i 0, (i = 1,2,.....,p) yang dari ouput SPSS dapat dilihat pada output ANOVA dengan p=2 sebagai berikut

ANOVA

Sum ofSquaresdfMeanSquaresFSig.

Dengan =0,00 mengindikasi-kan bahwa regresi Y pada X1 dan X2 signifikan.

Model1 Regression Residual Total11101.959 843.031 11944.9912 104 106 5550.980 8.106

684.793 .000

Secara umum model regresi dengan Y pada X1 dan X2 dapat digunakan lebih lanjut, namun demikian untuk mengetahui apakah X1 dan X2 secara parsial berpengaruh terhadap Y dapat diuji dengan melihat output COEFFICIENT sebagai berikut:

COEFFICIENTS

Unstandardized Coefficients

Standardized CoefficientstSig.X1 dan X2 secara parsial ber-pengaruh nyata pada Y tingkat signifikansi (p-value) masing-masing 0,013 dan 0,000.

BStd. Error

Beta

Model1(Constant)X1X282.677 -.662 -.240 .626 .263 .013

-.119 -.863 132.176 -2.518 -18.326 .000 .013 .000

Seberapa besar variasi dari variabel Y yang dapat dijelaskan oleh model dapat dilihat dari koefisien determinasi pada output MODEL SUMMARY berikut:MODEL SUMMARYModelVariablesRR SquareAdjusted R SquareStd. Error of the Estimate

EnteredRemoved

1X1, X2

.964 .929 .928 2.85

Estimasi R2 cenderung terlalu tinggi (overestimate), adjusted R2 (R2a) dirancang untuk mengurangi bias tersebut yang dihitung dengan cara

dengan p adalah banyaknya variabel independen X pada persamaan (3.1). Secara matematis R2 dan R2a dapat dirumuskan denganR2 = 1Residual sum of squares

Total sum of squares

R2a = 1Residual sum of squares/(N-p-1)

Total sum of squares/(N-1)

Dengan menggunakan R2a = 0,928 maka variasi dari Y yang dapat dijelaskan oleh model adalah sebesar 93 persen.

2.4 Pemilihan Variabel UtamaWalaupun model regresi linier ganda signifikan, mungkin tidak semua variabel independen X mempunyai pengaruh nyata pada variabel dependen Y, lebih daripada itu lebih banyak variabel independen sebagai prediktor tidak membuat lebih mudah dalam melakukan analisis. Dalam hal ini cara yang paling banyak digunakan untuk memilih variabel yang signifikan tersebut adalah dengan cara bertatar (stepwise)[footnoteRef:5]8. Secara singkat metode stepwise ini dimulai tahap-1 dengan memasukkan variabel independen X yang mempunyai simpel korelasi (r) tertinggi dengan variabel dependen Y. Pada tahap-2 (dan seterusnya) variabel X yang mempunyai korelasi parsial tertinggi dengan variabel Y dimasukkan dalam model, akan tetapi pada tahap ini variabel X yang sudah masuk pada tahap-1 (atau sebelumnya) dapat dikeluarkan (removed) dari model jika tidak memenuhi kriteria pemilihan variabel yang dipilih (Wilks , Mahalanobis Distance, atau lainnya). Demikian seterusnya tahap berikutnya dilakukan seperti pada tahap-2 sehingga diperoleh variabel terbaik. [5: ]

2.5 Kontribusi Setiap Prediktor Terhadap YDalam analisis adalah penting untuk mengetahui peranan setiap variabel X (prediktor) terhadap variabel Y yang kemudian dapat dibandingkan besarnya peranan setiap prediktor tersebut dalam menjelaskan variasi pada Y. Ukuran yang digunakan untuk tujuan tersebut adalah dengan melihat adjusted R2 dari setiap prediktor yang dapat dilihat dari output MODEL SUMMARY ketika melakukan pemilihan variabel dengan cara stepwise seperti berikut.

MODEL SUMMARYModel (variables in the model)RR SquareAdjusted R SquareAdjusted R Square ChangeIsian kolom Adjusted R Square Change merupakan selisih dari Adjusted R Square pada suatu baris terhadap baris sebelumnya di mana suatu variabel belum termasuk dalam model.

X1X1, X2X1, X2, X3.418.480.489.175.231.239.173.229.239.173.056.010

X1 menjelaskan 17 persen variasi Variabel Y X2 menjelaskan 5 persen variasi Variabel Y X3 menjelaskan 1 persen variasi Variabel Y

Interpretasi

2.6 Diagnostik ModelPerlu dipastikan apakah model yang secara empirik adalah signifikan atau [Pr>F]