regresi linier

22
 ANALISIS REGRESI Materi 1. Pen dah uluan :Pen ger tia n re gre si: 1.1. Pengertian regresi, regresi linier sederhana dan regresi liner berganda serta bentuk-bentuk yang lain 1.2.T aksiran parameter regresi (Metode Least Square), pengujian parameter 1.3. Koefisien determinasi 1.4.  Asumsi model 1.5. Langkah-langkah dalam pemodelan 1.6. Persoalan yang sering dihadapi dalam pemodelan regresi 2. Pe ng uj ian asumsi 3. Regr es i Linier Sederhana 3.1. Cara pembuatan model regresi linier sederhana 3.2. Pengujian parameter regresi 3.3. Pengujian asumsi 4. Regr es i Linier Bergand a 4.1. Cara pembuatan model regresi linier sederhana 4.2. Pengujian parameter regresi 4.3. Pengujian asumsi 5. Pemilihan model terbaik 5.1. Best subset regression 5.2. Metode stepwise dan Backward

Upload: danny-andrian

Post on 21-Jul-2015

67 views

Category:

Documents


0 download

TRANSCRIPT

ANALISIS REGRESIMateri1. Pendahuluan :Pengertian regresi: 1.1. Pengertian regresi, regresi linier sederhana dan regresi liner berganda serta bentuk-bentuk yang lain

1.2.Taksiran parameter regresi (Metode Least Square), pengujian parameter1.3. Koefisien determinasi

1.4.Asumsi model1.5. Langkah-langkah dalam pemodelan 1.6. Persoalan yang sering dihadapi dalam pemodelan regresi 2. Pengujian asumsi 3. Regresi Linier Sederhana 3.1. Cara pembuatan model regresi linier sederhana 3.2. Pengujian parameter regresi 3.3. Pengujian asumsi 4. Regresi Linier Berganda 4.1. Cara pembuatan model regresi linier sederhana 4.2. Pengujian parameter regresi 4.3. Pengujian asumsi 5. Pemilihan model terbaik 5.1. Best subset regression 5.2. Metode stepwise dan Backward

I.

PENDAHULUAN

PENGERTIAN REGRESI1.1.Pengertian regresi, regresi linier sederhana dan regresi liner berganda serta bentuk-bentuk yang lainDigunakan untuk memodelkan hubungan antara variable respons (yang dipengaruhi) dan variable predictor (yang mempengaruhi) 1. REGRESI LINIER SEDERHANA

Y = 0 + 1 X +

2. REGRESI LINIER BERGANDA

Y = 0 + 1 X 1 1 + 2 X 2 + 3 X 3 + ......... k X k +

LINIER DALAM PARAMETER

KETERANGAN: i : parameter regresi : error Y : variabel respons X: variabel predictor 3. CONTOH REGRESI LINIER YANG LAIN:

Y = 0 + 1 X 21 1 + 2 X 2 2 + 3 X 2 3 + ......... k X 2 k +

Y = e 0 + 1 X +(Dikatagorikan sebagai model regresi linier karena dapat dilinierkan melalui transformasi), Misalnya: Zi = Xi2 Y =

0 + 1Z11 + 2 Z 2 + 3 Z 3 + ......... k Z k + ln Y = 0 + 1 X + Y ' = 0 + 1 X +

Y = ln Y

Tujuan utama: menemukan model yang paling sesuai i???????

1.2.Taksiran parameter regresi (Metode Least Square), pengujian parameterContoh data 1: Diduga ada hubungan linier antara variabel X dan variabel Y, dimana Y dapat dinyatakan sebagai fungsi dari X: Y = f(x) = 0 + 1 x + obs X Y 1 1.5 3 2 1.7 2.5 3 2 3.5 4 2.2 3 5 2.5 3.1 6 2.5 3.6 7 2.7 3.2 8 2.9 3.9 9 3 4 10 3.5 4 11 3.8 4.2 12 4.2 4.1 13 4.3 4.8 14 4.6 4.2

Y = f(x) = 0 + 1 x + Y9 8 7 6 5 4 3 2 1 0 0

Berapa taksiran 0 dan 1

Y

b0 dan b1

CONTOH DATA2 4 6 8 10

Untuk mendapatkan taksiran dari 0 dan 1, digunakan Metode maximum Likelihood Estimator (MLE) dimana metode ini secara prinsip adalah meminimumkan jumlah kuadrat kesalahan i2 (i= Y- (0 + 1 xi). Pengujian parameter dilakukan untuk mengetahui apakah parameter tersebut secara significant berbeda dengan nol atau tidak , artinya apakah memang variabel prediktor X berpengaruh terhadap variabel respon Y dengan besaran 1. Hipotesis dalam pengujian ini adalah : H0: 1 = 0 H1: 1 0 Jika H0 diterima artinya memang X tidak berpengaruh terhadap variabel respon Y secara linier.

1.3. Koefisien determinasi dan Asumsi Model RegresiKoefisien Determinasi Koefisien determinasi, disiimbolkan dengan R2 adalah sebuah besaran yang mengukur ketepatan garis regresi. Nilai R2 ini menunjukkan prosentase besarnya variabilitas dalam data yang dijelaskan oleh model regresi. Maksimum nilai R 2 adalah 100% dan mnimal 0. Jika nilai R2=100%, misalnya untuk regresi linier sederhana semua titik data akan menempel ke garis regresi, semakin kecil R2 maka data makin menyebar jauh dari garis. Oleh karena itu jika R2 kecil maka keeratan hubungan antara X dan Y lemah dan jika R2=0 menunjukkan bahwa X tidak memiliki hubungan dengan Y.

(Y

i

2 Y ) = Yi Y

(

) + (Y Y )2 i i

2

JUMLAH KUADRAT SEKITAR MEAN

JUMLAH KUADRAT SEKITAR REGRESI

JUMLAH KUADRAT KRN REGRESI JUMLAH KUADRAT TOTAL Y TERKOREKSI

Artinya diantara keragaman y disekitar nilai tengah (mean), sebagian keragaman itu

berasal dari garis regresi dan sebagian lainnya, Yi Yi menunjukkan bahwa amatan amatan itu tidak seluruhnya terletak pada garis regresi.Untuk mengevaluasi baik tidaknya garis regresi sebagai peramal dapat dilihat dari berapa banyak variasi disekitar nilai mean terurai (dijelaskan) oleh variasi karena regresi dan variasi di sekitar regresi. Atau: R2 = Asumsi Model Regresi Asumsi model regresi dikaitkan dengan pengujian parameter model dimana pengujian dikatakan sahih jika asumsi model regresi dipenuhi. Asumsi tersebut menyangkut sifat dari distribusi residual (i), yaitu: i ~ IIDN (0, 2) Artinya residual harus menyebar disekitar 0, memiliki varians konstan (identik) dan independen (tidak berkorelasi satu sama lain). Salah satu syarat untuk mencapai ini adalah pengamatan antar Yi tidak berkorelasi, misalnya tidak bersifat time series. Berkaitan dengan metode penaksiran (MLE), maka untuk regresi linier berganda dibutuhkan kondisi bahwa antar variabel X tidak saling berkorelasi (independent). 1.4. Langkah-langkah dalam pemodelanDefinisikan masalahnya pilih responnya Tentukan variabelvaribelnya Kumpulkan data. Periksa mutu data tebaran. Coba modelnya Apakah parameter stabil dalam ruang sampelnya Apakah model sudah divalidasi ?Ti dak Ya

(

)2

VARIASI KARENA REGRESI VARIASI DI SEKITAR MEAN(TOTAL)

Apakah variabelvariabel itu penting dan tersediaS top Ti dak Ya

Konsultasikan pada pakar untuk mendapatkan kritik & komentar

Apakah ada ketidakpastian model ?Tidak

Ya

Matriks korelasi regresi pertama

Tentukan tujuan 2 galat baku, R Taksir biayanya

Buat distribusi variabel-variabel. Tentukan variabelvariabel baru yang dapat menjelaskan sisaan

Apakah koefisienkoefisiennya wajar ? Apakah persamaannya masuk akal ? Apakah persamaan dapat digunakan ?Tidak Ya

Apakah tujuan dan biaya dapat diterima ?Ti dak S top

Ya

Peubah ditransformasi, bila perlu, dan tentukan persamaan regresinya

Pemeliharaan model

Apakah sasaran tercapai ?Tidak

II.Asumsi residual:

PENGUJIAN ASUMSI

E( i ) = 0

, i= 1,2,3,..n.

2 Varians ( i ) = homoskedastisitas ( identik ).

Tidak ada autokorelasi antar error; i dan j tidak berkorelasi, i j sehingga cov(i, j) = 0 Tidak ada kolinieritas ganda (multikolinieritas) antar variabel independen.

, artinya kesalahan error mengikuti distribusi normal dengan rata-rata nol dan varians 2. Dalam bentuk gambar diilustrasikan sbb :N 0 + 1 X , 2 Y1 Y1

i N ( 0, 2 )

(

)

GRS YG SEBENARNYA

0 1 X

X1

X2

. ..........

Xn

X

2.1. Pengujian Asumsi Residual SECARA GRAFIK

1. Over All Plot

-5

0

5

10

Jika model benar residual akan beristribusi normal dengan mean nol 2. Menyusun normal plot / half normal plot.

Jika jumlah data residual sangat banyak over all plot dapat dibuat dengan cara membuat histogram

0

0

3. Plot i melawan YI atau XiBentuk-bentuk yang mengkin terjadi:i

VARIASI TIDAK KONSTAN SEIRING DENGAN MEMBESARNYA Yi WEIGHTED LEAST SQUARE.

Yi

Yi

ADA SUATU POLA TERTENTU, MIS : i UNTUK i TERTENTU NEG, DIATAS NILAI i TSB CENDERUNG POS MUNGKIN TERJADI KRN 0 DIHILANGKAN.

i

i

MODEL TIDAK SESUAI BUTUH PENYESUAIAN DENGAN MELAKUKAN TRANSFORMASI

X 1i

X 2i

5. The Time Sequence Plot10

0

5

5

10

15

20

TIME ORDER

-5

Yi

X

j

Bentuk yang diinginkani

RANDOM, MEMBENTUK CONFIDENCE BAND.

Yi

2.2. Melalui Pengujian1. UJI KENORMALAN

e=

en

i

=0

ei = the unit normal deviate from of the residual i S

ei = dapat digunakan untuk melihat apakah asumsi i ~ N (0 , 1) dipenuhi S 95 % dari distribusi N (0,1) berada pada limit (-1,96 , 1.96) ~ (-2,2) Jika (np) terlalu kecil, maka dapat digunakan pendekatan distribusi t n-p.

III. REGRESI LINIER SEDERHANA3.1. Cara pembuatan model regresi linier sederhanaPostulate Model Y = f(x) = 0 + 1 x + Bermacam-macam bentuk model regresi linier

0=0

01=0

01. Taksiran 0 , 1 METODE LEAST SQUARE (meminimkan jumlah kuadraterror) Model Taksiran :

Y = bo + b1 XY

bo dan b1 adalah taksiran dari 0 , 1

9 8 7 6 5 4 3 2 1 0 0 2 4 6 8 10

b0 = Y b1 X

Y

b1 =

X Yi =1 n

n

i i 2 i

nXY nX 2

Xi =1

3.2.

Pengujian parameterTujuan : Menguji pengaruh X terhadap Y Gunakan Tabel Anova

Langkah-langkah menggunakan minitab : Contoh : Lihat data produksi (Lampiran 2)

Stat>Regressin>Regresin

Dialog Box items: Response: memilih kolom yang berisi variabel Y (respon) Predictors:memilih kolom yangberisi variabel X (prediktor)

Model Regresi yang terbentuk :Theregressionequationis PRODUKSI=7863+0.273BAHANBAKU PredictorCoefStDevTP Constant786358281.350.192 BAHANBA0.273070.0137619.840.000 S=6143RSq=95.2%RSq(adj)=94.9% AnalysisofVariance SourceDFSSMSFP Regression11485146762414851467624393.550.000 Error2075474434937737217 Total2115606211973 UnusualObservations ObsBAHANBAPRODUKSIFitStDevFitResidualStResid 175134691466501323481909143022.45R Rdenotesanobservationwithalargestandardizedresidual

3.3.

Pengujian Residual Sebelum dilakukan pengujian residual terlebih dahulu menyimpan residual dan nilai dugaan dalam kolom baru. Stat>Regression>Regression>Storage Dialog Box Items: Diagnostics Measures Residual : Pilih untuk menyimpan residual

Standard residual : Pilih untuk menyimpan residual yang sudah distandarisasi Deleted t residual: Pilih untuk menyimpan Residual Studendized Hi (leverages): Pilih untuk menyimpan leverages Cooksdistances: Pilih untuk menyimpan cooks distances DFITS : Pilih untuk menyimpan DFITS Karakteristik estimasi persamaan: Coeffficients : Pilih untuk menyimpan koefisien dari persamaan regresi Fits : Pilih untuk menyimpan nilai dugaan MSE : Pilih untuk menyimpan mean square error (Hal ini juga digambarkan dalam tabel analisis varians, dibawah MS) catatan bahwa akar kuadrat MSE sama dengan s yang juga diikutkan dalam output. XX inverse: Pilih untuk menyimpan inverse dari XX. Matrik ini bila dikalikan dengan MSE adalah matrik varians covarians dari koefisien. Jika anda melakukan weigthted regression (lihat options) kemudian pilihan ini disimpan dalam invers matriks XWX. (lihat juga Stored Regressions Matrices) R matrix: Pilih untuk menyimpan matrik R dari QR atau Cholesky decomposition, lihat Stored Regressions Matrices

Stat>Regression>Regression>Residual Plot menampilkan plot residual untuk mengecek kesesuaian model.

Dialog Box Items: Residual for Plots: anda dapat menentukan tipe residual plot yang mau ditampilkan. Regular :Pilih plot biasa atau residual baris Standardized : Pilih plot untuk residual yang sudah distandarisasi Deleted : Pilih plot untuk rediual studendized yang dihapus Residual Plots Histogram of Residual: pilih untuk menampilkan residual dalam bentuk histogram Normal plot of residuals : pilih untuk menampilkan plot probabilitas normal untuk residual Residual versus fits: Pilih plot residual versus nilai dugaan (Y^) Residual versus order: Pilih plot residual versus urutqan data. Jumlah baris untuk setiap titik data ditunjukkan dengan sumbu X contohnya: 1, 2, 3,,n Residual versus variabel: Pilih untuk plot residual versus variable yang dipilih, kemudian pilih kolom yang berisi variable ini. Minitab menmpilkan paragraph yang terpisah untuk setiap kolom yang anda enter didalam kotak dialog

Residual Model DiagnosticsNormal Plot of ResidualsResidual10000 10000 0 -10000-3.0SL=-13103 X=0.000

I Chart of Residuals1 3.0SL=13103

0

-10000 -2 -1 0 1 2

Residual

0

10

20

Normal Score

Observation Number

Histogram of Residuals8 7 6 5 4 3 2 1 0 -12000 -8000 -4000 0 40008000 12000 16000

Residuals vs. Fits10000

Frequency

Residual

0

-10000 60000 80000 100000 120000 140000

Residual

Fit

IV.

REGRESI LINIER BERGANDA

4.1. Struktur Data Contoh: Data tentang hasil produksi, bahan baku, tenaga kerja dan jenis mesin No 1 2 3 4 . . . 20 21 22 Y Produksi 74970 106430 83285 86810 . . . 131767 110120 88333 X1 X2 Bahan baku Tenaga kerja 308956 29 416141 35 325644 32 339427 29 . . . . . . 515209 39 472347 35 378199 29 X3 Mesin 11 12 12 11 . . . 12 12 11

Akan dibuat model regresi yang menghubungkan hasil produksi dengan bahan baku, tenaga kerja dan mesin. Y : Hasil produksi X1: Bahan baku X2: Tenaga kerja X3: Mesin 4.2. Cara Penaksiran Parameter Regresi dan Pengujian Model Postulate Model :

Dalam bentuk Matriks Y = X + Dimana:

Y=

Y1 Y 2 . . . Yn

X=

1 x11 ... xk 1 . . . . . . . . . 1 x ... x kn 1n

=

0 1 . . . k

0 1 . = . . k

Taksiran parameter menggunakan metode Metode Least Square, diperoleh: Estimasi Parameter : b = ( X X) -1 XY Model estimasinya:

Y = Xb

Sebagai contoh model yang memuat 2 variabel prediktor dapat digambarkan sebagai berikut:

Model regresi yang menjelaskan hubungan antara kualitas dengan variable temperature dan tekanan.2 2 y = 5.127,9 + 31,10 x1 + 39,75 x 2 0,146 x1 x 2 0,133x1 1,14 x 2

Pengujian Model:Uji Serentak (Overall) Hipotesa: Ho : 1 = 2 = = k = 0 H1 : minimal ada satu i 0, dimana i = 1, 2, 3, , k Statistik Uji:

MS regr MS res

=

SS regr / k

SS res / n (k + 1)

=

SS regr (b1 , b2 ,...bk | b0 ) s2

Fhitung = Daerah Kritis: tolak Ho, jika Fhitung F k;n-(k+1);

Tabel AnovaSumber variasi Regresi Residual Total terkoreksi Derajat bebas k n-(k+1) n-1 Jumlah kuadrat b1 X1 Y nY 2 Y1Y-b1X1Y Y 1Y n Y 2 Rata rata jumlah kuadrat (b1 X1 Y nY 2 ) = MSregr k ( Y1 Y b 1 X1 Y ) = MSres ( n k 1) F hitung MSregr / MSres

Uji Indvidu Untuk menguji signifikansi dari pengaruh masing-masing variabel terhadap variabel y (respons) Hipotesa : Ho : i = 0 H1 : i 0

, i = 1, 2, , k , i = 1, 2, , k

Statistik Uji : bi thitung = sd (b ) i Daerah Kritis : Tolak Ho, jika | thitung | > t 1-/2,n-(k+1)

4.3. Pembuatan Model dengan Menggunakan MinitabGunakan data produksi diatas 1. Klik Stat > Regression > Regression 2. Masukkan variabel Produksi (Y) ke kotak Response dan variabel Bahan Baku dan Tenaga Kerja (X1 dan X2) ke kotak Prediktors. Klik OK

Untuk mengontrol tampilan output pada window session Klik Stat>Regression>Regression>Results Dialog Box Items: Kontrol tampilan hasil Display nothing: Pilih untuk tidak menampilkan apa-apa Regression equation, table of coefficients, s, R-squared, and basic analysis of variance: Pilih untuk menampilkan beberapa output keluaran regresi In addition, sequential sums of square nand the unusual observation in the table of fits and residual: Pilih untuk menampilkan tambahan dari sebelumnya, sequential sum of squares (ditambahkan jumlahan kuadrat yang dijelaskan oleh setiap tambahan predictor) dan suatu tabel untuk nilai-nilai yang tidak umum In addition, the full table of fits and residuals: Pilih untuk menampilkan tambahan sebelumnya, suatu tabel nilai dugaan dan observasi redual

Output :Theregressionequationis PRODUKSI=19592+0.245BAHANBAKU+715TENAGAKERJA PredictorCoefStDevTP Constant1959290652.160.044 BAHANBA0.244610.0217711.230.000 TENAGAK715.1434.91.640.117 S=5897RSq=95.8%RSq(adj)=95.3% AnalysisofVariance Keterangan: Jika digunakan =5%, maka tenaga kerja terlihat tidak signifikan dalam model. Mengapa???

SourceDFSSMSFP Regression2149455087097472754354214.900.000 Error1966070326434773856 Total2115606211973

SourceDFSeqSS BAHANBA114851467624 TENAGAK194041084 UnusualObservations ObsBAHANBAPRODUKSIFitStDevFitResidualStResid 175134691466501338972061127532.31R Rdenotesanobservationwithalargestandardizedresidual

Interpretasi:

Dari ANOVA Model regresi signifikan pada alpha 5% Interpretasi model : Bila bahan baku meningkat 1 (satuan), maka produksi akan meningkat 18,3%. Dengan syarat variabel lain konstan. Bila tenaga kerja bertambah 1 orang, maka produksi akan meningkat sebesar 919. Dengan syarat variabel lain konstan. Dan bila mesin bertambah 1 buah, maka produksi akan meningkat 5766 kali. PENGUJIAN RESIDUALResidual Model DiagnosticsNormal Plot of Residuals10000 200003.0SL=14787

I Chart of Residuals10000

Residual

Residual

0

0 -10000

X=-2.0E-11

-3.0SL=-14787

-10000 -2 -1 0 1 2

-20000 0 10 20

Normal Score

Observation Number

Histogram of Residuals5 10000 4 3 2 1 0 -8000 -4000 -6000 -2000 0 2000000000 000 4 6 8 10000 -10000 50000

Residuals vs. Fits

Frequency

Residual

Asumsi Residual dari model yang terbentuk terpenuhi, yaitu identik, independen, berdistribusi normal (IIDN)

0

100000

150000

Residual

Fit

Catatan:

Bila akan menambahkan variable baru: Prediction intervals for new observation : memasukkan nilai baru yang ingin diprediksi sebagai respon Confidence Level : Storage : pilih untuk menyimpan tambahan dari sebelumnya Fits : pilih untuk menyimpan fitted values untuk observasi yang baru SEs of fits : pilih untuk mengestimasi standard error dari nilai dugaannya Confidence limits : pilih untuk menampilkan batas keyakinan dengan batas atas dan batas bawah

Prediction limits : pilih untuk menampilkan nilai prediksi dengan batas atas dan batas bawah

V.

PEMILIHAN MODEL TERBAIK

Jika antar variabel prediktor saling berkorelasi satu sama lain, dikatakan terjadi kasus multicolinear. Hal ini kana mengakibatkan beberapa variabel prediktor tidak significant berada dalam model valaupun sesungguhnya variabel tersebut berhubungan sangat erat dengan variabel respon Y. Untuk mendapatkan model yang diinginkan terdapat dua pertimbangan dalam pembentukan model, diantaranya: Agar persamaan regresi bermanfaat untuk tujuan prediksi, serigkali diinginkan model yang memuat sebanyak-banyaknya variabel X (prediktor) yang mempengaruhi variabel Y (respon) Kareena pertimbangan biaya untuk mendapatkan informasi, maka digunakan sesedikit mungkin variabel X (prediktor) yang mempengaruhi variabel Y (respon) Untuk itu dibutuhkan metode untuk dapat mengakomodasikan dua kepentingan di atas dengan cara Selecting the best regression equation. Berikut ini adalah cara-cara yang sering digunakan dalam memilih model terbaik. 5.1. Best Subset Model Memilih semua subset (model) yang terbaik yang memenuhi kriteria diatas. Kriteria yang digunakan adalah: R2 terbesar MS residual terkecil Cp yang mendekati jumlah parameter Dengan menggunakan Minitab lakukan langkah berikut: Stat > Regression > Best Subsets Dalog box items Respons : Masukkan kolom yang memuat variabel respon Y Free predictors: masukkan yang memuat variabel variabel prediktor X (maksimum 31 variabel) Predictors in all models: pilih kolom-kolom yang memuat variabel yang ingin dimasukkan dalam model. Kolom-kolom ini tidak boleh terdaftar dalam Free predictors. Jika anda menganalisis data dengan lebih dari 15 variabel prediktor, pertimbangkan termasuk variabel prediktor ini dalam rangka mengurangi jumlah free variables dan mempercepat proses perhitungan.

Best Subsets RegressionResponseisY RSqXXXXX VarsRSq(adj)CpS12345 192.392.025.427.314X 188.588.150.333.288X 295.495.06.921.580XX 292.692.125.127.188XX 396.496.02.019.378XXX 395.795.26.821.222XXX 496.495.84.019.758XXXX 496.495.84.019.762XXXX 596.495.66.020.165XXXXX

5.2. Stepwise and Eliminasi Backward Regression Stepwise Regression Model dibuat dengan memasukkan variabel prediktor satu persatu (secara bertahap) mulai dari variabel X yang memiliki korelasi tinggi Langkah-langkahnya: 1. Cari variabel X yang berkorelasi paling tinggi dengan Y, kemudian buat regresinya 2. Pemilihan variabel berikutnya adalah variabel yag memiliki korelasi parsial terbesar dengan Y dan buat model dengan memasukkan variabel tersebut. 3. Uji parameter yang telah ada di dalam model 4. Begitu seterusnya ulangi langkah 2-3 sampai diperoleh model terbaik Eliminasi Backward Membuat model dengan memasukkan semua variabel kemudian dikeluarkan satu persatu dengan melakukan pengujian terhadap parameter parameternya dengan menggunakan partial F test. Nilai partial F-test (FL) terkecil dibandingkan dengan F0 table:

Jika FL < F0, maka X yang bersangkutan dikeluarkan dari model dan dilanjutkan dengan pembuatan model baru tanpa variable tersebut Jika FL > F0, maka proses dihentikan dan persamaan terakhir tersebut yang digunakan/dipilih.

Dengan menggunakan Minitab lakukan langkah berikut: Stat > Regression > Stepwise>Methods Dalog box items Stepwise (forward and backward): pilih standard stepwise regression Predictor in initial model: masukkan variabelprediktor. Variabel ini akan dikeluarkan jika p-value lebih besar dari alpha to enter value (Jika ingin mempertahankan variabel tertentu dalam model abaikan nilai p-value dan enter variabel tersebut dalam Predictor to include in every model dalam box utama) Alpha to enter : tetapkan nilai untuk memasukkan variable dalam model Alpha to remove: tetapkan nilai untuk mengeluarkan variable dalam model Forward selection: pilih Forward selection Alpha to enter : tetapkan nilai untuk memasukkan variable dalam model Backward elimination Alpha to remove: tetapkan nilai untuk mengeluarkan variable dalam model Force: masukkan variabel prediktor yang tidak ingin dikeluarkan dari model. Contoh: Klik Stat > Regression > Stepwise Masukkan variabel X dan Y. Klik OK Gunakan data di Lampiran 2 Y = berat limbah blontong (kuintal) X1 = berat kapur tohor (kuintal) X2 = berat sulfur (kg) X3 = berat flokulan (kg) X4 = berat tebu (kuintal) X5 = berat fosfat (kg)

Variabel X1-X5 dipilih untuk dimasukkan dalam model

Stepwise RegressionFtoEnter:4.00FtoRemove:4.00 ResponseisYon5predictors,withN=30 Step123 Constant74.6874.5674.72 X10.0760.0760.076 TValue4.804.955.25 X20.001 TValue0.01 X30.30.3 TValue0.100.10 X40.02090.02090.0209 TValue6.357.017.17 X54.74.74.7 TValue2.192.682.74 S20.219.819.4 RSq96.4096.4096.39

Jumlah variable yang signifikan dalam model hanya 3 variabel yaitu X1, X4 dan X5.Model yang terbentuk: Y=74,72 + 0,076 X1+0,0209 X4-4,7 X5 R2=96,39

Variabel X1-X5 ingin dimasukkan dalam model.

Stepwise RegressionFtoEnter:4.00FtoRemove:4.00 ResponseisYon5predictors,withN=30 Step1 Constant74.68 X10.076 TValue4.80 X20.001 TValue0.01 X30.3 TValue0.10 X40.0209 TValue6.35 X54.7 TValue2.19 S20.2

RSq96.40