pendekatan regresipendekatan regresi...

Post on 22-Nov-2020

32 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

PENDEKATAN REGRESIPENDEKATAN REGRESI SEMIPARAMETRIK UNTUK PROSES PENGOLAHAN LIMBAHPROSES PENGOLAHAN LIMBAH PABRIK GULA ASEMBAGUS SITUBONDOSITUBONDONiarfie Radythia1306100045

Dosen Pembimbingose e b b gIr. Mutiah Salamah Chamid, M.KesJerry Dwi TP, S.Si, M.Si

Latar Belakang

Masalah yang sering muncul dalam regresi adalah• Masalah yang sering muncul dalam regresi adalahtidak semua variabel penjelas dapat didekati denganpendekatan parametrik

• Diperlukan suatu pendekatan yang tidak terikatdengan asumsi bentuk kurva regresi tertentu danmemberikan fleksibilitas yang besar pendekatanmemberikan fleksibilitas yang besar, pendekatansemacam ini dinamakan regresi nonparametrik.

• Dengan menggabungkan kedua pendekatan ini akandi dapatkan suatu model regresi semiparametrik.

P l dil k k d l h b d• Perlunya dilakukan pendugaan pola hubungan padaproses pembentukan limbah pabrik gula AsembagusSitubondo

• Dalam penelitian Rudianto (1997) terdapat lima variabel prediktor serta variabel respon adalah beratlimbah/blotong Dengan menggunakan metode Alllimbah/blotong. Dengan menggunakan metode All Possible Regression didapatkan bahwa model regresi Y dengan X2 dan X3 memiliki nilai R2 yang kecil yaitu sebesar 50.9

Permasalahan

Bagaimana mendapatkan model semiparametrik g p ppada proses pembentukan limbah pabrik gula Asembagus Situbondo

TujuanTujuanUntuk mendapatkan model semiparametrik pada p p pproses pembentukan limbah pabrik gula Asembagus Situbondo

ManfaatMemberikan pemodelan alternatif pada prosespembentukan limbah pabrik gula Asembagus Situbondo

it d t d i i t ikyaitu dengan metode regresi semiparametrik

Batasan PermasalahanBatasan PermasalahanData yang digunakan adalah data dari penelitian Rudianto( )(1997), dengan menggunakan satu variabel respon yaituvariabel berat limbah dan dua variabel prediktor yaituvariabel berat flokulan dan variabel berat sulfur.

Metode yang digunakan adalah regresi semiparametrikdengan basis polinomial truncateddengan basis polinomial truncated.

Tinjauan Pustaka

→ Regresi Parametrik→ Regresi ParametrikRegresi parametrik merupakan metode yang digunakan untuk mengetahui pola hubungandigunakan untuk mengetahui pola hubunganantara variabel respon dan prediktor yang diketahui bentuk kurva regresinya. Secarag yumum bentuk regresi parametrik linear digambarkan sebagai berikut (Eubank, 1988):

γ ε= +y X

→ Regresi Nonparametrik→ Regresi NonparametrikRegresi nonparametrik adalah metode yang digunakan untuk mengetahui pola hubungandigunakan untuk mengetahui pola hubunganantara variabel respon dan variabel prediktoryang tidak diketahui bentuk fungsinya. Secaray g g yumum bentuk regresi nonparametrikdigambarkan sebagai berikut:

( )f i( )i i iy f t ε , i 1, 2, , n= + = …

→ Regresi Semiparametrik→ Regresi SemiparametrikModel semiparametrik dikembangkan olehGreen Jennison dan Scheult (1985); EngelGreen, Jennison dan Scheult (1985); Engel, Granger, Rice, Weiss (1986); Heckman (1986); Eubank (1988); Wahba (1990); Chen dan Shiau( ) ( )(1994); Shi dan Li (1994); He dan Shi (1996); Ruppert, Wand, dan Caroll (2003). Model inidi k b idirumuskan sebagai:

( )' , 1, 2,...,i i i iy x f t i nγ ε= + + =

→ Spline dalam Regresi Nonparametrik→ Spline dalam Regresi NonparametrikSecara umum, fungsi spline berorde k-1 adalahsebarang fungsi yang dapat disajikan dalamsebarang fungsi yang dapat disajikan dalambentuk:

( )k 1 h

i k 1S t t δ (t ξ )−

−+∑ ∑( ) i k 1i j j

i 1 j 1

S t α t δ (t ξ )+= =

= + −∑ ∑

Limbah Pabrik Gula• Limbah padat yang dihasilkan dalam proses pembuatan

gula di pabrik gula Asembagus Situbondo secara ringkasg p g g gdijelaskan bahwa terdapat enam stasiun dalam tahappembuatan gula

• Stasiun tersebut bila diurutkan dari awal proses adalahdimulai dari stasiun penggilingan, stasiun pemurnian, p gg g , p ,stasiun penguapan, stasiun masakan, stasiun putarandan terakhir stasiun finishing

• Akan tetapi, limbah padat sudah dapat dikeluarkan padatahap pemurnian, sehingga kotoran-kotoran dari bahantahap pemurnian, sehingga kotoran kotoran dari bahandasar tebu tidak mengganggu proses selanjutnyasampai diperoleh hasil akhir berupa gula

Metode Penelitian

→ Identifikasi VariabelData yang digunakan pada penelitian sebelumnyaData yang digunakan pada penelitian sebelumnyaadalah terdiri dari satu variabel respon , yaitu beratlimbah /blotong (Y), dan lima variabel prediktor yaituberat kapur tohor (X1), berat sulfur (X2), berat flokulan(X3), berat tebu (X4) dan berat fosfat (X5).

Variabel berat sulfur dan berat flokulan akan di dekatidengan metode regresi semiparametrik, maka variabel

d i b l dikt di k d lrespon dan variabel prediktor yang digunakan dalampenelitian ini:

Y = berat limbah/blotongX1 = berat flokulan (kg)X2 = berat sulfur (kg)

→ Metode AnalisisLangkah-langkah dalam menganalisis data adalahLangkah langkah dalam menganalisis data adalahsebagai berikut :

• Deskripsi data untuk melihat pola perilaku hubungan dari data.

• Pemilihan parameter penghalus optimal dengan metodeGCVGCV.

• Memodelkan data limbah pabrik gula AsembagusSitubondo dengan pendekatan regresi semiparametrik.

• Pemilihan model spline optimal yang dilakukan dengant d G li d C V lid ti (GCV)metode Generalized Cross Validation (GCV).

• Melakukan analisis diagnostik residual.• Melakukan pengujian signifikansi koefisien regresi• Melakukan pengujian signifikansi koefisien regresi

secara simultan dan individu.

Analisis dan Pembahasan

Pl t Y(b t li b h) d X (b t fl k l )

Deskripsi Data

Plot Y(berat limbah) dan X1(berat flokulan)

800

700

Y

600

500

400

X29876543

Plot Y(berat limbah) dan X1(berat flokulan)80

080

0

pon

070

0

pon

070

0

resp

500

600

resp

500

600

3 4 5 6 7 8 9

400

3 4 5 6 7 8 9

400

paramparam

Plot Y(berat limbah) dan X2(berat sulfur)

800

700

Y

600

500

X1700600500400300200

400

X1

Plot Y(berat limbah) dan X2(berat sulfur)

800

700

Y

600

500

700600500400300200

400

Sulfur

Nilai GCV dengan dua titik knots

Orde titik knots GCV3 4 4,8 5809 489

g

3 , 5809,4893 4 4,9 5809,4893 4 5,0 5809,4893 4 5 1 5813 1853 4 5,1 5813,1853 4 5,2 5822,2333 4 5,3 5834,733

4 5 43 4 5,4 5849,5763 4 5,5 5865,9593 4 5,6 5883,1593 4 5,7 5900,3893 4 5,8 5916,6984 4 4,8 5527,9474 5527,947

4 4 4,9 5527,937*4 4 5 5527,9454 4 5 1 5528 2224 4 5,1 5528,2224 4 5,2 5529,6754 4 5,3 5532,6834 4 5,4 5537,3834 4 5,5 5543,9064 4 5,6 5552 4734 5552,4734 4 5,7 5563,4344 4 5,8 5577,314 4 5 9 5594 8464 4 5,9 5594,8464 4 6,0 5617,109

*GCV Minimum

Model semiparametrik dengan dua titik knots :

30 1 1 1 1 1

2 32 3 4 ( 4)Y X X X Xγ γ γγ γ += + + + + − +0 1 1 1 1 12 3 4

53

1 6 2

( 4)

( 4,9)

Y X X X X

X X

γ γ γ

γ

γ γ

γ ε+

+

+ + + + +

− + +

291213 64 3633 2 1949 03

Dengan program S-Plus diperoleh estimasi model sebagai berikut:

21 1

3 31 1

91213,64 73633,27 19497,03

1703,562 2092,643( 4)

Y X X

X X +

= − + − +

− − +3

1 2406,2007( 4,9) 0,5659328X X+− +

2 63,99%R =

• Sulfur dan berat limbah pabrik gulamempunyai hubungan linier. p y g

• Sedangkan hubungan antara berat limbahSedangkan hubungan antara berat limbahpabrik gula dan berat flokulan berupapiecewise polynomials.

piecewise polynomials• Untuk :1X 4<Untuk :

U t k

1X 4<2 3

1 1 191213,64 73633,27X 19497,03X 1703,562X− + − +

• Untuk :14 X 4,9≤ <2 3

1 1 191213,64 73633,27X 19497,03X 1703,562X− + − + −

• Untuk :1X 4 , 9≥( )312092,643 X 4

+−

Untuk :1X 4 , 9≥

( ) ( )

2 31 1 1

3 3

91213,64 73633,27X 19497,03X 1703,562X

2092 643 X 4 406 2007 X 4 9

− + − + −

( ) ( )1 12092,643 X 4 406,2007 X 4,9+ +

−+−

Model Pembanding

• Dipilih titik knots 4 dan 5,8 pada orde ketiga (splinekuadratik) dengan nilai GCV sebesar 5916,698) g ,

• Nilai GCV yang besar mengindikasikan model semiparametrik yang kurang sesuai untuk

j l k d t b t li b h lmenjelaskan data berat limbah gula• Model regresi semiparametrik dengan titik-titik knots

ini menghasilkan nilai koefisien determinasi yang e g as a a oe s e de e as ya grelatif kecil yaitu 55,91%

Nilai P-value lebih dari 0,10 yaitu > 0,150Diagnostik Residual

99

Probability Plot of residualNormal

95

90

80

Mean

>0.150

-0.0001273StDev 57.98N 30KS 0.079P-Value

Perc

ent 70

60504030

2020

10

5

1

residual150100500-50-100-150

Scatterplot of residual vs fits

100

Scatterplot of residual vs fits

sidu

al

50

0

res

-50

-100

fits850800750700650600550500

-150

fits

Uji Signifikansi Koefisien Regresi

H0 : γ0 = γ1 = γ2 = γ3 = γ4 = γ5 = γ6= 0H1 : paling sedikit ada satu γ i ≠ 0

SK db JK KT Fhit Ftabel

Regresi 6 173292 28882 6,814861 2,047227

Galat 23 97476,08 4238,09Galat 23 97476,08 4238,09

Total 29 270768,8

H 0 H ≠ 0• H0 : γ0 = 0 , H1 : γ0 ≠ 0• H0 : γ 1 = 0 , H1 : γ 1 ≠ 0

H 0 H ≠ 0• H0 : γ2 = 0 , H1 : γ2 ≠ 0• H0 : γ3 = 0 , H1 : γ3 ≠ 0• H0 : γ4 = 0 , H1 : γ4 ≠ 0• H0 : γ5 = 0 , H1 : γ5 ≠ 0• H0 : γ6 = 0 , H1 : γ6 ≠ 0

Koefisien Estimasi StDev t-hitung

γ0 -91213,64 42188,6 -2,16205

γ 1 73633 27 34152 12 2 156038γ 1 73633,27 34152,12 2,156038

γ2 -19497,03 9089,539 -2,145

γ 1703 562 797 1022 2 137194γ3 1703,562 797,1022 2,137194

γ4 -2092,64 991,9244 -2,10968

406 2007 204 9328 1 982116γ5 406,2007 204,9328 1,982116

γ6 0,565933 0,15173 3,729873

Nilai tabel t : 1,713872

Kesimpulan dan SaranKesimpulan

Berat limbah pabrik gula Asembagus Situbondodapat dimodelkan dengan model semiparametriksebagai berikut :

291213 64 3633 2 1949 03 21 1

3 31 1

91213,64 73633,27 19497,03

1703,562 2092,643( 4)

Y X X

X X +

= − + − +

− − +3

1 2406,2007( 4,9) 0,5659328X X+− +

Model semiparametrik yang didapatkan memiliki nilaikoefisien determinasi yang lebih baik yaitu 63 99%koefisien determinasi yang lebih baik yaitu 63,99% dibandingkan dengan nilai koefisien determinasipada model parametrik pada penelitian Rudianto(1997) it 50 9%(1997) yaitu 50,9%

Saran

Pada penelitian ini hanya meneliti dua variabelprediktor yang dibuang pada model parametrik yaituprediktor yang dibuang pada model parametrik yaituvariabel berat sulfur dan variabel berat flokulan, maka untuk penelitian selanjutnya diharapkanmemodelkan semua variabel prediktor yang mempengaruhi berat limbah pabrik gula denganmenggunakan model semiparametrikmenggunakan model semiparametrik

Daftar Pustaka

Chen, H. dan Shiau, J.J.H.(1994). Data Driven Efficient Estimators for a Partially Linear Model The Annals of Statistics 22 211-237Partially Linear Model. The Annals of Statistics, 22, 211-237

Craven an Wahba, G.(1979). Smoothing Noisy Data With SplineFunction: Estimating The Correct Degree of Smoothing by The Method of Generalized Cross Validation, Numer. Math, 31, 377-403.,

Engle, R.L., Granger, C., Rice, J., dan Weiss, A.(1986). SemiparametricEstimates of Relation Between Weather and Electricity Sales, Journal of The American Statistical Association, 81, 310-320.

Eubank, R. (1988). Spline Smoothing and Nonparametric Regression. Marcel dekker, New York.

Green, P., Jennison, C., Scheult, A.(1985). Analysis of field Experiments by Least Squared Smoothing Journal of The RoyalExperiments by Least Squared Smoothing, Journal of The Royal Statistics Society, Ser. B, 47, 299-314.

He, X. dan Shi, P.(1996). Bivariate Tensor Product B-Spline in Partly Linear Models, Journal of Multivariate Analysis, 58, 162-181., y , ,

Heckman N (1986) Spline Smoothing in a Partly Linear ModelsHeckman, N.(1986). Spline Smoothing in a Partly Linear Models, Journal of Royal Statistics Society, Ser. B, 48, 244-248.

Kohn, R.(1991). The Performance of Cross Validation and Maximum Likelihood Estimators of Spline Smoothing Parameters. Journal of p gAmerican Statistics Association, 86, 1042-1050.

Li, K.C.(1986). Asymtotic Optimality of C1 and Generalized Cross Validation in Ridge Regression With Application to SplineS thi A St ti t 14 1101 1112Smoothing, Ann.Statist., 14, 1101-1112.

Rudianto, N. (1997). Implementasi Gibbs Sampler dan Bayesian Inference dalam Pemilihan Model Terbaik Limbah Pabrik GulaAsembagus Situbondo Tugas Akhir ITS SurabayaAsembagus Situbondo, Tugas Akhir, ITS, Surabaya.

Rupert, D, Wand, M.P, and Caroll, R.J. (2003). SemiparametricRegression, New York: Cambridge University.

Shao J (1993) Linear Model Selection by Cross Validation Journal ofShao, J.(1993). Linear Model Selection by Cross Validation. Journal of The American Statistical Assosiation, 88, 486-494.

Shi, P., dan Li, G. (1994). On The Rate Convergence of :Minimum L1-Norm” Estimates in a partly Linear Model, Communication in p yStatistics, Theory and Methoda, 23, 175-196.

Venter, J.H., dan Snyman, J.L.J.(1995). A note on the Generalized Cross Validation Criterior in Linear Model Selection, Biometrica, 82 215 21982, 215-219.

Wahba, G.(1985). A Comparison of GCV and GML for Choosing the Smoothing Parameter in the Generalized Spline Smoothing Problem Journal The Annals of Statistics 13 1378-1402Problem, Journal The Annals of Statistics, 13, 1378 1402.

Wahba, G. (1990). Spline Models for Observation Data, SIAM, Pensylvania.

top related