pemodelan curah hujan bulanan di kabupaten...

12
1 PEMODELAN CURAH HUJAN BULANAN DI KABUPATEN NGAWI DENGAN METODE REGRESI POHON BERDASARKAN INDIKATOR ENSO 1 Dessy Budiyanti dan 2 Sutikno 1 Mahasiswa Jurusan Statistika FMIPA-ITS (1308 100 512) 2 Dosen Pembimbing, Staf Pengajar Jurusan Statistika FMIPA-ITS e-mail : 1 [email protected], 2 [email protected] Abstrak. Informasi ramalan iklim, khususnya curah hujan saat ini sangat dibutuhkan di berbagai bidang. Akurasi hasil ramalan yang tinggi akan mengurangi dampak negatif yang ditimbulkan oleh faktor iklim.Salah satu upaya untuk mengatasi masalah tersebut adalah membuat model ramalan yang mempunyai akurasi tinggi. Berbagai metode ramalan telah digunakan oleh BMKG, namun hasil ramalan yang dihasilkan masih belum memuaskan, sehingga dibutuhkan pengembangan model ramalan. Salah satu metode tersebut adalah regresi pohon. Regresi pohon adalah metode dari pohon keputusan, dimana data variabel respon kontinyu. Pohon keputusan dibentuk dengan menggunakan algoritma penyekatan secara biner. Penggunaan metode tersebut dalam penelitian ini bertujuan untuk menyusun model curah hujan di Kabupaten Ngawi berdasarkan dua zona musim (ZOM) serta hasil prediksi curah hujan bulanan dengan kriteria model terbaik menggunakan RMSEP (Root Mean Square Error Prediction) dan R 2 prediksi menurut indikator ENSO. Hasil yang didapatkan adalah pohon regresi optimum pada ZOM 1 memiliki 4 simpul terminal dan 3 simpul dalam, dengan kedalaman sebesar 4 tingkatan. Variabel pemilah utamanya adalah DMI, disamping itu terdapat juga variabel lainnya yang berpengaruh pada pembentukkan pohon regresi yaitu variabel tekanan permukaan laut di Tahiti dan SOI Tahiti-Darwin, dengan nilai R 2 prediksi yang dihasilkan sebesar 0.575 dan nilai RMSEP sebesar 83.288, sedangakan pohon regresi optimum pada ZOM 2 memiliki 5 simpul terminal dan 3 simpul dalam, dengan kedalaman sebesar 5 tingkatan. Variabel pemilahnya adalah SOI Tahiti-Darwin. Terdapat juga variabel lainnya yang berpengaruh pada pembentukkan pohon regresi yaitu variabel DMI dan suhu permukaan laut Nino 12 dengan nilai R 2 prediksi yang dihasilkan sebesar 0.218 dan nilai RMSEP sebesar 130.538. Kata Kunci: Curah hujan, Indikator ENSO, Regresi pohon 1. Pendahuluan Informasi ramalan iklim, khususnya curah hujan saat ini sangat dibutuhkan di berbagai bidang diantaranya pertanian, perikanan, kehutanan, infrastruktur, transportasi, dan telekomunikasi. Akurasi hasil ramalan yang tinggi akan mengurangi dampak negatif yang ditimbulkan oleh faktor iklim seperti hujan badai, kebajiran, kekeringan atau tanah longsor dan sebagainya.Salah satu upaya untuk mengatasi masalah tersebut adalah membuat model ramalan yang mempunyai akurasi tinggi. BMKG (Badan Meteorologi, Klimatologi dan Geofisika) adalah lembaga melakukan pengukuran dan peramalan iklim. Informasi iklim yang keluarkan oleh BMKG berupa besaran curah hujan, sifat hujan (normal, di atas normal dan di bawah normal). Berbagai metode ramalan telah digunakan oleh BMKG, namun hasil ramalan yang dihasilkan masih belum memuaskan, sehingga dibutuhkan pengembangan model ramalan. Beberapa penelitian sebelumnya untuk menyusun metode ramalan curah hujan sebagian besar tidak menggunakan pendekatan regresi klasik. Hal ini disebabkan metode regresi klasik terdapat pelanggaran asumsi IID N(0, σ 2 ). Metode yang saat ini digunakan oleh BMKG adalah ANFIS (Adaptive Neuro-Fuzzy Inference Systems), ARIMA dan transformasi wavelet. Namun metode-metode tersebut di beberapa lokasi mempunyai kinerja yang kurang bagus, sehingga upaya untuk mendapatkan metode ramalan terbaik terus perlu dilakukan. Salah satu

Upload: nguyenphuc

Post on 21-Mar-2019

226 views

Category:

Documents


0 download

TRANSCRIPT

1

PEMODELAN CURAH HUJAN BULANAN DI KABUPATEN NGAWIDENGAN METODE REGRESI POHON BERDASARKAN INDIKATOR ENSO

1Dessy Budiyanti dan 2Sutikno

1Mahasiswa Jurusan Statistika FMIPA-ITS (1308 100 512)2Dosen Pembimbing, Staf Pengajar Jurusan Statistika FMIPA-ITS

e-mail : [email protected], [email protected]

Abstrak. Informasi ramalan iklim, khususnya curah hujan saat ini sangat dibutuhkan diberbagai bidang. Akurasi hasil ramalan yang tinggi akan mengurangi dampak negatif yangditimbulkan oleh faktor iklim.Salah satu upaya untuk mengatasi masalah tersebut adalahmembuat model ramalan yang mempunyai akurasi tinggi. Berbagai metode ramalan telahdigunakan oleh BMKG, namun hasil ramalan yang dihasilkan masih belum memuaskan,sehingga dibutuhkan pengembangan model ramalan. Salah satu metode tersebut adalah regresipohon. Regresi pohon adalah metode dari pohon keputusan, dimana data variabel responkontinyu. Pohon keputusan dibentuk dengan menggunakan algoritma penyekatan secara biner.Penggunaan metode tersebut dalam penelitian ini bertujuan untuk menyusun model curah hujandi Kabupaten Ngawi berdasarkan dua zona musim (ZOM) serta hasil prediksi curah hujanbulanan dengan kriteria model terbaik menggunakan RMSEP (Root Mean Square ErrorPrediction) dan R2 prediksi menurut indikator ENSO. Hasil yang didapatkan adalah pohonregresi optimum pada ZOM 1 memiliki 4 simpul terminal dan 3 simpul dalam, dengankedalaman sebesar 4 tingkatan. Variabel pemilah utamanya adalah DMI, disamping itu terdapatjuga variabel lainnya yang berpengaruh pada pembentukkan pohon regresi yaitu variabel tekananpermukaan laut di Tahiti dan SOI Tahiti-Darwin, dengan nilai R2 prediksi yang dihasilkansebesar 0.575 dan nilai RMSEP sebesar 83.288, sedangakan pohon regresi optimum pada ZOM2 memiliki 5 simpul terminal dan 3 simpul dalam, dengan kedalaman sebesar 5 tingkatan.Variabel pemilahnya adalah SOI Tahiti-Darwin. Terdapat juga variabel lainnya yangberpengaruh pada pembentukkan pohon regresi yaitu variabel DMI dan suhu permukaan lautNino 12 dengan nilai R2 prediksi yang dihasilkan sebesar 0.218 dan nilai RMSEP sebesar130.538.

Kata Kunci: Curah hujan, Indikator ENSO, Regresi pohon

1. PendahuluanInformasi ramalan iklim, khususnya curah hujan saat ini sangat dibutuhkan di berbagai

bidang diantaranya pertanian, perikanan, kehutanan, infrastruktur, transportasi, dantelekomunikasi. Akurasi hasil ramalan yang tinggi akan mengurangi dampak negatif yangditimbulkan oleh faktor iklim seperti hujan badai, kebajiran, kekeringan atau tanah longsor dansebagainya.Salah satu upaya untuk mengatasi masalah tersebut adalah membuat model ramalanyang mempunyai akurasi tinggi.

BMKG (Badan Meteorologi, Klimatologi dan Geofisika) adalah lembaga melakukanpengukuran dan peramalan iklim. Informasi iklim yang keluarkan oleh BMKG berupa besarancurah hujan, sifat hujan (normal, di atas normal dan di bawah normal). Berbagai metoderamalan telah digunakan oleh BMKG, namun hasil ramalan yang dihasilkan masih belummemuaskan, sehingga dibutuhkan pengembangan model ramalan.

Beberapa penelitian sebelumnya untuk menyusun metode ramalan curah hujan sebagianbesar tidak menggunakan pendekatan regresi klasik. Hal ini disebabkan metode regresi klasikterdapat pelanggaran asumsi IID N(0, σ2). Metode yang saat ini digunakan oleh BMKG adalahANFIS (Adaptive Neuro-Fuzzy Inference Systems), ARIMA dan transformasi wavelet. Namunmetode-metode tersebut di beberapa lokasi mempunyai kinerja yang kurang bagus, sehinggaupaya untuk mendapatkan metode ramalan terbaik terus perlu dilakukan. Salah satu

2

metode yang akan digunakan adalah regresi pohon. Regresi pohon adalah salah satu metodedari pohon keputusan yang merupakan metodologi statistik nonparametrik, dimana data variabelrespon kontinyu. Pohon keputusan dibentuk dengan menggunakan algoritma penyekatan secarabiner (binary recursive partitioning). Metode ini mempunyai beberapa kelebihan diantaranyadapat melakukan eksplorasi pada struktur data yang kompleks, mengidentifikasi berbagaivariabel prediktor yang mempunyai hubungan struktural dengan variabel responnya danmemprediksi dugaan respon dari satu atau beberapa amatan baru. Interpretasi hasilnya lebihmudah selain itu pohon regresi resistan terhadap pengaruh pencilan.

Indikator ENSO yang sering digunakan antara lain tekanan permukaan laut atau SLP (sealevel preasure) Darwin (Australia), tekanan permukaan laut Tahiti (Pasifik Selatan), suhupermukaan laut atau SST (sea surface temperature) Nino 1.2, Nino 3, Nino 4 dan Nino 3.4(Zifwen, 1999 dalam Estikaningrum, 2003). Kemudian dalam penelitian ini juga terdapatvariabel DMI (dipole mode index).

Beberapa penelitian sebelumnya yang menggunakan metode yang sama menggunakanindikator ENSO yaitu penelitian oleh Mayasari (2003) dengan lokasi penelitian daerah Tuban,Sandakan dan Ampenan. Hasil yang didapatkan dari penelitian tersebut variabel prediktor yangrelatif penting di ketiga stasiun sebagai pemilah pada simpul utama adalah tekanan permukaandi Darwin. Tujuan penelitian ini adalah memodelkan curah hujan dengan metode regresi pohondi Kabupaten Ngawi dan mengetahui hasil kinerja model regresi pohon dengan kriteria modelterbaik menggunakan R2 prediksi dan RMSEP.

2. Tinjauan PustakaAnalisis Klasifikasi Pohon

Menurut Breiman L, Friedman J.H, Olshen R.A, dan Stone C.J. (1993), CARTmerupakan metodologi statistika nonparametrik yang dikembangkan berdasarkan kaidah pohonkeputusan, baik untuk peubah respon kategorik maupun kontinyu. Apabila variabel respon databerupa kontinyu maka akan diperoleh model pohon regresi, sebaliknya apabila data variabelrespon berskala kategorik maka akan diperoleh model pohon klasifikasi. Pohon keputusandibentuk dengan menggunakan algoritma penyekatan secara biner (binary recursivepartitioning).

Pembentukan pohon regresi pada dasarnya hampir sama dengan pembentukan pohonklasifikasi dimana simpul utama (root node) terdapat beberapa kelompok data didalamnya danpenentuan simpul utama berdasarkan variabel terpenting, selanjutnya simpul utama dipilahmenjadi simpul anak kiri (left child node) dan simpul anak kanan (right child node), demikianseterusnya hingga didapatkan suatu simpul akhir (terminal node).

Regresi pohon terbentuk dari hasil pemilahan data setiap simpul ke dalam dua simpulanak. Aturannya adalah sebagai berikut: tiap pemilahan tergantung pada nilai yang hanyaberasal dari satu variabel prediktor, untuk variabel kontinyu Xj, jika ruang sampelnya berukurann dan terdapat sebanyak-banyaknya n nilai amatan berbeda pada variabel Xj, maka akan terdapatsebanyak n-1 split yang berbeda yang dibentuk oleh pertanyaan “Apakah Xj≤ ci ?” dengan i = 1,2, ...., n-1 dan ci adalah nilai tengah dari dua nilai amatan variabel Xj berurutan berbeda danuntuk variabel kategorik, pemilahan yang terjadi berasal dari semua kemungkinan pemilahanberdasarkan terbentuknya dua anak gugus yang saling lepas (disjoint). Apakah Xj merupakanvariabel kategorik yang nominal bertaraf L, maka akan ada 2L-1-1 pemilahan, sedangkan jikaberupa variabel kategorik ordinal maka akan ada L-1 pemilahan.

Pohon regresi dibentuk melalui suatu pemilihan yang rekursif berdasarkan aturanpemilahan. Proses pemilahan dilakukan pada tiap simpul dengan cara sebagai berikut: carisemua kemungkinan pemilahan pada tiap variabel prediktor. Pilihlah pemilah terbaik.Pemilahan terbaik adalah pemilahan yang memaksimumkan ukuran kehomogenan didalammasing-masing simpul relatif terhadap simpul induknya dan yang memaksimumkan ukuranpemisahan (separation) antara dua simpul anak tersebut.

3

Rataan kuadrat kesalahan digunakan sebagai kriteria kehomogenan pada tiap-tiap simpul.Misalkan diketahui simpul t berisi sampel (Xn,yn), sedangkan N(t) adalah jumlah amatan dalamsimpul t dan rataan respon dalam simpul t adalah

txn

n

ytN

ty 1(1)

Maka rataan kuadrat kesalahan didalam simpul t adalah

21

tx

nn

tyyN

tR (2)

Misalkan ada pemilah s yang menyekat t menjadi simpul anak kiri tL dan simpul anak kanan tR.Kriteria rataan kuadrat sisaan adalah

RL tRtRtRtsR , (3)Dan pemilah terbaik s* adalah pemilah yang sedemikian hingga

tsRtsRSs

,max,*

(4)

Simpul terakhir yang terbentuk disebut simpul akhir (terminal node). Simpul t dapatdijadikan simpul terminal jika :a. Tidak terdapat penurunan keheterogenan yang berarti.b. Hanya terdapat satu pengamatan pada tiap simpul anak atau adanya batasan minimum n dan

menurut Breiman et al, 1993, pengembangan pohon berhenti apabila pada simpulterdapat ni < 5.

c. Adanya batasan jumlah level atau tingkat kedalaman pohon maksimal.Pemangkasan dilakukan untuk mendapatkan ukuran pohon yang layak dengan

menggunakan ukuran cost complexity minimum (Breiman et al. 1984).Ukuran complexity tersebut adalah banyaknya simpul akhir atau simpul terminal.

Resubtitution suatu pohon T pada kompleksitas α yaitu :TTRTR ~)()( (5)

dimana adalah parameter kompleksitas mengenai kesalahan bagi penambahan satusimpul akhir pada pohon T. R(T) adalah resubstitution estimate pohon T sedangkan T~ adalahBanyaknya simpul terminal pohon T.

Cost complexity prunning menentukan suatu pohon bagian T yangmeminimumkan Rα (T) pada seluruh pohon bagian atau untuk setiap nilai , dicaripohon bagian maxTT yang meminimumkan Rα (T) yaitu :

TRTR TT max

min (6)Ukuran pohon yang besar akan menyebabkan nilai cost complexity yang tinggi karena

struktur data yang digambarkan cenderung komplek. Oleh karena itu perlu dipilih pohonoptimal yang berukuran sederhana namun memberikan nilai penduga pengganti yang cukupkecil. Jika R (T) dipilih sebagai penduga terbaik, maka pohon yang berukuran besar akancenderung dipilih sebab makin besar ukuran suatu pohon maka akan semakin kecil R (T). Datasampel akan digunakan untuk mendapatkan nilai pengganti paling kecil dari regresi pohon yangdipilih. Terdapat 2 jenis penduga pengganti yaitu penduga sampel uji (test sample estimate) danpenduga validasi silang lipat V (cross validation V-fold estimate) (Breiman et al., 1993).Pemodelan Iklim di Indonesia

BMKG saat ini menggunakan tiga metode untuk meramal iklim yaitu ARIMA,tranformasi wavelet, dan Adaptive Neuro-Fuzzy Inference Systems (ANFIS) (Indragustari,2005a; 2005b; Nuryadi, 2005).Faktor-faktor yang Mempengaruhi Keragaman Iklim

Indonesia merupakan negara yang dilewati oleh garis khatulistiwa dan masuk ke dalampengaruh kawasan laut pasifik. Posisi ini menjadikan Indonesia sebagai daerah pertemuan

4

sirkulasi meridional (Hadley) dan sirkulasi zonal (Walker), dua sirkulasi yang sangatmempengaruhi keragaman iklim Indonesia. Selain itu posisi matahari berpindah dari 23.5 LSke 23.5 LU sepanjang tahun, aktifitas moonson juga ikut berperanan dalam mempengaruhikeragaman iklim. Indonesia merupakan negara kepulauan dengan bentuk topografi yang sangatberagam maka sistem golakan lokal juga cukup dominan dan pengaruhnya terhadap keragamaniklim di Indonesia tidak dapat diabaikan. Faktor lain yang diperkirakan ikut berpengaruhterhadap keragaman iklim Indonesia ialah gangguan siklon tropis. Semua aktifitas dan sistemini berlangsung secara bersamaan sepanjang tahun. Sedangkan iklim yang bervariasi antara satutempat dengan tempat lainnya dipengaruhi oleh intensitas radiasi (yang merupakan fungsi darigaris lintang), albedo (refleksitas dari permukaan bumi), pola distribusi daratan dan lautan sertatopografi. Salah satu penyebab terjadinya ganguan pada sirkulasi Walker adalah fenomenaENSO. ENSO merupakan salah satu faktor global disamping pemanasan global dan angin pasat(tade wind). Sehingga pola iklim (curah hujan) diwilayah Indonesia tidak semua terpengaruhlangsung oleh fenomena ini. Pola iklim (curah hujan) yang dipengaruhi ENSO adalah tipe hujanmoonson (Zifwen, 1999 dalam Estikaningrum, 2003).

Istilah ENSO (El-Nino Southern Oscillation) mendeskripsikan secara keseluruhan osilasiselatan (fenomena atmosfer) beserta peningkatan suhu permukaan laut dan penurunan suhupermukaan laut (fenomena lautan). Istilah tersebut dikenal dengan El-Nino (warm event) yaitumeningkatnya suhu permukaan laut di kawasan tengah dan timur ekuator laut pasifik. Osilasiselatan (southern oscillation) adalah osilasi tekanan atmosfer kawasan laut Pasifik dan atmosferlaut Indonesia-Australia. Untuk memonitor osilasi selatan ini dibuatkan indeks osilasi selatan(IOS) atau SOI (Southern Oscillation Index) yaitu nilai perbedaan antara tekanan atmosferdiatas permukaan laut di Darwin (Australia) dan Tahiti (Pasifik Selatan).

Peristiwa Indian Ocean Dipole (IOD) terjadi di Samudera Hindia yang ditandaidengan adanya perbedaan anomali suhu permukaan laut antara Samudera Hindia Baratdengan Samudera Hindia Timur. Kekuatan IOD dapat diukur dengan DMI (DipoleMode Index). Indeks ini berupa dipole anomali suhu permukaan laut yang didefinisikansebagai perbedaan anomali suhu permukaan laut Samudera Hindia Barat dan SamuderaHindia Timur. Jika nilai DMI positif, anomali suhu permukaan laut Samudera HindiaBarat lebih besar daripada di Samudera Hindia Timur. Akibatnya terjadi peningkatancurah hujan dari normalnya di Pantai Timur Afrika dan Samudera Hindia Barat,sedangkan di Indonesia mengalami penurunan curah hujan dari normalnya yangmenyebabkan kekeringan, dan sebaliknya jika nilai DMI negatif maka di Indonesia akanmengalami peningkatan curah hujan dari normalnya.

Menurut Zifwen 1999 indikator ENSO yang sering digunakan antara lain tekananpermukaan laut atau SLP (sea level preasure) Darwin (Australia), tekanan permukaan lautTahiti (Pasifik Selatan), suhu permukaan laut atau SST (sea surface temperature) yang terdiridari Nino 1.2 yang berada pada sekitar pantai peru dan chili dengan daerah (0-100South)(900West-800West), Nino 3 berada sekitar bagian timur pasifik ekuatorial dengandaerah (50North-50South)(1500West-900West), Nino 4 berada sekitar bagian barat pasifikekuatorial dengan daerah (50North-50South)(1600West-1500West) dan Nino 3.4 berada sekitarbagian tengah pasifik ekuatorial dengan daerah (50North-50South)(1700West-1200West).

3. MetodologiSumber Data

Data yang digunakan dalam penelitian ini adalah data curah hujan bulanan KabupatenNgawi yang diperoleh dari BMKG Karangploso Malang . Data curah hujan bulanan meliputi 18pos hujan yang akan dibagi kedalam 2 zona musim, dengan periode tahun 1989-2008. Namastasiun pos hujan menurut ZOM selengkapnya disajikan pada Tabel 3.1.

5

Tabel 3.1 Nama stasiun dan lokasinya menurut ZOMNo. Nama Pos Koordinat

ZOMLintang Bujur1 Jogorogo 07° 29' 27,8" 111° 15' 38,6" 12 Ngrambe 07° 30' 49,3" 111° 12' 21,1" 13 Kedung urung-urung 07° 30' 32,9" 111° 09' 41,1" 14 Tretes 07° 27' 13,2" 111° 10' 18,9" 15 Mantingan 07° 23' 06,1" 111° 13' 24,0" 16 Mardiasri 07° 25' 41,2" 111° 24' 20,1" 27 Paron 07° 26' 14,5" 111° 23' 44,8" 28 Bekoh 07° 30' 01,8" 111° 18' 02,6" 29 Guyung 07° 30' 21,2" 111° 24' 36,8" 210 Sambiroto 07° 26' 43,5" 111° 33' 17,1" 211 Karangjati 07° 27' 39,7" 111° 36' 47,8" 212 Padas 07° 25' 12,5" 111° 30' 15,9" 213 Ngawi 07° 24' 29,8" 111° 27' 22,7" 214 Kedunggalar 07° 24' 59,1" 111° 18' 45,1" 215 Begal 07° 28' 10,9" 111° 16' 15,1" 216 walikukun 07° 23' 06,1" 111° 13' 24,0" 217 Ngadirejo/Sooko 07° 23' 47,4" 111° 21' 57,7" 218 Ngale 07° 24' 32,2" 111° 22' 17,8" 2

Variabel PenelitianVariabel yang digunakan terdiri atas variabel respon dan variabel prediktor. Variabel

respon (Y) yaitu curah hujan bulanan dengan satuan mm (milimeter). Variabel prediktor yangdigunakan dalam penelitian ini merupakan faktor-faktor yang diduga mempengaruhi curahhujan bulanan yang merupakan indikator ENSO yaitu: Southern Oscillation Index (SOI) Tahiti-Darwin (X1); Sea Level Pressure (SLP) yang terdiri dari: Tekanan permukaan laut di Tahitidengan satuan mb (milibar) (X2), Tekanan permukaan laut di Darwin dengan satuan mb(milibar) (X3); Sea Surface Temperature (SST) yang terdiri dari: Suhu permukaan laut Nino 1.2dengan satuan 0C (X4), Suhu permukaan laut Nino 3 dengan satuan 0C (X5), Suhu permukaanlaut Nino 4 dengan satuan 0C (X6), Suhu permukaan laut Nino 3.4 dengan satuan 0C (X7) danDMI (Dipole mode index) (X8).Metode Analisis Data1. Statistika deskriptif digunakan untuk mengetahui pola data curah hujan di Kabupaten Ngawi

serta variabel-variabel yang mempengaruhinya.2. Analisis regresi pohon digunakan untuk memodelkan dan memprediksi curah hujan di

Kabupaten Ngawi. Langkah-langkahnya sebagai berikut:a. Pembagian data menjadi dua yaitu data learning dan data testing. Data learning

digunakan untuk proses pembentukan model pohon regresi, sedangkan data testingdigunakan untuk melakukan validasi model yaitu melihat kemampuan model yangterbentuk dalam menduga atau memprediksi data baru.

b. Pembentukan (growing) pohon regresi maksimal, meliputi pemilahan pemilah (splitter)terbaik dan penentuan simpul terminal (terminal node). Pemilahan terbaik dihitungberdasarkan selisih terbesar rataan kuadrat sisaan antara simpul induk dan kedua simpulanak yang memilahnya. Simpul terminal diperoleh ketika tidak memungkinkan lagimelakukan pemilahan pada suatu simpul atau jika tidak terdapat penurunankeheterogenan yang berarti sehingga tidak akan dipilah lagi.

c. Pemangkasan pohon regresi dimulai dengan memangkas pohon regresi maksimal sampaidiperoleh ukuran pohon regresi yang paling kecil dengan kriteria kompleksitas kesalahan(cost complexity) yang minimum.

d. Memilih pohon terbaik.e. Melakukan validasi model dengan memasukkan data testing pada pohon regresi optimal.

Melihat kemampuan model pohon regresi yang terbentuk dalam memprediksi dugaanrespon untuk data testing.

6

4. Hasil dan PembahasanDeskripsi curah hujan di Kabupaten Ngawi

Deskripsi curah hujan digunakan untuk mengetahui gambaran umum dari curah hujanyang terjadi pada setiap ZOM di Kabupaten Ngawi. rata-rata curah hujan Kabupaten Ngawipada tahun 1989 sampai dengan tahun 2008 pada ZOM 1 lebih tinggi dibandingkan dengan rata-rata curah hujan ZOM 2 yaitu sebesar 168.18 mm, dengan rata-rata curah hujan pada ZOM 2sebesar 159.53 mm. Dimana curah hujan minimum untuk kedua ZOM tersebut adalah 0 mmyang berarti bahwa tidak terjadi hujan.Tabel 1 Nilai rata-rata, simpangan baku, minimum dan maksimum dari variabel respon dan prediktor

Variabel Rataan Simpanganbaku

Minimum Maksimum

Curah hujan ZOM 1 (mm) 168.18 151.65 0 626Curah hujan ZOM 2 (mm) 159.53 133.28 0 526SOI Tahiti-Darwin -0.417 1.815 -6.70 4.40SLP Darwin (mb) 0.526 1.113 -2.90 3.90SLP Tahiti (mb) 0.110 1.063 -3.80 2.70Nino 1.2 (0) -0.071 1.163 -2.16 4.13Nino 3 (0) 0.021 0.890 -1.78 3.68Nino 4 (0) 0.226 0.698 -1.60 1.47Nino 3.4 (0) 0.095 0.883 -1.98 2.80DMI (0) -0.0155 1.064 -2.81 3.37

Gambaran hubungan antara curah hujan dengan Kabupaten Ngawi pada ZOM 1 danZOM 2 dari variabel southern oscillation index Tahiti-Darwin, tekanan permukaan laut diDarwin, tekanan pemukaan laut di Tahiti, suhu permukaan laut Nino 1.2, suhu permukaan lautNino 3, suhu permukaan laut Nino 4 dan suhu permukaan laut Nino 3.4 memberikan gambaranpola data dimana titik-titiknya tidak membentuk pola tertentu atau menyebar.

Cur

ahH

ujan

0-4-8

400

200

0

30-3 30-3

30-3 3.00.5-2.0 10-1

400

200

0

20-2

400

200

0

20-2

SOI Darwin Tahiti

Nino12 Nino3 Nino4

Nino34 DMI

Gambar 1 Scatterplot Y dan X pada ZOM 1 dan ZOM 2 Kabupaten Ngawi.

Berikut ini adalah gambaran hubungan antara curah hujan dengan delapan variabel yangmempengaruhi berdasarkan nilai korelasinya.

Tabel 2 Korelasi DataCurah hujan

ZOM 1Curah hujan

ZOM 2SOI Darwin Tahiti Nino 1.2 Nino 3 Nino 4 Nino 3.4

Curah hujan ZOM 20.9030.000

SOI0.0420.528

0.0780.243

Darwin-0.0800.229

-0.109*0.102

-0.8110.000

Tahiti-0.0100.878

0.0170.794

0.7960.000

-0.2920.000

Nino 1.20.0440.509

0.0660.323

-0.4180.000

0.4380.000

-0.2310.000

Cur

ahH

ujan

0-4-8

500

250

0

30-3 30-3

30-3 3,00,5-2,0 10-1

500

250

0

20-2

500

250

0

20-2

SOI Darwin Tahiti

Nino12 Nino3 Nino4

Nino34 DMI

7

Nino 3-0.0600.367

-0.0370.578

-0.6150.000

0.5750.000

-0.4140.000

0.8160.000

Nino 4-0.122*0.066

-0.147*0.026

-0.6520.000

0.5380.000

-0.5130.000

0.3190.000

0.6650.000

Nino 3.4-0.0870.191

-0.0850.202

-0.7020.000

0.6210.000

-0.5100.000

0.6050.000

0.9250.000

0.8640.000

DMI-0.192*0.000

-0.171*0.010

-0.3810.000

0.4160.000

-0.1960.000

0.3330.000

0.4590.000

0.3280.000

-0.4420.000

Angka yang dicetak miring adalah nilai korelasi, yang tidak dicetak miring adalah niali P_value dan tandabintang adalah nilai korelasi yang lebih dari 0,1

Terdapat hubungan antara curah hujan di ZOM 1 dengan curah hujan di ZOM 2 dilihatdari nilai korelasinya yang tinggi yaitu sebesar 0,903. Variabel curah hujan di ZOM 1 denganvariabel suhu permukaan laut Nino 4 dan dipole index mode memiliki hubungan lebih besaryaitu sekitar 10% daripada dengan variabel prediktor lainnya. Sedangkan pada ZOM 2 variabelyang memiliki hubungan lebih besar daripada variabel prediktor lainnya adalah tekananpermukaan laut di Darwin, suhu permukaan laut Nino 4 dan dipole index mode. Akan tetapiantara variabel southern oscillation index Tahiti-Darwin, tekanan permukaan laut di Darwin,tekanan permukaan laut di Tahiti, suhu permukaan laut Nino 1.2, suhu permukaan laut Nino 3,suhu permukaan laut Nino 4 dan suhu permukaan laut Nino 3.4 mempunyai nilai korelasi yangcukup tinggi antara variabel satu dengan variabel yang lainnya.

Pola curah hujan di Kabupaten Ngawi termasuk pola moonson yaitu pola hujan yangbersifat unimodal (satu puncak musim hujan).

050

100150200250300350400

Januari

Februa

riMare

tApril Mei

Juni Juli

Agustus

Septem

ber

Oktober

Nopember

Desember

Bulan

Rat

a-ra

ta c

urah

huj

an ZOM 1

ZOM 2

Gambar 2 Pola curah hujan bulanan Kabupaten Ngawi.

Gambar 2 dapat diketahui bahwa musim penghujan yang terjadi di Kabupaten Ngawiselama kurun waktu 20 tahun terjadi pada bulan November-April, sedangkan musim kemarauterjadi pada bulan Mei-Oktober. Curah hujan bulanan yang terjadi di ZOM 1 relatif lebih tinggidibandingkan dengan ZOM 2.Pembentukan Pohon Regresi

Pembentukan regresi pohon dengan menggunakan data curah hujan bulanan dari tahun1989 sampai dengan tahun 2008 sebanyak 240 data, yang akan dibagi menjadi 2 kelompok datayaitu data learning dan data testing. Berdasarkan deskripsi data yang telah dilakukan data yangdigunakan dalam penelitian ini hanya sebanyak 228 data atau 19 tahun sebagai data learningdan 12 data atau satu tahun sebagai data testing.Pohon Regresi Maksimal

Pohon regresi maksimal pada ZOM 1 memiliki 47 simpul dalam dan 48 simpulterminal, dengan kedalaman sebesar 16 tingkatan. Pohon regresi maksimal yang terbentukmempunyai nilai kesalahan relatif validasi silang lipat 10 (10-folt cross validated relative cost)sebesar 1.253 ± 0.124 yang berarti nilai kesalahan prediksi besarnya curah hujan dari pohonregresi maksimal relatif ZOM 1 terhadap ragam data yang dihitung berdasarkan pendugavalidasi silang lipat 10 adalah berkisar antara 1.129 sampai 1.377. Nilai kesalahan relatifpenggantian (resubstitution relative error) sebesar 0,247 yaitu rataan kuadrat kesalahan prediksiyang terjadi jika mengganti data amatan besar curah hujan dengan data prediksi menggunakan

8

model regresi pohon maksimal relatif terhadap ragam data. Pohon regresi maksimal pada ZOM2 memiliki 48 simpul dalam dan 49 simpul terminal, dengan kedalaman sebesar 13 tingkatan.Pohon regresi maksimal mempunyai nilai kesalahan relatif penggantian (resubstition relativecost) sebesar 0.254 yaitu rataan kuadrat kesalahan prediksi yang terjadi jika mengganti dataamatan besar curah hujan dengan data prediksi menggunakan model regresi pohon maksimalrelatif terhadap ragam data. Nilai kesalahan relatif validasi silang lipat 10 (10-folt crossvalidated relative cost) sebesar 1.293 ± 0.119 yang berarti nilai kesalahan prediksi besarnyacurah hujan dari regresi pohon maksimal relatif ZOM 2 terhadap ragam data yang dihitungberdasarkan penduga validasi silang lipat 10 adalah berkisar antara 1.174 sampai 1.412.

Gambar 3 Tipologi pohon regresi maksimal pada ZOM 2.Pohon Regresi Optimum

Pohon regresi optimal yang terbentuk dari pemangkasan pohon regresi maksimal padaZOM 1 menghasilkan nilai kesalahan relatif validasi silang lipat 10 (10-folt cross validatedrelative cost) yaitu sebesar 1 ± 0.045 yang berarti nilai kesalahan prediksi besarnya curah hujandari regresi pohon maksimal relatif pada ZOM 1 terhadap ragam data yang dihitung berdasarkanpenduga validasi silang lipat 10 adalah berkisar antara 0.955 sampai 1.045 dengan nilaikesalahan relatif penggantian (resubstition relative cost) sebesar 0.819 yaitu rataan kuadratkesalahan prediksi yang terjadi jika mengganti data amatan besar curah hujan dengan dataprediksi menggunakan model pohon regresi optimal relatif terhadap ragam data, serta nilaikomplesitas sebesar 181837.656.

Sedangkan pohon regresi optimal pada ZOM 2 menghasilkan nilai kesalahan relatifvalidasi silang lipat 10 (10-folt cross validated relative cost) yaitu sebesar 0.988 ± 0.063 yangberarti nilai kesalahan prediksi besarnya curah hujan dari pohon regresi optimal relatif padaZOM 2 terhadap ragam data yang dihitung berdasarkan penduga validasi silang lipat 10 adalahberkisar antara 0.955 sampai 1.045 dengan nilai kesalahan relatif penggantian (resubstitionrelative cost) sebesar 0.748 yaitu rataan kuadrat kesalahan prediksi yang terjadi jika menggantidata amatan besar curah hujan dengan data prediksi menggunakan model regresi pohon optimalrelatif terhadap ragam data, serta nilai kompleksitas sebesar 102846.492.

9

Gambar 4 Plot antara relative cost dengan jumlah node pada ZOM 1 dan ZOM 2.

Pohon regresi optimal pada ZOM 1 memiliki 4 simpul terminal dan 3 simpul dalam,dengan kedalaman sebesar 4 tingkatan. Sedangkan Pohon regresi optimal pada ZOM 2 memiliki5 simpul terminal dan 3 simpul dalam, dengan kedalaman sebesar 5 tingkatan. Berikut iniadalah gambar dari pohon regresi optimal dari ZOM 1 dan ZOM 2.

T e r m in a lN o d e 1

S T D = 1 5 4 . 5 0 9A v g = 3 2 7 . 9 4 1

N = 1 7

T e r m in a lN o d e 2

S T D = 1 2 3 . 5 8 2A v g = 1 1 5 . 7 9 5

N = 4 4

T e r m in a lN o d e 3

S T D = 1 4 7 . 0 3 9A v g = 2 0 0 . 3 7 9

N = 1 1 6

N o d e 3S O I < = - 0 . 9 0 0S T D = 1 4 5 . 9 4 9A v g = 1 7 7 . 1 1 9

N = 1 6 0

N o d e 2T A H IT I < = - 1 . 2 5 0S T D = 1 5 3 . 3 7 2A v g = 1 9 1 . 6 0 5

N = 1 7 7

T e r m in a lN o d e 4

S T D = 1 2 3 . 5 3 5A v g = 9 3 . 1 3 7

N = 5 1

N o d e 1D M I < = 0 . 6 3 5S T D = 1 5 2 . 8 3 5A v g = 1 6 9 . 5 7 9

N = 2 2 8

TerminalNode 1

STD = 90.751A vg = 370.000

N = 8

TerminalNode 2

STD = 107.116A vg = 75.379

N = 29

TerminalNode 3

STD = 129.345A vg = 161.961

N = 128

Node 4NINO_12 <= -1.035STD = 129.954A vg = 145.968

N = 157

TerminalNode 4

STD = 76.727A vg = 41.053

N = 19

Node 3DMI <= 1.455STD = 129.462A vg = 134.642

N = 176

TerminalNode 5

STD = 94.001A vg = 226.114

N = 44

Node 2SOI <= 1.150STD = 128.508A vg = 152.936

N = 220

Node 1SOI <= -3.550STD = 133.488A vg = 160.553

N = 228

Gambar 5 Tipologi pohon regresi optimum ZOM 1 dan ZOM 2.

Gambar 5 menunjukkan bahwa variabel pemilah utama pada pohon regresi optimalZOM 1 adalah DMI. Jadi, variabel DMI merupakan variabel yang mempunyai kontribusi utamadalam pembentukan pohon regresi optimal kemudian terdapat juga variabel lainnya yang

10

berpengaruh pada pembentukkan pohon regresi yaitu variabel tekanan permukaan laut di Tahitidan SOI Tahiti-Darwin, sedangkan pada ZOM 2 variabel pemilah utama pada pohon regresioptimal adalah SOI Tahiti-Darwin. Jadi, variabel SOI Tahiti-Darwin merupakan variabel yangmempunyai kontribusi utama dalam pembentukan pohon regresi optimal kemudian terdapatjuga variabel lainnya yang berpengaruh pada pembentukkan pohon regresi yaitu variabel DMIdan suhu permukaan laut Nino 1.2.

Tabel 3 Skor variabel terpenting ZOM 1Variabel SkorSOI 100.00 ||||||||||||||||||||||||||||||||||||||||||DMI 83.88 |||||||||||||||||||||||||||||||||||TAHITI 77.50 ||||||||||||||||||||||||||||||||NINO_34 50.23 |||||||||||||||||||||DARWIN 50.07 |||||||||||||||||||||NINO_3 39.65 ||||||||||||||||NINO_12 6.98 ||NINO_4 0.56

Tabel 4 Skor variabel terpenting ZOM 2Variabel SkorSOI 100.00 ||||||||||||||||||||||||||||||||||||||||||DARWIN 77.38 ||||||||||||||||||||||||||||||||NINO_4 35.28 ||||||||||||||TAHITI 34.47 ||||||||||||||NINO_12 29.44 ||||||||||||DMI 27.60 |||||||||||NINO_3 23.30 |||||||||NINO_34 19.06 |||||||

Jika dilihat pada skor variabel terpentingnya pada ZOM 1 berbeda dengan pohonregresi optimal yang terbentuk dimana pemilah utamanya adalah variabel DMI, sedangkan padaskor variabel terpenting variabel SOI Tahiti-Darwin yang memiliki skor tertinggi kemudiandilanjutkan oleh variabel DMI. Namum DMI masih termasuk dalam skor kedua tertinggi. Jikadilihat pada skor variabel terpentingnya pada ZOM 2 dalam pohon regresi optimal yangterbentuk juga memiliki nilai skor tertinggi.

Berdasarkan gambar 5 diketahui bahwa pada ZOM 1, rata-rata curah hujan bulanankarena pengaruh tekanan permukaan laut di Tahiti -1.250 dan pengaruh DMI 0.635 sebesar327.941 mm. Rata-rata curah hujan bulanan karena pengaruh SOI Tahiti-Darwin -0.900,pengaruh tekanan permukaan laut di Tahiti > -1.250 dan pengaruh DMI 0.635 sebesar115.795 mm. Rata-rata curah hujan bulanan karena pengaruh SOI Tahiti-Darwin > -0.900,pengaruh tekanan permukaan laut di Tahiti > -1.250 dan pangaruh DMI 0.635 sebesar200.379 mm. Rata-rata curah hujan bulanan karena pengaruh DMI > 0.635 sebesar 93.137 mm.Sedangkan pada ZOM 2, rata-rata curah hujan bulanan karena pengaruh tekanan SOI Tahiti-Darwin -3.550 sebesar 370 mm. Rata-rata curah hujan bulanan karena pengaruh suhupermukaan laut Nino 1.2 -1.035, pengaruh DMI 1.455, pengaruh SOI Tahiti-Darwin 1.150 dan pangaruh SOI Tahiti-Darwin > -3.550 sebesar 75.379 mm. Rata-rata curahhujan bulanan karena pengaruh suhu permukaan laut Nino 1.2 > -1.035, pengaruh DMI 1.455, pengaruh SOI Tahiti-Darwin 1.150 dan pangaruh SOI Tahiti-Darwin > -3.550 sebesar161.961 mm. Rata-rata curah hujan bulanan karena pengaruh DMI > 1.455, pengaruh SOITahiti-Darwin 1.150 dan pengaruh SOI Tahiti-Darwin > -3.550 sebesar 41.053 mm. Rata-ratacurah hujan bulanan karena pengaruh SOI Tahiti-Darwin > 1.150 dan pengaruh SOI Tahiti-Darwin > -3.550 sebesar 226.114 mm.

4.2.3 Validasi Model Pohon Regresi OptimalModel pohon regresi yang baik adalah model yang mampu memprediksi data amatan

baru. Untuk tujuan tersebut maka sebanyak 12 data testing dimasukkan ke dalam pohon regresioptimal yang terbentuk untuk melakukan validasi model, yaitu melihat kemampuan model

11

pohon regresi yang terbentuk dalam menduga atau memprediksi curah hujan bulanan untuk datatesting. Berikut ini merupakan grafik perbandingan antara prediksi curah hujan denganpengamatannya pada ZOM 1 dan ZOM 2 dari data testing.

Tabel 5 Perbandingan antara ZOM 1 dan ZOM 2ZOM Data testing

R2 prediksi RMSEPZOM 1 0.575 83,288ZOM 2 0.218 130.538

Tabel 5 merupakan perbandingan dari data testing antara ZOM 1 dan ZOM 2 dapatdilihat bahwa nilai R2 prediksinya ZOM 1 lebih besar dibandingkan nilai R2 prediksi padaZOM 2. Begitu pula jika dilihat dari nilai RMSEP nya ZOM 1 mempunyai nilai RMSEPterkecil. Berikut ini adalah tabel yang menunjukkan nilai aktual dengan hasil prediksi yangdiperoleh dari model pohon regresi :

Tabel 6 curah hujan aktual dan curah hujan prediksi menurut ZOMCurah Hujan

ZOM 1Prediksi Curah Hujan

ZOM 1Curah Hujan

ZOM 2Prediksi Curah Hujan

ZOM 2256 200.379303 227 226.1136322239 200.379303 215 226.1136322378 200.379303 361 226.1136322173 200.379303 179 161.960937584 93.13725281 48 161.96093752 93.13725281 1 161.96093750 93.13725281 0 161.960937525 93.13725281 17 226.11363220 93.13725281 9 226.1136322

161 93.13725281 144 226.1136322198 93.13725281 337 226.1136322181 200.379303 122 226.1136322

5. Kesimpulan dan SaranKesimpulan1. Model pohon regresi optimal yang diperoleh: Pada ZOM 1 menghasilkan pohon regresi optimal dengan 4 simpul terminal dan 3

simpul dalam, serta kedalaman sebesar 4 tingkatan. Variabel pemilah utamanyaadalah DMI. Pemilah lainnya adalah tekanan permukaan laut di Tahiti dan SOITahiti-Darwin.

Pada ZOM 2 menghasilkan pohon regresi optimal dengan 5 simpul terminal dan 3simpul dalam, serta kedalaman sebesar 5 tingkatan. Variabel pemilah utamanyaadalah SOI Tahiti-Darwin. Variabel pemilah lainnya yaitu variabel DMI dan suhupermukaan laut Nino 1.2.

2. Hasil validasi model dengan menggunakan data testing diperoleh kinerja yangmasih kurang baik khusunya pada ZOM 2. Hal ini ditunjukan nilai R2 prediksi yangdihasilkan sebesar 0.575 dan nilai RMSE prediksinya sebesar 83.288 pada ZOM 1.Sementara untuk ZOM 2 nilai R2 prediksi yang dihasilkan sebesar 0.218 dan nilaiRMSE prediksinya sebesar 130.538.

12

SaranDalam penelitian selanjutnya dapat ditambahkan variabel prediktor seperti

variabel prediktor yang berkaitan dengan pengaruh lokal curah hujan di KabupatenNgawi, diantaranya topograpi dan ketinggian (elevasi).

Daftar PustakaAuthor (a), (2009), El-Nino Southern Oscillation (ENSO). http://kadarsah wordpress.com

(tanggal akses : 6 Februari 2009)Author (b), (2009), El-Nino Southern Oscillation (ENSO). http://www.bmg.go.id

(tanggal akses : 6 Februari 2009)Author (c), (2009), El-Nino Southern Oscillation (ENSO). http://www.e-dukasi.net

(tanggal akses : 6 Februari 2009)Author (d), (2009), Indikator indeks El-Nino Southern Oscillation (ENSO)

http://esminfo.prenhall.com/science/geoanimations/animations/26_NinoNina.html(tanggal akses : 6 Februari 2009)

Author (e), (2009), Indikator indeks El-Nino Southern Oscillation (ENSO).http://en.wikipedia.org/wiki/El_Ni%C3%B1o (tanggal akses : 6 Februari 2009)

Breiman L., Friedman J.H., Olshen R.A., & Stone C.J. (1993). Classification And RegressionTress. New York, NY: Chapman And Hall.

Estikaningrum, L. F. (2003). Penerapan metode klasifikasi berstruktur pohon biner padaprakiraan sifat curah hujan berdasarkan indikator indeks ENSO (El-Nino SouthernOscillation) (Tugas akhir tidak dipublikasikan). Institut Teknologi Sepuluh Nopember,Surabaya.

Firth, L., Hazelton. M. L., & Campbell, E. P. (2005). Predicting the Onset of Australian WinterRainfall by Nonlinear Classification. Journal of Climate (18), 772-781.

Komalasari, Wieta B. (2007). Metode Pohon Regresi Untuk ekploratori Data Dengan PeubahYang Banyak Dan Kompleks. Jurnal Informatika Pertanian, 16, 967-980.

Lewis, Roger J. (2000). An Introduction to Classification and Regression Tree (CART)Analysis. Presented at the 2000 Anual Meeting Of Society For Academy EmergencyMedice in San Francisco, California. http://www.saem.org/download/lewis1.pdf

Mayasari, S. D. (2003). Pemodelan curah hujan bulanan dengan metode regresi berstrukturpohon berdasarkan indikator indeks ENSO (El-Nino Southern Oscillation) (Tugas akhirtidak dipublikasikan). Institut Teknologi Sepuluh Nopember, Surabaya.

Usayana, I. G. N. B. (2006). Analisis variabel-variabel yang mempengaruhi besar emisi gasbuang kendaraan berbahan bakar bensin berdasarkan indikator karbon monoksida (CO)dengan metode regresi pohon (Tugas akhir tidak dipublikasikan). Institut TeknologiSepuluh Nopember, Surabaya.