data warehouse dan olap berbasis web untuk persebaran ... · 3 skema galaksi (han & kamber 2006...

32
DATA WAREHOUSE DAN OLAP BERBASIS WEB UNTUK PERSEBARAN HOTSPOT DI WILAYAH INDONESIA MENGGUNAKAN PALO 2.0 GANANDA HAYARDISI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR 2008

Upload: ngotu

Post on 10-Mar-2019

221 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Data Warehouse dan OLAP Berbasis Web untuk Persebaran ... · 3 Skema galaksi (Han & Kamber 2006 ... 11 Presentasi jumlah hotspot di setiap pulau dilihat dari dimensi waktu dalam bentuk

DATA WAREHOUSE DAN OLAP BERBASIS WEB UNTUK PERSEBARAN HOTSPOT DI WILAYAH INDONESIA MENGGUNAKAN PALO 2.0

GANANDA HAYARDISI

DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

INSTITUT PERTANIAN BOGOR 2008

Page 2: Data Warehouse dan OLAP Berbasis Web untuk Persebaran ... · 3 Skema galaksi (Han & Kamber 2006 ... 11 Presentasi jumlah hotspot di setiap pulau dilihat dari dimensi waktu dalam bentuk

DATA WAREHOUSE DAN OLAP BERBASIS WEB UNTUK PERSEBARAN HOTSPOT DI WILAYAH INDONESIA MENGGUNAKAN PALO 2.0

Skripsi

Sebagai salah satu syarat untuk memperoleh gelar Sarjana Komputer

pada Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Pertanian Bogor

Oleh :

GANANDA HAYARDISI G64104053

DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

INSTITUT PERTANIAN BOGOR 2008

Page 3: Data Warehouse dan OLAP Berbasis Web untuk Persebaran ... · 3 Skema galaksi (Han & Kamber 2006 ... 11 Presentasi jumlah hotspot di setiap pulau dilihat dari dimensi waktu dalam bentuk

3

3

ABSTRAK

GANANDA HAYARDISI. Pengembangan Data Warehouse dan OLAP Berbasis Web untuk Persebaran Hotspot di Wilayah Indonesia Menggunakan Palo 2.0 . Dibimbing oleh IMAS S. SITANGGANG dan LAILAN SYAUFINA.

Pada tahun 1997 kebakaran hutan terjadi di sebagian besar wilayah Indonesia seperti Sumatera dan Kalimantan. Hal tersebut menyebabkan beberapa akibat yang buruk yaitu polusi udara, kehilangan nyawa, dan kerugian ekonomi. Salah satu cara pengendalian kebakaran hutan yaitu dengan pencitraan jarak jauh menggunakan satelit NOAA. Hasil pencitraan tersebut menghasilkan lokasi berupa koordinat wilayah. Saat ini, data persebaran hotspot hanya disimpan dan belum banyak diolah untuk menghasilkan informasi yang berguna dalam pengendalian kebakaran hutan. Oleh karena itu, penelitian perlu dilakukan untuk mengeksplorasi data tersebut dan menyajikan hasilnya dalam bentuk yang menarik. Data warehouse yang dintegrasikan dengan aplikasi OLAP merupakan salah satu solusi yang tepat untuk masalah penumpukan data sehingga informasi yang dihasilkan dapat digunakan untuk pengambilan keputusan dalam pengendalian kebakaran hutan.

Pada penelitian ini menggunakan data hotspot yang didapatkan dari Kementrian Lingkungan Hidup (KLH). Pengembangan data warehouse mengadopsi arsitektur three-tier data warehouse yang memiliki 3 lapisan yaitu lapisan bawah (basis data), lapisan tengah (OLAP Server), dan lapisan atas (web browser). Aplikasi OLAP dibuat berbasis web dengan menggunakan bahasa pemograman PHP dan Palo sebagai OLAP Server. Aplikasi ini menerapkan operasi-operasi OLAP seperti roll up, drill down, slice, dice dan pivot. Operasi tersebut dapat membantu dalam proses analisis dan eksplorasi data.

Hasil penelitian ini yaitu data warehouse untuk persebaran data hotspot yang memiliki satu kubus data yaitu kubus data hotspot. Kubus data ini berisi nilai agregasi jumlah hotspot setiap wilayah Indonesia mulai dari tingkat pulau sampai tingkat kabupaten pada tahun 2000 sampai 2004. Informasi tentang persebaran hotspot ditampilkan dalam bentuk crosstab dan grafik yang menarik. Grafik ditampilkan dalam bentuk bar dan pie plot. Salah satu informasi yang dapat diambil yaitu pulau Sumatera mempunyai jumlah hotspot terbanyak dalam periode tahun 2000 sampai 2004 yaitu 76.530 titik, kemudian disusul pulau Kalimantan di urutan kedua yaitu 49.011 titik sedangkan pulau Jawa sebagai wilayah dengan jumlah hotspot paling sedikit yaitu 8 titik. Dilihat dari dimensi waktu, wilayah Indonesia memiliki jumlah hotspot terbanyak pada tahun 2000, yaitu di pulau Sumatera sebanyak 53.403 titik.

Kata kunci : hotspot, data warehouse, OLAP, arsitektur three-tier, crosstab, grafik.

Page 4: Data Warehouse dan OLAP Berbasis Web untuk Persebaran ... · 3 Skema galaksi (Han & Kamber 2006 ... 11 Presentasi jumlah hotspot di setiap pulau dilihat dari dimensi waktu dalam bentuk

Judul : Data Warehouse dan OLAP Berbasis Web untuk Persebaran Hotspot di Wilayah Indonesia Menggunakan Palo 2.0

Nama : Gananda Hayardisi NIM : G64104053

Menyetujui:

Pembimbing I,

Imas S. Sitanggang, S.Si, M.Kom NIP 132206235

Pembimbing II,

Dr. Ir. Lailan Syaufina, M.Sc NIP 131849392

Mengetahui:

Dekan Fakultas Matematika Dan Ilmu Pengetahuan Alam Institut Pertanian Bogor

Dr. Drh. Hasim, DEA NIP 131578806

Tanggal Lulus:

Page 5: Data Warehouse dan OLAP Berbasis Web untuk Persebaran ... · 3 Skema galaksi (Han & Kamber 2006 ... 11 Presentasi jumlah hotspot di setiap pulau dilihat dari dimensi waktu dalam bentuk

RIWAYAT HIDUP

Penulis dilahirkan pada tanggal 10 Agustus 1986 di Jakarta sebagai anak ketiga dari 4 bersaudara dari pasangan Aji Hamim Wigena dan Evi Hartati. Pada tahun 2001, penulis menempuh pendidikan menengah atas di SMU Negeri 68 Jakarta Pusat masuk program IPA dan lulus tahun 2004.

Pada tahun yang sama penulis diterima sebagai mahasiswa Departemen Ilmu Komputer (Ilkom), Fakultas Matematika dan Ilmu Penggetahuan Alam (FMIPA), Institut Pertanian Bogor (IPB) melalui jalur PMDK. Pada tahun 2007, penulis melaksanakan kegiatan praktik kerja lapangan di PT Indosat Divisi Interconnect Billing selama dua bulan. Penulis juga pernah menjadi anggota tim tenaga IT (information technology) PHK TIK Departemen Agronomi dan Hortikultura (AGH) IPB dalam rangka pengembangan course content mata kuliah Tanaman Hias dan bunga.

Page 6: Data Warehouse dan OLAP Berbasis Web untuk Persebaran ... · 3 Skema galaksi (Han & Kamber 2006 ... 11 Presentasi jumlah hotspot di setiap pulau dilihat dari dimensi waktu dalam bentuk

PRAKATA

Alhamdulillahi Rabbil ‘alamin, puji dan syukur penulis panjatkan kepada Allah SWT atas limpahan rahmat dan hidayah-Nya sehingga tugas akhir dengan judul Data Warehouse dan OLAP Berbasis Web untuk Persebaran Hotspot di Wilayah Indonesia Menggunakan Palo 2.0 dapat diselesaikan. Shalawat serta salam juga penulis ucapkan kepada junjungan kita Nabi Muhammad SAW beserta seluruh sahabat dan umatnya hingga akhir zaman.

Dalam menyelesaikan tugas akhir ini penulis mendapatkan banyak sekali bantuan, bimbingan dan dorongan dari berbagai pihak. Oleh karena itu, penulis ingin mengucapkan terima kasih kepada semua pihak yang telah membantu dalam penyelesaian tugas akhir ini, antara lain:

1 Kedua orangtua tersayang, papa Dr. Ir. Aji Hamim Wigena, M.Sc dan mama Evi Hartati atas segala do’a, kasih sayang, dan dukungannya.

2 Kakak Nui, Nea, Sumar, Nani, Tante Farida, Risa, Chaca, Ocin tersayang yang selalu memberikan semangat dan motivasi dalam penyelesaian tugas akhir ini.

3 Ibu Imas S. Sitanggang, S.Si, M.Kom selaku pembimbing pertama atas bimbingan dan arahannya selama pengerjaan tugas akhir ini.

4 Ibu Dr. Ir. Lailan Syaufina, M.Sc selaku pembimbing kedua atas bimbingan dan arahannya selama pengerjaan tugas akhir ini.

5 Bapak Hari Agung, S.Kom, M.Si selaku moderator dan penguji tugas akhir ini. 6 Anizza Restra Pusparianti yang telah memberi dukungan, semangat, bantuan dan do’a saat penulis

merasa jenuh dan kesulitan dalam penyelesaian tugas akhir terutamaw saat penulisan laporan. 7 Anak- anak am-pm yaitu Denny, Lewe, Erwin, Inez, Toink, Popi, Icha (tahu), teman-teman jalan

waktu tingkat 3 sampai sekarang. 8 Anak-anak pondok Irafan terutama Andre, Henri, Imam (PGT), Kikis, David, Bayu Brank, teman

seperjuangan main game “ Warcraft dot-a”. 9 Tri, Henri, Rafi, Welly, Hasan, Rafi, Heni, Yaghi, Riza selama konsultasi bersama. 10 Abi angkatan 38 atas bantuan khususnya masalah teknis. 11 Seluruh teman-teman Program Studi Ilmu Komputer angkatan 41 yang tidak dapat disebutkan

namanya satu-persatu.

Penulis juga mengucapkan terima kasih kepada semua pihak yang telah membantu selama pengerjaan penyelesaian tugas akhir ini yang tidak dapat disebutkan satu-persatu. Semoga penelitian ini dapat memberikan manfaat.

Bogor, Mei 2008

Gananda Hayardisi

Page 7: Data Warehouse dan OLAP Berbasis Web untuk Persebaran ... · 3 Skema galaksi (Han & Kamber 2006 ... 11 Presentasi jumlah hotspot di setiap pulau dilihat dari dimensi waktu dalam bentuk

v

DAFTAR ISI Halaman

DAFTAR TABEL ............................................................................................................................... vi�

DAFTAR GAMBAR .......................................................................................................................... vi�

DAFTAR LAMPIRAN ....................................................................................................................... vi�

PENDAHULUAN�Latar Belakang ................................................................................................................................ 1�Tujuan ............................................................................................................................................. 1�Ruang Lingkup ............................................................................................................................... 1�

TINJAUAN PUSTAKA�Data Warehouse ............................................................................................................................. 1�Model Data Multidimensi .............................................................................................................. 2�OLAP (On-line Analytical Processing) ......................................................................................... 3�Arsitektur Three-Tier Data Warehouse ......................................................................................... 3�Hotspot (titik panas) ....................................................................................................................... 4�

METODE PENELITIAN�Analisis ........................................................................................................................................... 4�Praproses Data ................................................................................................................................ 4�Pembuatan Data Warehouse .......................................................................................................... 4�Pembuatan Aplikasi OLAP ............................................................................................................ 5�Lingkungan Pengembangan ........................................................................................................... 5�

HASIL DAN PEMBAHASAN�Analisis Data................................................................................................................................... 6�Praproses data ................................................................................................................................. 6�Pembersihan Data ........................................................................................................................... 7�Struktur Kubus Data ....................................................................................................................... 7�Pemuatan Data ................................................................................................................................ 8�Deskripsi Umum Aplikasi OLAP .................................................................................................. 8�Kelebihan dan Kekurangan Aplikasi OLAP .................................................................................. 9�Analisis Visual dari Crosstab dan Grafik .................................................................................... 10�

KESIMPULAN DAN SARAN�Kesimpulan ................................................................................................................................... 13�Saran ............................................................................................................................................. 13�

DAFTAR PUSTAKA ........................................................................................................................ 13�

Page 8: Data Warehouse dan OLAP Berbasis Web untuk Persebaran ... · 3 Skema galaksi (Han & Kamber 2006 ... 11 Presentasi jumlah hotspot di setiap pulau dilihat dari dimensi waktu dalam bentuk

vi

DAFTAR TABEL

Halaman

1 Struktur tabel titikPanas .................................................................................................................... 6�2 Struktur tabel hotspotNew ................................................................................................................ 7�3 Struktur tabel HotspotBulan ............................................................................................................. 7�4 Deskripsi Kubus Data Hotspot .......................................................................................................... 8�

DAFTAR GAMBAR

Halaman

1 Skema bintang (Han & Kamber 2006). ........................................................................................... 2�2 Skema snowflake (Han & Kamber 2006). ....................................................................................... 3�3 Skema galaksi (Han & Kamber 2006). ............................................................................................. 3�4 Arsitektur three-tier (Han & Kamber 2006). .................................................................................... 4�5 Skema bintang data warehouse persebaran data hotspot. ................................................................ 6�6 Diagram alur tahapan praproses data. ............................................................................................... 8�7 Tampilan utama aplikasi OLAP dan visualisasi crosstab. ............................................................... 9�8 Visualisasi grafik hasil operasi drill down terhadap dimensi waktu dan lokasi. ........................... 10�9 Crosstab hasil operasi dice untuk melihat perkembangan jumlah hotspot tiap pulau di Indonesia

dari tahun 2000 sampai 2004. ......................................................................................................... 11�10 Grafik Batang trend persebaran hotspot tiap pulau dilihat dari dimensi waktu. ......................... 11�11 Presentasi jumlah hotspot di setiap pulau dilihat dari dimensi waktu dalam bentuk pie plot. .... 12�

DAFTAR LAMPIRAN

Halaman

1 Contoh Perubahan Nama Rincian Pembersihan Data Hotspot ...................................................... 16�2 Hasil visualisasi crosstab dan grafik lainnya ................................................................................. 18�3 Tampilan operasi OLAP pada contoh 1 .......................................................................................... 20�4 Tampilan operasi OLAP pada contoh 2 .......................................................................................... 23�

Page 9: Data Warehouse dan OLAP Berbasis Web untuk Persebaran ... · 3 Skema galaksi (Han & Kamber 2006 ... 11 Presentasi jumlah hotspot di setiap pulau dilihat dari dimensi waktu dalam bentuk

1

PENDAHULUAN

Latar Belakang

Basis data merupakan salah satu teknologi penyimpanan data yang berkembang saat ini. Basis data dapat menyimpan dan mengelola data dalam jumlah yang besar. Data yang telah disimpan dan dimanipulasi dapat disajikan kembali sebagai informasi yang bermanfaat bagi pengguna. Jumlah data yang disimpan dalam basis data bertambah dari waktu ke waktu dan terakumulasi sehingga terjadi penumpukan data. Saat ini masalah penumpukan data tidak menjadi suatu kendala dalam sisi perangkat keras karena telah tersedia media penyimpanan yang berkapasitas Terabyte. Namun permasalahan penumpukan data terdapat dalam penyajian informasi yang akurat, cepat, dan menarik sehingga dapat bermanfaat bagi pengguna.

Teknologi data warehouse dan On-line Analytical Processing (OLAP) merupakan salah satu solusi dari permasalahan penumpukan data. Teknologi tersebut dapat mengorganisasikan data dan menampilkan informasi yang terdapat di dalam data sehingga dapat digunakan dalam pengambilan keputusan. Hal tersebut berguna bagi suatu lembaga, perusahaan atau organisasi untuk pengambilan keputusan berdasarkan data historis yang ada.

Tahun 1997 kebakaran hutan terjadi di sebagian besar area di Indonesia seperti Kalimantan dan Sumatera. Hal tersebut menyebabkan beberapa akibat yang buruk yaitu polusi udara, mengganggu kesehatan masyarakat, kehilangan nyawa, kerusakan harta benda (Stolle 2000). Apabila hal tersebut tidak mendapat tindakan pencegahan ataupun penanggulangan yang baik akan berdampak pada ekosistem yang ada. Hutan memiliki fungsi yang banyak dan berguna bagi ekosistem. Fungsi hutan antara lain habitat hewan- hewan, resapan air, sumber oksigen dan lainnya.

Salah satu pencegahan untuk menanggulangi masalah kebakaran hutan yaitu dengan pencitraan jarak jauh menggunakan satelit untuk mengetahui persebaran hotspot (titik panas). Apabila lokasi hotspot telah diketahui maka dapat diambil langkah dini untuk menanggulangi kebakaran hutan. Saat ini kebanyakan data tentang persebaran hotspot hanya disimpan dan tidak diolah. Hal tersebut menyebabkan tumpukan data yang sedikit memiliki informasi.

Untuk menyelesaikan masalah penumpukan data tentang persebaran hotspot maka dibangun suatu data warehouse beserta aplikasi OLAP berbasis web yang dapat menampilkan informasi secara cepat dan akurat. Informasi yang dihasilkan dapat digunakan untuk pengambilan keputusan dalam pengendalian kebakaran hutan.

Tujuan

Tujuan dari penelitian ini adalah :

1 Membangun data warehouse untuk data persebaran hotspot.

2 Membangun aplikasi OLAP dan memvisualisasikan hasil operasi-operasi OLAP atau ringkasan dalam bentuk crosstab dan grafik.

Ruang Lingkup

Ruang lingkup penelitian dibatasi pada pembuatan data warehouse, pembangunan aplikasi OLAP, dan menampilkan ringkasan. Data yang digunakan adalah persebaran hotspot untuk wilayah Indonesia sampai dengan tingkat kabupaten dari tahun 2000 sampai 2004.

Manfaat

Penelitian ini diharapkan dapat bermanfaat bagi pengguna, dalam hal ini pihak-pihak yang membutuhkan informasi tentang persebaran hotspot (titik panas) yang cepat, menarik dan akurat. Informasi yang didapatkan dapat membantu dalam proses pengambilan keputusan untuk pengendalian kebakaran hutan.

TINJAUAN PUSTAKA

Data Warehouse

Data warehouse menyediakan arsitektur dan alat bagi para eksekutif bisnis untuk mengatur secara sistematis, mengerti dan menggunakan data tersebut untuk pengambilan keputusan (Han & Kamber 2006).

Data warehouse adalah sekumpulan data yang berorientasi subjek, terintegrasi, time-variant dan nonvolatile yang mendukung dalam manajemen pengambilan keputusan. Karakteristik data warehouse yaitu berorientasi objek, terintegrasi, time-variant dan nonvolatile merupakan hal yang membedakan data warehouse dari sistem penyimpanan data lainnya seperti sistem basis data relasional, sistem proses transaksi, dan sistem berkas. Penjelasan secara rinci dari pengertian data warehouse (Han & Kamber 2006) :

Page 10: Data Warehouse dan OLAP Berbasis Web untuk Persebaran ... · 3 Skema galaksi (Han & Kamber 2006 ... 11 Presentasi jumlah hotspot di setiap pulau dilihat dari dimensi waktu dalam bentuk

2

• Berorientasi subjek

Data warehouse disusun berdasarkan subjek utama, seperti pelanggan, supplier, produk, dan penjualan. Data warehouse menyediakan tampilan yang sederhana dan ringkas dengan menghilangkan data yang tidak berguna dalam pengambilan keputusan.

• Terintegrasi

Data warehouse biasanya dibangun dengan mengintegrasikan berbagai sumber yang berbeda seperti basis data relasional, flat files, dan catatan transaksi on-line. Teknik pembersihan dan integrasi data dilakukan untuk memastikan kekonsistenan data dalam konvesi penamaan, struktur penyandian, pengukuran atribut dan lainnya.

• Time- variant

Data disimpan untuk menyediakan informasi berdasarkan perspektif waktu.

• Non-volatile

Data warehouse secara fisik selalu terpisah dari basis data operasional. Data warehouse tidak membutuhkan proses transaksi, recover, dan concurrency control.

Model Data Multidimensi

Data warehouse dan alat bantu OLAP berdasarkan pada model data multidimensi. Model ini menampilkan data dalam bentuk kubus data. Kubus data dapat memodelkan dan menampilkan data dalam multidimensi. Model data multidimensi dibagi menjadi dua yaitu dimensi dan fakta (Han & Kamber 2006).

Dimensi adalah perspektif atau entitas penting yang dimiliki organisasi untuk menyimpan records. Setiap dimensi memiliki tabel yang biasa disebut dengan tabel dimensi. Tabel dimensi dapat dispesifikasikan oleh pengguna atau para ahli, atau dihasilkan secara otomatis dan diatur berdasarkan distribusi data (Han & Kamber 2006).

Fakta adalah ukuran-ukuran numerik. Fakta merupakan kuantitas yang akan dianalisis hubungan antar dimensi. Tabel fakta berisi nama dari fakta (ukuran) dan juga keys untuk setiap tabel dimensi yang berhubungan.

Dalam data warehouse kubus data adalah n-dimensi. Kubus data disebut juga cuboid. Cuboid yang tingkat kesimpulannya paling

rendah disebut base cuboid sedangkan cuboid dengan tingkat paling tinggi disebut apex cuboid.

Data warehouse membutuhkan skema yang ringkas dan berorientasi subjek untuk memfasilitasi analisis data secara on-line. Model data yang paling populer untuk data warehouse adalah model multidimensi. Tipe-tipe skema model multidimensi sebagai berikut:

1 Star schema (skema bintang)

Star schema merupakan skema data warehouse yang paling sederhana. Star schema terdiri dari satu tabel fakta yang dihubungkan dengan beberapa tabel dimensi yang polanya menyerupai bintang. Dengan demikian skema ini disebut skema bintang. Keuntungan star schema yaitu pada proses query dan waktu respon yang cepat. Skema bintang dapat dilihat pada Gambar 1.

Gambar 1 Skema bintang (Han & Kamber 2006).

2 Snowflake schema

Snowflake schema merupakan variasi dari star schema dimana beberapa tabel dimensinya dinormalisasi sehingga menghasilkan beberapa tabel tambahan. Perbedaan utama antara snowflake dan star schema adalah tabel dimensi pada snowflake dapat dijaga tetap dalam bentuk normal sehingga mengurangi redundancy. Skema snowflake dapat dilihat pada Gambar 2.

Page 11: Data Warehouse dan OLAP Berbasis Web untuk Persebaran ... · 3 Skema galaksi (Han & Kamber 2006 ... 11 Presentasi jumlah hotspot di setiap pulau dilihat dari dimensi waktu dalam bentuk

3

Gambar 2 Skema snowflake (Han & Kamber 2006).

3 Fact constellation scheme

Beberapa aplikasi mungkin membutuhkan membutuhkan tabel fakta yang banyak untuk berbagi dengan tabel dimensi. Skema ini dapat dilihat sebagai sekumpulan star schema atau biasa disebut galaxy schema. Skema galaksi dapat dilihat pada Gambar 3.

Gambar 3 Skema galaksi (Han & Kamber 2006).

OLAP (On-line Analytical Processing)

Teknologi OLAP melengkapi teknologi basis data dalam menyediakan sebuah penampilan multidimensi dari data dan alat yang cocok untuk menganalisisnya. Secara umum, OLAP berguna bagi pengguna untuk antara lain (Cabbibo & Torlone 1997) :

1 Mendefinisikan analisis persamaan melalui dimensi-dimensi data berserta perhitungan yang kompleks.

2 Menyimpulkan dataset, agregasi dan disagregasi dari beberapa dimensi.

3 Mengevaluasi dan menampilkan hasil dari analisis.

Operasi-operasi OLAP adalah sebagai berikut (Han & Kamber 2006) :

1 Roll-up

Operasi roll-up dilakukan pada kubus pusat dengan cara menaikkan tingkat suatu hierarki. Pada saat roll-up dilakukan jumlah dimensi berkurang. Misalkan operasi roll-up dilakukan pada kubus data pada tingkat kota menjadi tingkat propinsi atau negara.

2 Drill-down

Drill-down merupakan kebalikan dari operasi roll-up. Operasi ini merepresentasikan kubus data lebih detil.

3 Slice dan dice

Operasi slice melakukan pemilihan satu dimensi dari kubus sehingga dihasilkan subcube. Operasi dice mendefinisikan subcube dari pemilihan dua dimensi atau lebih.

4 Pivot (rotate)

Pivot merupakan operasi dalam visualiasisasi yang memutar koordinat data untuk menghasilkan presentasi data dalam bentuk lain.

Arsitektur Three-Tier Data Warehouse

Arsitektur data warehouse yang umum digunakan yaitu arsitektur three-tier. Arsitektur ini disebut three-tier karena terdiri atas tiga lapisan. Representasi arsitektur three-tier dapat dilihat pada Gambar 4. Lapisan-lapisan arsitektur three-tier adalah sebagai berikut (Han & Kamber 2006) :

1 Lapisan bawah (bottom tier)

Lapisan bawah merupakan tempat pengolahan sumber data warehouse yang bertujuan agar data tersebut dapat digunakan dengan baik. Pengolahan tersebut biasanya menggunakan sistem basis data relasional.

2 Lapisan tengah (middle tier)

Lapisan tengah merupakan OLAP Server yang berfungsi menyimpan struktur dari kubus data.

3 Lapisan atas (top tier)

Lapisan atas adalah lapisan untuk end-user yang berisi query dan menampilkan informasi atau ringkasan.

Page 12: Data Warehouse dan OLAP Berbasis Web untuk Persebaran ... · 3 Skema galaksi (Han & Kamber 2006 ... 11 Presentasi jumlah hotspot di setiap pulau dilihat dari dimensi waktu dalam bentuk

4

Gambar 4 Arsitektur three-tier (Han & Kamber 2006).

Hotspot (titik panas)

Pemantauan hotspot (titik panas) dilakukan dengan cara penginderaan jauh (remote sensing) menggunakan satelit. Data hotspot merupakan salah satu indikator tentang kemungkinan terjadinya kebakaran hutan sehingga dapat dilakukan analisis, pemantauan, dan terkadang harus melakukan pemeriksaan langsung ke lapangan untuk mengetahui apakah diperlukan langkah pencegahan kebakaran (Adinugroho et al dalam Sukmawati 2006).

Satelit yang biasa digunakan adalah satelit NOAA (National Oceanic and Atmospheric Administration) melalui sensor AVHRR (Advanced Very High Resolution Radiometer) karena sensor tersebut dapat membedakan suhu permukaan di darat dan laut. Satelit NOAA-AVHRR memiliki cakupan yang luas dan mengunjungi tempat yang sama sebanyak 4 kali dalam satu hari sehingga data yang didapatkan cukup aktual dan waktu analisis yang cepat meskipun wilayahnya luas (Adinugroho et al dalam Sukmawati 2006).

Sistem monitoring dengan menggunakan satelit NOAA berfungsi untuk mendeteksi terjadinya kebakaran hutan dan lahan sehingga kebakaran tidak meluas dan mengakibatkan kerusakan dan kerugian ekonomi. Metode remote sensing memberikan solusi yang efisien dalam kegiatan deteksi dan pencegahan kebakaran hutan dan lahan pada area yang sangat luas.

Satelit NOAA akan mendeteksi suatu obyek di permukaan bumi yang memiliki suhu relatif

lebih tinggi dibandingkan sekitarnya. Suhu yang dideteksi berkisar antara 210 K (37 oC ) untuk malam hari dan 315 K (42 oC) untuk siang hari. Hotspot akan direpresentasikan dalam suatu pixel pada sebuah peta yang juga menunjukkan koordinat geografisnya (Dephut dalam Sukmawati 2006).

Data hotspot hanya memberikan sedikit informasi apabila tidak didukung oleh analisis dan interpretasi yang baik. Data tersebut akan lebih bermanfaat apabila dikombinasikan dengan informasi mengenai penggunaan lahan, penutupan tanaman, habitat binatang, atau peta-peta.

METODE PENELITIAN

Analisis

Data persebaran hotspot yang telah didapatkan dikumpulkan dan dianalisis untuk mendapatkan atribut-atribut yang tepat dalam pembuatan data warehouse. Hasil analisis tersebut digunakan untuk menentukan dimensi, fakta dan skema untuk model data dimensi. Apabila ketiga hal tersebut telah ditentukan maka data warehouse dapat dibangun sesuai dengan hasil analisis.

Sumber data hotspot diperoleh dari Kementrian Lingkungan Hidup (KLH) Bagian Penanganan Kebakaran Hutan dengan format Excel (.xls). Data hotspot tersebut berasal dari pencatatan satelit NOAA. Pada awalnya data hanya berbentuk file teks (.txt) yang berisi titik koordinat dan tanggal. Data teks tersebut diolah menjadi bentuk file Excel dengan cara meng-input-kan titik koordinat ke dalam peta administrasi KLH sehingga didapatkan nama pulau, propinsi, kebupaten dan kecamatan.

Praproses Data

Terhadap data yang telah dikumpulkan dan dianalisis dilakukan tahapan praproses agar ketepatan dan ke-valid-an data terjaga. Langkah-langkah praproses data yang dilakukan yaitu penggabungan dan reduksi data, pembersihan data dan transformasi data.

Pembuatan Data Warehouse

Tahapan selanjutnya adalah pembuatan data warehouse. Metode yang digunakan dalam penelitian ini mengacu pada arsitektur three tier data warehouse. Arsitektur three tier memiliki tiga lapisan yang meliputi :

Page 13: Data Warehouse dan OLAP Berbasis Web untuk Persebaran ... · 3 Skema galaksi (Han & Kamber 2006 ... 11 Presentasi jumlah hotspot di setiap pulau dilihat dari dimensi waktu dalam bentuk

5

1 Lapisan bawah (bottom tier)

Lapisan bawah merupakan suatu sistem basis data relasional (DBMS SQL Server 2003) yang berfungsi sebagai tempat penyimpanan dan pengolahan data. Pada lapisan ini dilakukan praproses data agar data yang digunakan valid.

2 Lapisan tengah (middle tier)

Lapisan tengah merupakan tempat penyimpanan struktur kubus data yang biasa disebut sebagai OLAP Server. Dalam penelitian ini menggunakan Palo 2.0 sebagai OLAP Server. Struktur kubus data dibuat pada lapisan ini. Pembuatan struktur kubus data dapat dilakukan dengan dua cara yaitu merancang langsung dari aplikasi OLAP Server Palo atau membuat script PHP. Script tersebut berfungsi untuk memetakan tabel-tabel dimensi ke struktur kubus data yang terdapat di Palo OLAP Server.

3 Lapisan atas (top tier)

Lapisan atas merupakan lapisan untuk end user yang berfungsi menampilkan ringkasan dari isi data warehouse yang merupakan hasil operasi OLAP. Ringkasan ditampilkan dalam bentuk crosstab dan beberapa bentuk grafik. Visualisasi ringkasan tersebut dibuat dengan menggunakan bahasa pemograman PHP. Web browser merupakan alat bantu yang digunakan untuk melihat ringkasan dari data warehouse.

Pembuatan Aplikasi OLAP

Pembuatan aplikasi OLAP berbasis web diimplementasikan menggunakan bahasa pemograman PHP, Palo PHP API, dan javascript. Koneksi PHP ke OLAP Server Palo menggunakan library tambahan yang terdapat di dalam package SDK Palo 2.0 (versi 20080118_1000). Penambahan library dilakukan agar fungsi-fungsi Palo dapat dijalankan melalui script PHP. Tampilan antarmuka menggunakan kode HTML (Hypertext Markup Language) dan CSS (Cascading Style Sheet).

Pembuatan aplikasi OLAP terdiri dari dua rancangan yaitu rancangan antarmuka dan fungsi aplikasi. Rancangan antarmuka yaitu tampilan screen dari aplikasi. Fungsi aplikasi dirancang untuk operasi-operasi OLAP dan visualisasi hasil operasi OLAP yang ditampilkan dalam bentuk crosstab dan grafik. Grafik-grafik yang ditampilkan berupa bar dan pie plot.

Modul-modul utama dalam pembuatan aplikasi OLAP :

• Config.php : merupakan modul yang berguna untuk mengatur rute halaman web.

• Olap.func.inc.php : modul ini merupakan pecahan dari modul program palo_demo.php yang terdapat di dalam Palo SDK (Software Development Kit) 1.0c. Palo_demo.php dipecah menjadi tiga modul yaitu Olap.func.inc.php, fetchData.inc.php, dan olapCrosstab.php. Palo_demo.php merupakan contoh modul program untuk membentuk struktur crosstab dan operasi- operasi OLAP seperti roll up, drill down, dan pivot. Olap.func.inc.php berisi kumpulan fungsi-fungsi yang diperlukan dalam aplikasi.

• fetchData.inc.php : berguna untuk fetching data dan proses pembuatan struktur crosstab.

• olapCrosstab.php : menampilkan aplikasi yang dibuat dalam sintaks HTML.

• folder graph : berisi dua modul program yaitu graphBar.php dan graphPie.php. Modul tersebut berguna untuk menggambarkan grafik hasil operasi OLAP. Modul tersebut menggunakan library jpGraph untuk menghasilkan grafik.

Lingkungan Pengembangan

Aplikasi OLAP dibangun dengan menggunakan perangkat keras dan lunak dengan spesifikasi sebagai berikut :

Perangkat keras : • Processor Intel Centrino Duo 1.8 Ghz • RAM 1.5 GB DDR 2 • HDD 120 GB • Monitor 14.1 dengan resolusi 1280 × 800 • Mouse dan keyboard

Perangkat lunak : • Sistem operasi Windows XP SP 2 • Microsof SQL Server 2000 • Palo Server Win32 2.0 • Palo Excel Add-in 2.0 merupakan basis data

cell-based yang multidimensi, hierarki dan memory based. Palo berfungsi untuk pembuatan atau pemodelan struktur kubus data dan proses pemuatan data dari data warehouse ke kubus data.

• Web Server package WAMPP versi 2.0 • Bahasa pemograman PHP 5 • JpGraph 1.20 untuk membangkitkan grafik-

grafik hasil operasi OLAP

Page 14: Data Warehouse dan OLAP Berbasis Web untuk Persebaran ... · 3 Skema galaksi (Han & Kamber 2006 ... 11 Presentasi jumlah hotspot di setiap pulau dilihat dari dimensi waktu dalam bentuk

6

• Web browser Mozilla Firefox 2.0 dan Internet Explorer 7

HASIL DAN PEMBAHASAN

Analisis Data

Data hotspot yang digunakan adalah data dari tahun 2000 sampai dengan tahun 2004. Hal ini disebabkan data hotspot sebelum tahun 2000 mempunyai perbedaan dalam batas-batas wilayah. Data sumber (.xls) berisi kolom koordinat, tanggal, pulau, propinsi, kabupaten, kecamatan, nama HPH (Hak Pengusahaan Hutan), jenis tanah dan lainnya

Dari data sumber dengan format (.xls) diambil beberapa atribut yaitu tanggal, pulau, propinsi, dan kabupaten. Pada awalnya atribut kecamatan dipilih tetapi karena keterbatasan perangkat lunak OLAP Server Palo maka atribut kecamatan tidak dimasukkan sebagai atribut terpilih. Atribut tersebut dipilih karena beberapa alasan antara lain :

1 Atribut tersebut menarik untuk dianalisis dan sesuai dengan tujuan dari pembuatan data warehouse persebaran hotspot,

2 Nilai null tidak melebihi 10%, dan

3 Atribut berkaitan satu dengan yang lain.

Berdasarkan atribut-atribut yang dipilih kemudian ditentukan fakta dan dimensi. Dari hasil analisis didapatkan 1 tabel fakta dan 2 tabel dimensi. Tabel fakta yaitu jumlah hotspot dan tabel dimensi yaitu waktu dan lokasi. Skema data warehouse yang digunakan adalah skema bintang (star scheme) yang dapat dilihat pada Gambar 5.

Gambar 5 Skema bintang data warehouse persebaran data hotspot.

Praproses data

Tahap awal dalam praproses dari data hotspot yaitu penggabungan dan reduksi data. Penggabungan dilakukan karena data hotspot terpisah setiap tahunnya, masing-masing satu file Excel (.xls). Proses reduksi data dibutuhkan karena jumlah data yang cukup besar.

Penggabungan data dilakukan dengan cara meng-import data sumber (.xls) ke DBMS SQL Server 2000 dengan menggunakan tools import. Hasil penggabungan adalah tabel titikPanas yang berisi field Tanggal, Pulau, Propinsi, Kabupaten. Struktur tabel titikPanas dapat dilihat pada Tabel 1.

Tabel 1 Struktur tabel titikPanas

Field Data Type

Tanggal Smalldatetime(4)

Pulau Varchar(12)

Propinsi Varchar(20)

Kabupaten Varchar(22)

Proses reduksi data dilakukan dengan tujuan yaitu pengurangan jumlah records. Data sumber (.xls) hanya mencatat tanggal dan wilayah hotspot sehingga jumlah hotspot perlu ditentukan. Penjumlahan hotspot dilakukan dengan membuat modul yaitu sum.php dan sumHotspotKab.php. File sum.php digunakan untuk menjumlahkan hotspot pada tingkat kecamatan dan harian. Hasil penjumlahan disimpan di dalam tabel baru yaitu tabel hotspot. Penjumlahan hotspot pada tingkat kecamatan menghasilkan banyak cell pada crosstab sehingga pada saat penampilan data menghasilkan nilai null di beberapa cell. Oleh karena itu jumlah hotspot harian pada tingkat kecamatan diganti dengan tingkat kabupaten dan bulanan. Namun demikian untuk mendapatkan jumlah hotspot pada tingkat kabupaten dan bulanan terlebih dahulu didapatkan dari penjumlahan tingkat harian dan kecamatan.

Penjumlahan hotspot pada tingkat kabupaten dilakukan setelah proses pembersihan data pada tabel hotspot. Pembersihan data akan dibahas pada subbab selanjutnya. Tabel hotspot yang telah dibersihkan dipindahkan ke dalam tabel baru yaitu hotspotNew.Struktur tabel hotspotNew dapat dilihat pada tabel 2. Penjumlahan hotspot pada tingkat kabupaten dilakukan dari tabel hotspotNew. File sumHotspotKab.php menjumlahkan hotspot pada tingkat kabupaten dan bulanan lalu hasilnya disimpan dalam tabel baru yaitu hotspotBulan. Struktur tabel hotspotBulan dapat dilihat pada Tabel 3.

Page 15: Data Warehouse dan OLAP Berbasis Web untuk Persebaran ... · 3 Skema galaksi (Han & Kamber 2006 ... 11 Presentasi jumlah hotspot di setiap pulau dilihat dari dimensi waktu dalam bentuk

7

Tabel 2 Struktur tabel hotspotNew

Field Data Type

Tanggal Varchar(5)

Bulan Varchar(5)

Tahun Varchar(5)

Pulau Varchar(24)

Propinsi Varchar(20)

Kabupaten Varchar(22)

Kecamatan Varchar(30)

Jumlah Int(4)

Tabel 3 Struktur tabel HotspotBulan

Field Data Type

Bulan Varchar(5)

Tahun Varchar(5)

Pulau Varchar(24)

Propinsi Varchar(20)

Kabupaten Varchar(22)

Jumlah Int(4)

Pembersihan Data

Proses pembersihan data dilakukan bertujuan untuk menghilangkan data yang bernilai kosong (null), noise, dan data yang tidak konsisten. Hal ini dapat terjadi pada saat penggabungan dalam satu tabel.

Pada field Tanggal terdapat nilai null dalam tabel hotspotNew sehingga baris tersebut dihilangkan dengan melakukan proses query. Dalam field pulau juga terdapat beberapa nilai null, hal ini menunjukkan bahwa hotspot tersebut terjadi di luar wilayah Indonesia. Untuk itu field pulau yang bernilai null diisi dengan “OUTSIDE INDONESIA(ALL)”. Nama field pulau tersebut untuk mewakili hotspot yang terjadi di luar wilayah Indonesia karena nama field kabupaten (elemen terendah dari dimensi lokasi) diisi dengan “Outside Indonesia”.

Selain nilai null pada data, terdapat hal-hal lain yang membuat data hotspot menjadi tidak konsisten yaitu :

1 Perbedaan penulisan nama kabupaten antar data sumber (.xls) tiap tahun. Data tahun

2003 penulisan nama kabupaten diawali dengan tulisan kab. atau kota, misalnya kab. Rokan Hilir seharusnya Rokan hilir dan kota Dumai yang sebenarnya Dumai.

2 Kesalahan dalam penamaan pulau misal, propinsi Bengkulu terdapat di dalam pulau Jawa.

3 Kesamaan nama kabupaten dengan nama kecamatan seperti kabupaten Banggai dengan kecamatan Banggai (Sulawesi).

4 Penamaan ganda pada kabupaten dan kecamatan, misalnya kabupaten Kutai terdapat di propinsi Kalimantan Timur dan Kalimantan Tengah. Hal tersebut membutuhkan pemeriksaan kembali agar tidak salah dalam penentuan batas wilayahnya. Referensi yang digunakan dalam penentuan batas wilayah didapatkan dari situs http://www.pu.go.id/infostatistik/htm/. Referensi yang didapatkan berupa file html dengan judul kode wilayah tahun 2003 tingkat propinsi. Masing-masing propinsi memiliki satu file html yang memiliki isi daftar kabupaten dan kecamatan.

Untuk menangani permasalahan tersebut dilakukan query basis data untuk membenarkan data dengan menggunakan referensi yang ada. Contoh untuk kasus nomor 3, mengganti nama kecamatan dengan menambahkan “(Kec)” seperti Banggai (Kec).

Untuk menangani ketidakkonsistenan data pada kasus nomor 4, maka pertama kali diperiksa terlebih dahulu dengan menggunakan referensi. Apabila setelah diperiksa nama data yang ganda salah satunya tidak terdapat pada referensi penamaan, maka data ganda yang tidak terdapat pada referensi tersebut diganti sesuai dengan yang ada. Akan tetapi, apabila kedua data penamaan ganda terdapat di referensi, maka penamaan kedua data tersebut ditambahkan sesuai dengan propinsinya. Diagram alur tahapan praproses data dapat dilihat pada Gambar 6. Rincian pembersihan data dapat dilihat pada Lampiran 1.

Struktur Kubus Data

Setelah semua tahapan praproses selesai, tahapan selanjutnya yaitu membuat struktur kubus data di OLAP Server Palo. Pembuatan struktur kubus data dilakukan sesuai dengan skema data warehouse yang telah dibuat. Di

Page 16: Data Warehouse dan OLAP Berbasis Web untuk Persebaran ... · 3 Skema galaksi (Han & Kamber 2006 ... 11 Presentasi jumlah hotspot di setiap pulau dilihat dari dimensi waktu dalam bentuk

8

Gambar 6 Diagram alur tahapan praproses data.

dalam OLAP Server Palo diberi nama monthlyHotspot.

Dimensi-dimensi yang terdapat di dalam basis data monthlyHotspot adalah waktu dan lokasi. Kubus data yang diberi nama hotspot dibentuk dengan menggunakan kedua dimensi tersebut. Deskripsi kubus data hotspot dapat dilihat pada Tabel 4.

Tabel 4 Deskripsi Kubus Data Hotspot

Nama Dimensi

Deksripsi

Lokasi Lokasi titik hotspot (pulau, propinsi, kabupaten)

Waktu Bulan dan tahun kejadian hotspot (2000, 2001, 2002, 2003, 2003).

Pemuatan Data

Tahap terakhir dari pembuatan data warehouse persebaran hotspot yaitu pemuatan data. Pemuatan data merupakan proses pemindahan data dari basis data relasional ke OLAP Server Palo. Proses pemuatan data dilakukan dengan membuat sebuah modul import yaitu importLocation.php, importTime.php, monthlyImport.php.

File importLocation.php berfungsi untuk memasukkan nama pulau, propinsi, dan kabupaten yang ada di dalam tabel hotspotBulan (basis data relasional) sebagai elemen dari dimensi lokasi. Dalam pengisian elemen, apabila terdapat penamaan ganda akan menimbulkan error karena terdapat nama elemen yang sama dalam satu dimensi. Oleh

karena itu tahap pembersihan data dibutuhkan agar tidak terdapat penamaan ganda.

File ImportTime.php berfungsi untuk memasukkan elemen dari dimensi waktu. Elemen tersebut merupakan kombinasi dari setiap tingkatan waktu. Penamaan elemen dari dimensi waktu adalah sebagai berikut All, tahun, quarter + tahun, bulan + tahun. Misalnya data tahun 2004, quarter 1 dan bulan januari maka penamaannya Q1 2004 dan Jan 2004.

File monthlyImport.php berisi query pengambilan data dari DBMS SQL Server 2000 lalu memasukkan hasil query tersebut ke dalam OLAP Server Palo menggunakan library atau PHP Palo API. Library Palo yang digunakan yaitu palo_setdata.

Deskripsi Umum Aplikasi OLAP

Aplikasi OLAP untuk persebaran hotspot merupakan aplikasi yang berguna untuk memberikan informasi mengenai perkembangan atau tren jumlah hotspot setiap tahunnya di wilayah Indonesia. Informasi tersebut dapat berguna bagi para pengambil keputusan terkait, pencegahan kebakaran hutan untuk wilayah tertentu.

Arsitektur aplikasi OLAP untuk persebaran hotspot ini menggunakan arsitektur three tier yang memiliki tiga lapisan yaitu lapisan bawah, tengah dan atas. Pada lapisan bawah tahapan praproses data dilakukan menggunakan DBMS (SQL Server 2000).

Lapisan tengah merupakan OLAP Server Palo dan pembuatan Aplikasi OLAP. Data yang telah melalui praproses diisi ke dalam kubus data yang terdapat di dalam basis data OLAP Server Palo. Pada lapisan tempat operasi-

Page 17: Data Warehouse dan OLAP Berbasis Web untuk Persebaran ... · 3 Skema galaksi (Han & Kamber 2006 ... 11 Presentasi jumlah hotspot di setiap pulau dilihat dari dimensi waktu dalam bentuk

9

operasi OLAP diimplementasikan digunakan bahasa pemograman PHP yang berjalan pada web Server Apache. Pemograman PHP digunakan untuk pembuatan Aplikasi OLAP maupun pemuatan data basis data relasional ke OLAP Server Palo. Untuk menghubungkan antara PHP dan OLAP Server Palo digunakan Palo PHP API (SDK 20080118_1000). Palo PHP API merupakan library yang dapat digunakan untuk menjalankan fungsi-fungsi Palo di PHP. Pembangkitan grafik untuk aplikasi OLAP menggunakan library JpGraph 1.20.

Aplikasi OLAP untuk persebaran hotspot merupakan pengembangan dari modul palo_demo.php yang terdapat di dalam SDK 1.0c. Fungsi filter dimensi dalam aplikasi ini didapatkan dari aplikasi OLAP untuk data PPMB (Herlambang 2007). Pada aplikasi OLAP untuk persebaran hotspot fungsi filter dimensi ditambahkan beberapa fitur, khususnya pada dimensi waktu yaitu untuk menyeleksi quarter dan bulan.

Lapisan atas merupakan hasil visualisasi dari aplikasi OLAP yang ditampilkan melalui web browser. Pada lapisan ini pengguna dapat melihat hasil operasi-operasi OLAP seperti drill down atau roll up. Penyajian informasi dikemas dalam bentuk crosstab (tabel) dan grafik yang mudah untuk dipahami pengguna.

Fasilitas-fasilitas yang terdapat di dalam aplikasi OLAP adalah sebagai berikut :

1 Pengguna dapat menentukan basis data, kubus data dan dimensi yang akan

ditampilkan sesuai dengan kepentingan analisis.

2 Visualisasi dalam bentuk crosstab dan grafik yang dapat digunakan untuk menganalisis.

3 Operasi-operasi OLAP yang dapat dilakukan pada crosstab antara lain roll up dan drill down. Untuk visualisasi grafik ditampilkan dalam bentuk bar plot dan pie plot

4 Filter dimensi yang berfungsi untuk menyeleksi yang akan ditampilkan pada kolom (x-axis) dan baris (y-axis). Filter dimensi hanya menampilkan elemen yang dipilih oleh pengguna sesuai dengan kebutuhan analisis.

5 Filter quarter dan bulan pada dimensi waktu. Filter ini berguna untuk menyeleksi salah satu dari quarter atau bulan. Misalnya pengguna hanya ingin menampilkan elemen Q1 atau bulan januari.

Tampilan utama aplikasi OLAP dapat dilihat pada Gambar 7. Contoh visualisasi grafik hasil operasi drill down dimensi waktu dan lokasi pada Gambar 8.

Kelebihan dan Kekurangan Aplikasi OLAP

Aplikasi OLAP untuk data persebaran hotspot memiliki beberapa kelebihan, yaitu :

1 Aplikasi OLAP dibuat berbasis web sehingga dapat digunakan oleh pengguna dalam satu jaringan Intranet ataupun mengaksesnya lewat Internet. Aplikasi berbasis web memudahkan dalam pemakaian aplikasi karena tidak perlu meng-install aplikasi di setiap komputer pengguna.

Gambar 7 Tampilan utama aplikasi OLAP dan visualisasi crosstab.

Page 18: Data Warehouse dan OLAP Berbasis Web untuk Persebaran ... · 3 Skema galaksi (Han & Kamber 2006 ... 11 Presentasi jumlah hotspot di setiap pulau dilihat dari dimensi waktu dalam bentuk

10

Gambar 8 Visualisasi grafik hasil operasi drill down terhadap dimensi waktu dan lokasi.

2 Aplikasi OLAP dibangun dengan perangkat lunak yang berbasis open source seperti OLAP Server Palo dan PHP.

3 Aplikasi ini dapat digunakan untuk data warehouse yang lain dengan cara mengubah beberapa konfigurasi seperti pada saat fetching data karena aplikasi ini belum mendukung perhitungan rataan.

Selain kelebihan yang telah disebutkan di atas, aplikasi OLAP untuk data persebaran hotspot juga memiliki beberapa kekurangan, yaitu :

1 Pada saat data warehouse persebaran hotspot dibuat sampai tingkat harian dan kecamatan, aplikasi akan menimbulkan warning pada saat crosstab di drill down. Hal ini menyebabkan beberapa cell pada crosstab bernilai null. Untuk menangani masalah ini browser harus di-refresh beberapa kali agar nilai pada cell kembali normal. Kasus tersebut tidak terjadi pada saat data warehouse hanya dibuat sampai tingkat bulanan dan kabupaten. Berdasarkan hasil penelitian ini OLAP Server Palo memiliki keterbatasan dalam jumlah elemen dalam satu dimensi. Aplikasi OLAP untuk persebaran hotspot dengan jumlah elemen 1.261 (dimensi lokasi) dan 1.946 (dimensi waktu) akan menghasilkan nilai nul di beberapa cell tertentu dalam crosstab pada saat penampilan data (fetching).

2 Tidak terdapat fungsi untuk melakukan operasi pivot. Saat ini untuk melakukan operasi pivot dengan cara mengubah axis (baris dan kolom) dimensinya.

3 Aplikasi OLAP belum memiliki fungsi updating yang berguna pada saat terdapat data hotspot terbaru.

4 Dalam hal penanganan dimensi waktu seperti penamaan quarter atau bulan.

Analisis Visual dari Crosstab dan Grafik

Dari aplikasi OLAP untuk persebaran data hotspot dapat diambil beberapa contoh informasi yang bermanfaat bagi pengguna. Informasi tersebut berupa tren jumlah hotspot di wilayah Indonesia mulai dari pulau, propinsi, dan kabupaten dari tahun 2000 sampai 2004. Untuk dimensi waktu juga dapat dilihat lebih rinci misalnya tiap quarter atau bulanan.

Informasi yang dapat diambil antara lain yaitu tren perkembangan jumlah hotspot tiap pulau di Indonesia dari tahun 2000 sampai 2004. Informasi tersebut didapatkan dari operasi dice, operasi ini dapat dilakukan dengan menggunakan filter dimensi. Operasi dice ditampilkan dengan memilih pulau = Jawa, Kalimantan, Sulawesi, Sumatera, dan OUTSIDE INDONESIA(ALL) dan waktu = 2000, 2001, 2002, 2003, dan 2004. Tampilan crosstab untuk operasi tersebut dapat dilihat pada Gambar 9 dan visualisasi grafiknya pada Gambar 10.

Page 19: Data Warehouse dan OLAP Berbasis Web untuk Persebaran ... · 3 Skema galaksi (Han & Kamber 2006 ... 11 Presentasi jumlah hotspot di setiap pulau dilihat dari dimensi waktu dalam bentuk

11

Gambar 9 Crosstab hasil operasi dice untuk melihat perkembangan jumlah hotspot tiap pulau di Indonesia dari tahun 2000 sampai 2004.

Gambar 10 Grafik Batang trend persebaran hotspot tiap pulau dilihat dari dimensi waktu.

Dilihat dari dimensi waktu, pada tahun 2000 pulau sumatera memiliki jumlah hotspot paling tinggi yaitu 7.289 titik jauh di atas pulau lainnya. Jumlah hotspot terbanyak pada urutan kedua ditempati oleh pulau Kalimantan dengan 1.571 titik disusul OUTSIDE INDONESIA(ALL) dengan 79 titik, Sulawesi dengan 11 titik dan pulau Jawa di urutan terakhir dengan 0 titik. Tahun 2001 terjadi penurunan jumlah hotspot di wilayah Indonesia. Tahun 2001 juga merupakan tahun dengan jumlah akumulasi hotspot paling sedikit di wilayah Indonesia. Penurunan dialami oleh pulau Sumatera dari 7.289 titik menjadi hanya 2.826 titik. Hal ini membuat pulau Sumatera menempati urutan kedua setelah Kalimantan dengan 4.094 titik. Berbeda dari tahun 2001 yang terjadi penurunan, tahun 2002 beberapa pulau mengalami kenaikan dan sisanya mengalami penurunan. Pulau Kalimantan, Sumatera, dan OUTSIDE INDONESIA(ALL) mengalami kenaikan yang cukup tinggi pada

tahun ini. Kenaikan tertinggi terjadi pada pulau Kalimantan sehingga menempatkannya pada posisi teratas dan disusul oleh Sumatera di urutan kedua. Pada tahun 2002 merupakan tahun dengan jumlah hotspot terbanyak di wilayah Indonesia periode tahun 2000 sampai 2004. Tahun 2003 terjadi kembali penurunan di setiap pulau dan jumlah hotspot terbanyak masih terdapat di pulau Kalimantan dan Sumatera. Di tahun 2004 terjadi kembali kenaikan jumlah hotspot di setiap pulau. Pulau Kalimantan masih berada posisi teratas dalam jumlah hotspot dengan 10.724 titik dan disusul pulau Sumatera dengan 8.033 titik. Pada tahun 2004 pulau Jawa memiliki jumlah hotspot terbanyak dibanding tahun sebelumnya dengan 6 titik. Presentasi jumlah hotspot di setiap pulau dilihat dari dimensi waktu dalam bentuk pie plot dapat dilihat pada Gambar 11. Contoh hasil visualisasi crosstab dan grafik lainnya dapat dilihat pada Lampiran 2.

Page 20: Data Warehouse dan OLAP Berbasis Web untuk Persebaran ... · 3 Skema galaksi (Han & Kamber 2006 ... 11 Presentasi jumlah hotspot di setiap pulau dilihat dari dimensi waktu dalam bentuk

12

Gambar 11 Presentasi jumlah hotspot di setiap pulau dilihat dari dimensi waktu dalam bentuk pie plot.

Dalam proses analisis, pengguna dapat menggunakan operasi-operasi OLAP seperti roll up, drill down dan pivot. Contoh-contoh operasi OLAP dalam aplikasi antara lain :

1 Melihat jumlah hotspot pulau Sumatera dan propinsinya dari tahun 2000 sampai 2004.

Kubus data awal memiliki dimensi lokasi dan waktu. Dimensi lokasi direpresentasikan melalui atribut propinsi dan dimensi waktu direpresentasikan melalui atribut tahun secara keseluruhan (All).

• Roll up

Operasi roll-up ditampilkan dengan menaikkan hirarki dimensi lokasi. Hirarki pada dimensi lokasi adalah All < pulau < propinsi < kabupaten. Sehingga operasi yang dilakukan adalah melihat jumlah hotspot di setiap pulau di Indonesia.

• Drill down

Operasi drill down ditampilkan dengan menurunkan hirarki dimensi waktu. Hirarki pada dimensi waktu adalah All < tahun < quarter < bulan. Sehingga operasi yang dilakukan adalah melihat jumlah hotspot dari setiap propinsi di Sumatera pada tahun 2000 sampai 2004.

• Slice

Operasi slice dilakukan dengan pemilihan satu dimensi, yaitu dimensi waktu dengan kriteria tahun = 2000. Sehingga operasi yang dilakukan adalah menampilkan jumlah hotspot untuk tingkat pulau dan propinsi di Indonesia pada tahun 2000.

• Dice

Operasi dice dilakukan dengan melakukan memilih kedua dimensi

dengan kriteria propinsi = Sumatera dan tahun = 2000.

• Pivot

Operasi pivot dilakukan dengan menukarkan axis dimensi. Axis-x (elemen waktu) diubah menjadi lokasi (tingkat pulau) dan axis-y (elemen lokasi) menjadi waktu (tahun 2000 sampai 2004). Operasi ini berguna untuk melihat informasi dari sudut pandang yang berbeda.

Tampilan operasi OLAP pada contoh 1 dapat dilihat pada Lampiran 3.

2 Melihat jumlah hotspot setiap kabupaten dari propinsi Riau dari tahun 2000 sampai 2004.

Kubus data awal memiliki dimensi lokasi dan waktu. Dimensi lokasi direpresentasikan melalui atribut propinsi dan dimensi waktu direpresentasikan melalui atribut tahun.

• Roll up

Operasi roll-up ditampilkan dengan menaiki hirarki dimensi waktu. Hirarki pada dimensi waktu adalah All < tahun < quarter < bulan. Sehingga operasi yang dilakukan melihat jumlah hotspot dari setiap propinsi di Sumatera berdasarkan tahun secara keseluruhan (akumulasi dari tahun 2000 sampai 2004 atau elemen All).

• Drill down

Operasi drill down ditampilkan dengan menurunkan hirarki dimensi lokasi. Hirarki pada dimensi lokasi adalah All < pulau < propinsi < kabupaten. Sehingga operasi yang dilakukan adalah melihat jumlah hotspot dari setiap kabupaten di Riau pada tahun 2000 sampai 2004.

Page 21: Data Warehouse dan OLAP Berbasis Web untuk Persebaran ... · 3 Skema galaksi (Han & Kamber 2006 ... 11 Presentasi jumlah hotspot di setiap pulau dilihat dari dimensi waktu dalam bentuk

13

• Slice

Operasi slice dilakukan dengan pemilihan satu dimensi, yaitu dimensi yaitu dimensi lokasi dengan kriteria kabupaten = Rokan Hilir. Sehingga operasi yang dilakukan adalah menampilkan jumlah hotspot untuk kabupaten Rokan Hilir di propinsi Riau pada tahun 2000 sampai 2004.

• Dice

Operasi dice dilakukan dengan melakukan memilih kedua dimensi dengan kriteria kabupaten = Rokan Hilir dan tahun = 2000.

Tampilan operasi OLAP pada contoh 2 dapat dilihat pada Lampiran 4.

KESIMPULAN DAN SARAN

Kesimpulan

Data warehouse untuk data persebaran data hotspot memiliki satu kubus data yaitu kubus data hotspot. Kubus data ini berisi nilai agregasi jumlah hotspot setiap wilayah di Indonesia mulai dari tingkat pulau sampai tingkat kabupaten. Data hotspot yang digunakan yaitu tahun 2000 sampai dengan tahun 2004.

Aplikasi OLAP merupakan sistem yang dibuat untuk merepresentasikan kubus data dari OLAP Server Palo yang dapat membantu pengguna dalam menganalisis data multidimensional. Aplikasi OLAP memberikan informasi kepada pengguna untuk membantu dalam proses pengambilan keputusan terkait dengan pencegahan kebakaran hutan.

Aplikasi OLAP dibuat berbasis web dengan menggunakan bahasa pemograman PHP. Dalam aplikasi ini disertai operasi-operasi OLAP seperti roll up, drill down dan pivot yang dapat membantu pengguna dalam menganalisis. Selain itu pengguna juga dapat memilih basis data, kubus data, dimensi dari data warehouse persebaran hotspot yang akan ditampilkan. Hasil operasi OLAP divisualisasikan dalam bentuk crosstab dan grafik.

Berdasarkan hasil penelitian ini OLAP Server Palo mempunyai keterbatasan dalam jumlah elemen dari suatu dimensi. Aplikasi OLAP untuk persebaran hotspot dengan jumlah elemen 1.262 (dimensi lokasi) dan 1.946 (dimensi waktu) saat penampilan data OLAP Server Palo akan menghasilkan null pada cell tertentu dalam crosstab.

Dari hasil crosstab dan grafik dapat diambil beberapa informasi tentang persebaran hotspot di wilayah Indonesia. Salah satu informasi yang dapat diambil yaitu pulau Kalimantan mempunyai jumlah hotspot terbanyak dalam periode tahun 2000 sampai 2004 yaitu 38.857 titik kemudian disusul pulau Sumatera di urutan kedua yaitu 30.396 titik sedangkan pulau Jawa sebagai wilayah dengan jumlah hotspot paling sedikit yaitu 8 titik. Dilihat dari dimensi waktu wilayah Indonesia memiliki jumlah hotspot terbanyak pada tahun 2002, jumlah hotspot terbanyak pada tahun 2002 yaitu pulau Sumatera dengan 53.403 titik.

Saran

Aplikasi OLAP masih memiliki beberapa kekurangan sehingga masih membutuhkan pengembangan lebih lanjut. Saran untuk penelitian data warehouse selanjutnya adalah :

1 Pembuatan modul update untuk data hotspot yang bertujuan untuk memudahkan pengguna apabila terdapat data baru. Pembuatan dapat dilakukan dengan mengembangkan modul yang sudah ada yaitu impLocation.php, impTime.php, dan montlyImport.php

2 Penambahan fasilitas login pada proses update sehingga dapat membatasi pengguna yang akan melakukan perubahan pada data.

3 Aplikasi OLAP dikembangkan dengan OLAP Server Palo atau library yang terbaru. Pada saat ini aplikasi OLAP dikembangkan dengan OLAP Server Palo 2.0 dan SDK 20080118_1000.

4 Perbaikan grafik pada multiple pie plot agar jumlah pie plot bisa lebih dinamis tidak hanya berjumlah 12.

5 Penambahan dimensi baru yaitu HPH, HTI, Lithology dan Jenis Tanah.

6 Optimasi pada dimensi waktu.

DAFTAR PUSTAKA

Cabbibo L, Torlone R. 1997. Querying Multidimensional Databases. http://citeseer.ist.psu.edu/cache/papers/cs/21194/http:zSzzSzwww.dia.uniroma3.itzSz~cabibbozSzpubzSzpdfzSzdbpl97.pdf/cabibbo97querying.pdf [9 Januari 2008].

Han J, Kamber M. 2006. Data Mining Concepts & Techniques. Simon Fraser University. USA: Morgan Kaufman

Page 22: Data Warehouse dan OLAP Berbasis Web untuk Persebaran ... · 3 Skema galaksi (Han & Kamber 2006 ... 11 Presentasi jumlah hotspot di setiap pulau dilihat dari dimensi waktu dalam bentuk

14

Herlambang, A. 2007. Pembangunan Data Warehouse dan Aplikasi OLAP untuk Data PPMB IPB Menggunakan Palo [Skripsi]. Bogor. Departemen Ilmu Komputer Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Pertanian Bogor.

Stolle F. 2000. The Underlying Causes And Impacts Of Fires In Southeast Asia. http://www.worldagroforestry.org/sea/Publications/searchpub.asp?publishid=1148[10 November 2007]

Sukmawati A. 2006. Hubungan Antara Curah Hujan Dengan Titik Panas (Hotspot) Sebagai Indikator Terjadinya Kebakaran Hutan Dan Lahan Di Kabupaten Pontianak Propinsi Kalimantan Barat [Skripsi]. Bogor. Program Studi Budidaya Hutan Fakultas Kehutanan Institut Pertanian Bogor.

Page 23: Data Warehouse dan OLAP Berbasis Web untuk Persebaran ... · 3 Skema galaksi (Han & Kamber 2006 ... 11 Presentasi jumlah hotspot di setiap pulau dilihat dari dimensi waktu dalam bentuk

LAMPIRAN

Page 24: Data Warehouse dan OLAP Berbasis Web untuk Persebaran ... · 3 Skema galaksi (Han & Kamber 2006 ... 11 Presentasi jumlah hotspot di setiap pulau dilihat dari dimensi waktu dalam bentuk

16

Lampiran 1 Contoh perubahan nama rincian pembersihan data hotspot

1 Pembersihan data hotspot kasus nomor 3 yaitu nama kabupaten sama dengan nama kecamatan

Kabupaten Kecamatan Jumlah tuple Nama Kecamatan Baru

Siak Siak 50 Siak(kec)

Banggai Banggai 1 Banggai(kec)

Pasaman Pasaman 17 Pasaman(kec)

Muara Enim Muara Enim 18 Muara Enim(kec)

Sintang Sintang 35 Sintang(kec)

Nunukan Nunukan 87 Nunukan(kec)

Sambas Sambas 11 Sambas(kec)

Solok Solok 1 Solok(kec)

Kutai Barat Kutai Barat 5 Kutai Barat(kec)

Kampar Kampar 21 Kampar(kec)

Mamuju Mamuju 1 Mamuju(kec)

Lampung Timur Lampung Timur 19 Lampung Timur(kec)

Enrekang Enrekang 1 Enrekang(kec)

Banjar Baru Banjar Baru 1 Banjar Baru(kec)

Bengkayang Bengkayang 7 Bengkayang(kec)

Sarolangun Sarolangun 16 Sarolangun(kec)

Lahat Lahat 8 Lahat(kec)

Bengkalis Bengkalis 18 Bengkalis(kec)

Malinau Malinau 4 Malinau(kec)

Pesisir Selatan Pesisir Selatan 2 Pesisir Selatan(kec)

Kapuas Hulu Kapuas Hulu 2 Kapuas Hulu(kec)

2 Contoh pembersihan data hotspot kasus nomor 4 yaitu penamaan ganda.

Kecamatan Kecamatan 1 Kecamatan 2 Jumlah tuple

Banda Sakti Banda Sakti (Aceh Utara) Banda Sakti (Lhokseumawe) 6

Dendang Dendang(Jambi) Dendang(Bangka Belitung) 40

Kota Agung Kota Agung(Sumsel) Kota Agung(Lampung) 4

Tebing Tinggi Tebing Tinggi(Riau) Tebing Tinggi(Sumsel) 22

Prabumulih Timur

Prabumulih Timur (Prabumulih)

Prabumulih Timur(Muara Enim)

10

Mesuji Mesuji(Lampung) Mesuji(Sumsel) 152

Tanjung Raja Tanjung Raja(Lampung) Tanjung Raja(Sumsel) 13

Payung Payung(Sumut) Payung(Bangka Belitung) 17

Page 25: Data Warehouse dan OLAP Berbasis Web untuk Persebaran ... · 3 Skema galaksi (Han & Kamber 2006 ... 11 Presentasi jumlah hotspot di setiap pulau dilihat dari dimensi waktu dalam bentuk

17

Lanjutan

Kecamatan Kecamatan Kecamatan Jumlah Tuple

Sukadana Sukadana(Kalbar) Sukadana(Lampung) 15

Tujuh Belas Tujuh Belas(Singkawang)

Tujuh Belas(Bengkayang)

9

Kubu Kubu(Kalbar) Kubu(Riau) 113

Belitang Belitang(Sumsel) Belitang(Kalbar) 20

Cempaka Cempaka(Sumsel) Cempaka(Kalsel) 21

Martapura Martapura(Sumsel) Martapura(Kalsel) 19

Simpang Empat Simpang Empat(Sumut)

Simpang Empat(Kalsel)

31

Batu Ampar Batu Ampar(Kalsel) Batu Ampar(Kalbar) 33

Bukit Batu Bukit Batu(Riau) Bukit Batu(Kalteng) 62

Kayan Hilir Kayan Hilir(Kaltim) Kayan Hilir(Kalbar) 46

Kayan Hulu Kayan Hulu(Kalbar) Kayan Hulu(Kaltim) 19

Kuala Kuala(Aceh) Kuala (Sumut) 10

Page 26: Data Warehouse dan OLAP Berbasis Web untuk Persebaran ... · 3 Skema galaksi (Han & Kamber 2006 ... 11 Presentasi jumlah hotspot di setiap pulau dilihat dari dimensi waktu dalam bentuk

18

Lampiran 2 Hasil visualisasi crosstab dan grafik lainnya

1 Crosstab dan grafik persebaran hotspot tingkat propinsi dari tahun 2000 sampai 2004

Page 27: Data Warehouse dan OLAP Berbasis Web untuk Persebaran ... · 3 Skema galaksi (Han & Kamber 2006 ... 11 Presentasi jumlah hotspot di setiap pulau dilihat dari dimensi waktu dalam bentuk

19

Lanjutan

2 Crosstab dan grafik persebaran jumlah setiap quarter (per tiga bulan) tingkat propinsi

Page 28: Data Warehouse dan OLAP Berbasis Web untuk Persebaran ... · 3 Skema galaksi (Han & Kamber 2006 ... 11 Presentasi jumlah hotspot di setiap pulau dilihat dari dimensi waktu dalam bentuk

20

Lampiran 3 Tampilan operasi OLAP pada contoh 1

1 Kubus data awal

2 Operasi roll up pada contoh 1 berdasarkan dimensi lokasi

Page 29: Data Warehouse dan OLAP Berbasis Web untuk Persebaran ... · 3 Skema galaksi (Han & Kamber 2006 ... 11 Presentasi jumlah hotspot di setiap pulau dilihat dari dimensi waktu dalam bentuk

21

Lanjutan

3 Operasi drill down pada contoh 1 berdasarkan dimensi waktu

4 Operasi slice pada contoh 1 dengan kriteria waktu = 2000

5 Operasi dice pada contoh 1 dengan kriteria propinsi = Sumatera dan waktu = 2000

Page 30: Data Warehouse dan OLAP Berbasis Web untuk Persebaran ... · 3 Skema galaksi (Han & Kamber 2006 ... 11 Presentasi jumlah hotspot di setiap pulau dilihat dari dimensi waktu dalam bentuk

22

Lanjutan

6 Operasi pivot pada contoh 1

Page 31: Data Warehouse dan OLAP Berbasis Web untuk Persebaran ... · 3 Skema galaksi (Han & Kamber 2006 ... 11 Presentasi jumlah hotspot di setiap pulau dilihat dari dimensi waktu dalam bentuk

23

Lampiran 4 Tampilan operasi OLAP pada contoh 2

1 Tampilan awal kubus data

2 Operasi roll up pada contoh 2 berdasarkan dimensi waktu

Page 32: Data Warehouse dan OLAP Berbasis Web untuk Persebaran ... · 3 Skema galaksi (Han & Kamber 2006 ... 11 Presentasi jumlah hotspot di setiap pulau dilihat dari dimensi waktu dalam bentuk

24

Lanjutan

3 Operasi drill down pada contoh 2 berdasarkan dimensi lokasi

4 Operasi slice pada contoh 2 dengan kriteria kabupaten = Rokan Hilir

5 Operasi dice pada contoh 2 dengan kriteria kabupaten = Rokan Hilir dan tahun = 2000