statistik, uji statistik, wavelet, dan kalman filter

Upload: bagoesdwiramdhani

Post on 08-Mar-2016

44 views

Category:

Documents


11 download

DESCRIPTION

Statistik, Uji Statistik, Wavelet, dan Kalman Filter

TRANSCRIPT

MAKALAH PERKULIAHAN TEKNIK ANALISIS DATA

Diajukan untuk memenuhi tugas pengganti UASMata Kuliah GD5102 Teknik Anakisis Dataoleh :Bagoes Dwi Ramdhani 15112065

TEKNIK GEODESI DAN GEOMATIKAFAKULTAS ILMU DAN TEKNOLOGI KEBUMIANINSTITUT TEKNOLOGI BANDUNG2015

STATISTIKStatistik adalah kumpulan angka yang sering disusun, diatur, atau disajikan ke dalam bentuk daftar/tabel, sering pula daftar atau tabel tersebut disertai dengan gambar-gambar yang biasa disebut diagram atau grafik. Data yang diperoleh itu dapat berupa bilangan yang melukiskan suatu persoalan.

Nilai Frekuensi

53

76

108

Statistika adalah pengetahuan yang berhubungan dengan cara-cara pengumpulan data, pengolahan atau penganalisaannya dan penarikan kesimpulan atau interprestasi terhadap hasil analisis kumpulan data tersebut. Statistika dikelompokkan dalam dua kelompok yaitu statistika deskriptif dan statistika inferensia. Statistika deskriptif adalah metode yang berkaitan dengan pengumpulan dan penyajian suatu gugus data sehingga memberikan informasi yang berguna. Statistika deskriptif ini menggambarkan dan menganalisa data dalam suatu kelompok tanpa membuat/ menarik kesimpulan tentang populasi atau kelompok yang lebih besar. Sedangkan pengertian statistika inferensia adalah metode yang berhubungan dengan analisis sebagian data untuk kemudian sampai pada peramalan atau penarikan kesimpulan tentang seluruh gugus data induknya. Dalam statitistik inferensial berkaitan dengan kondisi-kondisi dimana data dari sampel dianalisis tersebut ditarik kesimpulan untuk populasi dari mana sampel tersebut diambil.

Statistik tidak lepas dari istilah data. Data adalah ukuran dari variabel yang diperoleh dengan mengukur nilai satu atau lebih variabel dalam sampel (atau populasi). Data dapat diklasifikasikan menurut jenis, menurut dimensi waktu, dan menurut sumbernya. Menurut jenisnya, data terdiri dari data kuantitatif dan data kualitatif. a. Data kuantitatif adalah data yang diukur dalam suatu skala numerik (angka). Data kuantitatif dapat dibedakan menjadi: 1) Data interval, yaitu data yang diukur dengan jarak di antara dua titik pada skala yang sudah diketahui. Sebagai contoh: IPK mahasiswa (interval 0 hingga 4); usia produktif (interval 15 hingga 55 tahun); suhu udara dalam Celcius (interval 0 hingga 100 derajat). 2) Data rasio, yaitu data yang diukur dengan suatu proporsi. Sebagai contoh: persentase jumlah pengangguran di Propinsi Sumatera Utara; tingkat inflasi Indonesia pada tahun 2000; persentase penduduk miskin di Sumatera Utara; pertumbuhan ekonomi Sumatera Utara b. Data kualitatif, adalah data yang tidak dapat diukur dalam skala numerik. Namun karena dalam statistik semua data harus dalam bentuk angka, maka data kualitatif umumnya dikuantifikasi agar dapat diproses. Kuantifikasi dapat dilakukan dengan mengklasifikasikan data dalam bentuk kategori. Data kualitatif dapat dibedakan menjadi: 1) Data nominal, yaitu data yang dinyatakan dalam bentuk kategori. Sebagai contoh, industri di Indonesia oleh Biro Pusat Statistik digolongkan menjadi: a) Industri rumah tangga, dengan jumlah tenaga kerjanya 1-4 orang, yang diberi kategori 1. b) Industri kecil, dengan jumlah tenaga 5-19 orang, yang diberi kategori 2. c) Industri menengah, dengan jumlah tenaga kerja 20-100 orang, yang diberi kategori 3. d) Industri besar, dengan jumlah tenaga kerja lebih dari 100 orang, yang diberi kategori 4. Angka yang menyatakan kategori ini menunjukkan bahwa posisi data sama derajatnya. Dalam contoh di atas, angka 4 tidak berarti industri besar nilainya lebih tinggi dibanding industri kecil yang angkanya 1. Angka ini sekedar menunjukkan kode kategori yang berbeda. 2) Data ordinal, yaitu data yang dinyatakan dalam bentuk kategori, namun posisi data tidak sama derajatnya karena dinyatakan dalam skala peringkat. Sebagai contoh, dalam skala likert.Berdasarkan cara perolehannya data kuantitatif dibedakan menjadi data diskrit dan data kontinu. Data-data yang diperoleh dari hasil menghitung atau membilang termasuk dalam data diskrit, sedangkan data-data yang diperoleh dari hasil mengukur termasuk dalam data kontinu.Menurut sumbernya kita mengenal data intern dan data ekstern. Data intern adalah data yang diperoleh dari perusahaan atau instansi yang bersangkutan. Sedangkan data ekstern diperoleh dari luar instansi atau perusahaan tersebut. Data ekstern dibedakan menjadi data primer dan data sekunder. Data primer adalah data yang dikeluarkan oleh badan sejenis. Sedangkan data lainnya termasuk data sekunder. Semua data-data yang beru dikumpulkan dan belum pernah diolah disebut sebagai data mentah.Sebelum menggunakan statistika ada beberapa konsep atau pengertian dasar yang perlu diketahui. Hal ini sangat dibutuhkan dalam rangka memudahkan memahami proses, teknik-teknik, dan prosedur yang tersedia. Selain itu, akan memudahkan pula manakala kita harus memilih dan menggunakan teknik-teknik yang paling tepat serta sesuai dengan disain penelitian yang dilaksanakan, sehingga tidak akan terjadi kesalahan dalam menginterpretasikan hasil-hasil pengujiannya. Beberapa konsep dan pengertian-pengertian yang perlu dipahami antara lain:a. Variabel : Adalah karakteristik dari obyek penelitian yang memiliki nilai bervariasi. Misalnya, jenis kelamin: laki-laki dan perempuan. Status ekonomi: tinggi, sedang, rendah.b. Variabel Bebas/Independent : Dalam hubungan antar dua atau lebih variabel, variable bebas merupakan variabel yang dapat mempengaruhi variabel lainnya. Misalnya; variabel X dengan variabel Y, yang menggambarkan variabel X mempengaruhi variabel Y, maka X disebut variabel bebas.c. Variabel Tak Bebas/Dependent : Dalam hubungan antar dua atau lebih variabel, variable tak bebas merupakan variabel yang dipengaruhi oleh variabel lainnya. Misalnya; variabel X dengan variabel Y, yang menggambarkan variabel Y dipengaruhi oleh variabel X, maka Y disebut variabel tak bebas.d. Data : fakta, baik berbentuk kualitatif maupun kuantitatif. Data kualitatif diperoleh melalui pengamatan, misalnya pemilikan lahan petani di suatu desa cukup tinggi. Data kuantitatif diperoleh melalui pengukuran.e. Pengukuran : suatu proses kuantifikasi atau mencantumkan bilangan kepada variabel tertentu. Misalnya, berat badan secara kualitatif bisa dibedakan sebagai ringan, sedang, atau berat, dan melalui proses pengukuran dengan cara menimbang kita dapat menyatakan berat badan: 50 kg, 60 kg, 70 kg.f. Skala Pengukuran : bilangan yang dicantumkan kepada variabel berdasarkan aturan-aturan yang telah ditentukan dan disepakati. Dikenal 4 macam skala pengukuran yaitu: nominal, ordinal, interval, dan rasio. Skala nominal hanya dipakai untuk membedakan, skala ordinal mengisyaratkan adanya peringkat, skala interval menunjukkan adanya jarak yang tetap tetapi tidak memiliki titik nol mutlak, dan skala rasio memiliki titik nol mutlak. g. Populasi : himpunan yang lengkap dan sempurna dari semua unit penelitian. Lengkap dan sempurna, artinya harus ada pernyataan sedemikian rupa dalam mendefinisikannya populasi agar tidak menimbulkan salah pengertian. Misalnya, kita menyebutkan bahwa populasi adalah peternak ayam. Dalam kaitan ini, batasan populasi belum bisa menjelaskan; peternak ayam di wilayah mana, apakah peternak ayam ras, broiler, atau ayam buras. Sehingga lebih baik disebutkan misalnya , peternak ayam ras di desa X.h. Populasi Sampel : Misalnya kita ingin meneliti tentang pendapatan petani tembakau dikabupaten X dengan mengambil 3 kecamatan A, B, dan C di kabupaten tersebut sebagai tempat penelitian yang dipilih. Populasinya adalah seluruh petani tembakau yang ada di kabupaten X, sedangkan yang ada di kecamatan A, B, dan C disebut populasi sampel.i. Sampel : Adalah himpunan unit penelitian yang memberikan informasi atau data yang diperlukan dalam penelitian. Jadi, sampel merupakan himpunan bagian dari populasi. Misalnya dalam contoh di atas petani tembakau yang ada di kecamatan A, B, dan C merupakan populasi sampel, dan sampelnya adalah hanya petani tembakau yang terpilih untuk diteliti setelah melalui proses sampling.j. Sampling : Sampling adalah suatu proses memilih n buah obyek dari sebuah populasi berukuran N.k. Validitas : Istilah validitas dipakai berkaitan dengan kriteria hasil pengukuran. Apakah kategori/skor/nilai yang diperoleh benar-benar menyatakan hasil pengukuran? Pada umumnya validitas dipermasalahakan pada pengukuran-pengukuran non fisik, seperti dalam pengukuran, sikap dan minat.l. Reliabilitas : Istilah reliabilitas dipakai berkaitan dengan kriteria alat pengukuran Misalnya untuk mengukur minat, sehingga kita memperoleh angka-angka skor untuk menyatakan minatnya rendah, minatnya sedang, atau minatnya tinggi, alat pengukuran yang menghasilkan skor-skornya tersebut sering dipermasalahkan.

Setelah data kuantitatif diperoleh, maka dilakukan pengolahan data dan pengujian beberapa hipotesis. Pengolahan data yang dilakukan adalah mencari ukuran pemusatan data, dalam hal ini adalah mean dan mencari ukuran penyebaran data dalam hal ini variance dan simpangan baku. Setelah itu, baru dilakukan pengujian normalitas, homogenitas dan uji hipotesis. Ketika data terdistribusi normal maka dapat dilakukan pengujian parametik dan sebaliknya ketika data tidak terdistribusi normal maka dapat dilakukan pengujian nonparametik Pada praktisnya, momen-momen fungsi distribusi (mean, variansi, skewness, dan kurtosis) akan bergantung pada banyaknya sampel yang diambil. Jika populasinya terdistribusi normal, maka momen-momen tersebut akan mendekati distribusi normal untuk sampel.Gambar 1 . Kurva Distribusi Untuk ukuran sampel yang kecil, maka kurva tersebut akan menyimpang dari keadaannormal. Beberapa fungsi distribusi :1. t - students2. ^2 chi squares3. FisherDistribusi t-student merupakan uji statistik yang meninjau distribusi mean dari sample populasi tersebut. Nilai t untuk sebarang populasi didefinsikan sebagai:

(1)

Kita tahu bahwa nilai mean dan standar deviasi dari suatu sampel akan berbeda untuk setiap ukuran sampel N, sehingga nilai t akan bergantung pada nilai N.(2)Dengan variansi :(3)Gambar 2. Kurva t untuk N=8

Distribusi t banyak digunakan untuk hal-hal mengenai mean suatu populasi juga mengenai perbandingan mean-mean beberapa sampel. Distribusi X^2 chi square merupakan uji statistik yang meninjau distribusi variansi dari sample populasi. Untuk distribusi X^2 chi square didefinisikan sebagai :(4)(5)(6)Bentuk Umum fungsi distribusi adalah(6)Gambar 3. Kurva chi square untuk N=10Untuk uji statistik Fisher akan meninjau perubahan relatif distribusi variansi dari dua sample populasi dalam satu populasi yang sama, dengan menggunakan distribusi F dapat menarik kesimpulan mengenai variansi populasi dari variansi dua sample tersebut. Nilai F didefinisikan sebagai :(6)(7)

Dengan bentuk fungsi umum :(8)Gambar 4. Kurva F untuk N1=3 N2=5

STATISTIK SPASIALStatistik spasial merupakan sekumpulan teknik untuk mendeskrpsikan dan memodelkan data spasial (Fischer and Getis, 2010). GIS Dictionary (Wade and Sommer, 2006) mendeskripsikan statistic spasial sebagai bagian dari ilmu yang mempelajari metode statistic yang menggunakan unsur keruangan dan hubungan spasial (contoh : jarak, area, volume, panjang, tinggi, orientasi, dan/atau karakter spasial data laiannya) secara langsung dalam perhitungan matematisnya. Statistik spasial merujuk pada aplikasi dari konsep statistic dan metode untuk mendekati atau memahami data yang secara eksplisit memeiliki struktur spasial (Ribeiro and Diggle, 2001). Perbedaaan yang pasti dari statistik spasial dan statistik secara umum adalah bahwa statistic spasial digunakan untuk menganalisis data yang memiliki unsur spasial. Statistik sasial memberikan data-data spasial seperti lokasi, pola spasial, jarak, dan sebagainya. Dimensi spasial ini membuat statistik spasial lebih kompleks daripada statistik biasa.

Beriukut adalah istilah - istilah dalam proses statistik spasial yang harus dipahami untuk mempermudah dalam pemhaman konsep statistik spasial Autokorelasi SpasialAutokorelasi secara bahasa berarti suatu variabel memiliki korelasi terhadap dirinya sendiri. Definisi paling sederhana dari autokorelasi adalah sepasang objek yang jaraknya dekat lebih mungkin memiliki nilai yang mirip, sedangkan objek dengan jarak yang jauh akan memiliki nilai yang jauh dari mirip. Struktur spasial dari data bervariasi pada pola apapun yang ada, contohnya gradien atau clusters memiliki autokorelasi positif, sedangkan korelasi negatif akan terjadi apabila terdapat pola checkerboard. Ketika suatu data terautokorelasi secara spasial, menjadi mungkin untuk memprediksi nilai suatu lokasi berdasarkan nilai yang diambil dekat dengan lokasi data tersebut. Tidak adanya autokorelasi menandakan bahwa data-data yang ada merupakan data independen.

Terdapat dua alasan mengapa terjadi autokorelasi. Yang pertama merupakan alasan spurious. Spurious autocorrelation merupakan hasil ketika pada suatu desain percobaan, sampel tidak dipilih secara benar-benar random. Real autocorrelation dapat didefinisikan sebagai alasan dari interkasi dari suatu variabel dengan dirinya sendiri (univariate) atau dengan variabel indepen (multivariate) berdasarkan sifat-sifat dasar variabel tersebut.

Hubungan antara Variansi, Kovariansi dan KorelasiAutuokorelasi spasial biasa didefinisikan dan memiliki hubungan erat dengan variansi, kovariansi serta korelasi. Variansi merupakan ukuran persebaran suatu populasi, sementara kovariansi merupakan ukuran dari asosiasi antar dua variabel. Hubungan antara variansi dan kovariansi, nilai harapan dari hasil variansi dua vairabel dapat diketahui melalui persamaan berikut

(9)(10)

Dimana = sampel variansi dari variabel xi. xi = nilai dari variabel x dari i hingga n, = rata-rata sampel dari variabel x, n = banyaknya sampel, = sampel kovariansi antara variabel x dan y, yi = nilai dari variabel y dari i hingga n, = rata-rata sampel dari variabel y.

Koefisien korelasi juga menunjukkan nilai yang mengindikasikan betapa besar dua variabel saling terasosiasi. Membagi hasil variansi dari setiap variabel akan menghasilkan nilai antara -1 sampai 1, dimana nlai antara 0 dan 1 mengindikasikan asosiasi positif antar variabel dan nilai antara 0 dan -1 mengindikasikan asosasi negatif sedangkan 0 berarti tidak ada korelasi antar variabel. Koefisien korelasi biasanya menggunakan koefisen korelasi Pearson yaitu (11)

dengan r = sampel dari koefisien korelasi antara variabel x dan y dan dan sxsy = produk dari variansi variabel x dan y.

Sedangkan karena tujuan dari autokorelasi spasial adalah untuk menentukan apakah suatu sampel berjauhan atau berdekatan antara satu sama lain, dibentuk fungsi yang memperhitungan jarak antara sampel. Dibandingkan mengukur perbedaan antara suatu nilai sampel dan nilai rata-ratanya sebagaimana dilakukan pada perhitungan variansi dan fungsi korelasi, fungsi spasial memperhitungan perbedaan nilai antar seluruh sampel berdasarkan jarak yang diberikan.

Perhitungan dan pengeplotan suatu nilai sampel berdasarkan interval jarak yang berbeda-beda akan menjadi lebih informative. Jarak antar sampel, biasa disebut lag, ditentukan oleh peneliti berdasarkan priori. Hal ini akan memberikan informasi mengenai struktur data spasial. Setiap titik pada hasil plot merepresentasikan variansi atau korelasi untuk seluurh titik lainnya pada interval jarak tertentu. Pengeplotan semi-variansi dikatakan variogram, sedangkan pengeplotan dari koefisien korelasi dikatakan correlograms. Untuk membentuk variogram atau correlograms, dibentuk suatu matriks jarak antara tiap titik.

Semi-Variansi dan VariogramSemi-variogram atau variogram merupakan plot dari semivariansi terhadap fungsi jarak. Semivarianse mengukur perbedaan daris uatu subjek diantara satu variabel, dibandingkan dengan kovariansi yang mengukur hubungan antara satu atau lebih variabel. Tidak seperti koefisien korelasi, semi-variansi tidak dinormalisasi. Rumus variogram yang dirumuskan Gearys C adalah (12)

dengan = semi-variansi sebagai fungsi dari jarak, W = jumlah dari seluruh nilai whi pada matriks bobot, n = jumlah sampel, whi = elemen bobot sebagai matriks dari jarak, yh, yi = sepasang poin sampel.

Vairogram klasik seperti pada Gambar 2 dihitung berdasarkan data inependen, dimana semi-variansi meningkat seiring dengan jarak antara titik/lag meningkat. Terdapat beberapa istilah, yaitu range sebagai jarak lag ketika data menjadi independen, sill merepresentasikan nilai variansi yang berkorespondesi terhadap range, nugget adalah jarak pada sumbu y antara 0 dan perpotongan dengan y, merepresentasikan variabilitas yang tidak dapat dihitung karena ada error.

Gambar 5. Semi-variansi dari rata-rata suhu suatu daerah pada lokasi yang berbeda

Gambar 1(a) menunjukkan bahwa suhu bergantung pada ketinggian. Seiring dengan jarak antara titik meningkat, tinggi menjadi tidak terlalu signifikan dan autokorelasi menurun. Sedangkan Gambar 1(b), ketika nilai diganti dengan nilai random, menunjukkan bahwa data merupakan data independen.

Sedangkan rumus untuk menghitung autokorelasi spasial pada suatu variabel kuantitatif tunggal dirmuskan oleh Morans I sebagai (13)

dengan I(d) = koefisien korelasi sebagai fungsi dari jarak.

Statistik spasial seringkali digunakan untuk mendeteksi, melihat karakteristik dan memahami pola spasial, biasanya dalam kasus geografi maupun ekologi (Archbald, 2015). Statistik spasial digunakan pada berbagai jenis analisis, termasuk analisis pola, bentuk, pemodelan dan prediksi permukaan, regresi spasial, komparasi statistik antara dua set data, pemodelan statistik, prediksi dari interaksi spasial dan banyak lagi. Tipe dari statistik spasial adalah deskriptif, inferential, exploratory, geostatistical, dan economoctric.

Tujuan utama statistik spasial adalah : 1. Mendeksripsikan pola spasial (exploration)2. Mengetes hipotesis suatu pola (inference)3. Memprediksi pola (mapping atau interpolation)

Bagaimana Statistik Spasial Digunakan?Balley dan Gatrell (1995) membagi teknik statistik spasial menjadi 4 kategori berdasarkan tipe datanya yaitu 1. Point Pattern DataPoint pattern statistics dugnakan untuk menganalisis distribusi spasial dari suatu fenomena yang dapat dimodelkan secara diskrit. Terdapat beberapa metode yaitu Quadrat analysis Kernel estimation Nearest neighbor analysis K-functionPerhitungan statistik menggunakan metode-metode ini biasa digunakan untuk mengetes hipotesa dari Complete Spatial Randomness (CSR). Terapat beberapa metode lain yang telah dikembangkan untuk mengetahui interaksi antara beberapa tipe kejadian, space-time clustering, clustering antara titik-titik dari suatu objek, dan sebagainya.

2. Spatially Continuous DataTerkadang disebut juga sebagai random field data/geostatistics yang merujuk pada suatu sekelompok statistik spasial yang digunakan untuk menganalisis data kontinu pada suatu unsur spasial. Metode yang dikembangkan adalah Spatial moving averages Trend surface analysis Delauney triangulation / Thiesen polygons / TINs Kernel estimation Variograms / covariograms / kriging Principal components analysis / factor analysis Procrustes analysis Cluster analysis Canonical correlation

3. Areal DataTerdapat metode untuk menganalisis data atribut yang merujuk pada suatu poligon (area) yaitu Spatial moving averages Kernel estimation Spatial autocorrelation (Morans I, Gearys c) Spatial correlation and regression Bermacam model dikembangkan untuk spatial correlation dan regression. Berbagai metode juga dikembangkan untuk tipe-tipe khusus dari suatu data area (misalnya : counts, proportions).

4. Interaction DataKebanyakan metode dikembangkan untuk interaks berdasarkan model gravitasi, yang menyatakan bahwa tingkat interaksi antar dua tempat adalah fungsi dari ukurannya dan berbanding terbalik dengan jarak antar keduanya. Jarak dapat diukur dengan suatu garis lurus pada suatu jaringan.

Sedangkan berdasarkan fungsinya, statistik spasial dapat digunakan dengan rincian sebagai berikut :

Deskripsi Pola Spasial (Exploration)Terdapat beberapa metode yang telah dikembangkan untuk mendeskripsikan pola spasial dari suatu titik-titik lokasi atau kejadian. Suatu keajadian didefinisikan sebagai fenomena apapun yang terjadi pada lokasi dan waktu yang spesifik.

Mengidentifikasi pola dari suatu kejadian adalah langkah pertama untuk memahami proses yang membentuk pola tersebut. Suatu kejadian mungkin saja terpisah satu sama yang lain, berkelompok, atau justru terpisah secara acak seperti diilustrasikan pada Gambar 1. Contohnya, suatu penyakit misalnya kanker paru-paru, dapat terjadi pada suatu kelompok area karena lingkungan lokal yang ada di daerah tersebut. Mengetahui hubungan antara pola dan proses adalah tujuan dari identifikasi pola spasial suatu kejadian (Legendre, 1993).

Gambar 6. Jenis pola spasial

Pola spasial dapat diidentifikasi menggunakan analisis average nearest neighbor (Fortin et al, 2002). Metode ini mengurur jarak rata-rata terdekat untuk semua titik dan mengasumsikan semua titik pada area survei telah diukur. Setelah itu, jarak rata-rata terdekat tersebut dibandingan dengan nilai rata-rata-rata dari hipotesa awal dimana distribusi poinnya masih dalam bentuk acak. Hasil dari nilai rata-rata hasil observasi dapat bervariasi dari nilai rata-rata hipotesa awal. Hal ini menggambarkan apakah titik tersebut terpisah, acak, atau terkelompok. Suatu nilai z digunakan untuk mengetes apakah suatu pola spasial dikatakan acak atau justru jauh dari kata acak.

Mengetes Hiptesis Suatu Pola (Inference)Terdapat tes-tes yang telah dikembangkan untuk mengevaluasi hasil dari data spasial yang berautokorelasi. Terdapat dua cara untuk mengukur autokorelasi spasial dari suatu data yang biasa digunakan yaitu Morans dan Gearys. Kedua cara tersebut mengukur korelasi antara lokasi spasial dari titik-titik sampel dan nilai dari titik-titik tersebut. Mantel Test bisa digunakan untuk mengevaluasi atau melakukan tes untuk mengetahui korelasi antara dua matriks yang mirip menggunakan autokorelasi spasial.

Apabila dilakukan perhitungan menggunakan autokorelasi spasial dan dibutuhkan parameter untuk mengetes hipotesa tersebut secara statistik, perlu dilakukan koreksi untuk perhitungan autokorelasi spasial tersebut. Salah satu cara untuk melakukan hal ini adalah dengan analisis regresi.

Memprediksi Pola (Mapping/Interpolation)Berbeda dengan metode yang dikembangkan untuk menganalisis pola dari suatu kejadian, telah dikembangkan seperangkat alat untuk memprebdiksi distribusi dari variable yang kontinu seperti temperature, dari titik-titik sampel yang terbatas. Metode interpolasi ini menghasilkan suatu peta dengan nilai-nilai kontinu dimana nilai-nilai yang tadinya tidak diketahui diinterpolasi dari nilai-nilai yang telah diketahui.

Interpolasi menggunakan asumsi awal yaitu nilai-nilai ada pada suatu fenomena kontinu tersebut semuanya berautokorelasi secara spasial dengan lokasi mereka. Dengan kata lain, nilai untuk sesuatu yang lokasinya tidak terlalu jauh diprediksi akan memiliki nilai yang lebih mirip daripada nilai pada lokasi yang lebih jauh. Suatu model maematika digunakan dan dibandingkan dengan nilai hasil observasi pada suatu lokasi yang telah ditentukan. Model ini kemudian digunakan untuk menginterpolasi nilai diantara nilai yang telah diketahui.

Metode untuk menginterpolasi ini bervariasi mulai dari kriging, splining, inverse distance weighting dan trend surface analysis. Kriging menginterpolasi berdasarkan nilai variogram yang mengukur tingkat autokorelasi spasial antara titik-titik yang ada dan kemudian digunakan untuk memprediksi nilai yang belum diketahui. Karena digunakan prediksi berdasarkan autokorelasi spasial, nilai hasil prediksi pasti memiliki error standar. Sebaliknya, inverse distance weighting dan splining menggunakan fungsi spesifik untuk memprediksi bagaimana suatu nilai berubah berdasarkan jarak. Mereka mengasumsikan autokorelasi spasial generik dibandingkan pengukuran suatu nilai berdasarkan suatu set data autokorelasi spasial. Metode yang paling general adalah trend analysis yang mencocokkan suatu polynomial terhadap titik-titik hasil observasi untuk menghasilkan permukaan yang bagus. Metode-metode ini dapat digunakan dengan mudah menggunakan software yang telah berkembang, salah satunya ArcGIS.

WAVELETWavelet merupakan suatu model matematika yang digunakan untuk memperlajari fenomena fisik yang ada di dunia dengan konsep matematik. Konsep ini dapat melihat sebuah fenomena menjadi hal yang lebih sederhana dan menggunakan perangkat matematik untuk mendapatkan pemahaman yang lebih baik dari perbedaan fenomena yang terjadi di dunia ini.Konsep tentang penyederhanaan suatu fenomena menggunakan konsep matematika yang kemudian direpresentasikan dan direkonstruksi menggunakan suatu fungsi dapat dilihat pada Gambar 1 di bawah ini.

Gambar 7. Penyederhanaan fenomena menggunakan konsep matematika.Berdasarkan gambar di atas fungsi dari wavelet yang terkait dengan penyederhanaan fenomena menggunakan konsep matematika dapat dibedakan menjadi dua hal yaitu representasi dan rekonstruksi fungsi serta representasi multi resolusi.Wavelet dikembangkan karena dapat memberikan solusi yang lebih kuat dan fleksibel dalam mendiskritasi fungsi dan merekonstruksi ulang. Wavelet dikembangkan sebagai suatu solusi yang lebih untuk menanggulangi keterbatasan dari transformasi fourier. Transformasi wavelet merupakan pengembangan dari STFT (Short Time Fourier Transform). Hal ini terjadi karena untuk melakukan pengamatan pada komponen spektral berbeda, STFT menggunakan fungsi jendela dengan lebar yang sama sehingga resolusi waktu dan frekuesni yang buruk pada komponen berfrekuensi tinggi. Secara umum perbedaan dari Fourier transform, wavelet transform, dan STFT dapat dilihat pada table 1.

Table 1. Perbandingan transformasi Fourier (FT), transformasi Fourier jangka pendek (STFT), dan transformasi wavelet (WT)KomponenFTSTFTWT

DomainfrekuensiWaktu-frekuesiSkala-pergeseran

Fungsi BasisSinusoid kompleksSinusoid kompleks dimodulasi fungsi jendela sembarangFungsi wavelet induk (mother function)

Resolusi WaktuTidak adaKonstan untuk semua frekuensiBaik untuk skala rendah (frekuensi tinggi)

Resolusi FrekuensiSangat baikKonstan untuk semua frekuensiBaik untuk skala rendah (frekuensi tinggi)

Wavelet merupakan suatu gelombang dengan durasi terbatas sebagai sebuah fungsi osilasi dari waktu (space) yang memiliki nilai rata-rata nol. Karakteristik dari wavelet antara lain adalah berosilasi singkat, translasi (pergeseran), dilatasi (skala), dapat berbentuk tidak simetris, iiregular, dan durasinya terbatas. Sebagai sebuah fungsi matematika wavelet dapat menguraikan data atau fungsi menjadi komponen-komponen frekuensi yang berbeda-beda.

Gambar 8. Perbedaan antara gelombang sinus yang tak berhingga dan wavelet dengan panjang berhinggaTransformasi wavelet merujuk pada aproksimasi sinyal menggunakan suatu gelombang singkat yang mengalami translasi dan dilatasi untu keperluan analisis frekuensi temporal sinyal. Analisis temporal dilakukan menggunakan variasi lokal gelombang singkat pada waktu tertentu dan analisis frekuensi menggunakan variasi dilatasi gelombang singkat yang sama. Wavelet menggunakan suatu fungsi dasar atau fungsi induk (mother function) yang memiliki skala yang bervariasi. Fungsi induk ini akan digunakan sebagai dasar untuk menurunkan fungsi-fungsi lainnya untuk analisis lokasi dan frekuensi tertentu. Berberapa fungsi induk yang sering digunakan adalah wavelet Haar dan Daubechies. Fungsi tersebut dapat digambarkan dalam domain frekuensi seperti Gambar 3 di bawah ini.

1. (b) (c)Gambar 9. (a) Wavelet Induk Haar, (a) Wavelet Induk Daubechies-2, (c) Wavelet Induk Daubechies-3Funsi induk dapat didefinisikan dalam lebar dari fungsi modulasi sehingga akan mempunyai skala yang tidak pasti serta lokalisasi waktu yang baik. Selanjutnya perlu mendefinisikan sebuah fungsi sebagai kandidat dari fungsi modulasi dengan menentukan > 0 dan untuk semua s , s 0 yaitu : (14)Jika memiliki lebar T sehingga lebar dari s = sT. Fungsi modulasi dengan faktor 1/|s| akan bertambah amplitudonya ketika skalanya s berkurang atau sebaliknya. Dalam konteks frekuensi, untuk skala yang kecil s, fungsi modulasi akan memiliki frekuensi yang besar atau sebaliknya.Fungsi hasil turunan merupakan fungsi wavelet induk yang mengalami translasi atau dilatasi atau telah dilokalisasi dalam waktu. Untuk menyatakan hubungan antara induk wavelet dan fungsi turunannya dapat diberlakukan persamaan 2 dibawah ini: (15)dimana L2 ( R ) , sehingga L2 ( R )Berdasarkan persamaan di atas sebuah transformasi pada L2 ( R ) dapat didefinisikan menggunakan fungsi dari s,t sebagai fungsi modulasinya maka akan didapatkan persamaan di bawah ini (16)Persamaan 3 di atas merupakan formulasi matematika dari representasi sinyal yang dikenal dengan transformasi wavelet. Transformasi ini sendiri dilakukan dengan menguraikan sinyal dengan menggunakan suatu himpunan fungsi basis ortonormal yang disebut wavelet.Transformasi wavelet pada umumnya mempunyai 3 sifat utama yaitu: Self-similarityWavelet melakukan konvolusi yaitu penggabungan sinyal antara fungsi asli dengan mother function dan menggeser fungsi basis untuk mencari korelasi yang paling dekat antara kedua fungsi tersebut. Dalam melihat korelasi tersebut akan didapatkan nilai yang besarnya menunjukkan tingkat korelasi atau kemiripan pada 2 fungsi tersebut. Well localizedWavelet dapat mengaproksimasi sinyal menggunakan suatu gelombang singkat yang mengalami translasi dan dilatasi untuk keperluan analisis frekuensi-frekuensi sinyal. Multi resolutionSinyal yang asli dapat direkonstruksi menggunakan koefisien yang dihasilkan dari proses filtering dalam frekuensi tertentu. Hal ini dapat dilakukan dengan memotong nilai koefisien tersebut dalam ambang batas (threshold) tertentu. Kemampuan ini biasa disebut multi resolution yang dilakukan dengan memperbesar dan memperkecil matriks fungsi basis dari wavelet.Pada dasarnya transformasi wavelet dapat dibedakan menjadi 2 tipe berdasarkan nilai parameter translasi dan dilatasinya. Tipe dari transformasi wavelet tersebut adalah sebagai berikut: Discrete Wavelet Transform (DWT) Undecimated Discrete Wavelet Transform (UDWT) Conventional Discrete Wavelet Transform (CDWT) Continuous Wavelet Transform (CWT)Transformasi wavelet diskrit menggunakan 3 filter yaitu low pass decomposition filter, high pass decomposition filter, dan reconstruction filter. Dilatasi dan translasi dilakukan dengan menggunakan faktor integer pangkat 2 yaitu 2,4,8,16,dst. Transformasi ini memiliki kemampyan untuk menganalisis suatu data dalam domain waktu dan frekuensi secara simultan. Analisis data dapat dilakukan dengan mendekomposisikan suatu sinyal ke dalam komponen-komponen frekuensi yang berbeda-beda yang selanjutnya dapat dianalisis sesuai dengan skala resolusi atau level dekomposisi yang digunakan. Hal ini dapat digunakan untuk melihat dimana sinyal tersebut dalam domain waktu dapat dilewatkan ke dalam high pass atau low pass untuk memisahkan komponen frekuensi tinggi dan rendahnya.Koefisien dari transformasi wavelet diskrit secara matematis dapat dinyatakan sebagai berikut: (17)Dimana : a = 2j = dyadic scale; b = k2j = dyadic translation; j = level decomposition, k = discrete time constant.Transformasi wavelet diskrit dapat dilakukan dalam dua tahap yaitu dekomposisi dan rekonstruksi. Proses dekomposisi adalah mengurai suatu sinyal ke dalam komponen-komponen subband frekuensi yang berbeda dan selanjutnya masing-masing komponen tersebut dianalisis sesuai dengan skala resolusinya atau level dekomposisinya. Pada prosesnya sinyal akan dilewatkan pada wavelet decomposition filter yaitu high dan low. Hasil keluaran yang didapat dari Low pass filter adalah koefisien cA dan untuk high pass filter adalah koefisien cD. Proses filtering dapat dilihat pada skema seperti yang tersaji pada gambar 4 di bawah ini.

Gambar 10. Skema dekomposisi pada transformasi wavelet diskritBerdasarkan gambar di atas terlihat bahwa bagian aproksimasi A(t) mengandung nilai frekuensi yang rendah, sedangkan untuk bagian D(t) mengandung nilai frekuensi yang tinggi.Proses rekonstruksi adalah menggabungkan kembali komponen-komponen subband frekuensi yang berasal dari hasil proses dekomposisi. Proses yang dilakukan adalah melewatkan komponen tersebut pada wavelet reconstruction filter yaitu high pass dan low pass reconstruction filter. Proses rekonstruksi ini sering disebut inverse discrete wavelet transform. Keberhasilannya ditentukan oleh nilai kesalahan yang berasal dari selisih sinyal S. semakin kecil nilai kesalahannya semakin sempurna hasil rekosntruksinya. Secara lengkap proses dekomposisi dan rekonstruksi sinyal disajikan pada gambar 5 di bawah ini.

Gambar 11. Skema dekomposisi dan rekonstruksi sinyal dengan menggunakan DWT.Menurut D Lee Fugal, High pass reconstruction filter sering disebut wavelet function sedangkan untuk low pass reconstruction filter disebut scaling factor. Perbedaan diantara keduanya dapat dilihat dalam Tabel 2 di bawah ini.Tabel 2. Komponen fungsi transformasi wavelet diskritKomponenScaling FunctionWavelet Function

Nama LainLow Pass Reconstruction FilterHigh Pass Reconstruction Filter

Persamaan

Sifat

FungsiMenentukan aproksimasi (A)Menentukan detail (D)

Continuous Wavelet Transform (CWT) menganalisis sinyal dengan perubahan skala pada jendela yang dianalisis, pergeseran jendela dalam waktu dan perkalian sinyal serta mengintegral semuanya sepanjang waktu. Secara matematis transformasi wavelet kontinyu dapat dirumuskan sebgai berikut: (18)Dimana transformasi ini ditentukan oleh nilai parameter dilatasi (a) dan translasi (b) yang bervariasi secara kontinyu.Dilatasi dilakukan dengan ukuran skala untuk mendapatkan frekuesni yang sama dengan anomali atau kejadian lain. Sedangkan translasi atau pergerseran dilakukan dalam domain waktu sehingga dapat sejajar dengan kejadian yang dianalisis. Informasi tentang kapan dan frekuenis dari suatu kejadian dalam sinyal diperoleh dengan mengetahui skala dilatasi dan besar pergeseran saat wavelet tersebut sejajar dan berkorelasi dengan kejadian tersebut. Hal ini dapat ditunjukkan dengan nilai korelasi (C(a,b)): (19)Dimana a merupakan faktor skala (dilatasi) dan b merupakan faktor translasi.Aplikasi dari wavelet ini mencakup beberapa bidang diantaranya untuk memperbaiki komposisi citra misalnya untuk mempertajam citra, memperbaiki data radar misalnya untuk mendapatkan nilai reflektansi pada daerah yang tertutup awan, peramalan gempa bumi, dll.

KALMAN FILTERKalman filter adalah suatu alat yang digunakan untuk mengestimasi linear-quadratic problem yang mana inti permasalahannya adalah mengestimasi nilai/keadaan (state) dari sistem dinamik linier dari pengukuran yang berhubungan linier dengan nilai state yang dimaksud (Grewal, 2001). Kalman filter digunakan untuk mengestimasi nilai yang dianggap benar dari suatu data dari mulai data masih dikumpulkan (co-processing) dengan parameter berupa hasil ukuran dan ketidakpastiannya (uncertainty). Kalman filter disusun oleh persamaan-persamaan matematika yang digunakan untuk menghitung nilai state secara rekursif dengan prinsip kuadrat terkecil atau least squares (Welch, 2006). Dari penjelasan di atas, dapat diperoleh prinsip-prinsip matematika yang digunakan untuk membentuk Kalman filter seperti yang digambarkan pada Gambar 1.

Gambar 13. Konsep dasar pembentuk Kalman filter

Kalman filter dalam mengestimasi nilai/keadaan dari suatu sistem dinamik memperhitungkan seluruh data ukuran yang telah ada beserta karakteristik statistiknya seperti kovariansi. Di samping mengestimasi keadaan yang sekarang (current state), Kalman filter juga dapat menghitung nilai/keadaan pada waktu yang akan datang sesuai dengan model proses dan kontrol yang digunakan. Kemudian nilai prediksi ini akan dibandingkan dengan data ukuran yang baru, dan digunakan untuk menghitung estimasi nilai state yang aktual. Proses ini akan terus berulang (rekursif) sehingga Kalman filter disebut sebagai sistem yang belajar. Kalman filter menjadi satu penemuan yang sangat penting dalam teori estimasi. Kalman filter dapat digunakan untuk kontrol dari suatu sistem dinamik yang kompleks seperti proses-proses manufaktur. Kalman filter dan variannya seperti extended Kalman filter pada awalnya sangat popular digunakan untuk navigasi Apollo. Di samping itu, Kalman filter juga dapat digunakan untuk tracking objek bergerak, misal dalam keilmuan geodesi dan geomatika, hal ini digunakan untuk tracking satelit GPS. Dalam kaitannya dengan tracking posisi satelit GPS, Gambar 2 menjelaskan bagaimana Kalman filterdigunakan. Nilai posisi awal GPS misal menggunakan data broadcast ephemeris, kemudian data ini dibandingkan dengan data aktual hasil pengukuran. Dengan algoritma tertentu, Kalman akan memberikan koreksi untuk data pengukuran sehingga menjadi nilai state yang baru dan ketidakpastiannya. Nilai state baru yang baru tersebut kemudian digunakan untuk prediksi nilai state pada selang waktu berikutnya. Proses ini terus berulang (rekursif) sampai didapatkan nilai state yang dianggap benar.

Gambar 14. Ilustrasi penggunaan Kalman filter pada tracking GPS

Kalman filter memiliki berbagai manfaat dan keunggulan di antaranya adalah kemampuannya untuk menyelesaikan masalah untuk multi-variabel serta kombinasinya. Metode ini memungkinkan untuk pemrosesan data secara real time karena tidak perlu menunggu hingga data pengukuran cukup atau fix, proses ini bahkan dapat mengaktualkan sistem filtering-nya setiap kali pengukuran dilakukan (Zaknich, 2005). Di samping keunggulannya, Kalman filter juga memiliki beberapa kekurangan di antaranya adalah hanya dapat digunakan pada sistem dengan distribusi error Gaussian atau distribusi normal (white noise) dan sistem yang linear.Terdapat 3 proses penting dalam algoritma perhitungan Kalman filter, yaitu: 1) Perhitungan Kalman gain, 2) Perhitungan current state (nilai aktual), 3) Perhitungan New Error. Sebagaimana telah dijelaskan di atas bahwa proses ini adalah proses yang berulang dan rekursif. Proses ini diperlihatkan pada Persamaan 1, 2, dan 3.(20)(21)(22)di mana KG adalah Kalman gain, Eest dan Emea berturut-turut adalah error atau ketidakpastian dari nilai estimasi dan nilai ukuran, ESTt adalah nilai state pada saat t, MEA adalah hasil ukuran.Kalman gain adalah bobot yang didapat dari perbandingan nilai error estimasi dengan nilai error total (error estimasi + error pengukuran) seperti pada Persamaan 1. Nilai Kalman gain ini yang bervariasi dari 0 sampai 1 menandakan kualitas pengukuran dan stabilitas sistem kemudian digunakan untuk menghitung nilai aktual berdasarkan nilai sebelumnya dengan Persamaan 2. Perhatikan jika error pengukuran sangat kecil maka KG akan mendekati 1, dengan bobot besar, maka pengukuran akan dianggap benar sehingga nilai state yang baru akan mendekati hasil ukuran. Dengan semakin banyaknya data ukuran, maka Kalman gain akan semakin menurun seiring dengan konvergennya estimasi state pada suatu nilai/harga. Kemudian, nilai error estimasi yang baru dihitung lagi dengan Persamaan 3. Secara konseptual, proses ini telah menggambarkan bagaimana Kalman filter bekerja.Penjelasan yang lebih analitis dijelaskan sebagai berikut. Kalman filter mencoba mengestimasi nilai state yang baru berdasarkan suatu model proses(23)dan suatu model pengukuran (24)di mana xk adalah vektor state yang mengandung parameter sistem yang ingin diestimasi, uk adalah vektor kontrol yang mengandung variable yang mengontrol state, wk adalah vektor yang menyatakan noise pada modelestimasi tersebut, A adalah matriks yang menghubungkan estimasi pada k-1 dengan estimasi pada k, B adalah matriks yang menghubungkan state dengan input u atau perubahan x terhadap u. Sementara zk adalah vektor pengukuran, vk adalah vektor noise pada pengukuran dan H adalah matrik yang mentransformasikan ukuran state dari pengukuran.Konsep Kalman filter yang dijelaskan sebelumnya bahwa Kalman menestimasi state beserta ketidakpastiannya. Misalkan Pk adalah matriks kovariansi proses yang menyatakan kovariansi antara nilai-nilai parameter state yang mana secara rekursif dinyatakan sebagai(6)yang mana jika dianalogikan degan sitem Persmaan 1, 2, dan 3, nilai Pk adalah nilai error dalam estimasi Eest.Estimasi nilai Kalman gain seperti pada Persamaan 1, ditulis sebagai berikut(25)di mana R menyatakan matriks kovariansi dari pengukuran atau sensor.

Kemudian persamaan 2 dan 3 untuk mengupdate nilai state dan kovariansinya dianalogikan sebagai berikut(26)(27)Pada dasarnya persamaan-persamaan di atas, terdiri dari dua grup: persamaan time update dan persamaan measurement update. Persamaan time update bertugas untuk menentukan estimasi nilai state beserta kovariansi pada waktu berikutnya, sementara persamaan measurement update bertugas untuk menghitung estimasi aposteriori nilai state dan kovariansi berdasarkan estimasi apriori dan data ukuran. Berikut adalah ilustrasi dari proses time dan measurement update pada Gambar 3.

Gambar 15.Ilustrasi time dan measurement update.

Berikut adalah contoh langsung penerapan Kalman filter. Contoh ini disadur seluruhnya dari http://bilgin.esme.org/BitsBytes/KalmanFilterforDummies.aspx. Pada contoh ini beberapa persamaan disimplifikasi dengan beberaa asumsi sehingga menjadi

Gambar 16. Persamaan hasil simplifikasiMisal persamaan di atas akan digunakan untuk menestimasi nilai voltase berdasarkan data ukuran seperti pada Tabel 1. Data ukuran diasumsikan memiliki ketidakpastian (uncertainty) sebesar 0.1. Nilai awal estimasi untuk hitungan ditetapkan xk = 0, dan Pk = 1

Dengan algoritma perhitungan pada Gambar 4, didapat nilai state dan uncertainty-nya pada setiap saat iterasi pada Gambar 5. Tampak bahwa voltase semakin konvergen menuju 0.4 V saat error nya mendekati nol.

Gambar 17. Hasil hitungan dengan Kalman filterKalman filter dianggap sebagai penemuan yang sangat berpengaruh di abad ke-20 karena kemampuannya mengatasi masalah-masalah pada sistem dinamik. Dalam kaitannya dengan teknik analisis data, Kalman filter dapat digunakan sebagai tool untuk menganalisi data yang sifatnya deret waktu dan juga untuk memaksimalkan generation daripada informasi yang terkandung pada data (data mining).

DAFTAR PUSTAKA

Bogdan, Robert, C., Biklen, Sari, K. 1998. Qualitative Research in Education, an Introduction toTheory and Methods, Third Edition, Boston, Allyn and Bacon.Faragher, R. 2012 Understanding the Basis of the Kalman Filter Via a Simple and Intuitive Derivation. IEEE Signal Processing Magazine pp128-132Grewal et al. 2001. Kalman Filtering: Theory and Practice Using MATLAB 2nd Ed.http://bilgin.esme.org/BitsBytes/KalmanFilterforDummies.aspx diakses 15 Desember 2015http://ilecturesonline.com Special Topics : Kalman Filtering, diakses 14 Desember 2015Welch, G and Bishop, G. 2006. An Introduction to the Kalman Filter. Dept of Computer Science, University of North CarolinaZaknich, Anthony. 2005. Principle of Adaptive Filters and Self-learning Systems. Leipzig: Springer-VerlagFischer, Manfred M and Arthur Getis. 2010. Handbook of Applied Spatial Analysis : Software Tools, Methods and Applications. New York : Springer Fischer, Manfred M. and Jinfeng Wang. 2011. Spatial Data Analysis Models, Methods, Techniques. Bailet, T.C. and Gatrell, A. C. 1995. Interactive Spatial Data Analysis. Longman : HarlowFortin, Marie-Josee, M. Dale and J. Hoeff, 2002. Spatial Analysis in Ecology. Encyclopedia of Environmetrics, 4: 2051-2058.Legrendre, Pierre, 1993. Spatial Autocorrelation: Trouble or New Paradigm? Ecology, 74(6): 1659- 1673.Legrendre, Pierre and M.J. Fortin, 1989. Spatial pattern and ecological analysis. Vegetation 80: 107-138.Lichstein, Jeremy, T.R. Simons, S.A. Shriner and K.E. Franzreb, 2002. Spatial Autocorrelation and Autoregressive Models in Ecology. Ecological Monographs 73(3): 445-463.