deteksi pencilan data titik panas di provinsi riau menggunakan algoritme local outlier factor

Post on 12-Aug-2015

253 Views

Category:

Science

5 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Shofyan G64134009Dibimbing oleh

Dr Imas Sukaesih Sitanggang, SSi MKom

Departemen Ilmu KompputerFakultas Ilmu Pengetahuan Alam dan MatematikaInstitut Pertanian Bogor 2015

Deteksi Pencilan Data Titik Api di Provinsi Riau Menggunakan

Algoritme Local Outlier Factor

• Latar Belakang• Penelitian Sebelumnya• Rumusan Masalah• Tujuan dan Manfaat• Ruang Lingkup• Metode• Lingkungan Pengembangan• Jadwal Penelitian• Daftar Pustaka

Why

How

Outline

2

• Baehaki D. 2014. Deteksi Pencilan Data Titik Panas Di Provinsi Riau Menggunakan Algoritme Clustering K-means [Skripsi]. Bogor(id): Insitut Pertanian Bogor.

• Cahyadarena M B. 2014. Deteksi Pencilan Pada Data Titik Panas Menggunakan Clustering Berbasis Medoids [Skripsi]. Bogor(id): Insitut Pertanian Bogor.

Penelitian Sebelumnya

4

• Bagaimana pencilan diidentifikasi dari data titik panas menggunakan metode local outlier factor dan informasi tentang karakteristik pencilan titik panas.

Rumusan Masalah

5

• Menentukan pencilan pada data titik panas di Provinsi Riau berdasarkan hasil algoritme local outlier factor data titik panas di Provinsi Riau.

• Analisis pencilan data titik panas yang dihasilkan berdasarkan aspek lokasi dan waktu.

Tujuan

6

Mengidentifikasi wilayah yang beresiko terjadi kebakaran hutan

Manfaat

7Sumber gambar:https://www.flickr.com/photos/gpsea/3813694681/in/album-72157621893775165/

Ruang Lingkup

8

Pencilan local Library DMwR package R

Ruang lingkup dari penelitian ini meliputi Pencilan yang dideteksi adalah pencilan lokal dan

Implementasi menggunakan library DMwR package R

Tahapan Penelitian

9

Deteksi pencilan titik panas

menggunakan algoritme local

outlier factor

Praproses data

Mulai Pengumpulandata titik panas

Visualisasi data

Selesai

Analisis pencilan

Pengumpulan Data Titik Panas

10

LATITUDE 2.0100000000

LONGITUDE 100.4560000000

BRIGHTNESS 314.4000000000

SCAN 1.0000000000

TRACK 1.0000000000

ACQ_DATE 1/7/2001

ACQ_TIME 0358

SATELLITE T

CONFIDENCE 61

VERSION 5.1

BRIGHT_T31 300.4000000000

FRP 10.3000000000

Januari 2001 – Maret 2015Source: https://

earthdata.nasa.gov/earth-observation-data/near-real-time/firms/active-fire-data

11

Praproses Data

13

LATITUDE 2.0100000000LONGITUDE 100.4560000000BRIGHTNESS 314.4000000000SCAN 1.0000000000TRACK 1.0000000000ACQ_DATE 1/7/2001ACQ_TIME 0358SATELLITE TCONFIDENCE 61VERSION 5.1BRIGHT_T31 300.4000000000FRP 10.3000000000

LATITUDE 2.0100000000

LONGITUDE 100.4560000000

ACQ_DATE 1/7/2001

• Membersihkan data titik api dari wilayah selain Provinsi Riau • Memilih atribut data titik api • Agregasi data

Deteksi Pencilan dengan Local Outlier Factor (Beunig 2000)

14

PencilanGlobal

Pencilan Local

Sebuah objek local outlier factor adalah rasio rataan dari o degan jarak k-ketetanggan lokal terdekat. Beunig (2000):

Local Outlier Factor (Beunig 2000)

15

reach-dist k (p, o) = max { k-distance(o), d(p, o) }.

dengank = jumlah

tetanggadistance = fungsi jaraklrd = local

reachability densityLOF = local outlier

factor

Visualisasi Data

16

Visualisasi dengan titik panas menggunakan pendekatan spasial

Sumber gambar:http://geospasial.bnpb.go.id/monitoring/hotspot/

Analisis Pencilan

17

Pencilan Local

• Ukuran Pemusatan Pencilan• Waktu Terjadinya Pencilan

Pada tahap ini diperlihatkan objek-objek pencilan dari data penelitian. Data hasil deteksi pencilan dianalisis untuk mengetahui informasi yang terdapat pada data

• Intel(R) Core(TM) i7-5500U 2.40GHz • RAM 12288 MB.

Lingkungan Pengembang

18

Kegiatan Tahun 20154 5 6 7 8 9 10 11 12

Penyusunan proposal Pengumpulan data Praproses data Kolokium Implementasi Local outlier factor Evaluasi hasil penelitian Penyusunan skripsi dan makalah seminar Seminar Sidang tugas akhir Revisi Skripsi dan penyelesaian Lulus (SKL)

Jadwal Penelitian

19

Daftar Pustaka

20

Baehaki D. 2014. Deteksi pencilan data titik panas di provinsi Riau menggunakan algoritme clustering K-Means [skripsi]. Bogor(ID): Insitut Pertanian Bogor.

Beunig Markus M, Kriegel Hans-Peter, Ng Raymond T, Sander J. 2000. LOF: Identifying Density-Based Local Outliers. ACM SIGMOD international conference on Management of data; 2, June 2000; New York, USA. New York (USA): ACM SIGMOD Volume 29 Issue Pages 93-104

Cahyadarena M B.2014. Deteksi Pencilan Pada Data Titik Panas Menggunakan Clustering Berbasis Medoids [skripsi]. Bogor(ID): Insitut Pertanian Bogor.

Terima kasihshofyanipb@gmail.com

Frequent Answer Question

21

• Bagaimana cara kerja algoritme LOF dengan data set kecil? (12 slide) • Kenapa Menggunakan library R, Tidak

membuat dari awal? (1 slide)• Data mengapa menggunakan algoritme Local

Outlier Factor? (2 slide)• Kenapa harus menggunakan analisis deteksi

pencilan? (1 sllide)• Apa itu titik panas? (1 slide)• Apa dampak kebakaran hutan? (1 slide)

GO

GO

GO

GO

GO

GO

Algoritme LOF dengan data set kecil

22

Data 4 data titik:a(0, 0), b(0, 1), c(1, 1), d(3, 0)

Hitung LOF untuk setiap titik dan tunjukkan 1 outlier teratas, dengan k = 2 dan fungsi jarak Manhattan

Langkah 1: menghitung semua jarak antara masing-masing dua titik data

23

a(0, 0), b(0, 1), c(1, 1), d(3, 0)

dist(a, b) = 1dist(a, c) = 2dist(a, d) = 3dist(b, c) = 1dist(b, d) = 3+1=4dist(c, d) = 2+1=3

Langkah 2: menghitung semua dist2 (o)

24

dist k (o): jarak antara o dan yang k-thNN (tetangga terdekat k-th)

dist2 (a) = dist (a, c) = 2 (c = ke-2 tetangga terdekat)

dist2 (b) = dist (b, a) = 1 (a / c ke-2 tetangga terdekat)

dist2 (c) = dist (c, a) = 2 (a ke-2 tetangga terdekat)

dist2 (d) = dist (d, a) = 3 (a / c ke-2 tetangga terdekat)

Langkah 3: menghitung semua Nk (o)

25

N2 (a) = {b, c}

N2 (b) = {a, c}

N2 (c) = {b, a}

N2 (d) = {a, c}

k-distance neighborhood dari o, N k (o) = {o’| o’ in D, dist(o, o’) ≤ dist k (o)}

Langkah 4: menghitung semua lrdk (o)

26

reach-dist k (p, o) = max { k-distance(o), d(p, o) }

Langkah 4: menghitung semua lrdk (o)

27

reach-distk (p, o) = max { k-distance(o), d(p, o) }

| Nk (o) | = jumlah anggota pada Nk (o)Contoh N2 (a) = {b, c} = 2

Langkah 4: menghitung semua lrdk (o)

28

reach-distk (p, o) = max { k-distance(o), d(p, o) }

=0.667

reachdist2 (b, a) = max{dist2(b), dist(b, a)} = max{1, 1} = 1reachdist2 (c, a) = max{dist2(c), dist(c, a)} = max{2, 2} = 2

Langkah 4: menghitung semua lrdk (o)

29

=0.5

=0.667

=0.33

Lakukan juga terhadap titik yang lain

Langkah 5: menghitung semua LOFk (o)

30

=0.5

=0.667

=0.33

Lakukan juga terhadap titik yang lain

Langkah 5: menghitung semua LOFk (o)

31

x

Langkah 5: menghitung semua LOFk (o)

32

LOF 2 (a) = (lrd 2 (b) + lrd 2 (c)) * ( reachdist 2 (a,b) + reachdist 2 (a,c)) = (0.5+0.667) * (1+2) = 3.501

LOF 2 (b) = (lrd 2 (a) + lrd 2 (c)) * ( reachdist 2 (b,a) + reachdist 2 (b,c)) = (0.667+0.667) * (2+2) = 5.336

LOF 2 (c) = (lrd 2 (b) + lrd 2 (a)) * ( reachdist 2 (c,b) + reachdist 2 (c,a)) = (0.5+0.667) * (1+2) = 3.501

LOF 2 (d) = (lrd 2 (a) + lrd 2 (c)) * ( reachdist 2 (d,a) + reachdist 2 (d,c)) = (0.667+0.667) * (3+3) = 8.004

Langkah 6: Urutkan semua LOFk (o)

33

LOF2(d) = 8.004LOF2(b) = 5.336LOF2 (a) = 3.501LOF2 (c) = 3.501

Data 4 data titik:a(0, 0), b(0, 1), c(1, 1), d(3, 0)Outlier teratas adalah titik d.

Back to list FAQ

Mengapa Menggunakan R ?

33

• R Gratis :open-source project

• R adalah bahasa. : experimentation and exploration

• Graphics dan data visualization

• Access to powerful :Akademisi Terkemuka dan peneliti

dari seluruh dunia menggunakan R. Lebih dari 2000

packages yang memperluas library R

• A robust, community yang ramai

• R is excellent for "mash-ups" : Mysql,Apache web

server, Google API, Quatum GIS, Postgres

Back to list FAQ

Mengapa Menggunakan LOF ?

34

• Baehaki D. 2014. Deteksi Pencilan Data Titik Panas Di Provinsi Riau Menggunakan Algoritme Clustering K-means [Skripsi]. Bogor(id): Insitut Pertanian Bogor.

• Cahyadarena M B. 2014. Deteksi Pencilan Pada Data Titik Panas Menggunakan Clustering Berbasis Medoids [Skripsi]. Bogor(id): Insitut Pertanian Bogor.

• Risti. 2015 . 2014. Deteksi Pencilan Pada Data Titik Panas Menggunakan DB Scan [Skripsi]. Bogor(id): Insitut Pertanian Bogor. (Masih Proses)

• SUCI A M Y A .2015. Aplikasi Berbasis Web untuk Mendeteksi Pencilan Titik PanasMenggunakan Algoritme Clustering K-Means dan Framework Shiny. [Skripsi]. Bogor(id): Insitut Pertanian Bogor. (Masih Proses)

Back to list FAQ

Mengapa Menggunakan LOF ?

35Sumber gambar:https://upload.wikimedia.org/wikipedia/commons/4/4e/LOF-idea.svg

• Ide dasar dari LOF: membandingkan kepadatan lokal titik dengan kepadatan tetangganya. A memiliki kepadatan yang jauh lebih rendah dibandingkan tetangganya.

Back to list FAQ

Kenapa menggunakan analisis pencilan?

36

• Agar segera diselidiki sumber titik panas, apakah berbahaya atau tidak

• Karena jika pencilan itu adalah Kebakaran, harus diselidiki lagi kenapa terjadi kebakaran di daerah tersebut

• Mencegah terjadinya kebakaran berdasarkan karakteristik pencilan titik panas.

Back to list FAQ

Apa itu titik panas?

36

• Titik panas merupakan suatu daerah di permukaan bumi yang memiliki suhu relatif lebih tinggi dibandingkan daerah di sekitarnya berdasarkan ambang batas suhu tertentu (Suwarsono et al 2013).

• Ambang batas yang digunakan oleh Kementrian Kehutanan dan Japan International Cooperation Agency untuk data titik panas satelit NOAA adalah 315o K atau 42o C (Guswanto dan Heriyanto 2009).

Guswanto, Heriyanto E. 2009. Operational Weather System for National Fire Danger Rating. Jurnal Meteorologi dan Geofisika. 10(2): 77-87

Suwarsono, Rokhmatuloh, Waryono T. 2013. Pengembangan ModelIdentifikasi Daerah Bekas Kebakaran Hutan dan Lahan (Burned Area) Menggunakan Citra MODIS di Kalimantan [Model Development of Burned

Area Identification Using MODIS Imagery in Kalimantan]. Jurnal Penginderaan Jauh. 10(2): 93-112.

Back to list FAQ

Apa dampak kebakaran hutan?

36

Menurut Sri Lestari S .2000. Dampak Dan Antisipasi Kebakaran Hutan . Jurnal Teknologi Lingkungan. 1(2) :171-175.

• Polusi Udara • Konsentrasi Debu meningkat antara 300 % hingga 700 %• Jarak Pandang (Visibility)• Penurunan Intensitas Curah Hujan.

Menurut Rasyid F .2014.Permasalahan dan Dampak Kebakaran Hutan.Jurnal Lingkar Widyaiswara. 1(4: 47-49

• kerugian antara US $ 2,84 - US $ 4,86 milyar • Berbagai jenis kayu kini telah menjadi langka. Kayu eboni

(Dyospyros ebenum dan D. celebica), kayu ulin (Eusyderoxylon zwageri), ramin (Gonystylus bancanus), dan beberapa jenis meranti (Shorea spp.)

Back to list FAQ

top related