09. eksplorasi data

10

Click here to load reader

Upload: ahmad-fakri-syaukhani

Post on 03-Jul-2015

343 views

Category:

Documents


7 download

TRANSCRIPT

Page 1: 09. Eksplorasi Data

5/11/2011

1

Pengantar Sistem Informasi Geografis

Pendahuluan Data GIS bisa terdiri atas puluhan layer dan ratusan

atribut: Mulai dari mana?

Atribut apa yang perlu dilihat?

Eksplorasi Data

Eksplorasi Data

Pengantar Sistem Informasi Geografis

Atribut apa yang perlu dilihat?

Relasi data apa yang tampak?

Eksplorasi dataanalisa & query yg berpusat pada data.

Eksplorasi data memungkinkan pengguna untuk: Melihat kecenderungan umum data

Melihat subset data lebih detil

Fokus pada relasi yang mungkin antar data

Pendahuluan Tujuan eksplorasi data

untuk memahami data dengan lebih baik

Langkah awal untuk formulasi hipotesa

Sebuah komponen yg penting dalam eksplorasi data

Eksplorasi Data

Pengantar Sistem Informasi Geografis

Sebuah komponen yg penting dalam eksplorasi data adalah adanya tools visual yg terhubung secarainteraktif dan dinamis

Eksplorasi data memungkinkan untuk melihat data dariperspektif yang berbeda memudahkan prosesinformasi dan sintesa

Bab ini eksplorasi data interaktif, query data vektor, query data raster, penggunaan diagram, visual geografis.

Eksplorasi Data Interaktif Ahli statistik terbiasa pakai diagram (histogram dan

scatterplot) struktur data dan pola data.

Histogram data dikelompokkan dalam kelas, nilainyaditunjukkan dengan batang

Eksplorasi Data

Pengantar Sistem Informasi Geografis

ditunjukkan dengan batang

Scatterplot penandaan nilai dua variabel dengankoordinat x,y

Eksplorasi data dalam statistik juga mencakup: 1) Exploratory data analysis promosikan penggunaan

teknik yang bervariasi dalam menilai data lebih efektifsebagai langkah awal analis statistik

Page 2: 09. Eksplorasi Data

5/11/2011

2

Eksplorasi Data Interaktif Eksplorasi data dalam statistik juga mencakup:

2) Dynamic Graphics memperkaya proses 1) dengangunakan windows yang beragam dan terkait secaradinamis juga memungkinkan pengguna memanipulasi

Eksplorasi Data

Pengantar Sistem Informasi Geografis

data langsung pada diagram Memudahkan melihat outliers

Metode umum dalam manipulasi data pada dynamic graphics mencakup selection, deletion, rotation, dantransformation. Contoh Brushing metode seleksi dan menandai subset data

dalam banyak view (satu scatterplot scatterplot lain)

Eksplorasi Data Interaktif Sejumlah diagram ada yang dirancang khusus. Misalkan

Box plot dan variogram cloud,

Data eksplorasi dalam GIS mirip dengan exploratory data analysis memungkinkan pengguna pada subset data

Eksplorasi Data

Pengantar Sistem Informasi Geografis

analysis memungkinkan pengguna pada subset data yang diamati.

Pada GIS melibatkan peta vektor dan raster, petayang tertaut dengan diagram, tabel dan grafik.

Kekhususan pada eksplorasi data GIS adalahketerkaitan antara data spasial dan data atribut. Mis: pengetahuan kondisi tanah dan lokasinya.

Eksplorasi Data Interaktif Keterkaitan data spasial dengan data atribut

karakteristik penting dalam model data vektor

Keterkaitan ini tidak terlalu penting pada data raster: 1) Raster gunakan sel dengan lokasi yang tetap

Eksplorasi Data

Pengantar Sistem Informasi Geografis

1) Raster gunakan sel dengan lokasi yang tetap

2) Raster tidak miliki data atribut

Query Data Vektor Query data atribut menampilkan subset data dari

sebuah peta, dengan memproses data atributnya.

Query data atribut memerlukan penggunaan ekspresiyang harus bisa di interpretasikan oleh aplikasi GIS atau

Eksplorasi Data

Pengantar Sistem Informasi Geografis

yang harus bisa di interpretasikan oleh aplikasi GIS atauDBMS. 1) Ekspresi Logika berisi operand dan operator logika

Kelas = 2

Operand ≈ field, angka, atau huruf

Operator logika bisa jadi (=), (>), (<), (≥), (≤), atau (<>)

operand

Operator logika

Page 3: 09. Eksplorasi Data

5/11/2011

3

Query Data Vektor Konektor Boolean adalah AND, OR, XOR, dan NOT

menghubungkan dua atau lebih ekspresi logika dalampernyataan query.

Contoh:

Eksplorasi Data

Pengantar Sistem Informasi Geografis

(Kelas = 2) AND (Umur < 8) keduanya harus benar

(Kelas = 2) OR (Umur < 8) salah satu atau keduanya benar

(Kelas = 2) XOR (Umur < 8) hanya salah satu yang benar

NOT (Kelas = 2) bukan kelas = 2 yang benar

NOT, AND, dan OR digunakan pada operasi Complement, Intersect, dan Union.

Query Data Vektor Complement A adalah elemen yg bukan A

(NOT A)

Intersect A dan B elemen yg dimilikiA dan B (A AND B)

Eksplorasi Data

A

Pengantar Sistem Informasi Geografis

A dan B (A AND B)

Union A dan B elemen yg dimiliki olehA atau B (A OR B)

Intersect R1

Union R1 + R2 + R3

A B

R2R1 R3

Query Data Vektor 2) Jenis Operasi

Query akan menghasilkan data yg terpilih dan yg tidak terpilih

Ada tiga jenis operasi yg dilakukan pada subset terpilih a) Add to Set menambah lebih banyak record pada subset

Eksplorasi Data

Pengantar Sistem Informasi Geografis

b) From Set dapat mengurangi subset ke subset yg lebih kecil

c) Switch Selection bertukar antara subset terpilih dengansubset tidak terpilih

3) Contoh operasi query a) Memilih data subset dan menambah data

[New Set] ( [Area] < 0.000043) AND ([Perimeter] < 0.032466 )

2 dari 36 terpilih

[Add to Set] ( [Area] < 0.000147 )

5 dari 36 terpilih

Query Data Vektor 3) Contoh operasi query

b) Memilih data subset dan Switch Selection [New Set] ( [Area] < 0.000439) and ([Perimeter] < 0.050542) and

([Kabkota_no] = "12" )

4 dari 36 terpilih

Eksplorasi Data

Pengantar Sistem Informasi Geografis

4 dari 36 terpilih

[Switch Selection]

32 dari 36 terpilih

c) Memilih data subset dan memilih subset yg lebih kecil [New Set] ( [Area] < 0.102943 )

23 dari 36 terpilih

[Select From Set] ( [Kabkota_no] = "12" )

5 dari 36 terpilih

Page 4: 09. Eksplorasi Data

5/11/2011

4

Query Data Vektor 4) Query database relasional

Dilakukan menggunakan database relational yang terdiri atastabel terpisah tapi saling terhubung.

Query tidak hanya pilih data dari satu tabel tapi juga dari tabell i t k it

Eksplorasi Data

Pengantar Sistem Informasi Geografis

lain yang terkait

Disukai untuk eksplorasi data

Pada ArcView bisa dilakukan perintah JOIN dan LINK Join menggabung data atribut dari dua atau lebih tabel ke dalam

satu tabel

Link tetap membiarkan tabel terpisah, tapi terkait secara dinamis

Tabel Source/Sumber Tabel Destination/TujuanLink

One-way

Query Data Vektor 4) Query database relasional

Pada ArcView bisa dilakukan perintah JOIN dan LINK

Link one-way membingungkan dalam eksplorasi data

Eksplorasi Data

Link

Pengantar Sistem Informasi Geografis

5) Memakai SQL untuk Query database SQL (Structured Query Language) bahasa manipulasi data

yang dirancang untuk database relasional

Dikembangkan IBM tahun 70 an

Sintaks dasar SQL : select<daftar atribut> from<relasi> where<kondisi>

Tabel Source/Sumber Tabel Destination/TujuanTwo-way

Query Data VektorPIN Sale

DateAcres Zone 

CodeZoning

P101 1‐10‐98 1.0 1 Residensial

P102 10‐6‐68 3.0 2 komersial

P k i l

Eksplorasi Data

Relasi 1: Persil

Pengantar Sistem Informasi Geografis

P103 3‐7‐97 2.5 2 komersial

P104 7‐30‐78 1.0 1 Residensial

PIN Owner Name

P101 Wang

P101 Chang

P102 Smith

P102 Jones

P103 Costello

P104 Smith

Relasi 2: Pemilik

Query Data Vektor 5) Memakai SQL untuk Query database

Contoh SQL sederhana (berdasarkan tabel sebelumnya) Mengquery Sale Date persil P101

Select sale date

From persil

Eksplorasi Data

Pengantar Sistem Informasi Geografis

From persil

Where PIN = “P101”

Query nama pemilik dari P104

Select owner name

From persil, pemilik

Where persil.PIN = pemilik.PIN AND PIN = “P104”

Page 5: 09. Eksplorasi Data

5/11/2011

5

Query Data Vektor 6) Deskripsi statistik untuk data atribut

Mencakup minimum, maksimum, range, mean, dan standardeviasi

Range perbedaan antara nilai maksimum dan minimum

St d d D i i k d i t t k d t d i i ti d t

Eksplorasi Data

Pengantar Sistem Informasi Geografis

Standard Deviasi akar dari rata-rata kuadrat deviasi tiap data terhadap nilai tengah

Query Data Vektor Query data spasial

Merupakan proses pengambilan data dari peta denganmemproses fitur petanya.

Fitur peta bisa dipilih dengan kursor, grafik, atau relasi

Eksplorasi Data

Pengantar Sistem Informasi Geografis

p p g , g ,spasial antara fitur-fitur dalam peta.

Query data spasial merupakan interface geografis terhadapdatabase berguna untuk hal yg tidak bisa dilakukanquery data atribut.

1) Seleksi fitur dengan kursor mengarahkan kursor padafitur yang ingin dipilih

2) Seleksi fitur dengan Grafik misalkan gunakanlingkaran, kotak, garis, atau poligon untuk memilih fitur peta

Query Data Vektor Query data spasial

Grafik yg dipakai untuk seleksidisebut selector graphic

Misal : pilih restoran berjarak 1

Eksplorasi Data

Pengantar Sistem Informasi Geografis

p jkm dari hotel, pilih tanah ygberpotongan dengan rencanapembangunan jalan

Query Data Vektor Query data spasial

3) Seleksi fitur dengan relasi spasial pemilihanberdasarkan relasi spasial terhadap fitur lainnya. Fitur yang dipilih bisa berada pada peta yang sama atau juga

Eksplorasi Data

Pengantar Sistem Informasi Geografis

y g p p p y g j gpada peta yg berbeda

Contoh: Memilih rest area pada jarak 50 km dari rest area tertentu

(keduanya ada dalam satu peta)

Menemukan rest area di masing-masing kabupaten di jabodetabek(perlu dua peta : batas kabupaten dan peta rest area)

Page 6: 09. Eksplorasi Data

5/11/2011

6

Query Data Vektor Query data spasial

3) Seleksi fitur dengan relasi spasial Relasi spasial yang digunakan dalam query mencakup:

a) Containment pilih fitur yang berada dalam fitur yang

Eksplorasi Data

Pengantar Sistem Informasi Geografis

) p y g y gdigunakan untuk seleksi

Mis: pilih sekolah di kabupaten tertentu, temukan hutan lindungdi propinsi tertentu

b) Intersect pilih fitur yg berpotongan dengan fitur yg digunakanuntuk seleksi

Mis: temukan bidang tanah yg berpotongan dengan rencanajalan, pilih desa yang berpotongan dengan daerah patahan.

c) Proximity pilih fitur yg berada pada jarak tertentu dari fituryang digunakan untuk seleksi

Query Data Vektor Query data spasial

4) Kombinasi query data spasial dan atribut Dalam banyak hal, eksplorasi data memerlukan baik query

data atribut maupun query data spasial

Eksplorasi Data

Pengantar Sistem Informasi Geografis

Mis: mencari SPBU dalam jarak 1 km dari pintu keluar toljagorawi dan memiliki omzet > 60 ribu liter per bulan a) cara pertama

Temukan lokasi pintu keluar tol jagorawi,

Buat lingkaran pada tiap pintu keluar dengan radius 1 km.

Pilih SPBU dalam lingkaran dengan query data spasial

Gunakan data query atribut untuk temukan SPBU beromzet > 60 ribu liter per bulan

Query Data Vektor Query data spasial

4) Kombinasi query data spasial dan atribut Mis: mencari SPBU dalam jarak 1 km dari pintu keluar tol

jagorawi dan memiliki omzet > 60 ribu liter per bulan

Eksplorasi Data

Pengantar Sistem Informasi Geografis

b) cara kedua

Temukan lokasi pintu keluar tol jagorawi,

Gunakan data query atribut untuk temukan SPBU beromzet > 60 ribu liter per bulan

Pilih SPBU dengan query data spasial untuk SPBU berjarak ≤ 1 km dari pintu keluar tol jagorawi

Cara pertama mungkin lebih baik (SPBU > pintu tol)

Sejumlah pengguna GIS memasukkan ini dalam kategorianalisa data

Query Data Raster Data raster bisa diquery menggunakan metoda nilai sel

atau metoda grafik

Pada grid integer dalam ArcView dan ArcInfo memilikitabel atribut seperti halnya dalam data vektor

Eksplorasi Data

Pengantar Sistem Informasi Geografis

tabel atribut seperti halnya dalam data vektor

Floating-point grid tidak punya tabel atribut query terbatas

Query berdasar nilai sel Metoda umum untuk query grid adalah menggunakan

ekspresi logika yang melibatkan nilai sel

Contoh : [jalan] = 1 query grid jalan integer

[elevasi] >= 2331.21 query grid elevasi floating point.

Page 7: 09. Eksplorasi Data

5/11/2011

7

Query Data Raster Query berdasar nilai sel

Data raster juga bisa gunakan konektor Boolean AND, OR dan NOT dalam querynya

Pernyataan majemuk (compound statement) bisa

Eksplorasi Data

Pengantar Sistem Informasi Geografis

y j ( p )diterapkan pada multiple grid (bisa integer maupun floating-point)

Query multiple grid berdasarkan nilai sel unik untuk data raster

Pada data vektor atribut yang digunakan dalamcompound statement, semuanya harus berada dalam tabelatribut yang sama.

Query Data Raster Query menggunakan metoda grafis

Menggunakan objek grafis seperti lingkaran, bujur sangkar, atau poligon.

Nilai sel yang berada dalam objek grafis, ditampilkan dalam

Eksplorasi Data

Pengantar Sistem Informasi Geografis

y g j g , phistogram

Pada ArcView terdapat tombol histogram untukmenampilkan histogram dengan nilai tertentu pada grid integer kisaran nilai pada grid floating-point.

Diagram Merupakan perangkat dasar untuk exploratory data

analysis.

Diagram terkait dengan peta dan tabel menandairecord tertentu pada tabel, akan terlihat pada peta dan

Eksplorasi Data

Pengantar Sistem Informasi Geografis

record tertentu pada tabel, akan terlihat pada peta dandiagram

ArcView punya keterbatasan dengan diagram: Record maksimum untuk diagram dengan 1 field adalah

100 record (mis: pada histogram), untuk dua field 50 record (mis: pada scatterplot)

Pilihan diagram terbatas untuk tampilkan satu atau dua set data

Diagram ArcView punya keterbatasan dengan diagram:

Interaktif dengan diagram terbatas pada dua perangkat: Menghapus, dan

Bisa menghapus data satu per satu pada diagram

Eksplorasi Data

Pengantar Sistem Informasi Geografis

g p p p g

Menghapus dengan poligon Bisa menghapus banyak data sekaligus dalam sebuah poligon

Page 8: 09. Eksplorasi Data

5/11/2011

8

Visualisasi Geografis Visualisasi Geografis Penggunaan peta untuk

membangun konteks untuk pemrosesan informasi visual

Metode visualisasi geografis:

1) Klasifikasi data

Eksplorasi Data

Pengantar Sistem Informasi Geografis

1) Klasifikasi data Merupakan metode umum untuk manpulasi peta

Bermanfaat untuk visualisasi data , pembuatan data atributbaru, dan peta baru

a) Klasifikasi data untuk visualisasi Dengan mengubah metoda klasifikasi dan jumlah kelas data yang

sama bisa hasilkan peta berbeda peta choropleth

Dalam eksplorasi data, klasifikasi sangat berguna untuk memisahkandata dengan deskripsi statistik

Visualisasi Geografis 1) Klasifikasi data

a) Klasifikasi data untuk visualisasi Mis: kita ingin melihat laju pengangguran di satu propinsi

Pertama bisa dibagi kelas berdasarkan laju diatas rata-rata atau di bawahi l

Eksplorasi Data

Pengantar Sistem Informasi Geografis

rata-rata nasional

Lalu bisa diklasifikasikan berdasar nilai tengah dan standar deviasi

b) Klasifikasi data untuk membuat data baru Data atribut baru pada peta berbasis vektor pilih subset data

dan berikan nilai pada subset tersebut

Pada data raster, proses ini termasuk re-klasifikasi, re coding, dan transforming melalui LUT (look up table)

Visualisasi Geografis

Eksplorasi Data

Pengantar Sistem Informasi Geografis

Visualisasi Geografis

Eksplorasi Data

Pengantar Sistem Informasi Geografis

Page 9: 09. Eksplorasi Data

5/11/2011

9

Visualisasi Geografis Agregasi spasial

Mirip dengan klasifikasi data ini mengelompokkan data secara spasial

Pengelompokkan bisa berdasar provinsi, wilayah.

Eksplorasi Data

Pengantar Sistem Informasi Geografis

g p p , y

Bisa juga berdasarkan jarak dari titik, garis atau area tertentu Mis: daerah urban bisa ditentukan berdasar jarak dari pusat

kota.

Agregasi spasial untuk data raster persiapkan resolusigrid yang lebih kasar dan hitung nilai pada sel yang lebihbesar

Visualisasi Geografis

Eksplorasi Data

Pengantar Sistem Informasi Geografis

Visualisasi Geografis

Eksplorasi Data

Pengantar Sistem Informasi Geografis

Visualisasi Geografis Perbandingan peta

Membantu pengguna GIS untuk mensortir relasi antaradata thematik yang berbeda yang ditampilkan pada peta.

Mis: menampilkan lokasi kehidupan hewan liar pada peta

Eksplorasi Data

Pengantar Sistem Informasi Geografis

p p p pvegetasi memberi kesan asosiasi antara spesies hewandengan jenis tumbuhan

Jika peta yang dibandingkan berupa titik atau garis dapatdiberi kode dan warna berbeda lalu ditampilkan pada satuview

Proses tersebut tidak berlaku pada peta raster

Page 10: 09. Eksplorasi Data

5/11/2011

10

Visualisasi Geografis Perbandingan peta

Ada tiga pilihan untuk membandingkan peta raster: 1) menempatkan semua poligon dan peta raster, juga titik dan

garis pada satu layar. Tetapi peta poligon dan raster hanya bisa

Eksplorasi Data

Pengantar Sistem Informasi Geografis

ditampilkan bergiliran.

2) membuka dua atau lebih view dapat dilihat peta poligonatau raster secara bersamaan Ini berguna untuk melihat perubahan sementara

3) gunakan simbol peta dapat perlihatkan data dari duatheme poligon. Diantaranya menggunakan diagram batang

Atau pada peta choropleth

Visualisasi Geografis

Eksplorasi Data

Pengantar Sistem Informasi Geografis

Visualisasi Geografis

Eksplorasi Data

Pengantar Sistem Informasi Geografis