09. eksplorasi data
TRANSCRIPT
5/11/2011
1
Pengantar Sistem Informasi Geografis
Pendahuluan Data GIS bisa terdiri atas puluhan layer dan ratusan
atribut: Mulai dari mana?
Atribut apa yang perlu dilihat?
Eksplorasi Data
Eksplorasi Data
Pengantar Sistem Informasi Geografis
Atribut apa yang perlu dilihat?
Relasi data apa yang tampak?
Eksplorasi dataanalisa & query yg berpusat pada data.
Eksplorasi data memungkinkan pengguna untuk: Melihat kecenderungan umum data
Melihat subset data lebih detil
Fokus pada relasi yang mungkin antar data
Pendahuluan Tujuan eksplorasi data
untuk memahami data dengan lebih baik
Langkah awal untuk formulasi hipotesa
Sebuah komponen yg penting dalam eksplorasi data
Eksplorasi Data
Pengantar Sistem Informasi Geografis
Sebuah komponen yg penting dalam eksplorasi data adalah adanya tools visual yg terhubung secarainteraktif dan dinamis
Eksplorasi data memungkinkan untuk melihat data dariperspektif yang berbeda memudahkan prosesinformasi dan sintesa
Bab ini eksplorasi data interaktif, query data vektor, query data raster, penggunaan diagram, visual geografis.
Eksplorasi Data Interaktif Ahli statistik terbiasa pakai diagram (histogram dan
scatterplot) struktur data dan pola data.
Histogram data dikelompokkan dalam kelas, nilainyaditunjukkan dengan batang
Eksplorasi Data
Pengantar Sistem Informasi Geografis
ditunjukkan dengan batang
Scatterplot penandaan nilai dua variabel dengankoordinat x,y
Eksplorasi data dalam statistik juga mencakup: 1) Exploratory data analysis promosikan penggunaan
teknik yang bervariasi dalam menilai data lebih efektifsebagai langkah awal analis statistik
5/11/2011
2
Eksplorasi Data Interaktif Eksplorasi data dalam statistik juga mencakup:
2) Dynamic Graphics memperkaya proses 1) dengangunakan windows yang beragam dan terkait secaradinamis juga memungkinkan pengguna memanipulasi
Eksplorasi Data
Pengantar Sistem Informasi Geografis
data langsung pada diagram Memudahkan melihat outliers
Metode umum dalam manipulasi data pada dynamic graphics mencakup selection, deletion, rotation, dantransformation. Contoh Brushing metode seleksi dan menandai subset data
dalam banyak view (satu scatterplot scatterplot lain)
Eksplorasi Data Interaktif Sejumlah diagram ada yang dirancang khusus. Misalkan
Box plot dan variogram cloud,
Data eksplorasi dalam GIS mirip dengan exploratory data analysis memungkinkan pengguna pada subset data
Eksplorasi Data
Pengantar Sistem Informasi Geografis
analysis memungkinkan pengguna pada subset data yang diamati.
Pada GIS melibatkan peta vektor dan raster, petayang tertaut dengan diagram, tabel dan grafik.
Kekhususan pada eksplorasi data GIS adalahketerkaitan antara data spasial dan data atribut. Mis: pengetahuan kondisi tanah dan lokasinya.
Eksplorasi Data Interaktif Keterkaitan data spasial dengan data atribut
karakteristik penting dalam model data vektor
Keterkaitan ini tidak terlalu penting pada data raster: 1) Raster gunakan sel dengan lokasi yang tetap
Eksplorasi Data
Pengantar Sistem Informasi Geografis
1) Raster gunakan sel dengan lokasi yang tetap
2) Raster tidak miliki data atribut
Query Data Vektor Query data atribut menampilkan subset data dari
sebuah peta, dengan memproses data atributnya.
Query data atribut memerlukan penggunaan ekspresiyang harus bisa di interpretasikan oleh aplikasi GIS atau
Eksplorasi Data
Pengantar Sistem Informasi Geografis
yang harus bisa di interpretasikan oleh aplikasi GIS atauDBMS. 1) Ekspresi Logika berisi operand dan operator logika
Kelas = 2
Operand ≈ field, angka, atau huruf
Operator logika bisa jadi (=), (>), (<), (≥), (≤), atau (<>)
operand
Operator logika
5/11/2011
3
Query Data Vektor Konektor Boolean adalah AND, OR, XOR, dan NOT
menghubungkan dua atau lebih ekspresi logika dalampernyataan query.
Contoh:
Eksplorasi Data
Pengantar Sistem Informasi Geografis
(Kelas = 2) AND (Umur < 8) keduanya harus benar
(Kelas = 2) OR (Umur < 8) salah satu atau keduanya benar
(Kelas = 2) XOR (Umur < 8) hanya salah satu yang benar
NOT (Kelas = 2) bukan kelas = 2 yang benar
NOT, AND, dan OR digunakan pada operasi Complement, Intersect, dan Union.
Query Data Vektor Complement A adalah elemen yg bukan A
(NOT A)
Intersect A dan B elemen yg dimilikiA dan B (A AND B)
Eksplorasi Data
A
Pengantar Sistem Informasi Geografis
A dan B (A AND B)
Union A dan B elemen yg dimiliki olehA atau B (A OR B)
Intersect R1
Union R1 + R2 + R3
A B
R2R1 R3
Query Data Vektor 2) Jenis Operasi
Query akan menghasilkan data yg terpilih dan yg tidak terpilih
Ada tiga jenis operasi yg dilakukan pada subset terpilih a) Add to Set menambah lebih banyak record pada subset
Eksplorasi Data
Pengantar Sistem Informasi Geografis
b) From Set dapat mengurangi subset ke subset yg lebih kecil
c) Switch Selection bertukar antara subset terpilih dengansubset tidak terpilih
3) Contoh operasi query a) Memilih data subset dan menambah data
[New Set] ( [Area] < 0.000043) AND ([Perimeter] < 0.032466 )
2 dari 36 terpilih
[Add to Set] ( [Area] < 0.000147 )
5 dari 36 terpilih
Query Data Vektor 3) Contoh operasi query
b) Memilih data subset dan Switch Selection [New Set] ( [Area] < 0.000439) and ([Perimeter] < 0.050542) and
([Kabkota_no] = "12" )
4 dari 36 terpilih
Eksplorasi Data
Pengantar Sistem Informasi Geografis
4 dari 36 terpilih
[Switch Selection]
32 dari 36 terpilih
c) Memilih data subset dan memilih subset yg lebih kecil [New Set] ( [Area] < 0.102943 )
23 dari 36 terpilih
[Select From Set] ( [Kabkota_no] = "12" )
5 dari 36 terpilih
5/11/2011
4
Query Data Vektor 4) Query database relasional
Dilakukan menggunakan database relational yang terdiri atastabel terpisah tapi saling terhubung.
Query tidak hanya pilih data dari satu tabel tapi juga dari tabell i t k it
Eksplorasi Data
Pengantar Sistem Informasi Geografis
lain yang terkait
Disukai untuk eksplorasi data
Pada ArcView bisa dilakukan perintah JOIN dan LINK Join menggabung data atribut dari dua atau lebih tabel ke dalam
satu tabel
Link tetap membiarkan tabel terpisah, tapi terkait secara dinamis
Tabel Source/Sumber Tabel Destination/TujuanLink
One-way
Query Data Vektor 4) Query database relasional
Pada ArcView bisa dilakukan perintah JOIN dan LINK
Link one-way membingungkan dalam eksplorasi data
Eksplorasi Data
Link
Pengantar Sistem Informasi Geografis
5) Memakai SQL untuk Query database SQL (Structured Query Language) bahasa manipulasi data
yang dirancang untuk database relasional
Dikembangkan IBM tahun 70 an
Sintaks dasar SQL : select<daftar atribut> from<relasi> where<kondisi>
Tabel Source/Sumber Tabel Destination/TujuanTwo-way
Query Data VektorPIN Sale
DateAcres Zone
CodeZoning
P101 1‐10‐98 1.0 1 Residensial
P102 10‐6‐68 3.0 2 komersial
P k i l
Eksplorasi Data
Relasi 1: Persil
Pengantar Sistem Informasi Geografis
P103 3‐7‐97 2.5 2 komersial
P104 7‐30‐78 1.0 1 Residensial
PIN Owner Name
P101 Wang
P101 Chang
P102 Smith
P102 Jones
P103 Costello
P104 Smith
Relasi 2: Pemilik
Query Data Vektor 5) Memakai SQL untuk Query database
Contoh SQL sederhana (berdasarkan tabel sebelumnya) Mengquery Sale Date persil P101
Select sale date
From persil
Eksplorasi Data
Pengantar Sistem Informasi Geografis
From persil
Where PIN = “P101”
Query nama pemilik dari P104
Select owner name
From persil, pemilik
Where persil.PIN = pemilik.PIN AND PIN = “P104”
5/11/2011
5
Query Data Vektor 6) Deskripsi statistik untuk data atribut
Mencakup minimum, maksimum, range, mean, dan standardeviasi
Range perbedaan antara nilai maksimum dan minimum
St d d D i i k d i t t k d t d i i ti d t
Eksplorasi Data
Pengantar Sistem Informasi Geografis
Standard Deviasi akar dari rata-rata kuadrat deviasi tiap data terhadap nilai tengah
Query Data Vektor Query data spasial
Merupakan proses pengambilan data dari peta denganmemproses fitur petanya.
Fitur peta bisa dipilih dengan kursor, grafik, atau relasi
Eksplorasi Data
Pengantar Sistem Informasi Geografis
p p g , g ,spasial antara fitur-fitur dalam peta.
Query data spasial merupakan interface geografis terhadapdatabase berguna untuk hal yg tidak bisa dilakukanquery data atribut.
1) Seleksi fitur dengan kursor mengarahkan kursor padafitur yang ingin dipilih
2) Seleksi fitur dengan Grafik misalkan gunakanlingkaran, kotak, garis, atau poligon untuk memilih fitur peta
Query Data Vektor Query data spasial
Grafik yg dipakai untuk seleksidisebut selector graphic
Misal : pilih restoran berjarak 1
Eksplorasi Data
Pengantar Sistem Informasi Geografis
p jkm dari hotel, pilih tanah ygberpotongan dengan rencanapembangunan jalan
Query Data Vektor Query data spasial
3) Seleksi fitur dengan relasi spasial pemilihanberdasarkan relasi spasial terhadap fitur lainnya. Fitur yang dipilih bisa berada pada peta yang sama atau juga
Eksplorasi Data
Pengantar Sistem Informasi Geografis
y g p p p y g j gpada peta yg berbeda
Contoh: Memilih rest area pada jarak 50 km dari rest area tertentu
(keduanya ada dalam satu peta)
Menemukan rest area di masing-masing kabupaten di jabodetabek(perlu dua peta : batas kabupaten dan peta rest area)
5/11/2011
6
Query Data Vektor Query data spasial
3) Seleksi fitur dengan relasi spasial Relasi spasial yang digunakan dalam query mencakup:
a) Containment pilih fitur yang berada dalam fitur yang
Eksplorasi Data
Pengantar Sistem Informasi Geografis
) p y g y gdigunakan untuk seleksi
Mis: pilih sekolah di kabupaten tertentu, temukan hutan lindungdi propinsi tertentu
b) Intersect pilih fitur yg berpotongan dengan fitur yg digunakanuntuk seleksi
Mis: temukan bidang tanah yg berpotongan dengan rencanajalan, pilih desa yang berpotongan dengan daerah patahan.
c) Proximity pilih fitur yg berada pada jarak tertentu dari fituryang digunakan untuk seleksi
Query Data Vektor Query data spasial
4) Kombinasi query data spasial dan atribut Dalam banyak hal, eksplorasi data memerlukan baik query
data atribut maupun query data spasial
Eksplorasi Data
Pengantar Sistem Informasi Geografis
Mis: mencari SPBU dalam jarak 1 km dari pintu keluar toljagorawi dan memiliki omzet > 60 ribu liter per bulan a) cara pertama
Temukan lokasi pintu keluar tol jagorawi,
Buat lingkaran pada tiap pintu keluar dengan radius 1 km.
Pilih SPBU dalam lingkaran dengan query data spasial
Gunakan data query atribut untuk temukan SPBU beromzet > 60 ribu liter per bulan
Query Data Vektor Query data spasial
4) Kombinasi query data spasial dan atribut Mis: mencari SPBU dalam jarak 1 km dari pintu keluar tol
jagorawi dan memiliki omzet > 60 ribu liter per bulan
Eksplorasi Data
Pengantar Sistem Informasi Geografis
b) cara kedua
Temukan lokasi pintu keluar tol jagorawi,
Gunakan data query atribut untuk temukan SPBU beromzet > 60 ribu liter per bulan
Pilih SPBU dengan query data spasial untuk SPBU berjarak ≤ 1 km dari pintu keluar tol jagorawi
Cara pertama mungkin lebih baik (SPBU > pintu tol)
Sejumlah pengguna GIS memasukkan ini dalam kategorianalisa data
Query Data Raster Data raster bisa diquery menggunakan metoda nilai sel
atau metoda grafik
Pada grid integer dalam ArcView dan ArcInfo memilikitabel atribut seperti halnya dalam data vektor
Eksplorasi Data
Pengantar Sistem Informasi Geografis
tabel atribut seperti halnya dalam data vektor
Floating-point grid tidak punya tabel atribut query terbatas
Query berdasar nilai sel Metoda umum untuk query grid adalah menggunakan
ekspresi logika yang melibatkan nilai sel
Contoh : [jalan] = 1 query grid jalan integer
[elevasi] >= 2331.21 query grid elevasi floating point.
5/11/2011
7
Query Data Raster Query berdasar nilai sel
Data raster juga bisa gunakan konektor Boolean AND, OR dan NOT dalam querynya
Pernyataan majemuk (compound statement) bisa
Eksplorasi Data
Pengantar Sistem Informasi Geografis
y j ( p )diterapkan pada multiple grid (bisa integer maupun floating-point)
Query multiple grid berdasarkan nilai sel unik untuk data raster
Pada data vektor atribut yang digunakan dalamcompound statement, semuanya harus berada dalam tabelatribut yang sama.
Query Data Raster Query menggunakan metoda grafis
Menggunakan objek grafis seperti lingkaran, bujur sangkar, atau poligon.
Nilai sel yang berada dalam objek grafis, ditampilkan dalam
Eksplorasi Data
Pengantar Sistem Informasi Geografis
y g j g , phistogram
Pada ArcView terdapat tombol histogram untukmenampilkan histogram dengan nilai tertentu pada grid integer kisaran nilai pada grid floating-point.
Diagram Merupakan perangkat dasar untuk exploratory data
analysis.
Diagram terkait dengan peta dan tabel menandairecord tertentu pada tabel, akan terlihat pada peta dan
Eksplorasi Data
Pengantar Sistem Informasi Geografis
record tertentu pada tabel, akan terlihat pada peta dandiagram
ArcView punya keterbatasan dengan diagram: Record maksimum untuk diagram dengan 1 field adalah
100 record (mis: pada histogram), untuk dua field 50 record (mis: pada scatterplot)
Pilihan diagram terbatas untuk tampilkan satu atau dua set data
Diagram ArcView punya keterbatasan dengan diagram:
Interaktif dengan diagram terbatas pada dua perangkat: Menghapus, dan
Bisa menghapus data satu per satu pada diagram
Eksplorasi Data
Pengantar Sistem Informasi Geografis
g p p p g
Menghapus dengan poligon Bisa menghapus banyak data sekaligus dalam sebuah poligon
5/11/2011
8
Visualisasi Geografis Visualisasi Geografis Penggunaan peta untuk
membangun konteks untuk pemrosesan informasi visual
Metode visualisasi geografis:
1) Klasifikasi data
Eksplorasi Data
Pengantar Sistem Informasi Geografis
1) Klasifikasi data Merupakan metode umum untuk manpulasi peta
Bermanfaat untuk visualisasi data , pembuatan data atributbaru, dan peta baru
a) Klasifikasi data untuk visualisasi Dengan mengubah metoda klasifikasi dan jumlah kelas data yang
sama bisa hasilkan peta berbeda peta choropleth
Dalam eksplorasi data, klasifikasi sangat berguna untuk memisahkandata dengan deskripsi statistik
Visualisasi Geografis 1) Klasifikasi data
a) Klasifikasi data untuk visualisasi Mis: kita ingin melihat laju pengangguran di satu propinsi
Pertama bisa dibagi kelas berdasarkan laju diatas rata-rata atau di bawahi l
Eksplorasi Data
Pengantar Sistem Informasi Geografis
rata-rata nasional
Lalu bisa diklasifikasikan berdasar nilai tengah dan standar deviasi
b) Klasifikasi data untuk membuat data baru Data atribut baru pada peta berbasis vektor pilih subset data
dan berikan nilai pada subset tersebut
Pada data raster, proses ini termasuk re-klasifikasi, re coding, dan transforming melalui LUT (look up table)
Visualisasi Geografis
Eksplorasi Data
Pengantar Sistem Informasi Geografis
Visualisasi Geografis
Eksplorasi Data
Pengantar Sistem Informasi Geografis
5/11/2011
9
Visualisasi Geografis Agregasi spasial
Mirip dengan klasifikasi data ini mengelompokkan data secara spasial
Pengelompokkan bisa berdasar provinsi, wilayah.
Eksplorasi Data
Pengantar Sistem Informasi Geografis
g p p , y
Bisa juga berdasarkan jarak dari titik, garis atau area tertentu Mis: daerah urban bisa ditentukan berdasar jarak dari pusat
kota.
Agregasi spasial untuk data raster persiapkan resolusigrid yang lebih kasar dan hitung nilai pada sel yang lebihbesar
Visualisasi Geografis
Eksplorasi Data
Pengantar Sistem Informasi Geografis
Visualisasi Geografis
Eksplorasi Data
Pengantar Sistem Informasi Geografis
Visualisasi Geografis Perbandingan peta
Membantu pengguna GIS untuk mensortir relasi antaradata thematik yang berbeda yang ditampilkan pada peta.
Mis: menampilkan lokasi kehidupan hewan liar pada peta
Eksplorasi Data
Pengantar Sistem Informasi Geografis
p p p pvegetasi memberi kesan asosiasi antara spesies hewandengan jenis tumbuhan
Jika peta yang dibandingkan berupa titik atau garis dapatdiberi kode dan warna berbeda lalu ditampilkan pada satuview
Proses tersebut tidak berlaku pada peta raster
5/11/2011
10
Visualisasi Geografis Perbandingan peta
Ada tiga pilihan untuk membandingkan peta raster: 1) menempatkan semua poligon dan peta raster, juga titik dan
garis pada satu layar. Tetapi peta poligon dan raster hanya bisa
Eksplorasi Data
Pengantar Sistem Informasi Geografis
ditampilkan bergiliran.
2) membuka dua atau lebih view dapat dilihat peta poligonatau raster secara bersamaan Ini berguna untuk melihat perubahan sementara
3) gunakan simbol peta dapat perlihatkan data dari duatheme poligon. Diantaranya menggunakan diagram batang
Atau pada peta choropleth
Visualisasi Geografis
Eksplorasi Data
Pengantar Sistem Informasi Geografis
Visualisasi Geografis
Eksplorasi Data
Pengantar Sistem Informasi Geografis