di belantara maya jurnalismedata.pdf · format file: pdf, xls, csv, txt, dbf ... untuk mencari, ......
TRANSCRIPT
menambang WEBINAR
Jurnalismedata.id 9 Februari 2019
di belantara maya…
Laksono Hari Wiwoho Wakil Redaktur Pelaksana Kompas.com
0817-9825-749
Data Peta Interaktif Pilkada 2018
Data apa? Relevan? Update? Detail? Lengkap?
Mencari Data Awal
Sumber? Dari mana? Legal? Akurat?
Caranya? Mudah didapat? Konversi? Berapa lama? Biaya?
Cara paling mudah mendapatkan data awal untuk sebuah riset adalah dengan memanfaatkan internet… atau…
Mbah Google…?
Korupsi filetype: PDF Cari
inurl:lelang filetype:xls Cari
Format file: pdf, xls, csv, txt, dbf, doc, shp, kml, mdb, jpg, …. dll
Faskes filetype:xls Cari
Google Trends
Data di Internet
Internet = surga sekaligus neraka informasi/data Informasi di layar browser berarti data sudah diunduh ke dalam komputer kita (client): • Data terbuka/publik (contoh: data pemerintah, putusan pengadilan)
• Data diproteksi/dibatasi (contoh: media online)
• Data tertutup/tersembunyi • Data tidak boleh disalin (contoh: data persil BPN)
Format Data di Internet
Dokumen • DOC/DOCX, RTF • PDF • TXT
Tabular • XLS/XLSX • CSV, TSV • SQL, DBF
Hypertext • HTM/HTML • XML • RSS
Spasial • Shapefile (SHP) • KML • DXF
Data/Object • JS/JSON • GeoJSON
Grafis/video • JPG, PNG, GIF , BMP • SVG • MP4/AVI/MPG/SWF
dan masih buaanyak lagi...
HTML
Contoh Data di Internet
JSON
Contoh Data di Internet
Web Scraping Pemula: Pakai Google Spreadsheet (=IMPORTHTML) Kelebihan: - Auto update seusai
sumbernya
Kekurangan: - Hanya bisa ambil isi tabel,
list, RSS, data (CSV & TSV) - Ambil data per halaman - Tidak bisa Javascript
Advance: Dengan bahasa Python atau R Kelebihan: - Bisa ambil semua isi halaman
asalkan tidak diproteksi - Proses cepat - Cocok utk data besar (lebih dari
100 halaman web)
Syarat: - Paham HTML & CSS - Paham dasar & logika
pemrograman
Menengah: Pakai plugin Web Scraper Kelebihan: - Bisa banyak halaman
(selevel atau berjenjang) - Bisa tarik data teks, tabel,
link, dll…
Kekurangan: - Tidak bisa Javascript Syarat: - Paham HTML & CSS
PENTING!
Pahami karakter setiap format data, struktur halaman web, dan aplikasi olah data supaya tahu teknik yang tepat untuk mencari, mengambil, mengolah, dan mengelola data
Kebutuhan aplikasi: - Notepad++, Atom atau
Sublime Text - Add on Web Scraper di
browser Chrome - MS Excel atau Google
Spreadsheet
A journalist should learn...
how to code Buat Apa?!
Data Journalism ... represents the mass democratization of
resources, tools, techniques, and methodologies that were previously used by specialists; whether
investigative reporters, social scientists, statisticians, analysts, or other experts.
— Liliana Bounegru “Data Journalism Handbook” - 2012
"We need to have skills to be able to crunch this data and
bring different datasets together to come up with
stories“ Bahareh Heravi (2017)
Assistant professor in information and communication studies University College Dublin
Data Jurnalistik Riset
Praktik!
1. Import HTML data kurs mata uang 2. Web scraping sekolah/peserta didik Kemdikbud 3. Ambil data DCT dan peta dari infopemilu.kpu.go.id 4. Ambil data kasus korupsi dari Mahkamah Agung
dan Beritagar.id 5. Ambil data sebaran sekolah
1. https://www.pertamina.com/id/news-room/announcement/daftar-harga-bbk-tmt-5-januari-2019
Jangan Terlewat!
Setelah semua data terkumpul, ARSIPKANLAH dengan baik sehingga: - Mudah dicari/diakses kembali - Mudah dikoreksi - Bisa digunakan kembali - Bisa diperkaya/ditambah dengan data lain