di belantara maya jurnalismedata.pdf · format file: pdf, xls, csv, txt, dbf ... untuk mencari, ......

18
menambang WEBINAR Jurnalismedata.id 9 Februari 2019 di belantara maya… Laksono Hari Wiwoho Wakil Redaktur Pelaksana Kompas.com 0817-9825-749

Upload: duongnhu

Post on 30-Jun-2019

242 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: di belantara maya JurnalismeData.pdf · Format file: pdf, xls, csv, txt, dbf ... untuk mencari, ... Sublime Text -Add on Web Scraper di browser Chrome - MS Excel atau Google Spreadsheet

menambang WEBINAR

Jurnalismedata.id 9 Februari 2019

di belantara maya…

Laksono Hari Wiwoho Wakil Redaktur Pelaksana Kompas.com

0817-9825-749

Page 3: di belantara maya JurnalismeData.pdf · Format file: pdf, xls, csv, txt, dbf ... untuk mencari, ... Sublime Text -Add on Web Scraper di browser Chrome - MS Excel atau Google Spreadsheet

Data Peta Interaktif Pilkada 2018

Page 4: di belantara maya JurnalismeData.pdf · Format file: pdf, xls, csv, txt, dbf ... untuk mencari, ... Sublime Text -Add on Web Scraper di browser Chrome - MS Excel atau Google Spreadsheet

Data apa? Relevan? Update? Detail? Lengkap?

Mencari Data Awal

Sumber? Dari mana? Legal? Akurat?

Caranya? Mudah didapat? Konversi? Berapa lama? Biaya?

Page 5: di belantara maya JurnalismeData.pdf · Format file: pdf, xls, csv, txt, dbf ... untuk mencari, ... Sublime Text -Add on Web Scraper di browser Chrome - MS Excel atau Google Spreadsheet

Cara paling mudah mendapatkan data awal untuk sebuah riset adalah dengan memanfaatkan internet… atau…

Page 6: di belantara maya JurnalismeData.pdf · Format file: pdf, xls, csv, txt, dbf ... untuk mencari, ... Sublime Text -Add on Web Scraper di browser Chrome - MS Excel atau Google Spreadsheet

Mbah Google…?

Korupsi filetype: PDF Cari

inurl:lelang filetype:xls Cari

Format file: pdf, xls, csv, txt, dbf, doc, shp, kml, mdb, jpg, …. dll

Faskes filetype:xls Cari

Page 7: di belantara maya JurnalismeData.pdf · Format file: pdf, xls, csv, txt, dbf ... untuk mencari, ... Sublime Text -Add on Web Scraper di browser Chrome - MS Excel atau Google Spreadsheet

Google Trends

Page 8: di belantara maya JurnalismeData.pdf · Format file: pdf, xls, csv, txt, dbf ... untuk mencari, ... Sublime Text -Add on Web Scraper di browser Chrome - MS Excel atau Google Spreadsheet

Data di Internet

Internet = surga sekaligus neraka informasi/data Informasi di layar browser berarti data sudah diunduh ke dalam komputer kita (client): • Data terbuka/publik (contoh: data pemerintah, putusan pengadilan)

• Data diproteksi/dibatasi (contoh: media online)

• Data tertutup/tersembunyi • Data tidak boleh disalin (contoh: data persil BPN)

Page 9: di belantara maya JurnalismeData.pdf · Format file: pdf, xls, csv, txt, dbf ... untuk mencari, ... Sublime Text -Add on Web Scraper di browser Chrome - MS Excel atau Google Spreadsheet

Format Data di Internet

Dokumen • DOC/DOCX, RTF • PDF • TXT

Tabular • XLS/XLSX • CSV, TSV • SQL, DBF

Hypertext • HTM/HTML • XML • RSS

Spasial • Shapefile (SHP) • KML • DXF

Data/Object • JS/JSON • GeoJSON

Grafis/video • JPG, PNG, GIF , BMP • SVG • MP4/AVI/MPG/SWF

dan masih buaanyak lagi...

Page 10: di belantara maya JurnalismeData.pdf · Format file: pdf, xls, csv, txt, dbf ... untuk mencari, ... Sublime Text -Add on Web Scraper di browser Chrome - MS Excel atau Google Spreadsheet

HTML

Contoh Data di Internet

Page 11: di belantara maya JurnalismeData.pdf · Format file: pdf, xls, csv, txt, dbf ... untuk mencari, ... Sublime Text -Add on Web Scraper di browser Chrome - MS Excel atau Google Spreadsheet

JSON

Contoh Data di Internet

Page 12: di belantara maya JurnalismeData.pdf · Format file: pdf, xls, csv, txt, dbf ... untuk mencari, ... Sublime Text -Add on Web Scraper di browser Chrome - MS Excel atau Google Spreadsheet

Web Scraping Pemula: Pakai Google Spreadsheet (=IMPORTHTML) Kelebihan: - Auto update seusai

sumbernya

Kekurangan: - Hanya bisa ambil isi tabel,

list, RSS, data (CSV & TSV) - Ambil data per halaman - Tidak bisa Javascript

Advance: Dengan bahasa Python atau R Kelebihan: - Bisa ambil semua isi halaman

asalkan tidak diproteksi - Proses cepat - Cocok utk data besar (lebih dari

100 halaman web)

Syarat: - Paham HTML & CSS - Paham dasar & logika

pemrograman

Menengah: Pakai plugin Web Scraper Kelebihan: - Bisa banyak halaman

(selevel atau berjenjang) - Bisa tarik data teks, tabel,

link, dll…

Kekurangan: - Tidak bisa Javascript Syarat: - Paham HTML & CSS

Page 13: di belantara maya JurnalismeData.pdf · Format file: pdf, xls, csv, txt, dbf ... untuk mencari, ... Sublime Text -Add on Web Scraper di browser Chrome - MS Excel atau Google Spreadsheet

PENTING!

Pahami karakter setiap format data, struktur halaman web, dan aplikasi olah data supaya tahu teknik yang tepat untuk mencari, mengambil, mengolah, dan mengelola data

Kebutuhan aplikasi: - Notepad++, Atom atau

Sublime Text - Add on Web Scraper di

browser Chrome - MS Excel atau Google

Spreadsheet

Page 14: di belantara maya JurnalismeData.pdf · Format file: pdf, xls, csv, txt, dbf ... untuk mencari, ... Sublime Text -Add on Web Scraper di browser Chrome - MS Excel atau Google Spreadsheet

A journalist should learn...

how to code Buat Apa?!

Page 15: di belantara maya JurnalismeData.pdf · Format file: pdf, xls, csv, txt, dbf ... untuk mencari, ... Sublime Text -Add on Web Scraper di browser Chrome - MS Excel atau Google Spreadsheet

Data Journalism ... represents the mass democratization of

resources, tools, techniques, and methodologies that were previously used by specialists; whether

investigative reporters, social scientists, statisticians, analysts, or other experts.

— Liliana Bounegru “Data Journalism Handbook” - 2012

Page 16: di belantara maya JurnalismeData.pdf · Format file: pdf, xls, csv, txt, dbf ... untuk mencari, ... Sublime Text -Add on Web Scraper di browser Chrome - MS Excel atau Google Spreadsheet

"We need to have skills to be able to crunch this data and

bring different datasets together to come up with

stories“ Bahareh Heravi (2017)

Assistant professor in information and communication studies University College Dublin

Data Jurnalistik Riset

Page 18: di belantara maya JurnalismeData.pdf · Format file: pdf, xls, csv, txt, dbf ... untuk mencari, ... Sublime Text -Add on Web Scraper di browser Chrome - MS Excel atau Google Spreadsheet

Jangan Terlewat!

Setelah semua data terkumpul, ARSIPKANLAH dengan baik sehingga: - Mudah dicari/diakses kembali - Mudah dikoreksi - Bisa digunakan kembali - Bisa diperkaya/ditambah dengan data lain