bab i pendahuluan 1.1 latar...
TRANSCRIPT
1
BAB I
PENDAHULUAN
1.1 Latar Belakang
Provinsi Daerah Istimewa Yogyakarta (DIY) merupakan salah satu tujuan
wisata utama di Indonesia karena banyaknya wisata budaya serta wisata alam yang
ada di DIY. DIY juga menjadi destinasi para pelajar dari daerah-daerah lain untuk
melanjutkan studinya, bahkan kota Yogyakarta di DIY sering disebut sebagai kota
pelajar. Dengan berbagai daya tariknya tersebut, banyak penduduk dari daerah lain
yang mengunjungi provinsi DIY baik hanya untuk berlibur, tinggal sementara untuk
melanjutkan studi atau bahkan menetap dan berdomisili. Hal ini mengakibatkan
jumlah populasi di kota Yogyakarta semakin padat dan diiringi dengan
pertumbuhan jumlah kendaraan bermotor yang melalui jalan-jalan di kota
Yogyakarta.
Menurut data Badan Pusat Statistik Provinsi Daerah Istimewa Yogyakarta
pada tahun 2015 [1], jumlah kendaraan bermotor pada tahun 2005 hingga 2014 rata-
rata naik sebesar 10,06% seperti yang diilustrasikan pada Gambar 1.1. Sementara
menurut data Badan Pusat Statistik Provinsi Daerah Istimewa Yogyakarta pada
tahun 2005 hingga 2015 [1]–[10], total panjang jalan (jalan negara + jalan provinsi
+ jalan kabupaten/kota) di Provinsi DIY tidak mengalami perkembangan seperti
terlihat pada Gambar 1.2.
Pertumbuhan jumlah kendaraan bermotor di DIY tidak sebanding dengan
pertumbuhan luas jalan, sehingga semakin lama jalan-jalan di DIY menjadi
semakin macet. Hal ini didukung pula oleh semakin tingginya mobilitas masyarakat
modern, sehingga semakin banyak kendaraan yang berada di jalan.
2
Gambar 1.1 Jumlah Kendaraan Bermotor yang Terdaftar di DIY
(sumber: Badan Pusat Statistik Provinsi Daerah Istimewa Yogyakarta [1])
Gambar 1.2 Total Panjang Jalan Provinsi DIY
(sumber: Badan Pusat Statistik Provinsi Daerah Istimewa Yogyakarta [1]–[10])
Telah banyak pendekatan dikembangkan untuk melakukan pemantauan
terhadap kondisi lalu lintas [11]–[28]. Pendekatan yang sudah banyak digunakan di
Indonesia khususnya di Provinsi DIY adalah pemasangan kamera pengawas di
beberapa ruas jalan maupun persimpangan yang ingin dipantau [29], [30]. Gambar
888.161982.348
1.065.571
1.276.3091.374.202
1.488.0331.618.457
1.749.738
1.908.058
2.096.005
0
500.000
1.000.000
1.500.000
2.000.000
2.500.000
2005 2006 2007 2008 2009 2010 2011 2012 2013 2014
Jumlah Kendaraan Bermotor yang Terdaftar di
Provinsi DIY
4.840,32
4.595,73
4.831,924.852,184.853,57
4.735,44
4.592,054.649,83
4.111,904.111,90
3.600,00
3.800,00
4.000,00
4.200,00
4.400,00
4.600,00
4.800,00
5.000,00
2005 2006 2007 2008 2009 2010 2011 2012 2013 2014
Total Panjang Jalan Provinsi DIY (km)
3
atau hasil dari kamera pengawas tersebut dipantau secara terpusat kemudian kondisi
kemacetan jalan dipetakan. Kota-kota besar di Indonesia biasanya sudah memiliki
pemantauan kamera yang dikelola oleh Area Traffic Control System (ATCS) [29]
atau Traffic Management Center (TMC) [30] masing-masing kota. Pendekatan ini
membutuhkan tenaga kerja pemantau kamera pengawas yang harus melakukan
pemetaan kondisi lalu lintas secara manual.
Selain dengan menggunakan kamera pengawas, terdapat pendekatan lain
yaitu crowdsourcing berbasis lokasi [31]. Contoh dari pendekatan ini adalah
aplikasi WAZE (www.waze.com). WAZE memberikan rekomendasi dan informasi
mengenai keadaan lalu lintas ke pengguna sekaligus melakukan pengumpulan pola-
pola pergerakan kendaraan. Pola-pola kendaraan tersebut dianalisis oleh WAZE
untuk menentukan kondisi lalu lintas di suatu tempat. WAZE menggunakan Global
Positioning System (GPS) untuk mengetahui lokasi pengguna dan melacak
pergerakan kendaraan. Selain itu, pengguna juga dapat secara manual memberitahu
kondisi jalan, seperti macet, ada kecelakaan, jalan berlubang, kondisi cuaca, dan
lain-lain. Pendekatan ini tidak membutuhkan suatu sistem terpusat yang
dioperasikan manual karena dapat dianalisis dengan menggunakan algoritme
khusus. Akan tetapi data yang dikumpulkan oleh WAZE tersebut dimiliki oleh
swasta, pihak berwenang mungkin akan mengalami kesulitan untuk mendapatkan
akses ke data tersebut.
Pendekatan yang masih jarang digunakan adalah dengan melakukan text
mining pada situs web jejaring sosial yang banyak digunakan oleh masyarakat.
Padahal saat ini, sebagian besar data direpresentasikan dalam bentuk teks. Jejaring
sosial atau social network merupakan suatu istilah yang digunakan untuk
menggambarkan sebuah layanan berbasis web yang memungkinkan orang-orang
berkomunikasi dengan pengguna lain dalam suatu jaringan. Jejaring sosial telah
menggunakan konsep dan teknologi web 2.0 sehingga memungkinkan pengguna
untuk membuat konten sendiri dan mempertukarkan dengan orang lain. Hal ini
sering disebut sebagai user generated content [32].
Salah satu contoh jejaring sosial yang banyak digunakan sebagai media
pelaporan suatu kejadian adalah Twitter. Twitter saat ini memiliki 320 juta
4
pengguna aktif bulanan, dan ada 500 juta tweet (pesan) yang dibuat oleh pengguna
setiap harinya. Sebuah pendekatan yang dikembangkan oleh Sakaki dkk. [33]
menunjukkan bahwa Twitter mendeteksi suatu kejadian lebih cepat dibandingkan
media tradisional.
Saat ini telah ada beberapa penelitian terkait penggunaan jejaring sosial
sebagai pemantauan kondisi dan kejadian lalu lintas. Sebagian besar dari penelitian
tersebut menggunakan Twitter (www.twitter.com) sebagai sumber data, sebagian
yang lain menggunakan Sina Weibo (www.weibo.com, sebuah jejaring sosial
Tiongkok yang hampir sama dengan Twitter). Penelitian yang menggunakan studi
kasus di luar negeri, antara lain D’Andrea dkk. [11] yang membandingkan performa
tujuh algoritme klasifikasi untuk mengklasifikasikan tweet berbahasa Italia, Sakaki
dkk. [12] yang mengusulkan empat tahap pendeteksian lokasi pada Twitter
berbahasa Jepang, Gu dkk. [13] mengklasifikasikan tweet mengenai lalu lintas di
kota Pittsburgh dan Philadelphia (Amerika Serikat) dengan menggunakan metode
Semi Naive Bayes, dan Gutiérrez dkk. [14] melakukan klasifikasi tweet di Inggris
menggunakan perangkat lunak RapidMiner. Beberapa penelitian tersebut
menggunakan studi kasus di negara masing-masing dengan bahasa masing-masing,
tentu saja akan terjadi perbedaan apabila menggunakan bahasa Indonesia. Selain
itu, penelitian-penelitian tersebut lebih berfokus pada kejadian lalu lintas seperti
kecelakaan, pekerjaan jalan, salju, penutupan jalan, dan sebagainya. Penelitian-
penelitian sebelumnya tidak berfokus pada keadaan arus lalu lintas seperti macet,
padat, ramai, ramai lancar, maupun lancar.
Terdapat pula beberapa penelitian di Indonesia terkait penggunaan jejaring
sosial sebagai pemantauan kondisi dan kejadian lalu lintas. Anas di Yogyakarta
mengembangkan antarmuka web untuk melihat aliran tweet dengan tagar
#lalinjogja [34], akan tetapi sistem yang dikembangkan ini hanya menggunakan
tagar sebagai penyaring tweet. Penelitian lain oleh Wibisono dkk. [35] di Jakarta
menggunakan konsep jaringan syaraf Learning Vector Quantization (LVQ) untuk
mengklasifikasikan tweet menjadi tiga kelas: arus lalu lintas rendah, arus lalu lintas
sedang, dan arus lalu lintas tinggi. Sistem yang dikembangkan oleh Wibisono dkk.
[35] hanya menggunakan tweet dari akun resmi aparat lalu lintas sebagai sumber
5
data. Penelitian lain di Bandung oleh Rodiyansyah dan Winarko [36] melakukan
klasifikasi tiga kelas (Macet, Lancar, Unknown) pada tweet lalu lintas dengan
menggunakan algoritme Naive Bayes dan Support Vector Machine (SVM) dari
perangkat lunak RapidMiner. Penelitian yang dilakukan oleh Rodiyansyah dan
Winarko [36] masih belum mengklasifikasikan dan memetakan lokasi yang
ditunjukkan oleh tweet secara waktu nyata. Hal tersebut menyebabkan kita tidak
bisa mendapatkan tweet-tweet terbaru mengenai informasi lalu lintas.
Oleh karena itu, penelitian ini mengembangkan sistem pemantauan arus lalu
lintas dengan mengklasifikasi tweet dan memetakan lokasi yang dirujuk oleh tweet
berbahasa Indonesia secara waktu nyata. Data tweet yang telah diolah akan
ditampilkan dalam bentuk situs web. Klasifikasi akan divalidasi dengan
menggunakan ten folds cross validation untuk mengukur akurasi, presisi, recall,
dan F-score dari pengklasifikasi dan kumpulan data yang digunakan. Keluaran dari
penelitian ini adalah sistem pemantauan arus lalu lintas dengan mengklasifikasi teks
dan memetakan lokasi yang dirujuk oleh teks berbahasa Indonesia secara waktu nyata
dengan menggunakan data Twitter. Beberapa metode pengklasifikasi divalidasi
dengan menghitung akurasi, presisi, recall, dan F-score dari dan kumpulan data
yang digunakan.
1.2 Rumusan Masalah
Penelitian sebelumnya mengenai penggunaan data jejaring sosial untuk
melakukan pemantauan lalu lintas tidak mengembangkan sistem pemantauan
keadaan arus lalu lintas dengan mengklasifikasi tweet dan memetakan lokasi yang
dirujuk oleh tweet berbahasa Indonesia secara waktu nyata.
1.3 Tujuan Penelitian
Mengembangkan sistem pemantauan arus lalu lintas dengan mengklasifikasi
teks dan memetakan lokasi yang dirujuk oleh teks berbahasa Indonesia secara waktu
nyata dengan menggunakan data Twitter. Sistem ini dapat memberi tahu kondisi
arus lalu lintas di berbagai tempat di DIY secara waktu nyata dengan sumber data
jejaring sosial Twitter.
6
1.4 Manfaat Penelitian
1. Penelitian ini menjadi alternatif metode pemantauan keadaan lalu lintas
secara waktu nyata berbasis data Twitter yang tidak membutuhkan biaya
besar dalam implementasinya.
2. Penelitian ini mengidentifikasi metode klasifikasi yang cocok
digunakan dalam klasifikasi teks bahasa Indonesia yang singkat seperti
tweet pada Twitter atau SMS.
3. Penelitian ini diharapkan menjadi langkah awal dari pengembangan
sistem pemantauan lalu lintas yang menggunakan data dari sosial media
yang dapat mendeteksi lebih banyak lokasi secara dinamis.
1.5 Batasan Masalah
1. Penelitian ini tidak membedakan tweet asli yang dibuat oleh pengguna
dengan retweet yang hanya mengulang konten yang sudah dibuat oleh
pengguna lain.
2. Penelitian ini menggunakan studi kasus untuk memetakan kondisi lalu
lintas di Provinsi Daerah Istimewa Yogyakarta.
3. Penelitian ini menggunakan pustaka Natural Language Tool Kit
(NLTK) [37] dan Scikit Learn (sklearn) [38] sebagai alat pembantu
dalam melakukan machine learning.
4. Penelitian ini hanya membandingkan algoritme klasifikasi Naive Bayes
(NB), Support Vector Machine (SVM), dan Decision Tree (DT). NB
dipilih karena merupakan metode sederhana yang sering dipakai dalam
klasifikasi, namun memiliki akurasi yang cukup baik. NB bahkan
memberikan performa paling baik dalam klasifikasi kepribadian dengan
data Twitter [39]. SVM dipilih karena SVM sangat cocok diterapkan
pada klasifikasi teks [40]. Algoritme DT yang dipakai dalam penelitian
ini adalah algoritme yang dipakai dalam pustaka Scikit Learn.
Algoritme DT digunakan karena dapat mengklasifikasikan tweet dengan
sangat baik [11].
7
1.6 Sistematika Penulisan
BAB I : PENDAHULUAN
Bab ini menjelaskan latar belakang penelitian, rumusan masalah, tujuan dan
manfaat penelitian, batasan masalah serta sistematika penulisan hasil penelitian
secara ringkas.
BAB II : TINJAUAN PUSTAKA DAN DASAR TEORI
Bab ini menjelaskan mengenai berbagai tinjauan penelitian terdahulu serta
teori-teori yang dijadikan sebagai dasar acuan dan parameter dalam pengerjaan
penelitian..
BAB III : METODE PENELITIAN
Bab ini menjelaskan mengenai metode yang digunakan dalam penelitian
berupa langkah kerja, alat dan bahan serta alur penelitian.
BAB IV : HASIL DAN PEMBAHASAN
Bab ini berisi mengenai pemaparan dan pembahasan hasil penelitian.
BAB V : KESIMPULAN DAN SARAN
Bab ini berisi mengenai kesimpulan dan saran dari penelitian.