bab i pendahuluan 1.1 latar...

1

BAB I

PENDAHULUAN

1.1 Latar Belakang

Provinsi Daerah Istimewa Yogyakarta (DIY) merupakan salah satu tujuan

wisata utama di Indonesia karena banyaknya wisata budaya serta wisata alam yang

ada di DIY. DIY juga menjadi destinasi para pelajar dari daerah-daerah lain untuk

melanjutkan studinya, bahkan kota Yogyakarta di DIY sering disebut sebagai kota

pelajar. Dengan berbagai daya tariknya tersebut, banyak penduduk dari daerah lain

yang mengunjungi provinsi DIY baik hanya untuk berlibur, tinggal sementara untuk

melanjutkan studi atau bahkan menetap dan berdomisili. Hal ini mengakibatkan

jumlah populasi di kota Yogyakarta semakin padat dan diiringi dengan

pertumbuhan jumlah kendaraan bermotor yang melalui jalan-jalan di kota

Yogyakarta.

Menurut data Badan Pusat Statistik Provinsi Daerah Istimewa Yogyakarta

pada tahun 2015 [1], jumlah kendaraan bermotor pada tahun 2005 hingga 2014 rata-

rata naik sebesar 10,06% seperti yang diilustrasikan pada Gambar 1.1. Sementara

menurut data Badan Pusat Statistik Provinsi Daerah Istimewa Yogyakarta pada

tahun 2005 hingga 2015 [1]–[10], total panjang jalan (jalan negara + jalan provinsi

+ jalan kabupaten/kota) di Provinsi DIY tidak mengalami perkembangan seperti

terlihat pada Gambar 1.2.

Pertumbuhan jumlah kendaraan bermotor di DIY tidak sebanding dengan

pertumbuhan luas jalan, sehingga semakin lama jalan-jalan di DIY menjadi

semakin macet. Hal ini didukung pula oleh semakin tingginya mobilitas masyarakat

modern, sehingga semakin banyak kendaraan yang berada di jalan.

2

Gambar 1.1 Jumlah Kendaraan Bermotor yang Terdaftar di DIY

(sumber: Badan Pusat Statistik Provinsi Daerah Istimewa Yogyakarta [1])

Gambar 1.2 Total Panjang Jalan Provinsi DIY

(sumber: Badan Pusat Statistik Provinsi Daerah Istimewa Yogyakarta [1]–[10])

Telah banyak pendekatan dikembangkan untuk melakukan pemantauan

terhadap kondisi lalu lintas [11]–[28]. Pendekatan yang sudah banyak digunakan di

Indonesia khususnya di Provinsi DIY adalah pemasangan kamera pengawas di

beberapa ruas jalan maupun persimpangan yang ingin dipantau [29], [30]. Gambar

888.161982.348

1.065.571

1.276.3091.374.202

1.488.0331.618.457

1.749.738

1.908.058

2.096.005

0

500.000

1.000.000

1.500.000

2.000.000

2.500.000

2005 2006 2007 2008 2009 2010 2011 2012 2013 2014

Jumlah Kendaraan Bermotor yang Terdaftar di

Provinsi DIY

4.840,32

4.595,73

4.831,924.852,184.853,57

4.735,44

4.592,054.649,83

4.111,904.111,90

3.600,00

3.800,00

4.000,00

4.200,00

4.400,00

4.600,00

4.800,00

5.000,00

2005 2006 2007 2008 2009 2010 2011 2012 2013 2014

Total Panjang Jalan Provinsi DIY (km)

3

atau hasil dari kamera pengawas tersebut dipantau secara terpusat kemudian kondisi

kemacetan jalan dipetakan. Kota-kota besar di Indonesia biasanya sudah memiliki

pemantauan kamera yang dikelola oleh Area Traffic Control System (ATCS) [29]

atau Traffic Management Center (TMC) [30] masing-masing kota. Pendekatan ini

membutuhkan tenaga kerja pemantau kamera pengawas yang harus melakukan

pemetaan kondisi lalu lintas secara manual.

Selain dengan menggunakan kamera pengawas, terdapat pendekatan lain

yaitu crowdsourcing berbasis lokasi [31]. Contoh dari pendekatan ini adalah

aplikasi WAZE (www.waze.com). WAZE memberikan rekomendasi dan informasi

mengenai keadaan lalu lintas ke pengguna sekaligus melakukan pengumpulan pola-

pola pergerakan kendaraan. Pola-pola kendaraan tersebut dianalisis oleh WAZE

untuk menentukan kondisi lalu lintas di suatu tempat. WAZE menggunakan Global

Positioning System (GPS) untuk mengetahui lokasi pengguna dan melacak

pergerakan kendaraan. Selain itu, pengguna juga dapat secara manual memberitahu

kondisi jalan, seperti macet, ada kecelakaan, jalan berlubang, kondisi cuaca, dan

lain-lain. Pendekatan ini tidak membutuhkan suatu sistem terpusat yang

dioperasikan manual karena dapat dianalisis dengan menggunakan algoritme

khusus. Akan tetapi data yang dikumpulkan oleh WAZE tersebut dimiliki oleh

swasta, pihak berwenang mungkin akan mengalami kesulitan untuk mendapatkan

akses ke data tersebut.

Pendekatan yang masih jarang digunakan adalah dengan melakukan text

mining pada situs web jejaring sosial yang banyak digunakan oleh masyarakat.

Padahal saat ini, sebagian besar data direpresentasikan dalam bentuk teks. Jejaring

sosial atau social network merupakan suatu istilah yang digunakan untuk

menggambarkan sebuah layanan berbasis web yang memungkinkan orang-orang

berkomunikasi dengan pengguna lain dalam suatu jaringan. Jejaring sosial telah

menggunakan konsep dan teknologi web 2.0 sehingga memungkinkan pengguna

untuk membuat konten sendiri dan mempertukarkan dengan orang lain. Hal ini

sering disebut sebagai user generated content [32].

Salah satu contoh jejaring sosial yang banyak digunakan sebagai media

pelaporan suatu kejadian adalah Twitter. Twitter saat ini memiliki 320 juta

4

pengguna aktif bulanan, dan ada 500 juta tweet (pesan) yang dibuat oleh pengguna

setiap harinya. Sebuah pendekatan yang dikembangkan oleh Sakaki dkk. [33]

menunjukkan bahwa Twitter mendeteksi suatu kejadian lebih cepat dibandingkan

media tradisional.

Saat ini telah ada beberapa penelitian terkait penggunaan jejaring sosial

sebagai pemantauan kondisi dan kejadian lalu lintas. Sebagian besar dari penelitian

tersebut menggunakan Twitter (www.twitter.com) sebagai sumber data, sebagian

yang lain menggunakan Sina Weibo (www.weibo.com, sebuah jejaring sosial

Tiongkok yang hampir sama dengan Twitter). Penelitian yang menggunakan studi

kasus di luar negeri, antara lain D’Andrea dkk. [11] yang membandingkan performa

tujuh algoritme klasifikasi untuk mengklasifikasikan tweet berbahasa Italia, Sakaki

dkk. [12] yang mengusulkan empat tahap pendeteksian lokasi pada Twitter

berbahasa Jepang, Gu dkk. [13] mengklasifikasikan tweet mengenai lalu lintas di

kota Pittsburgh dan Philadelphia (Amerika Serikat) dengan menggunakan metode

Semi Naive Bayes, dan Gutiérrez dkk. [14] melakukan klasifikasi tweet di Inggris

menggunakan perangkat lunak RapidMiner. Beberapa penelitian tersebut

menggunakan studi kasus di negara masing-masing dengan bahasa masing-masing,

tentu saja akan terjadi perbedaan apabila menggunakan bahasa Indonesia. Selain

itu, penelitian-penelitian tersebut lebih berfokus pada kejadian lalu lintas seperti

kecelakaan, pekerjaan jalan, salju, penutupan jalan, dan sebagainya. Penelitian-

penelitian sebelumnya tidak berfokus pada keadaan arus lalu lintas seperti macet,

padat, ramai, ramai lancar, maupun lancar.

Terdapat pula beberapa penelitian di Indonesia terkait penggunaan jejaring

sosial sebagai pemantauan kondisi dan kejadian lalu lintas. Anas di Yogyakarta

mengembangkan antarmuka web untuk melihat aliran tweet dengan tagar

#lalinjogja [34], akan tetapi sistem yang dikembangkan ini hanya menggunakan

tagar sebagai penyaring tweet. Penelitian lain oleh Wibisono dkk. [35] di Jakarta

menggunakan konsep jaringan syaraf Learning Vector Quantization (LVQ) untuk

mengklasifikasikan tweet menjadi tiga kelas: arus lalu lintas rendah, arus lalu lintas

sedang, dan arus lalu lintas tinggi. Sistem yang dikembangkan oleh Wibisono dkk.

[35] hanya menggunakan tweet dari akun resmi aparat lalu lintas sebagai sumber

5

data. Penelitian lain di Bandung oleh Rodiyansyah dan Winarko [36] melakukan

klasifikasi tiga kelas (Macet, Lancar, Unknown) pada tweet lalu lintas dengan

menggunakan algoritme Naive Bayes dan Support Vector Machine (SVM) dari

perangkat lunak RapidMiner. Penelitian yang dilakukan oleh Rodiyansyah dan

Winarko [36] masih belum mengklasifikasikan dan memetakan lokasi yang

ditunjukkan oleh tweet secara waktu nyata. Hal tersebut menyebabkan kita tidak

bisa mendapatkan tweet-tweet terbaru mengenai informasi lalu lintas.

Oleh karena itu, penelitian ini mengembangkan sistem pemantauan arus lalu

lintas dengan mengklasifikasi tweet dan memetakan lokasi yang dirujuk oleh tweet

berbahasa Indonesia secara waktu nyata. Data tweet yang telah diolah akan

ditampilkan dalam bentuk situs web. Klasifikasi akan divalidasi dengan

menggunakan ten folds cross validation untuk mengukur akurasi, presisi, recall,

dan F-score dari pengklasifikasi dan kumpulan data yang digunakan. Keluaran dari

penelitian ini adalah sistem pemantauan arus lalu lintas dengan mengklasifikasi teks

dan memetakan lokasi yang dirujuk oleh teks berbahasa Indonesia secara waktu nyata

dengan menggunakan data Twitter. Beberapa metode pengklasifikasi divalidasi

dengan menghitung akurasi, presisi, recall, dan F-score dari dan kumpulan data

yang digunakan.

1.2 Rumusan Masalah

Penelitian sebelumnya mengenai penggunaan data jejaring sosial untuk

melakukan pemantauan lalu lintas tidak mengembangkan sistem pemantauan

keadaan arus lalu lintas dengan mengklasifikasi tweet dan memetakan lokasi yang

dirujuk oleh tweet berbahasa Indonesia secara waktu nyata.

1.3 Tujuan Penelitian

Mengembangkan sistem pemantauan arus lalu lintas dengan mengklasifikasi

teks dan memetakan lokasi yang dirujuk oleh teks berbahasa Indonesia secara waktu

nyata dengan menggunakan data Twitter. Sistem ini dapat memberi tahu kondisi

arus lalu lintas di berbagai tempat di DIY secara waktu nyata dengan sumber data

jejaring sosial Twitter.

6

1.4 Manfaat Penelitian

1. Penelitian ini menjadi alternatif metode pemantauan keadaan lalu lintas

secara waktu nyata berbasis data Twitter yang tidak membutuhkan biaya

besar dalam implementasinya.

2. Penelitian ini mengidentifikasi metode klasifikasi yang cocok

digunakan dalam klasifikasi teks bahasa Indonesia yang singkat seperti

tweet pada Twitter atau SMS.

3. Penelitian ini diharapkan menjadi langkah awal dari pengembangan

sistem pemantauan lalu lintas yang menggunakan data dari sosial media

yang dapat mendeteksi lebih banyak lokasi secara dinamis.

1.5 Batasan Masalah

1. Penelitian ini tidak membedakan tweet asli yang dibuat oleh pengguna

dengan retweet yang hanya mengulang konten yang sudah dibuat oleh

pengguna lain.

2. Penelitian ini menggunakan studi kasus untuk memetakan kondisi lalu

lintas di Provinsi Daerah Istimewa Yogyakarta.

3. Penelitian ini menggunakan pustaka Natural Language Tool Kit

(NLTK) [37] dan Scikit Learn (sklearn) [38] sebagai alat pembantu

dalam melakukan machine learning.

4. Penelitian ini hanya membandingkan algoritme klasifikasi Naive Bayes

(NB), Support Vector Machine (SVM), dan Decision Tree (DT). NB

dipilih karena merupakan metode sederhana yang sering dipakai dalam

klasifikasi, namun memiliki akurasi yang cukup baik. NB bahkan

memberikan performa paling baik dalam klasifikasi kepribadian dengan

data Twitter [39]. SVM dipilih karena SVM sangat cocok diterapkan

pada klasifikasi teks [40]. Algoritme DT yang dipakai dalam penelitian

ini adalah algoritme yang dipakai dalam pustaka Scikit Learn.

Algoritme DT digunakan karena dapat mengklasifikasikan tweet dengan

sangat baik [11].

7

1.6 Sistematika Penulisan

BAB I : PENDAHULUAN

Bab ini menjelaskan latar belakang penelitian, rumusan masalah, tujuan dan

manfaat penelitian, batasan masalah serta sistematika penulisan hasil penelitian

secara ringkas.

BAB II : TINJAUAN PUSTAKA DAN DASAR TEORI

Bab ini menjelaskan mengenai berbagai tinjauan penelitian terdahulu serta

teori-teori yang dijadikan sebagai dasar acuan dan parameter dalam pengerjaan

penelitian..

BAB III : METODE PENELITIAN

Bab ini menjelaskan mengenai metode yang digunakan dalam penelitian

berupa langkah kerja, alat dan bahan serta alur penelitian.

BAB IV : HASIL DAN PEMBAHASAN

Bab ini berisi mengenai pemaparan dan pembahasan hasil penelitian.

BAB V : KESIMPULAN DAN SARAN

Bab ini berisi mengenai kesimpulan dan saran dari penelitian.

bab i pendahuluan 1.1 latar...

Documents