regression trees (cart) classification and ......antar peminat di bidang ilmu matematika dan...

20
KLASIFIKASI KARAKTERISTIK KECELAKAAN LALU LINTAS DI KOTA DENPASAR DENGAN PENDEKATAN CLASSIFICATION AND REGRESSION TREES (CART) by I Gusti Ayu Made Srinadi FILE T IME SUBMIT T ED 23-JAN-2016 08:29PM SUBMISSION ID 623157891 WORD COUNT 2393 CHARACT ER COUNT 14368 ARTIKEL_AYU_1.PDF (235.07K)

Upload: others

Post on 10-Nov-2020

21 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: REGRESSION TREES (CART) CLASSIFICATION AND ......antar peminat di bidang ilmu matematika dan terapannya, seperti statistika, matematika finansial, pengajaran matematika dan terapan

KLASIFIKASI KARAKTERISTIKKECELAKAAN LALU LINTAS

DI KOTA DENPASAR DENGANPENDEKATAN

CLASSIFICATION ANDREGRESSION TREES (CART)

by I Gusti Ayu Made Srinadi

FILE

TIME SUBMITTED 23-JAN-2016 08:29PM

SUBMISSION ID 623157891

WORD COUNT 2393

CHARACTER COUNT 14368

ARTIKEL_AYU_1.PDF (235.07K)

Page 2: REGRESSION TREES (CART) CLASSIFICATION AND ......antar peminat di bidang ilmu matematika dan terapannya, seperti statistika, matematika finansial, pengajaran matematika dan terapan
Page 3: REGRESSION TREES (CART) CLASSIFICATION AND ......antar peminat di bidang ilmu matematika dan terapannya, seperti statistika, matematika finansial, pengajaran matematika dan terapan
Page 4: REGRESSION TREES (CART) CLASSIFICATION AND ......antar peminat di bidang ilmu matematika dan terapannya, seperti statistika, matematika finansial, pengajaran matematika dan terapan
Page 5: REGRESSION TREES (CART) CLASSIFICATION AND ......antar peminat di bidang ilmu matematika dan terapannya, seperti statistika, matematika finansial, pengajaran matematika dan terapan
Page 6: REGRESSION TREES (CART) CLASSIFICATION AND ......antar peminat di bidang ilmu matematika dan terapannya, seperti statistika, matematika finansial, pengajaran matematika dan terapan
Page 7: REGRESSION TREES (CART) CLASSIFICATION AND ......antar peminat di bidang ilmu matematika dan terapannya, seperti statistika, matematika finansial, pengajaran matematika dan terapan
Page 8: REGRESSION TREES (CART) CLASSIFICATION AND ......antar peminat di bidang ilmu matematika dan terapannya, seperti statistika, matematika finansial, pengajaran matematika dan terapan

11%SIMILARITY INDEX

11%INTERNET SOURCES

2%PUBLICATIONS

1%STUDENT PAPERS

1 3%

2 2%

3 2%

4 1%

5 1%

6 1%

7 <1%

8 <1%

9 <1%

KLASIFIKASI KARAKTERISTIK KECELAKAAN LALU LINTASDI KOTA DENPASAR DENGAN PENDEKATANCLASSIFICATION AND REGRESSION TREES (CART)ORIGINALITY REPORT

PRIMARY SOURCES

seminar.uny.ac.idInternet Source

ejournal.uin-malang.ac.idInternet Source

ejurnal.its.ac.idInternet Source

Submitted to Australian National UniversityStudent Paper

www.researchgate.netInternet Source

eprints.uns.ac.idInternet Source

www.me.ucsb.eduInternet Source

home.uludag.edu.trInternet Source

digilib.unair.ac.idInternet Source

Page 9: REGRESSION TREES (CART) CLASSIFICATION AND ......antar peminat di bidang ilmu matematika dan terapannya, seperti statistika, matematika finansial, pengajaran matematika dan terapan

10 <1%

11 <1%

12 <1%

13 <1%

14 <1%

EXCLUDE QUOTES OFF

EXCLUDEBIBLIOGRAPHY

OFF

EXCLUDE MATCHES OFF

tatamotors.comInternet Source

journal.ubaya.ac.idInternet Source

Hun-Kyun Bae. "Classif ication and regressiontree (CART) analysis for indicator bacterialconcentration prediction for a Californiancoastal area", Water Science & Technology,01/2010Publicat ion

segalamacam.comInternet Source

www.slideshare.netInternet Source

Page 10: REGRESSION TREES (CART) CLASSIFICATION AND ......antar peminat di bidang ilmu matematika dan terapannya, seperti statistika, matematika finansial, pengajaran matematika dan terapan

OPEN JOURNAL SYSTEMS

Journal Help

USER

Username

Password

Remember me

Log In

NOTIFICATIONS

View

Subscribe / Unsubscribe

JOURNAL CONTENT

Search

All

Search

Browse

By Issue

By Author

E - J u r n a l M a t e m a t i k a

E-Jurnal Matematika http://ojs.unud.ac.id/index.php/mtk/index

1 of 5 11/25/2015 12:00 AM

Page 11: REGRESSION TREES (CART) CLASSIFICATION AND ......antar peminat di bidang ilmu matematika dan terapannya, seperti statistika, matematika finansial, pengajaran matematika dan terapan

By Title

Other Journals

FONT SIZE

INFORMATION

For Readers

For Authors

For Librarians

HOME ABOUT LOG IN REGISTER SEARCH CURRENT ARCHIVES EDITORIAL

TEAM CONTACT

Home > Vol 4, No 4 (2015)

E-Jurnal Matematika merupakan salah satu jurnal elektronik yang ada di Universitas Udayana, sebagai media komunikasi

antar peminat di bidang ilmu matematika dan terapannya, seperti statistika, matematika finansial, pengajaran matematika

dan terapan matematika dibidang ilmu lainnya. Jurnal ini lahir sebagai salah satu bentuk nyata peran serta jurusan

Matematika FMIPA UNUD guna mendukung percepatan tercapainya target mutu UNUD, selain itu jurnal ini terbit didorong oleh

surat edaran Dirjen DIKTI tentang syarat publikasi karya ilmiah bagi program Sarjana di Jurnal Ilmiah. E-jurnal Matematika

juga menerima hasil-hasil penelitian yang tidak secara langsung berkaitan dengan tugas akhir mahasiswa meliputi penelitian

E-Jurnal Matematika http://ojs.unud.ac.id/index.php/mtk/index

2 of 5 11/25/2015 12:00 AM

Page 12: REGRESSION TREES (CART) CLASSIFICATION AND ......antar peminat di bidang ilmu matematika dan terapannya, seperti statistika, matematika finansial, pengajaran matematika dan terapan

atau artikel yang merupakan kajian keilmuan.

E-Jurnal Matematika http://ojs.unud.ac.id/index.php/mtk/index

3 of 5 11/25/2015 12:00 AM

Page 13: REGRESSION TREES (CART) CLASSIFICATION AND ......antar peminat di bidang ilmu matematika dan terapannya, seperti statistika, matematika finansial, pengajaran matematika dan terapan

KLASIFIKASI KARAKTERISTIK KECELAKAAN LALU LINTAS DI KOTA DENPASAR DENGAN PENDEKATAN

CLASSIFICATION AND REGRESSION TREES (CART)

PDF

I GEDE AGUS JIWADIANA, I KOMANG GDE SUKARSA, I GUSTI AYU MADE SRINADI 146-151

MENENTUKAN FORMULA PREMI TAHUNAN TIDAK KONSTAN PADA ASURANSI JOINT LIFE PDF

I GEDE BAGUS PASEK SUBADRA, I NYOMAN WIDANA, DESAK PUTU EKA

NILAKUSMAWATI

152-157

OPTIMALISASI PENJUALAN KAIN ENDEK DENGAN METODE KARUSH-KUHN-TUCKER (KKT) PDF

I GEDE ARIS JANOVA PUTRA, NI MADE ASIH, I NYOMAN WIDANA 158-162

METODE QUEST DAN CHAID PADA KLASIFIKASI KARAKTERISTIK NASABAH KREDIT PDF

NUR FAIZA, I WAYAN SUMARJAYA, I GUSTI AYU MADE SRINADI 163-168

MODEL PERSAMAAN STRUKTURAL TINGKAT KEPUASAN MASYARAKAT TERHADAP KUALITAS PELAYANAN

JALAN TOL BALI MANDARA

PDF

I PUTU AGUS WIDHIANTARA, I KOMANG GDE SUKARSA, I PUTU EKA N. KENCANA 169-175

ESTIMASI MODEL REGRESI SEMIPARAMETRIK MENGGUNAKAN ESTIMATOR KERNEL UNIFORM (Studi

Kasus: Pasien DBD di RS Puri Raharja)

PDF

ANNA FITRIANI, I GUSTI AYU MADE SRINADI, MADE SUSILAWATI 176-180

E-Jurnal Matematika http://ojs.unud.ac.id/index.php/mtk/index

4 of 5 11/25/2015 12:00 AM

Page 14: REGRESSION TREES (CART) CLASSIFICATION AND ......antar peminat di bidang ilmu matematika dan terapannya, seperti statistika, matematika finansial, pengajaran matematika dan terapan

PERBANDINGAN CAPITAL ASSET PRICING MODEL (CAPM) DAN THREE FACTORS MODEL FAMA AND

FRENCH (TFMFF) DALAM MENGESTIMASI RETURN SAHAM

PDF

KADEK MIRA PITRIYANTI, KOMANG DHARMAWAN, G.K. GANDHIADI 181-187

ESTIMASI NILAI CONDITIONAL VALUE AT RISK MENGGUNAKAN FUNGSI GAUSSIAN COPULA PDF

HERLINA HIDAYATI, KOMANG DHARMAWAN, I WAYAN SUMARJAYA 188-194

MENENTUKAN PREMI TAHUNAN UNTUK TIGA ORANG PADA ASURANSI JIWA HIDUP GABUNGAN (JOINT

LIFE)

PDF

TRI YANA BHUANA, I NYOMAN WIDANA, LUH PUTU IDA HARINI 195-200

OPTIMALISASI PERENCANAAN PRODUKSI DENGAN PREEMPTIVE GOAL PROGRAMMING (STUDI KASUS: UD.

DODOL MADE MERTA TEJAKULA, SINGARAJA)

PDF

NI PUTU DEVIYANTI, NI KETUT TARI TASTRAWATI, I WAYAN SUMARJAYA 201-207

This work is licensed under a Creative Commons Attribut ion 4.0 International License. ISSN: 2303-1751

E-Jurnal Matematika http://ojs.unud.ac.id/index.php/mtk/index

5 of 5 11/25/2015 12:00 AM

Page 15: REGRESSION TREES (CART) CLASSIFICATION AND ......antar peminat di bidang ilmu matematika dan terapannya, seperti statistika, matematika finansial, pengajaran matematika dan terapan

E-Jurnal Matematika Vol. 4 (4), November 2015, pp. 146-151 ISSN: 2303-1751

146

KLASIFIKASI KARAKTERISTIK KECELAKAAN LALU LINTAS DI

KOTA DENPASAR DENGAN PENDEKATAN CLASSIFICATION AND

REGRESSION TREES (CART)

I Gede Agus Jiwadiana§1

, I Komang Gde Sukarsa2, I Gusti Ayu Made Srinadi

3

1Jurusan Matematika, Fakultas MIPA - Universitas Udayana [Email: [email protected]]

2Jurusan Matematika, Fakultas MIPA - Universitas Udayana [Email: [email protected]]

3Jurusan Matematika, Fakultas MIPA - Universitas Udayana [Email: [email protected]]

§Corresponding Author

ABSTRACT

The aim of this research is to determine the classification characteristics of traffic accidents in

Denpasar city in January-July 2014 by using Classification And Regression Trees (CART). Then, for

determine the explanatory variables into the main classifier of CART. The result showed that optimum

CART generate three terminal node. First terminal node, there are 12 people were classified as heavy

traffic accident characteritics with single accident, and second terminal nodes, there are 68 people

were classified as minor traffic accident characteristics by type of traffic accident front-rear, front-

front, front-side, pedestrians, side-side and location of traffic accident in district road and sub-district

road. For third terminal node, there are 291 people were classified as medium traffic accident

characteristics by type of traffic accident front-rear, front-front, front-side, pedestrians, side-side and

location of traffic accident in municipality road and explanatory variables into the main splitter to

make of CART is type of traffic accident with maximum homogeneity measure of 0.03252.

Keywords: CART, traffic accident, terminal node

1. PENDAHULUAN

Umumnya masalah klasifikasi diselesaikan

dengan menggunakan metode regresi logistik

dan analisis diskriminan (Lusyanti [1]). Analisis

diskriminan memerlukan asumsi multivariate

normal dan varians kovarians sama, sedangkan

metode regresi logistik tidak memerlukan kedua

asumsi tersebut. Metode ini memerlukan data

yang lengkap, dan sensitif terhadap outlier.

Salah satu metode alternatif masalah

klasifikasi yang lebih longgar atau tidak terikat

oleh asumsi-asumsi dan tidak berbentuk

probabilitas adalah metode klasifikasi

berstruktur pohon yang diperkenalkan oleh

Breimen, L., Friedmen, J., Olshen, R., dan

Stone, C. pada tahun 1984 yaitu Classification

and Regression Trees (CART). Metode CART

merupakan alat yang digunakan dalam

eksplorasi data nonparametrik yang dapat

digunakan untuk melihat hubungan antara

variabel terikat dengan variabel bebas yang

berukuran besar dan kompleks (Pratiwi dan Zain

[2]). Variabel bersifat kompleks dapat berupa

dimensinya yang besar atau jenis variabel

bebasnya campuran, misalnya kontinu dan

kategorik, baik nominal maupun ordinal. Jika

variabel terikatnyanya berupa variabel kontinu

maka akan diperoleh model pohon regresi, jika

variabel terikatnyanya kategorik maka akan

diperoleh model pohon klasifikasi.

Model CART dikenal karena kesederhanaan

dan efisiensi ketika berhadapan dengan kasus

yang jumlah datanya besar. CART diperoleh

menggunakan pembagian cepat yang secara

rekursif mempartisi data menjadi sub yang lebih

kecil.

Penelitian menggunakan metode CART

sudah pernah dilakukan oleh Suniantara (2008)

serta Pratiwi dan Zain [2]. Suniantara (2008)

Page 16: REGRESSION TREES (CART) CLASSIFICATION AND ......antar peminat di bidang ilmu matematika dan terapannya, seperti statistika, matematika finansial, pengajaran matematika dan terapan

Jiwadiana, I G.A., Sukarsa, I K.G., Srinadi, I G.A.M. Klasifikasi Karakteristik Kecelakaan Lalu Lintas…

147

menerapkan metode CART dalam bidang

kesehatan yaitu memprediksi berat badan bayi

lahir. Penelitian ini menghasilkan model pohon

regresi karena variabel terikatnyanya bersifat

kontinu. Pratiwi dan Zain [2] meneliti tentang

klasifikasi pengangguran terbuka menggunakan

CART di Provinsi Sulawesi Utara.

Salah satu kasus yang terkait dengan metode

CART adalah karakteristik kecelakaan lalu

lintas. Pihak kepolisian telah mengumpulkan

data kecelakaan lalu lintas setiap harinya

sehingga menghasilkan data dalam jumlah yang

besar untuk setiap bulannya. Data tersebut

berupa data bertipe kategorik. Penelitian tentang

kecelakaan lalu lintas pernah dilakukan oleh

Afidah [3]. Masalah yang muncul dalam

kecelakaan lalu lintas ini adalah pada

karakteristik kecelakaan lalu lintas. Karakteristik

kecelakaan lalu lintas ini dibagi menjadi tiga

kelompok yaitu ringan, sedang, dan berat.

Ketiga kelompok tersebut dipengaruhi oleh

empat faktor yaitu faktor manusia, kendaraan,

jalan, dan alam (lingkungan) (Afidah [3]). Perlu

cara untuk mengetahui faktor-faktor apakah

yang dapat memengaruhi karakteristik

kecelakaan lalu lintas tersebut, sehingga pihak

kepolisian dapat mengambil tindakan yang dapat

mengurangi kondisi korban. Penelitian tentang

kecelakaan lalu lintas pernah dilakukan oleh

Afidah [3], meneliti pola tingkat keparahan

korban lalu lintas dengan menggunakan regresi

logistik multinomial.

Permasalahan dalam penelitian adalah

bagaimana klasifikasi karakteristik dan variabel

apa yang mejadi pemilah utama dalam

penentuan klasifikasi karakteristik kecelakaan

lalu lintas di Kota Denpasar dari bulan Januari

sampai Juli 2014?

Tujuan penelitian adalah untuk mengetahui

klasifikasi karakteristik dan variabel yang

mejadi pemilah utama dalam penentuan

klasifikasi karakteristik kecelakaan lalu lintas di

Kota Denpasar dari bulan Januari sampai Juli

2014.

2. METODE PENELITIAN

Penelitian ini menggunakan data sekunder

yang diperoleh dari POLRESTA (Kepolisian

Resor Kota) tentang data Kecelakaan Lalu

Lintas di Kota Denpasar dari bulan Januari

sampai bulan Juli 2014.

Gambaran umum variabel terikat dan

variabel bebas dalam penelitian dapat dilihat

pada Tabel 1.

Tabel 1. Gambaran Umum Variabel Terikat

dan Variabel Bebas

Penelitian ini dilaksanakan dengan metode

studi kasus, yaitu dilakukan dengan menerapkan

teori untuk menganalisis data dengan

menggunakan program CART Pro EX V6.0.

No Peubah Jenis Kategori

1 Karakteristik

kecelakaan lalu

lintas

(variabel

terikat)

Diskrit 1. Ringan

2. Sedang

3. Berat

2 Jenis

kecelakaan lalu

lintas

(variabel

bebas)

Diskrit 1. Tunggal

2. Samping-

samping

3. Depan-samping

4. Depan-depan

5. Depan-belakang

6. Pejalan kaki

3 Waktu

(variabel

bebas)

Diskrit 1. Lalu lintas padat

(antara pukul

06.00 WITA –

08.00 WITA,

antara pukul

12.00 WITA –

13.30 WITA,

antara pukul

16.00 WITA –

18.00 WITA)

2. Lalu lintas sepi

(selain waktu

padat)

4 Lokasi Status

jalan

(variabel

bebas)

Diskrit 1. Nasional

2. Provinsi

3. Kabupaten

4. Kodya

5. Kecamatan

5 Jenis kelamin

(variabel

bebas)

Diskrit 1. Laki-laki

2. Perempuan

6 Umur(variabel

bebas)

Kontinu

Page 17: REGRESSION TREES (CART) CLASSIFICATION AND ......antar peminat di bidang ilmu matematika dan terapannya, seperti statistika, matematika finansial, pengajaran matematika dan terapan

E-Jurnal Matematika Vol. 4 (4), November 2015, pp. 146-151 ISSN: 2303-1751

148

Langkah-langkah yang dilakukan dalam

penelitian ini adalah:

1) Penentuan pemilah dan pemilahan secara

rekursif pada simpul dengan menggunakan

pemilah Indeks Gini yaitu:

ij

t|ipt|jpti

dengan ti adalah nilai indeks gini,

t|jp adalah proporsi kelas j pada simpul

t, dan t|ip adalah proporsi kelas i pada

simpul t (Timofeev [4]). Penetapan sebuah

simpul sebagai simpul terminal, jika banyak

data pada simpul tersebut kurang atau sama

dengan 5.

2) Penandaan label kelas simpul yang

ditentukan berdasarkan jumlah kelas

terbanyak pada simpul.

3) Pemangkasan CART yang dilakukan untuk

mendapatkan pohon yang minimum dengan

menggunakan persamaan berikut:

TTRTR

dengan TR adalah Resubtitution Estimate

(Proporsi kesalahan pada sub pohon T,

adalah kompleksitas parameter, dan T

adalah jumlah simpul terminal pada pohon T

(Breimen [5]).

4) Pemilihan CART optimal dengan

menggunakan Cross Validation V-Fold

Estimate. Amatan dalam L dibagi menjadi V

bagian yang saling lepas dengan ukuran

kurang lebih sama besar ditiap kelasnya.

Learning sample ke-v dengan v=1,2,...,V

digunakan untuk membentuk pohon v

kT .

Misal xd v adalah hasil

pengklasifikasian, maka penduga sampel uji

untuk v

k

ts TR adalah:

vnn Lj,x

nn

v

v

v

k

ts jxdXN

1TR

Dengan menggunakan amatan induk L untuk

membentuk deretan pohon kT , maka

penduga validasi silang lipat V untuk v

kT

adalah:

V

1v

v

k

ts

k

cv TRV

1TR

Pohon klasifikasi optimum dipilih *Tk

dengan k

cv

kk

cv TRmin*TR .

3 HASIL DAN PEMBAHASAN

Objek orang pada penelitian ini adalah data

kecelakaan lalu lintas di Kota Denpasar dari

Bulan Januari sampai Bulan Juli 2014. Variabel

terikat pada penelitian ini adalah karakteristik

kecelakaan lalu lintas, sedangkan variabel

bebasnya adalah jenis laka (kecelakaan lalu

lintas), waktu, lokasi laka, jenis kelamin, dan

umur. Dari 371 data kecelakaan lalu lintas di

Kota Denpasar selama tahun 2014, diperoleh

gambaran karakteristik kecelakaan lalu lintas

yaitu kecelakaan ringan 24% atau 87 orang,

kecelakaan sedang sebesar 53% atau 198 orang,

dan kecelakaan berat sebesar 23% atau 86 orang.

3.1 Pembentukan CART Awal

CART awal dibentuk dengan menggunakan

metode pemilahan Indeks Gini. Metode ini

memisahkan kelas yang anggota kelasnya

terbesar lebih dahulu atau yang merupakan kelas

terpenting dalam simpul tersebut. Berikut ini,

diberikan kemungkinan pemilah pada masing-

masing variabel bebas:

1) Jenis laka 1x dengan 6 kategori nominal,

kemungkinan pemilah 3112 16

2) Waktu 2x dengan 2 kategori nominal,

mempunyai kemungkinan pemilah

112 12

3) Lokasi status jalan 3x dengan 5 kategori

nominal, mempunyai kemungkinan pemilah

1512 15

4) Jenis kelamin 4x dengan 2 kategori

nominal, mempunyai kemungkinan pemilah

112 12

Umur 5x merupakan data kontinu. Dari 371

orang, terdapat n nilai amatan berbeda, maka

terdapat n-1 kemungkinan pemilah.

Pemilah yang memberikan nilai indeks gini

tertinggi adalah pemilah terbaik yang digunakan

Page 18: REGRESSION TREES (CART) CLASSIFICATION AND ......antar peminat di bidang ilmu matematika dan terapannya, seperti statistika, matematika finansial, pengajaran matematika dan terapan

Jiwadiana, I G.A., Sukarsa, I K.G., Srinadi, I G.A.M. Klasifikasi Karakteristik Kecelakaan Lalu Lintas…

149

sebagai pemilah pertama dalam pembentukan

pohon. Dari lima variabel bebas, pemilahan

pertama kali dilakukan terhadap simpul

akar/utama yang didasarkan pada jenis laka

dengan nilai indeks gini 0,03252. Nilai indeks

gini masing-masing variabel ditampilkan dalam

Tabel 2.

Tabel 2. Nilai Indeks Gini

Peubah jenis laka terpilih sebagai pemilah

utama karena memberikan nilai indeks gini

tertinggi dari variabel lain. Dengan kata lain

bahwa, variabel bebas jenis laka merupakan

peubah utama yang berperan penting dalam

pembentukan CART.

Pemilahan ini memisahkan simpul utama

menjadi kelompok jenis kecelakaan depan-

belakang, depan-depan, depan-samping, pejalan-

kaki, samping-samping, dan kelompok jenis

kecelakaan tunggal. Hasil pemilahan pada

simpul ini, jumlah objek sebelah kiri sebanyak

359 orang dan sebelah kanan sebanyak 12 orang.

Dari 359 orang tersebut, terdapat karakteristik

kecelakaan berat sebesar 74 orang, kecelakaan

ringan 87 orang, dan kecelakaan sedang 198

orang. Sedangkan dari 12 orang pada simpul

kanan tersebut hanya terdapat 12 orang dengan

karakteristik kecelakaan berat. Selanjutnya

simpul dua dipilah berdasarkan lokasi laka, dan

seterusnya muncul variabel-variabel bebas jenis

kelamin, umur, dan waktu laka. Secara umum

semua variabel bebas muncul sebagai pemilah.

Penghentian pembentukan CART dilakukan

ketika banyaknya amatan pada simpul kurang

dari 5 atau dalam simpul terdapat amatan yang

homogen. Maka didapatkan CART awal dengan

42 simpul terminal.

3.2 Pemangkasan Pohon

Hasil dari pembentukan CART dengan

metode pemilahan Indeks Gini berukuran sangat

besar yaitu 42 simpul. Ukuran pohon yang besar

ini dapat menimbulkan overfitting. Untuk

mengatasinya maka dicari pohon dugaan yang

yang layak dengan memangkas pohon tersebut.

Pemangkasan CART merupakan suatu

upaya untuk menentukan ukuran CART yang

terbaik bagi CART yang terbentuk. Proses

pemangkasan pohon dilakukan apabila

memenuhi persamaan rightleft tRtRtR ,

maka rightt dan leftt dipangkas. Berdasarkan

perhitungan program yang digunakan diperoleh

18 sub pohon yang dihasilkan dari proses

pemangkasan.

Setelah CART dipangkas, ditentukan CART

optimum menggunakan penduga silang lipat V

(Cross Validation V-Fold Estimate). CART

optimum didapatkan berdasarkan nilai cvR

minimum yaitu 0,83540+/-0,03440 atau

0,80100≤cvR ≤0,86980 dengan parameter

kompleksitas 0,020682. Berdasarkan

kriteria ini, didapatkan CART optimum dengan

tiga simpul akhir. Letak pemangkasan CART

tersebut dapat dilihat pada Tabel 3.

Variabel

bebas Pemisah

Indeks

gini

N

kiri

N

kanan

1 Jenis

Laka

depan-

belakang, 0,03252 359 12

depan-depan,

depan-

samping,

pejalan kaki,

samping-

samping

2 Lokasi

Laka

Jalan

Kabupaten, 0,02304 277 94

Jalan

Kecamatan,

Jalan Kodya

3 Jenis

Kelamin Perempuan 0,01267 123 248

4 Umur 39.50000 0,00566 270 101

5 Waktu Padat 0,00554 97 274

Page 19: REGRESSION TREES (CART) CLASSIFICATION AND ......antar peminat di bidang ilmu matematika dan terapannya, seperti statistika, matematika finansial, pengajaran matematika dan terapan

E-Jurnal Matematika Vol. 4 (4), November 2015, pp. 146-151 ISSN: 2303-1751

150

Tabel 3. Letak Pemangkasan CART

Pohon Jumlah simpul

terminal

Cross-Validated Relative Cost

(biaya kesalahan)

Resubtitution

Relative Cost

(penduga pengganti)

komplesitas

parameter

1 42 0,91886 +/- 0,04079 0,48357 0,000000

11 15 0,87560 +/- 0,04126 0,59757 0,005648

12 14 0,89038 +/- 0,04101 0,60893 0,007584

13 13 0,89474 +/- 0,04107 0,62069 0,007851

14 9 0,85753 +/- 0,04151 0,67477 0,009023

15 8 0,85646 +/- 0,04143 0,68998 0,010150

16 7 0,85240 +/- 0,04070 0,71065 0,013791

17 6 0,85310 +/- 0,04058 0,73220 0,014379

18 5 0,84997 +/- 0,03953 0,75824 0,017367

19** 3 0,83540 +/- 0,03440 0,82025 0,020682

20 1 1,00000 +/- 0,00003 1,00000 0,059926

Berdasarkan cvR minimum sebesar

0,83540+/-0,03440 diperoleh CART optimum

dari proses pemangkasan dengan simpul-simpul

terminal yang dihasilkan dan digambarkan pada

Gambar 1.

Gambar 1. CART Optimum dengan Tiga Simpul

Terminal

Dalam proses pemangkasan berdasarkan cvR minimum, didapatkan CART dengan tiga

simpul terminal. Dengan peubah yang masuk

dalam CART tersebut adalah jenis laka dan

lokasi laka. Jenis laka menjadi pemilah utama

dalam pembentukan CART. Ketiga simpul

terminal yang dihasilkan dapat diuraikan sebagai

berikut:

1. Simpul terminal pertama, terdiri dari 12

orang yang dikelompokkan sebagai

karakteristik kecelakaan lalu lintas berat

dengan jenis laka tunggal.

2. Simpul terminal kedua, terdiri dari 68

orang yang dikelompokkan sebagai

karakteristik kecelakaan lalu lintas ringan

dengan jenis laka depan-belakang, depan-

depan, depan-samping, pejalan kaki,

samping-samping dan lokasi laka jalan

Kabupaten, jalan Kecamatan.

3. Simpul terminal ketiga, terdiri dari 291

orang yang dikelompokkan sebagai

karakteristik kecelakaan lalu lintas sedang

dengan jenis laka depan-belakang, depan-

depan, depan-samping, pejalan kaki,

samping-samping dan lokasi laka jalan

Kodya.

4. KESIMPULAN

Berdasarkan hasil dan pembahasan dapat

disimpulkan bahwa CART optimum yang

terbentuk menghasilkan tiga simpul terminal

yaitu simpul terminal pertama, terdiri dari 12

orang yang dikelompokkan sebagai karakteristik

kecelakaan lalu lintas berat dengan jenis laka

tunggal, simpul terminal kedua, terdiri dari 68

orang yang dikelompokkan sebagai karakteristik

kecelakaan lalu lintas ringan dengan jenis laka

depan-belakang, depan-depan, depan-samping,

pejalan kaki, samping-samping dan lokasi laka

jalan Kabupaten, jalan Kecamatan, serta Simpul

Node 1

Kelas = sedang

N = 371

Node 2

Kelas = sedang

N = 359 Node 3

Kelas = berat

N = 12

Node 1

Kelas = ringan

N = 68

Node 2

Kelas = sedang

N = 291

Page 20: REGRESSION TREES (CART) CLASSIFICATION AND ......antar peminat di bidang ilmu matematika dan terapannya, seperti statistika, matematika finansial, pengajaran matematika dan terapan

Jiwadiana, I G.A., Sukarsa, I K.G., Srinadi, I G.A.M. Klasifikasi Karakteristik Kecelakaan Lalu Lintas…

151

terminal ketiga, terdiri dari 291 orang yang

dikelompokkan sebagai karakteristik kecelakaan

lalu lintas sedang dengan jenis laka depan-

belakang, depan-depan, depan-samping, pejalan

kaki, samping-samping dan lokasi laka jalan

kodya dan variabel bebas yang menjadi pemilah

utama dalam pembentukan CART adalah jenis

laka dengan nilai indeks gini 0,03252.

Daftar Pustaka

[1] Lusyanti, Merlina. 2010. Perbandingan

Metode Regresi Logistik Dengan Metode

Pohon Klasifikasi Pada Data Polikotomus

(Studi Kasus Pada Faktor Yang

Berpengaruh Terhadap Keberhasilan

Pengobatan Akupuntur Pada Penderita

Obesitas Di LP3A Surabaya). Skripsi.

Surabaya: Institut Teknologi Sepuluh

Nopember (tidak dipublikasikan).

[2] Pratiwi, F. E., dan Zain, I. 2014. Klasifikasi

Pengangguran Terbuka Menggunakan

CART (Classification and Regression Tree)

di Provinsi Sulawesi Utara. Sains dan Seni

Pomit, Jurusan Statistika, FMIPA, Institut

Teknologi Sepuluh Nopember.

[3] Afidah, L. N. 2011. Pola Tingkat

Keparahan Korban Kecelakaan Lalu Lintas

dengan Menggunakan Regresi Logistik

Multinomial (Studi Kasus Kecelakaan Lalu

Lintas di Surabaya). Skripsi. Surabaya:

Institut Teknologi Sepuluh Nopember

(tidak dipublikasikan).

[4] Timofeev, R. 2004. Classification and

Regression Trees (CART) Theory and

Applications. Berlin: Center of Applied

Statistics and Economics Humboldt

University.

[5] Breimen, L. F. 1984. Classification and

Regression Tree. New York: Chapman And

Hall.