klasifikasi data produksi padi pulau jawa … · c4.5algorithm. the data used in form on secondary...

12
i KLASIFIKASI DATA PRODUKSI PADI PULAU JAWA MENGGUNAKAN ALGORITME CLASSIFICATION VERSION 4.5 (C4.5) oleh DWI SETYOWATI M0112026 SKRIPSI ditulis dan diajukan untuk memenuhi sebagian persyaratan memperoleh gelar Sarjana Sains Matematika PROGRAM STUDI MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS SEBELAS MARET SURAKARTA 2018

Upload: others

Post on 10-Jul-2020

3 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: KLASIFIKASI DATA PRODUKSI PADI PULAU JAWA … · C4.5Algorithm. The data used in form on secondary data which sourced from Badan Pusat Statistik. Based on the result of the research,

i

KLASIFIKASI DATA PRODUKSI PADI PULAU JAWA

MENGGUNAKAN ALGORITME CLASSIFICATION VERSION 4.5 (C4.5)

oleh

DWI SETYOWATI

M0112026

SKRIPSI

ditulis dan diajukan untuk memenuhi sebagian persyaratan memperoleh gelar

Sarjana Sains Matematika

PROGRAM STUDI MATEMATIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

UNIVERSITAS SEBELAS MARET SURAKARTA

2018

Page 2: KLASIFIKASI DATA PRODUKSI PADI PULAU JAWA … · C4.5Algorithm. The data used in form on secondary data which sourced from Badan Pusat Statistik. Based on the result of the research,

ii

Page 3: KLASIFIKASI DATA PRODUKSI PADI PULAU JAWA … · C4.5Algorithm. The data used in form on secondary data which sourced from Badan Pusat Statistik. Based on the result of the research,

iii

PERNYATAAN

Dengan ini saya menyatakan bahwa skripsi saya yang berjudul KLASIFIKASI

DATA PRODUKSI PADI PULAU JAWA MENGGUNAKAN ALGORITME

CLASSIFICATION VERSION 4.5 (C4.5) belum pernah diajukan untuk

memperoleh gelar kesarjanaan pada suatu perguruan tinggi, dan sepanjang

pengetahuan saya juga belum pernah ditulis atau dipublikasikan oleh orang lain,

kecuali yang secara tertulis diacu dalam naskah ini dan disebutkan dalam daftar

pustaka.

Surakarta, Januari 2018

Dwi Setyowati

Page 4: KLASIFIKASI DATA PRODUKSI PADI PULAU JAWA … · C4.5Algorithm. The data used in form on secondary data which sourced from Badan Pusat Statistik. Based on the result of the research,

iv

ABSTRAK

Dwi Setyowati. 2018. KLASIFIKASI DATA PRODUKSI PADI PULAU

JAWA MENGGUNAKAN ALGORITME CLASSIFICATION VERSION 4.5

(C4.5). Fakultas Matematika dan Ilmu Pengetahuan Alam. Universitas Sebelas

Maret.

Padi merupakan tanaman pangan yang banyak diproduksi masyarakat

Indonesia. Jumlah penduduk Indonesia yang semakin meningkat mengakibatkan

semakin tinggi kebutuhan konsumsi pangan khususnya padi. Kebutuhan pangan

yang meningkat harus diimbangi dengan jumlah produksi yang meningkat pula.

Untuk menghindari jumlah impor beras yang berlebihan, perlu dilakukan

optimalisasi produksi padi di kota/kabupaten.

Penelitian ini bertujuan mengklasifikasi data produksi padi Pulau Jawa.

Metode yang digunakan adalah klasifikasi dengan Algoritme C4.5. Data yang

digunakan bersumber dari Badan Pusat Statistik.

Berdasarkan hasil penelitian, klasifikasi data produksi padi Pulau Jawa

menghasilkan pohon keputusan dengan 9 aturan klasifikasidan 4 klasifikasi status

kota/kabupaten. Tingkat keakuratan yang diperoleh dari pohon keputusan sebesar

83.19% sehingga pohon keputusan yang terbentuk cukup layak dalam

mengklasifikasi produksi padi Pulau Jawa.

Kata kunci: klasifikasi, produksi padi, algoritme C4.5

Page 5: KLASIFIKASI DATA PRODUKSI PADI PULAU JAWA … · C4.5Algorithm. The data used in form on secondary data which sourced from Badan Pusat Statistik. Based on the result of the research,

v

ABSTRACT

Dwi Setyowati. 2018. THE CLASSIFICATION OF RICE DATA

PRODUCTION OF JAVA ISLAND USING CLASSIFICATION VERSION 4.5

ALGORITHM (C4.5). Faculty of Mathematics and Nature Sciences. Sebelas

Maret University.

Rice is a food plantation which is mostly produced in Indonesia. The

number of population on Indonesia which continues to increase causes the higher

the consumption of food, especially rice. The needs of food which is increasing

should be balanced with the number of the production which increases to avoid

the number of imported rice. So it is important to know the city/regency in which

the production of rice need to be optimized.

The research is aim to classify the rice data production of Java Island to find

out the city/regency that are need to be optimized. The methods use is

C4.5Algorithm. The data used in form on secondary data which sourced from

Badan Pusat Statistik.

Based on the result of the research, the classification of rice data production

of Java Island resulted decision tree with 9 classification rules. The level of the

accuracy obtained from decision tree is 83.19%, so that the decision tree formed

quite worth in doing the classification of the rice data production of Java Island.

Keywords : classification, production of rice , C4.5 algorithm

Page 6: KLASIFIKASI DATA PRODUKSI PADI PULAU JAWA … · C4.5Algorithm. The data used in form on secondary data which sourced from Badan Pusat Statistik. Based on the result of the research,

vi

MOTO

“Maka sesungguhnya bersama kesulitan ada kemudahan. Sesungguhnya bersama

kesulitan ada kemudahan. Maka apabila engkau telah selesai (dari sesuatu

urusan), tetaplah bekerja keras (untuk urusan yang lain), dan hanya kepada

Tuhanmulah engkau berharap.”

Q.S. Al-Insyirah

94 : 5-8

Page 7: KLASIFIKASI DATA PRODUKSI PADI PULAU JAWA … · C4.5Algorithm. The data used in form on secondary data which sourced from Badan Pusat Statistik. Based on the result of the research,

vii

PERSEMBAHAN

Karya ini dipersembahkan untuk keluarga dan teman-teman atas motivasi,

doa, dan semangat yang diberikan.

Page 8: KLASIFIKASI DATA PRODUKSI PADI PULAU JAWA … · C4.5Algorithm. The data used in form on secondary data which sourced from Badan Pusat Statistik. Based on the result of the research,

viii

PRAKATA

Puji syukur kehadirat Tuhan Yang Maha Esa atas limpahan rahmatNya

sehingga penulis dapat menyelesaikan skripsi ini. Ucapan terimakasih penulis

sampaikan kepada

1. Dra. Yuliana Susanti, M.Si. sebagai Pembimbing I yang telah memberikan

bimbingan dalam hal penulisan skripsi, motivasi, pemilihan tema,

pedalaman materi, dan pengambilan data,

2. Supriyadi Wibowo, S.Si., M.Si. sebagai Pembimbing II yang telah

memberikan bimbingan, motivasi, dan penyusunan alur penulisan,

3. Bowo Winarno, S.Si., M.Kom. yang telah memberikan motivasi dan

bimbingan dalam pembuatan program, dan

4. seluruh pihak yang telah membantu dalam kelancaran skripsi ini.

Semoga skripsi ini dapat bermanfaat.

Surakarta, Januari 2018

Penulis

Page 9: KLASIFIKASI DATA PRODUKSI PADI PULAU JAWA … · C4.5Algorithm. The data used in form on secondary data which sourced from Badan Pusat Statistik. Based on the result of the research,

ix

DAFTAR ISI

HALAMAN JUDUL ....................................................................................... i

HALAMAN PENGESAHAN ........................................................................ ii

PERNYATAAN ........................................................................................... iii

ABSTRAK ..................................................................................................... iv

ABSTRACT ....................................................................................................... v

MOTO ........................................................................................................... vi

PERSEMBAHAN ......................................................................................... vii

PRAKATA ................................................................................................... viii

DAFTAR ISI .................................................................................................. ix

DAFTARTABEL ........................................................................................... xi

DAFTAR GAMBAR .................................................................................... xii

I PENDAHULUAN .......................................................................................... 1

1.1 Latar Belakang Masalah ............................................................................ 1

1.2 Perumusan Masalah .................................................................................. 3

1.3 Tujuan ....................................................................................................... 3

1.4 Manfaat ..................................................................................................... 3

II LANDASAN TEORI .................................................................................... 4

2.1 Tinjauan Pustaka ....................................................................................... 4

2.2 Teori Penunjang ........................................................................................ 6

2.2.1 Data Mining .................................................................................. 6

2.2.2 Klasifikasi ..................................................................................... 7

2.2.3 Pohon Keputusan .......................................................................... 7

2.2.4 Algoritme C4.5 .............................................................................. 9

Page 10: KLASIFIKASI DATA PRODUKSI PADI PULAU JAWA … · C4.5Algorithm. The data used in form on secondary data which sourced from Badan Pusat Statistik. Based on the result of the research,

x

2.2.5 Confusion Matrix ........................................................................ 11

2.3 Kerangka Pemikiran................................................................................ 13

III METODE PENELITIAN ............................................................................ 14

IV PEMBAHASAN ........................................................................................... 16

4.1 Deskripsi Atribut Data ............................................................................ 16

4.2 Analisis Algoritme C4.5 ......................................................................... 17

4.2.1 Menentukan Node Akar .............................................................. 18

4.2.2 Menentukan Node Cabang .......................................................... 19

4.3 Interpretasi Pohon Keputusan ................................................................. 26

4.4 Pengujian Akurasi Pohon Keputusan Algoritme C4.5 ........................... 28

4.5 Program dalam Delphi ............................................................................ 29

V PENUTUP ..................................................................................................... 32

5.1 Kesimpulan ............................................................................................. 32

5.2 Saran ....................................................................................................... 32

VI DAFTAR PUSTAKA 33

Page 11: KLASIFIKASI DATA PRODUKSI PADI PULAU JAWA … · C4.5Algorithm. The data used in form on secondary data which sourced from Badan Pusat Statistik. Based on the result of the research,

xi

DAFTAR TABEL

2.1 Model Confusion Matrix ......................................................................... 11

4.1 Kategori Variabel Target ........................................................................ 16

4.2 Kategori Variabel Input .......................................................................... 17

4.3 Hasil Perhitungan Iterasi Pertama ........................................................... 18

4.4 Hasil Perhitungan Iterasi Kedua ............................................................. 20

4.5 Hasil Perhitungan Iterasi Ketiga ............................................................. 21

4.6 Hasil Perhitungan Iterasi Keempat ......................................................... 23

4.7 Aturan Klasifikasi dengan Algoritme C4.5 ............................................ 26

4.8 Klasifikasi Status Kota/Kabupaten ......................................................... 27

4.9 Jumlah Klasifikasi Benar ........................................................................ 28

4.10 Confusion Matrix ................................................................................... 29

Page 12: KLASIFIKASI DATA PRODUKSI PADI PULAU JAWA … · C4.5Algorithm. The data used in form on secondary data which sourced from Badan Pusat Statistik. Based on the result of the research,

xii

DAFTAR GAMBAR

2.1 Struktur Pohon Keputusan ........................................................................ 8

2.2 Diagram Alur Algoritme C4.5 ................................................................. 15

4.1 Pohon Keputusan Hasil Perhitungan Iterasi Pertama .............................. 19

4.2 Pohon Keputusan Hasil Perhitungan Iterasi Kedua ................................ 21

4.3 Pohon Keputusan Hasil Perhitungan Iterasi Ketiga ................................ 22

4.4 Pohon Keputusan Hasil Perhitungan Iterasi Keempat ............................. 23

4.5 Pohon Keputusan Hasil Perhitungan Iterasi Kelima dan Keenam .......... 24

4.6 Pohon Keputusan Produksi Padi dengan Algoritme C4.5 ...................... 25

4.7 Klasifikasi Produksi Padi Tiap Kota/Kabupaten di Pulau Jawa ............. 27

4.8 Output Syntax Program Delphi ............................................................... 31