prediksi data nasabah yang berpotensi membuka …repository.usd.ac.id/35523/2/155314046_full.pdf ·...

83
i PREDIKSI DATA NASABAH YANG BERPOTENSI MEMBUKA SIMPANAN DEPOSITO MENGGUNAKAN METODE DECISION TREE DENGAN PENERAPAN ALGORITMA C4.5 SKRIPSI Diajukan Untuk Memenuhi Salah Satu Syarat Memperoleh Gelar Sarjana Komputer Program Studi Teknik Informatika Oleh : Fellia Febriani 155314046 PROGRAM STUDI TEKNIK INFORMATIKA JURUSAN TEKNIK INFORMATIKA FAKULTAS SAINS DAN TEKNOLOGI UNIVERSITAS SANATA DHARMA YOGYAKARTA 2019 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Upload: others

Post on 06-Nov-2020

8 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: PREDIKSI DATA NASABAH YANG BERPOTENSI MEMBUKA …repository.usd.ac.id/35523/2/155314046_full.pdf · Decision Tree Dengan Penerapan Algoritma C4.5”. 1.2 Rumusan Masalah Dalam melakukan

i

PREDIKSI DATA NASABAH YANG BERPOTENSI MEMBUKA

SIMPANAN DEPOSITO MENGGUNAKAN METODE DECISION TREE

DENGAN PENERAPAN ALGORITMA C4.5

SKRIPSI

Diajukan Untuk Memenuhi Salah Satu Syarat

Memperoleh Gelar Sarjana Komputer

Program Studi Teknik Informatika

Oleh :

Fellia Febriani

155314046

PROGRAM STUDI TEKNIK INFORMATIKA

JURUSAN TEKNIK INFORMATIKA

FAKULTAS SAINS DAN TEKNOLOGI

UNIVERSITAS SANATA DHARMA YOGYAKARTA

2019

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 2: PREDIKSI DATA NASABAH YANG BERPOTENSI MEMBUKA …repository.usd.ac.id/35523/2/155314046_full.pdf · Decision Tree Dengan Penerapan Algoritma C4.5”. 1.2 Rumusan Masalah Dalam melakukan

ii

PREDICTION OF CUSTOMERS DATA THAT POTENTIALLY OPEN

DEPOSITS USING DECISION TREE METHOD WITH THE

APPLICATION OF C4.5 ALGORITHM

THESIS

Present as Partial Fulfillment of the Requirement

To Obtain the Sarjana Komputer Degree

in Informatics Engineering Study Program

By :

Fellia Febriani

155314046

INFORMATICS ENGINEERING STUDY PROGRAM

DEPARTMENT OF INFORMATICS ENGINEERING

FACULTY OF SCIENCE AND TECHNOLOGY

SANATA DHARMA UNIVERSITY

YOGYAKARTA

2019

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 3: PREDIKSI DATA NASABAH YANG BERPOTENSI MEMBUKA …repository.usd.ac.id/35523/2/155314046_full.pdf · Decision Tree Dengan Penerapan Algoritma C4.5”. 1.2 Rumusan Masalah Dalam melakukan

iii

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 4: PREDIKSI DATA NASABAH YANG BERPOTENSI MEMBUKA …repository.usd.ac.id/35523/2/155314046_full.pdf · Decision Tree Dengan Penerapan Algoritma C4.5”. 1.2 Rumusan Masalah Dalam melakukan

iv

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 5: PREDIKSI DATA NASABAH YANG BERPOTENSI MEMBUKA …repository.usd.ac.id/35523/2/155314046_full.pdf · Decision Tree Dengan Penerapan Algoritma C4.5”. 1.2 Rumusan Masalah Dalam melakukan

v

HALAMAN PERSEMBAHAN

“Janganlah hendaknya kamu kuatir tentang apa pun juga, tetapi nyatakanlah

dalam segala hal keinginanmu kepada Allah dalam doa dan permohonan dengan

ucapan syukur”

(Filipi 4:6)

‘’Seberapa keras kita berusaha, kita tidak akan pernah bisa ‘membeli’ waktu, yang bisa kita lakukan hanyalah menggunakan waktu secara bijaksana”

-Napoleon Hiell-

TUGAS AKHIR INI SAYA PERSEMBAHKAN KEPADA :

TUHAN YESUS KRISTUS

PAPA,MAMA DAN KAKAK

KELUARGA TERCINTA

TEMAN-TEMAN SEPERJUANGAN TEKNIK INFORMATIKA 2015.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 6: PREDIKSI DATA NASABAH YANG BERPOTENSI MEMBUKA …repository.usd.ac.id/35523/2/155314046_full.pdf · Decision Tree Dengan Penerapan Algoritma C4.5”. 1.2 Rumusan Masalah Dalam melakukan

vi

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 7: PREDIKSI DATA NASABAH YANG BERPOTENSI MEMBUKA …repository.usd.ac.id/35523/2/155314046_full.pdf · Decision Tree Dengan Penerapan Algoritma C4.5”. 1.2 Rumusan Masalah Dalam melakukan

vii

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 8: PREDIKSI DATA NASABAH YANG BERPOTENSI MEMBUKA …repository.usd.ac.id/35523/2/155314046_full.pdf · Decision Tree Dengan Penerapan Algoritma C4.5”. 1.2 Rumusan Masalah Dalam melakukan

viii

ABSTRAK

Deposito masih merupakan pilihan bagi masyarakat untuk berinvestasi saat

ini dan sebuah bank perlu untuk menentukan strategi pemasaran dan promosi yang

lebih efisien dengan tidak terlalu banyak mengeluarkan biaya sehingga masyarakat

akan tertarik untuk berinvestasi pada produk deposito dari bank tersebut.

Keberhasilan strategi dalam pemasaran deposito pada sebuah bank sangat berperan

dalam meningkatkan dan menjaga kelangsungan hidup sebuah bank. Oleh karena

itu , maka dilakukan penelitian untuk memprediksi nasabah yang berpotensi

membuka simpanan deposito. Penelitian menggunakan teknik data mining yang

menerapkan metode decision tree dengan algoritma C4.5, algoritma C4.5

mempunyai keunggulan dalam kecepatan membaca dan membentuk model

sehingga mudah dipahami, namun mempunyai kelemahan dalam pembacaan data

yang berjumlah besar.

Pada penelitian ini algoritma C4.5 digunakan untuk mengklasifikasikan data

nasabah-nasabah yang bepotensi menerima tawaran deposito menggunakan dataset

bagian marketing sebuah bank di Portugal. Data yang dipakai memiliki 20 atribut

dan 1 label. Pada proses data selection, penulis menggunakan metode decision tree

dan dibandingkan dengan pereduksian atribut secara manual yang dilakukan oleh

penulis untuk mencari atribut yang paling berpengaruh terhadap proses klasifikasi

data nasabah yang berpotensi menerima tawaran deposito dari hasil tersebut

didapatlah atribut yang digunakan yaitu: Duration, ,Cons.Price.idx, Cons.conf.idx,

Euribor3m, nr.employed.

Pengujian yang dilakukan terhadap 18560 dari 41118 data menggunakan 3-fold

cross validation menghasilkan tingkat keakuratan sebesar 73.777%

Kata kunci : algoritma C4.5, data mining, Deposito

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 9: PREDIKSI DATA NASABAH YANG BERPOTENSI MEMBUKA …repository.usd.ac.id/35523/2/155314046_full.pdf · Decision Tree Dengan Penerapan Algoritma C4.5”. 1.2 Rumusan Masalah Dalam melakukan

ix

ABSTRACT

Deposits are still an option for the community to invest and a bank needs

to determine marketing strategies and promotions that are more efficient with not

spending too much cost so the public will be interested in Deposit products from

the bank. The successful strategy in marketing deposits on a bank is instrumental

in enhancing and maintaining the viability of a bank. Therefore, research is done to

predict potential customers to open deposits. Research using data mining techniques

that implement the method of decision tree with algorithm C4.5, C4.5 algorithm has

advantages in reading speed and forming model so easy to understand, but has

weakness in data reading Large numbers.

In this study the algorithm C4.5 used to classify the data of customers who

are potentially accepting the deposit offer using the marketing portion of a bank

dataset in Portugal. The Data used has 20 attributes and 1 label. In the data selection

process, the authors use the decision tree method and compare with the manually-

made attribute of the authors to find the attributes most influential to the potential

customer data classification process receiving a deposit offer from the results are

the attributes used are: Duration,Cons.price.idx, Cons.conf.idx, Euribor3m, Nr.

employed.

Tests conducted against 18560 of 41118 data using 3-fold cross validation

resulted in an accuracy rate of 73,777%

Keywords: C4.5 algorithm, data mining, deposits

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 10: PREDIKSI DATA NASABAH YANG BERPOTENSI MEMBUKA …repository.usd.ac.id/35523/2/155314046_full.pdf · Decision Tree Dengan Penerapan Algoritma C4.5”. 1.2 Rumusan Masalah Dalam melakukan

x

KATA PENGANTAR

Puji syukur kepada Tuhan Yang Maha Esa, atas berkat dan rahmatNya

penulis mampu menyelesaikan penelitian tugas akhir dengan judul “PREDIKSI

DATA NASABAH YANG BERPOTENSI MEMBUKA SIMPANAN

DEPOSITO MENGGUNAKAN METODE DECISION TREE DENGAN

PENERAPAN ALGORITMA C4.5”.

Penelitian ini tidak akan selesai tanpa adanya dukungan, semangat, dan

bantuan dari banyak pihak. Untuk itu, pada kesempatan ini penulis ingin

mengucapkan terima kasih kepada:

1. Tuhan Yesus Kristus yang selalu memberikan kekuatan, kesabaran, dan

petunjuk sehingga penulis dapat menyelesaikan tugas akhir.

2. Kedua orang tua, papa Fengky,SH. dan mama Dra. Elia Satriani yang

telah memberikan doa, perhatian, semangat, dan dukungan baik secara

moral maupun material bagi penulis selama menjalani masa perkuliahan

sampai selesai ini.

3. Kakak tercinta, Yonas Sinseng yang selalu memberikan doa, perhatian,

dan dukungan kepada penulis.

4. Bapak Sudi Mungkasi, S.Si.,M.Math.Sc.,Ph.D selaku Dekan Fakultas

Sains dan Teknologi Universitas Sanata Dharma.

5. Ibu Dr.Anastasia Rita Widiarti, M.Kom., selaku Ketua Program Studi

Tenik Informatika yang selalu memberikan dukungan, perhatian serta

saran kepada mahasiswa yang berjuang mengerjakan tugas akhir.

6. Romo Dr.Cyprianus Kuntoro Adi, S.J. M.A., M.Sc. selaku dosen

pembimbing tugas akhir yang telah sabar dan memberikan motivasi,

waktu dan kesabarannya dalam membimbing penulis untuk penyusunan

tugas akhir.

7. Bapak JB. Budi Darmawan S.T., M.Sc. selaku dosen pembimbing

akademik penulis.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 11: PREDIKSI DATA NASABAH YANG BERPOTENSI MEMBUKA …repository.usd.ac.id/35523/2/155314046_full.pdf · Decision Tree Dengan Penerapan Algoritma C4.5”. 1.2 Rumusan Masalah Dalam melakukan

xi

8. Kevin, teman seperjuangan dari masa metopen hingga bersama-sama

dalam pengerjaan skripsi ini tanpa berhenti menyemangati dan

menghibur satu sama lain.

9. Bernadus Generasi Kristian yang telah memberikan semangat, motivasi

dan menguatkan penulis setiap harinya untuk menyelesaikan tugas akhir

ini.

10. Sahabat-sahabatku Debora, Ayas, Udev yang selalu menghibur dan

memberi semangat penulis.

11. Teman-teman Tempe Benguk terutama Jeri, Novri, Gayoh, Adres,

David, Zenggi, Magnus, Suryo, Enjang, Dito yang selalu menemani dan

menghibur penulis.

12. Unni, El dan Monic teman seperjuangan skripsi yang selalu membantu

dalam pengerjaan skripsi dan selalu menyemangati satu sama lain.

13. Ruth, Dama dan Maria, Yerni, dan Giska teman seperjuangan skripsi

yang selalu menghibur dan menemani selama pengerjaan skripsi diluar

kampus dan di RAM.

14. Teman-teman Komunitas JOY Fellowship yang selalu mendoakan dan

memberi semangat penulis terutama Ka Rio, Ka Awi, Ka Vera, Yosua,

Natput, Nael, Wulan, Shella.

15. Teman – teman Teknik Informatika angkatan 2015 yang selalu

menyemangati dan memotivasi penulis serta berjuang bersama untuk

menyelesaikan tugas akhir ini

Tugas Akhir ini masih memiliki banyak kekurangan. Maka dari itu, penulis

menerima masukan saran dan kritik membangun yang yng berguna di masa

yang akan datang . Semoga penelitian tugas akhir ini dapat membawa

manfaat bagi semua pihak.

Yogyakarta,

Penulis

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 12: PREDIKSI DATA NASABAH YANG BERPOTENSI MEMBUKA …repository.usd.ac.id/35523/2/155314046_full.pdf · Decision Tree Dengan Penerapan Algoritma C4.5”. 1.2 Rumusan Masalah Dalam melakukan

xii

DAFTAR ISI

HALAMAN PERSETUJUAN......................................................................................... iii

HALAMAN PENGESAHAN.............................................................................................iv

HALAMAN PERSEMBAHAN ......................................................................................... v

LEMBAR PERNYATAAN PERSETUJUAN PUBLIKASI KARYA ILMIAH UNTUK

KEPENTINGAN AKADEMIS .... .................................................................................. vi

ABSTRAK ......................................................................................................................... vii

ABSTRACT ........................................................................................................................ ix

KATA PENGANTAR ........................................................................................................ x

DAFTAR GAMBAR ........................................................................................................ xiv

DAFTAR TABEL .............................................................................................................. xv

BAB I .................................................................................................................................. 1

PENDAHULUAN .............................................................................................................. 1

1.1 Latar Belakang .......................................................................................................... 1

1.2 Rumusan Masalah ..................................................................................................... 2

1.3 Batasan Masalah ....................................................................................................... 2

1.4 Tujuan Penelitian ...................................................................................................... 3

1.5 Manfaat Penelitian ................................................................................................... 3

1.6 Sistematika Penulisan ............................................................................................... 4

BAB II ................................................................................................................................. 5

LANDASAN TEORI .......................................................................................................... 5

2.1 Bank .......................................................................................................................... 5

2.1.1 Pengertian Bank ................................................................................................... 5

2.1.2 Peranan Bank Dalam Perekonomian .................................................................... 5

2.2 Deposito .................................................................................................................... 7

2.3 Pemasaran Langsung ................................................................................................ 8

2.4 Data Mining .............................................................................................................. 8

2.5 Pohon Keputusan .................................................................................................... 10

2.6 Algoritma C4.5 ....................................................................................................... 11

2.7 K-Fold Cross Validation ......................................................................................... 13

2.8 Evaluasi ............................................................................................................. 13

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 13: PREDIKSI DATA NASABAH YANG BERPOTENSI MEMBUKA …repository.usd.ac.id/35523/2/155314046_full.pdf · Decision Tree Dengan Penerapan Algoritma C4.5”. 1.2 Rumusan Masalah Dalam melakukan

xiii

BAB III ............................................................................................................................. 15

METODOLOGI PENELITIAN ........................................................................................ 15

3.1 Data ......................................................................................................................... 15

3.2 Preprocessing .......................................................................................................... 17

3.2.1 KDD (Knowledge Discovery in Database) ......................................................... 17

3.3 Data Testing dan Data Training ............................................................................ 24

3.4 Pemodelan dengan Algoritma C4.5 ...................................................................... 25

3.5 Pengujian Akurasi ................................................................................................... 29

3.6 Pengujian Data Tunggal .......................................................................................... 30

3.7 Kebutuhan Sistem ................................................................................................... 30

3.8 Perancangan Antar Muka Sistem ............................................................................ 31

BAB IV ............................................................................................................................. 33

4.1 Preprocessing Data .................................................................................................. 33

4.1.1 Data Selection ...................................................................................................... 33

4.2 Hasil dan Analisa .................................................................................................... 37

BAB V .............................................................................................................................. 50

KESIMPULAN DAN SARAN ......................................................................................... 50

5.1 KESIMPULAN ....................................................................................................... 50

5.2 SARAN ................................................................................................................... 50

DAFTAR PUSTAKA ....................................................................................................... 51

LAMPIRAN ...................................................................................................................... 52

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 14: PREDIKSI DATA NASABAH YANG BERPOTENSI MEMBUKA …repository.usd.ac.id/35523/2/155314046_full.pdf · Decision Tree Dengan Penerapan Algoritma C4.5”. 1.2 Rumusan Masalah Dalam melakukan

xiv

DAFTAR GAMBAR

Gambar 2.1 Ilustrasi k-fold cross validation ......................................................... 13

Gambar 3.1 Diagram Blok .................................................................................... 15

Gambar 3.2 Pohon keputusan Hasil perhitungan Root/ Node 1 ........................... 27

Gambar 3.3 Pohon keputusan Hasil Perhitungan Node 2 ..................................... 29

Gambar 3.4 Desain GUI ........................................................................................ 31

Gambar 4.1 Grafik akurasi .................................................................................... 37

Gambar 4.2 Menu Uji Data Tunggal..................................................................... 38

Gambar 4.3 Tree.................................................................................................... 48

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 15: PREDIKSI DATA NASABAH YANG BERPOTENSI MEMBUKA …repository.usd.ac.id/35523/2/155314046_full.pdf · Decision Tree Dengan Penerapan Algoritma C4.5”. 1.2 Rumusan Masalah Dalam melakukan

xv

DAFTAR TABEL

Tabel 2.1 Confusion Matrix .................................................................................. 13

Tabel 3.1 Data Atribut Nasabah ............................................................................ 15

Tabel 3.2 Contoh Data Nasabah............................................................................ 17

Tabel 3.3 Tabel Tranformasi Batas Interval ......................................................... 23

Tabel 3.4 Nilai Target Output ............................................................................... 24

Tabel 3.5 Pembagian 3-fold Validation ................................................................ 24

Tabel 3.6 Contoh Data Nasabah............................................................................ 25

Tabel 3.7 Perhitungan Root / Node 1 .................................................................... 26

Tabel 3.8 Perhitungan Node 2 ............................................................................... 28

Tabel 4.1 Perankingan Atribut Berdasarkan Information Gain ............................ 33

Tabel 4.2 Percobaan Atribut menggunakan Tools Weka...................................... 34

Tabel 4.3 Hasil Reduksi Atribut Menggunakan Weka ......................................... 35

Tabel 4.4 Hasil Percobaan Seleksi Atribut ........................................................... 36

Tabel 4.5 Tabel akurasi 3-fold-validation ............................................................. 49

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 16: PREDIKSI DATA NASABAH YANG BERPOTENSI MEMBUKA …repository.usd.ac.id/35523/2/155314046_full.pdf · Decision Tree Dengan Penerapan Algoritma C4.5”. 1.2 Rumusan Masalah Dalam melakukan

1

BAB I

PENDAHULUAN

1.1 Latar Belakang

Deposito masih merupakan pilihan bagi masyarakat yang ingin berinvestasi.

Menurut UU Nomor 10 tahun 1998, deposito sendiri memiliki definisi yaitu simpanan

yang penarikannya hanya dapat dilakukan pada waktu tertentu berdasarkan perjanjian

nasabah penyimpan dengan bank. Hal itu dikarenakan deposito memiliki tingkat suku

bunga per tahun yang diterima lebih tinggi apabila dibandingkan dengan simpanan

tabungan biasa. Untuk itu, bank membutuhkan strategi pemasaran yang dapat digunakan

untuk mengolah data dalam jumlah besar tersebut. Bank harus pintar dalam mengambil

kesempatan tersebut dengan melakukan promosi dalam stategi pemasaran yang efisien,

yaitu dengan melakukan pemasaran langsung (direct marketing). Salah satu cara yang

dapat digunakan sebelum pemasaran langsung yaitu memprediksi nasabah yang

berpotensi membuka simpanan deposito. Prediksi dapat dilakukan dengan menerapkan

teknik pengenalan pola seperti statistik dan matematika, yaitu dengan mengolah data-data

nasabah yang ada, kemudian diproses sehingga menghasilkan informasi, menemukan

hubungan yang berarti, mendapatkan pola data, kemudian memeriksa sekumpulan besar

data yang tersimpan pada penyimpanan. Proses tersebut dinamakan Data Mining

(Prabowo, 2014).

Proses mining sendiri sangat membantu beberapa pihak dalam mengolah data

dengan jumlah yang besar. Peran data mining yaitu untuk klasifikasi, prediksi,

pengelompokan, estimasi, dan asosiasi. Pada perkembangannya, proses prediksi dan

klasifikasi data menghasilkan beberapa tujuan, salah satunya untuk memudahkan dalam

mengambil keputusan. Metode untuk memprediksi dan mengklasifikasi data salah

satunya adalah metode decision tree.

Penelitian yang terkait dengan topik ini dilakukan oleh Septiawanti (2014) yang

menerapkan metode case-based reasoning untuk prediksi data nasabah yang berpotensi

membuka simpanan deposito. Penelitian yang dilakukan memiliki akurasi sebesar

86,948% dengan data yang digunakan oleh peneliti adalah data publik pada bagian

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 17: PREDIKSI DATA NASABAH YANG BERPOTENSI MEMBUKA …repository.usd.ac.id/35523/2/155314046_full.pdf · Decision Tree Dengan Penerapan Algoritma C4.5”. 1.2 Rumusan Masalah Dalam melakukan

2

pemasaran suatu bank di Portugal. Uji akurasi penelitian tersebut menggunakan cross

validation dan confusion matrix.

Pada penelitian lain oleh Harry Dhika tentang komparasi penerapan metode

C.45,naive bayes, dan neural network dalam Pemilihan Mitra Kerja Penyedia Jasa

Transportasi. Disimpulkan bahwa metode C4.5 tingkat akurasi tertinggi dibandingkan

dengan metode naive bayes dan neural network. Tingkat akurasi C4.5 adalah sebesar

97,1%,Naive Bayes sebesar 94,3% sedangkan Neural Network 60%

akurasi.(Dhika,Harry,2009)

Berdasarkan uraian tersebut, penulis tertarik melakukan penelitian dengan

menggunakan data publik yang diperoleh dari website UCI Repository Machine

Learning. Dengan menerapkan data tersebut menggunakan metode Decision Tree yang

diharapkan mampu mendapatkan pola prediksi yang akurat untuk mengetahui nasabah

mana yang berpotensi membuka simpanan deposito. Penelitian ini berjudul “Prediksi

Data Nasabah Yang Berpotensi Membuka Simpanan Deposito Menggunakan Metode

Decision Tree Dengan Penerapan Algoritma C4.5”.

1.2 Rumusan Masalah

Dalam melakukan penelitian ini terdapat rumusan masalah yang akan diuraikan,

diantaranya adalah:

1. Bagaimana membangun sistem dengan menerapkan metode decision tree

menggunakan algoritma C4.5 untuk memprediksi data nasabah yang

berpotensi membuka simpanan deposito?

2. Seberapa akurat penerapan metode decision tree untuk memprediksi data

nasabah yang berpotensi membuka simpanan deposito?

1.3 Batasan Masalah

Berdasarkan latar belakang dan rumusan masalah yang telah disebutkan, terdapat

beberapa batasan masalah

a. Metode yang digunakan adalah decision tree dengan menggunakan algoritma

C4.5.

b. Penelitian dilakukan dengan jumlah data sebanyak 18560 data, 20 atribut

dan 1 label kelas.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 18: PREDIKSI DATA NASABAH YANG BERPOTENSI MEMBUKA …repository.usd.ac.id/35523/2/155314046_full.pdf · Decision Tree Dengan Penerapan Algoritma C4.5”. 1.2 Rumusan Masalah Dalam melakukan

3

c. Implementasi algoritma C4.5 menggunakan Matlab.

d. Format file masukkan adalah .xlsx atau .xls.

1.4 Tujuan Penelitian

Adapun tujuan penelitian ini adalah sebagai berikut :

1. Membangun sistem yang dapat menghasilkan knowledge (pengetahuan) bagi

bank tentang prediksi data nasabah yang berpotensi membuka simpanan

deposito.

2. Mengetahui tingkat akurasi dari algoritma C4.5 dalam melakukan prediksi

data nasabah yang berpotensi membuka simpanan deposito.

1.5 Manfaat Penelitian

Manfaat dari penelitian adalah :

1. Membantu pihak bank pada bagian marketing untuk menentukan nasabah

yang berpotensi membuka simpanan deposito.

2. Menambah wawasan keilmuan yang berkaitan dengan data mining,

pemahaman tentang algoritma C4.5 dan prediksi menggunakan metode

decision tree.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 19: PREDIKSI DATA NASABAH YANG BERPOTENSI MEMBUKA …repository.usd.ac.id/35523/2/155314046_full.pdf · Decision Tree Dengan Penerapan Algoritma C4.5”. 1.2 Rumusan Masalah Dalam melakukan

4

1.6 Sistematika Penulisan

BAB I PENDAHULUAN

Bab ini membahas mengenai latar belakang, rumusan masalah, tujuan dan

manfaat penelitian, batasan masalah, dan sistematika penulisan yang berisi

tentang gambaran secara singkat dari tiap-tiap bab yang ada dalam penelitian

tugas akhir.

BAB II LANDASAN TEORI

Bab ini membahas tentang teori-teori yang terkait dalam pembuatan penelitian

ini serta algoritma dan variabel pendukung yang diterapkan dalam

menyelesaikan masalah.

BAB III METODOLOGI PENELITIAN

Pada bab ini berisi tentang deskripsi data penelitian yang digunakan dan proses

umum sistem dan tahap-tahap penyelesaian masalah.

BAB IV HASIL DAN ANALISA

Bab ini membahas tentang analisis hasil yang diperoleh dari pengujian yang

dilakukan, BAB V PENUTUP

Bab ini membahas tentang kesimpulan yang dapat diambil dari hasil yang

diperoleh dalam melakukan penelitian tugas akhir dan saran yang berguna untuk

mengembangkan sistem di masa yang akan datang.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 20: PREDIKSI DATA NASABAH YANG BERPOTENSI MEMBUKA …repository.usd.ac.id/35523/2/155314046_full.pdf · Decision Tree Dengan Penerapan Algoritma C4.5”. 1.2 Rumusan Masalah Dalam melakukan

5

BAB II

LANDASAN TEORI

2.1 Bank

2.1.1 Pengertian Bank

Menurut Hoggson (1926), bank merupakan lembaga intermediasi keuangan yang

didirikan untuk menerima simpanan uang, meminjamkan uang, dan menerbitkan promes

atau yang dikenal sebagai banknote. Kata bank berasal dari bahasa Italia “banca” berarti

tempat penukaran uang. Sedangkan menurut Undang-undang Negara Republik Indonesia

Nomor 10 Tahun 1998 tanggal 10 November 1998 tentang perbankan, bank adalah badan

usaha yang menghimpun dana dari masyarakat dalam bentuk simpanan, kemudian

menyalurkannya kepada masyarakat dalam bentuk kredit atau bentuk lainnya dalam

rangka meningkatkan taraf hidup rakyat banyak (Kasmir, 2000).

2.1.2 Peranan Bank Dalam Perekonomian

Selama ini masyarakat awam mengetahui peranan Bank dalam perekonomian

terbatas pada menerima tabungan dan memberikan kredit. Peranan Bank modern dalam

perekonomian dewasa ini, telah berkembang seiring dengan perkembangan zaman. Oleh

karena itu perlu diadopsi peran baru untuk melayani keinginan dan kebutuhan nasabah.

Peran utama perbankan modern dewasa ini adalah sebagai berikut:

1. Peran Intermediasi Mentrasnformasikan terutama merima simpanan uang

(giro, deposito, dan tabungan) dari rumah tangga kemudian memberikan kredit

untuk perusahaan dan individu dalam rangka menginvestasikan dananya dalam

bentuk, pembangunan gedung baru, peralatan, dan barang-barang lain.

2. Peran Pembayaran Peran pembayaran bank adalah menyelesaikan pembayaran

untuk atas nama nasabahnya (seperti penerbitan dan pembayaran cek,

pengiriman uang melalui telegram, menyediakan saluran untuk pembayaran

elektronik (ATM), dan penukaran valuta asing dan koin.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 21: PREDIKSI DATA NASABAH YANG BERPOTENSI MEMBUKA …repository.usd.ac.id/35523/2/155314046_full.pdf · Decision Tree Dengan Penerapan Algoritma C4.5”. 1.2 Rumusan Masalah Dalam melakukan

6

3. Peran Guarrantor Peran membantu dan menggaransi nasabah mereka untuk

melunasi hutangnya, ketika nasabah tersebut tidak mampu membayar (seperti

penerbitan letter of credit)

4. Peran Manajemen Risiko Peran bank dalam membantu nasabah dalam

menyiapkan dana untuk menanggulangi risiko properti dan individu

5. Peran Penasehat Investasi dan Tabungan Peran Bank dalam memberikan

nasehat kepada nasabah dalam melakukan investasi dan tabungan untuk tujuan

jangka panjang untuk kehidupan yang lebih baik di masa mendatang dengan

membangun dan memproteksi tabungan.

6. Peran Penjaminan Keamanan Nilai Surat Berharga Peran Bank dalam

menjamin nilai surat berharga dan melindungi barang-barang berharga

nasabahnya dan menjamin harga pasar surat berharga nasabahnya.

7. Peran agensi Bank adalah bertindak atas nama nasabah untuk mengatur dan

melindungi properti nasabahnya, atau mengeluarkan dan menebus surat-surat

berharga nasabahnya (yang pada umumnya melalui jasa kepercayaan bank).

8. Peran Pengambilan Kebijakan Peranan Bank di sini adalah Bank bertindak

sebagai saluran kebijakan pemerintah dalam mengatur pertumbuhan ekonomi

dan mengejar tujuan sosial.

Dari peranan perananan yang telah dijabarkan diatas, pada penelitian kali ini

berfokus pada peran bank sebagai Penasehat Investasi dan Tabungan khususnya peranan

bank dalam penyimpanan pengumpulan dana simpanan yang berasal dari masyarakat

yang sering disebut dengan Dana Pihak Ketiga (DPK) yang merupakan sumber dan bagi

bank. Adapun DPK tersebut terdiri dari giro, tabungan dan deposito. Pada pemaparan

pada sub bab berikut akan dijelaskan mengenai deposito karna pada penelitian kali ini

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 22: PREDIKSI DATA NASABAH YANG BERPOTENSI MEMBUKA …repository.usd.ac.id/35523/2/155314046_full.pdf · Decision Tree Dengan Penerapan Algoritma C4.5”. 1.2 Rumusan Masalah Dalam melakukan

7

penulis hanya berfokus pada 1 sumber DPK pada bank yaitu deposito (Dedy Takdir

Syaiffudin. (2007).

2.2 Deposito

Deposito atau simpanan berjangka merupakan simpanan dana masyarakat dimana

penarikan tersebut hanya dilakukan pada waktu tertentu sesuai dengan tanggal yang telah

disepakati antara nasabah dengan pihak bank. Apabila nasabah menarik dananya tidak

sesuai dengan waktu yang telah disepakati, nasabah akan didenda (Sukmayani dkk.,

2008).

Deposito merupakan salah satu tempat bagi nasabah untuk melakukan investasi

dalam bentuk surat-surat berharga. Pemilik deposito di sebut deposan. Kepada setiap

deposan akan diberikan imbalan bunga atas depositonya. Bagi bank, bunga yang di

berikan kepada para deposan merupakan bunga yang tertinggi, jika di bandingkan dengan

simpanan giro atau tabungan, sehingga deposito oleh sebagian bank dianggap sebagai

dana mahal. Keuntungan bagi bank dengan menghimpun dana lewat deposito adalah uang

yang tersimpan relatif lebih lama, mengingat deposito memiliki jangka waktu yang relatif

panjang dan frekuensi penarikan juga jarang. Dengan demikian, bank dapat dengan

leluasa untuk menggunakan kembali dana tersebut untuk keperluan penyalur kredit.

Fungsi deposito merupakan salah satu alat untuk mengumpulkan dana dari

masyarakat dan sangat berguna sekali untuk pemanfaatan perkereditan bagi bank. Maka

fungsi deposito mempunyai peranan penting, hal ini disebabkan karena deposito

merupakan salah satu sarana bagi bank untuk mengerahkan dana dari masyarakat.

Dimana nantinya oleh bank akan dimanfaatkan kembali dan disalurkan dalam bentuk

kredit kepada masyarakat ataupun berupa produk-produk bank yang lain. Dengan

demikian berarti deposito merupakan juga suatu cara untuk mengatur kehidupan

perekonomian.

Pertumbuhan dan munculnya bank-bank baru dan masuknya cabang-cabang

bank asing di Indonesia, sehingga persaingan antar bank dalam memperebutkan pasar

yang semakin ketat. Dengan makin ketatnya persaingan bank dalam memperebutkan

pasar menyebabkan pergeseran yang mendasar dalam pola pemasaran terutama teknik

pemasaran suatu bank dalam menawarkan produk depositonya terhadap nasabah atau

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 23: PREDIKSI DATA NASABAH YANG BERPOTENSI MEMBUKA …repository.usd.ac.id/35523/2/155314046_full.pdf · Decision Tree Dengan Penerapan Algoritma C4.5”. 1.2 Rumusan Masalah Dalam melakukan

8

deposan. Jika sebelumnya bank-bank melakukan kegiatan pemasaran lebih pasif, maka

saat ini dipaksa harus melaksanakan pemasaran secara aktif dengan mendatangi calon

nasabah, baik dirumah maupun di kantor disertai dengan promosi di media-media online.

Bentuk pemasaran yang kerap kali digunakan bank pada umumnya adalah pemasaran

langsung. Pemasaran langsung adalah metode penjualan dimana pengiklan langsung

mendekati calon pelanggan dengan produk atau jasa tanpa pihak perantara pemasaran.

Pemasaran langsung adalah metode penjualan dimana pengiklan langsung mendekati

calon pelanggan dengan produk atau jasa tanpa pihak perantara pemasaran.

Dalam proses menjalankan pemasaran langsung dibutuhkan suatu metode untuk

meningkatkan hasil dari pemasaran langsung, salah satunya adalah menerapkan metode

klasifikasi dalam proses pemasaran langsung, dengan menerapkan ilmu penambangan

data khususnya dengan menggunakan salah satu metode klasifikasi yang diharapkan

dapat mengklasifikasikan nasabah yang menerima dan menolak tawaran deposito

sehingga dari hasil yang didapatkan dapat menjadi pedoman dari bank dalam

menawarkan produk deposito ke calon deposan.

2.3 Pemasaran Langsung

Pemasaran langsung (direct marketing) adalah sistem pemasaran yang

dikendalikan penuh oleh pemasar, mengembangkan produk, mempromosikan, dan

mendistribusikan langsung produknya pada konsumen akhir dengan menggunakan

beberapa pilihan media dan menerima pemesanan langsung dari pelanggan (Hudson,

2008).

2.4 Data Mining

Data mining adalah suatu proses menemukan hubungan yang berarti, pola dan

dengan memeriksa sekumpulan besar data yang tersimpan, dengan menggunakan teknik

pengenalan pola (Gartner, 2012).

Pada dasarnya terdapat dua alasan yang menyebabkan data mining menjadi

perhatian. Pertama adalah kemampuan kita dalam mengumpulkan dan menyimpan data

dalam jumlah sangat banyak terus meningkat. Alasan yang utama adalah alasan kedua,

yaitu kebutuhan mengubah data menjadi informasi dan pengetahuan yang berguna (Kaur

dan Aggarwal, 2010)

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 24: PREDIKSI DATA NASABAH YANG BERPOTENSI MEMBUKA …repository.usd.ac.id/35523/2/155314046_full.pdf · Decision Tree Dengan Penerapan Algoritma C4.5”. 1.2 Rumusan Masalah Dalam melakukan

9

Data mining memindai basis data untuk menemukan pola yang tersembunyi,

informasi prediktif yang mungkin dilewatkan oleh para ahli karena berada di luar dugaan.

Data mining terdiri dari urutan iteratif dari langkah-langkah berikut: data clean, data

integration, data selection, data transformation, data mining, pattern evaluation, dan

knowledge extraction. (Kaur dan Aggarwal, 2010).

Istilah data mining dan knowledge discovery in database (KDD) sering digunakan

secara bergantian untuk menjelaskan proses penggalian informasi tersembunyi dalam

suatu basis data yang besar. Kedua istilah tersebut mempunyai konsep yang berbeda,

tetapi saling berkaitan dan digunakan secara bergantian karena data mining merupakan

salah satu tahapan dalam keseluruhan proses KDD (Kusrini dan Luthfi). Berikut adalah

tahap dalam proses KDD.

1. Seleksi data (Data selection)

Seleksi data dari sekumpulan data operasional perlu dilakukan sebelum tahap

penggalian informasi dalam KDD dimulai. Data hasil seleksi tersebut akan

disimpan dalam suatu berkas, terpisah dari basis data operasional.

2. Pre-processing / Cleansing

Proses cleansing dilaksanakan sebelum proses data mining pada data yang

menjadi fokus KDD. Proses cleaning diantaranya membuang duplikasi data dan

memperbaiki kesalahan pada data. Selain itu dilakukan juga proses enrichment,

yaitu proses memperkaya data yang sudah ada dengan data atau informasi yang

relevan dan diperlukan untuk KDD.

3. Transformasi (Tranformation)

Pengkodean adalah proses transformasi pada data yang telah dipilih.

Proses pengkodean dalam KDD merupakan proses kreatif dan sangat tergantung

pada jenis atau pola informasi yang akan dicari dalam basis data.

4. Data Mining

Data mining adalah proses pola atau informasi menarik dalam data dengan

menggunakan teknik atau metode tertentu. Pemilihan metode atau algoritma yang

tepat sangat bergantung pada tujuan dan proses KDD secara keseluruhan.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 25: PREDIKSI DATA NASABAH YANG BERPOTENSI MEMBUKA …repository.usd.ac.id/35523/2/155314046_full.pdf · Decision Tree Dengan Penerapan Algoritma C4.5”. 1.2 Rumusan Masalah Dalam melakukan

10

5. Interpretasi/Evaluasi (Interpretation/Evaluation)

Pola informasi yang dihasilkan dari proses data mining perlu ditampilkan dalam

bentuk yang mudah dimengerti oleh pihak yang berkepentingan. Tahap-tahap ini

disebut dengan interpretasi yang mencakup pemeriksaan apakah pola atau

informasi yang ditemukan bertentangan dengan fakta atau hipotesis yang ada

sebelumnya.

Menurut Larose metode data mining dibagi menjadi enam kelompok berdasarkan

tugas yang dilakukan. Kelompok-kelompok tersebut diuraikan sebagai berikut:

1. Deskripsi

Teknik yang digunakan untuk menggambarkan pola dan kecendrungan yag

terdapat dalam data.

2. Klasifikasi

Proses membedakan kelas data dalam beberapa kategori.

3. Estimasi

Estimasi hampir sama dengan klasifikasi, tetapi variabel target estimasi lebih ke

arah numerik daripada ke arah kategorik.

4. Prediksi

Prediksi hampir sama dengan klasifikasi dan estimasi, tetapi nilai dari hasil

prediksi akan ada di masa mendatang.

5. Klaster

Klaster merupakan pengelompokan sejumlah data yang mempunyai kemiripan ke

dalam kelompok-kelompok data.

6. Asosiasi

Teknik yang digunakan untuk mencari hubungan antara karakteristik tertentu

dalam satu waktu.

2.5 Pohon Keputusan

Pohon keputusan merupakan salah satu metode klasifikasi yang kuat dan terkenal.

Metode pohon keputusan mengubah fakta yang besar menjadi pohon keputusan yang

merepresentasikan aturan, aturan tersebut dapat dengan mudah untuk diinterpretasi oleh

manusia. Pohon keputusan juga berguna untuk mengeksplorasikan data, menemukan

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 26: PREDIKSI DATA NASABAH YANG BERPOTENSI MEMBUKA …repository.usd.ac.id/35523/2/155314046_full.pdf · Decision Tree Dengan Penerapan Algoritma C4.5”. 1.2 Rumusan Masalah Dalam melakukan

11

hubungan tersembunyi antara sejumlah variabel input dengan sebuah variabel target

(Berry & Linoff, 2004).

Model pohon keputusan terdiri dari sekumpulan aturan untuk membagi sejumlah

populasi yang heterogen menjadi lebih kecil(homogen) dengan memperhatikan variabel

tujuannya. Variabel tujuan biasanya dikelompokkan dengan pasti dan model pohon

keputusan lebih mengarah pada perhitungan probabilitas dari tiap-tiap record terhadap

kategori tersebut atau untuk mengklasifikasikan record dengan mengelompokkannya

dalam satu kelas. Sebuah pohon keputusan dapat dibangun dengan menerapkan salah satu

algoritma pohon keputusan untuk memodelkan himpunan data yang belum terklasifikasi

kelasnya (Kusrini, 2009).

2.6 Algoritma C4.5

Algoritma C4.5 adalah algoritma klasifikasi data dengan teknik decision tree yang

memiliki kelebihan-kelebihan. Kelebihan ini misalnya dapat mengolah data numerik

(kontinyu) dan diskret, dapat menangani nilai atribut yang hilang, menghasilkan aturan-

aturan yang mudah diinterpretasikan dan tercepat diantara algoritma-algoritma yang lain

(Kusrini,2009). Secara umum algoritma C4.5 digunakan untuk membangun pohon keputusan

adalah sebagai berikut (Kusrini, 2009):

a. Pilih atribut sebagai akar

b. Buat cabang untuk tiap-tiap nilai

c. Bagi kasus dalam cabang

d. Ulangi proses untuk setiap cabang sampai semua kasus pada cabang memiliki kelas

yang sama.

Untuk memilih atribut sebagai akar, didasarkan pada nilai Gain tertinggi dari atribut-

atribut yang ada. Untuk menghitung Gain digunakan rumus seperti tertera dalam persamaan

berikut :

𝐺𝑎𝑖𝑛(𝑆, 𝐴) = 𝐸𝑛𝑡𝑟𝑜𝑝𝑦 (𝑆) − ∑ |𝑆𝑖|

|𝑆|∗ 𝐸𝑛𝑡𝑟𝑜𝑝𝑦(𝑆𝑖)

𝑛

𝑖=1................(2.1)

Keterangan :

S : Himpunan khusus

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 27: PREDIKSI DATA NASABAH YANG BERPOTENSI MEMBUKA …repository.usd.ac.id/35523/2/155314046_full.pdf · Decision Tree Dengan Penerapan Algoritma C4.5”. 1.2 Rumusan Masalah Dalam melakukan

12

A : Atribut

n : Jumlah partisi atribut A

|Si| : Jumlah kasus pada partisi ke-i

|S| : Jumlah kasus dalam S

Setelah mendapatkan nilai Gain, ada satu hal lagi yang perlu dilakukan

perhitungan yaitu mencari nilai Entropy. Entropy digunakan untuk menentukan seberapa

informatif sebuah input atribut untuk menghasilkan output atribut.

Rumus dasar dari Entropy tersebut adalah sebagai berikut :

𝐸𝑛𝑡𝑟𝑜𝑝𝑦(𝑠) = − ∑ 𝑝𝑖 𝑙𝑜𝑔2𝑛𝑖=1 𝑝𝑖 .............(2.2)

Keterangan :

S : Himpunan kasus

A : Atribut

n : Jumlah partisi S

Pi : Porsi dari Si terhadap S

Untuk menghitung GainRatio perlu diketahui suatu term baru yang disebut

SplitInformation (pemisah informasi). SplitInformation dihitung dengan persamaan

sebagai berikut.

𝑆𝑝𝑙𝑖𝑡𝐼𝑛𝑓𝑜𝑟𝑚𝑎𝑡𝑖𝑜𝑛 (S, A) = − ∑𝑆𝑖

𝑆 𝑙𝑜𝑔2

𝑆𝑖

𝑆

𝑐𝑖=1 ..............(2.3)

Dimana c adalah subset yang dihasilkan dari pemecahan dengan menggunakan

atribut A yang mempunyai sebanyak nilai c. Selanjutnya GainRatio dihitung dengan

persamaan berikut.

𝐺𝑎𝑖𝑛𝑅𝑎𝑡𝑖𝑜(S, A) =𝐺𝑎𝑖𝑛(𝑆,𝐴)

𝑆𝑝𝑙𝑖𝑡𝐼𝑛𝑓𝑜𝑟𝑚𝑎𝑡𝑖𝑜𝑛 (S,A) ........... (2.4)

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 28: PREDIKSI DATA NASABAH YANG BERPOTENSI MEMBUKA …repository.usd.ac.id/35523/2/155314046_full.pdf · Decision Tree Dengan Penerapan Algoritma C4.5”. 1.2 Rumusan Masalah Dalam melakukan

13

2.7 K-Fold Cross Validation

K-fold cross validation merupakan salah satu metode yang bisa digunakan

untuk menilai atau memvalidasi keakuratan sebuah sistem. Dalam k-fold cross

validation data akan di partisi secara acak ke dalam k partisi (D1,D2,…,Dk,

masing masing dari D memiliki jumlah data yang sama). Pembagian data dari k-

fold cross validation dapat dilihat pada ilustrasi di bawah ini:

Gambar 2.1 Ilustrasi K-Fold Cross Validation

Ilustrasi diatas menjelaskan pembagian dari model data yang digunakan.

Cara pembagian k-fold cross validation yaitu dengan cara, menentukan terlebih

dahulu nilai K yang akan di gunakan setelah itu membagi seluruh data sebanyak

K yang sudah ditentukan. Setelah itu dilakukan kombinasi dengan aturan model

training 2/3 dari nilai K yang ditentukan dan sisanya menjadi model testing.

2.8 Evaluasi

Evaluasi bertujuan untuk menguji tingkat keberhasilan. Pengujian tingkat

keberhasilan suatu sistem merupakan hal yang penting untuk mengetahui seberapa

baik sistem dalam mengklasifikasikan data. Confusion Matrix merupakan salah

satu metode yang dapat digunakan untuk mengukur kinerja suatu metode

klasifikasi. Pada pengukuran kinerja menggunakan Confusion Matrix, terdapat 4

istilah sebagai representasi hasil proses klasifikasi, yaitu:

Tabel 2.1 Confusion Matrix

Positif Negatif

Positif TP (True Positif) FN (False Negatif)

Negatif FP (False Positif) TN (True Negatif)

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 29: PREDIKSI DATA NASABAH YANG BERPOTENSI MEMBUKA …repository.usd.ac.id/35523/2/155314046_full.pdf · Decision Tree Dengan Penerapan Algoritma C4.5”. 1.2 Rumusan Masalah Dalam melakukan

14

Nilai akurasi dapat dihitung dengan persamaan:

𝑎𝑘𝑢𝑟𝑎𝑠𝑖 = 𝑇𝑃+𝑇𝑁

𝑇𝑃+𝑇𝑁+𝐹𝑃+𝐹𝑁 𝑥 100 % .......….(2.5)

Dimana:

TP = Jumlah positif yang diklasifikasi sebagai positif

TN = Jumlah negatif yang diklasifikasi sebagai negatif

FP = Jumlah negatif yang diklasifikasikan sebagai positif

FN = Jumlah positif yang diklasifikasikan sebagai negati

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 30: PREDIKSI DATA NASABAH YANG BERPOTENSI MEMBUKA …repository.usd.ac.id/35523/2/155314046_full.pdf · Decision Tree Dengan Penerapan Algoritma C4.5”. 1.2 Rumusan Masalah Dalam melakukan

15

BAB III

METODOLOGI PENELITIAN

Dalam metodologi penelitian ini akan dijelaskan lebih rinci mengenai data, dan

proses penelitian prediksi data nasabah yang berpotensi membuka simpanan deposito

menggunakan metode decision tree dengan algoritma C4.5. Gambar 3.1 merupakan alur

dari tahapan penelitian dijabarkan dalam bentuk diagram blok seperti berikut :

Gambar 3.1 Diagram Blok

3.1 Data

Data yang digunakan dalam penelitian ini adalah data publik yang diperoleh dari

situs UCI Repository Machine Learning yang berjudul “Bank Marketing Data Set”

dengan jumlah data 41188 dengan 20 atribut dan 1 Output.

Data yang diperoleh terdiri dari : age, job, marital, education, default, housing,

loan, contact, month, day of week, duration, campaign, pdays, previous, emp.var.rate,

cons.price.idx, cons.conf.idx, euribor3m, nr.employed, Y/N.

Tabel 3.1 Data Atribut Nasabah

No Atribut Keterangan dan Nilai

1 Age Umur Nasabah

2 Job Jenis pekerjaan nasabah

3 Marital Status pernikahan

4 Education Pendidikan nasabah

5 Default Apakah mempunyai

kredit gagal/macet ?

6 Housing Apakah mempunyai

kredit pinjaman rumah?

7 Loan Apakah mempunyai

pinjaman pribadi

8 Contact Jenis komunikasi yang

digunakan nasabah

9 Month Bulan terakhir

menghubungi nasabah

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 31: PREDIKSI DATA NASABAH YANG BERPOTENSI MEMBUKA …repository.usd.ac.id/35523/2/155314046_full.pdf · Decision Tree Dengan Penerapan Algoritma C4.5”. 1.2 Rumusan Masalah Dalam melakukan

16

10 Day_of_week Hari terakhir kontak

dengan nasabah

11 Duration Durasi terakhir

menghubungi nasabah

dalam detik

12 Campaign Jumlah kontak yang

dilakukan selama promosi

ini dan untuk nasabah ini

13 pdays Jumlah hari

yang

berlalu

setelah

nasabah

terakhir

dihubungi

dan

promosi

sebelumnya

14 Previous Jumlah kontak dilakukan

sebelum promosi ini dan

untuk klien ini

15 Emp.var.rate Variasi tingkat pekerjaan

16 Cons.price.idx Indeks harga konsumen

17 Cons.conf.idx Indeks kepercayaan

konsumen

18 Euribor3m Tingkat eurbor 3 bulan

19 Nr.employed Jumlah karyawan

20 Poutcome Hasil dari promosi

sebelumnya

21 y/n Apakah nasabah

berlangganan deposito

yang ditawarkan

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 32: PREDIKSI DATA NASABAH YANG BERPOTENSI MEMBUKA …repository.usd.ac.id/35523/2/155314046_full.pdf · Decision Tree Dengan Penerapan Algoritma C4.5”. 1.2 Rumusan Masalah Dalam melakukan

17

Berikut contoh data yang digunakan dalam penelitian ini:

Tabel 3. 2Contoh Data Nasabah

3.2 Preprocessing

3.2.1 KDD (Knowledge Discovery in Database)

Pada tahap ini dilakukan proses KDD (Knowledge Discovery in

Database), terdapat berberapa proses pada knowledge discovery in database

yaitu sebagai berikut :

No Data

1 Y Yes Yes No No

2 Age 41 49 56 74

3 Job retired entrepreneur retired retired

4 Marital divorced married married married

5 Education basic.4y university.degre

e

basic.4y basic.9y

6 Default yes no yes yes

7 Housing yes no no no

8 Loan no no no yes

9 Contact telephone telephone cellular cellular

10 Month may may nov nov

11 Day_of_

week

mon mon fri fri

12 Duration 1575 1042 189 239

13 Campaign 1 1 2 3

14 Pdays 999 999 999 999

15 Previous 0 0 0 1

16 Poutcome failure nontexsistent failure nonexistent

17 Emp.var.r

ate

1.1 1.1 -1.1 -1.1

18 Cons.pric

e.idx

93.994 93.994 94.767 94.767

19 Cons.conf

.idx

-36.4 -36.4 -50.8 -50.8

20 Euribor3

m

4.857 4.857 1.028 1.028

21 Nr.emplo

yed

5191 5191 4963.6 4963.9

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 33: PREDIKSI DATA NASABAH YANG BERPOTENSI MEMBUKA …repository.usd.ac.id/35523/2/155314046_full.pdf · Decision Tree Dengan Penerapan Algoritma C4.5”. 1.2 Rumusan Masalah Dalam melakukan

18

a. Data Cleaning

Tahap data cleaning dilakukan untuk membersihkan noise dan data yang

inkonsisten pada umumnya di tahap ini juga dilakukan pembersihan

missing values namun data set yang digunakan pada penelitian ini tidak

mengandung missing values.

b. Data Integration

Data integration dilakukan untuk menggabungkan data dari berbagai

sumber data, namun pada penelitian ini tidak dilakukan tahap data

integration karena data set yang dipakai hanya satu dan sudah siap

digunakan untuk penambangan data.

c. Data Selection

Data selection dilakukan untuk memilih atribut yang relevan dan

menghapus atribut yang tidak digunakan dalam penelitian. Dalam

menjalankan tahap data selection penulis menggunakan tools yang ada

pada aplikasi Weka dengan versi 3.8.3 dengan menerapkan metode

Information Gain untuk melakukan perankingan terhadap atribut yang ada

pada data.

d. Data Transformation

Data transformation adalah suatu proses yang dilakukan untuk mengubah

bentuk data menjadi bentuk yang sesuai untuk digunakan. Proses ini

dilakukan untuk mengubah data di atribut yang belum numerik,menjadi

data numeric. Proses transformation yang dilakukan pada penelitian ini

sebagai berikut:

1. Transformasi pada kolom age:

Transformasi dilakukan kedalam 5 kelompok usia yang telah

ditetapkan oleh badan kesahatan dunia (WHO) yaitu (Erabaru 2017):

0 – 17 tahun : Anak-anak di bawah umur

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 34: PREDIKSI DATA NASABAH YANG BERPOTENSI MEMBUKA …repository.usd.ac.id/35523/2/155314046_full.pdf · Decision Tree Dengan Penerapan Algoritma C4.5”. 1.2 Rumusan Masalah Dalam melakukan

19

18 – 65 tahun : Pemuda

66 – 79 tahun : Setengah baya

80 – 99 tahun : Orang tua

100 tahun ke atas : Orang tua berusia panjang

Selanjutnya dari kelima kelompok usia yang ada dilakukan

transformasi ke data numerik sebagai berikut:

Anak-anak di bawah umur : 1

Pemuda : 2

Setengah baya : 3

Orang tua : 4

Orang tua berusia panjang : 5

2. Tranformasi pada kolom job

Terdapat 12 jenis pekerjaan yang ada di kolom job dan dilakukan

transformasi sebagai berikut:

Admin : 1

Bluecollar : 2

Entrepreneur : 3

Housemaid : 4

Management : 5

Retired : 6

Self-employed : 7

Services : 8

Student : 9

Technician : 10

Unemployed : 11

Unknown : 12

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 35: PREDIKSI DATA NASABAH YANG BERPOTENSI MEMBUKA …repository.usd.ac.id/35523/2/155314046_full.pdf · Decision Tree Dengan Penerapan Algoritma C4.5”. 1.2 Rumusan Masalah Dalam melakukan

20

3. Transformasi pada kolom Marital

Terdapat 3 jenis status pada atribut status pernikahan yang akan di

transformasikan yaitu:

Single : 1

Married : 2

Divorce : 3

Unknown : 4

4. Transformasi pada kolom education

Terdapat 8 jenis data nasabah yang ada pada kolom education dan

dilakukan transformasi sebagai berikut:

basic 4y : 1

basic 6y : 2

basic 9y : 3

high school : 4

illiterate : 5

professional course : 6

university degree : 7

unknown : 8

5. Transformasi pada kolom default

Terdapat 3 jenis data nasabah yang ada pada kolom default dilakukan

transformasi sebagai berikut:

Yes : 1

No : 2

Unknown : 3

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 36: PREDIKSI DATA NASABAH YANG BERPOTENSI MEMBUKA …repository.usd.ac.id/35523/2/155314046_full.pdf · Decision Tree Dengan Penerapan Algoritma C4.5”. 1.2 Rumusan Masalah Dalam melakukan

21

6. Transformasi pada kolom Contact

Terdapat 2 jenis data nasabah yang ada pada kolom contact dilakukan

transformasi sebagai berikut:

Cellular : 1

Telephone : 2

7. Transformasi pada kolom Poutcome

Terdapat 3 jenis data nasabah yang ada pada kolom contact dan

dilakukan transformasi sebagai berikut:

Failure : 1

Nonexistent : 2

Success : 3

8. Transformasi pada kolom Month

Terdapat 10 jenis data nasabah yang ada pada kolom dan dilakukan

transformasi sebagai berikut :

Mar : 1

Apr : 2

May : 3

Jun : 4

Jul : 5

Aug : 6

Sep : 7

Oct : 8

Nov : 9

Dec : 10

9. Transformasi pada kolom day_of_week

Terdapat 5 jenis data nasabah yang ada pada kolom day of week dan

ditransformasikan sebagai berikut :

Tue : 1

Wed : 2

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 37: PREDIKSI DATA NASABAH YANG BERPOTENSI MEMBUKA …repository.usd.ac.id/35523/2/155314046_full.pdf · Decision Tree Dengan Penerapan Algoritma C4.5”. 1.2 Rumusan Masalah Dalam melakukan

22

Thu : 3

Fri : 4

Mon : 5

10. Transfomasi data pada atribut duration dikarenakan meskipun sudah

bernilai numerik tapi penyebarannya masih acak sehingga dilakukan

transformasi dengan proses pendistribusian tabel frekuensi

berkelompok, dengan melakukan langkah-langkah berikut :

a. Langkah pertama yaitu memilih atribut yang bernilai data numerik,

dan akan dicari intervalnya. Pada dataset penelitian ini, atribut yang

mengandung data numerik adalah duration.

b. Kemudian pada masing-masing atribut tersebut dicari nilai

minimum(Xmin) dan nilai maksimum (Xmax).

Untuk atribut duration , didapat :

Nilai minimum : 0

Nilai maksimum : 4918

c. Setelah mendapatkan nilai minimum (Xmin) dan nilai maksimum

(Xmax) dari setiap atribut, yang dicari, langkah selanjutnya adalah

menghitung nilai jangkauan dari masing-masing atribut dengan

rumus :

J = Xmax – Xmin ....(3.1)

Hitung jangkauan untuk atribut Duration :

J = 4918 – 0

J = 4918

d. Langkah selanjutnya menghitung jumlah kelas interval dengan rumus

:

k = 1 + 3,3 log n ….(3.2)

Sehingga jumlah kelas interval pada penelitian ini sebagai berikut :

k = 1 + 3,3 log 41188

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 38: PREDIKSI DATA NASABAH YANG BERPOTENSI MEMBUKA …repository.usd.ac.id/35523/2/155314046_full.pdf · Decision Tree Dengan Penerapan Algoritma C4.5”. 1.2 Rumusan Masalah Dalam melakukan

23

k = 1 + 15,228

k = 16,228

k = 17 dibulatkan menjadi 17, sehingga jumlah kelas interval adalah

17.

e. Kemudian menentukan panjang interval untuk masing-masing atribut,

dengan rumus :

p = 𝑗

𝑘 ....(3.3)

Panjang kelas interval untuk atribut Duration :

p = 4918

17 = 289,29

f. Langkah terakhir yaitu menentukan batas interval dari masing-

masing atribut yang terpilih :

Interval untuk atribut Duration :

Tabel 3.3 Tranformasi Batas Interval

Batas

Interval

Batas Bawah Batas Atas Transformasi

1 0 303.0426 1

2 304.0426 607.0852 2

3 608.0852 911.1277 3

4 912.1277 1215.17 4

5 1216.17 1519.213 5

6 1520.213 1823.255 6

7 1824.255 2127.298 7

8 2128.298 2431.341 8

9 2432.341 2735.383 9

10 2736.383 3039.426 10

11 3040.426 3343.468 11

12 3344.468 3647.553 12

13 3648.511 3951.553 13

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 39: PREDIKSI DATA NASABAH YANG BERPOTENSI MEMBUKA …repository.usd.ac.id/35523/2/155314046_full.pdf · Decision Tree Dengan Penerapan Algoritma C4.5”. 1.2 Rumusan Masalah Dalam melakukan

24

14 3952.553 4255.596 14

15 4256.596 4559.639 15

16 4560.639 4863.681 16

17 4864.681 5167.724 17

g. Nilai luaran akan bernilai 1 atau 0. Berikut representasi luaran dari

sistem

Tabel 3.4 Nilai Target Output

Status Nilai Target Output

Yes 1

No 0

3.3 Data Testing dan Data Training

Pada tahap ini hasil dari penambangan data berupa pola khusus yang akan

dievaluasi atau diteliti lagi apakah hasilnya sudah sesuai atau belum. Untuk

mengetahui apakah sistem yang akan dibangun ini sudah baik atau belum, maka

perlu dilakukan pengujian sistem menggunakan metode k-fold cross validation.

Evaluasi sistem pada penelitian ini dilakukan dengan membagi data menjadi

data testing dan data training. Pembagian data dilakukan dengan menerapkan

model 3-fold validation dengan membagi data menjadi 3 bagian seperti pada

Tabel 3.4.

Tabel 3.5 Pembagian 3-fold validation

Model Data

Training

Data

Testing

1 1,2 3

2 1,3 2

3 2,3 1

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 40: PREDIKSI DATA NASABAH YANG BERPOTENSI MEMBUKA …repository.usd.ac.id/35523/2/155314046_full.pdf · Decision Tree Dengan Penerapan Algoritma C4.5”. 1.2 Rumusan Masalah Dalam melakukan

25

3.4 Pemodelan dengan Algoritma C4.5

Pada tahap ini dilakukan proses penambangan data dengan algoritma C4.5.

Data yang digunakan dalam penelitian ini akan diklasifikasi dengan membentuk

pohon keputusan dengan menghitung Entropy, Information Gain, Split Info, dan

Gain Ratio. Proses pembentukan pohon diawali dengan mencari nilai GainRatio

tertinggi pada keseluruhan fitur untuk dijadikan sebagai simpul akar. Selanjutnya,

penghitungan brunch dan leaf akan dilakukan secara rekursif sampai pohon

keputusan terbentuk.

Langkah pembentukan pohon keputusan dengan menggunakan algoritma

C4.5 dijelaskan secara lebih rinci dalam menyelesaikan permasalahan pada data

nasabah seperti pada proses berikut :

1. Data yang digunakan pada pembentukan pohon keputusan merupakan data

nasabah dengan atribut mencakup : duration, cons.price.idx, cons.conf.idx,

euribor3m, nr.employed. Dari data yang ada akan menghasilkan nilai target

nasabah yang berpotensi menerima deposito (Yes atau No). Data yang digunakan

pada tabel 3.6 berikut :

Tabel 3.6 Contoh Data Nasabah

duration cons.price cons.conf euribor3m nr.employed Y

2 94,767 -50,8 1,035 4963,6 1

7 94,767 -50,8 1,035 4963,6 1

2 94,767 -50,8 1,030 4963,6 1

3 94,767 -50,8 1,030 4963,6 1

1 94,767 -50,8 1,031 4963,6 1

2 94,767 -50,8 1,031 4963,6 1

1 93,994 -36,4 4,857 5191 0

2 94,465 -41,8 4,864 5228,1 0

2 93,918 -42,7 4,960 5228,1 0

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 41: PREDIKSI DATA NASABAH YANG BERPOTENSI MEMBUKA …repository.usd.ac.id/35523/2/155314046_full.pdf · Decision Tree Dengan Penerapan Algoritma C4.5”. 1.2 Rumusan Masalah Dalam melakukan

26

1 93,994 -36,4 4,856 5191 0

1 93,444 -36,1 4,963 5228,1 0

2 94,465 -41,8 4,960 5228,1 0

1 92,893 -46,2 1,354 5099,1 0

1 93,369 -34,8 0,649 5008,7 0

1 93,994 -36,4 4,857 5191 0

2 93,075 -47,1 1,415 5099,1 0

2. Menghitung setiap kejadian, Entropy, Gain, Split Info, dan Gain Ratio untuk

menentukan root. Perhitungan ditampilkan pada tabel 3.7 berikut :

Tabel 3.7 Perhitungan Root / Node 1

Node 1 JML

KASUS No Yes Entropy

Info Gain

Split Info

Gain Ratio

Total 16 10 6 0,9544

Duration 0,2645 1,5436 0,1714

1 7 6 1 0,5917

2 7 4 3 0,9852

3 1 0 1 0

7 1 0 1 0

cons.price 0,9544 2,6085 0,3659

94,767 6 0 6 0

93,994 3 3 0 0

94,465 2 2 0 0

93,918 1 1 0 0

93,444 1 1 0 0

92,893 1 1 0 0

93,369 1 1 0 0

93,075 1 1 0 0

cons.conf 0,2710 0,8960 0,3025

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 42: PREDIKSI DATA NASABAH YANG BERPOTENSI MEMBUKA …repository.usd.ac.id/35523/2/155314046_full.pdf · Decision Tree Dengan Penerapan Algoritma C4.5”. 1.2 Rumusan Masalah Dalam melakukan

27

Dari hasil perhitungan pada tabel 3.7 diatas diperoleh nilai Gain Ratio tertinggi

adalah nr.employed yaitu sebesar 0.7035. Dengan demikian nr.employed terbentuk

sebagai root dari pohon keputusan. Pada atribut nr.employed kategori “>5008,7” semua

kasusnya bernilai “No” dan sudah mengklasifikasikan status nasabah yang akan

menerima tawaran deposito, sehingga tidak perlu dilakukan perhitugan lagi. Kategori

atribut nr.employed “ <=5008,7” masih perlu dilakukan perhitungan lebih lanjut.

Pohon keputusan yang terbentuk pada perhitungan root ditampilkan pada

gambar 3.2 berikut :

Gambar 3.2 Pohon keputusan Hasil perhitungan Root/ Node 1

34,8-36,4 5 5 0 0

41,8-50,8 11 5 6 0,9940

euribor3m 0,4379 0,9887 0,4429

<=1415 9 3 6 0,9183

>1415 7 7 0 0

nr employed 0,6956 0,9887 0,7035

<=5008,7 7 1 6 0,5917

>5008,7 9 9 0 0

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 43: PREDIKSI DATA NASABAH YANG BERPOTENSI MEMBUKA …repository.usd.ac.id/35523/2/155314046_full.pdf · Decision Tree Dengan Penerapan Algoritma C4.5”. 1.2 Rumusan Masalah Dalam melakukan

28

3. Menghitung setiap kejadian Entropy, Gain, Split Info, dan Gain Ratio untuk

menentukan node 2. Perhitungan untuk mencari node 2 ditampilkan pada tabel

3.8 berikut :

Tabel 3.8 Perhitungan Node 2

Node 1 JML

KASUS No Yes

Entropy

Info Gain

Split Info

Gain Ratio

Total 7 1 6 0,5917

Duration 0,3060 1,8424 0,1661

1 2 1 1 1,0000

2 3 0 3 0

3 1 0 1 0

7 1 0 1 0

cons.price 0,5917 0,5917 1,0000

94,767 6 0 6 0

93,994 0 0 0 0

94,465 0 0 0 0

93,918 0 0 0 0

93,444 0 0 0 0

92,893 0 0 0 0

93,369 1 1 0 0

93,075 0 0 0 0

cons.conf 0,5917

0,8631

0,6855

34,8-36,4 2 2 0 0

41,8-50,8 5 0 5 0

euribor3m - 0 0

<=1415 7 1 6 0,5917

>1415 0 0 0 0

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 44: PREDIKSI DATA NASABAH YANG BERPOTENSI MEMBUKA …repository.usd.ac.id/35523/2/155314046_full.pdf · Decision Tree Dengan Penerapan Algoritma C4.5”. 1.2 Rumusan Masalah Dalam melakukan

29

Dari hasil perhitungan pada tabel 3.8 diatas diperoleh nilai Gain Ratio tertinggi

adalah cons.price yaitu sebesar 1,0000. Dengan demikian cons.price terbentuk sebagai

node 2 dari pohon keputusan. Pada atribut tersebut kategori “94,767” semua kasus

bernilai “Yes” dan sudah mengklasifikasikan status nasabah yang menerima tawaran

deposito, sehingga tidak perlu melakukan perhitungan lagi. Kategori atribut cons.price

“93,369” semua kasus bernilai “No” dan sudah mengklasifikasikan status nasabah yang

akan menerima tawaran deposito, sehingga tidak perlu dilakukan perhitungan lagi. Pada

node 2 ini semua kasus sudah diklasifikasikan semua. Pohon keputusan yang terbentuk

pada perhitungan node 2 ditampikan pada gambar 3.3

Gambar 3.3 Pohon keputusan Hasil Perhitungan Node 2

Dengan memperhatikan pohon keputusan pada gambar 3.3 diketahui bahwa

semua kasus masuk dalam kelas. Dengan demikian, pohon keputusan pada gambar.3.3

merupakan pohon terakhir yang terbentuk sehingga merupakan pohon keputusan yang utuh

dari perhitungan kasus ini.

3.5 Pengujian Akurasi

Pengujian hasil klasifikasi dilakukan dengan membandingkan data testing terhadap

data training berdasarkan model 3-fold validation yang digunakan. Pengujian dilakukan

terhadap 3 model berbeda yang menghasilkan luaran berupa hasil akurasi dari masing-

masing model. Hasil akurasi dihasilkan berdasarkan jumlah prediksi sistem terhadap data

testing yang diuji. Hasil luaran yang dihasilkan dihitung dengan menjumlahkan data yang

terklasifikasi dengan benar dibagi dengan total keseluruhan data kemudian dikali 100%.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 45: PREDIKSI DATA NASABAH YANG BERPOTENSI MEMBUKA …repository.usd.ac.id/35523/2/155314046_full.pdf · Decision Tree Dengan Penerapan Algoritma C4.5”. 1.2 Rumusan Masalah Dalam melakukan

30

3.6 Pengujian Data Tunggal

Pada tahap ini dilakukan pengujian dengan pola klasifikasi yang telah terbentuk.

Pengujian data tunggal ini dilakukan dengan memasukan data uji dari masing-masing

fitur berdasarkan data training yang sudah ada. Luaran dari pengujian ini akan

menampilkan hasil prediksi berupa ya atau tidaknya seorang nasabah menerima tawaran

deposito.

3.7 Kebutuhan Sistem

Peralatan yang digunakan pada penelitian ini antara lain laptop Acer dengan

spesifikasi RAM 4 GB, processor Intel(R) Core i3-6006U 2.0 GHz, 128 GB SSD,

harddisk 500GB.

Kemudian digunakan Matlab version (R2018b).

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 46: PREDIKSI DATA NASABAH YANG BERPOTENSI MEMBUKA …repository.usd.ac.id/35523/2/155314046_full.pdf · Decision Tree Dengan Penerapan Algoritma C4.5”. 1.2 Rumusan Masalah Dalam melakukan

31

3.8 Perancangan Antar Muka Sistem

Gambar 3.4 Desain GUI

Adapun penjelasan setiap fitur GUI adalah :

Browse merupakan button yang digunakan untuk mencari dan menginput data

mentah yang akan ditampilkan dalam tabel Data Sebelum Preprocessing.

Preprocessing merupakan button yang berfungsi untuk melakukan preprocessing

terhadap data mentah yang akan ditampilkan pada tabel Data Setelah Preprocessing.

Kolom Duration, Euribor3m, Cons.price.idx, Cons.Conf.idx, Nr.employed yang

disediakan untuk menginput nilai setiap data yang sesuai dengan nama fitur yang

tersedia.

Prediksi merupakan button yang berfungsi untuk melakukan klasifikasi terhadap

data sesuai dengan inputan pada kolom fitur.

Result berfungsi untuk menampilkan hasil prediksi data sesuai dengan inputan pada

setiap kolom fitur.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 47: PREDIKSI DATA NASABAH YANG BERPOTENSI MEMBUKA …repository.usd.ac.id/35523/2/155314046_full.pdf · Decision Tree Dengan Penerapan Algoritma C4.5”. 1.2 Rumusan Masalah Dalam melakukan

32

Bersihkan adalah button yang digunakan untuk membersihkan semua kolom

inputan ketika data sudah selesai diuji.

Menu tree berisi tombol untuk menampilkan rule yang terbentuk dari proses

penambangan data dengan algoritma C4.5.

Menu Proses berisi tombol digunakan untuk menjalankan proses penambangan data

dengan algoritma C4.5 dan menampilkan tingkat keakuratan sistem yaitu tampilan

menu yang menghasilkan nilai akurasi.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 48: PREDIKSI DATA NASABAH YANG BERPOTENSI MEMBUKA …repository.usd.ac.id/35523/2/155314046_full.pdf · Decision Tree Dengan Penerapan Algoritma C4.5”. 1.2 Rumusan Masalah Dalam melakukan

33

BAB IV

HASIL DAN ANALISA HASIL

Pada bab ini dijelaskan mengenai hal-hal yang berkaitan dengan hasil luaran sistem

yang diperoleh dari proses pengolahan data pengujan yang dilakukan.

4.1 Preprocessing Data

Proses transformasi data dilakukan saat data mentah diambil dari direktori

penyimpanan. Data mentah yang dapat diolah adalah file data dengan format .xlxs.

Data yang melalui tahap transformasi adalah semua nilai atribut baik yang betipe

string atau numerik.

4.1.1 Data Selection

Pada tahap seleksi atribut ini penulis mencoba menghitung information gain

dengan menggunakan algortima J48, karena algoritma J48 memiliki akurasi lebih

tinggi dibandingkan algoritma lainnya ketika penulis melakukan percobaan.

Sebelum melakukan pereduksian atribut, penulis terlebih dulu mengurutkan atribut

berdasarkan information gain yang dapat dilihat pada tabel 4.1:

Tabel 4.1 Perankingan Atribut Berdasarkan Information Gain

No Atribut

1 Duration

2 Euribor3m

3 Cons.price.idx

4 Cons.conf.idx

5 Nr.employed

6 Emp.var.rate

7 Pdays

8 Poutcome

9 Month

10 Previous

11 Age

12 Contact

13 Job

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 49: PREDIKSI DATA NASABAH YANG BERPOTENSI MEMBUKA …repository.usd.ac.id/35523/2/155314046_full.pdf · Decision Tree Dengan Penerapan Algoritma C4.5”. 1.2 Rumusan Masalah Dalam melakukan

34

14 Default

15 Campaign

16 Education

17 Marital

18 Day_of_week

19 Housing

20 Loan

Setelah melakukan perankingan, menggunakan aplikasi Weka penulis

mencoba mereduksi 3 atribut dengan ranking terbawah dari perankingan

menggunakan tools yang ada pada aplikasi Weka. Dari percobaan yang dilakukan

menghasilkan kesimpulan yang dapat dilihat pada tabel 4.2:

Tabel 4.2 Percobaan Atribut menggunakan Tools Weka

Percobaan Atribut Persentase

1 Age, Job, Marital, Education,

Default, Housing, Loan,

Contact, Month, Day_of_week,

Duration, Campaign, pdays,

Previous, Poutcome,

Emp.var.rate, Cons.price.idx,

Cons.conf.idx, Euribor3m,

Nr.employed

91.1989 %

2 Age, Job, Marital, Education,

Default, Contact, Month,

Day_of_week, Duration,

Campaign, pdays, Previous,

Poutcome, Emp.var.rate,

Cons.price.idx, Cons.conf.idx,

Euribor3m, Nr.employed

91.4174 %

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 50: PREDIKSI DATA NASABAH YANG BERPOTENSI MEMBUKA …repository.usd.ac.id/35523/2/155314046_full.pdf · Decision Tree Dengan Penerapan Algoritma C4.5”. 1.2 Rumusan Masalah Dalam melakukan

35

3 Age, Job, Marital, Education,

Default, Contact, Month,

Duration, Campaign, pdays,

Previous, Poutcome,

Emp.var.rate, Cons.price.idx,

Cons.conf.idx, Euribor3m,

Nr.employed

91.3033 %

Dari tabel diatas, penulis menyeleksi 2 atribut dari dan menjadikan

18 atribut yang lain untuk diolah pada penelitian ini karena memiliki

persentase pengaruh atribut tertinggi pada percobaan kedua yaitu 91.4174

%, 18 atribut yang akan digunakan dan telah diseleksi menggunakan

algoritma J48 adalah sebagai berikut:

Tabel 4.3 Hasil Reduksi Atribut Menggunakan Weka

No Atribut

1 Age

2 Job

3 Marital

4 Education

5 Default

6 Contact

7 Month

8 Day_of_week

9 Duration

10 Campaign

11 pdays

12 Previous

13 Poutcome

14 Emp.var.rate

15 Cons.price.idx

16 Cons.conf.idx

17 Euribor3m

18 Nr.employed

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 51: PREDIKSI DATA NASABAH YANG BERPOTENSI MEMBUKA …repository.usd.ac.id/35523/2/155314046_full.pdf · Decision Tree Dengan Penerapan Algoritma C4.5”. 1.2 Rumusan Masalah Dalam melakukan

36

Dari hasil pemilihan atribut yang dilakukan klasifikasi dengan

menggunakan metode C4.5 dengan beberapa percobaan seperti pada tabel 4.4

Hasil percobaan seleksi atribut

Tabel 4.4 Hasil Percobaan Seleksi Atribut

percobaan atribut akurasi

1 Duration,euribor3m,cons.price.idx, cons.conf.idx, nr.employed,emp.var.rate,pdays,poutcome,month,previous, age, contact, job, default, campaign, education, marital, day-of_week, housing,loan

68,6857%

2 Duration,euribor3m,cons.price.idx, cons.conf.idx, nr.employed,emp.var.rate,pdays,poutcome,month,previous, age, contact, job, default, campaign, education, marital, day-of_week, housing

68,6857%

3 Duration,euribor3m,cons.price.idx, cons.conf.idx, nr.employed,emp.var.rate,pdays,poutcome,month,previous, age, contact, job, default, campaign, education, marital, day-of_week

68,6857%

4 Duration,euribor3m,cons.price.idx, cons.conf.idx, nr.employed,emp.var.rate,pdays,poutcome,month,previous, age, contact, job, default, campaign, education, marital

68,6857%

5 Duration,euribor3m,cons.price.idx, cons.conf.idx, nr.employed,emp.var.rate,pdays,poutcome,month,previous, age, contact, job, default, campaign, education

68,6857%

6 Duration,euribor3m,cons.price.idx, cons.conf.idx, nr.employed,emp.var.rate,pdays,poutcome,month,previous, age, contact, job, default, campaign

68,6857%

7 Duration,euribor3m,cons.price.idx, cons.conf.idx, nr.employed,emp.var.rate,pdays,poutcome,month,previous, age, contact, job, default

68,6857%

8 Duration,euribor3m,cons.price.idx, cons.conf.idx, nr.employed,emp.var.rate,pdays,poutcome,month,previous, age, contact, job

68,6857%

9 Duration,euribor3m,cons.price.idx, cons.conf.idx, nr.employed,emp.var.rate,pdays,poutcome,month,previous, age, contact

68,6857%

10 Duration,euribor3m,cons.price.idx, cons.conf.idx, nr.employed,emp.var.rate,pdays,poutcome,month,previous, age

68,6857%

11 Duration,euribor3m,cons.price.idx, cons.conf.idx, nr.employed,emp.var.rate,pdays,poutcome,month,previous

68,6857%

12 Duration,euribor3m,cons.price.idx, cons.conf.idx, nr.employed,emp.var.rate,pdays,poutcome,month

68,6857%

13 Duration,euribor3m,cons.price.idx, cons.conf.idx, nr.employed,emp.var.rate,pdays,poutcome

68,6857%

14 Duration,euribor3m,cons.price.idx, cons.conf.idx, nr.employed,emp.var.rate,pdays

73,777%

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 52: PREDIKSI DATA NASABAH YANG BERPOTENSI MEMBUKA …repository.usd.ac.id/35523/2/155314046_full.pdf · Decision Tree Dengan Penerapan Algoritma C4.5”. 1.2 Rumusan Masalah Dalam melakukan

37

15 Duration,euribor3m,cons.price.idx, cons.conf.idx, nr.employed,emp.var.rate

73,777%

16 Duration,euribor3m,cons.price.idx, cons.conf.idx, nr.employed

73,777%

17 Duration,euribor3m,cons.price.idx, cons.conf.idx 73,6746%

Pada tabel 4.4 terlihat terjadi peningkatan akurasi ketika dilakukan

percobaan pereduksian atribut, yaitu penulis mencoba untuk melakukan

pereduksian ulang dengan menghapus satu persatu atribut yang ada untuk

mendapatkan hasil akurasi yang lebih tinggi dan akurasi mencapai hasil tertinggi

sebesar 73,777% ketika 15 atribut direduksi. Sehingga dari 20 atribut yang ada,

hanya 5 atribut saja yang akan digunakan. Perbedaan hasil akurasi secara rinci dapat

dilihat pada grafik berikut :

Gambar 4.1 Grafik akurasi

4.2 Hasil dan Analisa

4.2.1 Uji Data Tunggal

Pada menu uji data tunggal digunakan untuk melakukan pengujian

terhadap suatu data. Setelah data uji dimasukkan akan menghasilkan keluaran

berupa kelas hasil prediksi, yaitu Yes atau No. Implementasi menu uji data

tunggal dapat dilihat pada gambar 4.2 berikut :

66,00%67,00%68,00%69,00%70,00%71,00%72,00%73,00%74,00%75,00%

akurasi

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 53: PREDIKSI DATA NASABAH YANG BERPOTENSI MEMBUKA …repository.usd.ac.id/35523/2/155314046_full.pdf · Decision Tree Dengan Penerapan Algoritma C4.5”. 1.2 Rumusan Masalah Dalam melakukan

38

Gambar 4.2 Menu Uji Data Tunggal

Klasifikasi nasabah yang berpotensi membuka simpanan deposito menggunakan

metode decision tree C4.5 menghasilkan rule yang ditampilkan sebagai berikut :

1 if x5<5087.65 then node 2 elseif x5>=5087.65 then node 3 else 0 2 if x1<1.5 then node 4 elseif x1>=1.5 then node 5 else 1 3 if x1<2.5 then node 6 elseif x1>=2.5 then node 7 else 0 4 if x4<0.7155 then node 8 elseif x4>=0.7155 then node 9 else 1 5 if x5<5049.85 then node 10 elseif x5>=5049.85 then node 11 else 1 6 if x3<-46.65 then node 12 elseif x3>=-46.65 then node 13 else 0 7 if x1<3.5 then node 14 elseif x1>=3.5 then node 15 else 1 8 if x4<0.698 then node 16 elseif x4>=0.698 then node 17 else 1 9 if x4<0.7195 then node 18 elseif x4>=0.7195 then node 19 else 1 10 if x3<-39.9 then node 20 elseif x3>=-39.9 then node 21 else 1 11 if x4<1.046 then node 22 elseif x4>=1.046 then node 23 else 1 12 if x2<92.959 then node 24 elseif x2>=92.959 then node 25 else 0 13 if x1<1.5 then node 26 elseif x1>=1.5 then node 27 else 0 14 if x4<1.4025 then node 28 elseif x4>=1.4025 then node 29 else 1 15 if x1<159 then node 30 elseif x1>=159 then node 31 else 1 16 if x3<-34.7 then node 32 elseif x3>=-34.7 then node 33 else 1 17 if x4<0.7135 then node 34 elseif x4>=0.7135 then node 35 else 1 18 if x4<0.7175 then node 36 elseif x4>=0.7175 then node 37 else 0 19 if x4<0.736 then node 38 elseif x4>=0.736 then node 39 else 1 20 if x2<94.408 then node 40 elseif x2>=94.408 then node 41 else 1 21 if x4<0.897 then node 42 elseif x4>=0.897 then node 43 else 1 22 if x4<0.882 then node 44 elseif x4>=0.882 then node 45 else 1 23 if x4<1.0785 then node 46 elseif x4>=1.0785 then node 47 else 1 24 if x1<1.5 then node 48 elseif x1>=1.5 then node 49 else 1 25 if x1<1.5 then node 50 elseif x1>=1.5 then node 51 else 0 26 if x4<5.0225 then node 52 elseif x4>=5.0225 then node 53 else 0 27 if x2<93.858 then node 54 elseif x2>=93.858 then node 55 else 0

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 54: PREDIKSI DATA NASABAH YANG BERPOTENSI MEMBUKA …repository.usd.ac.id/35523/2/155314046_full.pdf · Decision Tree Dengan Penerapan Algoritma C4.5”. 1.2 Rumusan Masalah Dalam melakukan

39

28 if x4<1.349 then node 56 elseif x4>=1.349 then node 57 else 1 29 if x4<4.9635 then node 58 elseif x4>=4.9635 then node 59 else 1 30 if x4<4.9645 then node 60 elseif x4>=4.9645 then node 61 else 1 31 if x1<456 then node 62 elseif x1>=456 then node 63 else 0 32 class = 1 33 if x4<0.6435 then node 64 elseif x4>=0.6435 then node 65 else 1 34 if x2<93.2945 then node 66 elseif x2>=93.2945 then node 67 else 0 35 class = 1 36 class = 1 37 class = 0 38 if x2<92.54 then node 68 elseif x2>=92.54 then node 69 else 1 39 if x4<1.2835 then node 70 elseif x4>=1.2835 then node 71 else 1 40 class = 1 41 if x4<0.9655 then node 72 elseif x4>=0.9655 then node 73 else 1 42 if x4<0.8795 then node 74 elseif x4>=0.8795 then node 75 else 1 43 if x4<0.8985 then node 76 elseif x4>=0.8985 then node 77 else 1 44 class = 1 45 if x1<2.5 then node 78 elseif x1>=2.5 then node 79 else 1 46 class = 1 47 if x4<1.256 then node 80 elseif x4>=1.256 then node 81 else 1 48 if x4<1.543 then node 82 elseif x4>=1.543 then node 83 else 1 49 if x4<1.515 then node 84 elseif x4>=1.515 then node 85 else 1 50 class = 0 51 if x4<1.3985 then node 86 elseif x4>=1.3985 then node 87 else 1 52 if x4<1.2755 then node 88 elseif x4>=1.2755 then node 89 else 0 53 class = 1 54 if x4<1.286 then node 90 elseif x4>=1.286 then node 91 else 0 55 class = 0 56 if x4<1.32 then node 92 elseif x4>=1.32 then node 93 else 1 57 class = 1 58 if x5<5193.4 then node 94 elseif x5>=5193.4 then node 95 else 1 59 class = 1 60 if x1<5.5 then node 96 elseif x1>=5.5 then node 97 else 1 61 class = 1 62 class = 0 63 class = 1 64 if x4<0.639 then node 98 elseif x4>=0.639 then node 99 else 1 65 class = 1 66 if x4<0.711 then node 100 elseif x4>=0.711 then node 101 else 1 67 if x4<0.7055 then node 102 elseif x4>=0.7055 then node 103 else 0 68 class = 1 69 if x4<0.7205 then node 104 elseif x4>=0.7205 then node 105 else 1 70 if x5<5004.55 then node 106 elseif x5>=5004.55 then node 107 else 1 71 class = 1 72 class = 1 73 if x2<94.684 then node 108 elseif x2>=94.684 then node 109 else 1 74 if x1<3.5 then node 110 elseif x1>=3.5 then node 111 else 1 75 class = 1 76 if x1<2.5 then node 112 elseif x1>=2.5 then node 113 else 0

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 55: PREDIKSI DATA NASABAH YANG BERPOTENSI MEMBUKA …repository.usd.ac.id/35523/2/155314046_full.pdf · Decision Tree Dengan Penerapan Algoritma C4.5”. 1.2 Rumusan Masalah Dalam melakukan

40

77 class = 1 78 if x4<0.9225 then node 114 elseif x4>=0.9225 then node 115 else 1 79 if x1<5.5 then node 116 elseif x1>=5.5 then node 117 else 1 80 if x4<1.2435 then node 118 elseif x4>=1.2435 then node 119 else 1 81 class = 1 82 if x4<1.5345 then node 120 elseif x4>=1.5345 then node 121 else 0 83 if x4<1.6215 then node 122 elseif x4>=1.6215 then node 123 else 1 84 class = 0 85 if x4<1.5255 then node 124 elseif x4>=1.5255 then node 125 else 1 86 class = 1 87 if x4<1.4125 then node 126 elseif x4>=1.4125 then node 127 else 0 88 class = 0 89 if x2<93.858 then node 128 elseif x2>=93.858 then node 129 else 0 90 if x4<1.2545 then node 130 elseif x4>=1.2545 then node 131 else 0 91 if x2<93.621 then node 132 elseif x2>=93.621 then node 133 else 0 92 class = 1 93 if x4<1.3305 then node 134 elseif x4>=1.3305 then node 135 else 1 94 if x4<4.862 then node 136 elseif x4>=4.862 then node 137 else 0 95 if x2<94.1915 then node 138 elseif x2>=94.1915 then node 139 else 1 96 if x4<1.4725 then node 140 elseif x4>=1.4725 then node 141 else 1 97 if x4<4.8575 then node 142 elseif x4>=4.8575 then node 143 else 1 98 class = 1 99 if x4<0.641 then node 144 elseif x4>=0.641 then node 145 else 0 100 class = 1 101 class = 0 102 if x4<0.703 then node 146 elseif x4>=0.703 then node 147 else 0 103 class = 0 104 class = 1 105 if x3<-36.4 then node 148 elseif x3>=-36.4 then node 149 else 0 106 if x4<1.047 then node 150 elseif x4>=1.047 then node 151 else 1 107 if x4<1.264 then node 152 elseif x4>=1.264 then node 153 else 1 108 if x4<0.99 then node 154 elseif x4>=0.99 then node 155 else 1 109 if x4<1.029 then node 156 elseif x4>=1.029 then node 157 else 1 110 if x4<0.6475 then node 158 elseif x4>=0.6475 then node 159 else 1 111 if x2<92.54 then node 160 elseif x2>=92.54 then node 161 else 1 112 class = 0 113 class = 1 114 class = 1 115 if x4<1.0235 then node 162 elseif x4>=1.0235 then node 163 else 0 116 class = 1 117 class = 0 118 class = 1 119 class = 0 120 class = 1 121 class = 0 122 class = 1 123 if x4<1.6345 then node 164 elseif x4>=1.6345 then node 165 else 1 124 class = 1 125 if x4<1.6515 then node 166 elseif x4>=1.6515 then node 167 else 1

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 56: PREDIKSI DATA NASABAH YANG BERPOTENSI MEMBUKA …repository.usd.ac.id/35523/2/155314046_full.pdf · Decision Tree Dengan Penerapan Algoritma C4.5”. 1.2 Rumusan Masalah Dalam melakukan

41

126 if x4<1.408 then node 168 elseif x4>=1.408 then node 169 else 0 127 if x4<1.449 then node 170 elseif x4>=1.449 then node 171 else 0 128 if x2<93.621 then node 172 elseif x2>=93.621 then node 173 else 0 129 class = 0 130 class = 0 131 if x4<1.2615 then node 174 elseif x4>=1.2615 then node 175 else 0 132 if x4<4.969 then node 176 elseif x4>=4.969 then node 177 else 0 133 class = 1 134 class = 0 135 class = 1 136 if x4<1.419 then node 178 elseif x4>=1.419 then node 179 else 0 137 class = 1 138 if x4<4.9605 then node 180 elseif x4>=4.9605 then node 181 else 1 139 if x4<4.8655 then node 182 elseif x4>=4.8655 then node 183 else 1 140 class = 1 141 if x4<1.4905 then node 184 elseif x4>=1.4905 then node 185 else 1 142 if x1<6.5 then node 186 elseif x1>=6.5 then node 187 else 1 143 if x4<4.9635 then node 188 elseif x4>=4.9635 then node 189 else 1 144 class = 0 145 class = 1 146 class = 0 147 class = 1 148 if x4<0.7305 then node 190 elseif x4>=0.7305 then node 191 else 0 149 class = 0 150 if x4<0.745 then node 192 elseif x4>=0.745 then node 193 else 1 151 class = 0 152 if x4<0.7925 then node 194 elseif x4>=0.7925 then node 195 else 0 153 class = 1 154 if x1<2.5 then node 196 elseif x1>=2.5 then node 197 else 1 155 class = 1 156 class = 0 157 class = 1 158 class = 1 159 if x4<0.7095 then node 198 elseif x4>=0.7095 then node 199 else 1 160 if x4<0.741 then node 200 elseif x4>=0.741 then node 201 else 1 161 class = 1 162 class = 0 163 class = 1 164 class = 0 165 if x4<1.6565 then node 202 elseif x4>=1.6565 then node 203 else 1 166 if x4<1.6345 then node 204 elseif x4>=1.6345 then node 205 else 1 167 class = 1 168 if x4<1.4055 then node 206 elseif x4>=1.4055 then node 207 else 0 169 class = 0 170 if x4<1.419 then node 208 elseif x4>=1.419 then node 209 else 1 171 if x4<1.481 then node 210 elseif x4>=1.481 then node 211 else 0 172 if x4<4.7165 then node 212 elseif x4>=4.7165 then node 213 else 0 173 if x4<4.8105 then node 214 elseif x4>=4.8105 then node 215 else 1 174 class = 1

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 57: PREDIKSI DATA NASABAH YANG BERPOTENSI MEMBUKA …repository.usd.ac.id/35523/2/155314046_full.pdf · Decision Tree Dengan Penerapan Algoritma C4.5”. 1.2 Rumusan Masalah Dalam melakukan

42

175 if x4<1.265 then node 216 elseif x4>=1.265 then node 217 else 0 176 if x4<4.0485 then node 218 elseif x4>=4.0485 then node 219 else 0 177 class = 0 178 class = 0 179 if x4<1.449 then node 220 elseif x4>=1.449 then node 221 else 0 180 if x4<4.427 then node 222 elseif x4>=4.427 then node 223 else 1 181 class = 1 182 class = 0 183 if x4<4.9595 then node 224 elseif x4>=4.9595 then node 225 else 1 184 class = 0 185 if x4<4.098 then node 226 elseif x4>=4.098 then node 227 else 1 186 if x4<4.098 then node 228 elseif x4>=4.098 then node 229 else 1 187 if x1<7.5 then node 230 elseif x1>=7.5 then node 231 else 1 188 if x1<6.5 then node 232 elseif x1>=6.5 then node 233 else 1 189 class = 0 190 if x4<0.728 then node 234 elseif x4>=0.728 then node 235 else 0 191 class = 1 192 class = 0 193 if x4<1.0285 then node 236 elseif x4>=1.0285 then node 237 else 1 194 if x4<0.7545 then node 238 elseif x4>=0.7545 then node 239 else 1 195 if x4<0.811 then node 240 elseif x4>=0.811 then node 241 else 0 196 class = 1 197 class = 0 198 class = 1 199 if x4<0.7395 then node 242 elseif x4>=0.7395 then node 243 else 1 200 class = 0 201 class = 1 202 class = 1 203 if x4<1.7145 then node 244 elseif x4>=1.7145 then node 245 else 1 204 class = 1 205 class = 0 206 class = 0 207 class = 1 208 class = 0 209 class = 1 210 class = 0 211 class = 1 212 if x4<4.207 then node 246 elseif x4>=4.207 then node 247 else 0 213 class = 0 214 class = 1 215 if x4<4.8435 then node 248 elseif x4>=4.8435 then node 249 else 1 216 class = 1 217 if x4<1.2755 then node 250 elseif x4>=1.2755 then node 251 else 0 218 if x4<1.349 then node 252 elseif x4>=1.349 then node 253 else 0 219 if x4<4.9635 then node 254 elseif x4>=4.9635 then node 255 else 0 220 class = 1 221 if x4<4.8555 then node 256 elseif x4>=4.8555 then node 257 else 0 222 class = 1 223 if x4<4.9575 then node 258 elseif x4>=4.9575 then node 259 else 1

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 58: PREDIKSI DATA NASABAH YANG BERPOTENSI MEMBUKA …repository.usd.ac.id/35523/2/155314046_full.pdf · Decision Tree Dengan Penerapan Algoritma C4.5”. 1.2 Rumusan Masalah Dalam melakukan

43

224 class = 1 225 if x4<4.9615 then node 260 elseif x4>=4.9615 then node 261 else 0 226 class = 1 227 if x4<4.8645 then node 262 elseif x4>=4.8645 then node 263 else 1 228 class = 1 229 if x2<93.597 then node 264 elseif x2>=93.597 then node 265 else 1 230 if x4<4.1145 then node 266 elseif x4>=4.1145 then node 267 else 0 231 if x1<11.5 then node 268 elseif x1>=11.5 then node 269 else 1 232 if x2<94.2295 then node 270 elseif x2>=94.2295 then node 271 else 1 233 class = 1 234 class = 1 235 class = 0 236 if x4<0.986 then node 272 elseif x4>=0.986 then node 273 else 1 237 if x4<1.0345 then node 274 elseif x4>=1.0345 then node 275 else 1 238 if x4<0.7535 then node 276 elseif x4>=0.7535 then node 277 else 0 239 if x4<0.7705 then node 278 elseif x4>=0.7705 then node 279 else 1 240 class = 0 241 if x4<0.871 then node 280 elseif x4>=0.871 then node 281 else 0 242 if x4<0.734 then node 282 elseif x4>=0.734 then node 283 else 1 243 if x4<0.7425 then node 284 elseif x4>=0.7425 then node 285 else 1 244 if x4<1.695 then node 286 elseif x4>=1.695 then node 287 else 1 245 if x4<1.7415 then node 288 elseif x4>=1.7415 then node 289 else 1 246 if x4<1.349 then node 290 elseif x4>=1.349 then node 291 else 0 247 class = 1 248 class = 0 249 if x4<4.886 then node 292 elseif x4>=4.886 then node 293 else 1 250 if x4<1.268 then node 294 elseif x4>=1.268 then node 295 else 0 251 class = 0 252 class = 0 253 if x2<93.0465 then node 296 elseif x2>=93.0465 then node 297 else 0 254 if x4<4.9625 then node 298 elseif x4>=4.9625 then node 299 else 0 255 class = 0 256 if x4<1.4595 then node 300 elseif x4>=1.4595 then node 301 else 1 257 if x4<4.8565 then node 302 elseif x4>=4.8565 then node 303 else 0 258 class = 1 259 if x4<4.9595 then node 304 elseif x4>=4.9595 then node 305 else 1 260 class = 0 261 class = 1 262 if x4<4.8555 then node 306 elseif x4>=4.8555 then node 307 else 1 263 if x4<4.8655 then node 308 elseif x4>=4.8655 then node 309 else 1 264 class = 0 265 if x4<4.8555 then node 310 elseif x4>=4.8555 then node 311 else 1 266 class = 0 267 class = 1 268 class = 1 269 class = 0 270 if x4<4.859 then node 312 elseif x4>=4.859 then node 313 else 1 271 class = 1 272 if x4<0.8985 then node 314 elseif x4>=0.8985 then node 315 else 1

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 59: PREDIKSI DATA NASABAH YANG BERPOTENSI MEMBUKA …repository.usd.ac.id/35523/2/155314046_full.pdf · Decision Tree Dengan Penerapan Algoritma C4.5”. 1.2 Rumusan Masalah Dalam melakukan

44

273 class = 0 274 class = 1 275 if x4<1.0395 then node 316 elseif x4>=1.0395 then node 317 else 1 276 if x4<0.7415 then node 318 elseif x4>=0.7415 then node 319 else 0 277 class = 0 278 class = 1 279 if x4<0.7845 then node 320 elseif x4>=0.7845 then node 321 else 1 280 if x4<0.8405 then node 322 elseif x4>=0.8405 then node 323 else 1 281 if x4<0.88 then node 324 elseif x4>=0.88 then node 325 else 0 282 if x4<0.732 then node 326 elseif x4>=0.732 then node 327 else 1 283 class = 1 284 if x1<2.5 then node 328 elseif x1>=2.5 then node 329 else 1 285 if x4<0.814 then node 330 elseif x4>=0.814 then node 331 else 1 286 class = 1 287 class = 0 288 class = 1 289 if x4<1.7885 then node 332 elseif x4>=1.7885 then node 333 else 1 290 class = 0 291 if x4<3.2405 then node 334 elseif x4>=3.2405 then node 335 else 0 292 class = 1 293 if x4<4.9195 then node 336 elseif x4>=4.9195 then node 337 else 1 294 class = 0 295 class = 1 296 class = 1 297 class = 0 298 if x4<4.267 then node 338 elseif x4>=4.267 then node 339 else 0 299 class = 0 300 class = 0 301 class = 1 302 class = 0 303 if x4<4.8575 then node 340 elseif x4>=4.8575 then node 341 else 0 304 class = 0 305 class = 1 306 if x1<4.5 then node 342 elseif x1>=4.5 then node 343 else 1 307 class = 1 308 class = 0 309 if x2<94.1915 then node 344 elseif x2>=94.1915 then node 345 else 1 310 class = 0 311 class = 1 312 class = 1 313 if x4<4.9595 then node 346 elseif x4>=4.9595 then node 347 else 1 314 if x2<94.041 then node 348 elseif x2>=94.041 then node 349 else 1 315 if x2<94.408 then node 350 elseif x2>=94.408 then node 351 else 1 316 class = 0 317 class = 1 318 if x4<0.7405 then node 352 elseif x4>=0.7405 then node 353 else 0 319 if x4<0.7425 then node 354 elseif x4>=0.7425 then node 355 else 1 320 if x4<0.772 then node 356 elseif x4>=0.772 then node 357 else 1 321 class = 1

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 60: PREDIKSI DATA NASABAH YANG BERPOTENSI MEMBUKA …repository.usd.ac.id/35523/2/155314046_full.pdf · Decision Tree Dengan Penerapan Algoritma C4.5”. 1.2 Rumusan Masalah Dalam melakukan

45

322 if x2<92.29 then node 358 elseif x2>=92.29 then node 359 else 0 323 if x4<0.85 then node 360 elseif x4>=0.85 then node 361 else 1 324 class = 0 325 if x3<-32.5 then node 362 elseif x3>=-32.5 then node 363 else 0 326 if x4<0.7295 then node 364 elseif x4>=0.7295 then node 365 else 1 327 class = 1 328 if x2<92.405 then node 366 elseif x2>=92.405 then node 367 else 1 329 class = 0 330 class = 1 331 if x2<93.289 then node 368 elseif x2>=93.289 then node 369 else 1 332 if x4<1.7675 then node 370 elseif x4>=1.7675 then node 371 else 0 333 class = 1 334 if x2<92.8245 then node 372 elseif x2>=92.8245 then node 373 else 0 335 class = 0 336 class = 1 337 if x4<4.952 then node 374 elseif x4>=4.952 then node 375 else 1 338 class = 0 339 class = 1 340 class = 1 341 if x4<4.8595 then node 376 elseif x4>=4.8595 then node 377 else 0 342 class = 1 343 if x4<4.1365 then node 378 elseif x4>=4.1365 then node 379 else 0 344 if x4<4.9615 then node 380 elseif x4>=4.9615 then node 381 else 1 345 class = 1 346 class = 0 347 class = 1 348 if x4<0.8875 then node 382 elseif x4>=0.8875 then node 383 else 0 349 if x4<0.831 then node 384 elseif x4>=0.831 then node 385 else 1 350 class = 1 351 if x4<0.956 then node 386 elseif x4>=0.956 then node 387 else 1 352 if x2<92.405 then node 388 elseif x2>=92.405 then node 389 else 0 353 class = 0 354 class = 1 355 if x4<0.7525 then node 390 elseif x4>=0.7525 then node 391 else 0 356 class = 0 357 class = 1 358 if x4<0.823 then node 392 elseif x4>=0.823 then node 393 else 0 359 class = 1 360 class = 1 361 if x4<0.865 then node 394 elseif x4>=0.865 then node 395 else 1 362 if x4<0.993 then node 396 elseif x4>=0.993 then node 397 else 0 363 class = 1 364 if x4<0.7285 then node 398 elseif x4>=0.7285 then node 399 else 1 365 class = 1 366 class = 0 367 class = 1 368 class = 0 369 class = 1 370 class = 1

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 61: PREDIKSI DATA NASABAH YANG BERPOTENSI MEMBUKA …repository.usd.ac.id/35523/2/155314046_full.pdf · Decision Tree Dengan Penerapan Algoritma C4.5”. 1.2 Rumusan Masalah Dalam melakukan

46

371 class = 0 372 class = 1 373 class = 0 374 class = 1 375 if x4<4.984 then node 400 elseif x4>=4.984 then node 401 else 1 376 class = 0 377 class = 1 378 class = 1 379 class = 0 380 if x4<4.9605 then node 402 elseif x4>=4.9605 then node 403 else 1 381 class = 1 382 class = 1 383 if x4<0.8935 then node 404 elseif x4>=0.8935 then node 405 else 0 384 if x4<0.7575 then node 406 elseif x4>=0.7575 then node 407 else 0 385 if x4<0.8795 then node 408 elseif x4>=0.8795 then node 409 else 1 386 class = 0 387 if x4<0.9745 then node 410 elseif x4>=0.9745 then node 411 else 1 388 class = 1 389 class = 0 390 if x4<0.751 then node 412 elseif x4>=0.751 then node 413 else 0 391 class = 1 392 class = 0 393 if x4<0.8315 then node 414 elseif x4>=0.8315 then node 415 else 0 394 if x4<0.86 then node 416 elseif x4>=0.86 then node 417 else 1 395 class = 1 396 class = 0 397 if x4<1.1525 then node 418 elseif x4>=1.1525 then node 419 else 0 398 if x4<0.7185 then node 420 elseif x4>=0.7185 then node 421 else 1 399 class = 1 400 class = 1 401 class = 0 402 if x1<4.5 then node 422 elseif x1>=4.5 then node 423 else 1 403 class = 1 404 class = 0 405 if x4<0.897 then node 424 elseif x4>=0.897 then node 425 else 0 406 class = 1 407 if x4<0.816 then node 426 elseif x4>=0.816 then node 427 else 0 408 if x4<0.8655 then node 428 elseif x4>=0.8655 then node 429 else 1 409 if x4<0.8825 then node 430 elseif x4>=0.8825 then node 431 else 1 410 if x4<0.962 then node 432 elseif x4>=0.962 then node 433 else 0 411 class = 1 412 if x2<92.405 then node 434 elseif x2>=92.405 then node 435 else 1 413 class = 0 414 if x4<0.827 then node 436 elseif x4>=0.827 then node 437 else 0 415 class = 0 416 class = 1 417 class = 0 418 if x4<1.0785 then node 438 elseif x4>=1.0785 then node 439 else 1 419 if x4<1.2295 then node 440 elseif x4>=1.2295 then node 441 else 0

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 62: PREDIKSI DATA NASABAH YANG BERPOTENSI MEMBUKA …repository.usd.ac.id/35523/2/155314046_full.pdf · Decision Tree Dengan Penerapan Algoritma C4.5”. 1.2 Rumusan Masalah Dalam melakukan

47

420 if x4<0.7165 then node 442 elseif x4>=0.7165 then node 443 else 1 421 class = 1 422 class = 1 423 if x4<4.9575 then node 444 elseif x4>=4.9575 then node 445 else 1 424 class = 1 425 class = 0 426 if x4<0.764 then node 446 elseif x4>=0.764 then node 447 else 0 427 class = 0 428 if x4<0.8535 then node 448 elseif x4>=0.8535 then node 449 else 1 429 class = 1 430 if x4<0.8815 then node 450 elseif x4>=0.8815 then node 451 else 0 431 if x4<0.8845 then node 452 elseif x4>=0.8845 then node 453 else 1 432 class = 1 433 class = 0 434 class = 0 435 class = 1 436 class = 0 437 class = 1 438 if x4<1.0235 then node 454 elseif x4>=1.0235 then node 455 else 1 439 class = 1 440 class = 0 441 if x4<1.2395 then node 456 elseif x4>=1.2395 then node 457 else 0 442 class = 1 443 if x2<92.681 then node 458 elseif x2>=92.681 then node 459 else 1 444 class = 0 445 class = 1 446 class = 0 447 if x2<94.135 then node 460 elseif x2>=94.135 then node 461 else 1 448 class = 1 449 class = 0 450 class = 1 451 class = 0 452 if x2<94.207 then node 462 elseif x2>=94.207 then node 463 else 1 453 class = 1 454 class = 1 455 if x4<1.0365 then node 464 elseif x4>=1.0365 then node 465 else 1 456 class = 1 457 class = 0 458 class = 0 459 class = 1 460 class = 1 461 if x4<0.786 then node 466 elseif x4>=0.786 then node 467 else 0 462 if x4<0.8835 then node 468 elseif x4>=0.8835 then node 469 else 0 463 class = 1 464 class = 0 465 class = 1 466 class = 0 467 if x4<0.7995 then node 470 elseif x4>=0.7995 then node 471 else 1 468 class = 1

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 63: PREDIKSI DATA NASABAH YANG BERPOTENSI MEMBUKA …repository.usd.ac.id/35523/2/155314046_full.pdf · Decision Tree Dengan Penerapan Algoritma C4.5”. 1.2 Rumusan Masalah Dalam melakukan

48

469 class = 0 470 if x4<0.795 then node 472 elseif x4>=0.795 then node 473 else 0 471 class = 1 472 class = 1 473 class = 0

Berdasarkan hasil diatas, setiap rule yang terbentuk akan menghasilkan kelas “1”

adalah “Yes” dan “0” adalah “NO” . Selain rule juga diperoleh node dari hasil

tersebut. Dapat dilihat bahwa node yang terbentuk sebanyak 473.

Node yang terbentuk dapat dilihat dalam sebuah tree yang ditampilkan pada

gambar 4.3 Tree berikut :

Gambar 4.3 Tree

Luaran yang dihasilkan dari pengujian menggunakan 5 atribut ini menunjukan hasil

akurasi berbeda berdasarkan 3-fold validation yang digunakan. Hasil akurasi tersebut

dapat dilihat pada Tabel 4.2 dibawah ini.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 64: PREDIKSI DATA NASABAH YANG BERPOTENSI MEMBUKA …repository.usd.ac.id/35523/2/155314046_full.pdf · Decision Tree Dengan Penerapan Algoritma C4.5”. 1.2 Rumusan Masalah Dalam melakukan

49

Tabel 4.2 Tabel akurasi 3-fold-validation

Model Akurasi

1 75.0081 %

2 76.984 %

3 69.3389 %

akurasi total = 75.0081 + 76.984 + 69.3389

3 𝑥 100 % = 73,777%

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 65: PREDIKSI DATA NASABAH YANG BERPOTENSI MEMBUKA …repository.usd.ac.id/35523/2/155314046_full.pdf · Decision Tree Dengan Penerapan Algoritma C4.5”. 1.2 Rumusan Masalah Dalam melakukan

50

BAB V

KESIMPULAN DAN SARAN

Pada bab ini dijelaskan kesimpulan yang diperoleh dari hasil percobaan yang dilakukan.

Bab ini juga menjelaskan saran perbaikan untuk penelitian yang akan datang.

5.1 KESIMPULAN

Kesimpulan yang dihasilkan berdasarkan sistem klasifikasi data transaksi untuk mendeteksi

nasabah yang berpotensi membuka simpanan deposito menggunakan algoritma C4.5 adalah :

1. Metode decision tree dapat diterapkan untuk memprediksi data nasabah yang

berpotensi membuka simpanan deposito

2. Pengujian yang dilakukan terhadap 18560 data menghasilkan tingkat keakuratan

sebesar 73.777% persen. Dari hasil ini dapat disimpulkan bahwa sistem cukup mampu

dalam menerapkan metode tersebut, sistem mampu melakukan prediksi nasabah yang

berpotensi menerima tawaran deposito dengan tingkat akurasi yang cukup optimal.

5.2 SARAN

Saran yang dapat diberikan untuk mengembangkan penelitian yang akan datang adalah :

1. Perangkat lunak yang dibangun diharapkan dapat menerima masukan tidak hanya file

bertipe .xlsx saja, tetapi juga dapat menerima file bertipe lain.

2. Perangkat lunak yang dibangun mampu menggunakan model validasi untuk beragam

k-fold validation yang digunakan.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 66: PREDIKSI DATA NASABAH YANG BERPOTENSI MEMBUKA …repository.usd.ac.id/35523/2/155314046_full.pdf · Decision Tree Dengan Penerapan Algoritma C4.5”. 1.2 Rumusan Masalah Dalam melakukan

51

DAFTAR PUSTAKA

Dedy Takdir Syaiffudin. (2007). Manajemen Perbankan (Pendekatan Praktis). Kendari: Unhalu

Press.

Jiawei, H. (2012). Data Mining Concepts and Tecniques. Waltham: Elsevier Inc.

Larose, D. T. (2005). Discovering Knowledge In Data. United States Of America: John Wiley &

Sons, Inc.

Luthfi, E. T. (2009). Algoritma Data Mining. Yogyakarta: C.V ANDI OFFSET.

Parmitasari, R. D. (2015). Pengaruh Tingkat Suku Bunga Deposito Terhadap Jumlah Dana

Deposito Pada Bank Mandiri Cabang Utama Makassar. Pengaruh Tingkat Suku Bunga

Deposito Terhadap Jumlah Dana Deposito Pada Bank Mandiri Cabang Utama Makassar,

1-5.

Prabowo, A. D. (2018). Prediksi Nasabah Yang Berpotensi Membuka Simpanan Deposito

Menggunakan Naive Bayes Berbasis Particle Swarm Optimization . Semarang:

Universitas Dian Nuswantoro.

Tamara, L. A. (2018). Klasifikasi Data Nasabah Yang Berpotensi Membuka Simpanan Deposito

Menggunakan Algoritma Rough Set. Yogyakarta: Universitas Sanata Dharma.

Septiawanti, S.(2018). Penerapan Metode Cased-Based Reasoning Untuk Prediksi Data Nasabah

Yang Berpotensi Membuka Simpanan Deposito. Yogyakarta: Universitas Sanata Dharma.

Eko Prasetyo, Data Mining : Konsep dan Aplikasi menggunakan MATLAB, 1st ed.

Yogyakarta, Indonesia: Andi, 2012.

Bernita, L. M. (2017). Klasifikasi Persalinan Normal Atau Caesar Menggunakan Algoritma

C4.5. Yogyakarta: Universitas Sanata Dharma.

Kusrini and Emha Taufiq Luthfi, Algoritma Data Mining, 1st ed. Yogyakarta, Indonesia:

Andi, 2009.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 67: PREDIKSI DATA NASABAH YANG BERPOTENSI MEMBUKA …repository.usd.ac.id/35523/2/155314046_full.pdf · Decision Tree Dengan Penerapan Algoritma C4.5”. 1.2 Rumusan Masalah Dalam melakukan

52

LAMPIRAN

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 68: PREDIKSI DATA NASABAH YANG BERPOTENSI MEMBUKA …repository.usd.ac.id/35523/2/155314046_full.pdf · Decision Tree Dengan Penerapan Algoritma C4.5”. 1.2 Rumusan Masalah Dalam melakukan

53

A. Lampiran Percobaan Menggunakan Aplikasi Weka

1. Information Gain

2. Percobaan 20 Atribut

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 69: PREDIKSI DATA NASABAH YANG BERPOTENSI MEMBUKA …repository.usd.ac.id/35523/2/155314046_full.pdf · Decision Tree Dengan Penerapan Algoritma C4.5”. 1.2 Rumusan Masalah Dalam melakukan

54

3. Percobaan Pereduksin Atribut Loan

4. Percobaan Pereduksin Atribut Housing

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 70: PREDIKSI DATA NASABAH YANG BERPOTENSI MEMBUKA …repository.usd.ac.id/35523/2/155314046_full.pdf · Decision Tree Dengan Penerapan Algoritma C4.5”. 1.2 Rumusan Masalah Dalam melakukan

55

5. Percobaan Reduksi Day_of_week

6. Percobaan Reduksi Atribut Marital

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 71: PREDIKSI DATA NASABAH YANG BERPOTENSI MEMBUKA …repository.usd.ac.id/35523/2/155314046_full.pdf · Decision Tree Dengan Penerapan Algoritma C4.5”. 1.2 Rumusan Masalah Dalam melakukan

56

A. Lampiran Program

Source Code Transformasi data Duration

[num,txt,raw] = xlsread('UntukTest2.xlsx');

[m,n] = size (num);

for i=1:m

if num(i,2)>0&& num(i,2)<= 303.0426

num(i,2)=1;

elseif num(i,2)> 304.0426 && num(i,2)<= 607.0852

num(i,2)=2;

elseif num(i,2)> 608.0852 && num(i,2)<= 911.1277

num(i,2)=3;

elseif num(i,2)> 912.1277 && num(i,2)<= 1215.17

num(i,2)=4;

elseif num(i,2)> 1216.17 && num(i,2)<= 1519.213

num(i,2)=5;

elseif num(i,2)> 1520.213 && num(i,2)<= 1823.255

num(i,2)=6;

elseif num(i,2)> 1824.255 && num(i,2)<= 2127.298

num(i,2)=7;

elseif num(i,2)> 2128.298 && num(i,2)<= 2431.341

num(i,2)=8;

elseif num(i,2)> 2432.341 && num(i,2)<= 2735.383

num(i,2)=9;

elseif num(i,2)> 2736.383 && num(i,2)<= 3039.426

num(i,2)=10;

elseif num(i,2)> 3040.426 && num(i,2)<= 3343.468

num(i,2)=11;

elseif num(i,2)> 3344.468 && num(i,2)<= 3647.553

num(i,2)=12;

elseif num{i,2}> 3648.511 && num{i,2}<= 3951.553

num{i,2}=13;

elseif num{i,2}> 3952.553 && num{i,2}<= 4255.596

num{i,2}=14;

elseif num{i,2}> 4256.596 && num{i,2}<= 4559.639

num{i,10}=15;

elseif num{i,2}> 4560.639 && num{i,2}<= 4863.681

num{i,2}=16;

elseif num{i,2}> 4864.681 && num{i,2}<= 5167.724

num{i,2}=17;

end

if isequal(txt{i+1,1},'yes')

num(i,1)=1;

elseif isequal(txt{i+1,1},'no')

num(i,1)=2;

end

end

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 72: PREDIKSI DATA NASABAH YANG BERPOTENSI MEMBUKA …repository.usd.ac.id/35523/2/155314046_full.pdf · Decision Tree Dengan Penerapan Algoritma C4.5”. 1.2 Rumusan Masalah Dalam melakukan

57

2. Source Code klasifikasi

3. C = xlsread('5tanpaemprate.xlsx'); 4. X = C(:,1:5); 5. Y = C(:,6); 6. 7. inc_node = 35; 8. 9. kel1= find(Y==1); 10. kel2= find(Y==0);

11.

12. for i = 1:size(kel1,1)

13. atr1(i,:) = X (kel1(i),:);

14. label1(i,1) = Y(kel1(i));

15. end

16.

17. for i = 1:size(kel1,1)*3

18. atr2(i,:) = X (kel2(i),:);

19. label2(i,1) = Y(kel2(i));

20. end

21.

22. % Pembagian Data Training Testing

23. jumlahData1 = length(label1);

24. jumlahData2 = length(label2);

25.

26. dataTrain1 = round(jumlahData1/3);

27. dataTrain2 = round(jumlahData2/3);

28.

29. kel11 = atr1(1:dataTrain1,:);

30. kel12 = atr1(dataTrain1+1:dataTrain1*2,:);

31. kel13 = atr1(dataTrain1*2+1:jumlahData1,:);

32.

33. Lab11 = label1(1:dataTrain1);

34. Lab12 = label1(dataTrain1+1:dataTrain1*2);

35. Lab13 = label1(dataTrain1*2+1:jumlahData1);

36.

37. kel21 = atr2(1:dataTrain2,:);

38. kel22 = atr2(dataTrain2+1:dataTrain2*2,:);

39. kel23 = atr2(dataTrain2*2+1:jumlahData2,:);

40.

41. Lab21 = label2(1:dataTrain2);

42. Lab22 = label2(dataTrain2+1:dataTrain2*2);

43. Lab23 = label2(dataTrain2*2+1:jumlahData2);

44.

45. kelLabel1 = [Lab11; Lab21];

46. kelLabel2 = [Lab12; Lab22];

47. kelLabel3 = [Lab13; Lab23];

48.

49. kelAtr1 = [kel11; kel21];

50. kelAtr2 = [kel12; kel22];

51. kelAtr3 = [kel13; kel23];

52.

53. train_targets1 = [kelLabel1;kelLabel2];

54. test_targets1 = kelLabel3;

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 73: PREDIKSI DATA NASABAH YANG BERPOTENSI MEMBUKA …repository.usd.ac.id/35523/2/155314046_full.pdf · Decision Tree Dengan Penerapan Algoritma C4.5”. 1.2 Rumusan Masalah Dalam melakukan

58

55.

56. train_patterns1 = [kelAtr1;kelAtr2];

57. test_patterns1 = kelAtr3;

58.

59. train_targets1 = train_targets1';

60. test_targets1 = test_targets1';

61.

62. train_patterns1 = train_patterns1';

63. test_patterns1 = test_patterns1';

64.

65. tic;

66. [hasil1,tree,discrete_dim] = Tree(train_patterns1,

train_targets1, test_patterns1, inc_node);

67. waktu = toc;

68.

69. cf = confusionmat(hasil1,test_targets1);

70. output1 = (sum(diag(cf))/sum(sum(cf)))*100;

71.

72. disp(['Akurasi 1 = ' num2str(output1) ' %']);

73.

74. train_targets2 = [kelLabel1;kelLabel3];

75. test_targets2 = kelLabel2;

76.

77. train_patterns2 = [kelAtr1;kelAtr3];

78. test_patterns2 = kelAtr2;

79.

80. train_targets2 = train_targets2';

81. test_targets2 = test_targets2';

82.

83. train_patterns2 = train_patterns2';

84. test_patterns2 = test_patterns2';

85.

86. tic;

87. [hasil2,tree,discrete_dim] = Tree(train_patterns2,

train_targets2, test_patterns2, inc_node);

88. waktu = toc;

89. % save tree.mat tree;

90. % save discrete_dim.mat discrete_dim;

91. cf = confusionmat(hasil2,test_targets2);

92. output2 = (sum(diag(cf))/sum(sum(cf)))*100;

93.

94. disp(['Akurasi 2 = ' num2str(output2) ' %']);

95.

96. train_targets3 = [kelLabel2;kelLabel3];

97. test_targets3 = kelLabel1;

98.

99. train_patterns3 = [kelAtr2;kelAtr3];

100. test_patterns3 = kelAtr1;

101.

102. train_targets3 = train_targets3';

103. test_targets3 = test_targets3';

104.

105. train_patterns3 = train_patterns3';

106. test_patterns3 = test_patterns3';

107.

108. tic;

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 74: PREDIKSI DATA NASABAH YANG BERPOTENSI MEMBUKA …repository.usd.ac.id/35523/2/155314046_full.pdf · Decision Tree Dengan Penerapan Algoritma C4.5”. 1.2 Rumusan Masalah Dalam melakukan

59

109. [hasil3,tree,discrete_dim] = Tree(train_patterns3,

train_targets3, test_patterns3, inc_node);

110. waktu = toc;

111.

112. cf = confusionmat(hasil3,test_targets3);

113. output3 = (sum(diag(cf))/sum(sum(cf)))*100;

114.

115. disp(['Akurasi 3 = ' num2str(output3) ' %']);

116.

117. rataakurasi = (output1+output2+output3)/3;

118.

119. disp(['Rata-rata Akurasi = ' num2str(rataakurasi) ' %']);

120.

1. Lampiran Hasil Rule

1 if x5<5087.65 then node 2 elseif x5>=5087.65 then node 3 else 0 2 if x1<1.5 then node 4 elseif x1>=1.5 then node 5 else 1 3 if x1<2.5 then node 6 elseif x1>=2.5 then node 7 else 0 4 if x4<0.7155 then node 8 elseif x4>=0.7155 then node 9 else 1 5 if x5<5049.85 then node 10 elseif x5>=5049.85 then node 11 else 1 6 if x3<-46.65 then node 12 elseif x3>=-46.65 then node 13 else 0 7 if x1<3.5 then node 14 elseif x1>=3.5 then node 15 else 1 8 if x4<0.698 then node 16 elseif x4>=0.698 then node 17 else 1 9 if x4<0.7195 then node 18 elseif x4>=0.7195 then node 19 else 1 10 if x3<-39.9 then node 20 elseif x3>=-39.9 then node 21 else 1 11 if x4<1.046 then node 22 elseif x4>=1.046 then node 23 else 1 12 if x2<92.959 then node 24 elseif x2>=92.959 then node 25 else 0 13 if x1<1.5 then node 26 elseif x1>=1.5 then node 27 else 0 14 if x4<1.4025 then node 28 elseif x4>=1.4025 then node 29 else 1 15 if x1<159 then node 30 elseif x1>=159 then node 31 else 1 16 if x3<-34.7 then node 32 elseif x3>=-34.7 then node 33 else 1 17 if x4<0.7135 then node 34 elseif x4>=0.7135 then node 35 else 1 18 if x4<0.7175 then node 36 elseif x4>=0.7175 then node 37 else 0 19 if x4<0.736 then node 38 elseif x4>=0.736 then node 39 else 1 20 if x2<94.408 then node 40 elseif x2>=94.408 then node 41 else 1 21 if x4<0.897 then node 42 elseif x4>=0.897 then node 43 else 1 22 if x4<0.882 then node 44 elseif x4>=0.882 then node 45 else 1 23 if x4<1.0785 then node 46 elseif x4>=1.0785 then node 47 else 1 24 if x1<1.5 then node 48 elseif x1>=1.5 then node 49 else 1 25 if x1<1.5 then node 50 elseif x1>=1.5 then node 51 else 0 26 if x4<5.0225 then node 52 elseif x4>=5.0225 then node 53 else 0 27 if x2<93.858 then node 54 elseif x2>=93.858 then node 55 else 0 28 if x4<1.349 then node 56 elseif x4>=1.349 then node 57 else 1 29 if x4<4.9635 then node 58 elseif x4>=4.9635 then node 59 else 1 30 if x4<4.9645 then node 60 elseif x4>=4.9645 then node 61 else 1 31 if x1<456 then node 62 elseif x1>=456 then node 63 else 0 32 class = 1 33 if x4<0.6435 then node 64 elseif x4>=0.6435 then node 65 else 1 34 if x2<93.2945 then node 66 elseif x2>=93.2945 then node 67 else 0 35 class = 1 36 class = 1

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 75: PREDIKSI DATA NASABAH YANG BERPOTENSI MEMBUKA …repository.usd.ac.id/35523/2/155314046_full.pdf · Decision Tree Dengan Penerapan Algoritma C4.5”. 1.2 Rumusan Masalah Dalam melakukan

60

37 class = 0 38 if x2<92.54 then node 68 elseif x2>=92.54 then node 69 else 1 39 if x4<1.2835 then node 70 elseif x4>=1.2835 then node 71 else 1 40 class = 1 41 if x4<0.9655 then node 72 elseif x4>=0.9655 then node 73 else 1 42 if x4<0.8795 then node 74 elseif x4>=0.8795 then node 75 else 1 43 if x4<0.8985 then node 76 elseif x4>=0.8985 then node 77 else 1 44 class = 1 45 if x1<2.5 then node 78 elseif x1>=2.5 then node 79 else 1 46 class = 1 47 if x4<1.256 then node 80 elseif x4>=1.256 then node 81 else 1 48 if x4<1.543 then node 82 elseif x4>=1.543 then node 83 else 1 49 if x4<1.515 then node 84 elseif x4>=1.515 then node 85 else 1 50 class = 0 51 if x4<1.3985 then node 86 elseif x4>=1.3985 then node 87 else 1 52 if x4<1.2755 then node 88 elseif x4>=1.2755 then node 89 else 0 53 class = 1 54 if x4<1.286 then node 90 elseif x4>=1.286 then node 91 else 0 55 class = 0 56 if x4<1.32 then node 92 elseif x4>=1.32 then node 93 else 1 57 class = 1 58 if x5<5193.4 then node 94 elseif x5>=5193.4 then node 95 else 1 59 class = 1 60 if x1<5.5 then node 96 elseif x1>=5.5 then node 97 else 1 61 class = 1 62 class = 0 63 class = 1 64 if x4<0.639 then node 98 elseif x4>=0.639 then node 99 else 1 65 class = 1 66 if x4<0.711 then node 100 elseif x4>=0.711 then node 101 else 1 67 if x4<0.7055 then node 102 elseif x4>=0.7055 then node 103 else 0 68 class = 1 69 if x4<0.7205 then node 104 elseif x4>=0.7205 then node 105 else 1 70 if x5<5004.55 then node 106 elseif x5>=5004.55 then node 107 else 1 71 class = 1 72 class = 1 73 if x2<94.684 then node 108 elseif x2>=94.684 then node 109 else 1 74 if x1<3.5 then node 110 elseif x1>=3.5 then node 111 else 1 75 class = 1 76 if x1<2.5 then node 112 elseif x1>=2.5 then node 113 else 0 77 class = 1 78 if x4<0.9225 then node 114 elseif x4>=0.9225 then node 115 else 1 79 if x1<5.5 then node 116 elseif x1>=5.5 then node 117 else 1 80 if x4<1.2435 then node 118 elseif x4>=1.2435 then node 119 else 1 81 class = 1 82 if x4<1.5345 then node 120 elseif x4>=1.5345 then node 121 else 0 83 if x4<1.6215 then node 122 elseif x4>=1.6215 then node 123 else 1 84 class = 0 85 if x4<1.5255 then node 124 elseif x4>=1.5255 then node 125 else 1 86 class = 1 87 if x4<1.4125 then node 126 elseif x4>=1.4125 then node 127 else 0 88 class = 0 89 if x2<93.858 then node 128 elseif x2>=93.858 then node 129 else 0 90 if x4<1.2545 then node 130 elseif x4>=1.2545 then node 131 else 0 91 if x2<93.621 then node 132 elseif x2>=93.621 then node 133 else 0 92 class = 1

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 76: PREDIKSI DATA NASABAH YANG BERPOTENSI MEMBUKA …repository.usd.ac.id/35523/2/155314046_full.pdf · Decision Tree Dengan Penerapan Algoritma C4.5”. 1.2 Rumusan Masalah Dalam melakukan

61

93 if x4<1.3305 then node 134 elseif x4>=1.3305 then node 135 else 1 94 if x4<4.862 then node 136 elseif x4>=4.862 then node 137 else 0 95 if x2<94.1915 then node 138 elseif x2>=94.1915 then node 139 else 1 96 if x4<1.4725 then node 140 elseif x4>=1.4725 then node 141 else 1 97 if x4<4.8575 then node 142 elseif x4>=4.8575 then node 143 else 1 98 class = 1 99 if x4<0.641 then node 144 elseif x4>=0.641 then node 145 else 0 100 class = 1 101 class = 0 102 if x4<0.703 then node 146 elseif x4>=0.703 then node 147 else 0 103 class = 0 104 class = 1 105 if x3<-36.4 then node 148 elseif x3>=-36.4 then node 149 else 0 106 if x4<1.047 then node 150 elseif x4>=1.047 then node 151 else 1 107 if x4<1.264 then node 152 elseif x4>=1.264 then node 153 else 1 108 if x4<0.99 then node 154 elseif x4>=0.99 then node 155 else 1 109 if x4<1.029 then node 156 elseif x4>=1.029 then node 157 else 1 110 if x4<0.6475 then node 158 elseif x4>=0.6475 then node 159 else 1 111 if x2<92.54 then node 160 elseif x2>=92.54 then node 161 else 1 112 class = 0 113 class = 1 114 class = 1 115 if x4<1.0235 then node 162 elseif x4>=1.0235 then node 163 else 0 116 class = 1 117 class = 0 118 class = 1 119 class = 0 120 class = 1 121 class = 0 122 class = 1 123 if x4<1.6345 then node 164 elseif x4>=1.6345 then node 165 else 1 124 class = 1 125 if x4<1.6515 then node 166 elseif x4>=1.6515 then node 167 else 1 126 if x4<1.408 then node 168 elseif x4>=1.408 then node 169 else 0 127 if x4<1.449 then node 170 elseif x4>=1.449 then node 171 else 0 128 if x2<93.621 then node 172 elseif x2>=93.621 then node 173 else 0 129 class = 0 130 class = 0 131 if x4<1.2615 then node 174 elseif x4>=1.2615 then node 175 else 0 132 if x4<4.969 then node 176 elseif x4>=4.969 then node 177 else 0 133 class = 1 134 class = 0 135 class = 1 136 if x4<1.419 then node 178 elseif x4>=1.419 then node 179 else 0 137 class = 1 138 if x4<4.9605 then node 180 elseif x4>=4.9605 then node 181 else 1 139 if x4<4.8655 then node 182 elseif x4>=4.8655 then node 183 else 1 140 class = 1 141 if x4<1.4905 then node 184 elseif x4>=1.4905 then node 185 else 1 142 if x1<6.5 then node 186 elseif x1>=6.5 then node 187 else 1 143 if x4<4.9635 then node 188 elseif x4>=4.9635 then node 189 else 1 144 class = 0 145 class = 1 146 class = 0 147 class = 1 148 if x4<0.7305 then node 190 elseif x4>=0.7305 then node 191 else 0

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 77: PREDIKSI DATA NASABAH YANG BERPOTENSI MEMBUKA …repository.usd.ac.id/35523/2/155314046_full.pdf · Decision Tree Dengan Penerapan Algoritma C4.5”. 1.2 Rumusan Masalah Dalam melakukan

62

149 class = 0 150 if x4<0.745 then node 192 elseif x4>=0.745 then node 193 else 1 151 class = 0 152 if x4<0.7925 then node 194 elseif x4>=0.7925 then node 195 else 0 153 class = 1 154 if x1<2.5 then node 196 elseif x1>=2.5 then node 197 else 1 155 class = 1 156 class = 0 157 class = 1 158 class = 1 159 if x4<0.7095 then node 198 elseif x4>=0.7095 then node 199 else 1 160 if x4<0.741 then node 200 elseif x4>=0.741 then node 201 else 1 161 class = 1 162 class = 0 163 class = 1 164 class = 0 165 if x4<1.6565 then node 202 elseif x4>=1.6565 then node 203 else 1 166 if x4<1.6345 then node 204 elseif x4>=1.6345 then node 205 else 1 167 class = 1 168 if x4<1.4055 then node 206 elseif x4>=1.4055 then node 207 else 0 169 class = 0 170 if x4<1.419 then node 208 elseif x4>=1.419 then node 209 else 1 171 if x4<1.481 then node 210 elseif x4>=1.481 then node 211 else 0 172 if x4<4.7165 then node 212 elseif x4>=4.7165 then node 213 else 0 173 if x4<4.8105 then node 214 elseif x4>=4.8105 then node 215 else 1 174 class = 1 175 if x4<1.265 then node 216 elseif x4>=1.265 then node 217 else 0 176 if x4<4.0485 then node 218 elseif x4>=4.0485 then node 219 else 0 177 class = 0 178 class = 0 179 if x4<1.449 then node 220 elseif x4>=1.449 then node 221 else 0 180 if x4<4.427 then node 222 elseif x4>=4.427 then node 223 else 1 181 class = 1 182 class = 0 183 if x4<4.9595 then node 224 elseif x4>=4.9595 then node 225 else 1 184 class = 0 185 if x4<4.098 then node 226 elseif x4>=4.098 then node 227 else 1 186 if x4<4.098 then node 228 elseif x4>=4.098 then node 229 else 1 187 if x1<7.5 then node 230 elseif x1>=7.5 then node 231 else 1 188 if x1<6.5 then node 232 elseif x1>=6.5 then node 233 else 1 189 class = 0 190 if x4<0.728 then node 234 elseif x4>=0.728 then node 235 else 0 191 class = 1 192 class = 0 193 if x4<1.0285 then node 236 elseif x4>=1.0285 then node 237 else 1 194 if x4<0.7545 then node 238 elseif x4>=0.7545 then node 239 else 1 195 if x4<0.811 then node 240 elseif x4>=0.811 then node 241 else 0 196 class = 1 197 class = 0 198 class = 1 199 if x4<0.7395 then node 242 elseif x4>=0.7395 then node 243 else 1 200 class = 0 201 class = 1 202 class = 1 203 if x4<1.7145 then node 244 elseif x4>=1.7145 then node 245 else 1 204 class = 1

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 78: PREDIKSI DATA NASABAH YANG BERPOTENSI MEMBUKA …repository.usd.ac.id/35523/2/155314046_full.pdf · Decision Tree Dengan Penerapan Algoritma C4.5”. 1.2 Rumusan Masalah Dalam melakukan

63

205 class = 0 206 class = 0 207 class = 1 208 class = 0 209 class = 1 210 class = 0 211 class = 1 212 if x4<4.207 then node 246 elseif x4>=4.207 then node 247 else 0 213 class = 0 214 class = 1 215 if x4<4.8435 then node 248 elseif x4>=4.8435 then node 249 else 1 216 class = 1 217 if x4<1.2755 then node 250 elseif x4>=1.2755 then node 251 else 0 218 if x4<1.349 then node 252 elseif x4>=1.349 then node 253 else 0 219 if x4<4.9635 then node 254 elseif x4>=4.9635 then node 255 else 0 220 class = 1 221 if x4<4.8555 then node 256 elseif x4>=4.8555 then node 257 else 0 222 class = 1 223 if x4<4.9575 then node 258 elseif x4>=4.9575 then node 259 else 1 224 class = 1 225 if x4<4.9615 then node 260 elseif x4>=4.9615 then node 261 else 0 226 class = 1 227 if x4<4.8645 then node 262 elseif x4>=4.8645 then node 263 else 1 228 class = 1 229 if x2<93.597 then node 264 elseif x2>=93.597 then node 265 else 1 230 if x4<4.1145 then node 266 elseif x4>=4.1145 then node 267 else 0 231 if x1<11.5 then node 268 elseif x1>=11.5 then node 269 else 1 232 if x2<94.2295 then node 270 elseif x2>=94.2295 then node 271 else 1 233 class = 1 234 class = 1 235 class = 0 236 if x4<0.986 then node 272 elseif x4>=0.986 then node 273 else 1 237 if x4<1.0345 then node 274 elseif x4>=1.0345 then node 275 else 1 238 if x4<0.7535 then node 276 elseif x4>=0.7535 then node 277 else 0 239 if x4<0.7705 then node 278 elseif x4>=0.7705 then node 279 else 1 240 class = 0 241 if x4<0.871 then node 280 elseif x4>=0.871 then node 281 else 0 242 if x4<0.734 then node 282 elseif x4>=0.734 then node 283 else 1 243 if x4<0.7425 then node 284 elseif x4>=0.7425 then node 285 else 1 244 if x4<1.695 then node 286 elseif x4>=1.695 then node 287 else 1 245 if x4<1.7415 then node 288 elseif x4>=1.7415 then node 289 else 1 246 if x4<1.349 then node 290 elseif x4>=1.349 then node 291 else 0 247 class = 1 248 class = 0 249 if x4<4.886 then node 292 elseif x4>=4.886 then node 293 else 1 250 if x4<1.268 then node 294 elseif x4>=1.268 then node 295 else 0 251 class = 0 252 class = 0 253 if x2<93.0465 then node 296 elseif x2>=93.0465 then node 297 else 0 254 if x4<4.9625 then node 298 elseif x4>=4.9625 then node 299 else 0 255 class = 0 256 if x4<1.4595 then node 300 elseif x4>=1.4595 then node 301 else 1 257 if x4<4.8565 then node 302 elseif x4>=4.8565 then node 303 else 0 258 class = 1 259 if x4<4.9595 then node 304 elseif x4>=4.9595 then node 305 else 1 260 class = 0

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 79: PREDIKSI DATA NASABAH YANG BERPOTENSI MEMBUKA …repository.usd.ac.id/35523/2/155314046_full.pdf · Decision Tree Dengan Penerapan Algoritma C4.5”. 1.2 Rumusan Masalah Dalam melakukan

64

261 class = 1 262 if x4<4.8555 then node 306 elseif x4>=4.8555 then node 307 else 1 263 if x4<4.8655 then node 308 elseif x4>=4.8655 then node 309 else 1 264 class = 0 265 if x4<4.8555 then node 310 elseif x4>=4.8555 then node 311 else 1 266 class = 0 267 class = 1 268 class = 1 269 class = 0 270 if x4<4.859 then node 312 elseif x4>=4.859 then node 313 else 1 271 class = 1 272 if x4<0.8985 then node 314 elseif x4>=0.8985 then node 315 else 1 273 class = 0 274 class = 1 275 if x4<1.0395 then node 316 elseif x4>=1.0395 then node 317 else 1 276 if x4<0.7415 then node 318 elseif x4>=0.7415 then node 319 else 0 277 class = 0 278 class = 1 279 if x4<0.7845 then node 320 elseif x4>=0.7845 then node 321 else 1 280 if x4<0.8405 then node 322 elseif x4>=0.8405 then node 323 else 1 281 if x4<0.88 then node 324 elseif x4>=0.88 then node 325 else 0 282 if x4<0.732 then node 326 elseif x4>=0.732 then node 327 else 1 283 class = 1 284 if x1<2.5 then node 328 elseif x1>=2.5 then node 329 else 1 285 if x4<0.814 then node 330 elseif x4>=0.814 then node 331 else 1 286 class = 1 287 class = 0 288 class = 1 289 if x4<1.7885 then node 332 elseif x4>=1.7885 then node 333 else 1 290 class = 0 291 if x4<3.2405 then node 334 elseif x4>=3.2405 then node 335 else 0 292 class = 1 293 if x4<4.9195 then node 336 elseif x4>=4.9195 then node 337 else 1 294 class = 0 295 class = 1 296 class = 1 297 class = 0 298 if x4<4.267 then node 338 elseif x4>=4.267 then node 339 else 0 299 class = 0 300 class = 0 301 class = 1 302 class = 0 303 if x4<4.8575 then node 340 elseif x4>=4.8575 then node 341 else 0 304 class = 0 305 class = 1 306 if x1<4.5 then node 342 elseif x1>=4.5 then node 343 else 1 307 class = 1 308 class = 0 309 if x2<94.1915 then node 344 elseif x2>=94.1915 then node 345 else 1 310 class = 0 311 class = 1 312 class = 1 313 if x4<4.9595 then node 346 elseif x4>=4.9595 then node 347 else 1 314 if x2<94.041 then node 348 elseif x2>=94.041 then node 349 else 1 315 if x2<94.408 then node 350 elseif x2>=94.408 then node 351 else 1 316 class = 0

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 80: PREDIKSI DATA NASABAH YANG BERPOTENSI MEMBUKA …repository.usd.ac.id/35523/2/155314046_full.pdf · Decision Tree Dengan Penerapan Algoritma C4.5”. 1.2 Rumusan Masalah Dalam melakukan

65

317 class = 1 318 if x4<0.7405 then node 352 elseif x4>=0.7405 then node 353 else 0 319 if x4<0.7425 then node 354 elseif x4>=0.7425 then node 355 else 1 320 if x4<0.772 then node 356 elseif x4>=0.772 then node 357 else 1 321 class = 1 322 if x2<92.29 then node 358 elseif x2>=92.29 then node 359 else 0 323 if x4<0.85 then node 360 elseif x4>=0.85 then node 361 else 1 324 class = 0 325 if x3<-32.5 then node 362 elseif x3>=-32.5 then node 363 else 0 326 if x4<0.7295 then node 364 elseif x4>=0.7295 then node 365 else 1 327 class = 1 328 if x2<92.405 then node 366 elseif x2>=92.405 then node 367 else 1 329 class = 0 330 class = 1 331 if x2<93.289 then node 368 elseif x2>=93.289 then node 369 else 1 332 if x4<1.7675 then node 370 elseif x4>=1.7675 then node 371 else 0 333 class = 1 334 if x2<92.8245 then node 372 elseif x2>=92.8245 then node 373 else 0 335 class = 0 336 class = 1 337 if x4<4.952 then node 374 elseif x4>=4.952 then node 375 else 1 338 class = 0 339 class = 1 340 class = 1 341 if x4<4.8595 then node 376 elseif x4>=4.8595 then node 377 else 0 342 class = 1 343 if x4<4.1365 then node 378 elseif x4>=4.1365 then node 379 else 0 344 if x4<4.9615 then node 380 elseif x4>=4.9615 then node 381 else 1 345 class = 1 346 class = 0 347 class = 1 348 if x4<0.8875 then node 382 elseif x4>=0.8875 then node 383 else 0 349 if x4<0.831 then node 384 elseif x4>=0.831 then node 385 else 1 350 class = 1 351 if x4<0.956 then node 386 elseif x4>=0.956 then node 387 else 1 352 if x2<92.405 then node 388 elseif x2>=92.405 then node 389 else 0 353 class = 0 354 class = 1 355 if x4<0.7525 then node 390 elseif x4>=0.7525 then node 391 else 0 356 class = 0 357 class = 1 358 if x4<0.823 then node 392 elseif x4>=0.823 then node 393 else 0 359 class = 1 360 class = 1 361 if x4<0.865 then node 394 elseif x4>=0.865 then node 395 else 1 362 if x4<0.993 then node 396 elseif x4>=0.993 then node 397 else 0 363 class = 1 364 if x4<0.7285 then node 398 elseif x4>=0.7285 then node 399 else 1 365 class = 1 366 class = 0 367 class = 1 368 class = 0 369 class = 1 370 class = 1 371 class = 0 372 class = 1

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 81: PREDIKSI DATA NASABAH YANG BERPOTENSI MEMBUKA …repository.usd.ac.id/35523/2/155314046_full.pdf · Decision Tree Dengan Penerapan Algoritma C4.5”. 1.2 Rumusan Masalah Dalam melakukan

66

373 class = 0 374 class = 1 375 if x4<4.984 then node 400 elseif x4>=4.984 then node 401 else 1 376 class = 0 377 class = 1 378 class = 1 379 class = 0 380 if x4<4.9605 then node 402 elseif x4>=4.9605 then node 403 else 1 381 class = 1 382 class = 1 383 if x4<0.8935 then node 404 elseif x4>=0.8935 then node 405 else 0 384 if x4<0.7575 then node 406 elseif x4>=0.7575 then node 407 else 0 385 if x4<0.8795 then node 408 elseif x4>=0.8795 then node 409 else 1 386 class = 0 387 if x4<0.9745 then node 410 elseif x4>=0.9745 then node 411 else 1 388 class = 1 389 class = 0 390 if x4<0.751 then node 412 elseif x4>=0.751 then node 413 else 0 391 class = 1 392 class = 0 393 if x4<0.8315 then node 414 elseif x4>=0.8315 then node 415 else 0 394 if x4<0.86 then node 416 elseif x4>=0.86 then node 417 else 1 395 class = 1 396 class = 0 397 if x4<1.1525 then node 418 elseif x4>=1.1525 then node 419 else 0 398 if x4<0.7185 then node 420 elseif x4>=0.7185 then node 421 else 1 399 class = 1 400 class = 1 401 class = 0 402 if x1<4.5 then node 422 elseif x1>=4.5 then node 423 else 1 403 class = 1 404 class = 0 405 if x4<0.897 then node 424 elseif x4>=0.897 then node 425 else 0 406 class = 1 407 if x4<0.816 then node 426 elseif x4>=0.816 then node 427 else 0 408 if x4<0.8655 then node 428 elseif x4>=0.8655 then node 429 else 1 409 if x4<0.8825 then node 430 elseif x4>=0.8825 then node 431 else 1 410 if x4<0.962 then node 432 elseif x4>=0.962 then node 433 else 0 411 class = 1 412 if x2<92.405 then node 434 elseif x2>=92.405 then node 435 else 1 413 class = 0 414 if x4<0.827 then node 436 elseif x4>=0.827 then node 437 else 0 415 class = 0 416 class = 1 417 class = 0 418 if x4<1.0785 then node 438 elseif x4>=1.0785 then node 439 else 1 419 if x4<1.2295 then node 440 elseif x4>=1.2295 then node 441 else 0 420 if x4<0.7165 then node 442 elseif x4>=0.7165 then node 443 else 1 421 class = 1 422 class = 1 423 if x4<4.9575 then node 444 elseif x4>=4.9575 then node 445 else 1 424 class = 1 425 class = 0 426 if x4<0.764 then node 446 elseif x4>=0.764 then node 447 else 0 427 class = 0 428 if x4<0.8535 then node 448 elseif x4>=0.8535 then node 449 else 1

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 82: PREDIKSI DATA NASABAH YANG BERPOTENSI MEMBUKA …repository.usd.ac.id/35523/2/155314046_full.pdf · Decision Tree Dengan Penerapan Algoritma C4.5”. 1.2 Rumusan Masalah Dalam melakukan

67

429 class = 1 430 if x4<0.8815 then node 450 elseif x4>=0.8815 then node 451 else 0 431 if x4<0.8845 then node 452 elseif x4>=0.8845 then node 453 else 1 432 class = 1 433 class = 0 434 class = 0 435 class = 1 436 class = 0 437 class = 1 438 if x4<1.0235 then node 454 elseif x4>=1.0235 then node 455 else 1 439 class = 1 440 class = 0 441 if x4<1.2395 then node 456 elseif x4>=1.2395 then node 457 else 0 442 class = 1 443 if x2<92.681 then node 458 elseif x2>=92.681 then node 459 else 1 444 class = 0 445 class = 1 446 class = 0 447 if x2<94.135 then node 460 elseif x2>=94.135 then node 461 else 1 448 class = 1 449 class = 0 450 class = 1 451 class = 0 452 if x2<94.207 then node 462 elseif x2>=94.207 then node 463 else 1 453 class = 1 454 class = 1 455 if x4<1.0365 then node 464 elseif x4>=1.0365 then node 465 else 1 456 class = 1 457 class = 0 458 class = 0 459 class = 1 460 class = 1 461 if x4<0.786 then node 466 elseif x4>=0.786 then node 467 else 0 462 if x4<0.8835 then node 468 elseif x4>=0.8835 then node 469 else 0 463 class = 1 464 class = 0 465 class = 1 466 class = 0 467 if x4<0.7995 then node 470 elseif x4>=0.7995 then node 471 else 1 468 class = 1 469 class = 0 470 if x4<0.795 then node 472 elseif x4>=0.795 then node 473 else 0 471 class = 1 472 class = 1 473 class = 0

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 83: PREDIKSI DATA NASABAH YANG BERPOTENSI MEMBUKA …repository.usd.ac.id/35523/2/155314046_full.pdf · Decision Tree Dengan Penerapan Algoritma C4.5”. 1.2 Rumusan Masalah Dalam melakukan

68

2. Lampiran gambar Tree pruning level 25

Tree Pruning Level 27

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI