implementasi algoritma decision tree untuk prediksi

65
IMPLEMENTASI ALGORITMA DECISION TREE UNTUK PREDIKSI KELULUSAN MAHASISWA TEPAT WAKTU LAPORAN SKRIPSI RAMADHINA PUTRI PERMATASARI 4617010061 PROGRAM STUDI TEKNIK INFORMATIKA JURUSAN TEKNIK INFORMATIKA DAN KOMPUTER POLITEKNIK NEGERI JAKARTA 2021

Upload: others

Post on 21-May-2022

6 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: IMPLEMENTASI ALGORITMA DECISION TREE UNTUK PREDIKSI

IMPLEMENTASI ALGORITMA DECISION TREE

UNTUK PREDIKSI KELULUSAN MAHASISWA

TEPAT WAKTU

LAPORAN SKRIPSI

RAMADHINA PUTRI PERMATASARI

4617010061

PROGRAM STUDI TEKNIK INFORMATIKA

JURUSAN TEKNIK INFORMATIKA DAN

KOMPUTER

POLITEKNIK NEGERI JAKARTA

2021

Page 2: IMPLEMENTASI ALGORITMA DECISION TREE UNTUK PREDIKSI

IMPLEMENTASI ALGORITMA DECISION TREE

UNTUK PREDIKSI KELULUSAN MAHASISWA

TEPAT WAKTU

LAPORAN SKRIPSI

Dibuat untuk Melengkapi Syarat-Syarat yang Diperlukan untuk

Memperoleh Diploma Empat Politeknik

RAMADHINA PUTRI PERMATASARI

4617010061

PROGRAM STUDI TEKNIK INFORMATIKA

JURUSAN TEKNIK INFORMATIKA DAN KOMPUTER

POLITEKNIK NEGERI JAKARTA

2021

Page 3: IMPLEMENTASI ALGORITMA DECISION TREE UNTUK PREDIKSI

iii

HALAMAN PERNYATAAN ORISINALITAS

Skripsi ini adalah hasil karya saya sendiri, dan semua sumber baik yang

dikutip maupun dirujuk telah saya nyatakan dengan benar.

Nama : Ramadhina Putri Permatasari

NPM : 4617010061

Tanggal : Rabu, 21 Juli 2021

Tanda Tangan :

Page 4: IMPLEMENTASI ALGORITMA DECISION TREE UNTUK PREDIKSI

iv

LEMBAR PENGESAHAN

Skripsi diajukan oleh:

Nama : Ramadhina Putri Permatasari

NIM : 4617010061

Program Studi : Teknik Informatika

Judul Skripsi : Implementasi Algoritma Decision Tree untuk

Prediksi Kelulusan Mahasiswa Tepat Waktu

Telah diuji oleh tim penguji dalam Sidang Skripsi pada hari Kamis, Tanggal 5,

Bulan Agustus, Tahun 2021 dan dinyatakan LULUS.

Disahkan oleh

Pembimbing I : Euis Oktavianti, S.Si., M.T.I. (……………………………)

Penguji I : Iwan Sonjaya,ST.,MMT.,MT. (……………………………)

Penguji II : Anggi Mardiyono S.Kom.,

M.Kom.

(……………………………)

Penguji III : Ariawan Andi Suhandana,

S.Kom., aM.T.I.

(……………………………)

Mengetahui : Jurusan Teknik Informatika dan Komputer

Ketua

Mauldy Laya, S.Kom., M.Kom.

NIP. 197802112009121003

Page 5: IMPLEMENTASI ALGORITMA DECISION TREE UNTUK PREDIKSI

v

KATA PENGANTAR

Puji syukur penulis panjatkan atas kehadirat Allah SWT karena atas rahmat

dan karunia Nya-lah laporan skripsi ini dapat diselesaikan. Skripsi ini

berjudul “Implementasi Algoritma Decision Tree untuk Prediksi Kelulusan

Mahasiswa Tepat Waktu”. Pada kesempatan ini penulis mengucapkan

banyak terima kasih kepada berbagai pihak atas bantuan, bimbingan dan

dukungannya sehingga penulisan ini berjalan lancar, yaitu:

a. Allah SWT yang telah memberikan penulis rezeki berupa akal

sehat serta kesehatan sehingga mampu menyelesaikan skripsi ini.

b. Ibu Euis Oktavianti, S.Si., M.T.I. selaku dosen pembimbing skripsi

yang telah meluangkan waktu, tenaga, dan pikiran untuk

membimbing dan membantu penulis dalam menyusun laporan

skripsi.

c. Orang tua dan keluarga penulis yang tak pernah luput mendoakan

penulis serta memberikan dukungan dan bantuan moral maupun

material kepada penulis.

d. Teman-teman yang telah membantu penulis menyelesaikan

penyusunan skripsi .

Akhir kata, penulis berharap Allah SWT berkenan membalas segala

kebaikan yang telah dilakukan Bapak/Ibu serta teman-teman dan semoga

laporan skripsi ini dapat bermanfaat.

Jakarta, Juli 2021

Ramadhina Putri Permatasari

Page 6: IMPLEMENTASI ALGORITMA DECISION TREE UNTUK PREDIKSI

vi

HALAMAN PERNYATAAN PERSETUJUAN PUBLIKASI SKRIPSI

UNTUK KEPENTINGAN AKADEMIS

Sebagai sivitas akademik Politeknik Negeri Jakarta, saya yang bertanda tangan di

bawah ini:

Nama : Ramadhina Putri Permatasari

NIM : 4617010061

Program Studi : Teknik Informatika

Jurusan : Teknik Informatika dan Komputer

Jenis karya : Skripsi

demi pengembangan ilmu pengetahuan, menyetujui untuk memberikan kepada

Politeknik Negeri Jakarta Hak Bebas Royalti Noneksklusif (Non-exclusive

Royalty Free Right) atas karya ilmiah saya yang berjudul :

IMPLEMENTASI ALGORITMA DECISION TREE UNTUK PREDIKSI

KELULUSAN MAHASISWA TEPAT WAKTU

beserta perangkat yang ada (jika diperlukan). Dengan Hak Bebas Royalti

Noneksklusif ini Politeknik Negeri Jakarta berhak menyimpan,

mengalihmedia/format-kan, mengelola dalam bentuk pangkalan data (database),

merawat, dan memublikasikan skripsi saya selama tetap mencantumkan nama

saya sebagai penulis/pencipta dan sebagai pemilik Hak Cipta.

Demikian pernyataan ini saya buat dengan sebenarnya. Dibuat di : Depok, Pada

tanggal : 18 Agustus 2021

Yang menyatakan

( Ramadhina Putri Permatasari )

Page 7: IMPLEMENTASI ALGORITMA DECISION TREE UNTUK PREDIKSI

vii

Implementasi Algoritma Decision Tree untuk Prediksi Kelulusan Mahasiswa

Tepat Waktu

Abstrak

Perguruan tinggi adalah institusi yang menyelenggarakan pendidikan akademik

bagi mahasiswa yang diharapkan dapat memberikan pendidikan yang berkualitas

agar mahasiswa dapat menjadi insan yang berilmu sehingga bisa memberikan

kontribusi bagi pembangunan nasional. Seluruh mahasiswa tentunya

menginginkan kelulusan yang tepat waktuKetepatan waktu kelulusan mahasiswa

dipengaruhi faktor faktor yang telah ditentukan perguruan tinggi. Tujuan

penelitian ini untuk melakukan prediksi kelulusan mahasiswa tepat waktu dengan

memberikan informasi nilai akademik mahasiswa. Metode yang digunakan dalam

penelitian ini adalah decision tree. Hasil evaluasi model menunjukkan akurasi

sebesar 85%.

Kata kunci: Prediksi, Decision Tree.

Page 8: IMPLEMENTASI ALGORITMA DECISION TREE UNTUK PREDIKSI

viii

DAFTAR ISI

HALAMAN PERNYATAAN ORISINALITAS ......................................................... iii

LEMBAR PENGESAHAN ......................................................................................... iv

KATA PENGANTAR .................................................................................................. v

HALAMAN PERNYATAAN PERSETUJUAN PUBLIKASI SKRIPSI UNTUK

KEPENTINGAN AKADEMIS ................................................................................... vi

Abstrak ........................................................................................................................ vii

DAFTAR ISI .............................................................................................................. viii

DAFTAR TABEL ........................................................................................................ xi

DAFTAR GAMBAR .................................................................................................. xii

BAB I ............................................................................................................................ 1

PENDAHULUAN ........................................................................................................ 1

1.1 Latar Belakang ........................................................................................................ 1

1.2 Perumusan Masalah ................................................................................................ 2

1.3 Batasan Masalah ..................................................................................................... 2

1.4 Tujuan dan Manfaaat .............................................................................................. 3

1.4.1 Tujuan .................................................................................................................. 3

1.4.2 Manfaat ................................................................................................................ 3

1.5 Metode Penyelesaian Masalah ................................................................................ 3

1.5.1 Identifikasi Masalah ............................................................................................. 3

1.5.2 Pengumpulan Data ............................................................................................... 3

1.5.3 Metode Pengembangan Sistem ............................................................................ 4

1.5.4 Analisis dan Desain Perancangan Sistem ............................................................ 5

1.5.5 Implementasi ........................................................................................................ 5

1.5.6 Pengujian .............................................................................................................. 6

1.5.7 Kesimpulan dan Saran ......................................................................................... 6

Page 9: IMPLEMENTASI ALGORITMA DECISION TREE UNTUK PREDIKSI

ix

BAB II ........................................................................................................................... 7

TINJAUAN PUSTAKA ............................................................................................... 7

2.1 Implementasi ........................................................................................................... 7

2.3 Fitur Seleksi ............................................................................................................ 7

2.4 Prediksi ................................................................................................................... 7

2.5 Mahasiswa ............................................................................................................... 7

2.8 Metode Pengembangan Sistem ............................................................................... 8

2.8.1 Requirement Gathering ........................................................................................ 8

1.8.2 Analisis ................................................................................................................ 9

2.8.3 Desain ................................................................................................................ 11

2.8.4 Implementasi ...................................................................................................... 14

2.8.5 Testing ................................................................................................................ 15

2.8.6 Deployment ........................................................................................................ 15

2.10 CRISP-DM .......................................................................................................... 15

2.10.1 Business Understanding ................................................................................... 16

2.10.2 Data Understanding ......................................................................................... 16

2.10.3 Data Preparation ............................................................................................... 16

2.10.4 Modelling ......................................................................................................... 18

2.10.5 Evaluation ........................................................................................................ 19

2.10.6 Deployment ...................................................................................................... 22

2.11 Penelitian Terdahulu ........................................................................................... 22

BAB III ....................................................................................................................... 24

PERENCANAAN DAN REALISASI ........................................................................ 24

3.1 Perancangan Program Aplikasi ............................................................................. 24

3.1.1 Deskripsi Program Aplikasi ............................................................................... 24

3.1.2 Requirement Analysis ........................................................................................ 24

3.1.3 Desain Sistem ..................................................................................................... 25

3.1.4 Implementasi Sistem .......................................................................................... 29

BAB IV ....................................................................................................................... 46

PEMBAHASAN ......................................................................................................... 46

Page 10: IMPLEMENTASI ALGORITMA DECISION TREE UNTUK PREDIKSI

x

4.1 Pengujian ............................................................................................................... 46

4.2 Deskripsi Pengujian .............................................................................................. 46

4.4 Data Hasil Pengujian ............................................................................................. 46

4.5 Analisis Pengujian ................................................................................................ 48

BAB V ........................................................................................................................ 50

KESIMPULAN ........................................................................................................... 50

5.1 Kesimpulan ........................................................................................................... 50

5.2 Saran ..................................................................................................................... 50

DAFTAR PUSTAKA ................................................................................................. 51

Page 11: IMPLEMENTASI ALGORITMA DECISION TREE UNTUK PREDIKSI

xi

DAFTAR TABEL

Tabel 3. 1 Tabel Data Nilai Matakuliah Mahasiswa ................................................... 31

Tabel 3. 2 Tabel Fitur Terpilih .................................................................................... 34

Tabel 3. 3 Tabel Fitur dan Information Gain .............................................................. 39

Tabel 4. 1 Hasil pengujian sistem ............................................................................... 46

Tabel 4. 2Tabel rasio pembagian data training dan testing......................................... 48

Page 12: IMPLEMENTASI ALGORITMA DECISION TREE UNTUK PREDIKSI

xii

DAFTAR GAMBAR

Gambar 2. 1 Tahapan metode waterfall ........................................................................ 8

Gambar 2. 2 Contoh flowchart .................................................................................... 11

Gambar 2. 3 Contoh diagram use case ....................................................................... 12

Gambar 2. 4 Contoh diagram activity ......................................................................... 14

Gambar 2. 5 Siklus Hidup CRISP-DM ....................................................................... 16

Gambar 2. 6 Struktur decision tree ............................................................................. 18

Gambar 2. 7 Confusion Matrix untuk klasifikasi biner .............................................. 20

Gambar 3. 1 Diagram Flowchart Sistem ..................................................................... 25

Gambar 3. 2 Diagram use case sistem ........................................................................ 26

Gambar 3. 3 Diagram activity sistem ......................................................................... 27

Gambar 3. 4 Tampilan Data Mahasiswa ..................................................................... 28

Gambar 3. 5 Tampilan Hasil Lulus Tepat Waktu ....................................................... 28

Gambar 3. 6 Tampilan Hasil Tidak Lulus Tepat Waktu ............................................. 29

Gambar 3. 7 Halaman input data nilai mahasiswa ...................................................... 29

Gambar 3. 8 Halaman yang tampil jika hasil klasifikasi adalah lulus tepat waktu..... 30

Gambar 3. 9 Halaman yang tampil jika hasil klasifikasi adalah tidak lulus tepat

waktu ........................................................................................................................... 30

Gambar 3. 10 Informasi tipe data dan keutuhan data ................................................. 35

Gambar 3. 11Baris kode data preparation ................................................................... 36

Gambar 3. 12 Baris kode data preparation .................................................................. 37

Gambar 3. 13 Baris kode data preparation .................................................................. 38

Gambar 3. 14 Baris kode data preparation .................................................................. 38

Gambar 3. 16 Baris kode model decision tree ............................................................ 39

Page 13: IMPLEMENTASI ALGORITMA DECISION TREE UNTUK PREDIKSI

1

BAB I

PENDAHULUAN

1.1 Latar Belakang

Perguruan tinggi merupakan institusi yang menyelenggarakan pendidikan

akademik bagi mahasiswa yang diharapkan dapat memberikan pendidikan yang

berkualitas agar mahasiswa dapat menjadi insan yang berilmu sehingga bisa

memberikan kontribusi bagi pembangunan nasional. Pendidikan dapat dikatakan

berhasil jika telah memenuhi tujuan pendidikan nasional dan proses belajar

mengajar yang diterapkan secara efektif dan efisien. Kesuksesan dan keberhasilan

pihak perguruan tinggi seringkali dapat dilihat dari keberhasilan dan prestasi

belajar mahasiswa, sedangkan kegagalan atau rendahnya kualitas mahasiswa

seringkali menjadi cerminan ketidakmampuan pihak perguruan tinggi dalam

menyelenggarakan proses pendidikan tinggi.

Semua mahasiwa tentunya mengharapkan kelulusan yang tepat waktu dan tidak

menambah semester. Adapun ketepatan waktu kelulusan mahasiswa dipengaruhi

faktor faktor tertentu yang ditentukan oleh perguruan tinggi yang bersangkutan.

Untuk dapat mengetahui kelulusan mahasiswa yang tepat waktu,dapat dilakukan

prediksi kelulusan tepat waktu dengan algoritma data mining. Adapun parameter

utama yang bisa digunakan adalah nilai akademik mahasiswa.

Prediksi kelulusan mahasiswa tepat waktu dapat diselesaikan dengan algoritma

prediksi data mining. Algoritma decision tree adalah algoritma yang cocok untuk

melakukan prediksi kelulusan mahasiswa tepat waktu dikarenakan algoritma

decision tree merupakan algoritma yang memiliki fleksibilitas dalam memilih

fitur dari internal nodes internal nodes yang berbeda, fitur yang terpilih akan

membedakan kriteria satu dengan kriteria lainnya di dalam node yang sama.

Karena sifatnya yang fleksibel, algoritma decision tree dapat meningkatkan

Page 14: IMPLEMENTASI ALGORITMA DECISION TREE UNTUK PREDIKSI

2

Jurusan Teknik Informatika dan Komputer – Politeknik Negeri Jakarta

kualitas keputusan yang dihasilkan. Selain itu, dengan algoritma decision tree,

daerah keputusan yang sebelumnya kompleks dan sangat global, dapat menjadi

diubah menjadi lebih simpel dan spesifik (Syamsu et al., 2019).

Namun demikian, algoritma decision tree memiliki kekurangan yaitu memiliki

kesulitan dalam mendesain pohon keputusan yang optimal yang menyebabkan

desain pohon keputusan yang dibuat memengaruhi hasil kualitas keputusan yang

didapatkan. Oleh karena itu, dalam penelitian ini akan digunakan pemilihan fitur

menggunakan nilai information gain terbesar (Ke et al., 2017). Dengan model

decision tree membagi setiap node pada fitur yang paling informatif atau dengan

information gain terbesar, diharapkan desain pohon keputusan menjadi lebih

optimal sehingga dapat meningkatkan kualitas keputusan.

Adapun beberapa algoritma lain adalah naive bayes dan k-nearest neighbor.

Namun, algoritma lain tersebut memiliki kekurangan. Yang pertama adalah naive

bayes memiliki kelemahan bahwa harus memiliki asumsi bahwa antar fitur tidak

memiliki keterkaitan ketika dalam realitanya seringkali antar fitur memiliki

keterkaitan (Syarli & Muin, 2016). Yang kedua adalah k-nearest neighbor

memiliki kelemahan bahwa nilai parameter k yang paling sesuai harus dicari

terlebih dahulu (Prasetya, 2017).

1.2 Perumusan Masalah

Berdasarkan latar belakang yang telah diuraikan di atas,

maka perumusan masalah dalam pembuatan sistem ini adalah:

Bagaimana algoritma decision tree dapat melakukan prediksi kelulusan

mahasiswa tepat waktu?

1.3 Batasan Masalah

Batasan masalah dalam pembuatan sistem ini adalah:

a. Sistem menggunakan algoritma decision tree dengan entropy untuk

melakukan prediksi kelulusan mahasiswa tepat waktu.

b. Data yang digunakan pada model adalah data nilai akademik mahasiswa

Page 15: IMPLEMENTASI ALGORITMA DECISION TREE UNTUK PREDIKSI

3

Jurusan Teknik Informatika dan Komputer – Politeknik Negeri Jakarta

bertipe file csv di program studi Teknik Informatika jurusan Teknik

Informatika dan Komputer Politeknik Negeri Jakarta

c. Data nilai akademik yang digunakan pada model adalah adalah matakuliah

wajib tingkat 1, IP semester dan IPK mahasiswa

d. Sistem berbasis website

e. Sistem memberikan informasi mahasiswa yang lulus tepat waktu

1.4 Tujuan dan Manfaaat

1.4.1 Tujuan

Tujuan dari penelitian ini adalah untuk mengimplementasikan algoritma decision

tree untuk melakukan prediksi kelulusan mahasiswa tepat waktu.

1.4.2 Manfaat

Manfaat yang dapat diperoleh dari pembuatan sistem ini tersebut antara lain

adalah untuk dapat membantu staf Politeknik Negeri Jakarta dalam melakukan

prediksi kelulusan mahasiswa yang tepat waktu secara otomatis.

1.5 Metode Penyelesaian Masalah

Metode yang dilakukan dalam penelitian ini terdiri dari beberapa tahapan yaitu

sebagai berikut:

1.5.1 Identifikasi Masalah

Tahap ini mengidentifikasikan permasalahan yang muncul ditempuh dengan cara

melakukan observasi lapangan. Observasi dilakukan untuk mengetahui

permasalahan yang terjadi di lapangan, yaitu ketepatan waktu kelulusan

mahasiswa. Identifikasi masalah dari hasil observasi yaitu diperlukannya sistem

yang bermanfaat untuk membantu melakukan prediksi kelulusan mahasiswa yang

tepat waktu.

1.5.2 Pengumpulan Data

Metode pengumpulan data yang digunakan terdiri dari:

Page 16: IMPLEMENTASI ALGORITMA DECISION TREE UNTUK PREDIKSI

4

Jurusan Teknik Informatika dan Komputer – Politeknik Negeri Jakarta

1. Data Sekunder

Penulis juga mengumpulkan data akademik mahasiswa dari staf akademik terkait

data yang akan diujikan kedalam sistem yang dibuat.

2. Tinjauan Pustaka

Tahap ini penulis melakukan studi literatur, yaitu pengumpulan bahan-bahan

referensi dari buku, artikel jurnal, maupun situs internet yang berkaitan dengan

sistem yang akan dibuat.

1.5.3 Metode Pengembangan Sistem

Metode pengembangan yang akan digunakan dalam pembuatan aplikasi ini adalah

waterfall. Waterfall Development Method adalah pendekatan SDLC paling awal

yang digunakan untuk pengembangan perangkat lunak. Hal ini juga disebut

sebagai model SDLC linear-sekuensial. Hal ini sangat sederhana untuk

memahami dan menggunakanya dalam mengimplementasikan sebuah

sistem. Dalam Model Waterfall, setiap tahap harus berurutan, dan tidak dapat

meloncat ketahap berikutnya, harus menyelesaikan tahap pertama baru lanjut ke

tahap ke berikutnya (Susilo, 2018). Tahapan tahapan tersebut antara lain adalah :

a. Requirement Gathering

Tahap ini akan menghasilkan daftar kebutuhan dari sistem untuk mengatasi

permasalahan yang ada dengan cara melakukan analisis terhadap masalah yang

sedang terjadi pada objek penelitian yang dilakukan dengan studi literatur dan

wawancara dengan pihak universitas

b. Analisis

Tahap ini dilakukan analisis kebutuhan, analisis kebutuhan ini nantinya dijadikan

sebagai alat bantu yang digunakan dalam proses pembuatan desain hingga

menjadi aplikasi final

c. Desain

Page 17: IMPLEMENTASI ALGORITMA DECISION TREE UNTUK PREDIKSI

5

Jurusan Teknik Informatika dan Komputer – Politeknik Negeri Jakarta

Informasi yang telah didapatkan pada tahap analisis akan dibuatkan suatu desain

interaktif dari aplikasi yang akan dibangun. Adapun desain yang dilakukan adalah

desain terhadap infrastruktur dan tampilan sistem.

d. Implementasi

Informasi yang telah dikumpulkan pada tahap sebelumnya akan menjadi bahan

acuan untuk ditransformasikan ke dalam bentuk syntax code. Disini akan banyak

dilakukan debug pada setiap komponen aplikasi yang telah dibangun di tahap ini.

e. Testing

Aplikasi yang telah selesai dibangun akan dilakukan proses pengujian pada

seluruh komponen aplikasi untuk memastikan semua komponen aplikasi dapat

bekerja dengan baik tanpa adanya error.

f. Instalasi

Tahap ini adalah tahap terakhir yang dimana dilakukan instalasi sistem yang siap

untuk digunakan oleh pihak perguruan tinggi

1.5.4 Analisis dan Desain Perancangan Sistem

Tahap ini meliputi kegiatan analisa kebutuhan fungsional dari sistem berdasarkan

studi literature yang dilakukan pada tahap sebelumnya. Kemudian dilanjutkan

dengan melakukan perancangan model sistem. Perancangan adalah suatu bagian

dari metodologi pengembangan pembangunan. Perancangan yang dibuat

mencakup flowchart

1.5.5 Implementasi

Tahap ini dilakukan dengan cara menerapkan rancangan sistem yang telah dibuat

sebelumnya. Selain itu, tahap ini juga menjelaskan bagaimana implementasi dari

perancangan yang telah dibuat pada tahap sebelumnya, bagaimana infrastuktur

sistem dan bahasa pemrograman yang digunakan. Sebagai rencana awal, aplikasi

dibangun menggunakan framework laravel.

Page 18: IMPLEMENTASI ALGORITMA DECISION TREE UNTUK PREDIKSI

6

Jurusan Teknik Informatika dan Komputer – Politeknik Negeri Jakarta

1.5.6 Pengujian

Tahap ini yaitu melakukan uji coba sistem prediksi. Tujuan dari tahap ini yaitu

untuk memastikan aplikasi telah sesuai dengan kebutuhan yang sudah

didefinisikan sebelumnya. Aplikasi diuji berdasarkan metode akurasi untuk

mengetahui berapa persen error yang terjadi pada sistem.

1.5.7 Kesimpulan dan Saran

Tahap ini merupakan proses untuk menarik kesimpulan dan saran atas apa yang

dilakukan selama pengerjaan tugas akhir. Dasar pengambilan kesimpulan dan

saran diantaranya adalah hasil analisa dan pembahasan. Tahap ini bertujuan untuk

menghasilkan gambaran penelitian secara ringkas, jelas, dan mudah dipahami.

Page 19: IMPLEMENTASI ALGORITMA DECISION TREE UNTUK PREDIKSI

7

BAB II

TINJAUAN PUSTAKA

2.1 Implementasi

Implementasi sistem dapat didefinisikan sebagai sebuah proses untuk penerapan

suatu sistem atau kebijakan dalam sebuah aktivitas. Implementasi dapat juga

diartikan sebagai penerapan dan pelaksanaan sebuah kebijakan. Implementasi

dilakukan berdasarkan suatu kerangka yang telah dibuat.

2.3 Fitur Seleksi

Proses pemilihan suatu subset dari fitur asli dengan menghilangkan fitur yang

tidak relevan disebut dengan feature selection atau fitur seleksi. Fitur seleksi

seringkali digunakan untuk meningkatkan efisiensi dari suatu model. Fitur seleksi

bertujuan untuk mencari sebuah data yang paling relevan terhadap suatu kelas

dikarenakan fitur yang tidak relevan ataupun yang berlebihan dapat memengaruhi

hasil dari suatu model (Bode, 2017).

2.4 Prediksi

Prediksi merupakan suatu proses perkiraan yang dilakukan terhadap sekumpulan

data. Prediksi di dalam data mining merupakan proses perkiraan sekumpulan data,

dapat dilakukan pada data terstruktur atau tidak terstruktur. Adapun label adalah

atribut yang akan diprediksi oleh mesin.

2.5 Mahasiswa

Mahasiswa merupakan orang yang belajar di perguruan tinggi, baik di universitas,

institut atau akademi. Mahasiswa adalah orang orang yang terdaftar sebagai

pelajar di perguruan tinggi. Dengan mengejar pendidikan yang lebih tinggi,

mahasiswa diharapkan dapat menjadi insan yang kreatif dan berilmu untuk dapat

memberikan kontribusi di dalam pembangunan nasional (Nurhayati et al., 2015).

Page 20: IMPLEMENTASI ALGORITMA DECISION TREE UNTUK PREDIKSI

8

Jurusan Teknik Informatika dan Komputer – Politeknik Negeri Jakarta

2.8 Metode Pengembangan Sistem

Waterfall Development Method adalah pendekatan SDLC paling awal yang

digunakan untuk pengembangan perangkat lunak. Hal ini juga disebut sebagai

model SDLC linear-sekuensial. Hal ini sangat sederhana untuk memahami dan

menggunakanya dalam mengimplementasikan sebuah sistem. Dalam

Model Waterfall, setiap tahap harus berurutan, dan tidak dapat meloncat ketahap

berikutnya, harus menyelesaikan tahap pertama baru lanjut ke tahap ke berikutnya

(Susilo, 2018).

Gambar 2. 1 Tahapan metode waterfall

(Sumber : Maulani, 2020)

Gambar 2.1 merupakan tahapan dari metode waterfall. Pada algoritma ini terdapat

tahapan tahapan yang antara lain adalah tahapan perencanaan ataupun seringkali

berupa requirement gathering, analisis, desain, implementasi, serta penggunaan

atau yang bisa juga disebut dengan deployment.

2.8.1 Requirement Gathering

Dalam tahap analisis kebutuhan software ini bertujuan untuk menganalisa

kebutuhan software dan hardware yang dibutuhkan untuk menentukan solusi

untuk fitur dan interface yang digunakan. Adapun kebutuhuan Functional

Requirement dan Non-Functional Requirement pada aplikasi ini adalah:

a. Functional Requirement

Page 21: IMPLEMENTASI ALGORITMA DECISION TREE UNTUK PREDIKSI

9

Jurusan Teknik Informatika dan Komputer – Politeknik Negeri Jakarta

Kebutuhan fungsi dari sistem ini adalah di dalam sistem dapat melakukan input

nilai matakuliah wajib tingkat 1, serta IP setiap semester dan IPK. Sistem dapat

memroses nilai yang dimasukkan, serta sistem dapat menampilkan hasil prediksi

ketepatan waktu kelulusan mahasiswa

b. Non-Functional Requirement

Persyaratan untuk sistem ini yaitu menggunakan bahasa pemrograman PHP,

framework Laravel untuk membuat interface web. Yang terakhir adalah metode

yang akan diterapkan dalam sistem adalah algoritma decision tree dengan

menggunakan bahasa Python dan juga libraries Python.

1.8.2 Analisis

Dalam tahap analisis kebutuhan software ini bertujuan untuk menganalisa

kebutuhan software dan hardware yang dibutuhkan untuk menentukan solusi

untuk fitur dan interface yang digunakan. Adapun hasil dari analisa adalah :

a. Bahasa pemrograman PHP

PHP merupakan singkatan dari "PHP: Hypertext Prepocessor", yakni bahasa

pemrograman yang digunakan secara luas untuk penanganan pembuatan dan

pengembangan sebuah situs web dan bisa digunakan bersamaan dengan HTML.

PHP diciptakan oleh Rasmus Lerdorf pertama kali tahun 1994. Pada awalnya PHP

adalah singkatan dari "Personal Home Page Tools". Selanjutnya diganti menjadi

FI ("Forms Interpreter").Sejak versi 3.0, nama bahasa ini diubah menjadi "PHP:

Hypertext Prepocessor" dengan singkatannya "PHP". PHP versi terbaru adalah

versi ke-5 (ubaya.ac.id, 2014).

b. Framework Laravel

Laravel merupakan sebuah MVC web development framework yang dibuat untuk

membangun perangkat lunak dengan kualitas yang lebih baik dengan

meminimalisir biaya pengembangan dan perbaikan serta meningkatkan

produktifitas pekerjaan dengan sintak yang bersih dan fungsional yang dapat

mengurangi banyak waktu untuk implementasi (Luthfi, 2017).

Page 22: IMPLEMENTASI ALGORITMA DECISION TREE UNTUK PREDIKSI

10

Jurusan Teknik Informatika dan Komputer – Politeknik Negeri Jakarta

c. Decision Tree

Decision tree merupakan salah satu algoritma data mining. Algoritma decision

tree menghasilkan pohon keputusan yang mempresentasikan aturan dari fakta

yang sangat besar. Aturan ini dapat dengan mudah dipahami oleh manusia.

Sebuah decision tree merupakan sebuah struktur yang digunakan untuk membagi

sekumpulan besar data menjadi himpunan himpunan record yang lebih kecil

dengan menggunakan serangkaian aturan keputusan.

d. Bahasa pemrograman Python

Python merupakan yang kemampuan, menggabungkan kapabilitas, dan sintaks

kode yang sangat jelas dan juga dilengkapi dengan libraries yang memberikan

ekstensi fungsi. Python merupakan golongan dari bahasa pemrograman dengan

level tinggi yang dirancang agar mudah dipahami dan dipelajari (baktikominfo.id,

2019).

e. Pandas

Pandas merupakan salah satu library yang berjenis open source yang

menyediakan struktur dan dengan alat analisa data berkinerja tinggi dan mudah

digunakan dalam bahasa pemrograman Python. Pandas sering digunakan untuk

membaca data atau memanggil data dari berbagai macam jenis data khususnya

data tekstual (Turmudi, 2020).

f. TFScikit-Learn(Sklearn)

Sklearn merupakan salah satu library open source yang bekerja dengan bahasa

pemrograman Python. Sklearn memiliki fungsi pengintegrasian banyak algoritma

dalam pembelajaran mesin. Pustaka sklearn awalnya dikembangkan oleh

Cournapeu pada tahun 2007, akan tetapi untuk rilisan pertama secara resmi pada

tahun 201 Sklearn merupakan bagian dari pustaka SciPy (Science Python),

dimana satu set pustaka ini dibuat untuk komputasi ilmiah khususnya analisa data

(Turmudi, 2020).

Page 23: IMPLEMENTASI ALGORITMA DECISION TREE UNTUK PREDIKSI

11

Jurusan Teknik Informatika dan Komputer – Politeknik Negeri Jakarta

2.8.3 Desain

Tahap desain dilakukan sesuai dengan kebutuhan sistem user interface. Alur user

melakukan input data nilai mahasiswa, melakukan submit data dan yang terakhir

adalah sistem akan menampilkan output prediksi kelulusan tepat waktu

mahasiswa. Pada tahapan desain, dilakukan perancangan diagram kerja dari

sistem dan juga desain antar muka sistem. Adapun diagram yang akan dibuat pada

tahap desain ini adalah diagram flowchart, diagram use case dan juga diagram

activity.

a. Diagram Flowchart

Flowchart dapat diartikan sebagai gambaran algoritma yang terstruktur dan

mudah dipahami oleh orang lain. Flowchart menggambarkan urutan logika dari

suatu prosedur dalam sebuah pemecahan masalah, sehingga flowchart dapat

diartikan sebagai langkah langkah penyelesaian masalah yang diselesaikan dengan

simbol simbol tertentu. Flowchart memiliki tujuan untuk menggambarkan suatu

tahapan penyelesaian masalah secara sederhana, terurai, rapi dan jelas

menggunakan simbol-simbol yang standar (Sitorus, 2015). Berikut adalah contoh

flowchart menurut (Maulida et al., 2016) :

Gambar 2. 2 Contoh flowchart

(Sumber : Maulida, Penerapan Metode Waterfall Pada Pengembangan Aplikasi, 2016)

Page 24: IMPLEMENTASI ALGORITMA DECISION TREE UNTUK PREDIKSI

12

Jurusan Teknik Informatika dan Komputer – Politeknik Negeri Jakarta

Gambar 2.2 Merupakan contoh diagram flowchart. Diagram ini memuat proses

kerja sistem yang dibuat. Setiap bangun datar merupakan simbol dari sebuah

proses dan antar proses tersebut dihubungkan dengan tanda panah.

b. Diagram Use Case

Use case diagram merupakan diagram yang mendeskripsikan fungsi fungsi yang

dilakukan didalam sistem. Diagram usecase menyediakan cara mendiskripsikan

pandangan eksternal terhadap sistem dan interaksi-interaksinya terhadap dunia

luar (Handayani, 2018). Use case diagram merepresentasikan model untuk

kelakukan sistem yang dibuat dengan tujuan untuk mengetahui fungsi fungsi yang

ada di dalam suatu sistem dan siapa saja yang berhak mengakses fungsi fungsi

tersebut (Hendini, 2016). Berikut adalah contoh dari use case diagram :

Gambar 2. 3 Contoh diagram use case

Page 25: IMPLEMENTASI ALGORITMA DECISION TREE UNTUK PREDIKSI

13

Jurusan Teknik Informatika dan Komputer – Politeknik Negeri Jakarta

(Sumber : Suendri, Implementasi Diagram UML (Unified Modelling Language) Pada Perancangan

Sistem Informasi Remunerasi Dosen Dengan Database Oracle (Studi Kasus: UIN Sumatera Utara

Medan), 2018)

Gambar 2.3 merupakan contoh diagram dari sebuah sistem yang dibangun,

adapun komponen dari diagram tersebut adalah aktor atau user yang

menggunakan sistem dan juga use case, use case merupakan sebuah aktivitas yang

dapat dilakukan oleh aktor di dalam sistem tersebut. Adapun garis yang

menghubungkan antara aktor dengan use case menunjukkan bahwa aktor tersebut

dapat melakukan aktivitas dari use case yang terhubung.

c. Diagram Activity

Activity Diagram merupakan gambaran workflow (aliran kerja) atau aktivitas dari

sebuah sistem atau proses bisnis (Hendini, 2016). Digram acivity menggambarkan

sistem dalam bentuk sekumpulan aksi aksi, bagaimana setiap aksi tersebut

dimulai, keputusan yang mungkin terjadi, hingga berakhirnya aksi tersebut.

Diagram activity juga dapan menggambarkan proses lebih dari satu aksi dalam

waktu yang bersamaan (Suendri, 2018). Adapun contoh dari diagram activity

adalah sebagai berikut :

Page 26: IMPLEMENTASI ALGORITMA DECISION TREE UNTUK PREDIKSI

14

Jurusan Teknik Informatika dan Komputer – Politeknik Negeri Jakarta

Gambar 2. 4 Contoh diagram activity

(Sumber : Suendri, Implementasi Diagram UML (Unified Modelling Language) Pada Perancangan

Sistem Informasi Remunerasi Dosen Dengan Database Oracle (Studi Kasus: UIN Sumatera Utara

Medan), 2018)

Gambar 2.4 merupakan contoh diagram activity dari sebuah sistem yang dibuat.

Adapun komponennya menunjukkan setiap alur dari activity yang dilakukan oleh

dosen dan sistem. Adapun panah yang ada menunjukkan hubungan antar activity

yang dilakukan.

2.8.4 Implementasi

Tahap implementasi dilakukan pembuatan aplikasi berdasarkan analisis dan

desain yang sudah dilakukan di tahap sebelumnya dengan dilakukan coding. Pada

tahap ini dilakukan coding menggunakan bahasa pemrograman PHP dan

Page 27: IMPLEMENTASI ALGORITMA DECISION TREE UNTUK PREDIKSI

15

Jurusan Teknik Informatika dan Komputer – Politeknik Negeri Jakarta

framework Laravel untuk melakukan pengembangan aplikasi berbasis web,

menggunakan algoritma decision tree dengan Python dan libraries Python untuk

melakukan prediksi ketepatan waktu kelulusan mahasiswa. Penerapan sistem ini

dilakukan pada laptop sebagai server dengan spesifikasi processor Intel Core i5,

Memory 4GB, HDD 1TB.

2.8.5 Testing

Tahap ini dilakukan pemeriksaan dan pengujian program secara keseluruhan.

Pengujian akan menggunakan metode Black Box untuk mengetahui apakah sistem

dapat berjalan dengan baik dan sesuai dengan yang diharapkan. Pengujian sistem

ini dilakukan simulasi penggunaan sistem dengan melakukan input dan submit

data dan juga melihat apakah hasil output sudah sesuai dengan hasil testing yang

ada.

2.8.6 Deployment

Tahapan terakhir adalah tahapan deployment. Pada tahapan ini sistem yang sudah

dibuat akan dioperasikan oleh pengguna yakni pihak perguruan tinggi. Pada

tahapan ini sistem diharapkan berjalan sebagaimana seharusnya setelah dilakukan

tahap testing.

2.10 CRISP-DM

CRISP-DM atau Cross-Industry Standard Process untuk Data Mining merupakan

standarisasi proses data mining sebagai strategi pemecahan masalah secara umum

dari bisnis atau unit penelitian. Dalam CRISP-DM sebuah proyek data mining

memiliki siklus hidup yang terbagi dalam enam fase (Feblian & Daihani, 2017).

Berikut adalah siklus hidup dari CRISP-DM :

Page 28: IMPLEMENTASI ALGORITMA DECISION TREE UNTUK PREDIKSI

16

Jurusan Teknik Informatika dan Komputer – Politeknik Negeri Jakarta

Gambar 2. 5 Siklus Hidup CRISP-DM

(Sumber : sis.binus.ac.id, 2020)

2.10.1 Business Understanding

Tahap ini dilakukan pendalaman terhadap pemahaman bisnis yang akan dijadikan

tumpuan dalam mengembangkan sistem. Dalam tahap ini dilakukan penentuan

tujuan projek dan kebutuhan secara detail dalam lingkup bisnis atau unit

penelitian secara keseluruhan serta menerjemahkan tujuan dan batasan menjadi

formula dan definisi dari permasalahan data mining.

2.10.2 Data Understanding

Tahap ini dilakukan pendalaman terkait pemahaman data yang akan digunakan.

Adapun tahapannya adalah mengumpulkan data, melakukan analisis penyelidikan

data untuk mengenali lebih lanjut mengenai data dan pencarian awal pengetahuan

yang ada didalamnya serta mengevaluasi kualitas data

2.10.3 Data Preparation

Tahap ini melibatkan ETL(Extract-Transform-Load) proses yang dapat mengubah

beberapa bagian informasi data dari berbagai sumber menjadi sesuatu yang

berguna dari algoritma dan proses. Menyiapkan data yang tersedia dari awal, fase

ini merupakan pekerjaan berat yang perlu dilaksanakan secara intensif, memilih

kasus dan variabel yang ingin dianalisis dan yang sesuai dengan analisis yang

akan dilakukan, melakukan perubahan pada beberapa variabel jika dibutuhkan

Page 29: IMPLEMENTASI ALGORITMA DECISION TREE UNTUK PREDIKSI

17

Jurusan Teknik Informatika dan Komputer – Politeknik Negeri Jakarta

serta menyiapkan data awal sehingga siap untuk perangkat pemodelan.

Information gain adalah salah satu teknik feature selection atau seleksi fitur yang

sering digunakan untuk memilih fitur terbaik atau yang paling sesuai dalam proses

pembelajaran dengan melakukan perhitungan nilai entropy, entropy adalah ukuran

dari ketidakpastian kelas menggunakan probabilitas dari suatu atribut tertentu.

Information gain berperan dalam membuat keputusan klasifikasi dengan cara

mengukur berapa banyak informasi kehadiran dan ketidakhadiran dari suatu

atribut (Utami, 2015). Berikut adalah tahapan dari perhitungan information gain

(Yessy Nabella et al., 2019):

2. Mencari nilai entropi seluruh kelas dengan persamaan :

( ) ∑

Keterangan :

S adalah himpunan (dataset) kasus

c adalah jumlah kelas

Pi adalah jumlah sampel setiap kelas i

3. Mencari nilai gain setiap fitur A dengan rumus persamaan

( ) ( ) ∑ ( ) | |

| | ( )

Keterangan :

S adalah ruang (data) sample data training

A adalah fitur

( ) adalah nilai-nilai untuk fitur A

| | adalah jumlah sampel v

| | adalah jumlah seluruh data

( ) adalah entropi untuk data dengan nilai v

Page 30: IMPLEMENTASI ALGORITMA DECISION TREE UNTUK PREDIKSI

18

Jurusan Teknik Informatika dan Komputer – Politeknik Negeri Jakarta

2.10.4 Modelling

Tahap ini bertanggungjawab atas hasil yang akan diperoleh atau membantu

memenuhi tujuan proyek dan tahap ini merupakan core dari machine learning

project. Pada langkah ini, development team akan menggunakan metode model

statistik, seperti: linear regressions, decision trees, random forest modelling, dll

dalam membangun model untuk menguji data dan mencari jawaban

atas objective yang diberikan.

Dalam tahap modeling, akan digunakan algoritma decision tree. Salah satu

algoritma klasifikasi dan prediksi yang kuat dan terkenal adalah algoritma

decision tree. Algoritma decision tree menghasilkan pohon keputusan yang

mempresentasikan aturan dari fakta yang sangat besar. Aturan ini dapat dengan

mudah dipahami oleh manusia. Sebuah decision tree merupakan sebuah struktur

yang digunakan untuk membagi sekumpulan besar data menjadi himpunan

himpunan record yang lebih kecil dengan menggunakan serangkaian aturan

keputusan (Muzakir & Wulandari, 2016). Berikut adalah struktur decision tree :

Gambar 2. 6 Struktur decision tree

(Sumber : Muzakir & Wulandari, Model Data Mining sebagai Prediksi Penyakit Hipertensi

Kehamilan dengan Teknik Decision Tree, 2016)

Root node atau node akar merupakan node yang terletak paling atas dari suatu

pohon. Internal Node ini merupakan node percabangan, dimana pada node ini

hanya terdapat satu input dan mempunyai minimal dua output. Sedangkan Leaf

Page 31: IMPLEMENTASI ALGORITMA DECISION TREE UNTUK PREDIKSI

19

Jurusan Teknik Informatika dan Komputer – Politeknik Negeri Jakarta

Node ini merupakan node akhir, hanya memiliki satu input, dan tidak memiliki

output. Pada pohon keputusan setiap leaf node menandai label kelas.

ID3 merupakan salah satu teknik yang digunakan dalam algoritma decision tree

yang dibuat oleh yang dibuat oleh J. Ross Quinlan. ID3 menggunakan algoritma

basic tree induction yang memberi atribut ke node pada tree berdasar berapa

banyak informasi bertambah dari node tersebut. Metode ID3 memperbolehkan

sebuah atribut untuk memiliki dua atau lebih nilai pada sebuah node atau titik

split. Atribut yang dipilih untuk setiap node adalah atribut yang memaksimalkan

information gain. ID3 dapat mengklasifikasikan data yang besar dalam waktu

yang relatif cepat, tergantung seberapa besar data set yang digunakan (Sebastian

et al., 2015). Berikut adalah tahapan dari pembuatan pohon keputusan dengan

teknik ID3:

1. Memasukkan data training dan variabel

2. Melakukan perhitungan Entropy dan Information Gain dari setiap variabel

3. Memilih variabel dengan nilai information gain terbesar.

4. Bentuk node yang berisi variabel tersebut

5. Mengulangi proses perhitungan information gain secara terus menerus sampai

semua data telah termasuk dalam kelas yang sama. Variabel yang telah terpilih

sebelumnya tidak diikutsertakan dalam perhitungan information gain berikutnya.

2.10.5 Evaluation

Tahap ini, akan dilakukan verifikasi atau penilaian data yang sudah dimodelkan

untuk memastikan bahwa hasil yang didapatkan adalah valid dan benar. Jika

terjadi hasilnya salah, maka pada metodologi ini memperbolehkan untuk kembali

ke tahap business understanding untuk mengetahui penyebab terjadinya hasil

yang salah. Pada tahap ini, akan digunakan data testing untuk memverifikasi

model yang dibuat adalah akurat dengan kenyataan. Dalam mengembangkan

model prediksi tentunya salah satu tahapan penting yang dibutuhkan adalah

melakukan evaluasi kinerja model. Evaluasi model prediksi dilihat beberapa

Page 32: IMPLEMENTASI ALGORITMA DECISION TREE UNTUK PREDIKSI

20

Jurusan Teknik Informatika dan Komputer – Politeknik Negeri Jakarta

parameter terkait. Parameter parameter ini akan diujikan kepada model yang

nantinya akan menghasilkan suatu nilai atau skor. Evaluasi dibutuhkan untuk

mengetahui seberapa akurat dan seberapa andal model yang dibuat. Adapun

parameter evaluasi yang akan digunakan dalam penelitian ini adalah confusion

matrix, accuracy, precision, recall, f1 score dan auc score (Alvi Pranandha Syah,

Adiwijaya, 2017)

Confusion matrix adalah matriks berukuran N x N yang digunakan untuk

melakukan evaluasi performa dari sebuah model klasifikasi. Matriks ini

membandingkan nilai target yang sebenarnya dengan nilai target yang diprediksi.

Berikut adalah confusion matrix untuk klasifikasi biner

Gambar 2. 7 Confusion Matrix untuk klasifikasi biner

Classification accuracy adalah rasio jumlah prediksi yang benar dengan jumlah

total sampel input, yang biasanya kita sebut dengan istilah akurasi. Adapun rumus

dari accuracy adalah :

Precision adalah kemampuan model klasifikasi untuk tidak memberi label positif

pada sampel yang negatif. Adapun rumus dari precision adalah :

Page 33: IMPLEMENTASI ALGORITMA DECISION TREE UNTUK PREDIKSI

21

Jurusan Teknik Informatika dan Komputer – Politeknik Negeri Jakarta

Recall adalah kemampuan model klasifikasi untuk menemukan semua sampel

positif. Adapun rumus dari recall adalah :

Dimana :

TP adalah True Positive, yaitu jumlah data positif yang terklasifikasi dengan

benar oleh sistem.

TN adalah True Negative, yaitu jumlah data negatif yang terklasifikasi dengan

benar oleh sistem.

FN adalah False Negative, yaitu jumlah data negatif namun terklasifikasi salah

oleh sistem.

FP adalah False Positive, yaitu jumlah data positif namun terklasifikasi salah

oleh sistem

F1-score adalah skor yang merupakan rata rata tertimbang dari precision dan

recall. Adapun rumus perhitungan f1-score adalah sebagai berikut :

AUC score adalah Area Under the Curve (AUC) adalah ukuran kemampuan

classifier untuk membedakan antar kelas dan digunakan sebagai ringkasan dari

kurva ROC. Semakin besar skor AUC, maka ini menandakan semakin baik

kinerja model dalam membedakan kelas positif dan negatif.

Page 34: IMPLEMENTASI ALGORITMA DECISION TREE UNTUK PREDIKSI

22

Jurusan Teknik Informatika dan Komputer – Politeknik Negeri Jakarta

2.10.6 Deployment

Pada tahap ini, model dapat digunakan dalam sistem, hasil dari model dapat

dibuat sebagai laporan ataupun insight bagi pihak perguruan tinggi.

2.11 Penelitian Terdahulu

Berdasarkan penelitian yang dilakukan oleh (Widiyati et al., 2018) yang berjudul

“Penerapan Algoritma ID3 Decision Tree Pada Penentuan Penerima Program

Bantuan Pemerintah Daerah di Kabupaten Kutai Kartanegara” dapat melakukan

klasifikasi dengan metode ID3 menggunakan rapidminer menghasilkan akurasi

sebesar 97,89 % dengan 92 data sehingga algoritma ini sangat baik digunakan

dalam klasifikasi penentuan penerima program bantuan lanjut usia. Aplikasi ini

dapat membantu dalam memaksimalkan kinerja pihak Dinas Sosial dalam proses

seleksi khususnya dalam hal menentukan calon penerima program bantuan yang

akan diterima secara lebih obyektif dan sesuai dengan yang diharapkan.

Adapun penelitian lain dari (Sugianto, 2017) dengan judul “Penerapan Teknik

Data Mining Untuk Menentukan Hasil Seleksi Masuk Sman 1 Gibeber Untuk

Siswa Baru Menggunakan Decision Tree” dengan tujuan melakukan penentuan

prediksi tingkat akurasi siswa baru di SMA Negeri 1 Cibeber yang diterima

dilakukan dengan menggunakan Algoritma C4.5 mencapai tingkat akurasi yang

cukup tinggi yaitu mencapai sebesar 99.05%. Hal ini menunjukan tingkat akurasi

yang cukup tinggi dari data penyeleksian nilai yang disajikan dalam

pengelompokan mata pelajaran pelajaran dalam Ujian Nasional, sehingga dapat

dikatakan proses seleksi siswa baru menggunakan metode ini merupakan metode

yang tepat untuk digunakan dalam metode komputasi untuk seleksi masuk siswa

ke SMA Negeri 1 Cibeber.

Penelitian sejenis pernah juga dilakukan oleh (Muzakir & Wulandari, 2016)

dengan judul “Model Data Mining sebagai Prediksi Penyakit Hipertensi

Kehamilan dengan Teknik Decision Tree” dapat melakukan prediksi penyakit

hipertensi dalam kehamilan. Pada penelitian ini dilakukan evaluasi dengan

supplied test set menggunakan WEKA dihasilkan kesalahan (error) 7.3427% dan

Page 35: IMPLEMENTASI ALGORITMA DECISION TREE UNTUK PREDIKSI

23

Jurusan Teknik Informatika dan Komputer – Politeknik Negeri Jakarta

tingkat akurasi 92.6573%. Data training yang berjumlah 286 instances, hal ini

menunjukkan bahwa terdapat 265 instances yang akurat dan 21 instances yang

error atau prediksinya salah

Page 36: IMPLEMENTASI ALGORITMA DECISION TREE UNTUK PREDIKSI

24

BAB III

PERENCANAAN DAN REALISASI

3.1 Perancangan Program Aplikasi

3.1.1 Deskripsi Program Aplikasi

Aplikasi prediksi kelulusan mahasiswa tepat waktu adalah aplikasi yang berfungsi

untuk melakukan memprediksi ketepatan waktu kelulusan mahasiswa pada

Jurusan Teknik Informatika dan Komputer Politeknik Negeri Jakarta agar

mahasiswa yang terprediksi tidak lulus tepat waktu dapat diketahui bagi

stakeholder Jurusan Teknik Informatika dan Komputer Politeknik Negeri Jakarta.

Data yang digunakan merupakan data nilai matakuliah wajib mahasiswa tingkat 1

(semester 1 dan 2), IP dan IPK. Prediksi yang dilakukan menggunakan algoritma

decision tree.

3.1.2 Requirement Analysis

Pada tahapan ini dilakukan analisa kebutuhan fungsional dan juga non fungsional

dari sistem yang dibuat. Tahapan ini adalah tahapan pertama dari metode

pengembangan waterfall. Adapun analisa kebutuhannya adalah sebagai berikut:

Analisa Kebutuhan Fungsional dan Non Fungsional

a. Analisa Kebutuhan Fungsional

- Sistem dapat melakukan input data

- Sistem dapat melihat hasil prediksi ketepatan waktu kelulusan mahasiswa

b. Analisa Kebutuhan Non Fungsional

- Sistem ini yaitu menggunakan bahasa pemrograman PHP dan framework

Laravel untuk membuat interface web.

- Sistem ini menggunakan bahasa Python dan juga libraries Python.

Page 37: IMPLEMENTASI ALGORITMA DECISION TREE UNTUK PREDIKSI

25

Jurusan Teknik Informatika dan Komputer – Politeknik Negeri Jakarta

3.1.3 Desain Sistem

Pada tahap desain sistem, dilakukan perancangan diagram kerja dari sistem yang

dibuat serta rancangan antar muka dari sistem. Kedua rancangan ini kemudian

akan digunakan pada saat implementasi atau pengembangan sistem. Tahapan ini

adalah tahapan kedua dari metode pengembangan waterfall.

a. Flowchart Diagram

Gambar 3. 1 Diagram Flowchart Sistem

Gambar 3.1 Merupakan alur dari sistem yang dibuat, adapun alurnya adalah

pertama tama, user melakukan input data nilai mahasiswa. Kemudian, setelah data

nilai telah terisi lengkap, user dapat menekan tombol submit. Maka akan keluar

ouput ketepatan waktu kelulusan dari mahasiswa terkait

b. Use Case Diagram

Page 38: IMPLEMENTASI ALGORITMA DECISION TREE UNTUK PREDIKSI

26

Jurusan Teknik Informatika dan Komputer – Politeknik Negeri Jakarta

Gambar 3. 2 Diagram use case sistem

Gambar 3.2 merupakan desain use case dari sistem. Pada sistem, user dapat

melakukan pengisian data nilai mahasiswa pada form yang terdapat dalam sistem,

user juga dapat melakukan submit data nilai tersebut serta melihat hasil dari

prediksi ketepatan waktu kelulusan mahasiswa.

c. Activity Diagram

Page 39: IMPLEMENTASI ALGORITMA DECISION TREE UNTUK PREDIKSI

27

Jurusan Teknik Informatika dan Komputer – Politeknik Negeri Jakarta

Gambar 3. 3 Diagram activity sistem

Gambar 3.3 merupakan diagram activity dari sistem. Pada sistem, pertama tama

user mengisi data nilai mahasiswa pada form yang terdapat dalam sistem lalu

mengklik tombol submit. Setelah itu sistem akan melakukan prediksi ketepatan

waktu kelulusan mahasiswa dengan mengeksekusi file python. Hasil dari prediksi

tersebut akan ditampilkan kepada user berupa keterangan TEPAT WAKTU atau

TIDAK TEPAT WAKTU.

d. Rancangan Antar Muka

Berdasarkan analisa kebutuhan pada sub-bab sebelumnya, maka tahap selanjutnya

adalah melakukan mockup antar muka dari sistem yang akan

dirancang. Hal ini bertujuan agar user dapat melihat gambaran sistem yang akan

dibangun. Berikut adalah rancangan antar muka dari sistem yang dibuat :

Page 40: IMPLEMENTASI ALGORITMA DECISION TREE UNTUK PREDIKSI

28

Jurusan Teknik Informatika dan Komputer – Politeknik Negeri Jakarta

Gambar 3. 4 Tampilan Data Mahasiswa

Gambar 3. 5 Tampilan Hasil Tepat Waktu

Page 41: IMPLEMENTASI ALGORITMA DECISION TREE UNTUK PREDIKSI

29

Jurusan Teknik Informatika dan Komputer – Politeknik Negeri Jakarta

Gambar 3. 6 Tampilan Hasil Tidak Tepat Waktu

3.1.4 Implementasi Sistem

Pada tahapan implementasi sistem, dilakukan pengembangan dengan penulisan

baris kode untuk bagian front end dan back end dari sistem. Tahapan ini adalah

tahapan ketiga dari metode pengembangan waterfall.

a. Implementasi Program Aplikasi

Tahap ini dilakukan implementasi sistem dengan penulisan baris kode untuk

pembuatan halaman website serta model decision tree yang ada didalamnya.

Adapun hasil implementasi website adalah sebagai gambar berikut :

Gambar 3. 7 Halaman input data nilai mahasiswa

Page 42: IMPLEMENTASI ALGORITMA DECISION TREE UNTUK PREDIKSI

30

Jurusan Teknik Informatika dan Komputer – Politeknik Negeri Jakarta

Gambar 3. 8 Halaman yang tampil jika hasil prediksi adalah tepat waktu

Gambar 3. 9 Halaman yang tampil jika hasil prediksi tidak tepat waktu

b. Algoritma Decision Tree untuk Prediksi Ketepatan Waktu Kelulusan

Mahasiswa

1. Business Understanding

Proses prediksi ketepatan waktu kelulusan mahasiswa dimulai dari business

understanding yaitu memahami masalah yang harus diselesaikan. Masalah

tersebut adalah bagaimana cara melakukan prediksi ketepatan waktu kelulusan

Page 43: IMPLEMENTASI ALGORITMA DECISION TREE UNTUK PREDIKSI

31

Jurusan Teknik Informatika dan Komputer – Politeknik Negeri Jakarta

mahasiswa pada data evaluasi semester mahasiswa untuk dapat melakukan

prediksi ketepatan waktu kelulusan mahasiswadi masa yang akan datang secara

otomatis.

2. Data Understanding

Tahap ini melakukan eksplorasi data untuk memahami kekuatan dan keterbatasan

data karena jarang ada kecocokan yang tepat dengan masalah. Data mentah yang

selanjutnya akan dipersiapkan dan digunakan adalah data nilai matakuliah dasar

mahasiswa tingkat 1, IP dan IPK. Nama dan deskripsi masing-masing nilai

mahasiswa dapat dilihat pada tabel berikut:

Tabel 3. 1 Tabel Data Nilai Matakuliah Mahasiswa

No Nama Deskripsi

1. NO Index baris dari data

2. NIM NIM mahasiswa

3. NAMA Nama mahasiswa

4. Pendidikan Kewarganegaraan Nilai Pendidikan

Kewarganegaraan

5. Pendidikan Agama dalam TIK Nilai Pendidikan Agama

dalam TIK

6. Kepemimpinan dan Pengembangan

Karakter

Nilai Kepemimpinan dan

Pengembangan Karakter

7. Bahasa Indonesia untuk TI Nilai Bahasa Indonesia

untuk TI

8. Matematika Diskrit Nilai Matematika Diskrit

9. Pengantar Multimedia Nilai Pengantar Multimedia

10. Algoritma dan Pemrograman Nilai Algoritma dan

Pemrograman

Page 44: IMPLEMENTASI ALGORITMA DECISION TREE UNTUK PREDIKSI

32

Jurusan Teknik Informatika dan Komputer – Politeknik Negeri Jakarta

11. Rekayasa Perangkat Lunak Nilai Rekayasa Perangkat

Lunak

12. Jaringan Komputer dan Komunikasi Nilai Jaringan Komputer

dan Komunikasi

13. Aljabar Linier Nilai Aljabar Linier

14. Struktur Data Nilai Struktur Data

15. Sistem Basis Data Nilai Sistem Basis Data

16. Data Mining Nilai Data Mining

17. Sistem Terdistribusi Nilai Sistem Terdistribusi

18. Pemrograman Bergerak Nilai Pemrograman

Bergerak

19. Pengolahan Citra Digital Nilai Pengolahan Citra

Digital

20. Bahasa Inggris Nilai Bahasa Inggris

21. Sistem Operasi Nilai Sistem Operasi

22. Pemrograman Berorientasi Objek Nilai Pemrograman

Berorientasi Objek

23. Pemrograman Web Nilai Pemrograman Web

24. Hukum dan Etika dalam Teknologi

Informasi dan Komunikasi

Nilai Hukum dan Etika

dalam Teknologi Informasi

dan Komunikasi

25. Struktur Data Nilai Struktur Data

26. Sistem Informasi Manajemen Nilai Sistem Informasi

Manajemen

27. Keamanan Komputer dan Pemulihan

Bencana

Nilai Keamanan Komputer

dan Pemulihan Bencana

28. Pemrograman Visual Nilai Pemrograman Visual

29. Metode Numerik Nilai Metode Numerik

30. Grafika Komputer Nilai Grafika Komputer

31. Kecerdasan Buatan Nilai Kecerdasan Buatan

32. Perancangan Antarmuka Nilai Perancangan

Page 45: IMPLEMENTASI ALGORITMA DECISION TREE UNTUK PREDIKSI

33

Jurusan Teknik Informatika dan Komputer – Politeknik Negeri Jakarta

Antarmuka

33. Data Warehouse Nilai Data Warehouse

34. Sistem Pendukung Keputusan Nilai Sistem Pendukung

Keputusan

35. Metodologi Penelitian Nilai Metodologi Penelitian

36. Probabilitas dan Statistik Nilai Probabilitas dan

Statistik

37. Pembelajaran Mesin Nilai Pembelajaran Mesin

38. Penjaminan Kualitas Perangkat Lunak

(SQA)

Nilai Penjaminan Kualitas

Perangkat Lunak (SQA)

39. Manajemen Proyek TIK Nilai Manajemen Proyek

TIK

40. IP_smt1 Nilai IP_smt1

41. IP_smt2 Nilai IP_smt2

42. IP_smt3 Nilai IP_smt3

43. IP_smt4 Nilai IP_smt4

44. IP_smt5 Nilai IP_smt5

45. IP_smt6 Nilai IP_smt6

46. IP_s8 Nilai IP_s8

47. IPK Nilai IPK

48. TARGET Status Kelulusan Mahasiswa

3. Data Preparation

Data preparation merupakan tahap menyiapkan data agar dapat digunakan untuk

dipelajari oleh model pada tahap Modeling. Tahap ini penting untuk menyiapkan

data mentah sebelum dilakukan fitting data kepada model sehingga data layak

untuk digunakan. Proses membersihkan data dapat berupa pemilihan terhadap

fitur yang sekiranya akan digunakan dan mengatasi missing value, one hot

encoding dan standard scaling.

Tahap yang pertama dilakukan adalah melakukan pemilihan fitur dan data yang

sekiranya cocok untuk digunakan pada model. Pemilihan fitur dan data ini

Page 46: IMPLEMENTASI ALGORITMA DECISION TREE UNTUK PREDIKSI

34

Jurusan Teknik Informatika dan Komputer – Politeknik Negeri Jakarta

dilakukan secara manual terhadap data mentah yang dimiliki yang berupa file

excel. Adapun hasil fitur yang terpilih dari data mentah tersebut adalah sebagai

berikut :

Tabel 3. 2 Tabel Fitur Terpilih

No Nama Deskripsi

1. NO Index baris dari data

2. NIM NIM mahasiswa

3. NAMA Nama mahasiswa

4. Matematika Diskrit Nilai Matematika Diskrit

5. Pengantar Multimedia Nilai Pengantar Multimedia

6. Algoritma dan Pemrograman Nilai Algoritma dan

Pemrograman

7. Rekayasa Perangkat Lunak Nilai Rekayasa Perangkat

Lunak

8. Jaringan Komputer dan Komunikasi Nilai Jaringan Komputer

dan Komunikasi

9. Aljabar Linier Nilai Aljabar Linier

10. Struktur Data Nilai Struktur Data

11. Sistem Basis Data Nilai Sistem Basis Data

12. IP_smt1 Nilai IP_smt1

13. IP_smt2 Nilai IP_smt2

14. IP_smt3 Nilai IP_smt3

15. IP_smt4 Nilai IP_smt4

16. IP_smt5 Nilai IP_smt5

17. IP_smt6 Nilai IP_smt6

18. IP_s8 Nilai IP_s8

19. IPK Nilai IPK

20. TARGET Status Kelulusan Mahasiswa

Page 47: IMPLEMENTASI ALGORITMA DECISION TREE UNTUK PREDIKSI

35

Jurusan Teknik Informatika dan Komputer – Politeknik Negeri Jakarta

Setelah menentukan fitur yang terpilih dari data mentah, selanjutnya akan

dilakukan pemeriksaan data terlebih dahulu untuk melihat kualitas data secara

keseluruhan.

Gambar 3. 10 Informasi tipe data dan keutuhan data

Gambar 3.10 menunjukkan bahwa terdapat 82 baris pada data nilai akademik

mahasiswa yang akan diolah menjadi model. Tidak ada data yang kosong atau

null. Disini juga dapat dilihat bahwa seluruh tipe data sudah sesuai dengan yang

diinginkan kecuali kolom NIM yang seharusnya bertipe object.

Page 48: IMPLEMENTASI ALGORITMA DECISION TREE UNTUK PREDIKSI

36

Jurusan Teknik Informatika dan Komputer – Politeknik Negeri Jakarta

Gambar 3. 11Baris kode data preparation

Gambar 3.11 adalah baris kode preparasi data yang dimana bertujuan untuk

mempersiapkan data testing terlebih dahulu. Dilakukan replace value apabila

value mengandung nilai null atau empt maka akan diganti dengan value „kosong‟

bertipe string. Kemudian pada dibuat dataframe untuk data testing tersebut.

Setelah itu, dilakukan replace data yang memiliki value „kosong‟ dengan value

np.NaN. Setelah itu data testing yang merupakan input dari user akan

ditambahkan kedalam data training dengan tujuan untuk menyiapkan data testing

apabila pada fitur data testing terdapat nilai dengan value NaN.

Page 49: IMPLEMENTASI ALGORITMA DECISION TREE UNTUK PREDIKSI

37

Jurusan Teknik Informatika dan Komputer – Politeknik Negeri Jakarta

Gambar 3. 12 Baris kode data preparation

Gambar 3.12 merupakan proses persiapan data yang dilakukan untuk mengisi data

yang kosong dengan teknik imputasi. Adapun fitur yang memiliki tipe data

numerik, yakni fitur IP_smt1, IP_smt2, IP_smt3, IP_smt4, IP_smt5, IP_smt6,

IP_smt7, IP_s8, dan IPK, fitur tersebut apabila terdapat value null akan dilakukan

imputasi dengan nilai median. Sedangkan fitur fitur bertipe data kategorikal, yakni

fitur Pendidikan Kewarganegaraan, Pendidikan Agama dalam TIK ,

Kepemimpinan dan Pengembangan Karakter, Bahasa Indonesia untuk TI ,

Matematika Diskrit , Pengantar Multimedia, Algoritma dan Pemrograman,

Rekayasa Perangkat Lunak, Jaringan Komputer dan Komunikasi, Aljabar Linier,

Struktur Data, Sistem Basis Data maka apabila terdapat value null akan dilakukan

imputasi dengan nilai modus.

Page 50: IMPLEMENTASI ALGORITMA DECISION TREE UNTUK PREDIKSI

38

Jurusan Teknik Informatika dan Komputer – Politeknik Negeri Jakarta

Gambar 3. 13 Baris kode data preparation

Gambar 3.13, Setelah melakukan imputasi data, hal yang dilakukan adalah

menyiapkan pipeline untuk melakukan standard scaling atau standarisasi

terhadap tipe data numerik. Teknik standarisasi akan mengubah data sehingga

memiliki distribusi nilai mean sama dengan 0 dan standar deviasi sama dengan 1.

Selain itu juga menyiapkan pipeline untuk mengkonversi fitur bertipe kategorikal

menjadi bernilai numerik, hal ini dapat dilakukan dengan teknik yang digunakan

adalah One hot encoding yaitu mengkonversi nilai menjadi kolom baru pada data

dan memberikan nilai 1 pada kolom baru tersebut jika nilai pada data sesuai

dengan nama kolom yang baru. Kedua pipeline tersebut akan dienkapsulasi

dengan column transformer yang nantinya akan digunakan pada tahap modeling.

Gambar 3. 14 Baris kode data preparation

Gambar 3.14 merupakan baris kode untuk seleksi fitur yang digunakan pada

model, adapun fitur fitur tersebut adalah data nilai matakuliah dan IP semester 1 ,

semester 2 dan IPK. Adapun beberapa atribut yang di drop adalah atribut NAMA,

NIM, NO., IP_smt3, IP_smt4, IP_smt5, IP_smt6, IP_smt7, IP_s8, Pendidikan

Kewarganegaraan, Pendidikan Agama dalam TIK, Kepemimpinan dan

Pengembangan Karakter, Bahasa Indonesia untuk TI Sehingga yang tersisa

adalah 11 atribut/fitur yang akan digunakan untuk membangun model. Yang

diantaranya adalah Matematika Diskrit, Pengantar Multimedia, Algoritma dan

Page 51: IMPLEMENTASI ALGORITMA DECISION TREE UNTUK PREDIKSI

39

Jurusan Teknik Informatika dan Komputer – Politeknik Negeri Jakarta

Pemrograman, Rekayasa Perangkat Lunak, Jaringan Komputer dan Komunikasi,

Aljabar Linier, Struktur Data, Sistem Basis Data, IP_smt1, IP_smt2, dan IPK.

Selain itu juga dilakukan pemilihan data training dan data testing, adapun data

training diambil dari baris 1 hingga 82 sedangkan data testing adalah data baris ke

83 yang dimana data testing merupakan 1 baris data yang sebelumnya adalah data

input dari mahasiswa.

4. Modeling

Tahap Modeling ini bertujuan untuk melatih model algoritma menggunakan data

training nilai akademik mahasiswa untuk melakukan prediksi ketepatan kelulusan

mahasiswa. Algoritma yang digunakan pada tahap Modeling ini adalah decision

tree dan data yang digunakan berjumlah 82 baris dan fitur yang digunakan

berjumlah 15.

Gambar 3. 15 Baris kode model decision tree

Gambar 3.15, merupakan model decision tree berikut preprocessing yang di

bentuk dalam sebuah satu pipeline. Parameter criterion entropy digunakan sebagai

pembobotan fitur serta dilakukan fitting data training kepada model

Adapun nilai nilai entropy dan information gain untuk seluruh fitur adalah sebagai

berikut :

Tabel 3. 3 Tabel Fitur dan Information Gain

Nama Fitur Value

Fitur

Nilai Entropy

Page 52: IMPLEMENTASI ALGORITMA DECISION TREE UNTUK PREDIKSI

40

Jurusan Teknik Informatika dan Komputer – Politeknik Negeri Jakarta

Jumlah IPK

(Information Gain =

0.456)

<= 3.11 0.535

> 3.11 0.535

Jumlah IP smt 1

(Information Gain = 0.011)

<= 3.215 0.989

> 3.215 0.989

Jumlah IP smt 2

(Information Gain = 0.1)

<= 3.15 0.901

> 3.15 0.901

Matematika Diskrit

(Information Gain = 0.298)

A 0.887

A- 1

B 0.811

B+ 0.764

B- 0.592

C 0.811

C+ 0.946

D 0

E 0

Pengantar Multimedia

(Information Gain = 0.187)

A 0.985

A- 0.787

B 0.918

B+ 0.811

B- 0.918

C 1

C+ 0

D 1

E 0.414

Algoritma dan

Pemrograman

(Information Gain = 0.271)

A 0.971

A- 0.971

B 1

B+ 0.439

B- 0

C 0.946

Page 53: IMPLEMENTASI ALGORITMA DECISION TREE UNTUK PREDIKSI

41

Jurusan Teknik Informatika dan Komputer – Politeknik Negeri Jakarta

C+ 0.918

D 0

E 0

Rekayasa Perangkat Lunak

(Information Gain = 0.326)

A 0.9

A- 0.469

B 0.896

B+ 0.650

B- 0.918

C 0.918

C+ 0.650

D 0

E 0

Jaringan Komputer dan

Komunikasi

(Information Gain = 0.310)

A 0.811

A- 0.863

B 0

B+ 0.792

B- 0.918

C 0.954

C+ 0

D 0.722

E 0

Aljabar Linier

(Information Gain = 0.316)

A 0.863

A- 0.896

B 0.503

B+ 0.811

B- 0.650

C 0.985

C+ 0.811

D 0.592

E 0

Struktur Data A 1

Page 54: IMPLEMENTASI ALGORITMA DECISION TREE UNTUK PREDIKSI

42

Jurusan Teknik Informatika dan Komputer – Politeknik Negeri Jakarta

(Information Gain = 0.322) A- 0.959

B 0.650

B+ 0.811

B- 0.650

C 0

C+ 1

D 0

E 0

Basis Data

(Information Gain = 0.237)

A 0.918

A- 1

B 0.985

B+ 1

B- 0.439

C 0.811

C+ 0.918

D 0.918

E 0

Pada Tabel 3.3 dapat dilihat bahwa fitur degan information gain terbesar

merupakan fitur IPK. Adapun fitting yang dilakukan dengan pembagian data

training dan data testing dengan perbandingan 60 : 40 dengan data berjumlah

49:34 menghasilkan tree seperti berikut yang dimana root adalah IPK yang sesuai

dengan fitur dengan nilai information gain terbesar:

Gambar 3. 16 Model tree yang dihasilkan

Page 55: IMPLEMENTASI ALGORITMA DECISION TREE UNTUK PREDIKSI

43

Jurusan Teknik Informatika dan Komputer – Politeknik Negeri Jakarta

5. Evaluation

Tahap ini dilakukan evaluasi model yang telah dibangun, adapun parameter yang

akan digunakan adalah accuracy, precision, recall, f1 score dan auc score,

adapun baris kodenya adalah sebagai berikut:

Gambar 3. 17 Baris kode pengujian accuracy, precision, recall, f1score untuk setiap pembagian

rasio data

Page 56: IMPLEMENTASI ALGORITMA DECISION TREE UNTUK PREDIKSI

44

Jurusan Teknik Informatika dan Komputer – Politeknik Negeri Jakarta

Gambar 3. 18 Hasil pengujian untuk setiap pembagian rasio data

Pada Gambar 3.18 dapat disimpulkan bahwa split terbaik ada pada split 60:40

yang menghasilkan nilai akurasi sebesar 0.85 (85%), nilai precision 0.84(84%),

nilai recall 0.89(89%), nilai f1 score 0.86(86%), serta nilai auc score 0.85(85%).

6. Deployment

Tahap deployment merupakan penerapan model terhadap business understanding

yang ada. Model telah di evaluasi terlebih dahulu dengan beberapa parameter

evaluasi dan telah menghasilkan nilai yang baik yakni dengan nilai akurasi

sebesar 0.85 (85%), nilai precision 0.84(84%), nilai recall 0.89(89%), nilai f1

score 0.86(86%), serta nilai auc score 0.85(85%). Model ini akan digunakan pada

Page 57: IMPLEMENTASI ALGORITMA DECISION TREE UNTUK PREDIKSI

45

Jurusan Teknik Informatika dan Komputer – Politeknik Negeri Jakarta

sistem yang berupa website untuk dapat melakukan prediksi ketepatan waktu

kelulusan mahasiswa pada data evaluasi semester mahasiswa untuk dapat

melakukan prediksi ketepatan waktu kelulusan mahasiswa di masa yang akan

datang secara otomatis.

Page 58: IMPLEMENTASI ALGORITMA DECISION TREE UNTUK PREDIKSI

46

BAB IV

PEMBAHASAN

4.1 Pengujian

Bagian ini akan menjelaskan mengenai pengujian, mulai dari deskripsi

pengujian, prosedur pengujian, hingga menampilkan data hasil pengujian. Hasil

dari dari pengujian yang telah dilakukan akan dievaluasi pada sub bab berikutnya

4.2 Deskripsi Pengujian

Pengujian merupakan tahapan yang penting dalam proses rancang bangun sistem

sebelum digunakan secara utuh, tahap ini akan dilakukan apabila tahap

sebelumnya telah selesai. Pengujian bertujuan memastikan sistem bekerja dengan

baik, menerima input dengan benar dan memberikan output yang sesuai.

Pengujian yang akan dilakukan dalam penelitian ini adalah melakukan pengujian

terhadap model decision tree yang telah dibangun.

4.4 Data Hasil Pengujian

Tahap ini dilakukan dengan pengujian alpha testing. Alpha testing dilakukan

secara berkali-kali dalam masa pengembangan, pengujian ini dilakukan dengan

teknik black box testing untuk melihat hasil kesesuaian hasil keluaran sistem

dengan yang diharapkan oleh pengguna. Pada pengujian ini digunakan pengujian

dengan metode black box testing pada aplikasi web terkait fitur yang ada.

Keterangan : Simbol √ menunjukkan hasil pengujian sesuai dengan yang

diharapkan sedangkan simbol X menunjukkan hasil pengujian tidak sesuai dengan

yang diharapkan.

Tabel 4. 1 Hasil pengujian sistem

Page 59: IMPLEMENTASI ALGORITMA DECISION TREE UNTUK PREDIKSI

47

Jurusan Teknik Informatika dan Komputer – Politeknik Negeri Jakarta

No Skenario Pengujian Yang

Diharapkan

Pengamatan Hasil

1. Tidak mengisi text box

nilai IP semester 1 dan 2

Menampikan

alert jika textbox

kosong

Menampikan alert jika

textbox kosong

2. Tidak mengisi text box

nilai IP selain semester 1

dan 2

Tidak

menampikan

alert jika textbox

kosong

Tidak menampikan

alert jika textbox

kosong

3. Mengisi text box nilai IP

tidak dengan angka

Menampikan

alert jika textbox

berisi tidak

dengan angka

Menampikan alert jika

textbox berisi tidak

dengan angka

4. Mengisi text box nilai IP

dengan angka lebih dari 4

dan kurang dari 0.1

Menampikan

alert jika textbox

berisi angka

lebih dari 4 dan

kurang dari 0.1

Menampikan alert jika

textbox berisi angka

lebih dari 4 dan

kurang dari 0.1

5. Tidakmemilih nilai pada

combo box nilai

matakuliah

Tidak

memunculkan

alert saat tidak

memilih nilai

pada combo box

nilai matakuliah

Tidak memunculkan

alert saat tidak

memilih nilai pada

combo box nilai

matakuliah

6. Menekan tombol submit Menampilkan

hasil prediksi

ketika menekan

tombol submit

Menampilkan hasil

prediksi ketika

menekan tombol

submit

7. Hasil prediksi yang

dihasilkan TIDAK

TEPAT WAKTU

Menampilkan

halaman dengan

tulisan TIDAK

TEPAT

Menampilkan halaman

dengan tulisan TIDAK

TEPAT WAKTU

Page 60: IMPLEMENTASI ALGORITMA DECISION TREE UNTUK PREDIKSI

48

Jurusan Teknik Informatika dan Komputer – Politeknik Negeri Jakarta

WAKTU

8. Hasil prediksi yang

dihasilkan TEPAT

WAKTU

Menampilkan

halaman dengan

tulisan TEPAT

WAKTU

Menampilkan halaman

dengan tulisan TEPAT

WAKTU

9. Menekan tombol

KEMBALI pada halaman

TEPAT WAKTU

Redirect ke

halaman index

Redirect ke halaman

index

10. Menekan tombol

KEMBALI pada halaman

TIDAK TEPAT

WAKTU

Redirect ke

halaman index

Redirect ke halaman

index

4.5 Analisis Pengujian

Pengujian model decision tree dilakukan dengan cara menggunakan data training

untuk melatih model memprediksi target class pada data testing. Selanjutnya,

hasil dari evaluasi model akan diukur akurasinya dengan menggunakan 6

parameter evaluasi. Pada tahap ini dilakukan pengujan data dengan pembagian

sebagai berikut:

Tabel 4. 2Tabel rasio pembagian data training dan testing

Data

training

Data

testing

Accuracy Precision Recall F1Score AUCScore

90 10 0.78 0.83 0.83 0.83 0.75

80 20 0.82 0.86 0.75 0.80 0.82

70 30 0.72 0.79 0.73 0.76 0.71

60 40 0.85 0.84 0.89 0.86 0.85

Pengujian model decision tree yang telah dilakukan menggunakan data

training dan data testing menghasilkan akurasi yang berbeda beda. Dari hasil

Page 61: IMPLEMENTASI ALGORITMA DECISION TREE UNTUK PREDIKSI

49

Jurusan Teknik Informatika dan Komputer – Politeknik Negeri Jakarta

evaluasi di Tabel 4.2, diambil pembagian data dengan rasio 60:40 untuk

kesimpulan hasil analisis dengan jumlah data training dan testing yang digunakan

masing-masing berjumlah 49 baris data training dan 34 baris data testing

menghasilkan nilai akurasi sebesar 0.85 (85%), nilai precision 0.84(84%), nilai

recall 0.89(89%), nilai f1 score 0.86(86%), serta nilai auc score 0.85(85%).

Page 62: IMPLEMENTASI ALGORITMA DECISION TREE UNTUK PREDIKSI

50

BAB V

KESIMPULAN

5.1 Kesimpulan

Sistem prediksi kelulusan mahasiswa tepat waktu berhasil dibuat dengan

menerapkan algoritma decision tree untuk melakukan prediksi kelulusan

mahasiswa tepat waktu. Adapun kesimpulan yang dapat diambil setelah

pembuatan sistem ini yaitu tujuan penelitian telah tercapai. Ketepatan waktu

kelulusan mahasiswa berhasil diprediksi menggunakan model decision tree dan

juga sistem prediksi kelulusan mahasiswa tepat waktu berhasil dibuat. Data total

data yang digunakan berjumlah 82 data nilai akademik mahasiswa. Hasil

pengujian model decision tree menggunakan 60%(49) data training dan 40%(34)

data testing dari 82 data nilai akademik mahasiswa berupa nilai akurasi sebesar

0.85 (85%), nilai precision 0.84(84%), nilai recall 0.89(89%), nilai f1 score

0.86(86%), serta nilai auc score 0.85(85%). Berdasarkan hasil evaluasi tersebut

dapat dikatakan bahwa model bekerja dengan baik, serta fitur yang digunakan

memengaruhi faktor kelulusan mahasiswa dengan cukup besar.

Selain itu, manfaat yang bisa didapatkan dari penelitian ini adalah proses prediksi

ketepatan waktu kelulusan mahasiswa dapat dilakukan dalam waktu yang lebih

singkat daripada sebelumnya di mana proses dilakukan secara manual. Namun,

dengan adanya sistem prediksi ini, proses prediksi ketepatan waktu kelulusan

mahasiswa dikerjakan dalam hitungan menit saja.

5.2 Saran

Saran penulis untuk pengembangan sistem prediksi ketepatan waktu kelulusan

mahasiswa ke depannya adalah untuk menambah data nilai akademik mahasiswa

serta fitur lain yang mungkin berupa data non akademik yang sekiranya

berpengaruh terhadap kelulusan mahasiswa untuk meningkatkan kualitas model.

Page 63: IMPLEMENTASI ALGORITMA DECISION TREE UNTUK PREDIKSI

51

DAFTAR PUSTAKA

Alvi Pranandha Syah, Adiwijaya, S. A. F. (2017). Analisis Sentimen Pada Data

Ulasan Produk Toko Online Dengan Metode Maximum Entropy. E-

Proceeding of Engineering, 4(3), 4632–4640.

Bode, A. (2017). K-Nearest Neighbor Dengan Feature Selection Menggunakan

Backward Elimination Untuk Prediksi Harga Komoditi Kopi Arabika.

ILKOM Jurnal Ilmiah, 9(2), 188–195.

https://doi.org/10.33096/ilkom.v9i2.139.188-195

Feblian, D., & Daihani, D. U. (2017). Implementasi Model Crisp-Dm Untuk

Menentukan Sales Pipeline Pada Pt X. Jurnal Teknik Industri, 6(1), 1–12.

https://doi.org/10.25105/jti.v6i1.1526

Fiska, R. R. (2017). Penerapan Teknik Data Mining dengan Metode Support

Vector Machine. Sains Dan Teknologi Informasi (SATIN), 3(1).

Ke, G., Meng, Q., Finley, T., Wang, T., Chen, W., Ma, W., Ye, Q., & Liu, T. Y.

(2017). LightGBM: A highly efficient gradient boosting decision tree.

Advances in Neural Information Processing Systems, 2017-Decem(Nips),

3147–3155.

Luthfi, F. (2017). Penggunaan Framework Laravel Dalam Rancang Bangun

Modul Back-End Artikel Website Bisnisbisnis.ID. JISKA (Jurnal

Informatika Sunan Kalijaga), 2(1), 34.

https://doi.org/10.14421/jiska.2017.21-05

Maulani, J., Informasi, F. T., Islam, U., Muhammad, K., Al, A., & Banjarmasin,

B. (2020). Penerapan Metode Waterfall Pada Pengembangan Aplikasi.

Page 64: IMPLEMENTASI ALGORITMA DECISION TREE UNTUK PREDIKSI

52

Jurusan Teknik Informatika dan Komputer – Politeknik Negeri Jakarta

Technologia, 11(2), 64–70.

Maulida, I., Suyatno, A., Rahmania Hatta, H., & Mulawarman, U. (2016). Seleksi

Fitur Pada Dokumen Abstrak Teks Bahasa Indonesia Menggunakan Metode

Information Gain. JSM STMIK Mikroskil, 17(2), 249–258.

Muzakir, A., & Wulandari, R. A. (2016). Model Data Mining sebagai Prediksi

Penyakit Hipertensi Kehamilan dengan Teknik Decision Tree. Scientific

Journal of Informatics, 3(1), 19–26. https://doi.org/10.15294/sji.v3i1.4610

Nurhayati, S., Luthfi, E. T., & Papua, U. Y. (2015). Prediksi Mahasiswa

Menggunakan Metode Support Vector. Prediksi Menggunakan SVM, 3(6),

82–93.

Prasetya, C. S. D. (2017). Sistem Rekomendasi Pada E-Commerce Menggunakan

K-Nearest Neighbor. Jurnal Teknologi Informasi Dan Ilmu Komputer, 4(3),

194. https://doi.org/10.25126/jtiik.201743392

Sebastian, B., Budhi, G. S., & Adipranata, R. (2015). Penggunaan Decision Tree

Dengan ID3 Algorithm Untuk Mengenali Dokumen Beraksara Jawa. Jurnal

Infra, 3, 142.

Sugianto, C. A. (2017). Penerapan Teknik Data Mining Untuk Menentukan Hasil

Seleksi Masuk Sman 1 Gibeber Untuk Siswa Baru Menggunakan Decision

Tree. 39–43. https://doi.org/10.31227/osf.io/vedu7

Susanti, Martha, S., & Sulistianingsih, E. (2018). K-Nearest Neighbor Dalam

Imputasi Missing Data. Buletin Ilmiah Math. Stat. Dan Terapannya

(Bimaster), 07(1), 9–14.

Susilo, M. (2018). Rancang Bangun Website Toko Online Menggunakan Metode

Page 65: IMPLEMENTASI ALGORITMA DECISION TREE UNTUK PREDIKSI

53

Jurusan Teknik Informatika dan Komputer – Politeknik Negeri Jakarta

Waterfall. InfoTekJar (Jurnal Nasional Informatika Dan Teknologi

Jaringan), 2(2), 98–105. https://doi.org/10.30743/infotekjar.v2i2.171

Syamsu, S., Muhajirin, M., & Wijaya, N. S. (2019). Rules Generation Untuk

Klasifikasi Data Bakat dan Minat Berdasarkan Rumpun Ilmu Dengan

Decision Tree. Inspiration: Jurnal Teknologi Informasi Dan Komunikasi,

9(1), 40. https://doi.org/10.35585/inspir.v9i1.2495

Syarli, S., & Muin, A. (2016). Metode Naive Bayes Untuk Prediksi Kelulusan

(Studi Kasus: Data Mahasiswa Baru Perguruan Tinggi). Jurnal Ilmiah Ilmu

Komputer, 2(1), 22–26.

Utami, L. D. (2015). Integrasi Metode Information Gain untuk Seleksi Fitur dan

AdaBoost untuk Mengurangi Bias pada Analisis Sentimen Review Restoran

Menggunakan Algoritma Naive Bayes. Journal of Intelligent Systems, 1(2),

120–126.

Widiyati, D. K., Wati, M., & Pakpahan, H. S. (2018). Penerapan Algoritma ID3

Decision Tree Pada Penentuan Penerima Program Bantuan Pemerintah

Daerah di Kabupaten Kutai Kartanegara. Jurnal Rekayasa Teknologi

Informasi (JURTI), 2(2), 125. https://doi.org/10.30872/jurti.v2i2.1864

Yessy Nabella, F., Arum Sari, Y., & Cahya Wihandika, R. (2019). Seleksi Fitur

Information Gain Pada Klasifikasi Citra Makanan Menggunakan Hue

Saturation Value dan Gray Level Co-Occurrence Matrix. Jurnal

Pengembangan Teknologi Informasi Dan Ilmu Komputer, 3(2), 1892–1900.

http://j-ptiik.ub.ac.id