model credit scoring untuk proses analisa kelayakan fasilitas kredit...
TRANSCRIPT
MODEL CREDIT SCORING UNTUK PROSES ANALISA
KELAYAKAN FASILITAS KREDIT MOTOR
MENGGUNAKAN METODE CLASSIFICATION AND
REGRESSION TREE (CART)
(Studi Kasus PT. X Finance Cabang Mauk Desember 2010)
Dendy Saputro
PROGRAM STUDI MATEMATIKA
FAKULTAS SAINS DAN TEKNOLOGI
UNIVERSITAS ISLAM NEGERI
SYARIF HIDAYATULLAH
JAKARTA
2011/1432 H
ii
PENGESAHAN UJIAN
Skripsi berjudul “ MODEL CREDIT SCORING UNTUK PROSES
ANALISA KELAYAKAN FASILITAS KREDIT MOTOR
MENGGUNAKAN METODE CLASSIFICATION AND REGRESSION
TREE (CART) ” dengan studi kasus di PT X Finance cabang Mauk pada
Desember 2010 yang ditulis oleh Dendy Saputro, NIM 107094002797 telah di
uji dan dinyatakankan lulus dalam sidang Munaqosyah Fakultas Sains dan
Teknologi Universitas Islam Negeri Syarif Hidayatullah Jakarta pada tanggal 07
Juni 2011. Skripsi ini telah diterima sebagai salah satu syarat untuk memperoleh
gelar sarjana strata satu (S1) Program Matematika.
Menyetujui :
Penguji 1, Penguji 2,
Gustina Elfiyanti, M.Si. Suma’inna, M.Si.
NIP. 19820820 200901 2 006 NIP. 150 408 699
Pembimbing 1, Pembimbing 2,
Hermawan Setiawan, M.Kom Bambang Ruswandi, M.Stat
NIP. 19740623 199312 2 001 NIDN. 0305108301
Mengetahui :
Dekan Fakultas Sains dan Teknologi, Ketua Program Studi Matematika,
DR. Syopiansyah Jaya Putra, M. Sis Yanne Irene, M. Si
NIP. 19680112 00112 1 001 NIP. 19741231 200501 2 018
ii
iii
PERNYATAAN
DENGAN INI SAYA MENYATAKAN BAHWA SKRIPSI INI BENAR-
BENAR HASIL KARYA SENDIRI YANG BELUM PERNAH DIAJUKAN
SEBAGAI SKRIPSI PADA PERGURUAN TINGGI ATAU LEMBAGA
MANAPUN.
Jakarta, Juni 2011
Dendy Saputro
107094002797
v
ABSTRAK
Pesatnya kemajuan teknologi transportasi merespon produsen dan
distributor kendaraan bermotor bersaing secara ekstra. Pembelian secara kredit
merupakan salah satu solusi yang positif dalam memenuhi permintaan kendaraan
konsumen saat ini. Hal ini pula yang membuat pihak lembaga pembiayaan untuk
melakukan serangkaian analisa kredit terhadap aplikasi permohonan kredit calon
konsumen guna mensiasati besarnya resiko kredit yang akan terjadi.
Model Credit Scoring dengan metode Classification and Regression Tree
(CART) merupakan salah satu mediasi dalam menganalisa kelayakan fasilitas
kredit calon konsumen. Pada penelitian ini, terdapat tujuh variabel uji yang
digunakan dalam penelitian yaitu, variabel approval, uang muka, harga OTR,
bunga pinjaman, tenor pembayaran, kondisi kendaraan, dan jenis kelamin. Hasil
dari penelitian yang telah dilakukan ternyata hanya terdapat empat variabel yang
berpengaruh terhadap keputusan persetujuan pemberian kelayakan fasilitas kredit
yakni variabel uang muka, harga OTR, bunga pinjaman, dan tenor pembayaran
dengan nilai kontribusi masing-masing variabel berturut-turut 100, 24.04, 21.5,
6.69.
Kata Kunci: Analisa Kredit, Credit Scoring, CART, Approval.
vi
ABSTRACT
The advancement of transportation technology responds the vehicle’s
producer and distributor to compete maximally. The purchase of motorcycle on
credit is one positive solution to fulfill the consumer request nowadays. This also
makes the financial institution to conduct a series of credit analysis on the
prospective buyers’loan application to reduce credit risk
Credit scoring model using the Classification and Regression Tree
(CART) method is one of the mediation in analyzing the prospective buyers’
credit facility properness. In this research, there are seven variables used in the
making of credit scoring model: approval variable, down payment, OTR price,
loan interest, tenor payment, vehicle condition, and gender. The research result,
however, only shows four variables that influence on the credit approval decision:
down payment variable, OTR price, loan interest, and tenor payment with the
contribution score of each variable in succession 100, 24.04, 21.5, 6.69.
Key words: Credit Analysis, Credit Scoring, CART, Approval.
vii
KATA PENGANTAR
Segala puji bagi Allah SWT, atas segala nikmat dan rahmat-Nya kepadaku.
Shalawat teriring salam semoga selalu tercurah kepada junjungan kita, Baginda
Nabi Besar Muhammad SAW. Dengan mengucap syukur Alhamdulillah berkat
rahmat dan izin-Nya, akhirnya penulis dapat menyelesaikan skripsi penelitian
yang berjudul “ MODEL CREDIT SCORING UNTUK PROSES ANALISA
KELAYAKAN FASILITAS KREDIT MOTOR MENGGUNAKAN METODE
CLASSIFICATION AND REGRESSION TREE (CART) ” dengan studi kasus di
PT X Finance cabang Mauk pada Desember 2010.
Pada penulisan skripsi ini, penulis mendapat bimbingan dan bantuan dari
berbagai pihak, sehingga dalam kesempatan yang berbahagia ini penulis
menghaturkan ucapan Terima Kasih kepada :
1. Dr. Syopiansyah Jaya Putra, M.Sis, Dekan Fakultas Sains dan Teknologi.
2. Yanne Irene, M.Si. Ketua Program Studi Matematika dan Suma’inna, M.Si,
Sekretaris Program Studi Matematika.
3. Hermawan Setiawan, M.Ti, selaku Pembimbing I.
4. Bambang Ruswandi, M.Stat, selaku Pembimbing II.
5. Seluruh Dosen Program Studi Matematika, terima kasih atas pengajaran dan
ilmu yang telah diberikan kepada penulis.
viii
6. Kedua orang tua, Bapak dan Ibu, mas Wawan, mbak Uthi, Opi, dan tentunya
Keisha, terima kasih atas kasih sayang, dukungan dan semangat tiada henti
yang membuat penulis bertahan hingga sejauh ini.
7. Keluarga besar H. Daniel Asril, terima kasih atas doa dan semua bantuan
yang tidak pernah terputus sampai saaat ini.
8. Cyka, Binu, Cumie, Inoy, Nita, Abang, dan terkhusus Alm. Eja, dan semua
sahabat-sahabat tersayang terima kasih untuk semua dukungan dan sekian
tahun kebersamaan terkhusus keluarga besar Bapak Suherman, Bapak, Mama,
Kaka, dan Bedhot.
9. Atunku Yufriska Citradini terima kasih atas semangat serta kesediaannya
mendengarkan curhatan selama ini dan semua teman-teman Mandiri TSC
Jakarta.
10. Sahabat-sahabat terbaik, Ade, Icha, Widy, Dhila, Febri, Laung, Ubay, Gerdy,
Rahmat, Afif, Angge, Asep, Opank, Cheper, terima kasih untuk dukungannya
selama ini, serta teman-teman Matematika 2007.
11. Kak Dennis, Kak Mahmudi, Selly, Tami dan seluruh keluarga besar
HIMATIKA UIN Jakarta.
Dengan terselesaikannya skripsi ini, penulis berharap dapat memberikan
sedikit kontribusi yang berarti, baik untuk pembaca dan khususnya untuk penulis.
Berkaitan dengan belum sempurnanya penyusunan skripsi ini, maka dari itu kritik
dan saran yang bersifat konstruktif sangat penulis harapkan.
Jakarta, 1 Mei 2011
Penulis
ix
DAFTAR ISI
HALAMAN JUDUL ……………………………………………………... .. i
PENGESAHAN UJIAN ......................................................................... ...... ii
PERNYATAAN ..................................................................................... ....... iii
PERSEMBAHAN DAN MOTTO ................................................................ iv
ABSTRAK ............................................................................................ ........ v
ABSTRACT ............................................................................................. .... . vi
KATA PENGANTAR ........................................................................... ....... vii
DAFTAR ISI ............................................................................................. .. . ix
DAFTAR TABEL ………………………………………… ......................... xii
DAFTAR GAMBAR ......................................................................... ........... xiii
BAB I PENDAHULUAN ........................................................................... 1
1.1. Latar Belakang .......................................................................... 1
1.2. Permasalahan ............................................................................. 3
1.3. Pembatasan Masalah ................................................................. 3
1.4. Tujuan Penelitian ...................................................................... 3
1.5. Manfaat Penelitian .................................................................... 4
BAB II LANDASAN TEORI ...................................................................... 5
2.1. Kredit ......................................................................................... 5
2.2. Analisis Cross Tabulation ......................................................... 6
2.2.1 Uji Chi-Square ( ) ........................................................... 7
2.3. Credit Scoring ........................................................................... 8
x
2.4. Decisoin Tree ............................................................................ 10
2.5. Classification and Regression Tree (CART) ............................ 13
2.5.1 Classification Tree ............................................................. 15
2.5.2 Maksimum Tree ................................................................. 19
2.5.3 Optimum Tree .................................................................... 21
BAB III METODOLOGI PENELITIAN
3.1 Waktu dan Tempat Penelitian ................................................ 23
3.2. Metode Pengumpulan Data ...................................................... 23
3.3. Metode Pengolahan Data .......................................................... 24
3.3.1 Analisis Cross Tabulation .................................................. 24
3.3.2 Pengolahan Data dengan CART ........................................ 26
3.4. Alur Penelitian .......................................................................... 28
BAB IV HASIL DAN PEMBAHASAN
4.1. Analisis Pendahuluan ................................................................. 29
4.1.1 Statistika Deskriptif ............................................................ 29
4.1.2 Analisis Cross Tabulasi ....................................................... 31
4.2 Analisis Hasil CART ................................................................... 35
4.2.1 Maksimum Tree ................................................................... 35
4.2.2 Optimal Tree ........................................................................ 41
BAB V KESIMPULAN DAN SARAN ....................................................... 48
5.1. Kesimpulan ............................................................................. 48
5.2. Saran ....................................................................................... 50
DAFTAR PUSTAKA ………………………………………… ................... 51
xi
LAMPIRAN ......................................................................... ......................... 53
RIWAYAT PENULIS ......................................................................... ......... 54
xii
DAFTAR TABEL
Tabel 4.1 : Statistik Deskriptif untuk Data Kuantitatif ................................. 29
Tabel 4.2 : Statistik Deskriptif untuk Data Kualitatif ................................... 30
Tabel 4.3 : CrossTabulasion untuk Data Kuantitatif .................................... 31
Tabel 4.4 : CrossTabulasion untuk Data Kualitatif ...................................... 32
Tabel 4.5 : Chi Square Test ........................................................................... 33
Tabel 4.6 : Misclassification untuk Test Sample pada Maksimum Tree....... 36
Tabel 4.7 : Misclassification untuk Test Sample pada Optimal Tree ............ 41
Tabel 4.8 : GAINS CHART ........................................................................... 45
Tabel 4.9 : Prediction Success ...................................................................... 46
Tabel 4.10 : Variabel Terpenting .................................................................. 47
xiii
DAFTAR GAMBAR
Gambar 2.1 : Contoh Bagan Klasifikasi DecisionTtree .............................. 14
Gambar 2.2 : Diagram Algoritma Pemisah CART ..................................... 16
Gambar 2.3 : Grafik Pemisahan Twoing Splitting Rule ......................... 18
Gambar 3.1 : Diagram Alur Penelitian ....................................................... 28
Gambar 4.1 : Diagram Salah Satu Cabang Maksimum Tree ....................... 37
Gambar 4.2 : Splitter Optimal Tree Menggunakan Twoing Splitting Rule .. 42
Gambar 4.3 : Gains CART Optimal Tree .................................................... 45
Gambar 5.1 : Optimal Tree .......................................................................... 49
iv
PERSEMBAHAN
Sebuah persembahan kecil, teruntuk kedua orang tuaku, kedua kakakku, adik perempuanku,
serta bidadari kecil yang selalu memberi senyuman baru dirumah “Keisha”, keluarga besarku,
keluarga besar Bapak H. Daniel Asril, dan sahabat-sahabat terbaik yang selalu ada dan
berjuang bersama dalam sebuah semangat kekeluargaan.
MOTTO
“Barang siapa yang menghendaki dunia maka hendaknya dia berilmu. Dan
barang siapa yang menghendaki akhirat maka hendaknya dia berilmu. Dan
barang siapa yang menghendaki dunia dan akhirat maka hendaknya dia
berilmu.”
[Sa’id bin Sholih al-Ghomidi]
Barang siapa berjalan untuk menuntut ilmu maka Allah akan memudahkan
baginya jalan ke syorga
.[HR. Muslim].
1
BAB I
PENDAHULUAN
1.1 Latar Belakang
Kemajuan dan perkembangan dunia di segala bidang saat ini mendorong
seluruh lapisan masyarakat melakukan semua aktivitas secara cepat.
Masyarakat membutuhkan sarana-sarana untuk menunjang semua aktifitas
tersebut, salah satunya adalah kendaraan bermotor yang saat ini memang dirasa
sangat diperlukan. Masyarakat dapat memiliki kendaraan bermotor selain
membelinya dengan cara tunai juga dapat membelinya dengan cara kredit yang
akhir-akhir ini banyak penawaran-penawaran khusus yang dilakukan oleh
beberapa perusahaan jasa pengkreditan dengan uang muka yang terjangkau,
salah satunya adalah PT. X Finance.
Walaupun masyarakat dipermudah dengan adanya penawaran khusus
dengan uang muka yang terjangkau, pihak perusahaan juga melakukan
serangkaian proses analisis kredit pada setiap konsumen yang mengajukan
permohonan kredit sebelum menyetujuinya. Serangkaian proses tersebut
diawali dari proses vertel yaitu adanya dokumen permohonan konsumen ke
dealer yang dilanjutkan dengan mendatangkan surveyor ke rumah masing-
masing konsumen untuk meminta persyaratan dokumen konsumen. Kemudian
akan dilanjutkan dengan analisis kredit yang dilakukan oleh pihak perusahaan.
Proses analisis kredit tersebut dalam pengerjaannya membutuhkan waktu yang
tidak sebentar. Fenomena yang terjadi saat ini adalah banyaknya permohonan
2
kredit yang dilakukan konsumen akan tetapi pihak perusahaan hanya bisa
menganalisa beberapa konsumen saja dalam sehari.
Persaingan bisnis pengkreditan kendaraan bermotor dan keterbatasan
untuk menganalisa dokumen kredit konsumen perhari mendorong pihak
perusahaan dan penulis untuk melakukan inovasi dan perbaikan proses analisa
kredit yang sudah ada. Inovasi dan perbaikan proses yang dimaksud adalah
dengan mencoba membuat model credit scoring yang belum dimiliki oleh
pihak perusahan, selanjutnya model tersebut akan digunakan untuk membantu
memberikan hasil analisa kelayakan kredit secara tepat terhadap permohonan
kredit konsumen perhari.
Dari penelitian Dwi Andhayani, dkk tahun 2008 telah dibuat model
credit scoring analisa kelayakan kredit konsumen KPR salah satu Bank pada
suatu daerah yang menghasilkan model credit scoring berupa model regresi
logistik. Selanjutnya dalam penelitian ini penulis bertujuan membuat model
credit scoring dengan menggunakan metode Classification and Regression
Tree (CART) untuk memperoleh model credit scoring konsumen kredit
kendaraan bermotor yang diinginkan. Oleh karena itu, judul penelitian ini
adalah “ MODEL CREDIT SCORING UNTUK PROSES ANALISA
KELAYAKAN FASILITAS KREDIT MOTOR MENGGUNAKAN
METODE CLASSIFICATION AND REGRESSION TREE (CART) ” dengan
studi kasus di PT X Finance cabang Mauk pada Desember 2010.
3
1.2 Permasalahan
Berdasarkan latar belakang di atas maka dapat dirumuskan permasalahan
sebagai berikut :
1. Parameter apakah yang menjadi faktor penting dalam model credit scoring
penilaian kelayakan Kredit Kendaraan Bermotor di PT. X Finance ?
2. Bagaimana pola klasifikasi Permohonan Kredit yang disetujui oleh PT. X
Finance?
3. Bagaimana model tree optimum credit scoring dengan menggunakan
metode CART ?
1.3 Pembatasan Masalah
Data yang digunakan dalam penelitian ini adalah data pribadi konsumen
pemohon kredit, seperti data jenis kelamin, uang muka, tenor pembayaran,
kondisi kendaraan, besar OTR dan bunga pinjaman yang penulis peroleh dari
divisi Risk Management PT. X Finance yang selanjutnya akan dibuat model
credit scoring dengan metode Classification and Regression Tree (CART).
1.4 Tujuan Penelitian
Adapun tujuan yang hendak dicapai dalam penelitian kali ini adalah :
1. Menentukan parameter yang menjadi faktor penting dalam model credit
scoring penilaian kelayakan Kredit Kendaraan Bermotor di PT. X
Finance.
4
2. Mengetahui pola klasifikasi Permohonan Kredit yang disetujui oleh PT. X
Finance.
3. Mengetahui model optimum tree credit scoring dengan menggunakan
metode CART.
1.5 Manfaat Penelitian
Hal-hal yang dapat diperoleh dari penelitian kali ini adalah :
1. Model credit scoring yang diperoleh akan bermanfaat untuk pihak
perusahaan dalam menentukan kelayakan pemberian kredit kepada calon
konsumen dengan lebih tepat dan cepat.
2. Bagi penulis menambah wawasan mengenai credit scoring khususnya
metode Classification and Regression Tree (CART).
5
BAB II
LANDASAN TEORI
2.1 Kredit
Pengertian kredit menurut undang-undang No. 7 Tahun 1992 tentang
Perbankan adalah : “ Penyediaan uang atau tagihan yang dapat dipersamakan
dengan itu, berdasarkan persetujuan kesepakatan pinjam-meminjam antara
bank dengan pihak lain yang mewajibkan pihak meminjam untuk melunasi
hutangnya setelah jangka waktu tertentu dengan jumlah bunga, imbalan atau
pembagian hasil keuntungan ”. Jika dilihat dari fungsinya, fasilitas kredit
dikatakan sangat bermanfaat bagi berbagai pihak [10], di antaranya :
a. Bagi dunia usaha (termasuk usaha kecil) atau debitur:
Sebagai sumber permodalan untuk menjaga kelangsungan atau
meningkatkan usahanya.
Pengembalian kredit wajib dilakukan tepat waktu, diharapkan dapat
diperoleh dari keuntungan usahanya
Memberi keuntungan usaha dengan adanya tambahan modal dan
berkembangnya usaha
b. Bagi lembaga keuangan (termasuk bank) :
Menyalurkan dana masyarakat (deposito, tabungan, giro) dalam
bentuk kredit kepada dunia usaha.
Memberi keuntungan dari selisih bunga pemberian kredit atau jasa
lainnya
6
Adapun jenis-jenis kredit disesuaikan dengan kebutuhan debitur. Jenis
kredit yang akan dibahas dalam penelitian ini adalah jenis kredit kendaraan
bermotor. Untuk mengkredit sebuah kendaraan bermotor calon konsumen
ataupun calon debitur harus mengikuti serangkaian prosedur yang sudah
ditetapkan oleh pihak perusahaan jasa pengkreditan. Prosedur yang dimaksud
dimulai dari pengisian formulir pengajuan kredit sampai pengecekan langsung
ke tiap-tiap rumah calon konsumen oleh surveyor sampai tahap analisa kredit
yang dilakukan oleh pihak perusahaan untuk selanjutnya pemberian keputusan
apakah permohonan kredit tersebut diterima atau ditolak berdasarkan ketentuan
analisa kredit yang sudah ada.
Keputusan perusahaan untuk menerima atau menolak sebuah
permohonan kredit konsumen didasarkan pada analisa kredit berdasarkan
formulir dokumen yang telah diisi oleh calon konsumen. Formulir tersebut
berisi mengenai seluruh keterangan terperinci tentang pribadi calon konsumen,
mulai dari nama, status perkawinan, besar pemasukan perbulan, sampai dengan
biaya pengeluaran yang wajib dikeluarkan calon konsumen tiap bulannya.
2.2 Analisis Cross Tabulation
Cross tabulation atau tabulasi silang merupakan prosedur yang
digunakan untuk menyajikan deskriptif suatu data dalam bentuk baris dan
kolom [9]. Data yang digunakan dalam analisa ini adalah data yang berskala
ordinal dan nominal. Pada dasarnya sebuah analisa crosstab dalam proses
7
pengerjaannya sama dengan menu TABLES pada MS. Excel biasa,
perbedaannya terletak pada adanya metode statistik yang dipakai untuk
mengukur tingkat asosiasi (hubungan) antara dua variabel yang tersedia pada
crosstab, sedangkan dalam menu TABLES tidak menyediakan metode
perhitungan statistik tersebut.
Dalam prakteknya, alat statistik yang sering digunakan untuk mengukur
tingkat asosiasi (hubungan) antar variabel yang tersedia dalam crosstab adalah
chi-square. Alat ini, dapat diterapkan untuk menguji ada atau tidaknya
hubungan antara baris dan kolom dari sebuah crosstab.
2.2.1 Uji Chi Square ( )
Maksud dan tujuan dari pengujian menggunakan metode uji Chi-Square
(Khi-kuadrat) adalah membandingkan antara fakta yang diperoleh berdasarkan
hasil observasi dan fakta yang didasarkan secara teoritis (yang diharapkan) [7].
Hal ini sejalan dengan konsep kenyataan yang sering terjadi, bahwa hasil
observasi biasanya selalu tidak tepat dengan yang diharapkan atau tidak sesuai
dengan yang direncanakan berdasarkan konsep dari teorinya (sesuai dengan
aturan-aturan teori kemungkinan atau teori probabilitinya).
∑( )
( )
di mana :
= banyak kasus yang diamati dalam kategori ke-i
= banyak kasus yang diharapkan dalam kategori ke-i
8
= banyaknya peristiwa atau kejadian
∑ = penjumlahan semua kategori (k)
Uji Chi Square dalam kaitannya dengan analisis cross tabulasi
berfungsi untuk mengamati ada atau tidaknya hubungan atau korelasi ( )
antara baris dan kolom sebuah crosstab adapun dasar pengambilan
keputusannya adalah sebagai berikut :
H0 : : Tidak ada hubungan antara baris dan kolom
H1 : : Ada hubungan antara baris dan kolom
dengan kriteria uji :
Jika >
maka H0 ditolak.
Jika <
maka H0 diterima.
2.3 Credit Scoring
Credit scoring adalah metode yang digunakan untuk mengevaluasi resiko
kredit dalam hal permohonan pinjaman dari konsumen [1]. Metode ini
digunakan untuk mengklasifikasikan konsumen yang mengajukan kredit
termasuk ke dalam kelompok baik atau buruk. Credit scoring mencoba untuk
mengelompokkan keragaman dari karakteristik konsumen yang mengajukan
permintaan kredit berdasarkan kesalahan dan kelalaian atas kewajiban. Metode
ini menghasilkan suatu perhitungan yang dapat digunakan oleh pihak
perusahaan jasa pengkreditan untuk menggolongkan syarat-syarat konsumen
yang mengajukan kredit dalam kaitannya dengan resiko kredit.
9
Untuk membuat suatu model scoring “scorecard” dalam menentukan
karakteristik si peminjam, pengembangan analisis data dilakukan dengan
melihat data historis konsumen kredit yang telah disetujui kreditnya atau tidak
oleh pihak perusahaan. Hasil scoring ini akan berguna untuk memprediksi
apakah calon konsumen dapat melaksakan pinjaman dengan baik atau buruk.
Informasi mengenai keterangan pribadi calon konsumen atau calon
peminjam didapat dari formulir aplikasi yang diajukan oleh pihak perusahaan.
Data-data seperti jenis kelamin, status perkawinan, pendapatan bulanan, sisa
pinjaman yang belum dibayar, jumlah tabungan, jenis pekerjaan, lama bekerja
pada suatu perusahaan, apakah calon konsumen pernah melakukan pelanggaran
pada peminjaman sebelumnya, status kepemilikan rumah apakah milik sendiri
atau menyewa, jenis rekening bank yang dimiliki, dan semua faktor potensial
yang berhubungan dengan disetujuinya permohonan pinjaman sampai dapat
digunakannya “scorecard”.
Dalam banyak kasus sistem scoring, dengan nilai scoring yang tinggi
akan memperkecil nilai resiko, dan pihak perusahaan pengkreditan yang
memberikan jasa kredit dapat menetukan batasan perhitungan untuk menerima
atau menolak permohonan kredit konsumen berdasarkan nilai resiko yang
dimiliki. Dengan mengacu kepada model credit scoring yang sudah terbentuk,
pihak perusahaan akan menyetujui permohonan kredit jika aplikasi yang
diajukan memiliki score di atas batas minimal dan menolak permohonan jika
aplikasi yang diajukan memiliki score di bawah batas minimal. Walaupun
model credit scoring untuk selanjutnya dapat menjadi penentu kebijakan
10
perusahaan untuk menerima ataupun menolak permohonan kredit dari
konsumen, akan tetapi kesalahan prediksi terhadap nilai tiap-tiap calon
konsumen untuk diberikan fasilitas kredit akan mungkin terjadi. Oleh karena
itu, untuk membangun suatu model credit scoring yang baik, diperlukan data
historis yang cukup.
Model credit scoring dibentuk melalui serangkaian proses statistika yang
dapat digunakan untuk melakukan ramalan terhadap data yang baru. Proses
pengaplikasian model yang sudah terbentuk berbeda dengan proses dalam
pembentukan atau pembuatan model. Secara khusus, suatu model credit
scoring yang terbentuk dapat digunakan pada waktu yang lama untuk
menghitung atau meramalkan data-data baru [1].
Selama proses pembentukan model credit scoring, informasi-informasi
dari konsumen yang berbentuk data selanjutnya diolah dengan bantuan
software statistika. Pada akhirnya akan dihasilkan suatu model yang memiliki
output berupa keputusan untuk konsumen.
Ada beberapa metode yang dapat dipakai untuk menghasilkan model
credit scoring, di antaranya analisis diskriminan, regresi linier, regresi logistik,
analisis probit, decision tree, dan sebagainya. Dalam penelitian kali ini, metode
yang akan dibahas untuk memecahkan persoalan credit scoring adalah metode
decision tree.
2.4 Decision Tree
Berbeda dengan metode regresi linier dan logistik yang menghasilkan
skor untuk kemudian mengklasifikasikan pengamatan dengan aturan
11
Diskriminan, decision tree memulai proses analisis dengan mengklasifikasikan
pengamatan ke dalam kelompok dan kemudian memperoleh skor untuk setiap
kelompok yang diamati [4].
Sebelum membahas lebih jauh mengenai decision tree, berikut akan
dijelaskan terlebih dahulu istilah-istilah yang digunakan dalam tree, sebagai
berikut :
Learning Sample :himpunan data awal yang digunakan untuk
pembentukan model.
Tree/ Pohon : suatu skema yang menunjukkan pola pengelompokan
berdasarkan variabel-variabel pemisah.
Sub-Tree : cabang-cabang kecil dari pohon yang dipisahkan oleh
variabel pemisah.
Node : titik yang terdapat pada masing-masing cabang dari
tree
Terminal node : cabang akhir dari suatu tree
Parent node : cabang dari suatu tree, namun dapat dipecah kembali
berdasarkan nilai dari variabel pemisah
Child node : simpul yang berhubungan langsung dengan parent
node yang merupakan hasil pemecahan dari Parent
node.
Decision tree dipisahkan menjadi dua buah teknik pengerjaan pertama
jika variabel terikat atau variabel terikatnya bersifat kontinu maka teknik
pengerjaan yang dilakukan adalah Regression tree, kedua apabila variabel
12
terikatnya bersifat diskrit atau kualitatif (kategori) maka teknik pengerjaannya
disebut dengan Classification tree.
Decision tree dapat didefinisikan sebagai prosedur rekursif, di mana satu
set data statistik n secara progresif dibagi menjadi kelompok-kelompok
berdasarkan aturan pembagian yang bertujuan untuk memaksimalkan ukuran
homogenitas atau kemurnian variabel respon pada masing-masing kelompok.
Pada setiap langkah prosedur pembentukan model tree aturan pembagian
ditentukan oleh pilihan variabel penjelas (interikat) untuk membagi dan
memisahkan variabel tersebut, yang menetapkan bagaimana partisi atau
pemisahan terhadap pengamatan dilakukan [4].
Hasil yang akan didapat dari sebuah pemodelan tree adalah partisi akhir
dari sebuah pengamatan. Untuk mencapai hal itu perlu dilakukan penentuan
kriteria pemberhentian yang tepat pada proses pembagian pada setiap
pengamatan. Anggap partisi akhir sudah tercapai, yang terdiri dari kelompok g
di mana g < n. Maka untuk sembarang nilai observasi pada variabel terikat
( ), sebuah regression tree menghasilkan nilai prediksi yang nilainya sama
dengan nilai mean dari untuk setiap i dalam grup tersebut. Misalkan m
adalah jumlah kelompok, maka akan didapatkan persamaan :
∑
( )
Sementara untuk classification tree, nilai yang tepat diberikan dari
gabungan probabilitas yang cocok menjadi satu buah kelompok. Jika hanya ada
13
dua kelas yang mungkin (klasifikasi biner), maka probabilitas yang cocok
adalah :
∑
( )
Pengamatan bernilai 0 atau 1, oleh karena itu, probabilitas
koresponden dicocokkan ke perbandingan pengamatan yang sukses dalam
grup. Perhatikan bahwa dan konstan untuk setiap observasi atau
pengamatan dalam grup.
Ada beberapa macam model dalam decision tree, di antaranya IDS,
CART, CHAID, C4.5, dan ID3. Adapun metode yang dipakai dalam penelitian
ini adalah model CART metode Classification tree.
2.5 Classification and Regression Tree (CART)
Breiman, Friedman, Olshen, dan Stone pada tahun 1984
memperkenalkan salah satu metode dalam statistika nonparametrik yakni
metode classification and regression tree (CART) yang dikenal sebagai partisi
binary rekursif. Dikatakan partisi binary karena pada proses pembentukan
model melibatkan sekumpulan data yang akan menghasilkan dua buah node
[6]. Disebut rekursif karena proses pembagian data menjadi dua node
dilakukan secara bertingkat dan berulang pada setiap node yang dihasilkan, di
mana parent node menghasilkan dua child node dan masing-masing child
node memiliki dua grand child node dan seterusnya sampai mencapai terminal
14
node. Tujuan mendasar dari metode tree adalah membangun sebuah model
pohon keputusan yang selanjutnya akan digunakan untuk memberikan score
atau nilai tertentu pada suatu data baru.
Gambar 2.1 Contoh Bagan Klasifikasi Decision tree
Keterangan gambar :
1 : Parent node
2 : Child node
3 : Grandchild node
4 : Terminal node (simpul akhir)
CART merupakan alat dari metode decision tree yang dapat dikatakan
paling baik untuk memecahkan masalah data mining, pemodelan prediksi, dan
pengolahan data. Pada proses pengerjaannya, CART secara otomatis mencari
pola-pola dan hubungan yang penting yaitu membuka struktur yang
tersembunyi meskipun data yang digunakan memiliki tingkat kompleksitas
15
yang tinggi. Dalam CART ada dua buah karakteristik penting yang harus
diperhatikan untuk mendapatkan hasil tree dengan tampilan yang optimal [3].
Pertama pemecahan obyek secara berulang. Dalam langkah ini pemilihan
kriteria alat pemisah (impurity function) yang sesuai dengan jenis data, dalam
CART terdapat tujuh buah kriteria pemisah di antaranya yaitu Gini, Symgini,
Twoing, Ordered Twoing, Entropy dan Class Probability untuk classification
tree, serta Least Square dan Least Absolute Deviatio untuk regression tree.
Kemudian yang kedua teknik pruning (pemangkasan) yang tepat.
Metode CART memiliki tiga bagian yaitu : pertama model tree dibentuk
menggunakan learning sample di mana dalam pembentukan tree tersebut tidak
terjadi pruning tree (pemangkasan pada tree) sehingga model yang terbentuk
memiliki jumlah terminal node paling banyak atau disebut juga dengan
maksimum tree [8]. Karena maksimum tree yang dibentuk tidak memiliki
keoptimalan antara misclassification error dengan kompleksitas tree sehingga
diperlukan bagian kedua yaitu pengoptimalan tree. Misclassification error
adalah nilai resiko ketepatan prediksi yang dihasilkan oleh model tree yang
terbentuk. Kemudian setelah dilakukannya pengoptimalan terhadap tree
tersebut maka lakukan bagian yang ketiga yaitu pengklasifikasian data baru.
2.5.1 Classification Tree
Classification tree adalah suatu metode klasifikasi atau pengelompokan
yang berbentuk tree dari sekumpulan data ke dalam beberapa kelompok
dengan menggunakan pemisahan tree [6]. Classification tree digunakan untuk
16
memprediksi objek atau kasus dalam kelas-kelas dengan satu variabel
dependent (terikat) yang kategorik dari satu atau lebih variabel bebas.
Classification tree dibangun berdasarkan splitting rule yang dipilih.
Splitting rule adalah aturan pemisahan pada tree yakni aturan yang
melaksanakan pemisahan data percobaan (learning sample) menjadi bagian
yang lebih kecil dengan mencari kemungkinan didapatkan kehomogenitasan
yang maksimum. Homogenitas maksimum adalah sebuah kondisi di mana
pemisahan node berdasarkan kehomogenan kelas data sehingga pada terminal
node akan didapatkan data yang lebih murni (pure). Kemurnian data yang
didapat itulah yang dapat menentukan keakuratan sebuah prediksi. Semakin
murni sebuah hasil yang didapat maka akan semakin akurat prediksinya, dan
sebaliknya semakin tidak murni (impure) hasil yang didapat maka akan
semakin tidak tepat prediksinya [6].
Aturan pemisah tree pada metode CART digambarkan dalam diagram di
bawah ini [8] :
Gambar 2.2 Diagram Algoritma Pemisah CART
17
Dengan adalah parent node dan berturut-turut adalah node kiri
dan node kanan dari parent node tersebut. Sedangkan adalah variabel j dan
adalah nilai pemisah yang terbaik dari variabel .
Homogenitas maksimum child node didefinisikan sebagai impurity
function i(t). Impurity function adalah suatu fungsi yang digunakan untuk
mengukur keakuratan model dengan memberikan indikasi kehomogenan kelas-
kelas pada data, sehingga pada simpul akhir (terminal node) akan didapatkan
data yang lebih murni. Jika kemurnian dari parent node konstan untuk setiap
kemungkinan pemisah , j = 1,2, … , p, maka homogenitas maksimum
dari child node kiri dan kanan akan ekivalen ke maksimisasi perubahan
impurity function ( ) :
( ) ( ) [ ( )] ( )
dengan :
( ) : Impurity function untuk parent simpul
: child node kiri dan kanan dari parent node
( ) : impurity function untuk
[ ( )] : ekspektasi dari ( )
Diasumsikan bahwa P1 dan P2 adalah proporsi sample ke node kiri dan
kanan, maka didapatkan :
( ) ( ) ( ) ( ) ( )
Atau
18
( ) ( ) [ ] ( ) [ ] ( ) ( )
CART akan mencari semua nilai yang mungkin dari semua variabel
dalam matriks X untuk mencari pemisah yang terbaik yang akan
memaksimumkan perubahan impurity function ( ). Impurity function yang
akan dipakai dalam penelitian ini adalah Twoing Splitting Rule.
Twoing Splitting Rule
Metode twoing berusaha untuk mencari persentase kelas yang paling
besar dan kelas paling kecil dalam data untuk kemudian memisahkan kedua
kelas tersebut ke dalam node terpisah. Sebagai contoh terdapat 4 buah kelas
yaitu kelas A, B, C, D yang masing-masing memiliki data sebesar 40, 30, 20,
dan 10 persen dari data. Kemudian aturan twoing akan berusaha menempatkan
kelas A sebagai kelas yang memiliki persen terbesar dari data dan kelas D yang
memiliki persen kelas paling kecil dalam satu node. Diagram di bawah ini
menunjukkan proses pemisahan yang mungkin dilakukan oleh Twoing untuk
data seperti yang telah disebutkan sebelumnya.
Gambar 2.3 Grafik Pemisahan Twoing Splitting Rule
Kelas A = 40 Kelas B = 30
Kelas C = 20 Kelas D = 10
Kelas A = 40
Kelas D = 10
Kelas B = 30
Kelas C= 20
19
Dapat disimpulkan bahwa metode twoing berusaha memisahkan kelas
dengan memfokuskannya pada dua buah kelas pada waktu yang bersamaan.
Twoing akan selalu mengerjakan kelas yang memiliki data yang paling besar
dan kelas yang memilki data paling kecil. Berdasarkan [8] dan [2] Twoing
splitting rule menggunakan impurity function sebagai berikut :
( ) (∑ ( ) ( )
)
( )
dengan :
= probabilitas node kiri
= probabilitas node kanan
( ) = probabilitas kondisional kelas ke-k yang disajikan
dalam node
( ) = probabilitas kondisional kelas ke-k yang disajikan
dalam node
2.5.2 Maksimum Tree
Proses pengklasifikasian data pada CART dibagi menjadi dua tahapan.
Pertama proses pembentukan model, di mana pada proses ini akan dijelaskan
dan diuraikan himpunan kelas yang ditentukan. Kemudian tahap kedua yaitu
proses pemakaian model yang dilakukan setelah model tree terbentuk. Pada
proses ini akan diklasifikasi data-data baru yang belum diketahui
pengklasifikasiannya berdasarkan model yang terbentuk.
20
Pada proses klasifikasi dengan tahapan proses pembentukan model pada
CART diperlukan learning sample (data percobaan) yang merupakan
sekumpulan data yang digunakan untuk membentuk sebuah model tree dan
biasanya learning sample berukuran besar agar dapat membentuk
pengklasifikasian yang baik. Ketika model tree sudah terbentuk maka model
itu dapat digunakan untuk mengklasifikasian data yang belum diketahui.
Tujuan klasifikasi ini adalah menentukan aturan pada variabel yang lain yang
memprediksi variabel kelas. Untuk menguji keakuratan model yang dibuat
dapat digunakan test sample (data uji) di mana test sample tersebut biasanya
berukuran lebih kecil dibandingkan dengan data percobaan yang sebenarnya.
Pada pembentukan model, data percobaan yang digunakan akan dipisah
menjadi dua buah node secara rekursif atau bertingkat hingga mencapai
terminal node dengan menggunakan algoritma tertentu. Seperti yang telah
dibahas dalam subbab sebelumnya, ada beberapa jenis algoritma yang dapat
digunakan sebagai alat pemisah dalam pembentukan model. Seperti yang sudah
dijelaskan sebelumnya, pada penelitian kali ini, akan digunakan algoritma
pemisah yaitu Twoing Splitting Rule.
Pertumbuhan tree dari data percobaan akan menghasilkan level dari suatu
node yang paling besar dibandingkan dengan model tree lainnya, serta
memiliki jumlah terminal node (simpul akhir) yang paling banyak. Tree yang
paling besar seperti ini disebut dengan maksimum tree.
21
2.5.3 Optimum Tree
Dalam pembentukan model tree perlu dipertimbangkan keakuratan dari
model tree tersebut [6]. Tingkat keakuratan sebuah model tree menunjukkan
seberapa baik model tersebut dalam memprediksi atau mengklasifikasi data.
Sedangkan ketidakakuratan model tersebut dalam memprediksi atau
mengklasifikasi data disebut dengan resiko. Seperti yang sudah dibahas
sebelumnya bahwa nilai resiko dari sebuah model tree dapat dilihat dari
misclassification error yang dihasilkan oleh model tersebut. Jika
misclassification yang dihasilkan tinggi maka resiko yang akan timbul dari
model tree tersebut juga akan tinggi dan sebaliknya jika nilai misclassification
rendah maka resiko dari tree tersebut juga rendah dalam memprediksi atau
mengklasifikasi sebuah data.
Dengan meningkatnya ukuran pada model tree, misclassification yang
dihasilkan akan menurun dan jika ukuran tree tersebut maksimum maka
misclassification error akan bernilai nol [6]. Akan tetapi maksimum tree dapat
menghasilkan kompleksitas yang sangat tinggi dan berakibat akan melemahkan
prediksi atau pengklasifikasian model tree terhadap suatu data. Di sisi lain tree
yang memiliki ukuran yang lebih kecil dari maksimum tree memiliki
kompleksitas yang rendah, namun akan memiliki nilai misclassification error
yang lebih tinggi dibandingkan dengan maksimum tree. Oleh karena itu, perlu
dilakukannya optimasi dari sebuah model tree sebelum model tersebut
digunakan untuk memprediksi atau mengklasifikasikan sebuah data baru.
Pengoptimasian tree mengimplikasikan pemilihan ukuran tree yang benar yaitu
22
memangkas node dan subtree yang tidak memberikan kontribusi yang cukup
besar terhadap akurasi dari pengelompokan namun menambah kompleksitas
dari tree tersebut.
23
BAB III
METODOLOGI PENELITIAN
3.1 Waktu dan Tempat Penelitian
Penelitian ini dilaksanakan pada bulan Desember 2010 sampai Mei 2011
di PT. X Finance cabang Mauk - Tangerang.
3.2 Metode Pengumpulan Data
Pada penelitian ini data yang dipakai adalah data sekunder, yaitu data
yang diperoleh berdasarkan arsip perusahaan. Data diperoleh dari divisi Risk
Management yang berupa data pribadi konsumen PT. X Finance. Data tersebut
terdiri dari 784 konsumen dengan 7 variabel (6 variabel berupa variabel bebas
dan 1 buah variabel terikat). Variabel-variabel tersebut adalah sebagai berikut :
1. Jenis Kelamin
a. Nilai 1 : Jenis kelamin konsumen laki-laki
b. Nilai 2 : Jenis kelamin konsumen perempuan
2. Uang Muka adalah besarnya uang muka atau yang lebih dikenal dengan
sebutan DP (down payment) yang merupakan persetujuan dari pihak
konsumen dengan Surveior di awal pengajuan kredit
3. Tenor Pembayaran adalah jumlah bulan cicilan yang akan dibayarkan oleh
konsumen.
4. Kondisi Kendaraan
a. Nilai 1 : Untuk jenis kendaraan baru.
24
b. Nilai 2 : Untuk jenis kendaraan bekas (second hand)
5. Harga OTR adalah harga kendaraan jika pembelian secara tunai.
6. Bunga Pinjaman adalah besarnya biaya yang harus ditanggung oleh pihak
konsumen yang mengajukan kredit, adapun besarnya bunga ditentukan
oleh pihak perusahaan.
7. Variabel terikat (permohonan kredit diterima atau ditolak) didefinisikan
sebagai variabel approval. Variabel approval merupakan variabel
kategorik dengan skala pengukuran adalah nominal. Kode nilai 1
menyatakan bahwa permohonan kredit konsumen diterima dan kode nilai
2 menyatakan bahwa permohonan kredit konsumen ditolak.
Selain itu, studi pustaka juga penulis lakukan melalui buku-buku atau
sumber lain yang menunjang seperti jurnal, hasil penelitian, yang digunakan
untuk memperoleh informasi-informasi tambahan yang berguna dalam
penelitian kali ini.
3.3 Metode Pengolahan Data
Setelah data sekunder didapat tahap selanjutnya data diolah dengan
bantuan dua buah software statistika untuk proses statistika deskriptif dan
analisis crosstab, dan untuk mendapatkan model credit scoring (dengan
metode CART) yang diinginkan.
3.3.1 Analisis Cross Tabulation
Sebelum melanjutkan proses pengolahan data, terlebih dahulu penulis
melakukan analisis statistik deskriptif dan analisis crosstab terhadap variabel-
25
variabel yang dipakai dalam penelitian. Adapun tujuannya adalah untuk
mengetahui hubungan keterkaitan antara variabel-variabel tersebut. Langkah
awal dilakukan dalam tahap ini adalah menentukan variabel apa yang menjadi
variabel terikat dan variabel apa yang merupakan variabel bebas untuk
selanjutnya dilakukan analisis deskriptif terhadap data yang diperoleh. Dalam
penelitian ini yang menjadi variabel terikat adalah permohonan kredit.
Kemudian variabel bebas yang mempengaruhi variabel terikat adalah variabel
jenis kelamin, uang muka, tenor pembayaran, kondisi kendaraan, besar OTR
dan bunga pinjaman.
Pada tahap analisis deskriptif beberapa variabel yang menjadi variabel
bebas dikelompokkan menjadi beberapa kelompok. Variabel yang
dikelompokkan itu diantaranya :
a. Variabel Uang Muka
Pengelompokan variabel uang muka didasarkan pada wawancara yang
telah dilakukan penulis dengan pihak perusahaan, adapun pengelompokan
tersebut adalah :
Kelompok 1 : besar uang muka ≤ 20%
Kelompok 2 : 20% < uang muka < 50%
Kelompok 3 : uang muka ≥ 50%
Adapun variabel uang muka diubah ke dalam bentuk persentase dimana
persen uang muka tersebut didasarkan pada biaya OTR
b. Variabel Bunga Pinjaman
Kelompok 1 : besar bunga pinjaman ≤ 30%
26
Kelompok 2 : 30% < bunga pinjaman < 45%
Kelompok 3 : bunga pinjaman ≥ 45%
c. Variabel Tenor Pembayaran
Kelompok 1 : tenor pembayaran ≤ 12 bulan
Kelompok 2 : 12 bulan < tenor pembayaran < 24 bulan
Kelompok 3 : tenor pembayaran ≥ 24 bulan
d. Variabel Harga OTR
Kelompok 1 : harga OTR ≤ 12.500.000
Kelompok 2 : 12.500.000 < harga OTR < 15.000.000
Kelompok 3 : harga OTR ≥ 15.000.000
Langkah selanjutnya yang dilakukan yaitu analisis Cross Tabulation,dan
Uji Khi Kuadrat terhadap data yang sudah didapat.
3.3.2 Pengolahan Data Dengan CART
Berikut adalah tahapan-tahapan pembentukan model tree dengan metode
CART :
1. Penentuan variabel terikat dan variabel bebas yang digunakan
Variabel terikat yang dipakai dalam penelitian ini adalah variabel
approval. Sedangkan variabel bebasnya adalah variabel jenis kelamin,
uang muka, tenor pembayaran, kondisi kendaraan besar OTR, dan bunga
pinjaman. Dalam pengerjaan selanjutnya variabel bebas dibagi menjadi
dua yaitu variabel bebas yang bersifat kategorik (variabel jenis kelamin
27
dan jenis kendaraan) dan variabel bebas yang bersifat numerik (variabel
uang muka, tenor pembayaran, besar OTR, dan bunga pinjaman).
2. Penenentuan variabel kelas yang menjadi fokus penelitian
Variabel terikat dipisahkan menjadi dua, yaitu permohonan kredit
yang diterima oleh pihak perusahaan dan permohonan kredit yang ditolak.
Dalam penelitian ini yang menjadi fokus penelitian adalah permohonan
kredit yang diterima, pemilihan ini didasarkan karena penulis ingin
mengetahui pola dari konsumen yang permohonan kreditnya telah diterima
oleh pihak perusahaan.
3. Model Tree yang dipilih
Model tree yang dipilih adalah classification tree karena variabel
terikatnya merupakan variabel kategorik.
4. Pemilihan model splitting rule
Metode splitting rule yang digunakan adalah Twoing Splitting Rule.
5. Data yang diperlukan untuk pembentukan model tree
Data konsumen yang akan digunakan sebanyak 784 data dengan 5
variabel, yang terdiri dari satu variabel terikat dan empat lainnya merupakan
variabel bebas.
28
3.4 Alur Penelitian
Gambar 3.1 Diagram Alur Penelitian
Identifikasi Parameter Credit Scoring
Kategori Parameter Credit Scoring
Model Tree Optimal CART CrediScoring
Parameter Signifikan Credit Scoring
Model Credit Scoring Untuk Proses Analisa Kelayakan
Pemberian Kredit Kendaraan Bermotor
Analisis Cross Tab &
Uji Chi square
Analisis Classification and
Regression Tree (CART)
Analisis Deskripsi
29
BAB IV
HASIL DAN PEMBAHASAN
4.1 Analisis Pendahuluan
Analisis hasil yang akan dilakukan bertujuan untuk mendapatkan model
tree berdasarkan data awal yakni data konsumen yang mengajukan kredit
kendaraan motor di PT X Finance yang terdiri atas 6 variabel bebas dan 1 buah
variabel terikat. Analisis pendahuluan yang dilakukan adalah analisis deskriptif
dari 7 buah variabel pengukuran, yang meliputi 4 buah variabel pengukuran
kuantitatif dan 3 buah variabel pengukuran kualitatif. Analisis pendahuluan
selanjutnya adalah analisis crosstab untuk mengetahui hubungan antara
variabel terikat dengan variabel bebasnya.
4.1.1 Statistika Deskriptif
Statistika deskriptif untuk keseluruhan data dibagi menjadi dua bagian
sesuai dengan variabel pengukurannya yakni variabel pengukuran kuantitatif
dan kualitatif. Untuk data kuantitatif, statistik deskriptifnya dapat dilihat pada
Tabel 4.1 berikut ini :
Tabel 4.1 Statistika Deskriptif untuk Data Kuantitatif
Jenis Variabel N Minimum Maksimum Rata-rata Std. Deviasi
Uang Muka 784 0 14.500.000 2.468.300 1.438.830
Tenor Pembayaran 784 11 36 30,17 6,94
Bunga Pinjaman 784 798.000 9.897.000 4.980.000 1.490.165
Harga OTR 784 7.000.000 32.200.000 12.400.000 1.812.277
30
Pada Tabel 4.1, dapat dijelaskan bahwa rata-rata uang muka yang
dikeluarkan konsumen PT X Finance dalam pengajuan kredit kendaraan motor
adalah Rp. 2.468.300,00. Seperti kasus yang sering terjadi belakangan ini
berkaitan dengan kredit kendaraan bermotor terdapat beberapa konsumen yang
tidak mengeluarkan uang muka sama sekali pada saat mengajukan permohonan
kredit. Sementara itu, besar uang muka maksimum adalah Rp. 14.500.000,00.
Rata-rata tenor pembayaran yang dipilih konsumen diawal perjanjian
pengajuan permohonan kredit adalah 30 bulan. Sedangkan untuk data kualitatif
dapat dilihat pada Tabel 4.2, sebagai berikut :
Tabel 4.2 Statistika Deskriptif untuk Data Kualitatif
Variabel Frekuensi Persen Jumlah
Persen
Jenis Kelamin Laki-laki 564
220
71.8
28.1
71.8
100.0 Perempuan
Kondisi
Kendaraan
Baru 756
28
96.4
3.6
96.4
100.0 Bekas
Approval Diterima 647
137
82.5
17.5
82.5
100.0 Ditolak
Pada Tabel 4.2 dapat dijelaskan bahwa pada data tersebut dari total 764
konsumen, 564 diantaranya berjenis kelamin laki-laki dengan 71.8% proporsi
laki-laki dan 28.1% proporsi perempuan. Sementara itu, untuk kondisi
kendaraan yang banyak diambil oleh konsumen adalah jenis kendaraan baru
dengan proporsi sebesar 96.4% dengan sisanya sebesar 3.6% konsumen
mengambil kendaraan bekas (secondhand). Sedangkan untuk variabel
terikatnya sendiri, yakni approval dari total keseluruhan 784 data dapat dilihat
jumlah permohonan kredit yang diterima oleh pihak perusahaan adalah 647
31
konsumen atau sebesar 82.5%, sementara untuk permohonan kredit yang
ditolak oleh pihak perusahaan adalah sebesar 17.5%.
4.1.2 Analisis Cross Tabulation
Tahap awal dalam analisis crosstab akan dijelaskan mengenai hubungan
antara variabel terikat dan variabel bebas yang dibagi menjadi dua kolom
berdasarkan jenis datanya, dapat dilihat pada Tabel 4.3 dan 4.4 sebagai berikut:
Tabel 4.3 Crosstabulation untuk Data Kuantitatif
Variabel Uang Muka
1(UM≤20%) 2(20%<UM<50%) 3(UM≥50%)
Approval Diterima 492 145 10
Ditolak 109 26 2
Variabel Bunga Pinjaman
1(BP≤30%) 2(30%<BP<45%) 3(BP≥45%)
Approval Diterima 146 395 106
Ditolak 43 75 19
Variabel Harga OTR
1(OTR≤12.5jt) 2(12.5jt<OTR<15jt) 3(OTR≥15jt)
Approval Diterima 300 260 87
Ditolak 47 63 27
Variabel Tenor Pembayaran
1(Tenor≤12bln) 2(12bln<Tenor<24bln) 3(Tenor≥24bln)
Approval Diterima 29 91 527
Ditolak 10 28 99
Seperti yang sudah dijelaskan pada Bab III bahwa variabel kualitatif
dikelompokkan ke dalam 3 buah kelompok. Dari Tabel 4.3 dapat dilihat
beberapa hal seperti berikut :
Terdapat 492 konsumen dengan UM<20% yang diterima permohonan
kreditnya.
32
Terdapat 109 konsumen dengan UM<20% yang ditolak permohonan
kreditnya.
Terdapat 145 konsumen dengan 20%<=UM<50% yang diterima
permohonan kreditnya.
Terdapat 26 konsumen dengan 20%<=UM<50% yang ditolak permohonan
kreditnya.
Terdapat 10 konsumen dengan UM>=50% yang diterima permohonan
kreditnya.
Terdapat 2 konsumen dengan UM>=50% yang ditolak permohonan
kreditnya.
Tabel 4.4 CrossTabulasion untuk Data Kualitatif
Variabel Jenis Kelamin
Laki-laki Perempuan
Approval Diterima 465 182
Ditolak 99 38
Kondisi Kendaraan
Baru Bekas
Approval Diterima 622 25
Ditolak 134 3
Dari Tabel 4.4 didapatkan beberapa informasi sebagai berikut :
Terdapat 465 konsumen laki-laki yang diterima permohonan kreditnya,
sedangkan yang ditolak berjumlah 99 orang.
Terdapat 182 konsumen perempuan yang diterima permohonan kreditnya,
sedangkan sebanyak 38 konsumen perempuan ditolak permohonan
kreditnya.
33
Terdapat 622 konsumen yang memilih kredit motor dengan kondisi baru
diterima permohonan kreditnya, sedangkan 134 konsumen yang juga
memilih kondisi motor baru ditolak permohonan kreditnya.
Terdapat 25 konsumen memilih kredit motor dengan kondisi bekas yang
diterima permohonannya, sedangkan 3 orang ditolak.
Tahap analisis crosstab selanjutnya akan menjelaskan mengenai
penentuan ada atau tidaknya hubungan antara variabel terikat(terikat) dengan
variabel bebasnya. Dalam proses penentuan tersebut dilakukan uji Chi Square
dengan menggunakan hipotesis sebagai berikut :
H0 : Tidak ada hubungan antara variabel terikat dan variabel bebas.
H1 : Ada hubungan antara variabel terikat dengan variabel bebas.
Dengan ketentuan pengambilan keputusannya adalah sebagai berikut :
Jika probabilitas > 0.05 maka H0 diterima.
Jika probabilitas < 0.05 maka H0 ditolak.
Tabel 4.5 Chi Square Test
Variabel Terikat Variabel Bebas P-Value
Aprroval Uang Muka 0.000
Aprroval Harga OTR 0.001
Aprroval Bunga Pinjaman 0.020
Aprroval Tenor Pembayaran 0.017
Aprroval Jenis Kelamin 0.926
Aprroval Kondisi Kendaraan 0.337
34
Keputusan yang dapat diambil dari Tabel 4.5 adalah sebagai berikut :
Kolom P-value menunjukkan nilai probabilitas, dimana untuk variabel uang
muka, tenor pembayaran, bunga pinjaman, dan harga OTR berturut-turut
0.000, 0.017, 0.020, dan 0.001 yang berarti lebih kecil dari 0.05, maka H0
ditolak. Hal ini berarti ada hubungan antara variabel terikat (approval)
dengan kedua variabel bebas tersebut yakni variabel uang muka, variabel
tenor pembayaran, bunga pinjaman, dan variabel besar OTR.
Untuk variabel jenis kelamin dan kondisi kendaraan mempunyai nilai
probabilitas berturut-turut sebesar 0.926 dan 0.337 yang berarti lebih besar
dari 0.05, sehingga H0 diterima. Maka dapat disimpulkan bahwa tidak ada
hubungan antara variabel terikat (approval) dengan kedua variabel bebas
tersebut.
Dari kedua kesimpulan diatas, dilihat dari hubungannya dengan variabel
terikat seharusnya variabel bebas yang dapat dimasukkan kedalam analisis
lanjutan hanyalah variabel yang memiliki hubungan yaitu variabel uang muka,
tenor pembayaran, bunga pinjaman, dan harga OTR. Akan tetapi, dalam
pelaksanaannya di lapangan variabel jenis kelamin dan variabel kondisi
kendaraan juga mempengaruhi keputusan perusahaan untuk menerima ataupun
menolak permohonan kredit dari calon konsumen. Maka dari itu, dalam
analisis lanjutan, kedua variabel ini tetap penulis masukkan untuk membuat
model tree credit scoring.
35
4.2 Analisis Hasil CART
Proses pembentukan model tree dengan menggunakan metode CART
akan menghasilkan sebuah model tree yang memiliki terminal node yang
paling banyak dan juga memiliki nilai resiko yang besar, untuk itu seperti yang
telah dijelaskan pada pembahasan sebelumnya bahwa diperlukan adanya
pengoptimalan model tree yang merupakan suatu model yang memiliki nilai
resiko yang paling kecil. Di dalam model optimal tree tersebut terdapat aturan-
aturan klasifikasi yang dapat menjelaskan mengenai aturan pemberian
keputusan perusahaan terhadap permohonan kredit yang ada, apakah
permohonan kredit yang diajukan konsumen diterima atau ditolak. Aturan
klasifikasi yang sudah didapat tersebut dapat digunakan untuk memprediksi
calon konsumen apakah akan diterima atau ditolak pengajuan permohonan
kreditnya.
4.2.1 Maksimum Tree
Secara keseluruhan data yang digunakan adalah sebesar 784 data.
Variabel terikat yang digunakan adalah variabel approval yang merupakan
variabel kategorik. Sementara itu, variabel bebas yang digunakan adalah
variabel uang muka, tenor pembayaran, bunga pinjaman, dan harga OTR yang
merupakan variabel numerik, serta variabel jenis kelamin dan variabel kondisi
kendaraan yang merupakan variabel kategorik. Karena variabel terikat yang
digunakan dalam penelitian kali ini adalah variabel kategorik maka CART
36
akan menghasilkan model tree berupa classification tree dengan aturan
pemisahan yang dipakai adalah Twoing splitting rule.
Dalam penelitian ini maksimum tree yang dihasilkan adalah model tree
yang memiliki terminal node paling banyak yaitu sebanyak 83 terminal node.
Relative cost dari maksimum tree didapatkan dari hasil pengujian model
dengan menggunakan test sample yang diperlihatkan pada Tabel 4.6 dibawah
ini :
Tabel 4.6 Misclassification untuk Test Sample pada Maksimum Tree
Kelas Jumlah
Kelas
Jumlah
Kesalahan Kelas
Persentase
Kesalahan
Nilai
Diterima 647 201 31.07 0.31
Ditolak 137 68 49.64 0.50
Total 784 269 40.35 0.405
Dari Tabel 4.6 di atas dapat dijelaskan bahwa untuk kelas approval
yang diterima permohonan kreditnya dengan jumlah kasus sebanyak 647 dan
jumlah kesalahan pengkelasan sebanyak 201 dan presentase kesalahan sebesar
31.07%, sehingga menghasilkan resiko sebesar 0.31. Sementara untuk kelas
approval yang permohonan kreditnya ditolak dengan jumlah kasus sebanyak
137 dan jumlah kesalahan pengkelasan sebanyak 68 kasus dan persentase
kesalahan sebesar 49.64% menghasilkan resiko sebesar 0.50. Dengan demikian
maksimum tree yang dihasilkan memiliki nilai resiko paling besar yaitu
( )
= 0.405. Adapun model maksimum tree yang dihasilkan dapat dilihat
pada Lampiran I.
37
Untuk menjelaskan aturan pengklasifikasian berdasarkan model
maksimum tree yang dihasilkan perlu dilakukannya pengoptimalan model tree
yang didapat, berikut akan ditampilkan salah satu contoh cabang pada model
maksimum tree.
Gambar 4.1 Diagram Salah Satu Cabang Maksimum Tree
Dengan mengikuti alur dari gambar di atas yang merupakan salah satu
cabang model tree dapat dijelaskan mengenai aturan klasifikasi dari terminal
node 68 sampai dengan terminal node 78, adalah sebagai berikut :
1. Aturan klasifikasi untuk terminal node 68
Jika bunga pinjaman ≤ 6.631.300, harga OTR > 15.440.000, harga OTR ≤
15.550.000, uang muka > 1.275.000, dan uang muka ≤ 2.550.000, maka
probabilitas calon konsumen tersebut diterima permohonan kreditnya
adalah sebesar 1. Adapun jumlah kasus yang terdapat pada terminal node
68 adalah sebanyak 8 data, dengan persentase data sebesar 1% resiko
sebesar 0.
38
2. Aturan klasifikasi untuk terminal node 69
Jika harga OTR > 15.440.000, harga OTR ≤ 15.550.000, uang muka >
2.550.000, dan uang muka ≤ 4.475.000, bunga pinjaman ≤ 3.917.750,
maka probabilitas calon konsumen tersebut ditolak permohonan kreditnya
adalah sebesar 0.56. Adapun jumlah kasus yang terdapat pada terminal
node 69 adalah sebanyak 9 data, dengan persentase data sebesar 1.1%
resiko sebesar 0.45.
3. Aturan klasifikasi untuk terminal node 70
Jika harga OTR > 15.440.000, harga OTR ≤ 15.550.000, bunga pinjaman
> 3.917.750, bunga pinjaman ≤ 6.631.300, uang muka > 2.550.000, dan
uang muka ≤ 2.675.000 maka probabilitas calon konsumen tersebut ditolak
permohonan kreditnya adalah sebesar 0.5. Adapun jumlah kasus yang
terdapat pada terminal node 70 adalah sebanyak 10 data, dengan
persentase data sebesar 1.3% resiko sebesar 0.5.
4. Aturan klasifikasi untuk terminal node 71
Jika harga OTR > 15.440.000, harga OTR ≤ 15.550.000, uang muka >
2.675.000, dan uang muka ≤ 4.475.000, bunga pinjaman > 3.917.750,
bunga pinjaman ≤ 6.214.600, maka probabilitas calon konsumen tersebut
diterima permohonan kreditnya adalah sebesar 1. Adapun jumlah kasus
yang terdapat pada terminal node 71 adalah sebanyak 7 data, dengan
persentase data sebesar 0.9% resiko sebesar 0.
39
5. Aturan klasifikasi untuk terminal node 72
Jika harga OTR > 15.440.000, harga OTR ≤ 15.550.000, uang muka >
2.675.000, dan uang muka ≤ 4.475.000, bunga pinjaman > 6.214.600,
bunga pinjaman ≤ 6.631.300, maka probabilitas calon konsumen tersebut
ditolak permohonan kreditnya adalah sebesar 0.25. Adapun jumlah kasus
yang terdapat pada terminal node 72 adalah sebanyak 4 data, dengan
persentase data sebesar 0.5% resiko sebesar 0.75.
6. Aturan klasifikasi untuk terminal node 73
Jika uang muka > 1.275.000, uang muka ≤ 4.475.000, harga OTR >
15.550.000, dan bunga pinjaman ≤ 4.148.530, maka probabilitas calon
konsumen tersebut ditolak permohonan kreditnya adalah 0.429. adapun
jumlah kasus yang terdapat pada terminal node 73 adalah sebanyak 7 data,
dengan persentase data sebesar 0.9%, resiko sebesar 0.5714.
7. Aturan klasifikasi untuk terminal node 74
Jika uang muka > 1.275.000, uang muka ≤ 4.475.000, harga OTR >
15.550.000, bunga pinjaman > 4.148.530, dan bunga pinjaman ≤6.631.300
maka probabilitas calon konsumen tersebut ditolak permohonan kreditnya
adalah 0.833. Adapun jumlah kasus yang terdapat pada terminal node 74
adalah sebanyak 6 data, dengan persentase data sebesar 0.8%, resiko
sebesar 0.1667.
40
8. Aturan klasifikasi untuk terminal node 75
Jika bunga pinjaman ≤ 6.631.300, uang muka > 4.475.000, harga OTR >
15.440.000, dan harga OTR ≤ 18.973.000, maka probabilitas calon
konsumen tersebut diterima permohonan kreditnya adalah 1. Adapun
jumlah kasus yang terdapat pada terminal node 75 sebanyak 8 data,
dengan persentase data sebesar 1%, dan resiko sebesar 0.
9. Aturan klasifikasi untuk terminal node 76
Jika bunga pinjaman ≤ 6.631.300, uang muka > 4.475.000, harga OTR >
18.973.000 dan tenor pembayaran ≤ 22, maka probabilitas calon
konsumen tersebut ditolak permohonan kreditnya adalah 0.332. Adapun
jumlah kasus yang terdapat pada terminal node 76 sebanyak 9 data,
dengan persentase data sebesar 1.1%, dan resiko sebesar 0.667.
10. Aturan klasifikasi untuk terminal node 77
Jika bunga pinjaman ≤ 6.631.300, uang muka > 4.475.000, harga OTR >
18.973.000, tenor pembayaran > 22, dan tenor pembayaran ≤ 28, maka
probabilitas calon konsumen tersebut diterima permohonan kreditnya
adalah 1. Adapun jumlah kasus yang terdapat pada terminal node 77
sebanyak 6 data, dengan persentase data sebesar 0.8%, dan resiko sebesar
0.
11. Aturan klasifikasi untuk terminal node 78
Jika bunga pinjaman ≤ 6.631.300, uang muka > 4.475.000, harga OTR >
18.973.000, dan tenor pembayaran > 28, maka probabilitas calon
41
konsumen tersebut ditolak permohonan kreditnya adalah 1. Adapun
jumlah kasus yang terdapat pada terminal node 78 sebanyak 2 data,
dengan persentase data sebesar 0.3%, dan resiko sebesar 0.
4.2.2 Optimal tree
Untuk memperoleh relative cost yang paling kecil dan terminal node
terbaik pada maksimum tree yang telah didapat pada pembahasan sebelumnya
perlu dilakukan pengoptimalan tree dengan menggunakan prosedur cross
validation. Optimal tree yang dihasilkan dalam penelitian kali ini merupakan
model tree yang memiliki terminal node sebanyak 6 buah dan memilki tinggi
tree 4 level. Relative cost yang didapat dalam model optimal tree didasarkan
pada hasil pengujian model dengan menggunakan test sample yang
diperlihatkan pada Tabel 4.7 berikut ini.
Tabel 4.7 Misclassification untuk Test Sample pada Optimal Tree
Kelas Jumlah
Kelas
Jumlah
Kesalahan Kelas
Persentase
Kesalahan
Nilai
Diterima 647 301 46.52 0.47
Ditolak 137 46 33.58 0.34
Total 784 357 40.05 0.405
Dari Tabel 4.7 di atas dapat dijelaskan bahwa untuk kelas approval yang
diterima permohonan kreditnya dengan jumlah kasus sebanyak 647 dan jumlah
kesalahan pengkelasan sebanyak 301 dan presentase kesalahan sebesar
46.52%, sehingga menghasilkan resiko sebesar 0.47. Sementara untuk kelas
approval yang permohonan kreditnya ditolak dengan jumlah kasus sebanyak
42
137 dan jumlah kesalahan pengkelasan sebanyak 46 kasus dan persentase
kesalahan sebesar 33.58% menghasilkan resiko sebesar 0.34. Dengan demikian
optimum tree yang dihasilkan memiliki nilai resiko paling besar yaitu
( )
= 0.405.
Adapun model optimal tree yang terbentuk dapat dilihat paga gambar 4.2
berikut ini.
Gambar 4.2 Splitter Optimal Tree Menggunakan Twoing Splitting Rule
Dengan mengikuti alur pada Gambar 4.2 diatas yang merupakan model
optimal tree maka aturan klasifikasi dapat dihasilkan. Aturan klasifikasi beserta
kemungkin diterima atau ditokalnya suatu permohonan kredit dari konsumen
akan dibahas dari klasifikasi berdasarkan terminal node 1 sampai terminal
node 6.
UANG_MUKA <= 1275000.00
TerminalNode 1
Class = 1Class Cases %
1 62 96.92 2 3.1
W = 64.00N = 64
UANG_MUKA <= 1575000.00
TerminalNode 2
Class = 1Class Cases %
1 102 86.42 16 13.6
W = 118.00N = 118
UANG_MUKA > 1575000.00
TerminalNode 3
Class = 2Class Cases %
1 75 70.12 32 29.9
W = 107.00N = 107
UANG_MUKA <= 1950000.00
Node 4Class = 2
UANG_MUKA <= 1575000.00Class Cases %
1 177 78.72 48 21.3
W = 225.00N = 225
UANG_MUKA > 1950000.00
TerminalNode 4
Class = 1Class Cases %
1 243 88.02 33 12.0
W = 276.00N = 276
HARGA_OTR <= 13915000.00
Node 3Class = 1
UANG_MUKA <= 1950000.00Class Cases %
1 420 83.82 81 16.2
W = 501.00N = 501
BUNGA_PINJAMAN <= 6631300.00
TerminalNode 5
Class = 2Class Cases %
1 128 72.32 49 27.7
W = 177.00N = 177
BUNGA_PINJAMAN > 6631300.00
TerminalNode 6
Class = 1Class Cases %
1 37 88.12 5 11.9
W = 42.00N = 42
HARGA_OTR > 13915000.00
Node 5Class = 2
BUNGA_PINJAMAN <= 6631300.00Class Cases %
1 165 75.32 54 24.7
W = 219.00N = 219
UANG_MUKA > 1275000.00
Node 2Class = 2
HARGA_OTR <= 13915000.00Class Cases %
1 585 81.32 135 18.8
W = 720.00N = 720
Node 1Class = 1
UANG_MUKA <= 1275000.00Class Cases %
1 647 82.52 137 17.5
W = 784.00N = 784
43
1. Aturan klasifikasi untuk terminal node 1
Jika uang muka ≤ 1.275.000, maka probabilitas calon konsumen tersebut
dierima permohonan kreditnya adalah sebesar 0.968. Adapun jumlah kasus
yang terdapat pada terminal node 1 sebesar 64 data, dengan persebtase
data sebesar 8.2% dengan resiko 0.03.
2. Aturan klasifikasi untuk terminal node 2
Jika harga OTR ≤ 13.915.000, uang muka > 1.275.000, dan uang muka
≤1.575.000, maka probabilitas calon konsumen tersebut diterima
permohonan kreditnya adalah sebesar 0.824. Adapun jumlah kasus yang
terdapat pada terminal node 2 adalah sebesar 118 data, dengan persentase
sebesar 15.1%, dan resiko kesalahan sebesar 0.1356.
3. Aturan klasifikasi untuk terminal node 3
Jika harga OTR ≤ 13.915.000, uang muka > 1.575.000, dan uang muka ≤
1.950.000 maka probabilitas calon konsumen tersebut ditolak permohonan
kreditnya adalah sebesar 0.3. Adapun jumlah kasus yang terdapat pada
terminal node 3 adalah sebesar 107 data, dengan persentase sebesar
13.6%, dan resiko kesalahan sebesar 0.7.
4. Aturan klasifikasi untuk terminal node 4
Jika harga OTR ≤ 13.915.000 dan uang muka > 1.950.000, maka
probabilitas calo konsumen tersebut diterima permohonan kreditnya
adalah sebesar 0.881. Adapun jumlah kasus yang terdapat pada terminal
node 4 adalah sebesar 276 data, dengan persentase data sebesar 35.2%,
dan resiko kesalahan sebesar 0.119.
44
5. Aturan klasifikasi untuk terminal node 5
Jika uang muka > 1.275.000, harga OTR > 13.915.000, dan bunga
pinjaman ≤ 6.631.300, maka probabilitas calon konsumen tersebut ditolak
permohonan kreditnya adalah sebesar 0.28. Adapun jumlah kasus yang
terdapat pada terminal node 5 adalah sebesar 177 data, dengan persentase
data sebesar 22.6%, dan resiko kesalahan sebesar 0.72.
6. Aturan klasifikasi untuk terminal node 6
Jika uang muka > 1.275.000, harga OTR > 13.915.000, dan bunga
pinjaman > 6.631.300, maka probabilitas calon konsumen tersebut
diterima permohonan kreditnya adalah sebesar 0.881. Adapun jumlah
kasus yang terdapat pada terminal node 6 adalah sebesar 42 data, dengan
persentase data sebesar 5.4%, dan resiko kesalahan sebesar 0.119.
Akan tetapi, dalam model optimum pengklasifikasian permohonan kredit
konsumen yang sudah didapat diatas terdapat hal menarik yang dapat dijadikan
sedikit evaluasi untuk pihak perusahaan, yaitu belum jelasnya standar penilaian
diterima atau ditolaknya sebuah permohonan kredit konsumen. Hal ini dapat
dilihat pada hasil akhir yang terdapat pada terminal node 1 dan terminal node
lainnya. Pada terminal node 1 variabel yang menjadi tolak ukur klasifikasi
permohonan kredit yang diterima hanya variabel uang muka yang besarnya ≤
Rp. 1.250.000,00. Namun, pada terminal node lain, jelas terlihat bahwa selain
uang muka terdapat variabel lain yang menjadi tolak ukur pengklasifikasian
permohonan kredit konsumen yakni variabel harga OTR dan variabel bunga
pinjaman.
45
Laporan kesimpulan dari model optimal tree yang diperoleh dapat dilihat
pada gains cart dibawah ini :
Tabel 4.8 GAINS CHART
Node
Persentase Komulatif
Kelas Terikat
Persentase
Komulatif Populasi
3 23.36 13.65
5 59.12 36.22
2 70.80 51.28
4 94.89 86.48
6 98.54 91.84
1 100.00 100.00
Menurut [5] suatu model optimal tree dikatakan suatu model yang dapat
mempresentasikan data awal yang digunakan jika hasil akhir persentase
komulatif kelas terikat (Cum% Tgt. Class) lebih besar daripada persentasi
komulatif dari populasinya (Cum% Pop). Seperti yang terlihat pada Tabel 4.8
dapat dilihat bahwa nilai Cum% Tgt. Class yang didapat lebih besar daripada
nilai Cum% Pop –nya kesimpulkan tersebut juga dikuatkan dengan grafik pada
Gambar 4.3 di bawah. Hal ini menunjukkan bahwa model optimal tree yang
terbentuk dapat dikatakan suatu model yang dapat mempresentasikan data awal
yang dipakai dalam penelitian.
Gambar 4.3 Gains CART Optimal Tree
0
50
100
150
1 2 3 4 5 6
Cum % Tgt.Class
Cum % Pop
46
Setelah mengetahui bahwa model tersebut sudah dikatakan dapat
mempresentasikan data awal, selanjutnya dapat diketahui persentase
keberhasilan pengelompokan berdasarkan Tabel 4.9 berikut ini :
Tabel 4.9 Prediction Success
Variabel
kelas
Jumlah
Kasus
Persentase
Sukses
Prediksi Kelas
1 (Diterima) 2(Ditolak)
1(Diterima) 647 68.62 444 203
2(Ditolak) 137 59.12 56 81
Total 784 63.87
Pada Tabel 4.9, persentase berhasilnya pengelompokan pada data
percobaan diperlihatkan untuk masing-masing kelompok. Pada kelompok
permohonan kredit yang diterima terdapat 647 konsumen, setelah dilakukan
kembali pengelompokan tersebut terdapat 444 konsumen dengan tepat
dikelompokkan ke dalam kelompok konsumen yang diterima permohonan
kreditnya, sehingga persentase kesuksesan pengelompokan untuk kelompok
permohonan kredit yang diterima adalah 68.62%. Begitu pula, pada kelompok
permohonan kredit yang ditolak terdapat 137 konsumen, setelah dilakukan
kembali pengelompokan tersebut kesuksesan pengelompokan sebanyak 81
konsumen, sehingga persentasenya adalah 59.12%. Secara keseluruhan,
kesuksesan pengelompokan yang telah dilakukan dapat dilihat pada tabel 4.10
yaitu total kesuksesan pengelompkkan yang dilakukan sebanyak 525 konsumen
dari total 784 konsumen, sehingga persentase total kesuksesan pengelompokan
sebesar 63.87%.
47
Setelah mengetahui akurasi pengelompokan dengan model CART
metode classification tree, selanjutnya dapat diketahui urutan variabel pemisah.
Berdasarkan kontribusi yang terbesar terhadap proses pemisahan berarti
memiliki peranan yang paling penting dalam pengelompokan dan sebaliknya
semakin kecil kontribusinya terhadap proses pemisahan maka memilki peranan
yang kurang penting dalam proses pemisahan, dapat dilihat pada Tabel 4.10
berikut :
Tabel 4.10 Variabel Terpenting
Variabel Nilai
Uang Muka 100.00 |||||||||||||||||||||||||||||||||||||||||||||||||
Harga OTR 24.04 ||||||||||
Bunga Pinjaman 21.50 ||||||||
Tenor Pembayaran 6.69 ||
Kondisi Kendaraan 5.01 |
Jenis Kelamin 0.55
Pada Tabel 4.10, diperlihatkan bahwa variabel pemisah yang terpenting
dalam proses pembentukan model tree adalah variabel uang muka dengan nilai
kontribusi 100. Setelah itu variabel harga OTR dan variabel bunga pinjaman
yang mempunyai nilai kontribusi rata-rata sebesar 22.77. Sementara untuk
variabel tenor pembayaran dan kondisi kendaraan memiliki nilai kontribusi
yang kurang dari 10%. Sedangkan untuk variabel jenis kelamin mempunyai
nilai kontribusi yang kurang dari 1% yakni sebesar 0.55, berarti tidak memiliki
peranan dalam pemisahan kelompok.
48
BAB V
KESIMPULAN DAN SARAN
5.1 Kesimpulan
Data konsumen diolah menggunakan metode CART yang menghasilkan
suatu model tree yang dapat ditarik suatu kesimpulan berdasarkan tujuan dari
penulisan skripsi ini. Pertama, variabel yang menjadi faktor terpenting dalam
menentukan pola klasifikasi persetujuan permohonan kredit adalah variabel
uang muka. Kemudian setelah variabel uang muka, variabel yang memilki
peran cukup penting adalah variabel harga OTR dan variabel bunga pinjaman.
Sementara untuk variabel tenor pembayaran dan kondisi kendaraan hanya
mempunyai sedikit peran dalam pembentukan model, sementara untuk variabel
jenis kelamin tidak memiliki peran penting dalam proses pembentukan model
tree.
Kedua, pola klasifikasi calon konsumen akan diterima permohonan
kreditnya adalah sebagai berikut :
1. Jika harga OTR ≤ 13.915.000 dan uang muka berkisar antara 1.275.000
– 1.575.000, maka prbabilitas konsumen tersebut diterima permohonan
kreditnya adalah 0.865 yang berarti kemungkinan permohonan
kreditnya akan diterima lebih besar.
2. Jika harga OTR ≤ 13.915.000 dan uang muka > 1.950.000, maka
probabilitas konsumen tersebut diterima permohonan kreditnya adalah
49
sebesar 0.881, yang berarti kemungkinan permohonan kreditnya
diterima lebih besar.
3. Jika uang muka > 1.275.000, harga OTR > 13.915.000, dan bunga
pinjaman > 6.631.300, maka probabilitas konsumen tersebut akan
diterima permohonan kreditnya adalah 0.881, yang berarti
kemungkinan permohonan kreditnya diterima lebih besar.
Ketiga model tree permohonan kredit diterima yang optimal
digambarkan sebagai berikut :
Gambar 5.1 Optimal Tree
Model optimal tree di atas memilki resiko atau relative cost paling kecil
yaitu sebesar 0.405 sehingga model tree inilah yang dikatakan dapat dipakai
oleh pihak perusahaan untuk memprediksi calon konsumen baru.
UANG_MUKA <= 1275000.00
TerminalNode 1
Class = 1Class Cases %
1 62 96.92 2 3.1
W = 64.00N = 64
UANG_MUKA <= 1575000.00
TerminalNode 2
Class = 1Class Cases %
1 102 86.42 16 13.6
W = 118.00N = 118
UANG_MUKA > 1575000.00
TerminalNode 3
Class = 2Class Cases %
1 75 70.12 32 29.9
W = 107.00N = 107
UANG_MUKA <= 1950000.00
Node 4Class = 2
UANG_MUKA <= 1575000.00Class Cases %
1 177 78.72 48 21.3
W = 225.00N = 225
UANG_MUKA > 1950000.00
TerminalNode 4
Class = 1Class Cases %
1 243 88.02 33 12.0
W = 276.00N = 276
HARGA_OTR <= 13915000.00
Node 3Class = 1
UANG_MUKA <= 1950000.00Class Cases %
1 420 83.82 81 16.2
W = 501.00N = 501
BUNGA_PINJAMAN <= 6631300.00
TerminalNode 5
Class = 2Class Cases %
1 128 72.32 49 27.7
W = 177.00N = 177
BUNGA_PINJAMAN > 6631300.00
TerminalNode 6
Class = 1Class Cases %
1 37 88.12 5 11.9
W = 42.00N = 42
HARGA_OTR > 13915000.00
Node 5Class = 2
BUNGA_PINJAMAN <= 6631300.00Class Cases %
1 165 75.32 54 24.7
W = 219.00N = 219
UANG_MUKA > 1275000.00
Node 2Class = 2
HARGA_OTR <= 13915000.00Class Cases %
1 585 81.32 135 18.8
W = 720.00N = 720
Node 1Class = 1
UANG_MUKA <= 1275000.00Class Cases %
1 647 82.52 137 17.5
W = 784.00N = 784
50
5.2 Saran
Akurasi dari model tree yang didapat dirasa kurang optimal. Ada
kemungkinan penyebab utamanya karena jumlah pengamatan yang tidak
seimbang dalam masing-masing kelompok jenis permohonan kredit baik yang
diterima maupun ditolak, yaitu sebesar 82.5% untuk data permohonan kredit
yang diterima dan 17.5% untuk data permohonan kredit yang ditolak.
Selain dari itu, sedikitnya jenis variabel yang didapat oleh penulis dalam
skripsi ini juga dapat melemahkan tingkat akurasi model. Oleh karena itu,
penulis mengharapkan dalam penelitian selanjutnya akan lebih baik dengan
menambahkan jenis variabel yang dimasukkan dalam model dan membuat
perbandingan yang sama terhadap data permohonan kredit antara permohonan
kredit yang diterima atapun ditolak.
54
Biodata Penulis
Nama Lengkap : Dendy Saputro
Nama Panggilan : Dendy
NIM : 107094002797
Tempat, Tanggal Lahir : Jakarta, 21 Mei 1989
Jenis Kelamin : Laki-laki
Alamat Rumah : Jl. Musyawarah Rt. 04/001 No.86
Desa Sawah Kecamatan Ciputat
Kota Tangerang Selatan 15413
No. HP : 085697557289
Email : [email protected]
Kewarganegaraan : Indonesia
Tinggi/Berat Badan : 172 cm/ 89 kg
Program Studi : MIPA Matematika
IPK : 3.41
1. Universitas Islam Negeri Syarif Hidayatullah Jakarta, Fakultas Sains dan
Teknologi (FST), Jurusan MIPA (Matematika), Program Studi Matematika
Statistika, lulus bulan Juni 2011.
2. SMU Negeri 2 Ciputat, lulus tahun 2007, berijazah.
3. SMP Negeri 2 Ciputat, lulus tahun 2004, berijazah.
4. SD Negeri 02 Kampung Sawah, lulus tahun 2001, berijazah.
5. RA Nurul Huda Pondok Karya lulus tahun 1995, berijazah.
Ciputat, 10 Juni 2011
Penulis
DAFTAR RIWAYAT HIDUP
DATA PRIBADI
RIWAYAT PENDIDIKAN
51
DAFTAR PUSTAKA
[1] Amarnath, K.N. Statistical Methods in Consumer Credit Scoring. Cranes
Software Internasiaonal Ltd . Product Analyst .2004
[2] Andriyashin, Anton. Financial Applications of Classification And
Regression Tree (CART). Master Thesis. CASE – Center of Applied
Statistics and Aconomics. Humboldt University. 2006.
[3] Angarini, Dini. Klasifikasi Kondisi Kesehatan Jantung Menggunakan
Metode Multiple Discriminant Analysis (MDA) Dan Classification and
Regression Tree (CART). Jakarta : Universitas Islam Negeri. 2007.
[4] Giudici, Paolo . Applied Data Mining, Satistical Methods for Business
and Industry. Italy : Faculty of Economics University of Pavia. 2003.
[5] Manual CART. An Implementation of the Original CART Methodology
by Salford System. California : Salford System San Diago. 2002
[6] Nur Rahman, Andi. Klasifikasi Penyakit Diabetes Positif Menggunakan
Classification and Regreesion Tree. Jakarta : Universitas Islam Negeri.
2006.
[7] Siegel, Sidney. STATISTIK NONPARAMETRIK. Jakarta : PT Gramedia,
Anggota IKAPI. 1985.
[8] Timfee, Roman. Classification And Regression Tree (CART) Theory and
Application. Master Thesis. CASE – Center of Applied Statistics and
Aconomics. Humboldt University. 2003.
[9] Trihendradi, C.Step by Step SPSS 16 Analisis Data Statistik. Yogyakarta
: Penerbit ANDI. 2009.
52
[10] http : // Edward Tanjung, Doddy. Apa Itu Kredit (1)-Prosedur Memperoleh
Kredit. usaha-umkm.blogspot.com, tanggal 17 Mei 2010, pukul 17.36
WIB.
LAMPIRAN I
UANG_MUKA <= 1275000.00
TerminalNode 1
Class = 1Class Cases %
1 62 96.92 2 3.1
W = 64.00N = 64
UANG_MUKA <= 1575000.00
TerminalNode 2
Class = 1Class Cases %
1 102 86.42 16 13.6
W = 118.00N = 118
UANG_MUKA > 1575000.00
TerminalNode 3
Class = 2Class Cases %
1 75 70.12 32 29.9
W = 107.00N = 107
UANG_MUKA <= 1950000.00
Node 4Class = 2
UANG_MUKA <= 1575000.00Class Cases %
1 177 78.72 48 21.3
W = 225.00N = 225
UANG_MUKA > 1950000.00
TerminalNode 4
Class = 1Class Cases %
1 243 88.02 33 12.0
W = 276.00N = 276
HARGA_OTR <= 13915000.00
Node 3Class = 1
UANG_MUKA <= 1950000.00Class Cases %
1 420 83.82 81 16.2
W = 501.00N = 501
BUNGA_PINJAMAN <= 6631300.00
TerminalNode 5
Class = 2Class Cases %
1 128 72.32 49 27.7
W = 177.00N = 177
BUNGA_PINJAMAN > 6631300.00
TerminalNode 6
Class = 1Class Cases %
1 37 88.12 5 11.9
W = 42.00N = 42
HARGA_OTR > 13915000.00
Node 5Class = 2
BUNGA_PINJAMAN <= 6631300.00Class Cases %
1 165 75.32 54 24.7
W = 219.00N = 219
UANG_MUKA > 1275000.00
Node 2Class = 2
HARGA_OTR <= 13915000.00Class Cases %
1 585 81.32 135 18.8
W = 720.00N = 720
Node 1Class = 1
UANG_MUKA <= 1275000.00Class Cases %
1 647 82.52 137 17.5
W = 784.00N = 784