paper tgs 1_anggi
TRANSCRIPT
5/12/2018 Paper Tgs 1_anggi - slidepdf.com
http://slidepdf.com/reader/full/paper-tgs-1anggi 1/6
Topic: Data Mining
Kriteria Usaha Mikro Kecil dan Menengah
menggunakan Klasifikasi Decision Tree
Anggraini Naya Parahita dan Jeanny Mareta DaudJurusan Sistem Informasi – Fakultas Teknologi Informasi
Institut Teknologi Sepuluh Nopember
Jalan Raya ITS Sukolilo
Surabaya, Indonesia
Abstract — UMKM (Usaha Mikro, Kecil, dan Menengah) telah
memegang peranan penting dalam memajukan perekonomian
suatu negara khususnya di Indonesia. UMKM yang memiliki
peranan penting dalam menyerap tenaga kerja, meningkatkan
jumlah unit usaha, dan mendukung pendapatan devisa negara
yang potensial. Perkembangan UMKM dipengaruhi oleh banyak
faktor salah satunya adalah permasalahan umum yang biasanya
dihadapi oleh para pelaku usaha yaitu pemodalan.Pemodalan
merupakan faktor utama dalam mengembangkan UMKM.
Kurangnya pemodalan UMKM pada umumnya pemberian
modal pinjaman atau disebut dengan kredit dari Bank atau
Lembaga keuangan lainnya sulit diperoleh karena persyaratan
administratif dan teknis yang tidak dapat dipenuhi. Salah satu
pengklasifikasian yang dapat membantu pada Usaha Mikro
Kecil dan Menengah adalah melakukan klasifikasi kriteria usaha
yang telah ditentukan oleh Undang – undang Republik Indonesia
Nomor 20 Tahun 2008 tentang Usaha Mikro, Kecil, dan
Menengah. Pengklasifikasian ini dibuat menggunakan metode
klasifikasi decision tree, dimana pada metode ini dibutuhkan
suatu data valid sehingga nantinya pengklasifikasian ini dapatmengambil suatu keputusan. Dengan mengukur nilai terkecil
dari split data record menggunakan GINI Index, maka akan
didapatkan nilai distribusi dari masing-masing class sehingga
didapatkan decision treedengan nilai impurity yang kecil. Dengan
menggunakandecision tree,mampu memberikan keputusan
berdasarkan skala prioritas atribut yang digunakan. Keluaran
dari kriteria UMKM menggunakan decision tree ini diharapkan
dapat membantu Pemerintah khususnya Bank dan Lembaga
Keuangan lainnya dalam pemberdayaan dengan menentukan
kategori usaha mikro, kecil, dan menengah yang dapat dijadikan
sebagai tolok ukur dalam basis penyediaan pembiayaan atau
sering dikenal dengan Kredit.
Keywords-component; UMKM, Klasifikasi, Metode Decision Tree.
PENDAHULUAN
UMKMadalah bagian penting dari perekonomian suatu
Negara maupun daerah, begitu juga dengan Negara Indonesia.
UMKM ini sangat memiliki peranan penting dalam laju
perekonomian masyarakat. UMKM ini sangat membantu
Negara/pemerintah dalam hal penciptaan lapangan pekerjaan
baru sehingga tercipta unit kerja baru yang menggunakan
tenaga tenaga kerja baru yang dapat mendukung pendapatan
Rumah tangga. Definisi UMKM adalah Usaha kecil termasuk
usaha mikro merupakan suatu badan usaha milik warga negara
Indonesia, baik perseorangan maupun berbadan hukum yang
memiliki kekayaan bersih, tidak termasuk tanah dan bangunan
sebanyak-banyaknya Rp.200 Juta atau mempunyai hasil penjualan rata-rata pertahun Rp. 1 Milyar dan usaha tersebut
berdiri sendiri. [1]
Selama krisis membuktikan bahwa kegiatan ekonomi
rakyat kecil dalam bentuk UMKM merupakan bagian terbesar
dalam kegiatan ekonomi masyarakat dan lebih dapat bersaing.
Hal tersebut dipengaruhi oleh Daya tahan UMKM tidak
banyak memiliki ketergantungan pada faktor eksternal seperti
utang dalam valuta asing dan bahan baku impor dalam
melakukan kegiatannya. Dengan melihat keunggulan potensi
spesifik seperti ini maka Pemerintah dalam mengatasi krisis
ekonomi adalah memberdayakan UMKM dengan cara
memberikan pembiayaan atau yang disebut kredit untuk
mendukung berlangsungnya kegiatan UMKM.Berbagai macam persyaratan penetuan dalam pemberian
kredit yang telah di atur dalam Peraturan Undng – Undang
Republik Indonesia Nomor 20 Tahun 2008 dan hampir
sebagian besar UMKM tidak memenuhi dalam kriteria
tersebut. Tujuan yang akan di capai dalam pelaksanaan studi
kasus ini, adalah untuk menentukan dan mengetahui kategori
usaha mikro, kecil, dan menengah yang dapat membantu
Pemerintah khususnya Bank dan Lembaga Keuangan lainnya
dalam pemberdayaan usaha mikro, kecil, dan menengah yang
dapat dijadikan sebagai tolok ukur dalam basis penyediaan
pembiayaan atau sering dikenal dengan Kredit.
Dari data yang didapatkan mengenai kriteria UMKM, akan
dilakukan analisis data mining untuk mengetahui kategori
usaha. Data mining merupakan proses ekstraksi informasi atau
pola penting dalam basis data berukuran besar [4]. Studi kasus
ini menggunakan suatu teknik dalam data mining yaitu
klasifikasi terhadap data tersebut. Dengan menggunakan 4
attribute yaitu kepemilikan, jenis usaha, kekayaan bersih, dan
hasil penjualan tahunan.
Perhitungan pada studi kasus ini menggunakan metode
decision tree dapat menghasilkan pola data dalam bentuk tree
dan rule, sehingga data menjadi mudah dipahami. Adapun
manfaat yang diharapkan dari hasil studi kasus ini adalah
1
5/12/2018 Paper Tgs 1_anggi - slidepdf.com
http://slidepdf.com/reader/full/paper-tgs-1anggi 2/6
Topic: Data Mining
sebagai bahan informasi yang akurat bagi pemerintah, lembaga
perbankan dan UMKM dalam hubungannya dengan kebijakan
penentuan penyaluran kredit kepada UMKM khususnya dalam
UMKM selain itu diharapkan mampu turut berpartisipasi
dalam pengembagan teoritis.
TINJAUAN PUSTAKA
A. Pengertian UMKM
Undang-Undang Nomor 20 Tahun 2008 tentang Usaha
Mikro, Kecil dan Menengah menyebutkan bahwa yang dapat
dikategorikan sebagai UMKM adalah Usaha kecil termasuk
usaha mikro merupakan suatu badan usaha milik warga negara
Indonesia, baik perseorangan maupun berbadan hukum yang
memiliki kekayaan bersih, tidak termasuk tanah dan bangunan
sebanyak-banyaknya Rp.200 Juta atau mempunyai hasil
penjualan rata-rata pertahun Rp. 1 Milyar dan usaha tersebut
berdiri sendiri.Cakupan yang luas dan melebar memang
menyebabkan fokus pengembangan sering tidak efektif,
karena karakter dan orientasi bisnis yang dijalankan oleh para pemilik usaha, jika digunakan basis penyediaan pembiayaan
sebagai tolok ukur, maka UMKM dalam pengertian Undang-
Undang Nomor 20 Tahun 2008 dapat dibedakan menjadi tiga
kelompok:
(1) Kriteria Usaha Mikro adalah sebagai
berikut:
a.memiliki kekayaan bersih paling banyak
Rp50.000.000,00 (lima puluh juta rupiah) tidak
termasuk tanah dan bangunan tempat usaha; atau
b.memiliki hasil penjualan tahunan paling banyak
Rp300.000.000,00 (tiga ratus juta rupiah).
(2) Kriteria UMKM adalah sebagai berikut:
a.memiliki kekayaan bersih lebih dari Rp50.000.000,00(lima puluh juta rupiah) sampai dengan paling
banyak Rp500.000.000,00 (lima ratus juta rupiah)
tidak termasuk tanah dan bangunan tempat usaha;
atau
b.memiliki hasil penjualan tahunan lebih dari
Rp300.000.000,00 (tiga ratus juta rupiah) sampai
dengan paling banyak Rp2.500.000.000,00 (dua
milyar lima ratus juta rupiah).
(3) Kriteria Usaha Menengah adalah sebagai
berikut:
a.memiliki kekayaan bersih lebih dari
Rp500.000.000,00 (lima ratus juta rupiah) sampai
dengan paling banyak Rp10.000.000.000,00(sepuluh milyar rupiah) tidak termasuk tanah dan
bangunan tempat usaha; atau
b.memiliki hasil penjualan tahunan lebih dari
Rp2.500.000.000,00 (dua milyar lima ratus juta
rupiah) sampai dengan paling banyak
Rp50.000.000.000,00 (lima puluh milyar rupiah).
Memperhatikan ciri-ciri UMKM dan peranannya
yang sangat potensial bagi pembangunan di sektor
ekonomi, maka UMKM perlu terusmenerus dibina dan
diberdayakan secara berkelanjutan agar dapat lebih
berkembang dan maju.
B. Klasifikasi
Klasifikasi merupakan suatu proses untuk menentukan dan
memetakan setiap atribut ke salah satu kelas. Salah satu
contoh dari klasifikasi yaitu memprediksi sel tumor sebagai
jinak atau ganas, bisa juga mengkategorikan berita sepertikeuangan, cuaca, hiburan, olahraga, dll. Terdapat beberapa
teknik untuk menyelesaikan masalah klasifikasi yaitu decision
tree, rule based, neural networks, support vector machines,
dan naive bayes [6].Dari beberapa teknik tersebut, pada studi
kasus paper ini penulis menggunakan teknik decision tree.
1) Decision Tree
Decision Tree merupakan salah satu metode klasifikasi dan
prediksi yang sangat kuat dan terkenal dalam penerapan data
mining. Pada dasarnya Decision Tree mengubah data menjadi
pohon keputusan (decision tree) dan aturan-aturan keputusan
(rule) seperti yang diilustrasikan dalam gambar berikut:
Gambar 1 Ilustrasi Pohon Keputusan
Pada decision tree terdapat 3 jenis node, yaitu:
a. Root Node, merupakan node paling atas, pada node ini
tidak ada input dan bisa tidak mempunyai output atau
mempunyai output lebih dari satu.
b. Internal Node, merupakan node percabangan, pada node
ini hanya terdapat satu input dan mempunyai output
minimal dua.
c. Leaf node atau terminal node, merupakan node akhir, pada
node ini hanya terdapat satu input dan tidak mempunyai
output.Pohon keputusan juga berguna untuk mengeksplorasi data,
menemukan hubungan tersembunyi antara sejumlah calon
variabel input dengan sebuah variabel target. Sebuah pohon
keputusan adalah sebuah struktur yang dapat digunakan untuk
membagi kumpulan data yang besar menjadi himpunan-
himpunan recordyang kebih kecil dengan menerapkan
serangkaian aturan-aturan keputusan [3]. Dengan masing-
masing rangkaian pembagian, anggota himpunan hasil
menjadi mirip satu dengan yang lain. Sebuah pohon keputusan
mungkin dibangun dengan saksama secara manual atau dapat
tumbuh secara otomatis dengan menerapkan salah satu atau
beberapa algoritma pohon keputusan untuk memodelkan
himpunan data yang belum terklasifikasi. Banyak algoritmayang dapat dipakai dalam pembentukan pohon keputusan,
antara lain ID3, CART, dan C4.5 [5]. Variabel tujuan biasanya
dikelompokkan denga pasti dan model pohon keputusan lebih
mengarah pada perhitungan probabilitas dari tiap-tiap
recordterhadap kategori-kategori tersebut atau untuk
mengklasifikasi record dengan mengelompokkannya dalam
satu kelas. MenurutBasuki & Syarif, proses pada pohon
keputusan adalah mengubah bentuk data (tabel) menjadi
model pohon, mengubah model pohon menjadi rule, dan
menyederhanakan rule [2].
2
5/12/2018 Paper Tgs 1_anggi - slidepdf.com
http://slidepdf.com/reader/full/paper-tgs-1anggi 3/6
Topic: Data Mining
Konsep dalam decision tree yaitu:
a. Data dinyatakan dalam bentuk table dengan atribut dan
record
b. Atribut meynatakan suatu parameter yang dibuat sebagai
kriteria dalam pembentukkan tree. Misalkan Jenis Usaha,
Kekayaan, Penjualan dan Kepemilikan. Salah satu atribut
merupakan atribut yang menyatakan data solusi per item
data yang disebut data atribut.c. Atribut memiliki nilai nilai yang dinaamakan dengan value
atau instance. Dimisalkan dalam atribut jenis usaha terdiri
dari 3 value yaitu anak perusahaan,berdiri sendiri dan
cabang perusahaan.
Saat menyusun sebuah decision tree pertama yang harus
dilakukan adalah menentukan atribut mana yang akan menjadi
simpul akar dan atribut mana yang akan menjadi simpul
selanjutnya. Pemilihan atribut yang baik adalah atribut yang
memungkinkan untuk mendapatkan decision tree paling kecil
ukurannya, atau atribut yang bisa memisahkan obyek menurut
kelasnya. Secara real, atribut yang dipilih adalah atribut yang
mempunyai tingkat impurity paling kecil. Tingkat impurity
dapat dilakukan dengan beberapa cara antara lain dengan
menghitung Information Gain, Gain Ratio, atau dengan
menggunakan perhitungan Gini Index. Pada kasus ini,
perhitungan yang dilakukan adalah menggunakan GINI Index.
2) GINI Index
Formula dari Gini Indeks untuk suatu cabang atau kotak A
dapat dihitung sebagai berikut:
(1)
Dimana adalah ratio observasi dalam kotak A yang
masuk dalam kelas K. Jika Gini yang dilambangkan dengan
IG(A) = 0 berarti semua data dalam kotak A berasal dari kelasyang sama. Nilai Gini mencapai maksimum jika dalam kelas
A proporsi data dari masing masing kelas yang ada mencapai
nilai yang sama. Nilai Gini menunjukan distribusi data dari
kelas tersebut.
C. Akurasi
Akurasi adalah nilai derajat kedekatan dari pengukurankuantitas untuk nilai sebenarnya (true). Nilai akurasididapatkan dari hasil rule yang dihasikan dari perhitungandecision tree kemudian di uji coba kan pada data testing danmenghasilkan derajat keakuratan dari rule tersebut setelah diuji coba kan pada data testing.
PENJELASAN DATA
Dalam studi kasus ini menggunakan data record sebanyak 50 record dimana 40 data diidentifikasikan sebagai training setdan 10 data diidentifikasikan sebagai test set. Data tersebutmemiliki 4 atribut yaitu kepemilikan, jenis usaha, kekayaan
bersih, dan hasil penjualan tahunan.Tipe dari atribut kepemilikan yaitu binary attribute dengan
values WNI dan non-WNI. Untuk atribut jenis usaha memilikitipe nominal atrribute dengan 3 values yaitu berdiri sendiri,anak perusahaan, dan cabang perusahaan. Sementara untuk atribut kekayaan bersih dan hasil penjualan tahunan, bertipe
continous attribute.Untuk pembentukan decision tree yangterbaik, dari data yang ada tersebut dilakukan pemisahanatribut/ split attribute berdasarkan tipe dari atribut tersebut yangkemudian ditentukan GINI Index dari masing-masing atributdan split tersebut.
Langkah-langkah yang dilakukan untuk mencapai decisiontree terbaik dalam studi kasus dalam paper ini sehingga dapat
membantu menentukan kategori usaha mikro, kecil, danmenengah yang dapat dijadikan sebagai tolok ukur dalam basis penyediaan pembiayaan adalah:a. Menghitung GINI parent dari data yang dimiliki.
b. Menentukan split dari atribut juga persebaran dan distribusidata di masing-masing atribut.
c. Menghitung nilai GINI Index dari masing-masing split dariatribut.
d. Menentukan atribut yang terbaik dengan nilai GINI yang paling kecil.
e. Menguji keakuratan decision tree dengan data test set yangtelah diidentifikasikan yaitu sebanyak 10 record.
f. Menghitung akurasi data decision tree.
PENGOLAHAN DATA
D. Menentukan Split terbaik dengan perhitungan GINI Index
Dilakukan perhitungan dalam menentukan split terbaik,
dalam studi kasus ini menggunakan perhitungan GINI Index.
Perhitungan ini didefinisikan dalam distribusi kelas dari data
record sebelum dan setelah dilakukan pemisahan/ split .Dengan distribusi data yang dimiliki, didapatkan GINI
parent adalah 0,709. Berikut ini adalah perhitungan GINI
parent dari data yang dimiliki yaitu 1 – (8/40)2 – (8/40)2 –
(7/40)2 – (17/40)2 = 0,709.Table 1 GINI Parent
Parent
mikro 8kecil 8
menengah 7
none 17
GINI = 0,709
1) Atribut Kepemilikan
Atribut kepemilikan memiliki 2 values yaitu WNI dan non-
WNI. Atribut ini bertipe binary attributes karena memiliki dua
keluaran yang potensial. Pada atribut ini dilakukan splitting
binary attribute dapat dilihat dalam diagram di bawah.
Sehingga didapatkan melalui perhitungan GINI di node N1
dan di node N2 didapatkan GINI pada atribut kepemilikan
yaitu 0,884.
3
5/12/2018 Paper Tgs 1_anggi - slidepdf.com
http://slidepdf.com/reader/full/paper-tgs-1anggi 4/6
Topic: Data Mining
Gambar 2 Splitting atribut kepemilikan
2) Atribut Jenis Usaha
Atribut jenis usaha memiliki 3 values yaitu berdiri sendiri,
anak perusahaan, dan cabang perusahaan. Atribut ini bertipeordinal attributes karena dapat dijadikan berkelompok selama
kelompok tersebut tidak mengganggu nilai atribut lainnya.
Pada atribut ini dilakukan splitting mominal attribute dapat
dilihat dalam diagram di bawah.
Gambar 3 Splitting atribut jenis usaha
Nilai GINI untuk split yang pertama adalah 0,914. Untuk
GINI split yang kedua adalah 0,876 dan GINI untuk split yang
ketiga adalah 1,571. Sehingga nilai split terbaik berdasarkan
perhitungan GINI adalah split yamg kedua yaitu
pengelompokan dari {berdiri sendiri} dan {anak perusahaan,
cabang perusahaan} dengan nilai bobot GINI adalah 0,876.
3) Atribut Hasil Penjualan Tahunan
Pada atribut ini memiliki record dengan data bertipe
numeric dan atribut ini bertipe continous atribut. Dilakukan
pengelompokan dengan menggunakan splitting continous
attribute.
Gambar 4 Splitting Atribut Penjualan Tahunan
Dalam split continuous attribute, mempertimbangkan
posisi kandidat yang dibagi terletak di antara dua catatan yang
berdekatan dengan label kelas yang berbeda. Dalam data
tersebut yaitu kandidat split 400, 600, 1800, 3000, dan 18000.
Karena class yang dimiliki adalah 4, sehingga keputusan
diperlukan berupa range dari split atribut ini adalah di split
sebanyak tiga kali dan dilihat nilai GINI terkecil. Split
pertama yaitu pada split 400 yaitu dengan nilai GINI 1,622,kemudian split 1800 dengan nilai GINI 0,501 dan split 18000
dengan GINI 1,511.
4) Atribut Kekayaan Bersih
Atribut ini juga bertipe continous atribut. Dilakukan
pengelompokan dengan menggunakan splitting continous
attribute.
Gambar 5 Splitting Atribut Kekayaan Bersih
Langkah atribut ini sama seperti atribut sebelumnya, dalam
data tersebut kandidat split yaitu 35, 50, 500, dan 1000.
Karena class yang dimiliki adalah 4, sehingga keputusan
diperlukan berupa range dari split atribut ini adalah di split
sebanyak tiga kali dan dilihat nilai GINI terkecil. Split
pertama yaitu pada split 50 yaitu dengan nilai GINI 1,126,
kemudian split 500 dengan nilai GINI 1,075 dan split 2000
dengan GINI 1,511.
E. Decision Tree yang dihasilkan
Sesuai dengan prinsip perhitungan GINI yang telah
dilakukan sebelumnya, maka didapatkan hasil decision tree
seperti pada gambar di bawah ini:
4
5/12/2018 Paper Tgs 1_anggi - slidepdf.com
http://slidepdf.com/reader/full/paper-tgs-1anggi 5/6
Topic: Data Mining
Gambar 6 Decision Tree
F. Mengukur Tingkat Akurasi Data
Menghitung tingkat akurasi menggunakan decision tree
yang sudah terbentuk tersebut dengan menggunakan test set
yang berjumlah 10 data. Berikut hasil test data terlihat pada
gambar berikut yaitu:
Gambar 7 Uji Data
Dari hasil uji tersebut, ternyata didapatkan nilai rule yang
bernilai benar adalah 7 data dari 10 data test sehingga tingkat
akurasi adalah 7/10 yaitu 70%.
KESIMPULAN
Program klasifikasi UMKM decision tree berdasarkanklasifikasi kredit dibuat untuk membantu fungsionalitas Bank atu badan hukum lainnya dalam menentukan kategori apa didalam UMKM sehingga beberapa faktor yang palingmempengaruhi untuk tingkat keputusan dapat diperhatikan.Setelah dilakukan uji coba dapat disimpulkan beberapa halsebagai berikut:1. Proses pengklasifikasian nilai sangat penting karena dapat
mengelompokkan nilai-nilai yang akan diuji.2. Pengkategorisasian usaha berdasarkan atribut yang
ditentukan dapat mengetahui tipe usaha baik mikro, kecil,dan menengah.
3. Algoritma decision tree memiliki kompleksitas yang besar karena pada algoritma ini setiap nilai ditelusuri dan diprosesuntuk mendapatkan gini index masing – masing nilai yangakan digunakan untuk mencari ukuran purity masing-masing atribut yang dinyatakan dengan proses perhitungan
purity. Proses penelusuran ini akan membentuk sebuah pola berupa pohon keputusan.
Dalam penentuan decision tree, perlu adanya data yangvalid dan cukup banyak. Hal tersebut dapat berpengaruh padatingkat akurasi. Semakin banyak dan valid data yangdigunakan, semakin besar dan bervariasi persebaran dandistribusi data dari masing-masing atribut sehingga tingkatakurasi juga dapat menjadi lebih besar.
REFERENSI
[1] Anonim. (2008). UNDANG-UNDANG REPUBLIK INDONESIA
NOMOR 20 TAHUN 2008 TENTANG USAHA MIKRO, KECIL, DAN MENENGAH. Jakarta.
[2] Basuki, A., & Syarif, I. (2003). Modul Ajar Decision Tree. Surabaya:
PENS-ITS.
[3] Berry, M. J., & Linoff, G. S. (2004). Data Mining Techniques (Second Edition). New York: John Wiley & Sons.
[4] Han, J., & Kamber, M. (2006). Data Mining Concepts and Techniques.
USA: Morgan Kaufman.
[5] Larose, D. T. (2005). Discovering Knowledge in Data: An Introduction
to Data Mining. USA: John Wiley & Sons, Inc.
[6] Tan, P.-N., Steinbach, M., & Kumar, V. (2006). Introduction to Data
Mining. Boston: Pearson Education, Inc.
5
5/12/2018 Paper Tgs 1_anggi - slidepdf.com
http://slidepdf.com/reader/full/paper-tgs-1anggi 6/6
Topic: Data Mining
6