paper tgs 1_anggi

5/12/2018 Paper Tgs 1_anggi - slidepdf.com

http://slidepdf.com/reader/full/paper-tgs-1anggi 1/6

Topic: Data Mining

Kriteria Usaha Mikro Kecil dan Menengah

menggunakan Klasifikasi Decision Tree

Anggraini Naya Parahita dan Jeanny Mareta DaudJurusan Sistem Informasi – Fakultas Teknologi Informasi

Institut Teknologi Sepuluh Nopember

Jalan Raya ITS Sukolilo

Surabaya, Indonesia

[email protected]

[email protected]

Abstract — UMKM (Usaha Mikro, Kecil, dan Menengah) telah

memegang peranan penting dalam memajukan perekonomian

suatu negara khususnya di Indonesia. UMKM yang memiliki

peranan penting dalam menyerap tenaga kerja, meningkatkan

jumlah unit usaha, dan mendukung pendapatan devisa negara

yang potensial. Perkembangan UMKM dipengaruhi oleh banyak

faktor salah satunya adalah permasalahan umum yang biasanya

dihadapi oleh para pelaku usaha yaitu pemodalan.Pemodalan

merupakan faktor utama dalam mengembangkan UMKM.

Kurangnya pemodalan UMKM pada umumnya pemberian

modal pinjaman atau disebut dengan kredit dari Bank atau

Lembaga keuangan lainnya sulit diperoleh karena persyaratan

administratif dan teknis yang tidak dapat dipenuhi. Salah satu

pengklasifikasian yang dapat membantu pada Usaha Mikro

Kecil dan Menengah adalah melakukan klasifikasi kriteria usaha

yang telah ditentukan oleh Undang – undang Republik Indonesia

Nomor 20 Tahun 2008 tentang Usaha Mikro, Kecil, dan

Menengah. Pengklasifikasian ini dibuat menggunakan metode

klasifikasi decision tree, dimana pada metode ini dibutuhkan

suatu data valid sehingga nantinya pengklasifikasian ini dapatmengambil suatu keputusan. Dengan mengukur nilai terkecil

dari split data record menggunakan GINI Index, maka akan

didapatkan nilai distribusi dari masing-masing class sehingga

didapatkan decision treedengan nilai impurity yang kecil. Dengan

menggunakandecision tree,mampu memberikan keputusan

berdasarkan skala prioritas atribut yang digunakan. Keluaran

dari kriteria UMKM menggunakan decision tree ini diharapkan

dapat membantu Pemerintah khususnya Bank dan Lembaga

Keuangan lainnya dalam pemberdayaan dengan menentukan

kategori usaha mikro, kecil, dan menengah yang dapat dijadikan

sebagai tolok ukur dalam basis penyediaan pembiayaan atau

sering dikenal dengan Kredit.

Keywords-component; UMKM, Klasifikasi, Metode Decision Tree.

PENDAHULUAN

UMKMadalah bagian penting dari perekonomian suatu

Negara maupun daerah, begitu juga dengan Negara Indonesia.

UMKM ini sangat memiliki peranan penting dalam laju

perekonomian masyarakat. UMKM ini sangat membantu

Negara/pemerintah dalam hal penciptaan lapangan pekerjaan

baru sehingga tercipta unit kerja baru yang menggunakan

tenaga tenaga kerja baru yang dapat mendukung pendapatan

Rumah tangga. Definisi UMKM adalah Usaha kecil termasuk

usaha mikro merupakan suatu badan usaha milik warga negara

Indonesia, baik perseorangan maupun berbadan hukum yang

memiliki kekayaan bersih, tidak termasuk tanah dan bangunan

sebanyak-banyaknya Rp.200 Juta atau mempunyai hasil penjualan rata-rata pertahun Rp. 1 Milyar dan usaha tersebut

berdiri sendiri. [1]

Selama krisis membuktikan bahwa kegiatan ekonomi

rakyat kecil dalam bentuk UMKM merupakan bagian terbesar

dalam kegiatan ekonomi masyarakat dan lebih dapat bersaing.

Hal tersebut dipengaruhi oleh Daya tahan UMKM tidak

banyak memiliki ketergantungan pada faktor eksternal seperti

utang dalam valuta asing dan bahan baku impor dalam

melakukan kegiatannya. Dengan melihat keunggulan potensi

spesifik seperti ini maka Pemerintah dalam mengatasi krisis

ekonomi adalah memberdayakan UMKM dengan cara

memberikan pembiayaan atau yang disebut kredit untuk

mendukung berlangsungnya kegiatan UMKM.Berbagai macam persyaratan penetuan dalam pemberian

kredit yang telah di atur dalam Peraturan Undng – Undang

Republik Indonesia Nomor 20 Tahun 2008 dan hampir

sebagian besar UMKM tidak memenuhi dalam kriteria

tersebut. Tujuan yang akan di capai dalam pelaksanaan studi

kasus ini, adalah untuk menentukan dan mengetahui kategori

usaha mikro, kecil, dan menengah yang dapat membantu

Pemerintah khususnya Bank dan Lembaga Keuangan lainnya

dalam pemberdayaan usaha mikro, kecil, dan menengah yang

dapat dijadikan sebagai tolok ukur dalam basis penyediaan

pembiayaan atau sering dikenal dengan Kredit.

Dari data yang didapatkan mengenai kriteria UMKM, akan

dilakukan analisis data mining untuk mengetahui kategori

usaha. Data mining merupakan proses ekstraksi informasi atau

pola penting dalam basis data berukuran besar [4]. Studi kasus

ini menggunakan suatu teknik dalam data mining yaitu

klasifikasi terhadap data tersebut. Dengan menggunakan 4

attribute yaitu kepemilikan, jenis usaha, kekayaan bersih, dan

hasil penjualan tahunan.

Perhitungan pada studi kasus ini menggunakan metode

decision tree dapat menghasilkan pola data dalam bentuk tree

dan rule, sehingga data menjadi mudah dipahami. Adapun

manfaat yang diharapkan dari hasil studi kasus ini adalah

1



Topic: Data Mining

sebagai bahan informasi yang akurat bagi pemerintah, lembaga

perbankan dan UMKM dalam hubungannya dengan kebijakan

penentuan penyaluran kredit kepada UMKM khususnya dalam

UMKM selain itu diharapkan mampu turut berpartisipasi

dalam pengembagan teoritis.

TINJAUAN PUSTAKA

A. Pengertian UMKM

Undang-Undang Nomor 20 Tahun 2008 tentang Usaha

Mikro, Kecil dan Menengah menyebutkan bahwa yang dapat

dikategorikan sebagai UMKM adalah Usaha kecil termasuk

usaha mikro merupakan suatu badan usaha milik warga negara

Indonesia, baik perseorangan maupun berbadan hukum yang

memiliki kekayaan bersih, tidak termasuk tanah dan bangunan

sebanyak-banyaknya Rp.200 Juta atau mempunyai hasil

penjualan rata-rata pertahun Rp. 1 Milyar dan usaha tersebut

berdiri sendiri.Cakupan yang luas dan melebar memang

menyebabkan fokus pengembangan sering tidak efektif,

karena karakter dan orientasi bisnis yang dijalankan oleh para pemilik usaha, jika digunakan basis penyediaan pembiayaan

sebagai tolok ukur, maka UMKM dalam pengertian Undang-

Undang Nomor 20 Tahun 2008 dapat dibedakan menjadi tiga

kelompok:

(1) Kriteria Usaha Mikro adalah sebagai

berikut:

a.memiliki kekayaan bersih paling banyak

Rp50.000.000,00 (lima puluh juta rupiah) tidak

termasuk tanah dan bangunan tempat usaha; atau

b.memiliki hasil penjualan tahunan paling banyak

Rp300.000.000,00 (tiga ratus juta rupiah).

(2) Kriteria UMKM adalah sebagai berikut:

a.memiliki kekayaan bersih lebih dari Rp50.000.000,00(lima puluh juta rupiah) sampai dengan paling

banyak Rp500.000.000,00 (lima ratus juta rupiah)

tidak termasuk tanah dan bangunan tempat usaha;

atau

b.memiliki hasil penjualan tahunan lebih dari

Rp300.000.000,00 (tiga ratus juta rupiah) sampai

dengan paling banyak Rp2.500.000.000,00 (dua

milyar lima ratus juta rupiah).

(3) Kriteria Usaha Menengah adalah sebagai

berikut:

a.memiliki kekayaan bersih lebih dari

Rp500.000.000,00 (lima ratus juta rupiah) sampai

dengan paling banyak Rp10.000.000.000,00(sepuluh milyar rupiah) tidak termasuk tanah dan

bangunan tempat usaha; atau

b.memiliki hasil penjualan tahunan lebih dari

Rp2.500.000.000,00 (dua milyar lima ratus juta

rupiah) sampai dengan paling banyak

Rp50.000.000.000,00 (lima puluh milyar rupiah).

Memperhatikan ciri-ciri UMKM dan peranannya

yang sangat potensial bagi pembangunan di sektor

ekonomi, maka UMKM perlu terusmenerus dibina dan

diberdayakan secara berkelanjutan agar dapat lebih

berkembang dan maju.

B. Klasifikasi

Klasifikasi merupakan suatu proses untuk menentukan dan

memetakan setiap atribut ke salah satu kelas. Salah satu

contoh dari klasifikasi yaitu memprediksi sel tumor sebagai

jinak atau ganas, bisa juga mengkategorikan berita sepertikeuangan, cuaca, hiburan, olahraga, dll. Terdapat beberapa

teknik untuk menyelesaikan masalah klasifikasi yaitu decision

tree, rule based, neural networks, support vector machines,

dan naive bayes [6].Dari beberapa teknik tersebut, pada studi

kasus paper ini penulis menggunakan teknik decision tree.

1) Decision Tree

Decision Tree merupakan salah satu metode klasifikasi dan

prediksi yang sangat kuat dan terkenal dalam penerapan data

mining. Pada dasarnya Decision Tree mengubah data menjadi

pohon keputusan (decision tree) dan aturan-aturan keputusan

(rule) seperti yang diilustrasikan dalam gambar berikut:

Gambar 1 Ilustrasi Pohon Keputusan

Pada decision tree terdapat 3 jenis node, yaitu:

a. Root Node, merupakan node paling atas, pada node ini

tidak ada input dan bisa tidak mempunyai output atau

mempunyai output lebih dari satu.

b. Internal Node, merupakan node percabangan, pada node

ini hanya terdapat satu input dan mempunyai output

minimal dua.

c. Leaf node atau terminal node, merupakan node akhir, pada

node ini hanya terdapat satu input dan tidak mempunyai

output.Pohon keputusan juga berguna untuk mengeksplorasi data,

menemukan hubungan tersembunyi antara sejumlah calon

variabel input dengan sebuah variabel target. Sebuah pohon

keputusan adalah sebuah struktur yang dapat digunakan untuk

membagi kumpulan data yang besar menjadi himpunan-

himpunan recordyang kebih kecil dengan menerapkan

serangkaian aturan-aturan keputusan [3]. Dengan masing-

masing rangkaian pembagian, anggota himpunan hasil

menjadi mirip satu dengan yang lain. Sebuah pohon keputusan

mungkin dibangun dengan saksama secara manual atau dapat

tumbuh secara otomatis dengan menerapkan salah satu atau

beberapa algoritma pohon keputusan untuk memodelkan

himpunan data yang belum terklasifikasi. Banyak algoritmayang dapat dipakai dalam pembentukan pohon keputusan,

antara lain ID3, CART, dan C4.5 [5]. Variabel tujuan biasanya

dikelompokkan denga pasti dan model pohon keputusan lebih

mengarah pada perhitungan probabilitas dari tiap-tiap

recordterhadap kategori-kategori tersebut atau untuk

mengklasifikasi record dengan mengelompokkannya dalam

satu kelas. MenurutBasuki & Syarif, proses pada pohon

keputusan adalah mengubah bentuk data (tabel) menjadi

model pohon, mengubah model pohon menjadi rule, dan

menyederhanakan rule [2].

2



Topic: Data Mining

Konsep dalam decision tree yaitu:

a. Data dinyatakan dalam bentuk table dengan atribut dan

record

b. Atribut meynatakan suatu parameter yang dibuat sebagai

kriteria dalam pembentukkan tree. Misalkan Jenis Usaha,

Kekayaan, Penjualan dan Kepemilikan. Salah satu atribut

merupakan atribut yang menyatakan data solusi per item

data yang disebut data atribut.c. Atribut memiliki nilai nilai yang dinaamakan dengan value

atau instance. Dimisalkan dalam atribut jenis usaha terdiri

dari 3 value yaitu anak perusahaan,berdiri sendiri dan

cabang perusahaan.

Saat menyusun sebuah decision tree pertama yang harus

dilakukan adalah menentukan atribut mana yang akan menjadi

simpul akar dan atribut mana yang akan menjadi simpul

selanjutnya. Pemilihan atribut yang baik adalah atribut yang

memungkinkan untuk mendapatkan decision tree paling kecil

ukurannya, atau atribut yang bisa memisahkan obyek menurut

kelasnya. Secara real, atribut yang dipilih adalah atribut yang

mempunyai tingkat impurity paling kecil. Tingkat impurity

dapat dilakukan dengan beberapa cara antara lain dengan

menghitung Information Gain, Gain Ratio, atau dengan

menggunakan perhitungan Gini Index. Pada kasus ini,

perhitungan yang dilakukan adalah menggunakan GINI Index.

2) GINI Index

Formula dari Gini Indeks untuk suatu cabang atau kotak A

dapat dihitung sebagai berikut:

(1)

Dimana adalah ratio observasi dalam kotak A yang

masuk dalam kelas K. Jika Gini yang dilambangkan dengan

IG(A) = 0 berarti semua data dalam kotak A berasal dari kelasyang sama. Nilai Gini mencapai maksimum jika dalam kelas

A proporsi data dari masing masing kelas yang ada mencapai

nilai yang sama. Nilai Gini menunjukan distribusi data dari

kelas tersebut.

C. Akurasi

Akurasi adalah nilai derajat kedekatan dari pengukurankuantitas untuk nilai sebenarnya (true). Nilai akurasididapatkan dari hasil rule yang dihasikan dari perhitungandecision tree kemudian di uji coba kan pada data testing danmenghasilkan derajat keakuratan dari rule tersebut setelah diuji coba kan pada data testing.

PENJELASAN DATA

Dalam studi kasus ini menggunakan data record sebanyak 50 record dimana 40 data diidentifikasikan sebagai training setdan 10 data diidentifikasikan sebagai test set. Data tersebutmemiliki 4 atribut yaitu kepemilikan, jenis usaha, kekayaan

bersih, dan hasil penjualan tahunan.Tipe dari atribut kepemilikan yaitu binary attribute dengan

values WNI dan non-WNI. Untuk atribut jenis usaha memilikitipe nominal atrribute dengan 3 values yaitu berdiri sendiri,anak perusahaan, dan cabang perusahaan. Sementara untuk atribut kekayaan bersih dan hasil penjualan tahunan, bertipe

continous attribute.Untuk pembentukan decision tree yangterbaik, dari data yang ada tersebut dilakukan pemisahanatribut/ split attribute berdasarkan tipe dari atribut tersebut yangkemudian ditentukan GINI Index dari masing-masing atributdan split tersebut.

Langkah-langkah yang dilakukan untuk mencapai decisiontree terbaik dalam studi kasus dalam paper ini sehingga dapat

membantu menentukan kategori usaha mikro, kecil, danmenengah yang dapat dijadikan sebagai tolok ukur dalam basis penyediaan pembiayaan adalah:a. Menghitung GINI parent dari data yang dimiliki.

b. Menentukan split dari atribut juga persebaran dan distribusidata di masing-masing atribut.

c. Menghitung nilai GINI Index dari masing-masing split dariatribut.

d. Menentukan atribut yang terbaik dengan nilai GINI yang paling kecil.

e. Menguji keakuratan decision tree dengan data test set yangtelah diidentifikasikan yaitu sebanyak 10 record.

f. Menghitung akurasi data decision tree.

PENGOLAHAN DATA

D. Menentukan Split terbaik dengan perhitungan GINI Index

Dilakukan perhitungan dalam menentukan split terbaik,

dalam studi kasus ini menggunakan perhitungan GINI Index.

Perhitungan ini didefinisikan dalam distribusi kelas dari data

record sebelum dan setelah dilakukan pemisahan/ split .Dengan distribusi data yang dimiliki, didapatkan GINI

parent adalah 0,709. Berikut ini adalah perhitungan GINI

parent dari data yang dimiliki yaitu 1 – (8/40)2 – (8/40)2 –

(7/40)2 – (17/40)2 = 0,709.Table 1 GINI Parent

Parent

mikro 8kecil 8

menengah 7

none 17

GINI = 0,709

1) Atribut Kepemilikan

Atribut kepemilikan memiliki 2 values yaitu WNI dan non-

WNI. Atribut ini bertipe binary attributes karena memiliki dua

keluaran yang potensial. Pada atribut ini dilakukan splitting

binary attribute dapat dilihat dalam diagram di bawah.

Sehingga didapatkan melalui perhitungan GINI di node N1

dan di node N2 didapatkan GINI pada atribut kepemilikan

yaitu 0,884.

3



Topic: Data Mining

Gambar 2 Splitting atribut kepemilikan

2) Atribut Jenis Usaha

Atribut jenis usaha memiliki 3 values yaitu berdiri sendiri,

anak perusahaan, dan cabang perusahaan. Atribut ini bertipeordinal attributes karena dapat dijadikan berkelompok selama

kelompok tersebut tidak mengganggu nilai atribut lainnya.

Pada atribut ini dilakukan splitting mominal attribute dapat

dilihat dalam diagram di bawah.

Gambar 3 Splitting atribut jenis usaha

Nilai GINI untuk split yang pertama adalah 0,914. Untuk

GINI split yang kedua adalah 0,876 dan GINI untuk split yang

ketiga adalah 1,571. Sehingga nilai split terbaik berdasarkan

perhitungan GINI adalah split yamg kedua yaitu

pengelompokan dari {berdiri sendiri} dan {anak perusahaan,

cabang perusahaan} dengan nilai bobot GINI adalah 0,876.

3) Atribut Hasil Penjualan Tahunan

Pada atribut ini memiliki record dengan data bertipe

numeric dan atribut ini bertipe continous atribut. Dilakukan

pengelompokan dengan menggunakan splitting continous

attribute.

Gambar 4 Splitting Atribut Penjualan Tahunan

Dalam split continuous attribute, mempertimbangkan

posisi kandidat yang dibagi terletak di antara dua catatan yang

berdekatan dengan label kelas yang berbeda. Dalam data

tersebut yaitu kandidat split 400, 600, 1800, 3000, dan 18000.

Karena class yang dimiliki adalah 4, sehingga keputusan

diperlukan berupa range dari split atribut ini adalah di split

sebanyak tiga kali dan dilihat nilai GINI terkecil. Split

pertama yaitu pada split 400 yaitu dengan nilai GINI 1,622,kemudian split 1800 dengan nilai GINI 0,501 dan split 18000

dengan GINI 1,511.

4) Atribut Kekayaan Bersih

Atribut ini juga bertipe continous atribut. Dilakukan

pengelompokan dengan menggunakan splitting continous

attribute.

Gambar 5 Splitting Atribut Kekayaan Bersih

Langkah atribut ini sama seperti atribut sebelumnya, dalam

data tersebut kandidat split yaitu 35, 50, 500, dan 1000.

Karena class yang dimiliki adalah 4, sehingga keputusan

diperlukan berupa range dari split atribut ini adalah di split

sebanyak tiga kali dan dilihat nilai GINI terkecil. Split

pertama yaitu pada split 50 yaitu dengan nilai GINI 1,126,

kemudian split 500 dengan nilai GINI 1,075 dan split 2000

dengan GINI 1,511.

E. Decision Tree yang dihasilkan

Sesuai dengan prinsip perhitungan GINI yang telah

dilakukan sebelumnya, maka didapatkan hasil decision tree

seperti pada gambar di bawah ini:

4



Topic: Data Mining

Gambar 6 Decision Tree

F. Mengukur Tingkat Akurasi Data

Menghitung tingkat akurasi menggunakan decision tree

yang sudah terbentuk tersebut dengan menggunakan test set

yang berjumlah 10 data. Berikut hasil test data terlihat pada

gambar berikut yaitu:

Gambar 7 Uji Data

Dari hasil uji tersebut, ternyata didapatkan nilai rule yang

bernilai benar adalah 7 data dari 10 data test sehingga tingkat

akurasi adalah 7/10 yaitu 70%.

KESIMPULAN

Program klasifikasi UMKM decision tree berdasarkanklasifikasi kredit dibuat untuk membantu fungsionalitas Bank atu badan hukum lainnya dalam menentukan kategori apa didalam UMKM sehingga beberapa faktor yang palingmempengaruhi untuk tingkat keputusan dapat diperhatikan.Setelah dilakukan uji coba dapat disimpulkan beberapa halsebagai berikut:1. Proses pengklasifikasian nilai sangat penting karena dapat

mengelompokkan nilai-nilai yang akan diuji.2. Pengkategorisasian usaha berdasarkan atribut yang

ditentukan dapat mengetahui tipe usaha baik mikro, kecil,dan menengah.

3. Algoritma decision tree memiliki kompleksitas yang besar karena pada algoritma ini setiap nilai ditelusuri dan diprosesuntuk mendapatkan gini index masing – masing nilai yangakan digunakan untuk mencari ukuran purity masing-masing atribut yang dinyatakan dengan proses perhitungan

purity. Proses penelusuran ini akan membentuk sebuah pola berupa pohon keputusan.

Dalam penentuan decision tree, perlu adanya data yangvalid dan cukup banyak. Hal tersebut dapat berpengaruh padatingkat akurasi. Semakin banyak dan valid data yangdigunakan, semakin besar dan bervariasi persebaran dandistribusi data dari masing-masing atribut sehingga tingkatakurasi juga dapat menjadi lebih besar.

REFERENSI

[1] Anonim. (2008). UNDANG-UNDANG REPUBLIK INDONESIA

NOMOR 20 TAHUN 2008 TENTANG USAHA MIKRO, KECIL, DAN MENENGAH. Jakarta.

[2] Basuki, A., & Syarif, I. (2003). Modul Ajar Decision Tree. Surabaya:

PENS-ITS.

[3] Berry, M. J., & Linoff, G. S. (2004). Data Mining Techniques (Second Edition). New York: John Wiley & Sons.

[4] Han, J., & Kamber, M. (2006). Data Mining Concepts and Techniques.

USA: Morgan Kaufman.

[5] Larose, D. T. (2005). Discovering Knowledge in Data: An Introduction

to Data Mining. USA: John Wiley & Sons, Inc.

[6] Tan, P.-N., Steinbach, M., & Kumar, V. (2006). Introduction to Data

Mining. Boston: Pearson Education, Inc.

5



Topic: Data Mining

6

paper tgs 1_anggi

Documents