implementasi metode probabilistic distance … file(pdc) untuk klasifikasi pintu kayu jati deska...
TRANSCRIPT
perpustakaan.uns.ac.id digilib.uns.ac.id
commit to user
i
IMPLEMENTASI METODE PROBABILISTIC DISTANCE CLUSTERING
(PDC) UNTUK KLASIFIKASI PINTU KAYU JATI
SKRIPSI
Diajukan untuk Memenuhi Salah Satu Syarat Mencapai Gelar Strata Satu
Jurusan Informatika
Disusun oleh :
DESKA MUHAMMAD FAISAL
NIM. M0509019
JURUSAN INFORMATIKA
FAKULTAS MATEMATIKA & ILMU PENGETAHUAN ALAM
UNIVERSITAS SEBELAS MARET
SURAKARTA
2013
perpustakaan.uns.ac.id digilib.uns.ac.id
commit to user
ii
perpustakaan.uns.ac.id digilib.uns.ac.id
commit to user
iii
perpustakaan.uns.ac.id digilib.uns.ac.id
commit to user
iv
IMPLEMENTASI METODE PROBABILISTIC DISTANCE CLUSTERING
(PDC) UNTUK KLASIFIKASI PINTU KAYU JATI
DESKA MUHAMMAD FAISAL Jurusan Informatika. Fakultas MIPA. Universitas Sebelas Maret.
ABSTRAK
Suatu industri kayu jati yang mengolah kayu jati menjadi beberapa produk
mebel mempunyai 120 produk jenis pintu. Perbedaan jenis pintu tergantung bahan
baku kayu jati yang digunakan dan waktu pengerjaan pintu. Banyaknya jenis pintu
membutuhkan pengklasifikasian pintu-pintu untuk mempermudah dalam
pengelolaan pintu. Kriteria yang digunakan untuk klasifikasi pintu adalah biaya
bahan baku dan waktu pengerjaan pintu. Proses klasifikasi dapat dilakukan
dengan teknik clustering menggunakan metode Probabilistic Distance Clustering
(PDC). Dalam PDC langkah awal yang dilakukan adalah menentukan pusat
cluster awal dan jumlah cluster terlebih dahulu.
Pada penelitian ini dipaparkan perbandingan hasil proses clustering antar
praprocessing clustering dalam metode PDC untuk mengklasifikasikan pintu
kayu jati. Praprocessing clustering adalah teknik pengambilan pusat cluster awal
dengan simple random atau stratified random, serta proses penyederhanaan data
clustering yaitu data dinormalisasi atau data disederhanakan ke ratusan ribuan
(tanpa normalisasi). Ada 4 (empat) praprocessing clustering yaitu pengambilan
pusat cluster awal simple random dengan data dinormalisasi (simple random–
normalisasi), simple random-tanpa normalisasi, stratified random-normalisasi,
stratified random-tanpa normalisasi. Untuk mengetahui jumlah cluster optimal
digunakan persamaan Pseudo-F. Jumlah cluster yang optimal adalah yang
mempunyai nilai Pseudo-F terbesar dan menghasilkan hasil clustering yang
efektif.
Hasil penelitian menunjukkan bahwa stratified random-tanpa normalisasi
menghasilkan rata-rata jumlah iterasi sedikit, rata-rata nilai e (toleransi error)
kecil, rata-rata waktu proses clustering cepat, dan rata-rata JDF (Joint Distance
Function) rendah sehingga lebih efektif dibandingkan preprocessing clustering
lain. Jumlah cluster yang optimal adalah 4 cluster karena mempunyai nilai
Pseudo-F tinggi dan menghasilkan rata-rata jumlah iterasi sedikit yaitu 23,75,
menghasilkan rata-rata nilai e kecil yaitu 0,08 dan membutuhkan rata-rata waktu
proses clustering cepat yaitu 0,969 detik dan tidak menghasilkan jumlah iterasi di
atas 100 iterasi.
Kata Kunci: normalisasi, probabilistic distance clustering, pseudo-f, simple
random, stratified random.
perpustakaan.uns.ac.id digilib.uns.ac.id
commit to user
v
IMPLEMENTATION OF PROBABILISTIC DISTANCE CLUSTERING
(PDC) METHOD FOR CLASSIFICATION TEAK WOOD DOOR
DESKA MUHAMMAD FAISAL Department of Informatic. Mathematic and Science Faculty.
Sebelas Maret University
ABSTRACT
A teak industry can produce some furniture products from teak wood up to
120 kinds of doors. Their differences depend on lots of teak wood material and the
production time. Classification of doors is needed in order to ease the
management process of doors. Criteria used for the classification process are the
materials cost and production time. The doors classification process uses
clustering technique with probabilistic distance clustering (PDC) method In the
first step of PDC, initial cluster center and the number of cluster must be
determined
This research present the result comparison of preprocessing clustering in
doors classification using PDC method. Preprocessing clustering is a technique
to take initial cluster centers with simple random or stratified random, and the
simplification of clustering data using data normalization or simplify the data into
thousand hundreds (non-normalization). There are four preprocessing clustering
: taking initial cluster centers with simple random and normalized data (simple
random - normalization), simple random - non-normalization, stratified random -
normalization, stratified random - non-normalization. The optimal cluster number
are determined using Pseudo-F equation. The number of clusters which have the
biggest value of Pseudo-F and produce effective clustering process is the optimal
number cluster.
The result of research shows that stratified random – non-normalization
produces the lowest average of iteration number, the lowest average of e value
(error tolerance), the fastest average clustering processing time and the lowest
JDF (Joint Distance Function) so it is the most effective preprocessing clustering.
The optimal number of cluster for clustering process is 4, because it has high
value of Pseudo-F equation (number 3), produces low average of iterations
number that is 23,75, produces low average of e value that is 0.008, need fast
average of clustering process time that is 0,969 seconds and does not produce the
number of iterations more than 100.
Kata Kunci: normalization, probabilistic distance clustering, pseudo-f, simple
random, stratified random.
perpustakaan.uns.ac.id digilib.uns.ac.id
commit to user
vi
MOTTO
“Sesungguhnya Shalatku, Ibadahku, Hidupku dan Matiku hanya untuk Allah
semata” (Q.S. Al-An’aam: 162)
“Karena sesungguhnya sesudah kesulitan itu ada kemudahan, sesungguhnya
sesudah kesulitan itu ada kemudahan, Maka apabila kamu telah selesai (dari
sesuatu urusan), kerjakanlah dengan sungguh-sungguh (urusan) yang lain”
(Q.S. Al-Insyirah : 5-7)
“Sesungguhnya Allah tidak akan mengubah nasib suatu kaum kecuali kaum itu
sendiri yang mengubah apa apa yang pada diri mereka.”
(Q.S. Ar-Ra'd : 11)
“Orang-orang menjadi begitu luar biasa ketika mereka mulai berpikir bahwa
mereka bisa melakukan sesuatu. Saat mereka percaya pada diri mereka sendiri,
mereka memiliki rahasia kesuksesan yang pertama.”
(Norman Vincent Peale)
perpustakaan.uns.ac.id digilib.uns.ac.id
commit to user
vii
PERSEMBAHAN
Karya ini penulis persembahkan kepada :
“Ibu dan Ayah yang telah membesarkan dan senantiasa mendukung saya hingga
menjadi seperti sekarang ini”
“Seluruh anggota keluarga yang telah banyak membantu doa agar selalu
dimudahkan dalam segala urusan”
“Teman-teman Informatika UNS khususnya angkatan 2009 untuk dukungan dan
kebersamaannya”
perpustakaan.uns.ac.id digilib.uns.ac.id
commit to user
viii
KATA PENGANTAR
Puji syukur penulis panjatkan kehadirat Allah Subhanahu Wa Ta’ala
yang senantiasa memberikan nikmat dan karunia-Nya sehingga penulis dapat
menyelesaikan skripsi dengan judul Implementasi Metode Probabilistic Distance
Clustering untuk Klasifikasi Pintu Kayu Jati, yang menjadi salah satu syarat wajib
untuk memperoleh gelar Sarjana Informatika di Universitas Sebelas Maret (UNS)
Surakarta.
Penulis menyadari akan keterbatasan yang dimiliki, begitu banyak
bimbingan, bantuan, serta motivasi yang diberikan dalam proses penyusunan
skripsi ini. Oleh karena itu, ucapan terima kasih penulis sampaikan kepada :
1. Bapak Ristu Saptono, S.Si., M.T selaku Dosen Pembimbing I yang penuh
kesabaran membimbing, mengarahkan, dan memberi motivasi kepada
penulis selama proses penyusunan skripsi ini,
2. Ibu Umi Salamah, S.Si.,M.Kom selaku Ketua Jurusan S1 Informatika dan
Dosen Pembimbing II yang penuh kesabaran membimbing, mengarahkan,
dan memberi motivasi kepada penulis selama proses penyusunan skripsi ini,
3. Bapak Didiek Sri Wiyono S.T.,M.T selaku Pembimbing Akademik yang
telah banyak memberi bimbingan dan pengarahan selama penulis
menempuh studi di Jurusan Informatika FMIPA UNS
4. Bapak dan Ibu dosen serta karyawan di Jurusan Informatika FMIPA UNS
yang telah mengajar penulis selama masa studi dan membantu dalam proses
penyusunan skripsi ini,
5. Ibu, Bapak, kakak, adik, serta teman-teman informatika 2009 yang telah
memberikan bantuan dan dukungan sehingga penyusunan skripsi ini dapat
terselesaikan.
Penulis berharap semoga skripsi ini dapat bermanfaat bagi semua pihak
yang berkepentingan.
Surakarta, Oktober 2013
Penulis
perpustakaan.uns.ac.id digilib.uns.ac.id
commit to user
ix
DAFTAR ISI
HALAMAN JUDUL ................................................................................................ i
HALAMAN PERSETUJUAN ................................................................................. ii
HALAMAN PENGESAHAN ................................................................................. iii
ABSTRAK ........................................................................................................... iv
ABSTRACT .............................................................................................................v
MOTTO .......................................................................................................... vii
PERSEMBAHAN ................................................................................................ viiii
KATA PENGANTAR .......................................................................................... viii
DAFTAR ISI .......................................................................................................... ix
DAFTAR TABEL ................................................................................................. xii
DAFTAR GAMBAR ............................................................................................ xiii
DAFTAR LAMPIRAN ........................................................................................ xxiv
BAB I PENDAHULUAN .........................................................................................1
1.1 Latar Belakang ..............................................................................................1
1.2 Rumusan Masalah .........................................................................................4
1.3 Batasan Masalah ............................................................................................4
1.4 Tujuan Penelitian ...........................................................................................4
1.5 Manfaat Penelitian .........................................................................................5
1.6 Sistematika Penulisan ....................................................................................5
BAB II TINJAUAN PUSTAKA ...............................................................................6
2.1 Landasan Teori ..............................................................................................6
2.1.1 Clustering ............................................................................................6
2.1.2 Probabilistic Distance Clustering (PDC) .............................................6
2.1.3 Pseudo-F .............................................................................................8
2.1.4 Kayu Jati .............................................................................................9
perpustakaan.uns.ac.id digilib.uns.ac.id
commit to user
x
2.1.5 Normalisasi ....................................................................................... 10
2.1.6 Teknik Random Sampling .................................................................. 11
2.2 Penelitian Terkait ........................................................................................ 11
2.2.1 Comparison of Probabilistic-D and k-Means Clustering in Segment
Profiles for B2B Markets (Depanjann Dey, Satish Garla dan Goutam
Chakraborty,2011).............................................................…………... 11
2.2.2 Familiarising Probabilistic Distance Clustering System Of Evolving
Awale Player (Randle Oluwarotimi Abayomi dan Keneilwe Zuva ,
2012)..................................................................................................... 12
2.2.3 Pengelompokan Kecamatan Di Pulau Madura Berdasarkan Sektor
Pertanian Sebelum Dan Setelah Berdiri Jembatan Suramadu (Aizeh
Mauludina, Dr. Ir. Setiawan, MS, 2012)............................................... 12
2.2.4 Segmentasi Pasar Dengan Ant-Kmeans Clustering (Budi Santosa,
Patdono Suwignyo, 2010)..................................................................... 13
2.3 Rencana Penelitian ...................................................................................... 14
BAB III METODE PENELITIAN .......................................................................... 15
3.1 Tahap Persiapan .......................................................................................... 15
3.1.1 Study Literature ................................................................................. 15
3.1.2 Pengumpulan Data ............................................................................. 15
3.2 Tahap Pemodelan ........................................................................................ 15
3.2.1 Pemodelan Data ................................................................................. 15
3.2.2 Pemodelan Langkah Kerja ................................................................. 16
3.3 Tahap Implementasi .................................................................................... 19
3.3.1 Prediksi Jumlah Cluster Optimal dengan Pseudo-F............................ 19
3.3.2 Proses Clustering Metode Probabilistic Distance Clustering ............. 20
3.4 Tahap Pengujian .......................................................................................... 23
3.5 Tahap Klasifikasi Pintu................................................................................ 23
3.6 Membuat Kesimpulan Penelitian ................................................................. 24
BAB IV PEMBAHASAN ....................................................................................... 25
4.1 Data Hasil Observasi ................................................................................... 25
perpustakaan.uns.ac.id digilib.uns.ac.id
commit to user
xi
4.2 Konversi Biaya Bahan Baku ........................................................................ 26
4.3 Pengolahan Data Pintu Sebelum Clustering ................................................. 27
4.4 Prediksi Jumlah Cluster Optimal Berdasarkan Pseudo-F ............................. 28
4.5 Hasil Clustering Menggunakan Metode Probabilistic Distance Clustering .. 29
4.5.1 Pembahasan Hasil Clustering Berdasarkan Jumlah Iterasi ..................... 30
4.5.2 Pembahasan Hasil Clustering Berdasarkan Nilai e ................................ 32
4.5.3 Pembahasan Hasil Clustering Berdasarkan Waktu Proses Clustering .... 33
4.5.4 Pembahasan Hasil Clustering Berdasarkan JDF .................................... 35
4.6 Penentuan Jumlah Cluster Optimal .............................................................. 36
4.7 Hasil Clustering Pintu Kayu Jati .................................................................. 38
BAB V PENUTUP ................................................................................................. 42
5.1 Kesimpulan ................................................................................................. 42
5.2 Saran ........................................................................................................... 42
DAFTAR PUSTAKA ............................................................................................. 43
perpustakaan.uns.ac.id digilib.uns.ac.id
commit to user
xii
DAFTAR TABEL
Tabel 4.1 Sample Data Pintu Hasil Observasi .......................................................... 25
Tabel 4.2 Contoh Proses Konversi Bahan Baku ke Biaya Bahan Baku .................... 26
Tabel 4.3 Contoh Proses Konversi Panjang Lis ke Biaya Lis ................................... 26
Tabel 4.4 Urutan Nilai Pseudo-F Data Normalisasi ................................................. 28
Tabel 4.5 Urutan Nilai Pseudo-F Data Tanpa Normalisasi ...................................... 29
Tabel 4.6 Perbandingan Rata-Rata Jumlah Iterasi .................................................... 30
Tabel 4.7 Perbandingan Rata-Rata Nilai e ............................................................... 32
Tabel 4.8 Perbandingan Rata-Rata Waktu Proses Clustering ................................... 33
Tabel 4.9 Perbandingan Rata-Rata JDF .................................................................. 35
Tabel 4.10 Perbandingan Pseudo-F dengan Hasil Clustering Stratified Random –
Tanpa Normalisasi .............................................................................. 37
Tabel 4.11 Iterasi dalam Proses Clustering Metode PDC ........................................ 39
Tabel 4.12 Analisis Hasil Clustering ....................................................................... 40
perpustakaan.uns.ac.id digilib.uns.ac.id
commit to user
xiii
DAFTAR GAMBAR
Gambar 3.1 Pemodelan Langkah Clustering dan Analisa ........................................ 17
Gambar 3.2 Algoritma PDC .................................................................................... 22
Gambar 4.1 Grafik Perbandingan Jumlah Iterasi ..................................................... 31
Gambar 4.2 Grafik Perbandingan Nilai e ................................................................. 32
Gambar 4.3 Grafik Perbandingan Waktu Proses Clustering..................................... 34
Gambar 4.3 Grafik Perbandingan JDF .................................................................... 35
perpustakaan.uns.ac.id digilib.uns.ac.id
commit to user
xiv
DAFTAR LAMPIRAN
Lampiran A. Data Pintu Kayu Jati untuk Proses Clustering ..................................... 46
Lampiran B. Daftar Harga Bahan Baku Kayu Jati ................................................... 50
Lampiran C. Hasil Percobaan Metode PDC dengan 2 Cluster ................................. 52
Lampiran D. Hasil Percobaan Metode PDC dengan 3 Cluster ................................. 53
Lampiran E. Hasil Percobaan Metode PDC dengan 4 Cluster ................................. 54
Lampiran F. Hasil Percobaan Metode PDC dengan 5 Cluster .................................. 55
Lampiran G. Hasil Percobaan Metode PDC dengan 6 Cluster ................................. 56
Lampiran H. Hasil Percobaan Metode PDC dengan 7 Cluster ................................. 57
Lampiran I. Hasil Percobaan Metode PDC dengan 8 Cluster .................................. 58
Lampiran J. Hasil Percobaan Metode PDC dengan 9 Cluster .................................. 59
Lampiran K. Hasil Percobaan Metode PDC dengan 10 Cluster ............................... 60
Lampiran L. Standar Deviasi 20 kali Clustering ...................................................... 60
Lampiran M. Proses Klasifikasi Pintu Kayu Jati ...................................................... 63