eko junianto - digilib.its.ac.id · hirarki. tidak perlu jumlah klaster diawal. setiap titik...

46
1 PREDIKSI KAPASITAS PRODUKSI, KONSUMSI PHOSPHATE ROCK DAN ASAM SULFAT UNTUK PEMILIHAN SUPPLIER DENGAN METODA DATA MINING oleh : EKO JUNIANTO 9107201611 DOSEN PEMBIMBING : Ir. BUDI SANTOSA MSc. Ph.D

Upload: vuongthuy

Post on 24-Mar-2019

221 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: EKO JUNIANTO - digilib.its.ac.id · HIRARKI. TIDAK PERLU JUMLAH KLASTER DIAWAL. SETIAP TITIK MENJADI KLASTER LALU DIGABUNG DENGAN ... Pada start, semua contoh training adalah akar

1

PREDIKSI KAPASITAS PRODUKSI, KONSUMSI PHOSPHATE ROCK DAN ASAM SULFAT UNTUK

PEMILIHAN SUPPLIER DENGAN METODA DATA MINING

oleh :EKO JUNIANTO

9107201611

DOSEN PEMBIMBING : Ir. BUDI SANTOSA MSc. Ph.D

Page 2: EKO JUNIANTO - digilib.its.ac.id · HIRARKI. TIDAK PERLU JUMLAH KLASTER DIAWAL. SETIAP TITIK MENJADI KLASTER LALU DIGABUNG DENGAN ... Pada start, semua contoh training adalah akar

2

Latar Belakang Permasalahan TUNTUTAN PROFIT SEBESAR BESARNYA OPTIMALISASI PROSES BISNIS,

SANGAT DIPENGARUHI PEMILIHAN BAHAN BAKU DENGAN SPESIFIKASIBERVARIASI (BECKER, 1989)

TARGET PERUSAHAAN SESUAI BAHAN BAKU YANG DIPILIH (LIU, JIAFU DANSONG, 2006) DAN PERLU PERENCANAAN DAN PENGENDALIAN BAHAN BAKU(RIANE DKK, 2001)

PERMINTAAN PUPUK BERBASIS PHOSPHATE SEBAGAI MATERIAL PENTINGDALAM PRODUKSI PERTANIAN (NOTHOLT, 1991) , MAKA KETERSEDIAAN,KUALITAS ASAM PHOSPHATE SEBAGAI POINT PENTING PENENTUANTARGET PRODUKSI.

METODE PEMILIHAN PHOSPHATE ROCK PEMBUATAN ASAM PHOSPHATEMENJADI POINT SERIUS KERENA VARIASI SPESIFIKASI TAMBANG DUNIA ,DENGAN METODE DATA MINING AKAN MEMBANTU UNTUK PREDIKSIPRODUK YANG DIHASILKAN (TSENG DKK, 2006)

PENELITIAN MENGGUNAKAN DATA MINING DENGAN MENGKLASIFIKASISPESIFIKASI POSPHATE ROCK, PRODUKSI ASAM PHOSPHATE, KONSUMSIPHOSPHATE ROCK DAN ASAM SULFAT DAPAT DIGUNAKAN UNTUKMEMPREDIKSI SUPPLIER PHOSPHAT E ROCK PADA P ROSES PRODUKSIASAM PHOSPHATE

Situasi Global, Perusahaan :

Page 3: EKO JUNIANTO - digilib.its.ac.id · HIRARKI. TIDAK PERLU JUMLAH KLASTER DIAWAL. SETIAP TITIK MENJADI KLASTER LALU DIGABUNG DENGAN ... Pada start, semua contoh training adalah akar

3

PERMASALAHAN : BAGAIMANA CARA MENENTUKAN SUPPLIER

PHOSPHATE ROCK TERBAIK DILIHAT DARI PRODUK ASAM PHOSPHATE, KONSUMSI PHOSPHATE ROCK DAN ASAM SULFAT PADA PROSES PRODUKSI ASAM PHOSPHATE ?

DENGAN MODEL KLASIFIKASI APA YANG SESUAI DENGAN TEKNIK DATA MINING YANG DIPILIH ?

Page 4: EKO JUNIANTO - digilib.its.ac.id · HIRARKI. TIDAK PERLU JUMLAH KLASTER DIAWAL. SETIAP TITIK MENJADI KLASTER LALU DIGABUNG DENGAN ... Pada start, semua contoh training adalah akar

4

Tujuan Penelitian MENDAPATKAN MODEL PREDIKSI YANG AKURAT

UNTUK KAPASITAS PRODUK ASAM PHOSPHATE,KONSUMSI PHOSPHATE ROCK DAN ASAM SULFAT.

MENERAPKAN MODEL UNTUK MENGKLASIFIKASIPHOSPHATE ROCK SESUAI DENGAN KARAKTERISTIKYANG TERKANDUNG DALAM PHOSPHATE ROCKSUPPLIER

IDENTIFIKASI FAKTOR-FAKTOR YANG BERPENGARUHDALAM PEMILIHAN SUPPLIER PHOSPHATE ROCK

Page 5: EKO JUNIANTO - digilib.its.ac.id · HIRARKI. TIDAK PERLU JUMLAH KLASTER DIAWAL. SETIAP TITIK MENJADI KLASTER LALU DIGABUNG DENGAN ... Pada start, semua contoh training adalah akar

5

DENGAN MODEL YANG DIDAPATKAN AKANDENGAN MUDAH DITENTUKAN SUPPLIERPHOSPHATE ROCK UNTUK PROSES PRODUKSIASAM PHOSPHATE YANG TERBAIK

DAPAT MEMBERIKAN INFORMASI KEPADAPENGAMBIL KEPUTUSAN SERTA MEMPERKENAL-KAN ALAT BANTU PENGAMBILAN KEPUTUSANYANG RASIONAL DALAM PEMILIHAN SUPPLIERPHOSPHATE ROCK

Manfaat Penelitian

Page 6: EKO JUNIANTO - digilib.its.ac.id · HIRARKI. TIDAK PERLU JUMLAH KLASTER DIAWAL. SETIAP TITIK MENJADI KLASTER LALU DIGABUNG DENGAN ... Pada start, semua contoh training adalah akar

6

BATASAN DAN ASUMSI1. PENELITIAN DILAKSANAKAN DI PABRIK ASAM PHOSPHATE

PT PETROKIMIA GRESIK.2. JENIS PROSES PABRIK ASAM PHOSPHATE ADALAH HEMI-

DI HYDRATE PROCESS.3. DATA YANG DIPERLUKAN DIAMBILKAN DARI DATA PROSES

PABRIK ASAM PHOSPHATE PT PETROKIMIA GRESIK.4. DATA PEMAKAIAN BAHAN PHOSPHATE ROCK, PRODUKSI DAN

KONSUMSI PHOSPHATE ROCK DAN ASAM SUFAT DITENTUKANBERDASARKAN PENGGUNAAN SELAMA 6 TAHUN SEJAKTAHUN 2004.

5. PHOSPHATE ROCK YANG DITELITI ADALAH PERSEDIAANINCOMING MATERIAL (BUKAN PERSEDIAAN BARANGSETENGAH JADI & BARANG JADI/PRODUK).

6. PLANT RELIABILITY PABRIK ASAM PHOSPHATEPT PETROKIMIA GRESIK PADA KONDISI BAIK.

Page 7: EKO JUNIANTO - digilib.its.ac.id · HIRARKI. TIDAK PERLU JUMLAH KLASTER DIAWAL. SETIAP TITIK MENJADI KLASTER LALU DIGABUNG DENGAN ... Pada start, semua contoh training adalah akar

7

Variasi bahan baku phosphate rock mempengaruhi pemilihan teknologi proses pembuatan asam phosphate (Becker, 1989)

Menurut Haksever dan Moussourakis (2005) jumlah dan kapan order bahan baku agar produk didapatkan optimal karena variasi kualitas dan variasi harga phosphate rock yang dipasok

TINJAUAN PUSTAKA DAN KAJIAN TEORITIS

Page 8: EKO JUNIANTO - digilib.its.ac.id · HIRARKI. TIDAK PERLU JUMLAH KLASTER DIAWAL. SETIAP TITIK MENJADI KLASTER LALU DIGABUNG DENGAN ... Pada start, semua contoh training adalah akar

8

DATA SUPPLIER PHOSPHATE ROCK

Becker P., (1989) % BPl = konversi P2O5 dalam Ca3(PO4)2 dibagi 2,183

Page 9: EKO JUNIANTO - digilib.its.ac.id · HIRARKI. TIDAK PERLU JUMLAH KLASTER DIAWAL. SETIAP TITIK MENJADI KLASTER LALU DIGABUNG DENGAN ... Pada start, semua contoh training adalah akar

9

PENDEKATAN METODA DATA MINING

o TEKNIK DATA MINING SANGAT MEMBANTU MENEMUKAN SOLUSI YANGBAIK PADA DUNIA BISNIS DI ERA GLOBALISASI TERUTAMA DALAMPENGAMBILAN KEPUTUSAN MANAJEMEN (ÇOBAN A., DKK., 2006),(TZUNG DKK., 2009)

o METODA DATA MINING ATAU JUGA SERING DISEBUT KNOWLEDGEDISCOVERY IN DATABASE (KDD) ADALAH SUATU KEGIATAN MELIPUTIPENGUMPULAN DATA, PEMAKAIAN DATA HISTORIS UNTUKMENEMUKAN KETERATURAN, POLA ATAU HUBUNGAN SET DATABERUKURAN BESAR. DAN INI TELAH DILAKUKAN OLEH PENELITISEBELUMNYA, MISALNYA OLEH MASTROGIANIS DKK. (2009), GERARDODAN LEE (2009), LEE DKK, LI DAN SUN (2009), CHEN DKK.(2009), YANGDKK. (2008), SHINHA DAN ZHAO, (2008), SERTA TSENG DKK. (2006) DANLAINNYA.

o SANTOSA (2007), PETRY DAN ZHAO (2009), DAT A MINING ERAT KAITANNYA DENGAN MACHINE LEARNING ATAU KECERDASAN BUATAN YANG BERHUBUNGAN DENGAN TEKNIK-TEKNIK YANG BISA DIPROGRAMKAN DAN BELAJAR DARI DATA MASA LALU

Page 10: EKO JUNIANTO - digilib.its.ac.id · HIRARKI. TIDAK PERLU JUMLAH KLASTER DIAWAL. SETIAP TITIK MENJADI KLASTER LALU DIGABUNG DENGAN ... Pada start, semua contoh training adalah akar

10

SUPERVISED

TEKNIK DATA MINING

UNSUPERVISED

KONSEP/PENDEKATAN DATA MINING

CIRI-CIRI VARIABEL DATA 1. TANPA DATA TRAINING2. TANPA DATA LABEL (OUTPUT)

CIRI-CIRI VARIABEL DATA 1. ADA DATA TRAINING2. ADA DATA TESTING3. ADA DATA LABEL (OUTPUT)

Page 11: EKO JUNIANTO - digilib.its.ac.id · HIRARKI. TIDAK PERLU JUMLAH KLASTER DIAWAL. SETIAP TITIK MENJADI KLASTER LALU DIGABUNG DENGAN ... Pada start, semua contoh training adalah akar

11

PARTISIONING

PENGELOMPOKAN OBJEK DALAM

JUMLAH K KLASTER

KLASTERINGUNSUPERVISED

• K – MEANS KLASTER

HIRARKITIDAK PERLU JUMLAH KLASTER DIAWAL. SETIAP TITIK MENJADI KLASTER LALU DIGABUNG DENGAN TITIK LAIN TERDEKAT UNTUK MEMBENTUK KLASTER YANG LEBIH BESAR

FUZZY CLUSTER MEANS

(FCM)

KONSEP DATA MINING

Page 12: EKO JUNIANTO - digilib.its.ac.id · HIRARKI. TIDAK PERLU JUMLAH KLASTER DIAWAL. SETIAP TITIK MENJADI KLASTER LALU DIGABUNG DENGAN ... Pada start, semua contoh training adalah akar

12

BACK PROPAGASI

SUPERVISED

KONSEP DATA MINING

LOGISTIK

LINIER

MULTIVARIATEREGRESI

KLASIFIKASINON LINIER

LINIER

NEURAL NETWORK

RECURRENT NET WORK

LEARNING VECTOR QUANTIZATION

Page 13: EKO JUNIANTO - digilib.its.ac.id · HIRARKI. TIDAK PERLU JUMLAH KLASTER DIAWAL. SETIAP TITIK MENJADI KLASTER LALU DIGABUNG DENGAN ... Pada start, semua contoh training adalah akar

ANALISIS DISKRIMINAN LINIER

(LDA)

DUA KELAS

MULTI KELAS

KLASIFIKASI

TEOREMA BAYES NAIVE BAYES

DECISION TREE

C 4.5

INDUCER DECISION TREES (ID3)

CLASSIFIER AND REGRESSION TREE( CART)

METODE KERNEL

SVM MULTI KELAS

SUPPORT VECTOR MACHINE (SVM)

PENGENALAN POLA DIDASARKAN KUANTIFIKASI TRADE OFF ANTARA BERBAGAI KEPUTUSAN KLASIFIKASI

ASUMSI PENYEDERHANAAN BAHWA NILAI ATRIBUT SECARA KONDISIONAL SALING BEBAS JIKA DIBERIKAN NILAI OUTPUT

MENGKLASIFIKASIKAN OBYEK DENGAN URUTAN PERTANYA-AN UNTUK MENENTUKAN KELOMPONYA, SEHINGGA ADA SIMPUL –AKAR DAN JAWABAN DIKEMUKAKAN PADA CABANG-CABANG.

MENGGUNAKAN KRITERIA INFORMATION GAIN UNTUK MEMILIH ATRIBUT PADA PEMISAHAN OBYEK

SETIAP SIMPUL DIPECAH MENJADI 2 CABANG, SEBAGAI UKURAN IMPURITY DIGUNAKAN INDEKS GINI

13

Page 14: EKO JUNIANTO - digilib.its.ac.id · HIRARKI. TIDAK PERLU JUMLAH KLASTER DIAWAL. SETIAP TITIK MENJADI KLASTER LALU DIGABUNG DENGAN ... Pada start, semua contoh training adalah akar

14

5. BAYES CLASSIFIER

YOUN , JEONG., (2009), MITCHEL, (1997)

MENYATAKAN SECARA TEORITIS SEBUAH OPTIMAL CLASSIFIER BAYES ADALAH MEMINIMALKAN ERRORRATE EXISTS DAN MAPPING OF EQUIVALENT

METODA DATA MINING

Page 15: EKO JUNIANTO - digilib.its.ac.id · HIRARKI. TIDAK PERLU JUMLAH KLASTER DIAWAL. SETIAP TITIK MENJADI KLASTER LALU DIGABUNG DENGAN ... Pada start, semua contoh training adalah akar

15

METODA DATA MINING

mapping of equivalent adalah :

Dimana P(y = -1 I X=x) adalah kondisional probability hasil klas adalah

negatif diberikan sebuah atribut vektor khusus.

Page 16: EKO JUNIANTO - digilib.its.ac.id · HIRARKI. TIDAK PERLU JUMLAH KLASTER DIAWAL. SETIAP TITIK MENJADI KLASTER LALU DIGABUNG DENGAN ... Pada start, semua contoh training adalah akar

16

METODA DATA MINING

Kaidah probaility ini equivalent untuk :

Dimana P(X = x I y = -1) adalah kondisional probability hasil klas adalah

negatif diberikan sebuah atribut vektor khusus, dan P(y=-1) adalah

probability utama hasil klas adalah negatif.

Page 17: EKO JUNIANTO - digilib.its.ac.id · HIRARKI. TIDAK PERLU JUMLAH KLASTER DIAWAL. SETIAP TITIK MENJADI KLASTER LALU DIGABUNG DENGAN ... Pada start, semua contoh training adalah akar

17

METODA DATA MINING

KLASIFIER NAIVE BAYES

Salah satu penerapan bayes theorem dalam klasifikasi adalah Naïve Bayes Classifier.

∏∈= vj)P (ai P (vj) argmax V V vjnb

dimana Vnb adalah output klasifikasi naïve bayes dengan nilai atribut a1, a2, a3, ……. an

Estimasi P (ai | vj), menggunakan m estimasi :

Dimana n = jumlah datatraining untuk v = vj

m n mp n c

++

= vj)P (ai

nc = jumlah data training untuk v = vj dan a = aj

p = pior estimate untuk P (ai | vj)

Page 18: EKO JUNIANTO - digilib.its.ac.id · HIRARKI. TIDAK PERLU JUMLAH KLASTER DIAWAL. SETIAP TITIK MENJADI KLASTER LALU DIGABUNG DENGAN ... Pada start, semua contoh training adalah akar

18

METODA DATA MINING

DECISION TREE

Salah satu alat/tool dan mudah diimplementasikan untuk klasifikasi adalahdecision tree, ini sangat cocok untuk kasus dimana nilai atribut dan outputnyaberupa nilai diskrit. (Santosa, 2007)

Aplikasi Metode Decision Tree :1. Classification and regression Trees (CART)2. Inducer of Decision Trees (ID3)

Decisison tree bisa dilakukan dengan 2 cara yakni1. Top-down tree construction Pada start, semua contoh training adalah akar Contoh-contoh pemisah diulang dengan memilih 1 atribut setiap waktu

2. Bootom up tree pruning Hilangkan substrees atau ranting dengan cara bottom-up untuk

memperbaiki akurasi pada kasus baru

Page 19: EKO JUNIANTO - digilib.its.ac.id · HIRARKI. TIDAK PERLU JUMLAH KLASTER DIAWAL. SETIAP TITIK MENJADI KLASTER LALU DIGABUNG DENGAN ... Pada start, semua contoh training adalah akar

19

METODA DATA MINING

DECISION TREE

Pemilihan pemisahan atribut1. setiap node, menggunakan fungsi goodness

Atribut yang ada dievaluasi dalam basis pemisahankelas dari contoh training

2. Tipikal fungsi goodness ada 3 yakni informationgain A (ID3/C. 45), information gain ratio dan giniindex.

3. Informasi diukur dalam bits, sebuah probabilitydistribusi, info dibutuhkan untuk mempredik padasebuah event adalah distribusinya entropy

Page 20: EKO JUNIANTO - digilib.its.ac.id · HIRARKI. TIDAK PERLU JUMLAH KLASTER DIAWAL. SETIAP TITIK MENJADI KLASTER LALU DIGABUNG DENGAN ... Pada start, semua contoh training adalah akar

20

METODA DATA MINING

DECISION TREEKomputasi information gain = information sebelum split – informasi setelah split.

Entropy (p1,p2,p3 ..........pn) = -p1 log p1 – p2 log p2 ............. pn log pn

)(y entropy yy nilai A cy) - entropy ( Gain (y,A) c

c∑ ∈=

) rq

r , rq

qr) x ( (q r) r)(p,qropy (p,q,,q,r): ententropy (p++

+++

Dimana nilai A adalah semua nilai mungkin dari atribut A dan Yc adalah subset dari y dimana A mempunyai nilai c.

Yaitu untuk menghitung gain ratio, dimana s adalah s1 ………. sc dan c adalah sub set yang dihasilkan dari pecahan s dengan menggunakan atribut A yang mempunyai sebanyak c nilai.

ss log2

ss - n)Informatio (Split A)(S, Info Intricic ii∑=

Page 21: EKO JUNIANTO - digilib.its.ac.id · HIRARKI. TIDAK PERLU JUMLAH KLASTER DIAWAL. SETIAP TITIK MENJADI KLASTER LALU DIGABUNG DENGAN ... Pada start, semua contoh training adalah akar

21

METODA DATA MINING

DECISION TREE

A)(s, info cinsitiansi

AS Gain A)(S, ratio Gam ),(=

Indek Gini, jika kelas objek dinyatakan dengan k, k-1,2,3, ........c adalah jumlah kelas untuk variable/output dependen y, maka untuk cabang A dihitung seperti dibawah ini :

∑=

−=c

kk P 1 (A)IG

1

2

Page 22: EKO JUNIANTO - digilib.its.ac.id · HIRARKI. TIDAK PERLU JUMLAH KLASTER DIAWAL. SETIAP TITIK MENJADI KLASTER LALU DIGABUNG DENGAN ... Pada start, semua contoh training adalah akar

22

MEMBANDINGKAN MODEL

1. Tidak ada model terbaik untuk semua kasus data mining untukmemprediksi atau klasifikasi yang harus dipilih, karena biasanya untuk satu kasus diterapkan beberapa teknik atau parameter yang berbeda

2. Cara membandingkan model - Membandingkan nilai error yang dihasilkan - Model yang mempunyai hasil nilai error terkecil itulah model yang dipilih(Santosa, 2007).

3. Menurut Sivakumasi S., (2009), atribut ranking method digunakan untuk mengevaluasi C4.5 (Decision tree) dan naive bayes

Page 23: EKO JUNIANTO - digilib.its.ac.id · HIRARKI. TIDAK PERLU JUMLAH KLASTER DIAWAL. SETIAP TITIK MENJADI KLASTER LALU DIGABUNG DENGAN ... Pada start, semua contoh training adalah akar

23

METODOLOGI PENELITIAN MULAI

TAHAP I : PENGUMPULAN DATA

TAHAP II : IDENTIFIKASI PARAMETER DATA

TAHAP III : PENGOLAHAN DATA

MODEL DECISION TREE

MODEL NAIVE BAYES

AKURASI NAIVE BAYES

AKURASI DECISION TREE

PEMILIHAN MODEL

A

DIBANDINGKAN

Page 24: EKO JUNIANTO - digilib.its.ac.id · HIRARKI. TIDAK PERLU JUMLAH KLASTER DIAWAL. SETIAP TITIK MENJADI KLASTER LALU DIGABUNG DENGAN ... Pada start, semua contoh training adalah akar

24

A

ANALISIS DAN KESIMPULAN

SELESAI

Page 25: EKO JUNIANTO - digilib.its.ac.id · HIRARKI. TIDAK PERLU JUMLAH KLASTER DIAWAL. SETIAP TITIK MENJADI KLASTER LALU DIGABUNG DENGAN ... Pada start, semua contoh training adalah akar

25

TAHAP I : PENGUMPULAN DATA

SUMBER DATA : UNIT ASAM PHOSPHATE PT PETROKIMIA GRESIK SUBJECT DATA : ANALISA PHOSPHATE ROCK, PRODUK ASAM

PHOSPHATE, KONSUMSI PHOSPHATE ROCK DANASAM SULFAT

WAKTU : JANUARI 2005 - DESEMBER 2009

TAHAP II : IDENTIFIKASI PARAMETER DATA

1. Kelompok/variabel input atau variable x, yakni variabel independent/prediktor - Supplier/asal negara phosphate rock- Kualitas phosphate rock : P2O5, CaO, SiO2, CO2, Fe2O3, Al2O3, F, K2O,MgO, Na2O3, SO3, Cl2, Moisture, Organic Carbon

Page 26: EKO JUNIANTO - digilib.its.ac.id · HIRARKI. TIDAK PERLU JUMLAH KLASTER DIAWAL. SETIAP TITIK MENJADI KLASTER LALU DIGABUNG DENGAN ... Pada start, semua contoh training adalah akar

26

TAHAP II : IDENTIFIKASI PARAMETER DATA

2. Kelompok/variabel output atau variabel y, yakni variabel dependent/responsterdiri atas 3 label yakni- Produksi asam phosphate :

Produksi <610 t/jam, label rendahProduksi 610 – 630 t/jam, label sedangProduksi >630 t/jam, label tinggi

- Konsumsi phosphate rockKonsumsi phospahte rock (ton/ton produk) > 3,4, label rendahKonsumsi phospahte rock (ton/ton produk) 3,21-3,4 , label sedangKonsumsi phospahte rock (ton/ton produk) < 3,21, label tinggi

- Konsumsi asam sulfatKonsumsi asam sulfat (ton/ton produk) > 3,0, label rendahKonsumsi asam sulfat (ton/ton produk) 2,9 -3,0, label sedangKonsumsi asam sulfat (ton/ton produk) <2,9 , label tinggi

Page 27: EKO JUNIANTO - digilib.its.ac.id · HIRARKI. TIDAK PERLU JUMLAH KLASTER DIAWAL. SETIAP TITIK MENJADI KLASTER LALU DIGABUNG DENGAN ... Pada start, semua contoh training adalah akar

27

TAHAP III : PENGOLAHAN DATA

MODEL NAIVE BAYES

dimana x adalah variabel indpenden kualitas phosphate rock : P2O5, CaO, SiO2, CO2, Fe2O3, Al2O3, F, K2O, MgO, Na2O3, SO3, Cl2, Moisture, Organic Carbon adalah variabel dependen prediksi output produksi asam phosphate y1, konsumsi phophate rock y2 dan konsumsi asam sulfat y3.

Dengan memasukan varabel x akan diperoleh y1, y2 dan y3 yang merupakannilai probabilitas dengan kesimpulan rendah, sedang atau tinggi.

Page 28: EKO JUNIANTO - digilib.its.ac.id · HIRARKI. TIDAK PERLU JUMLAH KLASTER DIAWAL. SETIAP TITIK MENJADI KLASTER LALU DIGABUNG DENGAN ... Pada start, semua contoh training adalah akar

28

TAHAP III : PENGOLAHAN DATA

MODEL DECISION TREE

KAP. PRODUKSI

P.R. MAROKOP.R. MESIR P.R. YORDAN

- TINGGI- SEDANG- RENDAH

- TINGGI- SEDANG- RENDAH

- TINGGI- SEDANG- RENDAH

Page 29: EKO JUNIANTO - digilib.its.ac.id · HIRARKI. TIDAK PERLU JUMLAH KLASTER DIAWAL. SETIAP TITIK MENJADI KLASTER LALU DIGABUNG DENGAN ... Pada start, semua contoh training adalah akar

29

KONSUMSI PH. ROCK

P.R. MAROKOP.R. MESIR P.R. YORDAN

- TINGGI- SEDANG- RENDAH

- TINGGI- SEDANG- RENDAH

- TINGGI- SEDANG- RENDAH

DENGAN CARA YANG SAMA DIBUAT KONSUMSI ASAM SULFAT

TAHAP III : PENGOLAHAN DATA

MODEL DECISION TREE

Page 30: EKO JUNIANTO - digilib.its.ac.id · HIRARKI. TIDAK PERLU JUMLAH KLASTER DIAWAL. SETIAP TITIK MENJADI KLASTER LALU DIGABUNG DENGAN ... Pada start, semua contoh training adalah akar

30

TAHAP III : PENGOLAHAN DATA

MODEL DECISION TREE

Masukan variable x dari kualitas phospahate rock kedalam rumus-rumus dibawahini untuk mendapatkan probabilitas variabel y (y1, y2dan y3),

Entropy (p1, p1, p1 .............pn) = -p1log p1 – p2log p2 .................................. pnlog pn

dimana nilai A adalah semua nilai mungkin dari atribut A dan yc adalah subsetdari y dan A mempunyai nilai c.

Page 31: EKO JUNIANTO - digilib.its.ac.id · HIRARKI. TIDAK PERLU JUMLAH KLASTER DIAWAL. SETIAP TITIK MENJADI KLASTER LALU DIGABUNG DENGAN ... Pada start, semua contoh training adalah akar

31

TAHAP III : PENGOLAHAN DATA

MODEL DECISION TREE

log2log2log2

Gain Ratio :

dimana s adalah s1........sc dan c adalah sub set yang dihasilkan dari pemecahan sdengan menggunakan atribut A yang mempunyai sebanyak c nilai.

Indek ini, jika kelas obyek dinyatakan dengan k, k-1,2,3,......c adalah jumlahkelas untuk variable/output dependen y, maka gini untuk cabang A dihitungseperti dibawah ini :

ss log2

ss - n)Informatio (Split A)(S, Info Intricic ii∑=

A)(s, info cinsitiansi

AS Gain A)(S, ratio Gam ),(=

∑=

−=c

kk P 1 (A)IG

1

2

Page 32: EKO JUNIANTO - digilib.its.ac.id · HIRARKI. TIDAK PERLU JUMLAH KLASTER DIAWAL. SETIAP TITIK MENJADI KLASTER LALU DIGABUNG DENGAN ... Pada start, semua contoh training adalah akar

Jumlah prediksi benarAkurasi = -------------------------- , atau

Jumlah total Prediksi

Jumlah prediksi salahError rate = -------------------------

Jumlah total prediksi

32

TAHAP IV : PEMILIHAN MODEL KLASIFIKASI

Untuk membandingkan model naive bayes dan decision tree dengan melihat Error terkecil atau melalui kriteria dibawah ini :

Page 33: EKO JUNIANTO - digilib.its.ac.id · HIRARKI. TIDAK PERLU JUMLAH KLASTER DIAWAL. SETIAP TITIK MENJADI KLASTER LALU DIGABUNG DENGAN ... Pada start, semua contoh training adalah akar

33

TAHAP V : ANALISIS DAN KESIMPULAN

• MENGUJI MODEL , APAKAH MODEL KLASIFIKASI PADA METODEDATA MINING DENGAN YANG DIKEMBANGKAN SUDAH BISAMENJAWAB PERMASALAHAN DALAM TOPIK PENELITIAN

• MELAKUKAN ANALISIS KE SELURUH PROSES PENELITIAN SERTAMENYUSUN KESIMPULAN SARAN ,SERTA UNTUK MENJADIPERSPEKTIF PENELITIAN DIKEMUDIAN HARI..

Page 34: EKO JUNIANTO - digilib.its.ac.id · HIRARKI. TIDAK PERLU JUMLAH KLASTER DIAWAL. SETIAP TITIK MENJADI KLASTER LALU DIGABUNG DENGAN ... Pada start, semua contoh training adalah akar

34

PENGOLAHAN DATA

1. MODEL NAÏVE BAYESMENENTUKAN ERROR RATE/TINGKAT AKURASI

MULAI

BACA DATA FILE EXCELL .xls Data analisa phosphate rock th. 2004-2009

Y1(Prod. As. Phosphate)Y2 (Kons. Phosp.Rock)Y3 (Kons. Asam Phosp.)KLASIFIKASI OUT PUT (Y)

RendahSedang Tinggi

HITUNG PROBABILITAS OUTPUT (Y) P(Y) = Y/JUMLAH DATA

HITUNG PROBABILITAS Xn YUNTUK SETIAP KONDISI OUTPUT

DATA X 100 DESKRIT, DIKLASIFIKASI MENJADI 10 RANGE

UNTUK MEMUDAHAKAN PERHITUNGAN DENGAN MATLAB

Y1(Prod. As. Phosphate)Y2 (Kons. Phosp.Rock)Y3 (Kons. Asam Phosp.)

RendahSedang Tinggi

A

KLASIFIKASI INPUT (X)

Menentukan level output Y

DATA X 100

Page 35: EKO JUNIANTO - digilib.its.ac.id · HIRARKI. TIDAK PERLU JUMLAH KLASTER DIAWAL. SETIAP TITIK MENJADI KLASTER LALU DIGABUNG DENGAN ... Pada start, semua contoh training adalah akar

A

HITUNG PROBABILITAS Xn YjUNTUK SETIAP KONDISI JENIS X DAN Y

MATRIX PROB. (3 X 137) UNTUK OUTPUT Y1 Y2 DAN Y3

ESTIMASI OUTPUT Y1,Y2 DAN Y3P(Yj) . P (Xi │Yj)

∏∏

MATRIX PROB. (3 X 137) TIAP UNSUR X DARI PHOSP. ROCK

MENGKOMPARASI ESTIMASI OUTPUT Y MEMBANDINGKAN MASING OUTPUT Y1, Y2 DAN Y3

MEMBANDINGKAN ESTIMASI OUPUTDENGAN O UTPUT DATA ASLI

MEMBANDINGKAN ESTIMASI OUPUT DENGAN O UTPUT DATA ASLI, ERROR RATE DAPAT DIKETAHUI

SELESAI

Page 36: EKO JUNIANTO - digilib.its.ac.id · HIRARKI. TIDAK PERLU JUMLAH KLASTER DIAWAL. SETIAP TITIK MENJADI KLASTER LALU DIGABUNG DENGAN ... Pada start, semua contoh training adalah akar

2. DECISION TREE (CART)

MULAI

LABELISASI OUTPUT (Y) PADA DATA .xlY1(Prod. As. Phosphate)Y2 (Kons. Phosp.Rock)Y3 (Kons. Asam Phosp.)

1 = Rendah2 = Sedang 3 = Tinggi

LABEL

BACA DATA FILE EXCELL .xls

IMPLEMENTASI ALGORITMACART DALAM MATLAB

Data analisa phosphate rock th. 2004-2009

Set Training input (x) dan output (Y)Set Testing input (P) dan output (T)Set data diambil keseluruhan (137 data)

OUTPUT

Metode Klasifikasi Metode Regresi

MEMBUAT DEC. TREE BERDASAR PREDIKTOR X DAN RESPON Y (TREEFIT)DAN MMBUAT TAMPILAN DECISION TREE.TEST HASIL DEC. TREE BERDASAR PREDIKTOR X (TREEVAL)SELANJUTNYA DIBANDINGKAN UNTUK MENGETAHUI ERROR RATENYA.

SELESAI

2. DECISION TREE

Page 37: EKO JUNIANTO - digilib.its.ac.id · HIRARKI. TIDAK PERLU JUMLAH KLASTER DIAWAL. SETIAP TITIK MENJADI KLASTER LALU DIGABUNG DENGAN ... Pada start, semua contoh training adalah akar

MEMBANDINGKAN MODEL

MODEL NAÏVE BAYESMODEL DECISION TREE METODE KLASIFIKASI

M0DEL DECISION TREE METODE REGRESI

MODEL DENGAN ERROR RATE TERRENDAH

Respons/ OutputError rate

Naïve Bayes(%)

Error rateDecision Tree

Klasifikasi(%)

Error rateDecision Tree Regresi(%)

Produk Asam Phosphate (Y1) 11,68 7,30 20,44

Konsumsi Phosphate Rock (Y2) 28,71 12,41 40,88

Konsumsi Asam Sulfat (Y3) 19,46 16,06 57,66

Tabel 4-1 Perbandingan Model

PEMILIHAN MODEL

Page 38: EKO JUNIANTO - digilib.its.ac.id · HIRARKI. TIDAK PERLU JUMLAH KLASTER DIAWAL. SETIAP TITIK MENJADI KLASTER LALU DIGABUNG DENGAN ... Pada start, semua contoh training adalah akar

ANALISA

DARI TABEL 4-1, ERROR RATE MODEL NAÏVE BAYES DAN DECISION TREE (CART) BERBEDA HASILNYA, DALAM PENELITIAN INI DECISION TREE (METODE KLASIFIKASI) LEBIH BAIK UNTUK MEMPREDIKSI OUTPUT

1. Decision tree cara pengelompokan objek lebih mudah dan disetiap atributditanyakan disimpul dan jawaban dari atribut dinyatakan dalam cabang sampai akhir ditemukankat katagori dari suatu objek disimpul terakhir

2. Naïve Bayes didasarkan pada asumsi penyederhanaan bahwa nilai atribut secara kondisional adalah saling bebas jika diberikan nilai input atau diberikan nilai output, probabilitas mengamati secara bersamaan adalah produk dari probabilitas dari individu

Page 39: EKO JUNIANTO - digilib.its.ac.id · HIRARKI. TIDAK PERLU JUMLAH KLASTER DIAWAL. SETIAP TITIK MENJADI KLASTER LALU DIGABUNG DENGAN ... Pada start, semua contoh training adalah akar

ANALISA ERROR RATE OUTPUT MODEL NAÏVE BAYES DAN DECISION TREE(ERROR RATE TIDAK BISA 0%)

1. OUTPUT Y1, PRODUKSI ASAM PHOSPHATE

PRODUK ASAM PHOSPHATE = DENSITAS AS. PHOSPHATE X FLOW RATE

- ERROR BISA TERJADI KARENA KESALAHAN ANALISA, FLOW MMETER PRODUK ASAM PHOSPHATE ERROR

2. OUTPUT Y2, KONSUMSI PHOSPHATE ROCK (ton Ph. Rock/ton Produk)

- KESALAHAN PENGUKURAN PRODUK ASAM PHOSPHATE- KALIBRASI WEIGHER PHOSPHATE ROCK YANG HARUS DIKOREKSI DENGAN PENGUKURAN FISIK PHOSPHATE ROCK DI STORAGE

3. OUTPUT Y1, KONSUMSI ASAM SULFAT (ton As. Sulfat/ton Produk)

- KESALAHAN PENGUKURAN PRODUK ASAM PHOSPHATE- ERROR BISA TERJADI KARENA KESALAHAN ANALISA AS. SULFAT, FLOW MMETER ERROR

Page 40: EKO JUNIANTO - digilib.its.ac.id · HIRARKI. TIDAK PERLU JUMLAH KLASTER DIAWAL. SETIAP TITIK MENJADI KLASTER LALU DIGABUNG DENGAN ... Pada start, semua contoh training adalah akar

ANALISA ERROR RATE OUTPUT MODEL DECISION TREE METODE REGRESIDAN KLASIFIKASI

Respons/ Output Metode Klasifikasi (%)

Metode Regresi (%)

Produk AsamPhosphate (Y1)

7 14

Konsumsi PhosphateRock (Y2)

9 18

Konsumsi Asam Sulfat(Y3)

7 15

Level Pruning Decision Tree

LEVEL PRUNING DECISION TREE METODE KLASIFIKASI LEBIH BAIK DARIMETODE REGRESI, MAKA DECISION TREE METODE KLASIFIKASI BISA DIGUNAKAN UNTUK PREDIKSI KASUS INI

Page 41: EKO JUNIANTO - digilib.its.ac.id · HIRARKI. TIDAK PERLU JUMLAH KLASTER DIAWAL. SETIAP TITIK MENJADI KLASTER LALU DIGABUNG DENGAN ... Pada start, semua contoh training adalah akar

TESTING PREDIKSI DECISION TREE METODE KLASIFIKASI :

MASUKAN NILAI PREDIKTOR

MULAI

PILIH SALAH SATU INPUT X/PREDIKTORDARI DATA EXCEL, MISAL PADA BARIS 11

MASUKAN BARIS 11 PADA TESTING UNTUK INPUT DAN OUTPUT

X=dat(1:137,2:16);

Y1=dat(1:137,20);

Y2=dat(1:137,21);

Y3=dat(1:137,22);

P=dat(11 :11,2:16);

T1=dat(11:11,20);

T2=dat(11:11,21);

T3=dat(11:11,22);

JALANKAN PROGRAM MATLAB

BANDINGKAN DATA OUTPUT AWAL DAN OUTPUT HASIL PREDIKSI

Respons/ Output Label/Prediksi Label/DataExcell/ awal

Produk AsamPhosphate(Y1)

3 (tinggi) 3 (tinggi)

KonsumsiPhosphateRock (Y2)

2 (sedang) 2 (sedang)

Konsumsi AsamSulfat (Y3)

3 (tinggi) 3 (tinggi)SELESAI

Page 42: EKO JUNIANTO - digilib.its.ac.id · HIRARKI. TIDAK PERLU JUMLAH KLASTER DIAWAL. SETIAP TITIK MENJADI KLASTER LALU DIGABUNG DENGAN ... Pada start, semua contoh training adalah akar

KESIMPULAN

MODEL NAÏVE BAYESMODEL DECISION TREE (CART)

METODE CLASIFICATION

METODE REGRESSION

METODE CLASIFICATION

ERROR RATE DIBANDINGKAN

MODEL DECISION TREE (CART)

1.CART dapat melakukan eksplorasi data untuk penyusunan metode klasifikasiyang melibatkan banyak predictor maupun respon dengan ukuran besar dankompleks. Eksplorasi data ini dapat dilakukan dengan lebih mudah untuk melihathubungan antara respon kontinu dengan prediktornya

Page 43: EKO JUNIANTO - digilib.its.ac.id · HIRARKI. TIDAK PERLU JUMLAH KLASTER DIAWAL. SETIAP TITIK MENJADI KLASTER LALU DIGABUNG DENGAN ... Pada start, semua contoh training adalah akar

5. Dengan mencoba menjalankan “coba_decision_tree”untuk testingprediksi terbukti hasilnya bisa dipakai untuk memprediksi.

4. Diperlukan data analisa phosphate rock dari supplier : P2O5, CaO, SiO2,CO2, Fe2O3, Al2O3, F, K2O, MgO, Na2O3, SO3, Cl2, Moisture, OrganicCarbon sebagai input untuk mempermudah manajemen perusahaanmemilih supplier phosphate rock berdasar prediksi yang diperoleh

3.Bila dibandingkan antara Model Naïve Bayes, Decision Tree metode regresi maupun decision tree metode klasifikasi berdasar error rate, maka yang paling tepat untuk bisa menjawab supplier phosphate rock di unit asam phosphate yang dipilh adalah model decision tree metode klasifikasi

2.Decision Tree metode klasifikasi pada metode data mining yang dikembangkan bisa menjawab permasalahan pemilihan supplier phosphate rock unit asam phosphate yang menjadi permasalahan dalam topik penelitian.

KESIMPULAN

Page 44: EKO JUNIANTO - digilib.its.ac.id · HIRARKI. TIDAK PERLU JUMLAH KLASTER DIAWAL. SETIAP TITIK MENJADI KLASTER LALU DIGABUNG DENGAN ... Pada start, semua contoh training adalah akar

SARANPada penelitian ini terdapat saran saran yang bisa memberikan

manfaat bagi pihak perusahaan PT Petrokimia Gresik atau pihak lain yangberkepentingan terhadap penelitian ini, seperti dibawah ini :

1. Dari analisis perlu dikembangkan lebih lanjut penelitian penelitian terhadap hal hal yang mempengaruhi error rate untuk prediksi respons/output memprediksi kapasitas produksi asam phosphate, konsumsi phosphate rock dan konsumsi asam sulfat dengan memperbaiki kesalahan-kesalahan analisa maupun sistem kalibrasi alat ukur seperti weigher phosphate rock dan fow meter produk asam phosphate maupun asam sulfat

2. Penelitian ini bukanlah merupakan hasil akhir, melainkan awal daripenelitian penelitian selanjutnya mengenai metode data mining dalammanajemen industry seperti minimilisai cost, sehingga proses pemilihansupplier phosphate rock bisa lebih muda dilakukan.

Page 45: EKO JUNIANTO - digilib.its.ac.id · HIRARKI. TIDAK PERLU JUMLAH KLASTER DIAWAL. SETIAP TITIK MENJADI KLASTER LALU DIGABUNG DENGAN ... Pada start, semua contoh training adalah akar

45

TERIMA KASIH ATAS PERHATIANNYA

Page 46: EKO JUNIANTO - digilib.its.ac.id · HIRARKI. TIDAK PERLU JUMLAH KLASTER DIAWAL. SETIAP TITIK MENJADI KLASTER LALU DIGABUNG DENGAN ... Pada start, semua contoh training adalah akar

46

JADUAL PENELITIAN