3475 16 decision tree

23

Upload: universitas-bina-darma-palembang

Post on 13-Aug-2015

99 views

Category:

Data & Analytics


3 download

TRANSCRIPT

Page 1: 3475 16 decision tree
Page 2: 3475 16 decision tree

KONSEP DECISION TREE Mengubah data menjadi pohon keputusan (decisiontree) dan aturan-aturan keputusan.

DATADECISION

TREE RULE

Page 3: 3475 16 decision tree

CONTOH PENGGUNAAN DECISION TREE Diagnosa penyakit: hipertensi, kanker, stroke dll.

Pemilihan produk: kendaraan, komputer dll

Pemilihan pegawai teladan atau mahasiswaberprestasi.

Deteksi gangguan pada komputer

Dan lain sebagainya

Page 4: 3475 16 decision tree

KONSEP DATA DECISION TREE Data dinyatakan dalam betuk tabel dengan atribut danrecord.

Atribut menyatakan suatu parameter yang dibuatsebagai kriteria dalam pembentukan tree.

Salah satu atribut merupakan atribut yangmenyatakan data solusi per item data yang disebuttarget atribut.

Atribut memiliki nilai-nilai yang dinamakan denganinstance.

Page 5: 3475 16 decision tree

KONSEP DATA DECISION TREENama Cuaca Angin Temperatur Main

Ali Cerah Keras Panas Tidak

Budi Cerah Lambat Panas Ya

Heri Berawan Keras Sedang Tidak

Irma Hujan Keras Dingin Tidak

Diman Cerah Lambat Dingin Ya

Sample/Identity

Atribut TargetAtribut

Page 6: 3475 16 decision tree

PROSES DALAM DECISION TREE Mengubah data (tabel) menjadi tree

Mengubah tree menjadi rule

Menyederhanakan Rule (Pruning)

Page 7: 3475 16 decision tree

Mengubah data (tabel) menjaditree

Page 8: 3475 16 decision tree

Entropy S adalah ruang (data) sample yang digunakan untuk

training.

P+ adalah jumlah yang bersolusi positif (mendukung) pada data sample untuk kriteria tertentu.

P- adalah jumlah yang bersolusi negatif (tidak mendukung) pada sata sample untuk kriteria tertentu.

Besarnya nilai Entropy pada ruang sample (S) diddefinisikan dengan:

Entropy(S) = (-P+ log2 P+) – (P- log2 P-)

Page 9: 3475 16 decision tree

MENGUBAH TREE MENJADI RULE

Page 10: 3475 16 decision tree

Conjunction & Disjunction

Page 11: 3475 16 decision tree

CONTOH KASUS: Penentuan penderita hipertensi menggunakanDecision Tree.

Data terdiri dari 8 sampel, dengan asumsi faktor yangmempengaruhi seseorang menderita hipertensiberdasarkan usia, berat badan dan jenis kelamin.

Kategori (instance):

usia: muda dan tua

berat: underweight, average, overweight

kelamin: pria dan wanita

Page 12: 3475 16 decision tree

Langkah mengubah data menjadi tree: Menentukan node terpilih

Menyusun tree

Page 13: 3475 16 decision tree

Menentukan Node terpilih Mencari nilai entropy dari setiap kriteria dengan data

sample yang ditentukan

Node terpilih adalah kriteria dengan nilai entropyterkecil

Page 14: 3475 16 decision tree

Memilih Node Awal

Page 15: 3475 16 decision tree

Memilih Node Awal

Page 16: 3475 16 decision tree

Penyusunan Tree Awal

Leaf node berikutnya yang dapat dipilih adalah bagianyang mempunyai nilai + dan -, yaitu berat=overweight

Page 17: 3475 16 decision tree

Penentuan Leaf NodeData training untuk berat = overweight

Page 18: 3475 16 decision tree

Penyusunan Tree

Leaf node usia dan kelaminmemiliki entropy yang sama, tisakada cara lain selain menggunakanpengetahuan pakar atau memilihpada hasil acak

Page 19: 3475 16 decision tree

Hasil Decision Tree

Page 20: 3475 16 decision tree

Mengubah Tree Menjadi Rule

Page 21: 3475 16 decision tree

Hasil Prediksi

Page 22: 3475 16 decision tree

Menyederhanakan dan Menguji Rule Membuat table distribusi terpadu dengan menyatakan

semua nilai kejadian pada setiap rule.

Menghitung tingkat independensi antara kriteria pada suatu rule, yaitu antara atribut dan target atribut.

Mengeliminasi kriteria yang tidak perlu, yaitu yang tingkat independensinya tinggi.

Page 23: 3475 16 decision tree

Hasil Prediksi Penyederhanaan