pembahasan decision tree

Download Pembahasan Decision Tree

Post on 12-Aug-2015

796 views

Category:

Documents

49 download

Embed Size (px)

DESCRIPTION

aa

TRANSCRIPT

BAB I

PENDAHULUAN

1.1. Latar Belakang Masalah

Sebagian besar keputusan yang dibuat manusia, terutama di bidang bisnis dan konstruksi akan selalu beresiko karena informasi yang tersedia adalah informasi yang tidak sempurna atau imperfect information. Hal inilah yang menyebabkan para pembuat keputusan tidak pernah lelah dalam mencari informasi tambahan untuk memperoleh hasil keputusan terbaik. Visualisasi tersebut menggambarkan bagaimana putusan harus memilih berbagai alternatif yang berdasar perhitungan dengan nilai keputusan berbeda.

Dalam suatu analisis keputusan, Decision Tree (Pohon Keputusan) merupakan salah satu alat untuk mencapai keputusan terbaik tersebut. Dimana Decision Tree adalah suatu decision support tool yang menggunakan sebuah grafik atau model suatu keputusan dan konsekuensi-konsekuensi dari keputusan tersebut. Disebut Decision Tree karena bila digambarkan mirip sebuah pohon dengan cabang-cabang dan ranting-rantingnya. Decision Tree biasanya digunakan untuk mengidentifikasi strategi terbaik yang harus digunakan untuk mencapai tujuan.

Kegunaan lain dari Decision Tree adalah sebagai alat deskriptif untuk menghitung probabilitas kondisional. Dibandingkan dengan decision support tools yang lain, Decision Tree memiliki beberapa kelebihan yakni mudah dimengerti dan diinterpretasikan. Orang akan mudah memahami model dari Decision Tree setelah memperoleh penjelasan singkat. Selain itu Decision Tree tetap memiliki nilai bahkan dengan data yang sulit. Untuk pengertian yang lebih mendalam dapat diperoleh berdasarkan gambaran dari tenaga ahli mengenai situasinya (alternatifnya, probabilitasnya, dan biaya-biayanya) dan pilihan mereka untuk hasilnya.

Decision Tree menggunakan white box model. Jika kita memperoleh hasil dari model tersebut maka penjelasannya akan dapat dengan mudah dimengerti dengan matematika sederhana. Decision Tree juga bisa dikombinasikan dengan teknik pengambilan keputusan yang lainnya contohnya dengan metode NPV, PERT dan distribusi linear. Bukan hanya itu, Decision Tree dapat digunakan untuk mengoptimalisasikan suatu investasi.

Berdasarkan hal tersebut, makan dalam penyusunan makalah ini akan dibahas lebih lanjut mengenai Decision Tree.

1.2. Rumusan Masalah

Dari latar belakang tersebut, maka permasalahan yang penulis angkat dalam tugas ini adalah :

1. Apa saja manfaat dari penggunanaa Decision Tree?

2. Bagaimana penerapan Decision Tree dalam suatu kasus?

1.3. Sistematika Penulisan.

Sistematika penulisan dalam tugas ini, meliputi :

BAB I PENDAHULUAN

Pada bab ini diuraikan tentang latar belakang, rumusan masalah dan sistematika penulisan.

BAB II KONSEP DAN TEORI

Bab ini menguraikan tentang konsep dan teori yang diperlukan sebagai pendukung dalam pembahasan.

BAB III METODE PEMBAHASAN

Bab ini menguraikan secara singkat tentang metode yang digunakan.

BAB IV PEMBAHASAN

Bab ini berisi proses pembahasan yang relevan dengan permasalahan.

BAB V SIMPULAN

Bab ini berisi simpulan terhadap hasil pembahasan.

BAB II

KONSEP DAN TEORI

2.1. Pengertian Decision Tree

Secara konsep Decision Tree adalah salah satu dari teknik decision analysis.Tries sendiri pertama kali diperkenalkan pada tahun 1960-an oleh Fredkin. Trie atau digital tree berasal dari kata retrival (pengambilan kembali) sesuai dengan fungsinya. Secara etimologi kata ini diucapkan sebagai tree. Meskipun mirip dengan penggunaan kata try tetapi hal ini bertujuan untuk membedakannya dari general tree. Dalam ilmu komputer, trie, atau prefix tree adalah sebuah struktur data dengan representasi ordered tree yang digunakan untuk menyimpan associative array yang berupa string. Berbeda dengan binary search tree (BST) yang tidak ada node di tree yang menyimpan elemen yang berhubungan dengan node sebelumnya dan, posisi setiap elemen di tree sangat menentukan. Semua keturunan dari suatu node mempunyai prefix string yang mengandung elemen dari node itu, dengan root merupakan string kosong. Values biasanya tidak terkandung di setiap node, hanya di daun dan beberapa node di tengah yang cocok dengan elemen tertentu.

Secara singkat bahwa Decision Tree merupakan salah satu metode klasifikasi pada Text Mining. Klasifikasi adalah proses menemukan kumpulan pola atau fungsi-fungsi yang mendeskripsikan dan memisahkan kelas data satu dengan lainnya, untuk dapat digunakan untuk memprediksi data yang belum memiliki kelas data tertentu (Jianwei Han, 2001).

Decision Tree adalah sebuah struktur pohon, dimana setiap node pohon merepresentasikan atribut yang telah diuji, setiap cabang merupakan suatu pembagian hasil uji, dan node daun (leaf) merepresentasikan kelompok kelas tertentu. Level node teratas dari sebuah Decision Tree adalah node akar (root) yang biasanya berupa atribut yang paling memiliki pengaruh terbesar pada suatu kelas tertentu. Pada umumnya Decision Tree melakukan strategi pencarian secara top-down untuk solusinya. Pada proses mengklasifikasi data yang tidak diketahui, nilai atribut akan diuji dengan cara melacak jalur dari node akar (root) sampai node akhir (daun) dan kemudian akan diprediksi kelas yang dimiliki oleh suatu data baru tertentu.

2.2 Node dan Algoritma Penyusun Decision Tree

Decision Tree merupakan salah satu metode klasifikasi yang menggunakan representasi struktur pohon (tree) dimana setiap node merepresentasikan atribut, cabang nya merepresentasikan nilai dari atribut, dan daun merepresentasikan kelas. Node yang paling atas dari Decision Tree disebut sebagai root. Decision Tree merupakan metode klasifikasi yang paling populer digunakan. Selain karena pembangunannya relatif cepat, hasil dari model yang dibangun mudah untuk dipahami.

Pada Decision Tree terdapat 3 jenis node, yaitu:

a. Root Node, merupakan node paling atas, pada node ini tidak ada input dan bisa tidak mempunyai output atau mempunyai output lebih dari satu.

b. Internal Node , merupakan node percabangan, pada node ini hanya terdapat satu input dan mempunyai output minimal dua.

c. Leaf node atau terminal node , merupakan node akhir, pada node ini hanya terdapat satu input dan tidak mempunyai output.

Decision Tree menggunakan algoritma ID3 atau C4.5, yang diperkenalkan dan dikembangkan pertama kali oleh Quinlan yang merupakan singkatan dari Iterative Dichotomiser 3 atau Induction of Decision 3 (baca: Tree). Algoritma ID3 membentuk pohon keputusan dengan metode divide-and-conquer data secara rekursif dari atas ke bawah. Strategi pembentukan Decision Tree dengan algoritma ID3 adalah:

Pohon dimulai sebagai node tunggal (akar/root) yang merepresentasikan semua data.

Sesudah node root dibentuk, maka data pada node akar akan diukur dengan information gain untuk dipilih atribut mana yang akan dijadikan atribut pembaginya.

Sebuah cabang dibentuk dari atribut yang dipilih menjadi pembagi dan data akan didistribusikan ke dalam cabang masing-masing.

Algoritma ini akan terus menggunakan proses yang sama atau bersifat rekursif untuk dapat membentuk sebuah Decision Tree. Ketika sebuah atribut telah dipilih menjadi node pembagi atau cabang, maka atribut tersebut tidak diikutkan lagi dalam penghitungan nilai information gain.

Proses pembagian rekursif akan berhenti jika salah satu dari kondisi dibawah ini terpenuhi:

1. Semua data dari anak cabang telah termasuk dalam kelas yang sama.

2. Semua atribut telah dipakai, tetapi masih tersisa data dalam kelas yang berbeda. Dalam kasus ini, diambil data yang mewakili kelas yang terbanyak untuk menjadi label kelas pada node daun.

3.Tidak terdapat data pada anak cabang yang baru. Dalam kasus ini, node daun akan dipilih pada cabang sebelumnya dan diambil data yang mewakili kelas terbanyak untuk dijadikan label kelas.

Beberapa contoh pemakaian Decision Tree,yaitu :

Diagnosa penyakit tertentu, seperti hipertensi, kanker, stroke dan lain-lain

Pemilihan produk seperti rumah, kendaraan, komputerdanlain-lain

Pemilihan pegawai teladan sesuai dengan kriteria tertentu

Deteksi gangguan pada computer atau jaringan computer seperti Deteksi Entrusi, deteksi virus (Trojan dan varians),dan lain-lain

BAB III

METODE PENULISAN

Metode pembahasan dalam penulisan tugas ini disampaikan secara deskriptif, mengacu pada beberapa sumber literatur/pustaka sebagai acuan dan sarana pendukung, baik cetak maupun elektronik. Selanjutnya dikaji secara mendalam mengikuti kaidah-kaidah ilmiah.

BAB IV

HASIL DAN PEMBAHASAN

4.1. Decision Tree dan Manfaatnya

Pohon keputusan adalah salah satu metode klasifikasi yang paling populer karena mudah untuk diinterpretasi oleh manusia. Pohon keputusan adalah model prediksi menggunakan struktur pohon atau struktur berhirarki. Konsep dari pohon keputusan adalah mengubah data menjadi pohon keputusan dan aturan-aturan keputusan. Manfaat utama dari penggunaan pohon keputusan adalah kemampuannya untuk mem-break down proses pengambilan keputusan yang kompleks menjadi lebih simpel sehingga pengambil keputusan akan lebih menginterpretasikan solusi dari permasalahan.

Pohon Keputusan juga berguna untuk mengeksplorasi data, menemukan hubungan tersembunyi antara sejumlah calon variabel input dengan sebuah variabel target. Pohon keputusan memadukan antara eksplorasi data dan pemodelan, sehingga sangat bagus sebagai langkah awal dalam proses pemodelan bahkan ketika dijadikan sebagai model akhir dari beberapa teknik lain.

Kelebihan dari metode pohon keputusan (Decision Tree) adalah:

Daerah pengambilan keputusan yang sebelumnya kompleks dan sangat global, dapat diubah menjadi lebih simpel dan spesifik.

Eliminasi perhitungan-perhitungan yang tidak diperlukan, karena

Recommended

View more >