yuki rizki adam nugraha_117006031

9
Laporan Klasifikasi Data Menggunakan Metode J48 Laporan ini diajukan untuk memenuhi tugas Mata Kuliah Data Mining Tahun 2013/2014 Disusun Oleh: 117006031 Yuki Rizki Adam Nugraha TEKNIK INFORMATIKA FAKULTAS TEKNIK UNIVERSITAS SILIWANGI

Upload: yuki-rizki-adam-nugraha

Post on 11-Sep-2015

215 views

Category:

Documents


2 download

DESCRIPTION

Data Mining

TRANSCRIPT

LaporanKlasifikasi Data Menggunakan Metode J48Laporan ini diajukan untuk memenuhi tugas Mata Kuliah Data MiningTahun 2013/2014

Disusun Oleh:117006031Yuki Rizki Adam Nugraha

TEKNIK INFORMATIKAFAKULTAS TEKNIK UNIVERSITAS SILIWANGIJln. Siliwangi no. 24 tasikmalaya kotak pos 164 tlp. (0265) 323537E-mail : [email protected] ; url : www.unsil.ac.id2014

1. DataSet playing_tennis_031.arff

2. Proses klasifikasi (classify) menggunakan metode Decision Tree (dalam software Weka disebut sebagai metode J48). Snapshot berikut memperlihatkan tampilan Weka setelah metode J48 dipilih.

3. Proses testing menggunakan training set itu sendiri dengan memilih Cross- validation sebagai Test Options. Set parameter folds = 10, hal ini berarti sistem akan mengacak data training set dan mengambil sebagian dari datanya untuk dijadikan testing set. Proses ini dilakukan sebanyak 10 kali dan hasil akhir merupakan akurasi rata- rata dari kesepuluh percobaan tersebut. Klik tombol mouse-kanan pada bagian seperti yang ditunjukkan oleh gambar berikut dan pilih Visualize Tree, maka pohon yang terbentuk akan ditampilkan.

4. Pohon keputusan ditampilkan sebagai berikut

Gambar diatas adalah tampilan pohon keputusan dari dataset playing tennis. Pohon keputusan diatas terdiri dari 2 node attribut dan 4 node class. Dari setiap node terdapat district yang terhubung pada node lainnya yang bersangkutan.

5. Observasi menggunakan Cross-validation dengan parameter folds = 5.

Jika memperhatikan hasil dari kedua percobaan di atas, terlihat sangat signifikan perubahan yang terjadi pada nilai Precision, Recall, dan F-Measure. Dimana nilai pada percobaan yang menggunakan Cross-validation dengan parameter folds = 5 nilainya lebih besar daripada menggunakan Cross-validation dengan parameter folds = 10. Sehingga dapat diambil kesimpulan untuk percobaan ini jika parameter foldsnya semakin kecil maka nilai yang dihasilkan akan lebih besar, begitu pula sebaliknya.

6. DataSet breast-camcer.arff

7. Proses klasifikasi (classify) menggunakan metode Decision Tree (dalam software Weka disebut sebagai metode J48). Snapshot berikut memperlihatkan tampilan Weka setelah metode J48 dipilih.

8. Proses testing menggunakan training set itu sendiri dengan memilih Cross- validation sebagai Test Options. Set parameter folds = 10, hal ini berarti sistem akan mengacak data training set dan mengambil sebagian dari datanya untuk dijadikan testing set. Proses ini dilakukan sebanyak 10 kali dan hasil akhir merupakan akurasi rata- rata dari kesepuluh percobaan tersebut. Klik tombol mouse-kanan pada bagian seperti yang ditunjukkan oleh gambar berikut dan pilih Visualize Tree, maka pohon yang terbentuk akan ditampilkan.

9. Pohon keputusan ditampilkan sebagai berikut

10. Observasi menggunakan Cross-validation dengan parameter folds = 5.

Jika memperhatikan hasil dari kedua percobaan di atas, terlihat sangat signifikan perubahan yang terjadi pada nilai Precision, Recall, dan F-Measure. Dimana nilai pada percobaan yang menggunakan Cross-validation dengan parameter folds = 10 nilainya lebih besar daripada menggunakan Cross-validation dengan parameter folds = 5. Sehingga dapat diambil kesimpulan untuk percobaan ini jika parameter foldsnya semakin besar maka nilai yang dihasilkan akan lebih besar, begitu pula sebaliknya.