laporan tugas besar bdt algoritma c4.5

Upload: radheenaghuzimansudrhajat

Post on 02-Mar-2018

236 views

Category:

Documents


0 download

TRANSCRIPT

  • 7/26/2019 Laporan Tugas Besar BDT Algoritma C4.5

    1/39

    BAB I

    PENDAHULUAN

    A. LATAR BELAKANG

    Di dalam kehidupan manusia sehari-hari, manusia selalu dihadapkan oleh

    berbagai macam masalah dari berbagai macam bidang. Masalah-masalah yang

    dihadapi oleh manusia memiliki tingkatkesulitan dan kompleksitas yang sangat

    bervariasi, mulai dari masalah yang teramat sederhana dengan sedikit faktor-faktor

    yang terkait, sampai dengan masalah yang sangat rumit dengan banyak sekali faktor-

    faktor yang terkait dan perlu untuk diperhitungkan.Untuk menghadapi masalah-

    masalah ini, manusia mulai mengembangkan sebuah sistem yang dapat membantu

    manusia agar dapat dengan mudah mampu untuk menyelesaikan masalah-masalah

    tersebut.Kami menggunakan Algoritma C.! dalam pengolahan data mahasis"a

    #$M%K &alangka 'aya. #edangkan untuk membuat pohon keputusannya kami

    menggunakan aplikasi ()KA dengan algoritma *+. Adapun pohon keputusan ini

    adalah sebuah a"aban akan sebuah sistem yang harus di kembangkan untuk

    membantu mencari dan membuat keputusan dalam masalah-masalah tersebut dan

    dengan memperhitungkan berbagai macam faktor yang ada di dalam lingkup

    masalah tersebut. Dengan pohon keputusan, manusia dapat dengan mudah

    mengidentifikasi dan melihat hubungan antara faktor-faktor yang mempengaruhi

    suatu masalah dan dapat mencari penyelesaian terbaik dengan memperhitungkan

    faktor-faktor tersebut.Dalam pengolahan data ini kami mengklasifikasikan data mahasis"a #$M%K

    &alangka 'aya menadi beberapa atribut yaitu nomor urut, enis kelamin, urusan,

    kelas, dan agama. amun, nilai hasil yang akan kami kemukaan dalam analisis ini

    adalah membuat pohon keputusan mengenai mayoritas agamanya sehingga atribut

    agama dicantumkan sebagai atribut hasil.

    B. RUMUSAN MASALAH

    Dalam analisis ini, masalah pokok yang akan kami ungkapkan adalah mengetahui

    agama apa yang menadi mayoritas dalam lingkungan #$M%K &alangka 'aya

    berdasarkan data mahasis"a. #ecara lebih khusus masalah penelitian ini dirumuskan

    sebagai berikut

    /

  • 7/26/2019 Laporan Tugas Besar BDT Algoritma C4.5

    2/39

    /. 0agaimana cara menemukan mayoritas agama yang dimiliki oleh mahasis"a

    #$M%K &alangka 'aya dengan algoritma C.! berdasarkan atribut kelas,

    urusan, enis kelamin, dan nomor urut1

    2. 0agaimana cara membuat pohon keputusannya menggunakan algoritma *+ danseperti apa tampilan pohonnya1

    C. TUJUAN DAN MANFAAT

    Analisis ini bertuuan untuk/. Mengetahui mayoritas agama di lingkungan #$M%K &alangka 'aya berdasarkan

    data mahasis"a.2. Memberikan tampilan desicion tress mayoritas agama mahasis"a #$M%K

    &alangka 'aya.

    Manfaat dari analisis ini adalah

    /. Memberi kemudahan dalam mengambil keputusan tentang mayoritas agama di

    #$M%K &alangka 'aya2. 3asil pemaparan analisis ini dapat diadikan bahan pembelaaran bagi rekan-

    rekan pembaca agar dapat memahami proses pengolahan pohon keputusan

    dengan algoritma C.!

    BAB II

    LANDASAN TEORI

    A. POHON KEPUTUSAN (DECISION TRESS)

    2

  • 7/26/2019 Laporan Tugas Besar BDT Algoritma C4.5

    3/39

    /. #earah &ohon Keputusan

    Di dalam kehidupan manusia sehari-hari, manusia selalu dihadapkan oleh

    berbagai macam masalah dari berbagai macam bidang. Masalah-masalah yang

    dihadapi oleh manusia memiliki tingkat kesulitan dan kompleksitas yang sangat

    bervariasi, mulai dari masalah yang teramat sederhana dengan sedikit faktor-

    faktor yang terkait, sampai dengan masalah yang sangat rumit dengan banyak

    sekali faktor-faktor yang terkait dan perlu untuk diperhitungkan. Untuk

    menghadapi masalahmasalah ini, manusia mulai mengembangkan sebuah sistem

    yang dapat membantu manusia agar dapat dengan mudah mampu untuk

    menyelesaikan masalah-masalah tersebut.

    Adapun pohon keputusan ini adalah sebuah a"aban akan sebuah sistemyang manusia kembangkan untuk membantu mencari dan membuat keputusan

    untuk masalah-masalah tersebut dan dengan memperhitungkan berbagai macam

    faktor yang ada di dalam lingkup masalah tersebut. Dengan pohon keputusan,

    manusia dapat dengan mudah mengidentifikasi dan melihat hubungan antara

    faktor-faktor yang mempengaruhi suatu masalah dan dapat mencari penyelesaian

    terbaik dengan memperhitungkan faktor-faktor tersebut.

    &ohon keputusan ini uga dapat menganalisa nilai resiko dan nilai suatu

    informasi yang terdapat dalam suatu alternatif pemecahan masalah. &eranan

    pohon keputusan sebagai alat bantu dalam mengambil keputusan 4decision

    support tool5 telah dikembangkan oleh manusia seak perkembangan teori pohon

    yang dilandaskan pada teori graf. Kegunaan pohon keputusan yang sangat

    banyak ini membuatnya telah dimanfaatkan oleh manusia dalam berbagai

    macam sistem pengambilan keputusan.

    2. &engertian &ohon Keputusan

    &ohon dalam analisis pemecahan masalah pengambilan keputusan adalah

    pemetaan mengenai alternatif-alternatif pemecahan masalah yang dapat diambil

    dari masalah tersebut. &ohon tersebut uga memperlihatkan faktor-faktor

    kemungkinan6probablitas yang akan mempengaruhi alternatif-alternatif

    keputusan tersebut, disertai dengan estimasi hasil akhir yang akan didapat bila

    kita mengambil alternatif keputusan tersebut.

    7

  • 7/26/2019 Laporan Tugas Besar BDT Algoritma C4.5

    4/39

    7. Manfaat &ohon Keputusan

    &ohon keputusan adalah salah satu metode klasifikasi yang paling

    populer karena mudah untuk diinterpretasi oleh manusia. &ohon keputusan

    adalah model prediksi menggunakan struktur pohon atau struktur berhirarki.

    Konsep dari pohon keputusan adalah mengubah data menadi pohon keputusan

    dan aturan-aturan keputusan. Manfaat utama dari penggunaan pohon keputusan

    adalah kemampuannya untuk mem-break downproses pengambilan keputusan

    yang kompleks menadi lebih simpel sehingga pengambil keputusan akan lebih

    menginterpretasikan solusi dari permasalahan.

    &ohon Keputusan uga berguna untuk mengeksplorasi data, menemukanhubungan tersembunyi antara seumlah calon variabel input dengan sebuah

    variabel target. &ohon keputusan memadukan antara eksplorasi data dan

    pemodelan, sehingga sangat bagus sebagai langkah a"al dalam proses

    pemodelan bahkan ketika diadikan sebagai model akhir dari beberapa teknik

    lain. #ering teradi ta"ar mena"ar antara keakuratan model dengan transparansi

    model. Dalam beberapa aplikasi, akurasi dari sebuah klasifikasi atau prediksi

    adalah satu-satunya hal yang ditonolkan, misalnya sebuah perusahaan direct

    mail membuat sebuah model yang akurat untuk memprediksi anggota mana

    yang berpotensi untuk merespon permintaan, tanpa memperhatikan bagaimana

    atau mengapa model tersebut bekera.

    . Kelebihan &ohon Keputusan

    Kelebihan dari metode pohon keputusan adalah

    a5 Daerah pengambilan keputusan yang sebelumnya kompleks dan sangat

    global, dapat diubah menadi lebih simpel dan spesifik.b5 )liminasi perhitungan-perhitungan yang tidak diperlukan, karena ketika

    menggunakan metode pohon keputusan maka sample diui hanya

    berdasarkan kriteria atau kelas tertentu.c5 8leksibel untuk memilih fitur dari internal node yang berbeda, fitur yang

    terpilih akan membedakan suatu kriteria dibandingkan kriteria yang lain

    dalam node yang sama.

  • 7/26/2019 Laporan Tugas Besar BDT Algoritma C4.5

    5/39

    d5 Kefleksibelan metode pohon keputusan ini meningkatkan kualitas keputusan

    yang dihasilkan ika dibandingkan ketika menggunakan metode

    penghitungan satu tahap yang lebih konvensional.

    e5 Dalam analisis multivariat, dengan kriteria dan kelas yang umlahnya sangatbanyak, seorang pengui biasanya perlu untuk mengestimasikan baik itu

    distribusi dimensi tinggi ataupun parameter tertentu dari distribusi kelas

    tersebut. Metode pohon keputusan dapatf5 menghindari munculnya permasalahan ini dengan menggunakan criteria

    yang umlahnya lebih sedikit pada setiap node internal tanpa banyak

    mengurangi kualitas keputusan yang dihasilkan.

    !. Kekurangan &ohon Keputusana5 $eradi overlap terutama ketika kelas-kelas dan criteria yang digunakan

    umlahnya sangat banyak. 3al tersebut uga dapat menyebabkan

    meningkatnya "aktu pengambilan keputusan dan umlah memori yang

    diperlukan.b5 &engakumulasian umlah eror dari setiap tingkat dalam sebuah pohon

    keputusan yang besar.c5 Kesulitan dalam mendesain pohon keputusan yang optimal.d5 3asil kualitas keputusan yang didapatkan dari metode pohon keputusan

    sangat tergantung pada bagaimana pohon tersebut didesain.

    B. ALGORITMA C4.5

    Algoritma C.! adalah algoritma klasifikasi data dengan teknik pohon

    keputusan yang terkenal dan disukai karena memiliki kelebihan-kelebihan.

    Kelebihan ini misalnya dapat mengolah data numerik 4kontinyu5 dan diskret, dapat

    menangani nilai atribut yang hilang, menghasilkan aturan-aturan yang mudah

    diintrepetasikan dan tercepat diantara algoritma-algoritma yang lain. Keakuratan

    prediksi yaitu kemampuan model untuk dapat memprediksi label kelas terhadap data

    baru atau yang belum diketahui sebelumnya dengan baik. Dalam hal kecepatan atau

    efisiensi "aktu komputasi yang diperlukan untuk membuat dan menggunakan

    model. Kemampuan model untuk memprediksi dengan benar "alaupun data ada

    nilai dari atribut yang hilang. Dan uga skalabilitas yaitu kemampuan untuk

    membangun model secara efisien untuk data berumlah besar 4aspek ini akan

    !

  • 7/26/2019 Laporan Tugas Besar BDT Algoritma C4.5

    6/39

    mendapatkan penekanan5. $erakhir interpretabilitas yaitu model yang dihasilkan

    mudah dipahami.

    Dalam algoritma C.! untuk membangun pohon keputusan hal pertama

    yang dilakukan yaitu memilih atribut sebagai akar. Kemudian dibuat cabang untuk

    tiap-tiap nilai didalam akar tersebut. 9angkah berikutnya yaitu membagi kasus

    dalam cabang. Kemudian ulangi proses untuk setiap cabang sampai semua kasus

    pada cabang memiliki kelas yang sama.

    Untuk memilih atribut dengan akar, didasarkan pada nilai gain tertinggi dari

    atribut-tribut yang ada. Untuk menghitung gain digunakan rumus sebagai berikut

    :ain4#,A5 ; )ntropy 4#5 < i=1

    n |Si||S|Entropy (Si)

    Dengan # 3impunan kasusA Atributn *umlah partisi atribut A=#i= *umlah kasus pada partisi ke i=#= *umlah kasus dalam #

    #ehingga akan diperoleh nilai gain dari atribut yang paling tertinggi. :ain

    adalah salah satu atribute selection measure yang digunakan untuk memilih test

    atribute tiap node pada tree. Atribut dengan information gain tertinggi dipilih

    sebagai test atribut dari suatu node. #ementara itu, penghitungan nilai entropi dapat

    dilihat pada persamaan

    )ntropy 4#5 ; i=1

    n

    Pilog2Pi

    Dengan # 3impunan kasusA 8itur n *umlah pertisi #&i &roporsi dari #i terhadap #

    )ntropy adalah ukuran dari sebuah ketidakpastian dengan variabel yang

    random 4acak5. Dalam hal stored instances, maka entropy adalah ukuran

    ketidakpastian dari attribute.

    >

  • 7/26/2019 Laporan Tugas Besar BDT Algoritma C4.5

    7/39

    C. STMIK PALANGKA RAYA

    #ekolah $inggi Manaemen %nformatika dan Komputer 4#$M%K5

    &alangkaraya yang dulunya bernama AM%K &alangkaraya, merupakan &erguruan

    $inggi %nformatika dan Komputer yang pertama di Kalimantan $engah khususnya di

    Kota Cantik &alangka 'aya. 0erdiri sesuai dengan iin yang dikeluarkan oleh Diren

    Dikti Depdikbud omor ?@+6D66/BB!, tanggal 2+ #eptember /BB! dan iin

    perubahan status menadi #$M%K &alangkaraya dari Menteri &endidikan asional

    'epublik %ndonesia omor @/6D662??@ tanggal 2 Mei 2??@.

    $anggal %in &erubahan #tatus dari AM%K &alangkaraya menadi #$M%K

    &alangkaraya itulah yang diadikan sebagai tanggal untuk memperingati Diesatalis #$M%K &alangkaraya selanutnya.

    D. WEKA DAN ALGORITMA J48

    /. ()KA(eka adalah aplikasi data mining open source berbasis ava.Aplikasi ini

    dikembangkan pertama kali oleh Universitas (aikato di #elendia 0aruse belum

    menadi bagian dari &entaho.(eka terdiri dari koleksi algoritma machine

    learning yang dapat digunakan untuk melakukan generalisasi6 formulasi dari

    sekumpulan data sampling. (alaupun kekuatan "eka terletak pada algoritma

    yang makin lengkap dan canggih, kesuksesan data mining tetap terletak pada

    factor pengetahuan manusia implementornya. $ugas pengumpulan data yang

    berkualitas tinggi dan pengetahuan permodelan dan penggunaan algoritma yang

    tepat diperlukan untuk menamin ke akuratan formulasi yang diharapkan.

    )mpat tombol diatas dapat digunakan untuk menalankan aplikasi

    /. )plorer digunakan untuk menggali lebih auh data dengan aplikasi ()KA

    @

  • 7/26/2019 Laporan Tugas Besar BDT Algoritma C4.5

    8/39

    2. )perimenter digunakanuntukmelakukanpercobaandenganpenguian statistic

    skemabelaar7. Kno"ledge 8lo" digunakan untuk pengetahuan pendukung. #imple C9% antarmuka dengan menggunakan tampilan command-line yang

    memungkinkan langsung mengeksekusi perintah "eka untuk #istem perasi

    yang tidak menyediakan secara langsung.

    +

  • 7/26/2019 Laporan Tugas Besar BDT Algoritma C4.5

    9/39

    BAB III

    ANALISIS DAN HASIL

    Untuk mendapatkan hasil analisa yang tepat digunakan tiga metode dalam

    pengeraannya. Metode yang digunakan dalam analisis ini adalah perhitungan algoritma

    C.! menggunakan perhitungan manual dan Microsoft ecel. Kemudian hasil analisis

    akan dibuktikan dengan menggunakan aplikasi ()KA untuk menampilkan pohon

    keputusannya.

    A. ALGORITMA C4.5

    #$M%K palangkaraya memiliki total mahasis"a pada tahun 2?/?-2?//adalah sebesar ?7 orang. $erdiri dari urusan $%, M%, #% dan memiliki kelas untuk

    $% 4kelas A, kelas 0, kelas C, dan kelas D5, #% 4Kelas A dan kelas 05, dan M% 4Kelas

    A dan kelas 05.0erikut ini adalah tabel data mahasis"a angkatan tahun 2?/?-2?// yang telah kami

    ambil beberapa data atributnya untuk kami analisis.

    No.JURUSAN

    KELAS L/P

    AGAMA

    1 TI A L ISLAM

    2 TI A

    LKRIST

    EN

    3 TI A L ISLAM

    4 TI A

    LKRIST

    EN

    5 TI A L ISLAM

    6 TI A

    LKRIST

    EN

    7 TI A L ISLAM

    8 TI A L ISLAM

    9 TI A

    L

    KRIST

    EN10 TI A L ISLAM

    11 TI A L ISLAM

    12 TI A L KRIST

    EN

    13 TI A L ISLAM

    14 TI A L ISLAM

    15 TI A L ISLAM

    16 TI A

    LKRIST

    EN

    B

  • 7/26/2019 Laporan Tugas Besar BDT Algoritma C4.5

    10/39

    17 TI A

    LKRIST

    EN

    18 TI A P ISLAM

    19 TI A

    LKRIST

    EN

    20 TI A

    LKRIST

    EN

    21 TI A L ISLAM

    22 TI A L ISLAM

    23 TI A

    LKRIST

    EN

    24 TI A L ISLAM

    25 TI A

    LKRIST

    EN

    26 TI A

    LKRIST

    EN

    27 TI A

    LKRIST

    EN

    28 TI A L ISLAM

    29 TI A

    LKATOL

    IK

    30 TI A L ISLAM

    31 TI A L ISLAM

    32 TI A L ISLAM

    33 TI A L ISLAM

    34 TI A L ISLAM

    35 TI A L ISLAM

    36 TI A

    PKRIST

    EN

    37 TI A

    PKRIST

    EN

    38 TI A P ISLAM

    39 TI A P ISLAM

    40 TI A P ISLAM

    41 TI A

    PKRIST

    EN

    42 TI A P ISLAM

    43 TI A P KRISTEN

    44 TI A P ISLAM

    45 TI A P ISLAM

    46 TI A P ISLAM

    47 TI A P ISLAM

    48 TI A P ISLAM

    49 TI B L ISLAM

    50 TI B L ISLAM

    51 TI B

    LKRIST

    EN

    /?

  • 7/26/2019 Laporan Tugas Besar BDT Algoritma C4.5

    11/39

    52 TI B

    LKRIST

    EN

    53 TI B

    LKRIST

    EN

    54 TI B L ISLAM

    55 TI B

    LKRIST

    EN

    56 TI B L ISLAM

    57 TI B L ISLAM

    58 TI B L ISLAM

    59 TI B L HINDU

    60 TI B L ISLAM

    61 TI B L ISLAM

    62 TI B L ISLAM

    63 TI B L ISLAM

    64 TI B

    LKRIST

    EN

    65 TI B L ISLAM

    66 TI B L ISLAM

    67 TI B L ISLAM

    68 TI B L HINDU

    69 TI B

    LKRIST

    EN

    70 TI B

    LKRIST

    EN

    71 TI B L ISLAM

    72 TI B L ISLAM

    73 TI B

    LKRIST

    EN

    74 TI B L ISLAM

    75 TI B L ISLAM

    76 TI B L ISLAM

    77 TI B L ISLAM

    78 TI B L ISLAM

    79 TI B L ISLAM

    80 TI B L ISLAM

    81 TI B L ISLAM82 TI B L ISLAM

    83 TI B

    LKRIST

    EN

    84 TI B L ISLAM

    85 TI B

    LKATOL

    IK

    86 TI B P ISLAM

    87 TI B P ISLAM

    88 TI B P ISLAM89 TI B P KRIST

    //

  • 7/26/2019 Laporan Tugas Besar BDT Algoritma C4.5

    12/39

    EN

    90 TI B P ISLAM

    91 TI B P ISLAM

    92 TI

    B

    P

    KRIST

    EN93 TI B P ISLAM

    94 TI B P ISLAM

    95 TI B P ISLAM

    96 TI B

    PKRIST

    EN

    97 TI B P ISLAM

    98 TI B

    PKRIST

    EN

    99 TI C L ISLAM

    100 TI C

    L

    KRIST

    EN101 TI C L ISLAM

    102 TI C L HINDU

    103 TI C L ISLAM

    104 TI C L ISLAM

    105 TI C L HINDU

    106 TI C L ISLAM

    107 TI C

    LKRIST

    EN

    108 TI C L ISLAM

    109 TI C L

    KRIST

    EN

    110 TI C

    LKRIST

    EN

    111 TI C

    LKATOL

    IK

    112 TI C

    LKRIST

    EN

    113 TI C

    LKRIST

    EN

    114 TI C

    LKRIST

    EN

    115 TI C L ISLAM116 TI C L HINDU

    117 TI C

    LKRIST

    EN

    118 TI C

    LKRIST

    EN

    119 TI C

    LKRIST

    EN

    120 TI C

    LKRIST

    EN121 TI C L KRIST

    /2

  • 7/26/2019 Laporan Tugas Besar BDT Algoritma C4.5

    13/39

    EN

    122 TI C

    LKRIST

    EN

    123 TI C

    LKRIST

    EN

    124 TI C L ISLAM

    125 TI C

    LKRIST

    EN

    126 TI C L ISLAM

    127 TI C L ISLAM

    128 TI C

    LKRIST

    EN

    129 TI C

    LKRIST

    EN

    130 TI C L ISLAM

    131 TI C

    L ISLAM132 TI C L ISLAM

    133 TI C

    LKRIST

    EN

    134 TI C L ISLAM

    135 TI C L ISLAM

    136 TI C

    PKRIST

    EN

    137 TI C P ISLAM

    138 TI C P HINDU

    139 TI

    C

    P

    KRIST

    EN

    140 TI C

    PKRIST

    EN

    141 TI C P HINDU

    142 TI C

    PKRIST

    EN

    143 TI C

    PKRIST

    EN

    144 TI C

    PKRIST

    EN

    145 TI C

    PKRIST

    EN

    146 TI C

    PKRIST

    EN

    147 TI C P ISLAM

    148 TI C

    PKRIST

    EN

    149 TI D L ISLAM

    150 TI D L ISLAM

    151 TI D L ISLAM

    152 TI D

    LKRIST

    EN

    /7

  • 7/26/2019 Laporan Tugas Besar BDT Algoritma C4.5

    14/39

    153 TI D

    LKRIST

    EN

    154 TI D

    LKRIST

    EN

    155 TI D LKRIST

    EN

    156 TI D

    LKRIST

    EN

    157 TI D

    LKRIST

    EN

    158 TI D

    LKRIST

    EN

    159 TI D

    LKRIST

    EN

    160 TI D L ISLAM

    161 TI D

    L

    KATOL

    IK

    162 TI D

    LKRIST

    EN

    163 TI D L ISLAM

    164 TI D

    LKRIST

    EN

    165 TI D

    LKRIST

    EN

    166 TI D L ISLAM

    167 TI D L HINDU

    168 TI D L ISLAM

    169 TI D

    LKRIST

    EN

    170 TI D L ISLAM

    171 TI D

    LKRIST

    EN

    172 TI D

    LKRIST

    EN

    173 TI D

    LKRIST

    EN

    174 TI D

    LKRIST

    EN

    175 TI D L ISLAM

    176 TI D L ISLAM

    177 TI D L ISLAM

    178 TI D

    LKRIST

    EN

    179 TI D L ISLAM

    180 TI D L ISLAM

    181 TI D

    LKRIST

    EN

    182 TI D L ISLAM

    183 TI D L HINDU

    /

  • 7/26/2019 Laporan Tugas Besar BDT Algoritma C4.5

    15/39

    184 TI D

    LKRIST

    EN

    185 TI D L ISLAM

    186 TI D

    PKRIST

    EN

    187 TI D

    LKATOL

    IK

    188 TI D

    PKRIST

    EN

    189 TI D

    PKRIST

    EN

    190 TI D P HINDU

    191 TI D

    PKRIST

    EN

    192 TI D P ISLAM

    193 TI D P

    KRIST

    EN

    194 TI D

    PKRIST

    EN

    195 TI D P HINDU

    196 TI D

    PKRIST

    EN

    197 TI D

    PKRIST

    EN

    198 SI A

    LKRIST

    EN

    199 SI A L ISLAM

    200 SI A L ISLAM201 SI A L ISLAM

    202 SI A

    LKRIST

    EN

    203 SI A L ISLAM

    204 SI A L ISLAM

    205 SI A

    LKRIST

    EN

    206 SI A L ISLAM

    207 SI A

    LKATOL

    IK

    208 SI A

    LKRIST

    EN

    209 SI A L ISLAM

    210 SI A L ISLAM

    211 SI A L ISLAM

    212 SI A L ISLAM

    213 SI A L ISLAM

    214 SI A

    LKRIST

    EN

    215 SI A L ISLAM

    /!

  • 7/26/2019 Laporan Tugas Besar BDT Algoritma C4.5

    16/39

    216 SI A

    LKRIST

    EN

    217 SI A L ISLAM

    218 SI A L ISLAM

    219 SI A L KRISTEN

    220 SI A L ISLAM

    221 SI A

    LKATOL

    IK

    222 SI A L ISLAM

    223 SI A L ISLAM

    224 SI A

    LKRIST

    EN

    225 SI A L ISLAM

    226 SI

    A

    L

    KRIST

    EN

    227 SI A

    LKRIST

    EN

    228 SI A

    LKRIST

    EN

    229 SI A

    LKRIST

    EN

    230 SI A

    PKRIST

    EN

    231 SI A P ISLAM

    232 SI A P ISLAM

    233 SI A P

    KRIST

    EN234 SI A P ISLAM

    235 SI A P ISLAM

    236 SI A

    PKRIST

    EN

    237 SI A

    PKRIST

    EN

    238 SI A

    PKRIST

    EN

    239 SI A P HINDU

    240 SI A P HINDU

    241 SI A P ISLAM

    242 SI A

    PKRIST

    EN

    243 SI A P ISLAM

    244 SI A P ISLAM

    245 SI A P ISLAM

    246 SI A

    PKATOL

    IK

    247 SI A

    PKRIST

    EN

    />

  • 7/26/2019 Laporan Tugas Besar BDT Algoritma C4.5

    17/39

    248 SI A

    PKRIST

    EN

    249 SI A

    LKRIST

    EN

    250 SI A LKRIST

    EN

    251 SI B L HINDU

    252 SI B L ISLAM

    253 SI B

    LKRIST

    EN

    254 SI B L ISLAM

    255 SI B L ISLAM

    256 SI B L HINDU

    257 SI B L ISLAM

    258 SI

    B

    L

    KRIST

    EN259 SI B L ISLAM

    260 SI B L ISLAM

    261 SI B

    LKRIST

    EN

    262 SI B L ISLAM

    263 SI B L ISLAM

    264 SI B

    LKRIST

    EN

    265 SI B L ISLAM

    266 SI

    B

    L

    KRIST

    EN267 SI B L ISLAM

    268 SI B

    LKRIST

    EN

    269 SI B L ISLAM

    270 SI B

    LKRIST

    EN

    271 SI B L ISLAM

    272 SI B L KRIST

    EN

    273 SI B L ISLAM

    274 SI B L KRISTEN

    275 SI B

    LKRIST

    EN

    276 SI B

    LKRIST

    EN

    277 SI B

    LKRIST

    EN

    278 SI B

    LKRIST

    EN

    279 SI B

    LKRIST

    EN

    /@

  • 7/26/2019 Laporan Tugas Besar BDT Algoritma C4.5

    18/39

    280 SI B

    LKRIST

    EN

    281 SI B

    LKRIST

    EN

    282 SI B L ISLAM

    283 SI B P ISLAM

    284 SI B

    PKRIST

    EN

    285 SI B

    PKRIST

    EN

    286 SI B P ISLAM

    287 SI B P ISLAM

    288 SI B P ISLAM

    289 SI B P ISLAM

    290 SI

    B

    P

    KRIST

    EN291 SI B P ISLAM

    292 SI B

    PKRIST

    EN

    293 SI B

    PKRIST

    EN

    294 SI B P ISLAM

    295 SI B

    PKRIST

    EN

    296 SI B P ISLAM

    297 SI B

    PKRIST

    EN

    298 SI B P ISLAM

    299 SI B

    PKRIST

    EN

    300 SI B

    PKRIST

    EN

    301 SI B

    PKRIST

    EN

    302 SI B L ISLAM

    303 MI A

    LKATOL

    IK

    304 MI A L ISLAM

    305 MI A

    LKRIST

    EN

    306 MI A L ISLAM

    307 MI A L ISLAM

    308 MI A

    LKRIST

    EN

    309 MI A

    LKRIST

    EN

    310 MI A

    LKRIST

    EN311 MI A L KRIST

    /+

  • 7/26/2019 Laporan Tugas Besar BDT Algoritma C4.5

    19/39

    EN

    312 MI A L ISLAM

    313 MI A

    LKRIST

    EN

    314 MI A L ISLAM315 MI A L ISLAM

    316 MI A L ISLAM

    317 MI A

    LKATOL

    IK

    318 MI A

    LKRIST

    EN

    319 MI A L ISLAM

    320 MI A L ISLAM

    321 MI A L ISLAM

    322 MI A

    L

    KRIST

    EN323 MI A L ISLAM

    324 MI A

    LKRIST

    EN

    325 MI A

    LKRIST

    EN

    326 MI A

    LKRIST

    EN

    327 MI A

    LKRIST

    EN

    328 MI A L ISLAM

    329 MI A L ISLAM

    330 MI A

    LKRIST

    EN

    331 MI A L ISLAM

    332 MI A L ISLAM

    333 MI A

    LKRIST

    EN

    334 MI A

    LKRIST

    EN

    335 MI A P ISLAM

    336 MI A

    PKRIST

    EN

    337 MI A L ISLAM

    338 MI A P ISLAM

    339 MI A P ISLAM

    340 MI A

    PKRIST

    EN

    341 MI A P ISLAM

    342 MI A P ISLAM

    343 MI A P HINDU

    344 MI A P ISLAM

    345 MI A P ISLAM

    /B

  • 7/26/2019 Laporan Tugas Besar BDT Algoritma C4.5

    20/39

    346 MI A

    PKRIST

    EN

    347 MI A

    PKRIST

    EN

    348 MI A P ISLAM

    349 MI A P ISLAM

    350 MI A P ISLAM

    351 MI A

    PKATOL

    IK

    352 MI A

    PKRIST

    EN

    353 MI B L HINDU

    354 MI B L ISLAM

    355 MI B

    LKRIST

    EN

    356 MI B LKRIST

    EN

    357 MI B L ISLAM

    358 MI B

    LKRIST

    EN

    359 MI B L ISLAM

    360 MI B

    LKRIST

    EN

    361 MI B L HINDU

    362 MI B

    LKRIST

    EN

    363 MI B L ISLAM

    364 MI B

    LKRIST

    EN

    365 MI B

    LKATOL

    IK

    366 MI B

    LKRIST

    EN

    367 MI B

    LKRIST

    EN

    368 MI B L ISLAM

    369 MI B

    LKRIST

    EN

    370 MI B

    LKRIST

    EN

    371 MI B

    LKRIST

    EN

    372 MI B L ISLAM

    373 MI B L ISLAM

    374 MI B L ISLAM

    375 MI B L ISLAM

    376 MI B

    LKRIST

    EN

    377 MI B L ISLAM

    2?

  • 7/26/2019 Laporan Tugas Besar BDT Algoritma C4.5

    21/39

    378 MI B

    LKRIST

    EN

    379 MI B L ISLAM

    380 MI B

    LKRIST

    EN

    381 MI B

    LKRIST

    EN

    382 MI B

    LKRIST

    EN

    383 MI B

    LKRIST

    EN

    384 MI B

    LKRIST

    EN

    385 MI B L ISLAM

    386 MI B P ISLAM

    387 MI B P

    KRIST

    EN388 MI B P ISLAM

    389 MI B P ISLAM

    390 MI B P ISLAM

    391 MI B P ISLAM

    392 MI B

    PKRIST

    EN

    393 MI B P HINDU

    394 MI B

    PKRIST

    EN

    395 MI B P ISLAM

    396 MI B P ISLAM

    397 MI B P ISLAM

    398 MI B P ISLAM

    399 MI B P ISLAM

    400 MI B P ISLAM

    401 MI B P ISLAM

    402 MI B

    PKRIST

    EN

    403 MI B P ISLAM

    Dalam kasus yang tertera pada table data mahasis"a, akan dibuat pohon

    keputusan untuk menentukan agama dengan melihat nomor urut, urusan, kelas, dan

    enis kelamin mahasis"a.#ecara umum algoritma C.! untuk membangun pohon keputusan adalah sebagai

    berikut a. &ilih atribut sebagai akarb. 0uat cabang untuk masing-masing nilaic. 0agi kasus dalam cabang

    2/

  • 7/26/2019 Laporan Tugas Besar BDT Algoritma C4.5

    22/39

    Untuk memilih atribut sebagai akar, didasarkan pada nilai gain tertinggi dari

    atribut-atribut yang ada. Untuk menghitung gain digunakan rumus seperti tertera

    dalam 'umus.

    :ain4#,A5 ; )ntropy 4#5 < i=1

    n

    |Si||S|Entropy (Si)

    Dengan # 3impunan kasusA Atributn *umlah partisi atribut A=#i= *umlah kasus pada partisi ke i=#= *umlah kasus dalam #

    #edangkan perhitungan nilai entropy dapat dilihat pada rumus.

    )ntropy 4#5 ; i=1

    n

    Pi

    log2Pi

    Dengan # 3impunan kasusA 8itur n *umlah pertisi #&i &roporsi dari #i terhadap #

    0erikut ini adalah penelasan lebih rinci mengenai masing-masing langkah

    dalam pembentukan pohon keputusan dengan menggunakan algoritma C.! untuk

    menyelesaikan permasalahan pada tabel data mahasis"a.

    a. Menghitung umlah kasus, umlah kasus untuk keputusan %slam, umlah kasus untuk

    keputusan Kristen, umlah kasus untuk keputusan 3indu, umlah kasus untuk

    keputusan Katolik, dan entropy dari semua kasus dan kasus yang dibagi berdasarkan

    atribut nomor urut, urusan, enis kelamin, dan kelas. #etelah itu lakukan

    perhitungan :ain untuk masing-masing atribut. 3asil perhitungan ditunukkan oleh

    tabel berikut

    Tabe N!"e

    ode*umlah

    Kasus %slam Kristen Katolik 3indu )ntropy :ain

    / $otal ?7 /B+ /@ /2 /B /,7+!>/>

    *urusa

    n?,??

    $% /B@ B@ + ! // /,7B!B2

    #% /?! !? + 7 /,7!2?B

    M% /?/ !/ 2 /,7B7/!2

    Kelas ?,?

    22

  • 7/26/2019 Laporan Tugas Besar BDT Algoritma C4.5

    23/39

    A /!/ +2 !B @ 7 /,72!+/2

    0 /!7 +7 >/ 2 @ /,2B2B@+

    C !? /@ 2@ / ! /,!2+@

    D B /> 2@ 2 /,+>?

    96& ?,?/

    9 2@B /7> /22 /? // /,7+7/B@

    & /2 >2 !2 2 + /,7@>B/

    $ata cara perhitungan untuk mendapatkan nilai pada table node di atas adalah

    sebagai berikut

    E#$%!&' (T!$a )

    ;

    (198403 x log2( 198403 ))+(174403 x log2(174403 ))+(12403 x log2( 12403 ))+(19403 x log2( 19403 ))(198403 x ( log2 (198 )log2(403 )))+(174403 x ( log2 (174 )log2(403 )))+(12403 x ( log2(12 )log2(403 ))

    ;

    (198

    403

    x (7,6293578,654636 )

    )+

    (174

    403

    x (7,4429438,654636 )

    )+

    (12

    403

    x (3,5849638,654636 )

    )+

    (1

    40

    ; (0,503735 )+ (0,523163 )+ (0,150958 )+ (0,20776 )

    ; /,7+!>/>

    Me#*+,$-#* E#$%!&' J-%-a#

    E#$%!&' (TI )

    ;

    (97197 x log2( 9197 ))+(84197 x log2( 84197 ))+(5197x log2( 5197 ))+(11197 x log2( 11197 ));

    (97197 x ( log2(97 )log2 (197 )))+(84197 x ( log2(84 )log2 (197 ) ))+(5197x ( log2(5 )log2(197 )))+(11197 x (log2

    27

  • 7/26/2019 Laporan Tugas Besar BDT Algoritma C4.5

    24/39

    ;

    (97197 x (6,5999137,622052 ))+(84197 x (6,3923177,622052 ))+(5197 x (2,3219287,622052 ) )+(11197 x

    ; (0,503287 )+(0,524354 )+ (0,134521 )+ (0,232431 ); /,7B!B2

    E#$%!&' (SI )

    ;

    (50105 x log2( 50105 ))+(48105 x log2( 48105 ))+(3105x log2( 3105 ))+(4105x log2( 4105 ));

    (50

    105 x ( log2 (50 )log2 (105 )))+(

    48105

    x ( log2 (48 )log2 (105 )))+(3

    105x ( log2 (3 )log2(105 )))+(

    4105

    x ( log2 (

    ;

    (50105 x (5,6438566,714246 ))+(48105 x (5,5849636,714246 ))+(3105 x (1,5849636,714246 ))+(4105 x; (0,509709 )+ (0,516244 )+ (0,146551)+ (0,17959 )

    ; /,7!2?B

    E#$%!&' (MI )

    ;

    (51101 x log2( 51101 ))+(42101 x log2( 42101 ))+(4101x log2( 4101 ))+(4101x log2( 4101 ));

    (51101 x (log2(51 )log2(101 )))+(42101 x ( log2(42 )log2 (101 )))+(4101x ( log2(4 )log2(101 )))+(4101x ( log2 (;

    (51101 x (5,6724256,65811 ))+(42101 x (5,3923176,65811 ))+( 3105 x (26,65811 ))+( 4105 x (26,65811; (0,497773 )+(0,526411)+(0,184484 )+(0,184484 )

    ; /,7B7/!2

    2

  • 7/26/2019 Laporan Tugas Besar BDT Algoritma C4.5

    25/39

    Me#*+,$-#* E#$%!&' Kea

    E#$%!&' Kea (A

    ;

    (82151 log2( 82151 ))+(59151 log2( 59151 ))+(7151 log2( 7151 ))+(3151 log2( 3151 ));

    (82151 ( log2 (82 )log2 (151 )))+(59151 ( log2(59 )log2(151 )))+(7151 ( log2 (7 )log2(151 )))+(3151 ( log2

    ;

    (82151 (6,3575527,238405 ))+(59151 (5,8826437,238405 ))+(7151 (2,8073557,238403 ))+(3151 (1;

    (82151 (0,88085 ))+(59151 (1,35576 ))+(7151 (4,43105 ))+(3151 (5,65344 )); 0,478344+0,529735+0,205413+0,11232

    ; 1,325812

    E#$%!&' Kea (B

    ;

    (

    83153

    log2( 83153 ))+

    (

    61153

    log2( 61153 ))+

    (

    2153

    log2( 2153 ))+

    (

    7153

    log2( 7153));

    (83153 ( log2 (83 )log2(153 )))+(61153 ( log2 (51 )log2 (153 )))+(2153 ( log2 (2 )log2 (153 )))+(7153 ( log2;

    (83153 (6,3570397,257388 ))+(61153 (5,9307377,257388 ))+(2153 (17,257388 ))+(7153 (2,8073

    2!

  • 7/26/2019 Laporan Tugas Besar BDT Algoritma C4.5

    26/39

    ;

    (83153 (0,88235 ))+(61153 (1,32665 ))+(2153 (6,25739 ))+(7153 (4,45003 )); 0,47866+0,528926+0,081796+0,203596

    ; 1,292978

    E#$%!&' Kea (C

    ; (1750 log2( 1750 ))+(2750 log2( 2750 ))+(150 log2( 150 ))+(550 log2( 550 ));

    (17

    50 ( log2 (17 )log2(50 )))+(

    1

    50 ( log2 (1 ) log2 (50 )))+(

    2

    50 x (log2(2 )log2(50 )))+(

    5

    50 ( log2(5 )lo

    ;

    (1750 (4,0874635,643856 ))+(2750 (4,7548885,643856 ))+(150 (05,643856 ))+(550 (2,32192;

    (1750 (1,55639 ))+(2750 (0,88897 ))+(150 (5,64386 ))+(550 (3,32193 )); 0,529174+0,480043+0,112877+0,332193

    ; 1,454287

    E#$%!&' Kea (D

    ; (1649 log2( 1649 ))+(2749 log2( 2749 ))+(249 log2( 249 ))+(449 log2( 449 ));

    (1649 ( log2 (16 )log2(49 )))+(2749 ( log2 (27 )log2(49 )))+(249 ( log2 (2 )log2(49 )))+(449 ( log2(4 );

    (1649 (45,61471))+(2749 (4,7548885,61471 ))+(249 (15,61471 ))+(449 (25,61471 ))

    2>

  • 7/26/2019 Laporan Tugas Besar BDT Algoritma C4.5

    27/39

    ;

    (1649 (1,61471 ))+(2749 (0,85982 ))+(249 (4,61471 ))+(449 (3,61471 )); 0,527252+0,47378+0,188356+0,295078

    ; 1,484466

    Me#*+,$-#* E#$%!&' L/P

    E#$%!&' L/P (L

    ;(136279

    x log2( 136279 ))+

    ;

    (136279 x ( log2 (136 )log2(279 )))+(122279 x ( log2 (122 )log2 (279 )))+(10279 x (log2(10 )log2 (279 )))+(;

    (136279 x (7,0874638,124121 ))+(122279 x (6,9307378,124121 ))+(10279 x (3,3219288,124121 ));

    (136279 x (1,03666 ))+(

    122279 x (1,19338 ))+(

    10279 x (4,80219 ))+(

    12279 x (4,66469 ))

    ; ?,!?!72! ?,!2/+7+ ?,/@2/22 ?,/+7B/2

    ; /,7+7/B@

    E#$%!&' L/P (L

    ;

    (62

    124 x log

    2

    ( 62

    124

    ))+;

    (62124 x ( log2 (62 )log2 (124 )))+(52124 x (log2(52 )log2 (124 )))+(2124 x ( log2 (2 )log2(124 )))+(8124 x; /,7B@/7> ?,!2!@>++B7! ?,?B>?7!2 ?,2!!/?B7B

    2@

  • 7/26/2019 Laporan Tugas Besar BDT Algoritma C4.5

    28/39

    ; /,7@>B/

    Se0e#$a%a ,$- -#$-1 #,a, Ga,# &a"a ba%, J-%-a# a"aa+ eba*a, be%,1-$)

    :ain 4$otal, *urusan5 ; )ntropy 4$otal5 < i=1

    n |Jurusani||Total|

    xEntropy (Jurusan )

    ; /, 7+!>/> - (( 197403x1,394592 )+( 105403x1,352094 )+( 101403x 1,393152)); ?,??

    Se0e#$a%a ,$- -#$-1 #,a, Ga,# &a"a ba%, Kea a"aa+ eba*a, be%,1-$)

    :ain 4$otal, Kelas5 ; )ntropy 4$otal5 < i=1n |Kelasi||Total| xEntropy (Kelas)

    ; /,7+!>/> -

    ((151403x 1,325812)+( 153403 x1,292978)+( 503403 x1,454287)+( 49403x 1,484466)); ?,?7@?7B>

    ; ?,?

    Se0e#$a%a ,$- -#$-1 #,a, Ga,# &a"a ba%, L/P a"aa+ eba*a, be%,1-$)

    :ain 4$otal, *EKel5 ; )ntropy 4$otal5 < i=1

    n |JKel i||Total|

    x Entropy(JKel)

    ; /, 7+!>/> - ((279404 x 1,383197)+( 124403 x1,376914)); ?,?//

    ; ?,?/

    0erdasarkan perhitungan menggunakan algoritma C.! didapatkan bah"a gain

    tertinggi adalah kelas.

    2+

  • 7/26/2019 Laporan Tugas Besar BDT Algoritma C4.5

    29/39

    B. MICROSOFT E2CEL

    0erdasarkan dengan tabel Data Mahasis"a #ebelumnya, buat nama area

    sesuai dengan ketentuan berikut

    /. Cell 0/ sampai 0? diberi nama noEurut, sehingga menadi seperti gambar

    diba"ah ini.

    2. Cell D/ sampai D? diberi nama urusan, sehingga menadi seperti gambar di

    ba"ah ini.

    7. Cell )/ sampai )? diberi nama kelas, sehingga menadi seperti gambar di

    ba"ah ini.

    . Cell 8/ sampai dengan 8? diberi nama Ekel, sehingga menadi seperti

    gambar di ba"ah ini.

    #etelah itu berdasarkan data pada tabel Data Mahasis"a buat calon

    percabangan, adapun calon percabangan yang mungkin teradi dari tabel Data

    Mahasis"a adalah

    2B

  • 7/26/2019 Laporan Tugas Besar BDT Algoritma C4.5

    30/39

    0erikutnya buat tabel untuk menghitung frekuensi yang muncul dari setiap

    hasil produk berikut dengan proporsi serta entropynya, sehingga tampak seperti

    berikut

    0erikut adalah formula-formula yang digunakan untuk mengisi tabel di atas

    /. Untuk cell C/7 48rekuensi %slam5;CU$%84agamaF0/75

    2. Untuk cell C/ 48rekuensi Kristen5

    ;CU$%84agamaF0/5

    7. Untuk cell C/! 48rekuensi Katolik5;CU$%84agamaF0/!5

    . Untuk cell C/> 48rekuensi 3indu5;CU$%84agamaF0/>5

    !. Cell C/@ 4$otal 8rekuensi5>. Cell D/7 4&roporsi %slam6pb5

    ;C/76C/@@. Cell D/ 4&roporsi Kristen6pb5

    ;C/6C/@+. Cell D/! 4&roporsi Katolik6pb5

    ;C/!6C/@B. Cell D/> 4&roporsi 3indu6pb5

    ;C/>6C/@/?. Cell )/7 4%slam6log2pb5

    ;9:4D/7F25//. Cell )/ 4Kristen6log2pb5

    ;9:4D/F25/2. Cell )/! 4Katolik6log2pb5

    ;9:4D/!F25/7. Cell )/> 43indu6log2pb5

    7?

  • 7/26/2019 Laporan Tugas Besar BDT Algoritma C4.5

    31/39

    ;9:4D/>F25/. Cell 8/7 4)ntropy %slam6-pb.log2.pb5

    ;4-)/75GD/7/!. Cell 8/ 4)ntropy Kristen6-pb.log2.pb5

    ;4-)/5GD//>. Cell 8/! 4)ntropy Katolik6-pb.log2.pb5;4-)/!5GD/!

    /@. Cell 8/> 4)ntropy 3indu6-pb.log2.pb5;4-)/>5GD/>

    /+. Cell 8/@ 4$otal )ntropy5;#UM48/78/>5

    0erikutnya kita akan menghitung :ain dari masing-masing criteria untuk mencari

    gain tertinggi yang akan diadikan cabang keputusan, untuk itu digunakan bantuan

    tabel seperti di ba"ah ini

    Cabang I!a

    "K#$%&n

    Ka%'!$(

    H$n)*

    P+I!a",

    P+K#$%&n,

    P+Ka%-'!$(,

    P+H$n)*,

    .P+I!a"

    , L'g2

    P+I!a",

    .P+K#$%&

    n, L'g2

    P+K#$%&n,

    .P+Ka%'!$

    (, L'g2

    P+Ka%'!$(,

    .P+H$n)*

    , L'g2

    P+H$n)*,

    1*#*an TI 97 84 5 11 049 043 003 006 050 052 013 023

    *#*an SI 50 48 3 4 048 046 003 004 051 052 015 018

    *#*an

    MI 51 42 4 4 050 042 004 004 050 053 018 018

    2 K&!a A 82 59 7 3 054 039 005 002 048 053 021 011

    K&!a B 83 61 2 7 054 040 001 005 048 053 008 020

    K&!a C 17 27 1 5 034 054 002 010 053 048 011 033

    K&!a D 16 27 2 4 033 055 004 008 053 047 019 030

    3 LP L136

    122 10 11 049 044 004 004 051 052 017 018

    LP P 62 52 2 8 050 042 002 006 050 053 010 026

    Adapun formula tabel di atas adalah sebagai berikut

    7/

  • 7/26/2019 Laporan Tugas Besar BDT Algoritma C4.5

    32/39

    /. Cell )/B 4produk dengan hasil islam pada urusan $%5;CU$%8#4urusanFD2?FagamaFH)H/B5

    2. Cell %2? 4&roporsi produk dengan hasil islam terhadap keseluruhan produk

    pada *urusan $%5

    ;%8)'''44)2?64)2?82?:2?32?55F?557. Cell M2? 4-&4%slam5 9og2 &4%slam55;%8)'''44-%2?G9:4%2?F255F?5

    . Cell I2? 4$otal5 ; ;#UM4M2?&2?5!. Cell '2? 4&4*urusan;..55

    ;CU$%8#4urusanFD2?56CU$A4urusan5

    >. Cell #2? 4$otal &4*urus@. Cell $2? 4)4$otalG&4*uru+. Cell U2? 4:ain *urusan5

    Note:

    Lakukan hal yang sama untuk

    Mahasiswa. Namun, untuk gai

    72

  • 7/26/2019 Laporan Tugas Besar BDT Algoritma C4.5

    33/39

    C. APLIKASI WEKA

    Untuk membuat pohon keputusan, langkah-langkahnya adalah sebagai

    berikut

    /. &ilih e!plore, maka akan tampil endela seperti di ba"ah ini

    2. Kemudian klik open "ile dan pilih data yang data mahasis"a pilih open.7. 0uka file yang akan dieksekusi oleh (eka, pergunakan ekstensi .ar"" disini

    kami menggunakanDatamhs.ar"" sebagai berikut

    Contoh file arff.

    77

  • 7/26/2019 Laporan Tugas Besar BDT Algoritma C4.5

    34/39

    . #etelah data dimasukkan, maka akan tampil kotak dialog seperti di ba"ah ini. Conteng

    semua atributnya kemudian pilih classi"y.

    !. Kemudian pilih algoritma yang akan digunakan seperti tampilan sebagai berikut

    ini

    7

  • 7/26/2019 Laporan Tugas Besar BDT Algoritma C4.5

    35/39

    *adi ketika ingin melakukan klasifikasi dengan menggunakan ()KA, akan ada

    4empat5 buah pilihan, yang disebut dengan test options. $est option ini

    digunakan untuk mengetes hasil dari klasifikasi yang telah dilakukan. 0erikut

    penelasan mengenai masing-masing option.

    /. Use training set&engetesan dilakukan dengan mengunakan data training itu sendiri.

    2. #upplied test set&engetesan dilakukan dengan menggunakan data lain. Dengan menggunakan

    option inilah, kita bisa melakukan prediksi terhadap data tes.7. Cross-validation

    Akan menampilkan hasil dari rata-rata perhitungan data errornya.. &ercentage split

    3asil klasifikasi akan dites dengan menggunakan data tersebut.

    Aa$ U1-% E3a-a, Pa"a Ka,,1a,

    Alat ukur evaluasi untuk mengetahui evaluasi dari kinera model

    klasifikasi didasarkan pada banyaknya 4count5 dataset record yang diprediksi

    secara benar dan tidak benar pada model klasifikasi tersebut. Count ini

    ditabulasikan dalam sebuah hasil yang dikenal sebagai con"usion matri!. &ada

    ()KA Classifier hasil klasifikasi yang diperoleh akan disertakan dengan

    beberapa alat ukur sebagai bukti teradinya hasil proses pada klasifikasi tersebut

    yang telah tersedia didalamnya, salah satu alat ukur tersebut adalah Confusion

    Matri.

    7!

  • 7/26/2019 Laporan Tugas Besar BDT Algoritma C4.5

    36/39

    Confusion Matri adalah salah satu alat ukur berbentuk matriks yang

    digunakan untuk menetapkan umlah perempatan klasifikasi pada proses

    menggunakan aplikasi ()KA.

    &ada hasil evaluasi dihasilkan data yang diklasifikasikan secara benar4correct classified instances5 sebanyak !2./?J dan data pemilih diklasifikasikan

    secara tidak benar 4incorrect classified instances5 sebanyak @.+BJ.

    :ambar 3asil )valuasi

    #etelah dilakukan pengolahan data training maka diperoleh akurasi pada model

    tersebut. Akurasi pada model dihitung dengan mengunakan confusion matri.

    0erdasarkan pada hasil yang terdapat dalam Confusion Matri diatas maka pada

    kolom me"akili suatu prediksi, dan baris me"akili kelas yang sebenarnya. 3al

    tersebut dapat dilihat banyaknya prediksi yang benar adalah 4aa, bb, cc, dd5 dan

    banyaknya total prediksi yang tidak benar adalah

    4ab,ac,ad,ba,bc,bd,ca,cb,cd,da,db,dc5.Kemudian akan dilakukan proses perhitungan rata-rata persentasi akurasi

    keberhasilan dan error rate pada Confusion matri dengan cara

    &ersentase Akurasi ;

    &ersentase Akurasi ;

    ; /?? J ; !2, /? J

    7>

    &rediksi benar /?? J$otal 0an akn a &rediksi

    /2 +> ? ? /?? J/2 @ ? ? ++ +> ? ? + ? ? @ /2 ? ?

    210

    403

  • 7/26/2019 Laporan Tugas Besar BDT Algoritma C4.5

    37/39

    )rror rate ;

    )rror rate ;

    ; /?? J ; @, +B J

    Untuk melihat decision treecaranya adalah sebagai berikut

    7@

    &rediksi #alah /?? J

    $otal 0an akn a &rediksi

    /?? J

    ++ + @ @ /2 ? ? ? ? ? ?

    /2 @ ? ? ++ +> ? ? + ? ? @ /2 ? ?

    193

    403

  • 7/26/2019 Laporan Tugas Besar BDT Algoritma C4.5

    38/39

    #ehingga akan tampil decision treesebagai berikut

    #ambar Decision $ree.

    7+

  • 7/26/2019 Laporan Tugas Besar BDT Algoritma C4.5

    39/39

    BAB I

    KESIMPULAN

    Algoritma C.! adalah metode untuk memilih akar percabangan sebuah

    data yang berbentuk tabel. &emilihan cabang ini didasarkan pada nilai gain

    tertinggi dari atribut-atribut yang ada. 0erdasarkan perhitungan sebelumnya,

    kami menemukan bah"a atribut kelas memiliki nilai gain tertinggi, yang diikuti

    dengan urusan dan enis kelamin. Klasifikasi inilah yang akan menadi dasar

    pembuatan pohon keputusan. Maka berdasarkan algoritma C.! dan *+, data

    kelas yang akan menadi prioritas utama percabangan. #ehingga menghasilkan

    tampilan pohon seperti gambar.Decision tree di atas.

    0erdasarkan analisis tersebut kami menyimpulkan hasil perhitungan data

    mahasis"a menggunakan algoritma C.! dengan dua buah cara penyelesaian

    yaitu hitungan manual dan Microsoft ecel bah"a enis agama yang menadi

    mayoritas mahasis"adi lingkungan #$M%K &alangka 'aya adalah %slam. 3al di

    dasarkan pada hasil perhitungan entropy dan gain dari setiap atribut data

    mahasis"a.Kemudian agama Kristen berada diperingkat kedua. Untuk hindu dan

    katolik berada di peringkat ketiga dan empat.