skripsi implementasi data mining untuk diagnosa …
TRANSCRIPT
SKRIPSI
IMPLEMENTASI DATA MINING UNTUK DIAGNOSA PREDIKSI
PENYAKIT TUBERCULOSIS (TBC) MENGGUNAKAN ALGORITMA
NAÏVE BAYES
Diajukan untuk memenuhi salah satu syarat memperoleh gelar
Sarjana Teknik Informatika
Disusun Oleh :
NANDA IRWANSYAH
311410187
SEKOLAH TINGGI TEKNOLOGI
PELITA BANGSA CIKARANG
2018
iv
KATA PENGANTAR
Dengan memanjatkan puji dan syukur kehadirat Allah SWT atas segala
Rahmat, Taufiq, serta Hidayah-Nya sehingga penulis dapat menyelesaikan Skripsi ini
dengan judul “Implementasi Data Mining Untuk Diagnosa Prediksi Penyakit
Tuberculosis (TBC) Menggunakan Algoritma Naïve Bayes”. Yang merupakan syarat
dalam menyelesaikan Program Studi Sl pada Program Studi Teknik Informatika,
Sekolah Tinggi Teknologi Pelita Bangsa.
Selama penulisan skripsi ini penulis mendapat banyak bantuan dan bimbingan dari
berbagai pihak, untuk itu pada kesempatan ini penulis mengucapkan terima kasih yang
sebesar-besarnya. pada :
1. Dr. Ir. Supriyanto, M.P., selaku Ketua Sekolah Tinggi Teknologi Pelita
Bangsa.
2. Aswan Supriyadi Sunge, S.E, M.Kom., selaku Ketua Program Studi Teknik
Informatika Sekolah Tinggi Teknologi Pelita Bangsa.
3. Bapak Makmum Effendi S.Kom.,M.Kom. selaku Dosen Pembimbing I
4. Bapak Rosi’in M.Pd selaku Dosen Pembimbing II.
5. Seluruh Dosen Teknik Informatika.
6. Rekan-rekan mahasiswa STT Pelita Bangsa angkatan 2014.
7. Ayah dan Ibu saya telah banyak memberikan dukungan maupun do'a kepada
saya sehingga semua dapat berjalan dengan lancar.
8. Seluruh keluarga yang ada di bekasi
9. Semua pihak yang telah menbantu penulis dalam menyelesaikan Skripsi.
Penulis sadar bahwa tentunya dalam penulisan skripsi ini masih banyak
terdapat kekurangan untuk itu saran dan kritik dari pembaca yang sifatnya membangun
sangat diharapkan, demi pengembangan kemampuan penulis ke depan.
\
v
ABSTRAK
Data mining sering disebut Knowledge Discovery in Database (KDD). Data mining
biasanya digunakan untuk memperbaiki pengambilan keputusan di masa yang akan
datang berdasarkan informasi yang diperoleh dari masa lalu. Misalnya untuk prediksi,
estimasi, assosiasi, clustering, dan deskripsi. Sekumpulan data yang ada di
laboratorium klinik belum difungsikan secara efektif dan hanya di fungsikan sebagai
arsip untuk riwayat penyakit pasien. Tuberculosis (TBC) adalah penyakit menular paru-
paru yang disebabkan oleh basil Mycobacterium tuberculosis. Penyakit ini ditularkan
dari penderita TBC aktif yang batuk dan mengeluarkan titik-titik kecil air liur dan
terinhalasi oleh orang sehat yang tidak memiliki kekebalan tubuh terhadap penyakit
ini. TBC termasuk dalam 10 besar penyakit yang menyebabkan kematian di dunia
menurut World Health Organization. Pada penelitian ini akan memprediksi penyakit
tuberculosis dengan algoritma klasifikasi data mining Naive Bayes menggunakan
aplikasi Rapidminer. Pengukuran dengan Naives Bayes menghasilkan akurasi 89,74%.
Kata Kunci: Data Mining, Penyakit Tuberculosis, Naive Bayes.
vi
DAFTAR ISI
BAB 1 ....................................................................................................................................... 1
PENDAHULUAN ................................................................................................................... 1
1.1 Latar Belakang .................................................................................................................... 1
1.2 Identifikasi Masalah ............................................................................................................ 4
1.3 Rumusan Masalah ............................................................................................................... 4
1.4 Batasan Masalah ................................................................................................................. 4
1.5 Tujuan dan Manfaat ............................................................................................................ 4
1.5.1 Tujuan .......................................................................................................................... 4
1.5.2 Manfaat ........................................................................................................................ 4
1.6 Metode Pengumpulan Data ................................................................................................. 5
1.7 Sistematika Penulisan ......................................................................................................... 6
BAB II ...................................................................................................................................... 9
LANDASAN TEORI .............................................................................................................. 9
2.1 Pengertian Implementasi ..................................................................................................... 9
2.2 Pengertian Diagnosis .......................................................................................................... 9
2.3 Pengertian Penyakit Tuberculosis ..................................................................................... 10
2.4 Data Mining ...................................................................................................................... 10
2.4.1 Pengertian Data Mining ............................................................................................. 10
2.4.2 Tugas – Tugas Data Mining ....................................................................................... 12
2.5 Arsitektur Sistem Data Mining ......................................................................................... 14
2.6 Penyimpanan Data dalam Data Mining ............................................................................ 16
2.7 Tahap – Tahap Data Mining ............................................................................................. 17
2.8 Teknik – Teknik Data Mining ........................................................................................... 19
2.8.1 Macam – macam Tekhnik Data Mining .................................................................... 19
2.8.2 Teknik Classification menggunakan Naïve Bayes ..................................................... 21
2.9 Implementasi (Penerapan Data Mining) ........................................................................... 23
2.10 Metode Penelitian Data Mining ...................................................................................... 24
2.10.1 Teori Naïve Bayes Classifier ................................................................................... 24
vii
2.10.2 Naïve Bayes Untuk Klasifikasi ................................................................................ 25
2.10.3 Model Klasifikasi ..................................................................................................... 26
2.11 Metode – metode Pilihan dan Klasifikasi ....................................................................... 28
2.12 UML (Unified Modelling Language) ............................................................................. 31
2.13 Penelitian Terdahulu ....................................................................................................... 33
2.14 Spesifikasi Kebutuhan Software dan Hardware .............................................................. 33
BAB III ................................................................................................................................... 36
METODE PENELITIAN ..................................................................................................... 36
3.1 Kerangka Pemikiran .......................................................................................................... 36
3.2 Sekilas Tentang Rumah Sakit Umum Daerah Padangan .................................................. 37
3.2.1 Waktu dan Tempat Penelitian .................................................................................... 38
3.3 Metode Pengumpulan Data ............................................................................................... 38
3.3.1 Hasil Wawancara ................................................................................................ 39
3.4 Desain Penelitian .............................................................................................................. 40
3.5 Analisis metode yang berjalan .................................................................................... 40
3.6 Akuisisi Pengetahuan ........................................................................................................ 41
3.7 Analisa Sistem ............................................................................................................ 42
3.8 Perancangan Sistem .................................................................................................... 43
3.8.1 Metode Algoritma Naïve Bayes .......................................................................... 43
3.8.2 Pengumpulan Data .............................................................................................. 44
3.8.3 Model yang diusulkan ................................................................................................ 45
BAB IV ................................................................................................................................... 48
HASIL DAN PEMBAHASAN ............................................................................................. 48
4.1 Langkah Perhitungan ....................................................................................................... 48
4.2 Seleksi Data ...................................................................................................................... 49
4.3 Metode yang diusulkan .................................................................................................... 52
4.4 Hasil Pengujian Prediksi Diagnosa ................................................................................... 52
4.4.1 Prediksi Menggunakan Perhitungan Manual ............................................................. 52
4.4.2 Prediksi Menggunakan Rapid Miner ........................................................................ 56
4.5 Hasil Klasifikasi Class ...................................................................................................... 58
viii
4.5.1 Simple Distribution Model ......................................................................................... 58
4.5.2 Distribution Table ...................................................................................................... 59
4.6 Hasil Performance Vektor ................................................................................................. 61
4.7 Evaluasi dan Validasi (Evaluation and Validation) ......................................................... 66
BAB V .................................................................................................................................... 68
PENUTUP .............................................................................................................................. 68
a. Kesimpulan ..................................................................................................................... 68
b. Saran ............................................................................................................................... 68
DAFTAR PUSTAKA ............................................................................................................. 69
ix
DAFTAR GAMBAR
Gambar 2.1 Tahapan Proses Data Mining ................................................................................ 9
Gambar 2.2 Diagram Alir Naïve Bayes ................................................................................. 22
Gambar 2.3 Proses Klasifikasi ................................................................................................ 27
Gambar 2.4 Intrface Rapid Miner Pada Data Mining Naïve Bayes ........................................ 35
Gambar 3.1 Kerangka Pemikiran ............................................................................................ 37
Gambar 3.2 Activity Diagram Diagnosa Prediksi Penyakit Tuberculosis .............................. 41
Gambar 3.3 Model Pengujian ................................................................................................. 46
Gambar 4.1 Model Agoritma Naïve Bayes ............................................................................. 47
Gambar 4.2 Metode Untuk Menentukan Performance Algoritma .......................................... 52
Gambar 4.3 Design Rapid Miner Prediksi Data Testing ......................................................... 58
Gambar 4.4 Hasil Prediksi Data Testing Di Rapid Miner ...................................................... 59
Gambar 4.5 Simple Distribution Model .................................................................................. 60
Gambar 4.6 Grafik Ditribusi Label ......................................................................................... 62
Gambar 4.7 Accuracy ............................................................................................................. 63
Gambar 4.8 Precision .............................................................................................................. 64
Gambar 4.9 Recall .................................................................................................................. 65
Gambar 4.10 Kurva ROC ....................................................................................................... 67
Gambar 4.11 Confession Metrix ............................................................................................. 67
x
DAFTAR TABEL
Tabel 3.1 Akuisisi Pengetahuan .............................................................................................. 42
Tabel 3.2 Data Pasien ............................................................................................................. 45
Tabel 3.3 Pembagian Data ...................................................................................................... 46
Tabel 4.1 Seleksi Data ............................................................................................................ 50
Tabel 4.2 Setelah Proses Seleksi Data .................................................................................... 51
Tabel 4.3 Data Training .......................................................................................................... 53
Tabel 4.4 Data Testing ............................................................................................................ 54
Tabel 4.5 Data Distribusi ........................................................................................................ 61
Tabel 4.6 Evaluasi Pengujian .................................................................................................. 68
1
BAB 1
PENDAHULUAN
1.1 Latar Belakang
Rumah Sakit Umum Daerah Padangan merupakan unit pelayanan teknis dinas
kesehatan Kabupaten Bojonegoro yang bertanggung jawab menyelenggarakan
pembangunan kesehatan di wilayah Kecamatan Padangan. Rumah Sakit Umum Daerah
Padangan mempunyai wewenang dan tanggungjawab atas pemeliharaan kesehatan
masyarakat dalam wilayah kerja di seluruh Kecamatan Padangan dan sekitarnya.
Rumah Sakit Umum Daerah Padangan telah menerima dan mengobati beragam
jenis penyakit dari masyarakat di Daerah Bojonegoro khususnya di Kecamatan
Padangan. Penyakit tersebut antara lain adalah typhoid fever, Diabetes Melitus,
Demam berdarah dengue (DBD), Malaria, liver, dan Tuberculosis (TBC). Dalam
beberapa penyakit diatas, penyakit Tuberculosis (TBC) adalah yang paling melakukan
peningkatan dari tahun ke tahun yaitu sebesar 30%. Hal ini sangat mengejutkan karena
begitu membahayakannya penyakit ini.
Tuberculosis (TBC) adalah penyakit menular paru-paru yang disebabkan oleh
basil Mycobacterium tuberculosis. Penyakit ini ditularkan dari penderita TBC aktif
yang batuk dan mengeluarkan titik-titik kecil air liur dan terinhalasi oleh orang sehat
yang tidak memiliki kekebalan tubuh terhadap penyakit ini. TBC termasuk dalam 10
besar penyakit yang menyebabkan kematian di dunia. Data WHO menunjukkan bahwa
2
pada tahun 2015, Indonesia termasuk dalam 6 besar negara dengan kasus baru TB
terbanyak.
Teknologi informasi di bidang kesehatan atau kedokteran komputer juga telah
memperlihatkan peran yang sangat signifikan untuk menolong jiwa manusia dan riset
di bidang kedokteran. Komputer digunakan untuk mendiagnosis penyakit, menemukan
obat yang tepat serta menganalisis organ tubuh manusia bagian dalam yang sulit untuk
dilihat. Saat ini telah ada temuan baru yaitu komputer DNA yang mampu mendiagnosis
penyakit sekaligus memberi obat.
Oleh Karena itu kemajuan teknologi mendorong setiap instansi – instansi dalam
dunia kesehatan yaitu Rumah Sakit untuk meningkatkan mutu pelayanan terhadap
pasien melalui cara melibatkan kemajuan teknologi dalam dunia kesehatan. Dimana
nantinya pihak Rumah Sakit Umum Daerah Padangan mampu mendiagnosa penyakit
menggunakan teknologi.
Rumah Sakit Umum Daerah Padangan mengidentifikasi penyakit Tuberculosis
secara manual terhadap pasien dengan keluhan awal yaitu antara lain batuk
berkepanjangan, batuk disertai bercak darah, penurunan berat badan drastis,
berkeringat pada malam hari, infeksi tidak kunjung sembuh, tidak nafsu makan, nyeri
dada, sesak nafas dan fisik lemah. Tahap diagnosa awal untuk mengetahui positif atau
negatif nya penyakit tuberculosis memerlukan waktu yang tidak singkat. Perlu
setidaknya beberapa minggu hanya untuk mengetahui diagnosa awal penyakit
tuberculosis. Setelah mengikuti kemajuan teknologi, diharapkan Rumah Sakit Umum
Daerah Padangan menggunakan data mining untuk mendiagnosa penyakit tuberculosis
3
sehingga tidak memerlukan waktu beberapa hari untuk mengetahui pasien tersebut
positif penyakit tuberculosis atau negatif.
Data mining juga sering disebut sebagai kegiatan mengeksplorasi dan
menganalisis data dalam jumlah yang besar untuk menemukan pattern dan rule yang
berarti (Berry, 2004). Data mining digunakan untuk mencari informasi bisnis berharga
dari basis data yang sangat besar, yang dipakai untuk memprediksi tren dan sifat – sifat
bisnis serta menemukan pola - pola yang tidak diketahui sebelumnya.
Dengan adanya masalah tersebut serta ada solusi untuk mengatasi dan penerapan
metode penelitian menggunakan data mining terhadap pasien untuk mendiagnosa
penyakit tersebut maka penulis akan mengusulkan judul skripsi “Implementasi Data
Mining Untuk Diagnosa Prediksi Penyakit Tuberculosis (TBC) Menggunakan
Algoritma Naïve Bayes”.
1.2 Identifikasi Masalah
Adapun identifikasi masalah dari latar belakang diatas adalah karena sering
terjadi di masyarakat sulitnya dalam melakukan diagnosa awal dari penyakit
tuberculosis (TBC). Dikarenakan penyakit Tuberculosis (TBC) mempunyai gejala –
gejala yang berjumlah cukup banyak dan terdapat kesamaan gejala yang dimiliki
penyakit lain serta memerlukan waktu yang lama untuk mendiagnosa awal penyakit
tersebut.
4
1.3 Rumusan Masalah
Dari identifikasi masalah yang terjadi, maka perumusan masalah yang akan
dibahas dalam penulisan ini adalah bagaimana melakukan prediksi data mining untuk
jenis data penyakit tuberculosis di Rumah Sakit Umum Daerah Padangan sehingga
pasien dapat melihat hasil diagnosa awal dari gejala dengan cepat dan cukup akurat ?
1.4 Batasan Masalah
Penulis membatasi masalah dalam penelitian ini, agar dalam pembahasan
dilaporan penelitian dapat terarah dan mencapai tujuan. Batasan masalah membahas
pendataan dalam kurun waktu 3 tahun ke belakang mengenai gejala – gejala yang di
derita oleh pasien penyakit Tuberculosis (TBC) menggunakan data mining dengan
metode naïve bayes classifier.
1.5 Tujuan dan Manfaat
1.5.1 Tujuan
Berdasarkan latar belakang dan rumusan masalah yang telah diuraikan diatas
maka tujuan dari penelitian ini adalah tentang penerapan data mining menggunakan
metode naïve bayes untuk memprediksi penyakit Tuberculosis (TBC).
1.5.2 Manfaat
Adapun manfaat dari penulisan tugas akhir ini dibagi menjadi beberapa bagian
yaitu :
5
a. Bagi Penulis
Manfaat bagi penulis yaitu dapat mengimplementasikan ilmu pengetahuan yang telah
didapatkan penulis selama masa perkuliahan dan dapat memahami penerapan data
mining serta metode naïve bayes.
b. Bagi Institusi
Manfaat bagi institusi yaitu dengan adanya penerapan data mining ini dapat membantu
dpkter dalam mendiagnosa penyakit Tuberculosis (TBC) tersebut.
c. Bagi Instansi
Manfaat bagi instansi yaitu diharapkan dapat menjadi tambahan bagi peneliti
selanjutnya untuk meneliti variable yang lain yang berkaitan dengan diagnosa penyakit
Tuberculosis (TBC) menggunakan data mining dengan metode naïve bayes classifier.
1.6 Metode Pengumpulan Data
Pada tahap ini penulis juga melakukan pengumpulan data yang dilakukan melalui :
1. Studi Lapangan (Field Research)
Penelitian lapangan adalah salah satu cara untuk mendapatkan data, yang dilakukan
dengan cara melakukan penelitian langsung ke lokasi studi. Adapun Teknik
pengumpulan data yang dilakukan adalah :
6
a. Metode Observasi (Pengamatan)
Merupakan salah satu metode pengumpulan data yang cukup efektif untuk
mempelajari suatu sistem. Penulis melakukan pengamatan langsung pada Dokter
agar data yang di dapatkan lebih akurat.
b. Metode Wawancara (Interview)
Merupakan metode yang Teknik pengumpulan data dengan cara tanya jawab
secara langsung dengan narasumber yang terkait.
2. Studi Pustaka (Library Research)
Metode ini memperoleh data – data yang berhubungan dengan penulisan skripsi
dari berbagai sumber bacaan seperti buku, jurnal, majalah dan lain sebagainya
sebagai acuan.
3. Internet (Browsing)
Melakukan pengumpulan jurnal yang bersumber dari internet.
1.7 Sistematika Penulisan
Untuk dapat mengetahui secara ringkas permasalahan dalam penulisan laporan
ini maka digunakan sistematika penulisan yang bertujuan untuk mempermudah
pembaca dalam menelusuri dan memahami isi laporan. Sistematika penulisan dalam
penyusunan laporan dengan judul skripsi “Implementasi Data Mining Untuk
Diagnosa Prediksi Penyakit Tuberculosis (TBC) Menggunakan Algoritma Naïve
Bayes Classifier” sebagai berikut :
7
BAB I PENDAHULUAN
Pada bab ini berisi tentang beberapa hal umum tentang maksud dan tujuan
penulisan serta pelaksanaan penelitian pada Rumah Sakit Umum Daerah Padangan
sebagai acuan yang terdiri dari latar belakang, identifikasi masalah, rumusan masalah,
batasan masalah, tujuan dan manfaat, metode pengumpulan data serta sistematika
penulisan dalam penyusunan skripsi ini.
BAB II LANDASAN TEORI
Pada bab ini menjelaskan konsep tentang Data Mining dan Metode Naïve Bayes
untuk pemecahan masalah mengenai identifikasi gejala penyakit Tuberculosis (TBC)
pada pasien Rumah Sakit Umum Daerah Padangan, Metode – Metode Pilihan dan
Klasifikasi, definisi Unified Modelling Language (UML) serta jenis – jenis diagram
UML.
BAB III METODE PENELITIAN
Pada bab ini merupakan penjabaran lebih rinci tentang metode penelitian yang
digunakan dalam pencarian data yang dilakukan pada penelitian. secara garis besar
telah disinggung dalam bab pendahuluan. Batasan istilah yang ada pada judul dan
variable yang dilibatkan dalam pencarian data juga dijelaskan dalam bab ini. Semua
prosedur, proses dan hasil penelitian sejak persiapan hingga penelitiaan berakhir akan
dibahas di bab ini.
8
BAB IV HASIL DAN PEMBAHASAN
Pada bab ini membahas diagnosa prediksi penyakit Tuberculosis (TBC)
menggunakan data mining dengan metode naïve bayes terhadap hasil penelitian yang
telah dibahas di bab sebelumnya. Dan yang akan menghasilkan prediksi data mining
untuk jenis data penyakit Tuberculosis (TBC), tolak ukurnya dapat dikembalikan pada
persiapan, asumsi, hipotesis, metode penelitian, tolak ukur penafsiran data dan
komponen – komponen yang lain.
BAB V PENUTUP
Pada bab ini berisi tentang kesimpulan dari penelitian dan hasil akhir dari
pemecahan masalah setelah diteliti serta saran yang dianggap penting atau dijalankan
pada masa yang akan datang untuk kesempurnaan hasil penelitian atau pemecahan
masalah dimana penulisan laporan skripsi ini dilakukan.
9
BAB II
LANDASAN TEORI
2.1 Pengertian Implementasi
Pandangan Implementasi menurut Solichin Abdul Wahab adalah tindakan-
tindakan yang dilakukan baik oleh individu-individu, pejabat-pejabat, atau kelompok
– kelompok pemerintah atau swasta yang diarahkan pada tercapainya tujuan – tujuan
yang telah digariskan dalam keputusan kebijakan (Solichin Abdul Wahab, 1997)
Nurdin Usman berpendapat bahwa implementasi bermuara pada aktivitas, aksi,
tindakan, atau adanya mekanisme suatu sistem. Implementasi bukan sekedar aktivitas,
tetapi suatu kegiatan yang terencana dan untuk mencapai tujuan kegiatan (Nurdin
Usman, 2002 )
2.2 Pengertian Diagnosis
Diagnosa adalah identifikasi sifat – sifat penyakit atau kondisi atau membedakan
satu penyakit atau kondisi dari yang lainnya. Penilaian dapat dilakukan melalui
pemeriksaan fisik, tes laboratorium atau sejenisnya. Dan dapat dibantu oleh program
komputer yang dirancang untuk memperbaiki proses pengambil keputusan (Carpenito,
2008).
10
2.3 Pengertian Penyakit Tuberculosis
Penyakit Tuberculosis adalah penyakit infeksius yang menyerang perenkim
paru. Agen infeksiusnya adalah Mycobacterium tuberculosis yang merupakan batang
aerobik yang tahan asam, tumbuhnya lambat dan agak sensitif dengan panas dan sinar
ultraviolet. Penyakit tuberkulosis bisa ditularkan ke bagian tubuh lainnya seperti
meninges, tulang, ginjal, dan nodus limfe. (Brunner & Suddarth, 2001).
Tuberculosis (TBC) adalah suatu penyakit menular langsung yang disebabkan
oleh kuman TB yaitu Mycobacterium tuberculosis. Mayoritas kuman TB akan
menyerang paru, akan tetapi kuman TB bisa juga menyerang organ tubuh yang lainnya.
(Departemen kesehatan, 2007)
Tuberculosis merupakan jenis penyakit infeksius yang menyerang paru-paru,
ditandai dengan pembentukan granuloma dan timbulnya nekrosis jaringan. Penyakit
tuberkulosis ini bersifat menahun dan bisa menular dari si penderita ke orang lainnya.
(Santa dkk,2009)
2.4 Data Mining
2.4.1 Pengertian Data Mining
Data Mining merupakan istilah yang sering dikatakan sebagai suatu cara untuk
menguraikan serta mencari penemuan berupa pengetahuan di dalam suatu database.
Data mining adalah proses pemilihan atau “menambang” pengetahuan dari sekumpulan
data dalam jumlah yang banyak (Han, Jiawei 2006)
11
Data Mining adalah langkah analisis terhadap proses penemuan pengetahuan di
dalam basisdata atau knowledge discovery in database atau biasa disingkat menjadi
KDD (fayyed et al, 1996)
Data mining digunakan untuk mencari informasi bisnis yang berharga dari basis
data yang sangat besar, yang dipakai untuk memprediksi trend dan sifat – sifat bisnis
serta menemukan pola – pola yang tidak diketahui sebelumnya.
Data mining adalah serangkaian proses untuk menggali nilai tambah dari suatu
kumpulan data berupa pengetahuan yang selama ini tidak diketahui secara manual.
Data mining adalah analisis otomatis dari data yang berjumlah besar atau kompleks
dengan tujuan untuk menemukan pola atau kecenderungan yang penting yang biasanya
tidak disadari keberadaannya.
Data mining didefinisikan sebagai proses menemukan pola – pola dalam data.
Proses ini otomatis atau seringnya semi otomatis. Pola yang ditemukan harus penuh
arti dan pola tersebut memberikan keuntungan, biasanya keuntungan secara ekonomi.
Data yang dibutuhkan dalam jumlah besar.
Data mining adalah proses pengumpulan informasi penting dari sejumlah data
besar yang tersimpan di dalam basis data, gudang data, atau tempat penyimpanan
lainnya. Data mining merupakan proses yang tidak dapat dipisahkan dengan
Knowledge Discovery in Database (KDD), Karena penambangan data adalah salah satu
dari tahap dalam proses KDD. (Han & Kamber, 2006)
12
2.4.2 Tugas – Tugas Data Mining
Menurut Larose (2005) tugas – tugas dalam data mining secara umum dibagi
ke dalam beberapa kategori yaitu :
a. Prediktif
Tujuan dari tugas prediktif adalah untuk memprediksi nilai dari atribut tertentu
berdasarkan pada nilai dari atribut – atribut lain. Atribut yang diprediksi umumnya
dikenal sebagai target atau variabel tak bebas, sedangkan atribut – atribut yang
digunakan untuk membuat prediksi dikenal sebagai explanatory atau variabel bebas.
b. Deskriptif
Tujuan dari tugas deskriptif adalah untuk menurunkan pola - pola (korelasi,
trend, cluster, trayektori dan anomali) yang meringkas hubungan yang pokok dalam
data. Tugas data mining deskriptif sering merupakan penyelidikan dan seringkali
memerlukan Teknik post processing untuk validasi dan penjelasan hasil.
Berikut adalah tugas – tugas dalam data mining (Larose, 2006) :
a. Analisis Asosiasi (Korelasi dan Kausalitas)
Analisis Asosiasi adalah pencarian aturan – aturan asosiasi yang menunjukkan
kondisi – kondisi nilai atribut yang sering terjadi bersama – sama dalam
sekumpulan data. Analisis asosiasi sering digunakan untuk menganalisa market
basket dan data transaksi.
13
b. Klasifikasi dan Prediksi
Klasifikasi adalah proses menemukan model (fungsi) yang menjelaskan dan
membedakan kelas – kelas atau konsep, dengan tujuan agar model yang diperoleh
dapat digunakan untuk memprediksi kelas atau objek yang memiliki label kelas
tidak diketahui. Model yang diturunkan didasarkan pada analisis dari training data
(yaitu objek data yang memiliki label kelas yang diketahui). Model yang
diturunkan dapat direpresentasikan dalam berbagai bentuk seperti aturan IF –
THEN klasifikasi, pohon keputusan, formula matematika atau jaringan syaraf
tiruan. Dalam banyak kasus, pengguna ingin memprediksi nilai – nilai data yang
tidak tersedia atau hilang (bukan label dari kelas). Dalam kasus ini biasanya nilai
data yang akan diprediksi merupakan data numeric. Kasus ini seringkali dirujuk
sebagai prediksi.
c. Analisis Cluster
Tidak seperti klasifikasi dan prediksi, yang menganalisis objek data yang diberi
label kelas, clustering menganalisis objek data dimana label kelas tidak diketahui.
Clustering dapat digunakan untuk menentukan label kelas tidak diketahui dengan
cara mengkelompokkan data untuk membentuk kelas baru. Sebagai contoh
Clutering rumah untuk menemukan pola distribusinya. Prinsip dalam clustering
adalah memaksimumkan kemiripan intra – class dan meminimumkan kemiripan
interclass.
14
d. Analisis Outlier
Outlier merupakan objek data yang tidak mengikuti perilaku umum dari
data. Outlier dapat dianggap sebagai noise atau pengecualian. Analisis data
outlier dinamakan outlier mining. Teknik ini berguna dalam fraud detection
dan rare event analysis.
e. Analisis Trend dan Evolusi
Analisis evolusi data menjelaskan dan memodelkan trend dari objek
yang memiliki perilaku yang berubah setiap waktu. Teknik ini dapat meliputi
karakterisasi, deskriminasi, asosiasi, klasifikassi atau clustering dari data yang
berkaitan dengan waktu.
2.5 Arsitektur Sistem Data Mining
Data mining merupakan proses pencarian pengetahuan yang menarik dari data
berukuran besar yang disimpan dalam basis data, data warehouse atau tempat
penyimpanan informasi lainnya. Dengan demikian menurut Connoly. T & Begg.
C arsitektur sistem data mining memiliki komponen – komponen utama yaitu :
- Basis data, data warehouse atau tempat penyimpanan informasi lainnya.
- Basis data dan data warehouse server. Komponen ini bertanggung jawab dalam
pengambilan relevan data, berdasarkan permintaan pengguna.
- Basis pengetahuan. Komponen ini merupakan domain knowledge yang
digunakan untuk memandu pencarian atau mengevaluasi pola – pola yang
dihasilkan. Pengetahuan tersebut meliputi hirarki konsep yang digunakan
15
untuk mengorganisasikan atribut atau nilai atribut ke dalam level abstraksi
yang berbeda. Pengetahuan tersebut juga dapat berupa kepercayaan pengguna
(user belief) yang dapat digunakan untuk menentukan kemenarikan pola yang
diperoleh.
- Data Mining Engine. Bagian ini merupakan komponen penting dalam
arsitektur sistem data mining. Komponen ini terdiri modul – modul fungsional
data mining seperti karakterisasi, asosiasi, klasifikasi dan analisis cluster.
- Modul Evaluasi Pola. Komponen ini menggunakan ukuran – ukuran
kemenarikan dan berinteraksi dengan modul data mining dalam pencarian pola
– pola menarik. Modul evaluasi pola dapat menggunakan threshold
kemenaikan untuk memfilter pola – pola yang diperoleh.
- Antarmuka Pengguna Grafis. Modul ini berkomunikasi dengan pengguna dan
sistem data mining. Melalui modul ini, pengguna berinteraksi dengan sistem
menentukan query atau task data mining. Antarmuka juga menyediakan
informasi untuk memfokuskan pencarian dan melakukan eksplorasi data
mining berdasarkan hasil data mining. Komponen ini juga memungkinkan
pengguna untuk mencari (browser) basis data dan skema data warehouse atau
struktur data, evaluasi pola yang diperoleh dan visualisasi pola dalam berbagai
bentuk.
16
2.6 Penyimpanan Data dalam Data Mining
Data mining dapat diaplikasikan pada berbagai jenis penyimpanan data seperti
basis data relational, data warehouse, transactional database, object – oriented and
object – relational databases, spatial databases, time – series data and temporal data,
text databases and multimedia databases, heterogeneous and legacy databases dan
WWW.
a. Basis Data Relasional
Merupakan kolekssi dari table. Setiap table berisi atribut (field) dan biasanya
menyimpan sejumlah besar tuple (record). Setiap tuple dalam table relasional
merepresentasikan sebuah objek yang diidentifikasikan oleh kunci unik dan
dideskripsikan oleh sekumpulan nilai atribut. Data relasional dapat diakses oleh
query basis data yang ditulis dalam bahasa query relasional seperti SQL atau dengan
bantuan antarmuka pengguna grafis.
b. Data Warehouse
Merupakan tempat penyimpanan informasi yang dikumpulkan dari berbagai
sumber, disimpan dalam skema yang dipersatukan (unified schema) dan biasanya
bertempat pada tempat penyimpanan tunggal. Data warehouse dikonstruksi melalui
sebuah proses data cleaning, data transformation, data integration, data loading
dan periodic data refreshing. Selain data warehouse, terdapat istilah penyimpanan
data yang lain yaitu datamart. Sebuah data warehouse mengumpulkan informasi
mengenai subjek – subjek yang menjangkau seluruh organisasi, dengan demikian
cakupannya enterprise-wide. Sedangkan datamart merupakan sub bagian dari data
17
warehouse. Fokus datamart adalah pada subjek yang dipilih dan dengan demikian
cakupannya adalah department-wide.
c. Basis Data Transaksional
Secara umum, basis data transaksional terdiri dari sebuah file dimana setiap
record merepresentasikan transaksi.
2.7 Tahap – Tahap Data Mining
Istilah data mining dan knowledge discovery in databases (KDD) sering kali
digunakan secara bergantian untuk menjelaskan proses penggalian informasi
tersembunyi dalam suatu basis data yang besar. Sebenarnya kedua istilah tersebut
memiliki konsep yang berbeda, tetapi berkaitan satu sama lain. Dan salah satu tahapan
dalam keseluruhan proses KDD adalah data mining. Menurut Fayyad proses KDD
secara garis besar dapat dijelaskan sebagai berikut :
1. Data Selection
Pemilihan (seleksi) dari data sekumpulan data operasional perlu dilakukan
sebelum tahap penggalian informasi dalam KDD dimulai. Data hasil seleksi yang akan
digunakan untuk proses data mining, disimpan suatu berkas, terpisah dari basis data
operasional.
2. Pre – Processing (Cleaning)
Sebelum proses data mining dapat dilaksanakan, perlu dilakukan proses cleaning
pada data yang menjadi focus KDD. Proses cleaning mencakup antara lain membuang
duplikasi data, memeriksa data yang inkonsisten, memperbaiki kesalahan pada data,
18
seperti kesalahan cetak (tipografi). Juga dilakukan proses enrichment, yaitu proses
“memperkaya” data yang sudah ada dengan data atau informasi yang relevan dan
diperlukan untuk KDD, seperti data atau informasi eksternal.
3. Transformation
Coding adalah proses transformasi pada data yang telah dipilih, sehingga data
tersebut sesuai untuk proses data mining. Proses coding dalam KDD merupakan proses
kreatif dan sangat tergantung pada jenis atau pola informasi yang akan dicari dalam
basis data.
4. Data Mining
Adalah proses mencari pola atau informasi menarik dalam data terpilih dengan
menggunakan teknik atau metode tertentu. Teknik, metode atau algoritma dalam data
mining sangat bervariasi pemilihan metode atau algoritma yang tepat sangat
bergantung pada tujuan dan proses KDD secara keseluruhan.
5. Interpretation (Evaluation)
Pola informasi yang dihasilkan dari proses data mining perlu ditampilkan dalam
bentuk yang mudah dimengerti oleh pihak yang berkepentingan. Tahap ini merupakan
bagian dari proses KDD yang disebut interpretation. Tahap ini mencakup pemeriksaan
apakah pola atau informasi yang ditemukan bertentangan dengan fakta atau hipotesis
yang ada sebelumnya.
Gambar tahapan pada data mining
19
Gambar 2.1 Tahapan Proses Data Mining
2.8 Teknik – Teknik Data Mining
2.8.1 Macam – macam Tekhnik Data Mining
Dengan definisi data mining yang luas, ada banyak jenis teknik analisa yang
dapat digolongkan dalam data mining. Karena keterbatasan tempat, disini penulis akan
memberikan sedikit gambaran tentang tiga teknik data mining yang paling banyak
digunakan menurut Larose Daniel T (2005) :
20
a. Association Rule Mining
Association rules (aturan asosiasi) atau affinity analysis (analisis afinitas)
berkenaan dengan studi tentang “apa bersama apa”. Karena awalnya berasal dari
studi tentang database transaksi pelanggan untuk menentukan kebiasaan suatu
produk dibeli bersama produk apa, maka aturan asosiasi juga sering dinamakan
market basket analysis. Analisis asosiasi dikenal juga sebagai salah satu metode data
mining yang menjadi dasar dari berbagai metode data mining lainnya.
b. Classification
Dalam klasifikasi, terdapat target variable kategori. Sebagai contoh
penggolongan pendapatan dapat dipisahkan dalam tiga kategori yaitu pendapatan
tinggi, pendapatan sedang dan pendapatan rendah.
c. Clustering
Termasuk metode yang sudah cukup dikenal dan banyak dipakai dalam data
mining. Sampai sekarang para ilmuwan dalam bidang data mining masih melakukan
berbagai usaha untuk melakukan perbaikan model clustering karena metode yang
dikembangankan sekarang masih bersifat heuristic. Tujuan utama dari metode
clustering adalah pengelompokkan sejumlah data / objek ke dalam cluster (group)
sehingga dalam setiap cluster akan berisi data yang semirip mungkin. Dalam metode
ini tidak diketahui sebelumnya berapa jumlah cluster dan bagaimana
pengelompokannya.
21
Berikut ini adalah 9 algoritma penggalian data yang paling sering digunakan
berdasarkan konferensi ICDM ’06 :
1. C4.5
2. K-Means
3. SVM
4. Apriori
5. EM
6. PageRank
7. AdaBoost
8. kNN
9. Naïve Bayes
2.8.2 Teknik Classification menggunakan Naïve Bayes
Naïve Bayes merupakan sebuah metoda klasifikasi menggunakan metode
probabilitas dan statistic yang dikemukakan oleh ilmuwan Inggris Thomas Bayes.
Naïve Bayes memprediksi peluang di masa depan berdasarkan pengalaman di masa
sebelumnya sehingga dikenal sebagai Teorema Bayes.
22
Gambar 2.2 Diagram Alir Naïve Bayes
(Jurnal PPTIK Vol.2, No.8, Agustus 2018)
23
2.9 Implementasi (Penerapan Data Mining)
Beberapa contoh bidang penerapan data mining :
1. Analisa pasar dan manajemen
Solusi yang dapat diselesaikan dengan data mining, diantaranya : menembak target
pasar, melihat pola beli pemakai dari waktu ke waktu, cross-market analysis, profil
customer, identifikasi kebutuhan customer, menilai loyalitas customer, informasi
summary.
2. Analisa perusahaan dan manajemen resiko
Solusi yang dapat diselesaikan dengan data mining, diantaranya : perencanaan dan
evaluasi aset, perencanaan sumber daya (resource planning), persaingan
(competition).
3. Telekomunikasi
Menerapkan data mining untuk melihat dari jutaan transaksi yang masuk dan
transaksi mana sajakah yang harus ditangani secara manual.
4. Keuangan
Menggunakan data mining untuk menambang berbagai subyek seperti property,
rekening bank dan transaksi keuangan lainnya untuk mendeteksi transaksi –
transaksi keuangan yang mencurigakan seperti money laundry.
5. Asuransi
Menggunakan data mining untuk mengidentifikasi layanan kesehatan yang
sebenarnya tidak perlu tetapi tetap dilakukan oleh peserta asuransi.
24
6. Olahraga
Menggunakan data mining untuk menganalisis statistic permainan NBA dalam
rangka mecapai keunggulan bersaing.
2.10 Metode Penelitian Data Mining
2.10.1 Teori Naïve Bayes Classifier
Naïve Bayes merupakan sebuah pengklasifikasian probalistik sederhana yang
menghitung sekumpulan probabilitas dengan menjumlahkan frekuensi dan kombinasi
nilai dari dataset yang diberikan. Algoritma menggunakan Teorema Bayes dan
mengasumsikan semua atribut independen atau tidak saling ketergantungan yang
diberikan oleh nilai pada variable kelas. Naïve Bayes juga didefinisikan sebagai
pengklasifikasian dengan metode probabilitas dan statistik yang dikemukakan oleh
ilmuan inggris Thomas Bayes yaitu memprediksi peluang di masa depan berdasarkan
pengalaman di masa sebelumnya (Saleh, 2015).
Naïve Bayes didasarkan pada asumsi penyederhanaan bahwa nilai atribut secara
kondisional saling bebas jika diberikan nilai output. Dengan kata lain diberikan nilai
output, probabilitas mengamati secara bersama adalah produk dari probabilitas
individu. Keuntungan penggunaan Naïve Bayes adalah bahwa metode ini hanya
membutuhkan jumlah data pelatihan (Training Data) yang kecil untuk menentukan
estimasi parameter yang diperlukan dalam proses pengklasifikasian. Naïve Bayes
25
sering bekerja jauh lebih baik dalam kebanyakan situasi dunia nyata yang kompleks
daripada yang diharapkan (Saleh, 2015).
Persamaan dari Teorema Bayes dapat dilihat dibawah ini :
𝑃 (𝐻 | 𝑋) =P(X|H). P(H)
P(H)
Dimana :
X : Data dengan class yang belum diketahui
H : Hipotesis data menggunakan suatu class spesifik
P(H|X) : Probabilitas hipotesis H berdasarkan kondisi X (parteriori probabilitas)
P(H) : Probabilitas hipotesis H (prior probabilitas)
P(X|H) : Probabilitas X berdasarkan kondisi pada hipotesis H
P(X) : Probabilitas H
2.10.2 Naïve Bayes Untuk Klasifikasi
Kaitan antara naïve bayes dengan klasifikasi, korelasi hipotesis dan bukti
klasifikasi adalah bahwa hipotesis dalam teorema bayes merupakan label kelas yang
menjadi target pemetaan dalam klasifikasi, sedangkan bukti merupakan fitur – fitur
yang menjadikan masukkan dalam model klasifikasi. Jika X adalah vector masukkan
yang berisi fitur dan Y adalah label kelas, naïve bayes dituliskan dengan P(X|Y). Notasi
tersebut berarti probabilitas label kelas Y didapatkan setelah fitur – fitur X diamati.
Notasi ini disebut juga probabilitas akhir (posterior probability) untuk Y, sedangkan
P(Y) disebut probabilitas awal (prior probability) Y.
26
Konsep Klasifikasi merupakan suatu pekerjaan menilai objek data untuk
memasukkannya ke dalam kelas tertentu dari sejumlah kelas yang tersedia. Dalam
klasifikasi ada dua pekerjaan utama yang dilakukan, yaitu :
1. Pembangunan model seperti prototype untuk disimpan sebagai memori.
2. Penggunaan model tersebut untuk melakukan pengenalan / klasifikasi / prediksi
pada suatu objek data lain agar diketahui di kelas mana objek data tersebut dalam
model yang mudah disimpan.
Contohnya adalah bagaimana melakukan diagnosis penyakit kulit kanker melanoma
(Amaliyah, 2011) yaitu dengan melakukan pembangunan model berdasarkan data latih
yang ada, kemudian menggunakan model tersebut untuk mengidentifikasi penyakit
pasien baru sehingga diketahui apakah pasien tersebut menderita kanker atau tidak.
2.10.3 Model Klasifikasi
Model dalam klasifikasi mempunyai arti yang sama dengan kotak hitam, dimana
ada suatu model yang menerima masukan, kemudian mampu melakukan pemikiran
terhadap masukan tersebut dan memberikan jawaban sebagai keluaran dari hasil
pemikirannya. Kerangka kerja (framework) klasifikasi ditunjukkan pada gambar 2.1,
pada gambar tersebut disediakan sejumlah data latih (x,y) untuk digunakan sebagai
data pembangunan model. Model tersebut kemudian dipakai untuk memprediksi kelas
dari data uji (x,y) sehingga diketahui kelas y yang sesungguhnya. Menurut Amaliyah
(2011) berikut adalah contoh proses klasifikasi data latih
27
Gambar 2.3 Proses Klasifikasi (Amaliyah, 2011)
Model yang sudah dibangun pada saat pelatihan kemudian dapat digunakan untuk
memprediksi label kelas baru yang belum diketahui. Dalam pembangunan model
selama proses pelatihan tersebut diperlukan suatu algoritma untuk membangunnya,
yang disebut algoritma pelatihan (learning algorithm). Ada banyak algoritma pelatihan
yang sudah dikembangkan oleh para peneliti seperti K-Nearest Neighbor, Artificial
Neural Network, Support Vector Machine dsb. Setiap algoritma mempunyai kelebihan
dan kekurangan, tetapi semua algoritma berprinsip sama yaitu melakukan suatu
pelatihan sehingga di akhir pelatihan model dapat memetakan (memprediksi) setiap
vektor masukan ke label kelas keluaran dengan benar.
28
Contoh studi kasus hasil pengujian akurasi :
Hasil dari pengujian akurasi dengan sampel 40 data uji mendapat 35 hasil yang akurat
dan 5 hasil tidak akurat. Untuk mencari nilai persentase akurasi sistem diperoleh dari
menghitung jumlah data yang akurat dibagi jumlah seluruh data uji, setelah mendapat
hasil pembagian kemudian dikali 100. Nilai akurasi dihitung dengan menggunakan
persamaan 2 (Gardenia dkk, 2015) dan memperoleh hasil seperti berikut :
𝑎𝑘𝑢𝑟𝑎𝑠𝑖 =𝑗𝑢𝑚𝑙𝑎ℎ 𝑑𝑎𝑡𝑎 𝑦𝑎𝑛𝑔 𝑎𝑘𝑢𝑟𝑎𝑡
𝑗𝑢𝑚𝑙𝑎ℎ 𝑑𝑎𝑡𝑎 𝑥 100
=35
40 𝑥 100 = 87,5%
Dari hasil perhitungan akurasi di dapatkan persentase sebesar 87,5%. Terdapat 5
kesalahan hasil diagnosis sistem, kesalahan terjadi disebabkan karena gejala dimiliki
oleh dua penyakit sedangkan sistem hanya dapat menghasilkan satu output penyakit.
Dapat dikatakan semakin banyak gejala spesifik yang digunakan maka akurasi semakin
tinggi, semakin banyak gejala umum yang digunakan maka akurasi semakin rendah.
2.11 Metode – metode Pilihan dan Klasifikasi
Berikut merupakan beberapa metode yang digunakan pada klasifikasi secara
umum, diantaranya adalah :
1. Klasifikasi berdasarkan pohon keputusan (Decission Tree)
Pohon keputusan atau decission tree merupakan proses pelatihan data set yang
memiliki atribut dengan dasaran nominal, yaitu bersifat kategoris dan setiap nilai
29
tidak bisa dijumlahkan atau dikurangkan. Pada umumnya, ciri khusus berikut cocok
untuk diterapkan pada decission tree :
a. Data / example dinyatakan dengan pasangan atribut dan nilainya
b. Label / output data biasanya bernilai diskrit
c. Data mempunyai missing value
2. Klasifikasi Bayesian
Klasifikasi Bayesian merupakan klasifikasi berdasarkan statistic classifier. Ini
dapat mengklasifikasikan sebuah kelas dengan probabilitas dari setiap klasifikasi
Bayesian didasarkan pada Bayes Theorem. Beberapa penelitian yang
membandingkan algoritma klasifikasi telah menemukan sebuah klasifikasi
Bayesian sederhana yang dikenal dengan nama Naïve Bayes Classifier. Algoritma
ini telah dibandingkan dengan decission tree dan selektif Neoral Network secara
performansi. Klasifikasi Bayesian juga memiliki tingkat akurasi yang tinggi dan
cepat jika diterapkan pada database yang besar. Naïve Bayes Classifier mengenali
setiap atribut pada data set sebagai atribut yang independen, sehingga disebut
algoritma yang naïve.
3. Klasifikasi berdasarkan Propagasi Balik (Back Propagation)
Propagasi Balik atau Back Propagation merupakan sebuah algoritma pembelajaran
dari Neural Network. Secara umum, neural network merupakan satu set input /
output yang terhubung pada setiap koneksi memiliki weight. Input / Output yang
terhubung tersebut mengadopsi system syaraf manusia, yang pemrosesan utamanya
adalah di otak. Bagian terkecil dari otak manusia adalah sel syaraf yang disebut
30
Unit Dasar pemroses informasi atau neuron. Ada sekitar 10 miliar neuron dalam
otak manusia dan sekitar 60 triliun koneksi dengan menggunakan neuron tersebut
secara simultan, otak manusia dapat memproses informasi secara parallel dan
cepat, bahkan lebih cepat dari komputer tercepat saat ini. Dengan analogi system
kinerja otak tersebut, neural network terdiri dari unit proses yang disebut neuron
yang berisi penambah dan fungsi aktivasi, sejumlah bobot, sejumlah vector
masukan. Fungsi aktivasi berguna untuk mengatur keluaran yang diberikan oleh
neuron. Propagasi Balik mempelajari data dengan memprediksi setiap jaringan
pada setiap atribut dan kemudian mengklasifikasikannya kedalam kelas target.
Kelas target dapat diketahui melalui training pada data set.
4. Support Vector Machine (SVM)
SVM merupakan metode klasifikasi yang berakar dari teori pembelajaran statistik
yang hasilnya sangat menjanjikan untuk memberikan hasil yang lebih baik daripada
metode yang lain. SVM juga bekerja dengan baik pada set data berdimensi tinggi,
bahkan SVM yang menggunakan teknik kernel yang harus memetakan data asli
dari dimensi asalnya menjadi dimensi lain yang relative lebih tinggi. Pada SVM,
data latih yang akan dipelajari hanya data terpilih saja yang berkontribusi untuk
membentuk model yang digunakan dalam klasifikasi yang akan dipelajari. Hal ini
menjadi kelebihan SVM karena tidak semua data latih akan dipandang untuk
dilibatkan dalam setiap iterasi pelatihannya. Data yang berkontribusi tersebut
disebut Support Vector sehingga metodenya disebut Support Vector Machine.
31
2.12 UML (Unified Modelling Language)
Unified Modelling Language (UML) adalah salah satu standar bahasa yang
banyak digunakan untuk mengkombinasikan, membuat analisis dan desain, serta
menggambarkan arsitektur dalam pemograman berorientasi objek. UML merupakan
bahasa visual untuk pemodelan dan komunikasi mengenai sebuah sistem dengan
menggunakan diagram dan teks – teks pendukung. UML muncul karena adanya
kebutuhan pemodelan visual untuk menspesifikasikan, menggambarkan, membangun,
dan dokumentasi dari sistem perangkat lunak. UML hanya berfungsi untuk melakukan
permodelan. Jadi penggunaan UML tidak terbatas pada metodologi tertentu, meskipun
pada kenyataannya UML paling banyak digunakan pada metodologi berorientasi objek
(Rosa A.S dan M. Shalahudin, 2014:133)
UML adalah bahasa yang telah menjadi standar untuk visualisasi, menetapkan,
membangun dan mendokumentasikan suatu sistem perangkat lunak (Hend, 2006:5).
UML adalah alat bantu analis serta perancangan perangkat lunak berbasis objek
(Adi Nugroho, 2005:3).
UML adalah keluarga notasi grafis yang di dukung oleh meta-model 28 tunggal
yang membantu pendeskripsian dan desain sistem perangkat lunak khususnya sistem
yang dibangun menggunakan pemograman berorientasi objek (Martin Fowler, 2005:1).
UML adalah bahasa standar untuk membuat rancangan software. UML biasanya
digunakan untuk menggambarkan dan membangun dokumen dari software – intensive
system (Booch, 2005:7).
32
UML adalah bahasa pemodelan untuk sistem atau perangkat lunak yang
berparadigma “berorientasi objek”. Pemodelan (modelling) sesungguhnya digunakan
untuk penyederhanaan permasalahan – permasalahan yang kompleks sedemikian rupa
sehingga lebih mudah dipelajari dan dipahami (Nugroho, 2010:6).
UML adalah metodologi kolaborasi antara metoda – metoda Booch, OMT
(Object Modelling Technique) serta OOSE (Object Oriented Software Enginering) dan
beberapa metoda lainnya merupakan metodologi yang paling sering digunakan saat ini
untuk analisa dan perancangan sistem dengan metodologi berorientasi objek
mengadaptasi maraknya pengguna Bahasa pemograman berorientasi objek (OOP)
(Nugroho, 2009:4).
Beberapa literature menyebutkan bahwa UML menyediakan 9 diagram, yang
lainnya menyebutkan 8 diagram karena ada beberapa diagram yang digabung misalnya
diagram komunikasi, diagram urutan dan diagram perwaktuan digabung menjadi
diagram interaksi (Heriawati, 2011)
UML adalah Bahasa pemodelan standar yang memiliki sintak dan semantik
(Widodo, 2011)
Berdasarkan beberapa pendapat yang dikemukakan dapat ditarik kesimpulan
bahwa Unified Modelling Language (UML) adalah Bahasa grafis untuk
mendokumentasikan, mengspesifikasikan dan membangun system perangkat lunak.
33
2.13 Penelitian Terdahulu
Sistem Diagnosis Penyakit Hati menggunakan metode Naïve Bayes merupakan
aplikasi yang bertujuan membantu masyarakat dalam mendiagnosis penyakit hati
secara dini. Sistem ini dibangun berdasarkan masalah yang terjadi di masyarakat yaitu
sulitnya dalam mengenali jenis penyakit hati. Dikarenakan penyakit hati mempunyai
gejala – gejala yang berjumlah cukup banyak serta terdapat kesamaan gejala yang
dimiliki beberapa penyakit hati. Hal ini termasuk salah satu penyebab tingginya tingkat
presentase penyakit hati di Indonesia, tercatat dari Riset Kesehatan Dasar tahun 2013,
salah satu jenis penyakit hati yaitu Hepatitis B secara nasional prevalensinya mencapai
21,8% dan menduduiki peringkat tertinggi ketiga di Indonesia. Metode naïve bayes
dipilih pada penelitian ini karena naïve bayes memperhatikan seluruh fitur pada data
latih sehingga membuat metode ini optimal dalam melakukan proses klasifikasi. Sistem
ini menggunakan system operasi Android, karena android cukup konsisten
kepopulerannya di pasar smartphone Indonesia hingga sekarang. Data yang digunakan
pada penelitian ini diperoleh dari dokter yang sudah divalidasi oleh instansi Rumah
Sakit Universitas Brawijaya, Malang. Hasil penelitian ini menunjukkan bahwa pada
pengujian akurasi dari 40 data uji mendapatkan tingkat akurasi sebesar 87,5%.
2.14 Spesifikasi Kebutuhan Software dan Hardware
Suatu sistem yang baik tidak akan berhasil dengan baik apabila tidak didukung
oleh sarana pendukung yang baik pula. Sarana pendukung yang dimaksud bukan harus
menggunakan suatu unit komputer dengan merek tertentu dan harga yang mahal tetapi
34
harus berintegrasi dengan baik antara satu dengan yang lainnya. Sistem dikatakan baik
dan akan berhasil digunakan atau diterapkan jika didiukung dengan beberapa unsur
atau beberapa aspek antara lain perangkay keras (Hardware), perangkat lunak
(Software) dan pemakai (Brainware). Diantara unsur tersebut yaitu prasarana atau
peralatan pendukung yang dibutuhkan harus sesuai dengan spesifikasi sistem yang
diusulkan untuk itu penulis menguraikan prasarana atau perangkat komputer yang
harus tersedia pada sistem yang diusulkan. Adapun spsesifikasinya adalah sebagai
berikut :
Perangkat lunak (Software) yang digunakan pada sistem usulan ini yaitu
menggunakan :
a. Operating Sistem : Microsoft Windows 10
b. Menggunakan Rapidminer untuk data mining dengan metode algoritma naïve bayes
classifier.
Rapidminer adalah aplikasi data mining berbasis sistem open-source yang
berguna untuk analisis data dan sebagai mesin data mining untuk integrasi ke dalam
produk.
35
Contoh interface Rapidminer pada data mining naïve bayes classifier
Gambar 2.4 Interface Rapidminer pada data mining naïve bayes classifier
Adapun perangkat keras yang digunakan sebagai berikut :
a. Micro Processor : Intel CORE i5 7th Generation
b. Memori : 8 GB DDR4
c. Hardisk : 1 TB HDD
d. Monitor : 14”
e. Keyboard / Mouse : Serial / PS2 / USB
f. Printer : Epson L200
36
BAB III
METODE PENELITIAN
3.1 Kerangka Pemikiran
Kerangka pikir merupakan garis besar dari langkah – langkah penelitian yang
dilakukan. Langkah – langkah tersebut disusun sedemikian rupa sebagai acuan untuk
tahap – tahap yang dilakukan dalam proses penelitian. Kerangka pemikiran dalam
penelitian ini berisi landasan teori yang menjadi dasar dalam menjawab tujuan
penelitian. Teori yang diuraikan meliputi konsep dasar dari metode naïve bayes beserta
Teknik yang digunakan untuk mengetahui diagnosa penyakit Tuberculosis yang
dialami oleh pasien akibat terinfeksi virus. Dan menggunakan rapid miner untuk
mengetahui akurasi prediksi penyakit tuberculosis.
Berdasarkan kerangka teori yang telah dijelaskan pada gambaran umum objek,
maka dikembangkan kerangka pemikiran penelitian diagnosa penyakit typhoid fever
yang dipengaruhi oleh gejala yang ada pada penyakit tuberculosis. Berikut ini gambar
kerangka pemikiran.
37
Gambar 3.1 Kerangka Pemikiran
3.2 Sekilas Tentang Rumah Sakit Umum Daerah Padangan
Rumah Sakit Umum Daerah (RSUD) Padangan yang beralamat di Jl. Dr.
Soetomo No. 02 Padangan Bojonegoro adalah sebuah rumah sakit milik Pemerintah
Kabupaten Bojonegoro, yang merupakan perubahan status dari Puskesmas Perawatan
menjadi Rumah Sakit Kelas D pada tahun 2011.
38
Perubahan status dari Puskesmas Perawatan menjadi Rumah Sakit Kelas D
bertujuan untuk meningkatkan pelayanan kesehatan kepada masyarakat khususnya
masyarakat wilayah barat Kabupaten Bojonegoro. Dengan didirikannya RSUD
Padangan sebagai fasilitas kesehatan rujukan, diharapkan dapat memberikan pelayanan
kesehatan yang lebih lengkap disbanding Puskesmas.
Selama tujuh tahun secara resmi RSUD Padangan berdiri telah menunjukkan
adanya perkembangan yang signifikan, baik dari kuantitas maupun kualitas pelayanan,
dalam arti jumlah kunjungan pasienada peningkatan dari tahun ke tahun baik pasien
rawat jalan maupun pasien rawat inap.
3.2.1 Waktu dan Tempat Penelitian
Penelitian dilakukan pada tanggal 15 Agustus 2018 sampai tanggal 25 Agustus
2018 di Rumah Sakit Umum Daerah (RSUD) Padangan yang beralamat di Jl. Dr.
Soetomo No. 02 Padangan, Bojonegoro, Jawa Timur.
3.3 Metode Pengumpulan Data
Metode yang digunakan dalam penyusunan laporan skripsi ini adalah :
1. Metode Wawancara
Dilakukan terhadap narasumber yang mengerti konsep kesehatan khususnya mengenai
gejala penyakit tuberculosis dan jenisnya.
39
2. Observasi
Merupakan salah satu metode pengumpulan data yang cukup efektif untuk mempelajari
suatu sistem. Penulis melakukan pengamatan langsung pada Dokter agar data yang di
dapatkan lebih akurat.
3. Studi Pustaka (Library Research)
Metode ini memperoleh data – data yang berhubungan dengan penulisan skripsi dari
berbagai sumber bacaan seperti buku, jurnal dan lain sebagainya sebagai acuan.
4. Searching (Browsing)
Melakukan pengumpulan jurnal yang bersumber dari internet.
3.3.1 Hasil Wawancara
Setelah melakukan penelitian dan wawancara dengan seorang pakar yang ahli di
bidang kesahatan dan cara penanganan dapat disimpulkan bahwa penyakit tuberculosis
dapat berakibat fatal jika tidak segera ditangani. Gejala penyakit tuberculosis
bermacam – macam seperti batuk lebih dari 2 minggu, batuk disertai bercak darah,
penurunan berat badan drastis, berkeringat pada malam hari, demam, tidak nafsu
makan, nyeri dada, dan fisik lemah yang akan berakibat fatal apabila tidak segera
ditangani. Cara penanganannya dengan rawat inap di rumah sakit tertentu dan
melakukan serangkaian tes laboratorium.
3.4 Desain Penelitian
Dalam melakukan suatu penelitian ini sangat perlu dilakukan perencanaan agar
penelitian yang dilakukan dapat berjalan dengan baik dan sistematis. Desain penelitian
40
menurut Moh. Nazir (2003:84) memaparkan bahwa desain penelitian adalah semua
proses yang dilakukan dalam perencanaan dan pelaksanaan penelitian. Dari definisi
diatas maka dapat disimpulkan bahwa desain penelitian merupakan semua proses
penelitian yang dilakukan oleh penulis dalam melaksanakan penelitian mulai dari
perencanaan sampai dengan pelaksanaan penelitian yang dilakukan pada waktu
tertentu
3.5 Analisis metode yang berjalan
Sebelum melakukan penelitian sistem, terlebih dahulu dilakukan analisa sistem
berjalan. Arus data pada sistem kerja dilihat pada gambar flowchart Diagnosa Prediksi
Penyakit Tuberculosis berikut
41
Gambar 3.2 Activity Diagram Diagnosa Prediksi Penyakit Tuberculosis
3.6 Akuisisi Pengetahuan
Selanjutnya setelah penyusunan basis pengetahuan dengan tabel keputusan
diagnosa penyakit sesuai pengamatan pada penyakit Tuberculosis. Hanya beberapa
gejala yang paling nampak yang digunakan dalam tabel keputusan diagnosa, kemudian
ditentukan hasil diagnosanya. Representasi pengetahuan dibuat dalam bentuk tabel
yang akan digunakan dalam pembuatan aturan – aturan untuk melakukan pengambilan
keputusan diagnosa pada penyakit Tuberculosis.
42
Tabel 3.1 Akuisisi Pengetahuan
Penyakit Gejala Penyakit Penyebab Gejala Penyakit
Tuberculosis
- Batuk
berkepanjangan
- Batuk disertai bercak
Darah
- Penurunan berat
badan drastis
- Berkeringat pada
malam hari
- Nyeri dada
- Sesak nafas
- Infeksi virus flu
- Kurang menjaga kesehatan
paru – paru dan tenggorokan
- Tidak nafsu makan
- Perubahan suhu tubuh
karena demam
- Infeksi pada saraf yang
menimbulkan ruam
- Tamponade jantung
(kelebihan cairan di sekitar
jantung)
3.7 Analisa Sistem
Pada bagian ini analisa dilakukan terhadap data dan permasalahan yang telah
dirumuskan yang dapat menjawab permasalahan dan kendala yang ada. Adapun analisa
yang dilakukan adalah :
a. Analisa kebetuhan sistem
Tahap ini dilakukan berdasarkan data yang diperoleh dari pakar kemudian data
tersebut digunakan dalam membangun sistem.
b. Basis pengetahuan
43
Pada tahap ini dibangun basis pengetahuan berupa data gejala. Pada tahap ini
digunakan table relasi gejala penyakit dengan memanfaatkan pengetahuan dari
pakar yang bersangkutan.
c. Mesin inferensi
Pada tahap ini dilakukan proses penggabungan banyak aturan berdasarkan data yang
tersedia dari pakar yang merujuk kepada table relasi untuk mempertimbangkan
informasi dalam basis pengetahuan dan merumuskan kesimpulan. Mesin inferensi
yang digunakan adalah forward chaining (runut maju).
d. Analisa fungsional
Analisa fungsional berisikan Analisa data kedalam bentuk UML (Unifield
Modelling Language).
Dengan adanya analisa di atas, dapat diketahui kebutuhan sistem dengan meneliti dari
mana data berasal, bagaimana aliran data menuju sistem, bagaimana operasi sistem
yang ada dan hasil akhirnya.
3.8 Perancangan Sistem
3.8.1 Metode Algoritma Naïve Bayes
Naïve Bayes merupakan sebuah pengklasifikasian probalistik sederhana yang
menghitung sekumpulan probabilitas dengan menjumlahkan frekuensi dan kombinasi
nilai dari data set yang diberikan. Algoritma menggunakan Teorema Bayes dan
mengasumsikan semua atribut independen atau tidak saling ketergantungan yang
diberikan oleh nilai pada variable kelas. Naïve Bayes juga didefinisikan sebagai
pengklasifikasian dengan metode probabilitas dan statistic yang dikemukakan oleh
44
Thomas Bayes yaitu memprediksi peluang di masa depan berdasarkan pengalaman di
masa sebelumnya.
Naïve Bayes didasarkan pada asumsi penyederhanaan bahwa nilai atribut secara
kondisonal saling bebas jika diberikan nilai output. Dengan kata lain diberikan nilai
output, probabilitas mengamati secara bersama adalah produk dari probabilitas
individu. Keuntungan penggunaan naïve bayes adalah bahwa metode ini hanya
membutuhkan jumlah data pelatihan (Training Data) yang kecil untuk menentukan
estimasi parameter yang diperlukan dalam proses pengklasifikasian. Naïve Bayes
sering bekerja jauh lebih baik dalam kebanyakan situasi dunia nyata yang kompleks
daripada yang diharapkan (Saleh, 2015).
3.8.2 Pengumpulan Data
Penulis mendapatkan data dari Rumah Sakit Umum Daerah (RSUD) Padangan
Data berupa hard copy file rekam medis pasien. Data rekam medis tersebut kemudian
dianalisis guna mendapatkan data yang spesifik dan menuangkan data yang didapatkan
dalam bentuk excel, guna mempermudah pengolahan data. Total data yang diambil
sebanyak 199 kasus, pasien terdiagnosa positif tuberculosis sebanyak 172 orang dan
pasien terdiagnosa negatif tuberculosis sebanyak 27 orang.
45
Tabel 3.2 Data Pasien
3.8.3 Model yang diusulkan
Model yang diusulkan untuk klasifikasi menggunakan algoritma Naïve bayes
adalah menggunakan model split validation. Split validation membagi data menjadi
46
dua subset data yaitu data trainning dan data testing. Data trainning merupakan data
yang digunakan untuk pelatihan, sedangkan data testing akan digunakan untuk
pengujian. Adapaun untuk melihat secara lebih jelas dari model split validation dapat
dilihat pada gambar 3.1
Gambar 3.3 Model pengujian
Pada gambar 3.3 akan digunakan untuk melakukan pengujian dengan masing-
masing proporsi pembagian datanya dapat dilihat tabel 3.3.
Tabel 3.3 Pembagian Data
Training Testing
60% 40%
70% 30%
80% 20%
90% 10%
Preposed
data
Testing Data
Training Data
Model
Development
Model
Assessment
Prediction
Accuration
Classifierr
47
Dari empat kali percobaan yang dilakukan berdasarkan proporsi dari tabel 3.2
setiap hasil yang diperoleh akan ditentukan jumlahnya.
48
BAB IV
HASIL DAN PEMBAHASAN
4.1 Langkah Perhitungan
Pada tahap ini metode yang digunakan dalam perhitungan tingkat akurasi adalah
algoritma naive bayes dengan melakukan pengujian akurasi data set dan perhitungan
manual. Berikut langkah metode algoritma naive bayes :
Gambar4.1 Model Algoritma Naive bayes
Pada gambar 4.1 mulai identifikasi sampel dari data set baca data. selanjutnya
P(Xi|Ci) menghitung jumlah class dari klasifikasi yang sudah terbentuk yaitu class
Proses Naive bayes
Menghitung
probabilitas awal
untuk klasifikasi yg
terbentuk positif dan
negatif P(𝑋𝑖|𝐶𝑖) dari
setiap Class i
Hitung setiap class
yang sama untuk
probabilitas class
X P(𝑋𝑖|𝐶𝑖) dari
setiap Class
Perkalian dari
semua Class
yang sudah
dihitung
probabilitasnya
P(𝑋𝑖|𝐶𝑖) * P(𝐶𝑖)
Membandingkan hasil tiap
class probabilitas
𝐶+untuk class positif
𝐶− untuk class negatif
diterima
P(X|𝐶+)>P(X|𝐶−)
Prediksi positif 𝐶+
Prediksi negatif 𝐶−
Mulai Input
dataset
selesai
49
positif dan negatif untuk setiap class. Kemudian P(X|Ci) menghitung jumlah kasus
yang sama dari kelas yang sama X, dalam kasus data set pada penelitian ini terdiri dari
2 class yaitu positif yang dinyatakan dengan simbul (+) dan negatif yang dinyatakan
dengan simbul (-). Kemudian hitung P(X|𝐶+),i=+,- untuk setiap kelas atau atribut.
Setelah itu dibandingkan, jika P(X|𝐶+)>P(X|𝐶−) maka kesimpulannya adalah 𝐶+ atau
pada penelitian ini berarti diagnosa penyakit positif. Jika P(X|𝐶+)<P(X|𝐶−) maka
kesimpulannya 𝐶− atau negatif.
4.2 Seleksi Data
Proses seleksi data yaitu dengan cara mengelompokkan data yang berupa angka
menjadi keterangan tingkat gejala normal, sedang dan bahaya. Berikut ini adalah tabel
klasifikasinya.
50
Tabel 4.1 Seleksi Data
Pada tabel 4.1 menerangkan tentang proses penyeleksian data ke dalam
klasifikasi gejala Normal, Sedang dan Bahaya.
51
Tabel 4.2 Setelah Proses Seleksi Data
Tabel 4.2 merupakan tampilan setelah di lakukan proses seleksi data. Pada
semua tabel gejala telah dikelompokkan menjadi normal, sedang, dan bahaya
berdasarkan tabel seleksi data.
52
4.3 Metode yang diusulkan
Metode yang akan digunakan dalam penelitian ini adalah algoritma naive
bayes. Dalam pemodelan ini algoritma naive bayes akan dicari performance
Vektor(accuracy) dan confusion matrix.
Gambar 4.2 Metode untuk menemukan performance algoritma
53
4.4 Hasil Pengujian Prediksi Diagnosa
Tabel 4.3 Data training
Data training adalah data yang akan di latih untuk menentukan hasil dari data
testing.
54
Tabel 4.4 Data Testing
Tabel 4.4 berisi tentang data diagnosa dari rumah sakit yang kemudian akan di testing
menggunakan hitung manual dan rapid miner.
4.4.1 Prediksi Menggunakan Perhitungan Manual
Berikut ini perhitungan dalam penelitian ini menggunakan 199 data training
terdiri dari 10 atribut untuk menentukan sebuah class, yang mana dari 199 data
55
training tersebut akan digunakan untuk melakukan perhitungan algoritma Naive bayes.
Adapun data training tersebut dapat dilihat pada tabel 4.1.
Data testing 1 : X = (Nama=”Tn”, Jenis kelamin=”L”, Batuk= “Bahaya”, Penurunan
Berat Badan=”Sedang”, Nyeri Dada= “Normal”, Sesak Nafas= “Sedang”, Berkeringat
Malam Hari=”Bahaya”, Batuk Darah=”Bahaya”)
Tahap 1 menghitung jumlah kelas atau prediksi data testing
P(Ci)
P(Positif) = 172
199 = 0,864
P(Negatif) = 27
199 = 0,135
56
Tahap 2 menghitung jumlah kasus yang sama dengan kelas yang sama.
P(X | Ci)
Batuk(Bahaya | Positif) = 87
172 = 0,5058
Batuk(Bahaya | Negatif) = 1
27 = 0,0370
Penurunan BB(Sedang | Positif) = 111
172 = 0,6453
Penurunan BB(Sedang | Negatif) = 17
27 = 0,6296
Nyeri dada(Normal | Positif) = 27
172 = 0,1569
Nyeri dada(Normal | Negatif) = 4
27 = 0,1481
Sesak nafas(Sedang | Positif) = 80
172 = 0,4651
Sesak nafas(Sedang | Negatif) = 24
27 = 0,8888
Berkeringat MH(Bahaya | Positif) = 61
172 = 0,3546
Berkeringat MH(Bahaya | Negatif) = 2
27 = 0,0740
Batuk darah(Bahaya | Positif) = 84
172 = 0,4883
Batuk darah(Bahaya | Negatif) = 4
27 = 0,1481
57
Tahap 3 mengkalikan semua hasil dari atribut Positif dan Negatif.
Tahap 4 membandingkan nilai kelas Positif dan Negatif.
Jadi untuk (Nama=”Tn”, Jenis kelamin=”L”, Batuk= “Bahaya”, Penurunan Berat
Badan=”Sedang”, Nyeri Dada= “Normal”, Sesak Nafas= “Sedang”, Berkeringat
Malam Hari=”Bahaya”, Batuk Darah=”Bahaya”, hasilnya “Positif” Tuberculosis.
4.4.2 Prediksi Menggunakan Rapid Miner
Uji coba ini dilakukan untuk mengetahui apakah perhitungan yang telah
dilakukan diatas sesuai dengan klasifikasi diagnosa penyakit tuberculosis dengan
metode naive bayes menggunakan Rapid Miner 9.0.
P(X | Positif)= 0,5058*0,6453*0,1569*0,4651*0,3546*0,4883 = 0,004124
P(X | Negatif)= 0,0370*0,6296*0,1481*0,8888*0,0740*0,1481 = 0,0000336
P(X | Ci * P(Ci)
P(X | Positif) * P(Positif) = 0,004124 * 0,864 = 0,003563136
P(X | Negatif) * P(Negatif) = 0,0000336 * 0,135 = 0,000004536
58
Gambar 4.3 Design Rapid Miner Prediksi Data Tesing
Gambar 4.3 berisi tentang design model rapid miner yang terdiri dari dua read
excel, select attributes, naïve bayes dan apply mode yang saling terkoneksi. Pada read
excel pertama berisi data training dan read excel yang kedua berisi data testing.
59
Gambar 4.4 Hasil Prediksi Data Testing di Rapid Miner
Dari keterangan gambar 4.4 hasil testing data pada nomor 1 dengan klasifikasi
Nama=”Tn”, Jenis kelamin=”L”, Batuk=“Bahaya”, Penurunan Berat
Badan=”Sedang”, Nyeri Dada= “Normal”, Sesak Nafas= “Sedang”, Berkeringat
Malam Hari=”Bahaya”, Batuk Darah=”Bahaya” yang dilakukan dengan menggunakan
Rapid miner menghasilkan prediksi yang sama dengan kasus perhitungan manual yaitu
“Positif” Tuberculosis.
60
4.5 Hasil Klasifikasi Class
4.5.1 Simple Distribution Model
Menganalisa tabel data pasien dalam memprediksi diagnosa penyakit typhoid
fever dengan metode naive bayes dapat menghasilkan 2 class utama.
Gambar 4.5 Simple Distribution Model
Hasil dari klasifikasi dari data pasien dengan menggunakan metode naive bayes
membagi 2 kelas klasifikasi yaitu class POSITIF dan class NEGATIF.Untuk nilai class
POSITIF yaitu 0.864 dan nilai class NEGATIF 0.136
4.5.2 Distribution Table
Tabel distribusi hasil analisa dengan metode naive bayes terhadap tabel data
pasien dalam memprediksi diagnosa penyakit dapat dilihat di tabel berikut.
61
Tabel 4.5 Tabel Distribusi
Atribut Value Probabilitas
Positif Negatif
Batuk
Biasa 0,04651163 0,29629630
Sedang 0,45348837 0,66666667
Bahaya 0,50000000 0,03703704
Penurunan Berat
Badan
Biasa 0,29651163 0,29629630
Sedang 0,64534884 0,62962963
Bahaya 0,05813953 0,07407407
Nyeri Dada
Biasa 0,15697674 0,14814815
Sedang 0,36046512 0,55555556
Bahaya 0,48255814 0,29629630
Sesak Nafas
Biasa 0,10465116 0,03703704
Sedang 0,46511628 0,88888889
Bahaya 0,43023256 0,07407407
Berkeringat
Malam Hari
Biasa 0,20348837 0,37037037
Sedang 0,44186047 0,55555556
Bahaya 0,35465116 0,07407407
Batuk Darah
Biasa 0,04069767 0,40740741
Sedang 0,47674419 0,44444444
Bahaya 0,48255814 0,14814815
Pada tabel 4.5 adalah tabel distribusi yang mempunyai nilai yang besar terhadap
probabilitasnya, dapat diketahui bahwa atribut tersebut mempunyai nilai yang hampir
sempurna. Atribut tersebut dapat mempengaruhi pola dari prediksi diagnosa penyakit
tuberculosis.
62
Gambar 4.6 Grafik Distribusi Label
4.6 Hasil Performance Vektor
Proses klasifikasi dengan rapidminer dengan metode naive bayes yang
digunakan mengklasifikasi data pasien sebanyak 199 data pada penelitian ini sehingga
diperoleh nilai Accuracy, Precision dan Recall dengan menggunakan Split validation
80 : 20 .
0,00000000
0,20000000
0,40000000
0,60000000
0,80000000
1,00000000
No
rmal
Sed
ang
Bah
aya
No
rmal
Sed
ang
Bah
aya
No
rmal
Sed
ang
Bah
aya
No
rmal
Sed
ang
Bah
aya
No
rmal
Sed
ang
Bah
aya
No
rmal
Sed
ang
Bah
aya
Batuk PenurunanBerat Badan
Nyeri Dada Sesak Nafas BerkeringatMalam Hari
BatukDarah
Grafik Distribusi Label
Positif Negatif
63
1. Accuracy / akurasi
Dengan mengetahui jumlah data yang di klasifikasikan secara benar maka
dapat diketahui akurasi hasil prediksi yaitu 89,74% dari hasil data pasien. Di bawah
ini merupakan hasil dari testing menggunakan rapidminer 9.0.
Gambar 4.7 Accuracy
64
Berikut ini perhitungan manual untuk menentukan accuracy.
2. Precision
Precision adalah jumlah data yang true positive (jumlah data positif yang
dikenali secara benar sebagai positif) dibagi dengan jumlah data dikenali
sebagai positif. Dari hasil pengujian nilai precision yaitu 91,67% untuk class
Positif dan nilai precision 66,67% untuk class Negatif.
Gambar 4.8 Precision
Accuracy =(𝑇𝑃+𝑇𝑁)
(𝑇𝑃+𝑇𝑁+𝐹𝑃+𝐹𝑁)𝑥100%
= (33 + 2)
(33 + 2 + 33 + 1)𝑥100% =
(35)
(39)𝑥100%
= 0.897 𝑥 100% = 89.74%
65
Berikut ini perhitungan manual untuk menentukan Precision.
3. Recall
Recall merupakan jumlah data yang true positive dibagi dengan jumlah data
yang sebenarnya positive (true positive + true negative). Untuk nilai recall
yaitu 97,06% pada class positif dan nilai recall 40% pada class negatif.
Gambar 4.9 Recall
Precision positive = 𝑇𝑃
(𝑇𝑃+𝐹𝑃)𝑥100%
=33
(33 + 3)𝑥100% =
33
36𝑥100% = 0.9166 𝑥 100% = 91.66%
Precision negative = 𝑇𝑁
(𝑇𝑁+𝐹𝑃)𝑥100%
=2
(2 + 3)𝑥100% =
2
5𝑥100% = 0.4 𝑥 100% = 40.00%
66
Berikut ini perhitungan manual untuk menentukan Recall positive dan
Recall negative.
4. AUC (Area Under Curve)
Kurva Receiver Operating Characteristic (ROC) juga dihasilkan oleh
Rapidminer. Kurva tersebut dapat dilihat pada gambar 4.8
Recall (Positive) =𝑇𝑃
(𝑇𝑃+𝐹𝑁)𝑥100%
=33
(33 + 1)𝑥100% =
33
34𝑥100% = 0.97 𝑥 100% = 97%
Recall (Negative) = 𝑇𝑁
(𝑇𝑁+𝐹𝑃)𝑥100%
= 2
(2 + 3)𝑥100% = =
2
5𝑥100% = 0.4 𝑥 100%
= 40.00%
67
Gambar 4.10 Kurva ROC
Kurva ROC digunakan untuk mengekspresikan data confusion matrix. Dari
gambar 4.10 dapat diketahui bahwa nilai Area Under Curve (AUC) model
algoritma naive bayes adalah 0.959. Hal ini menunjukkan bahwa model
algoritma naive bayes mencapai klasifikasi hampir sempurna.
5. Confusion Matrix
Pada gambar 4.11 dibawah ini adalah hasil confusion matrix dari rapidminer.
gambar 4.11 confusion matrix
Berdasarkan hasil Confusion Matrix dari rapidminer didapat accuracy 89.%.
68
4.7 Evaluasi dan Validasi (Evaluation and Validation)
Tahapan evaluasi yang dilakukan dalam penelitian ini adalah untuk memberikan
penilaian dari hasil penggunaan algoritma naive bayes saja dan naive bayes yang
disertai dengan confusion matrix untuk mengklasifikasi diagnosa prediksi penyakit
tuberculosis menggunakan Split validation. Bagian yang akan dievaluasi adalah
presentase data, jumlah data training, jumlah data testing dan nilai akurasi yang di
hasilkan. Adapaun secara keseluruhan dapat dilihat pada tabel 4.6
Tabel 4.6 Evaluasi Pengujian
No. Persentase Data Data Training Data Testing Akurasi
1 60 : 40 120 80 90.00%
2 70 : 30 140 60 90.00%
3 80 : 20 160 40 89.74%
4 90 : 10 180 20 85.00%
Pada Tabel 4.6 berisi tentang hasil akurasi dari perbandingan data training data
testing sebagai berikut :
1. Presentase data dengan perbandingan data 60 : 40 yaitu data training sebanyak
120 data dan data testing sebesar 80 data menghasilkan akurasi 90%.
2. Presentase data dengan perbandingan data 70 : 30 yaitu data training sebanyak
140 data dan data testing sebesar 60 data menghasilkan akurasi 90%.
69
3. Presentase data dengan perbandingan data 80 : 20 yaitu data training sebanyak
160 data dan data testing sebesar 40 data menghasilkan akurasi 89,74%.
4. Presentase data dengan perbandingan data 90 : 10 yaitu data training sebanyak
180 data dan data testing sebesar 20 data menghasilkan akurasi 85%.
70
BAB V
PENUTUP
a. Kesimpulan
Kesimpulan yang dapat diambil dari penelitian ini adalah :
1. Implementasi data mining dengan metode klasifikasi dan algoritma naive bayes
dapat memprediksi diagnosa penyakit tuberculosis dengan lebih cepat dan
mudah.
2. Implementasi data mining dengan metode klasifikasi dan algoritma naive bayes
dapat memprediksi diagnosa penyakit tuberculosis dengan cukup akurat yaitu
dengan akurasi 89,74%.
b. Saran
Saran yang dapat diberikan dalam penelitian ini adalah :
1. Pada penelitian selanjutnya, diharapkan menggunakan data yang lebih banyak
agar prediksi diagnosa penyakit tuberculosis semakin akurat.
2. Pada peneletian selanjutnya, di harapkan peneliti untuk merancang dan
membuat software untuk mendiagnosa penyakit tuberculosis.
3. Perlu dilakukan pengembangan metode selain klasifikasi, seperti klastering
dan asosiasi. Setiap metode diuji tingkat akurasinya baik dari akurasi metode
pada data mining itu sendiri maupun uji akurasi antara aktual dan prediksi.
71
DAFTAR PUSTAKA
Suyanto. 2017. Data Mining Untuk Klasifikasi Dan Klasterisasi Data. Bandung :
Informatika
Yuliawardhani, Dilla dan Zarman Wendi. Pembuatan Sistem Berbasis Android untuk
Memprediksi Penyakit Berdasarkan Gejala yang Ditimbulkan Menggunakan
Metode Naive Bayes. Jurusan Teknik Komputer Unikom : Bandung
Chai, K.; H. T. Hn, H. L. Chieu; “Bayesian Online Classifiers for Text Classification
and Filtering”, Proceedings of the 25th annual international ACM SIGIR conference
on Research and Development in Information Retrieval, August 2002
Fuyudi, Ahmad W, dkk. “Sistem Diagnosis Penyakit Kucing Menggunakan Metode
Naive Bayes”. Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer Vol.
2, No. 8, hlm. 2659-2665, Agustus 2018
(http://j-ptiik.ub.ac.id/index.php/j-ptiik/article/view/1889/714)
Connoly, T., & Begg. C. 2005. Database Systems ; A Practical Approach to Design,
Implementation and Management, Harlow : Addison Wesley
Jiawei Han, Micheline Kamber. Data Mining Concepts and Techniques, 2003
Abdillah, Ihsan. 2016. Prediksi Penentuan Metode KB dalam Program Keluarga
Berencana dengan Menggunakan Metode Naive Bayes Classifier. Pekanbaru : UIN
Sultan Syarif Kasim Riau
Aeni, Nur W, dkk. “Algoritma Klasifikasi Data Minning Naive Bayes Berbasis Particle
Swarm Optimization untuk Deteksi Penyakit Jantung”. Jurnal Pseudocode Vol. 1,
No. 1, Februari 2014
(http://www.academia.edu/16838248/Jurnal_Pseudocode_Volume_1_Nomor_1_F
ebruari_2014_ISSN_2355_5920)
Bustami “Penerapan Algoritma Naive Bayes untuk mengklasifikasi Data Nasabah
Asuransi”. Jurnal Penelitian Teknik Informatika (TECHSI) Vol. 2 : 2, 127-146,
2013
(http://journal.uad.ac.id/index.php/JIFO/article/view/2086)
C, Dennis Aprilla, dkk. 2013. Belajar Data Mining dengan Rapidminer. Diakses 10
Oktober 2018
Cahya, Intan G. 2014. Prediksi Persediaan Obat dengan Metode Naive Bayes. Fakultas
Komunikasi dan Informatika Universitas Muhammadiyah Surakarta : Surakarta
72
Mahadewi. M. Ch. Agung Ayu Bulan. 2015. Klasifikasi Kain Tradisional Nusantara
dengan menggunakan Algoritma Naive Bayes Classifier. Universitas Sanata
Dharma : Yogyakarta
Dedy Ahmad Kurniawan, Danny Kriestanto. Penerapan Naive Bayes untuk Prediksi
Kelayakan Kredit. Jurnal Informatika dan Komputer (JIKO) Vol. 1 No. 1. 2016
(https://ejournal.akakom.ac.id/index.php/jiko/article/view/10/3)
Jananto Arief. Algoritma Naive Bayes untuk Mencari Perkiraan Waktu Studi
Mahasiswa. Jurnal Teknologi Informasi DINAMIK Vol. 18, No. 1 2013
(https://www.unisbank.ac.id/ojs/index.php/fti1/article/view/1669)
Fadli, A. 2011. Konsep Data Mining. Sumber : IlmuKomputer.com (diakses pada 07
September 2018)
Novianto, Nurul, Ratih “Sistem Diagnosis Penyakit Hati Menggunakan Metode Naive
Bayes”. Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer Vol. 2, No.
8, 2666-2671, Agustus 2018
(http://j-ptiik.ub.ac.id/index.php/j-ptiik/article/view/1917/735)
1.2 Tabel Seleksi Data
No. Nama
J
e
n
i
s
K
e
l
a
m
i
n
Batuk
Penurunan
Berat
Badan
Nyeri
Dada
Sesak
Nafas
Berkering
at Malam
Hari
Batuk
Darah
Tuberc
ulosis
(TBC)
<7 hr =
Normal
<2 kg =
Normal
<2 kali =
Normal
<2 kali =
Normal
<2 hr =
Normal
0 kali =
Normal
7 - 14 hr
= Sedang
2 - 4 kg =
Sedang
2 - 3
kali=
Sedang
2 - 3 kali =
Sedang
2 - 3 hr =
Sedang
1 kali =
Sedang
>14 hr =
Bahaya
>4 =
Bahaya
>3 kali=
Bahaya
>3 =
Bahaya
>3 hr =
Bahaya
>1 kali =
Bahaya
1 Tn. L 13 2 1 3 6 2 Positif
2 Ny. P 15 3 5 4 2 1 Positif
3 Anak P 23 1 6 4 2 0 Positif
4 Ny. P 13 3 3 4 5 1 Positif
5 Tn. L 5 3 3 3 3 0 Negatif
6 Ny. P 8 3 3 5 8 3 Positif
7 Tn. L 14 1 3 4 2 4 Positif
8 Ny. P 11 9 3 2 5 3 Positif
9 Anak L 8 1 3 2 5 3 Positif
10 Tn. L 10 1 4 2 4 2 Positif
11 Ny. P 20 1 4 2 2 3 Positif
12 Tn. L 9 1 2 3 6 0 Negatif
13 Ny. P 10 3 3 3 7 1 Positif
14 Anak L 32 3 2 2 2 4 Positif
15 Ny. P 22 2 4 3 4 1 Positif
16 Tn. L 17 1 4 3 2 4 Positif
17 Ny. P 12 2 1 3 2 0 Negatif
18 Tn. L 16 3 7 6 6 0 Positif
19 Ny. P 7 2 6 2 5 3 Positif
20 Anak L 15 3 4 3 3 0 Positif
21 Tn. L 19 5 4 3 3 2 Positif
22 Ny. P 11 3 2 4 6 1 Positif
23 Ny. P 20 5 6 2 5 3 Positif
24 Tn. L 9 2 3 4 1 8 Negatif
25 Tn. L 10 1 4 5 2 5 Positif
26 Ny. P 21 2 2 3 2 2 Positif
27 Anak P 22 2 3 3 7 2 Positif
28 Ny. P 16 1 4 3 6 1 Positif
29 Anak L 6 2 2 3 1 4 Negatif
30 Ny. P 6 2 2 2 8 2 Positif
31 Tn. L 16 1 4 7 2 1 Positif
32 Tn. L 21 2 4 2 7 1 Positif
33 Ny. P 6 2 4 3 7 7 Positif
34 Ny. P 12 2 6 3 4 1 Positif
35 Anak P 5 0 3 3 2 0 Negatif
36 Ny. P 12 1 2 1 6 4 Positif
37 Ny. P 12 3 2 3 7 3 Positif
38 Ny. P 6 1 8 3 2 4 Positif
39 Ny. P 13 1 3 3 3 4 Negatif
40 Anak L 12 1 1 4 2 2 Positif
41 Ny. P 9 1 7 6 2 4 Positif
42 Anak P 19 2 2 3 5 1 Positif
43 Tn. L 10 1 6 2 6 2 Positif
44 Tn. L 15 2 1 2 2 3 Positif
45 Ny. P 15 3 3 3 2 1 Positif
46 Ny. P 21 1 5 3 1 3 Positif
47 Tn. L 13 3 6 2 0 3 Positif
48 Tn. L 12 1 7 4 3 2 Positif
49 Anak P 13 1 3 6 3 4 Positif
50 Tn. L 13 1 4 2 2 2 Positif
51 Anak P 6 3 5 2 1 0 Negatif
52 Tn. L 13 1 4 2 4 2 Positif
53 Ny. P 5 1 4 1 4 4 Positif
54 Tn. L 20 1 4 3 2 1 Positif
55 Ny. P 9 2 2 3 6 5 Positif
56 Tn. L 19 1 2 3 1 1 Positif
57 Tn. L 6 3 2 2 2 4 Positif
58 Tn. L 13 1 5 3 4 1 Positif
59 Tn. L 22 2 4 1 2 2 Positif
60 Tn. L 13 1 2 1 7 1 Positif
61 Anak L 22 1 6 2 5 1 Positif
62 Ny. P 13 3 7 6 6 3 Positif
63 Ny. P 18 3 5 3 3 1 Positif
64 Tn. L 3 2 4 7 8 2 Negatif
65 Ny. P 10 3 2 7 7 1 Positif
66 Anak L 13 3 6 2 3 3 Positif
67 Anak L 11 2 5 7 7 2 Positif
68 Tn. L 12 3 5 2 2 1 Positif
69 Ny. P 21 5 2 6 2 1 Positif
70 Ny. P 19 2 4 3 1 5 Positif
71 Tn. L 18 2 3 3 4 1 Positif
72 Tn. L 10 1 4 5 3 4 Positif
73 Tn. L 18 2 4 2 3 1 Positif
74 Tn. L 15 2 3 7 2 2 Positif
75 Ny. P 10 1 1 3 0 0 Negatif
76 Tn. L 10 5 5 5 1 3 Positif
77 Anak P 16 4 6 5 1 1 Positif
78 Anak L 5 2 7 3 2 8 Positif
79 Anak L 10 3 2 4 6 1 Positif
80 Ny. P 15 3 5 4 1 1 Positif
81 Tn. L 7 1 1 4 7 5 Positif
82 Ny. P 12 1 1 5 2 1 Positif
83 Anak L 9 1 2 3 6 5 Positif
84 Tn. L 19 2 4 5 0 1 Positif
85 Tn. L 12 3 2 2 2 2 Positif
86 Anak L 15 1 4 4 4 1 Positif
87 Ny. P 16 1 5 2 2 1 Positif
88 Anak P 21 2 5 2 7 2 Positif
89 Tn. L 18 2 6 2 5 2 Positif
90 Tn. L 17 3 7 6 6 0 Positif
91 Ny. P 20 3 1 0 3 1 Positif
92 Tn. L 18 2 5 7 1 2 Positif
93 Anak L 12 2 5 4 1 1 Positif
94 Anak L 12 3 6 2 3 1 Positif
95 Tn. L 12 2 2 7 1 1 Positif
96 Ny. P 19 3 5 2 2 1 Positif
97 Anak L 11 2 2 6 2 1 Positif
98 Ny. P 11 1 3 3 1 1 Negatif
99 Anak L 10 2 3 3 0 0 Negatif
100 Ny. P 11 1 5 2 3 4 Positif
101 Tn. L 10 2 2 2 8 1 Positif
102 Ny. P 11 1 3 7 2 1 Positif
103 Tn. L 12 2 2 4 0 1 Positif
104 Ny. P 27 1 7 7 1 0 Positif
105 Anak L 16 1 6 4 4 1 Positif
106 Tn. L 12 2 7 4 2 1 Positif
107 Ny. P 17 3 2 5 6 1 Positif
108 Ny. P 10 3 2 5 0 1 Positif
109 Ny. P 22 3 8 2 2 4 Positif
110 Tn. L 19 2 5 7 1 1 Positif
111 Ny. P 19 3 5 2 2 1 Positif
112 Anak P 10 2 1 5 2 5 Positif
113 Anak L 15 1 3 2 0 3 Positif
114 Anak L 16 1 4 5 4 2 Positif
115 Ny. P 20 1 4 2 2 1 Positif
116 Tn. L 15 2 2 3 6 1 Positif
117 Tn. L 15 3 3 3 7 1 Positif
118 Ny. P 21 3 2 2 2 2 Positif
119 Ny. P 12 5 1 3 4 2 Positif
120 Anak P 6 5 1 7 2 1 Positif
121 Ny. P 13 2 2 3 2 0 Negatif
122 Ny. P 18 2 6 2 5 1 Positif
123 Ny. P 11 3 7 6 6 3 Positif
124 Ny. P 6 3 0 3 3 1 Positif
125 Tn. L 18 3 7 2 2 1 Positif
126 Ny. P 16 3 2 4 1 1 Positif
127 Anak P 11 3 2 2 3 1 Negatif
128 Tn. L 18 2 0 7 1 2 Positif
129 Ny. P 12 1 1 5 2 1 Positif
130 Ny. P 23 2 2 6 2 1 Positif
131 Ny. P 11 2 3 3 1 1 Negatif
132 Tn. L 16 1 3 3 0 1 Positif
133 Ny. P 15 2 5 0 3 2 Positif
134 Anak P 17 2 2 2 3 2 Positif
135 Tn. L 16 5 3 7 2 1 Positif
136 Anak P 11 2 0 5 0 1 Positif
137 Ny. P 10 2 1 2 0 2 Positif
138 Ny. P 10 1 6 4 4 1 Positif
139 Tn. L 10 2 7 5 2 2 Positif
140 Ny. P 10 3 2 4 6 1 Positif
141 Tn. L 11 3 2 3 7 1 Positif
142 Tn. L 22 3 8 4 2 4 Positif
143 Tn. L 9 3 3 3 3 1 Negatif
144 Tn. L 21 3 2 2 2 2 Positif
145 Anak P 10 2 0 4 2 4 Positif
146 Anak L 10 1 2 5 7 4 Positif
147 Ny. P 10 5 6 4 2 1 Positif
148 Ny. P 9 1 6 2 3 1 Negatif
149 Anak L 20 3 0 0 7 0 Positif
150 Ny. P 18 2 0 0 1 1 Positif
151 Anak L 9 3 7 2 2 4 Positif
152 Anak L 16 3 2 4 1 1 Positif
153 Ny. P 11 2 0 7 1 4 Positif
154 Ny. P 11 3 5 2 2 1 Positif
155 Ny. P 13 2 1 3 2 1 Negatif
156 Tn. L 23 2 2 6 2 1 Positif
157 Ny. P 16 2 3 3 0 0 Positif
158 Tn. L 20 1 0 1 3 4 Positif
159 Tn. L 15 2 5 4 3 2 Positif
160 Ny. P 4 2 2 2 3 1 Negatif
161 Anak P 12 2 0 4 0 1 Positif
162 Anak P 5 1 5 3 1 0 Negatif
163 Anak L 17 2 1 1 0 2 Positif
164 Anak L 16 1 6 4 4 1 Positif
165 Ny. P 18 3 2 1 6 1 Positif
166 Tn. L 16 3 2 1 0 1 Positif
167 Ny. P 11 3 2 3 7 1 Positif
168 Anak L 22 3 8 1 2 4 Positif
169 Tn. L 13 5 2 3 0 0 Negatif
170 Tn. L 12 2 2 3 7 1 Positif
171 Tn. L 22 3 8 1 2 4 Positif
172 Tn. L 15 3 3 3 7 1 Positif
173 Tn. L 11 1 0 5 4 4 Positif
174 Anak P 12 1 0 1 2 5 Positif
175 Anak L 7 2 2 4 7 4 Positif
176 Ny. P 17 2 6 4 2 1 Positif
177 Tn. L 17 3 7 3 3 1 Negatif
178 Anak L 11 3 0 0 3 1 Positif
179 Ny. P 18 2 0 7 1 1 Positif
180 Anak L 9 3 7 2 2 4 Positif
181 Tn. L 12 3 6 2 3 1 Positif
182 Ny. P 8 2 0 7 1 6 Positif
183 Ny. P 9 3 5 2 2 1 Negatif
184 Ny. P 13 2 1 3 2 1 Negatif
185 Tn. L 11 1 3 3 1 1 Positif
186 Ny. P 10 5 3 3 0 1 Positif
187 Tn. L 11 2 0 1 3 4 Positif
188 Tn. L 19 2 5 5 3 2 Positif
189 Ny. P 12 1 2 6 2 1 Positif
190 Anak L 15 1 3 2 0 3 Positif
191 Anak L 16 1 4 4 4 2 Positif
192 Tn. L 10 5 3 3 0 1 Negatif
193 Ny. P 15 2 5 4 3 1 Positif
194 Anak P 21 2 2 2 3 2 Positif
195 Tn. L 22 1 3 7 2 3 Positif
196 Anak P 21 2 0 1 0 1 Positif
197 Ny. P 17 2 1 2 0 2 Positif
198 Ny. P 13 1 6 3 3 1 Negatif
199 Tn. L 5 2 7 0 2 0 Negatif
1.3 Tabel Setelah Seleksi Data
No. Nam
a
Je
ni
s
K
el
a
m
in
Batuk
Penurun
an Berat
Badan
Nyeri
Dada
Sesak
Nafas
Berkeringat
Malam
Hari
Batuk
Darah
Tuberculo
sis (TBC)
1 Tn. L Bahaya Sedang Normal Sedang Bahaya Bahaya Positif
2 Ny. P Bahaya Sedang Bahaya Bahaya Sedang Sedang Positif
3 Anak P Bahaya Normal Bahaya Bahaya Sedang Normal Positif
4 Ny. P Sedang Sedang Sedang Bahaya Bahaya Sedang Positif
5 Tn. L Normal Sedang Sedang Sedang Sedang Normal Negatif
6 Ny. P Sedang Sedang Sedang Bahaya Bahaya Bahaya Positif
7 Tn. L Sedang Normal Sedang Bahaya Sedang Bahaya Positif
8 Ny. P Sedang Bahaya Sedang Sedang Bahaya Bahaya Positif
9 Anak L Sedang Normal Sedang Sedang Bahaya Bahaya Positif
10 Tn. L Sedang Normal Bahaya Sedang Bahaya Bahaya Positif
11 Ny. P Bahaya Normal Bahaya Sedang Sedang Bahaya Positif
12 Tn. L Sedang Normal Sedang Sedang Bahaya Normal Negatif
13 Ny. P Sedang Sedang Sedang Sedang Bahaya Sedang Positif
14 Anak L Bahaya Sedang Sedang Sedang Sedang Bahaya Positif
15 Ny. P Bahaya Sedang Bahaya Sedang Bahaya Sedang Positif
16 Tn. L Bahaya Normal Bahaya Sedang Sedang Bahaya Positif
17 Ny. P Sedang Sedang Normal Sedang Sedang Normal Negatif
18 Tn. L Bahaya Sedang Bahaya Bahaya Bahaya Normal Positif
19 Ny. P Sedang Sedang Bahaya Sedang Bahaya Bahaya Positif
20 Anak L Bahaya Sedang Bahaya Sedang Sedang Normal Positif
21 Tn. L Bahaya Bahaya Bahaya Sedang Sedang Bahaya Positif
22 Ny. P Sedang Sedang Sedang Bahaya Bahaya Sedang Positif
23 Ny. P Bahaya Bahaya Bahaya Sedang Bahaya Bahaya Positif
24 Tn. L Sedang Sedang Sedang Bahaya Normal Bahaya Negatif
25 Tn. L Sedang Normal Bahaya Bahaya Sedang Bahaya Positif
26 Ny. P Bahaya Sedang Sedang Sedang Sedang Bahaya Positif
27 Anak P Bahaya Sedang Sedang Sedang Bahaya Bahaya Positif
28 Ny. P Bahaya Normal Bahaya Sedang Bahaya Sedang Positif
29 Anak L Normal Sedang Sedang Sedang Normal Bahaya Negatif
30 Ny. P Normal Sedang Sedang Sedang Bahaya Bahaya Positif
31 Tn. L Bahaya Normal Bahaya Bahaya Sedang Sedang Positif
32 Tn. L Bahaya Sedang Bahaya Sedang Bahaya Sedang Positif
33 Ny. P Normal Sedang Bahaya Sedang Bahaya Bahaya Positif
34 Ny. P Sedang Sedang Bahaya Sedang Bahaya Sedang Positif
35 Anak P Normal Normal Sedang Sedang Sedang Normal Negatif
36 Ny. P Sedang Normal Sedang Normal Bahaya Bahaya Positif
37 Ny. P Sedang Sedang Sedang Sedang Bahaya Bahaya Positif
38 Ny. P Normal Normal Bahaya Sedang Sedang Bahaya Positif
39 Ny. P Sedang Normal Sedang Sedang Sedang Bahaya Negatif
40 Anak L Sedang Normal Normal Bahaya Sedang Bahaya Positif
41 Ny. P Sedang Normal Bahaya Bahaya Sedang Bahaya Positif
42 Anak P Bahaya Sedang Sedang Sedang Bahaya Sedang Positif
43 Tn. L Sedang Normal Bahaya Sedang Bahaya Bahaya Positif
44 Ny. P Sedang Sedang Bahaya Sedang Sedang Bahaya Positif
45 Ny. P Bahaya Sedang Sedang Sedang Sedang Sedang Positif
46 Ny. P Bahaya Normal Bahaya Sedang Normal Bahaya Positif
47 Tn. L Sedang Sedang Bahaya Sedang Normal Bahaya Positif
48 Tn. L Sedang Normal Bahaya Bahaya Sedang Bahaya Positif
49 Anak P Sedang Normal Sedang Bahaya Sedang Bahaya Positif
50 Tn. L Sedang Normal Bahaya Sedang Sedang Bahaya Positif
51 Anak P Normal Sedang Bahaya Sedang Normal Normal Negatif
52 Tn. L Sedang Normal Bahaya Sedang Bahaya Bahaya Positif
53 Ny. P Normal Normal Bahaya Normal Bahaya Bahaya Positif
54 Tn. L Bahaya Normal Bahaya Sedang Sedang Sedang Positif
55 Ny. P Sedang Sedang Sedang Sedang Bahaya Bahaya Positif
56 Tn. L Bahaya Normal Sedang Sedang Normal Sedang Positif
57 Tn. L Normal Sedang Sedang Sedang Sedang Bahaya Positif
58 Tn. L Sedang Normal Bahaya Sedang Bahaya Sedang Positif
59 Tn. L Bahaya Sedang Bahaya Normal Sedang Bahaya Positif
60 Tn. L Sedang Normal Sedang Normal Bahaya Sedang Positif
61 Anak L Bahaya Normal Bahaya Sedang Bahaya Sedang Positif
62 Ny. P Sedang Sedang Bahaya Bahaya Bahaya Bahaya Positif
63 Ny. P Bahaya Sedang Bahaya Sedang Sedang Sedang Positif
64 Tn. L Normal Sedang Bahaya Bahaya Bahaya Bahaya Negatif
65 Ny. P Sedang Sedang Sedang Bahaya Bahaya Sedang Positif
66 Anak L Sedang Sedang Bahaya Sedang Sedang Bahaya Positif
67 Anak L Sedang Sedang Bahaya Bahaya Bahaya Bahaya Positif
68 Tn. L Sedang Sedang Bahaya Sedang Sedang Sedang Positif
69 Ny. P Bahaya Bahaya Sedang Bahaya Sedang Sedang Positif
70 Ny. P Bahaya Sedang Bahaya Sedang Normal Bahaya Positif
71 Tn. L Bahaya Sedang Sedang Sedang Bahaya Sedang Positif
72 Tn. L Sedang Normal Bahaya Bahaya Sedang Bahaya Positif
73 Tn. L Bahaya Sedang Bahaya Sedang Sedang Sedang Positif
74 Tn. L Bahaya Sedang Sedang Bahaya Sedang Bahaya Positif
75 Ny. P Sedang Normal Normal Sedang Normal Normal Negatif
76 Tn. L Sedang Bahaya Bahaya Bahaya Normal Bahaya Positif
77 Anak P Bahaya Sedang Bahaya Bahaya Normal Sedang Positif
78 Anak L Normal Sedang Bahaya Sedang Sedang Bahaya Positif
79 Anak L Sedang Sedang Sedang Bahaya Bahaya Sedang Positif
80 Ny. P Bahaya Sedang Bahaya Bahaya Normal Sedang Positif
81 Tn. L Sedang Normal Normal Bahaya Bahaya Bahaya Positif
82 Ny. P Sedang Normal Normal Bahaya Sedang Sedang Positif
83 Anak L Sedang Normal Sedang Sedang Bahaya Bahaya Positif
84 Tn. L Bahaya Sedang Bahaya Bahaya Normal Sedang Positif
85 Tn. L Sedang Sedang Sedang Sedang Sedang Bahaya Positif
86 Anak L Bahaya Normal Bahaya Bahaya Bahaya Sedang Positif
87 Ny. P Bahaya Normal Bahaya Sedang Sedang Sedang Positif
88 Anak P Bahaya Sedang Bahaya Sedang Bahaya Bahaya Positif
89 Tn. L Bahaya Sedang Bahaya Sedang Bahaya Bahaya Positif
90 Tn. L Bahaya Sedang Bahaya Bahaya Bahaya Normal Positif
91 Ny. P Bahaya Sedang Normal Normal Sedang Sedang Positif
92 Tn. L Bahaya Sedang Bahaya Bahaya Normal Bahaya Positif
93 Anak L Sedang Sedang Bahaya Bahaya Normal Sedang Positif
94 Anak L Sedang Sedang Bahaya Sedang Sedang Sedang Positif
95 Tn. L Sedang Sedang Sedang Bahaya Normal Sedang Positif
96 Ny. P Bahaya Sedang Bahaya Sedang Sedang Sedang Positif
97 Anak L Sedang Sedang Sedang Bahaya Sedang Sedang Positif
98 Ny. P Sedang Normal Sedang Sedang Normal Sedang Negatif
99 Anak L Sedang Sedang Sedang Sedang Normal Normal Negatif
100 Ny. P Sedang Normal Bahaya Sedang Sedang Bahaya Positif
101 Tn. L Sedang Sedang Sedang Sedang Bahaya Sedang Positif
102 Ny. P Sedang Normal Sedang Bahaya Sedang Sedang Positif
103 Tn. L Sedang Sedang Sedang Bahaya Normal Sedang Positif
104 Ny. P Bahaya Normal Bahaya Bahaya Normal Normal Positif
105 Anak L Bahaya Normal Bahaya Bahaya Bahaya Sedang Positif
106 Tn. L Sedang Sedang Bahaya Bahaya Sedang Sedang Positif
107 Ny. P Bahaya Sedang Sedang Bahaya Bahaya Sedang Positif
108 Ny. P Sedang Sedang Sedang Bahaya Normal Sedang Positif
109 Ny. P Bahaya Sedang Bahaya Sedang Sedang Bahaya Positif
110 Tn. L Bahaya Sedang Bahaya Bahaya Normal Sedang Positif
111 Ny. P Bahaya Sedang Bahaya Sedang Sedang Sedang Positif
112 Anak P Sedang Sedang Normal Bahaya Sedang Bahaya Positif
113 Anak L Bahaya Normal Sedang Sedang Normal Bahaya Positif
114 Anak L Bahaya Normal Bahaya Bahaya Bahaya Bahaya Positif
115 Ny. P Bahaya Normal Bahaya Sedang Sedang Sedang Positif
116 Tn. L Bahaya Sedang Sedang Sedang Bahaya Sedang Positif
117 Tn. L Bahaya Sedang Sedang Sedang Bahaya Sedang Positif
118 Ny. P Bahaya Sedang Sedang Sedang Sedang Bahaya Positif
119 Ny. P Sedang Bahaya Normal Sedang Bahaya Bahaya Positif
120 Anak P Normal Bahaya Normal Bahaya Sedang Sedang Positif
121 Ny. P Sedang Sedang Sedang Sedang Sedang Normal Negatif
122 Ny. P Bahaya Sedang Bahaya Sedang Bahaya Sedang Positif
123 Ny. P Sedang Sedang Bahaya Bahaya Bahaya Bahaya Positif
124 Ny. P Normal Sedang Normal Sedang Sedang Sedang Positif
125 Tn. L Bahaya Sedang Bahaya Sedang Sedang Sedang Positif
126 Ny. P Bahaya Sedang Sedang Bahaya Normal Sedang Positif
127 Anak P Sedang Sedang Sedang Sedang Sedang Sedang Negatif
128 Tn. L Bahaya Sedang Normal Bahaya Normal Bahaya Positif
129 Ny. P Sedang Normal Normal Bahaya Sedang Sedang Positif
130 Ny. P Bahaya Sedang Sedang Bahaya Sedang Sedang Positif
131 Ny. P Sedang Sedang Sedang Sedang Normal Sedang Negatif
132 Tn. L Bahaya Normal Sedang Sedang Normal Sedang Positif
133 Ny. P Bahaya Sedang Bahaya Normal Sedang Bahaya Positif
134 Anak P Bahaya Sedang Sedang Sedang Sedang Bahaya Positif
135 Tn. L Bahaya Bahaya Sedang Bahaya Sedang Sedang Positif
136 Anak P Sedang Sedang Normal Bahaya Normal Sedang Positif
137 Ny. P Sedang Sedang Normal Sedang Normal Bahaya Positif
138 Ny. P Sedang Normal Bahaya Bahaya Bahaya Sedang Positif
139 Tn. L Sedang Sedang Bahaya Bahaya Sedang Bahaya Positif
140 Ny. P Sedang Sedang Sedang Bahaya Bahaya Sedang Positif
141 Tn. L Sedang Sedang Sedang Sedang Bahaya Sedang Positif
142 Tn. L Bahaya Sedang Bahaya Bahaya Sedang Bahaya Positif
143 Tn. L Sedang Sedang Sedang Sedang Sedang Sedang Negatif
144 Tn. L Bahaya Sedang Sedang Sedang Sedang Bahaya Positif
145 Anak P Sedang Sedang Normal Bahaya Sedang Bahaya Positif
146 Anak L Sedang Normal Sedang Bahaya Bahaya Bahaya Positif
147 Ny. P Sedang Bahaya Bahaya Bahaya Sedang Sedang Positif
148 Ny. P Sedang Normal Bahaya Sedang Sedang Sedang Negatif
149 Anak L Bahaya Sedang Normal Normal Bahaya Normal Positif
150 Ny. P Bahaya Sedang Normal Normal Normal Sedang Positif
151 Anak L Sedang Sedang Bahaya Sedang Sedang Bahaya Positif
152 Anak L Bahaya Sedang Sedang Bahaya Normal Sedang Positif
153 Ny. P Sedang Sedang Normal Bahaya Normal Bahaya Positif
154 Ny. P Sedang Sedang Bahaya Sedang Sedang Sedang Positif
155 Ny. P Sedang Sedang Normal Sedang Sedang Sedang Negatif
156 Tn. L Bahaya Sedang Sedang Bahaya Sedang Sedang Positif
157 Ny. P Bahaya Sedang Sedang Sedang Normal Normal Positif
158 Tn. L Bahaya Normal Normal Normal Sedang Bahaya Positif
159 Tn. L Bahaya Sedang Bahaya Bahaya Sedang Bahaya Positif
160 Ny. P Normal Sedang Sedang Sedang Sedang Sedang Negatif
161 Anak P Sedang Sedang Normal Bahaya Normal Sedang Positif
162 Anak P Normal Normal Bahaya Sedang Normal Normal Negatif
163 Anak L Bahaya Sedang Normal Normal Normal Bahaya Positif
164 Anak L Bahaya Normal Bahaya Bahaya Bahaya Sedang Positif
165 Ny. P Bahaya Sedang Sedang Normal Bahaya Sedang Positif
166 Tn. L Bahaya Sedang Sedang Normal Normal Sedang Positif
167 Ny. P Sedang Sedang Sedang Sedang Bahaya Sedang Positif
168 Anak L Bahaya Sedang Bahaya Normal Sedang Bahaya Positif
169 Tn. L Sedang Bahaya Sedang Sedang Normal Normal Negatif
170 Tn. L Sedang Sedang Sedang Sedang Bahaya Sedang Positif
171 Tn. L Bahaya Sedang Bahaya Normal Sedang Bahaya Positif
172 Tn. L Bahaya Sedang Sedang Sedang Bahaya Sedang Positif
173 Tn. L Sedang Normal Normal Bahaya Bahaya Bahaya Positif
174 Anak P Sedang Normal Normal Normal Sedang Bahaya Positif
175 Anak L Sedang Sedang Sedang Bahaya Bahaya Bahaya Positif
176 Ny. P Bahaya Sedang Bahaya Bahaya Sedang Sedang Positif
177 Tn. L Bahaya Sedang Bahaya Sedang Sedang Sedang Negatif
178 Anak L Sedang Sedang Normal Normal Sedang Sedang Positif
179 Ny. P Bahaya Sedang Normal Bahaya Normal Sedang Positif
180 Anak L Sedang Sedang Bahaya Sedang Sedang Bahaya Positif
181 Tn. L Sedang Sedang Bahaya Sedang Sedang Sedang Positif
182 Ny. P Sedang Sedang Normal Bahaya Normal Bahaya Positif
183 Ny. P Sedang Sedang Bahaya Sedang Sedang Sedang Negatif
184 Ny. P Sedang Sedang Normal Sedang Sedang Sedang Negatif
185 Tn. L Sedang Normal Sedang Sedang Normal Sedang Positif
186 Ny. P Sedang Bahaya Sedang Sedang Normal Sedang Positif
187 Tn. L Sedang Sedang Normal Normal Sedang Bahaya Positif
188 Tn. L Bahaya Sedang Bahaya Bahaya Sedang Bahaya Positif
189 Ny. P Sedang Normal Sedang Bahaya Sedang Sedang Positif
190 Anak L Bahaya Normal Sedang Sedang Normal Bahaya Positif
191 Anak L Bahaya Normal Bahaya Bahaya Bahaya Bahaya Positif
192 Ny. P Sedang Bahaya Sedang Sedang Normal Sedang Negatif
193 Tn. L Bahaya Sedang Bahaya Bahaya Sedang Sedang Positif
194 Tn. L Bahaya Sedang Sedang Sedang Sedang Bahaya Positif
195 Ny. P Bahaya Normal Sedang Bahaya Sedang Bahaya Positif
196 Ny. P Bahaya Sedang Normal Normal Normal Sedang Positif
197 Ny. P Bahaya Sedang Normal Sedang Normal Bahaya Positif
198 Ny. P Sedang Normal Bahaya Sedang Sedang Sedang Negatif
199 Ny. P Normal Sedang Bahaya Normal Sedang Normal Negatif
1.4 Tabel Data Training
No. Nam
a
Jenis
Kela
min
Batuk
Penurun
an Berat
Badan
Nyeri
Dada
Sesak
Nafas
Berkerin
gat
Malam
Hari
Batuk
Darah
Tubercul
osis
(TBC)
1 Tn. L Bahaya Sedang Normal Sedang Bahaya Bahaya Positif
2 Ny. P Bahaya Sedang Bahaya Bahaya Sedang Sedang Positif
3 Anak P Bahaya Normal Bahaya Bahaya Sedang Normal Positif
4 Ny. P Sedang Sedang Sedang Bahaya Bahaya Sedang Positif
5 Tn. L Normal Sedang Sedang Sedang Sedang Normal Negatif
6 Ny. P Sedang Sedang Sedang Bahaya Bahaya Bahaya Positif
7 Tn. L Sedang Normal Sedang Bahaya Sedang Bahaya Positif
8 Ny. P Sedang Bahaya Sedang Sedang Bahaya Bahaya Positif
9 Anak L Sedang Normal Sedang Sedang Bahaya Bahaya Positif
10 Tn. L Sedang Normal Bahaya Sedang Bahaya Bahaya Positif
11 Ny. P Bahaya Normal Bahaya Sedang Sedang Bahaya Positif
12 Tn. L Sedang Normal Sedang Sedang Bahaya Normal Negatif
13 Ny. P Sedang Sedang Sedang Sedang Bahaya Sedang Positif
14 Anak L Bahaya Sedang Sedang Sedang Sedang Bahaya Positif
15 Ny. P Bahaya Sedang Bahaya Sedang Bahaya Sedang Positif
16 Tn. L Bahaya Normal Bahaya Sedang Sedang Bahaya Positif
17 Ny. P Sedang Sedang Normal Sedang Sedang Normal Negatif
18 Tn. L Bahaya Sedang Bahaya Bahaya Bahaya Normal Positif
19 Ny. P Sedang Sedang Bahaya Sedang Bahaya Bahaya Positif
20 Anak L Bahaya Sedang Bahaya Sedang Sedang Normal Positif
21 Tn. L Bahaya Bahaya Bahaya Sedang Sedang Bahaya Positif
22 Ny. P Sedang Sedang Sedang Bahaya Bahaya Sedang Positif
23 Ny. P Bahaya Bahaya Bahaya Sedang Bahaya Bahaya Positif
24 Tn. L Sedang Sedang Sedang Bahaya Normal Bahaya Negatif
25 Tn. L Sedang Normal Bahaya Bahaya Sedang Bahaya Positif
26 Ny. P Bahaya Sedang Sedang Sedang Sedang Bahaya Positif
27 Anak P Bahaya Sedang Sedang Sedang Bahaya Bahaya Positif
28 Ny. P Bahaya Normal Bahaya Sedang Bahaya Sedang Positif
29 Anak L Normal Sedang Sedang Sedang Normal Bahaya Negatif
30 Ny. P Normal Sedang Sedang Sedang Bahaya Bahaya Positif
31 Tn. L Bahaya Normal Bahaya Bahaya Sedang Sedang Positif
32 Tn. L Bahaya Sedang Bahaya Sedang Bahaya Sedang Positif
33 Ny. P Normal Sedang Bahaya Sedang Bahaya Bahaya Positif
34 Ny. P Sedang Sedang Bahaya Sedang Bahaya Sedang Positif
35 Anak P Normal Normal Sedang Sedang Sedang Normal Negatif
36 Ny. P Sedang Normal Sedang Normal Bahaya Bahaya Positif
37 Ny. P Sedang Sedang Sedang Sedang Bahaya Bahaya Positif
38 Ny. P Normal Normal Bahaya Sedang Sedang Bahaya Positif
39 Ny. P Sedang Normal Sedang Sedang Sedang Bahaya Negatif
40 Anak L Sedang Normal Normal Bahaya Sedang Bahaya Positif
41 Ny. P Sedang Normal Bahaya Bahaya Sedang Bahaya Positif
42 Anak P Bahaya Sedang Sedang Sedang Bahaya Sedang Positif
43 Tn. L Sedang Normal Bahaya Sedang Bahaya Bahaya Positif
44 Ny. P Sedang Sedang Bahaya Sedang Sedang Bahaya Positif
45 Ny. P Bahaya Sedang Sedang Sedang Sedang Sedang Positif
46 Ny. P Bahaya Normal Bahaya Sedang Normal Bahaya Positif
47 Tn. L Sedang Sedang Bahaya Sedang Normal Bahaya Positif
48 Tn. L Sedang Normal Bahaya Bahaya Sedang Bahaya Positif
49 Anak P Sedang Normal Sedang Bahaya Sedang Bahaya Positif
50 Tn. L Sedang Normal Bahaya Sedang Sedang Bahaya Positif
51 Anak P Normal Sedang Bahaya Sedang Normal Normal Negatif
52 Tn. L Sedang Normal Bahaya Sedang Bahaya Bahaya Positif
53 Ny. P Normal Normal Bahaya Normal Bahaya Bahaya Positif
54 Tn. L Bahaya Normal Bahaya Sedang Sedang Sedang Positif
55 Ny. P Sedang Sedang Sedang Sedang Bahaya Bahaya Positif
56 Tn. L Bahaya Normal Sedang Sedang Normal Sedang Positif
57 Tn. L Normal Sedang Sedang Sedang Sedang Bahaya Positif
58 Tn. L Sedang Normal Bahaya Sedang Bahaya Sedang Positif
59 Tn. L Bahaya Sedang Bahaya Normal Sedang Bahaya Positif
60 Tn. L Sedang Normal Sedang Normal Bahaya Sedang Positif
61 Anak L Bahaya Normal Bahaya Sedang Bahaya Sedang Positif
62 Ny. P Sedang Sedang Bahaya Bahaya Bahaya Bahaya Positif
63 Ny. P Bahaya Sedang Bahaya Sedang Sedang Sedang Positif
64 Tn. L Normal Sedang Bahaya Bahaya Bahaya Bahaya Negatif
65 Ny. P Sedang Sedang Sedang Bahaya Bahaya Sedang Positif
66 Anak L Sedang Sedang Bahaya Sedang Sedang Bahaya Positif
67 Anak L Sedang Sedang Bahaya Bahaya Bahaya Bahaya Positif
68 Tn. L Sedang Sedang Bahaya Sedang Sedang Sedang Positif
69 Ny. P Bahaya Bahaya Sedang Bahaya Sedang Sedang Positif
70 Ny. P Bahaya Sedang Bahaya Sedang Normal Bahaya Positif
71 Tn. L Bahaya Sedang Sedang Sedang Bahaya Sedang Positif
72 Tn. L Sedang Normal Bahaya Bahaya Sedang Bahaya Positif
73 Tn. L Bahaya Sedang Bahaya Sedang Sedang Sedang Positif
74 Tn. L Bahaya Sedang Sedang Bahaya Sedang Bahaya Positif
75 Ny. P Sedang Normal Normal Sedang Normal Normal Negatif
76 Tn. L Sedang Bahaya Bahaya Bahaya Normal Bahaya Positif
77 Anak P Bahaya Sedang Bahaya Bahaya Normal Sedang Positif
78 Anak L Normal Sedang Bahaya Sedang Sedang Bahaya Positif
79 Anak L Sedang Sedang Sedang Bahaya Bahaya Sedang Positif
80 Ny. P Bahaya Sedang Bahaya Bahaya Normal Sedang Positif
81 Tn. L Sedang Normal Normal Bahaya Bahaya Bahaya Positif
82 Ny. P Sedang Normal Normal Bahaya Sedang Sedang Positif
83 Anak L Sedang Normal Sedang Sedang Bahaya Bahaya Positif
84 Tn. L Bahaya Sedang Bahaya Bahaya Normal Sedang Positif
85 Tn. L Sedang Sedang Sedang Sedang Sedang Bahaya Positif
86 Anak L Bahaya Normal Bahaya Bahaya Bahaya Sedang Positif
87 Ny. P Bahaya Normal Bahaya Sedang Sedang Sedang Positif
88 Anak P Bahaya Sedang Bahaya Sedang Bahaya Bahaya Positif
89 Tn. L Bahaya Sedang Bahaya Sedang Bahaya Bahaya Positif
90 Tn. L Bahaya Sedang Bahaya Bahaya Bahaya Normal Positif
91 Ny. P Bahaya Sedang Normal Normal Sedang Sedang Positif
92 Tn. L Bahaya Sedang Bahaya Bahaya Normal Bahaya Positif
93 Anak L Sedang Sedang Bahaya Bahaya Normal Sedang Positif
94 Anak L Sedang Sedang Bahaya Sedang Sedang Sedang Positif
95 Tn. L Sedang Sedang Sedang Bahaya Normal Sedang Positif
96 Ny. P Bahaya Sedang Bahaya Sedang Sedang Sedang Positif
97 Anak L Sedang Sedang Sedang Bahaya Sedang Sedang Positif
98 Ny. P Sedang Normal Sedang Sedang Normal Sedang Negatif
99 Anak L Sedang Sedang Sedang Sedang Normal Normal Negatif
100 Ny. P Sedang Normal Bahaya Sedang Sedang Bahaya Positif
101 Tn. L Sedang Sedang Sedang Sedang Bahaya Sedang Positif
102 Ny. P Sedang Normal Sedang Bahaya Sedang Sedang Positif
103 Tn. L Sedang Sedang Sedang Bahaya Normal Sedang Positif
104 Ny. P Bahaya Normal Bahaya Bahaya Normal Normal Positif
105 Anak L Bahaya Normal Bahaya Bahaya Bahaya Sedang Positif
106 Tn. L Sedang Sedang Bahaya Bahaya Sedang Sedang Positif
107 Ny. P Bahaya Sedang Sedang Bahaya Bahaya Sedang Positif
108 Ny. P Sedang Sedang Sedang Bahaya Normal Sedang Positif
109 Ny. P Bahaya Sedang Bahaya Sedang Sedang Bahaya Positif
110 Tn. L Bahaya Sedang Bahaya Bahaya Normal Sedang Positif
111 Ny. P Bahaya Sedang Bahaya Sedang Sedang Sedang Positif
112 Anak P Sedang Sedang Normal Bahaya Sedang Bahaya Positif
113 Anak L Bahaya Normal Sedang Sedang Normal Bahaya Positif
114 Anak L Bahaya Normal Bahaya Bahaya Bahaya Bahaya Positif
115 Ny. P Bahaya Normal Bahaya Sedang Sedang Sedang Positif
116 Tn. L Bahaya Sedang Sedang Sedang Bahaya Sedang Positif
117 Tn. L Bahaya Sedang Sedang Sedang Bahaya Sedang Positif
118 Ny. P Bahaya Sedang Sedang Sedang Sedang Bahaya Positif
119 Ny. P Sedang Bahaya Normal Sedang Bahaya Bahaya Positif
120 Anak P Normal Bahaya Normal Bahaya Sedang Sedang Positif
121 Ny. P Sedang Sedang Sedang Sedang Sedang Normal Negatif
122 Ny. P Bahaya Sedang Bahaya Sedang Bahaya Sedang Positif
123 Ny. P Sedang Sedang Bahaya Bahaya Bahaya Bahaya Positif
124 Ny. P Normal Sedang Normal Sedang Sedang Sedang Positif
125 Tn. L Bahaya Sedang Bahaya Sedang Sedang Sedang Positif
126 Ny. P Bahaya Sedang Sedang Bahaya Normal Sedang Positif
127 Anak P Sedang Sedang Sedang Sedang Sedang Sedang Negatif
128 Tn. L Bahaya Sedang Normal Bahaya Normal Bahaya Positif
129 Ny. P Sedang Normal Normal Bahaya Sedang Sedang Positif
130 Ny. P Bahaya Sedang Sedang Bahaya Sedang Sedang Positif
131 Ny. P Sedang Sedang Sedang Sedang Normal Sedang Negatif
132 Tn. L Bahaya Normal Sedang Sedang Normal Sedang Positif
133 Ny. P Bahaya Sedang Bahaya Normal Sedang Bahaya Positif
134 Anak P Bahaya Sedang Sedang Sedang Sedang Bahaya Positif
135 Tn. L Bahaya Bahaya Sedang Bahaya Sedang Sedang Positif
136 Anak P Sedang Sedang Normal Bahaya Normal Sedang Positif
137 Ny. P Sedang Sedang Normal Sedang Normal Bahaya Positif
138 Ny. P Sedang Normal Bahaya Bahaya Bahaya Sedang Positif
139 Tn. L Sedang Sedang Bahaya Bahaya Sedang Bahaya Positif
140 Ny. P Sedang Sedang Sedang Bahaya Bahaya Sedang Positif
141 Tn. L Sedang Sedang Sedang Sedang Bahaya Sedang Positif
142 Tn. L Bahaya Sedang Bahaya Bahaya Sedang Bahaya Positif
143 Tn. L Sedang Sedang Sedang Sedang Sedang Sedang Negatif
144 Tn. L Bahaya Sedang Sedang Sedang Sedang Bahaya Positif
145 Anak P Sedang Sedang Normal Bahaya Sedang Bahaya Positif
146 Anak L Sedang Normal Sedang Bahaya Bahaya Bahaya Positif
147 Ny. P Sedang Bahaya Bahaya Bahaya Sedang Sedang Positif
148 Ny. P Sedang Normal Bahaya Sedang Sedang Sedang Negatif
149 Anak L Bahaya Sedang Normal Normal Bahaya Normal Positif
150 Ny. P Bahaya Sedang Normal Normal Normal Sedang Positif
151 Anak L Sedang Sedang Bahaya Sedang Sedang Bahaya Positif
152 Anak L Bahaya Sedang Sedang Bahaya Normal Sedang Positif
153 Ny. P Sedang Sedang Normal Bahaya Normal Bahaya Positif
154 Ny. P Sedang Sedang Bahaya Sedang Sedang Sedang Positif
155 Ny. P Sedang Sedang Normal Sedang Sedang Sedang Negatif
156 Tn. L Bahaya Sedang Sedang Bahaya Sedang Sedang Positif
157 Ny. P Bahaya Sedang Sedang Sedang Normal Normal Positif
158 Tn. L Bahaya Normal Normal Normal Sedang Bahaya Positif
159 Tn. L Bahaya Sedang Bahaya Bahaya Sedang Bahaya Positif
160 Ny. P Normal Sedang Sedang Sedang Sedang Sedang Negatif
161 Anak P Sedang Sedang Normal Bahaya Normal Sedang Positif
162 Anak P Normal Normal Bahaya Sedang Normal Normal Negatif
163 Anak L Bahaya Sedang Normal Normal Normal Bahaya Positif
164 Anak L Bahaya Normal Bahaya Bahaya Bahaya Sedang Positif
165 Ny. P Bahaya Sedang Sedang Normal Bahaya Sedang Positif
166 Tn. L Bahaya Sedang Sedang Normal Normal Sedang Positif
167 Ny. P Sedang Sedang Sedang Sedang Bahaya Sedang Positif
168 Anak L Bahaya Sedang Bahaya Normal Sedang Bahaya Positif
169 Tn. L Sedang Bahaya Sedang Sedang Normal Normal Negatif
170 Tn. L Sedang Sedang Sedang Sedang Bahaya Sedang Positif
171 Tn. L Bahaya Sedang Bahaya Normal Sedang Bahaya Positif
172 Tn. L Bahaya Sedang Sedang Sedang Bahaya Sedang Positif
173 Tn. L Sedang Normal Normal Bahaya Bahaya Bahaya Positif
174 Anak P Sedang Normal Normal Normal Sedang Bahaya Positif
175 Anak L Sedang Sedang Sedang Bahaya Bahaya Bahaya Positif
176 Ny. P Bahaya Sedang Bahaya Bahaya Sedang Sedang Positif
177 Tn. L Bahaya Sedang Bahaya Sedang Sedang Sedang Negatif
178 Anak L Sedang Sedang Normal Normal Sedang Sedang Positif
179 Ny. P Bahaya Sedang Normal Bahaya Normal Sedang Positif
180 Anak L Sedang Sedang Bahaya Sedang Sedang Bahaya Positif
181 Tn. L Sedang Sedang Bahaya Sedang Sedang Sedang Positif
182 Ny. P Sedang Sedang Normal Bahaya Normal Bahaya Positif
183 Ny. P Sedang Sedang Bahaya Sedang Sedang Sedang Negatif
184 Ny. P Sedang Sedang Normal Sedang Sedang Sedang Negatif
185 Tn. L Sedang Normal Sedang Sedang Normal Sedang Positif
186 Ny. P Sedang Bahaya Sedang Sedang Normal Sedang Positif
187 Tn. L Sedang Sedang Normal Normal Sedang Bahaya Positif
188 Tn. L Bahaya Sedang Bahaya Bahaya Sedang Bahaya Positif
189 Ny. P Sedang Normal Sedang Bahaya Sedang Sedang Positif
190 Anak L Bahaya Normal Sedang Sedang Normal Bahaya Positif
191 Anak L Bahaya Normal Bahaya Bahaya Bahaya Bahaya Positif
192 Ny. P Sedang Bahaya Sedang Sedang Normal Sedang Negatif
193 Tn. L Bahaya Sedang Bahaya Bahaya Sedang Sedang Positif
194 Tn. L Bahaya Sedang Sedang Sedang Sedang Bahaya Positif
195 Ny. P Bahaya Normal Sedang Bahaya Sedang Bahaya Positif
196 Ny. P Bahaya Sedang Normal Normal Normal Sedang Positif
197 Ny. P Bahaya Sedang Normal Sedang Normal Bahaya Positif
198 Ny. P Sedang Normal Bahaya Sedang Sedang Sedang Negatif
199 Ny. P Normal Sedang Bahaya Normal Sedang Normal Negatif
1.4 Tabel Data Testing
No. Nama
Je
ni
s
K
el
a
m
in
Batuk
Penurun
an Berat
Badan
Nyeri
Dada
Sesak
Nafas
Berkerin
gat
Malam
Hari
Batuk
Darah
Tuberculo
sis (TBC)
1 Tn. L Bahaya Sedang Normal Sedang Bahaya Bahaya Positif
2 Ny. P Sedang Sedang Sedang Bahaya Bahaya Bahaya Positif
3 Ny. P Bahaya Normal Bahaya Sedang Sedang Bahaya Positif
4 Tn. L Bahaya Normal Bahaya Sedang Sedang Bahaya Positif
5 Tn. L Bahaya Bahaya Bahaya Sedang Sedang Bahaya Positif
6 Ny. P Bahaya Sedang Sedang Sedang Sedang Bahaya Positif
7 Tn. L Bahaya Normal Bahaya Bahaya Sedang Sedang Positif
8 Ny. P Sedang Normal Sedang Normal Bahaya Bahaya Positif
9 Ny. P Sedang Normal Bahaya Bahaya Sedang Bahaya Positif
10 Ny. P Bahaya Normal Bahaya Sedang Normal Bahaya Positif
11 Anak P Normal Sedang Bahaya Sedang Normal Normal Negatif
12 Tn. L Bahaya Normal Sedang Sedang Normal Sedang Positif
13 Anak L Bahaya Normal Bahaya Sedang Bahaya Sedang Positif
14 Anak L Sedang Sedang Bahaya Sedang Sedang Bahaya Positif
15 Tn. L Bahaya Sedang Sedang Sedang Bahaya Sedang Positif
16 Tn. L Sedang Bahaya Bahaya Bahaya Normal Bahaya Positif
17 Tn. L Sedang Normal Normal Bahaya Bahaya Bahaya Positif
18 Anak L Bahaya Normal Bahaya Bahaya Bahaya Sedang Positif
19 Ny. P Bahaya Sedang Normal Normal Sedang Sedang Positif
20 Ny. P Bahaya Sedang Bahaya Sedang Sedang Sedang Positif
21 Tn. L Sedang Sedang Sedang Sedang Bahaya Sedang Positif
22 Tn. L Sedang Sedang Bahaya Bahaya Sedang Sedang Positif
23 Ny. P Bahaya Sedang Bahaya Sedang Sedang Sedang Positif
24 Tn. L Bahaya Sedang Sedang Sedang Bahaya Sedang Positif
25 Ny. P Sedang Sedang Sedang Sedang Sedang Normal Negatif
26 Ny. P Bahaya Sedang Sedang Bahaya Normal Sedang Positif
27 Ny. P Sedang Sedang Sedang Sedang Normal Sedang Negatif
28 Anak P Sedang Sedang Normal Bahaya Normal Sedang Positif
29 Tn. L Sedang Sedang Sedang Sedang Bahaya Sedang Positif
30 Anak L Sedang Normal Sedang Bahaya Bahaya Bahaya Positif
31 Anak L Sedang Sedang Bahaya Sedang Sedang Bahaya Positif
32 Tn. L Bahaya Sedang Sedang Bahaya Sedang Sedang Positif
33 Anak P Sedang Sedang Normal Bahaya Normal Sedang Positif
34 Tn. L Bahaya Sedang Sedang Normal Normal Sedang Positif
35 Tn. L Bahaya Sedang Bahaya Normal Sedang Bahaya Positif
36 Ny. P Bahaya Sedang Bahaya Bahaya Sedang Sedang Positif
37 Tn. L Sedang Sedang Bahaya Sedang Sedang Sedang Positif
38 Ny. P Sedang Bahaya Sedang Sedang Normal Sedang Positif
39 Anak L Bahaya Normal Bahaya Bahaya Bahaya Bahaya Positif
40 Ny. P Bahaya Sedang Normal Normal Normal Sedang Positif
1.5 Perhitungan Manual Data Testing Nomor 11
Data testing No. 11 : X = (Nama=”Anak”, Jenis kelamin=”P”, Batuk= “Normal”,
Penurunan Berat Badan=”Sedang”, Nyeri Dada= “Bahaya”, Sesak Nafas=
“Sedang”, Berkeringat Malam Hari=”Normal”, Batuk Darah=”Normal”)
Tahap 1 menghitung jumlah kelas atau prediksi data testing
P(Ci)
P(Positif) = 172
199 = 0,864
P(Negatif) = 27
199 = 0,135
Tahap 2 menghitung jumlah kasus yang sama dengan kelas yang sama.
P(X | Ci)
Batuk(Normal | Positif) = 8
172 = 0,0465
Batuk(Normal | Negatif) = 8
27 = 0,2962
Penurunan BB(Sedang | Positif) = 51
172 = 0,2965
Penurunan BB(Sedang | Negatif) = 8
27 = 0,2962
Nyeri dada(Bahaya | Positif) = 27
172 = 0,1569
Nyeri dada(Bahaya | Negatif) = 4
27 = 0,1481
Sesak nafas(Sedang | Positif) = 18
172 = 0,1046
Sesak nafas(Sedang | Negatif) = 1
27 = 0,0370
Berkeringat MH(Normal | Positif) = 35
172 = 0,2034
Berkeringat MH Normal | Negatif) = 10
27 = 0,3703
Batuk darah(Normal | Positif) = 7
172 = 0,0406
Batuk darah(Normal | Negatif) = 11
27 = 0,4074
Tahap 3 mengkalikan semua hasil dari atribut Positif dan Negatif.
Tahap 4 membandingkan nilai kelas Positif dan Negatif.
Jadi untuk Data testing 11 : X = (Nama=”Anak”, Jenis kelamin=”P”, Batuk=
“Normal”, Penurunan Berat Badan=”Sedang”, Nyeri Dada= “Bahaya”, Sesak
Nafas= “Sedang”, Berkeringat Malam Hari=”Normal”, Batuk Darah=”Normal”)
hasilnya “Negatif” Tuberculosis.
P(X | Positif)= 0,0465 * 0,2965 * 0,1569 * 0,1046 * 0,2034* 0,0406 = 0,000001868
P(X | Negatif)= 0,2962 * 0,2962 * 0,1481 * 0,0370 * 0,3703 * 0,4074 = 0,000072527
P(X | Ci * P(Ci)
P(X | Positif) * P(Positif) = 0,000001868 * 0,864 = 0,0000016140
P(X | Negatif) * P(Negatif) = 0,000072527 * 0,135 = 0,0000097911
1.6 Testing Dengan Split Validation 0,6
1. Accuraccy
2. Recall
3. Precision
4. AUC
1.7 Testing Dengan Split Validation 0,7
1. Accuraccy
2. Recall
3. Precision
4. AUC
1.8 Testing Dengan Split Validation 0,9
1. Accuraccy
2. Recall
3. Precision
4. AUC
1.9 Tabel Distribusi Gejala Tuberculosis
No Atribut Value Jumlah Kasus
Positif Negatif
Total 199 172 27
1 Batuk
<7 hr = Normal 16 8 8
7 - 14 hr = Sedang 96 78 18
>14 hr = Bahaya 87 86 1
199 172 27
2 Penurunan Berat
Badan
<1 kg = Normal 59 51 8
2 - 3 kg = Sedang 128 111 17
>3 = Bahaya 12 10 2
199 172 27
3 Nyeri Dada
<1 kali = Normal 31 27 4
1 - 3 kali= Sedang 77 62 15
>3 kali= Bahaya 91 83 8
199 172 27
4 Sesak Nafas
<1 kali = Normal 19 18 1
1 - 3 kali = Sedang 104 80 24
>3 = Bahaya 76 74 2
199 172 27
5 Berkeringat Malam Hari
<2 hr = Normal 45 35 10
2 - 3 hr = Sedang 91 76 15
>3 hr = Bahaya 63 61 2
199 172 27
6 Batuk Darah
0 kali = Normal 18 7 11
1 kali = Sedang 94 82 12
>1 kali = Bahaya 87 83 4
199 172 27
Positif Negatif
Batuk
Normal 0,04651163 0,29629630
Sedang 0,45348837 0,66666667
Bahaya 0,50000000 0,03703704
Penurunan Berat Badan
Normal 0,29651163 0,29629630
Sedang 0,64534884 0,62962963
Bahaya 0,05813953 0,07407407
Nyeri Dada
Normal 0,15697674 0,14814815
Sedang 0,36046512 0,55555556
Bahaya 0,48255814 0,29629630
Sesak Nafas
Normal 0,10465116 0,03703704
Sedang 0,46511628 0,88888889
Bahaya 0,43023256 0,07407407
Berkeringat Malam Hari
Normal 0,20348837 0,37037037
Sedang 0,44186047 0,55555556
Bahaya 0,35465116 0,07407407
Batuk Darah
Normal 0,04069767 0,40740741
Sedang 0,47674419 0,44444444
Bahaya 0,48255814 0,14814815
Jumlah 0,00000000002003057 0,00000000000245822