g07aia.ppt
TRANSCRIPT
-
7/22/2019 G07aia.ppt
1/45
DIAGNOSIS PENYAKIT DEMAM BERDARAH
DENGUE MENGGUNAKAN
VOTING FEATURE INTERVALS 5
Oleh :
Aristi Imka Apniasari
G64103027
Pembimbing :
Aziz Kustiyo, S.Si, M.Kom
Irman Hermadi S.Kom, MS
-
7/22/2019 G07aia.ppt
2/45
Outline
Pendahuluan
Tinjauan Pustaka
Metode Penelitian
Hasil dan Pembahasan
Kesimpulan dan Saran
Daftar Pustaka
-
7/22/2019 G07aia.ppt
3/45
Latar Belakang
Tingkat kematian akibat penyakit Demam
Berdarah Dengue (DBD) relatif masih tinggi.
Salah satu penyebab tingginya tingkat kematian
tersebut adalah keterlambatan diagnosis.Penyakit DBD juga sering salah didiagnosis
dengan penyakit lain seperti flu atau tipus.
Semakin cepat diagnosis dapat dilakukan,semakin cepat pula pertolongan bisa diberikan
-
7/22/2019 G07aia.ppt
4/45
Latar Belakang (cont..)
VFI5 digunakan oleh HA Gvenir, G Demirz
dan N Ilter (1998) dalam memprediksi penyakit
erythemato-squamous dengan akurasi 96,2%.
Selain itu juga digunakan oleh Iqbal (2007)dalam mengklasifikasi pasien Suspect Parvo
dan Distemper. Akurasi yang dihasilkan adalah
90%.
-
7/22/2019 G07aia.ppt
5/45
Tujuan
Tujuan dari penelitian ini adalah untuk
menerapkan algoritma klasifikasi VFI5
dalam diagnosa penyakit DBD.
-
7/22/2019 G07aia.ppt
6/45
Ruang Lingkup
Data yang digunakan adalah data sekunder
penyakit DBD pada penelitian M.Syafii (2006).
Bobot (weight) setiap feature pada data
diasumsikan sama.
-
7/22/2019 G07aia.ppt
7/45
Manfaat
Penelitian ini diharapkan dapat membantusemua pihak dalam deteksi dini penyakitDBD menggunakan algoritma klasifikasi
VFI5.
Back
-
7/22/2019 G07aia.ppt
8/45
Tinjauan Pustaka
Demam Berdarah Dengue (DBD)
Validasi data
k-Fold Cross Validation
Voting Feature Intervals (VFI5)
-
7/22/2019 G07aia.ppt
9/45
Demam Berdarah Dengue
Penyakit Demam Berdarah Dengue atau Dengue
Hemorrhagic Fever (DHF) ialah penyakit yang
disebabkan oleh virus dengue yang ditularkan melalui
gigitan nyamuk Aedes aegypti dan Aedes albopictus
(Kristina dkk, 2004). Kriteria klinis untuk diagnosa DBD antara lain (Kristina
dkk, 2004) :
a Demam tinggi mendadak dan terus menerus selama 2-7 hari (38 C- 40 C).
b Manifestasi pendarahan.
c Hepatomegali (pembesaran hati).
-
7/22/2019 G07aia.ppt
10/45
Demam Berdarah Dengue (cont..)
d Shockyang ditandai dengan nadi lemah, cepat,
tekanan nadi menurun menjadi 20 mmHg atau kurang
dan tekanan sistolik sampai 80 mmHg atau lebih
rendah.
e Trombositopenia, pada hari ke 3-7 ditemukan
penurunan trombosit sampai 100.000/mm3.
f Hemokonsentrasi, meningkatnya nilai hematokrit.
g Gejala-gejala klinis lainnya yang dapat menyertai :
anoreksia (hilangnya nafsu makan), lemah, mual,
muntah, sakit perut, diare, kejang dan sakit kepala.
h Rasa sakit pada otot dan persendian.
-
7/22/2019 G07aia.ppt
11/45
Demam Berdarah Dengue (cont..)
Secara alamiah penyakit DBD mengalami perjalanan
empat tahap yaitu (Sutaryo 2004 diacu dalam Syafii
2006) :
1 masa inkubasi selama 5-9 hari.
2 masa akut selama 1-3 hari.
3 masa kritis selama 1-3 hari
4 masa penyembuhan selama 1-2 hari
Penyakit DBD sering terjadi di daerah tropis dan muncul
pada musim penghujan (Kristina dkk, 2004).
-
7/22/2019 G07aia.ppt
12/45
Validasi Data
Validasi adalah meneliti kebenaran data dalam
kondisi khusus. Dalam hal ini kondisi khusus
tersebut adalah aturan (rule base) yang
diperoleh dari pakar. Validasi dilakukan dengancara meneliti konsistensi data terhadap aturan
tersebut (Syafii 2006).
-
7/22/2019 G07aia.ppt
13/45
k-Fold Cross Val idat ion
Dalam k-fold cross validation, data dibagi secara
acak menjadi k himpunan bagian yang
ukurannya hampir sama satu sama lain.
Himpunan bagian yang dihasilkan yaituS1,S2,...,Sk digunakan sebagai pelatihan dan
pengujian yang masing-masing diulang
sebanyak kkali.
Pada iterasi ke-i, subset Si diperlakukan
sebagai data pengujian, dan subset lainnya
diperlakukan sebagai data pelatihan.
-
7/22/2019 G07aia.ppt
14/45
Vot ing Featu re In tervals(VFI5)
Algoritma klasifikasi Voting Feature Intervals
(VFI5) merepresentasikan deskripsi sebuah
konsep oleh sekumpulan interval nilai-nilai
feature atau atribut. Termasuk algoritma supervised, karena memiliki
target yaitu kelas-kelas data dari kasus yang
ada.
-
7/22/2019 G07aia.ppt
15/45
Vot ing Featu re In tervals(cont..)
VFI5 dikembangkan menjadi dua tahap :
1 Pelatihan
- menemukan nilai end pointsetiap feature f
pada setiap kelas data c- mengurutkan nilai-nilai end pointtersebutsehingga membentuk interval untuk setiapfeature f.
- menghitung jumlah instance pelatihan setiapkelas c dengan feature f yang nilainya jatuhpada interval i
- dilakukan normalisasi
-
7/22/2019 G07aia.ppt
16/45
Vot ing Feature In tervals(cont..)
2 Prediksi (klasifikasi)
- Untuk setiap feature f, dicari interval i dimana
nilai efjatuh, dengan efmerupakan nilai
feature f dari instance tes e.- Memberi nilai vote untuk setiap feature pada
masing-masing kelas kemudian dijumlahkan.
- Kelas dengan jumlah vote terbesar diprediksisebagai kelas dari instance tes e.
Back
-
7/22/2019 G07aia.ppt
17/45
Metode Penelitian
Data
Seleksi data
Data ujiKlasifikasi
Pelatihan
Akurasi
Data latih
Model VFI5
-
7/22/2019 G07aia.ppt
18/45
Data
Data yang digunakan adalah data sekunderpenyakit DBD pada penelitian Syafii (2006).Sampel terdiri dari data pasien yang menderitapenyakit DBD dan Demam Dengue (DD).
Catatan medis yang dijadikan sampel adalahyang mencatat 4 kriteria klinis yaitu : demam,bercak-bercak, tanda pendarahan spontan danhasil uji tornikuet.
Dari 205 catatan medis yang ditemukan, yangmemenuhi persyaratan hanya 64, yang terdiridari 32 kasus DBD dan 32 kasus DD.
-
7/22/2019 G07aia.ppt
19/45
Seleksi Data
Pada penelitian ini akan dilakukan seleksi
terhadap keseluruhan data baik sebelum
maupun setelah validasi. Seleksi ini dilakukan
untuk menentukan data mana yang digunakansebagai data latih dan data uji.
-
7/22/2019 G07aia.ppt
20/45
Data Latih dan Data Uji
Seluruh data yang digunakan dibagimenjadi beberapa subset dengan ukurancontoh yang hampir sama.
Setiap subset dibagi-bagi lagi menjadi tigasub-subset dengan metode 3-fold crossvalidation.
Subset-subset tersebut akan digunakansebagai data pelatihan (training) dan datapengujian (testing).
-
7/22/2019 G07aia.ppt
21/45
VFI5
Pada penelitian ini digunakan algoritmaklasifikasi VFI5 dengan bobot setiap featurediasumsikan sama, yaitu satu.
Pelatihan
Pada tahap ini akan ditentukan nilai end pointuntuk setiap feature. Selanjutnya akan dibentukinterval-interval dari setiap feature yang ada.Setelah semua interval terbentuk, langkahselanjutnya adalah menghitung jumlah instancesetiap kelas yang berada pada setiap intervaltersebut dan dilakukan normalisasi.
-
7/22/2019 G07aia.ppt
22/45
VFI5 (cont..)
Klasifikasi
Setiap nilai feature dari suatu instance barudiperiksa letak interval nilai feature tersebut.
Vote-vote setiap kelas untuk setiap feature padasetiap interval yang bersesuaian diambil dankemudian dijumlahkan. Kelas dengan nilai totalvote tertinggi akan menjadi kelas prediksi
instance baru tersebut.
-
7/22/2019 G07aia.ppt
23/45
Analisis
Pada tahapan ini dilakukan prosespenghitungan tingkat akurasi. Tingkat akurasi
diperoleh dengan perhitungan :
Dilakukan pengamatan terhadap hasil diagnosa
penyakit DBD dengan menggunakan VFI5.
Hasil diagnosa diperoleh dari kelas dengan
jumlah vote terbesar.
ujidatatotal
asidiklasifikbenarujidataakurasitingkat
-
7/22/2019 G07aia.ppt
24/45
Spesifikasi Aplikasi
Hardware :1 Prosesor Intel Pentium 4
2 Memori 512 MB
3 Harddisk80 GB
4 Monitor 155 Alat input mouse dan keyboard
Software :
1 Sistem Operasi : Microsoft Windows XP
2 Microsoft Visual Basic 6.0
Back
-
7/22/2019 G07aia.ppt
25/45
Hasil dan Pembahasan
Terdapat 4 gejala klinis objektif yang kemudian
menjadi fitur pada VFI5
-
7/22/2019 G07aia.ppt
26/45
Selanjutnya akan dilakukan validasi data.Semua data yang nilainya dianggap tidakkonsisten dengan kelasnya akan dihilangkan.
Sebaran data sebelum dan sesudah validasi :
Keseluruhan data baik sebelum maupun
setelah validasi terlebih dahulu dibagi secaraacak menjadi 3 himpunan bagian (subset) yangakan digunakan dalam 3-fold cross validation.
Kasus Sebelum validasi Setelah validasi
DBD 32 23
Bukan DBD 32 19
Jumlah 64 42
-
7/22/2019 G07aia.ppt
27/45
Akan dilakukan 3 tahap pengujian.
- Tahap pertama : pengujian untuk data sebelumvalidasi
- Tahap kedua : pengujian untuk data setelah
validasi tanpa persebaran
- Tahap ketiga : pengujian untuk data setelahvalidasi dengan persebaran
-
7/22/2019 G07aia.ppt
28/45
Data sebanyak 64 instance dibagi menjadi 3 himpunan
bagian.
Susunan data yang digunakan sebagai data pelatihan
dan data pengujian pada setiap iterasi :
Tahap Pertama
-
7/22/2019 G07aia.ppt
29/45
Iterasi pertama
S1 : data pengujian S2&S3 : data pelatihan
Proses pelatihan menghasilkan selang-selang fitur.
Akurasi yang dihasilkan 66,67% (dari 21 instance terdapat 7instance yang diklasifikasi salah)
Tahap Pertama (cont..)
-
7/22/2019 G07aia.ppt
30/45
Tahap Pertama (cont..)
Iterasi kedua S2 : data pengujian
S1&S3 : data pelatihan
Proses pelatihan menghasilkan selang-selang fitur.
Akurasi yang dihasilkan 66,67% (dari 21 instance terdapat7 instance yang diklasifikasi salah)
Iterasi ketiga
S3 : data pengujian
S1&S2 : data pelatihan Proses pelatihan menghasilkan selang-selang fitur.
Akurasi yang dihasilkan 63,64% (dari 22 instance terdapat
8 instance yang diklasifikasi salah)
-
7/22/2019 G07aia.ppt
31/45
Tahap Pertama (cont..)
Hasil pengujian tahap pertama
Iterasi Akurasi
Pertama 66,67%Kedua 66,67%
Ketiga 63,64%
Rata-rata 65,66%
-
7/22/2019 G07aia.ppt
32/45
Tahap Kedua
Data sebanyak 42 instance dibagi menjadi 3 himpunanbagian.
Susunan data yang digunakan sebagai data pelatihan
dan data pengujian pada setiap iterasi :
-
7/22/2019 G07aia.ppt
33/45
Tahap Kedua (cont..)
Iterasi pertama S1 : data pengujian
S2&S3 : data pelatihan
Proses pelatihan menghasilkan selang-selang fitur.
Akurasi yang dihasilkan 100%
-
7/22/2019 G07aia.ppt
34/45
Tahap Kedua (cont..)
Iterasi kedua S2 : data pengujian
S1&S3 : data pelatihan
Proses pelatihan menghasilkan selang-selang fitur.
Akurasi yang dihasilkan 78,57% (dari 14 instance terdapat 3
instance yang diklasifikasi salah)
Hasil pengujian algoritma VFI5 untuk 3 instance yang salah
diklasifikasi :
-
7/22/2019 G07aia.ppt
35/45
Tahap Kedua (cont..)
Ketiga instance tersebut diklasifikasi ke dalam kelas bukan DBD,sedangkan kelas sebenarnya adalah kelas DBD.
Nilai normalisasi ketiga instance mendekati 0,5. Ini berarti ketiga
instance tersebut mempunyai peluang yang hampir sama untuk
menjadi kelas DBD maupun kelas bukan DBD.
Iterasi ketiga
S3 : data pengujian
S1&S2 : data pelatihan
Proses pelatihan menghasilkan selang-selang fitur. Akurasi yang dihasilkan 100%
-
7/22/2019 G07aia.ppt
36/45
Tahap Kedua (cont..)
Hasil pengujian tahap kedua
Iterasi Akurasi
Pertama 100%Kedua 78,57%
Ketiga 100%
Rata-rata 92,86%
-
7/22/2019 G07aia.ppt
37/45
Tahap Ketiga
Pembagian data menjadi 3 himpunan bagian dansusunan data yang digunakan sebagai data pelatihan
dan data pengujian sama seperti pada tahap kedua.
Dari hasil pengujian tahap kedua, ditemukan 3 instance
yang salah diklasifikasi dimana ketiga instance tersebutberada pada satu data pengujian yang sama.
Pada tahap ini, ketiga instance tersebut akan disebar
pada 3 data pengujian yang berbeda. Sehingga masing-
masing data perngujian mengandung satu instance yang
salah diklasifikasi.
-
7/22/2019 G07aia.ppt
38/45
Tahap Ketiga (cont..) Iterasi pertama
S1 : data pengujian
S2&S3 : data pelatihan
Proses pelatihan menghasilkan selang-selang fitur.
Akurasi yang dihasilkan 92,86% (dari 14 instance terdapat 1instance yang diklasifikasi salah)
-
7/22/2019 G07aia.ppt
39/45
Tahap Ketiga (cont..) Hasil pengujian instance yang salah diklasifikasi
Instance yang salah diklasifikasi tersebut termasuk ke dalam
kelas bukan DBD, sedangkan kelas sebenarnya adalah kelas
DBD.
Nilai normalisasi instance tersebut mendekati 0.5 untuk setiap
kelasnya. Ini berarti instance tersebut mempunyai peluang yang
hampir sama untuk menjadi kelas DBD maupun kelas bukan
DBD.
-
7/22/2019 G07aia.ppt
40/45
Tahap Ketiga (cont..)
Iterasi kedua S2 : data pengujian
S1&S3 : data pelatihan
Proses pelatihan menghasilkan selang-selang fitur.
Akurasi yang dihasilkan 100%
Iterasi ketiga
S3 : data pengujian
S1&S2 : data pelatihan
Proses pelatihan menghasilkan selang-selang fitur.
Akurasi yang dihasilkan 100%
-
7/22/2019 G07aia.ppt
41/45
Tahap Ketiga (cont..)
Hasil pengujian tahap ketiga
Tiga instance yang salah diklasifikasi pada tahap kedua
tidak semuanya diklasifikasi salah pada pengujian tahap
ketiga.
Back
Iterasi Akurasi
Pertama 92,86%
Kedua 100%
Ketiga 100%
Rata-rata 97,62%
-
7/22/2019 G07aia.ppt
42/45
Kesimpulan dan Saran
Kesimpulan Algoritma Voting Feature Intervals (VFI5) pada penelitian ini
dapat digunakan secara selektif untuk memprediksi penyakit
Demam Berdarah Dengue (DBD).
Pada pengujian tahap pertama, rata-rata akurasi yang dihasilkanadalah 65,66%, dimana terdapat 22 instance yang kelas
prediksinya tidak sesuai dengan kelas sebenarnya.
Pada pengujian tahap kedua ditemukan 3 instance yang kelas
prediksinya tidak sesuai dengan kelas sebenarnya dengan rata-
rata akurasi 92,86%.
Pada pengujian tahap ketiga hanya terdapat 1 instance yang
kelas prediksinya tidak sesuai dengan kelas sebenarnya dengan
rata-rata akurasi 97,62%.
-
7/22/2019 G07aia.ppt
43/45
Saran
Pada penelitian selanjutnya dapat digunakan bobot yangberbeda untuk setiap fiturnya.
Data yang akan digunakan diharapkan memiliki jumlah record
yang lebih banyak. Disarankan juga adanya pengembangan
jumlah kriteria klinis termasuk tanda subjektif seperti sakit
kepala, nyeri perut, mual dan sebagainya.
Back
-
7/22/2019 G07aia.ppt
44/45
Daftar Pustaka Demirz G, Gvenir HA. 1997. Classification by Voting Feature Intervals.
http://www.cs.ucf.edu/~ecl/papers/demiros97classification.pdf. Gvenir HA, Demirz G, Ilter N. 1998. Learning Differential Diagnosis of
Erythemato-Squamous Diseases using Voting Feature Intevals.ArtificialIntelligence in Medicine, 13(3), 147-165.
Ibrahim F, Taib MN, Abas WABW, Guan CC, Sulaiman S. 2005.A NovelDengue Fever(DF) and Dengue Haemorrhagic Fever(DHF)Analysis UsingArtificial Neural Network(ANN).
http://www.intl.elsevierhealt.com/journals/cmpb. Iqbal M. 2007. Klasifikasi Pasien Suspect Parvo dan Distemperpada Data
Rekam Medik Rumah Sakit Hewan IPB Menggunakan Voting FeatureIntevals [skripsi]. Bogor: Fakultas Matematika dan Ilmu Pengetahuan Alam,Institut Pertanian Bogor.
Kristina, Isminah, Wulandari L. 2004. Demam Berdarah Dengue. http://www.litbang.depkes.go.id/maskes/052004/demamberdarah1.htm.
Sarle W. 2004. What are cross-validation andbootstrapping?.http://www.faqs.org/faqs/ai-faq/neuralnets/part3/section-12.html.
Syafii M. 2006.Adaptive Neuro Fuzzy Inference System (ANFIS) untukDiagnosa dan Tatalaksana Penyakit Demam Berdarah Dengue [tesis].Bogor: Sekolah Pascasarjana, Intitut Pertanian Bogor.
http://www.cs.ucf.edu/~ecl/papers/demiros97classification.pdfhttp://www.intl.elsevierhealt.com/journals/cmpbhttp://www.intl.elsevierhealt.com/journals/cmpbhttp://www.cs.ucf.edu/~ecl/papers/demiros97classification.pdf -
7/22/2019 G07aia.ppt
45/45
Terima Kasih