penerapan data mining -...

17
Penerapan Data Mining Untuk Menampilkan Informasi Pertumbuhan Berat Badan Ideal Balita dengan Menggunakan Metode Naive Bayes Classifier Octia Nuraeni 55410244 Teknik Informatika Pembimbing : Dr. Riza Adrianti S, Skom., MMSI

Upload: lynga

Post on 09-May-2018

227 views

Category:

Documents


2 download

TRANSCRIPT

Penerapan Data Mining Untuk Menampilkan Informasi

Pertumbuhan Berat Badan Ideal Balita dengan

Menggunakan Metode Naive Bayes Classifier

Octia Nuraeni

55410244

Teknik Informatika

Pembimbing : Dr. Riza Adrianti S, Skom., MMSI

LATAR BELAKANG

• Perkembangan teknologi informasi yang semakinpesat

• Penggunaan konsep data mining

• Pertumbuhan dan perkembangan anak balitayang ideal merupakan hal penting dan sangatdiinginkan bagi setiap orang tua.

• Agar hasil pengukuran berat badan balitamendapatkan hasil yang optimal makadigunakan teknik data mining dengan algoritmaNBC (Naïve Bayes Classifier).

BATASAN MASALAH

Lokasi Penelitian:

Posyandu G 20 A RW 022 wilayah RW 022, Harapan

Jaya Bekasi Utara

Responden:

Para Kader Posyandu dan Orangtua Balita

Waktu Penelitian :

Bulan Mei 2014

Metode:

Teknik Data Mining Klasifikasi, Naive Bayes Classifier

Dataset :

Data penimbangan balita yang berjumlah

250 instances

Permasalahan:

Menerapkan teknik data mining untuk menampilkaninformasi

pertumbuhan berat badan ideal balita menggunakan software

aplikasi WEKA V3.6.9

TUJUAN PENULISAN

Menerapkan teknik data mining denganalgoritma Naive Bayesian Classifier untukmenampilkan informasi yang berhargadari data posyandu mengenaipertumbuhan balita ideal dan tidak idealdi wilayah RW 022 Posyandu G 20 A,Harapan Jaya Bekasi Utara

1

Menganalisis data balita di PosyanduG 20 A dan membuktikan kebenarandari teknik data mining denganmengukur hasil akurasinya.

2

METODOLOGI PENELITIAN

ANALISA DAN PEMBAHASAN

• Data mining adalah suatu disiplin ilmu atau teknik menggaliinformasi berharga yang tersembunyi pada suatu databasedengan volume besar sehingga ditemukan suatu pola yangmenarik yang sebelumnya tidak diketahui.

• Klasifikasi adalah proses untuk menemukan model atau fungsiyang menjelaskan atau membedakan suatu class data, dengantujuan untuk dapat memperkirakan class dari suatu atribut yanglabelnya tidak diketahui.

• Algoritma Naive Bayes adalah salah satu algoritma dalam teknikklasifikasi yang mudah diimplementasikan dan cepat prosesnya.

ANALISA DAN PEMBAHASAN

• Klasifikasi Naive Bayes merupakan bentuk klasifikasi yang melakukanteknik pengklasifikasian dengan menghitung derajat kecocokandengan cara membandingkan nilai Posterior untuk masing-masingclass, dan mengambil class dengan nilai Posterior yang tinggi.

Rumus Naive Bayes Classifier

atau

• Untuk klasifikasi dengan data kontinyu digunakan rumus DensitasGauss :

ANALISA DAN PEMBAHASAN

Class Name : Tabel 1. Data Training Balita : data_posyandu.csv

Pertumbuhan Berat Badan Ideal Balita

Class Label Attribut :

Ideal = [ Ya | Tidak ]

Identifier :

Nama Balita

Attribut/Variabel dan Anggota attribut

- Usia [ <=12 | 13...24 | 25...36 |

37...48 | 49...60 ]

- Status [ Bayi | Balita ]

- Berat Badan

- Hasil Berat Badan [ Underweight |

Normal | Overweight ]

- Jenis Kelamin [ Laki-laki | Perempuan ]

ANALISA DAN PEMBAHASAN

Rancangan Algoritma Naive Bayes 1. Menghitung jumlah class atau label attribut

P(Ya) = 222/250 = 0,888 → Jumlah data “Ya” pada data training dibagi dengan jumlah keseluruhan data.

P(Tidak) = 28/250 = 0,112 → Jumlah data “Tidak” pada data training dibagi dengan jumlah keseluruhan data.

2. Apabila data numerik, hitung mean dan standar deviasi setiap atribut/variabel

Kemudian menghitung densitas Gauss data menggunakan persamaan dibawah ini.

ANALISA DAN PEMBAHASAN

3. Menghitung jumlah kategori atribut yang sama dengan class yang sama

P(Status = Bayi |Ya) = 21/222 = 0,094 P(Berat Badan = 8 | Ya) = 0,394

P(Status = Bayi | Tidak) = 1/28 = 0,036 P(Berat Badan = 8 | Tidak) = 0,527

P(Usia = <=12 | Ya) = 21/222 = 0,094

P(Usia = <=12 | Tidak) = 1/28 = 0,036

P(Hasil Berat Badan = Normal | Ya) = 212/222 = 0,955

P(Hasil Berat Badan = Normal | Tidak) = 0/28 = 0

P(Jenis Kelamin = Laki-laki|Ya) = 115/222 = 0,518

P(Jenis Kelamin = Laki-laki | Tidak) = 14/28 = 0,5

4. Kalikan semua hasil atribut Ya dan Tidak, kemudian hitung probabilitas setiap kategori dari input yang diberikan

P(Ya) = P(Status = Bayi|Ya) × P(Usia = <=12|Ya) × P(Berat Badan = 8|Ya) ×P(Hasil Berat Badan = Normal|Ya) × P(Jenis Kelamin = Laki-laki|Ya) × P(Ya)

= 0,094 × 0,094 × 0,394 × 0,955 × 0,518 × 0,888

= 1,53 × 10-3

ANALISA DAN PEMBAHASAN

P(Tidak) = P(Status = Bayi|Tidak) × P(Usia = <=12|Tidak) × P(Berat Badan = 8|Tidak) × P(Hasil Berat Badan = Normal|Tidak) × P(Jenis Kelamin = Laki-laki|Tidak) × P(Tidak)

= 0,036 × 0,036 × 0,527 × 0 × 0,5 × 0,112

= 0

Probabilitas Ya = = 1 × 100 % = 100 %

Probabilitas Tidak = = 0 × 100 % = 0 %

5. Bandingkan hasil class Ya, dan Tidak

Dari hasil diatas, terlihat bahwa nilai probabilitas tertinggi ada pada kelas (P|Ya) sehingga dapat disimpulkan bahwa bayi yang bernama Alvin Chandra masuk dalam klasifikasi “Ya”. Artinya bayi tersebut memiliki pertumbuhan berat badan ideal.

ANALISA DAN PEMBAHASAN

Langkah-Langkah Menggunakan WEKA

ANALISA DAN PEMBAHASAN

• Perbandingan hasil yang didapat secara real (perhitungan manualberdasarkan Metode Konvensional dan Tabel Berat Badan Ideal Anakmenurut WHO) dengan hasil yang didapat dari perhitunganmenggunakan tools WEKA dengan teknik classifier NaiveBayes, sepertiyang terlihat pada tabel 2.

Tabel 2. Perbandingan Hasil Perhitungan Secara Manual dengan Metode Naive Bayes Classifier Menggunakan WEKA

SIMPULAN

• Melalui teknik data mining yang digunakan, penulis telah berhasilmengumpulkan, menganalisa, dan mengklasifikasikan data balitasebanyak 250 instances mengenai pertumbuhan berat badan ideal dantidak ideal balita di wilayah RW 022 Posyandu G20 A, Harapan JayaBekasi Utara pada bulan Mei tahun 2014. Penggunaan aplikasi WEKAdirasa dapat mempermudah para kader posyandu dalam menampilkaninformasi pertumbuhan berat badan ideal balita.

• Berdasarkan hasil uji coba terhadap tools WEKA, terdapat sedikitperbedaan dari tingkat kevalidan hasil perhitungan status berat badanideal dengan teknik classifier NaiveBayes. Dari 250 data instances,terdapat 240 data yang sesuai dengan class yang diberikan dan 10 datayang tidak sesuai dengan hasil yang diberikan. Hal ini dapat terjadikarena data training yang digunakan cukup akurat, sehinggaperhitungan presentase tingkat akurasinya sebesar 96%.

SARAN

• Penelitian lanjutan dapat juga dilakukan dengan menggabungkanmetode Bayes dengan metode lain seperti Association Rules,Decision Tree, Neural Network (NN) dan Support Vector Machine(SVM). Hasil dari perangkat lunak WEKA hanya bisa digunakansesuai dengan apa yang sudah dilatih menggunakan datatraining, sehingga keakuratan data harus tetap terjaga agarmampu memberikan hasil yang lebih signifikan.

• Penulis juga berharap pada penelitian lanjutan bisadiimplementasikan melalui bahasa pemrograman seperti Java,Visual Basic, Matlab, dan lain sebagainya, sehingga penerapanteknik data mining dapat lebih dimengerti oleh user apabiladiimplementasikan kedalam suatu aplikasi.

DAFTAR PUSTAKA[1] Aplikasi Weka. http://sourceforge.net/projects/weka/. Tanggal akses 19 Mei 2014 pukul 12.17.

[2] Budi, Santoso. 2007. Data Mining: Teknik Pemanfaatan Data untuk Keperluan Bisnis. Yogyakarta:Graha Ilmu.

[3] Bustami. Penerapan Algoritma Naive Bayes Untuk Mengklasifikasi Data Nasabah Asuransi. http://ejurnal.tif.unimal.ac.id/index.php/ejournal/article/download/37/22 Tanggal akses 30 Juni 2014 pukul 12:17

[4] Danone Institue. Prinsip 4: Pentingnya Menjaga Berat Badan Ideal Pada Anak. http://www.danonenutrindo.org/prinsip4_anak_anak.php. Tanggal akses 08 Agustus 2014 pukul 12:50

[5] Fauzy, Nurrochim. 2013. Sistem Pendukung Keputusan Berbasis Android Sebagai Penentu Kelayakan Peminjaman Uang Menggunakan Metode Naive Bayes. Jakarta:Universitas Persada Indonesia YAI

[6] Haryanto. 2012. Teknik Data Mining Untuk Mendapatkan Informasi Dari Keluaran Perangkat Jaringan. Jakarta:Binus University

[7] Kusumadewi, Sri. 2009. Klasifikasi Status Gizi Menggunakan Algoritma Naive Bayes Classification. Yogyakarta:Universitas Islam Indonesia

[8] Natalius, Samuel. 2010. Metoda Naïve Bayes Classifier dan Penggunaannya pada Klasifikasi Dokumen. Bandung:ITB

[9] Planet Sehat. Cara Menghitung Berat Badan Ideal Dengan Metode IMT dan Konvensional. http://planetsehat.com/tips-diet/berat-badan-ideal/cara-menghitung-berat-badan-ideal-dengan-metode-imt-dan-konvensional/ . Tanggal akses 08 Juli 2014 pukul 22:57

[10] Prabowo, Sony. Tabel Berat Badan Anak Menurut Usia. http://majalahkesehatan.com/tabel-berat-badan-anak-menurut-usia/. Tanggal akses 07 Mei 2014 pukul 07:34

[11] Pratama, Anindito Yoga. 2012. Penerapan Teknik Data Mining Untuk Menentukan Hasil Seleksi Masuk Sman 99 Jakarta Untuk Siswa / Siswi Smpn 9 Jakarta Menggunakan Decision Tree. Jakarta:Universitas Gunadarma

[12] Rumus Hitung. Tabel Berat Badan Dan Tinggi Ideal Anak 0-5 Tahun. http://rumushitung.com/2013/06/01/tabel-berat-badan-dan-tinggi-ideal-anak-0-5-tahun/. Tanggal akses 07 Mei 2014 pukul 07:30

[13] Susanto, Sani, Ph.D, Suryadi, Dedy. 2010. Pengantar Data Mining: Menggali Pengetahuan dari Bongkahan Data. Yogyakarta:Andi.