jurnal biaya pasien rawat inap penyakit jantung

6

Click here to load reader

Upload: andy-murtanto

Post on 17-Jun-2015

376 views

Category:

Engineering


20 download

DESCRIPTION

Jurnal Biaya pasien rawat inap penyakit jantung di rumah sakit

TRANSCRIPT

Page 1: Jurnal biaya pasien rawat inap penyakit jantung

KLASIFIKASI BIAYA PASIEN RAWAT INAP PENYAKIT JANTUNG MENGGUNAKAN

TEKNIK DATA MINING ATTRIBUTE IMPORTANCE (AI) DAN ALGORITMA NAIVE BAYES

Andi MurtantoEmail : [email protected]

Abstrak

Sistem Informasi Manajemen Rumah Sakit (SIMRS) secara umum telah digunakan oleh para stafrumah sakit untuk mendukung operasional sehari-hari. Sebagian besar informasi yang didapat padaoperasional SIMRS berasal dari pengolahan transactional database. Sedangkan untuk mendukung pengambilankeputusan ditingkat manajerial, diperlukan akses ke database dalam ukuran besar dan dimensi yang lebihkompleks, sehingga diperlukan teknik data mining. Pendekatan data mining biasa dilakukan untuk menggaliinformasi, pengetahuan, pola-pola baru dan tren dengan menganalisis database dalam ukuran besar,menggunakan teknologi pengenalan pola, teknik statistik dan matematik. Salah satu potensi yang dapatdimanfaatkan pada penerapan data mining di rumah sakit adalah mengidentifikasi atribut-atribut penentu biayapasien rawat inap penyakit jantung. Dengan mengetahui atribut penentu biaya rawat, diharapkan pihakmanajemen rumah sakit dapat melakukan kontrol terhadap biaya, sehingga ongkos perawatan pasiendapat ditekan tanpa mengurangi kualitas pelayanan. Untuk mengidentifikasi atributpenentu biaya pasienrawat inap, digunakan data kunjungan pasien rawat inap RSUP Abu Nawas dengan jaminan Jamkesmasperiode 1 Januari 2012 s/d 30 September 2013 dari database SIMRS sebanyak 40 kunjungan (jumlah sebelumdilakukan data cleaning 102). Dengan teknik analisa Atttibute Importance (AI) didapatkan atribut-atributpenentu biaya dengan urutan sebagai berikut: pasien (A1), penyakit (A2), tipe_kelas (A3).

Keyword : penyakit jantung, biaya rawat inap

I. PendahuluanPerkembangan teknologi informasi yang

pesat terutama disektor kesehatan memungkinkandata dalam jumlah besar terakumulasi dengancepat. Saat ini berbagai rumah sakit sudah mulaimenerapkan sistem informasi rumah sakitberbasis computer untuk mendukung manajemenkeuangan (khususnya billing systems) [1]. Untukrumah sakit yang sudah mapan sisteminformasinya bahkan mulai memperluaskebutuhannya untuk membangun sisteminformasi klinik.

Pertumbuhan yang pesat dari akumulasidata itu telah menciptakan kondisi yang seringdisebut sebagai “rich of data but poor ofknowledge”, karena data yang terkumpul ituhanya digunakan untuk kebutuhan operasionalsaja, bahkan tidak jarang kumpulan data itudibiarkan begitu saja seakan-akan menjadi“kuburan data” (data tombs).

Untuk melakukan analisa data dalam jumlahbesar yang tersimpan pada database, biasanyadigunakan teknik data mining. Meski telahumum digunakan pada industri keuangan dantelekomunikasi, teknik data mining mulai

diterapkan secara intensif di sektor kesehatan.Sebagai contoh, Mayo Clinic bekerja samadengan IBM menerapkan teknik data miningpada pasien dengan kesamaan jenis kelamin, usiadan riwayat kesehatan untuk mengetahui responterhadap pengobatan tertentu .[2]

Menurut Friedman[3] ada beberapa definisidari data mining. Dikumpulkan dari berbagailiteratur data mining antara lain sebagai berikut:Data mining adalah proses ekstraksi

sebelumnya tidak dikenal dan dipahami daridata base berukuran besar dan digunakan untukmembuat keputusan bisnis yang penting. -Zekulin.Data mining adalah serangkaian metode yang

digunakan dalam proses penemuanpengetahuan untuk membedakan yangsebelumnya tidak diketahui baik hubungan danpola dalam data. - Ferruzza.Data mining adalah proses pendukung

keputusan yang digali dari basis databerukuran besaruntuk mengetahui pola yangtidak diketahui dan tak terduga sebelumnyapada data. – Parsaye.

Page 2: Jurnal biaya pasien rawat inap penyakit jantung

Potensi data mining dalam bidang kesehatansudah diakui secara luas. Banyak studi yangdiakukan menggunakan teknik data miningmodern, antara lain classification dan predictiveyang diterapkan pada rekam medis elektronis.Beberapa dari studi tersebut antara lainadalahsebagai berikut: Teknik Classification Naïve Bayes yang

diterapkan untuk masalah seleksi embrio [4] Teknik Decision Tree untuk

mengembangkan dan memvalidasi ukuranresiko stratifikasi mortalitas di rumah sakitkarena dekomposisi akut gagal jantung(ADHF) [5]

Neural Network untuk memprediksi pasientertentu yang akan mengalami kegagalandialysis peritoneal [6]

Support Vector Machines (SVM) untukmemprediksi sumber pendarahan danmengidentifikasi kohort pada pasien denganpendarahan akut gastrointestinal (GIB) yangmemerlukan intervensi mendesak, termasukendoskopi [7]

Association digunakan untukmengkonfirmasi aturan yang akandigunakan oleh sistem pakar yangmembantu dalam diagnosis penyakitjantung dan untuk menemukan aturan-aturan baru untuk memperkaya pengetahuansistem pakar [8]

Text Mininguntuk mengidentifikasi lukayang terkait dengan luka jatuh pada orangtua [9]

Penggunan data miningdiharapkan dapatmembantu para pengambil keputusanmendapatkan informasi yang lebih akurat danbermakna sebagai salah satu sarana untukmeningkatkan pelayanan kesehatan kepadamasyarakat.

II. Bahan dan Data2.1 Proses data mining

Pada bagian ini akan dijelaskan proses datamining yang terdiri dari beberapa tahap yangdiilustrasikan digambar 1[10]:1.Pembersihan data (data cleaning), untuk

membersihkan noise dan data yang tidakkonsisten. Dalam kasus ini membersihkandata – data pasien yang sudah dihapusdanidentitas yang tidak lengkap (misal: umur,status marital, pendidikan, diagnosa, dansebagainya);

2. Integrasi data, penggabungan data dariberbagai sumber;

3. Transformasi data, data diubah menjadibentuk yang sesuai untuk dimining;

4. Aplikasi teknik data mining, proses intidimana teknik data mining diterapkanuntuk mengekstrak pola - pola tertentupada data;

5. Evaluasi pola yang ditemukan;6. Presentasi pengetahuan, menggunakan

teknik visualisasi untuk menampilkanhasil data mining kepada pengguna(user).

Gambar1.Tahapan dalam proses datamining

2.2 DataUntuk mengidentifikasi atribut -

atribut penentubiaya pasien rawat inap,digunakan data kunjungan pasien rawatinap RSUP Abu Nawas dengan jaminanJamkesmas periode 1 Januari 2012 s/d 30September 2013 yang diambil daridatabase SIMRS sebanyak 102kunjungan pasien. Setelah dilakukan datacleaning, didapatkan 40 kunjungan pasienyang layak untuk dianalisa.

III. MetodeAttribute Importance (AI) member peringkat

atribut dengan menghilangkan atribut yangberulang,tidak relevan,atau tidak informative danmengidentifika siatribut yang mungkin memilikipengaruh yang paling tinggi dalam membuatprediksi.

Page 3: Jurnal biaya pasien rawat inap penyakit jantung

Gambar 2. Ilustrasi Atrribut Importance

AI menggunakan algoritma MinimumDescription Length (MDL). Algoritma MDLmempertimbangkan setiap atribut sebagaimodel prediktif sederhana dari kelas target.

Teknik AI digunakan untukmengoptimalkan analisa model classificationdengan mengurangi atribut yang digunakan danakan meningkatkan kecepatan dan akurasi saatmembangun model.

3.1. Naive Bayes Algoritma (Classification)Classifikasi adalah proses untuk

menentukan model atau fungsi yangmenjelaskan atau membedakan konsep ataukelas data, dengan tujuan untuk dapatmemperkirakan kelas dari suatu objek yanglabelnya tidak diketahui. Model itu sendiri bisaberupa aturan “jika - maka”. Dalam teknikclassifikasi terdapat beberapa algoritma yangbisa digunakan antara lain decision tree, naivebayes, adaptive naive bayes, logistiticreggression dan support vektor machine.

Bayesian Classification didasarkan padaTeorema Bayesian. Konsep dasar teori bayesitu pada dasarnya adalah peluang bersyarat P(H/X). Dimana dalam Bayesian H adalahposterior dan X adalah prior. Priora dalahpengetahuan kita tentang kara kteristik suatuparameter (bias dibaca sebagai pengalaman dimasa lalu atas suatu parameter atau juga biasberdasarkan teori), sedangkan posterior adalahkarakteristik yang akan kita duga padakejadian yang akan datang.

Teorema Bayesian berguna untukmelakukan kalkulasi probabilitas posterior,P(H|X), dari P(H), P(X) dan P(X|H). TeoriBayes adalah sebagai berikut:

P(H|X)=P(X|H)+P(H)Dimana :

X : Data dengan class yang belumdiketahui

H : Hipotesis data X merupakansuatu class spesifik

P(H/X) : Probabilitas hipotesis Hberdasar kondisi X (prosteriorprobability)

P(H) : Probabilitas hipotesis H (priorProbabitity)

P(X/H) : Probabititas X berdasarkankondisi pada hipotesis H

P(X) : Probabilitas X

Rumus diatas dapat dituliskan juga sebagaiberikut :

Posterior = prior + evidance

Nilai Evidence selalu tetap untuk setiapkelas pada satu sampel. Nilai dari posteriortersebut nantinya akan dibandingkan dengan nilainilai posterior kelas lainnya untuk menentukanke kelas apa suatu sampel akan diklasifikasikan.

Adapun alur dari metode Naive Bayes adalahsebagai berikut :1. Baca data training2. Hitung Jumlah dan probabilitas, namun apabila

datanumerik maka:a. Cari nilai mean dan standar deviasi dari

masing masing parameter yang merupakandatanumerik.

b. Cari nilai probabilistik dengan caramenghitung jumlah data yang sesuai darikategori yang sama dibagi dengan jumlahdata pada kategori tersebut

3. Mendapatkan nilai dalam tabel mean, standartdeviasi dan probabilitas

Proses classification biasanya dibagimenjadi dua fase: learning dan test. Pada faselearning, sebagian data yang telah diketahui kelasdatanya diumpankan untuk membentuk modelperkiraan. Kemudian pada fase test model yangsudah terbentuk diuji dengan sebagian datalainnya untuk mengetahui akurasi dari modeltersebut. Bila akurasinya mencukupi model inidapat dipakai untuk prediksi kelas data yangbelum diketahui.[10]

Gambar 3. Ilustrasi pemodelan teknik Classificationuntuk mengukur akurasi

Page 4: Jurnal biaya pasien rawat inap penyakit jantung

3.2. Data ScoringSetelah model dibuat dengan aplikasi data

mining, model tersebut bisa digunakan untukmembuat prediksi dari data baru yang dalamhal ini diterapkan untuk memprediksi polabiaya data pasien rawat inap penyakit jantung.Model biasanya dibuat dengan menggunakandata historis dari kunjungan pasiensebelumnya. Proses secara umumdiilustrasikan sebagai berikut :a. Ilustrasi Pembuatan Model

Gambar 4.Ilustrasi Pembuatan Modelb. Ilustrasi Sistem Scoring

Gambar 5. Ilustrasi Sistem Scoringc. Entity Relationship Diagram (ERD)

Gambar 6. Entity Relationship Diagram

IV. Perancangan Basis Dataa. Desain Tabel Penyakit

Tabel ini digunakan untuk menyimpan datajenis – jenis penyakit jantung

Tabel 1. Variable Jenis Penyakit

Dari tabel diatas adalah tabel data penyakityang memiliki atribut id penyakit, namapenyakit, dan harga obat, serta hargapemeriksaan.

b. Desain Tabel PasienTabel ini digunakan untuk menyimpan datapasien penderita penyakit jantung

Tabel 3. Variabel Pasien

Dari tabel diatas adalah tabel pasien yangmemiliki atribut id pasien, nama pasien, alamat,jenis kelamin, umur, dan termasuk tipe kelasyang saling berhubungan.

c. Desain Tabel PemeriksaanTabel ini digunakan untuk mengetahui biayatotal yang harus dibayar berdasarkan penderitapenyakit jantung.

Tabel 3. Varabel Pemeriksaan

Dari tabel diatas adalah tabel pemeriksaanyang memiliki atribut id pasien, id penyakit,umur, harga kelas, nama penyakit, harga obat,dan harga pemeriksaan yang salingberhubungan.

d. Implementasi dengan perhitungan NaïveBayes

Model statistik merupakan salah satu modelyang efisien sebagai pendukung pengambilankeputusan. Konsep probabilistik merupakan salahsatu bentuk model statistik. Salah satu metodeyang menggunakan konsep probabilistik adalahNaive Bayes. Algoritma Naive Bayes adalah salahsatu algoritma dalam teknik klasifikasi yangmudah diimplementasikan dan cepat prosesnya.Pada metode ini, semua atribut akan memberikankontribusinya dalam pengambilan keputusan,dengan bobot atibut yang sama penting dansetiap atribut saling bebas satu sama lain.

DataHistory

SistemDataMining

Model

DataHistory

ScoringEngine

Model

DataPrediksi

Page 5: Jurnal biaya pasien rawat inap penyakit jantung

Tahap awal cara kerja dari proses perhitunganNaïve Bayes adalah dengan melakukanpengambilan data training dari data pasienpenyakit jantung. Adapun variabel penentuyang digunakan dalam mengklasifikasikan datapasien penyakit jantungyaitu :1. Nama Pasien

Merupakan atribut nama pasien yangdijadikan data primer.

2. Tipe kelasMerupakan atribut kelas ruangan yangdikelompokkan dalam empat kategori yaituVIP, Kelas 1, Kelas 2, dan Kelas 3.

3. Nama PenyakitMerupakan atribut penyakit yangdikelompokkan dalam delapan kategori yaituAterosklerosis/serangan, Infark MiokardAkut (AMI), Kardiomiopati, Arritmia, GagalJantung Kongestif, Fibrilasi Atrial, InflamasiJantung, dan Penyakit Jantung Rematik.

4. Harga ObatMerupakan atribut harga obat yang terdiridari berbagai macam obat beserta hargajumlah keseluruhan.

5. Harga PemeriksaanMerupakan atribut pemeriksaan yangmerupakan jumlah keseluruhan dari tiap tiapkelas ruangan.

Tabel 4. Pelatihan

Berdasarkan Berdasarkan tabel diatas dapatdihitung klasifikasi id pasien apabila diberikaninput berupa harga obat, harga pemeriksaanyang didalamnya terdapat harga kelasmenggunakan algoritma Naive Bayes sebagaiberikut:1. Menghitung jumlah biaya pemeriksaan

saudara Komang dengan penyakitAterosklerosis :P (Biaya sdr Komang)

= P (harga kelas) + P (harga obat) +P (harga pemeriksaan)

= 110.000 + 4.259.200 + 394.000= 4.763.200

2. Menghitung jumlah biaya pemeriksaansaudara Angelina dengan penyakit InfarkMiokard Akut (AMI) :P (Biaya sdr Angelina) =

= P (harga kelas) + P (harga obat) +P (harga pemeriksaan)

= 60.000 + 4.259.200 + 394.000= 4.713.200

3. Menghitung jumlah biaya pemeriksaansaudara Salis Saputri dengan penyakit GagalJantung :P (Biaya sdr Salis Saputri) =

= P (harga kelas) + P (harga obat) +P (harga pemeriksaan)

= 80.000 + 107.315 + 389.000= 576.315

Proses diatas adalah proses data miningsecara manual dengan menggunakan datapelatihan untuk Rumah Sakit Abu Nawas.Dari data yang ada setelah dilakukan miningdengan menggunakan XAMPP versi 1.7.1 danNetBeans IDE 8.0

V. PengujianKegiatan uji coba dengan cara memasukan data

sample kedalam system dan memperhatikan outputoutput yang dihasilkan. Adapun tahapan yangdilakukan adalah :1. Melakukan penginputan data pribadi pasien

agar diketahui keluarga dan pengunjung.

Gambar 7. Tampilan data pasienmenggunakan program NetBeans IDE 8.0

2. Melakukan penginputan pasien terhadap jenispenyakit yang dideritanya.

Gambar 8. Tampilan data penyakitmenggunakan program NetBeans IDE 8.0

Page 6: Jurnal biaya pasien rawat inap penyakit jantung

3. Melakukan pemeriksaan pasien terhadap jumlahbiaya yang harus dibayar

Gambar 9. Tampilan data pemeriksaanmenggunakan program NetBeans IDE 8.0

VI. KesimpulanPada paper ini telah dilakukan studi dengan

menggunakan teknik Attribute Importance (AI)untuk mengetahui peringkat atribut yangberpengaruh terhadap pola biaya yang harusdibayar pasien terhadap penyakit yang dialaminyadengan membuat model menggunakan teknikclassification dengan Algoritma Naive Bayesyang kemudian digunakan untuk memprediksipola biaya pada data kunjungan pasien yang akandatang (scoring data). Dengan model prediksibiaya tersebut, dapat diperkirakan biaya pasienrawat inap pada saat awal kunjungan. Informasiperkiraan biaya tersebut bermanfaat bagi pihakpasien, karena dapat mempersiapkan pembiyaandan pihak rumah sakit karena dapat mengetahuiperkiraan biaya dan sumberdaya yang harusdisiapkan untuk merawat pasien.

VII. Daftar pustaka[1]. Fuad, A. 2005. Teknologi Informasi untuk

Keselamatan Pasien. http:/ /www.desentralisasi kesehatan.net/. 04 Juni 201414:10.

[2]. N. Wartz, “IBM, Mayo Clinic to Mine Data”,The information Management Journal,volume 3, issue 6, November /December2004,p.8

[3]. Friedman JH: Data Mining and Statistics:What's the Connection? Dept. of Statisticsand Stanford Linear Accelerator Center,Stanford University, Stanford,CA,http://stat.stanford.edu/~jhf/ftp/dm-stat.ps

[4]. Morales, D. A., Bengoetxea, E. et al. 2008.Selection of human embryos for transfer byBayesian classifiers. Computers in Biologyand Medicine 38(11–12):1177–1186.

[5]. Fonarow, G. C., Adams, K. F., Jr. et al. 2005.Risk stratification for in-hospital mortality

in acutely decompensated heart failure:classification and regression tree analysis.JAMA 293(5):572–580.

[6]. Tangri, N., Ansell, D. et al. 2008.Predicting technique survival in peritonealdialysis patients: comparing artificial neuralnetworks and logistic regression.Nephrology Dialysis Transplantation23(9):29722981.

[7]. Chu, A., Ahn, H. et al. 2008. A decisionsupport system to facilitate management ofpatients with acute gastrointestinal bleeding.Artificial Intelligence in Medicine42(3):247–259.

[8]. Ordonez, C., Santana, C. A. et al. 2000.Discovering interesting association rules inmedical data. In ACM SIGMOD Workshopon Research Issues on Data Mining andKnowledge Discovery.

[9]. Tremblay, M. C., Berndt, D. et al. 2005.Utilizingtext mining techniques to identify fallrelated injuries. In Proceedings of the 11thAmericas Conference on InformationSystems (AMCIS 2005), Omaha, NE

[10]. J. Hanand M. Kamber. Data Mining:Conceptsand Techniques. MorganKaufmann, 2001.8