bioepid
TRANSCRIPT
Biostatistika dan Epidemiologi (MMS-4411)Dr. Danardono, [email protected]
Program Studi Statistika Jurusan Matematika FMIPA UGM
Materi dan JadualMinggu ke1. Pokok Bahasan Pendahuluan Sub Pokok Bahasan 1 Kompetensi dan profesi terkait 2 Rencana pembelajaran dan penilaian 3 Studi Kasus 1 (tentang kompetensi, profesi, penelitian atau desain) 1 Penelitian dalam bidang ilmu hayati, kedokteran, kesehatan dan epidemiologi 2 Penelitian observasional 3 Cross-sectional Study 4 Follow-up study 5 Case-control study 6 Penelitian klinis (clinical trial)
2.
Desain Penelitian
Materi dan Jadual3. Desain Penelitian (lanjutan); Statistik dan ukuran dalam epidemiologi 1 Pengenalan desain lanjut (nested case-control, case-cohort) 2 Kaitan desain penelitian dengan analisis statistik 3 Prevalence dan incidence 4 Odds ratio, risk ratio dan risk difference 5 Studi kasus 2 (tentang penelitian, desain dan analisis) 1 Perangkat lunak statistika 2 Pencarian informasi 1 Analisis regresi dan ANAVA 2 Model linear terumumkan 1 Crosstabulation dan stratikasi 2 Regresi logistik 3 Regresi Poisson 1 Sensitivity dan specicity 2 Kurva ROC
4. 5. 6.
Alat bantu analisis dan penelitian Model linear Analisis Data kategorik
7.
Uji Diagnostik
Materi dan Jadual8. Analisis data longitudinal dan survival Studi Kasus 3 1 Model Regresi untuk data longitudinal 2 Kaplan-Meier dan Life Table 3 Model Regresi data survival Studi kasus tentang penggunaan metode yang tepat, skill olah data, analisis dan interpretasi 1 Hubungan antara beberapa metode 2 Kelebihan dan kekurangan masing-masing metode 3 Dasar teori lebih lanjut Metode yang tidak standar atau metode terkini dari penelitian terakhir atau yang sedang dikembangkan 1 Penulisan laporan 2 Komunikasi dan presentasi
9.
10.
Ringkasan Metode
11.
Topik lanjut
12.
Praktek Konsultasi
Materi dan Jadual13. Studi kasus 4 Studi kasus yang berkaitan dengan praktek konsultasi (individual atau kelompok) Studi kasus yang berkaitan dengan praktek konsultasi (individual atau kelompok)
14.
Studi kasus 5
PenilaianNo 1. 2. 3. 4. Unsur Penilaian Ujian Akhir Sisipan Tugas/Presentasi PR/Kuis Persentase 35 25 30 10
Pustaka dan Sumber InformasiBuku Teks: 1. Le, Chap T. Introductory Biostatistics. Wiley, 2003 2. Clayton, D. dan Hills, M. Statistical Models in Epidemiology. Oxford University Press, 1993 3. Newman, S. C. Biostatistical Methods in Epidemiology. Wiley, 2001 4. Kleinbaum, D. G., Kupper, L. L. dan Morgenstern, H. Epidemiologic Research: Principles and Quantitative Methods. Wadsworth, Inc., 1982 Sumber informasi internet: 1. http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?DB=pubmed 2. http://www.pitt.edu/ super1/
Diskusi
Diskusi
Biostatistika (Biostatistics)
Epidemiologi (Epidemiology)
Diskusi
Mulailah berpikir dan bertindak bukan hanya sebagai statistisi saja, tapi juga sebagai orang yang mempelajari bidang lain dan dengan sudut pandang yang berbeda dari seorang statistisi
DiskusiIRON AND ZINC IN INFANCY: RESULTS FROM EXPERIMENTAL TRIALS IN SWEDEN AND INDONESIA Torbjrn Lind Epidemiology and Public Health Sciences, Department of Public Health and Clinical Medicine & Pediatrics Department of Clinical Sciences Ume University, 901 87 Ume, Sweden
DiskusiABSTRACT Background: Iron and zinc are difcult to provide in sufcient amounts in complementary foods to infants world-wide, resulting in high prevalence of both iron and zinc deciency. These deciency states cause anemia, delayed neurodevelopment, impaired growth, and increased susceptibility to infections such as diarrhea and respiratory infections.
DiskusiABSTRACT Background: Iron and zinc are difcult to provide in sufcient amounts in complementary foods to infants world-wide, resulting in high prevalence of both iron and zinc deciency. These deciency states cause anemia, delayed neurodevelopment, impaired growth, and increased susceptibility to infections such as diarrhea and respiratory infections.
DiskusiDesign: Two different intervention strategies; reduction of a possible inhibitor of iron and zinc absorption, i.e. phytate, or supplementation with iron and zinc, were applied to two different populations in order to improve iron and zinc nutrition: In a high-income population (Ume, Sweden), the amount of phytate in commonly consumed infant cereals was reduced. Healthy, term infants (n=300) were at 6 mo of age randomized to phytate-reduced infant cereals, conventional infant cereals, or infant formula and porridge. In a low income population (Purworejo, Indonesia), daily iron and zinc supplementation was given. Healthy, term infants (n=680) were at 6 mo randomized to supplementation with iron, zinc, a combination of iron and zinc, or placebo. Blood samples, anthropometrical measurements, and data on infant neurodevelopment and morbidity were collected. Also, in the Swedish study, detailed information on the dietary intake was recorded.
DiskusiDesign: Two different intervention strategies; reduction of a possible inhibitor of iron and zinc absorption, i.e. phytate, or supplementation with iron and zinc, were applied to two different populations in order to improve iron and zinc nutrition: In a high-income population (Ume, Sweden), the amount of phytate in commonly consumed infant cereals was reduced. Healthy, term infants (n=300) were at 6 mo of age randomized to phytate-reduced infant cereals, conventional infant cereals, or infant formula and porridge. In a low income population (Purworejo, Indonesia), daily iron and zinc supplementation was given. Healthy, term infants (n=680) were at 6 mo randomized to supplementation with iron, zinc, a combination of iron and zinc, or placebo. Blood samples, anthropometrical measurements, and data on infant neurodevelopment and morbidity were collected. Also, in the Swedish study, detailed information on the dietary intake was recorded.
DiskusiResults: In the Swedish study, the reduction of phytate had little effect on iron and zinc status, growth, development or incidence of diarrhea or respiratory infections, possibly due to the presence of high contents of ascorbic acid, which may counteract the negative effects of phytate. In the Indonesian study, signicant negative interaction between iron and zinc was evident for several of the outcomes; Hb and serum ferritin improved more in the iron only group compared to placebo or the combined iron and zinc group. Further, supplementation with iron alone improved infant psychomotor development and knee-heel length, whereas supplementation with zinc alone improved weight and knee-heel length compared to placebo. Combined iron and zinc supplementation did decrease the prevalence of iron deciency anemia and low serum zinc, but had no other positive effects. Vomiting was more common in the combined group.
DiskusiResults: In the Swedish study, the reduction of phytate had little effect on iron and zinc status, growth, development or incidence of diarrhea or respiratory infections, possibly due to the presence of high contents of ascorbic acid, which may counteract the negative effects of phytate. In the Indonesian study, signicant negative interaction between iron and zinc was evident for several of the outcomes; Hb and serum ferritin improved more in the iron only group compared to placebo or the combined iron and zinc group. Further, supplementation with iron alone improved infant psychomotor development and knee-heel length, whereas supplementation with zinc alone improved weight and knee-heel length compared to placebo. Combined iron and zinc supplementation did decrease the prevalence of iron deciency anemia and low serum zinc, but had no other positive effects. Vomiting was more common in the combined group.
DiskusiResults (continued): Analyses of dietary intake from the Swedish study showed that dietary iron intake in the 6-11 mo period was signicantly associated with Hb, but not serum ferritin at 9 and 12 mo, whereas the opposite was true in the 12-17 mo period, i.e. dietary iron intake was signicantly associated with serum ferritin, but not Hb at 18 mo.
DiskusiResults (continued): Analyses of dietary intake from the Swedish study showed that dietary iron intake in the 6-11 mo period was signicantly associated with Hb, but not serum ferritin at 9 and 12 mo, whereas the opposite was true in the 12-17 mo period, i.e. dietary iron intake was signicantly associated with serum ferritin, but not Hb at 18 mo.
DiskusiConclusions: The phytate content of commercial infant cereals does not seem to contribute to poor iron and zinc status of Swedish infants as feared. However, the current denitions of iron and zinc deciency in infancy may overestimate the problem, and a change in the recommended cutoffs is suggested. These studies also indicate that dietary iron is preferably channeled towards erythropoiesis during infancy, but to an increasing amount channeled towards storage in early childhood. This suggests that in evaluating dietary programs, Hb may be superior in monitoring response to dietary iron in infancy, whereas S-Ft may respond better later in childhood. However, as shown in this study, increasing Hb may not necessarily be an indicator of iron deciency, as more dietary iron increased Hb regardless of iron status.
DiskusiConclusions (continued): In the low-income setting combined supplementation with iron and zinc resulted in signicant negative interaction. Thus, it is not possible to recommend routine iron-zinc supplementation at the molar concentration and mode used in this study. It is imperative that further research efforts are focused at nding cost-effective strategies to prevent iron and zinc deciency in low-income populations.
Tujuan Penelitian Epidemiologi1. Mendeskripsikan status kesehatan populasi dengan cara melakukan enumerasi kejadian sakit, menghitung frekuensi relatif dan mendapatkan kecenderungan atau trend penyakit; 2. Menjelaskan penyebab penyakit dengan cara menentukan faktor yang menjadi sebab dari suatu penyakit tertentu dan cara transmisinya; 3. Melakukan prediksi kejadian sakit dan distribusi status kesehatan dalam populasi; 4. Melakukan pengendalian penyebaran penyakit dalam populasi dengan pencegahan kejadian sakit, penyembuhan kasus sakit, menambah lama hidup bersama dengan suatu penyakit, atau meningkatkan status kesehatannyaKleinbaum, D.G., Kupper, L. L. dan Morgenstern, H. (1982) Epidemiologic Research, Lifetime Learning Pub.Wadsworth, Inc.
Tujuan Penelitian Epidemiologi1. Mendeskripsikan status kesehatan populasi dengan cara melakukan enumerasi kejadian sakit, menghitung frekuensi relatif dan mendapatkan kecenderungan atau trend penyakit; describe 2. Menjelaskan penyebab penyakit dengan cara menentukan faktor yang menjadi sebab dari suatu penyakit tertentu dan cara transmisinya; explain 3. Melakukan prediksi kejadian sakit dan distribusi status kesehatan dalam populasi; predict 4. Melakukan pengendalian penyebaran penyakit dalam populasi dengan pencegahan kejadian sakit, penyembuhan kasus sakit, menambah lama hidup bersama dengan suatu penyakit, atau meningkatkan status kesehatannya controlKleinbaum, D.G., Kupper, L. L. dan Morgenstern, H. (1982) Epidemiologic Research, Lifetime Learning Pub.Wadsworth, Inc.
Tipe PenelitianObservasional (tanpa ada manipulasi atau perlakuan) Deskriptif Analitik Eksperimental (ada manipulasi atau perlakuan dengan randomisasi) Laboratorium Penelitian klinis Intervensi komunitas Quasi-eksperimental (ada manipulasi atau perlakuan tanpa randomisasi) Laboratorium/Klinis Program/Kebijakan
Tipe Penelitian
?populasi
Tipe Penelitian
populasi
Variabel
Tipe Penelitian
populasi
X 1 , X2 , . . . Y1 , Y2 , . . .
v. independen, v. penjelas, faktor, exposure, confounder v. dependen, outcome, response
Tipe Penelitian
populasi
sampel
Tipe Penelitian
non-random
populasisampling
sampel
Tipe Penelitian
random
populasisampling
sampel
Tipe Penelitian
random
populasisampling- simple - stratication - cluster - systematic
sampel
Tipe Penelitian
populasi
sampel
representasi populasi
Tipe Penelitian
populasi
sampel
data
x1 , x2 , . . . y 1 , y2 , . . .
Tipe Penelitian
populasi
sampel- pencacahan - pengukuran - wawancara - dst
data
Tipe PenelitianPenelitian observasional
XY
populasi
sampel
data
X apa adanya
Tipe PenelitianPenelitian eksperimental
XY
populasi
sampel
data
X di- manipulasi - intervensi - beri perlakuan dengan randomisasi
Tipe PenelitianPenelitian quasi-eksperimental
XY
populasi
sampel
data
X di- manipulasi - intervensi - beri perlakuan tanpa randomisasi
Desain Penelitian1 Terpapar Individu Tidak terpapar 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 Waktu 6 7 8 9 10
Desain Penelitian1 Terpapar Individu Tidak terpapar 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 Waktu 6 7 8 9 10
periode sehat
periode sakit
meninggal
Terpapar
Desain Penelitian1 Terpapar Individu 2 3 4 5 6 Tidak terpapar 7 8 9 10 0 1 2 3 4 5 Waktu 6 7 8 9 10 desain cross-sectional
periode sehat
periode sakit
meninggal
Terpapar
Desain Penelitian1 Terpapar Individu 2 3 4 5 6 Tidak terpapar 7 8 9 10 0 1 2 3 4 5 Waktu 6 7 8 9 10 desain cross-sectional
periode sehat
periode sakit
meninggal
Terpapar
Desain Penelitian1 Terpapar Individu 2 3 4 5 6 Tidak terpapar 7 8 9 10 0 1 2 3 4 5 Waktu 6 7 8 9 10 desain longitudinal - follow-up - cohort - prospective - retrospective
periode sehat
periode sakit
meninggal
Terpapar
Desain PenelitianApakah terpapar menyebabkan sakit ? 1 2 3 Individu 4 5 6 7 8 9 10 0 1 3 2 cross-sectional 4 5 Waktu 6 7 8 9 10
periode sehat
periode sakit
meninggal
Terpapar
Desain PenelitianApakah terpapar menyebabkan sakit ? 1 2 3 Individu 4 5 6 7 8 9 10 0 1 2 3 4 5 Waktu 6 cross-sectional 7 8 9 10
periode sehat
periode sakit
meninggal
Terpapar
Desain PenelitianApakah terpapar menyebabkan sakit ? 1 2 3 Individu 4 5 6 7 8 9 10 0 1 2 3 longitudinal 5 4 Waktu meninggal 6 7 8 9 10
periode sehat
periode sakit
Terpapar
Statistik dan Ukuran dalam EpidemiologiPrevalensi adalah banyaknya subyek yang mengalami kejadian tertentu atau menderita penyakit tertentu pada suatu waktu tertentu Insidensi adalah banyaknya subyek yang mengalam kejadian baru atau mendapatkan penyakit baru dalam suatu interval waktu tertentu Tingkat (rate) adalah banyaknya perubahan kuantitatif yang terjadi terkait dengan waktu
Prevalensid P = N d: banyaknya subyek yang mengalami kejadian tertentu atau menderita penyakit tertentu pada suatu waktu tertentu N : banyaknya subyek pada suatu waktu tersebut
Faktor-faktor yang mempengaruhi prevalensi:
InsidensiInsidensi Kumulatifd IK = N0 d: banyaknya subyek yang mengalami kejadian tertentu atau menderita penyakit tertentu dalam suatu interval waktu tertentu N0 : banyaknya subyek yang belum mengalami kejadian tertentu atau menderita penyakit tertentu pada awal interval waktu tersebut
InsidensiInsidensi (Incidence rate)d I= NT d: banyaknya subyek yang mengalami kejadian tertentu atau menderita penyakit tertentu dalam suatu interval waktu tertentu N T : Total waktu subyek yang belum mengalami kejadian tertentu atau menderita penyakit tertentu dalam interval waktu tersebut
(Istilah lain: person-time incidence rate, instantaneous incidence rate, force of morbidity, incidence-density, hazard)
Hubungan antara Prevalensi dgn. InsidensiBila prevalensi kecil dan tidak berubah menurut waktu prevalensi insidensi durasi
Faktor yang mempengaruhi Prevalencenaik karena turun karena
durasi penyakit yg panjang pasien hidup lama insidensi meningkat in-migrasi kasus out-migrasi penduduk sehat in-migrasi orang yg rentan meningkatnya diagnosis
durasi penyakit yg pendek pasien hidup singkat insidensi menurun in-migrasi penduduk sehat out-migrasi kasus out-migrasi orang yg rentan meningkatnya kesembuhan
Risk dan OddModel probabilitas biner (Bernoulli) S adalah probabilitas sukses (risk ) 1
G
Odd : (1 ) atau = 1
LikelihoodDari n = 10 orang diketahui outcome sukses (S) dan gagal (G) SSGSGGGSGG (misalnya sukses adalah terkena penyakit tertentu dan gagal adalah tidak terkena penyakit tertentu). Seberapa mungkin data ini berasal dari model binomial dengan (i) = 0,1; (ii) = 0,5?
LikelihoodDari n = 10 orang diketahui outcome sukses (S) dan gagal (G) SSGSGGGSGG (misalnya sukses adalah terkena penyakit tertentu dan gagal adalah tidak terkena penyakit tertentu). Seberapa mungkin data ini berasal dari model binomial dengan (i) = 0,1; (ii) = 0,5?L( | data) = (1 )(1 )(1 )(1 )(1 )(1 ) = 0,14 0,96 = 5,31 105
LikelihoodDari n = 10 orang diketahui outcome sukses (S) dan gagal (G) SSGSGGGSGG (misalnya sukses adalah terkena penyakit tertentu dan gagal adalah tidak terkena penyakit tertentu). Seberapa mungkin data ini berasal dari model binomial dengan (i) = 0,1; (ii) = 0,5?L( | data) = (1 )(1 )(1 )(1 )(1 )(1 ) = 0,14 0,96 = 5,31 105
L( | data) = (1 )(1 )(1 )(1 )(1 )(1 ) = 0,54 0,56 = 9,77 104
Likelihood
Likelihood
0 0.0
2
4
6
8
10
12
0.2
0.4
0.6
0.8
1.0
Likelihood
Likelihood
0
2
4
6
8
10
12
0,001194394
0.0
0.2
0.4
0.6
0.8
1.0
Normed Likelihood 0.0 0.0 0.2 0.4 0.6 S=4; G=6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 1.2
Likelihood
Likelihood1.2 Normed Likelihood 0.8 1.0
0.0
0.2
0.4
0.6
S=20; G=30
0.0
0.2
0.4
0.6
0.8
1.0
Likelihood1.2 Normed Likelihood 0.8 1.0
0.0
0.2
0.4
0.6
SGGGGSGGGG
0.0
0.2
0.4
0.6
0.8
1.0
Likelihood1.2 Normed Likelihood 0.8 1.0
0.0
0.2
0.4
0.6
SSSSSSGSSS
0.0
0.2
0.4
0.6
0.8
1.0
Likelihood Ratio1.2 Normed Likelihood 0.4 0,258 0.2 0.0 0.0 0.6 0.8 1.0
0.2
0.4
0.6
0.8
1.0
Likelihood Ratio1.2 Normed Likelihood 0.2 0.4 0.6 0.8 1.0
0.0
0.179
0.655 0.4 0.6 0.8 1.0
0.0
0.2
Likelihood Ratio1.2 Normed Likelihood 0.0 0.2 0.4 0.6 0.8 1.0
0.289 0.0 0.2 0.4
0.516 0.6 0.8 1.0
Log Likelihood0.0 Log Likelihood 3.0 0.0 2.0 1.0
0.2
0.4
0.6
0.8
1.0
Konsep InferensiFrequentist interval (kondensi) untuk suatu parameter (condence interval) diinterpretasikan sebagai coverage probability nilai parameter terletak dalam interval, bila sampel (studi) diulang banyak kali (interpretasi frekuensi relatif) Bayesian interval (kondensi) untuk suatu parameter diinterpretasikan berdasarkan anggapan bahwa parameter adalah variabel random yang nilainya terletak dalam suatu credible interval Likelihood interval (kondensi) untuk suatu parameter disusun berdasarkan likelihood ratio yang menunjukkan seberapa besar kemungkinan suatu model didukung oleh data yang diperoleh
Likelihood untuk InsidensiM
1M
1
2 1H1 2
M3
H
1
3H
1M: mati H: hidup
3
5
Likelihood untuk InsidensiM
0,3M
0,2 0,7H0,8
M0,1
H
0,9H 1M: mati H: hidup
Probabilitas untuk 4 outcom 0,3; 0,7 0,2 ; 0,7 0,8 0,1 ; 0,7 0,8 0,9
3
5
Likelihood untuk InsidensiUntuk interval yang semakin sempit, probabilitas kondisional (untuk M) menjadi semakin kecil pula, dan konvergen ke hazard rate (force of mortality )P (t T < t + h | T t) h0 h
= lim
Likelihood untuk InsidensiPoisson Likelihood Likelihood untuk dapat diturunkan dari likelihood binomial dengan menganggap probabilitas sukses adalah h dengan h kecil,L() = D exp(Y )
dengan D adalah banyaknya kejadian, Y adalah total waktu observasi. Log-likelihood untuk () = D log() Y Penduga untuk , = D/Y
Likelihood untuk InsidensiMisalkan ada 7 observasi dengan total waktu observasi 500 orang-tahun (person-years). Log-likelihood untuk () = 7 log() 500
log likelihood
39.5 0.005
38.5
37.5
0.010
0.015
0.020
0.025
0.030
Ukuran untuk Pengaruh FaktorTidak hanya melihat outcome saja namun juga faktor (v. independen, v. penjelas, paparan/exposure) Bergantung pada desain penelitian
Ukuran untuk Pengaruh FaktorSelisih resiko (risk difference) Rasio resiko (risk ratio) Odds ratio
Ukuran untuk Pengaruh FaktorDesain cohort Data terobservasi D E 1 2 1 n11 n12 N1 2 n21 n22 N2Waktu
Model probabilitas D E 1 2 1 1 1 1 1 2 2 1 2 1Waktu
RD = 1 2
Ukuran untuk Pengaruh FaktorDesain cohort Data terobservasi D E 1 2 1 n11 n12 N1 2 n21 n22 N2Waktu
Model probabilitas D E 1 2 1 1 1 1 1 2 2 1 2 1Waktu
RR =
1 2
Ukuran untuk Pengaruh FaktorDesain cohort Data terobservasi D E 1 2 1 n11 n12 N1 2 n21 n22 N2Waktu
Model probabilitas D E 1 2 1 1 1 1 1 2 2 1 2 1Waktu
OR =
1 (12 ) 2 (11 )
Inferensi untuk OR, RR dan RDEstimasi titik untuk OR n11 n22 OR = n12 n21 alternatifnya, untuk menghindari masalah bila ada nij = 0 (n11 + 0,5)(n22 + 0,5) OR = (n12 + 0,5)(n21 + 0,5) galat standar (standard error ) untuk log OR log OR = 1 1 1 1 + + + n11 n12 n21 n221/2
Interval kondensi (1 )100% untuk log OR log OR Z/2 log OR
Inferensi untuk OR, RR dan RDEstimasi titik untuk RD RD = 1 2 galat standar (standard error ) untuk 1 2 1 (1 1 ) 2 (1 2 ) (1 2 ) = + n1 n2 Interval kondensi (1 )100% untuk 1 2 (1 2 ) Z/2 (1 2 ), (1 2 ) sama seperti (1 2 ) dengan i diganti i 1/2
Inferensi untuk OR, RR dan RDEstimasi titik untuk RR 1 RR = 2 galat standar (standard error ) untuk log RR log RR = 1 1 1 2 + 1 n 1 2 n 21/2
Interval kondensi (1 )100% untuk log RR log RR Z/2 log RR
Perancuan (confounding)Variable perancu adalah variabel yang memenuhi dua kondisi: merupakan faktor resiko mempunyai hubungan dengan variabel paparan tapi bukan merupakan konsekuensi dari variabel paparan
Perancuan (confounding)F adalah perancu antara D dengan EE D E D E D
F
F
F
D : variabel respon E : variabel paparan F : variabel perancu
Perancuan (confounding)F bukan perancu antara D dengan EE D F E D F F F E D E D
Perancuan (confounding)Bedsores study. Manula yang mengalami kecelakaan, seperti terjatuh, seringkali menjadi tidak dapat bangun dan bergerak dalam waktu lama. Hal ini dapat mengakibatkan bedsores, yaitu luka pada kulit yang dapat berlanjut ke otot dan tulang dan dapat berakibat fatal. Meninggal 79 286 365 hidup 745 8.290 9.035 Total 824 8.576 9.400
Bedsore tidak Bedsore Total79/824 RR= 286/8576 = 2,9
Perancuan (confounding)Adakah kemungkinan variabel perancu?Bedsore
Kematian
F
Perancuan (confounding)Tingkat keparahan tinggi akibat penyakit lain Meninggal hidup Total Bedsore 55 51 106 tidak Bedsore 5 5 10 Total 60 56 116 Tingkat keparahan rendah akibat penyakit lain Meninggal hidup Total Bedsore 24 694 718 tidak Bedsore 281 8.285 8.566 Total 305 8.979 9.284
RR= 55/106 = 1,04 5/10
24/718 RR= 281/8566 = 1,02
Metode AnalisisRespon Kontinu Variabel penjelas Biner Nominal, 2 kategori atau lebih Ordinal Kontinu Nominal dan kontinu Kategorik dan kontinu Kategorik Kontinu Kategorik dan kontinu Nominal Kategorik dan kontinu Kategorik dan kontinu Kategorik Kategorik dan kontinu Metode t-test, z-test ANAVA ANAVA Regresi Ganda Analisis Kovariansi Regresi Ganda Tabel kontingensi Regresi Logistik Regresi Logistik, probit atau model dose-response Regresi Logistik Tabel kontingensi Regresi Logistik Nominal Regresi Logistik Ordinal Model Log-linear, Regresi Poisson Regresi Poisson
Biner
Nominal, 2 kategori atau lebih Ordinal Cacah
Metode AnalisisRespon Durasi (survival) Respon berkorelasi Variabel penjelas Biner Kategorik dan kontinu Kategorik dan kontinu Metode Log-rank test Survival analysis Generalized Estimating equation Multilevels model Analisis Data Longitudinal Analisis Data Panel
Metode Analisis
Masih banyak variasi metode yang belum disebutkan; masih banyak masalah yang memerlukan pengembangan metode baru atau modikasi metode!
Metode AnalisisLangkah-langkah umum Analisis statistik: 1. Deskripsi data 2. Spesikasi model 3. Estimasi parameter model 4. Uji Kecocokan Model 5. Inferensi
Sensitivity, Specicity & Predictive ValueDalam diagnosa atau screening, T + : diagnosa atau screening menunjukkan tes positif T : diagnosa atau screening menunjukkan tes negatif D+ : kenyataannya positif ada penyakit D : kenyataannya tidak ada penyakit (negatif) Sensitivity = P (T + | D+) Specicity = P (T | D) Predictive Value+ = P (D+ | T +) Predictive Value = P (D | T )
Sensitivity, Specicity & Predictive ValueMenggunakan Teorema Bayes: Predictive Value+ = P (D+ | T +) P (D+ T +) = P (T +) P (D+)P (T + | D+) = P (D+)P (T + | D+) + P (D)P (T + | D) Prevalence Sensitivity = prev. sens. + (1 prev.) (1 spec.)
Sensitivity, Specicity & Predictive ValueMenggunakan Teorema Bayes: Predictive Value = P (D | T ) P (D T ) = P (T ) P (D)P (T | D) = P (D)P (T | D) + P (D+)P (T | D+) (1 Prevalence) Specicity = (1 prev.) spec. + prev. (1 sens.)
Sensitivity, Specicity & Predictive ValueContoh: Suatu tes sitologi (cytological test) dilakukan untuk screening kanker rahim pada wanita. Diperoleh data 24.103 wanita yang terdiri atas 379 wanita yang diketahui sudah menderita kanker rahim (dengan tes yang dianggap sebagai gold standar ):T 23.362 225 T+ 362 154
D D+
Total 23.724 379
Hitung sensitivity dan specicity tes tersebut!
Sensitivity, Specicity & Predictive ValueT 23.362 225 T+ 362 154
D D+
Total 23.724 379
154 sensitivity = 379 = 0,406 = 40,6% 23.362 specicity = 23.724 = 0,985 = 98,5%
Interpretasi: Jika tes digunakan untuk wanita yang tidak menderita kanker rahim, tes hampir pasti akan negatif ( specicity = 98,5% cukup besar) Jika tes digunakan untuk wanita yang menderita kanker rahim, peluang tidak terdeteksi besar ( sensitivity = 40,6 % rendah; false negatif 59,4%)
Sensitivity, Specicity & Predictive ValuePredictive Value + : PV + ==
Prevalence Sensitivity prev. sens. + (1 prev.) (1 spec.) Prevalence 0,406 prev. 0,406 + (1 prev.) (1 0,985)
Predictive Value - : PV == (1 Prevalence) Specicity (1 prev.) spec. + prev. (1 sens.) (1 Prevalence) 0,985 (1 prev.) 0,985 + prev. (1 0,406)
Sensitivity, Specicity & Predictive ValuePV + dan PV - untuk berbagai nilai prevalensi dengan spec=98,5% dan sens=40,6% prevalensi PV + PV 0,0010 0,0264 0,999 0,0157 0,3015 0,990 0,0500 0,5876 0,969 0,1000 0,7505 0,937 0,5000 0,9644 0,624
Kurva ROCROC = receiver operating characteristic berguna untuk respon diagnosis (screening test) yang kontinu atau mempunyai lebih dari dua nilai (jenis respon) menghubungkan sensitivity dengan 1-specicity Area di bawah kurva ROC dapat digunakan untuk menilai keakuratan suatu diagnosis (tes)
Kurva ROCDiketahui probabilitas skor CT image (computed tomographic image) untuk pasien syaraf oleh seorang radiolog adalah sebagai berikut: Status Penyakit (D)Normal (D) Abnormal (D+)
(1)0,303 0,028
Skor dari radiolog (2) (3) (4)0,055 0,018 0,055 0,018 0,101 0,101
(5)0,018 0,303
0,532 0,468
(1) hampir pasti normal; (2) mungkin normal; (3) tidak dapat ditentukan (4) mungkin abnormal; (5) hampir pasti abnormal
Nilai probabilitas pada tiap sel adalah irisan peristiwa D+, D dengan T(1) , T(2) , T(3) , T(4) , T(5) , misalnya P (D+ T(1) ) = 0,028, P (D T(5) ) = 0,018 P (D+) = 0,468 adalah prevalensi
Kurva ROCDiketahui probabilitas skor CT image (computed tomographic image) untuk pasien syaraf oleh seorang radiolog adalah sebagai berikut: Status Penyakit (D)Normal (D) Abnormal (D+)
(1)0,303 0,028
Skor dari radiolog (2) (3) (4)0,055 0,018 0,055 0,018 0,101 0,101
(5)0,018 0,303
0,532 0,468
(1) hampir pasti normal; (2) mungkin normal; (3) tidak dapat ditentukan (4) mungkin abnormal; (5) hampir pasti abnormal
Kriteria tes positif: skor 2 sens=(0,018 + 0,018 + 0,101 + 0,303)/0,468 = 0,94 spec=0,303/0,532 = 0,57
Kurva ROCDiketahui probabilitas skor CT image (computed tomographic image) untuk pasien syaraf oleh seorang radiolog adalah sebagai berikut: Status Penyakit (D)Normal (D) Abnormal (D+)
(1)0,303 0,028
Skor dari radiolog (2) (3) (4)0,055 0,018 0,055 0,018 0,101 0,101
(5)0,018 0,303
0,532 0,468
(1) hampir pasti normal; (2) mungkin normal; (3) tidak dapat ditentukan (4) mungkin abnormal; (5) hampir pasti abnormal
Kriteria tes positif: skor 3 sens=(0,018 + 0,101 + 0,303)/0,468 = 0,90 spec=(0,303 + 0,303)/0,532 = 0,67
Kurva ROCSensitivity dan Specicity berdasarkan beberapa kriteria tes positif. kriteria tes positif sensitivity specity 1-specity 1 skor 1,00 0,00 1,00 2 skor 0,94 0,57 0,43 3 skor 0,90 0,67 0,33 4 skor 0,86 0,78 0,22 5 skor 0,65 0,97 0,03 5 < skor 0,00 1,00 0,00
Kurva ROCKurva ROC(0.43, 0.94) (0.33, 0.90) (0.22, 0.86) (0.03, 0.65) (1.00, 1.00)
sensitivity
(0.00, 0.00)
1-specicity
Kurva ROCKurva ROC
sensitivity
1-specicity
Kurva ROCKurva ROC
sensitivity
1-specicity
Regresi LogistikData studi tentang hubungan Penyakit jantung koroner dengan Tekanan pekerjaan:Tertekan krn. Pekerjaan Ya TidakRisk ratio: RR = 97/404 200/1609 = 1,932
Penyakit jantung koroner Ya 97 200 Tidak 307 1409 Total 404 1609
Regresi LogistikMenggunakan R:> twoby2(dt$E,dt$D) 2 by 2 table analysis: -----------------------------------------------------Outcome : Y Comparing : Y vs. T Y T Y 97 307 T 200 1409 P(Y) 95% conf. interval 0.2401 0.2009 0.2842 0.1243 0.1091 0.1413 95% conf. interval 1.5554 2.3987 1.6956 2.9221 1.6754 2.9429 0.0674 0.1693
Relative Risk: Sample Odds Ratio: Conditional MLE Odds Ratio: Probability difference:
1.9316 2.2259 2.2249 0.1158
Exact P-value: 0 Asymptotic P-value: 0
Regresi LogistikYi adalah variabel random Bernoulli untuk individu iy P (Yi = yi ) = i i (1 i )1yi ,
yi = 0, 1
Setiap individu i mempunyai karakteristik berupa kovariat xi yang mempengaruhi i dalam bentuk 1 i = 1 + exp((0 + 1 xi )) Secara umum i adalah fungsi logistik eZ 1 , atau f (Z) = f (Z) = Z 1+e 1 + eZ dengan Z = 0 + 1 x1 + 1 x1 + + p adalah fungsi linear dari p variabel penjelas.
Regresi LogistikModeli log = 0 + 1 x1i + 2 x2i + + pi 1 i
ataulogit() = 0 + 1 x1i + 2 x2i + + pi
Estimasi = (0 , 1 , . . . , p ) dapat diperoleh dengan MLE untuk fungsi likelihoodn
L() =i=1
P (Yi = yi ) [exp(0 + 1 x1i + 2 x2i + + pi )]yi 1 + exp(0 + 1 x1i + 2 x2i + + pi )
=
Regresi LogistikInterpretasi parameter Untuk modellogit(i ) = 0 + 1 xi i = exp [0 + 1 xi ] 1 i oddsxi = exp [0 + 1 xi ] dengan xi = Sehingga odds1 e0 +1 OR = = = e1 odds0 e0 0 1 i tdk terpapar i terpapar
Regresi LogistikEstimasi parameter dan OR Program statistika seperti R, SPSS, Epi-Info, STATA menyediakan fasilitas untuk estimasi . Estimasi titik dan interval kondensi (1 )100% untuk OR: OR = exp() exp( Z/2 SE())
Regresi LogistikContoh dengan R:> m round(ci.logistik(m),digits=3) coef.p s.err L U ecoef.p eL eU (Intercept) -1.952 0.076 -2.100 -1.804 0.142 0.122 0.165 E 0.800 0.139 0.528 1.072 2.226 1.696 2.922
Diperoleh interval kondensi untuk OR 2,226 (1,696 2,922) RR dan RD ? Gunakan estimasi probabilitas (x) dari model regresi. Probabilitas mendapatkan penyakit jantung untuk individu yang terpapar P (yi = 1 | xi = 1) adalah> predict(m,newdata=data.frame(E=1),type="response") [1] 0.240099
Regresi LogistikPenggunaan Regresi Logistik berdasarkan desain tertentu Dapat digunakan untuk menghitung RR, RD, OR dalam desain cohort (probabilitas tiap-tiap individu , (xi ), dapat diestimasi) Hanya dapat digunakan untuk menghitung OR dalam desain case-control
Regresi PoissonDistribusi Poissonx e , P (X = x) = x! x = 0, 1, 2, . . .
mempunyai mean dan variansi
Regresi PoissonContoh: Untuk menyelidiki infeksi pada suatu populasi organisme tertentu, sering tidak mungkin untuk meneliti tiap-tiap individu. Organisme tersebut dibagi dalam kelompok-kelompok dan kelompok tersebut dianggap sebagai unit. N = banyaknya organisme n = banyaknya kelompok m = banyaknya organisme tiap kelompok, N = nm (dengan menganggap m sama untuk tiap kelompok) Misalnya X adalah banyaknya organisme yang tidak terinfeksi, variabel random X kemungkinan besar dapat dimodelkan dengan Poisson,
Regresi PoissonData: yi banyaknya observasi cacah pada unit i; si ukuran tiap unit i; dan karakteristik tiap unit (kovariat) xi , i = 1, 2, . . . , n Model:E(Yi | Xi ) = i = si (xi ) = si exp(0 + 1 xi ), log i = log si + 0 + 1 xi
atau
dengan (xi ) dinamakan resiko unit i.si dapat berupa: banyaknya anggota populasi interval waktu luasan exposure time
Regresi PoissonDengan asumsi Yi Poisson, diperoleh fungsi likelihood:n
L() =i=1 n
P (Yi = yi ) [si (xi )]yi exp[si (xi )] yi !
=i=1
Dapat digunakan beberapa program statistika seperti R, STATA, SAS untuk estimasi
Regresi PoissonInterpretasi parameter: Untuk modellog i = log si + 0 + 1 xi dengan xi = Sehingga RR = = E(Yi | Xi = 1) E(Yi | Xi = 0) si exp(0 + 1 ) si exp(0 ) 0 1 i tdk terpapar i terpapar
= e1
Regresi PoissonData diperoleh dari studi awal tentang akibat buruk merokok bagi kesehatan pada tahun 1951. Kematian akibat penyakit jantung koroner dikategorikan menurut umur dan status merokok.Kel. Umur 35 44 45 54 55 64 65 74 75 84 perokok kematian person-years 32 52407 104 43248 206 28612 186 12663 102 5317 bukan perokok kematian person-years 2 18790 12 10673 28 5710 28 2585 31 1462
Regresi PoissonTingkat kematian akibat penyakit jantung koroner per 100.000 person-years untuk perokok dan bukan perokok 2000 kematian per 100.000 per tahun 0 3544 500 1000 1500
4554
5564 kelompok umur
6574
7584
Regresi PoissonModel 1:log i = log(si ) + 1 x1i + 2 x2i + 3 x1i x2i + 4 x2 , i = 1, . . . , 10 1idengan i : mean dari kematian si : person-years x1i : perokok atau bukan; x2i : usia 1, 2, 3, 4, 5 ; x1i x2i : interaksi (hasil kali) antara x1i dengan x2i ; x2 : kuadrat umur 1i
Regresi PoissonModel 1:Parameter 0 1 2 3 4 Estimasi -10,79 1,44 2,37 -0,19 -0,30 SE 0,450 0,372 0,207 0,027 0,097 RR 4,22 10,77 0,82 0,74 Int-konf. 95% RR 2,04 8,76 7,16 16,18 0,78 0,87 0,61 0,89
Regresi PoissonModel 2:log i = log(si ) + 1 x1i + 2 x2i + 3 x3i + 4 x4i + 5 x5i + 6 x1i x2i + 7 x1i x3i + 8 x1i x4i + 9 x1i x5i i = 1, 2, . . . , 10dengan i : mean dari kematian si : person-years x1i : perokok atau bukan; xki , k = 2, 3, . . . , 5: kelompok umur 35 44, 45 54, . . ., 75 84 x1i xki , h = 2, 3, . . . , 5: interaksi (hasil kali) antara x1i dengan kelompok umur xki
Regresi PoissonModel 2: Model 1:Parameter 0 1 2 3 4 5 6 7 8 9 Estimasi -9,15 1,75 2,36 3,83 4,62 5,29 -0,99 -1,36 -1,44 -1,85 SE 0,71 0,73 0,76 0,73 0,73 0,73 0,79 0,76 0,76 0,76 RR 0,00 5,74 10,56 46,07 101,76 199,21 0,37 0,26 0,24 0,16 Int-konf 95% RR 0,00 0,00 1,37 23,94 2,36 47,20 10,97 193,39 24,24 427,18 47,68 832,36 0,08 1,75 0,06 1,13 0,05 1,04 0,04 0,70
Data LongitudinalKarakteristik data longitudinal Individu (subyek, unit sampel) diamati dalam suatu periode waktu tertentu lebih dari satu kali Pengukuran berulang pada suatu individu (subyek, unit sampel)
Data LongitudinalKemampuan Membaca
Umur
Data LongitudinalKemampuan Membaca
Umur
Data LongitudinalKemampuan Membaca
Umur
Data LongitudinalJenis data yang berkaitan dengan data longitudinal: Data Panel Data Survival, Antar Kejadian (Event History ) Data Runtun Waktu
KeuntunganDapat digunakan untuk mengetahui pola perubahan Setiap individu dapat menjadi kontrol bagi dirinya sendiri Dapat membedakan efek dari umur dengan efek dari cohort maupun efek dari periode Memungkinkan untuk meneliti kausalitas
Eksplorasi DataMetode Statistik: Eksploratori (deskriptif) konrmasi (inferensial)
Eksplorasi DataMetode Statistik: Eksploratori (deskriptif) konrmasi (inferensial) Eksplorasi untuk data longitudinal: tampilkan sebanyak mungkin data mentah daripada hanya ringkasannya tonjolkan pola atau ringkasannya identikasilah baik pola cross-sectional maupun longitudinal identikasilah individu atau observasi yang tidak biasa (outliers)
Bentuk Umum Data Longitudinalsubyek 1 1 . . . 1 2 2 . . . 2 . . . m m . . . m observasi 1 2 . . . n1 1 2 . . . n1 . . . 1 2 . . . nm waktu t11 t12 . . . t1n1 t21 t22 . . . t2n1 . . . t21 t22 . . . t2n1 respon y11 y12 . . . y1n1 y21 y22 . . . y2n1 . . . ym1 ym2 . . . ymn1 kovariat x111 x121 . . . x1n1 1 x211 x221 . . . x2n1 1 . . . xm11 xm21 . . . x2m1 1... ... . . . ... ... ... . . . ... . . . ... ... . . . ... x11p x12p . . . x1n1 p x21p x22p . . . x2n1 p . . . xm1p xm2p . . . xmn1 p
Bentuk Umum Data LongitudinalContoh : Suatu studi dilakukan untuk merehabilitasi pasien stroke. Ada 3 perlakuan dalam studi ini, yaitu: A Terapi yang baru B Program rehabilitasi yang sekarang digunakan dalam rumah sakit yang sama C Program perawatan biasa yang dilakukan dalam rumah sakit yang lain Setiap kelompok perlakuan terdiri dari 8 pasien yang diamati selama 8 minggu. Respon yang diperoleh adalah Bartel index, yaitu skor yang menunjukkan kemampuan fungsional pasien, nilai yang tinggi menunjukkan kemampuan yang baik (maksimum 100).
Bentuk Umum Data Longitudinalsubyek 1 2 3 . . . 9 . . . kovariat (perlakuan) A A A B 1 45 20 50 40 respon (pada minggu ke-) 2 3 4 5 6 7 45 45 45 80 80 80 25 25 25 30 35 30 50 55 70 70 75 90 55 ... 60 70 ... 80 85 90 8 90 50 90 90
Bentuk Umum Data Longitudinalsubyek 1 1 1 1 1 1 1 1 . . . 9 9 9 9 9 9 9 9 . . . observasi (minggu ke-) 1 2 3 4 5 6 7 8 1 2 3 4 5 6 7 8 respon 45 45 45 45 80 80 80 90 ... 40 55 60 70 80 85 90 90 ... kovariat (perlakuan) A A A A A A A A B B B B B B B B
Bentuk Umum Data Longitudinal100
A 80
B skor 60
C 40 0 0 20
2
4 minggu
6
8
Bentuk Umum Data Longitudinal20 80 20 80 20 80 20 80 80 0,55 20 80
m1
0,93
0,88
0,83
0,79
0,71
0,62
m2
0,92
0,88
0,85
0,79
0,70
0,64
20
80
20
m4
0,92
0,88
0,83
0,7780 20 80 20
m580
0,97
0,91 0,96
0,88
m6
0,93 0,98
20
m780
m820 80 20 80 20 80 20 80
20
20
m3
0,95
0,91
0,85
0,77
0,70
80
Pemodelan Data LongitudinalPrinsip Pemodelan: Permasalahan ilmiah diformulasikan sebagai model regresi - var respons var penjelas - variable penjelas awal (baseline) yang tetap sepanjang waktu - variabel yang berubah sepanjang waktu (time-varying expl. variables) Korelasi (asosiasi) karena pengukuran berulang pada individu yang sama, atau observasi berulang
NotasiIndividu: i = 1, . . . , m Observasi pada individu i: jh = 1, . . . , ni Total observasi: N = Variabel respon: variabel random Yij Yi = (Yi1 , . . . , Yini ) Y = (Y1 , . . . , Ym )m i=1 ni
Waktu observasi aktual: tij respon observasi yij yi = (yi1 , . . . , yini ) y = (y1 , . . . , ym )
Variabel penjelas: xij = (xij1 , . . . , xijp )T , vektor berukuran p 1 Xi = (xi1 , . . . , xini ), matriks berukuran ni p
NotasiMean Yi untuk individu i: E(Yi ) = i Variansi Yi ; Matriks Kovariansi ni ni untuk individu i: vi11 . . . vi1ni Var(Yi ) = . . . vijk ... vini 1 . . . vini ni dengan vijk = Cov(Yij , Yik )
Pendekatan PemodelanModel linear umum Model marginal (marginal, population average) Model efek random (random effects; subject specic) Model transisi (transition)
Contoh PemodelanNaive analysis (pooled analysis) Model 1:E(Yi | Xi ) = 0 + 1 X1i + 2 X2i + 3 X3i , i = 1, . . . , n
denganX1i
1 i mendapat perlakuan B = 0 i mendapat perlakuan selain B 1 = 0 i mendapat perlakuan C i mendapat perlakuan selain C
X2i
X3i = 1, 2, . . . , 8 minggu pengamatan n = 24 8 = 192, 24 pasien (terbagi dalam 3 grup perlakuan) diamati selama 8 minggu
Contoh PemodelanNaive analysis (pooled analysis) Model 2:E(Yi | Xi ) = 0 + 1 X1i + 2 X2i + 3 X3i + 4 (X1i X3i ) + 5 (X2i X3i ),
i = 1, . . . , n
dengan(X1i X3i ) dan (X2i X3i ) adalah interaksi antara perlakuan dengan waktu.
Contoh PemodelanParameter Model 1: 0 1 2 3 Model 2: 0 1 2 3 4 5 Estimasi 36,84 -5,63 -12,11 4,76 29,82 3,35 -0,02 6,32 -1,99 -2,69 SE 3,971 3,715 3,715 0,662 5,774 8,166 8,166 1,143 1,617 1,617
Model Linear NormalE(y) = X = , y N (, V)
X1 X2 X = . , . . Xn
1 2 = . , . . p
dengan p adalah banyaknya parameter model, n adalah banyaknya observasi.
Model Linear NormalEstimasi parameter model Generalized Least Squares Maximum Likelihood Generalized Estimating Equation
Model Linear NormalParameter Naive Model 1: 0 1 2 3 Model 2: 0 1 2 3 4 5 36.84 (3.971) -5.63 (3.715) -12.11 (3.715) 4.76 (0.662) 29.82 (5.774) 3.35 (8.166) -0.02 (8.166) 6.32 (1.143) -1.99 (1.617) -2.69 (1.617) Estimasi (SE) Random effects 36.84 ( 7.307) -5.62 (10.177) -12.10 (10.177) 4.76 ( 0.282) 29.82 ( 7.497) 3.34 (10.602) -0.02 (10.602) 6.32 ( 0.467) -1.99 ( 0.660) -2.68 ( 0.660) GEE-indep 36.84 (8.003) -5.63 (9.519) -12.11 (9.519) 4.76 (0.628) 29.82 (10.175) 3.35 (11.633) -0.02 (10.895) 6.32 ( 1.131) -1.99 ( 1.477) -2.69 ( 1.470)
Data Durasi/Survival23 16 18 20 24 15 18 19 19 20
grup 1
grup 2
Data terobservasi D E 1 2 1 0 5 5 2 2 3 5
E = 1 adalah grup 1 E = 2 adalah grup 2 D = 1 mendapatkan event (misalnya sakit) D = 2 tidak mendapatkan event
Data Durasi/Survival23 16 18 20 24 15 18 19 19 20
grup 1
grup 2
Data terobservasi D E 1 2 1 0 5 5 2 4 1 5
E = 1 adalah grup 1 E = 2 adalah grup 2 D = 1 mendapatkan event (misalnya sakit) D = 2 tidak mendapatkan event
Data Durasi/Survival23 16 18 20 24 15 18 19 19 20
grup 1
grup 2
Data terobservasi D E 1 2 1 1 4 5 2 5 0 5
E = 1 adalah grup 1 E = 2 adalah grup 2 D = 1 mendapatkan event (misalnya sakit) D = 2 tidak mendapatkan event
Fungsi SurvivalVariabel random T adalah waktu antar kejadian atau durasi, T >0 Probabilitas satu individu hidup (tinggal dalam suatu status) lebih lama daripada tS(t) = P (T > t) S(t) adalah fungsi non-increasing terhadap waktu t dengan sifat S(t) = 1 0 untuk t = 0 untuk t =
Fungsi Survival1.0 S(t) 0.0 0.0 0.2 0.4 0.6 0.8
0.5
1.0 t
1.5
2.0
Fungsi SurvivalPenduga untuk S(t) bila data tidak tersensor = s S(t) N
dimana s adalah banyaknya individu yang masih hidup lebih lama dari t ; N adalah total banyaknya individu Hubungan S(t) dengan distribusi kumulatif F (t)S(t) = 1 F (t)
Fungsi HazardTingkat (rate) terjadinya suatu eventP (t T < t + t | T t) h(t) = lim t0 t
Hubungan h(t), S(t) dan f (t)h(t) = f (t) S(t)
Fungsi Hazard Kumulatift
H(t) =0
h(x)dx
Hubungan H(t) dengan S(t)H(t) = log S(t)
Fungsi Hazard5 h(t) 0 0.0 1 2 3 4
0.5
1.0 t
1.5
2.0
Fungsi Hazard5 h(t) 0 0.0 1 2 3 4
0.5
1.0 t
1.5
2.0
Fungsi Hazard5 h(t) 0 0.0 1 2 3 4
0.5
1.0 t
1.5
2.0
Fungsi Hazard5 h(t) 0 0.0 1 2 3 4
0.5
1.0 t
1.5
2.0
Fungsi Hazard5 h(t) 0 0.0 1 2 3 4
0.5
1.0 t
1.5
2.0
Kaplan-MeierEstimator untuk S(t) (sering disebut juga sebagai Product-Limit estimator) S(t) = 1ti t (1 di Yi )
jika t < t1 jika ti t
dimana di adalah banyaknya event dan Yi adalah banyaknya individu yang beresiko (number at risk )
Kaplan-MeierVariansi dari KM estimator (Greenwoods formula) var[S(t)] = S(t)2ti t
di Yi (Yi di ) S(t)] Y (t)
Alternatif: var[S(t)] = S(t)2 [1
Kaplan-MeierContoh: Diketahui data survival sebagai berikut: 23 16+ 18+ 20+ 24+ 15 18 19 19 20 (Tanda + menunjukkan tersensor). Hitung estimasi S(t) menggunakan Kaplan-Meier:ti Yi di S(t) var(S(t))
Int-konf 95% S(t) 0,7320 1,000 0,5641 1,000 0,2722 1,000 0,1655 0,937 0,0384 1,000
15 18 19 20 23
10 8 6 4 2
1 1 2 1 1
0,900 0,787 0,525 0,394 0,197
0,0949 0,1340 0,1759 0,1742 0,1642
Nelson-AalenEstimator untuk fungsi hazard kumulatif: H(t) = 0di ti t Yi
jika t < t1 jika ti t
dengan variansidi Yi2
Var(H(t)) =ti t
Membandingkan Distribusi SurvivalMembandingkan dua populasi yang masing-masing mempunyai fungsi survival S1 (t) dan S2 (t) Hipotesis null: H0 : S1 (t) = S2 (t) Hipotesis alternatif: H1 : S1 (t) > S2 (t) H1 : S1 (t) < S2 (t) H1 : S1 (t) = S2 (t)
Membandingkan Distribusi SurvivalMetode Non-parametrik Untuk data tidak tersensor Wilcoxon (1945) Mann-Whitney (1947) Sign test (1977)
Membandingkan Distribusi SurvivalMetode Non-parametrik Untuk data tersensor Gehans generalized Wilcoxon test (1965) the Cox-Mantel test (Cox 1959, 1972; Mantel, 1966) the logrank test (1972) Peto and Petos generalized Wilcoxon test (1972) Coxs F-test (1964)
Membandingkan Distribusi SurvivalMetode Non-parametrik Untuk data tersensor Gehans generalized Wilcoxon test (1965) the Cox-Mantel test (Cox 1959, 1972; Mantel, 1966) the logrank test (1972) Peto and Petos generalized Wilcoxon test (1972) Coxs F-test (1964)
Logrank TestBerdasarkan observed dan expected event pada setiap event-time Untuk 2 grup Statistik penguji:(O1 E1 )2 (O2 E2 )2 = + E1 E22
dengan 2 Chi-square(df=1)
Logrank TestContoh: grup 1: 23, 16+, 18+, 20+, 24+ grup 2: 15, 18, 19, 19, 20H0 : S1 (t) = S2 (t) H1 : S1 (t) = S2 (t)
Logrank TestContoh: grup 1: 23, 16+, 18+, 20+, 24+ grup 2: 15, 18, 19, 19, 20H0 : S1 (t) = S2 (t) H1 : S1 (t) = S2 (t)
t dt
n1t
n2t
e1t
e2t
t : event-time dt : banyaknya event n1 , n2 : number at risk e1t , e2t : expected event
Logrank TestContoh: grup 1: 23, 16+, 18+, 20+, 24+ grup 2: 15, 18, 19, 19, 20H0 : S1 (t) = S2 (t) H1 : S1 (t) = S2 (t)
t dt 15 18 19 20 23
n1t
n2t
e1t
e2t
t : event-time dt : banyaknya event n1 , n2 : number at risk e1t , e2t : expected event
Logrank Test23 16 18 20 24 15 18 19 19 20
grup 1
grup 2
t dt 15 18 19 20 23
n1t
n2t
e1t
e2t
t : event-time dt : banyaknya event n1 , n2 : number at risk e1t , e2t : expected event
Logrank Testgrup 1
grup 2
t dt 15 1 18 19 20 23
n1t 5
n2t 5
e1t
e2t
t : event-time dt : banyaknya event n1 , n2 : number at risk e1t , e2t : expected event
Logrank Testgrup 1
grup 2
t dt 15 1 18 19 20 23
n1t 5
n2t 5
e1t
e2t e1t = e2t =n1t n1t +n2t n2t n1t +n2t
dt dt
Logrank Testgrup 1
grup 2
t dt 15 1 18 19 20 23
n1t 5
n2t 5
e1t 0,5
e2t 0,5 e1t = e2t =n1t n1t +n2t n2t n1t +n2t
dt dt
Logrank Testgrup 1
grup 2
t dt 15 1 18 1 19 20 23
n1t 5 4
n2t 5 4
e1t 0,5 0,5
e2t 0,5 0,5
Logrank Testgrup 1
grup 2
t dt 15 1 18 1 19 2 20 23
n1t 5 4 3
n2t 5 4 3
e1t 0,5 0,5 1,0
e2t 0,5 0,5 1,0
Logrank Testgrup 1
grup 2
t dt 15 1 18 1 19 2 20 1 23
n1t 5 4 3 3
n2t 5 4 3 1
e1t 0,5 0,5 1,0 0,75
e2t 0,5 0,5 1,0 0,25
Logrank Testgrup 1
grup 2
t dt 15 1 18 1 19 2 20 1 23 1
n1t 5 4 3 3 2
n2t 5 4 3 1 0
e1t 0,5 0,5 1,0 0,75 1,0
e2t 0,5 0,5 1,0 0,25 0
Logrank TestContoh: grup 1: 23, 16+, 18+, 20+, 24+ grup 2: 15, 18, 19, 19, 20H0 : S1 (t) = S2 (t) H1 : S1 (t) = S2 (t)
t dt 15 1 18 1 19 2 20 1 23 1
n1t 5 4 3 3 2
n2t 5 4 3 1 0
e1t 0,5 0,5 1,0 0,75 1,0 3,75
e2t 0,5 0,5 1,0 0,25 0 2,25
Logrank TestContoh: grup 1: 23, 16+, 18+, 20+, 24+ grup 2: 15, 18, 19, 19, 20H0 : S1 (t) = S2 (t) H1 : S1 (t) = S2 (t)
t dt 15 1 18 1 19 2 20 1 23 1
n1t 5 4 3 3 2
n2t 5 4 3 1 0
e1t 0,5 0,5 1,0 0,75 1,0 3,75
e2t 0,5 0,5 1,0 0,25 0 2,25
E1 = 3, 75 E2 = 2, 25
Logrank TestContoh: grup 1: 23, 16+, 18+, 20+, 24+ grup 2: 15, 18, 19, 19, 20H0 : S1 (t) = S2 (t) H1 : S1 (t) = S2 (t) O1 = 1 O2 = 5
t dt 15 1 18 1 19 2 20 1 23 1
n1t 5 4 3 3 2
n2t 5 4 3 1 0
e1t 0,5 0,5 1,0 0,75 1,0 3,75
e2t 0,5 0,5 1,0 0,25 0 2,25
E1 = 3, 75 E2 = 2, 25
Logrank TestContoh: grup 1: 23, 16+, 18+, 20+, 24+ grup 2: 15, 18, 19, 19, 20H0 : S1 (t) = S2 (t) H1 : S1 (t) = S2 (t)
t dt 15 1 18 1 19 2 20 1 23 1
n1t 5 4 3 3 2
n2t 5 4 3 1 0
e1t 0,5 0,5 1,0 0,75 1,0 3,75
e2t 0,5 0,5 1,0 0,25 0 2,25
E1 = 3, 75 E2 = 2, 25 O1 = 1 O2 = 5
Logrank TestContoh: grup 1: 23, 16+, 18+, 20+, 24+ grup 2: 15, 18, 19, 19, 20H0 : S1 (t) = S2 (t) H1 : S1 (t) = S2 (t)
t dt 15 1 18 1 19 2 20 1 23 1
n1t 5 4 3 3 2
n2t 5 4 3 1 0
e1t 0,5 0,5 1,0 0,75 1,0 3,75
e2t 0,5 0,5 1,0 0,25 0 2,25
2
= = =
(O2 E (O1 E1 )2 + E1 E2 (1 3, 75)2 (5 2, + 3, 75 2, 25 5, 378
Logrank TestContoh: grup 1: 23, 16+, 18+, 20+, 24+ grup 2: 15, 18, 19, 19, 20H0 : S1 (t) = S2 (t) H1 : S1 (t) = S2 (t)
t dt 15 1 18 1 19 2 20 1 23 1
n1t 5 4 3 3 2
n2t 5 4 3 1 0
e1t 0,5 0,5 1,0 0,75 1,0 3,75
e2t 0,5 0,5 1,0 0,25 0 2,25
2
= = =
(O1 E1 )2 (O2 E + E1 E2 (1 3, 75)2 (5 2, + 3, 75 2, 25 5, 378
p-value= 0, 0204 < 0, 05
Model RegresiModel Regresi untuk data antar kejadian: Model Regresi Parametrik Regresi Cox Model Hazard Aditif
Model Regresi ParametrikAFT (accelerated failure-time model) model linear dalam log durasi (lama antar kejadian) model hazard proporsional
Model Regresi ParametrikRepresentasi fungsi hazard AFTh(t | X) = h0 (exp(X)t) exp(X)
dengan X adalah matriks (n p) dari variabel penjelas; T = (1 . . . p ) adalah vektor (p 1) parameter regresi. Representasi log Tlog T = + X +
dengan T = (1 . . . p ) dan adalah parameter regresi; adalah suku error berdistribusi tertentu dan > 0 adalah suatu parameter skala.
Model AFTModel AFT dapat ditulis sebagai fungsi hazard atau survivalH(t | x) = H0 (exp(x)t),
untuk semua t
atauS(t | x) = S0 (exp(x)t),
untuk semua t
dengan H0 adalah baseline fungsi hazard kumulatif dan S0 baseline fungsi survival
Hazard Proporsional1.0 0.6 0.8 S(t)
Kurva survival untuk model eksponensial dengan dua nilai yang berbeda
0.4
= 0.1 = 0.3
0.0 0 0.4
0.2
10
20
30
40
h(t)
= 0.3 = 0.1
0.0 0
0.2
10
20 t
30
40
Hazard ProporsionalMisalkan ada dua orang yang masing-masing mempunyai hazard 1 = 0, 1 dan 2 = 0, 3 hazard ratio: 0,3 2 = 0,1 = 3 1
Hazard ProporsionalMisalkan ada dua orang yang masing-masing mempunyai hazard 1 = 0, 1 dan 2 = 0, 3 hazard ratio: 0,3 2 = 0,1 = 3 1 konstant, independen terhadap waktu
Coxs Regression ModelCoxs regression model atau Coxs proportional hazards (Cox;1972,1975):h(t | x) = h0 (t)(x, )
dengan x = (x1 , . . . , xp ) adalah vektor kovariat (variabel independen) dan = (1 , . . . , p ) adalah parameter dari model regresi
Coxs Regression ModelCoxs regression model atau Coxs proportional hazards (Cox;1972,1975):h(t | x) = h0 (t)(x, )
fungsi hazard bergantung pada x
=
baseline hazard fungsi kovariat tdk bergantung pd x
Coxs Regression ModelCoxs regression model atau Coxs proportional hazards (Cox;1972,1975):h(t | x) = h0 (t)(x, )
fungsi hazard bergantung pada x
=
baseline hazard fungsi kovariat tdk bergantung pd x
Bentuk fungsional dari (x, ) (x, ) = exp(x) (x, ) = exp(1 + x) (x, ) = log(1 + exp(x))
Coxs Regression ModelCoxs regression model atau Coxs proportional hazards (Cox;1972,1975):h(t | x) = h0 (t)(x, )
fungsi hazard bergantung pada x
=
baseline hazard fungsi kovariat tdk bergantung pd x
Bentuk fungsional dari (x, ) (x, ) = exp(x) (x, ) = exp(1 + x) (x, ) = log(1 + exp(x))
Coxs Regression ModelModel:h(t | x) = h0 (t) exp(x)
Misalkan:x = 0 1
placebo obat baru
Coxs Regression ModelModel:h(t | x) = h0 (t) exp(x)
Hazard ratio:h(t | x = 1) h(t | x = 0) = h0 (t) exp(1 ) h0 (t) exp(0 )
Coxs Regression ModelModel:h(t | x) = h0 (t) exp(x)
Hazard ratio:h(t | x = 1) h(t | x = 0) h0 (t) exp(1 ) = h0 (t) exp(0 ) = exp()
Coxs Regression ModelModel:h(t | x) = h0 (t) exp(x)
Hazard ratio:h(t | x = 1) h(t | x = 0) h0 (t) exp(1 ) = h0 (t) exp(0 ) = exp()
jika = 0 obat baru dan placebo sama efeknya
Coxs Regression ModelModel:h(t | x) = h0 (t) exp(x)
Hazard ratio:h(t | x = 1) h(t | x = 0) h0 (t) exp(1 ) = h0 (t) exp(0 ) = exp()
jika < 0 obat baru memberikan efek yang lebih baik daripada placebo (resiko kematian lebih rendah)
Coxs Regression ModelModel:h(t | x) = h0 (t) exp(x)
Hazard ratio:h(t | x = 1) h(t | x = 0) h0 (t) exp(1 ) = h0 (t) exp(0 ) = exp()
jika > 0 obat baru memberikan efek yang lebih buruk daripada placebo (resiko kematian lebih tinggi)
Coxs Regression ModelModel:h(t | x) = h0 (t) exp(x)
Secara umum nilai estimasi dapat digunakan untuk mengidentikasi faktor resiko (risk factors, prognostic factors) yang berkaitan dengan variabel dependen time-to-event T .
Coxs Regression ModelModel:h(t | x) = h0 (t) exp(x)
Dapat dituliskan dalam H(t | x) atau S(t | x)H(t | x) = H0 (t) exp(x)
S(t | x) = S0 (t)exp(x )
dengan H0 adalah baseline hazard kumulatif dan S0 adalah baseline survival
Alat Bantukomputer dan software online reference, documentation personal documentation
Alat BantuThe good news is that statistical analysis is becoming easier and cheaper. The bad news is that statistical analysis is becoming easier and cheaper. (Hofacker, 1983)
Alat BantuKeuntungan menggunakan komputer (dibandingkan manual) Akurasi dan kecepatan Fasilitas dan metode yang digunakan lebih banyak Grak Fleksibel Manipulasi variabel mudah Volume data besar Transfer data mudah
Alat Bantu
Akses
Olah
Data
Presentasi
Analisis
Alat BantuTahapan analisis menggunakan komputer 1. Data collection 2. Data entry 3. Data checking 4. Data screening 5. Data analysis 6. Checking results 7. Interpretation
Alat bantuAkses: Memasukkan data (entry data), mengambil data (dari format data yang lain) Olah: Mengurutkan, menyeleksi, mentransformasi, mengambil subset data, menambah data Presentasi: Membuat deskripsi data, tabel, grak, ringkasan-ringkasan statistik Analisis: Melakukan analisis data berdasarkan teori, metode-metode statistika tertentu atau metode-metode kuantitatif yang lain
Alat bantuCara eksekusi Paket Statistik : batch mode berupa program/urutan (sekuen) perintah non-interactive mode dalam mode ini, biasanya tidak diketahui proses eksekusi, hanya hasil dari eksekusi saja (biasanya dijalankan langsung dari DOS prompt) interactive line mode perintah dijalankan melalui prompt dari paket statistik per baris display manager (menu) mode perintah dijalankan interaktif melalui menu-menu atau window
Alat BantuProgram (paket statistik) utama yang akan digunakan dalam kuliah ini: R http://www.cran.ugm.ac.id Epi-Info http://www.cdc.gov/EpiInfo/epiinfo.htm Sumber informasi internet: 1. http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?DB=pubmed 2. http://www.pitt.edu/ super1/
Konsultan BiostatistikaPermasalahan yang biasa dikonsultasikan Desain penelitian dan ukuran sampel Prosedur analisis statistik yang tepat Penggunaan program komputer Interpretasi hasil analisis statistik