bioepid

Biostatistika dan Epidemiologi (MMS-4411)Dr. Danardono, [email protected]

Program Studi Statistika Jurusan Matematika FMIPA UGM

Materi dan JadualMinggu ke1. Pokok Bahasan Pendahuluan Sub Pokok Bahasan 1 Kompetensi dan profesi terkait 2 Rencana pembelajaran dan penilaian 3 Studi Kasus 1 (tentang kompetensi, profesi, penelitian atau desain) 1 Penelitian dalam bidang ilmu hayati, kedokteran, kesehatan dan epidemiologi 2 Penelitian observasional 3 Cross-sectional Study 4 Follow-up study 5 Case-control study 6 Penelitian klinis (clinical trial)

2.

Desain Penelitian

Materi dan Jadual3. Desain Penelitian (lanjutan); Statistik dan ukuran dalam epidemiologi 1 Pengenalan desain lanjut (nested case-control, case-cohort) 2 Kaitan desain penelitian dengan analisis statistik 3 Prevalence dan incidence 4 Odds ratio, risk ratio dan risk difference 5 Studi kasus 2 (tentang penelitian, desain dan analisis) 1 Perangkat lunak statistika 2 Pencarian informasi 1 Analisis regresi dan ANAVA 2 Model linear terumumkan 1 Crosstabulation dan stratikasi 2 Regresi logistik 3 Regresi Poisson 1 Sensitivity dan specicity 2 Kurva ROC

4. 5. 6.

Alat bantu analisis dan penelitian Model linear Analisis Data kategorik

7.

Uji Diagnostik

Materi dan Jadual8. Analisis data longitudinal dan survival Studi Kasus 3 1 Model Regresi untuk data longitudinal 2 Kaplan-Meier dan Life Table 3 Model Regresi data survival Studi kasus tentang penggunaan metode yang tepat, skill olah data, analisis dan interpretasi 1 Hubungan antara beberapa metode 2 Kelebihan dan kekurangan masing-masing metode 3 Dasar teori lebih lanjut Metode yang tidak standar atau metode terkini dari penelitian terakhir atau yang sedang dikembangkan 1 Penulisan laporan 2 Komunikasi dan presentasi

9.

10.

Ringkasan Metode

11.

Topik lanjut

12.

Praktek Konsultasi

Materi dan Jadual13. Studi kasus 4 Studi kasus yang berkaitan dengan praktek konsultasi (individual atau kelompok) Studi kasus yang berkaitan dengan praktek konsultasi (individual atau kelompok)

14.

Studi kasus 5

PenilaianNo 1. 2. 3. 4. Unsur Penilaian Ujian Akhir Sisipan Tugas/Presentasi PR/Kuis Persentase 35 25 30 10

Pustaka dan Sumber InformasiBuku Teks: 1. Le, Chap T. Introductory Biostatistics. Wiley, 2003 2. Clayton, D. dan Hills, M. Statistical Models in Epidemiology. Oxford University Press, 1993 3. Newman, S. C. Biostatistical Methods in Epidemiology. Wiley, 2001 4. Kleinbaum, D. G., Kupper, L. L. dan Morgenstern, H. Epidemiologic Research: Principles and Quantitative Methods. Wadsworth, Inc., 1982 Sumber informasi internet: 1. http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?DB=pubmed 2. http://www.pitt.edu/ super1/

Diskusi

Diskusi

Biostatistika (Biostatistics)

Epidemiologi (Epidemiology)

Diskusi

Mulailah berpikir dan bertindak bukan hanya sebagai statistisi saja, tapi juga sebagai orang yang mempelajari bidang lain dan dengan sudut pandang yang berbeda dari seorang statistisi

DiskusiIRON AND ZINC IN INFANCY: RESULTS FROM EXPERIMENTAL TRIALS IN SWEDEN AND INDONESIA Torbjrn Lind Epidemiology and Public Health Sciences, Department of Public Health and Clinical Medicine & Pediatrics Department of Clinical Sciences Ume University, 901 87 Ume, Sweden

DiskusiABSTRACT Background: Iron and zinc are difcult to provide in sufcient amounts in complementary foods to infants world-wide, resulting in high prevalence of both iron and zinc deciency. These deciency states cause anemia, delayed neurodevelopment, impaired growth, and increased susceptibility to infections such as diarrhea and respiratory infections.

DiskusiABSTRACT Background: Iron and zinc are difcult to provide in sufcient amounts in complementary foods to infants world-wide, resulting in high prevalence of both iron and zinc deciency. These deciency states cause anemia, delayed neurodevelopment, impaired growth, and increased susceptibility to infections such as diarrhea and respiratory infections.

DiskusiDesign: Two different intervention strategies; reduction of a possible inhibitor of iron and zinc absorption, i.e. phytate, or supplementation with iron and zinc, were applied to two different populations in order to improve iron and zinc nutrition: In a high-income population (Ume, Sweden), the amount of phytate in commonly consumed infant cereals was reduced. Healthy, term infants (n=300) were at 6 mo of age randomized to phytate-reduced infant cereals, conventional infant cereals, or infant formula and porridge. In a low income population (Purworejo, Indonesia), daily iron and zinc supplementation was given. Healthy, term infants (n=680) were at 6 mo randomized to supplementation with iron, zinc, a combination of iron and zinc, or placebo. Blood samples, anthropometrical measurements, and data on infant neurodevelopment and morbidity were collected. Also, in the Swedish study, detailed information on the dietary intake was recorded.

DiskusiDesign: Two different intervention strategies; reduction of a possible inhibitor of iron and zinc absorption, i.e. phytate, or supplementation with iron and zinc, were applied to two different populations in order to improve iron and zinc nutrition: In a high-income population (Ume, Sweden), the amount of phytate in commonly consumed infant cereals was reduced. Healthy, term infants (n=300) were at 6 mo of age randomized to phytate-reduced infant cereals, conventional infant cereals, or infant formula and porridge. In a low income population (Purworejo, Indonesia), daily iron and zinc supplementation was given. Healthy, term infants (n=680) were at 6 mo randomized to supplementation with iron, zinc, a combination of iron and zinc, or placebo. Blood samples, anthropometrical measurements, and data on infant neurodevelopment and morbidity were collected. Also, in the Swedish study, detailed information on the dietary intake was recorded.

DiskusiResults: In the Swedish study, the reduction of phytate had little effect on iron and zinc status, growth, development or incidence of diarrhea or respiratory infections, possibly due to the presence of high contents of ascorbic acid, which may counteract the negative effects of phytate. In the Indonesian study, signicant negative interaction between iron and zinc was evident for several of the outcomes; Hb and serum ferritin improved more in the iron only group compared to placebo or the combined iron and zinc group. Further, supplementation with iron alone improved infant psychomotor development and knee-heel length, whereas supplementation with zinc alone improved weight and knee-heel length compared to placebo. Combined iron and zinc supplementation did decrease the prevalence of iron deciency anemia and low serum zinc, but had no other positive effects. Vomiting was more common in the combined group.

DiskusiResults: In the Swedish study, the reduction of phytate had little effect on iron and zinc status, growth, development or incidence of diarrhea or respiratory infections, possibly due to the presence of high contents of ascorbic acid, which may counteract the negative effects of phytate. In the Indonesian study, signicant negative interaction between iron and zinc was evident for several of the outcomes; Hb and serum ferritin improved more in the iron only group compared to placebo or the combined iron and zinc group. Further, supplementation with iron alone improved infant psychomotor development and knee-heel length, whereas supplementation with zinc alone improved weight and knee-heel length compared to placebo. Combined iron and zinc supplementation did decrease the prevalence of iron deciency anemia and low serum zinc, but had no other positive effects. Vomiting was more common in the combined group.

DiskusiResults (continued): Analyses of dietary intake from the Swedish study showed that dietary iron intake in the 6-11 mo period was signicantly associated with Hb, but not serum ferritin at 9 and 12 mo, whereas the opposite was true in the 12-17 mo period, i.e. dietary iron intake was signicantly associated with serum ferritin, but not Hb at 18 mo.

DiskusiResults (continued): Analyses of dietary intake from the Swedish study showed that dietary iron intake in the 6-11 mo period was signicantly associated with Hb, but not serum ferritin at 9 and 12 mo, whereas the opposite was true in the 12-17 mo period, i.e. dietary iron intake was signicantly associated with serum ferritin, but not Hb at 18 mo.

DiskusiConclusions: The phytate content of commercial infant cereals does not seem to contribute to poor iron and zinc status of Swedish infants as feared. However, the current denitions of iron and zinc deciency in infancy may overestimate the problem, and a change in the recommended cutoffs is suggested. These studies also indicate that dietary iron is preferably channeled towards erythropoiesis during infancy, but to an increasing amount channeled towards storage in early childhood. This suggests that in evaluating dietary programs, Hb may be superior in monitoring response to dietary iron in infancy, whereas S-Ft may respond better later in childhood. However, as shown in this study, increasing Hb may not necessarily be an indicator of iron deciency, as more dietary iron increased Hb regardless of iron status.

DiskusiConclusions (continued): In the low-income setting combined supplementation with iron and zinc resulted in signicant negative interaction. Thus, it is not possible to recommend routine iron-zinc supplementation at the molar concentration and mode used in this study. It is imperative that further research efforts are focused at nding cost-effective strategies to prevent iron and zinc deciency in low-income populations.

Tujuan Penelitian Epidemiologi1. Mendeskripsikan status kesehatan populasi dengan cara melakukan enumerasi kejadian sakit, menghitung frekuensi relatif dan mendapatkan kecenderungan atau trend penyakit; 2. Menjelaskan penyebab penyakit dengan cara menentukan faktor yang menjadi sebab dari suatu penyakit tertentu dan cara transmisinya; 3. Melakukan prediksi kejadian sakit dan distribusi status kesehatan dalam populasi; 4. Melakukan pengendalian penyebaran penyakit dalam populasi dengan pencegahan kejadian sakit, penyembuhan kasus sakit, menambah lama hidup bersama dengan suatu penyakit, atau meningkatkan status kesehatannyaKleinbaum, D.G., Kupper, L. L. dan Morgenstern, H. (1982) Epidemiologic Research, Lifetime Learning Pub.Wadsworth, Inc.

Tujuan Penelitian Epidemiologi1. Mendeskripsikan status kesehatan populasi dengan cara melakukan enumerasi kejadian sakit, menghitung frekuensi relatif dan mendapatkan kecenderungan atau trend penyakit; describe 2. Menjelaskan penyebab penyakit dengan cara menentukan faktor yang menjadi sebab dari suatu penyakit tertentu dan cara transmisinya; explain 3. Melakukan prediksi kejadian sakit dan distribusi status kesehatan dalam populasi; predict 4. Melakukan pengendalian penyebaran penyakit dalam populasi dengan pencegahan kejadian sakit, penyembuhan kasus sakit, menambah lama hidup bersama dengan suatu penyakit, atau meningkatkan status kesehatannya controlKleinbaum, D.G., Kupper, L. L. dan Morgenstern, H. (1982) Epidemiologic Research, Lifetime Learning Pub.Wadsworth, Inc.

Tipe PenelitianObservasional (tanpa ada manipulasi atau perlakuan) Deskriptif Analitik Eksperimental (ada manipulasi atau perlakuan dengan randomisasi) Laboratorium Penelitian klinis Intervensi komunitas Quasi-eksperimental (ada manipulasi atau perlakuan tanpa randomisasi) Laboratorium/Klinis Program/Kebijakan

Tipe Penelitian

?populasi

Tipe Penelitian

populasi

Variabel

Tipe Penelitian

populasi

X 1 , X2 , . . . Y1 , Y2 , . . .

v. independen, v. penjelas, faktor, exposure, confounder v. dependen, outcome, response

Tipe Penelitian

populasi

sampel

Tipe Penelitian

non-random

populasisampling

sampel

Tipe Penelitian

random

populasisampling

sampel

Tipe Penelitian

random

populasisampling- simple - stratication - cluster - systematic

sampel

Tipe Penelitian

populasi

sampel

representasi populasi

Tipe Penelitian

populasi

sampel

data

x1 , x2 , . . . y 1 , y2 , . . .

Tipe Penelitian

populasi

sampel- pencacahan - pengukuran - wawancara - dst

data

Tipe PenelitianPenelitian observasional

XY

populasi

sampel

data

X apa adanya

Tipe PenelitianPenelitian eksperimental

XY

populasi

sampel

data

X di- manipulasi - intervensi - beri perlakuan dengan randomisasi

Tipe PenelitianPenelitian quasi-eksperimental

XY

populasi

sampel

data

X di- manipulasi - intervensi - beri perlakuan tanpa randomisasi

Desain Penelitian1 Terpapar Individu Tidak terpapar 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 Waktu 6 7 8 9 10

Desain Penelitian1 Terpapar Individu Tidak terpapar 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 Waktu 6 7 8 9 10

periode sehat

periode sakit

meninggal

Terpapar

Desain Penelitian1 Terpapar Individu 2 3 4 5 6 Tidak terpapar 7 8 9 10 0 1 2 3 4 5 Waktu 6 7 8 9 10 desain cross-sectional

periode sehat

periode sakit

meninggal

Terpapar

Desain Penelitian1 Terpapar Individu 2 3 4 5 6 Tidak terpapar 7 8 9 10 0 1 2 3 4 5 Waktu 6 7 8 9 10 desain cross-sectional

periode sehat

periode sakit

meninggal

Terpapar

Desain Penelitian1 Terpapar Individu 2 3 4 5 6 Tidak terpapar 7 8 9 10 0 1 2 3 4 5 Waktu 6 7 8 9 10 desain longitudinal - follow-up - cohort - prospective - retrospective

periode sehat

periode sakit

meninggal

Terpapar

Desain PenelitianApakah terpapar menyebabkan sakit ? 1 2 3 Individu 4 5 6 7 8 9 10 0 1 3 2 cross-sectional 4 5 Waktu 6 7 8 9 10

periode sehat

periode sakit

meninggal

Terpapar

Desain PenelitianApakah terpapar menyebabkan sakit ? 1 2 3 Individu 4 5 6 7 8 9 10 0 1 2 3 4 5 Waktu 6 cross-sectional 7 8 9 10

periode sehat

periode sakit

meninggal

Terpapar

Desain PenelitianApakah terpapar menyebabkan sakit ? 1 2 3 Individu 4 5 6 7 8 9 10 0 1 2 3 longitudinal 5 4 Waktu meninggal 6 7 8 9 10

periode sehat

periode sakit

Terpapar

Statistik dan Ukuran dalam EpidemiologiPrevalensi adalah banyaknya subyek yang mengalami kejadian tertentu atau menderita penyakit tertentu pada suatu waktu tertentu Insidensi adalah banyaknya subyek yang mengalam kejadian baru atau mendapatkan penyakit baru dalam suatu interval waktu tertentu Tingkat (rate) adalah banyaknya perubahan kuantitatif yang terjadi terkait dengan waktu

Prevalensid P = N d: banyaknya subyek yang mengalami kejadian tertentu atau menderita penyakit tertentu pada suatu waktu tertentu N : banyaknya subyek pada suatu waktu tersebut

Faktor-faktor yang mempengaruhi prevalensi:

InsidensiInsidensi Kumulatifd IK = N0 d: banyaknya subyek yang mengalami kejadian tertentu atau menderita penyakit tertentu dalam suatu interval waktu tertentu N0 : banyaknya subyek yang belum mengalami kejadian tertentu atau menderita penyakit tertentu pada awal interval waktu tersebut

InsidensiInsidensi (Incidence rate)d I= NT d: banyaknya subyek yang mengalami kejadian tertentu atau menderita penyakit tertentu dalam suatu interval waktu tertentu N T : Total waktu subyek yang belum mengalami kejadian tertentu atau menderita penyakit tertentu dalam interval waktu tersebut

(Istilah lain: person-time incidence rate, instantaneous incidence rate, force of morbidity, incidence-density, hazard)

Hubungan antara Prevalensi dgn. InsidensiBila prevalensi kecil dan tidak berubah menurut waktu prevalensi insidensi durasi

Faktor yang mempengaruhi Prevalencenaik karena turun karena

durasi penyakit yg panjang pasien hidup lama insidensi meningkat in-migrasi kasus out-migrasi penduduk sehat in-migrasi orang yg rentan meningkatnya diagnosis

durasi penyakit yg pendek pasien hidup singkat insidensi menurun in-migrasi penduduk sehat out-migrasi kasus out-migrasi orang yg rentan meningkatnya kesembuhan

Risk dan OddModel probabilitas biner (Bernoulli) S adalah probabilitas sukses (risk ) 1

G

Odd : (1 ) atau = 1

LikelihoodDari n = 10 orang diketahui outcome sukses (S) dan gagal (G) SSGSGGGSGG (misalnya sukses adalah terkena penyakit tertentu dan gagal adalah tidak terkena penyakit tertentu). Seberapa mungkin data ini berasal dari model binomial dengan (i) = 0,1; (ii) = 0,5?

LikelihoodDari n = 10 orang diketahui outcome sukses (S) dan gagal (G) SSGSGGGSGG (misalnya sukses adalah terkena penyakit tertentu dan gagal adalah tidak terkena penyakit tertentu). Seberapa mungkin data ini berasal dari model binomial dengan (i) = 0,1; (ii) = 0,5?L( | data) = (1 )(1 )(1 )(1 )(1 )(1 ) = 0,14 0,96 = 5,31 105

LikelihoodDari n = 10 orang diketahui outcome sukses (S) dan gagal (G) SSGSGGGSGG (misalnya sukses adalah terkena penyakit tertentu dan gagal adalah tidak terkena penyakit tertentu). Seberapa mungkin data ini berasal dari model binomial dengan (i) = 0,1; (ii) = 0,5?L( | data) = (1 )(1 )(1 )(1 )(1 )(1 ) = 0,14 0,96 = 5,31 105

L( | data) = (1 )(1 )(1 )(1 )(1 )(1 ) = 0,54 0,56 = 9,77 104

Likelihood

Likelihood

0 0.0

2

4

6

8

10

12

0.2

0.4

0.6

0.8

1.0

Likelihood

Likelihood

0

2

4

6

8

10

12

0,001194394

0.0

0.2

0.4

0.6

0.8

1.0

Normed Likelihood 0.0 0.0 0.2 0.4 0.6 S=4; G=6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 1.2

Likelihood

Likelihood1.2 Normed Likelihood 0.8 1.0

0.0

0.2

0.4

0.6

S=20; G=30

0.0

0.2

0.4

0.6

0.8

1.0


0.0

0.2

0.4

0.6

SGGGGSGGGG

0.0

0.2

0.4

0.6

0.8

1.0


0.0

0.2

0.4

0.6

SSSSSSGSSS

0.0

0.2

0.4

0.6

0.8

1.0

Likelihood Ratio1.2 Normed Likelihood 0.4 0,258 0.2 0.0 0.0 0.6 0.8 1.0

0.2

0.4

0.6

0.8

1.0

Likelihood Ratio1.2 Normed Likelihood 0.2 0.4 0.6 0.8 1.0

0.0

0.179

0.655 0.4 0.6 0.8 1.0

0.0

0.2

Likelihood Ratio1.2 Normed Likelihood 0.0 0.2 0.4 0.6 0.8 1.0

0.289 0.0 0.2 0.4

0.516 0.6 0.8 1.0

Log Likelihood0.0 Log Likelihood 3.0 0.0 2.0 1.0

0.2

0.4

0.6

0.8

1.0

Konsep InferensiFrequentist interval (kondensi) untuk suatu parameter (condence interval) diinterpretasikan sebagai coverage probability nilai parameter terletak dalam interval, bila sampel (studi) diulang banyak kali (interpretasi frekuensi relatif) Bayesian interval (kondensi) untuk suatu parameter diinterpretasikan berdasarkan anggapan bahwa parameter adalah variabel random yang nilainya terletak dalam suatu credible interval Likelihood interval (kondensi) untuk suatu parameter disusun berdasarkan likelihood ratio yang menunjukkan seberapa besar kemungkinan suatu model didukung oleh data yang diperoleh

Likelihood untuk InsidensiM

1M

1

2 1H1 2

M3

H

1

3H

1M: mati H: hidup

3

5

Likelihood untuk InsidensiM

0,3M

0,2 0,7H0,8

M0,1

H

0,9H 1M: mati H: hidup

Probabilitas untuk 4 outcom 0,3; 0,7 0,2 ; 0,7 0,8 0,1 ; 0,7 0,8 0,9

3

5

Likelihood untuk InsidensiUntuk interval yang semakin sempit, probabilitas kondisional (untuk M) menjadi semakin kecil pula, dan konvergen ke hazard rate (force of mortality )P (t T < t + h | T t) h0 h

= lim

Likelihood untuk InsidensiPoisson Likelihood Likelihood untuk dapat diturunkan dari likelihood binomial dengan menganggap probabilitas sukses adalah h dengan h kecil,L() = D exp(Y )

dengan D adalah banyaknya kejadian, Y adalah total waktu observasi. Log-likelihood untuk () = D log() Y Penduga untuk , = D/Y

Likelihood untuk InsidensiMisalkan ada 7 observasi dengan total waktu observasi 500 orang-tahun (person-years). Log-likelihood untuk () = 7 log() 500

log likelihood

39.5 0.005

38.5

37.5

0.010

0.015

0.020

0.025

0.030

Ukuran untuk Pengaruh FaktorTidak hanya melihat outcome saja namun juga faktor (v. independen, v. penjelas, paparan/exposure) Bergantung pada desain penelitian

Ukuran untuk Pengaruh FaktorSelisih resiko (risk difference) Rasio resiko (risk ratio) Odds ratio

Ukuran untuk Pengaruh FaktorDesain cohort Data terobservasi D E 1 2 1 n11 n12 N1 2 n21 n22 N2Waktu

Model probabilitas D E 1 2 1 1 1 1 1 2 2 1 2 1Waktu

RD = 1 2



RR =

1 2



OR =

1 (12 ) 2 (11 )

Inferensi untuk OR, RR dan RDEstimasi titik untuk OR n11 n22 OR = n12 n21 alternatifnya, untuk menghindari masalah bila ada nij = 0 (n11 + 0,5)(n22 + 0,5) OR = (n12 + 0,5)(n21 + 0,5) galat standar (standard error ) untuk log OR log OR = 1 1 1 1 + + + n11 n12 n21 n221/2

Interval kondensi (1 )100% untuk log OR log OR Z/2 log OR

Inferensi untuk OR, RR dan RDEstimasi titik untuk RD RD = 1 2 galat standar (standard error ) untuk 1 2 1 (1 1 ) 2 (1 2 ) (1 2 ) = + n1 n2 Interval kondensi (1 )100% untuk 1 2 (1 2 ) Z/2 (1 2 ), (1 2 ) sama seperti (1 2 ) dengan i diganti i 1/2

Inferensi untuk OR, RR dan RDEstimasi titik untuk RR 1 RR = 2 galat standar (standard error ) untuk log RR log RR = 1 1 1 2 + 1 n 1 2 n 21/2

Interval kondensi (1 )100% untuk log RR log RR Z/2 log RR

Perancuan (confounding)Variable perancu adalah variabel yang memenuhi dua kondisi: merupakan faktor resiko mempunyai hubungan dengan variabel paparan tapi bukan merupakan konsekuensi dari variabel paparan

Perancuan (confounding)F adalah perancu antara D dengan EE D E D E D

F

F

F

D : variabel respon E : variabel paparan F : variabel perancu

Perancuan (confounding)F bukan perancu antara D dengan EE D F E D F F F E D E D

Perancuan (confounding)Bedsores study. Manula yang mengalami kecelakaan, seperti terjatuh, seringkali menjadi tidak dapat bangun dan bergerak dalam waktu lama. Hal ini dapat mengakibatkan bedsores, yaitu luka pada kulit yang dapat berlanjut ke otot dan tulang dan dapat berakibat fatal. Meninggal 79 286 365 hidup 745 8.290 9.035 Total 824 8.576 9.400

Bedsore tidak Bedsore Total79/824 RR= 286/8576 = 2,9

Perancuan (confounding)Adakah kemungkinan variabel perancu?Bedsore

Kematian

F

Perancuan (confounding)Tingkat keparahan tinggi akibat penyakit lain Meninggal hidup Total Bedsore 55 51 106 tidak Bedsore 5 5 10 Total 60 56 116 Tingkat keparahan rendah akibat penyakit lain Meninggal hidup Total Bedsore 24 694 718 tidak Bedsore 281 8.285 8.566 Total 305 8.979 9.284

RR= 55/106 = 1,04 5/10

24/718 RR= 281/8566 = 1,02

Metode AnalisisRespon Kontinu Variabel penjelas Biner Nominal, 2 kategori atau lebih Ordinal Kontinu Nominal dan kontinu Kategorik dan kontinu Kategorik Kontinu Kategorik dan kontinu Nominal Kategorik dan kontinu Kategorik dan kontinu Kategorik Kategorik dan kontinu Metode t-test, z-test ANAVA ANAVA Regresi Ganda Analisis Kovariansi Regresi Ganda Tabel kontingensi Regresi Logistik Regresi Logistik, probit atau model dose-response Regresi Logistik Tabel kontingensi Regresi Logistik Nominal Regresi Logistik Ordinal Model Log-linear, Regresi Poisson Regresi Poisson

Biner

Nominal, 2 kategori atau lebih Ordinal Cacah

Metode AnalisisRespon Durasi (survival) Respon berkorelasi Variabel penjelas Biner Kategorik dan kontinu Kategorik dan kontinu Metode Log-rank test Survival analysis Generalized Estimating equation Multilevels model Analisis Data Longitudinal Analisis Data Panel

Metode Analisis

Masih banyak variasi metode yang belum disebutkan; masih banyak masalah yang memerlukan pengembangan metode baru atau modikasi metode!

Metode AnalisisLangkah-langkah umum Analisis statistik: 1. Deskripsi data 2. Spesikasi model 3. Estimasi parameter model 4. Uji Kecocokan Model 5. Inferensi

Sensitivity, Specicity & Predictive ValueDalam diagnosa atau screening, T + : diagnosa atau screening menunjukkan tes positif T : diagnosa atau screening menunjukkan tes negatif D+ : kenyataannya positif ada penyakit D : kenyataannya tidak ada penyakit (negatif) Sensitivity = P (T + | D+) Specicity = P (T | D) Predictive Value+ = P (D+ | T +) Predictive Value = P (D | T )

Sensitivity, Specicity & Predictive ValueMenggunakan Teorema Bayes: Predictive Value+ = P (D+ | T +) P (D+ T +) = P (T +) P (D+)P (T + | D+) = P (D+)P (T + | D+) + P (D)P (T + | D) Prevalence Sensitivity = prev. sens. + (1 prev.) (1 spec.)

Sensitivity, Specicity & Predictive ValueMenggunakan Teorema Bayes: Predictive Value = P (D | T ) P (D T ) = P (T ) P (D)P (T | D) = P (D)P (T | D) + P (D+)P (T | D+) (1 Prevalence) Specicity = (1 prev.) spec. + prev. (1 sens.)

Sensitivity, Specicity & Predictive ValueContoh: Suatu tes sitologi (cytological test) dilakukan untuk screening kanker rahim pada wanita. Diperoleh data 24.103 wanita yang terdiri atas 379 wanita yang diketahui sudah menderita kanker rahim (dengan tes yang dianggap sebagai gold standar ):T 23.362 225 T+ 362 154

D D+

Total 23.724 379

Hitung sensitivity dan specicity tes tersebut!

Sensitivity, Specicity & Predictive ValueT 23.362 225 T+ 362 154

D D+

Total 23.724 379

154 sensitivity = 379 = 0,406 = 40,6% 23.362 specicity = 23.724 = 0,985 = 98,5%

Interpretasi: Jika tes digunakan untuk wanita yang tidak menderita kanker rahim, tes hampir pasti akan negatif ( specicity = 98,5% cukup besar) Jika tes digunakan untuk wanita yang menderita kanker rahim, peluang tidak terdeteksi besar ( sensitivity = 40,6 % rendah; false negatif 59,4%)

Sensitivity, Specicity & Predictive ValuePredictive Value + : PV + ==

Prevalence Sensitivity prev. sens. + (1 prev.) (1 spec.) Prevalence 0,406 prev. 0,406 + (1 prev.) (1 0,985)

Predictive Value - : PV == (1 Prevalence) Specicity (1 prev.) spec. + prev. (1 sens.) (1 Prevalence) 0,985 (1 prev.) 0,985 + prev. (1 0,406)

Sensitivity, Specicity & Predictive ValuePV + dan PV - untuk berbagai nilai prevalensi dengan spec=98,5% dan sens=40,6% prevalensi PV + PV 0,0010 0,0264 0,999 0,0157 0,3015 0,990 0,0500 0,5876 0,969 0,1000 0,7505 0,937 0,5000 0,9644 0,624

Kurva ROCROC = receiver operating characteristic berguna untuk respon diagnosis (screening test) yang kontinu atau mempunyai lebih dari dua nilai (jenis respon) menghubungkan sensitivity dengan 1-specicity Area di bawah kurva ROC dapat digunakan untuk menilai keakuratan suatu diagnosis (tes)

Kurva ROCDiketahui probabilitas skor CT image (computed tomographic image) untuk pasien syaraf oleh seorang radiolog adalah sebagai berikut: Status Penyakit (D)Normal (D) Abnormal (D+)

(1)0,303 0,028

Skor dari radiolog (2) (3) (4)0,055 0,018 0,055 0,018 0,101 0,101

(5)0,018 0,303

0,532 0,468

(1) hampir pasti normal; (2) mungkin normal; (3) tidak dapat ditentukan (4) mungkin abnormal; (5) hampir pasti abnormal

Nilai probabilitas pada tiap sel adalah irisan peristiwa D+, D dengan T(1) , T(2) , T(3) , T(4) , T(5) , misalnya P (D+ T(1) ) = 0,028, P (D T(5) ) = 0,018 P (D+) = 0,468 adalah prevalensi


(1)0,303 0,028


(5)0,018 0,303

0,532 0,468


Kriteria tes positif: skor 2 sens=(0,018 + 0,018 + 0,101 + 0,303)/0,468 = 0,94 spec=0,303/0,532 = 0,57


(1)0,303 0,028


(5)0,018 0,303

0,532 0,468


Kriteria tes positif: skor 3 sens=(0,018 + 0,101 + 0,303)/0,468 = 0,90 spec=(0,303 + 0,303)/0,532 = 0,67

Kurva ROCSensitivity dan Specicity berdasarkan beberapa kriteria tes positif. kriteria tes positif sensitivity specity 1-specity 1 skor 1,00 0,00 1,00 2 skor 0,94 0,57 0,43 3 skor 0,90 0,67 0,33 4 skor 0,86 0,78 0,22 5 skor 0,65 0,97 0,03 5 < skor 0,00 1,00 0,00

Kurva ROCKurva ROC(0.43, 0.94) (0.33, 0.90) (0.22, 0.86) (0.03, 0.65) (1.00, 1.00)

sensitivity

(0.00, 0.00)

1-specicity

Kurva ROCKurva ROC

sensitivity

1-specicity

Kurva ROCKurva ROC

sensitivity

1-specicity

Regresi LogistikData studi tentang hubungan Penyakit jantung koroner dengan Tekanan pekerjaan:Tertekan krn. Pekerjaan Ya TidakRisk ratio: RR = 97/404 200/1609 = 1,932

Penyakit jantung koroner Ya 97 200 Tidak 307 1409 Total 404 1609

Regresi LogistikMenggunakan R:> twoby2(dt$E,dt$D) 2 by 2 table analysis: -----------------------------------------------------Outcome : Y Comparing : Y vs. T Y T Y 97 307 T 200 1409 P(Y) 95% conf. interval 0.2401 0.2009 0.2842 0.1243 0.1091 0.1413 95% conf. interval 1.5554 2.3987 1.6956 2.9221 1.6754 2.9429 0.0674 0.1693

Relative Risk: Sample Odds Ratio: Conditional MLE Odds Ratio: Probability difference:

1.9316 2.2259 2.2249 0.1158

Exact P-value: 0 Asymptotic P-value: 0

Regresi LogistikYi adalah variabel random Bernoulli untuk individu iy P (Yi = yi ) = i i (1 i )1yi ,

yi = 0, 1

Setiap individu i mempunyai karakteristik berupa kovariat xi yang mempengaruhi i dalam bentuk 1 i = 1 + exp((0 + 1 xi )) Secara umum i adalah fungsi logistik eZ 1 , atau f (Z) = f (Z) = Z 1+e 1 + eZ dengan Z = 0 + 1 x1 + 1 x1 + + p adalah fungsi linear dari p variabel penjelas.

Regresi LogistikModeli log = 0 + 1 x1i + 2 x2i + + pi 1 i

ataulogit() = 0 + 1 x1i + 2 x2i + + pi

Estimasi = (0 , 1 , . . . , p ) dapat diperoleh dengan MLE untuk fungsi likelihoodn

L() =i=1

P (Yi = yi ) [exp(0 + 1 x1i + 2 x2i + + pi )]yi 1 + exp(0 + 1 x1i + 2 x2i + + pi )

=

Regresi LogistikInterpretasi parameter Untuk modellogit(i ) = 0 + 1 xi i = exp [0 + 1 xi ] 1 i oddsxi = exp [0 + 1 xi ] dengan xi = Sehingga odds1 e0 +1 OR = = = e1 odds0 e0 0 1 i tdk terpapar i terpapar

Regresi LogistikEstimasi parameter dan OR Program statistika seperti R, SPSS, Epi-Info, STATA menyediakan fasilitas untuk estimasi . Estimasi titik dan interval kondensi (1 )100% untuk OR: OR = exp() exp( Z/2 SE())

Regresi LogistikContoh dengan R:> m round(ci.logistik(m),digits=3) coef.p s.err L U ecoef.p eL eU (Intercept) -1.952 0.076 -2.100 -1.804 0.142 0.122 0.165 E 0.800 0.139 0.528 1.072 2.226 1.696 2.922

Diperoleh interval kondensi untuk OR 2,226 (1,696 2,922) RR dan RD ? Gunakan estimasi probabilitas (x) dari model regresi. Probabilitas mendapatkan penyakit jantung untuk individu yang terpapar P (yi = 1 | xi = 1) adalah> predict(m,newdata=data.frame(E=1),type="response") [1] 0.240099

Regresi LogistikPenggunaan Regresi Logistik berdasarkan desain tertentu Dapat digunakan untuk menghitung RR, RD, OR dalam desain cohort (probabilitas tiap-tiap individu , (xi ), dapat diestimasi) Hanya dapat digunakan untuk menghitung OR dalam desain case-control

Regresi PoissonDistribusi Poissonx e , P (X = x) = x! x = 0, 1, 2, . . .

mempunyai mean dan variansi

Regresi PoissonContoh: Untuk menyelidiki infeksi pada suatu populasi organisme tertentu, sering tidak mungkin untuk meneliti tiap-tiap individu. Organisme tersebut dibagi dalam kelompok-kelompok dan kelompok tersebut dianggap sebagai unit. N = banyaknya organisme n = banyaknya kelompok m = banyaknya organisme tiap kelompok, N = nm (dengan menganggap m sama untuk tiap kelompok) Misalnya X adalah banyaknya organisme yang tidak terinfeksi, variabel random X kemungkinan besar dapat dimodelkan dengan Poisson,

Regresi PoissonData: yi banyaknya observasi cacah pada unit i; si ukuran tiap unit i; dan karakteristik tiap unit (kovariat) xi , i = 1, 2, . . . , n Model:E(Yi | Xi ) = i = si (xi ) = si exp(0 + 1 xi ), log i = log si + 0 + 1 xi

atau

dengan (xi ) dinamakan resiko unit i.si dapat berupa: banyaknya anggota populasi interval waktu luasan exposure time

Regresi PoissonDengan asumsi Yi Poisson, diperoleh fungsi likelihood:n

L() =i=1 n

P (Yi = yi ) [si (xi )]yi exp[si (xi )] yi !

=i=1

Dapat digunakan beberapa program statistika seperti R, STATA, SAS untuk estimasi

Regresi PoissonInterpretasi parameter: Untuk modellog i = log si + 0 + 1 xi dengan xi = Sehingga RR = = E(Yi | Xi = 1) E(Yi | Xi = 0) si exp(0 + 1 ) si exp(0 ) 0 1 i tdk terpapar i terpapar

= e1

Regresi PoissonData diperoleh dari studi awal tentang akibat buruk merokok bagi kesehatan pada tahun 1951. Kematian akibat penyakit jantung koroner dikategorikan menurut umur dan status merokok.Kel. Umur 35 44 45 54 55 64 65 74 75 84 perokok kematian person-years 32 52407 104 43248 206 28612 186 12663 102 5317 bukan perokok kematian person-years 2 18790 12 10673 28 5710 28 2585 31 1462

Regresi PoissonTingkat kematian akibat penyakit jantung koroner per 100.000 person-years untuk perokok dan bukan perokok 2000 kematian per 100.000 per tahun 0 3544 500 1000 1500

4554

5564 kelompok umur

6574

7584

Regresi PoissonModel 1:log i = log(si ) + 1 x1i + 2 x2i + 3 x1i x2i + 4 x2 , i = 1, . . . , 10 1idengan i : mean dari kematian si : person-years x1i : perokok atau bukan; x2i : usia 1, 2, 3, 4, 5 ; x1i x2i : interaksi (hasil kali) antara x1i dengan x2i ; x2 : kuadrat umur 1i

Regresi PoissonModel 1:Parameter 0 1 2 3 4 Estimasi -10,79 1,44 2,37 -0,19 -0,30 SE 0,450 0,372 0,207 0,027 0,097 RR 4,22 10,77 0,82 0,74 Int-konf. 95% RR 2,04 8,76 7,16 16,18 0,78 0,87 0,61 0,89

Regresi PoissonModel 2:log i = log(si ) + 1 x1i + 2 x2i + 3 x3i + 4 x4i + 5 x5i + 6 x1i x2i + 7 x1i x3i + 8 x1i x4i + 9 x1i x5i i = 1, 2, . . . , 10dengan i : mean dari kematian si : person-years x1i : perokok atau bukan; xki , k = 2, 3, . . . , 5: kelompok umur 35 44, 45 54, . . ., 75 84 x1i xki , h = 2, 3, . . . , 5: interaksi (hasil kali) antara x1i dengan kelompok umur xki

Regresi PoissonModel 2: Model 1:Parameter 0 1 2 3 4 5 6 7 8 9 Estimasi -9,15 1,75 2,36 3,83 4,62 5,29 -0,99 -1,36 -1,44 -1,85 SE 0,71 0,73 0,76 0,73 0,73 0,73 0,79 0,76 0,76 0,76 RR 0,00 5,74 10,56 46,07 101,76 199,21 0,37 0,26 0,24 0,16 Int-konf 95% RR 0,00 0,00 1,37 23,94 2,36 47,20 10,97 193,39 24,24 427,18 47,68 832,36 0,08 1,75 0,06 1,13 0,05 1,04 0,04 0,70

Data LongitudinalKarakteristik data longitudinal Individu (subyek, unit sampel) diamati dalam suatu periode waktu tertentu lebih dari satu kali Pengukuran berulang pada suatu individu (subyek, unit sampel)

Data LongitudinalKemampuan Membaca

Umur


Umur


Umur

Data LongitudinalJenis data yang berkaitan dengan data longitudinal: Data Panel Data Survival, Antar Kejadian (Event History ) Data Runtun Waktu

KeuntunganDapat digunakan untuk mengetahui pola perubahan Setiap individu dapat menjadi kontrol bagi dirinya sendiri Dapat membedakan efek dari umur dengan efek dari cohort maupun efek dari periode Memungkinkan untuk meneliti kausalitas

Eksplorasi DataMetode Statistik: Eksploratori (deskriptif) konrmasi (inferensial)

Eksplorasi DataMetode Statistik: Eksploratori (deskriptif) konrmasi (inferensial) Eksplorasi untuk data longitudinal: tampilkan sebanyak mungkin data mentah daripada hanya ringkasannya tonjolkan pola atau ringkasannya identikasilah baik pola cross-sectional maupun longitudinal identikasilah individu atau observasi yang tidak biasa (outliers)

Bentuk Umum Data Longitudinalsubyek 1 1 . . . 1 2 2 . . . 2 . . . m m . . . m observasi 1 2 . . . n1 1 2 . . . n1 . . . 1 2 . . . nm waktu t11 t12 . . . t1n1 t21 t22 . . . t2n1 . . . t21 t22 . . . t2n1 respon y11 y12 . . . y1n1 y21 y22 . . . y2n1 . . . ym1 ym2 . . . ymn1 kovariat x111 x121 . . . x1n1 1 x211 x221 . . . x2n1 1 . . . xm11 xm21 . . . x2m1 1... ... . . . ... ... ... . . . ... . . . ... ... . . . ... x11p x12p . . . x1n1 p x21p x22p . . . x2n1 p . . . xm1p xm2p . . . xmn1 p

Bentuk Umum Data LongitudinalContoh : Suatu studi dilakukan untuk merehabilitasi pasien stroke. Ada 3 perlakuan dalam studi ini, yaitu: A Terapi yang baru B Program rehabilitasi yang sekarang digunakan dalam rumah sakit yang sama C Program perawatan biasa yang dilakukan dalam rumah sakit yang lain Setiap kelompok perlakuan terdiri dari 8 pasien yang diamati selama 8 minggu. Respon yang diperoleh adalah Bartel index, yaitu skor yang menunjukkan kemampuan fungsional pasien, nilai yang tinggi menunjukkan kemampuan yang baik (maksimum 100).

Bentuk Umum Data Longitudinalsubyek 1 2 3 . . . 9 . . . kovariat (perlakuan) A A A B 1 45 20 50 40 respon (pada minggu ke-) 2 3 4 5 6 7 45 45 45 80 80 80 25 25 25 30 35 30 50 55 70 70 75 90 55 ... 60 70 ... 80 85 90 8 90 50 90 90

Bentuk Umum Data Longitudinalsubyek 1 1 1 1 1 1 1 1 . . . 9 9 9 9 9 9 9 9 . . . observasi (minggu ke-) 1 2 3 4 5 6 7 8 1 2 3 4 5 6 7 8 respon 45 45 45 45 80 80 80 90 ... 40 55 60 70 80 85 90 90 ... kovariat (perlakuan) A A A A A A A A B B B B B B B B

Bentuk Umum Data Longitudinal100

A 80

B skor 60

C 40 0 0 20

2

4 minggu

6

8

Bentuk Umum Data Longitudinal20 80 20 80 20 80 20 80 80 0,55 20 80

m1

0,93

0,88

0,83

0,79

0,71

0,62

m2

0,92

0,88

0,85

0,79

0,70

0,64

20

80

20

m4

0,92

0,88

0,83

0,7780 20 80 20

m580

0,97

0,91 0,96

0,88

m6

0,93 0,98

20

m780

m820 80 20 80 20 80 20 80

20

20

m3

0,95

0,91

0,85

0,77

0,70

80

Pemodelan Data LongitudinalPrinsip Pemodelan: Permasalahan ilmiah diformulasikan sebagai model regresi - var respons var penjelas - variable penjelas awal (baseline) yang tetap sepanjang waktu - variabel yang berubah sepanjang waktu (time-varying expl. variables) Korelasi (asosiasi) karena pengukuran berulang pada individu yang sama, atau observasi berulang

NotasiIndividu: i = 1, . . . , m Observasi pada individu i: jh = 1, . . . , ni Total observasi: N = Variabel respon: variabel random Yij Yi = (Yi1 , . . . , Yini ) Y = (Y1 , . . . , Ym )m i=1 ni

Waktu observasi aktual: tij respon observasi yij yi = (yi1 , . . . , yini ) y = (y1 , . . . , ym )

Variabel penjelas: xij = (xij1 , . . . , xijp )T , vektor berukuran p 1 Xi = (xi1 , . . . , xini ), matriks berukuran ni p

NotasiMean Yi untuk individu i: E(Yi ) = i Variansi Yi ; Matriks Kovariansi ni ni untuk individu i: vi11 . . . vi1ni Var(Yi ) = . . . vijk ... vini 1 . . . vini ni dengan vijk = Cov(Yij , Yik )

Pendekatan PemodelanModel linear umum Model marginal (marginal, population average) Model efek random (random effects; subject specic) Model transisi (transition)

Contoh PemodelanNaive analysis (pooled analysis) Model 1:E(Yi | Xi ) = 0 + 1 X1i + 2 X2i + 3 X3i , i = 1, . . . , n

denganX1i

1 i mendapat perlakuan B = 0 i mendapat perlakuan selain B 1 = 0 i mendapat perlakuan C i mendapat perlakuan selain C

X2i

X3i = 1, 2, . . . , 8 minggu pengamatan n = 24 8 = 192, 24 pasien (terbagi dalam 3 grup perlakuan) diamati selama 8 minggu

Contoh PemodelanNaive analysis (pooled analysis) Model 2:E(Yi | Xi ) = 0 + 1 X1i + 2 X2i + 3 X3i + 4 (X1i X3i ) + 5 (X2i X3i ),

i = 1, . . . , n

dengan(X1i X3i ) dan (X2i X3i ) adalah interaksi antara perlakuan dengan waktu.

Contoh PemodelanParameter Model 1: 0 1 2 3 Model 2: 0 1 2 3 4 5 Estimasi 36,84 -5,63 -12,11 4,76 29,82 3,35 -0,02 6,32 -1,99 -2,69 SE 3,971 3,715 3,715 0,662 5,774 8,166 8,166 1,143 1,617 1,617

Model Linear NormalE(y) = X = , y N (, V)

X1 X2 X = . , . . Xn

1 2 = . , . . p

dengan p adalah banyaknya parameter model, n adalah banyaknya observasi.

Model Linear NormalEstimasi parameter model Generalized Least Squares Maximum Likelihood Generalized Estimating Equation

Model Linear NormalParameter Naive Model 1: 0 1 2 3 Model 2: 0 1 2 3 4 5 36.84 (3.971) -5.63 (3.715) -12.11 (3.715) 4.76 (0.662) 29.82 (5.774) 3.35 (8.166) -0.02 (8.166) 6.32 (1.143) -1.99 (1.617) -2.69 (1.617) Estimasi (SE) Random effects 36.84 ( 7.307) -5.62 (10.177) -12.10 (10.177) 4.76 ( 0.282) 29.82 ( 7.497) 3.34 (10.602) -0.02 (10.602) 6.32 ( 0.467) -1.99 ( 0.660) -2.68 ( 0.660) GEE-indep 36.84 (8.003) -5.63 (9.519) -12.11 (9.519) 4.76 (0.628) 29.82 (10.175) 3.35 (11.633) -0.02 (10.895) 6.32 ( 1.131) -1.99 ( 1.477) -2.69 ( 1.470)

Data Durasi/Survival23 16 18 20 24 15 18 19 19 20

grup 1

grup 2

Data terobservasi D E 1 2 1 0 5 5 2 2 3 5

E = 1 adalah grup 1 E = 2 adalah grup 2 D = 1 mendapatkan event (misalnya sakit) D = 2 tidak mendapatkan event


grup 1

grup 2




grup 1

grup 2



Fungsi SurvivalVariabel random T adalah waktu antar kejadian atau durasi, T >0 Probabilitas satu individu hidup (tinggal dalam suatu status) lebih lama daripada tS(t) = P (T > t) S(t) adalah fungsi non-increasing terhadap waktu t dengan sifat S(t) = 1 0 untuk t = 0 untuk t =

Fungsi Survival1.0 S(t) 0.0 0.0 0.2 0.4 0.6 0.8

0.5

1.0 t

1.5

2.0

Fungsi SurvivalPenduga untuk S(t) bila data tidak tersensor = s S(t) N

dimana s adalah banyaknya individu yang masih hidup lebih lama dari t ; N adalah total banyaknya individu Hubungan S(t) dengan distribusi kumulatif F (t)S(t) = 1 F (t)

Fungsi HazardTingkat (rate) terjadinya suatu eventP (t T < t + t | T t) h(t) = lim t0 t

Hubungan h(t), S(t) dan f (t)h(t) = f (t) S(t)

Fungsi Hazard Kumulatift

H(t) =0

h(x)dx

Hubungan H(t) dengan S(t)H(t) = log S(t)

Fungsi Hazard5 h(t) 0 0.0 1 2 3 4

0.5

1.0 t

1.5

2.0


0.5

1.0 t

1.5

2.0


0.5

1.0 t

1.5

2.0


0.5

1.0 t

1.5

2.0


0.5

1.0 t

1.5

2.0

Kaplan-MeierEstimator untuk S(t) (sering disebut juga sebagai Product-Limit estimator) S(t) = 1ti t (1 di Yi )

jika t < t1 jika ti t

dimana di adalah banyaknya event dan Yi adalah banyaknya individu yang beresiko (number at risk )

Kaplan-MeierVariansi dari KM estimator (Greenwoods formula) var[S(t)] = S(t)2ti t

di Yi (Yi di ) S(t)] Y (t)

Alternatif: var[S(t)] = S(t)2 [1

Kaplan-MeierContoh: Diketahui data survival sebagai berikut: 23 16+ 18+ 20+ 24+ 15 18 19 19 20 (Tanda + menunjukkan tersensor). Hitung estimasi S(t) menggunakan Kaplan-Meier:ti Yi di S(t) var(S(t))

Int-konf 95% S(t) 0,7320 1,000 0,5641 1,000 0,2722 1,000 0,1655 0,937 0,0384 1,000

15 18 19 20 23

10 8 6 4 2

1 1 2 1 1

0,900 0,787 0,525 0,394 0,197

0,0949 0,1340 0,1759 0,1742 0,1642

Nelson-AalenEstimator untuk fungsi hazard kumulatif: H(t) = 0di ti t Yi

jika t < t1 jika ti t

dengan variansidi Yi2

Var(H(t)) =ti t

Membandingkan Distribusi SurvivalMembandingkan dua populasi yang masing-masing mempunyai fungsi survival S1 (t) dan S2 (t) Hipotesis null: H0 : S1 (t) = S2 (t) Hipotesis alternatif: H1 : S1 (t) > S2 (t) H1 : S1 (t) < S2 (t) H1 : S1 (t) = S2 (t)

Membandingkan Distribusi SurvivalMetode Non-parametrik Untuk data tidak tersensor Wilcoxon (1945) Mann-Whitney (1947) Sign test (1977)

Membandingkan Distribusi SurvivalMetode Non-parametrik Untuk data tersensor Gehans generalized Wilcoxon test (1965) the Cox-Mantel test (Cox 1959, 1972; Mantel, 1966) the logrank test (1972) Peto and Petos generalized Wilcoxon test (1972) Coxs F-test (1964)

Membandingkan Distribusi SurvivalMetode Non-parametrik Untuk data tersensor Gehans generalized Wilcoxon test (1965) the Cox-Mantel test (Cox 1959, 1972; Mantel, 1966) the logrank test (1972) Peto and Petos generalized Wilcoxon test (1972) Coxs F-test (1964)

Logrank TestBerdasarkan observed dan expected event pada setiap event-time Untuk 2 grup Statistik penguji:(O1 E1 )2 (O2 E2 )2 = + E1 E22

dengan 2 Chi-square(df=1)

Logrank TestContoh: grup 1: 23, 16+, 18+, 20+, 24+ grup 2: 15, 18, 19, 19, 20H0 : S1 (t) = S2 (t) H1 : S1 (t) = S2 (t)


t dt

n1t

n2t

e1t

e2t

t : event-time dt : banyaknya event n1 , n2 : number at risk e1t , e2t : expected event


t dt 15 18 19 20 23

n1t

n2t

e1t

e2t


Logrank Test23 16 18 20 24 15 18 19 19 20

grup 1

grup 2

t dt 15 18 19 20 23

n1t

n2t

e1t

e2t


Logrank Testgrup 1

grup 2

t dt 15 1 18 19 20 23

n1t 5

n2t 5

e1t

e2t


Logrank Testgrup 1

grup 2

t dt 15 1 18 19 20 23

n1t 5

n2t 5

e1t

e2t e1t = e2t =n1t n1t +n2t n2t n1t +n2t

dt dt

Logrank Testgrup 1

grup 2

t dt 15 1 18 19 20 23

n1t 5

n2t 5

e1t 0,5

e2t 0,5 e1t = e2t =n1t n1t +n2t n2t n1t +n2t

dt dt

Logrank Testgrup 1

grup 2

t dt 15 1 18 1 19 20 23

n1t 5 4

n2t 5 4

e1t 0,5 0,5

e2t 0,5 0,5

Logrank Testgrup 1

grup 2

t dt 15 1 18 1 19 2 20 23

n1t 5 4 3

n2t 5 4 3

e1t 0,5 0,5 1,0

e2t 0,5 0,5 1,0

Logrank Testgrup 1

grup 2

t dt 15 1 18 1 19 2 20 1 23

n1t 5 4 3 3

n2t 5 4 3 1

e1t 0,5 0,5 1,0 0,75

e2t 0,5 0,5 1,0 0,25

Logrank Testgrup 1

grup 2

t dt 15 1 18 1 19 2 20 1 23 1

n1t 5 4 3 3 2

n2t 5 4 3 1 0

e1t 0,5 0,5 1,0 0,75 1,0

e2t 0,5 0,5 1,0 0,25 0


t dt 15 1 18 1 19 2 20 1 23 1

n1t 5 4 3 3 2

n2t 5 4 3 1 0

e1t 0,5 0,5 1,0 0,75 1,0 3,75

e2t 0,5 0,5 1,0 0,25 0 2,25


t dt 15 1 18 1 19 2 20 1 23 1

n1t 5 4 3 3 2

n2t 5 4 3 1 0

e1t 0,5 0,5 1,0 0,75 1,0 3,75

e2t 0,5 0,5 1,0 0,25 0 2,25

E1 = 3, 75 E2 = 2, 25

Logrank TestContoh: grup 1: 23, 16+, 18+, 20+, 24+ grup 2: 15, 18, 19, 19, 20H0 : S1 (t) = S2 (t) H1 : S1 (t) = S2 (t) O1 = 1 O2 = 5

t dt 15 1 18 1 19 2 20 1 23 1

n1t 5 4 3 3 2

n2t 5 4 3 1 0

e1t 0,5 0,5 1,0 0,75 1,0 3,75

e2t 0,5 0,5 1,0 0,25 0 2,25

E1 = 3, 75 E2 = 2, 25


t dt 15 1 18 1 19 2 20 1 23 1

n1t 5 4 3 3 2

n2t 5 4 3 1 0

e1t 0,5 0,5 1,0 0,75 1,0 3,75

e2t 0,5 0,5 1,0 0,25 0 2,25

E1 = 3, 75 E2 = 2, 25 O1 = 1 O2 = 5


t dt 15 1 18 1 19 2 20 1 23 1

n1t 5 4 3 3 2

n2t 5 4 3 1 0

e1t 0,5 0,5 1,0 0,75 1,0 3,75

e2t 0,5 0,5 1,0 0,25 0 2,25

2

= = =

(O2 E (O1 E1 )2 + E1 E2 (1 3, 75)2 (5 2, + 3, 75 2, 25 5, 378


t dt 15 1 18 1 19 2 20 1 23 1

n1t 5 4 3 3 2

n2t 5 4 3 1 0

e1t 0,5 0,5 1,0 0,75 1,0 3,75

e2t 0,5 0,5 1,0 0,25 0 2,25

2

= = =

(O1 E1 )2 (O2 E + E1 E2 (1 3, 75)2 (5 2, + 3, 75 2, 25 5, 378

p-value= 0, 0204 < 0, 05

Model RegresiModel Regresi untuk data antar kejadian: Model Regresi Parametrik Regresi Cox Model Hazard Aditif

Model Regresi ParametrikAFT (accelerated failure-time model) model linear dalam log durasi (lama antar kejadian) model hazard proporsional

Model Regresi ParametrikRepresentasi fungsi hazard AFTh(t | X) = h0 (exp(X)t) exp(X)

dengan X adalah matriks (n p) dari variabel penjelas; T = (1 . . . p ) adalah vektor (p 1) parameter regresi. Representasi log Tlog T = + X +

dengan T = (1 . . . p ) dan adalah parameter regresi; adalah suku error berdistribusi tertentu dan > 0 adalah suatu parameter skala.

Model AFTModel AFT dapat ditulis sebagai fungsi hazard atau survivalH(t | x) = H0 (exp(x)t),

untuk semua t

atauS(t | x) = S0 (exp(x)t),

untuk semua t

dengan H0 adalah baseline fungsi hazard kumulatif dan S0 baseline fungsi survival

Hazard Proporsional1.0 0.6 0.8 S(t)

Kurva survival untuk model eksponensial dengan dua nilai yang berbeda

0.4

= 0.1 = 0.3

0.0 0 0.4

0.2

10

20

30

40

h(t)

= 0.3 = 0.1

0.0 0

0.2

10

20 t

30

40

Hazard ProporsionalMisalkan ada dua orang yang masing-masing mempunyai hazard 1 = 0, 1 dan 2 = 0, 3 hazard ratio: 0,3 2 = 0,1 = 3 1

Hazard ProporsionalMisalkan ada dua orang yang masing-masing mempunyai hazard 1 = 0, 1 dan 2 = 0, 3 hazard ratio: 0,3 2 = 0,1 = 3 1 konstant, independen terhadap waktu

Coxs Regression ModelCoxs regression model atau Coxs proportional hazards (Cox;1972,1975):h(t | x) = h0 (t)(x, )

dengan x = (x1 , . . . , xp ) adalah vektor kovariat (variabel independen) dan = (1 , . . . , p ) adalah parameter dari model regresi


fungsi hazard bergantung pada x

=

baseline hazard fungsi kovariat tdk bergantung pd x



=


Bentuk fungsional dari (x, ) (x, ) = exp(x) (x, ) = exp(1 + x) (x, ) = log(1 + exp(x))



=


Bentuk fungsional dari (x, ) (x, ) = exp(x) (x, ) = exp(1 + x) (x, ) = log(1 + exp(x))

Coxs Regression ModelModel:h(t | x) = h0 (t) exp(x)

Misalkan:x = 0 1

placebo obat baru


Hazard ratio:h(t | x = 1) h(t | x = 0) = h0 (t) exp(1 ) h0 (t) exp(0 )


Hazard ratio:h(t | x = 1) h(t | x = 0) h0 (t) exp(1 ) = h0 (t) exp(0 ) = exp()



jika = 0 obat baru dan placebo sama efeknya



jika < 0 obat baru memberikan efek yang lebih baik daripada placebo (resiko kematian lebih rendah)



jika > 0 obat baru memberikan efek yang lebih buruk daripada placebo (resiko kematian lebih tinggi)


Secara umum nilai estimasi dapat digunakan untuk mengidentikasi faktor resiko (risk factors, prognostic factors) yang berkaitan dengan variabel dependen time-to-event T .


Dapat dituliskan dalam H(t | x) atau S(t | x)H(t | x) = H0 (t) exp(x)

S(t | x) = S0 (t)exp(x )

dengan H0 adalah baseline hazard kumulatif dan S0 adalah baseline survival

Alat Bantukomputer dan software online reference, documentation personal documentation

Alat BantuThe good news is that statistical analysis is becoming easier and cheaper. The bad news is that statistical analysis is becoming easier and cheaper. (Hofacker, 1983)

Alat BantuKeuntungan menggunakan komputer (dibandingkan manual) Akurasi dan kecepatan Fasilitas dan metode yang digunakan lebih banyak Grak Fleksibel Manipulasi variabel mudah Volume data besar Transfer data mudah

Alat Bantu

Akses

Olah

Data

Presentasi

Analisis

Alat BantuTahapan analisis menggunakan komputer 1. Data collection 2. Data entry 3. Data checking 4. Data screening 5. Data analysis 6. Checking results 7. Interpretation

Alat bantuAkses: Memasukkan data (entry data), mengambil data (dari format data yang lain) Olah: Mengurutkan, menyeleksi, mentransformasi, mengambil subset data, menambah data Presentasi: Membuat deskripsi data, tabel, grak, ringkasan-ringkasan statistik Analisis: Melakukan analisis data berdasarkan teori, metode-metode statistika tertentu atau metode-metode kuantitatif yang lain

Alat bantuCara eksekusi Paket Statistik : batch mode berupa program/urutan (sekuen) perintah non-interactive mode dalam mode ini, biasanya tidak diketahui proses eksekusi, hanya hasil dari eksekusi saja (biasanya dijalankan langsung dari DOS prompt) interactive line mode perintah dijalankan melalui prompt dari paket statistik per baris display manager (menu) mode perintah dijalankan interaktif melalui menu-menu atau window

Alat BantuProgram (paket statistik) utama yang akan digunakan dalam kuliah ini: R http://www.cran.ugm.ac.id Epi-Info http://www.cdc.gov/EpiInfo/epiinfo.htm Sumber informasi internet: 1. http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?DB=pubmed 2. http://www.pitt.edu/ super1/

Konsultan BiostatistikaPermasalahan yang biasa dikonsultasikan Desain penelitian dan ukuran sampel Prosedur analisis statistik yang tepat Penggunaan program komputer Interpretasi hasil analisis statistik

bioepid

Documents