biostatistika

BIOSTATISTIKA

HADYANA SUKANDAR

1. KONSEP DASAR :

- Pengertian statistik - kegunaan statistik - data - sumber data - jenis data - skala pengukuran

- ukuran statistik (ukuran sentral tendensi dan dispersi) dan ukuran statistik kesehatan(rate, ratio dan proporsi).

------------------------------------------------------------

Definisi Statistika (statistics) :

Sekumpulan konsep dan metode yang digunakan untuk mengumpulkan dan menginterpretasikan data tentang bidang kegiatan tertentu dan mengambil kesimpulan dalam situasi dimana ada ketidakpastian dan variasi.

- Statistika deskriptif- Statistika inferensial/analitik

Dari definisi di atas, statistika mencakup:- pengumpulan data- pengolahan data- penyajian data- analisis data- penarikan kesimpulan

------------------------------------------------------

Statistik (statistic) : kumpulan fakta/data : ukuran (ukuran statistik)

Statistik kesehatan :

- Morbiditas- Mortalitas- Fertilitas- Pelayanan kesehatan- Statistik kedokteran- Statistik keperawatan

Kegunaan statistik kesehatan :

- menentukan besarnya masalah- menentukan prioritas masalah- merencanakan suatu program- menentukan potensi masyarakat beserta sumberdaya lainnya - melakukan evaluasi terhadap suatu program- melakukan analisis perbandingan

Penyalahgunaan statistik ?Data (data statistik) : keterangan atau fakta mengenai sesuatu persoalan, bisa berbentukkategori atau bilangan.

Data dapat diklasifikasikan berdasarkan :- jenis data- sumber data- skala pengukuran

Jenis data : kualitatif, kuantitatif

Sumber data : Intern Ekstern (primer, sekunder, tersier)

Cara memperoleh data primer :1. Melakukan observasi (pengamatan)2. Wawancara (interview)3. Kuesioner4. Pengukuran5. Diskusi mendalam (FGD)6. Sumber lainnya : lab, pemeriksaan rontgen, dsb.

Syarat kuesioner :a. singkat, jelas, mudah dipahami respondenb. responden dapat menjawab dengan benarc. tidak menyimpang dari tujuan penelitiand. tidak menyinggung perasaan respondene. tiap pertanyaan hanya mempunyai satu maknaf. tiap pertanyaan harus ada jawabnyag. pertanyaan bersifat netralh. jumlah pertanyaan tidak boleh terlalu banyaki. pertanyaan tidak bersifat hipotesis

Jenis kuesioner : terbuka, tertutup, campuran Isi kuesioner : a. pertanyaan tentang fakta/karakteristikb. pertanyaan tentang pendapat/sikapc. pertanyaan tentang informasi (menyangkut apa yang diketahui oleh responden)d. pertanyaan tentang persepsi diri

Sumber data sekunder :

1. Sensus penduduk2. Survey kesehatan rumah tangga3. Survey sosial ekonomi nasional 4. SUPAS5. Survey angkatan kerja nasional6. Profil kelurahan, kecamatan7. Sumber data lainnya.

Skala pengukuran :- Variabel kualitatif ----> Nominal Ordinal- Variabel kuantitatif --> Interval Rasio

Kontinu (hasil mengukur) Diskrit (hasil menghitung)

Statistik yang cocok :Nominal : modus, persentaseOrdinal : modus, median

Interval/rasio : semua ukuran statistik bisa dihitung

Variabel : karakteristik daripada orang, objek, atau gejala yang dapat mengambil nilai yang berbeda.

Klasifikasikan data/variabel di bawah ini :1. Penilaian ujian : A, B, C, D, E : Nilai skor 70, 76, dst 2. Pendapatan keluarga/bulan3. Tingkat pendidikan4. Status gizi5. Jenis pekerjaan6. IQ7. Produksi padi/Ha8. APGAR skor9. PH

Ukuran statistik kesehatan :

1. Rate (angka) misal rate kematian2. Rasio : perbandingan dua angka (X/Y)3. Proporsi : X/(X+Y)

Ukuran statistik :a. Ukuran sentral tendensi :- rata-rata- median- modus- rata-rata yang ditimbang- rata-rata logaritma

b. Ukuran variabilitas/dispersi :- range - standard deviasi- varians- koefisien variasi

Ukuran Frekuensi :

1. Rasio2. Proporsi3. RateBerdasarkan riwayat alamiah penyakit, kejadian penyakit dapat dibedakan menjadi 2 jenis : (1) Insidensi (2) Prevalensi

Insidensi sering dikatakan kasus baru.Prevalensi adalah kejadian penyakit pada satu saat atau satu periode waktu, baik yang baru saja memasuki fase klinik maupun yang telah beberapa waktu lamanya berkembang sepanjang fase klinik (kasus baru+kasus lama).

Dalam riset etiologi, untuk mengetahui faktor-faktor penyebab penyakit sehingga manifes secara klinik, jenis data yang digunakan adalah insidensi.

Dalam riset prognosis, untuk mempelajari faktor-faktor yang mempengaruhi akibat lanjut penyakit, jenis data yang digunakan adalah prevalensi. Insidensi :

(1) Insidensi kumulatif (CI)(2) Insidensi rate (laju insidensi) atau

Insidensi density (ID)Rumus : orang yg terkena penyakit dlm suatu jangka waktu

CI = --------------------------------------------------------------------------------

semua orang dlm risiko untuk terkena penyakit dlm jangka

waktu itu

Contoh :- Attack rate (risk) keracunan setelah

makan tempe bongkrek- Angka kematian kasus (case fatality

rate) untuk tuberkulosis- Probabilitas kelangsungan hidup dlm

setahun setelah didiagnosis kanker paru

- Risiko dlm 5 tahun untuk terkena penyakit jantung koroner pada pria Indonesia umur 50 th.

Cara menghitung CI :- Metode kumulatif sederhana- Metode aktuarial (life table)

Laju insidensi :

kasus baru penyakit

ID = --------------------------------------------------------------------------------

orang dalam risiko x lamanya masing-masing dlm risiko

Contoh :

Kecepatan insidensi HIV pada anggota klub “sextacy” di Jakarta. Pengamatan antara 1 Jan 1995 – akhir tahun 1996.A. 20 orang mulai menjadi anggota 1 Jan 95 dan

berhenti pada 1 Jan 97 tanpa pernah menderita positip HIV

B. 10 orang mulai menjadi anggota 1Jan 95 dan menjadi positip HIV pada 31 Jan 96

C. 5 orang mulai menjadi anggota 31 Juli 95 dan berhenti pada 1 Juli 96 karena positip HIV

D. 5 orang mulai menjadi anggota 1 Jan 95 dan berhenti pada 1 Juli 96 karena meninggal.

Pembilang : kasus = 15Penyebut : Kel A = 20 x 24 Kel B = 10 x 13 Kel C = 5 x 11 Kel D = 5 x 18ID = 15 kasus/ 755 orang bulan = 0,020 per orang bulan pengamatan = 2 positip HIV per 100 orang bulanArtinya : kecepatan insidensi adalah 2 orang positip HIV dari 100 orang yang terpapar selama sebulan.

Prevalensi : Prevalensi titik Prevalensi periode

Prevalensi = kasus penyakit titik Populasi total

Prevalensi = kasus saat ini + kasus baru periode Rata-rata populasiRata-rata populasi bisa diganti oleh populasi pada t0 .3. SAMPLING

ISTILAH-ISTILAH YANG DIGUNAKAN :---------------------------------------------------------

- POPULASI- SAMPEL- SAMPLING- SAMPLING FRACTION- SAMPLING FRAME- SAMPLING UNIT- JENIS SAMPLING- BESAR SAMPEL

---------------------------------------------------------

POPULASI : Totalitas semua nilai yang mungkin, hasil menghitung ataupun pengukuran, kuantitatif maupun kualitatif daripada karakteristik tertentu mengenai sekumpulan objek yang lengkap dan jelas.

KARAKTERISTIK : Ciri atau sifat yang akan diteliti, diperiksa, diukur.

SAMPEL : Sebagian yang diambil dari populasi.Cara pengumpulan data dimana setiap anggota populasi dikenai penelitian disebut sensus. Sedangkan berdasarkan sampel yang diambil dari populasi disebut sampling.

Populasi : Sampel :

Parameter Statistik (,, dsb) (X,p,s dsb)

Alasan sampling : 1. ukuran populasi: terhingga,

N . . ..

d

n X p s

tak terhingga 2. masalah biaya3. masalah waktu4. percobaan yg sifatnya merusak 5. masalah ketelitian6. faktor ekonomisSAMPLING FRACTION : Proporsi dari unit sampling yang akan dipilih dari spesifik sampling frame.

SAMPLING FRAME(kerangka sampling): Daftar dari unit sampling yang akan dipilih.

UNIT SAMPLING : Unit terkecil yang akan dipilih secara sampling, misal orang, kepala keluarga, desa, dsb.

2 macam kekeliruan :- kekeliruan sampling- kekeliruan tak sampling

Kekeliruan sampling terjadi karena pemeriksaan tak lengkap tentang

populasi (penelitian dilakukan berdasarkan sampel)

Kekeliruan tak sampling penyebabnya : - populasi tidak didefinisikan sebagaimana mestinya- populasi yang menyimpang dari populasi yang seharusnya dipelajari- kuesioner tidak dirumuskan sebagai mana mestinya- istilah-istilah tidak didefinisikan secara tidak tepat- responden tdk memberikan jawaban yang akurat

JENIS SAMPLING :

1. Probabilitas sampling2. Non probabilitas sampling

Non probabilitas sampling :1. quota sampling2. purposive sampling3. convenience sampling4. dll.Probabilitas sampling :

1. simple random sampling2. stratified sampling3. systematic sampling4. cluster sampling 5. multistage sampling

Simple random sampling : - setiap unit sampling dalam kerangka sampling mempunyai kemungkinan yang sama untuk dipilih.- pemilihan random dari kerangka sampling dapat dipilih dengan menggunakan bilangan random atau komputer.- populasinya bersifat homogen.

Stratified random sampling :

- populasi dibagi kedalam group atau strata menurut karakteristik yang diperhatikan, misal jenis kelamin, usia, lokasi geografi (populasi heterogen dibagi kedalam beberapa sub populasi yang homogen).- dari setiap strata, dilakukan simple random sample : bisa secara proporsional, seragam atau alokasi optimum.

Contoh : Strata Nh nh Xh Sh

1 400 96 - - 2 140 33 - - 3 80 19 - - 4 100 24 - - 5 100 24 - -JUMLAH 820 196

Systematic sampling :

- pemilihan dilakukan secara sistematis dengan memilih unit pertama secara random dari k unit. 1/k disebut sampling fraction.- contoh N=100, n = 10; maka n/N = 10/100 = 1/10 (artinya 1 dari setiap 10).

Cluster sampling :

- cluster (kelompok)hendaknya tersusun dari elemen-elemen yang heterogen sehingga setiap cluster dipandang dapat mewaki- li ciri atau sifa populasi. - banyaknya elemen (M) dalam cluster disebut ukuran cluster, dan banyaknya cluster (N) dalam populasi disebut ukuran populasi cluster.- sampel cluster dipilih secara random.

- semua unit yang ada pada cluster terpilih menjadi subjek penelitian.

Multistage sampling :

- pemilihan dilakukan dalam beberapa tahap sampai unit sampling terakhir/terkecil.- dalam setiap tahap sampling bisa dilakukan secara random atau sistematis.

Penggunaan tabel bilangan random (acak) :

Dari 8500 penduduk akan dipilih secara random sebanyak 100, bagaimana caranya ?

a. buka tabel bilangan randomb. lemparkan ujung pensil ke dalam

tabel bilangan random, misal jatuh pada kolom 5, baris 3.

c. Baca 4 digit bisa kekanan, kekiri atau kebawah (4 digit karena N=8500). Contoh pilih ke kanan.

d. Baca sampai diperoleh sebanyak 100 bilangan random.

Bilangan random :

Kolom

1 2 3 4 5 6 7 8 9 0 1 2 3 4 … …3 6 4 5 8 8 3 1 2 8 7 3 5 99 0 5 1 4 0 6 6 1 8 4 6 9 59 8 4 1 9 0 2 2 4 8 3 7 8 05 5 2 5 7 1 2 7 1 4 6 8 6 40 2 9 9 1 0 7 5 7 7 2 1 8 87 9 8 5 5 5 6 6 6 3 8 4 0 8

dst

catatan : jika setiap bilangan random ingin dipergunakan caranya adalah dengan mengurangi dengan kelipatannya.

Misal 9845 ingin dipakai maka bilangan random terpilih no = 9845 – 8500 = 1345.Latihan kelas :

1. Kapan kita harus melakukan sensus dan sampling ?

2. Tujuan penelitian ingin mengetahui pengetahuan remaja tentang kesehatan reproduksi di Jawa Barat.Tetapkan : populasi, sampel, teknik sampling, kerangka sampling, unit sampling dan karakteristik apa yang akan diukur ?.

3. Prosedur sampling yang cocok untuk situasi :a. menaksir prevalensi buta

warna pada anak sekolah dasar di kota Bandung.

b. Menaksir distribusi penderita menurut asal penderita /tempat tinggal

dari pasen-pasen yang datang ke RSHS selama periode 1 tahun.

c. Memilih 25% pasen untuk interview dari yang datang ke klinik dokter dalam satu hari.

d. Menaksir persentase pengetahuan kepala desa di Jawa Barat tentang penyakit AIDS.

e. Mengetahui kemampuan perawat lulusan AKPER dalam menangani pasen stroke.

TAKSIRAN BESAR SAMPEL

1. TAKSIRAN BESAR SAMPEL UNTUK STUDI CROSS-SECTIONAL

DASAR PERTIMBANGAN :a. Rancangan samplingb. Parameter yang akan ditaksir

( atau ).

Untuk rancangan sampling ’simple random sampling’ pertimbangan lainnya diperlukan presisi (kekeliruan maksimum yang masih dapat ditolerir), tingkat reliabilitas yang dikehendaki dan besarnya variabilitas.

Rumus untuk menaksir rata-rata populasi :

n = Z2 2 / d2 (N -> )

n = N Z2 2 /((N-1)d2 + Z

2 2) (N diketahui)Rumus untuk menaksir proporsi populasi :

n = Z2 p (1-p) /d2 (N -> )

N Z2 p(1-p)

n = (N-1)d2 + Z

2 p(1-p) (N diketahui)

Untuk rancangan sampling ’stratified random sampling’

a. Rumus untuk menaksir rata-rata populasi :

N Nh sh2

n = N2d2/Z2 + Nh sh

2

(alokasi proporsional)

nh = Nh/N x n L Nh

2 sh2

n = N2d2/Z2 + Nh sh

2

(alokasi equal)

nh = n/L (L = banyak strata)

b. Rumus untuk menaksir proporsi populasi :

N Nh ph (1-ph) n = N2d2/Z2 + Nh ph (1-ph) (alokasi proporsional)

nh = Nh/N x n L Nh

2 ph (1-ph) n = N2d2/Z2 + Nh ph (1-ph)

(alokasi equal)nh = n/L (L = banyak strata)

2. TAKSIRAN BESAR SAMPEL UNTUK STUDI ANALITIK

a. Menguji sebuah proporsi

(Z1- p0(1-p0) + Z1- p1(1-p1) )2

n = ----------------------------------------- (p1 – p0)2

b. Menguji sebuah rata-rata

2 (Z1- + Z1-)2

n = --------------------- (X - )2

c. Menguji 2 proporsi

(Z1- 2P(1-P) + Z1- p1q1+p2q2 )2

n = ----------------------------------------- (p1 – p2)2

dengan q1 = 1-p1 ; q2 = 1-p2

d. Menguji 2 proporsi untuk equivalence trials = negative trials

2p(1-p) (Z1-/2 + Z1-)2

n = -------------------------- d2

d = perbedaan maksimum yang secara klinis tidak bermakna.

e. Menguji perbedaan dua rata-rata(H0 : 1 = 2)

2 2 (Z1- + Z1-)2

n = --------------------- (1 - 2)2

(paired observation)

d2 (Z1- + Z1-)2

n = --------------------- d

2 d= difference

(paired observation) f. BESAR SAMPEL UNTUK STUDI KOHOR

Disease Non Disease Total--------------------------------------------------------- Exposed a (p1n) c a+c (n)

Non Exp b (p2n) d b+d (n)--------------------------------------------------------- a/(a+c)Relative Risk (RR) = ----------- b/ (b+d)

p1 = a/(a+c)p2 = b/(b+d) p1 = p2 x RR

(Z1- 2P(1-P) + Z1- p1q1+p2q2 )2

n = ----------------------------------------- (p1 – p2)2

dengan q1 = 1-p1 ; q2 = 1-p2

g. BESAR SAMPEL UNTUK STUDI KASUS KONTROL (CASE-CONTROL STUDY)

KASUS KONTROL ---------------------------------------------- Exposed a (p1n) c (p2n)

Non Exp b (1-p1n) d (1-p2n) ---------------------------------------------- Total n n---------------------------------------------- ODDS RASIO (OR) = ad/bc p1 = proportion of exposed in casesp2 = proportion of exposed in control OR = p1 (1- p2) / p2 (1-p1)

-> p1 = OR x p2 / (1 + p2(OR-1) )

(Z1- 2P(1-P) + Z1- p1q1+p2q2 )2

n = ----------------------------------------- (p1 – p2)2

(OR dan p2 diketahui)Besar sampel untuk kontrol berganda :

n = c+1/ 2c x n

Contoh kasus : kontrol = 1 : 2Maka c = 2 n = jumlah subject untuk kasus 2 x n = jumlah subject untuk kontrol.

Koreksi untuk drop-out Jika f = proporsi subject drop-out

n = 1/(1-f) x n

h. BESAR SAMPEL UNTUK MENGANA- LISIS KOEFISIEN KORELASI (r) :

n = (Z1-/2 + Z1-) : 0.5 ln ((1+r)/(1-r)) 2 + 3

r = koefisien korelasi

POPULASI DAN SAMPEL

POPULASI : DALAM METODOLOGI PENELITIAN ADALAH SEKELOMPOK INDIVIDU (PASEN, BINATANG PERCOBAAN, REKAM MEDIK, HASIL LAB, DSB) DENGAN KARAKTERISTIK DITENTUKAN.

SAMPEL : ADALAH SUBSET (BAGIAN) POPULASI YANG DITELITI

POPULASI : - POPULASI TARGET - POPULASI TERJANGKAU

SAMPEL :- SAMPEL YANG DIRENCANAKAN - SAMPEL YANG BENAR-BENAR DITELITI

POPULASI TERJANGKAU : POPULASI TARGET YANG DIBATASI OLEH TEMPAT DAN WAKTU.

SAMPEL YANG DIRENCANAKAN : SUBSET DARI POPULASI TERJANGKAU

LOST TO FOLLOW UP :

- PENELITIAN KLINIS : 5 – 10 %- PENELITIAN LAPANGAN : 15 %- PENELITIAN LABORATORIUM : 5 %

TABEL KONTINGENSI

Untuk data yang terdiri atas dua klasifikasi atau variabel, di mana klasifikasi satu ada b dan lainnya ada k bagian, dapat dibuat tabel kontingensi berukuran bxk, di mana b menyatakan banyak baris dan k menyatakan banyak kolom.Tabel kontingensi ini merupakan hasil tabula-si silang dari 2 variabel atau lebih (analitik).

Tabulasi silang : Deskriptif Analitik

Menentukan perbedaan Mencari hubungan

1. Tabulasi silang deskriptif

- Tempat tinggal dan jenis kelamin dari tenaga kesehatan

Tempat tinggal Tenaga ------------------------------------------- Jumlah Kesehatan Rural Urban ---------------------------------------------------------------------------- Dokter L 8 (10%) 35 (21%) 43 P 2 (3%) 16 (10%) 18

Perawat L 46 (58%) 36 (22%) 82 P 23 (29%) 77 (47%) 100 --------------------------------------------------------------------------- Jumlah 79 (100%) 164 (100%) 243 --------------------------------------------------------------------------- 2. Tabulasi silang analitik

- Tingkat pengetahuan nutrisi antara kedua kelompok

---------------------------------------------------------------------------- Tingkat peng. NutrisiKelompok ibu --------------------------------------- Jumlah R S T---------------------------------------------------------------------------- Aktif PKK 70 70 110 250 (… %) (… %) (… %)

Tdk aktif PKK 120 80 50 250 (… %) (… %) (… %)---------------------------------------------------------------------------- Jumlah 190 150 160 500

---------------------------------------------------------------------------- 3. Hubungan antara umur ibu dengan lama menyusui

--------------------------------------------------------------------------- Lama menyusui bayi (bl) Umur ibu ----------------------------------------- Jumlah (tahun) 0-5 6-11 12--------------------------------------------------------------------------- 15-19 10 30 60 100 (… %) (… %) (… %)

20-24 20 50 80 150

25-29 30 50 70 150

30-34 45 70 60 175

35-39 100 60 40 200

40 + 40 80 5 125

---------------------------------------------------------------------------- Jumlah 245 340 315 900 ----------------------------------------------------------------------------

Uji Chi-kuadrat (2) :

a. Tabel 2x2

-------------------------------------------------- + - Jumlah--------------------------------------------------- Sampel 1 a b a+b

Sampel 2 c d c+d--------------------------------------------------- Jumlah a+c b+d n---------------------------------------------------

n ad - bc - n/2 2 2 = ----------------------------------- (a+b) (a+c) (b+d) (c+d)

Hasilnya bandingkan dengan 2 tabel untuk derajat bebas (2-1) (2-1) = 1 (program komputer akan keluar Hasil 2 berikut nilai p).

Contoh : Percobaan klinik penggunaan aspirin untuk sakit kepala

-------------------------------------------------- - + Jumlah --------------------------------------------------- Aspirin 70 30 100 + = Sakit kepalaPlacebo 55 55 110--------------------------------------------------- - = Tdk sakitJumlah 125 85 210 kepala

---------------------------------------------------

n ad - bc - n/2 2 2 = ----------------------------------- = 7,89 (p<0,01) (a+b) (a+c) (b+d) (c+d)

b. Tabel Kx2 :

-------------------------------------------------- + - jumlah-------------------------------------------------- sampel 1 n1

2 n23 n34 n4

. . . . . . k nk ------------------------------------------------ Jumlah x n-x n ------------------------------------------------

n2 2 = ----------- xi 2 / ni - x2 / n x (n-x)

Hasilnya bandingkan dengan 2 tabel untuk derajat bebas (k-1).

c. Tabel BxK :-------------------------------------------------------------------- Kolom ----------------------------------------------- Total 1 2 3 4 … K --------------------------------------------------------------------

Baris 1 n.1 2 n.2

3 n.34 n.4. .. .. .B n.B

-------------------------------------------------------------------- Total n1. n2. n3. n4. nK. N --------------------------------------------------------------------

2 = ( Oij - Eij ) 2 / Eij

Oij = Nilai observasi baris ke i kolom ke j Eij = Nilai ekspektasi baris ke i kolom ke j

Eij = ( ni. x n.j ) / N

Hasilnya bandingkan dengan 2 tabel untuk derajat bebas (B-1) (K-1).

d. Tabel 2x2 untuk data berpasangan (uji Mc. Nemar)

Contoh : Suatu percobaan klinik penggunaan dua obat

A dan B untuk arthritis, di mana setiap pasen diberi dua

pengobatan (Randomised crossover study), dan ditanyakan

apakah merasa :

’Satisfied’ atau ’Not satisfied’ dengan obat, datanya sbb :

--------------------------------------------------------------------- Obat A ----------------------------------- Total Satisfied Not satisfied---------------------------------------------------------------------

Obat B Satisfied 150 (e) 20 (f) 170

Not Satisfied 30 (g) 50 (h) 80--------------------------------------------------------------------- Total 180 70 250---------------------------------------------------------------------Untuk menguji hipotesis (H0) proporsi satisfied antara

Obat A dan obat B sama, digunakan rumus :

2 = f – g - 1 2 / (f+g) = 20 – 30 - 1 2/(20+30)

= 1,62 ; p = 0,20

ANALISIS REGRESI DAN KORELASI

Pengertian :

Analisis regresi adalah suatu analisis statistika yang

memanfaatkan hubungan antara dua variabel atau lebih.

Variabel yang terlibat dalam hubungan ini adalah variabel Y

(biasa dinamakan variabel dependen atau respons) dan variabel

X (bisa X1, X2, X3 , … , Xn), yang biasa dinamakan variabel

independen atau prediktor. Model hubungan fungsional

berbentuk :

Y = f (X). Misalnya, Y = 7 + 2 X; atau Y = 12 + 7 X – 0,5 X2

Analisis korelasi adalah menunjukkan kuatnya hubungan antara

kedua variabel atau lebih, dan ini ditunjukkan oleh besarnya

koefisien determinasi (r2), r sendiri adalah koefisien korelasi.

Memilih variabel independen

Untuk memperoleh model regresi yang masih dapat ditangani,

maka banyaknya variabel independen harus terbatas. Ini harus

dipilih sedemikian rupa sehingga benar-benar merupakan

himpunan variabel independen yang terbaik untuk tujuan

analisis.

Beberapa hal yang perlu diperhatikan adalah :

a) kontribusi variabel independen yang bersangkutan

b) pentingnya variabel independen sebagai penyebab dalam

proses yang dianalisis

c) adanya kemudahan akurat, dan ekonomisnya observasi

independen.

Bentuk fungsional persamaan regresi

Pemilihan bentuk fungsional persamaan regresi berhubungan

dengan pemilihan variabel independen. Kadang-kadang teori

disiplin yang bersangkutan dapat menunjukkan bentuk

fungsional yang cocok dari persamaan regresi. Tetapi dalam

banyak hal bentuk fungsional persamaan regresi tidak

diketahui sebelumnya dan harus ditentukan setelah data

terkumpul dan dianalisis.

Strategi memilih model yang cocok :

1. Mulai dengan mengasumsikan bahwa model yang cocok

adalah regresi linier

2. Tentukan taksiran model regresi terbaiknya

3. Tentukan apakah model regresi (pada langkah 2) secara

signifikan membantu menjelaskan variabel dependen Y

4. Jika ya (langkah 3), maka model regresi linier adalah model

yang cocok untuk digunakan sebagai peramal Y

5. Jika tidak (langkah 3), cari model lain sampai model yang

cocok diperoleh.

Catatan : Sebaiknya untuk memilih model yang cocok untuk

hubungan dua buah variabel, terlebih dahulu gambarkan scatter

diagramnya, dan buat perkiraan model yang bisa dipakai.

Model-model regresi :

1. Regresi linier : Y = A + B X

2. Regresi multipel : Y = A + B X1 + C X2 + D X3

3. regresi parabola (kuadratik) : Y = A + B X + C X2

4. Regresi geometrik : Y = A XB

5. Regresi eksponensial : Y = A BX

6. Dlsb.

Analisis regresi :

Outcome (variabel dependen) : kontinu

Variabel independen : kontinu dan kategori

Analisis diskriminan :

Outcome (variabel dependen) : 2 kategori

Variabel independen : kontinu (normal)

Analisis regresi logistik :

Outcome (variabel dependen) : 2 kategori

Variabel independen : kontinu dan kategori

Contoh :

1. Hubungan jumlah transfusi darah dengan kadar gula

2. Dosis yang diberikan dengan kadar tertentu

3. Tinggi ayah dengan tinggi anak

4. Pendapatan (GNP) dengan TFR di negara Asia

5. Berat badan lahir dengan lingkar lengan ibu, tinggi ibu, lingkar

kepala, dsb.

6. Variabel dependen : Tekanan darah sistolik

variabel independen : Umur, jenis kelamin (L,P), merokok (Y,T)

Model regresi yang bisa dibuat :

- Tekanan darah Sist (Y) terhadap umur (X1)

- Tekanan darah Sist (Y) terhadap umur (X1 ) dan jenis

kelamin (X2)

- Tekanan darah Sist (Y) terhadap umur (X1) , jenis

kelamin (X2) dan merokok (X3)

Bagaimana model regresi liniernya ?

7. Penelitian longitudinal untuk mempelajari tiga faktor risiko

terhadap kejadian Coronary heart disease (CHD). Pada saat

penelitian terhadap 832 laki-laki yang bebas CHD dicatat umur,

tekanan darah diastolik dan kadar kolesterol. Pada periode akhir

penelitian, 71 laki-laki menjadi CHD dan sisanya 761 non CHD.

Pertanyaan secara statistika yang penting apakah mungkin untuk

membedakan diantara 71 laki-laki dengan CHD dan 761 tanpa

CHD, dengan memperhatikan data dasar umur (X1), tekanan

darah diastolik (X2), dan kadar kolesterol (X3).

Untuk menjawab ini gunakan analisis diskriminan.

8. Pasen yang datang ke RSHS dengan myocardial infark. Diukur

tekanan darah sistolik, tekanan darah diastolik, heart rate, stroke

index, dan tekanan darah arteri. Apakah mungkin untuk

meramalkan bahwa pasen akan hidup ?

9. Data yang dikumpulkan di bagian kebidanan :

Variabel independen : umur sekarang; merokok (Y,T); Hb masuk;

paritas; pendidikan (tahun); lama persalinan (jam)

Variabel dependen : berat badan lahir; keadaan bayi lahir

(mati, hidup); komplikasi persalinan (ada/tidak ada)

Variabel confounding : Status sosial ekonomi; pemakain KB

sebelum kehamilan sekarang.

Analisis apa saja yang bisa dibuat ?

Regresi linier sederhana :

Hanya terlibat satu variabel independen (X) dan satu variabel

dependen (Y).

Bentuk persamaan regresi :

Y = + X + (populasi)

Ditaksir oleh :

Y = a + b X (sampel)

Y = Y taksiran (taksiran rata-rata Y untuk X diketahui)

a = intercept, konstanta

= titik potong garis regresi terhadap sumbu Y

b = koefisien regresi

Rumus :

n XY - X Y b = -------------------------- n X2 – (X)2

a = Y – b X

Rumus koefisien korelasi :

n XY - X Y r = -------------------------------------------------- n X2 – (X)2 n Y2 – (Y)2

-1 r 1

Analisis varians (ANAVA)

Untuk membandingkan perbedaan rata-rata lebih dari 2 kelompok.

Syarat : - Data numerik dan berdistribusi normal untuk masing - masing kelompok - alokasi kedalam kelompok dilakukan secara random - varians homogen

Untuk menguji hipotesis varians homogen dengan :

H0 : 12 = 2

2

H1 : 12 2

2

Digunakan uji statistik :

Varians terbesar F maks = -------------------- Varians terkecil

distribusi F dengan derajat bebas (degree of freedom) yaitu (n1 –1; n2 –1)

n1 –1 = derajat bebas pembilangn2 –1 = derajat bebas penyebut

Contoh lihat halaman 168 :Placebo : n1 = 15 - s1

2 = 579,8Test : n2 = 14 - s1

2 = 77,7

Maka F = 579,8/77,7 = 7,5

Dari tabel F untuk taraf signifikansi 5 % dengan derajat bebas (14;13) diperoleh F = 2,55 dan untuk taraf signifikansi 1 % didapat F = 3,85.Kesimpulan : karena F hitung (7,5) > F tabel = 1 % maka H0 ditolak (kedua varians tidak sama).Untuk membandingkan varians lebih dari 2 kelompok digunakan uji Bartlett atau uji Levene(program SPSS windows).

ANAVA satu arah (oneway ANOVA)Contoh : Treatment ---------------------------------- A B C

---------------------------------- 7 12 13 5 11 14

8 13 15 6 12 14 7----------------------------------

t1 = 33 t2 = 48 t3 = 56 T = 137

n1 = 5 n2 = 4 n3 = 4 N = 13Tabel ANAVA :--------------------------------------------------------------------------------Sumber variasi SS df MS=SS/df F-------------------------------------------------------------------------------- Antar kelompok t2 /n – T2 /N k-1 MSG MSG/MSW

(between groups) = SSG

Dalam kelompok SST – SSG =SSW N-k MSW

(within groups)--------------------------------------------------------------------------------Total X2 – T2/N =SST N – 1

---------------------------------------------------------------------------------ANAVA berpasangan (Related ANOVA)

- Analisis varians untuk observasi yang berpasangan tdk ada interaksi

- Cross- over design (> 2 way)

Contoh : Treatment ------------------------------------------------- A B C tr nr

------------------------------------------------- 7 12 13 32 3 5 11 14 30 3

8 13 15 36 3 6 12 14 32 3 7 12 14 33 3--------------------------------------------------

t1 = 33 t2 = 60 t3 = 70 T = 163 n1 = 5 n2 = 5 n3 = 5 N = 15

Tabel ANAVA :

--------------------------------------------------------------------------------Sumber variasi SS df MS=SS/df F-------------------------------------------------------------------------------- Antar kolom t C

2 /nC – T2 /N k-1 MSG MSG/MSE

(between groups) = SSG

Antar subyek t R2 /nR – T2 /N N-k MSR

(between subyek) = SSR

Residu SST-SSC-SSR (c-1) (r-1) MSE

= SSE

--------------------------------------------------------------------------------Total X2 – T2/N =SST N – 1

---------------------------------------------------------------------------------Factorial design (ANOVA two way) ada 2 variabel (treatment + 1 variabel lain) interaksi ada/tidak ada Contoh :--------------------------------------------------------------- Variabel II Treatment (var I) (kel umur) A B C

--------------------------------------------------------------- Muda 7 12 13 5 11 14

8 13 15

Tua 6 12 14 7 12 14

8 13 16--------------------------------------------------------------- Tabel ANAVA :--------------------------------------------------------------------------------Sumber variasi SS df MS=SS/df F------------------------------------------------------------------------------------------ Antar kolom tC 2 /nC – T2 /N c-1 MSC MSC/MSW

(between groups) = SSC

Antar subyek tR 2 /nR – T2 /N r-1 MSR MSR/MSW

(between subyek) = SSR

Interaksi tcells 2 /ncells – (c-1)(r-1) MSJ MSJ/MSW

(kolomxbaris) T2 /N-SSC –SSR

= SSJ

Within cells SST-SSC-SSR-SSj N - cr MSW

= SSW

------------------------------------------------------------------------------------------Total X2 – T2/N =SST N – 1

------------------------------------------------------------------------------------------

Factorial design (ANAVA 3 way)

Source : - variabel 1- variabel 2- variabel 3- interaksi var 1 x var 2- Interaksi var 1 x var 3- Interaksi var 2 x var 3- Interaksi var 1 x var 2 x var 3- Within cells

-------------------------------------------------------

Jika hasil analisis varians (uji F) bermakna, untuk melihat perlakuan mana yang berbeda (rata-ratanya) digunakan analisis “multiple comparisons” .

Beberapa pilihan uji multiple comparisons :

1. Metode Bonferroni (modifikasi t test)

2. Metode Tukey3. Metode Dunnett (hanya untuk membandingkan thd

kelompok kontrol)4. Metode Scheffe5. Metode Duncan6. Metode Newman-Keuls

(dalam program statistika semua ada tinggal dipilih salah satu)

biostatistika

Documents