biostatistika
DESCRIPTION
biostatistikaTRANSCRIPT
BIOSTATISTIKA
HADYANA SUKANDAR
1. KONSEP DASAR :
- Pengertian statistik - kegunaan statistik - data - sumber data - jenis data - skala pengukuran
- ukuran statistik (ukuran sentral tendensi dan dispersi) dan ukuran statistik kesehatan(rate, ratio dan proporsi).
------------------------------------------------------------
Definisi Statistika (statistics) :
Sekumpulan konsep dan metode yang digunakan untuk mengumpulkan dan menginterpretasikan data tentang bidang kegiatan tertentu dan mengambil kesimpulan dalam situasi dimana ada ketidakpastian dan variasi.
- Statistika deskriptif- Statistika inferensial/analitik
Dari definisi di atas, statistika mencakup:- pengumpulan data- pengolahan data- penyajian data- analisis data- penarikan kesimpulan
------------------------------------------------------
Statistik (statistic) : kumpulan fakta/data : ukuran (ukuran statistik)
Statistik kesehatan :
- Morbiditas- Mortalitas- Fertilitas- Pelayanan kesehatan- Statistik kedokteran- Statistik keperawatan
Kegunaan statistik kesehatan :
- menentukan besarnya masalah- menentukan prioritas masalah- merencanakan suatu program- menentukan potensi masyarakat beserta sumberdaya lainnya - melakukan evaluasi terhadap suatu program- melakukan analisis perbandingan
Penyalahgunaan statistik ?Data (data statistik) : keterangan atau fakta mengenai sesuatu persoalan, bisa berbentukkategori atau bilangan.
Data dapat diklasifikasikan berdasarkan :- jenis data- sumber data- skala pengukuran
Jenis data : kualitatif, kuantitatif
Sumber data : Intern Ekstern (primer, sekunder, tersier)
Cara memperoleh data primer :1. Melakukan observasi (pengamatan)2. Wawancara (interview)3. Kuesioner4. Pengukuran5. Diskusi mendalam (FGD)6. Sumber lainnya : lab, pemeriksaan rontgen, dsb.
Syarat kuesioner :a. singkat, jelas, mudah dipahami respondenb. responden dapat menjawab dengan benarc. tidak menyimpang dari tujuan penelitiand. tidak menyinggung perasaan respondene. tiap pertanyaan hanya mempunyai satu maknaf. tiap pertanyaan harus ada jawabnyag. pertanyaan bersifat netralh. jumlah pertanyaan tidak boleh terlalu banyaki. pertanyaan tidak bersifat hipotesis
Jenis kuesioner : terbuka, tertutup, campuran Isi kuesioner : a. pertanyaan tentang fakta/karakteristikb. pertanyaan tentang pendapat/sikapc. pertanyaan tentang informasi (menyangkut apa yang diketahui oleh responden)d. pertanyaan tentang persepsi diri
Sumber data sekunder :
1. Sensus penduduk2. Survey kesehatan rumah tangga3. Survey sosial ekonomi nasional 4. SUPAS5. Survey angkatan kerja nasional6. Profil kelurahan, kecamatan7. Sumber data lainnya.
Skala pengukuran :- Variabel kualitatif ----> Nominal Ordinal- Variabel kuantitatif --> Interval Rasio
Kontinu (hasil mengukur) Diskrit (hasil menghitung)
Statistik yang cocok :Nominal : modus, persentaseOrdinal : modus, median
Interval/rasio : semua ukuran statistik bisa dihitung
Variabel : karakteristik daripada orang, objek, atau gejala yang dapat mengambil nilai yang berbeda.
Klasifikasikan data/variabel di bawah ini :1. Penilaian ujian : A, B, C, D, E : Nilai skor 70, 76, dst 2. Pendapatan keluarga/bulan3. Tingkat pendidikan4. Status gizi5. Jenis pekerjaan6. IQ7. Produksi padi/Ha8. APGAR skor9. PH
Ukuran statistik kesehatan :
1. Rate (angka) misal rate kematian2. Rasio : perbandingan dua angka (X/Y)3. Proporsi : X/(X+Y)
Ukuran statistik :a. Ukuran sentral tendensi :- rata-rata- median- modus- rata-rata yang ditimbang- rata-rata logaritma
b. Ukuran variabilitas/dispersi :- range - standard deviasi- varians- koefisien variasi
Ukuran Frekuensi :
1. Rasio2. Proporsi3. RateBerdasarkan riwayat alamiah penyakit, kejadian penyakit dapat dibedakan menjadi 2 jenis : (1) Insidensi (2) Prevalensi
Insidensi sering dikatakan kasus baru.Prevalensi adalah kejadian penyakit pada satu saat atau satu periode waktu, baik yang baru saja memasuki fase klinik maupun yang telah beberapa waktu lamanya berkembang sepanjang fase klinik (kasus baru+kasus lama).
Dalam riset etiologi, untuk mengetahui faktor-faktor penyebab penyakit sehingga manifes secara klinik, jenis data yang digunakan adalah insidensi.
Dalam riset prognosis, untuk mempelajari faktor-faktor yang mempengaruhi akibat lanjut penyakit, jenis data yang digunakan adalah prevalensi. Insidensi :
(1) Insidensi kumulatif (CI)(2) Insidensi rate (laju insidensi) atau
Insidensi density (ID)Rumus : orang yg terkena penyakit dlm suatu jangka waktu
CI = --------------------------------------------------------------------------------
semua orang dlm risiko untuk terkena penyakit dlm jangka
waktu itu
Contoh :- Attack rate (risk) keracunan setelah
makan tempe bongkrek- Angka kematian kasus (case fatality
rate) untuk tuberkulosis- Probabilitas kelangsungan hidup dlm
setahun setelah didiagnosis kanker paru
- Risiko dlm 5 tahun untuk terkena penyakit jantung koroner pada pria Indonesia umur 50 th.
Cara menghitung CI :- Metode kumulatif sederhana- Metode aktuarial (life table)
Laju insidensi :
kasus baru penyakit
ID = --------------------------------------------------------------------------------
orang dalam risiko x lamanya masing-masing dlm risiko
Contoh :
Kecepatan insidensi HIV pada anggota klub “sextacy” di Jakarta. Pengamatan antara 1 Jan 1995 – akhir tahun 1996.A. 20 orang mulai menjadi anggota 1 Jan 95 dan
berhenti pada 1 Jan 97 tanpa pernah menderita positip HIV
B. 10 orang mulai menjadi anggota 1Jan 95 dan menjadi positip HIV pada 31 Jan 96
C. 5 orang mulai menjadi anggota 31 Juli 95 dan berhenti pada 1 Juli 96 karena positip HIV
D. 5 orang mulai menjadi anggota 1 Jan 95 dan berhenti pada 1 Juli 96 karena meninggal.
Pembilang : kasus = 15Penyebut : Kel A = 20 x 24 Kel B = 10 x 13 Kel C = 5 x 11 Kel D = 5 x 18ID = 15 kasus/ 755 orang bulan = 0,020 per orang bulan pengamatan = 2 positip HIV per 100 orang bulanArtinya : kecepatan insidensi adalah 2 orang positip HIV dari 100 orang yang terpapar selama sebulan.
Prevalensi : Prevalensi titik Prevalensi periode
Prevalensi = kasus penyakit titik Populasi total
Prevalensi = kasus saat ini + kasus baru periode Rata-rata populasiRata-rata populasi bisa diganti oleh populasi pada t0 .3. SAMPLING
ISTILAH-ISTILAH YANG DIGUNAKAN :---------------------------------------------------------
- POPULASI- SAMPEL- SAMPLING- SAMPLING FRACTION- SAMPLING FRAME- SAMPLING UNIT- JENIS SAMPLING- BESAR SAMPEL
---------------------------------------------------------
POPULASI : Totalitas semua nilai yang mungkin, hasil menghitung ataupun pengukuran, kuantitatif maupun kualitatif daripada karakteristik tertentu mengenai sekumpulan objek yang lengkap dan jelas.
KARAKTERISTIK : Ciri atau sifat yang akan diteliti, diperiksa, diukur.
SAMPEL : Sebagian yang diambil dari populasi.Cara pengumpulan data dimana setiap anggota populasi dikenai penelitian disebut sensus. Sedangkan berdasarkan sampel yang diambil dari populasi disebut sampling.
Populasi : Sampel :
Parameter Statistik (,, dsb) (X,p,s dsb)
Alasan sampling : 1. ukuran populasi: terhingga,
N . . ..
d
n X p s
tak terhingga 2. masalah biaya3. masalah waktu4. percobaan yg sifatnya merusak 5. masalah ketelitian6. faktor ekonomisSAMPLING FRACTION : Proporsi dari unit sampling yang akan dipilih dari spesifik sampling frame.
SAMPLING FRAME(kerangka sampling): Daftar dari unit sampling yang akan dipilih.
UNIT SAMPLING : Unit terkecil yang akan dipilih secara sampling, misal orang, kepala keluarga, desa, dsb.
2 macam kekeliruan :- kekeliruan sampling- kekeliruan tak sampling
Kekeliruan sampling terjadi karena pemeriksaan tak lengkap tentang
populasi (penelitian dilakukan berdasarkan sampel)
Kekeliruan tak sampling penyebabnya : - populasi tidak didefinisikan sebagaimana mestinya- populasi yang menyimpang dari populasi yang seharusnya dipelajari- kuesioner tidak dirumuskan sebagai mana mestinya- istilah-istilah tidak didefini- sikan secara tidak tepat- responden tdk memberikan jawaban yang akurat
JENIS SAMPLING :
1. Probabilitas sampling2. Non probabilitas sampling
Non probabilitas sampling :1. quota sampling2. purposive sampling3. convenience sampling4. dll.Probabilitas sampling :
1. simple random sampling2. stratified sampling3. systematic sampling4. cluster sampling 5. multistage sampling
Simple random sampling : - setiap unit sampling dalam kerangka sampling mempunyai kemungkinan yang sama untuk dipilih.- pemilihan random dari kerangka sampling dapat dipilih dengan menggunakan bilangan random atau komputer.- populasinya bersifat homogen.
Stratified random sampling :
- populasi dibagi kedalam group atau strata menurut karakteris- tik yang diperhatikan, misal jenis kelamin, usia, lokasi geografi (populasi heterogen dibagi kedalam beberapa sub populasi yang homogen).- dari setiap strata, dilakukan simple random sample : bisa secara proporsional, seragam atau alokasi optimum.
Contoh : Strata Nh nh Xh Sh
1 400 96 - - 2 140 33 - - 3 80 19 - - 4 100 24 - - 5 100 24 - -JUMLAH 820 196
Systematic sampling :
- pemilihan dilakukan secara sistematis dengan memilih unit pertama secara random dari k unit. 1/k disebut sampling fraction.- contoh N=100, n = 10; maka n/N = 10/100 = 1/10 (artinya 1 dari setiap 10).
Cluster sampling :
- cluster (kelompok)hendaknya tersusun dari elemen-elemen yang heterogen sehingga setiap cluster dipandang dapat mewaki- li ciri atau sifa populasi. - banyaknya elemen (M) dalam cluster disebut ukuran cluster, dan banyaknya cluster (N) dalam populasi disebut ukuran popula- si cluster.- sampel cluster dipilih secara random.
- semua unit yang ada pada cluster terpilih menjadi subjek penelitian.
Multistage sampling :
- pemilihan dilakukan dalam bebe- rapa tahap sampai unit sampling terakhir/terkecil.- dalam setiap tahap sampling bisa dilakukan secara random atau sistematis.
Penggunaan tabel bilangan random (acak) :
Dari 8500 penduduk akan dipilih secara random sebanyak 100, bagaimana caranya ?
a. buka tabel bilangan randomb. lemparkan ujung pensil ke dalam
tabel bilangan random, misal jatuh pada kolom 5, baris 3.
c. Baca 4 digit bisa kekanan, kekiri atau kebawah (4 digit karena N=8500). Contoh pilih ke kanan.
d. Baca sampai diperoleh sebanyak 100 bilangan random.
Bilangan random :
Kolom
1 2 3 4 5 6 7 8 9 0 1 2 3 4 … …3 6 4 5 8 8 3 1 2 8 7 3 5 99 0 5 1 4 0 6 6 1 8 4 6 9 59 8 4 1 9 0 2 2 4 8 3 7 8 05 5 2 5 7 1 2 7 1 4 6 8 6 40 2 9 9 1 0 7 5 7 7 2 1 8 87 9 8 5 5 5 6 6 6 3 8 4 0 8
dst
catatan : jika setiap bilangan random ingin dipergunakan caranya adalah dengan mengurangi dengan kelipatannya.
Misal 9845 ingin dipakai maka bilangan random terpilih no = 9845 – 8500 = 1345.Latihan kelas :
1. Kapan kita harus melakukan sensus dan sampling ?
2. Tujuan penelitian ingin mengetahui pengetahuan remaja tentang kesehatan reproduksi di Jawa Barat.Tetapkan : populasi, sampel, teknik sampling, kerangka sampling, unit sampling dan karakteristik apa yang akan diukur ?.
3. Prosedur sampling yang cocok untuk situasi :a. menaksir prevalensi buta
warna pada anak sekolah dasar di kota Bandung.
b. Menaksir distribusi pende- rita menurut asal penderita /tempat tinggal
dari pasen-pasen yang datang ke RSHS selama periode 1 tahun.
c. Memilih 25% pasen untuk interview dari yang datang ke klinik dokter dalam satu hari.
d. Menaksir persentase pengetahuan kepala desa di Jawa Barat tentang penyakit AIDS.
e. Mengetahui kemampuan perawat lulusan AKPER dalam menangani pasen stroke.
TAKSIRAN BESAR SAMPEL
1. TAKSIRAN BESAR SAMPEL UNTUK STUDI CROSS-SECTIONAL
DASAR PERTIMBANGAN :a. Rancangan samplingb. Parameter yang akan ditaksir
( atau ).
Untuk rancangan sampling ’simple random sampling’ pertimbangan lainnya diperlukan presisi (kekeliruan maksimum yang masih dapat ditolerir), tingkat reliabilitas yang dikehendaki dan besarnya variabilitas.
Rumus untuk menaksir rata-rata populasi :
n = Z2 2 / d2 (N -> )
n = N Z2 2 /((N-1)d2 + Z
2 2) (N diketahui)Rumus untuk menaksir proporsi populasi :
n = Z2 p (1-p) /d2 (N -> )
N Z2 p(1-p)
n = (N-1)d2 + Z
2 p(1-p) (N diketahui)
Untuk rancangan sampling ’stratified random sampling’
a. Rumus untuk menaksir rata-rata populasi :
N Nh sh2
n = N2d2/Z2 + Nh sh
2
(alokasi proporsional)
nh = Nh/N x n L Nh
2 sh2
n = N2d2/Z2 + Nh sh
2
(alokasi equal)
nh = n/L (L = banyak strata)
b. Rumus untuk menaksir proporsi populasi :
N Nh ph (1-ph) n = N2d2/Z2 + Nh ph (1-ph) (alokasi proporsional)
nh = Nh/N x n L Nh
2 ph (1-ph) n = N2d2/Z2 + Nh ph (1-ph)
(alokasi equal)nh = n/L (L = banyak strata)
2. TAKSIRAN BESAR SAMPEL UNTUK STUDI ANALITIK
a. Menguji sebuah proporsi
(Z1- p0(1-p0) + Z1- p1(1-p1) )2
n = ----------------------------------------- (p1 – p0)2
b. Menguji sebuah rata-rata
2 (Z1- + Z1-)2
n = --------------------- (X - )2
c. Menguji 2 proporsi
(Z1- 2P(1-P) + Z1- p1q1+p2q2 )2
n = ----------------------------------------- (p1 – p2)2
dengan q1 = 1-p1 ; q2 = 1-p2
d. Menguji 2 proporsi untuk equivalence trials = negative trials
2p(1-p) (Z1-/2 + Z1-)2
n = -------------------------- d2
d = perbedaan maksimum yang secara klinis tidak bermakna.
e. Menguji perbedaan dua rata-rata(H0 : 1 = 2)
2 2 (Z1- + Z1-)2
n = --------------------- (1 - 2)2
(paired observation)
d2 (Z1- + Z1-)2
n = --------------------- d
2 d= difference
(paired observation) f. BESAR SAMPEL UNTUK STUDI KOHOR
Disease Non Disease Total--------------------------------------------------------- Exposed a (p1n) c a+c (n)
Non Exp b (p2n) d b+d (n)--------------------------------------------------------- a/(a+c)Relative Risk (RR) = ----------- b/ (b+d)
p1 = a/(a+c)p2 = b/(b+d) p1 = p2 x RR
(Z1- 2P(1-P) + Z1- p1q1+p2q2 )2
n = ----------------------------------------- (p1 – p2)2
dengan q1 = 1-p1 ; q2 = 1-p2
g. BESAR SAMPEL UNTUK STUDI KASUS KONTROL (CASE-CONTROL STUDY)
KASUS KONTROL ---------------------------------------------- Exposed a (p1n) c (p2n)
Non Exp b (1-p1n) d (1-p2n) ---------------------------------------------- Total n n---------------------------------------------- ODDS RASIO (OR) = ad/bc p1 = proportion of exposed in casesp2 = proportion of exposed in control OR = p1 (1- p2) / p2 (1-p1)
-> p1 = OR x p2 / (1 + p2(OR-1) )
(Z1- 2P(1-P) + Z1- p1q1+p2q2 )2
n = ----------------------------------------- (p1 – p2)2
(OR dan p2 diketahui)Besar sampel untuk kontrol berganda :
n = c+1/ 2c x n
Contoh kasus : kontrol = 1 : 2Maka c = 2 n = jumlah subject untuk kasus 2 x n = jumlah subject untuk kontrol.
Koreksi untuk drop-out Jika f = proporsi subject drop-out
n = 1/(1-f) x n
h. BESAR SAMPEL UNTUK MENGANA- LISIS KOEFISIEN KORELASI (r) :
n = (Z1-/2 + Z1-) : 0.5 ln ((1+r)/(1-r)) 2 + 3
r = koefisien korelasi
POPULASI DAN SAMPEL
POPULASI : DALAM METODOLOGI PENELITIAN ADALAH SEKELOMPOK INDIVIDU (PASEN, BINATANG PERCOBAAN, REKAM MEDIK, HASIL LAB, DSB) DENGAN KARAKTERISTIK DITENTUKAN.
SAMPEL : ADALAH SUBSET (BAGIAN) POPULASI YANG DITELITI
POPULASI : - POPULASI TARGET - POPULASI TERJANGKAU
SAMPEL :- SAMPEL YANG DIRENCANAKAN - SAMPEL YANG BENAR-BENAR DITELITI
POPULASI TERJANGKAU : POPULASI TARGET YANG DIBATASI OLEH TEMPAT DAN WAKTU.
SAMPEL YANG DIRENCANAKAN : SUBSET DARI POPULASI TERJANGKAU
LOST TO FOLLOW UP :
- PENELITIAN KLINIS : 5 – 10 %- PENELITIAN LAPANGAN : 15 %- PENELITIAN LABORATORIUM : 5 %
TABEL KONTINGENSI
Untuk data yang terdiri atas dua klasifikasi atau variabel, di mana klasifikasi satu ada b dan lainnya ada k bagian, dapat dibuat tabel kontingensi berukuran bxk, di mana b menyatakan banyak baris dan k menyatakan banyak kolom.Tabel kontingensi ini merupakan hasil tabula-si silang dari 2 variabel atau lebih (analitik).
Tabulasi silang : Deskriptif Analitik
Menentukan perbedaan Mencari hubungan
1. Tabulasi silang deskriptif
- Tempat tinggal dan jenis kelamin dari tenaga kesehatan
Tempat tinggal Tenaga ------------------------------------------- Jumlah Kesehatan Rural Urban ---------------------------------------------------------------------------- Dokter L 8 (10%) 35 (21%) 43 P 2 (3%) 16 (10%) 18
Perawat L 46 (58%) 36 (22%) 82 P 23 (29%) 77 (47%) 100 --------------------------------------------------------------------------- Jumlah 79 (100%) 164 (100%) 243 --------------------------------------------------------------------------- 2. Tabulasi silang analitik
- Tingkat pengetahuan nutrisi antara kedua kelompok
---------------------------------------------------------------------------- Tingkat peng. NutrisiKelompok ibu --------------------------------------- Jumlah R S T---------------------------------------------------------------------------- Aktif PKK 70 70 110 250 (… %) (… %) (… %)
Tdk aktif PKK 120 80 50 250 (… %) (… %) (… %)---------------------------------------------------------------------------- Jumlah 190 150 160 500
---------------------------------------------------------------------------- 3. Hubungan antara umur ibu dengan lama menyusui
--------------------------------------------------------------------------- Lama menyusui bayi (bl) Umur ibu ----------------------------------------- Jumlah (tahun) 0-5 6-11 12--------------------------------------------------------------------------- 15-19 10 30 60 100 (… %) (… %) (… %)
20-24 20 50 80 150
25-29 30 50 70 150
30-34 45 70 60 175
35-39 100 60 40 200
40 + 40 80 5 125
---------------------------------------------------------------------------- Jumlah 245 340 315 900 ----------------------------------------------------------------------------
Uji Chi-kuadrat (2) :
a. Tabel 2x2
-------------------------------------------------- + - Jumlah--------------------------------------------------- Sampel 1 a b a+b
Sampel 2 c d c+d--------------------------------------------------- Jumlah a+c b+d n---------------------------------------------------
n ad - bc - n/2 2 2 = ----------------------------------- (a+b) (a+c) (b+d) (c+d)
Hasilnya bandingkan dengan 2 tabel untuk derajat bebas (2-1) (2-1) = 1 (program komputer akan keluar Hasil 2 berikut nilai p).
Contoh : Percobaan klinik penggunaan aspirin untuk sakit kepala
-------------------------------------------------- - + Jumlah --------------------------------------------------- Aspirin 70 30 100 + = Sakit kepalaPlacebo 55 55 110--------------------------------------------------- - = Tdk sakitJumlah 125 85 210 kepala
---------------------------------------------------
n ad - bc - n/2 2 2 = ----------------------------------- = 7,89 (p<0,01) (a+b) (a+c) (b+d) (c+d)
b. Tabel Kx2 :
-------------------------------------------------- + - jumlah-------------------------------------------------- sampel 1 n1
2 n23 n34 n4
. . . . . . k nk ------------------------------------------------ Jumlah x n-x n ------------------------------------------------
n2 2 = ----------- xi 2 / ni - x2 / n x (n-x)
Hasilnya bandingkan dengan 2 tabel untuk derajat bebas (k-1).
c. Tabel BxK :-------------------------------------------------------------------- Kolom ----------------------------------------------- Total 1 2 3 4 … K --------------------------------------------------------------------
Baris 1 n.1 2 n.2
3 n.34 n.4. .. .. .B n.B
-------------------------------------------------------------------- Total n1. n2. n3. n4. nK. N --------------------------------------------------------------------
2 = ( Oij - Eij ) 2 / Eij
Oij = Nilai observasi baris ke i kolom ke j Eij = Nilai ekspektasi baris ke i kolom ke j
Eij = ( ni. x n.j ) / N
Hasilnya bandingkan dengan 2 tabel untuk derajat bebas (B-1) (K-1).
d. Tabel 2x2 untuk data berpasangan (uji Mc. Nemar)
Contoh : Suatu percobaan klinik penggunaan dua obat
A dan B untuk arthritis, di mana setiap pasen diberi dua
pengobatan (Randomised crossover study), dan ditanyakan
apakah merasa :
’Satisfied’ atau ’Not satisfied’ dengan obat, datanya sbb :
--------------------------------------------------------------------- Obat A ----------------------------------- Total Satisfied Not satisfied---------------------------------------------------------------------
Obat B Satisfied 150 (e) 20 (f) 170
Not Satisfied 30 (g) 50 (h) 80--------------------------------------------------------------------- Total 180 70 250---------------------------------------------------------------------Untuk menguji hipotesis (H0) proporsi satisfied antara
Obat A dan obat B sama, digunakan rumus :
2 = f – g - 1 2 / (f+g) = 20 – 30 - 1 2/(20+30)
= 1,62 ; p = 0,20
ANALISIS REGRESI DAN KORELASI
Pengertian :
Analisis regresi adalah suatu analisis statistika yang
memanfaatkan hubungan antara dua variabel atau lebih.
Variabel yang terlibat dalam hubungan ini adalah variabel Y
(biasa dinamakan variabel dependen atau respons) dan variabel
X (bisa X1, X2, X3 , … , Xn), yang biasa dinamakan variabel
independen atau prediktor. Model hubungan fungsional
berbentuk :
Y = f (X). Misalnya, Y = 7 + 2 X; atau Y = 12 + 7 X – 0,5 X2
Analisis korelasi adalah menunjukkan kuatnya hubungan antara
kedua variabel atau lebih, dan ini ditunjukkan oleh besarnya
koefisien determinasi (r2), r sendiri adalah koefisien korelasi.
Memilih variabel independen
Untuk memperoleh model regresi yang masih dapat ditangani,
maka banyaknya variabel independen harus terbatas. Ini harus
dipilih sedemikian rupa sehingga benar-benar merupakan
himpunan variabel independen yang terbaik untuk tujuan
analisis.
Beberapa hal yang perlu diperhatikan adalah :
a) kontribusi variabel independen yang bersangkutan
b) pentingnya variabel independen sebagai penyebab dalam
proses yang dianalisis
c) adanya kemudahan akurat, dan ekonomisnya observasi
independen.
Bentuk fungsional persamaan regresi
Pemilihan bentuk fungsional persamaan regresi berhubungan
dengan pemilihan variabel independen. Kadang-kadang teori
disiplin yang bersangkutan dapat menunjukkan bentuk
fungsional yang cocok dari persamaan regresi. Tetapi dalam
banyak hal bentuk fungsional persamaan regresi tidak
diketahui sebelumnya dan harus ditentukan setelah data
terkumpul dan dianalisis.
Strategi memilih model yang cocok :
1. Mulai dengan mengasumsikan bahwa model yang cocok
adalah regresi linier
2. Tentukan taksiran model regresi terbaiknya
3. Tentukan apakah model regresi (pada langkah 2) secara
signifikan membantu menjelaskan variabel dependen Y
4. Jika ya (langkah 3), maka model regresi linier adalah model
yang cocok untuk digunakan sebagai peramal Y
5. Jika tidak (langkah 3), cari model lain sampai model yang
cocok diperoleh.
Catatan : Sebaiknya untuk memilih model yang cocok untuk
hubungan dua buah variabel, terlebih dahulu gambarkan scatter
diagramnya, dan buat perkiraan model yang bisa dipakai.
Model-model regresi :
1. Regresi linier : Y = A + B X
2. Regresi multipel : Y = A + B X1 + C X2 + D X3
3. regresi parabola (kuadratik) : Y = A + B X + C X2
4. Regresi geometrik : Y = A XB
5. Regresi eksponensial : Y = A BX
6. Dlsb.
Analisis regresi :
Outcome (variabel dependen) : kontinu
Variabel independen : kontinu dan kategori
Analisis diskriminan :
Outcome (variabel dependen) : 2 kategori
Variabel independen : kontinu (normal)
Analisis regresi logistik :
Outcome (variabel dependen) : 2 kategori
Variabel independen : kontinu dan kategori
Contoh :
1. Hubungan jumlah transfusi darah dengan kadar gula
2. Dosis yang diberikan dengan kadar tertentu
3. Tinggi ayah dengan tinggi anak
4. Pendapatan (GNP) dengan TFR di negara Asia
5. Berat badan lahir dengan lingkar lengan ibu, tinggi ibu, lingkar
kepala, dsb.
6. Variabel dependen : Tekanan darah sistolik
variabel independen : Umur, jenis kelamin (L,P), merokok (Y,T)
Model regresi yang bisa dibuat :
- Tekanan darah Sist (Y) terhadap umur (X1)
- Tekanan darah Sist (Y) terhadap umur (X1 ) dan jenis
kelamin (X2)
- Tekanan darah Sist (Y) terhadap umur (X1) , jenis
kelamin (X2) dan merokok (X3)
Bagaimana model regresi liniernya ?
7. Penelitian longitudinal untuk mempelajari tiga faktor risiko
terhadap kejadian Coronary heart disease (CHD). Pada saat
penelitian terhadap 832 laki-laki yang bebas CHD dicatat umur,
tekanan darah diastolik dan kadar kolesterol. Pada periode akhir
penelitian, 71 laki-laki menjadi CHD dan sisanya 761 non CHD.
Pertanyaan secara statistika yang penting apakah mungkin untuk
membedakan diantara 71 laki-laki dengan CHD dan 761 tanpa
CHD, dengan memperhatikan data dasar umur (X1), tekanan
darah diastolik (X2), dan kadar kolesterol (X3).
Untuk menjawab ini gunakan analisis diskriminan.
8. Pasen yang datang ke RSHS dengan myocardial infark. Diukur
tekanan darah sistolik, tekanan darah diastolik, heart rate, stroke
index, dan tekanan darah arteri. Apakah mungkin untuk
meramalkan bahwa pasen akan hidup ?
9. Data yang dikumpulkan di bagian kebidanan :
Variabel independen : umur sekarang; merokok (Y,T); Hb masuk;
paritas; pendidikan (tahun); lama persalinan (jam)
Variabel dependen : berat badan lahir; keadaan bayi lahir
(mati, hidup); komplikasi persalinan (ada/tidak ada)
Variabel confounding : Status sosial ekonomi; pemakain KB
sebelum kehamilan sekarang.
Analisis apa saja yang bisa dibuat ?
Regresi linier sederhana :
Hanya terlibat satu variabel independen (X) dan satu variabel
dependen (Y).
Bentuk persamaan regresi :
Y = + X + (populasi)
Ditaksir oleh :
Y = a + b X (sampel)
Y = Y taksiran (taksiran rata-rata Y untuk X diketahui)
a = intercept, konstanta
= titik potong garis regresi terhadap sumbu Y
b = koefisien regresi
Rumus :
n XY - X Y b = -------------------------- n X2 – (X)2
a = Y – b X
Rumus koefisien korelasi :
n XY - X Y r = -------------------------------------------------- n X2 – (X)2 n Y2 – (Y)2
-1 r 1
Analisis varians (ANAVA)
Untuk membandingkan perbedaan rata-rata lebih dari 2 kelompok.
Syarat : - Data numerik dan berdistribusi normal untuk masing - masing kelompok - alokasi kedalam kelompok dilakukan secara random - varians homogen
Untuk menguji hipotesis varians homogen dengan :
H0 : 12 = 2
2
H1 : 12 2
2
Digunakan uji statistik :
Varians terbesar F maks = -------------------- Varians terkecil
distribusi F dengan derajat bebas (degree of freedom) yaitu (n1 –1; n2 –1)
n1 –1 = derajat bebas pembilangn2 –1 = derajat bebas penyebut
Contoh lihat halaman 168 :Placebo : n1 = 15 - s1
2 = 579,8Test : n2 = 14 - s1
2 = 77,7
Maka F = 579,8/77,7 = 7,5
Dari tabel F untuk taraf signifikansi 5 % dengan derajat bebas (14;13) diperoleh F = 2,55 dan untuk taraf signifikansi 1 % didapat F = 3,85.Kesimpulan : karena F hitung (7,5) > F tabel = 1 % maka H0 ditolak (kedua varians tidak sama).Untuk membandingkan varians lebih dari 2 kelompok digunakan uji Bartlett atau uji Levene(program SPSS windows).
ANAVA satu arah (oneway ANOVA)Contoh : Treatment ---------------------------------- A B C
---------------------------------- 7 12 13 5 11 14
8 13 15 6 12 14 7----------------------------------
t1 = 33 t2 = 48 t3 = 56 T = 137
n1 = 5 n2 = 4 n3 = 4 N = 13Tabel ANAVA :--------------------------------------------------------------------------------Sumber variasi SS df MS=SS/df F-------------------------------------------------------------------------------- Antar kelompok t2 /n – T2 /N k-1 MSG MSG/MSW
(between groups) = SSG
Dalam kelompok SST – SSG =SSW N-k MSW
(within groups)--------------------------------------------------------------------------------Total X2 – T2/N =SST N – 1
---------------------------------------------------------------------------------ANAVA berpasangan (Related ANOVA)
- Analisis varians untuk observasi yang berpasangan tdk ada interaksi
- Cross- over design (> 2 way)
Contoh : Treatment ------------------------------------------------- A B C tr nr
------------------------------------------------- 7 12 13 32 3 5 11 14 30 3
8 13 15 36 3 6 12 14 32 3 7 12 14 33 3--------------------------------------------------
t1 = 33 t2 = 60 t3 = 70 T = 163 n1 = 5 n2 = 5 n3 = 5 N = 15
Tabel ANAVA :
--------------------------------------------------------------------------------Sumber variasi SS df MS=SS/df F-------------------------------------------------------------------------------- Antar kolom t C
2 /nC – T2 /N k-1 MSG MSG/MSE
(between groups) = SSG
Antar subyek t R2 /nR – T2 /N N-k MSR
(between subyek) = SSR
Residu SST-SSC-SSR (c-1) (r-1) MSE
= SSE
--------------------------------------------------------------------------------Total X2 – T2/N =SST N – 1
---------------------------------------------------------------------------------Factorial design (ANOVA two way) ada 2 variabel (treatment + 1 variabel lain) interaksi ada/tidak ada Contoh :--------------------------------------------------------------- Variabel II Treatment (var I) (kel umur) A B C
--------------------------------------------------------------- Muda 7 12 13 5 11 14
8 13 15
Tua 6 12 14 7 12 14
8 13 16--------------------------------------------------------------- Tabel ANAVA :--------------------------------------------------------------------------------Sumber variasi SS df MS=SS/df F------------------------------------------------------------------------------------------ Antar kolom tC 2 /nC – T2 /N c-1 MSC MSC/MSW
(between groups) = SSC
Antar subyek tR 2 /nR – T2 /N r-1 MSR MSR/MSW
(between subyek) = SSR
Interaksi tcells 2 /ncells – (c-1)(r-1) MSJ MSJ/MSW
(kolomxbaris) T2 /N-SSC –SSR
= SSJ
Within cells SST-SSC-SSR-SSj N - cr MSW
= SSW
------------------------------------------------------------------------------------------Total X2 – T2/N =SST N – 1
------------------------------------------------------------------------------------------
Factorial design (ANAVA 3 way)
Source : - variabel 1- variabel 2- variabel 3- interaksi var 1 x var 2- Interaksi var 1 x var 3- Interaksi var 2 x var 3- Interaksi var 1 x var 2 x var 3- Within cells
-------------------------------------------------------
Jika hasil analisis varians (uji F) bermakna, untuk melihat perlakuan mana yang berbeda (rata-ratanya) digunakan analisis “multiple comparisons” .
Beberapa pilihan uji multiple comparisons :
1. Metode Bonferroni (modifikasi t test)
2. Metode Tukey3. Metode Dunnett (hanya untuk membandingkan thd
kelompok kontrol)4. Metode Scheffe5. Metode Duncan6. Metode Newman-Keuls
(dalam program statistika semua ada tinggal dipilih salah satu)