harlan_johan.staff.gunadarma.ac.idharlan_johan.staff.gunadarma.ac.id/publications/files/3522/ukuran... ·...

104

Upload: nguyennhi

Post on 02-Mar-2019

242 views

Category:

Documents


1 download

TRANSCRIPT

PERHITUNGANPERHITUNGANPERHITUNGANPERHITUNGAN

UKURAN SAMPEL,UKURAN SAMPEL,UKURAN SAMPEL,UKURAN SAMPEL,

POWER DAN UKURAN EFEKPOWER DAN UKURAN EFEKPOWER DAN UKURAN EFEKPOWER DAN UKURAN EFEK

Johan HarlanJohan HarlanJohan HarlanJohan Harlan

Perhitungan Ukuran Sampel,Perhitungan Ukuran Sampel,Perhitungan Ukuran Sampel,Perhitungan Ukuran Sampel,

Power dan Ukuran EfekPower dan Ukuran EfekPower dan Ukuran EfekPower dan Ukuran Efek

Penulis : Johan Harlan

Cetakan Pertama, Oktober 2017

Disain cover : Joko Slameto

Diterbitkan pertama kali oleh Gunadarma

Jl. Margonda Raya No. 100, Pondokcina, Depok 16424

Telp. +62-21-78881112, 7863819 Faks. +62-21-7872829

e-mail : [email protected]

Hak Cipta dilindungi undang-undang. Dilarang mengutip atau

memperbanyak dalam bentuk apapun sebagian atau seluruh isi

buku tanpa ijin tertulis dari penerbit.

v

KATA PENGANTAR

Perhitungan ukuran sampel pada saat ini telah menjadi keharusan

dalam penulisan setiap makalah ilmiah penelitian. Setiap jurnal ilmiah

kredibel akan mewajibkan makalah penelitian yang dikirim ke jurnal tersebut

untuk memuat perhitungan ukuran sampelnya.

Sebaliknya, tidak semua staf pengajar terutama para pemula,

memahami dengan baik prosedur perhitungan ukuran sampel. Hal ini

disebabkan perhitungan ukuran sampel sendiri merupakan proses yang rumit

dan seringkali tidak dibahas secara mendetil dalam pengajaran Statistika

yang mereka terima. Tidak ada rumus perhitungan sederhana yang berlaku

bagi setiap rancangan studi, begitu pula tidak setiap rancangan studi

perhitungan ukuran sampelnya dapat dinyatakan secara sederhana.

Dalam buku perhitungan ukuran sampel, power dan ukuran efek ini

akan dibahas sejumlah rumus yang relatif sederhana dan bersifat mendasar,

sehingga dengan menguasai prinsip-prinsip dalam isi buku ini pembaca

diharap dapat melaksanakan perhitungan ukuran sampel pada hampir semua

rancangan studi sederhana. Perhitungan ukuran sampel untuk rancangan

studi yang lebih canggih yang tidak diuraikan di sini dapat dicari

pembahasannya dalam buku-buku referensi yang tercantum dalam Daftar

Pustaka.

Setiap saran dan kritik yang bersifat membangun akan diterima

dengan tangan terbuka.

Oktober 2017

Johan Harlan

vii

DAFTAR ISI

Kata Pengantar v

Daftar Isi vii

Bab 1 Dasar-Dasar Perhitungan Ukuran Sampel 1

Pendahuluan 1

Ukuran Sampel untuk Esmimasi Interval 3

Ukuran Sampel untuk Uji Hipotesis 5

Bab 2 Analisis Power dan Ukuran Efek 7

Analisis Power 7

Ukuran Efek 8

Contoh 2.1 10

Bab 3 Ukuran Sampel untuk Inferensi 1 Rerata 13

Ukuran Sampel untuk Estimasi Interval 13

Contoh 3.1 14

Ukuran Sampel untuk Uji Hipotesis & Analisis Power 15

Perhitungan Ukuran Sampel dan Analisis Power

dengan Stata

16

Contoh 3.2 17

Bab 4 Ukuran Sampel untuk Inferensi 1 Proporsi 21

Ukuran Sampel untuk Estimasi Interval 21

Contoh 4.1 22

Ukuran Sampel untuk Uji Hipotesis & Analisis Power 23

viii

Perhitungan Ukuran Sampel dan Analisis Power

dengan Stata

24

Contoh 4.2 25

Bab 5 Ukuran Sampel untuk Inferensi 2 Rerata 27

Ukuran Sampel untuk Uji Hipotesis & Analisis Power 27

Perhitungan Ukuran Sampel dan Analisis Power

dengan Stata

29

Contoh 5.1 30

Ukuran Sampel untuk Estimasi Interval 32

Contoh 5.2 33

Bab 6 Ukuran Sampel untuk Inferensi 2 Proporsi 35

Ukuran Sampel untuk Uji Hipotesis & Analisis Power 35

Perhitungan Ukuran Sampel dan Analisis Power

dengan Stata

37

Contoh 6.1 38

Ukuran Sampel untuk Estimasi Interval 40

Contoh 6.2 41

Bab 7 Ukuran Sampel untuk Rancangan Studi

Epidemiologi

43

Ukuran Sampel untuk Estimasi Interval pada Studi

Potong-Lintang

43

Ukuran Sampel untuk Estimasi Interval pada Studi

Kohort

45

Contoh 7.1 47

Ukuran Sampel untuk Estimasi Interval pada Studi 48

ix

Kasus-Kontrol

Contoh 7.2 50

Bab 8 Ukuran Sampel untuk Analisis Variansi 51

Ukuran Sampel untuk Analisis Variansi 1-Arah 51

Contoh 8.1 52

Ukuran Sampel untuk Analisis Variansi 2-Arah 55

Contoh 8.2 56

Bab 9 Ukuran Sampel untuk Analisis Regresi

Linear

61

Ukuran Sampel untuk Analisis Regresi Linear

Sederhana

61

Contoh 9.1 62

Ukuran Sampel untuk Analisis Regresi Linear Ganda 66

Contoh 9.2 67

Bab 10 Ukuran Sampel untuk Analisis Regresi

Logistik

73

Ukuran Sampel untuk Analisis Regresi Logistik

Sederhana

73

Contoh 10.1 74

Ukuran Sampel untuk Analisis Regresi Logistik

Ganda

75

Contoh 10.2 76

Kepustakaan 77

x

Lampiran 1 79

Lampiran 2 81

Lampiran 3 83

Bab 1 Dasar-Dasar Perhitungan Ukuran Sampel

1

BAB 1

DASAR-DASAR PERHITUNGAN

UKURAN SAMPEL

� P e n dah u lua n

` Perhitungan ukuran sampel merupakan langkah penting dalam

perancangan studi untuk menjamin tercapainya tujuan penelitian secara

kuantitatif. Pada penelitian terhadap 113 makalah pada Index Medicus 3

dekade yang lampau, hanya 2 yang memuat perhitungan ukuran sampel dan

3 lainnya yang menyertakan perhitungan power. Pada saat ini. hampir semua

jurnal internasional yang kredibel mengharuskan disertakannya perhitungan

ukuran sampel pada naskah yang dikirim untuk dimuat dalam jurnal tersebut.

Hal yang perlu diperhatikan dalam perhitungan ukuran sampel antara

lain yaitu:

- Ukuran sampel tidak dihitung sebagai persentase tertentu terhadap

ukuran populasi.

- Tidak ada rumus ukuran sampel yang sederhana dan berlaku secara

universal untuk tiap rancangan studi.

- Tiap rancangan studi umumnya memiliki rumus perhitungan ukuran

sampel yang berbeda.

- Tidak semua rancangan studi memiliki rumus perhitungan ukuran sampel

yang sederhana dan mudah diaplikasikan

Pada sebagian rancangan studi, terutama analisis multivariat,

penentuan ukuran sampel biasa dilakukan dengan menggambarkan grafik

ukuran sampel-power untuk tingkat signifikansi tertentu. Dengan

menentukan power yang diinginkan, ukuran sampel dapat diperoleh dari

grafik tersebut. Contoh grafik power-ukuran sampel demikian untuk analisis

variansi diperlihatkan pada gambar 1.1 berikut. Penggunaannya juga tidak

sederhana, memerlukan prosedur ‘trial and error’ dalam pelaksanaannya.

Bab 1 Dasar-Dasar Perhitungan Ukuran Sampel

Gambar 1.1 Grafik power-ukuran sampel untuk analisis variansi

Beberapa rancangan studi, terutama yang menggunakan metode

estimasi maximum likelihood, hanya menggunakan

menentukan ukuran sampel, misalnya pada

digunakan sampel berukuran besar dengan

digunakan aturan 30/30 yaitu sampel paling sedikit terdiri atas 30 kelompok

dengan paling sedikit 30 individu per kelompok, sehingga didapat

dan seterusnya.

Dalam buku ini pembahasan perhitungan ukuran sampel dan analisis

power dibatasi untuk beberapa rancangan studi yang perhitungan ukuran

Dasar Perhitungan Ukuran Sampel

2

ukuran sampel untuk analisis variansi

Beberapa rancangan studi, terutama yang menggunakan metode

, hanya menggunakan rule-of-thumb untuk

menentukan ukuran sampel, misalnya pada Structural Equation Modeling

digunakan sampel berukuran besar dengan n > 200, pada analisis multilevel

sampel paling sedikit terdiri atas 30 kelompok

dengan paling sedikit 30 individu per kelompok, sehingga didapat n > 900,

Dalam buku ini pembahasan perhitungan ukuran sampel dan analisis

tasi untuk beberapa rancangan studi yang perhitungan ukuran

Bab 1 Dasar-Dasar Perhitungan Ukuran Sampel

3

sampelnya relatif sederhana dan mudah dikerjakan. Secara umum, ada 2

macam metode perhitungan ukuran sampel, yaitu:

1. Perhitungan ukuran sampel untuk pengestimasian interval parameter

populasi.

2. Perhitungan ukuran sampel untuk uji hipotesis dan pencapaian power

penelitian tertentu.

� U ku ra n Sam p e l u nt uk Es t ima s i

I n te rv a l

Ukuran sampel di sini adalah ukuran sampel minimum yang

dibutuhkan dalam pengestimasian interval suatu parameter untuk mencapai

lebar interval yang dispesifikasikan. Perhitungan ukuran untuk estimasi

interval ini digunakan pada studi deskriptif dengan pengestimasian interval

parameternya tanpa uji hipotesis. Jika pada suatu studi dilakukan uji

hipotesis beserta pengestimasian interval, perhitungan ukuran sampelnya

dilakukan berdasarkan uji hipotesis.

Nilai-nilai yang perlu dispesifikasikan pada perhitungan ukuran

sampel untuk estimasi interval yaitu:

1. Tingkat keyakinan estimasi interval: Dianjurkan untuk secara rutin

menggunakan tingkat keyakinan 100 ( )1 α− % = 95%, kecuali jika ada

alasan tertentu.

2. Lebar interval estimasi maksimum yang dikehendaki: Dinyatakan

dengan simbol 2I.

3. Variansi data dalam populasi 2σ (atau estimasinya): Diperoleh dari

penelitian terdahulu atau studi pendahuluan.

Misalkan akan dilakukan pengestimasian interval konfidensi

( )100 1 %a− untuk rerata populasi µ . Contoh untuk α = 0.5 dan 2Zα = 1.96

diperlihatkan pada gambar 1.2. Tampak interval konfidensi 95% untuk nilai

rerata yang diperlihatkan pada gambaran distribusi sampling y . Seandainya

estimasi interval dilakukan terhadap selisih dua rerata pada dua populasi,

Bab 1 Dasar-Dasar Perhitungan Ukuran Sampel

gambaran distribusi tinggal diganti dengan distribusi sampling

Batas-batas interval dinyatakan dengan lambang

masing-masing menyatakan batas bawah dan

tersebut. Misalkan pula 2A B

I y y= −

yang diinginkan (= presisi, lihat gambar

I = 2Zα .SE ( )y

= 2Zα .n

σ

Gambar 1.2 Contoh interval konfidensi 95%

Diperoleh:

n = ( )

22

2

2

.Z

I

α σ

2I : Lebar interval estimasi yang diinginkan2σ : Variansi populasi, diperoleh dari penelitian terdahulu atau studi

pendahuluan

Perhitungan ukuran sampel untuk estimasi interval biasanya tidak

tersedia pada program komputer dan harus dilakukan secara manual.

Dasar Perhitungan Ukuran Sampel

4

gambaran distribusi tinggal diganti dengan distribusi sampling ( )1 2y y− .

dengan lambang [ ] ; ABy y ; B

y dan A

y

masing menyatakan batas bawah dan batas interval konfidensi

A BI y y menyatakan lebar interval maksimum

, lihat gambar 1.2), maka:

Gambar 1.2 Contoh interval konfidensi 95%

(1.1)

Lebar interval estimasi yang diinginkan

populasi, diperoleh dari penelitian terdahulu atau studi

Perhitungan ukuran sampel untuk estimasi interval biasanya tidak

tersedia pada program komputer dan harus dilakukan secara manual.

Bab 1 Dasar-Dasar Perhitungan Ukuran Sampel

5

� U ku ra n S am p e l un tu k Uj i

H ipo te s i s

Ukuran sampel di sini adalah ukuran sampel minimum yang

dibutuhkan untuk melaksanakan uji hipotesis pada tingkat signifikansi

tertentu dengan power yang dispesifikasikan. Perhitungan ukuran sampel

untuk uji hipotesis ini harus dilakukan pada setiap studi analitik dengan uji

hipotesis sebelum pengumpulan data dan pelaksanaan penelitian dimulai.

Nilai-nilai yang perlu dispesifikasikan pada perhitungan ukuran

sampel untuk uji hipotesis yaitu:

1. Tingkat signifikansi (kesalahan tipe I) uji hipotesis: Dianjurkan untuk

menggunakan α = 0.05.

2. Power uji hipotesis 100 ( )1 β− % atau kesalahan tipe II β : Biasanya

dipilih power 80%.

3. Selisih minimum antara rerata distribusi nol dengan rerata distribusi

alternatif yang diharapkan dapat dideteksi: diff = 1µ µ−0.

4. Variansi distribusi nol dan distribusi alternatif (atau estimasinya;

umumnya diasumsikan sama untuk kedua distribusi: σ0 = 1σ = σ ).

Misalkan akan dilakukan uji hipotesis 0H : µ < 0µ vs 1H : µ > 0µ

yang secara praktis untuk perhitungan ukuran sampel dapat dinyatakan

sebagai 0H : µ = 0µ vs AH : µ = 1µ , diff = 1µ − 0µ menyatakan besar

minimum selisih rerata distribusi nol dengan rerata distribusi alternatif yang

diharapkan dapat dideteksi. Pada gambar 1.3 berikut diperlihatkan contoh uji

hipotesis untuk 1 rerata dengan 0H : µ = 180 vs AH : µ = 210; 0µ = 180

dan 1µ = 210, diff = 210 – 180 = 30; α = 0.05 dan β = 0.1; σ0 = 1σ = σ .

Dengan C menyatakan titik kritis uji hipotesis (batas penerimaan dan

penolakan hipotesis nol), tampak bahwa:

Bab 1 Dasar-Dasar Perhitungan Ukuran Sampel

Gambar 1.3 Contoh gambar untuk uji hipotesis 1 rerata

C = µ0 + Zα . nσ

Diperoleh:

n = ( )

22

2

.Z Z

diff

α β σ+

diff : selisih minimum rerata nol dengan rerata alternatif yang diharapkan

dapat dideteksi; diff = 1µ −

Perhatikan:

Sebagian besar kepustakaan menyatakan selisih minimum rerata yang

diharapkan dapat dideteksi dengan lambang

menghindari kerancuan, sesuai dengan nomenklatur Stata, lambang

digunakan untuk menyatakan ukuran efek (

Bab 2).

Dasar Perhitungan Ukuran Sampel

6

Contoh gambar untuk uji hipotesis 1 rerata

n = 1µ − Zβ . nσ

(1.2)

selisih minimum rerata nol dengan rerata alternatif yang diharapkan

µ0

Sebagian besar kepustakaan menyatakan selisih minimum rerata yang

diharapkan dapat dideteksi dengan lambang d, tetapi dalam buku ini untuk

menghindari kerancuan, sesuai dengan nomenklatur Stata, lambang d (delta)

digunakan untuk menyatakan ukuran efek (effect size; lihat penjelasan pada

Bab 2 Analisis Power dan Ukuran Efek

BAB

ANALISIS POWER

UKURAN

� A na l i s i s Powe r

Power adalah peluang untuk mendeteksi suatu efek, dengan syarat

efek itu ada (gambar 2.1). Power seharusnya sudah dihitung pada tahap

perancangan studi sebelum penelitian dimulai, biasanya digunakan

80%.

Gambar 2.1 Power penelitian

Dalam pelaksanaan penelitian sesungguhnya, ukuran sampel yang

direncanakan karena satu dan lain hal mungkin tidak tercapai, sehingga

power yang direncanakan pun tak tercapai.

power curve, yaitu plot power terhadap

hendak dideteksi). Tampak bahwa memperkecil

Bab 2 Analisis Power dan Ukuran Efek

7

BAB 2

POWER DAN

UKURAN EFEK

A na l i s i s Powe r

adalah peluang untuk mendeteksi suatu efek, dengan syarat

. Power seharusnya sudah dihitung pada tahap

perancangan studi sebelum penelitian dimulai, biasanya digunakan power

Gambar 2.1 Power penelitian

pelaksanaan penelitian sesungguhnya, ukuran sampel yang

direncanakan karena satu dan lain hal mungkin tidak tercapai, sehingga

power yang direncanakan pun tak tercapai. Gambar 2.2 memperlihatkan

power curve, yaitu plot power terhadap diff (selisih efek minimum yang

hendak dideteksi). Tampak bahwa memperkecil diff pada ukuran sampel

Bab 2 Analisis Power dan Ukuran Efek

8

tertentu akan dengan cepat pula menurunkan power. Penurunan power dapat

diperlambat dengan memperbesar ukuran sampel.

Gambar 2.2 Power curve

Analisis power dilakukan setelah penelitian dilakukan, yaitu jika

ukuran sampel yang diinginkan tidak tercapai, yaitu menghitung ulang power

sesuai dengan ukuran sampel yang sebenarnya diperoleh.

� U ku ra n Efe k

Ukuran efek (effect size) adalah hasil perlakuan yang diungkapkan

dalam perbandingan antar kelompok (dengan dan tanpa perlakuan) ataupun

derajat asosiasi antar dua variabel terkait (dosis perlakuan dan respons).

Ukuran efek mengacu pada besar hasil yang terjadi atau akan ditemukan

dalam populasi. Estimasi ukuran efek mutlak diperlukan dalam interpretasi

hasil studi (Ellis, 2010).

Bab 2 Analisis Power dan Ukuran Efek

9

Terdapat berbagai ukuran efek, yang antara lain tergantung pada jenis

data dan macam analisis statistik yang digunakan. Sebagian ukuran efek tak-

terstandardisasi dan menggunakan satuan original (satuan data asal). Ukuran

efek ini terutama mudah dipahami dan bermanfaat bagi pembaca non-

statistik. Contoh ukuran efek demikian antara lain yaitu:

- Rerata

- Selisih antara dua rerata

- Median

- Koefisien regresi

Sebagian ukuran efek lain bersifat bebas-satuan (units-free) atau

terstandardisasi. Secara statistik, ukuran efek demikian lebih bermanfaat

karena akan dapat di-pooled dalam suatu analisis meta, dengan syarat semua

ukuran efek, baik yang sangat kecilpun tetap dipublikasikan. Beberapa di

antaranya yang ditampilkan pada Stata yaitu:

- Cohen’s d = 1 2*

x x

s

− (2.1)

dengan: *s =

( ) ( )2 21 1 2 2

1 2

1 1

2

n s n s

n n

− + −

+ −

- Hedges’ g = Cohen’s d × ( )c m (2.2)

dengan m = 1 2 2n n+ − dan

( )c m = 2

1

2 2

m

m m

Γ

− Γ

- Glass’s ∆ = ( )treated control

control

x x

s

- Glass’s 1∆ = ( )1 2

1

x x

s

− (2.3)

- Glass’s 2∆ = ( )1 2

2

x x

s

− (2.4)

Bab 2 Analisis Power dan Ukuran Efek

10

Cohen’s d, Glass’s ∆, dan Hedges’ g adalah ukuran efek

terstandardisasi antar 2-variabel kontinu. Point-biserial correlation adalah

ukuran efek antar 1 variabel kontinu dengan 1 variabel biner, misalnya antara

variabel independen kontinu dengan variabel dependen biner pada analisis

regresi logistik:

- PBr = 2 df

t

t + (2.5)

t : statistik t untuk selisih rerata antar 2 kelompok

df : derajat bebasnya

Pada sebagian perhitungan ukuran sampel dengan Stata, ukuran efek

yang dinyatakan dengan delta langsung ditampilkan pada keluaran hasil

tanpa diminta.

Contoh 2.1: . webuse depression

(Fictitious Depression Inventory data based on the

Beck Depression Inventory)

. esize twosample qu1, by(sex)

Effect size based on mean comparison

Obs per group:

Female = 712

Male = 288

-------------------------------------------------

Effect Size | Estimate [95% Conf. Interval]

------------+------------------------------------

Cohen's d | -.0512417 -.1881184 .0856607

Hedges's g | -.0512032 -.187977 .0855963

-------------------------------------------------

. esize twosample qu1, by(sex) all

Bab 2 Analisis Power dan Ukuran Efek

11

Effect size based on mean comparison

Obs per group:

Female = 712

Male = 288

------------------------------------------------------

Effect Size | Estimate [95% Conf. Interval]

-----------------+------------------------------------

Cohen's d | -.0512417 -.1881184 .0856607

Hedges's g | -.0512032 -.187977 .0855963

Glass's Delta 1 | -.0517793 -.1886587 .0851364

Glass's Delta 2 | -.0499786 -.1868673 .086997

Point-Biserial r | -.0232208 -.0849629 .0387995

------------------------------------------------------

Perhatian:

Perintah esize hanya dapat digunakan jika ada file data yang sedang

terbuka. Pada perhitungan ukuran sampel dengan perintah power (lihat bab-

bab berikut), dalam keadaan tidak ada file data yang terbuka, ukuran efek

akan selalu ditampilkan walaupun tidak diminta.

Bab 3 Ukuran Sampel untuk Inferensi 1 Rerata

13

BAB 3

UKURAN SAMPEL UNTUK

INFERENSI 1 RERATA

� Ukuran Sampel untuk Estimasi Interval

Misalkan hendak diestimasi interval konfidensi ( )100 1 %a− untuk

rerata populasi µ . Interval konfidensi yang akan diperoleh dinyatakan

dengan lambang [ ] ; ABy y ; B

y dan A

y masing-masing menyatakan batas

bawah dan batas interval konfidensi tersebut. Misalkan pula 2A B

I y y= −

menyatakan lebar interval maksimum yang diinginkan (= presisi, lihat

kembali gambar 1.2), maka:

/2.a

I Zn

σ=

Diperoleh:

n = ( )

22

2

2

.Z

I

α σ (3.1)

2I : Lebar interval estimasi yang diinginkan 2σ : Variansi populasi, diperoleh dari penelitian terdahulu atau studi

pendahuluan

Perhatikan:

- Dalam rumus perhitungan ukuran sampel untuk estimasi interval, selalu

digunakan 2Zα dan bukan Zα .

- Umumnya perhitungan ukuran sampel untuk estimasi interval tidak

didapatkan dalam program komputer statistik.

Bab 3 Ukuran Sampel untuk Inferensi 1 Rerata

14

Contoh 3.1:

α = 0.05 → 2Zα = 1.96

2σ = 20.30 = 0.09

2I = 0.10 → I = 0.05

n = ( )

22

2

2

.Z

I

α σ

= ( )

2

2

1.96 .0.09

0.05 = 138.2976 ≈ 139

Catatan:

- Jika populasi berhingga dan n N lebih besar daripada 5%, diperlukan

‘koreksi populasi berhingga’ (finite population correction; fpc), yaitu:

cn = 1

1

n

n

N

−+

Dengan asumsi penyederhanaan n – 1 ≈ n, diperoleh rumus ukuran

sampel minimum Isaac dan Michael untuk populasi berhingga:

Mn = ( )

( )

22

2

22 2

2

N Z

NI Z

α

α

σ

σ+ (3.2)

- Jika parameter yang akan diestimasi interval-nya lebih daripada satu,

untuk tiap parameter harus dilakukan perhitungan ukuran sampel sendiri-

sendiri, yaitu jika variansi dan/atau lebar interval untuk tiap parameter

tersebut tidak sama, dan ukuran sampel yang digunakan adalah ukuran

sampel yang terbesar.

Bab 3 Ukuran Sampel untuk Inferensi 1 Rerata

15

� Ukuran Sampel untuk Uji Hipotesis &

Analisis Power

Ukuran sampel minimum pada uji hipotesis adalah ukuran sampel

minimum yang dibutuhkan untuk mendeteksi selisih (minimum) nilai

parameter menurut hipotesis nol dan nilai parameter menurut hipotesis

alternatif pada uji hipotesis.

Pada uji hipotesis dua-sisi terhadap nilai rerata populasi dengan

hipotesis nol :H µ µ=0 0

, besaran (minimum) yang diharapkan untuk

dideteksi adalah selisih nilai 1diff µ µ= −0. Ukuran sampel minimum yang

diperlukan untuk mendeteksi perbedaan sebesar diff antara parameter

distribusi hipotesis nol dengan parameter distribusi hipotesis alternatif

ditentukan oleh:

a. Besar kesalahan tipe I (tingkat signifikansi; a ).

b. Power [1 – besar kesalahan tipe II; ( )1 β− ]

c. Besar selisih minimum antara parameter kedua distribusi yang hemdak

dideteksi: diff = 1µ − 0µ

d. Variabilitas kedua distribusi (umumnya diasumsikan sama: σ0 = 1σ =

σ )

Dengan merujuk pada titik C sebagai titik kritis (batas penerimaan

dan penolakan hipotesis nol, lihat kembali gambar 1.3) pada distribusi

sampling 0y dan distribusi sampling Ay , diperoleh:

C = µ0 + Zα . nσ = 1µ − Zβ . nσ

sehingga:

n = ( )

22

2

.Z Z

diff

α β σ+ (3.3)

Bab 3 Ukuran Sampel untuk Inferensi 1 Rerata

16

Perhatikan:

- Jika dilakukan uji hipotesis (dan estimasi parameter), perhitungan ukuran

sampel semata-mata dilakukan atas dasar uji hipotesis.

� Perhitungan Ukuran Sampel dan

Analisis Power dengan Stata

Sintaks

� Perhitungan Ukuran Sampel

power onemean m0 ma [, sd(numlist) alpha(numlist) power(numlist)

options]

m0 : rerata nol (rerata menurut hipotesis nol)

ma : rerata alternatif

� Analisis Power

power onemean m0 ma [, n(numlist) sd(numlist) alpha(numlist)

options]

m0 : rerata nol (rerata menurut hipotesis nol)

ma : rerata alternatif

Opsi:

n(numlist) : ukuran sampel (untuk analisis power)

sd(numlist) : standar deviasi, default-nya adalah sd(1)

alpha(numlist) : tingkat signifikansi, default-nya adalah alpha(0.05)

power(numlist) : power, default-nya adalah power(0.8)

beta(numlist) : kesalahan tipe II, default-nya adalah beta(0.2)

onesided : uji satu-sisi, default-nya adalah dua sisi

Bab 3 Ukuran Sampel untuk Inferensi 1 Rerata

17

Perhatikan:

- power dan beta tidak boleh dispesifikasikan secara bersama (hanya

salah satu yang dispesifikasikan), dengan hubungan power = 1 – beta.

- power (atau beta) hanya dispesifikasikan dalam perhitungan ukuran

sampel.

- n hanya dispesifikasikan dalam analisis power.

- Spesifikasi dengan nilai default tidak perlu dituliskan dalam perintah

Stata.

Contoh 3.2:

a. Perhitungan Ukuran Sampel dengan Stata

. power onemean 1 2, sd(2) alpha(0.01) power(0.9) onesided

Estimated sample size for a one-sample mean

test

t test

Ho: m = m0 versus Ha: m > m0

Study parameters:

alpha = 0.0100

power = 0.9000

delta = 0.5000

m0 = 1.0000

ma = 2.0000

sd = 2.0000

Estimated sample size:

N = 55

Ukuran sampel yang dibutuhkan adalah 55. Ukuran efek (effect size)

adalah 0.50.

Bab 3 Ukuran Sampel untuk Inferensi 1 Rerata

18

b. Perhitungan Ukuran Sampel Secara Manual:

α = 0.01 → Zα = 2.33

β = 1 – 0.9 = 0.1 → Zβ = 1.28

2σ = 22 = 4

d = 2 – 1 = 1

n = ( )

22

2

.Z Z

d

α β σ+

= ( )

2

2

2.33 1.28 .4

1

+ = 52.1284 ≈ 53

c. Analisis Power

Jika pada perhitungan ukuran sampel sebelum penelitian didapatkan

ukuran sampel n1, tetapi pada pelaksanaan penelitian hanya diperoleh

ukuran sampel n2, maka setelah penelitian harus dilakukan analisis power

untuk menghitung ulang besar power yang sesungguhnya tercapai.

Misalkan untuk contoh 3.2.a di atas, pada penelitian sesungguhnya

hanya dapat direkrut anggota sampel sebanyak 45 orang, maka power-nya

adalah:

. power onemean 1 2, n(45) sd(2) alpha(0.01) onesided

Estimated power for a one-sample mean test

t test

Ho: m = m0 versus Ha: m > m0

Study parameters:

alpha = 0.0100

N = 45

delta = 0.5000

m0 = 1.0000

ma = 2.0000

sd = 2.0000

Bab 3 Ukuran Sampel untuk Inferensi 1 Rerata

19

Estimated power:

power = 0.8222

.

Ternyata dari power yang ditargetkan sebesar 0.9 (pada ukuran

sampel 55 orang), hanya tercapai sebesar 0.82 (pada ukuran sampel 45

orang). Tampak pula bahwa ukuran efek tetap 0.50, tak terpengaruh oleh

perubahan power.

Bab 4 Ukuran Sampel untuk Inferensi 1 Proporsi

21

BAB 4

UKURAN SAMPEL UNTUK

INFERENSI 1 PROPORSI

� Ukuran Sampel untuk Estimasi Interval

Misalkan hendak diestimasi interval konfidensi ( )100 1 %a− untuk

proporsi populasi P . Interval konfidensi yang akan diperoleh dinyatakan

dengan lambang [ ] ; ABp p dan masing-masing menyatakan batas bawah

dan batas atas interval konfidensi tersebut. Misalkan pula 2I = Ap − Bp

menyatakan lebar interval maksimum yang diinginkan (= presisi), maka:

I = 2Zα .SE (p)

yaitu: I = 2Zα .PQ

n

dengan Q = 1 − P, sehingga ukuran sampel minimum yang dibutuhkan

adalah:

n = ( )

2

/2

2

aZ PQ

I (4.1)

Jika proporsi populasi P dan Q tak diketahui, dapat dilakukan

substitusi dengan estimasinya yaitu proporsi sampel p dan komplemennya q

yang diperoleh dari penelitian terdahulu atau studi pendahuluan:

n = ( )

2

/2

2

aZ pq

I

Jika P dan Q tak diketahui, diberlakukan asumsi konservatif, P = Q

= 0.5, sehingga:

Bab 4 Ukuran Sampel untuk Inferensi 1 Proporsi

22

n = ( )

2

2

2

.0.25Z

I

α (4.2)

Contoh 4.1:

α = 0.10 → 2Zα = 1.64

P = 0.7 Q = 0.3

2I = 0.10 I = 0.05

n = ( )

2

2

2

.Z PQ

I

α =

( ) ( )( )2

2

1.64 . 0.7 0.3

0.05 = 225.9264 ≈ 226

Dengan asumsi konservatif diperoleh:

n = ( )

2

2

2

.0.25Z

I

α =

( )2

2

1.64 .0.25

0.05 = 268.96 ≈ 269

Catatan:

- Jika populasi berhingga dan n N lebih besar daripada 5%, diperlukan

‘koreksi populasi berhingga’ (finite population correction; fpc), yaitu:

cn = 1

1

n

n

N

−+

Dengan asumsi penyederhanaan n – 1 ≈ n dan α = 0.05 serta 2Zα = 1.96

≈ 2, diperoleh rumus ukuran sampel minimum Slovin untuk populasi

berhingga:

Sn = 21

N

Ndiff+ (4.3)

Bab 4 Ukuran Sampel untuk Inferensi 1 Proporsi

23

� Ukuran Sampel untuk Uji Hipotesis &

Analisis Power

Untuk keperluan praktis perhitungan ukuran sampel, uji hipotesis 0H

: P < 0P vs 1H : P > 0P dituliskan sebagai:

0H : P = 0P vs AH : P = AP

P0 : proporsi menurut hipotesis nol;

AP : proporsi menurut hipotesis alternatif;

dan d = ( )0AP P− adalah selisih umum P0 dengan

AP yang diharapkan dapat

dideteksi.

Misalkan C menyatakan nilai titik batas penerimaan dan penolakan

hipotesis nol, maka:

C = P0 + Zα . 0 0P Q

n

dengan 0Q = 1 − P0 dan:

C = A

P − Zβ . A AP Q

n

sehingga didapatkan:

P0 + Zα . 0 0P Q

n =

AP − Zβ .

A AP Q

n

dan ukuran sampel minimum yang dibutuhkan untuk mendeteksi perbedaan

minimum sebesar diff = ( )0AP P− pada uji hipotesis 0H : P < 0P vs 1H : P >

0P adalah:

n =

2

0 0

2

A AZ P Q Z P Q

diff

α β +

(4.4)

Untuk uji 2-sisi, nilai a

Z diganti dengan Z a/2.

Bab 4 Ukuran Sampel untuk Inferensi 1 Proporsi

24

� Perhitungan Ukuran Sampel dan

Analisis Power dengan Stata

Sintaks

� Perhitungan Ukuran Sampel

power oneproportion p0 pa [, alpha (numlist) power(numlist)

options]

p0 : proporsi nol (proporsi menurut hipotesis nol)

pa : proporsi alternatif

� Analisis Power

power oneproportion p0 pa [, n(numlist) alpha (numlist)

options]

p0 : proporsi nol (proporsi menurut hipotesis nol)

pa : proporsi alternatif

Opsi:

n(numlist) : ukuran sampel (untuk analisis power)

alpha(numlist) : tingkat signifikansi, default-nya adalah alpha(0.05)

power(numlist) : power, default-nya adalah power(0.8)

beta(numlist) : kesalahan tipe II, default-nya adalah beta(0.2)

onesided : uji satu-sisi, default-nya adalah dua sisi

Bab 4 Ukuran Sampel untuk Inferensi 1 Proporsi

25

Contoh 4.2:

a. Perhitungan Ukuran Sampel dengan Stata

. power oneproportion 0.1 0.2, alpha(0.01) power(0.8) onesided

Estimated sample size for a one-sample

proportion test

Score z test

Ho: p = p0 versus Ha: p > p0

Study parameters:

alpha = 0.0100

power = 0.8000

delta = 0.1000

p0 = 0.1000

pa = 0.2000

Estimated sample size:

N = 108

Ukuran sampel yang dibutuhkan adalah 108, sedangkan ukuran efek

adalah 0.10.

b. Perhitungan Ukuran Sampel Secara Manual:

α = 0.01 → Zα = 2.33

β = 1 – 0.8 = 0.2 → Zβ = 0.84

0P = 0.1 0Q = 0.9

AP = 0.2 AQ = 0.8

diff = 0.2 – 0.1 = 0.1

n =

2

0 0

2

A AZ P Q Z P Q

diff

α β +

Bab 4 Ukuran Sampel untuk Inferensi 1 Proporsi

26

= ( )( ) ( )( )

2

2

2.33 0.1 0.9 0.84 0.2 0.8

0.1

+ = 107.1225 ≈ 108

c. Analisis Power

Jika pada perhitungan ukuran sampel sebelum penelitian didapatkan

ukuran sampel n1, tetapi pada pelaksanaan penelitian hanya diperoleh

ukuran sampel n2, maka setelah penelitian harus dilakukan analisis power

untuk menghitung ulang besar power yang sesungguhnya tercapai.

Misalkan untuk contoh 3.2.a di atas, pada penelitian sesungguhnya

hanya dapat direkrut anggota sampel sebanyak 80 orang, maka power-nya

adalah:

. power oneproportion 0.1 0.2, n(80) alpha(0.01) onesided

Estimated power for a one-sample proportion

test

Score z test

Ho: p = p0 versus Ha: p > p0

Study parameters:

alpha = 0.0100

N = 80

delta = 0.1000

p0 = 0.1000

pa = 0.2000

Estimated power:

power = 0.6884

Dari power yang ditargetkan sebesar 0.8 (pada ukuran sampel 108

orang), hanya tercapai sebesar 0.69 (pada ukuran sampel 80 orang).

Bab 5 Ukuran Sampel untuk Inferensi Dua Rerata

27

BAB 5

UKURAN SAMPEL UNTUK

INFERENSI DUA RERATA

� Ukuran Sampel untuk Uji Hipotesis &

Analisis Power

Misalkan hendak dilakukan uji hipotesis 0H : 1µ − 2µ < 0 vs 1H :

1µ − 2µ > 0. Untuk perhitungan ukuran sampel, uji hipotesis tersebut dapat

dituliskan sebagai:

0H : 1µ − 2µ = 0 vs AH :

1µ − 2µ = diff

dengan 1µ menyatakan rerata populasi pertama (populasi

1Y ); 2µ

menyatakan rerata populasi kedua (populasi 2Y ); dan diff = ( ) 21µ µ− adalah

selisih minimum yang diharapkan untuk dapat dideteksi.

Dengan asumsi 1σ = 2σ = σ ,

1n = 2n = n; serta

1Y dan 2Y

independen, maka variansi distribusi sampling ( ) 21y y− adalah:

Var ( ) 21y y− = Var ( )

1y + Var ( )2y

= 2

n

σ +

2

n

σ =

22

n

σ

dan standard error ( ) 21y y− adalah:

SE ( ) 21y y− =

22

n

σ

Bab 5 Ukuran Sampel untuk Inferensi Dua Rerata

28

Misalkan C menyatakan nilai titik batas (titik kritis) daerah

penerimaan dan penolakan hipotesis nol pada distribusi sampling ( ) 21y y− ,

maka dengan merujuk pada distribusi sampling 0H :

C = 0 + Zα2

2 nσ

sedangkan dengan merujuk pada distribusi sampling ( ) 21y y− menurut AH

diperoleh:

C = diff − Zβ2

2 nσ

sehingga didapatkan:

0 + Zα2

2 nσ = diff − Zβ2

2 nσ

Diperoleh ukuran sampel minimum 1 kelompok yang dibutuhkan

untuk mendeteksi perbedaan minimum sebesar diff = ( ) 21µ µ− pada uji

hipotesis 0H : 1µ − 2µ < 0 vs 1H :

1µ − 2µ > 0, yaitu:

n = ( )

22

2

2 .Z Z

diff

α β σ+ (5.1)

Perhatikan:

- Nilai 2σ atau estimasinya diperoleh dari penelitian terdahulu atau studi

pendahuluan.

- Untuk uji 2-sisi, Zα diganti dengan 2

.

- n adalah ukuran sampel 1 kelompok, sedangkan ukuran sampel 2

kelompok seluruhnya adalah 2n.

Bab 5 Ukuran Sampel untuk Inferensi Dua Rerata

29

� Perhitungan Ukuran Sampel dan

Analisis Power dengan Stata

Sintaks

� Perhitungan Ukuran Sampel

power twomeans m1 m2 [, sd(numlist) alpha(numlist)

beta(numlist) options]

m1 : rerata kelompok kontrol (kelompok referensi)

ma : rerata kelompok eksperimental

� Analisis Power

power twomeans m1 m2 [, n(numlist) sd(numlist)

alpha(numlist) options]

m1 : rerata kelompok kontrol (kelompok referensi)

ma : rerata kelompok eksperimental

Opsi:

n(numlist) : ukuran sampel (untuk analisis power)

sd(numlist) : standar deviasi, default-nya adalah sd(1)

sd1(numlist) : standar deviasi kelompok kontrol (jika standar

deviasi tak sama)

sd2(numlist) : standar deviasi kelompok eksperimental (jika

standar deviasi tak sama)

alpha(numlist) : tingkat signifikansi, default-nya adalah

alpha(0.05)

power(numlist) : power, default-nya adalah power(0.8)

beta(numlist) : kesalahan tipe II, default-nya adalah beta(0.2)

Bab 5 Ukuran Sampel untuk Inferensi Dua Rerata

30

onesided : uji satu-sisi, default-nya adalah dua sisi

Perhatikan:

- power dan beta tidak boleh dispesifikasikan secara bersama (hanya

salah satu yang dispesifikasikan), dengan hubungan power = 1 – beta.

- power (atau beta) hanya dispesifikasikan dalam perhitungan ukuran

sampel.

- Jika variansi kedua kelompok sama, spesifikasikan sd. Jika variansi

kedua kelompok tidak sama, spesifikasikan sd1 dan sd2.

- n hanya dispesifikasikan dalam analisis power.

- Spesifikasi dengan nilai default tidak perlu dituliskan dalam perintah

Stata.

Contoh 5.1:

a. Perhitungan Ukuran Sampel dengan Stata

. power twomeans 1 1.5, sd(2) alpha(0.10) power(0.7) onesided

Estimated sample sizes for a two-sample means

test

t test assuming sd1 = sd2 = sd

Ho: m2 = m1 versus Ha: m2 > m1

Study parameters:

alpha = 0.1000

power = 0.7000

delta = 0.5000

m1 = 1.0000

m2 = 1.5000

sd = 2.0000

Estimated sample sizes:

N = 210

Bab 5 Ukuran Sampel untuk Inferensi Dua Rerata

31

N per group = 105

Ukuran sampel seluruhnya adalah 210 (105 dalam 1 kelompok) dan

ukuran efek adalah 0.50.

b. Perhitungan Ukuran Sampel Secara Manual:

α = 0.10 → Zα = 1.28

β = 1 – 0.7 = 0.3 → Zβ = 0.52

2σ = 22 = 4

diff = 1.5 – 1 = 0.5

n = ( )

22

2

2 .Z Z

diff

α β σ+ =

( )2

2

2 1.28 0.52 .4

0.5

+ = 103.68 ≈ 104

c. Analisis Power

Jika pada perhitungan ukuran sampel sebelum penelitian didapatkan

ukuran sampel n1, tetapi pada pelaksanaan penelitian hanya diperoleh

ukuran sampel n2, maka setelah penelitian harus dilakukan analisis power

untuk menghitung ulang besar power yang sesungguhnya tercapai.

Misalkan untuk contoh 5.1.a di atas, pada penelitian sesungguhnya

hanya dapat direkrut anggota sampel sebanyak 190 orang, maka power-nya

adalah:

. power twomeans 1 1.5, n(190) sd(2) alpha(0.10) onesided

Estimated power for a two-sample means test

t test assuming sd1 = sd2 = sd

Ho: m2 = m1 versus Ha: m2 > m1

Study parameters:

alpha = 0.1000

N = 190

Bab 5 Ukuran Sampel untuk Inferensi Dua Rerata

32

N per group = 95

delta = 0.5000

m1 = 1.0000

m2 = 1.5000

sd = 2.0000

Estimated power:

power = 0.6692

Dari power yang ditargetkan semula sebesar 0.70 (pada ukuran

sampel 210 orang), hanya terjadi penurunan sedikit menjadi 0.669 (pada

ukuran sampel 190 orang).

� Ukuran Sampel untuk Estimasi Interval

Perhitungan ukuran sampel untuk estimasi interval 2 rerata relatif

jarang dikerjakan. Pada inferensi statistik untuk 2 rerata hampir selalu akan

dilakukan uji hipotesis (selain estimasi interval), karena itu ukuran sampel

yang dibutuhkan telah dihitung berdasarkan uji hipotesis.

Misalkan hendak diestimasi interval konfidensi 100 ( )1 α− % untuk

selisih 2 rerata populasi 1µ dan 2µ . Interval konfidensi yang akan diperoleh

dinyatakan dengan lambang [ ];B Ay y ; By dan Ay masing-masing

menyatakan batas bawah dan batas atas selisih interval konfidensi tersebut.

Misalkan pula:

2I = Ay − By

menyatakan lebar interval maksimum yang diinginkan (= presisi), maka:

I = 2

. SE ( ) 21y y−

dengan Var ( ) 21y y− =

21

1n

σ +

22

2n

σ

Bab 5 Ukuran Sampel untuk Inferensi Dua Rerata

33

Jika diasumsikan 21σ = 2

2σ = 2σ dan 1n =

2n = n, maka:

Var ( ) 21y y− =

2

n

σ +

2

n

σ =

22

n

σ

SE ( ) 21y y− =

22

n

σ

sehingga: I = 2

. 22

n

σ

dan diperoleh ukuran sampel minimum yang dibutuhkan untuk 1 kelompok

pada estimasi interval selisih 2 rerata 1µ dan 2µ dengan lebar interval

maksimum yang diinginkan 2I, yaitu:

n = ( )

22

2

2

2 .Z

I

α σ (5.2)

Perhatikan:

- Untuk 2 kelompok, ukuran sampel seluruhnya adalah 2n.

- Nilai 2σ atau estimasinya diperoleh dari penelitian terdahulu atau studi

pendahuluan dengan rumus:

2σ = 2pooleds =

( ) ( )

2 21 21 2

1 2

1 1

2

n s n s

n n

− + −

+ −

Contoh 5.2:

α = 0.05 → 2

= 1.96

2σ = 275 = 5625

2I = 40 → I = 20

Bab 5 Ukuran Sampel untuk Inferensi Dua Rerata

34

Ukuran sampel minimum untuk 1 kelompok adalah:

n = ( )

22

2

2

2 .Z

I

α σ

= ( )

2

2

2 1.96 .5625

20 = 108.045 ≈ 109

Ukuran sampel seluruhnya untuk 2 kelompok adalah:

2n = (2).(109) = 218

Bab 6 Ukuran Sampel untuk Inferensi Dua Proporsi

35

BAB 6

UKURAN SAMPEL UNTUK

INFERENSI DUA PROPORSI

� Ukuran Sampel untuk Uji Hipotesis &

Analisis Power

Misalkan hendak dilakukan uji hipotesis 0H : 1P −

2P < 0 vs 1H :

1P − 2P > 0. Untuk perhitungan ukuran sampel, uji hipotesis tersebut dapat

dituliskan sebagai:

0H : 1P −

2P = 0 vs AH : 1P −

2P = diff

dengan 1P menyatakan proporsi ‘sukses’ pada populasi pertama (populasi

1Y ); 2P menyatakan proporsi ‘sukses’ pada populasi kedua (populasi

2Y );

dan diff = ( ) 21p p− adalah selisih minimum yang diharapkan untuk dapat

dideteksi.

Dengan asumsi 1n =

2n = n; serta 1Y dan

2Y independen, maka

variansi distribusi sampling ( ) 21p p− adalah:

Var ( ) 21p p− = Var ( ) 1p + Var ( )2p

=

1

1

1P Q

n +

2

2

2P Q

n = 1 1 2 2P Q P Q

n

+

dengan 1Q = 1 −

1P ; 2Q = 1 −

2P ; dan standard error ( ) 21p p− adalah:

SE ( ) 21p p− = 1 1 2 2P Q P Q

n

+

Bab 6 Ukuran Sampel untuk Inferensi Dua Proporsi

36

Menurut 0H : 1P =

2P , sehingga keduanya dapat disubstitusikan

oleh P , nilai rata-rata keduanya:

1P =

2P = P dan P = 21

2

P P+

sehingga standard error ( ) 21p p− menurut 0H adalah:

SE ( ) 21p p− = 2PQ

n

Misalkan C menyatakan nilai titik batas (titik kritis) penerimaan dan

penolakan hipotesis nol pada distribusi sampling ( ) 21p p− , maka dengan

merujuk 0H :

C = 0 + Zα

2PQ

n

sedangkan dengan merujuk pada distribusi sampling ( ) 21p p− menurut AH

diperoleh:

C = diff − Zβ 1 1 2 2P Q P Q

n

+

sehingga didapatkan:

0 + Zα

2PQ

n = diff − Zβ

1 1 2 2P Q P Q

n

+

dan 2diff = ( ) 21

2P P− =

2

1 1 2 22Z PQ Z PQ P Q

n

α β + +

Diperoleh ukuran sampel minimum 1 kelompok yang dibutuhkan

untuk mendeteksi perbedaan minimum sebesar diff = ( ) 21P P− pada uji

hipotesis 0H : 1P −

2P < 0 vs 1H : 1P −

2P > 0, yaitu:

Bab 6 Ukuran Sampel untuk Inferensi Dua Proporsi

37

n =

2

1 1 2 2

2

2Z PQ Z PQ P Q

diff

α β + +

(6.1)

Perhatikan:

- Nilai 1P dan

2P atau estimasinya diperoleh dari penelitian terdahulu

atau studi pendahuluan.

- Untuk uji 2-sisi, Zα diganti dengan 2

.

- n adalah ukuran sampel 1 kelompok, sedangkan ukuran sampel 2

kelompok seluruhnya adalah 2n.

� Perhitungan Ukuran Sampel dan

Analisis Power dengan Stata

Sintaks

� Perhitungan Ukuran Sampel

power twoproportions p1 p2 [, alpha (numlist) power(numlist)

options]

p1 : proporsi kelompok kontrol (kelompok referensi)

p2 : proporsi kelompok eksperimental

� Analisis Power

power twoproportions p1 p2 [, n(numlist) alpha (numlist)

options]

p1 : proporsi kelompok kontrol (kelompok referensi)

p2 : proporsi kelompok eksperimental

Bab 6 Ukuran Sampel untuk Inferensi Dua Proporsi

38

Opsi:

n(numlist) : ukuran sampel (untuk analisis power)

alpha(numlist) : tingkat signifikansi, default-nya adalah

alpha(0.05)

power(numlist) : power, default-nya adalah power(0.8)

beta(numlist) : kesalahan tipe II, default-nya adalah beta(0.2)

onesided : uji satu-sisi, default-nya adalah dua sisi

Perhatikan:

- power dan beta tidak boleh dispesifikasikan secara bersama (hanya

salah satu yang dispesifikasikan), dengan hubungan power = 1 – beta.

- power (atau beta) hanya dispesifikasikan dalam perhitungan ukuran

sampel.

- n hanya dispesifikasikan dalam analisis power.

- Spesifikasi dengan nilai default tidak perlu dituliskan dalam perintah

Stata.

Contoh 6.1:

a. Perhitungan Ukuran Sampel dengan Stata

. power twoproportions 0.1 0.5, alpha(0.1) power(0.9) onesided

Estimated sample sizes for a two-sample

proportions test

Pearson's chi-squared test

Ho: p2 = p1 versus Ha: p2 > p1

Study parameters:

alpha = 0.1000

power = 0.9000

delta = 0.4000 (difference)

p1 = 0.1000

p2 = 0.5000

Bab 6 Ukuran Sampel untuk Inferensi Dua Proporsi

39

Estimated sample sizes:

N = 32

N per group = 16

Ukuran sampel seluruhnya adalah 32 (16 dalam 1 kelompok),

sedangkan ukuran efek adalah 0.40.

b. Perhitungan Ukuran Sampel Secara Manual:

α = 0.01 → Zα = 2.33

β = 1 – 0.9 = 0.1 → Zβ = 1.28

1P = 0.1 1Q = 0.9

2P = 0.5 2Q = 0.5

diff = 0.5 – 0.1 = 0.4

n =

2

1 1 2 2

2

2Z PQ Z PQ P Q

diff

α β + +

= ( )( ) ( ) ( ) ( )( )

2

2

2.33 2 0.3 0.7 1.28 0.1 0.9 0.5 0.5

0.4

+ +

= 31.82 . . . ≈ 32

c. Analisis Power

Jika pada perhitungan ukuran sampel sebelum penelitian didapatkan

ukuran sampel n1, tetapi pada pelaksanaan penelitian hanya diperoleh

ukuran sampel n2, maka setelah penelitian harus dilakukan analisis power

untuk menghitung ulang besar power yang sesungguhnya tercapai.

Misalkan untuk contoh 6.1.a di atas, pada penelitian sesungguhnya

hanya dapat direkrut anggota sampel sebanyak 28 orang, maka power-nya

adalah:

Bab 6 Ukuran Sampel untuk Inferensi Dua Proporsi

40

. power twoproportions 0.1 0.5, n(42) alpha(0.1) onesided

Estimated power for a two-sample proportions

test

Pearson's chi-squared test

Ho: p2 = p1 versus Ha: p2 > p1

Study parameters:

alpha = 0.1000

N = 28

N per group = 14

delta = 0.4000 (difference)

p1 = 0.1000

p2 = 0.5000

Estimated power:

power = 0.8734

� Ukuran Sampel untuk Estimasi Interval

Seperti pada ukuran sampel untuk estimasi interval 2 rerata,

perhitungan ukuran sampel untuk estimasi interval dua proporsi juga relatif

jarang dikerjakan. Pada inferensi statistik untuk 2 proporsi hampir selalu juga

akan dilakukan uji hipotesis (selain estimasi interval), karena itu ukuran

sampel yang dibutuhkan telah dihitung berdasarkan uji hipotesis.

Misalkan hendak diestimasi interval konfidensi 100 ( )1 α− % untuk

selisih 2 proporsi populasi 1P dan 2P . Interval konfidensi yang akan

diperoleh dinyatakan dengan lambang [ ];B Ap p ; Bp dan Ap masing-masing

menyatakan batas bawah dan batas atas selisih interval konfidensi tersebut.

Misalkan pula:

Bab 6 Ukuran Sampel untuk Inferensi Dua Proporsi

41

2I = Ap − Bp

I = 2

. ( )BASE p p−

dan I = 2

. 1 1 2 2PQ P Q

n

+

sehingga n = ( ) [ ]

2

2 1 1 2 2

2

.Z PQ P Q

I

α + (6.2)

Contoh 6.2:

α = 0.05 → 2

= 1.96

1p = 64% 2p = 82%

1q = 36% 2q = 18%

2I = 10% → I = 0.05

n = ( ) [ ]

2

2 1 1 2 2

2

.Z PQ P Q

I

α +

= ( ) ( ) ( ) ( )( )

2

2

1.96 . 0.64 0.36 0.82 0.18

0.05

+

= 580.8499 ≈ 581

Jumlah ini sangat besar dan sulit dicapai. Jika presisi diturunkan

menjadi 2I = 20% dan I = 0.10 maka:

n = ( ) ( ) ( ) ( )( )

2

2

1.96 . 0.64 0.36 0.82 0.18

0.10

+

= 145.21248 ≈ 146

Jumlah ini lebih realistik dan lebih mungkin dicapai.

Bab 7 Ukuran Sampel untuk Rancangan Studi Epidemiologi

43

BAB 7

UKURAN SAMPEL UNTUK

RANCANGAN STUDI

EPIDEMIOLOGI

Tiga rancangan studi dasar Epidemiologi, ialah studi kohort, studi

kasus-kontrol, dan studi potong-lintang. Dalam bab ini akan dibahas

perhitungan ukuran sampel untuk ketiga rancangan studi tersebut, tetapi

hanya perhitungan ukuran sampel untuk estimasi interval bagi 2 ukuran khas

Epidemiologi, yaitu rasio risiko dan rasio odds. Dalam perhitungan ukuran

sampel untuk estimasi interval pada rancangan studi epidemiologi sering

didapatkan ukuran sampel yang sangat besar, sehingga biasa diperlukan

spesifikasi ulang parameter-parameternya. Perhitungan ukuran sampel untuk

uji hipotesis tidak lagi akan dibahas di sini, karena sama saja dengan materi

Bab 4 dan Bab 6 tentang ukuran sampel untuk 1 dan 2 proporsi.

� Ukuran Sampel untuk Estimasi Interval

pada Studi Potong-Lintang

Layout data pada studi potong-lintang (cross-sectional study) adalah

sebagai berikut (lihat Tabel 7.1, perhatikan bahwa dalam Epidemiologi biasa

digunakan lambang dan notasi yang berbeda pengertiannya dengan dalam

Biostatistika):

Bab 7 Ukuran Sampel untuk Rancangan Studi Epidemiologi

44

Tabel 7.1 Layout data pada studi potong-lintang

Kelompok D D Jumlah

E a b 1n

E c d 2n

Jumlah 1m

2m n

E : Kelompok terpajan (exposed); 1n menyatakan jumlah subjek

terpajan

E : Kelompok tak-terpajan (non-exposed); 2n menyatakan jumlah

subjek tak-terpajan

D : Kelompok sakit (diseased); 1m menyatakan jumlah subjek sakit

D : Kelompok tidak sakit (non-diseased); 2m menyatakan jumlah subjek

tidak sakit

Pada rancangan studi ini, diambil 1 sampel berukuran n, lalu

anggotanya masing-masing dialokasikan ke salah satu dari empat sel dalam

tabel di atas berdasarkan status sakit dan status terpajan masing-masing.

Umumnya ahli Epidemiologi menganggap studi potong-lintang bukan salah

satu bentuk studi analitik karena tidak ada 2 kelompok yang dapat

diperbandingkan. Biasanya studi potong-lintang hanya dianggap sebagai

salah satu bentuk survei.

Jika sampel diambil secara acak dari populasi, maka dapat diestimasi

prevalensi penyakit dalam populasi, yaitu:

Prev = 1M

N

dengan estimasi titik:

ˆPrev = 1m

n

Ukuran sampel untuk estimasi interval prevalensi dengan presisi 2I

adalah:

n = ( ) ( )( )

2

/2

2

1a

Z Prev Prev

I

− (7.1)

Bab 7 Ukuran Sampel untuk Rancangan Studi Epidemiologi

45

Jika taksiran prevalensi tidak ada, dapat digunakan asumsi

konservatif:

n = ( )

2

2

2

.0.25Z

I

α (7.2)

� Ukuran Sampel untuk Estimasi Interval

pada Studi Kohort

Layout data pada studi kohort (cohort study) adalah sebagai berikut

(lihat Tabel 7.2) dengan nomenklatur yang sama seperti pada tabel 7.1:

Tabel 7.2 Layout data pada studi kohort

Kelompok D D Jumlah

E a b 1n

E c d 2n

Di sini diambil 2 sampel, sehingga ada dua kelompok perbandingan

yaitu kelompok terpajan yang berukuran 1n , dan kelompok tak-terpajan

yang berukuran 2n . Ukuran sampel seluruhnya adalah

1n + 2n .

Ukuran keeratan hubungan pajanan dengan penyakit adalah rasio

risiko, yaitu:

ˆRR =

1

2

a n

c n (7.3)

Rasio risiko bukan suatu nilai proporsi (rasio antar 2 proporsi), juga

tidak berdistribusi normal (sangat menceng ke kiri). Untuk mengkonversinya

agar mendekati distribusi normal digunakan tranformasi logaritmanya. Plot

ln RR terhadap RR diperlihatkan pada gambar 7.1.

Bab 7 Ukuran Sampel untuk Rancangan Studi Epidemiologi

46

Gambar 7.1 Plot ln RR terhadap RR

Tampak bahwa RR tidak berdistribusi simetris, tetapi ln RR adalah

hampir simetris, sehingga dapat digunakan interval konfidensi ( )1 α− %

untuk ln RR, yaitu:

ln ˆRR + 2Zα . ( )ˆ ˆ SE ln RR

Perhatikan bahwa karena tidak berdistribusi simetris, presisi bawah

estimasi interval RR tidak sama dengan presisi atasnya, yaitu LI ≠

UI ,

tetapi transformasi logaritmanya dapat dianggal sama, yaitu ln LI = ln

UI .

Misalkan LI = ε .RR →

ˆLI = ε . ˆRR

Karena: LI = RR − LRR

maka ln

ˆLI = ln ˆRR − ( )2

ˆ ˆ ˆ . ln RR Z SE ln RRα −

ˆLI = exp ( )ˆ ln RR − exp ( )2

ˆ ˆ ˆ . ln RR Z SE ln RRα −

= ˆRR ( ) 2ˆ ˆ1 . exp Z SE ln RRα

− −

Diperoleh: ε . ˆRR = ˆRR ( ) 2ˆ ˆ1 . exp Z SE ln RRα

− −

Bab 7 Ukuran Sampel untuk Rancangan Studi Epidemiologi

47

1 − ε = ( ) 2ˆ ˆ. exp Z SE ln RRα−

dan ukuran sampel minimum 1 kelompok adalah:

1n =

2n =

n = ( ) ( ) ( )

( )

2

2 1 1 2 2

2

. 1 1

1

Z p p p p

ln

α

ε

− + −

(7.4)

Untuk ε , dapat dipilih 0.10, 0.20, 0.25, dan 0.50.

Perhatikan bahwa dari 3 parameter, 1p , 2p , dan ˆRR , hanya 2 yang

boleh dispesifikasikan ( ˆRR = 1 2p p ).

Contoh 7.1:

α = 0.05 → 2Zα = 1.96

1p = 0.5 1 − 1p = 0.5

2p = 0.2 1 − 2p = 0.8

ε = 0.25

Ukuran sampel minimum yang dibutuhkan untuk 1 kelompok adalah:

n = ( ) ( ) ( )

( )

2

2 1 1 2 2

2

. 1 1

1

Z p p p p

ln

α

ε

− + −

= ( ) [ ]

( )

2

2

1.96 . 0.5 0.5 0.8 0.2

1 0.25ln

+

= 232.09 . . . ≈ 233

Ukuran sampel seluruhnya untuk dua kelompok adalah (2)(233) =

466.

Bab 7 Ukuran Sampel untuk Rancangan Studi Epidemiologi

48

� Ukuran Sampel untuk Estimasi Interval

pada Studi Kasus-Kontrol

Layout data pada studi kasus-kontrol (case-control study) adalah

sebagai berikut (lihat Tabel 7.3) dengan nomenklatur yang sama seperti pada

tabel 7.1:

Tabel 7.3 Layout data pada studi kasus-kontrol

Kelompok D D

E a b

E c d

Jumlah 1m

2m

Di sini diambil 2 sampel, yaitu kelompok D yang berukuran 1m dan

kelompok D yang berukuran 2m . Dalam kedua kelompok perbandingan

didapatkan sejumlah subjek yang terpajan serta sejumlah subjek yang tak-

terpajan, sehingga di sini tidak dapat dilakukan estimasi rasio risiko. Yang

dapat diestimasi adalah pendekatannya, yaitu rasio odds. Ukuran sampel

seluruhnya adalah 1m +

2m .

ˆOR = ad

bc (7.5)

Untuk mengkonversinya agar mendekati distribusi normal digunakan

tranformasi logaritmanya. Plot ln OR terhadap OR diperlihatkan pada

gambar 7.2

Bab 7 Ukuran Sampel untuk Rancangan Studi Epidemiologi

49

Gambar 7.2 Plot ln OR terhadap OR

.

Dengan memisalkan LI = ε .OR dengan nilai-nilai ε merupakan

salah satu pilihan di antara 0.10, 0.20, 0.25, atau 0.50, diperoleh ukuran

sampel minimum 1 kelompok yaitu:

1m =

2m =

m = ( ) ( ) ( ){ }

( )

2* * * *

2 1 1 2 2

2

. 1 1 1 1

1

Z p p p p

ln

α

ε

− + −

(7.6)

*1p adalah proporsi subjek yang terpajan dalam populasi sakit,

sedangkan *2p adalah proporsi subjek yang terpajan dalam populasi kontrol.

Dari 3 parameter, *1p , *

2p , dan ˆOR , hanya 2 yang boleh dispesifikasikan.

Jika estimasi ˆOR dan *2p diketahui, *

1p dihitung dengan persamaan:

*1p =

( )( ) ( )

*2

* *2 2

ˆ .

ˆ . 1

OR p

OR p p+ − (7.7)

Bab 7 Ukuran Sampel untuk Rancangan Studi Epidemiologi

50

Contoh 7.2:

α = 0.05 → 2Zα = 1.96

*2p = 0.25 ˆOR = 2.00

*1p =

( )( ) ( )

*2

* *2 2

ˆ .

ˆ . 1

OR p

OR p p+ −

= ( ) ( )

( ) ( ) ( )

2 . 0.25

2 . 0.25 1 0.25+ − = 0.40

ε = 0.20

Ukuran sampel minimum untuk 1 kelompok adalah 1m =

2m = m ,

yaitu:

m = ( ) ( ) ( ){ }

( )

2* * * *

2 1 1 2 2

2

. 1 1 1 1

1

Z p p p p

ln

α

ε

− + −

= ( ) ( ) ( ) ( ) ( ){ }

( )

2

2

1.96 . 1 0.40 0.60 1 0.25 0.75

1 0.20ln

+

= 732.9377 . . . ≈ 733

Ukuran sampel seluruhnya untuk dua kelompok adalah (2)(733) =

1466. Ukuran ini mungkin dianggap terlalu besar. Dengan respesifikasi ε =

0.50 diperoleh:

m = ( ) ( ) ( ) ( ) ( ){ }

( )

2

2

1.96 . 1 0.40 0.60 1 0.25 0.75

1 0.50ln

+

= 75.9599 . . . ≈ 76

Diperoleh ukuran sampel 1 kelompok sebesar 76 dan untuk 2

kelompok adalah 152.

Bab 8 Ukuran Sampel untuk Analisis Variansi

51

BAB 8

UKURAN SAMPEL UNTUK

ANALISIS VARIANSI

� Ukuran Sampel untuk Analisis Variansi

1-Arah

Model

Model analisis variansi 1-arah adalah:

ijY = µ + iτ + ijε

ijY : respons pada subjek ke-j dalam kelompok perlakuan ke-i

µ : rerata menyeluruh (overall mean)

iτ : efek perlakuan kelompok ke-i

ijε : galat pada subjek ke-j dalam kelompok perlakuan ke-i

Sintaks

� Perhitungan Ukuran Sampel

power oneway m1 m2 [m3 . . . mJ] [, power(numlist) options]

mj : rerata kelompok ke-j; j = 1, 2, . . . , J

� Analisis Power

power oneway m1 m2 [m3 . . . mJ], n(numlist) [options]

Bab 8 Ukuran Sampel untuk Analisis Variansi

52

Opsi:

n(numlist) : ukuran sampel (untuk analisis power)

alpha(numlist) : tingkat signifikansi, default-nya adalah

alpha(0.05)

power(numlist) : power, default-nya adalah power(0.8)

beta(numlist) : kesalahan tipe II, default-nya adalah beta(0.2)

varerror(numlist) : variansi galat (dalam-kelompok), default-nya

adalah varerror(1)

varmeans(numlist) : variansi rerata kelompok (antar-kelompok)

ngroups(#) : jumlah kelompok. Spesifikasi varmeans dan

ngroups pada opsi dapat menggantikan

meanspec (nilai-nilai rerata kelompok)

Contoh 8.1:

a. Perhitungan Ukuran Sampel dengan Stata

1) alpha = 5% power = 80%

m1 = 260 m2 = 289 m3 = 295

varerror = 4900

. power oneway 260 289 295, varerror(4900)

Estimated sample size for one-way ANOVA

F test for group effect

Ho: delta = 0 versus Ha: delta != 0

Study parameters:

alpha = 0.0500

power = 0.8000

delta = 0.2183

N_g = 3

Bab 8 Ukuran Sampel untuk Analisis Variansi

53

m1 = 260.0000

m2 = 289.0000

m3 = 295.0000

Var_m = 233.5556

Var_e = 4900.0000

Estimated sample sizes:

N = 207

N per group = 69

Ukuran sampel seluruhnya adalah 207, dengan alokasi 69 pada

masing-masing dari 3 kelompok. Ukuran efek adalah 0.2183.

2) Jika meanspec (rerata tiap kelompok) tak diketahui, tetapi yang

dispesifikasi adalah varmeans(233.5556) dan ngroups(3),

maka:

. power oneway, varerror(4900) varmeans(233.5556)

ngroups(3)

Estimated sample size for one-way ANOVA

F test for group effect

Ho: delta = 0 versus Ha: delta != 0

Study parameters:

alpha = 0.0500

power = 0.8000

delta = 0.2183

N_g = 3

Var_m = 233.5556

Var_e = 4900.0000

Estimated sample sizes:

Bab 8 Ukuran Sampel untuk Analisis Variansi

54

N = 207

N per group = 69

Tampak bahwa hasil yang diperoleh sama dengan di atas.

b. Analisis Power

Misalkan dalam pelaksanaan studi hanya diperoleh ukuran sampel

171 subjek dengan 57 subjek untuk tiap kelompok.

. power oneway 260 289 295, varerror(4900) n(171)

Estimated power for one-way ANOVA

F test for group effect

Ho: delta = 0 versus Ha: delta != 0

Study parameters:

alpha = 0.0500

N = 171

N per group = 57

delta = 0.2183

N_g = 3

m1 = 260.0000

m2 = 289.0000

m3 = 295.0000

Var_m = 233.5556

Var_e = 4900.0000

Estimated power:

power = 0.7179

Diperoleh power sebesar 71.79%.

Bab 8 Ukuran Sampel untuk Analisis Variansi

55

� Ukuran Sampel untuk Analisis Variansi

2-Arah

Model

Model pada analisis variansi 2-arah adalah:

ijkY = µ + iα + jβ + ( )ij

αβ + ijkε

ijkY : respons pada subjek ke-k dalam sel perlakuan A ke-i dan

perlakuan B ke-j

µ : rerata menyeluruh (overall mean) rerata menyeluruh (overall

mean)

iα : efek perlakuan A ke-i

jβ : efek perlakuan B ke-j

( )ij

αβ : efek interaksi perlakuan A ke-i dan perlakuan B ke-j

ijkε : galat pada subjek ke-j dalam sel perlakuan A ke-i dan perlakuan B

ke-j

Sintaks

� Perhitungan Ukuran Sampel

power twoway meanspec [, power(numlist) options]

meanspec adalah matriks yang memuat nilai-nilai rerata sel:

m1_1 m1_2 [ . . . ] \ m2_1 m2_2 [ . . . ] [\ . . . \ mJ_1 . . . mJ_K]

mj_k : rerata sel baris ke-j kolom ke-k; j = 1, 2, . . . , J dan k = 1, 2, . . . ,

K

Bab 8 Ukuran Sampel untuk Analisis Variansi

56

� Analisis Power

power twoway meanspec, n(numlist) [options]

Opsi:

n(numlist) : ukuran sampel (untuk analisis power)

alpha(numlist) : tingkat signifikansi, default-nya adalah

alpha(0.05)

power(numlist) : power, default-nya adalah power(0.8)

beta(numlist) : kesalahan tipe II, default-nya adalah beta(0.2)

varerror(numlist) : variansi galat (dalam-kelompok), default-nya

adalah varerror(1)

varrow(numlist) : variansi yang ‘dijelaskan’ oleh efek baris

nrows(#) : jumlah baris

ncols(#) : jumlah kolom. Spesifikasi varrow, nrows, dan

ncols pada opsi dapat menggantikan

meanspec (nilai-nilai rerata sel)

Contoh 8.2:

a. Perhitungan Ukuran Sampel dengan Stata

1) alpha = 5% power = 80%

| Column

| 1 2 3

-------|-----------

Row 1 | 134 143 91

2 | 106 173 145

varerror = 1417

. power twoway 134 143 91 \ 106 173 145,

varerror(1417)

Bab 8 Ukuran Sampel untuk Analisis Variansi

57

Estimated sample size for two-way ANOVA

F test for row effect

Ho: delta = 0 versus Ha: delta != 0

Study parameters:

alpha = 0.0500

power = 0.8000

delta = 0.2479

N_r = 2

N_c = 3

means = <matrix>

Var_r = 87.1111

Var_e = 1417.0000

Estimated sample sizes:

N = 132

N per cell = 22

Ukuran sampel seluruhnya adalah 132, teralokasi masing-masing

22 subjek pada tiap kelompok. Ukuran efek adalah 0.2479.

2) Nilai-nilai rerata sel (meanspec) dapat digantikan oleh varrow

= 87.1111, nrows = 2, dan ncols = 3.

. power twoway, varerror(1417) varrow(87.1111)

nrows(2) ncols(3)

Estimated sample size for two-way ANOVA

F test for row effect

Ho: delta = 0 versus Ha: delta != 0

Study parameters:

alpha = 0.0500

power = 0.8000

Bab 8 Ukuran Sampel untuk Analisis Variansi

58

delta = 0.2479

N_r = 2

N_c = 3

Var_r = 87.1111

Var_e = 1417.0000

Estimated sample sizes:

N = 132

N per cell = 22

b. Analisis Power

Misalkan dalam pelaksanaan studi hanya diperoleh ukuran sampel

108 subjek dengan 18 subjek untuk tiap sel.

. power twoway 134 143 91 \ 106 173 145, varerror(1417) n(108)

Estimated power for two-way ANOVA

F test for row effect

Ho: delta = 0 versus Ha: delta != 0

Study parameters:

alpha = 0.0500

N = 108

N per cell = 18

delta = 0.2479

N_r = 2

N_c = 3

means = <matrix>

Var_r = 87.1111

Var_e = 1417.0000

Bab 8 Ukuran Sampel untuk Analisis Variansi

59

Estimated power:

power = 0.7232

Diperoleh power sebesar 72.32%.

Bab 9 Ukuran Sampel untuk Analisis Regresi Linear

61

BAB 9

UKURAN SAMPEL UNTUK

ANALISIS REGRESI LINEAR

� Ukuran Sampel untuk Analisis Regresi

Linear Sederhana

Model

Model analisis regresi linear sederhana adalah:

iY = 0β +

1β iX + iε

iY : respons pada subjek ke-i

0β : intersep; konstante

1β : kemiringan; koefisien regresi

iX : nilai kovariat X pada subjek ke-i

iε : galat pada subjek ke-i

Sintaks

� Perhitungan Ukuran Sampel

power oneslope b0 ba [, power(numlist) options]

b0 : kemiringan nol (nilai kemiringan menurut hipotesis nol)

ba : kemiringan alternatif (nilai kemiringan menurut hipotesis alternatif)

Bab 9 Ukuran Sampel untuk Analisis Regresi Linear

62

� Analisis Power

power oneslope b0 ba, n(numlist) [options]

Opsi:

n(numlist) : ukuran sampel (untuk analisis power)

alpha(numlist) : tingkat signifikansi, default-nya adalah

alpha(0.05)

power(numlist) : power, default-nya adalah power(0.8)

beta(numlist) : kesalahan tipe II, default-nya adalah beta(0.2)

sderror(numlist) : standar deviasi suku galat model regresi, default-

nya adalah sderror(1)

sdx(numlist) : standar deviasi kovariat, default-nya adalah

sdx(1)

diff(numlist) : selisih kemiringan b0 dan ba, dispesifikasikan

untuk menggantikan ba

Contoh 9.1:

a. Perhitungan Ukuran Sampel dengan Stata

1) alpha = 5% power = 80%

b0 = 0 ba = 0.5

sdx = 1 sderror = 1

. power oneslope 0 0.5

Estimated sample size for a linear

regression slope test

t test

Ho: b = b0 versus Ha: b != b0

Bab 9 Ukuran Sampel untuk Analisis Regresi Linear

63

Study parameters:

alpha = 0.0500

power = 0.8000

delta = 0.5000

b0 = 0.0000

ba = 0.5000

sdx = 1.0000

sderror = 1.0000

Estimated sample size:

N = 34

Ukuran sampel yang dibutuhkan adalah 34 dengan ukuran efek

0.50.

2) Jika digunakan sderror = 2, maka

. power oneslope 0 0.5, sderror(2)

Estimated sample size for a linear

regression slope test

t test

Ho: b = b0 versus Ha: b != b0

Study parameters:

alpha = 0.0500

power = 0.8000

delta = 0.2500

b0 = 0.0000

ba = 0.5000

sdx = 1.0000

sderror = 2.0000

Estimated sample size:

Bab 9 Ukuran Sampel untuk Analisis Regresi Linear

64

N = 128

Ukuran sampel yang dibutuhkan adalah 128 dengan ukuran efek

0.25.

3) Jika digunakan sderror = 2 dan sdx = 0.5, maka:

. power oneslope 0 0.5, sderror(2) sdx(0.5)

Estimated sample size for a linear

regression slope test

t test

Ho: b = b0 versus Ha: b != b0

Study parameters:

alpha = 0.0500

power = 0.8000

delta = 0.1250

b0 = 0.0000

ba = 0.5000

sdx = 0.5000

sderror = 2.0000

Estimated sample size:

N = 505

Ukuran sampel yang dibutuhkan adalah 505 dengan ukuran efek

0.125.

b. Analisis Power

Misalkan dalam pelaksanaan studi terakhir dengan sderror = 2 dan

sdx = 0.5 hanya diperoleh ukuran sampel 400 subjek. Powernya adalah:

Bab 9 Ukuran Sampel untuk Analisis Regresi Linear

65

. power oneslope 0 0.5, sderror(2) sdx(0.5) n(400)

Estimated power for a linear regression slope

test

t test

Ho: b = b0 versus Ha: b != b0

Study parameters:

alpha = 0.0500

N = 400

delta = 0.1250

b0 = 0.0000

ba = 0.5000

sdx = 0.5000

sderror = 2.0000

Estimated power:

power = 0.7033

Diperoleh power sebesar 70.33%.

Bab 9 Ukuran Sampel untuk Analisis Regresi Linear

66

� Ukuran Sampel untuk Analisis Regresi

Linear Ganda

Model

Model pada analisis regresi linear ganda adalah:

iY = 0β +

1β 1iX + 2β 2iX + . . . +

pβ piX + iε

iY : respons pada subjek ke-i

0β : konstante

{ } 1 2, , . . . , pβ β β : himpunan koefisien regresi

{ }1 2, , . . . , pii iX X X : nilai himpunan kovariat pada subjek ke-i

iε : galat pada subjek ke-i

Sintaks

� Perhitungan Ukuran Sampel untuk Menguji Seluruh

Koefisien Regresi

power rsquared R2T [, power(numlist) options]

R2T : koefisien determinasi model menurut hipotesis alternatif

� Perhitungan Ukuran Sampel untuk Menguji Himpunan

Bagian Koefisien Regresi

power rsquared R2R R2F, ncontrol(numlist) [power(numlist)

options]

R2R : koefisien determinasi model tereduksi

R2F : koefisien determinasi model penuh

Bab 9 Ukuran Sampel untuk Analisis Regresi Linear

67

� Analisis Power

power rsquared R2T, n(numlist) [options]

Opsi:

n(numlist) : ukuran sampel (untuk analisis power)

alpha(numlist) : tingkat signifikansi, default-nya adalah

alpha(0.05)

power(numlist) : power, default-nya adalah power(0.8)

beta(numlist) : kesalahan tipe II, default-nya adalah beta(0.2)

ntested(numlist) : jumlah kovariat yang diuji, default-nya adalah

ntested(1)

ncontrol(numlist) : jumlah kovariat kontrol

Contoh 9.2:

a. Perhitungan Ukuran Sampel dengan Stata

1) alpha = 5% power = 80%

R-squared = 0.1

Diasumsikan hanya 1 kovariat yang akan diuji

Ukuran sampel yang dibutuhkan adalah:

. power rsquared 0.1

Estimated sample size for multiple linear

regression

F test for R2 testing all coefficients

Ho: R2_T = 0 versus Ha: R2_T != 0

Study parameters:

Bab 9 Ukuran Sampel untuk Analisis Regresi Linear

68

alpha = 0.0500

power = 0.8000

delta = 0.1111

R2_T = 0.1000

ntested = 1

Estimated sample size:

N = 73

Ukuran sampel yang dibutuhkan adalah 73 dengan ukuran efek

0.1111.

2) Sama seperti di atas, tetapi diasumsikan ada 3 kovariat yang akan

diuji.

. power rsquared 0.1, ntested(3)

Estimated sample size for multiple linear

regression

F test for R2 testing all coefficients

Ho: R2_T = 0 versus Ha: R2_T != 0

Study parameters:

alpha = 0.0500

power = 0.8000

delta = 0.1111

R2_T = 0.1000

ntested = 3

Estimated sample size:

N = 103

Bab 9 Ukuran Sampel untuk Analisis Regresi Linear

69

3) Akan diuji 1 kovariat dengan 2 kovariat kontrol

. power rsquared 0.1 0.15, ncontrol(2)

Estimated sample size for multiple linear

regression

F test for R2 testing subset of

coefficients

Ho: R2_F = R2_R versus Ha: R2_F != R2_R

Study parameters:

alpha = 0.0500

power = 0.8000

delta = 0.0588

R2_R = 0.1000

R2_F = 0.1500

R2_diff = 0.0500

ncontrol = 2

ntested = 1

Estimated sample size:

N = 136

4) Akan diuji 3 kovariat dengan 2 kovariat kontrol

. power rsquared 0.1 0.15, ncontrol(2) ntested(3)

Estimated sample size for multiple linear

regression

F test for R2 testing subset of

coefficients

Ho: R2_F = R2_R versus Ha: R2_F != R2_R

Bab 9 Ukuran Sampel untuk Analisis Regresi Linear

70

Study parameters:

alpha = 0.0500

power = 0.8000

delta = 0.0588

R2_R = 0.1000

R2_F = 0.1500

R2_diff = 0.0500

ncontrol = 2

ntested = 3

Estimated sample size:

N = 190

b. Analisis Power

Misalkan pada Contoh 9.2.a 2) di atas dalam pelaksanaannya hanya

diperoleh 87 subjek (seharusnya 103 subjek). Maka powernya adalah:

. power rsquared 0.1, n(87) ntested(3)

Estimated power for multiple linear regression

F test for R2 testing all coefficients

Ho: R2_T = 0 versus Ha: R2_T != 0

Study parameters:

alpha = 0.0500

N = 87

delta = 0.1111

R2_T = 0.1000

ntested = 3

Bab 9 Ukuran Sampel untuk Analisis Regresi Linear

71

Estimated power:

power = 0.7229

Power penelitiannya sesungguhnya adalah 72.29%.

Bab 10 Ukuran Sampel untuk Analisis Regresi Logistik

73

BAB 10

UKURAN SAMPEL UNTUK

ANALISIS REGRESI LOGISTIK

� Ukuran Sampel untuk Analisis Regresi

Logistik Sederhana

Model

Model pada analisis regresi logistik sederhana adalah:

ln 1

i

i

Y

Y− =

0β + 1β iX

iY : respons biner pada subjek ke-i

0β : konstante

1β : koefisien regresi logistik

iX : nilai kovariat X pada subjek ke-i

Telaah Teoretik

Umumnya untuk analisis multivariat, terutama yang menggunakan

metode estimasi maximum likelihood tidak cara sederhana untuk menghitung

ukuran sampel. Whittemore (1980) menghasilkan metode yang cukup rumit

yang menghasilkan sejumlah tabel ukuran sampel untuk analisis regresi

logistik, yang terbatas untuk respons jarang (small response). Hsieh (1989)

mengembangkannya menjadi rumus yang relatif lebih sederhana, yang masih

digunakan sampai saat ini.

Bab 10 Ukuran Sampel untuk Analisis Regresi Logistik

74

n = ( ) ( )

22

2

2

ˆ. 4 1 2

ˆ

Z Z exp b p

pb

α β δ + − + (10.1)

b : koefisien regresi; b = β = ln OR

p : peluang Y = 1 (atau estimasinya) pada titik rerata X;

P ( )1Y E X =

δ = ( ) ( )

( )

2 2

2

1 1 5 4

1 4

b exp b

exp b

+ +

+ − (10.2)

Contoh 10.1:

α = 0.05 → 2Zα = 1.96

β = 0.20 → Zβ = 0.84

OR = 2 → b = ln 2 = 0.6931

p = 0.2

Maka: δ = ( ) ( )

( )

2 2

2

1 1 5 4

1 4

b exp b

exp b

+ +

+ −

= ( )( ) ( )( )

( )( )

2 2

2

1 1 ln 2 5 ln 2 4

1 ln 2 4

exp

exp

+ +

+ −

= 1.960488 . . . ≈ 1.96

dan n = ( ) ( )

22

2

2

ˆ. 4 1 2

ˆ

Z Z exp b p

pb

α β δ + − +

= ( )( ) ( ) ( )( )

( ) ( )

22

2

1.96 0.84. ln 2 4 1 2 0.2 1.96

0.2 ln 2

exp + − +

= 135.8393 . . . ≈ 136

Bab 10 Ukuran Sampel untuk Analisis Regresi Logistik

75

� Ukuran Sampel untuk Analisis Regresi

Logistik Ganda

Model Model pada analisis regresi linear ganda adalah:

ln 1

i

i

Y

Y− =

0β + 1β 1iX +

2β 2iX + . . . + pβ piX

iY : respons biner pada subjek ke-i

0β : konstante

{ } 1 2, , . . . , pβ β β : himpunan koefisien regresi logistik

{ }1 2, , . . . , pii iX X X : nilai himpunan kovariat pada subjek ke-i

Telaah Teoretik

Metode perhitungan ukuran sampel untuk analisis regresi logistik

ganda ini dikembang oleh Hsieh et al (1998) sebagai kelanjutan metode

perhitungan ukuran sampel untuk analisis regresi logistik sederhana di atas,

terutama ditujukan untuk menguji 1 kovariat yang berada dalam model

bersama sejumlah kovariat lain.

Misalkan akan dilakukan analisis regresi logistik sederhana dengan

kovariat 1X . Dengan rumus (10.1) didapatkan ukuran sampel yang

dibutuhkan yaitu 1n . Maka ukuran sampel yang dibutuhkan untuk analisis

regresi logistik ganda dengan p kovariat adalah:

Mn = 121.23...1 p

n

ρ− (10.3)

Bab 10 Ukuran Sampel untuk Analisis Regresi Logistik

76

21.23... pρ : kuadrat koefisien korelasi ganda antara 1X dengan himpunan

sisa kovariat { }2 3, , . . . , pX X X ; atau sama dengan koefisien

determinasi regresi (linear) 1X terhadap himpunan kovariat

{ }2 3, , . . . , pX X X .

Contoh 10.2:

Misalkan analisis regresi logistik sederhana pada Contoh 10.1 akan

dilanjutkan dengan analisis regresi logistik ganda dengan penambahan 3

kovariat 2X , 3X , dan 4X .

21.234ρ = 0.60

Mn = 121.23...1 p

n

ρ−

= 136

1 0.60−

= 340

77

KEPUSTAKAAN

Bausell RB, Li Y-F. Power Analysis for Experimental Research: A

Practical Guide for the Biological, Medical and Social Sciences.

Cambridge: Cambridge University Press, 2002.

Chow S-C, Shao J, Wang H. Sample Size Calculations in Clinical

Research, 2nd Ed. Boca Raton: Chapman & Hall, 2008.

Cumming G. Understanding the New Statistics: Effect Sizes, Confidence

Intervals, and Meta-Analysis. New York: Routledge, 2012.

Ellis PD. The Essential Guide to Effect Sizes: Statistical Power, Meta-

Analysis, and the Interpretation of Research Results. Cambridge:

Cambridge University Press, 2010.

Hsieh FY. Sample size tables for logistic regression. In Statistics in

Medicine, Vol 8, pp 795-802, 1989.

Hsieh FY, Bloch DA, Larsen MD. A simple method of sample size

calculation for linear and logistic regression. In Statistics in Medicine,

Vol 17, pp 1623-1634, 1998.

Lemeshow S, Hosmer Jr DW, Klar J, Lwanga SK. Adequacy of Sample

Size in Health Studies. Chichester: John Wiley & Sons, 1990.

Machin D, Campbell MJ, Tan SB, Tan SH. Sample Size Tables for Clinical

Studies, 3rd Ed. Chichester: Wiley-Blackwell, 2009.

Murphy KR, Myors B, Wolach A. Statistical Power Analysis: A Simple

and General Model for Traditional and Modern Hypothesis Tests,

4th Ed. New York: Routledge, 2014.

Ryan TP. Sample Size Determination and Power. Hoboken, New Jersey:

John Wiley & Sons, 2013.

StataCorp LLC. Stata Power and Sample-Size Reference Manual:

Release 15. College Station, Texas: Stata Press, 2017.

Whittemore AS. Sample size for logistic regression with small response

probability, SIAM Institute for Mathematics and Society. Stanford,

California: Stanford University, 1980.

79

Lampiran 1

Ikhtisar Beberapa Rumus

Perhitungan Ukuran Sampel

Untuk estimasi interval parameter Untuk uji hipotesis

Satu sampel, respons kontinu

n = ( )

22

2

2

.Z

I

α σ n =

( )2

2

2

.Z Z

diff

α β σ+

Satu sampel, respons biner

n = ( )

2

/2

2

aZ PQ

I

n =

2

0 0

2

A AZ P Q Z P Q

diff

α β +

Dua sampel, respons kontinu

n = ( )

22

2

2

2 .Z

I

α σ n =

( )2

2

2

2 .Z Z

diff

α β σ+

Dua sampel, respons biner

n = ( ) [ ]

2

2 1 1 2 2

2

.Z PQ P Q

I

α + n =

2

1 1 2 2

2

2Z PQ Z PQ P Q

diff

α β + +

Studi potong-lintang, estimasi interval prevalensi

n = ( ) ( )( )

2

/2

2

1a

Z Prev Prev

I

Studi kohort, estimasi interval RR

n = ( ) ( ) ( )

( )

2

2 1 1 2 2

2

. 1 1

1

Z p p p p

ln

α

ε

− + −

Studi kasus-kontrol, estimasi interval OR

m = ( ) ( ) ( ){ }

( )

2* * * *

2 1 1 2 2

2

. 1 1 1 1

1

Z p p p p

ln

α

ε

− + −

*1p =

( )( ) ( )

*2

* *2 2

ˆ .

ˆ . 1

OR p

OR p p+ −

81

Lampiran 2

Beberapa Nilai Z untuk

Perhitungan Ukuran Sampel

α = 0.01 2

Zα = 2.58 Zα = 2.33

α = 0.05 2

Zα = 1.96 Zα = 1.64

α = 0.10 2

Zα = 1.64 Zα = 1.28

1 − β = 0.70 Zβ = 0.52

1 − β = 0.80 Zβ = 0.84

1 − β = 0.90 Zβ = 1.28

83

Lampiran 3

Macam Ukuran Efek

Efek adalah hasil suatu intervensi yang terungkap pada perbandingan

antar grup atau derajat asosiasi antar dua variabel. Ukuran efek menyatakan

besar efek tersebut yang ditemukan dalam populasi. Besar dan arah efek ini

dalam populasi diestimasi dengan menggunakan sampel yang direkrut sesuai

persyaratan dengan ukuran sampel yang memadai.

Ellis (2010) membedakan macam ukuran efek menjadi dua kelompok

besar:

1. Ukuran perbedaan grup (famili d):

a. Perbedaan grup dengan respons biner

b. Perbedaan grup dengan respons kontinu

2. Ukuran asosiasi (famili r):

a. Indeks korelasi

b. Indeks proporsi variansi

Daftar selengkapnya ukuran efek menurut klasifikasi tersebut dimuat

pada tabel III.1 dan III.2 berikut.

84

Tabel III.1 Ukuran perbedaan grup: Famili d

a) Perbandingan grup dengan respons biner

RD Risk Difference:

Selisih probabilitas terjadinya suatu peristiwa/respons antar 2-grup.

RR Risk Ratio atau Rate Ratio:

Perbandingan probabilitas terjadinya suatu peristiwa/respons pada

suatu grup dengan probabilitas serupa pada grup lainnya.

OR Odds Ratio:

Perbandingan odds terjadinya suatu peristiwa/respons pada suatu

grup dengan odds serupa pada grup lainnya.

b) Perbandingan grup dengan respons kontinu

d Cohen’ d:

Selisih rerata tak-terkoreksi antar 2-grup, terstandardisasi

berdasarkan standar deviasi pooled.

∆ Glass’ delta:

Selisih rerata tak-terkoreksi antar 2-grup, terstandardisasi

berdasarkan standar deviasi grup kontrol

g Hedges’ g:

Selisih rerata terkoreksi antar 2-grup, terstandardisasi berdasarkan

standar deviasi pooled tertimbang.

PS Probabilitas superioritas:

Probabilitas sebuah nilai acak dari satu grup lebih besar daripada

nilai acak serupa dari grup lainnya

85

Tabel III.2 Ukuran asosiasi: Famili r

a) Indeks korelasi

r Koefisien korelasi produk momen Pearson

ρ Koefisien korelasi rank Spearman

τ Tau Kendall

PBr Koefisien korelasi poin-biserial

φ Koefisien phi:

Untuk tabel kontijensi 2×2

C Koefisien kontijensi Pearson:

Untuk tabel kontijensi

V Cramer’s V

λ Goodman and Kruskal’s lambda

b) Indeks proporsi variansi

2r Koefisien determinasi:

Untuk regresi bivariat

2R Koefisien determinasi ganda (tak-terkoreksi):

Untuk analisis regresi ganda

2adj R Koefisien determinasi ganda suaian (adjusted R-squared):

Suaian terhadap ukuran sampel dan jumlah prediktor

f Cohen’ f:

Kuantifikasi dispersi rerata pada tiga/lebih grup dalam ANOVA

2f Cohen’ f kuadrat:

Alternatif 2R pada analisis regresi ganda

2η Eta kuadrat atau rasio korelasi (tak-terkoreksi):

Untuk ANOVA

2ε Epsilon kuadrat:

Alternatif tak-bias untuk 2η

2ω Omega kuadrat:

Alternatif tak-bias untuk 2η

86

Sebagian di antara ukuran efek di atas merupakan ukuran yang sudah

lazim dikenal (RD, RR, OR; serta r, 2r , dan 2R ) ataupun telah dibahas pada

Bab 2 (d, ∆, g, dan PBr ). Rumus untuk beberapa ukuran lainnya yaitu:

1. Koefisien korelasi rank Spearman

ρ = 1 − ( ) ( )

( )

2

2

6

1

i iR X R Y

n n

∑ (III.1)

( )iR X : Ranking iX

( )iR Y : Ranking iY

n : Ukuran sampel

2. Tau Kendall:

τ = ( )1 2

c dn n

n n

− (III.2)

cn : jumlah pasangan konkordan (concordant)

dn : jumlah pasangan diskordan (discordant)

n : ukuran sampel

3. Koefisien phi:

φ =

2uji

n

χ (III.3)

2ujiχ : statistik penguji pada uji khi-kuadrat untuk tabel kontijensi

2×2

n : Ukuran sampel

4. Koefisien kontijensi Pearson:

C =

2

2

uji

ujin

χ

χ+ (III.4)

Digunakan untuk tabel kontijensi yang lebih besar daripada 2×2.

87

5. Cramer’s V:

V = ( )

2

1

uji

n q

χ

− (III.5)

q : min(r ; c)

r : jumlah baris (row)

c : jumlah kolom (column)

6. Goodman and Kruskal’s lambda:

λ = C D

C D

+ (III.6)

C : jumlah pasangan konkordan

D : jumlah pasangan diskordan

Seperti tau Kendall, tetapi pasangan ties tidak dihitung pada

denominator.

7. Koefisien determinasi ganda suaian:

2adj R = 1 −

( )1

SSE df

SSTo n − (III.7)

SSE : Jumlah kuadrat galat (error sum of squares)

SSTo : Jumlah kuadrat total (total sum of squares)

8. Cohen’s f:

f = ( )1truji

dfF

n

(III.8)

9. Cohen’s f kuadrat:

2f = 2

21

R

R− (III.9)

88

10. Eta kuadrat:

2η = SSTr

SSTo (III.10)

Untuk analisis variansi 1-arah:

SSTr : jumlah kuadrat perlakuan (treatment sum of squares)

SSTo : jumlah kuadrat total (total sum of squares_

11. Epsilon kuadrat:

2ε = trSSTr df MSE

SSTo

− (III.11)

trdf : derajat bebas perlakuan

MSE : kuadrat rerata galat (error mean square)

12. Omega kuadrat:

2ω = trSSTr df MSE

SSTo MSE

+ (III.12)

SSE : jumlah kuadrat galat (error sum of squares)