Demokrawati, Fiqa A. 2014 ANALISIS QUICK COUNT DENGAN MENGGUNAKAN METODE STRATIFIED RANDOM
SAMPLING (STUDI KASUS PEMILU WALIKOTA BANDUNG 2013)
Universitas Pendidikan Indonesia | repository.upi.edu | perpustakaan.upi.edu
BAB III
METODE STRATIFIED RANDOM SAMPLING
3.1 Pengertian Stratified Random Sampling
Dalam bukunya Elementary Sampling Theory, Taro Yamane menuliskan
βThe process of breaking down the population into strata, selecting simple
random samples from each stratum, and combining these into a single sampel to
estimate population parameter is called stratified random samplingβ. Berdasarkan
kutipan di atas dapat dinyatakan bahwa stratified random sampling merupakan
proses pengambilan sampel melalui proses pembagian populasi kedalam strata,
memilih sampel acak sederhana dari setiap stratum, dan menggabungkannya ke
dalam sebuah sampel untuk menaksir parameter populasinya.
Sampel yang representatif adalah sampel yang benar-benar dapat mewakili
karakteristik seluruh populasi. Jika populasi bersifat homogen, maka sampel bisa
diambil dari populasi yang mana saja, namun jika populasi bersifat heterogen, maka
sampel harus mewakili dari setiap bagian yang heterogen dari populasi tersebut
sehingga hasil penelitian dari sampel dapat terpenuhi terhadap setiap anggota
populasi.
Proses pembagian populasi kedalam stratum bertujuan agar sampel yang
diambil dari setiap stratum dapat merepresentasikan karakteristik populasi yang
berukuran besar dan heterogen. Oleh karena itu, stratum harus dibentuk sehomogen
mungkin dengan manganalisis karakteristik populasi dengan baik. Terdapat tiga
tahapan yang harus dilakukan dalam mengambil sampel dengan menggunakan
metode stratified random sampling, yaitu sebagai berikut:
1. Tahap Pertama
Populasi yang berukuran N dibagi menjadi sub-sub populasi yang masing-
masing terdiri atas π1, π2, π3, β¦ , ππΏ elemen. Diantara dua sub populasi tidak
boleh ada yang saling tumpang tindih sehingga π1 + π2 + π3 + β― + ππΏ = π.
23
Setiap stratum dapat dipandang sebagai populasi tersendiri (sub populasi). Dalam
pembentukan stratum harus diperhatikan variabel apa yang dijadikan sebagai
dasar pembentukan stratum, yaitu variabel yang memiliki korelasi tinggi dengan
variabel yang diteliti.
2. Tahap Kedua
Sampel diambil dari setiap stratum secara terpisah (independen) dengan
ukuran sampel dari masing-masing stratum adalah π1, π2, π3, β¦ , ππΏ dengan syarat
π1 + π2 + π3 + β― + ππΏ = π.
3. Tahap Ketiga
Setelah diperoleh sampel, selanjutnya dilakukan penaksiran terhadap
parameter yang diperlukan dan selanjutnya dibuat kesimpulan untuk populasi
berdasarkan hasil penaksiran sampel.
3.2 Total Populasi
3.2.1 Pengertian Total Populasi
Apabila N menyatakan banyak anggota populasi dan L menyatakan
banyak stratum maka total populasi adalah jumlah dari total stratum dan
didefinisikan sebagai berikut:
π = β πβ
πΏ
β
= β β πβπ
πβ
π=1
πΏ
β=1
Dimana πβ adalah total dari stratum h yang didefinisikan sebagai berikut:
πβ = β πβπ
πβ
π=1
πβπ adalah sampel ke-i pada stratum ke-h.
Rata-rata stratum didefiniskan sebagai berikut:
24
οΏ½Μ οΏ½β =πβ
πβ
Dan rata-rata populasi didefinisikan sebagai berikut:
οΏ½Μ οΏ½ =π
π=
β πβοΏ½Μ οΏ½βπΏβ
π
3.2.2 Penaksir Total Populasi
Total populasi merupakan jumlah dari total stratum sehingga dalam
menaksir total populasi dapat melalui penjumlahan dari taksiran total stratum.
Taksiran total stratum dapat diperoleh dengan rumus sebagai berikut:
οΏ½ΜοΏ½β = πβοΏ½Μ οΏ½β (3.1)
Dimana οΏ½Μ οΏ½β merupakan rata-rata sampel dari sebuah subsampel acak yang
berukuran πβ dari stratum ke-h.
Taksiran total populasi πΏ adalah jumlah dari taksiran total stratum seperti
yang dijabarkan dalam persamaan berikut:
οΏ½ΜοΏ½π π‘ = π1οΏ½Μ οΏ½1 + π2οΏ½Μ οΏ½2 + β― + ππΏοΏ½Μ οΏ½πΏ = β πβοΏ½Μ οΏ½β
πΏ
β=1
(3.2)
dan taksiran rata-rata populasi menjadi
οΏ½Μ οΏ½βΜ = οΏ½Μ οΏ½π π‘ =
οΏ½ΜοΏ½π π‘
π=
π1οΏ½Μ οΏ½1+. . +ππΏοΏ½Μ οΏ½πΏ
π1 + β― + ππΏ=
β πβοΏ½Μ οΏ½βπΏβ=1
π
Karena rata-rata sampel stratum οΏ½Μ οΏ½β yang diperoleh dengan sampling acak
sederhana merupakan penaksir tak bias dari rata-rata stratum οΏ½Μ οΏ½β.
πΈ(οΏ½Μ οΏ½π π‘) = οΏ½Μ οΏ½β
Maka nilai ekspektasi οΏ½Μ οΏ½π π‘menjadi
E(οΏ½Μ οΏ½π π‘) = πΈ(π1οΏ½Μ οΏ½1+ β¦+ππΏοΏ½Μ οΏ½πΏ)
π
= π1οΏ½Μ οΏ½1+β―+ππΏοΏ½Μ οΏ½πΏ
π=
π1+β―+ ππΏ
π=
π
π= οΏ½Μ οΏ½
Jadi οΏ½Μ οΏ½π π‘ merupakan penaksir tak bias untuk οΏ½Μ οΏ½.
25
Informasi mengenai π1πππ π2 dibutuhkan untuk menentukan penaksir
οΏ½Μ οΏ½π π‘ karena E(οΏ½Μ οΏ½π π‘) =π
π, π πβπππππ πΈ (ποΏ½Μ οΏ½π π‘) = π. Pada penjabaran di atas sudah
diketahui taksiran dari rata-rata populasi sehingga akan diperoleh persamaan
berikut:
ποΏ½Μ οΏ½π π‘ = β πβοΏ½Μ οΏ½β
πΏ
β
= οΏ½ΜοΏ½π π‘
Ini artinya, penaksir οΏ½ΜοΏ½π π‘ juga merupakan penaksir tak bias untuk π karena dapat
ditunjukkan bahwa πΈ(οΏ½ΜοΏ½π π‘) = π
3.2.3 Varians Penaksir Total Populasi dan Penaksirnya
Varians dari stXΜ diperoleh dengan menggunakan hasil dari varians stx .
Sebelum membahas mengenai varians untuk penaksir total populasi, akan
dijelaskan terlebih dahulu mengenai varians untuk rata-rata sampel.
Variansi dari οΏ½Μ οΏ½π π‘didefinisikan oleh:
ποΏ½Μ οΏ½π π‘
2 =1
πβ (οΏ½Μ οΏ½π π‘ β οΏ½Μ οΏ½)2
π
π π‘=1
M adalah banyaknya kemungkinan rata-rata sampel, dimana π = (π1
π1) (
π2
π2).
Selanjutnya akan dicari π(οΏ½Μ οΏ½π π‘) dalam bentuk varians stratum π2β yang dapat
menunjukkan karakteristik dari π(οΏ½Μ οΏ½π π‘). π2β didefinisikan sebagai berikut:
πβ2 =
1
πβ β 1 β(πβπ β οΏ½Μ οΏ½β)2
πΏ
β=1
(3.3)
Ketika populasi dan sampel cukup besar, maka kemungkinan rata-rata
sampel M akan semakin besar sehingga dalam menghitung π(οΏ½Μ οΏ½π π‘) menggunakan
definisi ποΏ½Μ οΏ½π π‘
2 akan sulit. Selanjutnya akan ditunjukkan bagaimana π(οΏ½Μ οΏ½π π‘) dapat
dijelaskan dalam bentuk πβ2.
Diketahui,
οΏ½Μ οΏ½π π‘ = π1οΏ½Μ οΏ½1 + π2οΏ½Μ οΏ½2
π= π€1οΏ½Μ οΏ½1 + π€2οΏ½Μ οΏ½2
26
dimana π€β =πβ
π, dan disebut stratum weight (bobot). Selama πβ dipilih dengan
sampling acak dan saling bebas antara satu dengan yang lainnya, maka diperoleh:
V(οΏ½Μ οΏ½π π‘) = π€12π(οΏ½Μ οΏ½1) + π€2
2V(οΏ½Μ οΏ½2)
Berdasarkan definisi varians untuk rata-rata sampel yang dipilih secara acak dan
tanpa pengembalian, yaitu ποΏ½Μ οΏ½2 =
πβπ
π
π2
π , maka persamaan di atas dapat diubah
menjadi sebagai berikut:
V(οΏ½Μ οΏ½π π‘) = π€12π(οΏ½Μ οΏ½1) + π€2
2V(οΏ½Μ οΏ½2)
= w12
N1 β n1
N1
S12
n1+ w2
2N2 β n2
N2
S22
n2
= β (πβ
π)
2 πββπβ
πβ
πβ2
πβ
πΏβ=1
Persamaan di atas dapat dituliskan kembali dalam bentuk:
π(οΏ½Μ οΏ½π π‘) =1
π2β πβ
2 πββπβ
πβ
πβ2
πβ (3.4)
πβ2 menunjukkan varians dalam masing-masing stratum. Jadi dapat
disimpulkan bahwa ketika varians dalam masing-masing stratum kecil, maka
V(οΏ½Μ οΏ½π π‘) akan kecil dan ketelitian dari οΏ½Μ οΏ½π π‘ akan tinggi.
Karena rumusan dari V(οΏ½Μ οΏ½π π‘) memuat πβ2, maka tidak dapat digunakan pada
masalah praktis dimana πβ2
biasanya tidak diketahui. Oleh karena itu, dibutuhkan
penkasir untuk πβ2 dan diperoleh penkasir untuk V(οΏ½Μ οΏ½π π‘). Karena π β
2 adalah sebuah
penaksir tak bias dari πβ2 maka selanjutnya akan disubtitusikan π β
2 kedalam
persamaan (3.4). Dimana, οΏ½ΜοΏ½(οΏ½Μ οΏ½π π‘) merupakan penaksir tak bias untuk V(οΏ½Μ οΏ½π π‘).
οΏ½ΜοΏ½(οΏ½Μ οΏ½π π‘) =1
π2β πβ
2 πββπβ
πβ
π β2
πβ
Setelah diperoleh varians οΏ½Μ οΏ½π π‘ selanjutnya akan dibahas mengenai varians
dari penaksir total populasi, yaitu sebagai berikut:
27
Varians dari stXΜ adalah:
V(οΏ½ΜοΏ½st) = V (N οΏ½Μ οΏ½st )
= N2 V(οΏ½Μ οΏ½st)
= N2 ( 2
2
2
1 h h hh
h h
N n SN
N N n
)
= 2
2 h h hh
h h
N n SN
N n
Ini artinya π(οΏ½ΜοΏ½st) sama dengan π(οΏ½Μ οΏ½st) dengan syarat 2
1
Ndihilangkan.
Estimator π(οΏ½ΜοΏ½st) diperoleh untuk mendapatkan penaksir π(οΏ½Μ οΏ½st), yaitu
dengan cara mengganti 2
hS menjadi 2
hs . Oleh karena itu, estimatornya adalah:
οΏ½ΜοΏ½(οΏ½ΜοΏ½st) = β πβ2
πβ β πβ
πβ
πβ2
πβ (3.5)
πΏ
β=1
Dimana,
hn
hhi
h
h xxn
s 22 )(1
1
Dengan menggunakan hasil )(ΛstxV yang merupakan penaksir tak bias dari
)( stxV , kita dengan mudah dapat menunjukkan )Λ(ΛstXV merupakan penaksir tak
bias dari )Λ( stXV . Diketahui bahwa:
)()](Λ[ stst xVxVE
Dimana NXx stst /Λ . Substitusikan stx ke kedua ruas persamaan di atas, maka
diperoleh:
)Λ(1
)Λ(Λ122 stst XV
NXV
NE
Maka diperoleh:
)Λ()]Λ(Λ[ stst XVXVE
28
3.3 Alokasi Sampel
Alokasi sampel merupakan suatu metode untuk menentukan ukuran
sampel dari setiap stratum untuk didistribusikan kedalam sampel n. Ada dua
masalah yang perlu dipertimbangkan oleh peneliti, yaitu menentukan ukuran
sampel n dan mengalokasikan sampel ini diantara strata h untuk menentukan nh.
Terdapat beberapa metode yang dapat digunakan dalam mengalokasikan sampel
dari setiap strata yaitu sebagai berikut:
3.3.1 Alokasi Sembarang
Alokasi sembarang merupakan suatu cara mengalokasikan sampel dimana
ukuran sampel masing-masing strata ditentukan secara sembarang dengan syarat,
minimal harus ada dua satuan pengamatan yang dipilih dari setiap stratanya.
Dalam praktek, alokasi seperti ini jarang dan tidak disarankan untuk digunakan
karena menyebabkan standar error membesar.
3.3.2 Alokasi Proporsional
Alokasi proporsional merupakan suatu metode untuk mengalokasikan
sampel dimana ukuran sampel untuk setiap stratum sesuai dengan proporsi ukuran
masing-masing stratum. Metode ini paling sering digunakan karena praktis dan
jelas, tidak bergantung pada pertimbangan biaya dan peneliti hanya perlu
mengetahui ukuran stratum. Metode alokasi proporsional bersifat sederhana dan
lebih mudah bila dibandingkan dengan metode lainnya dengan tingkat ketepatan
yang tidak berbeda jauh dengan metode lainnya.
Berikut rumus yang digunakan untuk mengalokasikan sampel secara
proporsional:
πβ =πβ
π. π
29
Dimana πβ merupakan ukuran sampel dari setiap strata, dan rumus di atas
menunjukkan bahwa n harus dialokasikan sesuai dengan NNh (secara
proporsional). Pengambilan sampel dilakukan secara acak sederhana di setiap
strata, sehingga peluang dari setiap unit sampling di strata h untuk terpilih
sebagai subsampel hn yaitu fN
n
h
h . Setiap unit dalam populasi mempunyai
peluang yang sama untuk terpilih sebagai sampel.
4. Alokasi Optimum
Dalam penarikan sampel stratifikasi, nilai dari ukuran sampel nh dalam
masing-masing strata dipilih oleh peneliti. Dalam melakukan penelitan, peneliti
akan dihadapi oleh dua kemungkinan dalam mempertimbangkan biaya penelitian
atau memperkecil error dalam tahap penarikan sampel, yaitu peneliti mungkin
memilih untuk meminimumkan π(οΏ½Μ οΏ½π π‘) dengan biaya tertentu untuk memperoleh
sampel atau untuk meminimumkan biaya dengan sebuah nilai π(οΏ½Μ οΏ½π π‘) tertentu.
Metode untuk mengalokasikan sampel n diantara strata untuk meminimalkan
_
( )stV x disebut alokasi optimum. Berikut ini adalah bentuk sederhana dari fungsi
biaya, yaitu:
Biaya = 0
L
h hc c c n
Biaya dalam setiap lapisan adalah proposional dengan ukuran sampel, tetapi biaya
perunit ch dapat bervariasi antara lapisan satu dengan lapisan lainnya.
Biaya overhead dinyatakan dengan c0, fungsi biaya ini adalah fixed cost
(ongkos tetap) bila sebagian besar biaya itemnya diperoleh dengan mengukur
setiap unit dan tidak bergantung pada ukuran dari sampel survey. ch merupakan
variable cost dan menunjukkan ongkos tiap unit sampel pada stratum ke h.
Dalam penarikan sampel acak stratifikasi dengan sebuah fungi biaya
seperti di atas, variansi perkiraan rata-rata stx
adalah minimum untuk biaya
tertentu C, dan biaya adalah minimum untuk π(οΏ½Μ οΏ½π π‘) tertentu.
Diketahui rumus variansi sebagai berikut:
30
2_2
2
1( )
Lh h h
st h
h h
N n SV x N
N N n
Masalah yang dihadapi adalah bagaimana memilih nh agar
meminimumkan _
( )stV x dengan biaya tertentu (dengan fungsi biaya linear).
Perumusan untuk menentukan besarnya sampel dari setiap stratum agar
meminimumkan _
( )stV x adalah sebagai berikut:
/
/
h h h
h L
h h h
N S cn n
N S c
5. Alokasi Neyman
Alokasi Neyman digunakan apabila varians setiap strata berbeda-beda
besarnya sedangkan ongkos per unit penarikan sampel dianggap relatif sama.
Rumus ukuran sampel pada setiap strata untuk alokasi Neyman adalah sebagai
berikut:
πβ =πβπβ
β πβπβπΏβ=πΌ
π
Perumusan di atas menunjukkan bahwa sampel berukuran π dialokasikan secara
proporsi ke πβπβ.
Alokasi Neyman dipergunakan juga ketika strata besar dan dari strata yang
heterogen. Sebagai contoh jika sebuah kota dibagi dalam dua wilayah dan dalam
wilayah satu terdapat sedikit perbedaan antara pendapatan keluarga, sedangkan di
wilayah kedua terdapat variasi yang besar. Dengan rumus alokasi Neyman
tersebut dapat diambil sampel wilayah kedua. Jelas bahwa distrik dengan varians
yang besar dan sampel yang besar akan memeberikan sampel yang tidak
representatif.
31
32
33