sampling with probability proportional to size (pps

26
SAMPLING WITH PROBABILITY PROPORTIONAL TO SIZE (PPS SAMPLING) Contact: [email protected] A. Definisi PPS Sampling adalah suatu metode pengambilan sampel dari sebuah populasi dimana peluang terpilihnya setiap unit sampel sebanding dengan ukuran. Ukuran tersebut adalah informasi tambahan yang dimiliki oleh setiap unit sampel yang dijadikan sebagai dasar pertimbangan dalam penarikan sampel sehingga dapat diperoleh estimator-estimator yang lebih efisien. Informasi tambahan (ukuran) yang berguna untuk dijadikan dasar pertimbangan penarikan sampel adalah inform,asi yang mempunyai korelasi yang kuat dengan variabel-variabel yang akan diteliti. B. Keuntungan Keuntungan yang dapat diperoleh dari PPS Sampling, yaitu: 1. Akan diperoleh estimator yang unbiased terhadap populasi.

Upload: irdiena-izza-ell-milla

Post on 15-Jun-2015

978 views

Category:

Documents


49 download

TRANSCRIPT

Page 1: Sampling With Probability Proportional to Size (Pps

SAMPLING WITH PROBABILITY PROPORTIONAL TO SIZE

(PPS SAMPLING)

Contact: [email protected]

A. Definisi

PPS Sampling adalah suatu metode pengambilan sampel dari sebuah

populasi dimana peluang terpilihnya setiap unit sampel sebanding dengan ukuran.

Ukuran tersebut adalah informasi tambahan yang dimiliki oleh setiap unit sampel

yang dijadikan sebagai dasar pertimbangan dalam penarikan sampel sehingga

dapat diperoleh estimator-estimator yang lebih efisien.

Informasi tambahan (ukuran) yang berguna untuk dijadikan dasar

pertimbangan penarikan sampel adalah inform,asi yang mempunyai korelasi yang

kuat dengan variabel-variabel yang akan diteliti.

B. Keuntungan

Keuntungan yang dapat diperoleh dari PPS Sampling, yaitu:

1. Akan diperoleh estimator yang unbiased terhadap populasi.

2. Dapat memberikan estimator-astimator yang lebih sederhana.

3. Mempunyai akurasi yang lebih tinggi dibandingkan metode-metode

lain.

C. Kerugian

1. Pemilihan sampel dengan menggunakan prosedur With Out

Replacement (WOR) lebih sulit dilakukan.

D. Kondisi Penggunaan

PPS Sampling digunakan pada saat setiap unit sampel dalam populasi

memiliki ukuran yang bervariasi sehingga peluang terpilihnya sampel tidak sama.

Page 2: Sampling With Probability Proportional to Size (Pps

Semakin besar ukuran suatu unit sampel, maka semakin besar pula peluang

terpilihnya unit sampel tersebut. Selain itu, penggunaan PPS Sampling harus

memperhatikan ada tidakanya hubungan yang kuat antara informasi tambahan

(ukuran) yang dimiliki oleh setiap unit sampel dengan variabel-variabel yang ingin

diteliti.

E. Kasus Penggunaan

Variabel yang Diteliti Informasi Tambahan (Ukuran)

Rata-rata pengeluaran pulsa

per bulan

Jumlah handphone yang

dimiliki

Jumlah produksi sebuah

pabrik

Jumlah pekerja yang dimiliki

Rata-rata indeks prestasi

mahasiswa

Lamanya jam belajar

F. Pemilihan Sampel Dari Suatu Daftar (LIST)1. Metode Kumulatif

membuat frekuensi kumulatif dari ukuran yang dijadikan dasar penarikan sampel untuk seluruh unit dalam populasi (jumlah kumulatif dari ukuran auxiliary information) untuk seluruh unit dalam populasi.

Mengambil suatu angka random dari 1 sampai Z

Bila ∑i−1

zi< AR<¿∑i

zi¿ , maka unit ke-i terpilih, bila kondisi tidak

terpenuhi, maka kembali ke langkah ke 2 Mengulangi langkah ke-2 hingga n unit sampel terpilih

Kelemahan dari prosedur ini adalah dalam melakukan perhitungan akumulasi secara total (frekuensi kumulatif total) akan menghabiskan banyak waktu dan biaya yang lebih bila populasi berukuran besar.

Contoh :

Page 3: Sampling With Probability Proportional to Size (Pps

- Suatu desa memiliki 10 buah tanah/ lahan yang terdiri dari 50, 30, 45, 25, 40, 26, 44, 35,28, dan 27 sawah, berturut-turut. Ambil sampel sebanyak 4 buah tanah dengan pengembalian dan dengan metode proporsi peluang sesuai ukuran(PPS), jumlah sawah pada lahan sebagai informasi tambahan.

Jawab :Langkah pertama, dalam menyeleksi lahan adalah membentuk frekuensi

kumulatif, seperti tabel di bawah ini :

No.Sample

Ukuran (x i)

Frekuensi Kumulatif

Selang Ukuran

1. 50 50 1-502. 30 80 51-803. 45 125 81-1254. 25 150 126-1505. 40 190 151-1906. 26 216 191-2167. 44 260 217-2608. 35 295 261-2959. 28 323 296-32310. 27 350 324-350

Untuk memilih sebuah lahan, sebuah angka acak yang kurang dari 350 dipilih dengan bantuan tabel angka random. Misalkan, angka random yang terpilih adalah 272. Kita lihat dimana letak angka tersebut dalam interval selang ukuran. Ternyata, terletak dalam selang 261-295 sehingga lahan ke-8 yang terpilih sebagai sampel karena 272 terletak dalam selang tersebut. Dengan cara yang sama seperti di atas kita akan memilih 3 sampel yang lain. Misalkan, 3 angka lain yang terpilih adalah 346, 165, dan 094 maka lahan yang terpilih sesuai dengan angka random tersebut masing-masing adalah 10, 5, dan 3. Jadi, keempat lahan yang terpilih sebagai sampel yang diambil dengan metode PPS terdiri dari lahan ke 8, 10, 5, dan 3.2. Metode Lahiri

Merupakan metode pps yang paling baik digunakan jika ukuran unit cukup besar.

Tidak seperti kumulatif, metode ini tidak membutuhkan jumlah kumulatif dari ukuran unit sampling dalam populasi. Misalkan saja sampel yang terpilih berukuran n, dari populasi yang berukuran N secara pps dengan pemulihan, dan xi

Page 4: Sampling With Probability Proportional to Size (Pps

adalah ukuran sampel ke-i, maka tahap penarikan sampelnya adalah sebagai berikut:

a. Membangkitkan 2 angka random secara bersama- sama, anggap saja AR dan AR’, dengan AR yang memiliki besar ≤N, sehingga berkenaan dengan nomor urut

unit sampling dalam populasi. AR’ memiliki besar ≤xi maks, yaitu berkenaan dengan ukuran unit yang

digunakan untuk penarikan sampel.b. Bila AR’ ≤xi , maka unit yang dipilih adalah yang ke xi, bila kondisi tidak

terpenuhi, maka 2 AR lain perlu dibangkitkanc. Mengulangi langkah ke-2 hingga tercapai jumlah yang terpilih sebanyak n

Contoh soal:

Suatu desa memiliki 10 buah tanah/ lahan yang terdiri dari 50, 30, 45, 25, 40, 26, 44, 35,28, dan 27 sawah, berturut-turut. Ambil sampel sebanyak 4 buah tanah dengan pengembalian dan dengan metode proporsi peluang sesuai ukuran(PPS), jumlah sawah pada lahan sebagai informasi tambahan. Halaman 2, baris 1, kolom 1

Jawab:

NNo

1 22

33

34

55

66

77

88

99

110

NX

50 330

445

225

440

226

444

335

228

227

dibangkitkan 4 angka random secara serentak, 2 untuk no sampel dan 2 untuk nilai, sampel yang diambil sebagai berikut

NNo

AR No sampel

Nilai Ket

11

0331 3 45 Seluruh angka random yang ditolak tidak ditampilkan

22

0703 7 44

33

0404 4 25

44

1018 10 27

Page 5: Sampling With Probability Proportional to Size (Pps

3. Metode Sistematik

Bila ukuran sampel sebesar n dan X adalah total ukuran, maka interval penarikan sampelnya adalah:

I bilangan bulat (integer), maka gunakan sistematik linearMisalkan R1 adalah merupakan angka random pertama (random start) yang lebih kecil atau sama dengan I , unit-unit yang berpadanan dengan (R1 + j .I), j = 0, 2, 3,…, (n-1), akan terpilih sebagai sampel . Secara umum, unit ke-i terpilih sebagai sampel bila terpenuhi kondisi :

I bukan bilangan bulat, maka gunakan sistematik sirkuler.Dalam sistematik sirkuler, angka random pertama R1 besarnya antara 1 sampai dengan N (tidak harus lebih kecil sama dengan interval).

G.Pemilihan Dari Suatu Peta (MAP)

Prosedur ini dipakai untuk pemilihan unit-unit wilayah geografis dari sebuah peta dengan peluang proporsi terhadap luas (area)Probability Proportional to Area.

Banyak situasi dimana unit populasi berada dalam satu area. Prosedur sistematik sampling untuk situasi ini disebut plane systematic atau two-dimensional systematic sampling. Pengembangan paling sederhana dari sampel sistematik linier menuju systematik sampling dua dimensi dikenal dengan pemetaan persegi (grid square). Ada dua prosedur untuk memilih sampel pada sistematik sampling dua dimensi

Asumsikan populasi terdiri dari N persegi area dengan ukuran sama dan sampel area n akan diambil. Asumsikan wilayah petakan disusun dalam lxm=Nk=K, terbentuk petak petak yang tebentuk dari r baris dan s kolom, cara termudah untuk memilh sampel yaitu:

a. Ambil dua angka random sekaligus (dimana: AR 1= 1≤ r baris/panjang dan AR 2=1≤ s kolom/lebar)

Page 6: Sampling With Probability Proportional to Size (Pps

b. Sepasang angka random terpilih, akan menempatkan titik pada suatu peta. Maka di titik itulah sampel terpilih.

c. Ulangi langkah ke 1 hingga n unit sampel terpilih.

Cara lain:

Wilayah petakan disusun dalam rxl baris dan mxs kolom, membutuhkan sampel berukuran n sebanyak rxs wilayah petakan.

Pilih r angka random independent i1 , …, ir ≤l dan s angka random

independent dengan j1 , …, js ≤ m, wilayah petakan yang masuk dalam sampel

adalah (i¿¿ x+1+ xl , j x+1+ ym)¿dengan x=0,1,...,(r-1) dan y=o,1,...,(s-1). Disebut

unaligned sampel.

H. PPS WOR

PPS WOR dapat memberikan efisiensi yang lebih baik disbanding PPS WR, tetapi metode perhitungan lebih kompleks dan tidak mudah diaplikasikan, efisiensi lebih substansial jika fraksi besar.

I. Estimasi dan Pembuktian

Misalnya populasi dengan ukuran N akan diambil sampel sebanyak n secara

PPS-WR. Jika setiap unit sampel memiliki ukuran sebesar x i, maka probabilita

terpilihnya sampel ke-i adalah:

pi=x i

∑i=1

N

x i

=xi

Xdimana∑

i=1

N

pi=1

Dalam PPS Sampling setiap ukuran dalam unit sampel ke-i memiliki

hubungan atau korelasi dengan variabel yi. Penduga yang tidak bias dari total

adalah

Y i=Xy i

xi

=y i

x i

X

=y i

p i

Bukti:

Page 7: Sampling With Probability Proportional to Size (Pps

E (Y i )=E(∑i=1

N

xi

y i

x i)

¿∑i=1

N

y i=Y

Penduga yang tidak bias bagi total Y adalah

Y PPS=∑i=1

n Y i

n=

1n∑i=1

n y i

pi

=Xn ∑

i=1

n y i

x i

dengan varians

V (Y PPS )=1n∑i=1

N

p i( y i

pi

−Y )Bukti:

Pembuktiannya menggunakan rumus multinomial

n!t1 ! t2 !…tN !

p1t1 p2

t 2… pNt N dimana t 1 , t 2 , …, tN independen

dengan

E (t i )=n pi V ( ti )=p i (1−p i ) Kov (ti t j )=0

Kita dapat menulis

Y PPS=1n ( t1

y1

x1

+t2

y2

x2

+…+tN

y N

xN)=1

n∑i=1

N

ti

y i

p i

E (Y PPS )=E ( 1n∑i=1

N

t i

y i

pi)

Page 8: Sampling With Probability Proportional to Size (Pps

¿ 1n∑i=1

N y i

pi

∙ E (ti )

¿∑i=1

N y i

npi

∙ n pi

¿∑i=1

N

y i=Y

sehingga Y PPS tidak bias. Begitu juga dengan varians

V (Y PPS )=V ( 1n∑i=1

N

t i

y i

p i)

¿ 1

n2 [∑i=1

N

( y i

p i)

2

V (t i )+2∑i=1

N

∑j> i

N y i

pi

y j

p j

Kov (t i t j )]¿ 1

n2 [n∑i=1

N

( y i

p i)

2

pi (1−pi )+2∑i=1

N

∑j>i

N y i

pi

y j

p j

∙ 0]¿ 1

n2 n∑i=1

N

( y i

pi)

2

pi ( 1−pi )

V (Y PPS )=1n∑i=1

N [( y i

pi)

2

p i−( y i

pi)

2

p12]

¿ 1n∑i=1

N ( y i2

p i

− y i2)

V (Y PPS )=1n∑i=1

N ( y i2

p i)−Y 2

¿ 1n∑i=1

N

pi( y i2

pi)−Y 2

Page 9: Sampling With Probability Proportional to Size (Pps

dengan ∑i=1

N

pi=1.

Jadi, V (Y PPS ) tidak bias.

Penduga yang tidak bias bagi V (Y PPS ) adalah

v (Y PPS )= 1n (n−1)∑i=1

n

( y i

x i

−Y PPS)2

Bukti:

∑i=1

n

( y i

x i

−Y PPS)2

=∑i=1

n

( y i

x i

−Y )2

−n (Y PPS−Y )2

selanjutnya

n (n−1 ) v ( Y PPS )=∑i=1

n

( y i

x i

−Y PPS)2

E [n (n−1 ) v (Y PPS) ]=E [∑i=1

n

( y i

xi

−Y )2

−n (Y PPS−Y )2]n (n−1 ) E [ v (Y PPS) ]=E [∑i=1

N

ti( y i

zi

−Y )2]−n V (Y PPS )

n (n−1 ) E [ v (Y PPS) ]=n∑i=1

n

p i( y i

pi

−Y )2

−n V (Y PPS )

¿n ∙n V ( Y PPS )−n V ( Y PPS )

¿n2 V ( Y PPS )−n V (Y PPS )

¿n (n−1 )V (Y PPS )

Page 10: Sampling With Probability Proportional to Size (Pps

E [v ( Y PPS ) ]=V (Y PPS )

dila

Y PPS=1n∑i=1

n y i

p i

pi=x i

X

X=∑i=1

N

x i

Merupakan perkiraan yang tidak bias terhadap Y dengan varians

V (Y PPS)=1n∑i=1

n

pi( y i

p i

−Y )2

Bukti :

Misalkan t i= jumlah waktu ; i= 0, 1, 2, ..., n

Sehingga distribusi frekuensi gabungan dari t i untuk N unit dan populasinya adalah pada saat n dimasukkan ke dalam kotak ke-i adalah pi pada setiap pemasukan, sehingga distribusi gabungan t i adalah rumus multinomial

n!t1 ! t2 !…tN !

p1t1 p2

t 2… pNt N

Sehingga diketahui

E(t i) = n pi

V(t i) = n pi(1−p i)

Cov(t 1 , t 2) = -n pi p j

Sehingga : jika sebuah sampel berukuran n unit diambil dengan probabilita pi, dengan pengembalian maka

Y PPS=1n∑i=1

n y i

p i

Page 11: Sampling With Probability Proportional to Size (Pps

Y PPS=1n ( t1

y1

p1

+t2

y2

p2

+…+tN

y N

pN)=1

n ∑i=1

N

t i

y i

pi

t adalah variabel acak, y i dan pi adalah sekumpulan bilangan tetap

E(t i) = n pi

E(Y PPS)=1n∑i=1

n

npi

y i

pi

=¿∑i=1

n

y i=Y ¿

Sehingga Y PPS tidak bias

V (Y PPS )= 1

n2 ∑i=1

n

V ( y i

pi)= 1

n2 ∑i=1

n {∑j=1

N

(Y j

P j

−Y )2

P j}=1n∑i=1

N

(Y i

P i

−Y )2

Pi=1n∑i=1

N (Y i2

P i2−Y 2)

Nilai Covarians {Cov( y i

pi

,y j

p j)} , jika j ≠ i, akan menjadi 0. Ini menunjukkan

bahwa varians estimator adalah proporti yang berkebalikan dengan ukuran sampel (n) pada SRS WR

Jika sebuah sampel berukuran n unit diambil dengan probabilita proporsional terhadap ukuran, degan pengembalian (WR) :

pi=x i

X dan dengan pengembalian

Y PPS=1n∑i=1

n y i

p i

Y PPS=Xn∑i=1

n

( y i

x i)= X

n∑i=1

n

( yi )=X y

yadalah rata-rata tak tertimbang dari rata-rata unitnya adalah perkiraan yang tak bias dari Y dengan varians

V (Y ¿¿ PPS)= Xn∑i=1

n

xi( y¿¿i−Y )2 ¿¿

Page 12: Sampling With Probability Proportional to Size (Pps

y i=y i

xi

Y= YX

^Y=^Y PPS

X= N

nX∑i=1

n

y i

^Y R=Y R

X=∑i=1

n

y i

∑i=1

n

x i

= rata-rata sampel per elemen

Sehingga, unbiased estimator dari rata-rata populasinya :

Y PPS=yN

= 1n N

∑i=1

n y i

pi

= XnN

∑i=1

n y i

x i

Unbiased estimator V (Y ¿¿ PPS)¿ pada PPS Sampling WR nya adalah :

v (Y PPS )=∑i=1

n

( Y i−Y )2

n (n−1 )= 1

n (n−1 ) ∑i=1

n

( y i

pi

−Y )2

= 1n (n−1 ) [∑i=1

n

( y i

pi)

2

+∑i=1

n

Y PPS2−2Y PPS n Y PPS ]u= 1

n (n−1 )¿

Dan Unbiased estimator V (Y PPS) pada PPS Sampling WR nya adalah :

v ( Y PPS )= 1n (n−1 ) ∑i=1

n

( y i

N p i

−Y PPS)2

= 1n (n−1 )

¿

a. Koefisien relative / relative efficiency

Perbandingan sampling PPS WR dan SRS WR dengan sampel yang sama dapat diketahui. Seperti yang diketahui sebelumnya, varians dari SRS WR adalah

V(Ŷsrs)= N2 s2

n , dimana s2(Ŷ)=N [∑

i

N

y i2−N Y 2]

Page 13: Sampling With Probability Proportional to Size (Pps

Sehingga V (Y srs)=Nn [∑

i

N

y i2−N Y 2]

Sebuah penduga tidak bias dari [∑i

N

y i]adalah , sedangkan salah satu

penduga tidak bias dari N Y 2 adalah [Y pps2 −v (Y pps

2 )], maka

Varians SRS WR berdasarkan sampel PPS WR adalah

v pps (Y srs )= Nn [ 1

n∑

i

n y i2

p i❑− N

nnY 2]

¿N

n2 [∑i

n y i2

pi❑ ]−[Y pps

2 −v (Y pps2 )]

¿N

n2 [∑i

n y i2

pi❑ ]−[Y pps

2 ]+v (Y p ps2 )

¿ 1

n2 [N ∑

i

n y i2

p i

−nY pps2 ]+ 1

nv (Y pps )

Sehingga relative efficiency atau design effect adalah

RE¿v (Y ¿¿ pps)

v pps (Y pps )× 100 %¿

b. Estimasi terurut Des Raj

Z1 =

y i

p i dan z2 = y1 + y2

(1−p2 )p3

ŶORD =

12

(z1+z2 )=12 [ y1

(1+ p1 )p1

+ y2

(1−p1)p2

]Teorema 1.1

Page 14: Sampling With Probability Proportional to Size (Pps

Dalam pps sampling WOR, estimator ŶORD adalah estimator tak bias dan

varian sampling diberikan oleh

V(ŶORD) =

Bukti :

E(z1) = ∑ ( y i

p i) p i=∑ y i=Y

E2 [ y2

(1−p1)p2

y1 ] = ∑ y j

(1−pi )p j

p j

(1−pi )

E2 [ y2

(1−p1)p2

y1 ] = Y – y1

E(z2) = E1E2 (z2|y1) = y1+ Y – y1 = Y

E(ŶORD) = Y

V(z1) =

V(z2) = E1V2 (z2) + V1E2(z2)

E2(z2) = Y , V1E2 (z2) = 0

V(z2) =

Page 15: Sampling With Probability Proportional to Size (Pps

Sehingga varian dari ŶORD adalah:

V(ŶORD) =

Dan estimator tidak bias dari V(ŶORD) adalah :

V(ŶORD) =

Teorema 1.2

Dalam pps sampling WOR, estimator ŶORD adalah estimator tak bias dari

total populasi Y dan variasi samplingnya yang diberikan oleh

Dimana rij (k ) adalah peluang bahwa y i dan y j tidak termasuk dalam deret.

Bukti Telah diketahui bahwa E ( zi )=Y

Dan

E ( zi¿ y1 , y2, …, y i−1 )=Y , i=2 , …, n

Karenanya E ( zi )=Y untuk i=2 , …, n

Mengikuti bahwa Y D=z=∑i

n

zi /n adalah sebuah estimator tak bias.

Selanjutnya, untuk memperoleh varian sampling kita dapat melihat bahwa

E ( zi z j )=Y 2, yang mana menunjukkan bahwa z i dan z j tidak berkorelasi.

Page 16: Sampling With Probability Proportional to Size (Pps

Karenanya, dengan perlakuan yang serupa, dapat diperoleh hasilnya. Untuk lebih

mendetailnya, pembahasan ini ditujukan pada Des Raj (1966). Meskipun

perhitungan untuk V (Y ORD ) agak kompleks, namun dapat dimodifikasi menjadi

bentuk yang lebih sederhana seperti berikut

V (Y ORD )=V (∑i

n z i

n )= 1n2 ∑

i

n

V ( zi )

Dan estimasi tidak bias dari V(ŶORD) bisa ditulis :

c. Penduga Tidak Terurut Horvitz-Thompson

Sebuah sampel penduga berukuran n unit dipilih tanpa pengembalian

dengan beberapa metode. Misalkan

π i=probabilita bahwa unit ke-i ada dalam sampel

πij=probabilita bahwa unit ke-i dank e-j keduanya berada dalam sampel

hubungan berikut terpenuhi :

∑i

N

π i=n

∑j≠i

N

π ij=(n−1) π i ∑i

N

∑j>i

π ij=12

n(n−1)(1.1)

Untuk membentuk hubungan kedua, misalkan P(s) menyatakan probabilita

dari sebuah sampel yang terdiri atas n unit tertentu. Maka πij = ∑ P (s )seluruh

sampel yang terdiri atas unit ke-i dan unit ke-j, serta πi = ∑ P (s )seluruh sampel

yang terdiri atas unit ke-i. Bila kita mengambil ∑ π ij untuk j≠i, setiap P(s) untuk

Page 17: Sampling With Probability Proportional to Size (Pps

sebuah sampel yang terdiri atas unit ke-i dihitung (n-1) kali pada jumlahnya,

karena ada (n-1) nilai lainnya dari j dalam sampel. Ini membuktikan hubungan

yang kedua. Hubungan ketiga mengikuti hubungan kedua.

Penduga Horvitz dan Thompson (1952) tentang jumlah populasi adalah:

ŶHT = ∑

i

n y i

π i (1.2)

Dimana yi adalah pengukuran untuk unit ke-i.

Teorema :

Jika πi>0,(i=1,2,….,N)

ŶHT = ∑

i

n y i

π i

Adalah sebuah penduga tidak bias dari Y, dengan varians

V(ŶHT) = (1.3)

Dimana πij adalah probabilita bahwa unit ke-i dan ke-j berada dalam sampel.

Bukti :

Misalkan ti (i = 1,2,….,N) merupakan sebuah variable acak yang

mempunyai nilai 1 jika unit ke-i diambil dan bernilai nol untuk lainnya. Maka ti

mengikuti distribusi binomial untuk sebuah sampel berukuran 1, dengan

probabilita πi . maka ,

E(ti) = πi

V(ti) = πi (1- πi)

Page 18: Sampling With Probability Proportional to Size (Pps

Nilai kovarians (titj) juga di gunakan. Karena titj adalah 1 hanya jika kedua

unit mencul dalam sampel,

Kov (titj) = E(titj) – E(ti)E(tj) = πij - πi πj (1.4)

Karena yi tetap dan ti sebagai variable acak,

E(ŶHT) = E (∑

i=1

N t i yi

π i)=∑

i−1

N

yi=Y

V(ŶHT) = ∑

i

N

( y i

π i)2

V ( t i )+2∑i

N

∑j>i

N y i

π i

y j

π j

Kov ( ti t j)

= ∑i=1

N (1−π i)π i

yi2+2∑

i=1

N

∑j>i

N ( π ij−π i π j)π i π j

y i y j(1.5)

Ini membuktikan teorema.

Varians di atas dapat dinyatakan dalam bentuk lain dengan menggunaka dua

hubungan pertama. Ini memberikan

Dengan menggantikan (1- πi) pada suku pertama dalam (1.5)

V(ŶHT) =

= (1.6)

∑j≠i

(π ij−π i π j)=(n−1)π i−π j(n−π i)=−π i(1−π i )

Page 19: Sampling With Probability Proportional to Size (Pps

Kesimpulan: Dari (1.5), dengan menggunakan metode ti , sebuah penduga

sampel yang tidak bias dari V(ŶHT) terlihat menjadi.

V1(ŶHT)= = ∑i=1

n (1−π i)π

i2

yi2+2∑

i=1

n

∑j>i

n ( π ij−π i π j)π i π j π ij

y i y j

Membuktikan bahwa tidak satu pun dari πij dalam populasinya yang hilang.

Sebuah penduga sampel yang berbeda telah di berikan oleh Yates dan

Grundy (1953) dan oleh Sen (1953). Dari (1.6), penduga ini adalah

V2(ŶHT) = ∑

i

n

∑j>i

n (π i π j−π ij )π ij

( yi

π i

−y j

π j)

2

Dengan batasan yang sama pada πij ,

Karena suku (πi πj - πij) sering bervariasi secara besar dan kadang-kadang

negatif, v1dan v2 cenderung menjadi tidak stabil. Kedua penduga dapat mempunyai

nilai negatif untuk bberapa metode pemilihan sampel. Rao dan Singh (1973)

membandingkan koefisien variasi v1dan v2 dengan sampel n=2 sampel 34 dari

populasi alamiah kecil yang didapat dalam buku-buku dan majalah sampel survey,

dengan menggunakan metode pemilihan sampel Brewer, untuk πi = 2zi seperti yang

diiinginkan. Penduga v2 dianggap lebih stabil dan selalu ≥ 0 untuk metode ini,

sedangkan vi seringkali mempunyai nilai negative.

d. PPS Stratified

Ph i=Xh i

∑ Xh i

ph i=xh i

∑ xh i

Page 20: Sampling With Probability Proportional to Size (Pps

Asumsikan sampel nh diambil dari Nh unit terhadap strata ke h dengan pps

wr, ukurannya adalah x. Dimana Y h i dan Ph i=Xh i

Xh suatu nilai, dan probability

pemilihan i unit pada strata ke h dan yh idan ph i adalah sampel maka estimator unbiased bagi Y adalah:

Y PPS=∑h

L

Y h=∑h=1

L1nh∑i=1

nh yhi

phi

=∑h=1

L Xh

nh∑i=1

nh yh i

xh i

Dengan

v (Y PPS )=∑h=1

L

( Y h i−Y h )2

n ( n−1 )= 1

n (n−1 )∑h=1

L

( yh i

ph i

−Y h)2

= 1n (n−1 ) [∑h=1

L

( yh i

ph i)

2

+∑i=1

n

Y h2−2 Y h n Y h]= 1

n (n−1 ) [∑h=1

L

( yh i

p h i)

2

+nY h2−2Y hn Y h]= 1

n ( n−1 ) [∑h=1

L

( yh i

p hi)

2

+n Y h2−2n Y h

2]= 1n (n−1 ) [∑h=1

L

( yhi

phi)

2

−n Y h2]

Dan

Y PPS=Y PPS

∑h

L

N h

=∑

h

L Xh

nh∑

i

nh yh i

xh i

∑h

L

Nh

=∑h

L Xh

nh∑

i

nh yh i

xh i

.1

∑h

L

Nh

=∑h

L Xh

nh Nh∑

i

nh yh i

xhi

Stratifikasi menjadi strata efektif apabila diambil dari strata yang unit dari

masing-masing strata yang homogen, yang bersesuaian dengan variabel yh i

xh i atau

Y h i

Xh i

dan tidak bersesuaian dengan variabel y dan x yang diambil terpisah. Karena

nilai Y h itidak mungkin tersedia dalam praktek maka sangat penting untuk menggunakan pada nlai rasio pada periode sebelumnya atau nilai dari karakteristik yang berhubungan dengan tujuan stratifikasi.

Sumber:

Murthy

Daroga singh:

Cochran

Page 21: Sampling With Probability Proportional to Size (Pps

www.iccid.org/.../survey-sites.pdf

www.amstat.org/.../JSM2002-000704.pdf