himpunan semua objek yang
menjadi minat pengambilan
kesimpulan
himpunan bagian dari populasi
melakukan pengamatan terhadap seluruh populasi seringkali
tidak mungkin dilakukan ketika akan membuat kesimpulan,
mengapa?
population sample
sumber daya
terbatas waktu yang
tersedia terbatas
pengamatan kadang
bersifat merusah
mustahil mengamati
seluruh anggota populasi
1 2
3 4
bagaimana caranya dengan menggunakan data contoh
kita dapat mengambil kesimpulan terhadap populasi?
INI YANG KITA PELAJARI
data populasi parameterolah/analisis
data contoh statistikolah/analisis
Parameter tidak pernah diketahui, yang kita ketahui adalah
statistik. Statistik merupakan penduga bagi parameter.
Penduga bagi suatu parameter , dilambangkan
Sifat yang diinginkan dari suatu penduga parameter adalah:
1. Tak Bias (unbiased)
2. Ragam penduga, , kecil
ˆE
Var
Unsur (element)
Populasi (population)
Satuan penarikan contoh
(sampling units)
Kerangka (frame)
Contoh (sample)
An object on which a
measurement is taken
A collection of elements about which
we wish to make an inference
Nonoverlapping collections of element
from the population that cover entire
population
A list of sampling units
A collection of sampling units
drawn from a frame(s)
1
2
3
4
5
Penarikan Contoh Berpeluang
(Probability Sampling)
Penarikan Contoh Tak-Berpeluang
(Non-Probability Sampling)
• simple random sampling
• cluster random sampling
• systematic random sampling
• stratified random sampling
• quota sampling
• purpossive sampling
• snowball sampling
• voluntary sampling
Sampling Error : kesalahan yang ditimbulkan karena kita hanya
mengamati sebagian saja (contoh), tidak semuanya (populasi).
Dapat dikontrol dengan secara hati-hati mendesain penarikan
contohnya.
Non-Sampling Error : kesalahan yang ditimbulkan karena sebab
lain pada proses survei, dan lebih sulit dikendalikan.
Non-Response
Inaccurate
response
Bias selection
Pergi!!! saya tidak
mau diganggu
Iya, saya tidak ahli
memasak
Anak saya tidak ada
di rumah, saya saja
yang mengisi
kuesioner itu
Dishonest
Interviewer
Human error and
resources quality
Daripada capek cari
responden, aku berburu
saja. Nanti kuesioner
aku isi sendiri
Memperbesar ukuran contoh
(sample size)tapi cara ini dapat meningkatkan non-sampling error
non-sampling error
sampling error
Sample size
Jika sebuah contoh berukuran n diambil dari suatu populasi
sedemikian rupa sehingga setiap contoh berukuran n yang mungkin
memiliki peluang sama untuk terambil, maka prosedur itu
dinamakan penarikan contoh acak sederhana. Contoh tersebut
dinamakan contoh acak sederhana.
Definisi di atas berimplikasi bahwa setiap objek memiliki peluang
yang sama untuk terambil. Namun konsekuensi ini bukan definisi
dari penarikan contoh acak sederhana.
Pengambilan contoh acak sederhana pada ukuran populasi yang
sedikit dapat saja dilakukan seperti pengundian ‘lotere’ atau
‘arisan’. Yaitu menuliskan nomor atau identitas lain dari setiap
anggota populasi di selembar kertas, kemudian mengambil dengan
mata tertutup n buah kertas. objek sebanyak n dengan identitas
sesuai pada kertas terpilih adalah contoh yang diperoleh.
Untuk populasi yang lebih besar, dapat digunakan bantuan bilangan
acak yang bisa diperoleh dari tabel bilangan acak atau komputer.
Beri nomor setiap objek: 1, 2, …, N
Ambil bilangan acak dari tabel atau bangkitkan menggunakan
komputer.
Sekat-sekat bilangan acak sesuai dengan banyaknya digit N, dan
buat aturan sehingga setiap objek diwakili oleh bilangan yang sama
banyak.
Tentukan nomor objek yang terpilih
Misalkan populasi memiliki 4000 anggota, dan ingin diambil contoh
berukuran 10. Bilangan 4 digit digunakan untuk menentukan objek
yang terpilih.
0001 objek nomor 1
0002 objek nomor 2
…
4000 objek nomor 4000
4001 objek nomor 1
4002 objek nomor 2
…
8000 objek nomor 4000
8001, 8002, …, 0000 tidak digunakan
Misalkan dari tabel bilangan acak (baris 26 kolom 2, Scheaffer et al)
diperoleh:
72295048399642324878826516656614778767971478013300870747966695
72529676
7229 5048
3996 4232
4878 8265
1665 6614
7787 6797
1478
3229 1048
3996 232
878 -----
1665 2614
3787 2797
1478
jika N >>> n, maka
n
syV
2
)(ˆ
karena 22
1)(
N
NsE maka
N
nN
n
syV
2
)(ˆ
dengan
1
)(1
2
2
n
yys
n
ii
Objek Jumlah Uang
Y1 33.5
Y2 32.0
Y3 52.0
Y4 43.0
Y5 40.0
Y6 41.0
Y7 45.0
Y8 42.5
Y9 39.0
Dugalah μ, rata-ratajumlah uang dan hitungbound of error padapenduga tersebut
89.409
368
9
9
1 i
iy
y
Untuk mencari bound of error dari penduganya, kita terlebih dahulu
harus menghitung s2
67,359
36850,332.15
8
1
8
9
1
2
29
1
9
1
29
1
2
2
i
i
i
i
i
i yy
n
yy
s
94.3484
9484
9
67,3522ˆ2
2
N
nN
n
syV
Dugaan μ
bound of error pada penduga μ
= N=750(10.31)=7732,5
Jadi total jam kerja yang tidak efektif dalam satu minggu sebanyak 7732.5 jam
jamN
nN
n
sNyNVV 4.307
750
50750
50
25.275022)(2)ˆ(ˆ2
22
2
Kesalahan pendugaan kurang dari 307,4 jam
Tentukan dulu nilai bound on the error estimation,
misalkan sebesar B
ByVz )(ˆ
2
2
2
2
2
)1(
z
BN
Nn
Nilai 2 ditentukan berdasarkan
informasi awal, atau melakukan
survei pendahuluan terlebih dahulu
62525254
1004
22 danrange
Sebelumnya kita harus menduga ragam populasi (σ2) terlebih dahulu
56,217
6252
3)999(
)625(1000
)1(2
22
2
2
2
z
BN
Nn
Jadi kita perlu mengambil contoh sebanyak 218 rekening.
contohukuran
Ya"" menjawab yang banyaknyaˆ p
Jika “Ya” dilambangkan 1, dan “tidak” dengan 0, maka
yp ˆ
N
nN
n
pppV
1
)ˆ1(ˆ)ˆ(ˆ
Mahasiswa y
1 1
2 0
.
.
.
100 1
Total 15
proporsi mahasiswa tingkat akhir yang berencana melanjutkan studi
bound of error
15,0100
15ˆ yp
059.0300
100300
99
)85,0(15,02
1
)ˆ1(ˆ2)ˆ(ˆ2
N
nN
n
pppV
Contoh acak berlapis didapatkan dengan cara membagi populasi
menjadi beberapa kelompok yang tidak saling tumpang tindih,
dan kemudian mengambil secara acak dari setiap kelompok-
kelompok itu. Kelompok tersebut dinamakan LAPISAN atau
STRATA.
Karena tujuan dari penarikan contoh adalah mendapatkan
contoh yang mewakili (representative) populasi, maka sifat
lapisan adalah:
perbedaan objek antar lapisan tinggi, sedangkan dalam lapisan
rendah.
Dengan kata lain, populasi disekat-sekat sehingga di setiap
sekatan, objek memiliki karakteristik yang mirip.
Menggunakan PCAB, akan memastikan bahwa contoh yang kita
dapatkan terdiri atas berbagai kelompok. Jaminan ini tidak
diberikan oleh PCAS. Misalnya saja, jika kita ingin mengambil
contoh dari suatu kelas mahasiswa sebanyak 10 orang.
Andaikan kita pisahkan terlebih dahulu berdasarkan jenis
kelamin, kemudian secara acak kita ambil 5 orang dari
kelompok perempuan dan 5 orang dari yang laki-laki, maka 10
orang yang diperoleh akan mewakili kedua jenis kelamin.
Dengan PCAS, ada kemungkinan yang terambil perempuan saja,
atau laki-laki saja. Implikasinya, pendugaan menggunakan
PCAB akan memberikan bound of error yang lebih kecil. Hal
tersebut benar hanya jika kita mampu membuat strata dengan
tepat.
1
PCAB dapat mengurangi biaya survei, jika dibandingkan PCAS.
Pada lokasi survei yang luas, hasil pengacakan menggunakan
PCAS dapat saja terjadi kita harus pergi menyeberang pulau
hanya untuk mendapatkan data dari satu orang responden.
Menggunakan PCAB hal ini bisa diminimalkan.
2
Dengan PCAB dimungkinkan untuk melakukan pendugaan
parameter di setiap sub-populasi, yaitu di setiap lapisan.3
Lapisan adalah kumpulan objek yang memiliki karakteristik yang
sama pada variabel yang ingin diambil datanya. Variabel yang
menyekat populasi menjadi beberapa lapisan adalah variabel
yang memiliki pengaruh atau berhubungan dengan variabel yang
diambil datanya. Misalnya kita ingin menduga rata-rata waktu
yang disediakan oleh mahasiswa untuk menonton televisi dalam
sehari. Jika ada justifikasi yang kuat bahwa antara laki-laki dan
perempuan terdapat perbedaan dalam hal tersebut, maka jenis
kelamin dapat dipilih untuk dijadikan lapisan. Jika tidak
demikian, harus dicari variabel lain. Penyusunan lapisan dapat
dilakukan menggunakan lebih dari satu variabel.
Lapisan 1
N1
Lapisan 2
N2
Lapisan 3
N3
Contoh acak
Sederhana
n1
Contoh acak
Sederhana
n2
Contoh acak
Sederhana
n3
L
iiiLLst
yNN
yNyNyNN
y1
2211
11
L
ii
i
i
ii
istn
s
N
nNN
NyV
1
2
2
2
1)(ˆ
Selang kepercayaan bagi
)(ˆ
2
ststyVty
KOTA A KOTA B KOTA C
35 28 26 41 27 4 49 10 8 15 21 7
43 29 32 37 15 41 25 30 14 30 20 11
36 25 29 31 12 32 34 24
39 38 40 45
28 27 35 34
Tabel 1. waktu menonton televisi (jam/minggu)Dugalah rata-rata jumlahmenonton televisi untuk semuarumah tangga di ketiga kotatersebut dan hitung bound oferrornya
Kota A Kota B Kota C
n 20 8 12
33.900 25.125 19.000
35.358 232.411 87.636
N1 155 62 93
y2
1s
7.271900093251256233900155310
1sty
8.212
636.87871,093
8
411.232871,062
20
358.35871,0155
310
12
12)(ˆ2
222
2
1
22
2
L
i i
i
i
iiist
n
s
N
nNN
NyVB
L
iii
L
iiii
Nz
BN
wNn
1
2
2
2
2
1
22 /
B = bound of error pendugaan rataan populasi
wi = proporsi contoh masing-masing lapisan
L
iiiLLst
pNN
pNpNpNN
p1
2211ˆ
1ˆˆˆ
1ˆ
L
ii
ii
i
ii
istn
pp
N
nNN
NyV
1
2
2 1
)ˆ1(ˆ1)(ˆ
Selang kepercayaan bagi p
)ˆ(ˆˆ2
ststpVzp
Cari informasi besarnya N
Tentukan n, menggunakan formula
contoh acak sederhana
Tentukan k = N/n (bulatkan)
Acak bilangan 1, 2, …, k. Misalkan
diperoleh m (1 m k)
Objek yang terpilih adalah objek ke-m,
ke-(m+k), (m+2k), …, (m+(n-1)k) pada
kerangka penarikan contoh
N dapat diketahui dengan pasti pada kasus tertentu, tapi
pada kasus lain tidak dapat ditentukan sehingga harus
diasumsikan (diduga). Misalnya pada kasus pengunjung
tempat belanja.
n
y
y
n
i
i
sy
1
)1(1)(
2
nn
yV sy
dengan adalah korelasi antar pasangan objek contoh
sistematik dari frame yang sama. Nilai ini tidak dapat
dihitung hanya menggunakan satu contoh sistematik,
sehingga ragam penduga didekati dengan ragam penduga
rataan contoh acak sederhana.
N
nN
n
syV sy
2
)(ˆ
n
y
NyN
n
i
i
sysy
1
)1(1)ˆ(
22 n
nNV sy
dengan adalah korelasi antar pasangan objek contoh
sistematik dari frame yang sama. Nilai ini tidak dapat
dihitung hanya menggunakan satu conth sistematik,
sehingga ragam penduga didekati dengan ragam penduga
rataan contoh acak sederhana.
N
nN
n
sNV sy
22)ˆ(ˆ
Desa Jumlah Wanita (y)
y2
1 82 6724
2 76 5776
3 83 6889
… …
210 84 7056
211 80 6400
212 79 6241
Total 17.066 1.486.800
Dugalah rata-rata jumlah pendudukwanita di propinsi tersebut serta hitungragamnya jika diketahui jumlah populasidesa sebanyak 1484.
5,80212
066.17ˆ 1
n
y
y
n
i
i
sy
16,21484
2121484
212
483,535
)(ˆ2
N
nN
n
syV sy
Contoh Gerombol adalah suatu contoh berpeluang yang satuan
contohnya berupa gerombol (kumpulan elemen)
Penarikan Contoh Gerombol (PCG) adalah penarikan contoh acak
sederhana terhadap satuan contoh yang berupa gerombol
Dalam PCG semua elemen dalam gerombol yang terpilih sebagai
contoh diamati semua
Masalah: Tidak tersedia daftar semua rumahtangga
di kota tsb
Gunakan desa/kelurahan sebagai gerombol, ambil
beberapa desa secara acak, semua rumahtangga di
desa yang terpilih sebagai contoh diamati
Penduga bagi adalah
n
i
i
n
i
i
m
y
y
1
1
Penduga yang baik
bagi V(y) jika n 20
)(ˆ
2
yVty
Selang Kepercayaan bagi
1)( 1
2
2
n
myy
MNn
nNyV
n
i
ii
15125
1
i
im
Jumlah total pemukiman pada 25 blok tersebut:
000.329.125
1
i
iy
Jumlah total pendapatan pada 25 blok tersebut:
Gunakan data tersebut untuk menduga rata-rata pendapatan per kapita dikota tersebut, dan hitung bound of errornya.
8801151
000.329.1
1
1
n
i
i
n
i
i
m
y
y
161724
247.502.227.15
)04,6)(25(415
254152
12)(2
2
1
2
2
n
myy
MNn
nNyVB
n
i
ii
Tentukan dulu nilai bound on the error estimation, misalkan sebesar B
ByVz )(2
2
2
22
2
c
c
z
MBN
Nn
Nilai 2c dan M ditentukan
berdasarkan informasi awal, atau
melakukan survei pendahuluan
terlebih dahulu dengan mengambil
contoh awal berukuran n’
1
1
2
2
n
myy
s
n
i
ii
c
n
i
i
n
i
i
m
a
p
1
1ˆ
1
ˆ
)ˆ(ˆ 1
2
2
n
mpa
MNn
nNpV
n
i
ii
Penduga yang baik bagi V(p) jika n 20
Jika ai = banyaknya yang menjawab Ya dalam gerombol ke-i
mi = banyaknya elemen dalam gerombol ke-i, maka:
dan