analisa data statistik chap 10b: hipotesa testing (proporsi)

35
Analisa Data Statistik Chap 10b: Hipotesa Testing (Proporsi) Agoes Soehianie, Ph.D

Upload: devika

Post on 18-Jan-2016

80 views

Category:

Documents


0 download

DESCRIPTION

Analisa Data Statistik Chap 10b: Hipotesa Testing (Proporsi). Agoes Soehianie, Ph.D. Test Statistik Berkenaan dengan Proporsi 1 Populasi. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Analisa Data Statistik Chap 10b: Hipotesa Testing (Proporsi)

Analisa Data StatistikChap 10b: Hipotesa Testing (Proporsi)

Agoes Soehianie, Ph.D

Page 2: Analisa Data Statistik Chap 10b: Hipotesa Testing (Proporsi)

Test Statistik Berkenaan dengan Proporsi 1 Populasi

Situasi : Dari sampel diketahui proporsi “sukses” adalah p, ingin diketahui apakah proporsi di populasi P. Asumsikan ukuran sampel yg besar dapat dipergunakan aproksimasi distribusi normal. Variabel statistik untuk ditest adalah:

Dengan q=1-p

npq

PpZ

/

Page 3: Analisa Data Statistik Chap 10b: Hipotesa Testing (Proporsi)

Contoh

Sebuah obat hipertensi yg biasa dipakai orang dipercaya efektif 60%. Sampel random 100 penderita hipertensi yg diberi obat jenis baru ternyata 70 orang mengalami perbaikan.Apakah cukup bukti untuk menyatakan bahwa obat baru tsb lebih baik dibandingkan obat yg biasa dipakai? Pergunakan tingkat signifikan 5%.

Page 4: Analisa Data Statistik Chap 10b: Hipotesa Testing (Proporsi)

Solusi

1. H0:p=0.6 dan H1: p > 0.6

2. α = 0.05

3. Daerah kritis (1 ekor, distribusi normal) dengan Z:

`

nilai kritis Z untul α=0.05 adalah z=1.645

Tolak H0 jika Z> 1.645

4. Hitung statistik: diketahui p=0.7, q=1-p=0.3, n=100

5. Keputusan : Tolak H0 sebab Zhitung > 1.645

6. Kesimpulan: Obat baru lebih efektif

npq

pZ

/

6.0

04.2100/3.0*7.0

6.07.0

hitungZ

Page 5: Analisa Data Statistik Chap 10b: Hipotesa Testing (Proporsi)

Solusi

1. H0:p=0.6 dan H1: p > 0.6

2. α = 0.05

3. Daerah kritis (1 ekor, distribusi normal) dengan Z:

`

nilai kritis Z untul α=0.05 adalah z=1.645

Tolak H0 jika Z> 1.645

4. Hitung statistik: diketahui p=0.7, q=1-p=0.3, n=100

5. Keputusan : Tolak H0 sebab Zhitung > 1.645

6. Kesimpulan: Obat baru lebih efektif

npq

pZ

/

6.0

04.2100/3.0*7.0

6.07.0

hitungZ

Page 6: Analisa Data Statistik Chap 10b: Hipotesa Testing (Proporsi)

Test Statistik Berkenaan dengan Proporsi 2 Populasi

Situasi : Dari sampel ukurannya cukup besar yg berasal dari 2 populasi diketahui proporsi “sukses” adalah p1 dan p2, ingin diketahui apakah proporsi di populasi juga sama P1=P2.. Asumsikan ukuran sampel yg besar dapat dipergunakan aproksimasi distribusi normal. Variabel statistik untuk ditest adalah:

Dengan q=1-p. JIka yg diperiksa adalah H0: P1=P2, maka standard deviasi di rumus diatas bisa diperbaiki dg menggunakan Pooled estimate bagi p. Dalam hal ini p1=p2=p dengan p adalah nilai proporsi bersama dari sampel:

Dengan x1 dan x2 adalah banyaknya “sukses”

Di sampel 1 dan 2.

1

11

1

11

2121 )()(

nqp

nqp

PPppZ

21

21

nn

xxp

Page 7: Analisa Data Statistik Chap 10b: Hipotesa Testing (Proporsi)

Test Statistik Berkenaan dengan Proporsi 2 Populasi

Dengan ini maka rumus bagi variabel Z adalah:

21

2121

11

)()(

nnqp

PPppZ

Page 8: Analisa Data Statistik Chap 10b: Hipotesa Testing (Proporsi)

Contoh

Sebuah pabrik kimia akan didirikan di batas kota dekat dengan desa. Sebuah survei dilakukan untuk mengetahui penerimaan penduduk kota dan desa thd rencana pembangunan tsb. Dari sampel random 500 penduduk desa 240 menyetujuinya, sedangkan dari 200 penduduk kota yg disampel sebanyak 120 menyetujuinya. Periksalah apakah persentase penduduk kota yg menyetujui pendirian pabrik tsb lebih besar daripada penduduk desa pada tingkat signifikan 5%.

Page 9: Analisa Data Statistik Chap 10b: Hipotesa Testing (Proporsi)

Solusi

1. H0:P1 = P2 dan H1: P1 > P2 dengan P1 : proporsi penduduk kota yg setuju, dan P2 proporsi pdd desa yg setuju.

2. α = 0.05

3. Daerah kritis (1 ekor, distribusi normal) dengan Z:

`

nilai kritis Z untul α=0.05 adalah z=1.645

Tolak H0 jika Z> 1.645

21

2121

11

)()(

nnqp

PPppZ

Page 10: Analisa Data Statistik Chap 10b: Hipotesa Testing (Proporsi)

Solusi

21

2121

11

)()(

nnqp

PPppZ

4. Perhitungan

Dari sampel diperoleh p1= 120/200=60% ; p2=240/200=48%. Pooled estimate p:

5. Keputusan:

Karena Z > 1.645, maka Ho ditolak

6. Kesimpulan : Persentase pdd kota yg setuju > persentase pdd desa

21

21

nn

xxp

51.0500200

240120

p

9.2

5001

2001

)51.01(*51.0

)0()48.060.0(

Z

Page 11: Analisa Data Statistik Chap 10b: Hipotesa Testing (Proporsi)

Test Statistik Berkenaan dengan Variansi 1 Populasi

Situasi : Dari sampel dengan variansi S2 yg berasal dari populasi normal ingin diperiksa apakah variansi populasinya = σ0

2.

Variabel statistik untuk di test adalah χ2 :

Adalah variable chi-squares dengan derajat kebebasan v=n-1. Sebagai catatan test ini sangat bergantung pada asumsi normalitas penyimpangan dari normalitas berakibat pada ketidak akurasian hasilnya.

20

22 )1(

sn

Page 12: Analisa Data Statistik Chap 10b: Hipotesa Testing (Proporsi)

Soal

Pabrik aki mobil menyatakan bahwa umur akinya memiliki standard deviasinya 0.9 tahun, dan distribusi umur akinya normal. Untuk memeriksa kebenaran klaimnya sampel random 10 aki ditest ternyata standard deviasinya 1.2 tahun. Melihat hasil ini apakah cukup bukti untuk menyatakan bahwa standard devias umur akinya > 0.9 tahun. Periksalah dengan tingkat signifikan 5%

Page 13: Analisa Data Statistik Chap 10b: Hipotesa Testing (Proporsi)

Solusi

1. Hipotesa

H0: σ2 = 0.92 H1: σ2 > 0.92

2. α = 0.05

3. Daerah kritis : Variabel statistik untuk dites adalah:

Dari tabel nilai kritis χ20.05 (v=10-1) = 16.919.

Tolak H0 jika χ2 > 16.919

4. Perhitungan

20

22 )1(

sn

0.169.0

2.1)110(2

22

Page 14: Analisa Data Statistik Chap 10b: Hipotesa Testing (Proporsi)

Solusi

5. Keputusan

Karena χ2 < 16.919 maka H0 tidak bisa ditolak pada tingkat signifikan 5%. Sebenarnya selisihnya terlalu tipis, untuk membuat kesimpulan yg kuat!

6. Kesimpulan

Tidak cukup bukti untuk menyatakan bahwa standard deviasi aki produksi pabrik tsb > 0.9.

Page 15: Analisa Data Statistik Chap 10b: Hipotesa Testing (Proporsi)

Test Statistik Berkenaan dengan perbandingan Variansi 2 Populasi

Situasi : Sampel dari dua buah populasi memiliki variansi S12 dan S2

2 yg berasal dari populasi normal ingin diperiksa apakah variansi kedua populasi sama H0 : σ1

2 = σ22

Variabel statistik untuk di test adalah F :

Adalah variable dengan distribusi F yg memiliki derajat kebebasan v1 =n1 -1 (pembilang) dan v2=n2-1 (penyebut).

22

21

s

sF

Page 16: Analisa Data Statistik Chap 10b: Hipotesa Testing (Proporsi)

Contoh

Sampel dari dua buah populasi memiliki variansi dan

Dengan masing-masing ukuran sampelnya n2= 12 dan n1=10.

Periksalah kebenaran hipotesa H0 : yaitu kedua sampel berasal dari populasi dengan variansi yang sama, terhadap,

H1:` pada tingkat signifikan 10%

1622 S 252

1 S

22

21

22

21

Page 17: Analisa Data Statistik Chap 10b: Hipotesa Testing (Proporsi)

Solusi

Ini adalah test 2 ekor, akan tetapi karena kita sudah susun s1>s2 maka nanti hanya perlu diperiksa ekor kanannya saja!

1. Hipotesa: H0 : H1:

2. α = 0.1

3. Daerah kritis

Variabel statistik untuk ditest : F = s12/s2

2

dari tabel distribusi F untuk v1=10-1=9 dan v2=12-1=11, bagi nilai

α/2 = 0.05 adalah F0.05 (9,11) = 2.90

Tolak H0, jika F > 2.90

4. Perhitungan:

F = s12/s2

2 = 25/16 = 1.56

5. Keputusan

Karena F < 2.90 tidak bisa menolak H0 pada tingkat signifikan 10%.

6. Kesimpulan,

Kedua sampel berasal dari populasi dengan variansi yg sama!

22

21 2

221

Page 18: Analisa Data Statistik Chap 10b: Hipotesa Testing (Proporsi)

Goodness of Fit test

Page 19: Analisa Data Statistik Chap 10b: Hipotesa Testing (Proporsi)

Test statistik untuk kecocokan thd distribusi teoretik

Situasi: Ingin diketahui seberapa mirip distribusi data yg diperoleh di dalam sampel terhadap distribusi teoretis yg diasumsikan dimiliki oleh populasi asal sampel tsb. Test ini disebut goodness of fit test.

Test statistiknya adalah chi-squares:

Dengan Ok adalah frekuensi sampel yg terobservasi, Ek adalah frekuensi teoretis (expected) untuk sel yang sama (k). Derajat kebebasannya v=N-1

Hipotesa yg diuji adalah H0: Distribusi sampel = distribusi teoretis (nilai chi-squares kecil)

terhadap H1 : distribusi sampel menyimpang dari distribusi teoretis (nilai chi-squares besar)

N

k k

kk

E

EO

1

22 )(

Page 20: Analisa Data Statistik Chap 10b: Hipotesa Testing (Proporsi)

Contoh.

Sebuah dadu bermuka 6 dilemparkan sebanyak 120 kali, hasilnya adalah sbb:

Muka dadu 1 2 3 4 5 6

frek (obs) 20 22 17 18 19 24

frek (exp) 20 20 20 20 20 20

distribusi teoretis (expected ) f(x) =1/6 dengan x=1,2,3,…6, sehingga untuk 120 kali pelemparan frek (teoretis) = 1/6*120=20 untuk tiap mata dadu.

1. Hipotesa

H0: Distribusi frekuensi mata dadu sesuai distribusi teoretis

H1: Distribusi frekuensi mata dadu menyimpang dari teoretis

Page 21: Analisa Data Statistik Chap 10b: Hipotesa Testing (Proporsi)

Contoh.

N

k k

kk

E

EO

1

22 )(

2. Tingkat signifikan

Misal diambil α =5%.

3. Daerah kristis

Variabel statistik untuk diuji:

dengan v=N-1=6-1=5.

Nilai kritis, menurut tabel χ20.05

(v=5) = 11.070.

Tolak H0, jika χ2 > 11.070

4. Perhitungan

Obs 20 22 17 18 19 24

Exp 20 20 20 20 20 20

(O-E)2/E 0 0.2 0.45 0.2 0.05 0.8

Page 22: Analisa Data Statistik Chap 10b: Hipotesa Testing (Proporsi)

Contoh.

20

)2420(

20

)1920(

20

)2017(

20

)2022(

20

)2020()( 222226

1

22

k k

kk

E

EO

4. Perhitungan

5. Keputusan

Karena χ2 < 11.070 maka H0 tidak bisa ditolak pada tingkat signifikan 5%.

6. Kesimpuan:

Tidak bisa dikatakan bahwa distribusi frekuensi kemunculan mata dadu berasal dari populasi yg menyimpang dari distribusi teoretis yg seharusnya. Atau tidak cukup bukti menyatakan dadunya tidak fair!

7.18.005.02.045.02.00)(

1

22

N

k k

kk

E

EO

Page 23: Analisa Data Statistik Chap 10b: Hipotesa Testing (Proporsi)

Test untuk independensi (data kategorikal)

Situasi: Ingin diketahui independensi antara dua buah variabel kategorikal.

H0: Tidak ada hubungan (dua buah variabel tsb independen)

H1 : Ada hubungan antara kedua buah variabel

Sebagai distribusi teoretisnya adalah berdasarkan H0 yaitu distribusi yg akan terjadi jikalau kedua variabel yg diperiksa independen. Sedangkan test statistik yg dipergunakan adalah χ2 :

N

k k

kk

E

EO

1

22 )(

Page 24: Analisa Data Statistik Chap 10b: Hipotesa Testing (Proporsi)

Contoh.

Ingin diketahui apakah tingkat pendapatan berpengaruh pada opini terhadap rencana reformasi perpajakan yg akan dilakukan pemerintah. Untuk itu dilakukan sampling terhadap 1000 orang wajib pajak. Kepada mereka ditanyakan apakah setuju dengan reformasi perpajakan yg akan dilakukan. Hasilnya ditabelkan dalam tabel kontingensi berikut ini:

 

 Tingkat Pendapatan

   

  Rendah Medium Tinggi Total Row

Setuju 182 213 203 598

Tidak 154 138 110 402

Total Col 336 351 313 1000

Page 25: Analisa Data Statistik Chap 10b: Hipotesa Testing (Proporsi)

Contoh.

Periksalah hipotesa H0: tidak ada hubungan antara tingkat pendapatan dan opini thd reformasi perpajakan, dengan tingkat signifikan 5%.

Page 26: Analisa Data Statistik Chap 10b: Hipotesa Testing (Proporsi)

Solusi.

1. Hipotesa

H0: tidak ada hubungan antara tingkat pendapatan dan opini thd reformasi perpajakan,

H1: Ada hubungan ….

2. α = 5%.

3. Daerah kritis

Variabel untuk ditest:

dengan derajat kebebasan v= (row-1)*(col-1)= (2-1)*(3-1)=2

Nilai kritis, dari tabel χ0.052(ν=2)=5.991

Tolak H0, jika χ2 > 5.991

N

k k

kk

E

EO

1

22 )(

Page 27: Analisa Data Statistik Chap 10b: Hipotesa Testing (Proporsi)

Solusi.

4. Perhitungan

Menentukan frekuensi teoretis tiap cell berdasarkan asumsi bahwa variabel pendapatan independen thd variabel opini, sehingga probabilitas untuk cell dengan pendapatan Pa dan opini Ob akan diberikan oleh:

P (Pa ∩ Ob)= P(Pa)*P(Ob)

Jika total datanya N, maka expected frequency untuk cell tsb adalah:

n (Pa ∩ Ob)= P(Pa)*P(Ob) * N

Bagaimana menentukan Pa dan Ob dari tabel kontingensi?

Misal dari data, jumlah org yg pendapatannya a,b dan c masing-masing na, nb dan nc. Maka, probabilitas menemukan 1 orang dengan pendapatan a adalah : P (Pa) = na/(na+nb+nc), dst.

Page 28: Analisa Data Statistik Chap 10b: Hipotesa Testing (Proporsi)

Solusi.

  Tingkat Pendapatan   

  Rendah Medium Tinggi Total Row

Setuju       598

Tidak       402

Total Col 336 351 313 1000

4. Perhitungan

Disebelah kiri adalah tabel yg diperlukan untuk menghitung expected frequency, sebelah kanan adalah hasilnya : expected frequency.

Contoh perhitungan expected freq. orang yg berpendapatan rendah dan setuju.

P(rendah) = 336/1000 P(setuju)=598/1000

n(rendah dan setuju) = P(rendah)*P(setuju)*1000=

= 336/1000*598/1000*1000 = 200.9

 

 Tingkat Pendapatan   

  Rendah Medium Tinggi Total Row

Setuju 200.9 209.9 187.2 598

Tidak 135.1 141.1 125.8 402

Total Col 336 351 313 1000

Page 29: Analisa Data Statistik Chap 10b: Hipotesa Testing (Proporsi)

Solusi.

4. Perhitungan

Untuk menghemat perhitungan tidak perlu semua dihitung, misalkan seluruh baris “setuju” dihitung, maka jumlah expected yg di baris “tidak” bisa diperoleh dengan pengurangan. Contoh expected freq. yg pendapatan rendah dan tidak setuju:

n(rendah & tidak) = 336 – n(rendah & setuju) = 336 – 200.9=135.1

Tahap berikutnya menghitung chi-squares:

5. Keputusan

Karena χ2 > 5.991 maka cukup bukti untuk menolak H0

6. Kesimpulan

Ada hubungan antara variabel pendapatan dan opini.

8.125

)8.125110(

1.141

)1.141138(

1.135

)1.135154(

2.187

)2.187203(

9.209

)9.209213(

9.201

)9.201182()( 222222

1

22

N

k k

kk

E

EO

878.72

Page 30: Analisa Data Statistik Chap 10b: Hipotesa Testing (Proporsi)

Catatan

1. Metoda ini bekerja baik jika jumlah expected freq di tiap cell ≥ 5.

2. Untuk mempermudah perhitungan biasanya dalam tiap cell dicantumkan observed freq dan expected freq.

 

 Tingkat Pendapatan   

  Rendah Medium Tinggi Total Row

Setuju182

(200.9) 213 (209.9) 203 (187.2) 598

Tidak154

(135.1) 138 (141.1) 110 (125.8) 402

Total Col 336 351 313 1000

Page 31: Analisa Data Statistik Chap 10b: Hipotesa Testing (Proporsi)

Test Beberapa Proporsi Sekaligus

Situasi: Ingin diketahui apakah proporsi untuk “sukses” di berbagai populasi semuanya sama. Jadi

H0 : P1=P2=P3=…

H1: paling tidak ada 1 proporsi yg tidak sama

Variabel testnya adalah chi-squares:

N

k k

kk

E

EO

1

22 )(

Page 32: Analisa Data Statistik Chap 10b: Hipotesa Testing (Proporsi)

Contoh

Sebuah pabrik yg memiliki 3 shift pekerja ingin mengetahui apakah persentase produk yg cacat dari berbagai shift tersebut sama. Sampel data disusun dalam tabel berikut ini:

Pergunakan tingkat signifikan 2.5% untuk memeriksa apakah persentase yg cacat sama di segala shift.

Shift Pagi Siang Malam

Cacat 45 55 70

Baik 905 890 870

Page 33: Analisa Data Statistik Chap 10b: Hipotesa Testing (Proporsi)

Solusi

1. Hipotesa

H0 : p1=p2=p3

H1: tidak semua p1,p2 dan p3 sama

2. α =0.025

3. Daerah Kritis

Test statistiknya :

dengan derajat kebebasan v= (2-1)*(3-1)=2

Nilai kritis, dari tabel diperoleh χ0.0252(v=2) = 7.378

Tolak H0 jika χ2 > 7.378

N

k k

kk

E

EO

1

22 )(

Page 34: Analisa Data Statistik Chap 10b: Hipotesa Testing (Proporsi)

Solusi

Shift Pagi Siang Malam Total

Cacat 45 (57.0) 55 (56.7) 70 (56.4) 170

Baik905

(893.0)890

(888.3)870

(883.6) 2665

Total 950 945 940 2835

Perhitungan expected frequency seperti contoh-contoh sebelumnya. Sehingga chi-squares bisa dihitung:

Χ2 = 6.23

6.883

)6.883870(

3.888

)3.888890(

893

)893905(

4.56

)4.5670(

7.56

)7.5655(

0.57

)0.5745()( 222222

1

22

N

k k

kk

E

EO

4. Perhitungan

Page 35: Analisa Data Statistik Chap 10b: Hipotesa Testing (Proporsi)

Solusi

5. Keputusan

Karena χ2 <7.378, maka H0 tidak bisa ditolak.

6. Kesimpulan

Tidak cukup bukti untuk menyatakan bahwa ada perbedaan proporsi produksi yg cacat di berbagai shift yg berbeda