modul adk mei 2011

Download Modul ADK mei 2011

Post on 16-Jul-2015

698 views

Category:

Documents

7 download

Embed Size (px)

TRANSCRIPT

MODUL 1 DISTRIBUSI UNTUK DATA KATEGORI

Data kategori setidaknya terdiri atas dua hal yaitu data yang diukur pada skala nominal yang apabila diberikan nilai maka nilainya hanya berfungsi sebagai simbol dan tidak menyatakan urutan dan data yang diukur pada skala nominal yang apabila diberikan nilai memberikan arti urutan tetapi bukan nilai numerik tetapi hanya berupa simbol. Variabel kategori terkadang disebut juga variabel diskrit karena nilainya hanya diperoleh dengan cara mencacah. Dalam Agresti (2007) tiga distribusi utama yang dapat digunakan untuk data kategori yaitu: 1. Binomial yaitu distribusi yang menyatakan banyaknya percobaan yang saling bebas dari percobaan bernoulli yang memiliki hasil biner (terdiri hanya dua kategori: sukses atau gagal). Peluang sukses (p) adalah tetap untuk setiap percobaan dan variabel X menyatakan banyaknya sukses dari seluruh percobaan (n). 2. Multinomial merupakan perluasan dari distribusi binomial akan tetapi mempunyai hasil percobaan lebih dari dua. 3. Poisson adalah distribusi yang menyatakan banyaknya peristiwa yang terjadi dalam waktu yang lama (jangka panjang) yang setiap kejadiannya saling bebas. Dengan kata lain Distribusi Poisson dapat dikatakan sebagai distribusi untuk peristiwa yang jarang terjadi. 1.1 Distribusi Peluang Diskrit dalam R Software R come mendukung banyak distribusi peluang baik diskrit yaitu Poisson, negative binomial, geometric, hypergeometric, dan uniform diskrit. Selain itu juga ada beberapa distribusi-distribusi peluang khusus yang dapat diperoleh dari website CRAN seperti negatifbinomial yang terdapat pada fungsi rnegbin() paket MASS, beta-binomial terdapat pada paket rmutil dan gnlm dan masih banyak lagi. Setiap distribusi peluang mempunyai fungsi untuk memperoleh peluang kumulatif, nilai densitas dan kuantil. Selain itu juga bisa membangkitkan data (random data) dari distribusi 1

tersebut. Berikut adalah beberapa fungsi yang dapat digunakan untuk menghitung nilai-nilai dari distribusi di dalam R. Distribusi Binomial dengan peluang sukses p dan banyak percobaan n. > dbinom(x, n, p) # menghitung nilai peluang pada saat P(X = x) > pbinom(x, n, p) # menghitung nilai peluang kumulatif P(X qbinom(p, n, p) # menghitung nilai kuantil ke p > rbinom(N, n, p) # membangkitkan data sebanyak N dari distribusi Binomial

Distribusi Poisson dengan parameter lambda > dpois(x, lambda) # menghitung nilai peluang pada saat P(X = x) > ppois(x, lambda) # menghitung nilai peluang kumulatif P(X qpois(p, lambda) # menghitung nilai kuantil ke p > rpois(N, lambda) # membangkitkan data sebanyak N dari distribusi Poisson

Distribusi Multinomial dengan vektor peluang p > dmultinom(x, p) > rmultinom(n, size, prob)

Contoh: > dbinom(3, size=10, prob=0.25) # P(X = 3) untuk distribusi binomial

dengan n=10 dan peluang sukses 0.25 > pbinom(3, size=10, prob=0.25) # P(X prop.test(x, n, p = NULL, alternative = c("two.sided", "less", "greater"), conf.level = 0.95, correct = TRUE)

Keterangan:

x: adalah vektor banyak sukses atau berupa tabel satu dimensi dengan dua taraf atau tabel dua dimensi (atau matriks) dengn dua kolom berisi banyak sukses dan gagal. n: adalah vektor banyaknya percobaan, diabaikan apabila 'x' adalah matriks atau tabel. p: adalah vektor peluang sukses. Panjang vektor p harus sama dengan banyaknya kelompok yang bersesuaian dengan vektor x dan nilainya harus lebih besar dari nol dan lebih kecil dari 1. alternative: adalah hipotesis alternatif yang digunakan yaitu "two.sided" (default) untuk tidak sama, "greater" untuk lebih besar atau "less"

3

untuk lebih kecil. Dapat pula menggunakan huruf inisialnya saja. Opsi ini hanya digunakan untuk pengujian satu sampel dengan hipotesis sama dengan nilai tertentu, atau pada pengujian kesamaan dua proporsi.

conf.level: adalah derajat kepercayaan yang digunakan. Nilainya harus antara 0 dan 1. Opsi ini hanya digunakan untuk pengujian satu sampel dengan hipotesis sama dengan nilai tertentu, atau pada pengujian kesamaan dua proporsi.

correct: berisi TRUE atau FALSE yang mengindikasikan 'Yates' continuity correction yang digunakan apabila memungkinkan.

Nilai-nilai yang dapat diperoleh dari fungsi ini adalah

statistic: adalah nilai statistik uji chi-kuadrat Pearson's .

parameter: adalah derajat kebebasan yang digunakan pada statistik uji yang mengikuti distribusi chi-kuadrat.

p.value: adalah nilai 'p-value' pengujian.

estimate: adalah vektor dengan proporsi sampel x/n.

conf.int: adalah selang kepercayaan untuk proporsi satu sampel atau untuk perbedaan proporsi dua sampel Selang kepercayaan untuk proporsi dihitung dengan derajat kepercayaan sebesar conf.level yang telah didefinisikan.

null.value: adalah nilai spesifik p pada hipotesis nol.

alternative: adalah hipotesis alternatif yang digunakan.

method: adalah metode yang digunakan dan melliputi Yates' continuity correction yang digunakan.

data.name: adalah nama dari data yang digunakan.

4

Contoh Pengamat ekonomi memiliki dugaan bahwa 70% perusahaan besar di Indonesia dimiliki oleh warga negara asing. Untuk membuktikan dugaannya, diambil sampel acak 210 perusahaan yang digolongkan perusahaan besar. Dari 210 perusahaan besar sebanyak 130 perusahaan dimiliki oleh Orang Asing. Dengan tingkat signifikansi sebesar 0.05 Lakukan pengujian hipotesisnya! > prop.test(130, 210, 0.7, conf.level=0.95) 1-sample proportions test with continuity correction data: 130 out of 210, null probability 0.7 X-squared = 6.1735, df = 1, p-value = 0.01297 alternative hypothesis: true p is not equal to 0.7 95 percent confidence interval:

0.5493720 0.6842925 sample estimates: p 0.6190476

Karena p-value lebih kecil dari 0.05 maka hipotesis ditolak. Artinya, proporsi sampel tidak sama dengan 0.7 sehingga kesimpulannya tidak cukup alasan untuk setuju dengan pendapat ahli ekonomi tersebut dengan keyakinan 95%. Pengujian proporsi dalam software R merupakan pengujian proporsi menggunakan uji chi-kuadrat. Pendekatan lain untuk menguji proporsi adalah menggunakan statistik uji Z. Secara default R tidak menyediakan uji proporsi menggunakan statiistik Z. tetapi dalam R dimungkinkan untuk membuat fungsi yang dapat digunakan untuk menguji proporsi dengan statistik uji Z. Berikut adalah contoh pembuatan fungsi pengujian proporsi satu sampel. > ztes.prop prop=x/n > alpha=1-conf.level > zstar=qnorm(1-alpha/2) > SE=(prop*(1-prop)/n)^0.5 > zhitung=(prop-p)/SE > pvalue=1-pnorm(abs(zhitung)) > BB=(prop1-prop2)-zstar*SE

5

> BA=(prop1-prop2)+zstar*SE > Ringkasan zhitung=c(zhitung),pvalue=c(pvalue),BatasAtas=c(BA),BatasBawah=c(BB)) > Ringkasan$Kesimpulan=0.05,c("H0 Diterima"),c("Ho Ditolak")) > print(Ringkasan) >}

Fungsi tersebut dapat dipanggil dengan cara sebagai berikut: > ztes.prop(130,210,0.7,0.95) # kasus satu sampel

1.3 Pengujian Proporsi Dua Sampel Digunakan untuk membandingkan proporsi dua sampel. Dalam R masih menggunakan prop.test dengan syntax sebagai berikut >prop.test(c(a,b),c(n1,n2))

keterangan: a adalah banyaknya kategori A dalam sampel 1 b adalah banyaknya kategori A dalam sampel 2 n1 adalah ukuran sampel 1 n2 adalah ukuran sampel 2 Contoh Suatu kegiatan survey dilakukan sebanyak dua kali untuk mengetahui apakah ada perbedaan pilihan masyarakat terhadap calon tertentu dalam pemilihan presiden. Data disajikan sebagai berikut: Minggu ke 1 Minggu ke 2 Memilih 45 56

Tidak Memilih 35 47 6

Dengan tingkat signifikansi 5% lakukan pengujian apakah terdapat perbedaan proporsi minggu 1 dan minggu 2 > prop.test(c(45,56),c(45+35,56+47))

2-sample test for equality of proportions with continuity correction

data: c(45, 56) out of c(45 + 35, 56 + 47)

X-squared = 0.0108, df = 1, p-value = 0.9172

alternative hypothesis: two.sided

95 percent confidence interval:

-0.1374478 0.1750692

sample estimates:

prop 1 prop 2

0.5625000 0.5436893

Karena p-value lebih besar dari 0.05 maka hipotesis diterima. Artinya, proporsi sampel 1 tidak berbeda dengan sampel 2 sehingga kesimpulannya dengan keyakinan 95% sampel 1 tidak berbeda nyata dengan sampel 2. Seperti pada kasus satu asmpel pengujian proporsi dalam software R merupakan pengujian proporsi menggunakan uji chi-kuadrat. Pendekatan lain untuk menguji proporsi adalah menggunakan statistik uji Z. Secara default R tidak menyediakan uji proporsi menggunakan

statiistik Z. tetapi dalam R dimungkinkan untuk membuat fungsi yang dapat digunakan untuk menguji proporsi dengan statistik uji Z. Berikut adalah contoh pembuatan fungsi pengujian proporsi dua sampel. > ztes.prop2 prop1=x1/n1;prop2=x2/n2 > alpha=1-conf.level > zstar=qnorm(1-alpha/2) > SE=(prop1*(1-prop1)/n1+prop2*(1-prop2)/n2)^0.5 > zhitung=(prop1-prop2)/SE > pvalue=1-pnorm(abs(zhitung)) > BB=(prop1-prop2)-zstar*SE > BA=(prop1-prop2)+zstar*SE >Ringkasan zhitung=c(zhitung),pvalue=c(pvalue),BatasAtas=c(BA),BatasBawah=c(BB)) > Ringkasan$Kesimpulan=0.05,c("H0 Diterima"),c("Ho Ditolak")) > print(Ringkasan) >}

Fungsi tersebut dapat dipanggil dengan cara sebagai berikut: > ztes.prop2(45,56,80,103,0.95) # kasus dua sampel

8

MODUL 2 TABEL KONTINGENSI

2.1. Pendahuluan Dalam modul ini akan dijelaskan mengenai asosiasi antara dua variabel dalam tabel kontingensi. Pembahasan meliputi pada selang kepercayaan (Confidence intervals), odds ratio dan resiko relatif (relative risk), pengujian perbedaan proporsi dan uji independensi menggunakan pendekatan normal (untuk sampel besar) atau prosedur Wolf. Secara umum untuk tabel kontingensi I x J, pengujian independensi variabel baris dan kolom menggunkan uji chi kuadrat termasuk statistik rasio kemungkinan (likelihood ratio s