statistika non parametrik

6
1 http://dataflow-stat.blogspot.com/ 1 STATISTIKA NON PARAMETRIK A. UJI MEAN SATU POPULASI 1. UJI BINOMIAL Dalam Statistika parametrik untuk menguji mean sebuah sample maka digunakan uji t. Namun apabila asumsi yang diperlukan untuk uji-t itu yaitu n kecil dan populasinya normal tidak terpenuhi untuk suatu data maka sebagai alternatif-nya digunakan uji Binomial. Binomial berarti 2 bagian, sehingga dalam kasus ini dapat kita artikan data dibagi menjadi dua bagian yaitu bagian “+” untuk setiap nilai pengamatan yang melebihi nilai yang dihipotesiskan dan bagian “-“ untuk setiap pengamatan yang kurang dari nilai yang dihipotesiskan. B. UJI MEAN DUA SAMPEL INDEPENDEN/BEBAS 1. MANN-WHITNEY TEST Pada Mann-Whitney Test, data terdiri dari dua sample random dengan X 1 , X 2 , X 3 , … X n berasal dari populasi 1 dan Y 1 , Y 2 , Y 3 , … Y m berasal dari populasi 2. Uji Hipotesis: H 0 : μ 1 = μ 2 (tidak ada perbedaan rata-rata diantara kedua sampel) H 1 : μ 1 ≠ μ 2 (terdapat perbedaan rata-rata diantara kedua sampel) Statistik uji: = 1 2 . 1 . 2 1 12 . 1 . 2 . 1 + 2 +1 dimana = 1 . 2 + 1 12 . ( ) . ( +1) ( ) Dengan: x = 1 (untuk sampel 1) 2 (untuk sampel 2 ) R (x) = jumlah Rangking tiap sampel n1 = banyaknya sampel pada sampel 1 n 2 = banyaknya sampel pada sampel 2 H 0 ditolak jika nilai absolut dari Z hitung diatas > nilai Z α/2

Upload: scott-cracer

Post on 07-Aug-2015

42 views

Category:

Education


6 download

TRANSCRIPT

Page 1: Statistika non parametrik

1 http://dataflow-stat.blogspot.com/

1

STATISTIKA NON PARAMETRIK

A. UJI MEAN SATU POPULASI

1. UJI BINOMIAL

Dalam Statistika parametrik untuk menguji mean sebuah sample maka

digunakan uji t. Namun apabila asumsi yang diperlukan untuk uji-t itu yaitu

n kecil dan populasinya normal tidak terpenuhi untuk suatu data maka

sebagai alternatif-nya digunakan uji Binomial. Binomial berarti 2 bagian,

sehingga dalam kasus ini dapat kita artikan data dibagi menjadi dua bagian

yaitu bagian “+” untuk setiap nilai pengamatan yang melebihi nilai yang

dihipotesiskan dan bagian “-“ untuk setiap pengamatan yang kurang dari

nilai yang dihipotesiskan.

B. UJI MEAN DUA SAMPEL INDEPENDEN/BEBAS

1. MANN-WHITNEY TEST

Pada Mann-Whitney Test, data terdiri dari dua sample random dengan X1, X

2,

X3, … X

n berasal dari populasi 1 dan Y

1, Y

2, Y

3, … Y

m berasal dari populasi 2.

Uji Hipotesis:

H0 : μ

1 = μ

2 (tidak ada perbedaan rata-rata diantara kedua sampel)

H1 : μ

1 ≠ μ

2 (terdapat perbedaan rata-rata diantara kedua sampel)

Statistik uji:

𝑍 =𝑈 −

1

2.𝑛1 .𝑛2

1

12. 𝑛1 .𝑛2 . 𝑛1 + 𝑛2 + 1

dimana 𝑈 𝑥 = 𝑛1 .𝑛2 + 1

12.𝑛(𝑥). 𝑛(𝑥+1) − 𝑅(𝑥)

Dengan:

x = 1 (untuk sampel 1)

2 (untuk sampel 2 )

R(x) = jumlah Rangking tiap sampel

n1 = banyaknya sampel pada sampel 1

n2 = banyaknya sampel pada sampel 2

H0 ditolak jika nilai absolut dari Z hitung diatas > nilai Z

α/2

Page 2: Statistika non parametrik

2 http://dataflow-stat.blogspot.com/

2

2. KOLMOGOROV SMIRNOV TEST

Selain untuk menguji distribusi suatu data, Kolmogorov-Smirnov Test

juga dapat digunakan untuk menguji dua sampel bebas pada statistika non-

parametrik.

Prinsip dasar dalam menghitung nilai Kolmogorov-Smirnov adalah

mencari nilai absolut terbesar diantara selisih nilai empiris CDF diantara

kedua sampel yang akan diuji.

𝑇 = 𝑀𝑎𝑥 𝑆 𝑋1 − 𝑆 𝑋2

T= nilai dari statistic uji Kolmogorov-Smirnov

𝑆 𝑋𝑖 ,𝑗 =𝑛 ≤ 𝑋𝑖 ,𝑗

𝑛 𝑋𝑖 𝑡𝑜𝑡𝑎𝑙

Nilai T ini akan dibandingkan dengan nilai Kolmogorov-Smirnov tabel

dengan:

𝐷 = 1.36 ∗ 𝑚 + 𝑛

𝑚 ∗ 𝑛

dimana m = jumlah sampel pertama

n = jumlah sampel Kedua

Uji Hipotesis:

H0 : μ

1 = μ

2 (tidak ada perbedaan rata-rata diantara kedua sampel)

H1 : μ

1 ≠ μ

2 (terdapat perbedaan rata-rata diantara kedua sampel)

H0 ditolak jika nilai T > nilai Klomogorov Smirnov Tabel

C. UJI MEAN UNTUK DUA SAMPEL DEPENDEN/BERPASANGAN

Untuk uji dua sample berpasangan non parametrik, terdapat berbagai

macam uji yang dapat dilakukan yaitu:

Page 3: Statistika non parametrik

3 http://dataflow-stat.blogspot.com/

3

1. WILCOXON SIGNED-RANK TEST

Wilcoxon Signed Rank test ini digunakan hanya untuk data bertipe interval

atau rasio, namun datanya tidak mengikuti distribusi normal.

• Uji Hipotesis:

H0 : d = 0 (tidak ada perbedaan diantara dua perlakuan yang diberikan)

H1 : d ≠ 0 (ada perbedaan diantara dua perlakuan yang diberikan)

Dengan d menunjukkan selisih nilai antara kedua perlakuan

• Statistik uji:

𝑍 =𝑇 −

1

4𝑁 𝑁 + 1

1

24𝑁 𝑁 + 1 2𝑁 + 1

Dimana:

N = Banyak data yang berubah setelah diberi perlakuan berbeda

T = jumlah ranking dari nilai selisih yang negatif (apabila banyaknya selisih

yang positif lebih banyak dari banyaknya selisih yang negatif)

= jumlah rangking dari nilai selisih yang positif (apabila banyaknya selisih

yang negatif lebih banyak dari banyaknya selisih yang positif)

H0 ditolak jika nilai absolut dari Z hitung diatas > nilai Z

α/2

2. McNEMAR TEST

Pada McNemar Test, data yang digunakan adalah data yang bertipe nominal

dan hanya memiliki 2 pilihan saja (dikotomi) seperti “suka” dan “tidak suka”

, “ya” dan ”tidak”, ”berhasil” dan ”gagal”, dan sebagainya.

• Uji Hipotesis:

H0 : P

1 = P

2 (Tidak ada perbedaan proporsi antara kedua perlakuan)

H1 : P

1 ≠ P

2 (Ada perbedaan proporsi antara kedua perlakuan)

Statistik uji:

𝑍 =𝑏 − 𝑐

𝑏 + 𝑐

Dimana:

b = banyaknya data yang berubah dari ”1” ke ”2”

c = banyaknya data yang berubah dari ”2” ke ”1”

Page 4: Statistika non parametrik

4 http://dataflow-stat.blogspot.com/

4

H0 ditolak jika nilai absolut dari Z hitung diatas > nilai Z

α/2

D. UJI MEAN K SAMPEL INDEPENDEN/BEBAS

Walaupun ANOVA adalah metode yang banyak digunakan untuk menguji

apakah terdapat perbedaan beberapa populasi, metode ini mengasumsikan

bahwa mean sampel merupakan estimasi yang valid untuk pusat data,

distribusi data normal dan variansi masing- masing populasi homogen. Saat

asumsi ini tidak terpenuhi, maka metode ANOVA tidak lagi layak digunakan.

Untuk itu diperkenalkan metode lain sebagai alternatif metode ANOVA.

1. KRUSKAL WALLIS TEST

Uji Kruskal-Wallis merupakan generalisasi dari uji Wilcoxon untuk k>2. Uji ini

digunakan untuk menguji signifikansi perbedaan beberapa k sampel

independen dengan data yang minimal berskala ordinal. Asumsi dalam uji

Kruskal-Wallis :

1. sampel berasal dari populasi-populasi independen. Pengamatan satu

dan lainnya independen.

2. sampel diambil secara random dari populasi masing- masing.

3. data diukur minimal dalam skala ordinal.

Uji hipotesis yang dilakukan :

1. H0 : distribusi semua populasi identik

H1 : minimal ada 2 populasi yang berdistribusi tak identik

2. Tentukan signifikansi uji (alpha)

3. Statistik uji :

𝐻 =12

𝑁 𝑁 + 1

𝑅𝑗2

𝑛𝑗

𝑘

𝑗=1

− 3 𝑁 − 1

N = total sampel,

Rj = rata- rata rank untuk populasi ke –j

nj = jumlah sampel untuk populasi ke-j

4. Daerah kritik : H0 ditolak jika H > α dengan derajat bebas k-1

5. Kesimpulan

Page 5: Statistika non parametrik

5 http://dataflow-stat.blogspot.com/

5

2. MEDIAN TEST

Uji Median merupakan alternatif dari uji Kruskal- Wallis. Sebagai pusat

data dalam uji ini adalah median dari data yang telah digabung. Untuk

masing- masing populasi, dihitung frekuensi nilai yang lebih besar dan yang

lebih kecil atau sama dengan median gabungan.

Score Populasi

Populasi ke-1 … Populasi ke-k Total

>median n11 … n1k n1

<=median n21 … n2k n2

n1 nk N

Uji hipotesis yang dilakukan :

1. H0 : distribusi semua populasi identik

H1 : minimal ada 2 populasi yang berdistribusi tak identik

2. Tentukan signifikansi uji (alpha)

3. Statistik uji :

𝐶 = 𝑛𝑖𝑗 − 𝐸𝑖𝑗

2

𝐸𝑖𝑗,𝐸𝑖𝑗 =

𝑛𝑖𝑛𝑗

𝑁

𝑘

𝑗=1

2

𝑖=1

4. Daerah kritik : H0

ditolak jika C > nilai tabel chi square(αχ) dengan

derajat bebas (k-1) atau H0 ditolak jika nilai signifikansi uji < alpha

5. Kesimpulan

E. UJI MEAN UNTUK K SAMPEL DEPENDEN/ BERPASANGAN

Dalam uji mean nonparametrik untuk k sampel yang berpasangan/dependen

(Nonparametric Test for K Related Samples) terdapat berbagai metode, di

antaranya yaitu Uji Friedman dan Uji Q Cochran.

Syarat untuk dapat melakukan uji-uji tersebut adalah :

1. data minimal berupa dalam skala ordinal

2. pengamatan antar sampel adalah independen

3. adanya dependensi (saling berhubungan), yang bisa dihasilkan dari adanya

salah satu dari dua kondisi berikut:

a. sebuah sampel yang terdiri dari n objek yang dikenai k perlakuan

berbeda

Page 6: Statistika non parametrik

6 http://dataflow-stat.blogspot.com/

6

b. k sampel berbeda yang mengalami pencocokan (matching)

Berikut adalah keterangan tentang kedua uji di atas :

1. FRIEDMAN TEST

Uji ini memiliki hipotesis nol (H0) yang menyatakan bahwa k

sampel/variabel adalah berasal dari populasi yang sama.

Penerapan uji Friedman ini sering dilakukan pada penelitian untuk melihat

adanya pengaruh dari k perlakuan yang dikenakan pada n objek.

Uji ini dilakukan dengan menyajikan data dari sampel berukuran n ke dalam

tabulasi dengan k kolom. Kemudian beri nilai ranking untuk tiap barisnya

dari yang terendah 1 hingga nilai tertinggi dengan ranking k. Jika ada nilai

yang sama maka beri rata-rata nilai ranking untuk beberapa nilai yang sama

tersebut. Selanjutnya dari nilai-nilai ranking tersebut hitung nilai statistik uji

Friedman (F) berikut.

𝐹 =12𝑆

𝑛𝑘 𝑘 − 1 , 𝑑𝑒𝑛𝑔𝑎𝑛 𝑆 = 𝑅𝑖

2 − 3𝑛 𝑘 − 1

𝑘

𝑖=1

keterangan : = statistik uji Friedman F

= ukuran sampel n

= banyak sampel/perlakuan k

= kuadrat dari jumlah nilai ranking di sampel/perlakuan ke-i 2iR

Dalam uji hipotesis akan lebih mudah jika kita gunakan statistik uji nilai p

(p-value).

2. Q COCHRAN TEST

Statistik uji yang kedua ini diberikan sebagai alternatif dari uji Friedman,

dengan spesifikasi hanya digunakan ketika jenjang (rank) bernilai biner atau

dikotomi (misal 0 dan 1). Kita anggap 1 sebagai s\ukses, dan 0 gagal/tidak

sukses.

Hipotesis nol dalam uji ini menyatakan bahwa probabilitas memperoleh

sukses di antara k kelompok tersebut adalah sama secara signifikan.