pendahuluan

23
STATISTIK NONPARAMETRIK Kuliah 3: Uji Chi-Square untuk Goodness of Fit dan Uji Kolmogorov-Smirnov (Satu Populasi) Dosen: Dr. Hamonangan Ritonga, MSc Sekolah Tinggi Ilmu Statistik Jakarta Tahun 2013

Upload: ginger

Post on 22-Jan-2016

35 views

Category:

Documents


1 download

DESCRIPTION

STATISTIK NONPARAMETRIK Kuliah 3: Uji Chi-Square untuk Goodness of Fit dan Uji Kolmogorov -Smirnov (Satu Populasi ) Dosen : Dr. Hamonangan Ritonga , MSc Sekolah Tinggi Ilmu Statistik Jakarta Tahun 2013. Pendahuluan. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Pendahuluan

STATISTIK NONPARAMETRIK

Kuliah 3: Uji Chi-Square untuk Goodness of Fit dan Uji Kolmogorov-Smirnov

(Satu Populasi)

Dosen:Dr. Hamonangan Ritonga, MSc

Sekolah Tinggi Ilmu Statistik JakartaTahun 2013

Page 2: Pendahuluan

Pendahuluan Uji Chi-squares (2) merupakan salah satu uji statistik

yang sering digunakan dalam statistik, diantaranya digunakan untuk:1) apakah frekuensi observasi berbeda secara

signifikan terhadap frekuensi ekspektasi.2) apakah dua variabel independen atau tidak3) apakah data sampel mengikuti distribusi hipotesis tertentu, seperti distribusi normal, binomial, poison, dll.

Page 3: Pendahuluan

Pendahuluan Distribusi Chi-squares (2)

Jika x1 , x2 ,..., xv adalah variabel random yang memiliki distribusi normal, sementara z1 , z 2,…zv merupakan variabel random standarnya atau z1 N (0,1) maka z 2

1 akan memiliki derajat bebas v. Bentuk Fungsi Probability 2

• Jika v variabel random adalah independen, maka distribusi 2 memiliki rata-rata dan varians: E(2) = v 2

= 2v

sehingga nilai derajat bebas merupakan parameter suatu distribusi 2

Page 4: Pendahuluan

Uji Chi-Squares (goodness of fit) Uji Chi-square (2) goodness of fit satu sampel adalah teknik statistik yang

digunakian untuk menguji hipotesis deskriptif bila dalam populasi terdiri dari dari dua atau lebih kelas, dan datanya berbentuk nominal. Uji statistik ini menekankan pada perbedaan frekuensi subjek, objek, atai respon yang masuk pada kategori yang bervariasi.

Contoh kasius:1) Sekelompok pasien dikelompokkan menurut jenis penyakit tertentu, dan peneliti ingin mengetahui apakah tipe penyakit tertentu lebih sering terjadi dari penyakit lain.2) Anak-anak dikategorikan menurut jenis permainan, dan peneliti ingin

mengetahui apakah jenis permainan berbeda dalam frekuensi.3) masyarakat dapat dikategorikan menurut respon terhadap sesuatu:

“apakah lebih senang” , “sama saja”, atau “menolak” s, dan peneliti ingin mengetahui apakah respon masysrakat verbeda dalam frekuensi.

Uji yang sesuai dengan kasus diatas adalah Uji Chi Square Goodness of Fit. Uji ini digunakan untuk menguji apakah frekuens observasi berbeda secara signifikan terhadap frekuensi ekspektasi (harapan).

Page 5: Pendahuluan

Uji Chi-Squares (goodness of fit) Metode Uji Chi-square (2) goodness of fit satu sampel:

Untuk membandingkan frekuensi observasi dengan frekuensi ekspektasi, kita harus terlebih dahulu menentukan frekuensi ekspektasi.Hipothesis Ho menyatakan proporsi objek yang masuk pada setiap kategori yang diasumsukan terjadi pada populasi.

Hipotesis Ho dapat diuji dengan statistik berikut:

Dimana: Oi = frekuensi observasi pada kategori ke i Ei = frekuensi ekspektasi pada kategori ke i K= jumlah kategoriN= jumlah observasi

Statistik ini mengikuti distribusi 2 dengan degress of freedom = k-1(Tabel C Lampiran)

Page 6: Pendahuluan

Uji Chi-Squares (goodness of fit) Contoh 1: Kasus dua kategori

Suatu organisasi ingin mengetahui apakah wanita mempunyai peluang yang sama dengan pria untuk menjadi kepala desa di desa A . Untuk itu dilakukan penelitian. Populasi penelitian adalah masyarakat yang memenuhi sayara memilih di desa A. Calon kades ada dua orang, wanita dan pria. Sampel diambil secara random sebanyak 300 orang, ternyata dari sampel tersebut 200 orang memilih calon kades pria dan 100 orang memilih calon kades wanita. Lakukan pengujian apakah ada perbedaan frekuensi observasi dan frekuensi ekspektasi dengan taraf nyata 5 %.

Page 7: Pendahuluan

Uji Chi-Squares (goodness of fit)Langkah-langkah yang diakukan:1) Tentukan Ho dan Ha

Ho: frekuensi jumlah memilih calon kades pria dan wanita adalah sama (Kades pria dan wanita berpeluang sama untuk dipilih jadi kades)Ha: frekuensi jumlah pemilih calon kades pria dan wanita tidak sama

2) Tentukan taraf nyata () = 0,05 atau 5 %3) Tentukan Statistik Uji: Uji Chi-squares (2) goodness of fit satu sampel

AlternPatif Pilihan Oi Ei (Oi – Ei) (Oi-Ei) 2 (Oi-Ei) 2 /EiPria 200 150 50 2500 16,67Wanita 100 150 -50 2500 16,67

Jumlah 300 300 0 5000 33,33 Jadi: 2obs = 33,33

Page 8: Pendahuluan

Uji Chi-Squares (goodness of fit)4) Tentukan Kriteria Keputusan:

Jika 2obs > 2

df, Tolak Ho

5) Keputusan 2

obs = 33,33

df = k-1 = 2-1 = 1; =0,05 2df, = 3,84 (Lihat Tabel C pada Handbook)

Jadi Tolak Ho Masyarakat di Desa A cenderung memilih pria sebagai KadesSaran: Kelompok wanita sebaiknya tidak mencalonkan diri sebagai

calon kades

Page 9: Pendahuluan

Uji Chi-Squares (goodness of fit) Koreksi Yates untuk kontinuitas

Dalam pengujian dengan distribusi 2, nilainya dihitung dari distribusi

teoritis asli yang kontinu, sedangkan observasi kita adalah dari data diskrit. Ada kecenderungan pendugaan tersebut over estimate, khususnya untuk derajat bebas 1, dengan demikian nilai 2

obs akan meningkatkan kemungkinan menolak Ho, sehingga perlu mengoreksi nilai 2

obs kebawah.

(Oi-Ei-1/2) 2

2obs = ---------------- sehingga pada contoh sebelumnya 2

obs = 32,67

Ei

Kesimpulan: 2obs (32,67) > 2

df, = 3,841 Tetap Tolak Ho

Catatan: Jika derajat bebas lebih dari 1, penyesuaian dengan koreksi Yatestidak diperlukan.

Page 10: Pendahuluan

Observasi & Ekspektasi

Jenis Penyakit

A B C D Jumlah

Oi 3 5 6 3 17

Ei 6 6 3 2 17

Uji Chi-Squares (goodness of fit)Contoh 2: Kasus lebih dari dua kategoriTabel berikut adalah frekuensi observasi dan ekspektasi 4

macampenyakit yang ditemui di suatu daerah:

Uji apakah frekuensi observasi dan ekspektasi berbeda secara signifikan pada = 5 %

Page 11: Pendahuluan

Observasi & Ekspektasi

Jenis PenyakitA B C dan D Jumlah

Oi 3 5 9 17

Ei 6 6 5 17

Uji Chi-Squares (goodness of fit)Jika k = 2 untuk Uji Chi- Squares goodness of fit untuk satu sampelakan akurat pada frekuensi ekspektasi 5 atau lebih. Jika hanya ada 2 kategori dengan frekuensi < 5, maka Kategori yang berdekatan perlu digabung, seperti pengelompokanbaru pada tabel berikut:

Page 12: Pendahuluan

Uji Chi-Squares (goodness of fit)Langkah-langkah yang diakukan:1) Tentukan Ho dan Ha

Ho: frekuensi obesrvasi dan ekspektasi penyakit adalah samaHa: frekuensi obesrvasi dan ekspektasi penyakit adalah tidak sama

2) Tentukan taraf nyata () = 0,10 atau 10 %3) Tentukan Statistik Uji: Uji Chi-squares (2) goodness of fit satu sampel

Jenis Penyakit Oi Ei (Oi – Ei) (Oi-Ei) 2 (Oi-Ei) 2 /EiA 3 6 -3 9 1,5B 5 6 -1 1 0,17

C dan D 9 5 4 16 3,2

Jadi: 2obs = 4,87

Page 13: Pendahuluan

Uji Chi-Squares (goodness of fit)4) Tentukan Kriteria Keputusan:

Jika 2obs > 2

df, Tolak Ho

5) Keputusan 2

obs = 4,87

df = 3-1 = 3-1 = 2; =0,10 2df, = 4,61 (Lihat Tabel C pada Handbook)

Jadi Tolak Ho Ada perbedaan yang signifikan antara frekuensi ekspektasi dan observasi dari penyakit-penyakit di daerah tersebut.

Page 14: Pendahuluan

Uji Chi-Squares (goodness of fit) Soal Latihan 1:

Dilakukan pelemparan suatu mata uang sebanyak 50 kali, diperleh hasil sebagai berikut:Obs& ekspektasi Kepala Ekor JumlahObservasi 22 28 50Ekspektasi 25 25 50

Lakukan pelemparan mata uang tersebut jujur atau tidak pada taraf nyata 5 %.

Page 15: Pendahuluan

Uji Chi-Squares (goodness of fit) Soal Latihan 1:

Dilakukan pelemparan suatu mata uang sebanyak 50 kali, diperleh hasil sebagai berikut:Obs& ekspektasi Kepala Ekor JumlahObservasi 22 28 50Ekspektasi 25 25 50

Lakukan pengujian apakah pelemparan mata uang tersebut jujur atau tidak pada taraf nyata 5 %.

Soal Latihan 2:Sebuah dadu dilempar 60 kali dengan hasil:Mata 1 2 3 4 5 6Muncul 12 8 13 12 7 8Lakukan pengujian apakah dadu seimbang pada taraf nyata 5 %

Page 16: Pendahuluan

Uji Chi-Squares (goodness of fit) Soal Latihan 3:

Suatu perusahaan cat mobil ingin mengetahui warna cat apa yang harus lebih banyak diproduksi. Untuk itu perlu dilakukan penelitian. Berdasarkan pengamatan selama 1 minggu di jalan protokol terhadap mobil-mobil pribadi ditemukan 1000 berwarna biru, 900 berwarna merah, 600 berwarna putih, dan 500 berwarna lainnya. Lakukan pengujian apakah ada perbedaan nyata terhadap pemilihan warna mobil pada taraf nyata 5 %

Page 17: Pendahuluan

Uji Kolmogorov-Smirnov satu sampel Uji Kolmogorov-Smirnov satu sampel adalah uji goodness of fit

lain, untuk mengetahui kesesuaian antara distribusi nilai sampel (nilai yang diobservasi) dan beberapa distribusi teoritis yang ditentukan.

Dalam hal ini ingin diketahui apakah skor pada suatu sampel berasal dari populasi yang mempunyai distribusi teoritis.

Secara singkat uji ini mencakup menentukan distribusi frekuensi komulatif yang diobservasi terjadi sesuai distribusi teoritis. Distribusi teroritis merepresentasikan yang akan diharapkan melalui Ho.

Page 18: Pendahuluan

Uji Kolmogorov-Smirnov satu sampel Metode

Misalkan Fo (X) adalah fungsi distribusi komulatif frekuensi relatif (comulative relative frequency distribution function), distribusi teoritis dibawah Ho. Untuk setiap nilai X, nilai dari Fo (X) adalah proporsi kasus yang diharapkan mempunyai skor lebih kecil atau sama dengan X.

Selanjutnya S N (X) adalah diistribusi komulatif frekuensi relatif yang diobservasi dari sampel N. Jika setiap Xi setiap adalah kemungkinan skor, maka S N (Xi) =Fi/N, dimana Fi adalah jumlah observasi yang lebih kecil atau sama sengan Xi. Fo (Xi) adalah ekspektasi proporsi observasi yang lebih kecil atau sama dengan Xi.

Page 19: Pendahuluan

Uji Kolmogorov-Smirnov satu sampel Metode

Ketika Ho benar, , maka perbedaan antara S N (Xi) dan Fo(Xi) kecil diantara batasan kesalahan random.

Uji Kolmogorov-Smirnov memfokuskan pada deviasi terbesar. Deviasi nilai absolut terbesar dari Fo(Xi) - S N (Xi) disebut Maksimum Deviasi D, dengan persamaan:

D = max Fo(Xi) - S N (Xi) I = 1,2,…,N

Distribusi sampling dari D dibawah Ho dapat dilihat pada Tabel F (Lampiran Buku). Perhatikan, jika N > 35 nilai kritis D ditentukan baris terakhir dari Tabel F.

Page 20: Pendahuluan

Uji Kolmogorov-Smirnov satu sampel Contoh

Selama beberapa tahun seorang peneliti mempelajari deviasi dari variasi kejadian mogok kerja. Data berikut adalah deviasi dari mogok (dalam hari) dari tahun 1965 di Negara Inggris yang dikumpulkan, dianalis, dan diprediksi berdasarkan model matematis. Tabel dibawah ini menggambarkan distribusi komulatif frekuensi dari N=840 deviasi mogok. Juga diberikan pada tabel komulatif frekuensi yang diprediksi berdasarkan model matematis. Uji apakah distribusi dari durasi mogok mengikuti prediksi model matematis

Page 21: Pendahuluan

MaximumDuration

(days)

Cumulative frequency Cumulative Relativefrequency

Observed Predicted Observed Predicted |F0(X)-SN(X)|

1-2 203 212.81 0.242 0.253 0.0112-3 352 348.26 0.419 0.414 0.0043-4 452 442.06 0.538 0.526 0.0124-5 523 510.45 0.623 0.608 0.0155-6 572 562.15 0.681 0.669 0.0126-7 605 602.34 0.720 0.717 0.0037-8 634 634.27 0.755 0.755 0.0008-9 660 660.10 0.786 0.786 0.000

9-10 683 681.32 0.813 0.811 0.00210-111 697 698.97 0.830 0.832 0.00211-12 709 713.82 0.844 0.850 0.00612-13 718 726.44 0.855 0.865 0.01013-14 729 737.26 0.868 0.878 0.01014-15 744 746.61 0.886 0.889 0.00315-16 750 754.74 0.893 0.899 0.00616-17 757 761.86 0.901 0.907 0.00617-18 763 768.13 0.908 0.914 0.00618-19 7676 773.68 0.913 0.921 0.00819-20 771 778.62 0.918 0.927 0.00920-25 7888 796.68 0.938 0.948 0.01025-30 804 807.86 0.957 0.962 0.00530-35 812 815.25 0.967 0.971 0.00435-40 820 820.86 0.976 0.977 0.00140-50 832 826.86 0.990 0.984 0.006>50 840 840.01 1.000 1.000 0.000

Tabel:Data Mogok di Negara Inggris (N=840)

Page 22: Pendahuluan

Uji Kolmogorov-Smirnov satu sampelLangkah-langkah yang diakukan:1) Tentukan Ho dan Ha

Ho: distribusi dari durasi mogok mengikuti prediksi model

matematisHa: distribusi dari durasi mogok yang diobservasi tidak

sama dengan yang diprediksi dengan model matematis.

2) Tentukan taraf nyata () 0,05 atau 5 %3) Tentukan Statistik Uji: Uji Kolmogorov-Smirnov

Peneliti ingin membandingkan distribusi observasi skor dari skala ordinal dengan distribusi teoritis skor

Page 23: Pendahuluan

Uji Kolmogorov-Smirnov satu sampelLangkah-langkah yang diakukan:4) Distribusi sampling.

Nilai Kritis D, yaitu nilai maksimum deviasi absolut antara observasi dan prediksi dari distribusi komulatif dapat dilihat pada Tabel F.

4) Daerah Tolak. Tolak bila nilai D > nilai kritis

6) Keputusan: Nilai maksimum D = 0,015. Karena N.35, harus digunakan pendekatan sampel besar. Dengan N=840 , nilai kritis D adalah 1.36/840 =0,047. Karena nilai D < nilai kritis, kita tidak menolak Ho, data observasi adalah dari data populasi oleh model teoritis.