bab 3 inferensial sederhana untuk kategori data

18
Bab 3 Inference sederhana untuk Data kategoris : Dari Keyakinan dalam Akhirat dengan Hukuman Mati dan Ras 3.1 Deskripsi Data Dalam bab ini , kita akan membahas beberapa aspek yang relatif sederhana dari analisis data kategorikal . Kami akan mulai dengan menjelaskan bagaimana membangun lintas - klasifikasi data mentah menggunakan umur tikus dan usia saat perkawinan data yang digunakan dalam bab sebelumnya . Kemudian kita akan melanjutkan untuk memeriksa sejumlah set data yang pengamatan sudah ditabulasi dengan cara ini . Rincian tersebut adalah sebagai berikut : Keyakinan di akhirat berdasarkan gender - data dari Survei Sosial Umum 1991 mengklasifikasikan sampel orang Amerika menurut jenis kelamin mereka dan pendapat mereka tentang kehidupan setelah kematian ( diambil dari Agresti 1996, dengan izin dari penerbit ) . Data muncul dalam Tabel 3.1 . Insiden keinginan bunuh diri pada sampel psikotik dan pasien neurotik - diberikan dalam Tabel 3.2 ( diambil dari Everitt , 1992) . Tabel 3.1 Keyakinan di Alam Baka Jenis Kelamin Perempuan 435 147 Pria 375 134 Tabel 3.2 Insiden Perasaan bunuh diri di Sampel psikotik dan neurotik Pasien Keinginan bunuh diri ? Ya 1 4 No 19 16 Tabel 3.3 Kontrasepsi Oral kontrol Oral kontrasepsi Kontrasepsi Oral Tidak Digunakan Kasus Digunakan 10 57 Tidak digunakan 13 95 Psikiater mempelajari pasien neurotik dan psikotik , meminta masing-masing sampel 20 dari setiap kategori tentang apakah mereka menderita keinginan bunuh diri . Penggunaan dan pembekuan darah kontrasepsi oral - data yang diberikan dalam Tabel 3.3 . Data ini muncul dari sebuah studi yang dilaporkan oleh Sartwell et al . ( 1969) . Penelitian ini dilakukan di sejumlah rumah sakit di beberapa kota besar di Amerika . Di rumah sakit tersebut , semua perempuan yang sudah menikah diidentifikasi sebagai menderita idiopatik tromboemboli ( gumpalan darah ) selama tiga tahun secara individual cocok dengan kontrol yang sesuai , pasien perempuan yang dibuang hidup-hidup dari rumah sakit yang sama dalam interval waktu enam bulan yang sama sebagai kasus . Selain itu, mereka secara individual dicocokkan dengan kasus berdasarkan usia , status perkawinan , ras, dll Pasien dan kontrol kemudian diminta tentang penggunaan kontrasepsi oral . Alkohol dan bayi malformasi - data dari studi prospektif minum ibu dan malformasi kongenital ( diambil dari Agresti 1996, dengan izin dari penerbit ) . Setelah pertama Tabel 3.4 Konsumsi Alkohol dan Bayi Malformasi cacat hadir Absen Jumlah rata-rata minuman per hari 0 48 17066 < 1 38 14464

Upload: kalbin-salim

Post on 04-Jul-2015

1.708 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: Bab 3 inferensial sederhana untuk kategori data

Bab 3

Inference sederhana untuk Data kategoris :

Dari Keyakinan dalam

Akhirat dengan Hukuman Mati dan Ras

3.1 Deskripsi Data

Dalam bab ini , kita akan membahas beberapa aspek yang relatif sederhana dari analisis data

kategorikal . Kami akan mulai dengan menjelaskan bagaimana membangun lintas - klasifikasi data

mentah menggunakan umur tikus dan usia saat perkawinan data yang digunakan dalam bab

sebelumnya . Kemudian kita akan melanjutkan untuk memeriksa sejumlah set data yang pengamatan

sudah ditabulasi dengan cara ini . Rincian tersebut adalah sebagai berikut :

Keyakinan di akhirat berdasarkan gender - data dari Survei Sosial Umum 1991 mengklasifikasikan

sampel orang Amerika menurut jenis kelamin mereka dan pendapat mereka tentang kehidupan setelah

kematian ( diambil dari Agresti 1996, dengan izin dari penerbit ) . Data muncul dalam Tabel 3.1 .

Insiden keinginan bunuh diri pada sampel psikotik dan pasien neurotik - diberikan dalam Tabel 3.2 (

diambil dari Everitt , 1992) .

Tabel 3.1 Keyakinan di Alam Baka

Jenis Kelamin Perempuan 435 147

Pria 375 134

Tabel 3.2 Insiden Perasaan bunuh diri di Sampel psikotik dan neurotik Pasien

Keinginan bunuh diri ? Ya 1 4

No 19 16

Tabel 3.3 Kontrasepsi Oral

kontrol

Oral kontrasepsi Kontrasepsi Oral Tidak Digunakan

Kasus Digunakan 10 57

Tidak digunakan 13 95

Psikiater mempelajari pasien neurotik dan psikotik , meminta masing-masing sampel 20 dari setiap

kategori tentang apakah mereka menderita keinginan bunuh diri .

Penggunaan dan pembekuan darah kontrasepsi oral - data yang diberikan dalam Tabel 3.3 . Data ini

muncul dari sebuah studi yang dilaporkan oleh Sartwell et al . ( 1969) . Penelitian ini dilakukan di

sejumlah rumah sakit di beberapa kota besar di Amerika . Di rumah sakit tersebut , semua perempuan

yang sudah menikah diidentifikasi sebagai menderita idiopatik tromboemboli ( gumpalan darah )

selama tiga tahun secara individual cocok dengan kontrol yang sesuai , pasien perempuan yang

dibuang hidup-hidup dari rumah sakit yang sama dalam interval waktu enam bulan yang sama sebagai

kasus . Selain itu, mereka secara individual dicocokkan dengan kasus berdasarkan usia , status

perkawinan , ras, dll Pasien dan kontrol kemudian diminta tentang penggunaan kontrasepsi oral .

Alkohol dan bayi malformasi - data dari studi prospektif minum ibu dan malformasi kongenital (

diambil dari Agresti 1996, dengan izin dari penerbit ) . Setelah pertama

Tabel 3.4 Konsumsi Alkohol dan Bayi Malformasi

cacat

hadir Absen

Jumlah rata-rata minuman per hari 0 48 17066

< 1 38 14464

Page 2: Bab 3 inferensial sederhana untuk kategori data

01-02 Mei 788

03-05 Januari 126

u6 1 37

Tabel 3.5 Ras dan Hukuman Mati di AS

Hukuman Mati Tidak

Hukuman Mati

korban putih

Putih terdakwa bersalah atas pembunuhan 192 1320

Hitam terdakwa bersalah atas pembunuhan Hitam korban 110 520

Putih terdakwa bersalah atas pembunuhan 0 90

Hitam terdakwa bersalah atas pembunuhan 60 970

tiga bulan kehamilan , perempuan dalam sampel menyelesaikan kuesioner tentang konsumsi alkohol .

Setelah melahirkan , pengamatan dicatat pada ada atau tidak adanya bawaan seks malformasi organ .

Data dapat dilihat pada Tabel 3.4 .

Kematian hukuman vonis oleh ras terdakwa dan ras korban - data dalam Tabel 3.5 ( diambil dari

Everitt , 1999) . Data dikumpulkan untuk mencoba untuk membuang cahaya pada apakah ada

kesetaraan rasial dalam penerapan hukuman mati di AS

3.2 Metode Analisis

Tabel kontingensi adalah salah satu cara yang paling umum untuk merangkum pengamatan pada dua

variabel kategori . Tabel 3.1 , 3.2 , dan 3.3 merupakan contoh 2 v 2 tabel kontingensi (meskipun Tabel

3.3 muncul dalam cukup dengan cara yang berbeda seperti yang akan kita bahas nanti ) . Tabel 3.4

adalah contoh dari 5 v 2 tabel kontingensi di mana klasifikasi baris diperintahkan . Tabel 3.5 pada

dasarnya terdiri dari dua , 2 v 2 tabel kontingensi . Untuk semua tabel , bunga umumnya berada dalam

menilai apakah atau tidak ada hubungan atau hubungan antara variabel baris dan variabel kolom yang

membentuk meja . Paling umum, uji chi - kuadrat kemerdekaan digunakan untuk menjawab

pertanyaan ini , meskipun alternatif seperti uji eksak Fisher atau tes McNemar mungkin diperlukan

ketika ukuran sampel kecil (uji Fisher ) atau data terdiri dari sampel cocok (uji McNemar ) . Selain

itu, dalam 2 v 2 tabel , mungkin diperlukan untuk menghitung interval kepercayaan untuk rasio

proporsi populasi . Untuk seri 2 v 2 tabel , uji Mantel - Haenszel mungkin tepat ( lihat nanti ) . (

Rekening Singkat masing-masing tes disebutkan diberikan dalam Kotak 3.1 . Sejumlah topik lain

yang perlu dipertimbangkan kemudian dalam bab ini dijelaskan dalam Kotak 3.2 . )

Kotak 3.1 Pengujian Two-Way Tabel

( 2 ) uji Chi - kuadrat untuk r v c tabel kategori

Sebuah v tabel kontingensi c r dapat ditulis sebagai

kolom Variabel

1 c Jumlah

baris

variabel 1

2 N11 N21

n1c N2C n1 n2 • •

r nr1 nrc nr •

Jumlah n • 1 n • c N

Berdasarkan hipotesis nol bahwa baris dan kolom klasifikasi independen , nilai estimasi yang

diharapkan , Eij , untuk sel ijth dapat ditemukan sebagai

ni.n . j

Page 3: Bab 3 inferensial sederhana untuk kategori data

Eij ! N

Uji statistik untuk menilai kemerdekaan

2 r c nij Eij

X ! § §

2

E

i ! 1 j ! 1 ij

Di bawah hipotesis nol kemerdekaan , X2 memiliki distribusi chi -squared asimtotik dengan ( r - 1 ) (

c - 1 ) derajat kebebasan . ( 3 ) uji eksak Fisher untuk 2 tabel v2

Probabilitas , P , setiap pengaturan tertentu frekuensi a, b , c , dan d dalam 2 v 2 tabel kontingensi ,

ketika total marjinal tetap dan dua variabel independen, adalah

b ! c ! c d ! b d !

P !

a ! b ! c ! d ! N !

dimana ai , bi , ci , di mewakili jumlah dalam empat sel dari tabel i dan Ni adalah jumlah total

pengamatan dalam tabel engan .

Berdasarkan hipotesis nol , statistik ini memiliki distribusi chi - kuadrat dengan derajat kebebasan

tunggal .

Tes ini hanya tepat jika derajat dan arah hubungan antara dua variabel adalah sama di setiap strata .

Sebuah tes mungkin asumsi ini adalah bahwa karena Breslow dan Hari (lihat Agresti , 1996) .

( Rincian lengkap dari semua tes ini diberikan dalam Everitt , 1992 . )

Kotak 3.2 Estimasi Risiko dari 2 Tabel v2

2 v 2 tabel kontingensi sering muncul dalam penelitian medis menyelidiki hubungan antara mungkin "

faktor risiko " dan terjadinya kondisi medis tertentu, sejumlah istilah timbul dari penggunaannya

dalam konteks ini bahwa kita akan menentukan di sini, sehingga mereka dapat digunakan dalam teks .

( 1 ) Risiko relatif

Risiko Variabel 2 jatuh ke kategori " 1 " ketika Variabel

1 mengambil kategori " 1 " diperkirakan oleh r1 =

a b

Demikian pula , risiko Variabel 2 jatuh ke kategori " 1 " ketika

c Variabel 1 mengambil kategori " 2 " diperkirakan oleh r2 =

c d

Risiko relatif ( RR ) Variabel 2 jatuh ke kategori " 1 " membandingkan Variabel 1 kategori " 1 "

dengan kategori " 2 " diperkirakan

a b

oleh RR =

c c d

Risiko relatif mendapat penyakit membandingkan individu yang terpapar faktor risiko dengan

individu tidak terpapar hanya dapat diperkirakan dari studi prospektif (lihat Dunn dan Everitt , 1993) .

( 2 ) Odds ratio Kemungkinan Variabel 2 jatuh ke kategori " 1 " ketika Variabel 1 mengambil kategori

" 1 " diperkirakan oleh o1 = b

Demikian pula , kemungkinan Variabel 2 jatuh ke kategori " 1 " ketika c Variabel 1 mengambil

kategori " 2 " diperkirakan oleh o2 = d Rasio odds ( OR ) Variabel 2 jatuh ke kategori " 1 "

membandingkan 1 kategori Variabel " 1 " dengan kategori " 2 " diperkirakan

Page 4: Bab 3 inferensial sederhana untuk kategori data

a b

dengan OR = c d

Kemungkinan rasio penyakit membandingkan individu yang terpapar faktor risiko dengan individu

tidak terpapar dapat diperkirakan dari kedua studi prospektif dan retrospektif . ( Sekali lagi , lihat

Dunn dan Everitt , 1993 . )

Bila penyakit ini jarang terjadi ( misalnya, kurang dari 5 % dari populasi dipengaruhi ) , RR populasi

dapat didekati dengan OR ( Dunn dan Everitt , 1993) .

3.3 Analisis Menggunakan SPSS

Hal ini umum di banyak bidang penelitian untuk variabel kontinyu untuk dikonversi menjadi variabel

kategori dengan mengelompokkan mereka , sebelum analisis , menjadi dua atau lebih kategori ,

meskipun diketahui bahwa hal ini tidak selalu prosedur bijak (lihat Altman , 1998 ) . Dalam dua

bagian berikutnya kita menggunakan variabel kontinyu dari data set diperkenalkan pada bab

sebelumnya untuk menggambarkan bagaimana variabel kontinu dapat dikategorikan dalam SPSS dan

bagaimana , hasil sekali kategoris yang tersedia, ini dapat dengan mudah diringkas menggunakan

tabulasi silang .

3.3.1 Suami dan Istri Revisited

Sebuah kategorisasi yang cukup luas dari usia saat menikah ( Tabel 2.2 ) diberikan oleh tiga kategori "

Pernikahan dini " ( sebelum usia 30 tahun ) , " Pernikahan di usia pertengahan " ( pada usia antara 30

dan 49 tahun inklusif ) , dan "Late pernikahan " ( pada usia 50 atau lebih) . Perintah Recode di SPSS

berguna untuk membuat pengelompokan. Untuk mengkategorikan kedua variabel usia, kita dapat

menggunakan langkah-langkah berikut :

Akses perintah Transform - Recode - Ke Variabel yang berbeda ....

Isi kotak dialog yang dihasilkan seperti ditunjukkan dalam Tampilan 3.1 ( kami telah diberi label

variabel kategori baru) .

Klik tombol Nilai Lama dan Baru ... untuk membuka kotak dialog sub - .

Gunakan kotak ini untuk memetakan rentang variabel asli ke angka integer seperti yang ditunjukkan

dalam Tampilan 3.1 .

Klik Lanjutkan dan OK untuk mengeksekusi pengodean ulang tersebut .

Prosedur ini menghasilkan dua variabel baru , husCAT dan wifCAT , akan ditambahkan pada data

View spreadsheet . Untuk setiap pasangan , spreadsheet sekarang menunjukkan suami dan usia istri

saat menikah, serta kategori yang sesuai . ( Untuk memastikan bahwa analisis nantinya akan berisi

penjelasan dari kategori bukan hanya mencetak kode kategori , itu adalah ide yang baik untuk selalu

label kode kategori menggunakan Variable View . )

Tabulasi silang berfungsi untuk merangkum band usia pernikahan untuk kedua suami dan istri serta

hubungan mereka . Sebuah tabulasi silang dari data usia dikategorikan dapat dibangun dengan

menggunakan perintah

Analisa - Statistik Deskriptif - Tabulasi Frekuensi ...

Ini akan membuka kotak dialog yang ditunjukkan dalam Tampilan 3.2 . Kita perlu menentukan

variabel yang menentukan baris dan kolom yang tabulasi silang tersebut . Di sini kita memilih band

usia bagi suami untuk menentukan baris dari tabel dan orang-orang dari istri kolom . Mengklik Sel ...

tombol membuka Tampilan sub-kotak dialog Cell; ini mengontrol apa angka akan ditampilkan untuk

setiap sel dari dibangun klasifikasi silang . Memilih frekuensi mutlak diamati setiap sel serta frekuensi

sebagai persentase dari jumlah total pasangan dalam penelitian ini mengarah ke tabel output

ditunjukkan dalam Tampilan 3.3 .

The tabulasi silang menampilkan distribusi frekuensi dari band usia bagi suami dan istri dalam kolom

terakhir dan baris , masing-masing. Seperti yang terlihat sebelumnya ( misalnya , Bab 2 , Layar 2.14 )

, sebagian besar orang yang menikah menikah sebelum usia 30 . Hubungan antara suami 'dan istri '

usia pada perkawinan juga jelas . Sejak 48 % + 27 % + 8 % = 83 % dari pasangan , suami dan istri

Page 5: Bab 3 inferensial sederhana untuk kategori data

berada di usia band yang sama pada saat pernikahan. Sel-sel kosong dalam acara tabel yang " tua "

istri tidak menikah dengan " muda " laki-laki dan bahwa laki-laki lebih tua dari 50 tahun

band usia bagi suami band usia * untuk istri Crosstabulation

band usia bagi istri Jumlah

lebih muda dari

30 tahun 30-49 tahun 50 tahun atau lebih tua

band usia bagi suami lebih muda dari 30 tahun Hitungan

% Total 48

48,0% 4

4,0% 52

52,0 %

30-49 tahun Penghitungan

% Dari total 6

6,0% 27

27,0 % 33

33,0 %

50 tahun atau lebih tua Hitung

% Total 7

7,0% 8

8,0 % 15

15,0 %

total Perhitungan

% Total 54

54,0 % 38

38,0 % 8

8,0 % 100

100,0 %

Tampilan 3.3 Cross- klasifikasi band usia bagi istri dan suami .

diet * umur kurang dari 2 tahun ? Crosstabulation

Umur kurang dari 2 tahun ? total

Ya Tidak

Diet Dibatasi diet Hitungan

% Dalam diet 17

16,0 % 89

84,0 % 106

100,0 %

Ad libitum diet Hitung

% Dalam diet 52

58,4 % 37

41,6 % 89

100,0 %

total Perhitungan

% Dalam diet 69

35,4 % 126

64,6 % 195

100,0 %

Tampilan 3.4 Cross- tabulasi umur dengan diet .

tidak menikah dengan istri lebih dari 20 tahun yunior mereka (setidaknya di Cumberland County ) .

3.3.2 rentang hidup Tikus Revisited

Page 6: Bab 3 inferensial sederhana untuk kategori data

Rentang hidup tikus kumpulan data ( Tabel 2.1 ) sudah berisi satu hasil kategoris - diet . Kami

sekarang akan juga recode variabel umur terus menerus ke dalam variabel kategoris lanjut berlabel "

umur kurang dari 2 tahun ? " Dengan dua kategori ( 1 = " Ya " dan 2 = " Tidak ada " ) , lagi dengan

menggunakan perintah recode . Diet dan variabel umur dikategorikan kemudian dapat crossclassified

seperti pada contoh sebelumnya .

Karena ukuran kelompok diet berada di bawah kendali dari penyidik dalam contoh ini , masuk akal

untuk mengekspresikan jumlah sel sebagai persentase dalam kelompok diet . Jadi kita menetapkan

kategori diet untuk deretan kami klasifikasi silang dan periksa Row di Tampilan sub-kotak dialog Cell

( lihat Tampilan 3.2 ) . Hasil tabulasi silang ditunjukkan dalam Tampilan 3.4 . Kita melihat bahwa 84

% dari tikus dalam kelompok diet terbatas tinggal selama setidaknya dua tahun , sementara persentase

yang lebih rendah ( 41,6 % ) mencapai

Perkiraan risiko

Nilai Keyakinan 95 %

selang

Turunkan atas

Odds Ratio untuk diet ( diet Dibatasi / Iklan diet libitum )

Untuk kelompok umur kurang dari 2 tahun ? = 1.00

Untuk kelompok umur kurang dari 2 tahun ? = 2.00

U dari Valid Kasus .136

0,274

2.020

195 .070

0,172

1,557 0,265

0,439

2,619

Tampilan 3.5 keluaran risiko untuk umur oleh diet tabulasi silang di Tampilan 3.4 .

usia ini dalam kelompok ad libitum . Dinyatakan sebagai rasio risiko , jumlah ini risiko relatif

kematian sebelum usia 2 tahun membandingkan diet terbatas dengan diet secara ad libitum (17/ 106) :

(52/ 89) = 0,274 . Dengan kata lain , untuk tikus pada diet terbatas , risiko kematian dini adalah sekitar

seperempat bahwa tikus pada diet ad libitum .

Untuk 2 v 2 tabel , seperti yang di Tampilan 3.4 , risiko relatif ( RR ) dan odds ratio ( OR ) perkiraan (

untuk definisi lihat Kotak 3.2 ) , bersama-sama dengan confidence interval yang sesuai ( CI ) dapat

diperoleh di SPSS menggunakan langkah-langkah :

Klik tombol Statistik pada kotak dialog Tabulasi Frekuensi (lihat Tampilan

3.2 ) .

Periksa Risiko pada kotak sub - dialog yang dihasilkan.

Mengeksekusi perintah ini menambahkan tabel lebih lanjut untuk output . Ini " Risiko Perkiraan "

meja untuk umur oleh diet tabulasi silang ditunjukkan dalam Tampilan 3.5 .

Untuk memahami OR dan RRS disajikan dalam tabel ini , kita perlu menyadari perbandingan yang

digunakan oleh SPSS . Secara default ( dan kita tidak menyadari cara untuk mengubah ini ) , SPSS

menyajikan salah satu ATAU diikuti oleh dua RRS . OR membandingkan kemungkinan kategori

sesuai dengan kolom pertama dari tabulasi silang , antara kategori diwakili oleh baris pertama dan

kedua . Jadi , untuk tabulasi silang ditunjukkan dalam Tampilan 3.4 , kemungkinan hidup kurang dari

dua tahun yang dibandingkan antara kelompok diet terbatas dan kelompok ad libitum (diperkirakan

OR = 0.14 , 95 % CI 0,07-0,265 ) . Pertama nilai RR adalah perbandingan yang sama tapi kali ini

membandingkan risiko daripada odds ( diperkirakan RR = 0,274 , 95 %

CI 0,172-0,439 ) . RR lalu membandingkan risiko kategori

diet

Page 7: Bab 3 inferensial sederhana untuk kategori data

Tampilan 3,6 Clustered bar chart untuk umur oleh diet tabulasi silang .

diwakili oleh kolom kedua antara pertama dan baris kedua dari tabel . Untuk tabulasi silang di Layar

3.4 , ini berarti bahwa " risiko " hidup minimal 2 tahun sedang dibandingkan ( diperkirakan RR = 2,02

, 95 % CI 1,557-2,619 ) .

Dalam prakteknya pengaturan default SPSS berarti bahwa kelompok-kelompok yang akan

dibandingkan harus mendefinisikan baris tabel tersebut . Karena baris pertama selalu dibandingkan

dengan kedua dan SPSS secara otomatis menempatkan kategori dengan kode terkecil ke baris pertama

, kode variabel kategoris harus dipilih yang sesuai . Dalam aplikasi ini , misalnya, kita dibatasi untuk

membandingkan kelompok diet terbatas ( yang diberi kode 1 ) dengan kelompok ad libitum ( kode 2 )

dan bukan sebaliknya . Kolom pertama ( terendah kode kategori ) mendefinisikan kategori yang risiko

atau kemungkinan yang menarik . Sekali lagi , setidaknya untuk OR , disarankan untuk kode data

sehingga kategori minat menerima kode terendah .

Kadang-kadang masalah untuk menampilkan tabel frekuensi grafis . Salah satu kemungkinan adalah

untuk memeriksa Tampilan grafik batang berkerumun di kotak dialog Tabulasi Frekuensi (lihat

Tampilan 3.2 ) . Ini menghasilkan bar chart berkerumun dengan deretan salib - klasifikasi

mendefinisikan cluster dan kolom mendefinisikan pola . Tampilan 3.6 menunjukkan jenis plot untuk

tabulasi silang di Tampilan 3.4 ( setelah mengedit penampilan sedikit untuk presentasi ) .

Sekarang , kita beralih ke mempertimbangkan data set diperkenalkan awal yang benar-benar muncul

dalam bentuk tabel kontingensi .

3.3.3 Keyakinan di Alam Baka

Kita mulai dengan mengimpor klasifikasi silang pada Tabel 3.1 ke SPSS . Untuk mereproduksi tabel

di SPSS , kita perlu mendefinisikan tiga variabel , dua berhubungan dengan dua hasil kategoris

kepentingan, gender dan keyakinan , dan variabel lanjut , di sini disebut count , yang memegang

jumlah sel . Tabel diterjemahkan ke Data View spreadsheet seperti yang ditunjukkan dalam Tampilan

3.7 . Setiap sel tabel menempati baris dalam spreadsheet dan jumlah sel disertai dengan kode kategori

untuk baris yang sesuai dan kolom . (The variabel kategori masing-masing diberi label dengan kode

kategori mereka seperti pada Tabel 3.1 untuk memfasilitasi interpretasi hasil kemudian. )

Kita sekarang perlu menentukan struktur yang benar dari data yang ditentukan dalam Tampilan 3.7 ,

jika tidak, maka akan ditafsirkan oleh SPSS sebagai kumpulan data yang berisi hanya empat

pengamatan . Untuk ini, kita perlu perintah

Data - Berat Kasus ...

Ini akan membuka kotak dialog yang ditunjukkan dalam Tampilan 3.8 . Memeriksa kasus Berat oleh

memungkinkan pengguna untuk mereplikasi setiap sel k kali di mana k ditentukan oleh Variabel

Frekuensi , di sini jumlah variabel . Perhatikan bahwa menggunakan perintah Kasus Berat tidak

mengubah penampilan spreadsheet .

Jenis Kelamin * Kepercayaan di akhirat ? Crosstabulation

Keyakinan di akhirat ? total

Ya Tidak

Jenis kelamin Hitungan

% Dalam Kelamin 435

74,7 % 147

25,3 % 582

100,0 %

Pria Hitungan

% Dalam Kelamin 375

73,7 % 134

26,3 % 509

100,0 %

Page 8: Bab 3 inferensial sederhana untuk kategori data

total Perhitungan

% Dalam Kelamin 810

74,2 % 281

25,8 % 1091

100,0 %

Tampilan 3,9 Cross- tabulasi variabel kategori di Tampilan 3.7 .

Kita sekarang dapat menggunakan perintah Tabulasi Frekuensi seperti sebelumnya untuk

menghasilkan tabulasi silang dari hasil kategoris keyakinan dan gender. Menggunakan jender untuk

menentukan baris dan memilih untuk mengekspresikan dianggap sebagai persentase hasil baris dalam

tabel ditunjukkan dalam Tampilan 3.9 .

Persentase baris menunjukkan bahwa 74,7 % dari perempuan dan 73,7 % dari laki-laki dalam studi ini

percaya pada kehidupan setelah kematian . Apakah ini perbedaan jenis kelamin yang diamati dalam

sampel kami menunjukkan hubungan populasi antara gender dan keyakinan tentang kehidupan setelah

kematian ? Kita bisa menjawab pertanyaan ini dengan uji chisquared untuk kemerdekaan , yaitu ,

tidak ada hubungan (untuk rincian lihat Kotak 3.1 ) . Untuk menerapkan tes ini , kita perlu memeriksa

Chi -square dalam kotak sub - dialog Statistik (Display 3.10 ) . Ini menambahkan meja lain untuk

output - melihat Tampilan 3.11 .

Baris pertama dari " Chi -Square Tes " tabel memberikan hasil dari uji chi - kuadrat kemerdekaan .

Juga disediakan adalah kontinuitas dikoreksi versi tes ini ( untuk rinciannya, lihat Everitt , 1992) dan

uji rasio kemungkinan kemerdekaan berasal dari model statistik tertentu ( untuk rinciannya, lihat lagi

Everitt , 1992) . Tes yang tersisa akan dibahas dalam bagian berikutnya .

Standar uji chi- kuadrat kemerdekaan tidak memberikan bukti hubungan antara gender dan keyakinan

tentang akhirat ( X2 ( 1 ) = 0,16 , p = 0,69 ) , penggunaan kontinuitas dikoreksi versi atau uji rasio

kemungkinan tidak mengubah kesimpulan ini . Akibatnya, untuk meringkas keyakinan tentang akhirat

kita mungkin hanya menggunakan distribusi marjinal dalam Tampilan 3.9 , jenis kelamin responden

dapat diabaikan , 74,2 % dari responden percaya pada kehidupan setelah kematian , sedangkan

sisanya tidak.

3.3.4 Insiden Perasaan Suicidal

The tabulasi silang dari keinginan bunuh diri oleh kelompok pasien ditunjukkan pada Tabel 3.2 dapat

dikonversi menjadi data Lihat spreadsheet dengan mengikuti coding yang sama dan langkah-langkah

pembobotan seperti pada contoh sebelumnya . Dan cross-

b . 0 sel ( 0% ) diharapkan menghitung kurang dari 5 . Minimum jumlah yang diharapkan adalah

131.10 .

Tampilan 3.11 uji Chi - kuadrat untuk tabulasi silang di Tampilan 3.9 .

Klasifikasi lagi dapat dibuat dengan menggunakan kotak Tabulasi Frekuensi . Untuk data ini , kita

akan transpos tabel asli , karena kita ingin menampilkan tabel sebagai grafik batang ditumpuk dengan

tumpukan mewakili kelompok yang sama besar , dan menentukan kategori baris berdasarkan tipe

pasien . Langkah-langkah SPSS yang diperlukan :

Jenis Pasien * perasaan bunuh diri ? Crosstabulation

Keinginan bunuh diri ? total

Ya Tidak

Pasien jenis psikotik Hitungan

diharapkan Hitung

% Dalam jenis Pasien

sisa

Std . sisa 1

2.5

Page 9: Bab 3 inferensial sederhana untuk kategori data

5,0%

-1.5

- .9 19

17,5

95,0 %

1.5

.4 20

20,0

100,0 %

neurotik Hitungan

diharapkan Hitung

% Dalam jenis Pasien

sisa

Std . sisa 4

2.5

20,0 %

1.5

.9 16

17,5

80,0 %

-1.5

- .4 20

20,0

100,0 %

total Perhitungan

diharapkan Hitung

Pasien % dalam tipe 5

5.0

12,5 % 35

35.0

87,5 % 40

40.0

100,0 %

Tampilan 3.12 Cross- tabulasi keinginan bunuh diri oleh kelompok pasien .

Periksa Tampilan Clustered bar chart dalam kotak dialog Tabulasi Frekuensi .

Periksa chisquare dalam Statistik sub-kotak dialog (lihat Tampilan 3.10 ) .

Periksa Hitungan diamati , Hitungan Diharapkan , Residu unstandardixed , Residu Standar , dan

Persentase Row di Tampilan sub-kotak dialog Cell ( lihat Tampilan 3.2 ) .

Yang dihasilkan 2 v 2 tabel ditunjukkan pada Tampilan 3.12 . Dalam menanggapi perintah grafik ,

SPSS awalnya menghasilkan bar chart berkerumun , ini dapat dengan mudah berubah menjadi bar

chart ditumpuk dengan menggunakan perintah

Galeri - Bar ... - Stacked - Ganti

di Editor Bagan . Grafik akhir bar ditunjukkan dalam Tampilan 3.13 .

Tabel dan grafik menunjukkan bahwa persentase pasien yang diamati dengan perasaan bunuh diri

dalam sampel pasien neurotik ( 20 % ) jauh lebih tinggi daripada dalam sampel pasien psikotik ( 5 % )

. Cara alternatif memeriksa keberangkatan dari kemerdekaan adalah untuk membandingkan jumlah

diamati pada sel-sel tabel dengan yang diharapkan di bawah kemerdekaan baris dan variabel kolom (

untuk rincian tentang perhitungan jumlah yang diharapkan , lihat Kotak 3.1 ) . Perbedaannya disebut

residual , dengan nilai-nilai positif menunjukkan frekuensi sel lebih tinggi dari yang diharapkan . Di

sini kita akan melihat lagi bahwa keinginan bunuh diri lebih terwakili pada pasien neurotik . Lebih

Page 10: Bab 3 inferensial sederhana untuk kategori data

berguna daripada residu mentah residual standar (lihat Everitt , 1992) yang ditingkatkan sehingga

mereka mencerminkan kontribusi masing-masing sel untuk tes statistik dari uji chi - squared ,

akibatnya , mereka berguna untuk

Jenis pasien

Tampilan 3.13 Stacked bar chart perasaan bunuh diri dalam jenis pasien .

mengevaluasi kontribusi relatif dari sel untuk asosiasi diamati antara baris dan kolom variabel .

Seperti pada contoh sebelumnya , kami tertarik untuk menguji apakah ini hubungan yang diamati

antara baris dan kolom variabel merupakan bukti untuk asosiasi pada populasi yang mendasarinya .

Tapi , berbeda dengan kumpulan data sebelumnya , uji chi -squared standar ini mungkin tidak

sepenuhnya tepat karena jumlah sel yang diharapkan di bawah kemandirian keinginan bunuh diri dan

kelompok pasien mungkin terlalu kecil untuk membenarkan pendekatan chi - kuadrat ( lihat Kotak 3.1

) . Tampilan 3.12 menunjukkan bahwa hanya 5 orang melaporkan keinginan bunuh diri dalam

penelitian ini dan , sebagai hasilnya , penghitungan diharapkan dalam sel-sel dari kolom pertama agak

kecil . Bahkan , SPSS memperingatkan tentang hal ini dalam output uji chi - kuadrat (Display 3.14 ) .

Sebuah tes alternatif yang cocok kemerdekaan dalam situasi ini adalah uji eksak Fisher . Tes ini tidak

menggunakan pendekatan untuk memperoleh distribusi dari statistik uji di bawah hipotesis nol ,

melainkan distribusi yang tepat dari frekuensi sel mengingat total marjinal digunakan ( untuk rincian ,

lihat Kotak 3.1 ) . Untuk 2 v 2 tabel , SPSS otomatis pasokan uji eksak Fisher saat chisquare diperiksa

dalam Statistik sub-kotak dialog . ( Tes Persis untuk meja yang lebih besar juga mungkin, . Lihat

Latihan 3.4.2 )

Output Uji hanya terdiri dari tepat p - nilai untuk dua sisi dan uji satu sisi , karena uji statistik adalah

susunan sel diamati

Tes chi -Square

Nilai df Asymp . Sig . ( 2-sisi ) Exact Sig . ( 2-sisi ) Exact Sig . ( 1 - sisi)

Pearson Chi -Square

kontinuitas Correctiona

Rasio kemungkinan

Fisher Exact Test

Linear - by- Linear

asosiasi

N dari Valid Kasus 2.057b

0,914

2,185

2,006

40 1 1

1

1 0,151

0,339

0,139

0,157 0,342 0,171

a . Dihitung hanya untuk tabel 2x2

b . 2 sel ( 50,0 % ) diharapkan menghitung kurang dari 5 . Minimum jumlah yang diharapkan adalah

2,50 .

Tampilan 3.14 uji eksak Fisher untuk tabulasi silang di Layar 3.12 .

Kasus : Kontrasepsi yang digunakan ? * Cocok kontrol : Kontrasepsi yang digunakan ?

Crosstabulation

Kontrol cocok : Kontrasepsi yang digunakan ? total

Ya Tidak

Page 11: Bab 3 inferensial sederhana untuk kategori data

Kasus : Kontrasepsi yang digunakan ? Ya Hitungan

% Dari total 10

5,7 % 57

32,6 % 67

38,3 %

Tidak ada Penghitungan

% Total 13

7,4% 95

54,3 % 108

61,7 %

total Perhitungan

% Total 23

13,1 % 152

86,9 % 175

100,0 %

Tampilan 3.15 Cross- tabulasi penggunaan kontrasepsi pada kasus dan kontrol mereka cocok .

(Display 3.14 ) . Di sini kita melaksanakan uji dua sisi , karena kita tidak punya pendapat sebelum

mengenai arah perbedaan kelompok mungkin dalam proporsi memiliki keinginan bunuh diri . Pada

tingkat signifikansi 5 % , uji eksak Fisher tidak menemukan bukti hubungan antara jenis pasien dan

keinginan bunuh diri ( p = 0,34 ) .

3.3.5 Oral Kontrasepsi Penggunaan dan Gumpalan darah

The tabulasi silang dari penggunaan kontrasepsi pada wanita dengan idiopatik tromboemboli dan

kontrol mereka cocok ditunjukkan pada Tabel 3.3 , yang pertama kali masuk ke SPSS menggunakan

langkah yang sama seperti pada dua contoh sebelumnya . Yang dihasilkan tabel output , kali ini

menunjukkan persentase jumlah pasangan yang cocok , akan ditampilkan dalam Tampilan 3.15 .

Tes chi -Square

Nilai Sig Exact .

( 2 - sisi)

McNemar Uji

N Kasus Valid 175 .000 a

a . Distribusi binomial digunakan .

Tampilan 3.16 tes McNemar untuk tabulasi silang di Layar 3.15 .

Pada pandangan pertama , tabel ini tampak serupa dengan yang dianalisis dalam dua bagian

sebelumnya . Namun, ini tabulasi silang berbeda dari yang sebelumnya dalam beberapa aspek

penting. Sebelumnya, kami ditabulasi dua variabel kategori yang berbeda yang diukur pada set yang

sama mata pelajaran . Sekarang , kami sedang mempertimbangkan tabulasi silang dari hasil yang

sama ( penggunaan kontrasepsi ) tapi diukur dua kali ( sekali pada pasien dan sekali kontrol mereka

cocok ) . Akibatnya , jumlah total sel ( N = 175 ) merupakan jumlah pasangan yang cocok daripada

jumlah individu mengambil bagian dalam studi ini .

Sifat yang berbeda dari ini tabulasi silang berimplikasi pada pertanyaan-pertanyaan yang mungkin

menarik . Dalam tabulasi silang sebelumnya, kita diuji untuk hubungan antara baris dan variabel

kolom . Dalam v 2 tabel 2 , ini hanya berjumlah menguji hipotesis eksperimental bahwa persentase

satu kategori variabel pertama berbeda antara kategori dari variabel kedua. Pertanyaan semacam ini

tidak menarik untuk saat tabulasi silang . ( Kami akan menguji apakah persentase kontrol cocok

menggunakan alat kontrasepsi adalah sama pada pasien yang menggunakan kontrasepsi dan mereka

yang tidak ! ) Sebaliknya , kami tertarik dalam menilai apakah kemungkinan faktor risiko potensial ,

penggunaan kontrasepsi , berbeda antara pasien dan kontrol mereka cocok . Dalam hal tabel di Layar

3,15 , itu adalah total marjinal ( 38,3 % dan penggunaan kontrasepsi 13,1 % , masing-masing, untuk

sampel kami pasien dan kontrol ) yang akan dibandingkan .

Page 12: Bab 3 inferensial sederhana untuk kategori data

Uji McNemar menilai hipotesis nol bahwa distribusi marginal penduduk tidak berbeda dan dapat

dihasilkan untuk tabulasi silang dengan memeriksa McNemar di kotak Statistik sub - dialog (lihat

Tampilan 3.10 ) . Yang dihasilkan tabel output ditunjukkan pada Tampilan 3.16 . SPSS menyediakan

nilai p untuk tes yang tepat ( lihat Kotak 3.1 ) . Uji dua sisi menunjukkan bahwa wanita yang

menderita pembekuan darah melaporkan tingkat signifikan lebih tinggi dari penggunaan kontrasepsi

dibandingkan kontrol ( p < 0,001 ) .

Atau , tes McNemar dapat dihasilkan dalam SPSS dengan menggunakan perintah :

Analisa - Tes Nonparametrik - 2 Sampel Terkait ...

Mendefinisikan pasangan variabel yang akan diuji dalam kotak dialog yang dihasilkan .

Dan memeriksa McNemar ( lihat Bab 2 , Layar 2.18) .

Ini secara otomatis menyediakan 2 v 2 tabulasi silang , uji statistik dari kontinuitas dikoreksi uji chi -

kuadrat , dan dihasilkan perkiraan nilai p ( lihat Kotak 3.1 ) .

3.3.6 Alkohol dan Bayi Malformasi

Kita sekarang beralih ke data pada minum ibu dan cacat bawaan pada Tabel 3.4 . Sekali lagi , pusat

bunga kemungkinan hubungan antara konsumsi alkohol dan kehadiran malformasi bayi . Tapi dalam

kasus ini , tes yang lebih kuat daripada uji chi -squared standar tersedia karena sifat memerintahkan

variabel baris . Di sini , hipotesis nol kemerdekaan dapat diuji terhadap alternatif yang lebih terbatas ,

yaitu , bahwa proporsi malformasi perubahan secara bertahap dengan meningkatnya konsumsi . Tes

tren linier untuk tabulasi silang menilai kemerdekaan melawan hipotesis alternatif ini ( untuk

rinciannya, lihat Everitt , 1992) .

Data pada Tabel 3.4 dapat diimpor ke SPSS seperti yang dijelaskan untuk tiga contoh sebelumnya .

Namun , karena di sini kami ingin memanfaatkan pemesanan kategori alkohol , kita perlu memastikan

bahwa coding kategori ini mencerminkan pesanan mereka . Akibatnya, kita menetapkan kode terkecil

ke tingkat konsumsi terkecil , dll Tampilan 3.17 memperlihatkan tabulasi silang dibuat melalui kotak

dialog Tabulasi Frekuensi . Kami menampilkan persentase baris karena kita sedang mencari

perubahan bertahap dalam persentase ini selama tingkat konsumsi .

Tabel tersebut menunjukkan bahwa dalam sampel kami , proporsi malformasi meningkat dengan

setiap kenaikan tingkat konsumsi . Namun, uji tren formal, yang secara otomatis dihasilkan ketika Chi

-square diperiksa

CONSUMPT * malformasi Crosstabulation

MALF Orma Jumlah

hadir absen

CONSUMPT 0 Hitung

% Dalam CONSUMPT 17066

99,7 % 48

.3 % 17114

100,0 %

kurang dari 1 Jumlah

% Dalam CONSUMPT 14464

99,7 % 38

.3 % 14502

100,0 %

1 sampai 2 Jumlah

% Dalam CONSUMPT 788

99,4 % 5

.6 % 793

100,0 %

3 sampai 5 Jumlah

% Dalam CONSUMPT 126

Page 13: Bab 3 inferensial sederhana untuk kategori data

99,2 % 1

.8 % 127

100,0 %

6 atau lebih Hitungan

% Dalam CONSUMPT 37

97,4 % 1

2,6 % 38

100,0 %

total Perhitungan

% Dalam CONSUMPT 32.481

99,7 % 93

.3 % 32.574

100,0 %

Tampilan 3.17 Cross- tabulasi malformasi bayi oleh konsumsi alkohol .

Tes chi -Square

Nilai df Asymp . Sig .

( 2-sisi ) Exact Sig .

( 2-sisi ) Exact Sig .

( 1 sisi ) Titik Probabilitas

Pearson Chi -Square

Rasio kemungkinan

Fisher Exact Test

Linear - by- Linear

asosiasi

N dari Valid Kasus 12.082a

6,202 10,458

b 1,828

32.574 4

4

1 0,017

0,185

0,176 0,034

0,133

0,033

0,179 0,105 0,028

a . 3 sel ( 30,0 % ) diharapkan menghitung kurang dari 5 . Minimum jumlah yang diharapkan adalah .

11 .

b . Yang standar statistik adalah 1,352 .

Tampilan 3.18 tes tren Linear untuk tabulasi silang di Layar 3.17 .

Statistik di kotak sub - dialog dan ditampilkan di bawah " Linear - by- Linear Association " menuju ke

" Tes Chi - Square" tabel output (Display 3.18 ) , menunjukkan bahwa hal ini tidak mungkin untuk

mencerminkan kecenderungan linier dalam populasi ( X2 ( 1 ) = 1,83, p = 0,18 ) .

3.3.7 Kematian Putusan Hukuman

Data yang ditunjukkan pada Tabel 3.5 ras dan hukuman mati di AS adalah klasifikasi tiga -arah dari

pengamatan asli . Untuk setiap percobaan dengan vonis pembunuhan positif , tiga hasil kategoris

dicatat : ras terdakwa , ras korban , dan penggunaan hukuman mati . Pertanyaan yang paling menarik

di sini adalah : " Apakah ada hubungan antara ras terdakwa bersalah atas pembunuhan dan

penggunaan hukuman mati ? " ( Ini tiga-cara klasifikasi dan contoh tatanan yang lebih tinggi dapat

diimpor ke SPSS dengan menggunakan coding dan langkah-langkah pembobotan digunakan pada

Page 14: Bab 3 inferensial sederhana untuk kategori data

contoh sebelumnya . satu-satunya perbedaan adalah bahwa variabel kategori lebih lanjut perlu

dikodekan . )

Sebagai ilustrasi , kita mulai dengan mengabaikan ras korban dan membangun klasifikasi dua arah

dengan menggunakan kotak dialog Tabulasi Frekuensi . Hasilnya akan ditampilkan di layar 3.19 .

Tabel tersebut menunjukkan bahwa persentase agak lebih tinggi dari terdakwa putih yang ditemukan

bersalah atas pembunuhan ( 12 % ) dihukum dengan hukuman mati dibandingkan dengan terdakwa

hitam ( 10,2 % ) . Pengujian untuk asosiasi dalam tabel ini dalam hasil cara yang biasa dalam nilai

chisquared 2,51 terkait dengan p-value sebesar 0,11 , nilai yang tidak memberikan bukti hubungan

antara ras terdakwa dan penggunaan hukuman mati .

Kita sekarang mengulangi analisis , kali ini dengan mempertimbangkan klasifikasi tiga -arah dengan

memperkenalkan ras korban . Sebuah salib - klasifikasi penggunaan hukuman mati oleh ras terdakwa

dalam sub kelompok ras korban dihasilkan dalam SPSS dengan mendefinisikan lapisan balap korban

dalam kotak dialog Tabulasi Frekuensi (Display 3.20 ) . The tabulasi silang baru (Display 3.21 ) ,

yang

Lomba terdakwa bersalah atas pembunuhan hukuman mati * diberikan ? Crosstabulation

Hukuman mati yang diberikan ? total

Ya Tidak

Lomba terdakwa bersalah atas pembunuhan Putih Penghitungan

% Dalam Race of terdakwa bersalah atas pembunuhan 192

12,0 % 1410

88,0 % 1602

100,0 %

Hitam Hitung

% Dalam Race of terdakwa bersalah atas pembunuhan 170

10,2 % 1490

89,8 % 1660

100,0 %

total Perhitungan

% Dalam Race of terdakwa bersalah atas pembunuhan 362

11,1 % 2900

88,9 % 3262

100,0 %

Tampilan 3.19 Cross- tabulasi kematian penggunaan hukuman oleh ras terdakwa .

ulangan Tabel 3.5 menunjukkan tingkat hukuman mati yang lebih tinggi atas pembunuhan korban

putih daripada korban hitam ( 14,1 % dibandingkan dengan 5,4 % ) dan dalam subkelompok ras

korban tingkat hukuman mati yang lebih rendah bagi terdakwa putih dibandingkan dengan terdakwa

hitam ( korban putih : 12,7 % dibandingkan dengan 17,5 % , korban hitam : 0 % dibandingkan dengan

5,8 % ) . Angka-angka ini tampaknya bertentangan dengan angka yang diperoleh dari Tampilan 3.19 .

Fenomena bahwa ukuran dari hubungan antara dua variabel kategori (di sini terdakwa ras dan

hukuman mati ) mungkin identik dalam tingkat variabel ketiga (di sini ras korban ) , tetapi mengambil

Lomba terdakwa bersalah atas pembunuhan hukuman mati * diberikan ? * Ras korban

Crosstabulation

Lomba hukuman mati korban diberikan ? total

Ya Tidak

Ras Putih terdakwa bersalah atas pembunuhan Putih Penghitungan

% Dalam Race of terdakwa bersalah atas pembunuhan 192

12,7 % 1320

87,3 % 1512

100,0 %

Page 15: Bab 3 inferensial sederhana untuk kategori data

Hitam Hitung

% Dalam Race of terdakwa bersalah atas pembunuhan 110

17,5 % 520

82,5 % 630

100,0 %

total Perhitungan

% Dalam Race of terdakwa bersalah atas pembunuhan 302

14,1 % 1840

85,9 % 2142

100,0 %

Hitam Ras terdakwa bersalah atas pembunuhan Putih Penghitungan

% Dalam Race of terdakwa bersalah atas pembunuhan 90

100,0 % 90

100,0 %

Hitam Hitung

% Dalam Race of terdakwa bersalah atas pembunuhan 60

5,8 % 970

94,2 % 1030

100,0 %

total Perhitungan

% Dalam Race of terdakwa bersalah atas pembunuhan 60

5,4 % 1060

94,6 % 1120

100,0 %

Tampilan 3.21 Cross- tabulasi yang dihasilkan oleh perintah di Layar 3.20 .

nilai yang sama sekali berbeda ketika variabel ketiga diabaikan dan ukuran dihitung dari tabel

dikumpulkan , dikenal sebagai paradoks Simpson dalam literatur statistik (lihat Agresti , 1996) .

Situasi seperti itu dapat terjadi jika variabel ketiga dikaitkan dengan kedua dari dua variabel lainnya .

Untuk memeriksa bahwa ini memang terjadi di sini , kita perlu cross- tabulasi ras korban dengan ras

terdakwa . ( Kita telah melihat bahwa ras korban dikaitkan dengan kematian penggunaan penalti di

Layar 3.21 . ) The crosstabulation baru (Display 3.22 ) menegaskan bahwa ras korban juga terkait

dengan variabel kedua , ras terdakwa , dengan mayoritas pembunuhan yang dilakukan oleh pelaku

dari ras yang sama dengan korban . Oleh karena itu, perbandingan awal tingkat hukuman mati antara

kelompok ras (lihat Tampilan 3.19 ) tidak dapat membedakan antara efek dari ras terdakwa dan ras

korban , dan hanya memperkirakan efek gabungan .

Kembali sekarang untuk benar klasifikasi tiga - jalan di Layar 3.21 , kami ingin melakukan tes resmi

kemerdekaan antara ras terdakwa dan penggunaan hukuman mati . Memeriksa chisquare dalam

Statistik sub-kotak dialog akan memasok tes chi - kuadrat terpisah untuk korban putih dan hitam , tapi

kami lebih memilih untuk melaksanakan tes secara keseluruhan . Tes MantelHaenszel ( untuk rincian

, lihat Kotak 3.1 ) adalah tes yang tepat dalam situasi ini selama kita bersedia untuk menganggap

bahwa tingkat dan arah hubungan potensial antara ras terdakwa dan hukuman mati adalah sama untuk

korban hitam dan putih .

Ras korban

Tampilan 3.22 Clustered bar chart untuk cross - tabulasi terdakwa ras dengan ras korban .

SPSS memasok uji Mantel - Haenszel untuk serangkaian 2 v 2 meja setelah memeriksa Cochran dan

statistik Mantel - Haenszel dalam kotak sub - dialog Statistik (lihat Tampilan 3.10 ) . Untuk data

hukuman mati , ini menghasilkan output yang ditunjukkan pada Menampilkan 3,23 dan 3,24 . Baris

kedua di Tampilan 3.23 memberikan hasil uji Mantel - Haenszel , dengan X2 ( 1 ) = 11,19 dan terkait

Page 16: Bab 3 inferensial sederhana untuk kategori data

p-value sebesar 0,001 , hal ini memberikan bukti kuat adanya hubungan antara penggunaan hukuman

mati dan ras terdakwa

Pengujian Homogenitas Rasio Kemungkinan

Statistik Chi - Squared df Asymp . Sig .

( 2 - sisi)

bersyarat

kemerdekaan

Homogenitas Cochran

Mantel - Haenszel

Breslow - Hari

TARone itu 11,642

11,193

3,844

3,833 1

1 1

1 .001

.001

.050

.050

Dengan asumsi kondisi independen , statistik Cochran adalah asimtotik didistribusikan sebagai 1 df

distribusi chi - kuadrat , hanya jika jumlah strata adalah tetap , sedangkan statistik Mantel - Haenszel

selalu asimtotik didistribusikan sebagai 1 df distribusi chi - kuadrat . Perhatikan bahwa koreksi

kontinuitas dihapus dari statistik Mantel - Haenszel ketika jumlah dari perbedaan antara diamati dan

diharapkan adalah 0 .

Tampilan 3.23 uji Mantel - Haenszel untuk tabulasi silang di Layar 3.21 .

Mantel- Haenszel umum Odds Ratio Estimate

Perkirakan ln ( Perkiraan )

Std . Kesalahan ln ( Perkiraan )

Asymp . Sig . ( 2-sisi )

Asymp . Keyakinan 95 %

Odds umum Interval

Rasio ln (Common Odds Ratio ) Bawah Bound Bound Atas Bawah Bound

Atas Bound 0,642-0,443 0,128

.001

0,499

0,825-0,695

- .192

The Mantel - Haenszel umum estimasi rasio odds adalah asimtotik normal didistribusikan di bawah

rasio odds umum 1.000 asumsi . Begitu juga dengan log natural dari perkiraan .

Tampilan 3.24 Mantel - Haenszel umum odds ratio estimator untuk tabulasi silang di Layar 3.21 .

meskipun hasil uji Breslow hari untuk homogenitas odds ratio dalam dua tabel melempar beberapa

keraguan pada asumsi homogenitas odds ratio .

Namun, jika kita memutuskan untuk tidak menolak asumsi homogenitas , kita dapat menemukan

perkiraan rasio odds umum diasumsikan . SPSS memperkirakan rasio odds umum dari kolom pertama

dalam tabulasi silang ( hukuman mati diberikan ) membandingkan baris pertama ( tergugat putih)

dengan baris kedua ( tergugat hitam) . Perkiraan dan interval kepercayaan 95 % ditunjukkan dalam

Tampilan 3.24 . The Mantel - Haenszel estimator rasio odds umum disajikan di baris pertama ( OR =

0,642 ) , menunjukkan bahwa kemungkinan hukuman mati hukuman berkurang sebesar 35,8 % untuk

terdakwa putih dibandingkan dengan terdakwa hitam. Sebuah interval kepercayaan untuk OR

Page 17: Bab 3 inferensial sederhana untuk kategori data

dibangun pada skala log menggunakan asymptotic normality dan karenanya SPSS memasok log - OR

dan standard error -nya . Final 95 % confidence interval untuk OR ( 0,499-0,825 ) menunjukkan

bahwa pengurangan hukuman mati peluang dalam putih relatif terhadap kulit hitam antara 17,5 % dan

50,1 % konsisten dengan data .

3.4 Latihan

3.4.1 depersonalisasi dan Pemulihan dari Depresi

Seorang psikiater ingin menilai efek dari gejala " depersonalisasi " pada prognosis pasien depresi .

Untuk tujuan ini , 23 pasien depresi endogen yang didiagnosis sebagai yang " depersonalized "

dicocokkan satu-ke - satu untuk usia, jenis kelamin , durasi penyakit , dan variabel kepribadian

tertentu , dengan 23 pasien yang didiagnosis sebagai yang " tidak depersonalized . " pada debit setelah

pengobatan , pasien dinilai

Tabel 3.6 Pemulihan dari Depresi setelah Pengobatan

Tidak depersonalized Dipulihkan 14 5 pasien pulih Tidak 2 2

Sumber : Everitt , 1992.

sebagai " pulih " atau " belum pulih " dengan hasil yang ditunjukkan pada Tabel 3.6 . Apakah

depersonalisasi terkait dengan pemulihan?

3.4.2 Obat Pengobatan Pasien Psikiatri : Tes Persis untuk Two-Way Klasifikasi

Uji chi - kuadrat untuk kemerdekaan antara dua variabel kategori menggunakan pendekatan normal

untuk menghasilkan nilai - p . Pendekatan ini adalah tepat ketika nilai yang diharapkan di bawah

kemandirian cukup besar dalam setiap sel ( mengatakan sedikitnya 5 ) . Untuk 2 v 2 tabel , asumsi ini

dapat dihindari dengan menggunakan uji eksak Fisher . Namun , untuk tabel RVC , SPSS tidak

menyediakan tes yang tepat secara default . Uji eksak dapat dihasilkan untuk setiap ukuran tabulasi

silang dengan permutasi ( misalnya , untuk rincian , lihat Manly , 1999) . SPSS menyediakan tes

permutasi untuk semua uji statistik yang digunakan untuk klasifikasi dua arah setelah menekan Exact

... tombol di kotak dialog Tabulasi Frekuensi dan memeriksa Exact atau Monte Carlo di kotak sub -

dialog yang dihasilkan. Prosedur ini komputasi secara intensif . SPSS menetapkan batas waktu dan

menawarkan untuk sampel satu set permutasi (opsi Monte Carlo ) . Dalam kasus terakhir , presisi dari

p - nilai dievaluasi oleh interval kepercayaan .

Tabel 3.7 memberikan klasifikasi silang dari sampel pasien jiwa dengan diagnosis mereka dan apakah

mereka diberi resep obat untuk pengobatan mereka (data diambil dari Agresti , 1996) . Tampilan

tabulasi silang grafis . Menggunakan tes yang tepat untuk menilai apakah diagnosis dan obat

3.7 Tabel Obat Perawatan oleh Psychiatric Pasien Jenis

Pengobatan obat

Obat Tidak ada Obat

Pasien Skizofrenia jenis 105 8

Gangguan afektif 12 2

Neurosis 18 19

Gangguan kepribadian 47 52

Gejala khusus 0 13

pengobatan yang independen. Memperkirakan rasio kemungkinan menerima terapi obat

membandingkan pasien skizofrenia , pasien gangguan afektif dan pasien neurosis dengan pasien

gangguan kepribadian masing-masing .

3.4.3 Tics dan Gender

Data pada Tabel 3.8 memberikan kejadian tics pada tiga sampel kelompok usia anak-anak dengan

kesulitan belajar (data diambil dari Everitt , 1992) . Apakah ada bukti hubungan antara kejadian tics

dan jenis kelamin setelah disesuaikan untuk usia ? Memperkirakan rasio kemungkinan mengalami tics

antara laki-laki dan perempuan .

Tabel 3.8 Tics pada Anak dengan Learning Disabilities

Page 18: Bab 3 inferensial sederhana untuk kategori data

Pengalaman Anak Tics ?

Rentang Usia Jenis Kelamin Ya Tidak

5 sampai 9 tahun anak laki-laki

Gadis 13 3 57

23

10 sampai 12 tahun anak laki-laki

gadis 26

11 56

29

13 sampai 15 tahun anak laki-laki

Gadis 15 2 56

27

3.4.4 warna rambut dan warna mata

Data pada Tabel 3.9 menunjukkan warna rambut dan warna mata dari sejumlah besar orang .

Keseluruhan statistik chi - kuadrat untuk kemerdekaan sangat besar dan dua variabel jelas tidak

independen. Periksa kemungkinan alasan untuk keberangkatan dari kemerdekaan dengan melihat

perbedaan antara nilai-nilai yang diamati dan yang diharapkan di bawah kemerdekaan bagi setiap sel

tabel .

Tabel 3.9 warna rambut dan warna mata

Adil warna rambut

Red Medium Gelap Hitam

Warna mata Cahaya 688 116 584 188 4

Biru 326 38 241 110 3

Sedang 343 84 909 412 26

Gelap 98 48 403 681 81

Sumber : Everitt , 1992.