bab 3 inferensial sederhana untuk kategori data
TRANSCRIPT
Bab 3
Inference sederhana untuk Data kategoris :
Dari Keyakinan dalam
Akhirat dengan Hukuman Mati dan Ras
3.1 Deskripsi Data
Dalam bab ini , kita akan membahas beberapa aspek yang relatif sederhana dari analisis data
kategorikal . Kami akan mulai dengan menjelaskan bagaimana membangun lintas - klasifikasi data
mentah menggunakan umur tikus dan usia saat perkawinan data yang digunakan dalam bab
sebelumnya . Kemudian kita akan melanjutkan untuk memeriksa sejumlah set data yang pengamatan
sudah ditabulasi dengan cara ini . Rincian tersebut adalah sebagai berikut :
Keyakinan di akhirat berdasarkan gender - data dari Survei Sosial Umum 1991 mengklasifikasikan
sampel orang Amerika menurut jenis kelamin mereka dan pendapat mereka tentang kehidupan setelah
kematian ( diambil dari Agresti 1996, dengan izin dari penerbit ) . Data muncul dalam Tabel 3.1 .
Insiden keinginan bunuh diri pada sampel psikotik dan pasien neurotik - diberikan dalam Tabel 3.2 (
diambil dari Everitt , 1992) .
Tabel 3.1 Keyakinan di Alam Baka
Jenis Kelamin Perempuan 435 147
Pria 375 134
Tabel 3.2 Insiden Perasaan bunuh diri di Sampel psikotik dan neurotik Pasien
Keinginan bunuh diri ? Ya 1 4
No 19 16
Tabel 3.3 Kontrasepsi Oral
kontrol
Oral kontrasepsi Kontrasepsi Oral Tidak Digunakan
Kasus Digunakan 10 57
Tidak digunakan 13 95
Psikiater mempelajari pasien neurotik dan psikotik , meminta masing-masing sampel 20 dari setiap
kategori tentang apakah mereka menderita keinginan bunuh diri .
Penggunaan dan pembekuan darah kontrasepsi oral - data yang diberikan dalam Tabel 3.3 . Data ini
muncul dari sebuah studi yang dilaporkan oleh Sartwell et al . ( 1969) . Penelitian ini dilakukan di
sejumlah rumah sakit di beberapa kota besar di Amerika . Di rumah sakit tersebut , semua perempuan
yang sudah menikah diidentifikasi sebagai menderita idiopatik tromboemboli ( gumpalan darah )
selama tiga tahun secara individual cocok dengan kontrol yang sesuai , pasien perempuan yang
dibuang hidup-hidup dari rumah sakit yang sama dalam interval waktu enam bulan yang sama sebagai
kasus . Selain itu, mereka secara individual dicocokkan dengan kasus berdasarkan usia , status
perkawinan , ras, dll Pasien dan kontrol kemudian diminta tentang penggunaan kontrasepsi oral .
Alkohol dan bayi malformasi - data dari studi prospektif minum ibu dan malformasi kongenital (
diambil dari Agresti 1996, dengan izin dari penerbit ) . Setelah pertama
Tabel 3.4 Konsumsi Alkohol dan Bayi Malformasi
cacat
hadir Absen
Jumlah rata-rata minuman per hari 0 48 17066
< 1 38 14464
01-02 Mei 788
03-05 Januari 126
u6 1 37
Tabel 3.5 Ras dan Hukuman Mati di AS
Hukuman Mati Tidak
Hukuman Mati
korban putih
Putih terdakwa bersalah atas pembunuhan 192 1320
Hitam terdakwa bersalah atas pembunuhan Hitam korban 110 520
Putih terdakwa bersalah atas pembunuhan 0 90
Hitam terdakwa bersalah atas pembunuhan 60 970
tiga bulan kehamilan , perempuan dalam sampel menyelesaikan kuesioner tentang konsumsi alkohol .
Setelah melahirkan , pengamatan dicatat pada ada atau tidak adanya bawaan seks malformasi organ .
Data dapat dilihat pada Tabel 3.4 .
Kematian hukuman vonis oleh ras terdakwa dan ras korban - data dalam Tabel 3.5 ( diambil dari
Everitt , 1999) . Data dikumpulkan untuk mencoba untuk membuang cahaya pada apakah ada
kesetaraan rasial dalam penerapan hukuman mati di AS
3.2 Metode Analisis
Tabel kontingensi adalah salah satu cara yang paling umum untuk merangkum pengamatan pada dua
variabel kategori . Tabel 3.1 , 3.2 , dan 3.3 merupakan contoh 2 v 2 tabel kontingensi (meskipun Tabel
3.3 muncul dalam cukup dengan cara yang berbeda seperti yang akan kita bahas nanti ) . Tabel 3.4
adalah contoh dari 5 v 2 tabel kontingensi di mana klasifikasi baris diperintahkan . Tabel 3.5 pada
dasarnya terdiri dari dua , 2 v 2 tabel kontingensi . Untuk semua tabel , bunga umumnya berada dalam
menilai apakah atau tidak ada hubungan atau hubungan antara variabel baris dan variabel kolom yang
membentuk meja . Paling umum, uji chi - kuadrat kemerdekaan digunakan untuk menjawab
pertanyaan ini , meskipun alternatif seperti uji eksak Fisher atau tes McNemar mungkin diperlukan
ketika ukuran sampel kecil (uji Fisher ) atau data terdiri dari sampel cocok (uji McNemar ) . Selain
itu, dalam 2 v 2 tabel , mungkin diperlukan untuk menghitung interval kepercayaan untuk rasio
proporsi populasi . Untuk seri 2 v 2 tabel , uji Mantel - Haenszel mungkin tepat ( lihat nanti ) . (
Rekening Singkat masing-masing tes disebutkan diberikan dalam Kotak 3.1 . Sejumlah topik lain
yang perlu dipertimbangkan kemudian dalam bab ini dijelaskan dalam Kotak 3.2 . )
Kotak 3.1 Pengujian Two-Way Tabel
( 2 ) uji Chi - kuadrat untuk r v c tabel kategori
Sebuah v tabel kontingensi c r dapat ditulis sebagai
kolom Variabel
1 c Jumlah
baris
variabel 1
2 N11 N21
n1c N2C n1 n2 • •
r nr1 nrc nr •
Jumlah n • 1 n • c N
Berdasarkan hipotesis nol bahwa baris dan kolom klasifikasi independen , nilai estimasi yang
diharapkan , Eij , untuk sel ijth dapat ditemukan sebagai
ni.n . j
Eij ! N
Uji statistik untuk menilai kemerdekaan
2 r c nij Eij
X ! § §
2
E
i ! 1 j ! 1 ij
Di bawah hipotesis nol kemerdekaan , X2 memiliki distribusi chi -squared asimtotik dengan ( r - 1 ) (
c - 1 ) derajat kebebasan . ( 3 ) uji eksak Fisher untuk 2 tabel v2
Probabilitas , P , setiap pengaturan tertentu frekuensi a, b , c , dan d dalam 2 v 2 tabel kontingensi ,
ketika total marjinal tetap dan dua variabel independen, adalah
b ! c ! c d ! b d !
P !
a ! b ! c ! d ! N !
dimana ai , bi , ci , di mewakili jumlah dalam empat sel dari tabel i dan Ni adalah jumlah total
pengamatan dalam tabel engan .
Berdasarkan hipotesis nol , statistik ini memiliki distribusi chi - kuadrat dengan derajat kebebasan
tunggal .
Tes ini hanya tepat jika derajat dan arah hubungan antara dua variabel adalah sama di setiap strata .
Sebuah tes mungkin asumsi ini adalah bahwa karena Breslow dan Hari (lihat Agresti , 1996) .
( Rincian lengkap dari semua tes ini diberikan dalam Everitt , 1992 . )
Kotak 3.2 Estimasi Risiko dari 2 Tabel v2
2 v 2 tabel kontingensi sering muncul dalam penelitian medis menyelidiki hubungan antara mungkin "
faktor risiko " dan terjadinya kondisi medis tertentu, sejumlah istilah timbul dari penggunaannya
dalam konteks ini bahwa kita akan menentukan di sini, sehingga mereka dapat digunakan dalam teks .
( 1 ) Risiko relatif
Risiko Variabel 2 jatuh ke kategori " 1 " ketika Variabel
1 mengambil kategori " 1 " diperkirakan oleh r1 =
a b
Demikian pula , risiko Variabel 2 jatuh ke kategori " 1 " ketika
c Variabel 1 mengambil kategori " 2 " diperkirakan oleh r2 =
c d
Risiko relatif ( RR ) Variabel 2 jatuh ke kategori " 1 " membandingkan Variabel 1 kategori " 1 "
dengan kategori " 2 " diperkirakan
a b
oleh RR =
c c d
Risiko relatif mendapat penyakit membandingkan individu yang terpapar faktor risiko dengan
individu tidak terpapar hanya dapat diperkirakan dari studi prospektif (lihat Dunn dan Everitt , 1993) .
( 2 ) Odds ratio Kemungkinan Variabel 2 jatuh ke kategori " 1 " ketika Variabel 1 mengambil kategori
" 1 " diperkirakan oleh o1 = b
Demikian pula , kemungkinan Variabel 2 jatuh ke kategori " 1 " ketika c Variabel 1 mengambil
kategori " 2 " diperkirakan oleh o2 = d Rasio odds ( OR ) Variabel 2 jatuh ke kategori " 1 "
membandingkan 1 kategori Variabel " 1 " dengan kategori " 2 " diperkirakan
a b
dengan OR = c d
Kemungkinan rasio penyakit membandingkan individu yang terpapar faktor risiko dengan individu
tidak terpapar dapat diperkirakan dari kedua studi prospektif dan retrospektif . ( Sekali lagi , lihat
Dunn dan Everitt , 1993 . )
Bila penyakit ini jarang terjadi ( misalnya, kurang dari 5 % dari populasi dipengaruhi ) , RR populasi
dapat didekati dengan OR ( Dunn dan Everitt , 1993) .
3.3 Analisis Menggunakan SPSS
Hal ini umum di banyak bidang penelitian untuk variabel kontinyu untuk dikonversi menjadi variabel
kategori dengan mengelompokkan mereka , sebelum analisis , menjadi dua atau lebih kategori ,
meskipun diketahui bahwa hal ini tidak selalu prosedur bijak (lihat Altman , 1998 ) . Dalam dua
bagian berikutnya kita menggunakan variabel kontinyu dari data set diperkenalkan pada bab
sebelumnya untuk menggambarkan bagaimana variabel kontinu dapat dikategorikan dalam SPSS dan
bagaimana , hasil sekali kategoris yang tersedia, ini dapat dengan mudah diringkas menggunakan
tabulasi silang .
3.3.1 Suami dan Istri Revisited
Sebuah kategorisasi yang cukup luas dari usia saat menikah ( Tabel 2.2 ) diberikan oleh tiga kategori "
Pernikahan dini " ( sebelum usia 30 tahun ) , " Pernikahan di usia pertengahan " ( pada usia antara 30
dan 49 tahun inklusif ) , dan "Late pernikahan " ( pada usia 50 atau lebih) . Perintah Recode di SPSS
berguna untuk membuat pengelompokan. Untuk mengkategorikan kedua variabel usia, kita dapat
menggunakan langkah-langkah berikut :
Akses perintah Transform - Recode - Ke Variabel yang berbeda ....
Isi kotak dialog yang dihasilkan seperti ditunjukkan dalam Tampilan 3.1 ( kami telah diberi label
variabel kategori baru) .
Klik tombol Nilai Lama dan Baru ... untuk membuka kotak dialog sub - .
Gunakan kotak ini untuk memetakan rentang variabel asli ke angka integer seperti yang ditunjukkan
dalam Tampilan 3.1 .
Klik Lanjutkan dan OK untuk mengeksekusi pengodean ulang tersebut .
Prosedur ini menghasilkan dua variabel baru , husCAT dan wifCAT , akan ditambahkan pada data
View spreadsheet . Untuk setiap pasangan , spreadsheet sekarang menunjukkan suami dan usia istri
saat menikah, serta kategori yang sesuai . ( Untuk memastikan bahwa analisis nantinya akan berisi
penjelasan dari kategori bukan hanya mencetak kode kategori , itu adalah ide yang baik untuk selalu
label kode kategori menggunakan Variable View . )
Tabulasi silang berfungsi untuk merangkum band usia pernikahan untuk kedua suami dan istri serta
hubungan mereka . Sebuah tabulasi silang dari data usia dikategorikan dapat dibangun dengan
menggunakan perintah
Analisa - Statistik Deskriptif - Tabulasi Frekuensi ...
Ini akan membuka kotak dialog yang ditunjukkan dalam Tampilan 3.2 . Kita perlu menentukan
variabel yang menentukan baris dan kolom yang tabulasi silang tersebut . Di sini kita memilih band
usia bagi suami untuk menentukan baris dari tabel dan orang-orang dari istri kolom . Mengklik Sel ...
tombol membuka Tampilan sub-kotak dialog Cell; ini mengontrol apa angka akan ditampilkan untuk
setiap sel dari dibangun klasifikasi silang . Memilih frekuensi mutlak diamati setiap sel serta frekuensi
sebagai persentase dari jumlah total pasangan dalam penelitian ini mengarah ke tabel output
ditunjukkan dalam Tampilan 3.3 .
The tabulasi silang menampilkan distribusi frekuensi dari band usia bagi suami dan istri dalam kolom
terakhir dan baris , masing-masing. Seperti yang terlihat sebelumnya ( misalnya , Bab 2 , Layar 2.14 )
, sebagian besar orang yang menikah menikah sebelum usia 30 . Hubungan antara suami 'dan istri '
usia pada perkawinan juga jelas . Sejak 48 % + 27 % + 8 % = 83 % dari pasangan , suami dan istri
berada di usia band yang sama pada saat pernikahan. Sel-sel kosong dalam acara tabel yang " tua "
istri tidak menikah dengan " muda " laki-laki dan bahwa laki-laki lebih tua dari 50 tahun
band usia bagi suami band usia * untuk istri Crosstabulation
band usia bagi istri Jumlah
lebih muda dari
30 tahun 30-49 tahun 50 tahun atau lebih tua
band usia bagi suami lebih muda dari 30 tahun Hitungan
% Total 48
48,0% 4
4,0% 52
52,0 %
30-49 tahun Penghitungan
% Dari total 6
6,0% 27
27,0 % 33
33,0 %
50 tahun atau lebih tua Hitung
% Total 7
7,0% 8
8,0 % 15
15,0 %
total Perhitungan
% Total 54
54,0 % 38
38,0 % 8
8,0 % 100
100,0 %
Tampilan 3.3 Cross- klasifikasi band usia bagi istri dan suami .
diet * umur kurang dari 2 tahun ? Crosstabulation
Umur kurang dari 2 tahun ? total
Ya Tidak
Diet Dibatasi diet Hitungan
% Dalam diet 17
16,0 % 89
84,0 % 106
100,0 %
Ad libitum diet Hitung
% Dalam diet 52
58,4 % 37
41,6 % 89
100,0 %
total Perhitungan
% Dalam diet 69
35,4 % 126
64,6 % 195
100,0 %
Tampilan 3.4 Cross- tabulasi umur dengan diet .
tidak menikah dengan istri lebih dari 20 tahun yunior mereka (setidaknya di Cumberland County ) .
3.3.2 rentang hidup Tikus Revisited
Rentang hidup tikus kumpulan data ( Tabel 2.1 ) sudah berisi satu hasil kategoris - diet . Kami
sekarang akan juga recode variabel umur terus menerus ke dalam variabel kategoris lanjut berlabel "
umur kurang dari 2 tahun ? " Dengan dua kategori ( 1 = " Ya " dan 2 = " Tidak ada " ) , lagi dengan
menggunakan perintah recode . Diet dan variabel umur dikategorikan kemudian dapat crossclassified
seperti pada contoh sebelumnya .
Karena ukuran kelompok diet berada di bawah kendali dari penyidik dalam contoh ini , masuk akal
untuk mengekspresikan jumlah sel sebagai persentase dalam kelompok diet . Jadi kita menetapkan
kategori diet untuk deretan kami klasifikasi silang dan periksa Row di Tampilan sub-kotak dialog Cell
( lihat Tampilan 3.2 ) . Hasil tabulasi silang ditunjukkan dalam Tampilan 3.4 . Kita melihat bahwa 84
% dari tikus dalam kelompok diet terbatas tinggal selama setidaknya dua tahun , sementara persentase
yang lebih rendah ( 41,6 % ) mencapai
Perkiraan risiko
Nilai Keyakinan 95 %
selang
Turunkan atas
Odds Ratio untuk diet ( diet Dibatasi / Iklan diet libitum )
Untuk kelompok umur kurang dari 2 tahun ? = 1.00
Untuk kelompok umur kurang dari 2 tahun ? = 2.00
U dari Valid Kasus .136
0,274
2.020
195 .070
0,172
1,557 0,265
0,439
2,619
Tampilan 3.5 keluaran risiko untuk umur oleh diet tabulasi silang di Tampilan 3.4 .
usia ini dalam kelompok ad libitum . Dinyatakan sebagai rasio risiko , jumlah ini risiko relatif
kematian sebelum usia 2 tahun membandingkan diet terbatas dengan diet secara ad libitum (17/ 106) :
(52/ 89) = 0,274 . Dengan kata lain , untuk tikus pada diet terbatas , risiko kematian dini adalah sekitar
seperempat bahwa tikus pada diet ad libitum .
Untuk 2 v 2 tabel , seperti yang di Tampilan 3.4 , risiko relatif ( RR ) dan odds ratio ( OR ) perkiraan (
untuk definisi lihat Kotak 3.2 ) , bersama-sama dengan confidence interval yang sesuai ( CI ) dapat
diperoleh di SPSS menggunakan langkah-langkah :
Klik tombol Statistik pada kotak dialog Tabulasi Frekuensi (lihat Tampilan
3.2 ) .
Periksa Risiko pada kotak sub - dialog yang dihasilkan.
Mengeksekusi perintah ini menambahkan tabel lebih lanjut untuk output . Ini " Risiko Perkiraan "
meja untuk umur oleh diet tabulasi silang ditunjukkan dalam Tampilan 3.5 .
Untuk memahami OR dan RRS disajikan dalam tabel ini , kita perlu menyadari perbandingan yang
digunakan oleh SPSS . Secara default ( dan kita tidak menyadari cara untuk mengubah ini ) , SPSS
menyajikan salah satu ATAU diikuti oleh dua RRS . OR membandingkan kemungkinan kategori
sesuai dengan kolom pertama dari tabulasi silang , antara kategori diwakili oleh baris pertama dan
kedua . Jadi , untuk tabulasi silang ditunjukkan dalam Tampilan 3.4 , kemungkinan hidup kurang dari
dua tahun yang dibandingkan antara kelompok diet terbatas dan kelompok ad libitum (diperkirakan
OR = 0.14 , 95 % CI 0,07-0,265 ) . Pertama nilai RR adalah perbandingan yang sama tapi kali ini
membandingkan risiko daripada odds ( diperkirakan RR = 0,274 , 95 %
CI 0,172-0,439 ) . RR lalu membandingkan risiko kategori
diet
Tampilan 3,6 Clustered bar chart untuk umur oleh diet tabulasi silang .
diwakili oleh kolom kedua antara pertama dan baris kedua dari tabel . Untuk tabulasi silang di Layar
3.4 , ini berarti bahwa " risiko " hidup minimal 2 tahun sedang dibandingkan ( diperkirakan RR = 2,02
, 95 % CI 1,557-2,619 ) .
Dalam prakteknya pengaturan default SPSS berarti bahwa kelompok-kelompok yang akan
dibandingkan harus mendefinisikan baris tabel tersebut . Karena baris pertama selalu dibandingkan
dengan kedua dan SPSS secara otomatis menempatkan kategori dengan kode terkecil ke baris pertama
, kode variabel kategoris harus dipilih yang sesuai . Dalam aplikasi ini , misalnya, kita dibatasi untuk
membandingkan kelompok diet terbatas ( yang diberi kode 1 ) dengan kelompok ad libitum ( kode 2 )
dan bukan sebaliknya . Kolom pertama ( terendah kode kategori ) mendefinisikan kategori yang risiko
atau kemungkinan yang menarik . Sekali lagi , setidaknya untuk OR , disarankan untuk kode data
sehingga kategori minat menerima kode terendah .
Kadang-kadang masalah untuk menampilkan tabel frekuensi grafis . Salah satu kemungkinan adalah
untuk memeriksa Tampilan grafik batang berkerumun di kotak dialog Tabulasi Frekuensi (lihat
Tampilan 3.2 ) . Ini menghasilkan bar chart berkerumun dengan deretan salib - klasifikasi
mendefinisikan cluster dan kolom mendefinisikan pola . Tampilan 3.6 menunjukkan jenis plot untuk
tabulasi silang di Tampilan 3.4 ( setelah mengedit penampilan sedikit untuk presentasi ) .
Sekarang , kita beralih ke mempertimbangkan data set diperkenalkan awal yang benar-benar muncul
dalam bentuk tabel kontingensi .
3.3.3 Keyakinan di Alam Baka
Kita mulai dengan mengimpor klasifikasi silang pada Tabel 3.1 ke SPSS . Untuk mereproduksi tabel
di SPSS , kita perlu mendefinisikan tiga variabel , dua berhubungan dengan dua hasil kategoris
kepentingan, gender dan keyakinan , dan variabel lanjut , di sini disebut count , yang memegang
jumlah sel . Tabel diterjemahkan ke Data View spreadsheet seperti yang ditunjukkan dalam Tampilan
3.7 . Setiap sel tabel menempati baris dalam spreadsheet dan jumlah sel disertai dengan kode kategori
untuk baris yang sesuai dan kolom . (The variabel kategori masing-masing diberi label dengan kode
kategori mereka seperti pada Tabel 3.1 untuk memfasilitasi interpretasi hasil kemudian. )
Kita sekarang perlu menentukan struktur yang benar dari data yang ditentukan dalam Tampilan 3.7 ,
jika tidak, maka akan ditafsirkan oleh SPSS sebagai kumpulan data yang berisi hanya empat
pengamatan . Untuk ini, kita perlu perintah
Data - Berat Kasus ...
Ini akan membuka kotak dialog yang ditunjukkan dalam Tampilan 3.8 . Memeriksa kasus Berat oleh
memungkinkan pengguna untuk mereplikasi setiap sel k kali di mana k ditentukan oleh Variabel
Frekuensi , di sini jumlah variabel . Perhatikan bahwa menggunakan perintah Kasus Berat tidak
mengubah penampilan spreadsheet .
Jenis Kelamin * Kepercayaan di akhirat ? Crosstabulation
Keyakinan di akhirat ? total
Ya Tidak
Jenis kelamin Hitungan
% Dalam Kelamin 435
74,7 % 147
25,3 % 582
100,0 %
Pria Hitungan
% Dalam Kelamin 375
73,7 % 134
26,3 % 509
100,0 %
total Perhitungan
% Dalam Kelamin 810
74,2 % 281
25,8 % 1091
100,0 %
Tampilan 3,9 Cross- tabulasi variabel kategori di Tampilan 3.7 .
Kita sekarang dapat menggunakan perintah Tabulasi Frekuensi seperti sebelumnya untuk
menghasilkan tabulasi silang dari hasil kategoris keyakinan dan gender. Menggunakan jender untuk
menentukan baris dan memilih untuk mengekspresikan dianggap sebagai persentase hasil baris dalam
tabel ditunjukkan dalam Tampilan 3.9 .
Persentase baris menunjukkan bahwa 74,7 % dari perempuan dan 73,7 % dari laki-laki dalam studi ini
percaya pada kehidupan setelah kematian . Apakah ini perbedaan jenis kelamin yang diamati dalam
sampel kami menunjukkan hubungan populasi antara gender dan keyakinan tentang kehidupan setelah
kematian ? Kita bisa menjawab pertanyaan ini dengan uji chisquared untuk kemerdekaan , yaitu ,
tidak ada hubungan (untuk rincian lihat Kotak 3.1 ) . Untuk menerapkan tes ini , kita perlu memeriksa
Chi -square dalam kotak sub - dialog Statistik (Display 3.10 ) . Ini menambahkan meja lain untuk
output - melihat Tampilan 3.11 .
Baris pertama dari " Chi -Square Tes " tabel memberikan hasil dari uji chi - kuadrat kemerdekaan .
Juga disediakan adalah kontinuitas dikoreksi versi tes ini ( untuk rinciannya, lihat Everitt , 1992) dan
uji rasio kemungkinan kemerdekaan berasal dari model statistik tertentu ( untuk rinciannya, lihat lagi
Everitt , 1992) . Tes yang tersisa akan dibahas dalam bagian berikutnya .
Standar uji chi- kuadrat kemerdekaan tidak memberikan bukti hubungan antara gender dan keyakinan
tentang akhirat ( X2 ( 1 ) = 0,16 , p = 0,69 ) , penggunaan kontinuitas dikoreksi versi atau uji rasio
kemungkinan tidak mengubah kesimpulan ini . Akibatnya, untuk meringkas keyakinan tentang akhirat
kita mungkin hanya menggunakan distribusi marjinal dalam Tampilan 3.9 , jenis kelamin responden
dapat diabaikan , 74,2 % dari responden percaya pada kehidupan setelah kematian , sedangkan
sisanya tidak.
3.3.4 Insiden Perasaan Suicidal
The tabulasi silang dari keinginan bunuh diri oleh kelompok pasien ditunjukkan pada Tabel 3.2 dapat
dikonversi menjadi data Lihat spreadsheet dengan mengikuti coding yang sama dan langkah-langkah
pembobotan seperti pada contoh sebelumnya . Dan cross-
b . 0 sel ( 0% ) diharapkan menghitung kurang dari 5 . Minimum jumlah yang diharapkan adalah
131.10 .
Tampilan 3.11 uji Chi - kuadrat untuk tabulasi silang di Tampilan 3.9 .
Klasifikasi lagi dapat dibuat dengan menggunakan kotak Tabulasi Frekuensi . Untuk data ini , kita
akan transpos tabel asli , karena kita ingin menampilkan tabel sebagai grafik batang ditumpuk dengan
tumpukan mewakili kelompok yang sama besar , dan menentukan kategori baris berdasarkan tipe
pasien . Langkah-langkah SPSS yang diperlukan :
Jenis Pasien * perasaan bunuh diri ? Crosstabulation
Keinginan bunuh diri ? total
Ya Tidak
Pasien jenis psikotik Hitungan
diharapkan Hitung
% Dalam jenis Pasien
sisa
Std . sisa 1
2.5
5,0%
-1.5
- .9 19
17,5
95,0 %
1.5
.4 20
20,0
100,0 %
neurotik Hitungan
diharapkan Hitung
% Dalam jenis Pasien
sisa
Std . sisa 4
2.5
20,0 %
1.5
.9 16
17,5
80,0 %
-1.5
- .4 20
20,0
100,0 %
total Perhitungan
diharapkan Hitung
Pasien % dalam tipe 5
5.0
12,5 % 35
35.0
87,5 % 40
40.0
100,0 %
Tampilan 3.12 Cross- tabulasi keinginan bunuh diri oleh kelompok pasien .
Periksa Tampilan Clustered bar chart dalam kotak dialog Tabulasi Frekuensi .
Periksa chisquare dalam Statistik sub-kotak dialog (lihat Tampilan 3.10 ) .
Periksa Hitungan diamati , Hitungan Diharapkan , Residu unstandardixed , Residu Standar , dan
Persentase Row di Tampilan sub-kotak dialog Cell ( lihat Tampilan 3.2 ) .
Yang dihasilkan 2 v 2 tabel ditunjukkan pada Tampilan 3.12 . Dalam menanggapi perintah grafik ,
SPSS awalnya menghasilkan bar chart berkerumun , ini dapat dengan mudah berubah menjadi bar
chart ditumpuk dengan menggunakan perintah
Galeri - Bar ... - Stacked - Ganti
di Editor Bagan . Grafik akhir bar ditunjukkan dalam Tampilan 3.13 .
Tabel dan grafik menunjukkan bahwa persentase pasien yang diamati dengan perasaan bunuh diri
dalam sampel pasien neurotik ( 20 % ) jauh lebih tinggi daripada dalam sampel pasien psikotik ( 5 % )
. Cara alternatif memeriksa keberangkatan dari kemerdekaan adalah untuk membandingkan jumlah
diamati pada sel-sel tabel dengan yang diharapkan di bawah kemerdekaan baris dan variabel kolom (
untuk rincian tentang perhitungan jumlah yang diharapkan , lihat Kotak 3.1 ) . Perbedaannya disebut
residual , dengan nilai-nilai positif menunjukkan frekuensi sel lebih tinggi dari yang diharapkan . Di
sini kita akan melihat lagi bahwa keinginan bunuh diri lebih terwakili pada pasien neurotik . Lebih
berguna daripada residu mentah residual standar (lihat Everitt , 1992) yang ditingkatkan sehingga
mereka mencerminkan kontribusi masing-masing sel untuk tes statistik dari uji chi - squared ,
akibatnya , mereka berguna untuk
Jenis pasien
Tampilan 3.13 Stacked bar chart perasaan bunuh diri dalam jenis pasien .
mengevaluasi kontribusi relatif dari sel untuk asosiasi diamati antara baris dan kolom variabel .
Seperti pada contoh sebelumnya , kami tertarik untuk menguji apakah ini hubungan yang diamati
antara baris dan kolom variabel merupakan bukti untuk asosiasi pada populasi yang mendasarinya .
Tapi , berbeda dengan kumpulan data sebelumnya , uji chi -squared standar ini mungkin tidak
sepenuhnya tepat karena jumlah sel yang diharapkan di bawah kemandirian keinginan bunuh diri dan
kelompok pasien mungkin terlalu kecil untuk membenarkan pendekatan chi - kuadrat ( lihat Kotak 3.1
) . Tampilan 3.12 menunjukkan bahwa hanya 5 orang melaporkan keinginan bunuh diri dalam
penelitian ini dan , sebagai hasilnya , penghitungan diharapkan dalam sel-sel dari kolom pertama agak
kecil . Bahkan , SPSS memperingatkan tentang hal ini dalam output uji chi - kuadrat (Display 3.14 ) .
Sebuah tes alternatif yang cocok kemerdekaan dalam situasi ini adalah uji eksak Fisher . Tes ini tidak
menggunakan pendekatan untuk memperoleh distribusi dari statistik uji di bawah hipotesis nol ,
melainkan distribusi yang tepat dari frekuensi sel mengingat total marjinal digunakan ( untuk rincian ,
lihat Kotak 3.1 ) . Untuk 2 v 2 tabel , SPSS otomatis pasokan uji eksak Fisher saat chisquare diperiksa
dalam Statistik sub-kotak dialog . ( Tes Persis untuk meja yang lebih besar juga mungkin, . Lihat
Latihan 3.4.2 )
Output Uji hanya terdiri dari tepat p - nilai untuk dua sisi dan uji satu sisi , karena uji statistik adalah
susunan sel diamati
Tes chi -Square
Nilai df Asymp . Sig . ( 2-sisi ) Exact Sig . ( 2-sisi ) Exact Sig . ( 1 - sisi)
Pearson Chi -Square
kontinuitas Correctiona
Rasio kemungkinan
Fisher Exact Test
Linear - by- Linear
asosiasi
N dari Valid Kasus 2.057b
0,914
2,185
2,006
40 1 1
1
1 0,151
0,339
0,139
0,157 0,342 0,171
a . Dihitung hanya untuk tabel 2x2
b . 2 sel ( 50,0 % ) diharapkan menghitung kurang dari 5 . Minimum jumlah yang diharapkan adalah
2,50 .
Tampilan 3.14 uji eksak Fisher untuk tabulasi silang di Layar 3.12 .
Kasus : Kontrasepsi yang digunakan ? * Cocok kontrol : Kontrasepsi yang digunakan ?
Crosstabulation
Kontrol cocok : Kontrasepsi yang digunakan ? total
Ya Tidak
Kasus : Kontrasepsi yang digunakan ? Ya Hitungan
% Dari total 10
5,7 % 57
32,6 % 67
38,3 %
Tidak ada Penghitungan
% Total 13
7,4% 95
54,3 % 108
61,7 %
total Perhitungan
% Total 23
13,1 % 152
86,9 % 175
100,0 %
Tampilan 3.15 Cross- tabulasi penggunaan kontrasepsi pada kasus dan kontrol mereka cocok .
(Display 3.14 ) . Di sini kita melaksanakan uji dua sisi , karena kita tidak punya pendapat sebelum
mengenai arah perbedaan kelompok mungkin dalam proporsi memiliki keinginan bunuh diri . Pada
tingkat signifikansi 5 % , uji eksak Fisher tidak menemukan bukti hubungan antara jenis pasien dan
keinginan bunuh diri ( p = 0,34 ) .
3.3.5 Oral Kontrasepsi Penggunaan dan Gumpalan darah
The tabulasi silang dari penggunaan kontrasepsi pada wanita dengan idiopatik tromboemboli dan
kontrol mereka cocok ditunjukkan pada Tabel 3.3 , yang pertama kali masuk ke SPSS menggunakan
langkah yang sama seperti pada dua contoh sebelumnya . Yang dihasilkan tabel output , kali ini
menunjukkan persentase jumlah pasangan yang cocok , akan ditampilkan dalam Tampilan 3.15 .
Tes chi -Square
Nilai Sig Exact .
( 2 - sisi)
McNemar Uji
N Kasus Valid 175 .000 a
a . Distribusi binomial digunakan .
Tampilan 3.16 tes McNemar untuk tabulasi silang di Layar 3.15 .
Pada pandangan pertama , tabel ini tampak serupa dengan yang dianalisis dalam dua bagian
sebelumnya . Namun, ini tabulasi silang berbeda dari yang sebelumnya dalam beberapa aspek
penting. Sebelumnya, kami ditabulasi dua variabel kategori yang berbeda yang diukur pada set yang
sama mata pelajaran . Sekarang , kami sedang mempertimbangkan tabulasi silang dari hasil yang
sama ( penggunaan kontrasepsi ) tapi diukur dua kali ( sekali pada pasien dan sekali kontrol mereka
cocok ) . Akibatnya , jumlah total sel ( N = 175 ) merupakan jumlah pasangan yang cocok daripada
jumlah individu mengambil bagian dalam studi ini .
Sifat yang berbeda dari ini tabulasi silang berimplikasi pada pertanyaan-pertanyaan yang mungkin
menarik . Dalam tabulasi silang sebelumnya, kita diuji untuk hubungan antara baris dan variabel
kolom . Dalam v 2 tabel 2 , ini hanya berjumlah menguji hipotesis eksperimental bahwa persentase
satu kategori variabel pertama berbeda antara kategori dari variabel kedua. Pertanyaan semacam ini
tidak menarik untuk saat tabulasi silang . ( Kami akan menguji apakah persentase kontrol cocok
menggunakan alat kontrasepsi adalah sama pada pasien yang menggunakan kontrasepsi dan mereka
yang tidak ! ) Sebaliknya , kami tertarik dalam menilai apakah kemungkinan faktor risiko potensial ,
penggunaan kontrasepsi , berbeda antara pasien dan kontrol mereka cocok . Dalam hal tabel di Layar
3,15 , itu adalah total marjinal ( 38,3 % dan penggunaan kontrasepsi 13,1 % , masing-masing, untuk
sampel kami pasien dan kontrol ) yang akan dibandingkan .
Uji McNemar menilai hipotesis nol bahwa distribusi marginal penduduk tidak berbeda dan dapat
dihasilkan untuk tabulasi silang dengan memeriksa McNemar di kotak Statistik sub - dialog (lihat
Tampilan 3.10 ) . Yang dihasilkan tabel output ditunjukkan pada Tampilan 3.16 . SPSS menyediakan
nilai p untuk tes yang tepat ( lihat Kotak 3.1 ) . Uji dua sisi menunjukkan bahwa wanita yang
menderita pembekuan darah melaporkan tingkat signifikan lebih tinggi dari penggunaan kontrasepsi
dibandingkan kontrol ( p < 0,001 ) .
Atau , tes McNemar dapat dihasilkan dalam SPSS dengan menggunakan perintah :
Analisa - Tes Nonparametrik - 2 Sampel Terkait ...
Mendefinisikan pasangan variabel yang akan diuji dalam kotak dialog yang dihasilkan .
Dan memeriksa McNemar ( lihat Bab 2 , Layar 2.18) .
Ini secara otomatis menyediakan 2 v 2 tabulasi silang , uji statistik dari kontinuitas dikoreksi uji chi -
kuadrat , dan dihasilkan perkiraan nilai p ( lihat Kotak 3.1 ) .
3.3.6 Alkohol dan Bayi Malformasi
Kita sekarang beralih ke data pada minum ibu dan cacat bawaan pada Tabel 3.4 . Sekali lagi , pusat
bunga kemungkinan hubungan antara konsumsi alkohol dan kehadiran malformasi bayi . Tapi dalam
kasus ini , tes yang lebih kuat daripada uji chi -squared standar tersedia karena sifat memerintahkan
variabel baris . Di sini , hipotesis nol kemerdekaan dapat diuji terhadap alternatif yang lebih terbatas ,
yaitu , bahwa proporsi malformasi perubahan secara bertahap dengan meningkatnya konsumsi . Tes
tren linier untuk tabulasi silang menilai kemerdekaan melawan hipotesis alternatif ini ( untuk
rinciannya, lihat Everitt , 1992) .
Data pada Tabel 3.4 dapat diimpor ke SPSS seperti yang dijelaskan untuk tiga contoh sebelumnya .
Namun , karena di sini kami ingin memanfaatkan pemesanan kategori alkohol , kita perlu memastikan
bahwa coding kategori ini mencerminkan pesanan mereka . Akibatnya, kita menetapkan kode terkecil
ke tingkat konsumsi terkecil , dll Tampilan 3.17 memperlihatkan tabulasi silang dibuat melalui kotak
dialog Tabulasi Frekuensi . Kami menampilkan persentase baris karena kita sedang mencari
perubahan bertahap dalam persentase ini selama tingkat konsumsi .
Tabel tersebut menunjukkan bahwa dalam sampel kami , proporsi malformasi meningkat dengan
setiap kenaikan tingkat konsumsi . Namun, uji tren formal, yang secara otomatis dihasilkan ketika Chi
-square diperiksa
CONSUMPT * malformasi Crosstabulation
MALF Orma Jumlah
hadir absen
CONSUMPT 0 Hitung
% Dalam CONSUMPT 17066
99,7 % 48
.3 % 17114
100,0 %
kurang dari 1 Jumlah
% Dalam CONSUMPT 14464
99,7 % 38
.3 % 14502
100,0 %
1 sampai 2 Jumlah
% Dalam CONSUMPT 788
99,4 % 5
.6 % 793
100,0 %
3 sampai 5 Jumlah
% Dalam CONSUMPT 126
99,2 % 1
.8 % 127
100,0 %
6 atau lebih Hitungan
% Dalam CONSUMPT 37
97,4 % 1
2,6 % 38
100,0 %
total Perhitungan
% Dalam CONSUMPT 32.481
99,7 % 93
.3 % 32.574
100,0 %
Tampilan 3.17 Cross- tabulasi malformasi bayi oleh konsumsi alkohol .
Tes chi -Square
Nilai df Asymp . Sig .
( 2-sisi ) Exact Sig .
( 2-sisi ) Exact Sig .
( 1 sisi ) Titik Probabilitas
Pearson Chi -Square
Rasio kemungkinan
Fisher Exact Test
Linear - by- Linear
asosiasi
N dari Valid Kasus 12.082a
6,202 10,458
b 1,828
32.574 4
4
1 0,017
0,185
0,176 0,034
0,133
0,033
0,179 0,105 0,028
a . 3 sel ( 30,0 % ) diharapkan menghitung kurang dari 5 . Minimum jumlah yang diharapkan adalah .
11 .
b . Yang standar statistik adalah 1,352 .
Tampilan 3.18 tes tren Linear untuk tabulasi silang di Layar 3.17 .
Statistik di kotak sub - dialog dan ditampilkan di bawah " Linear - by- Linear Association " menuju ke
" Tes Chi - Square" tabel output (Display 3.18 ) , menunjukkan bahwa hal ini tidak mungkin untuk
mencerminkan kecenderungan linier dalam populasi ( X2 ( 1 ) = 1,83, p = 0,18 ) .
3.3.7 Kematian Putusan Hukuman
Data yang ditunjukkan pada Tabel 3.5 ras dan hukuman mati di AS adalah klasifikasi tiga -arah dari
pengamatan asli . Untuk setiap percobaan dengan vonis pembunuhan positif , tiga hasil kategoris
dicatat : ras terdakwa , ras korban , dan penggunaan hukuman mati . Pertanyaan yang paling menarik
di sini adalah : " Apakah ada hubungan antara ras terdakwa bersalah atas pembunuhan dan
penggunaan hukuman mati ? " ( Ini tiga-cara klasifikasi dan contoh tatanan yang lebih tinggi dapat
diimpor ke SPSS dengan menggunakan coding dan langkah-langkah pembobotan digunakan pada
contoh sebelumnya . satu-satunya perbedaan adalah bahwa variabel kategori lebih lanjut perlu
dikodekan . )
Sebagai ilustrasi , kita mulai dengan mengabaikan ras korban dan membangun klasifikasi dua arah
dengan menggunakan kotak dialog Tabulasi Frekuensi . Hasilnya akan ditampilkan di layar 3.19 .
Tabel tersebut menunjukkan bahwa persentase agak lebih tinggi dari terdakwa putih yang ditemukan
bersalah atas pembunuhan ( 12 % ) dihukum dengan hukuman mati dibandingkan dengan terdakwa
hitam ( 10,2 % ) . Pengujian untuk asosiasi dalam tabel ini dalam hasil cara yang biasa dalam nilai
chisquared 2,51 terkait dengan p-value sebesar 0,11 , nilai yang tidak memberikan bukti hubungan
antara ras terdakwa dan penggunaan hukuman mati .
Kita sekarang mengulangi analisis , kali ini dengan mempertimbangkan klasifikasi tiga -arah dengan
memperkenalkan ras korban . Sebuah salib - klasifikasi penggunaan hukuman mati oleh ras terdakwa
dalam sub kelompok ras korban dihasilkan dalam SPSS dengan mendefinisikan lapisan balap korban
dalam kotak dialog Tabulasi Frekuensi (Display 3.20 ) . The tabulasi silang baru (Display 3.21 ) ,
yang
Lomba terdakwa bersalah atas pembunuhan hukuman mati * diberikan ? Crosstabulation
Hukuman mati yang diberikan ? total
Ya Tidak
Lomba terdakwa bersalah atas pembunuhan Putih Penghitungan
% Dalam Race of terdakwa bersalah atas pembunuhan 192
12,0 % 1410
88,0 % 1602
100,0 %
Hitam Hitung
% Dalam Race of terdakwa bersalah atas pembunuhan 170
10,2 % 1490
89,8 % 1660
100,0 %
total Perhitungan
% Dalam Race of terdakwa bersalah atas pembunuhan 362
11,1 % 2900
88,9 % 3262
100,0 %
Tampilan 3.19 Cross- tabulasi kematian penggunaan hukuman oleh ras terdakwa .
ulangan Tabel 3.5 menunjukkan tingkat hukuman mati yang lebih tinggi atas pembunuhan korban
putih daripada korban hitam ( 14,1 % dibandingkan dengan 5,4 % ) dan dalam subkelompok ras
korban tingkat hukuman mati yang lebih rendah bagi terdakwa putih dibandingkan dengan terdakwa
hitam ( korban putih : 12,7 % dibandingkan dengan 17,5 % , korban hitam : 0 % dibandingkan dengan
5,8 % ) . Angka-angka ini tampaknya bertentangan dengan angka yang diperoleh dari Tampilan 3.19 .
Fenomena bahwa ukuran dari hubungan antara dua variabel kategori (di sini terdakwa ras dan
hukuman mati ) mungkin identik dalam tingkat variabel ketiga (di sini ras korban ) , tetapi mengambil
Lomba terdakwa bersalah atas pembunuhan hukuman mati * diberikan ? * Ras korban
Crosstabulation
Lomba hukuman mati korban diberikan ? total
Ya Tidak
Ras Putih terdakwa bersalah atas pembunuhan Putih Penghitungan
% Dalam Race of terdakwa bersalah atas pembunuhan 192
12,7 % 1320
87,3 % 1512
100,0 %
Hitam Hitung
% Dalam Race of terdakwa bersalah atas pembunuhan 110
17,5 % 520
82,5 % 630
100,0 %
total Perhitungan
% Dalam Race of terdakwa bersalah atas pembunuhan 302
14,1 % 1840
85,9 % 2142
100,0 %
Hitam Ras terdakwa bersalah atas pembunuhan Putih Penghitungan
% Dalam Race of terdakwa bersalah atas pembunuhan 90
100,0 % 90
100,0 %
Hitam Hitung
% Dalam Race of terdakwa bersalah atas pembunuhan 60
5,8 % 970
94,2 % 1030
100,0 %
total Perhitungan
% Dalam Race of terdakwa bersalah atas pembunuhan 60
5,4 % 1060
94,6 % 1120
100,0 %
Tampilan 3.21 Cross- tabulasi yang dihasilkan oleh perintah di Layar 3.20 .
nilai yang sama sekali berbeda ketika variabel ketiga diabaikan dan ukuran dihitung dari tabel
dikumpulkan , dikenal sebagai paradoks Simpson dalam literatur statistik (lihat Agresti , 1996) .
Situasi seperti itu dapat terjadi jika variabel ketiga dikaitkan dengan kedua dari dua variabel lainnya .
Untuk memeriksa bahwa ini memang terjadi di sini , kita perlu cross- tabulasi ras korban dengan ras
terdakwa . ( Kita telah melihat bahwa ras korban dikaitkan dengan kematian penggunaan penalti di
Layar 3.21 . ) The crosstabulation baru (Display 3.22 ) menegaskan bahwa ras korban juga terkait
dengan variabel kedua , ras terdakwa , dengan mayoritas pembunuhan yang dilakukan oleh pelaku
dari ras yang sama dengan korban . Oleh karena itu, perbandingan awal tingkat hukuman mati antara
kelompok ras (lihat Tampilan 3.19 ) tidak dapat membedakan antara efek dari ras terdakwa dan ras
korban , dan hanya memperkirakan efek gabungan .
Kembali sekarang untuk benar klasifikasi tiga - jalan di Layar 3.21 , kami ingin melakukan tes resmi
kemerdekaan antara ras terdakwa dan penggunaan hukuman mati . Memeriksa chisquare dalam
Statistik sub-kotak dialog akan memasok tes chi - kuadrat terpisah untuk korban putih dan hitam , tapi
kami lebih memilih untuk melaksanakan tes secara keseluruhan . Tes MantelHaenszel ( untuk rincian
, lihat Kotak 3.1 ) adalah tes yang tepat dalam situasi ini selama kita bersedia untuk menganggap
bahwa tingkat dan arah hubungan potensial antara ras terdakwa dan hukuman mati adalah sama untuk
korban hitam dan putih .
Ras korban
Tampilan 3.22 Clustered bar chart untuk cross - tabulasi terdakwa ras dengan ras korban .
SPSS memasok uji Mantel - Haenszel untuk serangkaian 2 v 2 meja setelah memeriksa Cochran dan
statistik Mantel - Haenszel dalam kotak sub - dialog Statistik (lihat Tampilan 3.10 ) . Untuk data
hukuman mati , ini menghasilkan output yang ditunjukkan pada Menampilkan 3,23 dan 3,24 . Baris
kedua di Tampilan 3.23 memberikan hasil uji Mantel - Haenszel , dengan X2 ( 1 ) = 11,19 dan terkait
p-value sebesar 0,001 , hal ini memberikan bukti kuat adanya hubungan antara penggunaan hukuman
mati dan ras terdakwa
Pengujian Homogenitas Rasio Kemungkinan
Statistik Chi - Squared df Asymp . Sig .
( 2 - sisi)
bersyarat
kemerdekaan
Homogenitas Cochran
Mantel - Haenszel
Breslow - Hari
TARone itu 11,642
11,193
3,844
3,833 1
1 1
1 .001
.001
.050
.050
Dengan asumsi kondisi independen , statistik Cochran adalah asimtotik didistribusikan sebagai 1 df
distribusi chi - kuadrat , hanya jika jumlah strata adalah tetap , sedangkan statistik Mantel - Haenszel
selalu asimtotik didistribusikan sebagai 1 df distribusi chi - kuadrat . Perhatikan bahwa koreksi
kontinuitas dihapus dari statistik Mantel - Haenszel ketika jumlah dari perbedaan antara diamati dan
diharapkan adalah 0 .
Tampilan 3.23 uji Mantel - Haenszel untuk tabulasi silang di Layar 3.21 .
Mantel- Haenszel umum Odds Ratio Estimate
Perkirakan ln ( Perkiraan )
Std . Kesalahan ln ( Perkiraan )
Asymp . Sig . ( 2-sisi )
Asymp . Keyakinan 95 %
Odds umum Interval
Rasio ln (Common Odds Ratio ) Bawah Bound Bound Atas Bawah Bound
Atas Bound 0,642-0,443 0,128
.001
0,499
0,825-0,695
- .192
The Mantel - Haenszel umum estimasi rasio odds adalah asimtotik normal didistribusikan di bawah
rasio odds umum 1.000 asumsi . Begitu juga dengan log natural dari perkiraan .
Tampilan 3.24 Mantel - Haenszel umum odds ratio estimator untuk tabulasi silang di Layar 3.21 .
meskipun hasil uji Breslow hari untuk homogenitas odds ratio dalam dua tabel melempar beberapa
keraguan pada asumsi homogenitas odds ratio .
Namun, jika kita memutuskan untuk tidak menolak asumsi homogenitas , kita dapat menemukan
perkiraan rasio odds umum diasumsikan . SPSS memperkirakan rasio odds umum dari kolom pertama
dalam tabulasi silang ( hukuman mati diberikan ) membandingkan baris pertama ( tergugat putih)
dengan baris kedua ( tergugat hitam) . Perkiraan dan interval kepercayaan 95 % ditunjukkan dalam
Tampilan 3.24 . The Mantel - Haenszel estimator rasio odds umum disajikan di baris pertama ( OR =
0,642 ) , menunjukkan bahwa kemungkinan hukuman mati hukuman berkurang sebesar 35,8 % untuk
terdakwa putih dibandingkan dengan terdakwa hitam. Sebuah interval kepercayaan untuk OR
dibangun pada skala log menggunakan asymptotic normality dan karenanya SPSS memasok log - OR
dan standard error -nya . Final 95 % confidence interval untuk OR ( 0,499-0,825 ) menunjukkan
bahwa pengurangan hukuman mati peluang dalam putih relatif terhadap kulit hitam antara 17,5 % dan
50,1 % konsisten dengan data .
3.4 Latihan
3.4.1 depersonalisasi dan Pemulihan dari Depresi
Seorang psikiater ingin menilai efek dari gejala " depersonalisasi " pada prognosis pasien depresi .
Untuk tujuan ini , 23 pasien depresi endogen yang didiagnosis sebagai yang " depersonalized "
dicocokkan satu-ke - satu untuk usia, jenis kelamin , durasi penyakit , dan variabel kepribadian
tertentu , dengan 23 pasien yang didiagnosis sebagai yang " tidak depersonalized . " pada debit setelah
pengobatan , pasien dinilai
Tabel 3.6 Pemulihan dari Depresi setelah Pengobatan
Tidak depersonalized Dipulihkan 14 5 pasien pulih Tidak 2 2
Sumber : Everitt , 1992.
sebagai " pulih " atau " belum pulih " dengan hasil yang ditunjukkan pada Tabel 3.6 . Apakah
depersonalisasi terkait dengan pemulihan?
3.4.2 Obat Pengobatan Pasien Psikiatri : Tes Persis untuk Two-Way Klasifikasi
Uji chi - kuadrat untuk kemerdekaan antara dua variabel kategori menggunakan pendekatan normal
untuk menghasilkan nilai - p . Pendekatan ini adalah tepat ketika nilai yang diharapkan di bawah
kemandirian cukup besar dalam setiap sel ( mengatakan sedikitnya 5 ) . Untuk 2 v 2 tabel , asumsi ini
dapat dihindari dengan menggunakan uji eksak Fisher . Namun , untuk tabel RVC , SPSS tidak
menyediakan tes yang tepat secara default . Uji eksak dapat dihasilkan untuk setiap ukuran tabulasi
silang dengan permutasi ( misalnya , untuk rincian , lihat Manly , 1999) . SPSS menyediakan tes
permutasi untuk semua uji statistik yang digunakan untuk klasifikasi dua arah setelah menekan Exact
... tombol di kotak dialog Tabulasi Frekuensi dan memeriksa Exact atau Monte Carlo di kotak sub -
dialog yang dihasilkan. Prosedur ini komputasi secara intensif . SPSS menetapkan batas waktu dan
menawarkan untuk sampel satu set permutasi (opsi Monte Carlo ) . Dalam kasus terakhir , presisi dari
p - nilai dievaluasi oleh interval kepercayaan .
Tabel 3.7 memberikan klasifikasi silang dari sampel pasien jiwa dengan diagnosis mereka dan apakah
mereka diberi resep obat untuk pengobatan mereka (data diambil dari Agresti , 1996) . Tampilan
tabulasi silang grafis . Menggunakan tes yang tepat untuk menilai apakah diagnosis dan obat
3.7 Tabel Obat Perawatan oleh Psychiatric Pasien Jenis
Pengobatan obat
Obat Tidak ada Obat
Pasien Skizofrenia jenis 105 8
Gangguan afektif 12 2
Neurosis 18 19
Gangguan kepribadian 47 52
Gejala khusus 0 13
pengobatan yang independen. Memperkirakan rasio kemungkinan menerima terapi obat
membandingkan pasien skizofrenia , pasien gangguan afektif dan pasien neurosis dengan pasien
gangguan kepribadian masing-masing .
3.4.3 Tics dan Gender
Data pada Tabel 3.8 memberikan kejadian tics pada tiga sampel kelompok usia anak-anak dengan
kesulitan belajar (data diambil dari Everitt , 1992) . Apakah ada bukti hubungan antara kejadian tics
dan jenis kelamin setelah disesuaikan untuk usia ? Memperkirakan rasio kemungkinan mengalami tics
antara laki-laki dan perempuan .
Tabel 3.8 Tics pada Anak dengan Learning Disabilities
Pengalaman Anak Tics ?
Rentang Usia Jenis Kelamin Ya Tidak
5 sampai 9 tahun anak laki-laki
Gadis 13 3 57
23
10 sampai 12 tahun anak laki-laki
gadis 26
11 56
29
13 sampai 15 tahun anak laki-laki
Gadis 15 2 56
27
3.4.4 warna rambut dan warna mata
Data pada Tabel 3.9 menunjukkan warna rambut dan warna mata dari sejumlah besar orang .
Keseluruhan statistik chi - kuadrat untuk kemerdekaan sangat besar dan dua variabel jelas tidak
independen. Periksa kemungkinan alasan untuk keberangkatan dari kemerdekaan dengan melihat
perbedaan antara nilai-nilai yang diamati dan yang diharapkan di bawah kemerdekaan bagi setiap sel
tabel .
Tabel 3.9 warna rambut dan warna mata
Adil warna rambut
Red Medium Gelap Hitam
Warna mata Cahaya 688 116 584 188 4
Biru 326 38 241 110 3
Sedang 343 84 909 412 26
Gelap 98 48 403 681 81
Sumber : Everitt , 1992.