analisis data kategori

Post on 29-Jan-2016

64 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

DESCRIPTION

ANALISIS DATA KATEGORI. Eni Sumarminingsih. Distribusi Multinomial. Misalnya terdapat c kategori pada variabel respon . Peluangnya dinotasikan {  1 , 2 ,…, c } di mana 1. - PowerPoint PPT Presentation

TRANSCRIPT

ANALISIS DATA KATEGORIEni Sumarminingsih

Distribusi Multinomial

• Misalnya terdapat c kategori pada variabel respon. Peluangnya dinotasikan {1 ,2 ,…,c} di mana 1.

• Untuk n sampel, peluang Multinomial bahwa n1 jatuh pada kategori1, n2 jatuh pada kategori 2,…, nc jatuh pada kategori c di mana

Distribusi Multinomial

Regresi Logistik MultinomialRegresi Logistik yang melibatkan variabel respon dengan kategori lebih dari dua dengan skala nominal yaitu tidak memiliki tingkatan serta variabel prediktor yang bersifat kategori dan atau kontinyu disebut sebagai regresi logistik multinomial

Suatu variabel respon dengan M kategori akan membentuk persamaan logit sebanyak M-1 di mana masing-masing persamaan ini membentuk regresi logistik biner yang membandingkan suatu kelompok kategori terhadap kategori pembanding

Secara umum model multinomial logit adalah

Jika yang digunakan sebagai pembanding adalah kategori M, maka ξM = 0 untuk

di mana p adalah banyaknya variabel prediktor, sehingga transformasi logitnyamenjadi,

Multinomial Logit dengan 3 Kategori Respon

Dalam model regresi logistik dengan 3 kategori Y (Y=0,1,2),dibutuhkan 2 fungsi logit dan harus diputuskan kategori respon mana yang menjadi kategori pembandingMisal Y=0 sebagai kategori pembanding untuk membentuk 2 logit (yaitu sebagai pembandinguntuk Y=1 dan Y=2) maka

Menurut Hosmer dan Lemeshow (2000) untuk mendapatkan model, asumsikan terdapat p variabel prediktor dan n sampel yang dinotasikan sebagai vektor X dengan matrik berukuran n x (p+1)di mana X0=1. Dua fungsi logit dinotasikan sebagai:

Bentuk Umum fungsi peluang dengan 3 kategori respon

• Secara teori, model dengan 3 kategori peubah respon akan menghasilkan dua fungsi logit.

• Sebenarnya dapat digunakan pasangan kategori pembanding yang mana saja tergantung dari tujuan yang ingin dicapai dalam penelitian, tetapi menurut Hosmer dan Lemeshow (2000) lebih baik menggunakan kategori 0 sebagai pembanding karena merupakan perluasan dari model dengan dua

• kategori variabel respon (biner).

Pendugaan Parameter

• Pendugaan parameter dari model logit menggunakan metode maksimum likelihood

• Untuk membuat fungsi likelihood pada model dengan kategori respon lebih dari 2 (misalnya 3 kategori) hal pertama yang dilakukan adalah membuat 3 variabel biner yang dikode 0 atau 1 untuk menandai group membership (anggota kelompok) pada suatu observasi

• Dalam kasus ini 3 variabel biner tersebut hanya untuk menjelaskan fungsi likelihood dan bukan digunakan untuk analisis regresi logistik multinomial yang sebenarnya

Pengujian Terhadap Pendugaan Parameter

a. Pengujian pendugaan parameter () secara parsialUji koefisien regresi secara parsial digunakan untuk memeriksa peranan koefisien regresi dari masing-masing variabel prediktor secara individu dalam model. Hipotesis yang digunakan adalah:

Pengujian Terhadap Pendugaan Parameter

Statistik uji yang digunakan adalah statistik uji Wald yang dapat ditulis:

Pengujian Terhadap Pendugaan Parameter

Pengujian Terhadap Pendugaan Parameter

Pengujian Terhadap Pendugaan Parameter

Pengujian Terhadap Pendugaan Parameter

Pengujian Terhadap Pendugaan Parameter

Interpretasi Koefisien regresi logistik

• Interpretasi dalam regresi logistik menggunakan nilai odds ratio yang menunjukkan perbandingan tingkat kecenderungan dari kategori yang ada dalam satu variabel prediktor.

• Nilai odds ratio pada respon multinomial menggunakan notasi umum yang digunakan dalam respon biner.

• Misalnya Y=0 digunakan sebagai kategori pembanding, odd ratio untuk Y=j terhadap Y=0 yang dihitung pada dua nilai

adalah

• pada regresi logistik politomus dengan tiga kategori respon akan terbentuk dua odds ratio.

• Yang pertama perbandingan peluang antara respon kategori 1 (Y=1) dengan respon kategori pembanding (Y=0)

• Yang kedua adalah perbandingan peluang antara respon kategori 2 (Y=2) dengan respon kategori pembanding (Y=0).

Koefisien Determinasi

Contoh

Suatu penelitian ingin mengetahui berapa peluang seseorang terkena PJK (Penyakit Jantung Koroner), PJK disertai hipertensi danPJK disertai hipertensi serta diabetes mellitus. Adapun faktor – faktor yang diduga mempengaruhi terjadinya PJK dan komplikasinyaadalah usia, tekanan darah sistole, tekanan darah diastole, kolesterol, HDl, LDL dan Trigliserid. Variabel Respon:

Y= 0 (PJK), Y= 1 (PJK disertai hipertensi), Y= 2 (PJK disertai hipertensi dan diabetes mellitus).Variabel Prediktor:X1 = Usia (tahun) X2 = Tekanan darah sistole (mmHg)X3 = Tekanan darah diastole (mmHg)X4 = Kolesterol (mg/dl)X5 = HDL (mg/dl)

X6 = LDL (mg/dl)X7 = Trigliserid (mg/dl)

Model regresi logistik multinomial setelah dilakukan transformasi adalah sebagai berikut:• Model regresi logistik yang pertama

Model regresi logistik yang kedua adalah

Nilai odds ratio model regresi logistik pertama

Interpretasi untuk model logistik pertama, • Untuk variabel X1 diperoleh nilai odds ratio

sebesar 1.109, berarti setiap bertambahnya 1 tahun usia seseorang yang telah memiliki faktor-faktor resiko PJK akan meningkatkan peluang orang tersebut terkena penyakit jantung koroner sekaligus hipertensi sebesar 1.109 kali.

• Untuk variabel X2• dengan nilai odds ratio sebesar 9.318 berarti

dengan bertambahnya 1• 57• mmHg tekanan darah sistole akan

meningkatkan peluang orang• tersebut terkena penyakit jantung koroner

sekaligus hipertensi• sebesar 9.318 kali, sedangkan untuk

bertambahnya 1 mmHg tekanan• darah diastole (X3) akan meningkatkan resiko

terkena penyakit• jantung serta hipertensi sebesar 9.309 kali.

Untuk variabel kolesterol• (X4), mengindikasikan bahwa dengan

menurunnya 1 mg/dl kadar• kolesterol akan menurunkan resiko terkena

penyakit jantung koroner• sekaligus hipertensi sebesar 0.749 kali. Untuk

kenaikan 1 mg/dl• kadar HDL (X5) akan meningkatkan resiko

terkena PJK serta• hipertensi sebesar 1.704 kali. Sedangkan

untuk penurunan 1 mg/dl• kadar LDL dan kadar trigliserid dapat

mengurangi resiko terkena• PJK disertai hipertensi berturut turut sebesar

0.488 kali dan 0.895• kali.

• Untuk variabel X2 dengan nilai odds ratio sebesar 9.318 berarti dengan bertambahnya 1 mmHg tekanan darah sistole akan meningkatkan peluang orang tersebut terkena penyakit jantung koroner sekaligus hipertensi sebesar 9.318 kali,

• sedangkan untuk bertambahnya 1 mmHg tekanan darah diastole (X3) akan meningkatkan resiko terkena penyakit

• jantung serta hipertensi sebesar 9.309 kali.

• Untuk variabel kolesterol (X4), mengindikasikan bahwa dengan menurunnya 1 mg/dl kadar kolesterol akan menurunkan resiko terkena penyakit jantung koroner sekaligus hipertensi sebesar 0.749 kali.

• Untuk kenaikan 1 mg/dl kadar HDL (X5) akan meningkatkan resiko terkena PJK serta hipertensi sebesar 1.704 kali.

• Sedangkan untuk penurunan 1 mg/dl kadar LDL dan kadar trigliserid dapat mengurangi resiko terkena PJK disertai hipertensi berturut turut sebesar 0.488 kali dan 0.895 kali.

Nilai odds ratio model regresi logistik kedua

• Interpretasi untuk model logistik kedua, untuk variabel X1 diperoleh nilai odds ratio sebesar 2.659, berarti setiap bertambahnya 1 tahun usia seseorang yang telah memiliki faktor-faktor resiko PJK akan meningkatkan peluang orang tersebut terkena penyakit jantung koroner disertai hipertensi dan diabetes mellitus (DM) sebesar 2.659 kali.

Untuk variabel X2 dengan nilai odds ratio sebesar 6.938 berarti dengan bertambahnya 1 mmHg tekanan darah sistole akan meningkatkan peluang orang tersebut terkena penyakit jantung koroner sekaligus hipertensi dan DM sebesar 6.938 kali,

• bertambahnya 1 mmHg tekanan darah diastole (X3) akan meningkatkan resiko terkena penyakit jantung disertai hipertensi dan DM sebesar 5.667 kali

• variabel kolesterol (X4), mengindikasikan bahwa dengan menurunnya 1 mg/dl kadar kolesterol akan menurunkan resiko terkena penyakit jantung koroner disertai hipertensi dan DM sebesar 0.977 kali

• Untuk kenaikan 1 mg/dl kadar HDL (X5) akan meningkatkan resiko terkena PJK disertai hipertensi dan DM sebesar 1.166 kali.

• Sedangkan untuk penurunan 1 mg/dl kadar LDL dan kadar trigliserid dapat mengurangi resiko terkena PJK disertai hipertensi dan DM berturut turut sebesar 0.891 kali dan 0.866 kali.

TERIMA KASIH

top related