regresi logistik biner dan aplikasinya
Post on 25-Mar-2022
21 Views
Preview:
TRANSCRIPT
1
REGRESI LOGISTIK BINER DAN APLIKASINYA
PENDAHULUAN
Seringkali di dalam penelitian, seseorang ingin memodelkan hubungan antara variabel
X (prediktor; bebas) dan Y (respon; terikat). Metode yang paling sering dipakai dalam kasus
seperti itu adalah regresi linier, baik sederhana maupun berganda. Namun, adakalanya regresi
linier dengan metode OLS (Ordinary Least Square) yang sering dipakai tersebut kurang
sesuai untuk digunakan. Dikatakan kurang sesuai karena jika regresi linier biasa digunakan
akan terjadi pelanggaran asumsi Gauss-Markov. Misalnya pada kasus dimana variabel respon
bertipe data nominal, sedangkan variabel prediktornya bertipe data interval atau rasio.
Untuk mengatasi masalah ini, diperkenalkan metode Regresi Logistik. Sebagaimana
metode regresi biasa, regresi logistik dapat dibedakan menjadi 2, yaitu: Binary Logistic
Regression (Regresi Logistik Biner) dan Multinomial Logistic Regression (Regresi Logistik
Multinomial). Regresi Logistik biner digunakan ketika hanya ada 2 kemungkinan variabel
respon. Sedangkan Regresi Logistik Multinomial digunakan ketika pada variabel respon
terdapat lebih dari 2 kategori. Pendugaan koefisien model regresi logistik tidak dapat
dilakukan dengan metode OLS halnya regresi linear karena pelanggaran asumsi kehomogenan
varians. Casella and Berger (2002) mengatakan bahwa metode estimasi yang biasanya dipakai
adalah metode Maximum Likelihood, yang merupakan salah satu alternatif untuk
memaksimalkan peluang pengklasifikasian obyek yang diamati menjadi kategori yang sesuai
kemudian mengubahnya menjadi koefisien regresi yang sederhana. Metode ini
mengasumsikan bahwa nilai π mengikuti distribusi binomial.
Regresi logistik biner telah banyak digunakan secara luas sebagai salah satu alat
analisis pemodelan ketika variabel responnya bersifat biner, yang merujuk pada penggunaan
dua buah bilangan 0 dan 1 untuk menggantikan dua kategori pada variabel respon. Contoh
variabel respon yang dimaksud adalah kesuksesan (suksesβgagal), kesetujuan (setujuβtidak
setuju), keinginan membeli (yaβtidak), terpilih atau tidak terpilih, dan masih banyak lagi.
Pada tulisan ini akan dibahas mengenai regresi logistik biner beserta aplikasinya
dengan bantuan software SPSS. Data yang digunakan dalam tulisan ini adalah data mengenai
CHD (Coronary Heart Disease) yang dihubungkan dengan sex, kebiasaan merokok,
kelompok usia, kadar kolesterol dan obesitas.
TINJAUAN PUSTAKA
2
1. Regresi Logistik Biner
Regresi logistik adalah metode statistika yang mempelajari tentang pola hubungan
secara matematis antara satu variabel respon (y) yang bersifat nominal atau ordinal dengan
satu atau lebih variabel prediktor (x). Perbedaan yang mendasar dengan model regresi linier
yaitu pada variabel responnya. Variabel respon pada regresi logistik merupakan variabel biner
atau dikotomus. Variabel prediktor dapat berupa variabel polikotomus (kategorik maupun
interval). Sedangkan untuk regresi linier, variabel responnya minimal berskala interval.
Perbedaan lainnya terlihat pada pemilihan model parametrik dan asumsi-asumsi yang
mendasari kedua model. Walaupun demikian, prinsip-prinsip pedugaan parameter yang
digunakan dalam analisis model regresi logistik sama dengan analisis model regresi linier
(Hosmer and Lemeshow, 1989). Menurut jenis skala dan variabel respon yang digunakan
regresi logistik dibagi menjadi 3 macam, yaitu regresi ligistik biner, multinomial dan ordinal.
Analisis regresi logistik biner adalah suatu regresi logistik antara variabel respon (y)
dan variabel prediktor (x) dimana variabel y menghasilkan 2 kategori yaitu 0 dan 1 (Hosmer
dan Lemeshow, 1989). Sehingga variabel y mengikuti distribusi Bernoulli dengan fungsi
probabilitasnya sebagai berikut.
π(π¦) = ππ¦(1 β π)1βπ¦ ; π¦ = 0, 1 (1)
Dimana jika y = 0 maka π(π¦) = 1 β π dan jika y = 1 maka π(π¦) = π. Fungsi regresi
logistiknya dapat dituliskan sebagai berikut.
π(π§) =1
1+πβπ§ πππ’ππ£ππππ π(π§) =ππ§
1+ππ§ (2)
Dengan π§ = π½0 + π½1π₯1 + β― + π½ππ₯π
Jika nilai z antara ββ dan β maka nilai f(z) terletak antara 0 dan 1 untuk setiap nilai
z yang diberikan. Hal tersebut menunjukkan bahwa model logistik sebenarnya menggam-
barkan probabilitas atau resiko dari suatu obyek. Model regresi logistiknya adalah sebagai
berikut.
π(π₯) =ππ½0+π½1π₯1+β―+π½ππ₯π
1+ππ½0+π½1π₯1+β―+π½ππ₯π (3)
Dimana p = banyaknya variabel prediktor
Bila model persamaan di atas ditranformasi dengan tranformasi logit, maka didapatkan
bentuk logit seperti pada persamaan (4).
π(π₯) = ln (π(π₯)
1βπ(π₯)) = π½0 + π½1π₯1 + β― + π½ππ₯π (4)
2. Estimasi Parameter
3
Estimasi parameter dalam regresi logistik dapat dilakukan dengan metode Maximum
Likelihood namun apabila metode ini tidak menghasilkan solusi yang close form, maka dapat
dilanjutkan dengan menggunakan iterasi Newton Raphson, hingga menghasilkan solusi yang
konvergen.
Metode Maximum Likelihood
Pada suatu model dengan respon biner atau dikotom (bernilai 0 atau 1) dimana antar
pengamatan diasumsikan saling bebas maka penduga parameter π½ dapat diperoleh dengan
metode Maximum Likelihood Estimation (MLE) dimana dengan metode ini parameter
diestimasi dengan memaksimumkan fungsi turunan pertama. Estimasi varian dan kovarian
diperoleh dari turunan kedua fungsi log likelihood.
Jika xi dan yi merupakan pasangan variabel bebas dan terikat pada pengamatan ke-i
dan diasumsikan bahwa setiap pasangan pengamatan saling independen dengan pasangan
pengamatan lainnya, i = 1, 2, ..., n maka fungsi probabilitas untuk setiap pasangan adalah se-
bagai berikut.
π(π½, π₯π) = π(π₯π)π¦π(1 β π(π₯π))π¦π ; π¦π = 0, 1 (5)
Dengan (π₯π) =π
(β π½ππ₯ππππ=0
)
1+π(β π½ππ₯ππ
ππ=0
) , dimana ketika j = 0 maka nilai xij = xi0 = 1. Setiap pasangan
pengamatan diasumsikan saling bebas (independen) sehingga fungsi likelihood merupakan
gabungan dari fungsi distribusi masing-masing pasangan yaitu sebagai berikut:
π (π½) = β π(π½, π₯π)ππ=1
= β π(π₯π)π¦π(1 β π(π₯π))1βπ¦ππ
π=1
= π[β (β π¦ππ₯ππ
ππ=1 )
ππ=0 π½π]
[β (1
1+πβ π½ππ₯ππ
ππ=0
)ππ=1 ] (6)
Fungsi likelihood tersebut lebih mudah dimaksimumkan dalam bentuk log π(π½) yang
disebut juga log likelihood (πΏ(π½)). Bentuk itu dapat didefinisikan sebagai berikut.
πΏ(π½) = log π(π½)
= β (β π¦ππ₯ππππ=1 )π
π=0 π½π β β log (1 + πβ π½ππ₯ππ
ππ=0 )π
π=1 (7)
Untuk mendapatkan nilai π½ dari πΏ(π½) yang maksimum maka dilakukan penurunan
terhadap π½ dan hasilnya disamakan dengan nol.
ππΏ(π½)
ππ½π= β π¦ππ₯ππ
ππ=1 β β π₯ππ [
πβ π½ππ₯ππ
ππ=0
1+πβ π½ππ₯ππ
ππ=0
]ππ=1 = 0
β π¦ππ₯ππππ=1 β β π₯πποΏ½ΜοΏ½(π₯π)
ππ=1 = 0 ; j = 0, 1, . . ., p (8)
4
Metode untuk mengestimasi varian dan kovarian dari estimasi koefisien parameter
dikembangkan dengan mengikuti teori Maximum Likelihood Estimation (MLE) yang
menyatakan bahwa estimasi varian dan kovarian diperoleh dari turunan kedua fungsi
likelihood dapat diperoleh hasil sebagai berikut.
ππΏ(π½)
ππ½ππ½π’= β π₯πππ₯ππ’π(π₯π)(1 β π(π₯π))π
π=1 (9)
π2πΏ(π½)
ππ½πππ½π’= β β π₯πππ₯ππ’π(π₯π)(1 β π(π₯π))π
π=1 (10)
Apabila u = j, maka estimasi varian dapat ditulis.
π2πΏ(π½)
π(π½π)2 = β β π₯ππ2ππ(1 β ππ)
ππ=1 ; j, u = 0, 1, β¦, p (11)
Metode Newton Raphson
Untuk memperoleh dugaan maksimum bagi parameter π½ karena pada persamaan
likelihood didapatkan π(π₯) yang non linier terhadap π½ maka digunakan metode Newton
Raphson melalui iterasi π½(π‘+1) = π½(π‘) β (π»(π‘))(β1)π(π‘), dimana t = 0, 1, β¦sampai konvergen,
dengan ππ = [ ππΏ(π½)
ππ½0,
ππΏ(π½)
ππ½1, β¦ ,
ππΏ(π½)
ππ½π] dan H merupakan matriks Hessian.
π» = [
π2πΏ(π½)
ππ½π2
π2πΏ(π½)
ππ½ππ½π’
π2πΏ(π½)
ππ½ππ½π’
π2πΏ(π½)
ππ½π’2
]
Langkah-langkah iterasi Newton Raphson adalah sebagai berikut.
- Gunakan nilai dugaan awal π½(0) dan dimasukan pada Persamaan (3) untuk mendapatkan
π(0). Kemudian masukkan dalam Persamaan (10) dan (11).
- Selanjutnya untuk t > 0 digunakan nilai οΏ½ΜοΏ½(1) = π½(0) β [π»(0)]β1π(0), nilai οΏ½ΜοΏ½ digunakan
untuk mencari π(1)sehingga mendapatkan π(1) dan π»(1) untuk memperoleh οΏ½ΜοΏ½(2) sampai
konvergen.
3. Pengujian Estimasi Parameter
Setelah parameter hasil estimasi diperoleh, maka dilakukan pengujian keberartian
terhadap koefisien π½ secara univariat terhadap variabel respon yaitu dengan membandingkan
parameter hasil maksimum likelihood, dugaan π½ dengan standar error parameter tersebut.
Pengujian yang dilakukan adalah sebagai berikut.
a. Uji Serentak
Uji serentak dilakukan untuk mengetahui signifikansi parameter π½ secara keseluruhan atau
serentak. Pengujian yang dilakukan sebagai berikut.
5
Hipotesis :
π»0 βΆ π½1 = π½2 = . . . = π½π = 0
π»1 βΆ Paling tidak ada satu π½π β 0
Statistik uji (Likelihood Ratio Test) :
πΊ = β2ππ(
π1π
)π1
(π0π
)π0
β οΏ½ΜοΏ½ππ¦π(1βοΏ½ΜοΏ½π)(1βπ¦π)π
π=1
(12)
dimana : π1 = β π¦πππ=1 ; π0 = β (1 β π¦π) ; π =π
π=1 π1 + π0
Daerah Penolakan :
Tolak H0 apabila nilai G > 2(v, ) atau P-value < , dimana v adalah derajat bebas
(banyak variabel prediktor yang ada di dalam model tanpa π½0).
b. Uji Individu
Uji individu ini dilakukan untuk mengetahui signifikansi parameter π½ secara individu
(Hosmer dan Lemeshow, 1989).
Hipotesis :
π»0 βΆ π½π = 0
π»1 βΆ π½π β 0 ; j = 1, 2, β¦, p
Statistik uji (Uji Wald) :
π2 =οΏ½ΜοΏ½π
2
ππΈ(οΏ½ΜοΏ½π)2 (13)
Daerah Penolakan :
Tolak H0 apabila Wi2 > 2
(v, ) atau P-value < dengan v adalah derajat bebas
banyaknya prediktor.
4. Uji Kesesuaian Model
Uji kesesuaian model berguna untuk mengetahui apakah model tanpa variabel-variabel
yang tidak signifikan adalah model terbaik. Terdapat beberapa statistik uji yang dapat
digunakan antara lain.
6
a. β2 log likelihood
πΊ2 = 2 β β π₯πππ½π=1
πΌπ=1 log (
π₯ππ
πππ) (14)
dimana : xij = nilai pengamatan
mij = frekuensi harapan
b. Goodness of fit
π2 = β β(π₯ππβπππ)
2
πππ
π½π=1
πΌπ=1 (15)
Dari kedua statistik uji di atas, untuk menguji hipotesis adalah sebagai berikut.
Hipotesis :
H0 : model yang dihipotesakan sesuai dengan data
H1 : model yang dihipotesakan tidak sesuai dengan data
Daerah Penolakan :
Tolak H0 apabila 2 hitung > 2 (,b) atau G2 hitung > 2
(,b) dimana b merupakan
selisih variabel prediktor dari kedua model yang dibandingkan atau p value < .
c. Improvement
Uji ini digunakan untuk mengetahui variabel prediktor yang belum masuk ke dalam model
apakah memiliki signifikansi dalam model.
Hipotesis :
H0 : model ringkas adalah model terbaik
H1 : model lengkap adalah model terbaik
Statistik uji :
πΊ2 = β2(πΏ0 β πΏ1) (16)
dimana :
=0L log likelihood untuk model ringkas (tanpa variabel tertentu)
=1L log likelihood untuk model lengkap (dengan variabel tertentu)
Daerah Penolakan :
Tolak H0 apabila nilai G2 > 2 (,b) dimana b merupakan selisih variabel prediktor dari
kedua model yang dibandingkan.
5. Interpretasi Koefisien Parameter
Dengan diperolehnya kesesuaian model pada parameter yang signifikan maka selan-
jutnya nilai parameter tersebut diinterpretasikan untuk menjelaskan dua persoalan berikut :
7
- Untuk menjelaskan kecenderungan/hubungan fungsional antara variabel-variabel prediktor
dengan variabel respon.
- Untuk menentukan unit perubahan setiap variabel prediktor.
Interpretasi variabel prediktor (x) dibagi menjadi 2 yaitu :
a. Untuk Variabel Diskrit
Odds ratio (π) merupakan salah satu ukuran tingkat resiko yang digunakan dalam
menginterpretasikan parameter. Misalkan variabel prediktor yang bersifat ordinal dibagi
dalam dua kategori yang dinyatakan dengan kode 0 dan 1, disini kategori pertama
dibandingkan dengan kategori kedua berdasarkan nilai π-nya yang menyatakan kategori
pertama berpengaruh π kali kategori kedua terhadap variabel respon. Nilai- nilai tersebut
dapat dinyatakan dalam Tabel 1.
Tabel 1. Nilai Probabilitas Pengaruh x terhadap y
Variabel Prediktor (x)
x = 1 x = 0
Variabel
respon
(y)
y =1 π(1) =ππ½0+π½1
1 + ππ½0+π½1 π(0) =
ππ½0
1 + ππ½0
y =0 1 β π(1) =
1
1 + ππ½0+π½1 1 β π(0) =
1
1 + ππ½0
Nilai Odds ratio untuk x = 1 dan x = 0 didefinisikan sebagai berikut.
π =
π(1)
1βπ(1)π(0)
1βπ(0)
=π(1)(1βπ(0))
π(0)(1βπ(1))
π =ππ½0+π½1
ππ½0 sehingga π = ππ½1 maka ln π = π½1
Variabel prediktor (x) tidak selalu dikategorikan dalam 2 kategori bisa lebih misalnya
dalam 5 kategori atau k = 5 sehingga setiap variabelnya merupakan variabel diskrit dengan
skala pengukuran nominal. Untuk k = 5 digunakan variabel dummy k - 1 = 4. Dapat dijelaskan
dalam Tabel 2 sebagai berikut :
Tabel 2. Variabel Dummy Untuk x Dengan 5 Kategori
Variabel x D1 D2 D3 D4
1 0 0 0 0
2 1 0 0 0
3 0 1 0 0
4 0 0 1 0
5 0 0 0 1
8
Desain variabel di atas untuk membandingkan variabel dengan kategori 2, 3, 4, 5
dengan kategori 1 dengan π sama seperti pada variabel x dikotomus yang memandang satu
sebagai pembanding.
b. Untuk Variabel Kontinu
Jika variabel prediktor yang masuk ke dalam model regresi logistik adalah kontinu
maka interpretasi dari parameter tergantung pada unit variabel bebas yang masuk misalkan
fungsi π(π₯) = π½0 + π½1(π₯) di mana koefisien π½1 akan memberi perubahan pada g(x) sebesar
satu unit pada setiap perubahan satu unit level x dan secara matematis dinyatakan dengan
g(x+1)-g(x). Jika x berubah sebesar t unit maka g(x) berubah sebesar t1 yang secara
matematis dinyatakan dengan g(x+t)-g(x) = t1. Odds ratio dari π(π‘) = π(π₯ + π‘, π₯) =
πΈπ₯π(π‘π½1).
STUDI KASUS DAN PEMBAHASAN
Sebuah perusahaan pembiayaan sepeda motor ingin mengetahui faktor-faktor apa saja
yang mempengaruhi sebuah kridit kendaraan dapat mengalami kemacetan. Data digunakan
sampel sebanyak 35 peminjam untuk mencari penyebab dimana faktor-faktor yang dicurigai
diantaranya, DP (Besar uang muka), jangka waktu pembayaran, umur peminjam dan
pendidikan peminjam
Pada contoh kasus, variabel prediktornya lebih dari satu. Dalam data ini, yang
merupakan variabel respon adalah status Kredit (βMacetβ = 1 dan βTidak Macetβ = 0).
Variabel prediktor untuk contoh kasus ini bersifat nominal, yaitu.
Tabel 3. Variabel prediktor untuk CHD
Variabel Prediktor Kategori Nilai
x1
(DP Uang Muka)
β€ Rp 1.5 juta 1
> Rp 1.5 juta 0
x2
Jangka waktu Numerik
x3
Umur Numerik
x4
Pendidikan
Perguruan tinggi 0
SMA 1
β€ SMP 2
Tabel diatas menunjukan nama variabel. Untuk variabel independen Kategorik
seperti Dp (Uang Muka) dan Pendidikan diberi kode kategorinya dimana kategori yang
diberi kode nol β0β, nantinya dijadikan sebagai Reference Category. Reference Category
9
umumnya dipilih berdasarkan Kategori yang memiliki Resiko Paling Kecil seperti
pendidikan Perguruan Tinggi, hal ini bertujuan untuk memudahkan dalam pembacaan
hasil analisa. Untuk variabel dependen Status Kridit, kategori resiko diberi kode lebih
besar dari pada kategori tidak beresiko.
Berikut adalah analisis dan pembahasan untuk data pada Lampiran 1, sedangkan
hasil output SPSS selengkapya dapat dilihat pada Lampiran 2.
A. Langkah-langkah Analisis Regresi Logistik
1. Masukkan nilai pada Variabel View
2. Klik Analyze β Regressionβ Binary Logistic
3. Masukan Variabel : Status Kridit ke Dependent Uang Muka , Jangka Waktu
Pembayaran, Umur Pemohon dan Pendidikan ke Covariates.
10
4. Klik categorical pilih variabel covariates dp dan Pendidikan kedalam categorical
covariates, klik reference category first kemudian klik change.
5. Klik Menu Options βMuncul Menu Dialog berikut : Centang Hosmer-Lemeshow dan
CI for exp(B).
11
6. Klik Continue β Oke, berikut outputnya,
Berikut interpretasi hasil uji regresi logistik
B. Estimasi Parameter Regresi Logistik
Dari Tabel 4, diperoleh estimasi parameter regresi logistik, sehingga model regresi
logistik biner dapat dituliskan sebagai berikut:
πππππ‘ (ππ) = 3.233 + 2.739 ππππ ππ’ππ(1) β 0.141 π½πππππ ππππ‘π’ ππππππ¦ππππ
β 0.1 π’ππ’π ππππβππππ + 0.411 ππππππππππ ππππβππ(1)
+ 2.761 ππππππππππ ππππβππππ(2)
dimana:
ππ = π(π = 1)
π(π₯) = πππππ‘ (π) = log(π
1 β π)
sehingga
π(π₯) =ππ½0+π½1π₯1+β―+π½ππ₯π
1 + ππ½0+π½1π₯1+β―+π½ππ₯π
12
Tabel 4. Estimasi Parameter
B S.E. Wald df Sig. Exp(B)
95% C.I.for
EXP(B)
Lower Upper
Step 1a Uang Muka(1) 2.739 1.336 4.202 1 .040 15.474 1.128 212.375
Jangka Waktu
Pembayaran
-.141 .065 4.613 1 .032 .869 .764 .988
Umur Pemohon -.100 .119 .712 1 .399 .905 .717 1.142
Pendidikan Pemohon 5.419 2 .067
Pendidikan
Pemohon(1)
.411 1.189 .119 1 .730 1.508 .147 15.523
Pendidikan
Pemohon(2)
2.761 1.267 4.748 1 .029 15.818 1.320 189.572
Constant 3.233 4.287 .569 1 .451 25.345
Kolom Sig menginformasikan signifikan pengaruh variabel Independen terhadap Variabel
Dependen. Terjadi pengaruh yang signifikan jika nilai sig < 0,05. Tampak variabel yang
berpengaruh terhadap Macet/Tidak dari Kridit seorang Pemohon diantaranya dp (sig 0,040),
Jangka_waktu (sig 0,032), dan pendidikan(2)/ β€ SMP (sig 0,029). Untuk Pendidikan (1)
merupakan kategori pendidiikan βSMAβ dibanding dengan yang pendidikan βPerguruan
Tinggiβ (Reference Category) tidak signifikan berbeda resiko macetnya, namun dengan
pendidikan(2) yang merupakan kategori pendidikan ββ€ SMPβ ada perbedaan signifikan resiko
macetnya dengan yang pendidikan βPerguruan Tinggiβ.
Interpretasi model regresi dari Tabel 4 adalah:
β’ Nilai Exp(B) pada variabel dp 15,474 yang artinya nilai dp β€ 1,5 juta cenderung
lebih beresiko mengalami macet jika dibandingkan dengan yang dp > 1,5 juta
(reference Category-nya) sebesar 15,474 kali.
β’ Nilai Exp(B) pada variabel Jangka waktu 0,869 yang artinya semakin lama
Jangka_waktu pembayaran akan semakin kecil resiko untuk mengalami macet.
β’ Nilai Exp(B) pada variabel βpendidikan(2)β 15,818 yang artinya pemohon yang
pendidikannya ββ€ SMPβ lebih beresiko 15,818 mengalami macet jika
dibandingkan dengan yang pendidikannya βPerguruan Tinggiβ.
13
a. Uji Serentak Parameter Regresi Logistik
Adapun hipotesis untuk pengujian signifikansi parameter regresi secara serentak yaitu:
Ho : Ξ²1 = Ξ²2 = β¦ = Ξ²5 = 0
Ha : Minimal ada satu Ξ²j β 0; j = 1, 2, β¦, 5
Statistik uji yang digunakan yaitu uji π2. Ho ditolak bila p-value < Ξ±, untuk Ξ± = 0.05.
Dari Tabel 5, π2=113.789 dan p-value = 0.000, sehingga dapat disimpulkan untuk
menolak Ho. Jadi minimal ada satu parameter regresi logistik tidak sama dengan nol.
Tabel 5. Uji Omnibus Koefisien Model
Chi-square df Sig.
Step 1 Step 19.368 5 .002
Block 19.368 5 .002
Model 19.368 5 .002
b. Uji Parsial Parameter Regresi Logistik
Adapun hipotesis untuk pengujian signifikansi parameter regresi secara parsial yaitu:
Ho : Ξ²j = 0
Ha : Ξ²j β 0; j = 1, 2, β¦, 5
Statistik uji yang digunakan yaitu uji chi-square, Ho ditolak apabila Ο2hitung > Ο2
Tabel(Ξ±/2)
atau jika p-value < Ξ±, untuk Ξ± = 0.05. Estimasi parameter yang diperoleh dari output
SPSS dapat dilihat pada Tabel 4. Dari 6 parameter yang ada, diketahui bahwa pada Ξ± =
0.05, hanya 3 parameter yang signifikan jangka uang muka (dp), waktu pembayaran,
dan Pendidikan (2) ββ€ SMPβ.
C. Uji Kesesuaian Model
Tahap selanjutnya yaitu menguji kesesuaian model (goodness of fit). Adapun hipotesis
dari uji kesesuaian model yaitu:
Ho : model yang dihipotesakan sesuai dengan data
Ha : model yang dihipotesakan tidak sesuai dengan data
Tabel 6 menunjukkan pengujian kesesuaian model regresi logistik biner. Untuk
pengujian ditampilkan uji Hosmer-Lemeshow. Dimana p-value = 0.404, lebih besar
bila dibandingkan dengan Ξ± (Ξ± = 0.05), sehingga dapat disimpulkan bahwa model
yang dihipotesakan sesuai dengan data.
14
Tabel 6. Uji Hosmer dan Lemeshow
Step Chi-square df Sig.
1 7.243 7 .404
D. Ekspektasi dan Pengukuran Asosiasi
Pada Tabel 7 dapat dilihat frekuensi amatan dan harapan dari data, sedangkan
pada Tabel 8, dapat dilihat sejauh mana keragaman variabel respon Y dapat dijelaskan
oleh variabel prediktor Xi dengan melihat Nagelkerke R-square. Pada kasus ini
diperoleh nilainya sebesar 57.1% yang berarti bahwa sebesar 57.1% keragaman
variabel respon Kredit macet dapat dijelaskan oleh variabel prediktor.
Tabel 7. Tabel Kontingensi Uji Hosmer dan Lemeshow
Status Kridit = Tdk Macet Status Kridit = Macet
Total Observed Expected Observed Expected
Step 1
1 4 3.953 0 .047 4
2 4 3.717 0 .283 4
3 2 3.436 2 .564 4
4 3 3.009 1 .991 4
5 4 2.629 0 1.371 4
6 2 1.822 2 2.178 4
7 1 .961 3 3.039 4
8 0 .406 5 4.594 5
9 0 .067 2 1.933 2
Tabel 8. Ringkasan Model
Step -2 Log likelihood Cox & Snell R
Square
Nagelkerke R
Square
1 28.435a .425 .571
a. Estimation terminated at iteration number 6 because
parameter estimates changed by less than .001.
15
E. Sensitivitas atau Spesifisitas
Tabel 9 menunjukkan bahwa model regresi logistik yang terbentuk bisa
membuat klasifikasi dalam penaksiran nilai Y yaitu sebesar 82.9%. Artinya dengan
model persamaan regresi logistik ini bisa memprediksi seseorang Kreditnya macet
dimana pada kenyataannya dia memang kreditnya macet, atau memprediksi seseorang
tidak macet kreditnya dimana pada kenyataannnya dia memang tidak macet kreditnya
adalah sebesar 82.9%.
Tabel 9. Tabel Klasifikasi
Observed
Predicted
Status Kridit Percentage
Correct
Tdk Macet Macet
Step 1 Status Kridit Tdk Macet 18 2 90.0
Macet 4 11 73.3
Overall Percentage 82.9
a. The cut value is .500
KESIMPULAN
Kesimpulan dari tulisan ini adalah regresi logistik biner digunakan untuk data yang
variabel responnya merupakan data yang terdiri dari dua kategori, dengan satu variabel
prediktor atau lebih, baik yang bersifat kategorik maupun kontinu. Dari contoh kasus kredit di
atas, dapat diambil kesimpulan bahwa status status kreditnya dapat dihubungkan dengan
variabel prediktornya sebagai berikut.
ππππππ‘ (ππ) = 3.233 + 2.739 ππππ ππ’ππ(1) β 0.141 π½πππππ ππππ‘π’ ππππππ¦ππππ
β 0.1 π’ππ’π ππππβππππ + 0.411 ππππππππππ ππππβππ(1)
+ 2.761 ππππππππππ ππππβππππ(2)
Sehingga model regresi logistiknya didapat sebagai berikut.
π(π₯) =πβ4.264+0.158π ππ₯(1)+1.997πππππππ(1)+0.915ππππ ππ(1)+3.230βπ¦ππππβππππ π‘ππππ(1)+1.294ππππ ππ‘ππ (1)
1 + π(1)
DAFTAR PUSTAKA
Casella, G. and Berger, R.L. (2002), Statistik Inference, Duxbury Thomson Learning, USA.
16
Hosmer, D.W. dan Lemeshow, S. (1989), Applied Logistic Regression, John Wiley & Sons,
Inc., New York.
top related