analisis regresi cox proporsional dengan …repository.unair.ac.id/25709/1/awurwani, jatu h.pdf ·...
TRANSCRIPT
ANALISIS REGRESI COX PROPORSIONAL DENGAN HAZARD
DASAR WEIBULL PADA DATA TERSENSOR TIPE II
SKRIPSI
JATU HERLINA AMURWANI
PROGRAM STUDI S-1 MATEMATIKA
DEPARTEMEN MATEMATIKA
FAKULTAS SAINS DAN TEKNOLOGI
UNIVERSITAS AIRLANGGA
2012
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
ii
ANALISIS REGRESI COX PROPORSIONAL DENGAN HAZARD DASAR WEIBULL PADA DATA TERSENSOR TIPE II
SKRIPSI
Sebagai Salah Satu Syarat Untuk Memperoleh Gelar Sarjana Sains Bidang Matematika
Pada Fakultas Sains Dan Teknologi Universitas Airlangga
Disetujui oleh
Pembimbing 1
Toha Saifudin,S.Si,M.Si NIP. 19750106 199903 1 002
Pembimbing II
Drs. Suliyanto, M.Si NIP. 19650907 199102 1 001
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
iii
LEMBAR PENGESAHAN NASKAH SKRIPSI
Judul : Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Penyusun : Jatu Herlina Amurwani Nomor Induk : 080810555 Tanggal Ujian : 18 Juni 2012
Disetujui oleh :
Pembimbing 1
Toha Saifudin,S.Si,M.Si NIP. 19750106 199903 1 002
Pembimbing II
Drs. Suliyanto, M.Si NIP. 19650907 199102 1 001
Mengetahui : Ketua Program Studi S-1 Matematika
Departemen Matematika Fakultas Sains dan Teknologi
Universitas Airlangga
Dr. Miswanto NIP. 19680204 199303 1 002
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
iv
PEDOMAN PENGGUNAAN SKRIPSI
Skripsi ini tidak dipublikasikan, namun tersedia di perpustakaan dalam lingkungan Universitas Airlangga, diperkenankan untuk dipakai sebagai referensi kepustakaan, tetapi pengutipan harus seizin penyusun dan harus menyebutkan sumbernya sesuai kebiasaan ilmiah. Dokumen skripsi ini merupakan milik Universitas Airlangga.
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
v
KATA PENGANTAR
Assalamu’alaikum warahmatullahi wabarakatuh. Alhamdulillahirobbil alamin, berkat rahmat Allah yang telah memberikan
petunjuk dan bimbingan-Nya yang tiada tara, sehingga penulis dapat menyelesaikan skripsi dengan judul ”Analisis Regresi Cox Proporsional dengan
Hazard Dasar Weibull pada Data Tersensor Tipe II ”. Dalam penyusunannya, penulis memperoleh banyak bantuan dari berbagai
pihak, karena itu penulis mengucapkan terima kasih yang sebesar-besarnya kepada : 1. Dr. Miswanto, M.Si., selaku Ketua Prodi S-1 Matematika serta dosen
penguji yang telah memberikan arahan dan bimbingan kepada penulis. 2. Toha Saifudin, S.Si, M.Si selaku dosen pembimbing I yang telah
memberikan banyak arahan, masukan, perhatian, semangat, rasa sabar yang begitu besar dan pengetahuan yang tidak ternilai harganya.
3. Suliyanto, M.Si. selaku dosen pembimbing II yang telah memberikan banyak arahan, masukan, waktu, tenaga dan pikiran.
4. Ir. Elly Ana, M.Si., selaku dosen penguji yang telah memberikan banyak saran untuk kesempurnaan skripsi ini.
5. Dra. Utami Dyah P, M.Si selaku dosen wali selama menjadi mahasiswa Fakultas Sains dan Teknologi Universitas Airlangga yang telah banyak memberikan arahan dan saran demi kesuksesan menjadi mahasiswa Matematika. Serta seluruh dosen Matematika Universitas Airlangga, terima kasih untuk segala ilmu yang diberikan.
6. Untuk Kedua Orang Tuaku tercinta dan ketiga adikku yang telah memberikan dukungan, semangat, kerpercayaan serta cinta dan kasih sayang yang begitu besar. Semoga saya selalu bisa membanggakan kalian.
7. Untuk Varian Luthfan yang telah setia menjadi seorang teman, sahabat, pemberi motivasi serta semangat yang tak pernah henti. Terima kasih atas segala perhatian dan nasehat-nasehatnya selama ini.
8. Arek-arek GP++ : Ragil, Rika, Dilphi, Mita, Wewe, Dinda, Lia, Tika, Vita, dan Michelle, terima kasih atas semua dukungan, canda tawa dan kenangan manis selama ini, semuanya tidak akan pernah terlupakan sampai kapanpun. Love you All.
9. Anak-anak kos dodol penghuni koz Ungu : Lely “Mon” terima kasih telah menjadi temen kamar yang menyenangkan dan selalu memberi dukungan,
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
vi
Arindha & Lia “Temen Seperjuangan” Semangat kawan ayo wisuda bareng, Beta “Bebeb” Jangan kebanyakan nonton drama korea sedih ya. Untuk Efinda & Daris, Mega & D’Nita, Terima kasih atas dukungan, kebersamaan dan canda tawa selama ini.
10. Rekan-rekan mahasiswa Matematika Universitas Airlangga 2008, terima kasih atas kebersamaan selama ini.
11. Serta pihak-pihak lain yang tidak dapat disebutkan satu persatu, terima kasih atas segala bantuan dalam penyelesaian skripsi ini.
Penulis menyadari bahwa skripsi ini masih banyak terdapat kekurangan-kekurangan. Oleh karena itu, penulis mengharapkan kritik dan saran yang membangun agar skripsi ini dapat lebih baik lagi.
Surabaya, Juni 2012 Penyusun
Jatu Herlina Amurwani
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
vii
Jatu Herlina Amurwani. 2012. Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II. Skripsi ini dibawah bimbingan Toha Saifudin S.Si, M.Si dan Drs. Suliyanto, M.Si. Departemen Matematika. Fakultas Sains dan Teknologi Universitas Airlangga.
ABSTRAK
Model regresi Cox proporsional merupakan model yang menggambarkan hubungan antara waktu survival sebagai variabel dependen dengan satu set variabel independen yang bisa kontinue ataupun kategorik. Secara umum bentuk model regresi Cox Proporsional dengan hazard dasar weibull adalah :
( ) ( )
dengan merupakan vektor dari variabel independen, merupakan vektor dari koefisien regresi, dan merupakan hazard dasar dari distribusi Weibull. Tujuan tulisan ini adalah mendapatkan estimator parameter regresi Cox dengan hazard dasar weibull pada data tersensor tipe II. Metode yang digunakan untuk mengestimasi parameter model adalah Maximum Likelihood. Estimator parameter regresi Cox dengan hazard dasar weibull pada data tersensor tipe II masih dalam bentuk implisit, sehingga diperlukan metode numerik untuk menyelesaikannya. Model selanjutnya diterapkan pada studi kasus pasien penderita Cardiovascular Diseases. Persamaan model regresi Cox proporsional dengan hazard dasar weibull pada data tersensor tipe II, hasil penerapan pada pasien penderita Cardiovascular Diseases adalah sebagai berikut :
( ) ( )( ) ( )
dengan adalah Sistolic Blood Pressure dan adalah Logaritm of Urinary
Albumin and Creatin. Nilai residual Cox-snell dari model tersebut berdistribusi eksponensial, sehingga dapat dikatakan model yang didapat sesuai atau tepat. Berdasarkan persamaan tersebut, diketahui bahwa resiko kematian pasien akan bertambah sebesar untuk setiap kenaikan SBP sebesar 10 satuan. Sedangkan untuk variabel LACR, resiko kematian pasien akan bertambah sebesar 0,256563 untuk setiap kenaikan LACR sebesar 2 satuan. Kata Kunci : Model Regresi Cox Proporsional dengan Hazard Dasar Weibull,
Regresi Cox, Proporsional Hazard, Data Tersensor Tipe II, Maximum Likelihood Estimator (MLE)
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
viii
Jatu Herlina Amurwani. 2012. Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II. This skripsi in under the guidance by Toha Saifudin S.Si, M.Si and Drs. Suliyanto, M.Si. Mathematics departement of Scince and Technology Faculty. Airlangga University.
ABSTRACT
Cox proportional regression model is a model that describes the relationship between survival times as the dependent variable with a set of independent variables, which can be continuous or categorical. In general, the form of Cox proportional regression model with the baseline hazard Weibull is
( ) ( )
where is a vector of independent variables, is vector of regression coefficients, and are the baseline hazard of the Weibull distribution. The purpose of this paper is to obtain estimators Cox regression parameter with Weibull as the baseline hazard for type II censored. The method used to estimate the model is the Maximum Likelihood Estimator. The model was applied to case studies of patients with Cardiovascular Diseases. The equation of Cox proportional hazard in patients with Cardiovascular Diseases are as follows :
( ) ( )( ) (
)
where is Sistolic Blood Pressure and is Logaritm of Urinary Albumin and Creatine. Cox-Snell residual value of this model is distributed exponentially, so that it can be said that the model fit or just gained. Based on the results, it is known that the risk of dying patients would increase by 0.751572 for each increase in SBP of 10 units. While for the variable LACR, the risk of dying patients would increase by 0.256563 for each increase by 2 units LACR. Keyword : Cox Proportional Regression Model with Baseline Hazard Weibull,
Cox Regression, Proportional Hazard, Type II censored data, Maximum Likelihood Estimator (MLE)
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
ix
DAFTAR ISI
Halaman
LEMBAR JUDUL ............................................................................................... i
LEMBAR PERNYATAAN ................................................................................ ii
LEMBAR PENGESAHAN ............................................................................... iii
LEMBAR PEDOMAN PENGGUNAAN SKRIPSI .......................................... iv
KATA PENGANTAR ........................................................................................ v
ABSTRAK ........................................................................................................ vii
DAFTAR ISI ...................................................................................................... ix
DAFTAR GAMBAR ........................................................................................ xii
DAFTAR TABEL ............................................................................................ xiii
DAFTAR LAMPIRAN ............................................................................. xiv
BAB I PENDAHULUAN ................................................................................... 1
1.1 Latar Belakang Permasalahan ........................................................... 1
1.2 Rumusan Masalah ............................................................................. 4
1.3 Tujuan ................................................................................................ 4
1.4 Manfaat .............................................................................................. 5
1.5 Batasan Masalah ................................................................................ 5
BAB II TINJAUAN PUSTAKA ......................................................................... 6
2.1 Analisis Regresi ................................................................................. 6
2.2 Analisis Data Uji Hidup .................................................................... 7
2.3 Tipe Penyensoran .............................................................................. 8
2.4 Fungsi Survival dan Fungsi Hazard .................................................. 9
2.5 Distribusi Weibull ........................................................................... 13
2.6 Model Regresi Dalam Analisis Data Uji Hidup .............................. 14
2.7 Model Regresi Cox Proporsional Hazard ........................................ 15
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
x
2.8 Fungsi Likelihood ........................................................................... 17
2.9 Maximum Likelihood Estimator ..................................................... 18
2.10 Estimasi Fungsi Survival ............................................................... 18
2.11 Residual Cox – Snell ..................................................................... 19
2.12 Metode Newton Rapshon .............................................................. 21
2.13 Titik Maksimum ............................................................................ 22
2.14 Matrik Definit Negatif ................................................................... 23
2.15 S-Plus ............................................................................................ 23
2.16 Cardiovascular Diseases ................................................................ 25
2.17 Interpretasi Model Proporsional Hazard ....................................... 30
BAB III METODE PENELITIAN .............................................................. 32
BAB IV PEMBAHASAN ................................................................................. 34
4.1 Model Regresi Cox dengan Hazard Dasar Weibull ........................ 34
4.1.1 Menentukan Fungsi Hazard Dasar Weibull ......................... 35
4.1.2 Mendapatkan Model Regresi Cox dengan Hazard
Dasar Weibull ........................................................................ 35
4.1.3 Menetukan Fungsi Survival dan PDF yang berhubungan
dengan Hazard Dasar Weibull ............................................... 35
4.2 Estimasi Parameter dalam Model Regresi Cox ............ 36
4.2.1 Menentukan Fungsi Likelihood dari Model Regresi Cox
dengan Hazard Dasar Weibull............................................... 36
4.2.2 Menentukan Fungsi Log-Likelihood ..................................... 37
4.2.3 Menentukan Turunan Pertama Fungsi Log Likelihood
Terhadap Parameter ............................................. 38
4.2.4 Mendapatkan Estimator Parameter ...................... 39
4.2.5 Menentukan Turunan Kedua Fungsi Log Likelihood ........... 40
4.3 Estimasi Residual Cox – Snell ...................................................... 45
4.4 Algoritma untuk Mendapatkan Estimator .................... 46
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
xi
4.5 Algoritma untuk Estimasi Residual Cox – Snell ............................ 49
4.6 Program Estimasi Parameter Model Regresi Cox
dengan Hazard Dasar Weibull........................................................ 49
4.7 Penerapan Pada Kasus Data Uji Hidup .......................................... 50
4.7.1 Uji Kesesuaian Distribusi Weibull pada data waktu Tahan
Hidup pasien Cardiovascular Disease ................................. 50
4.7.2 Asumsi Hazard Proporsional ................................................. 51
4.7.3 Estimasi Parameter ............................................. 65
4.7.4 Model Regresi Cox Proporsional untuk Data CVD .............. 67
4.7.5 Uji Residual Cox – Snell ....................................................... 68
4.7.6 Resiko Kematian Pasien Cardiovascular Disease ................ 69
BAB V KESIMPULAN .................................................................................... 71
DAFTAR PUSTAKA ....................................................................................... 73
LAMPIRAN
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
xii
DAFTAR GAMBAR
Nomor Judul Gambar Halaman
2.1 Kurva Fungsi Survival ........................................................................ 10
2.2 Kurva Distribusi Kumulatif Weibull .................................................. 13
4.1 Plot Asumsi Hazard Proporsional Variabel DG ................................. 52
4.2 Plot Asumsi Hazard Proporsional Variabel AGE ............................... 54
4.3 Plot Asumsi Hazard Proporsional Variabel SEX ................................ 55
4.4 Plot Asumsi Hazard Proporsional Variabel SMOKE ......................... 56
4.5 Plot Asumsi Hazard Proporsional Variabel BMI ................................ 58
4.6 Plot Asumsi Hazard Proporsional Variabel SBP ................................ 59
4.7 Plot Asumsi Hazard Proporsional Variabel LACR ............................ 60
4.8 Plot Asumsi Hazard Proporsional Variabel LTG ............................... 62
4.9 Plot Asumsi Hazard Proporsional Variabel HTN ............................... 63
4.10 Plot Asumsi Hazard Proporsional Variabel DM ................................. 64
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
xiii
DAFTAR TABEL
Nomor Judul Tabel Halaman
4.1 Nilai-nilai penduga Kaplan Meier dari fungsi Survival variabel Jenis penyakit (DG) ................................................................. 52
4.2 Nilai-nilai penduga Kaplan Meier dari fungsi Survival variabel Usia (AGE) .............................................................................. 53
4.3 Nilai-nilai penduga Kaplan Meier dari fungsi Survival variabel Jenis kelamin (SEX) ................................................................ 54
4.4 Nilai-nilai penduga Kaplan Meier dari fungsi Survival variabel intensitas merokok (SMOKE) ................................................. 56
4.5 Nilai-nilai penduga Kaplan Meier dari fungsi Survival variabel indeks masa tubuh (BMI) ........................................................ 57
4.6 Nilai-nilai penduga Kaplan Meier dari fungsi Survival variabel tekanan darah sistole (SBP)..................................................... 58
4.7 Nilai-nilai penduga Kaplan Meier dari fungsi Survival variabel Algoritma Albumin dan kreatin (LACR) ................................ 60
4.8 Nilai-nilai penduga Kaplan Meier dari fungsi Survival variabel Algoritma Trigliserin (LTG) ................................................... 61
4.9 Nilai-nilai penduga Kaplan Meier dari fungsi Survival variabel status hipertensi (HTN) ........................................................... 62
4.10 Nilai-nilai penduga Kaplan Meier dari fungsi Survival variabel status diabetes (DM)................................................................ 64
4.11 Nilai Estimator Awal Dari Data Tahan Hidup Pasien Penderita Penyakit Kardiovaskuler. ...................................................... 66 4.12 Nilai Estimator Parameter Dari Data Tahan Hidup Pasien Penderita Penyakit Kardiovaskuler ....................................................... 66 4.13 Nilai Residual Pada Data Tahan Hidup Pasien Penderita Penyakit Kardiovaskuler ...................................................................................... 68
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
xiv
DAFTAR LAMPIRAN
Nomor Judul Lampiran
1. Data Pasien Penderita Cardiovascular Disease (CVD).
2. Uji Kesesuaian Distribusi Weibull pada Kasus Data Tahan Hidup
Pasien Penderita Cardiovascular Disease (CVD).
3. Program Untuk Menentukan Estimator Parameter Model Regresi
Cox Proporsional Hazard.
a. Subprogram Untuk Mendapatkan Turunan Pertama.
b. Subprogram Untuk Mendapatkan Matrik Jacobian.
c. Subprogram Untuk Mendapatkan Estimator Parameter.
.
4. Program Untuk Mendapatkan Nilai Residual Cox – Snell.
5. Output Program Untuk Menentukan Parameter Model
Regresi Cox Proporsional dengan Hazard Dasar Weibull.
a. Nilai estimator parameter regresi Cox
b. Nilai Eigen matriks Hessian
c. Uji residual Cox Snell
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
1
BAB I
PENDAHULUAN
1.1 Latar belakang
Statistika merupakan suatu alat yang memegang peranan penting dalam
pengambilan keputusan. Banyak sekali peranan ilmu statistika dalam pengambilan
keputusan, salah satunya adalah di dunia medis atau kesehatan.
Analisis data uji hidup merupakan salah satu teknik statistika yang banyak
digunakan dalam bidang kesehatan. Di dunia kesehatan, sulit sekali untuk
mengetahui lamanya tahan hidup seorang pasien dalam pengobatan suatu
penyakit, apalagi untuk menentukan waktu kesembuhan atau kambuhnya suatu
penyakit. Namun, hal yang bisa kita lakukan adalah mengetahui sifat karakteristik
dari penyakit tersebut, antara lain : menganalisis peluang ketahanan, resiko
kematian, memodelkan sifat karakteristik penyakit, menentukan estimasi interval
kepercayaan dan mengambil kesimpulan yang berhubungan dengan penyakit
tersebut.
Dalam kehidupan nyata khususnya di dunia kesehatan, banyak sekali
situasi yang melibatkan populasi heterogen, sehingga penting untuk
mempertimbangkan hubungan waktu tahan hidup seseorang dengan faktor lain.
Satu-satunya jalan untuk menguji hubungan dari variabel bebas yang sesuai
dengan waktu tahan hidup seseorang adalah dengan menggunakan model regresi,
dengan ketergantungan waktu tahan hidup pada variabel yang sesuai dengan tegas
dikenali. Dalam analisis data uji hidup terdapat dua model regresi yang sering
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
2
digunakan yaitu : model proporsional hazard untuk T dan model lokasi skala
untuk log T.
Model tersebut selanjutnya diperluas pada situasi dimana resiko kematian
pada waktu tertentu tergantung pada nilai dari variabel bebas
. Himpunan nilai variabel bebas dari model proporsi hazard dapat
dinyatakan dengan vektor , yaitu = . Model regresi Cox
proporsional hazard untuk pengamatan ke- dari individu dapat dituliskan
sebagai berikut :
Model regresi Cox merupakan model hazard proporsional dasar yaitu rasio
hazardnya sama sepanjang waktu atau rasio hazardnya independen dengan waktu
(Fahrmer dan Tutz,1994). Model ini dikemukakan oleh Cox dan lebih dikenal
dengan regresi Cox, dimana merupakan vektor dari variabel bebas, dan
merupakan koefisien regresi yang membentuk vektor , sedangkan
merupakan fungsi hazard untuk individu dengan semua nilai variabel bebasnya
yang memuat vektor x sama dengan nol, dinamakan hazard dasar (baseline
hazard function) (Collet, 1994).
Fungsi hazard untuk setiap individu adalah yang diasumsikan
berdistribusi Weibull dengan λ adalah parameter skala dan γ adalah parameter
bentuk, maka Model Cox dapat dituliskan sebagai berikut (Collet, 1994) :
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
3
Distribusi weibull yang digunakan sebagai hazard dasar merupakan salah
satu distribusi yang banyak digunakan untuk menganalisis data uji hidup.
Distribusi weibull memiliki berbagai kelebihan yang tidak dimiliki oleh distribusi
lain seperti : memiliki 2 parameter yaitu parameter bentuk dan parameter skala,
parameter bentuk yang dimiliki oleh distribusi weibull menjadikan distribusi ini
lebih fleksibel atau bisa menyerupai distribusi lain.
Model regresi Cox proporsional hazard merupakan regresi survival,
dengan respon merupakan data waktu survival sampai suatu titik kejadian yang
ditentukan. Karakteristik utama model regresi Cox ini adalah mengakomodasikan
adanya data sensor. Di dalam analisis data uji hidup dikenal beberapa tipe
penyensoran, diantaranya adalah sampel tersensor tipe II. Sampel tersensor tipe II
ini memiliki kelebihan yaitu lebih efisien waktu, karena percobaan akan
dihentikan ketika sudah mencapai kegagalan yang diinginkan, dengan ketentuan
.
Karakteristik analisis survival yang mengakomodasi adanya sensoring
inilah yang membuat estimasi parameter pemodelan data survival dengan fungsi
likelihood semakin komplek (Fox,2002). Pada kasus dimana satu atau lebih data
tersensor tipe II, maka fungsi likelihood-nya dapat ditulis sebagai berikut
|
{∏
}
dengan menyatakan data waktu survival, menyatakan banyak data survival,
dan menyatakan banyak kematian / kegagalan pertama yang diinginkan untuk
diuji.
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
4
Berdasarkan uraian diatas, penulis tertarik untuk mengambil judul
“Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data
Tersensor Tipe II” dan selanjutnya menerapkan hasilnya pada data riil.
1.2 Rumusan Masalah
Berdasarkan latar belakang yang telah diuraikan, dapat dirumuskan
permasalahan :
1 Bagaimana bentuk model regresi Cox proporsional dengan hazard
dasar weibull ?
2 Bagaimana memperoleh estimator parameter model regresi Cox
dengan hazard dasar Weibull pada data tersensor tipe II ?
3 Bagaimana menerapkan model regresi Cox melalui studi kasus pada
data riil ?
1.3 Tujuan
Berdasarkan rumusan masalah diatas, tujuan yang ingin dicapai adalah
untuk :
1 Mendapatkan bentuk model regresi Cox proporsional dengan hazard
dasar weibull
2 Mendapatkan estimator parameter model regresi Cox dengan hazard
dasar Weibull pada data tersensor tipe II
3 Menerapkan model regresi Cox terhadap data riil.
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
5
1.4 Manfaat
Manfaat dari penulisan skripsi ini adalah sebagai berikut :
1 Memperluas wawasan tentang metode analisis regresi yang biasa
digunakan untuk menganalisa data survival
2 Dapat memodelkan regresi data survival secara umum dan metode
Cox secara khusus.
3 Mampu menerapkan dan mengaplikasikan model regresi tersebut ke
dalam data riil.
1.5 Batasan masalah
Mengacu pada rumusan masalah yang telah disebutkan, maka ruang
lingkup dalam penulisan skripsi ini dibatasi pada estimasi titik parameter
regresi dengan metode maksimum likelihood pada data tersensor tipe II.
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
6
BAB II
TINJAUAN PUSTAKA
2.1 Analisis Regresi
Sir Francis Galton (1822-1911), seorang antropolog dan ahli meteorologi
terkenal dari Inggris yang memperkenalkan istilah regresi dalam pidato di depan
Section H of the British Association di Aberdem, 1885, yang dimuat dalam
majalah Nature, dan juga dalam sebuah makalah “Regression Towards Mediocrity
in Hereditary Stature”, yang dimuat dalam journal of the Antropolgical Institute,
1985.
(Drapper dan Smith,1992)
Analisis regresi merupakan salah satu teknik yang ada dalam statistika,
secara umum ada beberapa definisi yang menjelaskan tentang analisis regresi
yaitu :
Definisi 2.1
Analisis regresi merupakan teknik statistik untuk menyelidiki dan
membuat model hubungan diantara variabel-variabel.
(Montgomery dan Peck,1992)
Definisi 2.2
Tujuan dari analisis regresi yaitu untuk mendapatkan model terbaik yang
menggambarkan hubungan antara variabel respon (variabel tak
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
7
bebas/variabel dependen) dan variabel prediktor (variabel bebas/variabel
independen) .
(Hosmer dan Lemeshow, 1989)
Definisi 2.3
Variabel prediktor ialah variabel yang nilainya dapat ditentukan atau yang
nilainya dapat diamati namun tidak dapat dikendalikan. Variabel respon
ialah variabel yang nilainya dipengaruhi oleh perubahan-perubahan
variabel-variabel prediktor.
(Drapper dan Smith,1992)
Di dalam kehidupan nyata banyak sekali teknik statistika yang dapat
digunakan untuk menganalisis masalah. Salah satu teknik analisis statistika yang
digunakan untuk menganalisis data yang berhubungan dengan waktu tahan hidup
adalah analisis data uji hidup.
2.2 Analisis Data Uji Hidup
Analisis data uji hidup (Survival analysis) adalah suatu metode untuk
menganalisis data yang berhubungan dengan waktu, mulai dari time origin atau
start-point sampai dengan terjadinya suatu kejadian khusus atau end point. Di
dalam riset medis, time origin sering digunakan sebagai awal perekrutan suatu
individu dalam suatu studi yang bersifat percobaan sedangkan end-point
merupakan kematian suatu individu atau pasien, sehingga data yang dihasilkan
secara harfiah dinamakan waktu survival.
(Collet,1994)
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
8
Untuk mendapatkan data uji hidup biasanya dilakukan eksperimen. Dalam
melakukan eksperimen ada beberapa metode yang dilakukan sehingga data yang
dihasilkan juga berbeda dari satu metode ke metode lain. Yang membedakan
analisis uji hidup dengan bidang-bidang yang lain pada statistika adalah
penyensoran.
2.3 Tipe Penyensoran
Di dalam analisis data uji hidup terdapat beberapa tipe penyensoran yaitu
sampel lengkap, sampel tersensor tipe I, dan sampel tersensor tipe II. Penjelasan
lengkapnya adalah sebagai berikut :
2.3.1 Sampel Lengkap
Pada uji sampel lengkap, eksperimen akan dihentikan jika semua benda
atau individu yang telah diuji mati atau gagal. Langkah seperti ini mempunyai
suatu keuntungan yaitu dihasilkannya observasi terurut dari semua benda atau
individu yang diuji.
(Lawless,1982)
2.3.2 Sampel Tersensor Tipe I
Dalam sampel tersensor tipe I, eksperimen akan dihentikan jika telah
dicapai waktu tertentu (waktu penyensoran). Misalkan adalah sampel
random dari distribusi tahan hidup dengan fungsi kepadatan peluang , fungsi
survival dan waktu tersensor untuk semua yaitu dengan .
Suatu komponen dikatakan terobservasi jika dan tersensor jika .
Selanjutnya data sampel uji hidup dicatat sebagai dan :
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
9
{
dimana adalah nilai sensor pada pengamatan ke-i
(Lawless, 1982)
2.3.3 Sampel Tersensor Tipe II
Pada pengujian sampel tersensor tipe II, eksperimen akan dihentikan
setelah kematian ke- dari komponen yang dioperasikan tercapai. Misalkan
adalah sampel random dari distribusi tahan hidup dengan fungsi
kepadatan peluang dan fungsi survival . Eksperimen dikatakan telah
selesai jika kegagalan ke- telah dicapai ( .
(Lawless, 1982)
Dalam analisis data survival ada dua macam fungsi yang dapat
memberikan informasi tentang data survival, yaitu fungsi survival dan fungsi
hazard.
2.4 Fungsi Survival dan Fungsi Hazard
Fungsi survival merupakan dasar dari analisis survival, karena meliputi
probabilitas survival dari waktu yang berbeda-beda yang memberikan informasi
penting tentang data survival. Dalam analisis data uji hidup fungsi survival dapat
didefinisikan :
Definisi 2.4
Fungsi survival disefinisikan sebagai probabilitas waktu yang
bertahan lebih besar atau sama dengan waktu.
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
10
Jika diketahui fungsi distribusi kumulatif , yaitu :
∫
, (2.1)
maka bisa diperoleh fungsi survival sebagai berikut :
∫
∫
(2.2)
(Kleinbaum dan Klein, 2005)
Secara teori, fungsi survival dapat digambarkan dengan kurva mulus dan
memiliki karakteristik sebagai berikut:
1. Tidak meningkat, kurva cenderung turun ketika meningkat.
2. Untuk , adalah awal dari penelitian, karena tidak ada objek
yang mengalami peristiwa, probabilitas waktu survival 0 adalah 1.
3. Untuk secara teori, jika periode penelitian meningkat
sampai tak berhingga maka tidak ada satu pun yang bertahan, sehingga
kurva survival mendekati nol.
Gambar 2.1 Kurva Fungsi Survival
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
11
Berbeda dengan fungsi survival yang fokus pada tidak terjadinya
peristiwa, fungsi hazard fokus pada terjadinya peristiwa. Oleh karena itu, fungsi
hazard dapat dipandang sebagai pemberi informasi yang berlawanan dengan
fungsi survival.
(Kleinbaum dan Klein, 2005)
Kurva fungsi hazard juga memiliki karakteristik, yaitu:
1. Selalu non negatif, yaitu sama atau lebih besar dari nol.
2. Tidak memiliki batas atas.
Selain itu fungsi hazard juga digunakan untuk alasan :
1. Memberikan gambaran tentang failur rate.
2. Mengidentifikasi bentuk model yang spesifik.
3. Membuat model matematik untuk analisis survival biasa.
Misalkan melambangkan waktu survival dari waktu awal sampai
terjadinya peristiwa yang merupakan variabel acak yang memiliki
karakteristik fungsi survival dan fungsi hazard, maka fungsi hazard
didefinisikan :
Definisi 2.5
Fungsi hazard didefinisikan sebagai tingkat kematian sesaat suatu
individu pada waktu .
(Kleinbaum dan Klein, 2005)
Misal, probabilitas variabel random berada antara dan , dengan syarat
lebih besar atau sama dengan , ditulis sebagai berikut :
|
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
12
Maka fungsi hazard yang didapat adalah
{ |
}
{
}
{
}
atau dapat juga ditulis sebagai berikut :
{
}
(2.3)
karena sehingga diperoleh
{ }
{ }
{ }
* ∫
+ (2.4)
dengan ∫
disebut fungsi hazard kumulatif
(Collet, 1994).
Di dalam analisis data uji hidup terdapat beberapa distribusi yang dapat
digunakan sebagai asumsi, salah satunya adalah distribusi Weibull.
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
13
2.5 Distribusi Weibull
Fungsi kepadatan peluang (fkp) dari distribusi Weibull dua parameter,
diformulasikan sebagai :
, (
)
- (2.5)
dengan :
(Lawless, 2003)
Jika maka fungsi kepadatan peluang (fkp) dari waktu survival
yang berdistribusi weibull dengan dua parameter adalah
(2.6)
dengan :
Berdasarkan fkp dalam persamaan (2.6), diperoleh fungsi distribusi
kumulatif weibull adalah sebagai berikut :
Gambar 2.2 Kurva Fungsi Distribusi Kumulatif Weibull
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
14
Sehingga persamaan (2.2) fungsi survivalnya dapat dituliskan sebagai berikut :
maka diperoleh fungsi hazard weibull :
(2.7)
(Collet, 1994)
Dalam kehidupan nyata khususnya di dunia medis, banyak situasi yang
melibatkan populasi heterogen, sehingga penting untuk mempertimbangkan
hubungan waktu tahan hidup dengan faktor lain. Satu-satunya jalan untuk menguji
hubungan dari variabel bebas yang sesuai dengan waktu tahan hidup yaitu
menggunakan model regresi, dimana ketergantungan waktu tahan hidup pada
variabel yang sesuai dengan tegas dikenali.
2.6 Model Regresi dalam Analisi Data Uji Hidup
Dalam analisis data uji hidup terdapat dua model regresi yang sering
digunakan untuk menganalisis data survival yaitu :
2.6.1 Model Proporsional Hazard untuk T
Model proporsional hazard merupakan model yang mengasumsikan
bahwa perbedaan antar individu dalam sekelompok data yang hendak dianalisis
mempunyai fungsi hazard yang proporsional satu sama lain. Hal ini berarti bahwa
rasio ⁄ merupakan fungsi hazard dari dua individu dengan vektor
regresi tidak tergantung pada Dengan kata lain fungsi hazard untuk , dengan
diketahui, dapat ditulis dengan :
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
15
(2.8)
dengan merupakan fungsi hazard dasar (baseline hazard functio) dan
merupakan fungsi yang menyatakan pengaruh terhadap hazard.
(Lawless, 1982)
2.6.2 Model Lokasi Skala untuk Log T.
Bagian terpenting kedua dari model regresi dalam analisis data uji hidup
adalah log waktu tahan hidup , diberikan , mempunyai suatu
distribusi dengan parameter lokasi dan parameter skala tetap dapat ditulis
sebagai berikut :
, (2.9)
dimana dan galat model mempunyai distribusi yang independen terhadap .
Biasanya memiliki distribusi normal standart.
(Lawless, 1982)
Kedua model diatas merupakan model yang digunakan untuk menganalisis
data survival secara umum, namun bila ada variabel-variabel bebas yang ingin
dikontrol atau bila menggunakan beberapa variabel penjelas untuk menjelaskan
hubungan antara waktu survival, maka regresi Cox lah yang digunakan.
2.6 Model Regresi Cox Proporsional Hazard
Regresi Cox proporsional hazard digunakan bila respon yang diobservasi
adalah data waktu survival (Kleinbaum dan Klein, 2005). Pada mulanya
pemodelan ini digunakan pada cabang statistika khususnya biostatistika yaitu
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
16
digunakan untuk menganalisis kematian atau harapan hidup seseorang. Namun
seiring perkembangan zaman pemodelan ini banyak dimanfaatkan diberbagai
bidang. Diantaranya bidang akademik, kedokteran, sosial, science, teknik,
pertanian dan sebagainya.
Ketika menyelidiki suatu kasus dibidang kedokteran contohnya kasus
pasien penderita penyakit tertentu, dibutuhkan hubungan waktu survival pasien
dengan karakteristik-karakteristik klinis lainnya yang didapat dari data medis
pasien.
Formula model Cox merupakan perkalian dari dua besaran yaitu fungsi
baseline hazard dan bentuk eksponensial untuk penjumlahan linier dari yaitu
penjumlahan dari variabel independen (Kleinbaum dan Klein, 2005).
Model regresi Cox ini berlaku pada situasi dimana resiko kematian pada
waktu tertentu tergantung pada nilai-nilai dari variabel bebas
Himpunan nilai variabel bebas dari model proporsional hazard
dapat dinyatakan dengan x, sehingga )’. Model proporsional
hazard untuk pengamatan ke- dari individu secara umum :
(2.10)
dengan merupakan vektor dari variabel bebas, dan
merupakan vektor dari koefisien regresi. Sedangkan merupakan fungsi
hazard untuk individu yang mana semua nilai variabel bebasnya memmuat vektor
x sama dengan nol, dinamakan hazard dasar (baseline hazard function).
(Collet, 1994)
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
17
Metode estimasi yang digunakan dalam skripsi ini adalah metode estimasi
maximum likelihood. Ketika menggunakan metode ini, hal yang harus diketahui
adalah tentang fungsi likelihood.
2.8 Fungsi Likelihood
Definisi 2.6
Misalkan adalah variabel random yang identik dan
independen dari suatu distribusi dengan fungsi kepadatan peluang (fkp)
untuk dan adalah ruang parameter. Fkp bersama antara
adalah . Jika fkp bersama
tersebut dinyatakan sebagai fungsi terhadap maka dinamakan fungsi
likelihood (L) yang dinyatakan sebagai :
(Hogg dan Craig, 1978)
Definisi 2.7
Pada kasus dimana terdapat satu atau lebih data survival yang tersensor
tipe II, maka fungsi likelihood-nya dapat dituliskan sebagai :
|
∏
dengan menyatakan data waktu survival, menyatakan jumlah kematian
/ kerusakan yang diinginkan dalam pengujian dan menyatakan
banyaknya data yang sedang diuji.
(Collet, 1994)
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
18
Setelah mendapatkan fungsi likelihood, langkah selanjutnya dalam
estimasi parameter menggunakan MLE adalah mendapatkan nilai maksimum
likelihood.
2.9 Maksimum Likelihood Estimator (MLE)
Definisi 2.8
Jika statistik memaksimumkan fungsi likelihood
maka statistik dinamakan
maksimum likelihood estimator (MLE) dari .
(Hogg and Craig, 1978)
Karena fungsi survival merupakan dasar dari analisis data tahan hidup.
Maka ketika menggunakan model regresi Cox proporsional dengan hazard dasar
Weibull sebagai asumsi, maka hal yang harus dilakukan adalah mengestimasi
fungsi survival.
2.10 Estimasi Fungsi Survival
Estimasi fungsi survival dasar dari model regresi Cox dengan hazard dasar
weibull dapat diperoleh dengan persamaan berikut :
(2.12)
Estimasi fungsi hazard dasar kumulatif dari model regresi Cox dengan
hazard dasar weibull dapat diperoleh dengan persamaan sebagai berikut :
(2.13)
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
19
Dari estimasi fungsi survival dasar dan fungsi hazard dasar kumulatif
diatas maka dapat diperoleh estimasi fungsi survival pengamatan ke- dan fungsi
hazard kumulatif pengamatan ke- , yaitu :
, (2.14)
dan
[ ]
(2.15)
(Collet, 1994)
Setelah fungsi survival didapat, maka model secara langsung juga akan
didapatkan. Untuk menguji kesesuaian model dilakukan pengujian terhadap
residual dari setiap pengamatan menggunakan residual Cox Snell.
2.11 Residual Cox – Snell
Setelah suatu model didapat, perlu dilakukan pemeriksaan terhadap
kesesuaian dari model tersebut. Banyak prosedur pemeriksaan model yang
digunakan, salah satunya residual Cox snell. Residual Cox snell untuk individu
ke- dengan diberikan berikut :
( ) (2.16)
dengan merupakan estimasi fungsi hazard dasar kumulatif pada waktu ,
fungsi tersebut dapat diselesaikan menggunakan persamaan (2.13). dari
persamaan (2.14) residual Cox snell merupakan nilai dari
dimana dan merupakan nilai estimasi dari fungsi
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
20
hazard kumulatif dan fungsi survival untuk individu ke- pada waktu Model
dikatakan layak jika nilai residual Cox-Snell berdistribusi eksponensial.
(Collet, 1994)
Teorema 2.1 :
Jika T merupakan variabel random dari waktu survival setiap pengamatan
dan merupakan fungsi survival, maka varabel random
berdistribusi eksponensial (Collet, 1994).
Bukti teorema 2.1 :
{ }
Fungsi densitas probabilitas dari variabel random diberikan
sebagai berikut :
{ } |
|
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
21
{ }
{ }
Terbukti bahwa variabel random berdistribusi eksponensial.
Ketika mengestimasi parameter, terdapat kemungkinan bahwa estimasi
tersebut tidak diperoleh secara langsung seperti adanya fungsi implisit, oleh
karena itu diperlukan suatu metode numerik untuk mendapatkan nilai estimator.
Salah satu metode yang digunakan untuk mendapatkan nilai estimator adalah
metode Newton Raphson.
2.12 Metode Newton – Raphson
Misalkan terdapat bentuk implisit dari
dengan
maka iterasi Newton Raphson adalah sebagai berikut :
(2.17)
dengan ( ) maka
(
)
dan
[
]
dengan :
adalah vektor berukuran pada iterasi ke .
matrik jacobian pada saat .
Vektor dari fungsi turunan pertama log L.
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
22
Adapun langkah-langkah dalam metode Newton Raphson adalah sebagai berikut :
1. Menentukan nilai awal estimator untuk
2. Menentukan .
3. Menghitung estimator berikutnya menggunakan (2.17).
4. Mengulangi iterasi sampai diperoleh nilai max | |
dengan adalah konstanta positif yang ditentukan.
(Lee dan Wang, 2003)
Nilai estimator parameter yang di dapatkan merupakan nilai yang dapat
memaksimumkan fungsi likelihood, untuk memperoleh hal itu banyak ketentuan
yang harus dipenuhi salah satunya mengenai titik maksimum. Selain itu, ketika
menggunakan metode numerik, ketentuan yang harus dipenuhi adalah
mendapatkan nilai eigen matrik hessian.
2.13 Titik Maksimum
Jika fungsi mempunyai titik maksimum di
maka
(Bacon, 1985)
Matrik hessian adalah matrik simetri A yang berisi persilangan turunan
parsial dari
dengan Syarat untuk
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
23
maksimum dari fungsi adalah jika matrik hessian merupakan matrik definit
negatif.
(Jong dan Heller, 2008)
Ketentuan tentang matrik definit negatif adalah sebagaimana teorema
dibawah ini :
2.14 Matrik Definite Negatif
Teorema 2.2
Sebuah matrik simetri A disebut definit negatif jika dan hanya jika semua
nilai eigen dari matrik A bernilai negatif.
Bukti Teorema 2.2 ( Lihat hal 709)
(Anton dan Rorres, 2005)
Untuk menerapkan semua algorima dalam pengestimasian program,
diperlukan suatu software khusus yang memungkinkan membuat program sendiri.
Salah satu software yang mampu membuat program sendiri adalah S-Plus.
2.15 S-PLUS
S-PLUS adalah suatu paket program yang memungkinkan membuat
program sendiri walaupun didalamnya sudah tersedia banyak program internal
yang siap digunakan. Kelebihan dari paket program ini adalah baik program
internal maupun program yang pernah dibuat digunakan sebagai sub program
yang akan dibuat. Beberapa perintah internal yang digunakan dalam S-Plus antara
lain :
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
24
a. function(.....)
function digunakan untuk menunjukkan fungsi yang akan digunakan
dalam program.
bentuknya adalah : function(...)
b. length(....)
length(...) merupakan perintah untuk menunjukkan banyaknya data.
c. matrix(....)
untuk membentuk sebuah matrik yang anggotanya a dengan jumlah baris
sebanyak b dan jumlah kolom sebanyak c.
d. for(....)
untuk melakukan pengulangan sebanyak n kali.
Bentuknya adalah ; for(...)
e. abs(....)
untuk membuat harga mutlak dari suatu bilangan.
Bentuknya adalah : abs(...)
f. sum(...)
untuk menjumlahkan semua bilangan anggota dari suatu vektor.
Bentuknya adalah : sum(...)
(Everitt , 1944)
Program yang udah didapat selanjutnya ditetapkan pada data tahan hidup
pasien. Dalam skripsi ini dugunakan data tahan hidup pasien penderita penyakit
Cardiovascular Disease .
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
25
2.16 Cardiovascular Diseases (CVD)
2.16.1 Pengertian
CVD atau Cardiovascular Diseases merupakan permasalahan yang sangat
menarik untuk diteliti. Fakta dari WHO menyebutkan bahwa CVD merupakan
penyebab utama kematian diseluruh dunia, yang mengakibatkan 17,5 juta
kematian setiap tahunnya. Sebanyak 7,6 juta orang meninggal karena serangan
jantung dan 5,7 juta meninggal karena stroke setiap tahunnya. Kematian global
akibat penyakit kardiovaskular diperkirakan mencapai sekitar 25 juta orang pada
tahun 2020.
Cardiovascular Diseases adalah istilah bagi serangkaian gangguan yang
menyerang jantung (kardio) dan pembuluh darah (vaskular), termasuk penyakit
jantung koroner, penyakit serebravaskular, dan penyakit vaskular porifer. Penyakit
kardiovaskular juga mencakup penyakit lain seperti kerusakan jantung. Penyakit
kardiovaskular berhubungan dengan kondisi serangan jantung , angina dan stroke.
(Medicastore, 2008)
2.16.2 Faktor Resiko
Faktor resiko adalah faktor yang meningkatkan terjadinya sesuatu.
Didalam suatu studi medis, mengamati faktor resiko untuk mengurangi akibat
negatif dari suatu penyakit adalah yang paling efektif untuk dilakukan. Faktor
risiko ini dibagi menjadi dua kelompok, yang dapat dikendalikan dan yang tidak
dapat dikendalikan.
Faktor risiko yang dapat dikendalikan meliputi kadar kolesterol darah yang
tinggi (hiperkolesterolemia), hipertensi, diabetes mellitus, obesitas, dan gaya
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
26
hidup (kurang gerak, merokok, konsumsi alkohol berlebihan). Sementara faktor
risiko yang tidak dapat dikendalikan meliputi usia, jenis kelamin, dan riwayat
penyakit kardiovaskular dalam keluarga.
(Mediastore, 2008)
Adapun beberapa faktor resiko yang dapat meningkatkan resiko kematian
pada penderita CVD adalah :
a. Tipe Penyakit Kardiovaskular
Konsekuensi langsung dari penyakit kardiovaskular adalah serangan
stroke. Badan Kesehatan Dunia (WHO), memperkirakan penyakit kardiovaskular
menjadi penyebab kematian nomor satu di seluruh dunia. Ada berbagai jenis
penyakit kardiovaskular yang harus diwaspadai yaitu : serangan jantung, angina
(nyeri dada), dan stroke.
b. Usia
Usia adalah faktor resiko terpenting dalam kasus penyakit kardiovaskular.
Di duga 87% kematian akibat penyakit CVD dialami oleh orang yang berusia 60
tahun keatas. Selain itu, resiko kematian akan penyakit stroke semakin meningkat
setiap tahunnya pada usia 55 tahun keatas. Banyak penelitian dilakukan untuk
mengungkap hubungan meningkatnya tingkat kematian akibat CVD dengan usia
penderita, salah satu temuan para peneliti berhubungan dengan level kolesterol
seseorang. Kebanyakan level kolesterol meningkat seiring dengan meningkatnya
usia seseorang.
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
27
c. Jenis kelamin
Pada umumnya lelaki memiliki resiko kematian akibat CVD lebih besar
dari pada wanita sebelum menopausal, namun resiko kematian pada wanita yang
sudah menopaus sama seperti pada lelaki. Sebuah penelitian yang dilakukan oleh
WHO menyatakan bahwa perbedaan resiko kematian akibat CVD terhadap pria
dan wanita disebabkan oleh perbedaan hormon. Untuk kebanyakan kasus, resiko
kematian akibat CVD banyak menyerang para lelaki dibanding wanita. Karena
pada wanita, hormon estrogen adalah hormon yang sangat dominan. Estrogen
mampu melindungi tubuh seorang wanita dari efek dari metabolisme glukosa
yang berlebihan, namun hormon estrogen yang dimiliki wanita ini menurun
setelah terjadi menopause sehingga resiko kematian akibat CVD jadi semakin
besar.
d. Smoke
Merokok juga merupakan salah satu faktor resiko pada penyakit CVD
karena beberapa alasan yaitu : perokok memiliki peluang 2-4 kali lebih tinggi
untuk mengidap penyakit jantung koroner dibanding bukan perokok, perokok
memiliki resiko terkena stroke dua kali lebih besar dan merokok menurangi
sirkulasi darah karena menyempitnya pembuluh darah dan arteri. Oleh karena itu,
perokok 10 kali lebih berpeluang terkena penyakit pembuluh darah, termasuk
disfungsi ereksi / impotensi. Selain itu merokok menyebabkan anurisma aorta
abdomen (pelebaran lokal pembuluh darah aorta di perut). Resiko kematian akibat
penyakit ini tinggi di kalangan perokok ketika pembuluh darah tersebut pecah.
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
28
e. BMI (Body Mass Indeks)
BMI dihitung sebagai berat badan dalam kilogram (kg) dibagi tinggi badan
dalam meter dikuadratkan ( ) dan tidak terkait pada jenis kelamin. BMI secara
signifikan berhubungan dengan kadar lemak tubuh. Saat ini, BMI secara
internasional diterima sebagai alat untuk mengidentifikasikan kelebihan berat
badan dan besitas. Orang-orang dengan BMI lebih yaitu kelebihan berat badan
dan obesitas pada hakekatnya meningkatkan morbiditas dan mortalitas akibat
hipertensi, stroke, penyakit jantung koroner, dyslipidemia dan diabetes mellitus
tipe 2 (Hill,2005).
f. SBP (Sistole Blood Pressure)
Tekanan darah merujuk kepada tekanan yang dialami darah pada
pembuluh arteri darah ketika darah di pompa oleh jantung ke seluruh anggota
tubuh. Tekanan darah dibuat dengan mengambil dua ukuran dan biasa diukur
seperti berikut - 120 /80 mmHg. Nomor atas (120) menunjukkan tekanan ke atas
pembuluh arteri akibat denyut jantung, dan disebut tekanan sistole. Tekanan darah
sistole digunakan untuk mendeteksi penyakit kardiovaskular sejak dini. Semakin
tinggi tekanan darah sistole, maka resiko kematian akan semakin besar. Karena
tekanan darah sistole yang tinggi bisa memicu hipertensi.
g. LACR (Logaritm of Albumin and Creatin)
Fungsi utama albumin dan kreatin adalah sebagai larutan penyangga dan
memelihara tekanan onkotik. Tekanan onkotik yang ditimbulkan oleh albumin
akan memelihara fungsi ginjal dan mengurangi edema pada saluran pencernaan
dan dimanafaatkan dengan metode hemodilusi untuk mangani penderita stroke.
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
29
h. LTG (Logaritm of Trigliserin)
Trigliserin merupakan penyusun utama minyak nabati dan lemak hewani.
Jadi dengan mengetahui kandungan trigliserin dalam tubuh , maka dapat
digunakan untuk mengontrol kelebihan kolesterol untuk mengurangi resiko
terkena CVD. Semakin tinggi level trigliserin dalam darah dapat meningkatkan
resiko penyakit CVD.
i. HTN (Hipertensi Status)
Tekanan darah tinggi atau Hipertensi adalah kondisi medis dimana terjadi
peningkatan tekanan darah secara kronis (dalam jangka waktu lama). Penderita
yang mempunyai sekurang – kurangnya tiga bacaan tekanan darah yang melebihi
140/90 mmHg saat istirahat diperkirakan mempunyai tekanan darah tinggi.
Menurut WHO, Tekanan darah yang selalu tinggi adalah salah satu faktor untuk
stroke, serangan jantung, gagal jantung, dan aneurisma arterial, dan merupakan
penyebab utama gagal ginjal kronis.
j. DM (Diabetes Status)
Menurut penelitian WHO, penderita diabetes memiliki resiko paling tinggi
terkena penyakit CVD. Penyakit diabetes terjadi akibat adanya penimbunan gula
dalam darah. Diabetes dapat menyebabkan komplikasi jangka panjang sepert
serangan jantung koroner, stroke, kebutaan akibat glukoma, penyakit ginjal, dan
luka yang tidak bisa sembuh akibat infeksi dan harus diamputasi.
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
30
2.17 Interpretasi Model Proporsional Hazard
Diketahui fungsi hazard model proporsional hazard adalah :
jika kita notasikan log natural dari fungsi hazard sebagai . Maka kita
akan memperoleh bentuk log natural fungsi hazard sebagai berikut :
[ ]
Perbedaan fungsi log-hazard untuk perubahan dari suatu bentuk menjadi
adalah :
[ ] [ ] { [ ] } { [ ] }
Log hazard adalah bentuk fungsi yang cocok digunakan untuk mengetahui
efek perubahan pada variabel prediktor. Untuk mempermudah perhitungan, kita
bisa menggunakan Hazard Ratio (HR) seperti bentuk dibawah ini :
[ ]
Interpretasi koefisien untuk variabel kontinu adalah mengubah fungsi log-
hazard dengan mengubah unit dari variabel kontinu menggunakan persamaan
(2.19) . Dengan dan , sehingga diperoleh perubahan fungsi log-
hazard sebagai berikut :
[ ] [ ] { [ ] } { [ ] }
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
31
dengan menggunakan persamaan (2.20), maka diperoleh estimator hazard ratio
sebagai berikut :
Interpretasi dari nilai estimator diatas adalah resiko kematian variabel akan
bertambah sebesar untuk setiap pertambahan unit variabel.
(Hosmer & Lemeshow, 1999)
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
32
BAB III
METODE PENELITIAN
Metode penelitian yang digunakan dalam penyusunan skripsi ini adalah sebagai
berikut :
1. Menyajikan definisi-definisi yang berhubungan dengan model regresi Cox
2. Menentukan bentuk model regresi Cox proporsional dengan hazard dasar
weibull dengan langkah sebagai berikut :
a. Menentukan fungsi hazard weibull.
b. Mendapatkan bentuk model regresi Cox proporsional dengan hazard
dasar weibull.
c. Menentukan fungsi survival dan Probability Density Function model
regresi Cox yang berhubungan dengan fungsi hazard weibull.
3. Menentukan estimator parameter dari model regresi cox dengan hazard
dasar weibull menggunakan metode maksimum likelihood dengan langkah
sebagai berikut :
a. Menentukan fungsi likelihood dari model regersi cox dengan hazard
dasar weibull pada data tersensor tipe II.
b. Menentukan fungsi log-likelihood dari model regersi cox dengan
hazard dasar weibull pada data tersensor tipe II.
c. Menentukan turunan pertama fungsi log-likelihood terhadap parameter
dan .
d. Mendapatkan estimator parameter dan .
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
33
e. Jika persamaan pada langkah c merupakan fungsi implisit, maka
persamaan diselesaikan dengan menggunakan metode Newton
Raphson.
4. Menyusun algoritma untuk mengestimasi parameter model regresi Cox
dengan langakah sebagai berikut :
a. Menyusun algoritma untuk mendapatkan estimator parameter
pada model regresi Cox berdasarkan langkah-langkah yang
telah dibuat.
b. Menyusun algoritma untuk mendapatkan estimator residual Cox-Snell.
5. Menerapkan model regresi Cox pada data tahan hidup pasien
Cardiovaskular Diseases (CVD) dengan langkah-langkah sebagai berikut :
a. Membuat program berdasarkan algoritma yang telah dibuat dalam
bahasa pemprograman yang ditulis dalah software S-Plus.
b. Inputkan data tahan hidup pasien penderita Cardiovascular Disease
(CVD).
c. Menguji distribusi data tahan hidup pasien Cardiovascular Disease
(CVD).
d. Estimasi parameter regresi dengan menggunakan program yang telah
dibuat dalam software S-Plus.
e. Estimasi residual Cox-Snell dengan menggunakan program yang telah
dibuat dalam software S-Plus.
f. Menguji residual Cox-Snell model yang telah didapat dari langkah e.
g. Menginterpretasikan model proporsional hazard
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
34
BAB IV
PEMBAHASAN
Model regresi Cox merupakan model yang menggambarkan hubungan
antara waktu survival sebagai variabel dependen dengan satu set variabel
independen. Variabel independen ini bisa kontinu ataupun kategorik
Model Regresi Cox proporsional hazard untuk pengamatan ke- dari
individu secara umum :
(4.1)
dengan merupakan vektor dari variabel bebas, dan
merupakan vektor dari koefisien regresi. Sedangkan merupakan fungsi
hazard untuk individu yang mana semua nilai variabel bebasnya membuat vektor
sama dengan nol, dinamakan hazard dasar (baseline hazard function).
4.1 Model Regresi Cox Dengan Hazard Dasar Weibull
Formula model Cox merupakan perkalian dari dua besaran yaitu fungsi
baseline hazard dan bentuk eksponensial untuk penjumlahan linier dari yaitu
penjumlahan dari variabel independen . Jika baseline hazardnya digunakan
distribusi Weibull maka kita akan menemukan bentuk model regresi Cox
proporsional dengan hazard dasar Weibull dengan langkah-langkah sebagai
berikut :
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
35
4.1.1 Menentukan Fungsi Hazard Weibull
Sebelum membuat model regresi Cox proporsional dengan hazard dasar
Weibull, terlebih dahulu harus mengetahui fungsi hazard Weibull. Menurut
persamaan (2.6) Fungsi hazard dasar Weibull adalah sebagai berikut :
(4.2)
4.1.2 Mendapatkan Model Regresi Cox dengan Hazard Dasar Weibull
Sesuai dengan persamaan (2.10) maka model regresi Cox proporsional
hazard untuk pengamatan ke- dari individu secara umum adalah :
dengan merupakan baseline hazard dari distribusi tertentu. Jika baseline
hazard yang digunakan adalah fungsi hazard dari distribusi Weibull, sesuai
dengan persamaan (4.2), maka akan diperoleh model regresi Cox dengan hazard
dasar Weibull sebagai berikut :
(4.3)
4.1.3 Menentukan Fungsi Survival dan Probability Density Function Model
Regresi Cox yang Berhubungan dengan Fungsi Hazard Weibull
Setelah diperoleh fungsi hazard yang berhubungan dengan hazard dasar
Weibull, langkah berikutnya adalah menentukan fungsi survival model regresi
Cox yang berhubungan dengan hazard dasar Weibull. Dengan menggunakan
persamaan (2.4) maka diperoleh fungsi survival yang berhubungan dengan hazard
dasar Weibull sebagai berikut :
(4.4)
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
36
Setelah diketahui fungsi hazard dan fungsi survival yang berhubungan
dengan distribusi Weibull. Selanjutnya dapat diperoleh Probability Density
Function (PDF) yang berhubungan dengan hazard dasar Weibull. Dengan
menggunakan persamaan (2.3) diperoleh model regresi Cox proporsional dengan
hazard dasar Weibull sebagai berikut :
(4.5)
4.2 Estimasi Parameter dalam Model Regresi Cox
Untuk menentukan estimasi parameter dari model regresi Cox dengan
hazard dasar Weibull, metode yang digunakan adalah Maximum Likelihood
Estimator (MLE), dengan langkah-langkahnya sebagai berikut :
4.2.1 Menentukan Fungsi Likelihood dari Model Regresi Cox dengan
Hazard Dasar Weibull pada Data Tersensor Tipe II.
Fungsi likelihood pada kasus data tersensor tipe II adalah sebagai berikut :
|
∏
dimana menyatakan waktu tahan hidup pasien yang diamati,
menyatakan jumlah kematian atau kerusakan yang diinginkan dan
menyatakan banyaknya data yang diamati. Fungsi likelihood untuk data tersensor
tipe II dengan menggunakan hazard dasar Weibull.
Diketahui fungsi survival yang berhubungan dengan hazard dasar Weibull
adalah
),
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
37
dan diketahui Probability Density Function (PDF) Weibull proporsional hazard
adalah
.
Sehingga diperoleh fungsi likelihoodnya adalah sebagai berikut :
|
{∏
}
(4.7)
{ (∏
) ( (∑
)) (∑
) }
(4.8)
Setelah mendapatkan fungsi likelihood, langkah selanjutnya dalam
estimasi parameter menggunakan metode maksimum likelihood adalah
menentukan fungsi log likelihood. Alasan penggunaan fungsi log likelihood
adalah karena perhitungan menggunakan fungsi log likelihood lebih sederhana
sehingga memudahkan dalam perhitungan, selain itu hasil yang diperoleh melalui
fungsi log likelihood tidak berbeda dengan hasil dari fungsi likelihood.
4.2.2 Menentukan Fungsi Log-Likelihood
Berdasarkan fungsi likelihood yang telah diperoleh sebelumnya,
dihasilkan fungsi log likelihood sebagai berikut :
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
38
(
)
(∏
) ( ( (∑ [
]
)))
( (∑
))
(
) (
)
( ∑
) ( ∑ [
]
)
(∑
)
(4.9)
Setelah fungsi Log likelihood didapatkan, selanjutnya dapat dicari turunan
pertama fungsi Likelihood sebagai syarat perlu memaksimumkan fungsi
likelihood.
4.2.3 Menentukan Turunan Pertama Fungsi Log-Likelihood terhadap
Parameter
Langkah pertama dalam estimasi parameter menggunakan MLE adalah
menemukan turunan pertama fungsi log likelihood sebagai berikut :
1. Turunan pertama terhadap .
Misalkan merupakan parameter yang berupa matrik berukuran ,
maka fungsi log-likelihoodnya harus diturunkan terhadap semua elemen
vektor parameter . Misalkan , maka turunan pertama log
likelihoodnya adalah sebagai berikut :
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
39
(
)
∑
( ∑ [ ]
)
(
)
∑
( ∑ [ ]
)
(
)
∑
(∑ [ ]
)
(
) (
) ∑
(∑ [ ]
)
Secara umum, turunan pertama log-likelihood terhadap , adalah :
(
)
∑
(∑ [ ]
)
2. Turunan pertama terhadap parameter
(
)
(∑ [ ]
)
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
40
3. Turunan pertama terhadap parameter .
(
) (
)
∑
(∑ [ ]
)
4.2.4 Mendapatkan estimator parameter .
Estimator MLE untuk parameter , untuk ,
diperoleh dengan cara menyamakan nol persamaan – persamaan dibawah sebagai
syarat perlu untuk memaksimumkan fungsi log – likelihood-nya.
(
)
∑
(∑ [ ]
)
(
)
(∑ [
]
)
(
) (
)
∑
(∑ [ ]
)
Ketiga persamaan diatas tidak dapat diselesaikan secara analistis, karena
masih dalam bentuk implisit sehingga diperlukan metode lain untuk
menyelesaikannya. Pada kesempatan ini digunakan metode Newton Raphson
untuk mendapatkan nilai estimasi parameter .
Berdasarkan metode Newton Raphson, maka hal yang pertama perlu
dilakukan adalah mendapatkan turunan kedua dari fungsi log likelihood.
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
41
(
) (
) (
) (
) (
) (
)
4.2.5 Menentukan Turunan Kedua Fungsi Log-Likelihood terhadap
Parameter .
1. Persamaan (4.17) diturunkan terhadap .
Untuk
(
) [
] [ ∑[ ]
]
(4.20)
(
) [
] [ ∑[ ]
]
(4.21)
(
) [
] [ ∑[ ]
]
(4.22)
Untuk
(
) [
] [ ∑[ ]
]
(4.23)
(
) [
] [ ∑[ ]
]
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
42
(4.24)
(
) [
] [ ∑[ ]
]
(4.25)
Untuk
(
) [
] [ ∑[ ]
]
(4.26)
(
) [
] [ ∑[ ]
]
(4.27)
(
) [
] [ ∑[ ]
]
(4.28)
Untuk
(
) [
] [ ∑[ ]
]
(4.29)
(
) [
] [ ∑[ ]
]
(4.30)
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
43
(
) [
] [ ∑[ ]
]
(4.31)
Dari semua persamaan diatas diperoleh bentuk umum turunan kedua
terhadap sebagai berikut :
(
) [
] [ ∑[ ]
]
(4.32)
2. Turunan persamaan (4.18) terhadap parameter
(
)
(
)
∑[ ]
3. Turunan persamaan (4.19) terhadap parameter
(
)
∑[
]
(
)
∑[ ]
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
44
4. Persamaan (4.17) diturunkan terhadap parameter
(
)
∑[ ]
(
)
∑[ ]
(
)
∑[ ]
(
)
∑ [ ]
(4.40)
Sehingga diperoleh bentuk umumnya
(
)
∑[ ]
5. Persamaan (4.17) diturunkan terhadap parameter
(
)
∑[
]
(
)
∑[
]
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
45
(
)
∑[
]
(
)
∑[
]
Sehingga diperoleh bentuk umumnya
(
)
∑[
]
4.3 Estimasi Residual Cox Snell
Log Cumulatif survival dari model regresi Cox dengan hazard dasar
Weibull dapat diperoleh dengan persamaan sebagai berikut :
( )
Log Cumulatif hazard dari model regresi Cox dengan hazard dasar
Weibull dapat diperoleh dengan persamaan berikut :
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
46
Dari log Cumulatif survival dan fungsi hazard komulatif diatas maka
dapat diperoleh log Cumulatif survival pengamatan ke-i dan fungsi hazard
komulatif pengamatan ke-i, yaitu :
atau
dan
[ ] ( )
Setelah model regresi Cox diperoleh, kelayakan dari model yang didapat
perlu ditaksir dengan menggunakan residual Cox snell sebagai berikut :
, (4.41)
dengan merupakan log Cumulatif hazard pada waktu , dapat dicari
dengan menggunakan persamaan (4.48). Selanjutnya model dikatakan layak
apabila nilai residual Cox-snell berdistribusi eksponensial. Algoritma untuk
memdapatkan estimator parameter diuraikan dibawah .
4.4 Algoritma untuk Mendapatkan Estimator Parameter
Terdapat beberapa langkah yang digunakan untuk mendapatkan nilai
estimator parameter dari model regresi Cox dan estimasi residual Cox
snell, sebagai berikut :
a. Mendapatkan nilai awal , untuk model regresi Cox dengan hazard
dasar Weibull dapat diambil (Collet, 1994) dan mendapatkan nilai
awal dan dengan menggunakan statgraphic.
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
47
b. Mendapatkan nilai estimator dengan menggunakan algoritma
newton raphson sebagai berikut :
1. Memasukkan data sekunder (data tahan hidup)
2. Ambil sebagai iterasi ke-0. Memasukkan nilai awal parameter
, dalam bentuk persamaan sebagai berikut :
(
)
3. Hitung fungsi sebagai berikut :
( ) (
)
( ) (
)
( ) (
)
( ) (
)
( ) (
)
Sehingga diperoleh bentuk matrik sebagai berikut :
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
48
(
( )
( )
( )
( )
( ))
(4.43)
4. Tentukan persamaan jacobian :
( )
[
( )
( )
(
)
( )
( )
( )
( )
(
)
( )
( )
(
)
( )
(
)
( )
( )
( )
( )
(
)
( )
( )
( )
( )
(
)
( )
( )
]
dengan , dan
5. Hitung nilai dengan rumus :
( )
( )
6. Jika diperoleh nilai max| | (dengan yang ditentukan),
maka dilanjutkan ke langkah (7), namun jika tidak maka proses
diulang ke langkah (3) dengan mengambil .
7. Dapatkan nilai estimator .
Setelah mendapatkan algoritma untuk memperoleh estimator parameter,
selanjutnya adalah membuat alagoritma untuk menguji kesesuaian model
menggunakan residual Cox Snell sebagai berikut :
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
49
4.5 Algoritma untuk Mendapatkan Estimator Residual Cox Snell
Terdapat beberapa langkah yang digunakan untuk mendapatkan nilai
estimator residual Cox snell, sebagai berikut :
a. Masukkan data sekunder (data tahan hidup)
b. Hitung nilai Estimasi residual Cox snell dengan persamaan (4.41)
c. Jika nilai estimasi residual Cox snell berdistribusi eksponensial, maka
model regresi Cox dapat dikatakan layak.
Algoritma yang telah dibuat diatas, selanjutnya diterapkan pada program
S-Plus sebagai berikut :
4.6 Program Estimasi Parameter Model Regresi Cox dengan Hazard
Dasar Weibull.
Penerapan algoritma pada program komputer dengan menggunakan paket
program S-PLUS.
1. Program untuk turunan pertama.
2. Program untuk mendapatkan matrik jacobian.
3. Program untuk mendapatkan parameter .
Dengan menggunakan program Newton Raphson
4. Memperoleh program untuk mendapatkan nilai residual Cox Snell.
Program-program yang telah dibuat dalam software Splus, selanjutnya
diterapkan pada data tahan hidup pasien penderita Cardiovascular Diseases.
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
50
4.7 Penerapan pada Kasus Data Tahan Hidup
Data yang akan diterapkan pada program adalah data sekunder hasil
penelitian tentang waktu tahan hidup pasien penderita cardiovascular disease
(CVD) (Lee.T, 2003), data ini terlampir dalam bentuk tabel pada Lampiran 1.
Permasalahan yang akan diselesaikan adalah membuat suatu model regresi
Cox dari data pasien CVD. Adapun variabel dari penelitian ini adalah variabel T
yaitu waktu tahan hidup 21 orang pasien CVD mulai dari terdiaknosa sampai dia
meninggal dengan hanya mengambil 10 kematian pertama penderita CVD.
Sedangkan variabel bebasnya adalah jenis CVD (DG), umur pasien (AGE) , jenis
kelamin pasien (SEX), intensitas merokok (SMOKE), indeks massa tubuh (BMI),
tekanan darah sistole (SBP), logaritme albumin dan kreatin (LACR), logaritme
trigliserin (LTG), status hipertensi (HTN), dan status diabetes (DM).
Setelah data diperoleh, langkah selanjutnya adalah menguji kesesuaian
distribusi pada data. Pengujian dilakukan dengan menggunakan software
StatGraphic Centurion.
4.7.1 Uji Kesesuaian Distribusi Weibull pada Data Waktu Tahan hidup
Pasien Cardiovascular Disease (CVD)
Uji yang dilakukan untuk mengetahui apakah distribusi dari waktu tahan
hidup pasien penderita penyakit kardiovaskuler berdistribusi Weibull atau tidak
adalah dengan menggunakan software dengan taraf kepercayaan 95%.
Hipotesisnya adalah sebagai berikut :
Distribusi waktu tahan hidup pasien penderita penyakit kardiovaskular
adalah Weibull
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
51
Distribusi waktu tahan hidup pasien penderita penyakit kardiovaskular
bukan Weibull
dengan ketentuan
Jika p-value (nilai probabilitas) data tersebut (tingkat kesalahan 5%),
maka distribusi waktu tahan hidup pasien penyakit kardiovaskuler adalah
Weibull.
Jika p-value data tersebut < 0,05, maka distribusi waktu tahan hidup pasien
penyakit kardiovaskuler bukan Weibull.
Pada lampiran 2, dapat dilihat bahwa p-value untuk data tersebut adalah
sebesar 0,875969. Dengan tingkat kesalahan 5% dapat dikatakan bahwa distribusi
waktu tahan hidup pasien penyakit kardiovaskuler adalah Weibull.
Setelah data berdistribusi weibull didapatkan, langkah yang harus dilewati
sebelum menggunakan model hazard proporsional adalah pemeriksaan asumsi
proporsional hazard. Asumsi proporsional hazard menyatakan bahwa fungsi
hazard untuk kategori yang berbeda pada variabel bebas harus proporsional pada
setiap waktu.
4.7.2 Asumsi Hazard Proporsional
Pemeriksaan asumsi hazard proporsional dapat ditunjukkan dengan plot
Log Cumulatif hazard terhadap log . Model memenuhi asumsi jika plot
yang terbentuk menghasilkan garis paralel (sejajar kasar) untuk setiap kategori
dari variabel bebas tersebut. Berikut adalah keseluruhan uji asumsi hazard
proporsional untuk semua variabel bebas pada kasus pasien penderita CVD .
a. Jenis CVD (DG)
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
52
Jenis penyakit CVD yang diderita pasien terbagi menjadi dua kategori
yaitu kategori 1 untuk pasien yang menderita penyakit stroke, dan kategori 2
untuk pasien yang menderita penyakit coronari heart diseases. Adapun tabel
pengkategorian dapat dilihat pada tabel 4.1.
Tabel 4.1 Nilai-nilai penduga Kaplan Meier dari fungsi Survival
variabel Jenis penyakit (DG)
DG = 1 ( )
1,1 0,041
2,6 0,414
2,7 0,431
2,9 0,462
3,3 0,518
DG = 0 ( )
1,3 0,113
2 0,301
2,1 0,322
3 0,477
3,2 0,505
Berikut merupakan plot Kaplan-Meier antara log t dan log cumulatif
hazard pada variabel DG .
log t
log
cu
mu
lati
f h
aza
rd
0,50,40,30,20,10,0
-0,7
-0,8
-0,9
-1,0
-1,1
-1,2
-1,3
-1,4
-1,5
-1,6
Variable
logcum * logt1
logcum2 * logt2
plot log cumulatif hazard terhadap log t variabel DG
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
53
Gambar 4.1 Plot Asumsi Hazard Proporsional Variabel DG
Plot pada gambar 4.1 menunjukkan bahwa plot antara log Cumulatif
hazard terhadap log (waktu tahan hidup) tidak menghasilkan garis paralel
(sejajar kasar) untuk setiap kategori pada variabel DG. Oleh karena itu pemodelan
dengan menggunakan model regresi Cox tidak dapat dilakukan.
b. Umur Pasien
Umur pasien terbagi menjadi 2 kategori yaitu kategori 1 untuk pasien yang
berumur < 70 tahun dan kategori 2 untuk pasien yang berumur diatasnya. Adapun
tabel pengkategorian dapat dilihat pada tabel 4.2
Tabel 4.2 Nilai-nilai penduga Kaplan Meier dari fungsi Survival
variabel Usia (AGE)
AGE = 1 ( )
1,1 0,041
1,3 0,114
2,9 0,462
3 0,477
3,2 0,505
AGE = 0 ( ) 2 0,301
2,1 0,322
2,6 0,415
2,7 0,431
3,3 0,519 Berikut merupakan plot kaplan-meier antara log dan log Cumulatif
hazard pada variabel AGE .
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
54
Gambar 4.2 Plot Asumsi Hazard Proporsional Variabel AGE
Plot pada gambar 4.2 menunjukkan bahwa plot antara fungsi hazard
terhadap t (waktu tahan hidup) tidak menghasilkan garis paralel (sejajar kasar)
untuk setiap kategori pada variabel AGE. Oleh karena itu pemodelan dengan
menggunakan model regresi Cox tidak dapat dilakukan.
c. Jenis Kelamin (SEX)
Jenis Kelamin Pasien terbagi menjadi dua kategori yaitu kategori 1 untuk
pasien berjenis kelamin laki-laki dan kategori 0 untuk pasien berjenis kelamin
perempuan. Adapun tabel pengkategorian dapat dilihat pada tabel 4.3
Tabel 4.3 Nilai-nilai penduga Kaplan Meier dari fungsi Survival
variabel Jenis kelamin (SEX)
SEX = 1 ( )
1,1 0,041
2 0,301
2,1 0,322
3,3 0,519
SEX = 0
log t
log
cu
mu
lati
f h
aza
rd
0,50,40,30,20,10,0
-0,7
-0,8
-0,9
-1,0
-1,1
-1,2
-1,3
-1,4
-1,5
-1,6
Variable
logcum * logt1
logcum2 * logt2
plot log cumulatif hazard terhadap log t variabel AGE
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
55
( ) 1,1 0,041
2,6 0,415
2,7 0,431
2,9 0,462
3 0,477
3,2 0,505
Berikut merupakan plot kaplan-meier antara dan log Cumulatif hazard
pada variabel SEX.
Gambar 4.3 Plot Asumsi Hazard Proporsional Variabel SEX
Plot pada gambar 4.3 menunjukkan bahwa plot antara fungsi hazard
terhadap log (waktu tahan hidup) tidak menghasilkan garis paralel (sejajar kasar)
untuk setiap kategori pada variabel SEX. Oleh karena itu pemodelan dengan
menggunakan model regresi Cox tidak dapat dilakukan.
d. Intensitas Merokok (SMOKE)
Intensitas merokok terbagi juga kedalam dua kategori yaitu kategori 1
untuk pasien yang merokok dan kategori 0 untuk pasien yang tidak merokok.
Adapun tabel pengkategorian dapat dilihat pada tabel 4.4
log t
log
cu
mu
lati
f h
aza
rd
0,50,40,30,20,10,0
-0,7
-0,8
-0,9
-1,0
-1,1
-1,2
-1,3
-1,4
-1,5
-1,6
Variable
logcum * logt1
logcum2 * logt2
plot log cumulatif hazard terhadap log t variabel SEX
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
56
Tabel 4.4 Nilai-nilai penduga Kaplan Meier dari fungsi Survival
variabel Intensitas merokok (SMOKE)
SMOKE = 1 ( )
1,1 0,041
1,3 0,114
2,7 0,431
3 0,477
3,2 0,505
3,3 0,519 SMOKE = 0
( ) 2 0,301
2,1 0,322
2,6 0,415
2,9 0,462
Berikut merupakan plot kaplan-meier antara log t dan log Cumulatif
hazard pada variabel SMOKE.
Gambar 4.4 Plot Asumsi Hazard Proporsional Variabel SMOKE
log t
log
cu
mu
lati
f h
aza
rd
0,50,40,30,20,10,0
-0,7
-0,8
-0,9
-1,0
-1,1
-1,2
-1,3
-1,4
-1,5
-1,6
Variable
logcum * logt1
logcum2 * logt2
plot log cumulatif hazard terhadap log t variabel SMOKE
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
57
Plot pada gambar 4.4 menunjukkan bahwa plot antara fungsi hazard
terhadap log (waktu tahan hidup) tidak menghasilkan garis paralel (sejajar kasar)
untuk setiap kategori pada variabel SMOKE. Oleh karena itu pemodelan dengan
menggunakan model regresi Cox tidak dapat dilakukan.
e. Indeks Massa Tubuh (BMI)
Indeks massa tubuh terbagi kedalam dua kategori yaitu, kategori 1 untuk
pasien yang memiliki BMI antara 20,78-27,9 dan kategori 0 untuk pasien yang
memiliki BMI. Adapun tabel pengkategorian dapat dilihat pada tabel 4.5.
Tabel 4.5 Nilai-nilai penduga Kaplan Meier dari fungsi Survival
variabel Indeks massa tubuh (BMI)
BMI = 1 ( )
1,1 0,041
2,1 0,322
2,7 0,431
3 0,477
3,3 0,519
BMI = 0 ( )
1,3 0,114
2 0,301
2,6 0,415
2,9 0,462
3,2 0,505
Berikut merupakan plot kaplan-meier antara log dan log Cumulatif
hazard pada variabel BMI
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
58
Gambar 4.5 Plot Asumsi Hazard Proporsional Variabel BMI
Plot pada gambar 4.5 menunjukkan bahwa plot antara fungsi hazard
terhadap log (waktu tahan hidup) tidak menghasilkan garis paralel (sejajar kasar)
untuk setiap kategori pada variabel BMI. Oleh karena itu pemodelan dengan
menggunakan model regresi Cox tidak dapat dilakukan.
f. Tekanan Darah Sistole (SBP)
Tekanan darah sistole terbagi juga kedalam dua kategori yaitu, kategori 1
untuk pasien yang memiliki SBP 97-119 dan kategori 0 untuk pasien yang
memiliki SBP selain interval tersebut. Adapun tabel pengkategorian dapat dilihat
pada tabel 4.6
Tabel 4.6 Nilai-nilai penduga Kaplan Meier dari fungsi Survival
variabel tekanan darah sistole (SBP)
SBP = 0 ( )
log t
log
cu
mu
lati
f h
aza
rd
0,50,40,30,20,10,0
-0,7
-0,8
-0,9
-1,0
-1,1
-1,2
-1,3
-1,4
-1,5
-1,6
Variable
logcum * logt1
logcum2 * logt2
plot log cumulatif hazard terhadap log t variabel BMI
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
59
SBP = 1 ( )
1,1 21 1 0,95238 0,95238 0,02119 0,041 -1,6739 1,3 20 1 0,95 0,90476 0,04347 0,114 -1,3619 2,6 19 1 0,94737 0,85714 0,06695 0,415 -1,1743 2,7 18 1 0,94444 0,80952 0,09177 0,431 -1,0373 3,2 17 1 0,94118 0,7619 0,1181 0,505 -0,9278
Berikut merupakan plot kaplan-meier antara log dan log Cumulatif
hazard pada variabel SBP .
Gambar 4.6 Plot Asumsi Hazard Proporsional Variabel SBP
Plot pada gambar 4.6 menunjukkan bahwa plot antara fungsi hazard
terhadap log (waktu tahan hidup) menghasilkan garis paralel (sejajar kasar)
untuk setiap kategori pada variabel SBP. Oleh karena itu pemodelan dengan
menggunakan model regresi Cox dapat dilakukan.
g. Algoritma Albumin dan kreatin (LACR)
Algoritma albumin dan kreatin terbagi menjadi dua kategori yaitu,
kategori 1 untuk pasien yang memiliki LACR 0,74-2,69 dan kategori 2 untuk
log t
log
cu
mu
lati
f h
aza
rd
0,50,40,30,20,10,0
-0,7
-0,8
-0,9
-1,0
-1,1
-1,2
-1,3
-1,4
-1,5
-1,6
Variable
logcum * logt1
logcum2 * logt2
plot log cumulatif hazard terhadap log t variabel SBP
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
60
pasien yang memiliki LACR diatas interval tersebut. Adapun tabel
pengkategorian dapat dilihat pada tabel 4.7
Tabel 4.7 Nilai-nilai penduga Kaplan Meier dari fungsi Survival
variabel kadar albumin dan kreatin (LACR)
LACR = 1 ( )
1,1 0,041
1,3 0,114
2,1 0,322
2,6 0,415
3 0,477
LACR = 0 ( )
Berikut merupakan plot kaplan-meier antara log dan log Cumulatif
hazard pada variabel LACR
Gambar 4.7 Plot Asumsi Hazard Proporsional Variabel LACR
log t
log
cu
mu
lati
f h
aza
rd
0,50,40,30,20,10,0
-0,7
-0,8
-0,9
-1,0
-1,1
-1,2
-1,3
-1,4
-1,5
-1,6
Variable
logcum * logt1
logcum2 * logt2
plot log cumulatif hazard terhadap log t variabel LACR
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
61
Plot pada gambar 4.7 menunjukkan bahwa plot antara fungsi hazard
terhadap log (waktu tahan hidup) menghasilkan garis paralel (sejajar kasar)
untuk setiap kategori pada variabel LACR. Oleh karena itu pemodelan dengan
menggunakan model regresi Cox dapat dilakukan.
h. Algoritma Trigliserin (LTG)
Algoritma trigliserin terbagi kedalam dua kategori yaitu, kategori 1 untuk
pasien yang memiliki LTG 3.95 - 4.4 dan kategori 2 untuk pasien yang memiliki
LTG diatas interval tersebut. Adapun tabel pengkategorian dapat dilihat pada
tabel 4.8
Tabel 4.8 Nilai-nilai penduga Kaplan Meier dari fungsi Survival
variabel kadar trigliserin (LTG)
LTG = 1 ( )
1,1 1 0,041
1,3 1 0,114
2 1 0,301
2,9 1 0,462
3,3 17 1 0,519
LTG = 0 ( )
Berikut merupakan plot kaplan-meier antara log dan log Cumulatif
hazard pada variabel LTG.
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
62
Gambar 4.8 Plot Asumsi Hazard Proporsional Variabel LTG
Plot pada gambar 4.9 menunjukkan bahwa plot antara fungsi hazard
terhadap log (waktu tahan hidup) tidak menghasilkan garis paralel (sejajar kasar)
untuk setiap kategori pada variabel LTG. Oleh karena itu pemodelan dengan
menggunakan model regresi Cox tidak dapat dilakukan.
i. Status Hipertensi (HTN)
Status hipertensi juga terbagi kedalam dua kategori yaitu, kategori 1 untuk
pasien yang memiliki tekanan darah tinggi ( SBP mmHg) dan kategori 0
jika pasien memiliki tekanan darah rendah. Adapun tabel pengkategorian dapat
dilihat pada tabel 4.9
Tabel 4.9 Nilai-nilai penduga Kaplan Meier dari fungsi Survival
variabel hipertensi status (HTN)
HTN = 1 ( )
1,1 21 1 0,041
2,9 20 1 0,462
3,3 19 1 0,519
log t
log
cu
mu
lati
f h
aza
rd
0,50,40,30,20,10,0
-0,7
-0,8
-0,9
-1,0
-1,1
-1,2
-1,3
-1,4
-1,5
-1,6
Variable
logcum * logt1
logcum2 * logt2
plot log cumulatif hazard terhadap log t variabel LTG
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
63
HTN = 0 ( )
Berikut merupakan plot kaplan-meier antara log dan log Cumulatif
hazard pada variabel HTN
Gambar 4.9 Plot Asumsi Hazard Proporsional Variabel HTN
Plot pada gambar 4.10 menunjukkan bahwa plot antara fungsi hazard
terhadap log (waktu tahan hidup) tidak menghasilkan garis paralel (sejajar kasar)
untuk setiap kategori pada variabel HTN. Oleh karena itu pemodelan dengan
menggunakan model regresi Cox tidak dapat dilakukan.
j. Status Diabetes (DM)
Status diabetes terbagi menjadi dua kategori yaitu, kategori 1 untuk pasien
yang memiliki gula darah tinggi dan kategori 0 untuk pasien yang memiliki gula
darah normal. Adapun tabel pengkategorian dapat dilihat pada tabel 4.10.
log t
log
cu
mu
lati
f h
aza
rd
0,50,40,30,20,10,0
-0,50
-0,75
-1,00
-1,25
-1,50
Variable
logcum * logt1
logcum2 * logt2
plot log cumulatif hazard terhadap log t variabel HTN
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
64
Tabel 4.10 Nilai-nilai penduga Kaplan Meier dari fungsi Survival
variabel diabetes status (DM)
DM = 1 ( )
1,1 21 1 0,952 0,021 0,041
2,7 1
2,9 1 0,462
3,3 18 1 0,519
DM = 0 ( )
1,3 21 1 0,952 0,021
Berikut merupakan plot kaplan-meier antara t dan log Cumulatif hazard
pada variabel DM.
Gambar 4.10 Plot Asumsi Hazard Proporsional Variabel DM
Plot pada gambar 4.10 menunjukkan bahwa plot antara fungsi hazard
terhadap log (waktu tahan hidup) tidak menghasilkan garis paralel (sejajar kasar)
log t
log
cu
mu
lati
f h
aza
rd
0,50,40,30,20,10,0
-0,7
-0,8
-0,9
-1,0
-1,1
-1,2
-1,3
-1,4
-1,5
-1,6
Variable
logcum * logt1
logcum2 * logt2
plot log cumulatif hazard terhadap log t variabel DM
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
65
untuk setiap kategori pada variabel DM. Oleh karena itu pemodelan dengan
menggunakan model regresi Cox tidak dapat dilakukan.
Berdasarkan plot antara fungsi hazard terhadap log (waktu tahan hidup)
untuk masing-masing variabel, didapat dua variabel yang memenuhi asumsi
proporsional hazard, yaitu variabel LACR dan SBP. Sehingga untuk lebih lanjut,
penulisan skripsi ini hanya kedua variabel tersebut yang merupakan variabel
bebas yang mempengaruhi model regresi Cox pada data CVD.
Didalam model regersi Cox proporsional, variabel yang dapat dimasukkan
kedalam model hanya variabel yang proporsional saja, sehingga meskipun
variabel lain memiliki resiko besar terhadap data, variabel tersebut tidak dapat
dimasukkan kedalam model ini jika varibael tersebut tidak proporsional.
Keproporsionalan dari setiap variabel digunakan untuk mengetahui efek dari
perubahan variabel tersebut terhadap waktu survaival pasien.
4.7.3 Estimasi Parameter
Berdasarkan Lampiran 1, maka dapat dibuat dugaan model regresi Cox
secara umum untuk waktu tahan hidup pasien penyakit kardiovaskuler. Adapun
model regresi Cox-nya adalah sebagai berikut :
(4.46)
dengan merupakan fungsi hazard untuk pengamatan ke-i,
merupakan fungsi hazard dasar Weibull dan dan masing-masing
menyatakan variabel SBP dan LACR untuk setiap pengamatan ke-i.
Proses analisis data dalam contoh kasus waktu tahan hidup pasien penyakit
kardiovaskuler dilakukan dengan menggunakan software S-Plus. Berdasarkan
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
66
hasil penerapan program 1 (program dapat dilihat pada lampiran 3a) diperoleh
matriks turunan pertama dengan memasukkan nilai awal , yang mana
tujuannya adalah untuk mendapatkan nilai estimator parameter dari model
regresinya. Nilai estimator awalnya adalah sebagai berikut :
Tabel 4.11 Nilai Estimator Awal Dari Data Tahan Hidup
Pasien Penderita Penyakit Kardiovaskuler
Nilai estimator awal
0
0
4,05191
2,6803
Berdasarkan hasil penerapan program 3a pada data yang digunakan untuk
memperoleh matriks hessian dengan memasukkan nilai awal estimator parameter
(program dapat dilihat pada
lampiran 3b) sehingga dihasilkan matrik hessian untuk iterasi ke-0 sebagai
berikut :
( ) (
)
dengan menggunakan metode Newton-Raphson melalui software S-Plus
(lihat Lampiran 5a) diperoleh nilai estimator sebagai berikut :
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
67
Tabel 4.12 Nilai Estimator Parameter Dari Data Tahan Hidup
Pasien Penderita Penyakit Kardiovaskuler
Nilai estimator akhir
-0,02855888
-0,68019096
21,26853
1,730281
Untuk menguatkan dugaan bahwa estimator yang diperoleh diatas
merupakan estimator yang memaksimumkan fungsi likelihood, maka dilakukan
pengujian terhadap matrik hessian (turunan kedua log likelihood terhadap
parameter regresi). Jika matrik hessian merupakan matrik definit negatif, maka
estimator akhir yang diperoleh adalah estimator yang memaksimumkan fungsi
likelihood.
Setelah memasukkan estimator akhir kedalam subprogram turunan kedua
diperoleh hasil bahwa nilai eigen turunan kedua semuanya bernilai negatif, maka
sesuai dengan teorema 2.2 dapat disimpulkan bahwa matrik hessian pada
estimator akhir diatas merupakan matrik definit negatif . (Lampiran 5b)
4.7.4 Model Regresi Cox Proporsional untuk Data Pasien Cardiovascular
Disease (CVD)
Berdasarkan hasil analisis contoh kasus data tahan hidup pasien penyakit
kardiovaskuler dengan tipe datanya adalah tersensor tipe II, maka bentuk model
regresi Cox dari data tahan hidup pasien penderita kardiovaskuler adalah :
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
68
4.7.5 Uji Residual Cox – Snell
Setelah mendapatkan model regresi Cox proporsional dengan hazard dasar
Weibull, maka langkah selanjutnya adalah melakukan uji kesesuaian model
menggunakan residual Cox Snell.
Berdasarkan hasil penerapan program untuk mendapatkan nilai residual
Cox Snell atau , didapatkan nilai residual sebagai berikut :
Tabel 4.13 Nilai Residual Pada Data Tahan Hidup Pasien
Penderita Penyakit Kardiovaskuler
Pengamatan ke-i t
1 1,1 0,04916251
2 1,3 0,03077198
3 2 0,27642930
4 2,1 0,02150950
5 2,6 0,01295176
6 2,7 0,03962931
7 2,9 0,85904053
8 3 0,03172421
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
69
9 3,2 0,52317895
10 3,3 0,63886642
Dengan menggunakan program uji residual (Lampiran 4), diperoleh
bahwa nilai residual Cox - Snell berdistribusi ekponensial pada tingkat kesalahan
1% (lihat Lampiran 5c), sehingga dapat dikatakan bahwa model yang didapat
sesuai atau tepat.
4.7.6 Resiko kematian Pasien Penderita Cardiovascular Diseases
Untuk mengetahui resiko kematian pasien berdasarkan faktor-faktor yang
mempengaruhi waktu survival, dapat dilakukan uji hazard rasio untuk masing-
masing variabel.
4.7.6.1 Interpretasi koefisien variabel Sistolic blood preasure (SBP) pada
Resiko kematian pasien Cardiovascular Diseases.
Diketahui nilai koefisien variabel SBP adalah jika ingin
mengetahui sejauh mana pengaruh nilai SBP terhadap waktu tahan hidup pasien
CVD, maka hal yang pertama yang harus dilakukan adalah menghitung HR
dengan menggunakan rumus pada persamaan (2.22). Jika dimisalkan
maka akan diperoleh nilai HR sebagai berikut :
Interpretasi dari nilai estimasi diatas adalah resiko kematian pasien
CVD akan bertambah sebesar untuk setiap kenaikan SBP sebesar 10
satuan. Hal ini sesuai dengan teori yang menyebutkan bahwa semakin
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
70
bertambahnya nilai SBP seorang pasien, maka secara langsung akan
meningkatkan resiko kematian.
4.7.6.2 Interpretasi Koefisien Variabel Logaritm Urinari of Albumin and
Creatin (LACR) pada Resiko kematian pasien penderita
Cardiovascular Diseases.
Diketahui nilai koefisien variabel LACR adalah jika
ingin mengetahui sejauh mana pengaruh nilai LACR terhadap waktu tahan hidup
pasien CVD, maka hal yang pertama yang harus dilakukan adalah menghitung HR
dengan menggunakan rumus pada persamaan (2.22). Jika dimisalkan maka
akan diperoleh nilai HR sebagai berikut :
Interpretasi dari nilai estimasi diatas adalah resiko kematian pasien
CVD akan bertambah sebesar 0,256563 untuk setiap kenaikan LACR sebesar 2
satuan. Hal ini sesuai dengan teori bahwa Albumin dan kreatin merupakan dua
protein yang berfungsi sebagai larutan penyangga dan memelihara tekanan
onkotik. Tekanan onkotik yang ditimbulkan oleh albumin akan memelihara fungsi
ginjal dan mengurangi edema pada saluran pencernaan dan dimanafaatkan dengan
metode hemodilusi untuk mangani penderita stroke. Sehingga semakin
bertambahnya nilai LACR maka akan meningkatkan resiko kematian pasien.
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
34
BAB IV
PEMBAHASAN
Model regresi Cox merupakan model yang menggambarkan hubungan
antara waktu survival sebagai variabel dependen dengan satu set variabel
independen. Variabel independen ini bisa kontinu ataupun kategorik
Model Regresi Cox proporsional hazard untuk pengamatan ke- dari
individu secara umum :
(4.1)
dengan merupakan vektor dari variabel bebas, dan
merupakan vektor dari koefisien regresi. Sedangkan merupakan fungsi
hazard untuk individu yang mana semua nilai variabel bebasnya membuat vektor
sama dengan nol, dinamakan hazard dasar (baseline hazard function).
4.1 Model Regresi Cox Dengan Hazard Dasar Weibull
Formula model Cox merupakan perkalian dari dua besaran yaitu fungsi
baseline hazard dan bentuk eksponensial untuk penjumlahan linier dari yaitu
penjumlahan dari variabel independen . Jika baseline hazardnya digunakan
distribusi Weibull maka kita akan menemukan bentuk model regresi Cox
proporsional dengan hazard dasar Weibull dengan langkah-langkah sebagai
berikut :
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
35
4.1.1 Menentukan Fungsi Hazard Weibull
Sebelum membuat model regresi Cox proporsional dengan hazard dasar
Weibull, terlebih dahulu harus mengetahui fungsi hazard Weibull. Menurut
persamaan (2.6) Fungsi hazard dasar Weibull adalah sebagai berikut :
(4.2)
4.1.2 Mendapatkan Model Regresi Cox dengan Hazard Dasar Weibull
Sesuai dengan persamaan (2.10) maka model regresi Cox proporsional
hazard untuk pengamatan ke- dari individu secara umum adalah :
dengan merupakan baseline hazard dari distribusi tertentu. Jika baseline
hazard yang digunakan adalah fungsi hazard dari distribusi Weibull, sesuai
dengan persamaan (4.2), maka akan diperoleh model regresi Cox dengan hazard
dasar Weibull sebagai berikut :
(4.3)
4.1.3 Menentukan Fungsi Survival dan Probability Density Function Model
Regresi Cox yang Berhubungan dengan Fungsi Hazard Weibull
Setelah diperoleh fungsi hazard yang berhubungan dengan hazard dasar
Weibull, langkah berikutnya adalah menentukan fungsi survival model regresi
Cox yang berhubungan dengan hazard dasar Weibull. Dengan menggunakan
persamaan (2.4) maka diperoleh fungsi survival yang berhubungan dengan hazard
dasar Weibull sebagai berikut :
(4.4)
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
36
Setelah diketahui fungsi hazard dan fungsi survival yang berhubungan
dengan distribusi Weibull. Selanjutnya dapat diperoleh Probability Density
Function (PDF) yang berhubungan dengan hazard dasar Weibull. Dengan
menggunakan persamaan (2.3) diperoleh model regresi Cox proporsional dengan
hazard dasar Weibull sebagai berikut :
(4.5)
4.2 Estimasi Parameter dalam Model Regresi Cox
Untuk menentukan estimasi parameter dari model regresi Cox dengan
hazard dasar Weibull, metode yang digunakan adalah Maximum Likelihood
Estimator (MLE), dengan langkah-langkahnya sebagai berikut :
4.2.1 Menentukan Fungsi Likelihood dari Model Regresi Cox dengan
Hazard Dasar Weibull pada Data Tersensor Tipe II.
Fungsi likelihood pada kasus data tersensor tipe II adalah sebagai berikut :
|
∏
dimana menyatakan waktu tahan hidup pasien yang diamati,
menyatakan jumlah kematian atau kerusakan yang diinginkan dan
menyatakan banyaknya data yang diamati. Fungsi likelihood untuk data tersensor
tipe II dengan menggunakan hazard dasar Weibull.
Diketahui fungsi survival yang berhubungan dengan hazard dasar Weibull
adalah
),
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
37
dan diketahui Probability Density Function (PDF) Weibull proporsional hazard
adalah
.
Sehingga diperoleh fungsi likelihoodnya adalah sebagai berikut :
|
{∏
}
(4.7)
{ (∏
) ( (∑
)) (∑
) }
(4.8)
Setelah mendapatkan fungsi likelihood, langkah selanjutnya dalam
estimasi parameter menggunakan metode maksimum likelihood adalah
menentukan fungsi log likelihood. Alasan penggunaan fungsi log likelihood
adalah karena perhitungan menggunakan fungsi log likelihood lebih sederhana
sehingga memudahkan dalam perhitungan, selain itu hasil yang diperoleh melalui
fungsi log likelihood tidak berbeda dengan hasil dari fungsi likelihood.
4.2.2 Menentukan Fungsi Log-Likelihood
Berdasarkan fungsi likelihood yang telah diperoleh sebelumnya,
dihasilkan fungsi log likelihood sebagai berikut :
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
38
(
)
(∏
) ( ( (∑ [
]
)))
( (∑
))
(
) (
)
( ∑
) ( ∑ [
]
)
(∑
)
(4.9)
Setelah fungsi Log likelihood didapatkan, selanjutnya dapat dicari turunan
pertama fungsi Likelihood sebagai syarat perlu memaksimumkan fungsi
likelihood.
4.2.3 Menentukan Turunan Pertama Fungsi Log-Likelihood terhadap
Parameter
Langkah pertama dalam estimasi parameter menggunakan MLE adalah
menemukan turunan pertama fungsi log likelihood sebagai berikut :
1. Turunan pertama terhadap .
Misalkan merupakan parameter yang berupa matrik berukuran ,
maka fungsi log-likelihoodnya harus diturunkan terhadap semua elemen
vektor parameter . Misalkan , maka turunan pertama log
likelihoodnya adalah sebagai berikut :
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
39
(
)
∑
( ∑ [ ]
)
(
)
∑
( ∑ [ ]
)
(
)
∑
(∑ [ ]
)
(
) (
) ∑
(∑ [ ]
)
Secara umum, turunan pertama log-likelihood terhadap , adalah :
(
)
∑
(∑ [ ]
)
2. Turunan pertama terhadap parameter
(
)
(∑ [ ]
)
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
40
3. Turunan pertama terhadap parameter .
(
) (
)
∑
(∑ [ ]
)
4.2.4 Mendapatkan estimator parameter .
Estimator MLE untuk parameter , untuk ,
diperoleh dengan cara menyamakan nol persamaan – persamaan dibawah sebagai
syarat perlu untuk memaksimumkan fungsi log – likelihood-nya.
(
)
∑
(∑ [ ]
)
(
)
(∑ [
]
)
(
) (
)
∑
(∑ [ ]
)
Ketiga persamaan diatas tidak dapat diselesaikan secara analistis, karena
masih dalam bentuk implisit sehingga diperlukan metode lain untuk
menyelesaikannya. Pada kesempatan ini digunakan metode Newton Raphson
untuk mendapatkan nilai estimasi parameter .
Berdasarkan metode Newton Raphson, maka hal yang pertama perlu
dilakukan adalah mendapatkan turunan kedua dari fungsi log likelihood.
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
41
(
) (
) (
) (
) (
) (
)
4.2.5 Menentukan Turunan Kedua Fungsi Log-Likelihood terhadap
Parameter .
1. Persamaan (4.17) diturunkan terhadap .
Untuk
(
) [
] [ ∑[ ]
]
(4.20)
(
) [
] [ ∑[ ]
]
(4.21)
(
) [
] [ ∑[ ]
]
(4.22)
Untuk
(
) [
] [ ∑[ ]
]
(4.23)
(
) [
] [ ∑[ ]
]
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
42
(4.24)
(
) [
] [ ∑[ ]
]
(4.25)
Untuk
(
) [
] [ ∑[ ]
]
(4.26)
(
) [
] [ ∑[ ]
]
(4.27)
(
) [
] [ ∑[ ]
]
(4.28)
Untuk
(
) [
] [ ∑[ ]
]
(4.29)
(
) [
] [ ∑[ ]
]
(4.30)
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
43
(
) [
] [ ∑[ ]
]
(4.31)
Dari semua persamaan diatas diperoleh bentuk umum turunan kedua
terhadap sebagai berikut :
(
) [
] [ ∑[ ]
]
(4.32)
2. Turunan persamaan (4.18) terhadap parameter
(
)
(
)
∑[ ]
3. Turunan persamaan (4.19) terhadap parameter
(
)
∑[
]
(
)
∑[ ]
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
44
4. Persamaan (4.17) diturunkan terhadap parameter
(
)
∑[ ]
(
)
∑[ ]
(
)
∑[ ]
(
)
∑ [ ]
(4.40)
Sehingga diperoleh bentuk umumnya
(
)
∑[ ]
5. Persamaan (4.17) diturunkan terhadap parameter
(
)
∑[
]
(
)
∑[
]
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
45
(
)
∑[
]
(
)
∑[
]
Sehingga diperoleh bentuk umumnya
(
)
∑[
]
4.3 Estimasi Residual Cox Snell
Log Cumulatif survival dari model regresi Cox dengan hazard dasar
Weibull dapat diperoleh dengan persamaan sebagai berikut :
( )
Log Cumulatif hazard dari model regresi Cox dengan hazard dasar
Weibull dapat diperoleh dengan persamaan berikut :
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
46
Dari log Cumulatif survival dan fungsi hazard komulatif diatas maka
dapat diperoleh log Cumulatif survival pengamatan ke-i dan fungsi hazard
komulatif pengamatan ke-i, yaitu :
atau
dan
[ ] ( )
Setelah model regresi Cox diperoleh, kelayakan dari model yang didapat
perlu ditaksir dengan menggunakan residual Cox snell sebagai berikut :
, (4.41)
dengan merupakan log Cumulatif hazard pada waktu , dapat dicari
dengan menggunakan persamaan (4.48). Selanjutnya model dikatakan layak
apabila nilai residual Cox-snell berdistribusi eksponensial. Algoritma untuk
memdapatkan estimator parameter diuraikan dibawah .
4.4 Algoritma untuk Mendapatkan Estimator Parameter
Terdapat beberapa langkah yang digunakan untuk mendapatkan nilai
estimator parameter dari model regresi Cox dan estimasi residual Cox
snell, sebagai berikut :
a. Mendapatkan nilai awal , untuk model regresi Cox dengan hazard
dasar Weibull dapat diambil (Collet, 1994) dan mendapatkan nilai
awal dan dengan menggunakan statgraphic.
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
47
b. Mendapatkan nilai estimator dengan menggunakan algoritma
newton raphson sebagai berikut :
1. Memasukkan data sekunder (data tahan hidup)
2. Ambil sebagai iterasi ke-0. Memasukkan nilai awal parameter
, dalam bentuk persamaan sebagai berikut :
(
)
3. Hitung fungsi sebagai berikut :
( ) (
)
( ) (
)
( ) (
)
( ) (
)
( ) (
)
Sehingga diperoleh bentuk matrik sebagai berikut :
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
48
(
( )
( )
( )
( )
( ))
(4.43)
4. Tentukan persamaan jacobian :
( )
[
( )
( )
(
)
( )
( )
( )
( )
(
)
( )
( )
(
)
( )
(
)
( )
( )
( )
( )
(
)
( )
( )
( )
( )
(
)
( )
( )
]
dengan , dan
5. Hitung nilai dengan rumus :
( )
( )
6. Jika diperoleh nilai max| | (dengan yang ditentukan),
maka dilanjutkan ke langkah (7), namun jika tidak maka proses
diulang ke langkah (3) dengan mengambil .
7. Dapatkan nilai estimator .
Setelah mendapatkan algoritma untuk memperoleh estimator parameter,
selanjutnya adalah membuat alagoritma untuk menguji kesesuaian model
menggunakan residual Cox Snell sebagai berikut :
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
49
4.5 Algoritma untuk Mendapatkan Estimator Residual Cox Snell
Terdapat beberapa langkah yang digunakan untuk mendapatkan nilai
estimator residual Cox snell, sebagai berikut :
a. Masukkan data sekunder (data tahan hidup)
b. Hitung nilai Estimasi residual Cox snell dengan persamaan (4.41)
c. Jika nilai estimasi residual Cox snell berdistribusi eksponensial, maka
model regresi Cox dapat dikatakan layak.
Algoritma yang telah dibuat diatas, selanjutnya diterapkan pada program
S-Plus sebagai berikut :
4.6 Program Estimasi Parameter Model Regresi Cox dengan Hazard
Dasar Weibull.
Penerapan algoritma pada program komputer dengan menggunakan paket
program S-PLUS.
1. Program untuk turunan pertama.
2. Program untuk mendapatkan matrik jacobian.
3. Program untuk mendapatkan parameter .
Dengan menggunakan program Newton Raphson
4. Memperoleh program untuk mendapatkan nilai residual Cox Snell.
Program-program yang telah dibuat dalam software Splus, selanjutnya
diterapkan pada data tahan hidup pasien penderita Cardiovascular Diseases.
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
50
4.7 Penerapan pada Kasus Data Tahan Hidup
Data yang akan diterapkan pada program adalah data sekunder hasil
penelitian tentang waktu tahan hidup pasien penderita cardiovascular disease
(CVD) (Lee.T, 2003), data ini terlampir dalam bentuk tabel pada Lampiran 1.
Permasalahan yang akan diselesaikan adalah membuat suatu model regresi
Cox dari data pasien CVD. Adapun variabel dari penelitian ini adalah variabel T
yaitu waktu tahan hidup 21 orang pasien CVD mulai dari terdiaknosa sampai dia
meninggal dengan hanya mengambil 10 kematian pertama penderita CVD.
Sedangkan variabel bebasnya adalah jenis CVD (DG), umur pasien (AGE) , jenis
kelamin pasien (SEX), intensitas merokok (SMOKE), indeks massa tubuh (BMI),
tekanan darah sistole (SBP), logaritme albumin dan kreatin (LACR), logaritme
trigliserin (LTG), status hipertensi (HTN), dan status diabetes (DM).
Setelah data diperoleh, langkah selanjutnya adalah menguji kesesuaian
distribusi pada data. Pengujian dilakukan dengan menggunakan software
StatGraphic Centurion.
4.7.1 Uji Kesesuaian Distribusi Weibull pada Data Waktu Tahan hidup
Pasien Cardiovascular Disease (CVD)
Uji yang dilakukan untuk mengetahui apakah distribusi dari waktu tahan
hidup pasien penderita penyakit kardiovaskuler berdistribusi Weibull atau tidak
adalah dengan menggunakan software dengan taraf kepercayaan 95%.
Hipotesisnya adalah sebagai berikut :
Distribusi waktu tahan hidup pasien penderita penyakit kardiovaskular
adalah Weibull
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
51
Distribusi waktu tahan hidup pasien penderita penyakit kardiovaskular
bukan Weibull
dengan ketentuan
Jika p-value (nilai probabilitas) data tersebut (tingkat kesalahan 5%),
maka distribusi waktu tahan hidup pasien penyakit kardiovaskuler adalah
Weibull.
Jika p-value data tersebut < 0,05, maka distribusi waktu tahan hidup pasien
penyakit kardiovaskuler bukan Weibull.
Pada lampiran 2, dapat dilihat bahwa p-value untuk data tersebut adalah
sebesar 0,875969. Dengan tingkat kesalahan 5% dapat dikatakan bahwa distribusi
waktu tahan hidup pasien penyakit kardiovaskuler adalah Weibull.
Setelah data berdistribusi weibull didapatkan, langkah yang harus dilewati
sebelum menggunakan model hazard proporsional adalah pemeriksaan asumsi
proporsional hazard. Asumsi proporsional hazard menyatakan bahwa fungsi
hazard untuk kategori yang berbeda pada variabel bebas harus proporsional pada
setiap waktu.
4.7.2 Asumsi Hazard Proporsional
Pemeriksaan asumsi hazard proporsional dapat ditunjukkan dengan plot
Log Cumulatif hazard terhadap log . Model memenuhi asumsi jika plot
yang terbentuk menghasilkan garis paralel (sejajar kasar) untuk setiap kategori
dari variabel bebas tersebut. Berikut adalah keseluruhan uji asumsi hazard
proporsional untuk semua variabel bebas pada kasus pasien penderita CVD .
a. Jenis CVD (DG)
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
52
Jenis penyakit CVD yang diderita pasien terbagi menjadi dua kategori
yaitu kategori 1 untuk pasien yang menderita penyakit stroke, dan kategori 2
untuk pasien yang menderita penyakit coronari heart diseases. Adapun tabel
pengkategorian dapat dilihat pada tabel 4.1.
Tabel 4.1 Nilai-nilai penduga Kaplan Meier dari fungsi Survival
variabel Jenis penyakit (DG)
DG = 1 ( )
1,1 0,041
2,6 0,414
2,7 0,431
2,9 0,462
3,3 0,518
DG = 0 ( )
1,3 0,113
2 0,301
2,1 0,322
3 0,477
3,2 0,505
Berikut merupakan plot Kaplan-Meier antara log t dan log cumulatif
hazard pada variabel DG .
log t
log
cu
mu
lati
f h
aza
rd
0,50,40,30,20,10,0
-0,7
-0,8
-0,9
-1,0
-1,1
-1,2
-1,3
-1,4
-1,5
-1,6
Variable
logcum * logt1
logcum2 * logt2
plot log cumulatif hazard terhadap log t variabel DG
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
53
Gambar 4.1 Plot Asumsi Hazard Proporsional Variabel DG
Plot pada gambar 4.1 menunjukkan bahwa plot antara log Cumulatif
hazard terhadap log (waktu tahan hidup) tidak menghasilkan garis paralel
(sejajar kasar) untuk setiap kategori pada variabel DG. Oleh karena itu pemodelan
dengan menggunakan model regresi Cox tidak dapat dilakukan.
b. Umur Pasien
Umur pasien terbagi menjadi 2 kategori yaitu kategori 1 untuk pasien yang
berumur < 70 tahun dan kategori 2 untuk pasien yang berumur diatasnya. Adapun
tabel pengkategorian dapat dilihat pada tabel 4.2
Tabel 4.2 Nilai-nilai penduga Kaplan Meier dari fungsi Survival
variabel Usia (AGE)
AGE = 1 ( )
1,1 0,041
1,3 0,114
2,9 0,462
3 0,477
3,2 0,505
AGE = 0 ( ) 2 0,301
2,1 0,322
2,6 0,415
2,7 0,431
3,3 0,519 Berikut merupakan plot kaplan-meier antara log dan log Cumulatif
hazard pada variabel AGE .
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
54
Gambar 4.2 Plot Asumsi Hazard Proporsional Variabel AGE
Plot pada gambar 4.2 menunjukkan bahwa plot antara fungsi hazard
terhadap t (waktu tahan hidup) tidak menghasilkan garis paralel (sejajar kasar)
untuk setiap kategori pada variabel AGE. Oleh karena itu pemodelan dengan
menggunakan model regresi Cox tidak dapat dilakukan.
c. Jenis Kelamin (SEX)
Jenis Kelamin Pasien terbagi menjadi dua kategori yaitu kategori 1 untuk
pasien berjenis kelamin laki-laki dan kategori 0 untuk pasien berjenis kelamin
perempuan. Adapun tabel pengkategorian dapat dilihat pada tabel 4.3
Tabel 4.3 Nilai-nilai penduga Kaplan Meier dari fungsi Survival
variabel Jenis kelamin (SEX)
SEX = 1 ( )
1,1 0,041
2 0,301
2,1 0,322
3,3 0,519
SEX = 0
log t
log
cu
mu
lati
f h
aza
rd
0,50,40,30,20,10,0
-0,7
-0,8
-0,9
-1,0
-1,1
-1,2
-1,3
-1,4
-1,5
-1,6
Variable
logcum * logt1
logcum2 * logt2
plot log cumulatif hazard terhadap log t variabel AGE
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
55
( ) 1,1 0,041
2,6 0,415
2,7 0,431
2,9 0,462
3 0,477
3,2 0,505
Berikut merupakan plot kaplan-meier antara dan log Cumulatif hazard
pada variabel SEX.
Gambar 4.3 Plot Asumsi Hazard Proporsional Variabel SEX
Plot pada gambar 4.3 menunjukkan bahwa plot antara fungsi hazard
terhadap log (waktu tahan hidup) tidak menghasilkan garis paralel (sejajar kasar)
untuk setiap kategori pada variabel SEX. Oleh karena itu pemodelan dengan
menggunakan model regresi Cox tidak dapat dilakukan.
d. Intensitas Merokok (SMOKE)
Intensitas merokok terbagi juga kedalam dua kategori yaitu kategori 1
untuk pasien yang merokok dan kategori 0 untuk pasien yang tidak merokok.
Adapun tabel pengkategorian dapat dilihat pada tabel 4.4
log t
log
cu
mu
lati
f h
aza
rd
0,50,40,30,20,10,0
-0,7
-0,8
-0,9
-1,0
-1,1
-1,2
-1,3
-1,4
-1,5
-1,6
Variable
logcum * logt1
logcum2 * logt2
plot log cumulatif hazard terhadap log t variabel SEX
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
56
Tabel 4.4 Nilai-nilai penduga Kaplan Meier dari fungsi Survival
variabel Intensitas merokok (SMOKE)
SMOKE = 1 ( )
1,1 0,041
1,3 0,114
2,7 0,431
3 0,477
3,2 0,505
3,3 0,519 SMOKE = 0
( ) 2 0,301
2,1 0,322
2,6 0,415
2,9 0,462
Berikut merupakan plot kaplan-meier antara log t dan log Cumulatif
hazard pada variabel SMOKE.
Gambar 4.4 Plot Asumsi Hazard Proporsional Variabel SMOKE
log t
log
cu
mu
lati
f h
aza
rd
0,50,40,30,20,10,0
-0,7
-0,8
-0,9
-1,0
-1,1
-1,2
-1,3
-1,4
-1,5
-1,6
Variable
logcum * logt1
logcum2 * logt2
plot log cumulatif hazard terhadap log t variabel SMOKE
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
57
Plot pada gambar 4.4 menunjukkan bahwa plot antara fungsi hazard
terhadap log (waktu tahan hidup) tidak menghasilkan garis paralel (sejajar kasar)
untuk setiap kategori pada variabel SMOKE. Oleh karena itu pemodelan dengan
menggunakan model regresi Cox tidak dapat dilakukan.
e. Indeks Massa Tubuh (BMI)
Indeks massa tubuh terbagi kedalam dua kategori yaitu, kategori 1 untuk
pasien yang memiliki BMI antara 20,78-27,9 dan kategori 0 untuk pasien yang
memiliki BMI. Adapun tabel pengkategorian dapat dilihat pada tabel 4.5.
Tabel 4.5 Nilai-nilai penduga Kaplan Meier dari fungsi Survival
variabel Indeks massa tubuh (BMI)
BMI = 1 ( )
1,1 0,041
2,1 0,322
2,7 0,431
3 0,477
3,3 0,519
BMI = 0 ( )
1,3 0,114
2 0,301
2,6 0,415
2,9 0,462
3,2 0,505
Berikut merupakan plot kaplan-meier antara log dan log Cumulatif
hazard pada variabel BMI
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
58
Gambar 4.5 Plot Asumsi Hazard Proporsional Variabel BMI
Plot pada gambar 4.5 menunjukkan bahwa plot antara fungsi hazard
terhadap log (waktu tahan hidup) tidak menghasilkan garis paralel (sejajar kasar)
untuk setiap kategori pada variabel BMI. Oleh karena itu pemodelan dengan
menggunakan model regresi Cox tidak dapat dilakukan.
f. Tekanan Darah Sistole (SBP)
Tekanan darah sistole terbagi juga kedalam dua kategori yaitu, kategori 1
untuk pasien yang memiliki SBP 97-119 dan kategori 0 untuk pasien yang
memiliki SBP selain interval tersebut. Adapun tabel pengkategorian dapat dilihat
pada tabel 4.6
Tabel 4.6 Nilai-nilai penduga Kaplan Meier dari fungsi Survival
variabel tekanan darah sistole (SBP)
SBP = 0 ( )
log t
log
cu
mu
lati
f h
aza
rd
0,50,40,30,20,10,0
-0,7
-0,8
-0,9
-1,0
-1,1
-1,2
-1,3
-1,4
-1,5
-1,6
Variable
logcum * logt1
logcum2 * logt2
plot log cumulatif hazard terhadap log t variabel BMI
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
59
SBP = 1 ( )
1,1 21 1 0,95238 0,95238 0,02119 0,041 -1,6739 1,3 20 1 0,95 0,90476 0,04347 0,114 -1,3619 2,6 19 1 0,94737 0,85714 0,06695 0,415 -1,1743 2,7 18 1 0,94444 0,80952 0,09177 0,431 -1,0373 3,2 17 1 0,94118 0,7619 0,1181 0,505 -0,9278
Berikut merupakan plot kaplan-meier antara log dan log Cumulatif
hazard pada variabel SBP .
Gambar 4.6 Plot Asumsi Hazard Proporsional Variabel SBP
Plot pada gambar 4.6 menunjukkan bahwa plot antara fungsi hazard
terhadap log (waktu tahan hidup) menghasilkan garis paralel (sejajar kasar)
untuk setiap kategori pada variabel SBP. Oleh karena itu pemodelan dengan
menggunakan model regresi Cox dapat dilakukan.
g. Algoritma Albumin dan kreatin (LACR)
Algoritma albumin dan kreatin terbagi menjadi dua kategori yaitu,
kategori 1 untuk pasien yang memiliki LACR 0,74-2,69 dan kategori 2 untuk
log t
log
cu
mu
lati
f h
aza
rd
0,50,40,30,20,10,0
-0,7
-0,8
-0,9
-1,0
-1,1
-1,2
-1,3
-1,4
-1,5
-1,6
Variable
logcum * logt1
logcum2 * logt2
plot log cumulatif hazard terhadap log t variabel SBP
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
60
pasien yang memiliki LACR diatas interval tersebut. Adapun tabel
pengkategorian dapat dilihat pada tabel 4.7
Tabel 4.7 Nilai-nilai penduga Kaplan Meier dari fungsi Survival
variabel kadar albumin dan kreatin (LACR)
LACR = 1 ( )
1,1 0,041
1,3 0,114
2,1 0,322
2,6 0,415
3 0,477
LACR = 0 ( )
Berikut merupakan plot kaplan-meier antara log dan log Cumulatif
hazard pada variabel LACR
Gambar 4.7 Plot Asumsi Hazard Proporsional Variabel LACR
log t
log
cu
mu
lati
f h
aza
rd
0,50,40,30,20,10,0
-0,7
-0,8
-0,9
-1,0
-1,1
-1,2
-1,3
-1,4
-1,5
-1,6
Variable
logcum * logt1
logcum2 * logt2
plot log cumulatif hazard terhadap log t variabel LACR
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
61
Plot pada gambar 4.7 menunjukkan bahwa plot antara fungsi hazard
terhadap log (waktu tahan hidup) menghasilkan garis paralel (sejajar kasar)
untuk setiap kategori pada variabel LACR. Oleh karena itu pemodelan dengan
menggunakan model regresi Cox dapat dilakukan.
h. Algoritma Trigliserin (LTG)
Algoritma trigliserin terbagi kedalam dua kategori yaitu, kategori 1 untuk
pasien yang memiliki LTG 3.95 - 4.4 dan kategori 2 untuk pasien yang memiliki
LTG diatas interval tersebut. Adapun tabel pengkategorian dapat dilihat pada
tabel 4.8
Tabel 4.8 Nilai-nilai penduga Kaplan Meier dari fungsi Survival
variabel kadar trigliserin (LTG)
LTG = 1 ( )
1,1 1 0,041
1,3 1 0,114
2 1 0,301
2,9 1 0,462
3,3 17 1 0,519
LTG = 0 ( )
Berikut merupakan plot kaplan-meier antara log dan log Cumulatif
hazard pada variabel LTG.
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
62
Gambar 4.8 Plot Asumsi Hazard Proporsional Variabel LTG
Plot pada gambar 4.9 menunjukkan bahwa plot antara fungsi hazard
terhadap log (waktu tahan hidup) tidak menghasilkan garis paralel (sejajar kasar)
untuk setiap kategori pada variabel LTG. Oleh karena itu pemodelan dengan
menggunakan model regresi Cox tidak dapat dilakukan.
i. Status Hipertensi (HTN)
Status hipertensi juga terbagi kedalam dua kategori yaitu, kategori 1 untuk
pasien yang memiliki tekanan darah tinggi ( SBP mmHg) dan kategori 0
jika pasien memiliki tekanan darah rendah. Adapun tabel pengkategorian dapat
dilihat pada tabel 4.9
Tabel 4.9 Nilai-nilai penduga Kaplan Meier dari fungsi Survival
variabel hipertensi status (HTN)
HTN = 1 ( )
1,1 21 1 0,041
2,9 20 1 0,462
3,3 19 1 0,519
log t
log
cu
mu
lati
f h
aza
rd
0,50,40,30,20,10,0
-0,7
-0,8
-0,9
-1,0
-1,1
-1,2
-1,3
-1,4
-1,5
-1,6
Variable
logcum * logt1
logcum2 * logt2
plot log cumulatif hazard terhadap log t variabel LTG
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
63
HTN = 0 ( )
Berikut merupakan plot kaplan-meier antara log dan log Cumulatif
hazard pada variabel HTN
Gambar 4.9 Plot Asumsi Hazard Proporsional Variabel HTN
Plot pada gambar 4.10 menunjukkan bahwa plot antara fungsi hazard
terhadap log (waktu tahan hidup) tidak menghasilkan garis paralel (sejajar kasar)
untuk setiap kategori pada variabel HTN. Oleh karena itu pemodelan dengan
menggunakan model regresi Cox tidak dapat dilakukan.
j. Status Diabetes (DM)
Status diabetes terbagi menjadi dua kategori yaitu, kategori 1 untuk pasien
yang memiliki gula darah tinggi dan kategori 0 untuk pasien yang memiliki gula
darah normal. Adapun tabel pengkategorian dapat dilihat pada tabel 4.10.
log t
log
cu
mu
lati
f h
aza
rd
0,50,40,30,20,10,0
-0,50
-0,75
-1,00
-1,25
-1,50
Variable
logcum * logt1
logcum2 * logt2
plot log cumulatif hazard terhadap log t variabel HTN
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
64
Tabel 4.10 Nilai-nilai penduga Kaplan Meier dari fungsi Survival
variabel diabetes status (DM)
DM = 1 ( )
1,1 21 1 0,952 0,021 0,041
2,7 1
2,9 1 0,462
3,3 18 1 0,519
DM = 0 ( )
1,3 21 1 0,952 0,021
Berikut merupakan plot kaplan-meier antara t dan log Cumulatif hazard
pada variabel DM.
Gambar 4.10 Plot Asumsi Hazard Proporsional Variabel DM
Plot pada gambar 4.10 menunjukkan bahwa plot antara fungsi hazard
terhadap log (waktu tahan hidup) tidak menghasilkan garis paralel (sejajar kasar)
log t
log
cu
mu
lati
f h
aza
rd
0,50,40,30,20,10,0
-0,7
-0,8
-0,9
-1,0
-1,1
-1,2
-1,3
-1,4
-1,5
-1,6
Variable
logcum * logt1
logcum2 * logt2
plot log cumulatif hazard terhadap log t variabel DM
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
65
untuk setiap kategori pada variabel DM. Oleh karena itu pemodelan dengan
menggunakan model regresi Cox tidak dapat dilakukan.
Berdasarkan plot antara fungsi hazard terhadap log (waktu tahan hidup)
untuk masing-masing variabel, didapat dua variabel yang memenuhi asumsi
proporsional hazard, yaitu variabel LACR dan SBP. Sehingga untuk lebih lanjut,
penulisan skripsi ini hanya kedua variabel tersebut yang merupakan variabel
bebas yang mempengaruhi model regresi Cox pada data CVD.
Didalam model regersi Cox proporsional, variabel yang dapat dimasukkan
kedalam model hanya variabel yang proporsional saja, sehingga meskipun
variabel lain memiliki resiko besar terhadap data, variabel tersebut tidak dapat
dimasukkan kedalam model ini jika varibael tersebut tidak proporsional.
Keproporsionalan dari setiap variabel digunakan untuk mengetahui efek dari
perubahan variabel tersebut terhadap waktu survaival pasien.
4.7.3 Estimasi Parameter
Berdasarkan Lampiran 1, maka dapat dibuat dugaan model regresi Cox
secara umum untuk waktu tahan hidup pasien penyakit kardiovaskuler. Adapun
model regresi Cox-nya adalah sebagai berikut :
(4.46)
dengan merupakan fungsi hazard untuk pengamatan ke-i,
merupakan fungsi hazard dasar Weibull dan dan masing-masing
menyatakan variabel SBP dan LACR untuk setiap pengamatan ke-i.
Proses analisis data dalam contoh kasus waktu tahan hidup pasien penyakit
kardiovaskuler dilakukan dengan menggunakan software S-Plus. Berdasarkan
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
66
hasil penerapan program 1 (program dapat dilihat pada lampiran 3a) diperoleh
matriks turunan pertama dengan memasukkan nilai awal , yang mana
tujuannya adalah untuk mendapatkan nilai estimator parameter dari model
regresinya. Nilai estimator awalnya adalah sebagai berikut :
Tabel 4.11 Nilai Estimator Awal Dari Data Tahan Hidup
Pasien Penderita Penyakit Kardiovaskuler
Nilai estimator awal
0
0
4,05191
2,6803
Berdasarkan hasil penerapan program 3a pada data yang digunakan untuk
memperoleh matriks hessian dengan memasukkan nilai awal estimator parameter
(program dapat dilihat pada
lampiran 3b) sehingga dihasilkan matrik hessian untuk iterasi ke-0 sebagai
berikut :
( ) (
)
dengan menggunakan metode Newton-Raphson melalui software S-Plus
(lihat Lampiran 5a) diperoleh nilai estimator sebagai berikut :
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
67
Tabel 4.12 Nilai Estimator Parameter Dari Data Tahan Hidup
Pasien Penderita Penyakit Kardiovaskuler
Nilai estimator akhir
-0,02855888
-0,68019096
21,26853
1,730281
Untuk menguatkan dugaan bahwa estimator yang diperoleh diatas
merupakan estimator yang memaksimumkan fungsi likelihood, maka dilakukan
pengujian terhadap matrik hessian (turunan kedua log likelihood terhadap
parameter regresi). Jika matrik hessian merupakan matrik definit negatif, maka
estimator akhir yang diperoleh adalah estimator yang memaksimumkan fungsi
likelihood.
Setelah memasukkan estimator akhir kedalam subprogram turunan kedua
diperoleh hasil bahwa nilai eigen turunan kedua semuanya bernilai negatif, maka
sesuai dengan teorema 2.2 dapat disimpulkan bahwa matrik hessian pada
estimator akhir diatas merupakan matrik definit negatif . (Lampiran 5b)
4.7.4 Model Regresi Cox Proporsional untuk Data Pasien Cardiovascular
Disease (CVD)
Berdasarkan hasil analisis contoh kasus data tahan hidup pasien penyakit
kardiovaskuler dengan tipe datanya adalah tersensor tipe II, maka bentuk model
regresi Cox dari data tahan hidup pasien penderita kardiovaskuler adalah :
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
68
4.7.5 Uji Residual Cox – Snell
Setelah mendapatkan model regresi Cox proporsional dengan hazard dasar
Weibull, maka langkah selanjutnya adalah melakukan uji kesesuaian model
menggunakan residual Cox Snell.
Berdasarkan hasil penerapan program untuk mendapatkan nilai residual
Cox Snell atau , didapatkan nilai residual sebagai berikut :
Tabel 4.13 Nilai Residual Pada Data Tahan Hidup Pasien
Penderita Penyakit Kardiovaskuler
Pengamatan ke-i t
1 1,1 0,04916251
2 1,3 0,03077198
3 2 0,27642930
4 2,1 0,02150950
5 2,6 0,01295176
6 2,7 0,03962931
7 2,9 0,85904053
8 3 0,03172421
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
69
9 3,2 0,52317895
10 3,3 0,63886642
Dengan menggunakan program uji residual (Lampiran 4), diperoleh
bahwa nilai residual Cox - Snell berdistribusi ekponensial pada tingkat kesalahan
1% (lihat Lampiran 5c), sehingga dapat dikatakan bahwa model yang didapat
sesuai atau tepat.
4.7.6 Resiko kematian Pasien Penderita Cardiovascular Diseases
Untuk mengetahui resiko kematian pasien berdasarkan faktor-faktor yang
mempengaruhi waktu survival, dapat dilakukan uji hazard rasio untuk masing-
masing variabel.
4.7.6.1 Interpretasi koefisien variabel Sistolic blood preasure (SBP) pada
Resiko kematian pasien Cardiovascular Diseases.
Diketahui nilai koefisien variabel SBP adalah jika ingin
mengetahui sejauh mana pengaruh nilai SBP terhadap waktu tahan hidup pasien
CVD, maka hal yang pertama yang harus dilakukan adalah menghitung HR
dengan menggunakan rumus pada persamaan (2.22). Jika dimisalkan
maka akan diperoleh nilai HR sebagai berikut :
Interpretasi dari nilai estimasi diatas adalah resiko kematian pasien
CVD akan bertambah sebesar untuk setiap kenaikan SBP sebesar 10
satuan. Hal ini sesuai dengan teori yang menyebutkan bahwa semakin
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
70
bertambahnya nilai SBP seorang pasien, maka secara langsung akan
meningkatkan resiko kematian.
4.7.6.2 Interpretasi Koefisien Variabel Logaritm Urinari of Albumin and
Creatin (LACR) pada Resiko kematian pasien penderita
Cardiovascular Diseases.
Diketahui nilai koefisien variabel LACR adalah jika
ingin mengetahui sejauh mana pengaruh nilai LACR terhadap waktu tahan hidup
pasien CVD, maka hal yang pertama yang harus dilakukan adalah menghitung HR
dengan menggunakan rumus pada persamaan (2.22). Jika dimisalkan maka
akan diperoleh nilai HR sebagai berikut :
Interpretasi dari nilai estimasi diatas adalah resiko kematian pasien
CVD akan bertambah sebesar 0,256563 untuk setiap kenaikan LACR sebesar 2
satuan. Hal ini sesuai dengan teori bahwa Albumin dan kreatin merupakan dua
protein yang berfungsi sebagai larutan penyangga dan memelihara tekanan
onkotik. Tekanan onkotik yang ditimbulkan oleh albumin akan memelihara fungsi
ginjal dan mengurangi edema pada saluran pencernaan dan dimanafaatkan dengan
metode hemodilusi untuk mangani penderita stroke. Sehingga semakin
bertambahnya nilai LACR maka akan meningkatkan resiko kematian pasien.
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
73
DAFTAR PUSTAKA
1. Anton,H., and Rorres,C., 2005, Elementary Linear Algebra, , John
Wiley and Son, Inc, New York.
2. Bacon,H.M.,1985, Differential And Integral Calculus, McGraw-Hill Book
Company, Inc.New York.
3. Collet, D., 1994, Modelling Survival Data in Medical Research, Chapman
& Hall, London.
4. Cox, D.R., and Oakes, D., 1984, Analisys of Survival Data, Chapman &
Hall, London.
5. Draper and Smith,1992, Applied Regression Analysis, ed., John Wiley
and Sons, Inc, New York.
6. Everitt, S.B., 1994. A Handbook of Statistical Analisys Using S-Plus,
Chapman & Hall, London.
7. Fox, J., 2002, Cox Proportional Hazard Regression for Survival Data,
Appendix to An R and S-Plus Companion to Applied Regression.
8. Fahrmer, L and Tutz, 1994, Multivariate Statistical Modelling Based on
Generalized Linier Model, Springer-Verlag, New York.
9. Hosmer, D.W., and Lemeshow, S., 1999, Applied Survival analysis
Regression Modeling for Time to Event Data, John Wiley and Sons, Inc,
New York.
10. Hosmer, D.W., and Lemeshow, S., 1989, Applied Logistic Regression,
John Wiley and Sons, Inc, New York.
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
74
11. Hogg, R.V, Craig, A.T., 1978, Introduction to Mathematical Statistics,
4thed, MacMillan Publishing, Inc, New York.
12. Jong, P.De., and Heller,G.Z.,2008, Generalized Linear Models for
Insurance Data, Cambtidge University Press, UK.
13. Kleinbeum, D.G., and Klein, 2005, survival Analysis, A Self-Learning
Text, Second Edition, Springer-Verlag, New York.
14. Lawless, J.F., 1982, Statistical Model and Method for Life Time Data,
John Wiley and Sons, Inc,New York.
15. Lawless, J.F., 2003, Statistical Model and Method for Life Time Data,
, John Wiley and Sons, Inc, New York.
16. Lee, E.T., and Wang, J.W., 2003, Statistical Methods for Survival Data
analysis, , John Wiley and Sons, Inc, New York.
17. Montgomery, D.C., and Peck, E.A.,1992, Introduction to Linear
Regression Analysis, John Wiley and Sons, Inc, New York.
18. World Heart Federation, 2012, Cardiovascular disease risk factors,
http://www.world-heart-federation.org/cardiovascular-health/
cardiovascular-disease-risk-factors. Diakses tanggal : 12 mei 2012.
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
Lampiran 1 : Data Pasien Penderita Cardiovasculer Disease (CVD)
a. Data Pasien Cardiovasculer Disease dari 21 pasien
T DG SEX SMOKE BMI SBP LACR LTG AGE HTN DM
1,1 1 0 1 28,44 134 3,54 4,32 55,7 0 0 1,3 1 1 1 34,13 126 5,87 3,95 53,1 0 1 2 2 1 0 34,49 130 2,69 3,95 76,7 1 1
2,1 1 1 0 31,05 131 1,38 4,48 69,1 0 0 2,6 1 0 0 30,88 189 5,38 4,72 73,9 1 1 2,7 1 0 1 25,05 200 3,37 4,86 77,2 1 1 2,9 1 0 0 36,83 114 2,64 4,52 68,2 0 0 3 2 0 1 27,9 117 7,45 5,61 56 0 1
3,2 2 0 1 28,73 154 1,94 5,24 68,9 1 1 3,3 1 1 1 21,67 111 3,53 4,18 71,1 0 0 3,6 2 0 0 28,4 118 5,43 4,66 69,3 1 1 3,8 3 1 0 25,03 188 6,25 5,63 71,7 1 1 4,1 3 0 0 23,63 144 8,24 4,82 59,4 1 1 4,2 2 1 1 20,78 127 4,4 4,54 73,1 0 0 4,5 2 1 0 44,25 97 2,01 4,4 68,6 0 1 4,6 2 0 0 43,23 128 5,08 5,25 72,2 0 1 4,9 3 0 0 25,22 129 6,69 3,9 75,4 1 0 5 3 1 0 46,76 96 3,93 4,12 65,6 1 0
5,7 1 0 0 35,78 132 9,93 5,11 52,5 0 1 6,1 2 0 0 39,72 118 2,39 3,93 52,6 0 1 6,3 2 0 1 38,67 126 5,16 4,5 76,8 1 1
b. Data Pasien Cardiovasculer Disease Setelah Diambil 10 Kematian
T DG AGE SEX SMOKE BMI SBP LACR LTG HTN DM
1,1 1 55,7 2 1 28,44 134 3,54 4,32 0 0
1,3 2 53,1 1 1 31,03 151 3,94 4,43 1 1
2 2 76,7 1 0 34,49 130 2,69 3,95 1 1
2,1 2 69,1 1 0 27,77 119 7,03 4,71 1 1
2,6 1 73,9 2 0 30,88 189 5,38 4,72 1 1
2,7 1 77,2 2 1 25,05 200 3,37 4,86 1 0
2,9 1 68,2 2 0 36,83 114 2,64 4,52 0 0
3 2 56 2 1 27,9 117 7,45 5,61 1 1
3,2 2 68,9 2 1 28,73 154 1,94 5,24 1 1
3,3 1 71,1 1 1 21,67 111 3,53 4,18 0 0
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
c. Data Pasien Cardiovasculer Disease beserta Variabel Yang Memenuhi
Asumsi Proporsional Hazard
T SBP LACR 1,1 134 3,54 1,3 151 3,94 2 130 2,69
2,1 119 7,03 2,6 189 5,38 2,7 200 3,37 2,9 114 2,64 3 117 7,45
3,2 154 1,94 3,3 111 3,53
Sumber : Lee, E.T., and Wang, J.W., 2003, Statistical Methods for Survival Data
Analysis ,Wiley & Son, USA.
Keterangan :
T : Waktu tahan hidup pasien dalam tahun
DG : Jenis CVD yang di derita pasien
AGE : Umur pasien dalam tahun
SEX : Jenis Kelamin pasien, 1 jika pasien laki-laki dan 2 perempuan
SMOKE : Intensitas Merokok pasien, 1 jika pasien merokok dan 0 jika tidak
BMI : Indeks Massa Tubuh pasien
SBP : Tekanan darah sistole dalam mmHg
LACR : Logaritme rasio urinary albumin dan creatin
LTG : Logaritme trigliserin
HTN : Hipertensi status, 1 jika SBP dan 0 jika sebaliknya.
DM : Diabetes Status, 1 jika glukosa dan 0 jika sebaliknya.
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
Lampiran 2 : Uji Kesesuaian Distribusi Weibull pada Data Tahan Hidup
Pasien Penderita Penyakit Kardiovaskuler
Weibull Analysis - Col_1 Data variable: Col_1 Estimation method: maximum likelihood Sample size = 10 Number of failures = 10 Estimated shape = 4,05191 Estimated scale = 2,6803 Specified threshold = 0,0 95,0% confidence intervals Shape: [1,93817; 5,76206] Scale: [2,20332; 3,26053] The StatAdvisor This table shows the results of fitting a Weibull distribution to the data values in Col_1. The shape and scale parameters were estimated using maximum likelihood. The minimum value of the distribution was assumed to be located at 0,0. Of the 10 data values, 0 were treated as right-censored, meaning that the true values might be greater than was indicated. Note: you may set the origin of the Weibull distribution to any number less than the minimum value in your data set using Analysis Options. Goodness-of-Fit Tests for Col_1 Kolmogorov-Smirnov Test Weibull DPLUS 0,148096 DMINUS 0,186891 DN 0,186891 P-Value 0,875969 The StatAdvisor This pane shows the results of tests run to determine whether Col_1 can be adequately modeled by a Weibull distribution. Since the smallest P-value amongst the tests performed is greater than or equal to 0,05, we can not reject the idea that Col_1 comes from a Weibull distribution with 95% confidence.
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
Fitted Weibull Distribution
0,1 1 10
Col_1
0
4
8
12
16
20
perc
en
tag
e
Weibull Plot
0,1 1 10
Col_1
0,1
0,5
1
5
10
2030
5070
90
9999,9
cu
mu
lati
ve p
erc
en
t
Est.: MLE
Shape: 4,05191
Scale: 2,6803
Threshold: 0,0
Failures: 10
Sample size: 10
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
Lampiran 3 : Program untuk Menentukan Estimator Parameter Model
Regresi Cox.
a. Subprogram untuk Mendapatkan Turunan Pertama
turunan1<-function(data,beta,lamda,gamma,n)
{
xy<-as.matrix(data)
x<-xy[,2:ncol(xy)]
y<-xy[,1]
r<-nrow(x)
p<-length(beta)
u<-matrix(0,p+2,1)
kanan2<-0
tengah2<-0
for(k in 1:p)
{
b<-0
c<-0
for(i in 1:r)
{
b<-b+x[i,k]
c<-c+lamda*exp(sum(beta*x[i,]))
*(y[i]^gamma)* x[i,k]
}
a<--lamda*x[r,k]*exp(sum(beta*x[r,]))
*(y[r]^gamma)*(n-r)
u[k,1]<-a+b-c
}
for(k in 1:p)
{
e<-0
g<-0
j<-0
for(i in 1:r)
{
e<-e+log(y[i])
g<-g+lamda*(y[i]^gamma)*log(y[i])
*exp(sum(beta*x[i,]))
j<-j+(y[i]^gamma)*exp(sum(beta*x[i,]))
}
}
d<-(r/gamma)
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
f<-lamda*(y[r]^gamma)*log(y[r])
*exp(sum(beta*x[r,]))*(n-r)
h<--exp(sum(beta*x[r,]))*(y[r]^gamma)*(n-r)
h1<-(r/lamda)
u[p+2,1]<-d+e-f-g
u[p+1,1]<-h+h1-j
return(u)
}
b. Subprogram untuk Mendapatkan Matrik Jacobian turunan2<-function(data,beta,lamda,gamma,n)
{
xy<-as.matrix(data)
x<-xy[,2:ncol(xy)]
y<-xy[,1]
r<-nrow(x)
p<-length(beta)
I<-matrix(0,p+2,p+2)
for(i in 1:p)
{
for(j in 1:p)
{
h1<-0
for(k in 1:r)
{
h1<-h1+lamda*(y[k]^gamma)*x[k,i]* x[k,j]
*exp(sum(beta*x[k,]))
}
I[i,j]<--lamda*(y[r]^gamma)*(n-r)*x[r,i]
*x[r,j]*exp(sum(beta*x[r,]))-h1
}
}
h2<-0
h5<-0
for(l in 1:r)
{
h2<-h2+(lamda*exp(sum(beta*x[l,])*(y[l]^gamma)
*((log(y[l]))^2)))
h5<-h5+(y[l]^gamma)*log(y[l])*exp(sum(beta*x[l,]))
}
h3<--(r/(gamma^2))
h4<-lamda*(exp(sum(beta*x[r,]))*(y[r]^gamma)
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
*((log(y[r]))^2)*(n-r))
h6<--(y[r]^gamma)*log(y[r])*(n-r)
*exp(sum(beta*x[r,]))
I[p+2,p+2]<-h3-h4-h2
I[p+2,p+1]<-h6-h5
I[p+1,p+2]<-I[p+2,p+1]
for(m in 1:p)
{
h7<-0
h9<-0
for(o in 1:r)
{
h7<-h7+(lamda*(y[o]^gamma)*log(y[o])* x[o,m]
*exp(sum(beta*x[o,])))
h9<-h9+(y[o]^gamma)*x[o,m]*exp(sum(beta*x[o,]))
}
h8<--lamda*(n-r)*x[r,m]*exp(sum(beta*x[r,]))
*(y[r]^gamma)*log(y[r])
h10<--y[r]^gamma*(n-r)*x[r,m]*exp(sum(beta*x[r,]))
I[m,p+2]<-h8-h7
I[m,p+1]<-h10-h9
I[p+2,m]<-I[m,p+2]
I[p+1,m]<-I[m,p+1]
}
I[p+1,p+1]<--(r/(lamda^2))
return(I)
}
c. Subprogram untuk Mendapatkan Estimator Parameter dan
dengan Menggunakan Metode Newton Raphson
newraph<-function(data,beta,gamma,lamda,n)
{
xy<-as.matrix(data)
bc<-ncol(xy)
i<-1
repeat
{
awal<-matrix(c(beta,gamma,lamda),bc+1,1)
u<-turunan1(data,beta,gamma,lamda,n)
I<-turunan2(data,beta,gamma,lamda,n)
hasil<-awal-(ginverse(I)%*%u)
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
if(max(abs(hasil-awal))<0.05)
break
if(i%%10==0) print(max(abs(hasil-awal)))
awal<-hasil
beta<-awal[1:(bc-1),1]
gamma<-awal[bc,1]
lamda<-awal[bc+1,1]
if(gamma<=0) gamma<-1
if(lamda<=0) lamda<-1
i<-i+1
}
betatopi<-matrix(awal[1:(bc-1),1])
gammatopi<-awal[bc+1,1]
lamdatopi<-awal[bc,1]
return(awal,betatopi,gammatopi,lamdatopi)
}
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
Lampiran 4 : Program untuk Mendapatkan Nilai Residual Cox-Snell
residual<-function(data,betatopi,lamdatopi,gammatopi,n)
{
xy<-as.matrix(data)
x<-xy[,2:ncol(xy)]
y<-xy[,1]
r<-nrow(x)
p<-length(beta)
rci<-matrix(0,r,1)
m<-0
for(i in 1:r)
{
rci[i,1]<-
lamdatopi*(y[i]^gammatopi)*exp(sum(betatopi*x[i,]))
dimnames(rci)<-list(c(1:r),c("rci"))
uji<-ks.gof(rci[,1],dist="expon")
}
return(rci,uji)
}
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
Lampiran 5 : Output Program untuk Menentukan Estimator Parameter
Model Regresi Cox Proporsional dengan Hazard Dasar
Weibull
a. Estimator parameter model regresi Cox
data<-matrix(0,10,3)
data[1,]<-c(1.1,134,3.54)
data[2,]<-c(1.3,151,3.94)
data[3,]<-c(2,130,2.69)
data[4,]<-c(2.1,119,7.03)
data[5,]<-c(2.6,189,5.38)
data[6,]<-c(2.7,200,3.37)
data[7,]<-c(2.9,114,2.64)
data[8,]<-c(3,117,7.45)
data[9,]<-c(3.2,154,1.94)
data[10,]<-c(3.3,111,3.53)
dimnames(data)<-list(c(1:10),c("Surv",”SBP”,"LACR”))
data
Surv SBP LACR
1 1.1 134 3.54
2 1.3 151 3.94
3 2.0 130 2.69
4 2.1 119 7.03
5 2.6 189 5.38
6 2.7 200 3.37
7 2.9 114 2.64
8 3.0 117 7.45
9 3.2 154 1.94
10 3.3 111 3.53
beta<-matrix(c(0,0),2,1)
beta
[,1]
[1,] 0
[2,] 0
turunan1(data,beta, 2.6803,4.05191,21)
[,1]
[1,] -612999.549
[2,] -18847.327
[3,] -1927.391
[4,] -5992.922
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
turunan2(data,beta, 2.6803,4.05191,21)
[,1] [,2] [,3] [,4]
[1,] -75194774.6 -2239284.848 -229234.991883 -707340.138
[2,] -2239284.8 -74443.746 -7047.284560 -21760.082
[3,] -229235.0 -7047.285 -1.391981 -2239.918
[4,] -707340.1 -21760.082 -2239.917939 -5330.150
newraph(data,beta,2.6803,4.05191,21)
$awal:
[,1]
[1,] -0.02855888
[2,] -0.68019096
[3,] 21.26853218
[4,] 1.73028073
$betatopi:
[,1]
[1,] -0.02855888
[2,] -0.68019096
$gammatopi:
[1] 1.730281
$lamdatopi:
[1] 21.26853
betatopi<-matrix(c(-0.02855888,-0.68019096),2,1)
betatopi
[,1]
[1,] -0.02855888
[2,] -0.68019096
b. Nilai Eigen Matriks Hessian
jacobian<-turunan2(data,betatopi, 21.26853,1.730281,21)
jacobian
[,1] [,2] [,3] [,4]
[1,] -127072.22040 -3642.588038 -51.40390571 -1256.9185948
[2,] -3642.58804 -110.229198 -1.50338908 -37.0404567
[3,] -51.40391 -1.503389 -0.02210676 -0.5164044
[4,] -1256.91859 -37.040457 -0.51640445 -43.2229675
eigen(jacobian)
$values:
[1] -1.271891e+005 -3.082736e+001 -5.767365e+000 -1.158803e-003
$vectors:
[,1] [,2] [,3] [,4]
[1,] 0.9995893580 0.0118111984 0.026368482 -0.00025675121
[2,] 0.0286551115 -0.0427882976 -0.932733341 -0.00512447542
[3,] 0.0004043664 -0.0003125564 -0.004769467 1.00003064310
[4,] 0.0098899319 -1.0697867741 0.037599087 -0.00009004682
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina
c. Uji Residual Cox Snell
residual(data,betatopi, 21.26853,1.730281,21)
$rci:
rci
1 0.04916251
2 0.03077198
3 0.27642930
4 0.02150950
5 0.01295176
6 0.03962931
7 0.85904053
8 0.03172421
9 0.52317895
10 0.63886642
$uji:
One sample Kolmogorov-Smirnov Test of Composite Exponentiality
data: rci[, 1]
ks = 0.446, p-value = 0.0251
alternative hypothesis: True cdf is not the exponential distn. with
estimated parameters sample estimates:
reciprocal of mean of x
4.026957
ADLN Perpustakaan Universitas Airlangga
Skripsi Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II
Amurwani, Jatu Herlina