klasifikasi penderita kanker payudara dengan … · penyakit neoplasma ganas yang merupakan suatu...
TRANSCRIPT
KLASIFIKASI PENDERITAKANKER PAYUDARA
DENGAN PENDEKATANMETODE
REGRESI LOGISTIK
7/11/2010 1
KLASIFIKASI PENDERITAKANKER PAYUDARA
DENGAN PENDEKATANMETODE
REGRESI LOGISTIK
Oleh:RICKI INDRA P
1303 109 030
Latar Belakang• Kanker payudara (Carcinoma mammae) adalah suatu
penyakit neoplasma ganas yang merupakan suatupertumbuhan jaringan payudara abnormal yang berbedadengan jaringan disekitarnya (Pane, 2007).
• Jenis kanker yang sering didapati di Indonesia denganurutan sebagai berikut: kanker leher rahim, hati,payudara, paru-paru, kulit, nasofaring, limfoma, leukimia,dan kolon/rektum.
• Sesuai dengan urutan tersebut, kanker leher rahim(serviks) merupakan kanker pembunuh wanita nomor satudi Indonesia dan peringkat kedua di dunia setelah kankerpayudara (Messwati, 2005).
7/11/2010 2
• Kanker payudara (Carcinoma mammae) adalah suatupenyakit neoplasma ganas yang merupakan suatupertumbuhan jaringan payudara abnormal yang berbedadengan jaringan disekitarnya (Pane, 2007).
• Jenis kanker yang sering didapati di Indonesia denganurutan sebagai berikut: kanker leher rahim, hati,payudara, paru-paru, kulit, nasofaring, limfoma, leukimia,dan kolon/rektum.
• Sesuai dengan urutan tersebut, kanker leher rahim(serviks) merupakan kanker pembunuh wanita nomor satudi Indonesia dan peringkat kedua di dunia setelah kankerpayudara (Messwati, 2005).
Rumusan Masalahpermasalahan yang ada dalam penelitian ini
adalah sebagai berikut:Bagaimana faktor-faktor yang mempengaruhi
resiko penyebab kanker payudara dari modelregresi logistik yang telah diperoleh ?
7/11/2010 3
permasalahan yang ada dalam penelitian iniadalah sebagai berikut:
Bagaimana faktor-faktor yang mempengaruhiresiko penyebab kanker payudara dari modelregresi logistik yang telah diperoleh ?
Tujuan PenelitianTujuan yang ingin dicapai oleh penelitian ini yaitu
:Mendapatkan faktor-faktor yang mempengaruhiresiko penyebab kanker payudara dari modelregresi logistik yang telah diperoleh.
7/11/2010 4
Tujuan yang ingin dicapai oleh penelitian ini yaitu:Mendapatkan faktor-faktor yang mempengaruhiresiko penyebab kanker payudara dari modelregresi logistik yang telah diperoleh.
Manfaat PenelitianDiharapkan penelitian ini dapat memberikan
manfaat sebagai berikut:• Mengaplikasikan ilmu statistika khususnya regresi
logistik di bidang kedokteran.• Memberikan acuan tambahan bagi tenaga medis
mengenai faktor-faktor yang berperan secara signifikanterhadap resiko tinggi terserang penyakit kankerpayudara, sehingga dapat meningkatkan penanganan yangtepat terhadap pasien.
7/11/2010 5
Diharapkan penelitian ini dapat memberikanmanfaat sebagai berikut:
• Mengaplikasikan ilmu statistika khususnya regresilogistik di bidang kedokteran.
• Memberikan acuan tambahan bagi tenaga medismengenai faktor-faktor yang berperan secara signifikanterhadap resiko tinggi terserang penyakit kankerpayudara, sehingga dapat meningkatkan penanganan yangtepat terhadap pasien.
Batasan MasalahBatasan masalah dalam penelitian ini adalah menentukan
pola hubungan antar faktor-faktor yang dapat memicuseseorang untuk terserang penyakit kanker payudara.Penelitian didasarkan pada studi kasus di RSUD Dr.Soetomo Surabaya.
7/11/2010 6
Batasan masalah dalam penelitian ini adalah menentukanpola hubungan antar faktor-faktor yang dapat memicuseseorang untuk terserang penyakit kanker payudara.Penelitian didasarkan pada studi kasus di RSUD Dr.Soetomo Surabaya.
Tinjauan PustakaRegresi logistik dikotomus adalah suatu analisis regresiyang digunakan untuk mengambarkan hubungan antaravariabel respon (outcome / dependent) dengansekumpulan variabel prediktor (eksplanatory /independent) (Agresti, 1990), dimana variabelresponnya berskala biner atau dikotomus denganvariabel prediktor berskala dikotomus maupunpolikotomus.
7/11/2010 7
Regresi logistik dikotomus adalah suatu analisis regresiyang digunakan untuk mengambarkan hubungan antaravariabel respon (outcome / dependent) dengansekumpulan variabel prediktor (eksplanatory /independent) (Agresti, 1990), dimana variabelresponnya berskala biner atau dikotomus denganvariabel prediktor berskala dikotomus maupunpolikotomus.
model regresi logistik dengan k variabel prediktor
)ˆ...ˆˆexp(1)ˆ...ˆˆexp(
)(11
11
kko
kko
xxxxx
Bentuk logit
7/11/2010 8
Bentuk logit
g(x) = kko xx ˆ...ˆˆ11
Penaksiran parameter : dengan MLE
Uji signifikansi parameter
a. Uji parsialHipotesis :H0 : = 0
H1 : ≠ 0
Statistik Uji : Wald (W)
Kriteria penolakan (tolak H0) jika nilai .
b. Uji SerentakHipotesis :H0 :
H1 : paling sedikit ada satu (i = 1, 2,…, k)
Statistik Uji (Agresti, 1990) :
dengan ; ;
Kriteria penolakan (tolak H0) jika nilai .
i
i
)ˆ(
ˆ
i
i
SE
2/ZW
7/11/2010 9
Uji signifikansi parameter
a. Uji parsialHipotesis :H0 : = 0
H1 : ≠ 0
Statistik Uji : Wald (W)
Kriteria penolakan (tolak H0) jika nilai .
b. Uji SerentakHipotesis :H0 :
H1 : paling sedikit ada satu (i = 1, 2,…, k)
Statistik Uji (Agresti, 1990) :
dengan ; ;
Kriteria penolakan (tolak H0) jika nilai .
0...21 k
0i
n
i
yi
yi
nn
ii
nn
nn
LnTestRatioLikelihoodG
1
1
01
2
12)(
01
i
ii yn i
io yn 1 1nnn o
2),( dbG
Prosedur klasifikasiMenggunakan APER
Actualmembership
Predicted membership…
n11 n12 … n1g
n21 n22 n2g
.
.
.
.
.
.
.
.
.
.
.
.ng1 ng2 … ngg
Keterangan :n11 = Jumlah yi dari tepat diklasifikasikan sebagain12 = Jumlah yi dari salah diklasifikasikan sebagain21 = Jumlah yi dari salah diklasifikasikan sebagainij = Jumlah yi dari salah diklasifikasikan sebagai ; i ≠ j ataunij = Jumlah yi dari tepat diklasifikasikan sebagai ; i = j, dimana i, j = 1,2,...,g.
APER (dalam % ) =
1 2 g
1
2
g
7/11/2010 10
Prosedur klasifikasiMenggunakan APER
Actualmembership
Predicted membership…
n11 n12 … n1g
n21 n22 n2g
.
.
.
.
.
.
.
.
.
.
.
.ng1 ng2 … ngg
Keterangan :n11 = Jumlah yi dari tepat diklasifikasikan sebagain12 = Jumlah yi dari salah diklasifikasikan sebagain21 = Jumlah yi dari salah diklasifikasikan sebagainij = Jumlah yi dari salah diklasifikasikan sebagai ; i ≠ j ataunij = Jumlah yi dari tepat diklasifikasikan sebagai ; i = j, dimana i, j = 1,2,...,g.
APER (dalam % ) =
g
1 1
1 2
2 1
i j
i j
g
gggg
nnnnnnnn
............
21
)1(111312
Metodologi PenelitianData yang digunakan dalam penelitian ini adalah data
sekunder, Sumber data yaitu berasal dari data sebelumya(Yuanita, 2008).
7/11/2010 11
Metode PenelitianMetode penelitian yang digunakan dalam penelitian
ini melalui tahap-tahap sebagai berikut:• Menentukan model regresi logistik antara variabel respon
dengan masing-masing variabel independen secaraindividu.
• Melakukan uji signifikansi parameter untuk setiap modelregresi logistik individu untuk mengetahui variabel-variabel independen mana yang berpengaruh secarasignifikan terhadap variabel respon.
7/11/2010 12
Metode penelitian yang digunakan dalam penelitianini melalui tahap-tahap sebagai berikut:
• Menentukan model regresi logistik antara variabel respondengan masing-masing variabel independen secaraindividu.
• Melakukan uji signifikansi parameter untuk setiap modelregresi logistik individu untuk mengetahui variabel-variabel independen mana yang berpengaruh secarasignifikan terhadap variabel respon.
• Menentukan model regresi logistik antara variabelrespon dengan variabel-variabel independen yangsignifikan secara serentak.
• Menghitung tingkat ketepatan pengklasifikasianvariabel respon dari model yang telah diperoleh.
• Menginterpretasikan model regresi logistik.
7/11/2010 13
• Menentukan model regresi logistik antara variabelrespon dengan variabel-variabel independen yangsignifikan secara serentak.
• Menghitung tingkat ketepatan pengklasifikasianvariabel respon dari model yang telah diperoleh.
• Menginterpretasikan model regresi logistik.
• Deskriptif Variabel
BAB IVHASIL DAN PEMBAHASAN
Tabel 4.1 Deskriptif Statistik
Variabel N Minimum Maximum Mean
Usia (X1) 100 21 77 49,28
Usia menstruasi pertama (X2) 100 9 17 13,38
Usia menikah (X3) 100 14 34 21,1
Tabel 4.1 Deskriptif Statistik
7/11/2010 14
Usia menikah (X3) 100 14 34 21,1
Variabel Frekuensi Persen
X4 tidak mempunyai anak 11 11
mempunyai anak 89 89
X5 tidak menyusui 18 18
menyusui 82 82
X6 tidak pernah KB 41 41
pernah KB 59 59
X7 tidak ada RPK 88 88
ada RPK 12 12
Regresi logistik dengan satu variabel prediktor(Univariat)Hipotesis :H0 : = 0, j = 1,2,...,7H1 : ≠ 0α = 0,05Statistik Uji:
Daerah penolakan H0: |W| >
Pola Hubungan antara Faktor-Faktor Risiko PenderitaKanker Payudara
j
7/11/2010 15
Regresi logistik dengan satu variabel prediktor(Univariat)Hipotesis :H0 : = 0, j = 1,2,...,7H1 : ≠ 0α = 0,05Statistik Uji:
Daerah penolakan H0: |W| >
j
64,105,02/ ZZ
)ˆ(ˆˆ
(W)Waldj
j
ES
Pengujian Signifikansi Parameter Model Regresi Logistik Univariat
Pola Hubungan antara Faktor-Faktor Risiko PenderitaKanker Payudara
Variabel Wald Sig. Odds Ratio
Usia (X1) 0,020 1,636 0,201 1,020
Usia menstruasi pertama (X2) -0,281 4,425 0,035* 0,755
7/11/2010 16
Usia menikah (X3) 0,048 0,807 0,369 1,050
Mempunyai anak atau tidak(X4)(1) 0,627 0,898 0,343 1,872
Pernah menyusui atau tidak(X5)(1) 0,272 0,270 0,603 1,312
Penggunaan KB (X6)(1) 0,083 0,041 0,839 1,086
Riwayat Penderita Keluarga(X7)(1) -21,477 0,000 0,999 0,000
Pengujian Hipotesis :H0 :H1 :α = 0,05Statistik Uji:
Daerah penolakan H0: G2 > 3,84Keputusan: Tolak H0
Kesimpulan: Minimal ada satu variabel prediktor yang pengaruhnyasignifikan terhadap variabel respon.
Regresi logistik dengan lebih dari satu variabelprediktor (multivariat)
0β0β
944,133
ˆ1ˆ2)(
1
1
01
2
01
n
i
yi
yi
nn
ii
nn
nn
LnTestRatioLikelihoodG
7/11/2010 17
Pengujian Hipotesis :H0 :H1 :α = 0,05Statistik Uji:
Daerah penolakan H0: G2 > 3,84Keputusan: Tolak H0
Kesimpulan: Minimal ada satu variabel prediktor yang pengaruhnyasignifikan terhadap variabel respon.
944,133
ˆ1ˆ2)(
1
1
01
2
01
n
i
yi
yi
nn
ii
nn
nn
LnTestRatioLikelihoodG
Untuk mengetahui variabel prediktor mana yang berpengaruh, maka dilakukanpengujian signifikansi parameter secara parsial sebagai berikut.H0 : = 0, j = 0,1H1 : ≠ 0α = 0,05Statistik Uji:
Daerah penolakan H0: |W| >
Regresi logistik dengan lebih dari satu variabelprediktor (multivariat)
ˆˆ
)((W)Wald
j
j
βESβ
7/11/2010 18
Untuk mengetahui variabel prediktor mana yang berpengaruh, maka dilakukanpengujian signifikansi parameter secara parsial sebagai berikut.H0 : = 0, j = 0,1H1 : ≠ 0α = 0,05Statistik Uji:
Daerah penolakan H0: |W| >)(
(W)Waldj
j
βESβ
64,105,02/ ZZ
Pola Hubungan antara Faktor-Faktor Risiko PenderitaKanker Payudara
Variabel Wald Sig. Keputusan
Usia (X1) 0,038 3,403 0,065* Tolak H0
Usia menstruasi pertama (X2) -0,265 2,779 0,095* Tolak H0
Pengujian Signifikansi Parameter Model Regresi Logistik Univariat
7/11/2010 19
Usia menstruasi pertama (X2) -0,265 2,779 0,095* Tolak H0
Usia menikah (X3) 0,1 2,544 0,111 Terima H0
Mempunyai anak atau tidak(X4)(1) 0,653 0,309 0,578 Terima H0
Pernah menyusui atau tidak(X5)(1) 0,258 0,07 0,791 Terima H0
Penggunaan KB (X6)(1) -0,322 0,355 0,551 Terima H0
Riwayat Penderita Keluarga(X7)(1) -21,438 0 0,998 Terima H0
Ketepatan pengklasifikasian responden
Interpretasi model regresi logistik
Observasi Taksiran Ketepatanklasifikasi
Non penderitaPenderita
7/11/2010 20
Non penderita
Non penderita 33 17 66%
Penderita 20 30 60%
Persentase keseluruhan 63%
BAB VKESIMPULAN DAN SARAN
Kesimpulan :• Variabel-variabel prediktor yang berpengaruh secara signifi-kan terhadap
variabel respon pada pemodelan regresi logistik univariat adalah X2 (Usiamenstruasi pertama) yaitu dengan model terbaik
• Sedangkan untuk regresi multivariat adalah X1 (Usia) dan X2 (Usiamenstruasi pertama)
• Dengan mengeksponensialkan untuk Nilai odds ratio pada variabel usia(X1)dan usia menstruasi pertama(X2) memiliki nilai yang jauh berbeda yaitusebesar 1,031 untuk X1 dan 0,711 untuk X2. Karena odds ratio variabel X1tersebut bernilai diatas 1, maka variabel tersebut memberikan pengaruhpositif terhadap faktor resiko penyebab penderita kanker payudara.
7/11/2010 21
Kesimpulan :• Variabel-variabel prediktor yang berpengaruh secara signifi-kan terhadap
variabel respon pada pemodelan regresi logistik univariat adalah X2 (Usiamenstruasi pertama) yaitu dengan model terbaik
• Sedangkan untuk regresi multivariat adalah X1 (Usia) dan X2 (Usiamenstruasi pertama)
• Dengan mengeksponensialkan untuk Nilai odds ratio pada variabel usia(X1)dan usia menstruasi pertama(X2) memiliki nilai yang jauh berbeda yaitusebesar 1,031 untuk X1 dan 0,711 untuk X2. Karena odds ratio variabel X1tersebut bernilai diatas 1, maka variabel tersebut memberikan pengaruhpositif terhadap faktor resiko penyebab penderita kanker payudara.
Daftar Pustaka• Agresti, Alan, (1990), Categorical Data Analysis, John Wiley and
Sons, Inc, New York.• Anita, (2007), Kanker Payudara,
(http://bima.ipb.ac.id/~anita/kanker_payudara.htm),download tanggal12 September 2007.
• Icha, (2003), Deteksi Dini Kanker Payudara, (http://www.pikiran-rakyat.com/cetak/0203/22/hikmah/lainnya02.htm), down load tanggal9 Oktober 2007.
• Johnson, R. A. Dan Wichern, D. W. (1992), Applied MultivariateStatistical Analysis, Prentice Hall, New Jersey.
• Messwati, E.D., (2005), Kanker Payudara, Paling Ditakuti KaumPerempuan,(http://kompas.com/kesehatan/news/0511/18/120708.htm),downloadtanggal 9 Oktober 2007.
7/11/2010 22
• Agresti, Alan, (1990), Categorical Data Analysis, John Wiley andSons, Inc, New York.
• Anita, (2007), Kanker Payudara,(http://bima.ipb.ac.id/~anita/kanker_payudara.htm),download tanggal12 September 2007.
• Icha, (2003), Deteksi Dini Kanker Payudara, (http://www.pikiran-rakyat.com/cetak/0203/22/hikmah/lainnya02.htm), down load tanggal9 Oktober 2007.
• Johnson, R. A. Dan Wichern, D. W. (1992), Applied MultivariateStatistical Analysis, Prentice Hall, New Jersey.
• Messwati, E.D., (2005), Kanker Payudara, Paling Ditakuti KaumPerempuan,(http://kompas.com/kesehatan/news/0511/18/120708.htm),downloadtanggal 9 Oktober 2007.
• Pane, M., (2007), Aspek Klinis dan Epidemiologis PenyakitKankerPayudara, (http://www.tempo.co.id/medika/arsip/082002/pus-3.htm) , download tanggal 9 Oktober 2007.
• Priambodo,D.A.,(2006), “Klasifikasi Penderita Kanker PayudaraDengan Pendekatan Regresi
• Ririn, R., (2007), Deteksi Sangat Dini Kanker Payudara, Jawabanuntuk Menghindar, (http://change.blogsome.com/2007/09/21/deteksi-sangat-dini-kanker-payudara-jawaban-untuk-menghindar/),down loadtanggal 9 Oktober 2007.
• Sutjipto, (2006), Permasalahan Deteksi Dini dan Pengobatan KankerPayudara,(http://www.dharmais.co.id/new/content.php?page=article&lang=en&id=17),download tanggal 12 September 2007.
• Yuanita. (2008), “Klasifikasi Penderita Kanker Payudara denganPendekatan Metode Multivariate Adaptive Regression Splines(MARS), Mahasiswa Jurusan Statistika FMIPA ITS, Surabaya.
7/11/2010 23
• Pane, M., (2007), Aspek Klinis dan Epidemiologis PenyakitKankerPayudara, (http://www.tempo.co.id/medika/arsip/082002/pus-3.htm) , download tanggal 9 Oktober 2007.
• Priambodo,D.A.,(2006), “Klasifikasi Penderita Kanker PayudaraDengan Pendekatan Regresi
• Ririn, R., (2007), Deteksi Sangat Dini Kanker Payudara, Jawabanuntuk Menghindar, (http://change.blogsome.com/2007/09/21/deteksi-sangat-dini-kanker-payudara-jawaban-untuk-menghindar/),down loadtanggal 9 Oktober 2007.
• Sutjipto, (2006), Permasalahan Deteksi Dini dan Pengobatan KankerPayudara,(http://www.dharmais.co.id/new/content.php?page=article&lang=en&id=17),download tanggal 12 September 2007.
• Yuanita. (2008), “Klasifikasi Penderita Kanker Payudara denganPendekatan Metode Multivariate Adaptive Regression Splines(MARS), Mahasiswa Jurusan Statistika FMIPA ITS, Surabaya.
TERIMA KASIH
7/11/2010 24
Oleh:RICKI INDRA P1303 109 030