estimasi model regresi semiparametrik … depan.pdf · aku memikirkan tentang semua pakaian, tetapi...
TRANSCRIPT
i
ESTIMASI MODEL REGRESI SEMIPARAMETRIK MENGGUNAKAN
ESTIMATOR KERNEL UNIFORM
(Studi Kasus : Pasien DBD di RS Puri Raharja)
KOMPETENSI STATISTIKA
ANNA FITRIANI
1108405001
JURUSAN MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS UDAYANA
BUKIT JIMBARAN
2015
ii
LEMBAR PERSEMBAHAN
Sesungguhnya hati memiliki keinginan, kepedulian, dan keengganan. Maka,
datangilah ia dari arah kesenangan dan kepeduliannya. Sebab, jika hati itu
dipaksakan, ia akan buta. (Ali bin Abi Thalib)
Aku mengamati semua sahabat, dan tidak menemukan sahabat yang lebih baik
daripada menjaga lidah. Aku memikirkan tentang semua pakaian, tetapi tidak
menemukan pakaian yang lebih baik daripada takwa. Aku merenungkan segala
jenis amal baik, namun tidak mendapatkan yang lebih baik daripada memberi
nasihat baik. Aku mencari segala bentuk rezki, tapi tidak menemukan rezki yang
lebih baik daripada sabar. (Umar bin Khatab)
Karya ini ku persembahkan untuk:
Allah S.W.T atas segala karunia-Nya pada penulis.
Kedua orang tuaku tercinta, kakak dan adikku tersayang, dan my sweet love untuk
doa, nasihat dan semangatnya.
Untuk karmana, Iin, Kis, Anggi atas semangat, dukungan, doa dan segalanya.
Tidak lupa juga untuk para dosen pembimbing dan penguji yang sudah sangat
baik membantu dalam penyelesaian tugas akhir ini.
Teman-teman di Matematika khususnya angkatan 2011 yang juga telah banyak
mendukung.
Dan untuk semua teman-teman yang telah memberikan semangat yang tidak
dapat disebutkan satu persatu.
iii
ESTIMASI MODEL REGRESI SEMIPARAMETRIK MENGGUNAKAN
ESTIMATOR KERNEL UNIFORM
(Studi Kasus : Pasien DBD di RS Puri Raharja)
KOMPETENSI STATISTIKA
[SKRIPSI]
Sebagai syarat untuk memperoleh gelar Sarjana bidang Matematika pada Fakultas
Matematika dan Ilmu Pengetahuan Alam
Universitas Udayana
Tulisan ini merupakan hasil penelitian yang belum pernah dipublikasikan
ANNA FITRIANI
1108405001
Pembimbing II
Made Susilawati, S.Si., M.Si.
NIP. 197109021998022001
Pembimbing I
I Gusti Ayu Made Srinadi, S.Si., M.Si.
NIP. 197112131997022001
iv
LEMBAR PENGESAHAN TUGAS AKHIR
Judul : Estimasi Model Regresi Semiparametrik Menggunakan
Estimator Kernel Uniform (Studi Kasus : Pasien DBD di RS
Puri Raharja)
Kompetensi : Statistika
Nama : Anna Fitriani
NIM : 1108405001
Tanggal seminar : 9 Oktober 2015
Disetujui oleh:
Pembimbing II
Made Susilawati, S.Si., M.Si.
NIP. 197109021998022001
Pembimbing I
I Gusti Ayu Made Srinadi, S.Si.,M.Si.
NIP. 197112131997022001
Penguji I
I Wayan Sumarjaya, S.Si., M.Stats.
NIP. 197704212005011001
Penguji III
Desak Putu Eka Nilakusmawati, S.Si.,M.Si.
NIP. 197106111997022001
Penguji II
Ni Made Asih, S.Pd., M.Si.
NIP. 197703142006042001
Mengetahui
Jurusan Matematika FMIPA Unud
Ketua,
Ir. Komang Dharmawan, M.Math., Ph.D.
NIP.196202181988031001
v
Judul : Estimasi Model Regresi Semiparametrik Menggunakan
Estimator Kernel Uniform (Studi Kasus : Pasien DBD di RS
Puri Raharja)
Nama : Anna Fitriani
Pembimbing : 1. I Gusti Ayu Made Srinadi, S.Si., M.Si.
2. Made Susilawati, S.Si., M.Si.
ABSTRAK
Pendekatan model regresi semiparametrik merupakan pendekatan model
yang mengkombinasikan model regresi parametrik dan regresi nonparametrik.
Pada regresi semiparametrik, sebagian variabel penjelasnya bersifat parametrik
dan sebagian lain bersifat nonparametrik. Regresi semiparametrik digunakan jika
pola hubungan antara sekumpulan variabel bebas dan variabel terikat diketahui
dan ada pula yang tidak diketahui. Teknik pemulusan (smoothing) kurva regresi
pada komponen nonparametrik yang digunakan pada penelitian ini menggunakan
fungsi kernel uniform. Pendugaan kurva regresi semiparametrik yang optimal
ditentukan dengan ukuran bobot atau bandwidth (h) yang optimal. Pemilihan
bandwidth yang optimal akan menghasilkan pendugaan kurva regresi yang mulus
sesuai dengan pola data. Pemilihan bandwidth yang optimal ditentukan
berdasarkan kriteria nilai GCV yang minimum. Tujuan penelitian ini adalah untuk
mengetahui estimasi fungsi regresi semiparametrik kasus DBD menggunakan
estimator kernel uniform. Respon dari data yang digunakan adalah data lama
kesembuhan pasien Demam Berdarah Dengue (DBD). Terdapat 6 variabel bebas
yaitu umur (tahun), suhu tubuh (0C), nadi (kali/menit), kadar hematokrit (%),
trombosit , dan lama demam (hari). Umur, suhu tubuh, nadi, trombosit,
dan lama demam merupakan komponen parametrik dan kadar hematokrit
merupakan komponen nonparametrik. Bandwidth (h) optimal berdasarkan kriteria
GCV minimum diperoleh sebesar 0,005. Nilai MSE yang dihasilkan
menggunakan analisis regresi linear berganda sebesar 0,031. Sedangkan dengan
regresi semiparametrik sebesar 0,00437119.
Kata kunci: Regresi Semiparametrik, Kernel, Bandwidth , GCV
vi
Title : Estimation of Semiparametric Regression Model Using
Uniform Kernel Estimator (Case Study : Dengue Fever
Patients in Puri Raharja Hospital)
Name : Anna Fitriani
Supervisors : 1. I Gusti Ayu Made Srinadi, S.Si, M.Si
: 2. Made Susilawati, S.Si., M.Si.
Abstract
Semiparametric regression model estimation is an estimation that
combines both parametric and nonparametric regression model. In
semiparametric regression, some of the variables are parametrics and the others
are nonparametrics. Semiparametric regression is used when relationship pattern
between independent and depentdent variables is half known and half unknown.
Regression curve smoothing technique in nonparametric components in this study
is using uniform kernel function. The optimal semiparametric regression curve
estimation is obtained by optimal bandwidth. By choosing optimal bandwidth, we
will obtain a smooth regression curve estimation in respect to data pattern. In
choosing optimal bandwidth, we use minimum GCV as a criteria. The aim of
study to estimate the semiparametric regression function of dengue fever case
using uniform kernel estimator. There are 6 independent variables namely age (in
years) body temperature (in Celcius), heartbeat (in times/minutes) hematocryte
ratio (in percent), amount of trombocyte (× 103/ul) and fever duration ( in days).
Age, body temperature, heartbeat, amount of trombosyte and fever duration are
parametric components and hematocryte ration is a nonparametric component.
The optimal bandwidth (h) which is obtained with minimum GCV is 0,005. The
value of MSE which is obtained by using multiple linear regression analysis is
0,031 and by using semiparametric regression is 0,00437119.
Keywords: Semiparametric Regression, Kernel, Bandwidth, GCV
vii
BIODATA ALUMNI
Nama Lengkap : Anna Fitriani
NIM : 1108405001
Kompetensi : Statistika
Jenis Kelamin : Perempuan
Tempat/Tanggal Lahir : Bima, 5 Januari 1994
Alamat Asal : Jl. Gajah Mada RT 11/ RW 04 Penaraga, Bima
NTB
Alamat Sekarang : Jl. Waturenggong gang II Denpasar, Bali
Agama : Islam
Tanggal Lulus : 9 Oktober 2015
Tanggal Wisuda : 20 November 2015
IP Komulatif : 3,39
Predikat Kelulusan : Sangat Memuaskan
Nilai TOEFL Lokal : 453
Alamat Email : [email protected]
Telepon/HP : 08776608602
Nama Ayah : Abdul Wahab S.Pd
Nama Ibu : St. Rukmini
Alamat Ayah/Ibu : Jl. Gajah Mada RT 11/ RW 04 Penaraga, Bima
NTB
Telepon/Hp : 081353917070
viii
KATA PENGANTAR
Puji syukur penulis panjatkan kehadapan Tuhan Yang Maha Esa, karena
atas berkat dan rahmat-Nya, penulis dapat menyelesaikan Tugas Akhir yang
berjudul “Estimasi Model Regresi Semiparametrik Menggunakan Penduga
Kernel Uniform (Studi Kasus : Pasien DBD di RS Puri Raharja) ”.
Sehubungan dengan telah terselesaikannya Tugas Akhir ini, maka melalui
kesempatan ini penulis menyampaikan penghargaan dan ucapan terima kasih
kepada berbagai pihak yang telah membantu penyusunan Tugas Akhir ini, antara
lain:
1. Bapak Ir. Komang Dharmawan, M.Math, Ph.D selaku Ketua Jurusan
Matematika Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas
Udayana.
2. Ibu I Gusti Ayu Made Srinadi, S.Si, M.Si selaku Dosen Pembimbing I yang
telah dengan sabar memberikan bimbingan, saran, dan nasehat yang sangat
membantu bagi penulis.
3. Ibu Made Susilawati. S.Si., M.Si. selaku Dosen Pembimbing II yang telah
banyak memberikan bimbingan, dukungan, dan arahan, hingga
terselesaikannya proposal tugas akhir ini.
4. Bapak I Wayan Sumarjaya, S.Si., M.Stats. sebagai penguji yang telah banyak
memberikan saran dan masukan kepada penulis.
5. Ibu Ni Made Asih, S.Pd, M.Si dan Desak Putu Eka Nilakusmawati, S.Si.,
M.Si sebagai penguji yang telah banyak memberikan saran dan masukan
kepada penulis.
ix
6. Kedua orang tua, kakak dan adik yang telah memberikan motivasi, semangat,
dan doa dalam menyelesaian Tugas Akhir ini.
7. Para Sahabat dan teman-teman di Jurusan Matematika, khususnya angkatan
2011, terima kasih atas bantuan, semangat, dan dukungannya.
8. Semua pihak yang turut membantu penyelesaian Tugas Akhir ini, yang tidak
dapat penulis sebutkan satu persatu.
Penulis menyadari bahwa Tugas Akhir ini masih terdapat banyak
kesalahan dan kekurangan yang disebabkan karena keterbatasan kemampuan dan
pengalaman penulis. Oleh karena itu, diharapkan masukan dan saran yang
mendukung penyempurnaan Tugas Akhir ini. Semoga Tugas Akhir ini dapat
bermanfaat bagi pembaca.
Bukit Jimbaran, September 2015
Penulis
xii
DAFTAR TABEL
Tabel Halaman
4.1 Statisika Deskriptif Data Pasien Demam Berdarah Dengue (DBD) ............ 21
4.2 Analisis regresi linear berganda ................................................................... 27
4.3 Korelasi antara lama kesembuhan pasien DBD, jenis kelamin, umur, suhu
tubuh, nadi, kadar hematokrit, trombosit, lama demam...............................28
4.4 Nilai Y Observasi dengan Y Dugaan ( ̂ )....................................................33
xiii
DAFTAR GAMBAR
Gambar Halaman
4.1 Scatter Plot Trombosit (PLT) dengan Lama Kesembuhan Pasien (Y) ..........22
4.2 Scatter Plot Antara Nadi (N) dengan Lama Kesembuhan Pasien (Y) ............23
4.3 Scatter Plot Antara Lama Demam (LD) dengan Lama Kesembuhan Pasien (Y)
............................................................................................................ 23
4.4 Scatter Plot Antara Umur (U) dengan Lama Kesembuhan Pasien (Y) ..........24
4.5 Scatter Plot Antara Suhu (S) dengan Lama Kesembuhan Pasien (Y) ............24
4.6 Scatter Plot Antara Kadar Hematokrit (HCT) dengan Lama Kesembuhan
Pasien (Y) ....................................................................................................... 25
4.7 Plot Antara Bandwidth dengan GCV Untuk Kenaikan H=0.05 .....................31
4.8 Plot Perbandingan Antara Y Observasi Dengan Hasil Dugaan ( ̂ ) ...............38
xiv
DAFTAR LAMPIRAN
Lampiran
1. Data Pasien Demam Berdarah Dengue (DBD) yang menjalani rawat inap di
Rumah Sakit Puri Raharja.
2. Output Program Statistika Deskriptif Menggunakan Software SPSS.
3. Matriks Korelasi dan Hasil Analisis Regresi Berganda antara Lama
Kesembuhan Pasien (Y), Suhu, Umur, Lama demam, Nadi, Trombosit, dan
Hematokrit.
4. Program Untuk Menentukan Nilai Bandwidth Optimal dengan Kernel
Uniform dengan bantuan Software R i386 2.15.0.
5. Output Nilai Bandwidth (h) dan GCV dengan Kernel Uniform pada selang
kenaikan h=0.05
6. Output Nilai Bandwidth (h) dan GCV dengan Kernel Uniform pada selang
kenaikan h=0.005
7. Output Nilai Bandwidth (h) dan GCV dengan Kernel Uniform pada selang
kenaikan h=0.001
8. Program Untuk Menentukan Pendugaan ̂ dengan Kernel Uniform dengan
bantuan Software R i386 2.15.0
9. Output Pendugaan ̂ dengan Kernel Uniform dengan Bandwidth (h)=0.05