kata kunci spline filevii kata pengantar puja dan puji syukur penulis panjatkan kehadapan ida sang...
TRANSCRIPT
v
Judul : Aplikasi Model Regresi Semiparametrik Spline Truncated
(Studi Kasus: Pasien Demam Berdarah Dengue (DBD) di Rumah
Sakit Puri Raharja)
Nama : Ni Wayan Merry Nirmala Yani
Pembimbing : 1. I.Gst. Ayu Made Srinadi, S.Si.,M.Si.
2. I Wayan Sumarjaya, S.Si.,M.Stats.
ABSTRAK
Regresi semiparametrik merupakan model regresi yang memuat komponen
parametrik dan komponen nonparametrik dalam suatu model. Pada penelitian ini
digunakan model regresi semiparametrik spline truncated dengan studi kasus
pasien Demam Berdarah Dengue (DBD) di Rumah Sakit Puri Raharja periode bulan
Januari sampai bulan Maret 2015. Estimasi model regresi terbaik didapat dari
pemilihan titik knot optimal dengan melihat nilai Generalized Cross Validation
(GCV) yang minimum. Komponen parametrik pada penelitian ini terdiri dari umur
(tahun), suhu tubuh (0C), trombosit (× 103/𝜇𝐿), dan kadar hematokrit (%) sebagai
komponen nonparametrik dengan nilai GCV minimum sebesar 0,03552045 dicapai
pada titik knot 39,6; nilai MSE sebesar 0,0296922; dan nilai koefisien determinasi
sebesar 98,91%, yang diperoleh dari model regresi semiparametrik spline truncated
linear (orde 2) dengan satu titik knot.
Kata Kunci : regresi semiparametrik, spline, knot, GCV
vi
Title : Application of Truncated Spline Semiparametric Regression
Model (Case Study: Patients with Dengue Hemorrhagic Fever
(DHF) at Puri Raharja Hospital)
Name : Ni Wayan Merry Nirmala Yani
Supervisor : 1. I.Gst. Ayu Made Srinadi, S.Si.,M.Si.
2. I Wayan Sumarjaya, S.Si.,M.Stats.
ABSTRACT
Semiparametric regression is a regression model that includes parametric
components and nonparametric components in a model. The regression model in
this research is truncated spline semiparametric regression with case studies of
patients with Dengue Hemorrhagic Fever (DHF) at Puri Raharja Hospital during
the period of January to March 2015. The best regression model estimation is
obtained from the selection of optimal knots which has minimum Generalized Cross
Validation (GCV) is. Parametric components in this research include age (years),
body temperature (0C), platelets (× 103/𝜇𝐿), and hematocrit (%) as a
nonparametric component. The minimum value of GCV is 0.03552045 achieved at
the point of 39.6 knots, MSE value of 0.0296922; and the value of coefficient
determination is 98.91%, obtained from semiparametric regression model
truncated linear spline (order 2) with a single point of knots.
Keywords : semiparametric regression, spline, knots, GCV
vii
KATA PENGANTAR
Puja dan puji syukur penulis panjatkan kehadapan Ida Sang Hyang Widhi
Wasa/Tuhan Yang Maha Esa karena atas berkat-Nya tugas akhir dengan judul
“Aplikasi Model Regresi Semiparametrik Spline Truncated (Studi Kasus: Pasien
Demam Berdarah Dengue (DBD) di Rumah Sakit Puri Raharja)” dapat
terselesaikan tepat pada waktunya.
Pada kesempatan ini penulis mengucapkan terima kasih kepada berbagai pihak
yang telah memberikan bantuan sehingga tugas akhir ini dapat tersusun dengan
baik, antara lain:
1. Ibu Desak Putu Eka Nilakusumawati, S.Si, M.Si. selaku Ketua Jurusan
Matematika FMIPA Universitas Udayana yang telah membantu dalam
kelancaran tugas akhir ini.
2. Ibu I Gusti Ayu Made Srinadi, S.Si.,M.Si. selaku pembimbing I yang telah
banyak membantu dan membimbing dalam pelaksanaan penelitian dan
penyusunan tugas akhir ini.
3. Bapak I Wayan Sumarjaya, S.Si.,M.Stats. selaku pembimbing II yang telah
banyak memberikan bimbingan, dukungan, dan arahan, hingga
terselesaikannya penelitian dan tugas akhir ini.
4. Bapak/Ibu dari Komisi Seminar dan Tugas Akhir Jurusan Matematika yang
telah banyak membantu dalam kelancaran tugas akhir ini dan memberikan
dukungan moral dalam penyelesaian tugas akhir ini.
viii
5. Bapak Ir. I Komang Gde Sukarsa, M.Si. selaku dosen penguji yang telah banyak
memberi kritikan, saran dan masukan yang membangun guna menyempurnakan
tugas akhir ini.
6. Bapak Ir. I Putu Eka Nila Kencana, M.T. selaku dosen penguji yang telah
banyak memberi kritikan, saran dan masukan yang membangun guna
menyempurnakan tugas akhir ini.
7. Ibu Ni Ketut Tari Tastrawati, S.Si.,M.Si. selaku dosen penguji yang telah
banyak memberi kritikan, saran dan masukan yang membangun guna
menyempurnakan tugas akhir ini.
8. Keluarga dan khususnya Bapak I Made Yasa dan Ibu Suartini sebagai orang tua
yang selalu mendoakan, memberikan motivasi dan pengorbanannya baik dari
segi moril maupun materi sehingga penulis dapat menyelesaikan tugas akhir
ini.
9. Kakak Senior Hardi Karmana yang telah banyak membantu dalam penyelesaian
tugas akhir ini.
10. Teman-teman di Jurusan Matematika Udayana dan KKN UNUD periode XI
Desa Ped Nusa Penida yang telah banyak membantu dan memberikan dukungan
moral dalam penyelesaian tugas akhir ini.
ix
Penulis menyadari bahwa masih terdapat banyak kekurangan dalam
penyusunan tugas akhir ini. Oleh karena itu, penulis mengharapkan saran dan kritik
yang membangun dari berbagai pihak guna menyempurnakan tugas akhir ini.
Denpasar, Desember 2016
(Penulis)
x
BIODATA ALUMNI
Nama Lengkap : Ni Wayan Merry Nirmala Yani
NIM : 1208405025
Jenis Kelamin : Perempuan
Tempat/Tanggal Lahir : Denpasar, 16 Desember 1994
Alamat Asal : Jl. Nagasari No.72 Denpasar
Alamat Sekarang : Jl. Nagasari No.72 Denpasar
Agama : Hindu
Tanggal Lulus : 2 Desember 2016
Kompotensi : Statistika
IP Kumulatif : 3,57
Predikat Kelulusan : Dengan Pujian
Nilai TOELF Lokal : 513
Alamat Email : [email protected]
No Hp : 08970860532
Nama Ayah : I Made Yasa
Nama Ibu : Ni Wayan Suartini
Alamat Ayah/Ibu : Jl. Nagasari No.72 Denpasar
Telepon : (0361) 464722
xi
DAFTAR TABEL
Tabel 2. 1 Tabel ANOVA bagi model regresi parametrikError! Bookmark not
defined.
Tabel 2. 2 Tabel aturan keputusan uji d Durbin-WatsonError! Bookmark not
defined.
Tabel 4. 1 Statistika deskriptif data pasien Demam Berdarah Dengue (DBD)
........................................................................ Error! Bookmark not defined.
Tabel 4. 2 Komponen parametrik dan komponen nonparametrik regresi
semiparametrik spline truncated .......... Error! Bookmark not defined.
Tabel 4. 3 Nilai (GCV) dari variasi titik dan orde . Error! Bookmark not defined.
Tabel 4. 4 Analisis variansi regresi semiparametrik spline truncated linear . Error!
Bookmark not defined.
Tabel 4. 5 Uji individu estimasi model regresi semiparametrik spline truncated
linear .................................................... Error! Bookmark not defined.
1
BAB I
PENDAHULUAN
1.1. Latar Belakang Masalah
Analisis regresi merupakan suatu studi yang digunakan untuk melihat
hubungan dalam bentuk fungsi antara variabel respons pada satu atau lebih variabel
prediktor. Hasil dari analisis regresi adalah suatu persamaan yang disebut dengan
persamaan regresi. Analisis regresi sering digunakan dalam berbagai bidang ilmu,
seperti ekonomi, bisnis, administrasi, kesehatan, biologi, dan ilmu pengetahuan
sosial.
Terdapat dua pendekatan dalam analisis regresi untuk mengestimasi kurva
regresi, yaitu pendekatan regresi parametrik dan regresi nonparametrik. Model
regresi parametrik mengasumsikan bahwa pola fungsi diketahui seperti linear,
kuadratik, kubik, polinomial derajat-𝑝, eksponensial, dan lain-lain. Asumsi pada
pendektan parametrik tersebut berdasarkan pada teori atau tersedianya sumber-
sumber lain yang dapat memberi suatu informasi yang terperinci. Pada regresi
parametrik informasi dari penelitian sebelumnya yang rinci tentang karakteristik
data sangat diperlukan untuk dapat memperoleh model yang baik. Apabila dalam
analisis regresi bentuk atau pola kurva tidak diketahui maka pendekatan model
regresi tersebut disebut regresi nonparametrik.
Metode regresi nonparametrik merupakan metode pendekatan regresi yang
digunakan ketika kurva regresi antara variabel prediktor dengan variabel respons
tidak diketahui bentuk atau polanya. Regresi nonparametrik memiliki fleksibilitas
2
yang tinggi di mana data diharapkan mencari sendiri bentuk estimasi kurva
regresinya. Dalam regresi nonparametrik terdapat beberapa teknik estimasi seperti
pendekatan histogram, estimator kernel, estimator deret orthogonal, analisis
wavelet, estimator MARS, estimator deret Fourier, estimator spline, dan lain-lain.
Pendekatan spline memiliki suatu basis fungsi, di mana basis fungsi yang biasa
digunakan antara lain spline truncated dan B-spline (Lyche and Morken 2008).
Spline adalah salah satu jenis piecewise polinomial (Eubank 1988). Maksud
piecewise polinomial ini adalah polinomial yang memiliki sifat tersegmen atau sifat
terpotong-potong. Model polinomial dengan sifat tersegmen ini menyebabkan
spline memiliki fleksibilitas yang lebih tinggi dari model polinomial biasa, sehingga
menyebabkan regresi spline dapat menyesuaikan diri secara lebih efektif terhadap
karakteristik lokal suatu fungsi data atau dengan kata lain regresi spline dapat
menghasilkan suatu fungsi regresi yang sesuai dengan data. Selain memiliki
fleksibilitas yang tinggi regresi spline juga memiliki kelebihan lain seperti memiliki
interpretasi visual dan interpretasi statistika yang baik, mampu menangani data
atau fungsi yang mulus (smooth), mampu menangani data yang perilakunya
berubah-ubah pada sub-sub interval tertentu dengan baik dan mampu
menggeneralisasikan pemodelan statistika yang kompleks dan rumit dengan baik.
Namun, pada saat regresi spline memiliki orde yang tinggi, knot yang terlalu dekat,
dan knot yang terlalu banyak menyebabkan suatu perhitungan matriks yang
singular, sehingga dapat menyebabkan persamaan normal tidak dapat diselesaikan.
Apabila pada sebuah model regresi terdapat komponen model yang diestimasi
secara parametrik dan komponen lain menggunakan pendekatan nonparametric
3
terbentuklah model regresi semiparametrik. Penelitian sebelumnya mengenai
pemodelan menggunakan regresi semiparametrik spline pernah dilakukan oleh
Marina & Budiantara (2013) yang memodelkan faktor-faktor yang memengaruhi
persentase kriminalitas di Jawa Timur dengan pendekatan regresi semiparametrik
spline. Penelitian tersebut menggunakan regresi semiparamterik linear dan dengan
tiga titik knot (𝑟 = 1,2,3). Laome (2009) memodelkan regresi semiparametrik
spline untuk data longitudinal pada kadar CD4 penderita HIV. Sugiantari &
Budiantara (2013) meneliti analisis faktor-faktor yang memengaruhi angka harapan
hidup di Jawa Timur menggunakan regresi semiparametrik spline, pada penelitian
tersebut menggunakan Generalized Cross Validation (GCV) dalam pemilihan titik
knot optimal pada spline linear satu knot, dua knot, dan tiga knot. Wibowo et al.
(2013) meneliti estimasi parameter dalam regresi semiparametrik spline. Penelitian
tersebut mengatakan bahwa pendekatan reproducing kernel Hilbert space
memberikan estimator yang bersifat lebih umum dibandingkan dengan estimator
yang diperoleh dengan metode kuadrat terkecil maupun dengan kuadrat terkecil
terpenalti. Penelitian ini akan digunakan regresi semiparametrik spline truncated
dengan studi kasus pasien Demam Berdarah Dengue (DBD) di Rumah Sakit Puri
Raharja yang nanti hasilnya akan dibandingkan dengan estimasi regresi
semiparametrik menggunakan estimator kernel uniform yang sebelumnya telah
dianalisis oleh Fitriani (2015).
Penyakit Demam Berdarah Dengue (DBD) yang disebabkan oleh virus dengue
yang termasuk kelompok B Arthropod virus yang dikenal sebagai genus Flavivirus
dengan family Flaviviride. Virus Dengue mempunyai empat jenis serotype yaitu
4
DEN-1, DEN-2, DEN-3, dan DEN-4. Terdapat tiga faktor pemegang peran dalam
penularan infeksi virus dengue yaitu manusia, virus, dan vektor perantara. Virus
dengue yang menular ke manusia ditularkan oleh gigitan nyamuk Aedes aegypty
(Departemen Kesehatan Republik Indonesia 2004).
1.2. Rumusan Masalah
Berdasarkan latar belakang yang telah dipaparkan di atas, maka dapat
dirumuskan permasalahan yaitu bagaimana menentukan estimasi model regresi
semiparametrik dengan spline truncated pada data pasien Demam Berdarah Dengue
(DBD) di Rumah Sakit Puri Raharja dan mengetahui variabel-variabel apa saja
yang berpengaruh signifikan terhadap lama rawat inap pada pasien Demam
Berdarah Dengue (DBD)?
1.3. Tujuan Penelitian
Berdasarkan rumusan masalah yang telah dipaparkan sebelumnya, adapun
tujuan pada penelitian ini yaitu menentukan estimasi model regresi semiparametrik
dengan spline truncated pada data pasien Demam Berdarah Dengue (DBD) di
Rumah Sakit Puri Raharja dan mengetahui variabel-variabel apa saja yang
berpengaruh signifikan.
1.4. Manfaat Penelitian
Adapun dalam penelitian ini, penulis berharap dapat memberikan manfaat
sebagai berikut:
1. mampu menambah pemahaman mengenai regresi semiparametrik spline
truncated;