pemodelan angka putus sekolah usia sma di jawa timur ... · spline di smkn 1 nguling pasuruan ....
TRANSCRIPT
Pemodelan Angka Putus Sekolah Usia SMA
di Jawa Timur dengan Pendekatan
Regresi Spline Multivariabel
Seminar Hasil Tugas Akhir
Mega Pradipta
1309100038
Pembimbing I : Dra. Madu Ratna, M.Si
Pembimbing II : Prof. Dr.Drs.I Nyoman Budiantara, M.S
PENDAHULUAN
TINJAUAN PUSTAKA
METODOLOGI PENELITIAN
ANALISIS DAN PEMBAHASAN
KESIMPULAN DAN SARAN
1
Kesejahteraan
Permasalah pendidikan
Putus Sekolah
2
Angka putus sekolah pada usia SMA tahun 2011 sebesar
0.84 persen.
usia SD 0,14 persen usia SMP 0.4 persen
angka partisipasi usia SMA adalah 54,97 persen. Artinya hanya 55 persen saja anak usia SMA yang
sekolah 3
Analisis regresi Parametrik
Semiparametrik
Nonparametrik
Regresi Spline
Pemodelan Angka Putus Sekolah Usia SMA di Jawa Timur dengan
Pendekatan Regresi Spline Multivariabel
4
• Pengaruh Kemampuan Ekonomi Keluarga dan Motivasi Belajar
terhadap Kecenderungan Putus Sekolah Anak Usia Sekolah di Desa Dedel Kelurahan Lau Kecamatan Dawe Kabupaten Kudus Tahun 2008
Rahmawati (2008)
• Pemodelan Angka Putus Sekolah bagi Anak Usia Wajib Belajar di Jawa Timur dengan Pendekatan Generalized Poisson Regression
Wijayanti (2011)
Penelitian Sebelumnya
5
Pemodelan Nilai UN dengan pendekatan regresi semiparametrik spline di SMKN 1 Nguling Pasuruan
Purwahyuningsih
(2010)
Faktor-Faktor yang Memepengaruhi Angka Buta Huruf (ABH) Kabupaten/Kota di Jawa Timur dengan Regresi Spline Semiparametrik
Consetta (2013)
1
• Bagaimanakah karakteristik angka putus sekolah usia SMA di Jawa Timur secara deskriptif?
2
• Bagaimanakah pemodelan faktor-faktor yang mempengaruhi angka putus sekolah usia SMA di Jawa Timur dengan regresi spline?
6
1
• Menganalisis karakteristik angka putus sekolah usia SMA di Jawa Timur secara deskriptif.
2
• Memodelkan faktor-faktor yang mempengaruhi angka putus sekolah usia SMA di Jawa Timur dengan regresi spline
7
Manfaat
• 1. Menambah wawasan keilmuan dalam penggunaan metode regresi spline pada bidang sosial
• 2. Memberikan informasi terkait angka putus sekolah usia SMA di Jawa Timur dan faktor-faktor yang mempengaruhinya
Batasan Masalah
• - Data yang digunakan pada penelitian ini adalah data Badan Pusat Statistik hasil Susenas 2011 di 38 kabupaten/kota Provinsi Jawa Timur.
• - Pemilihan titik knot optimal menggunakan metode GCV (Generalized Cross Validation).
8
Regresi Parametrik
Semiparametrik
Nonparametrik
Analisis Regresi
Analisis regresi merupakan salah satu analisis dalam statistika yang digunakan untuk menyelidiki pola hubungan fungsional antara variabel respon dan variabel prediktor.
9
Regresi nonparametrik merupakan metode pendekatan regresi yang sesuai untuk pola data yang tidak diketahui bentuk kurva regresinya atau tidak terdapat informasi masa lalu yang lengkap tentang bentuk pola data
Regresi Nonparametrik
10
Bentuk umum model regresi Spline
dengan
k = Titik knot merupakan titik perpaduan bersama di mana terdapat perubahan
pola perilaku pada interval yang berbeda
Regresi Nonparametrik Spline
11
J
j
m
jij
m
j
j
iji kxxxF10
)()(
ji
ji
m
jim
jikx
kxkxkx
;0
;
Pemilihan Titik Knot Optimal dan Model Terbaik menggunakan Metode
Generalized Cross Validation (GCV)
Dengan
Titik knot yang optimal diperoleh dari nilai GCV yang paling minimum.
Pemilihan model terbaik
12
221
1
2121
),,,(
),,,(),,,(
J
JJ
KKKAItrn
KKKMSEKKKGCV
Uji Serentak Uji individu
Daerah kritis: tolak jika lebih
besar dari
Daerah kritis: tolak jika lebih besar dari
Pengujian Signifikansi Parameter
13
Uji Asumsi Residual
Residual identik Uji Glejser
Residual independen ACF
Residual berdistribusi Normal
Uji Kolmogorov Smirnov
kn
ee
k
ee
Fn
i
ii
n
i
i
hitung
1
2
1
2
|)ˆ||(|
1
|)||ˆ(|
14
)((x)F0 xSmaksD
Putus Sekolah Putus sekolah adalah proses berhentinya siswa secara terpaksa dari suatu lembaga pendidikan tempat dia belajar atau terlantarnya anak dari sebuah lembaga pendidikan formal, yang disebabkan oleh berbagai faktor.
15
Data yang digunakan pada penelitian ini adalah data sekunder yang diperoleh dari data
Badan Pusat Statistik Jawa Timur dan data Dinas Pendidikan dan Kebudayaan Jawa Timur
pada tahun 2011.
Unit sampel adalah 38 kab/kota di Jawa Timur
Variabel Keterangan Variabel
Y Angka putus sekolah usia SMA Kab/Kota di
Jawa Timur
X1 Persentase keluarga miskin
X2 Laju pertumbuhan ekonomi
X3 Persentase sekolah
X4 Persentase Tenaga pengajar 16
1. Melakukan analisis deskriptif karakteristik angka putus sekolah usia SMA di Jawa
Timur, persentase keluarga miskin, laju pertumbuhan ekonomi , persentase jumlah
sekolah, persentase tenaga pengajar
2. Memodelkan faktor-faktor yang mempengaruhi angka putus sekolah usia SMA di
Jawa Timur dengan regresi spline multivariabel
a) Membuat scatterplot variabel respon dengan masing-masing variabel prediktor untuk
mengetahui pola hubungan antara variabel respon dan variabel prediktor
b) Memodelkan variabel respon dengan berbagai model Spline dan berbagai titik knot
c) Menetukan titik knot optimal berdasarkan nilai GCV minimum
d) Menentukan model Spline terbaik.
e) Menguji signifikansi parameter secara serentak dan individu.
f) Melakukan uji IIDN pada residual
g) Menghitung koefisien determinasi dan MSE
h) Menginterpretasikan hasil yang diperoleh dan mengambil kesimpulan.
17
18
0
0.5
1
1.5
2
2.5
3
3.5
mo
joke
rto
nga
wi
mad
iun
pac
itan
pam
ekas
an
tub
an
pas
uru
an
sid
oar
jo
Sura
bay
a
gres
ik
ban
gkal
an
sam
pan
g
pro
bo
lingg
o
kota
mal
ang
situ
bo
nd
o
mag
etan
tulu
nga
gun
g
sum
enep
lam
on
gan
kota
mad
iun
po
no
rogo
bo
jon
ego
ro
blit
ar
nga
nju
k
mal
ang
jom
ban
g
tren
ggal
ek
ked
iri
lum
ajan
g
ban
yuw
angi
jem
ber
kota
mo
joke
rto
kota
pro
bo
lingg
o
kota
ked
iri
kota
bat
u
kota
pas
uru
an
bo
nd
ow
oso
kota
blit
ar
Persentase Angka Putus Sekolah Usia SMA
19
Variabel Rata-rata Varians Minimum Maksimum
Y 0.9820 0.4610 0.2000 3.0300
X1 13.8160 34.6390 4.7400 30.2100
X2 6.8560 0.4160 6.1400 9.2000
X3 0.2453 0.0069 0.1530 0.5038
X4 7.558 13.7120 3.5660 18.6630
Sampang Kota Batu
Bojonegoro Sampang
Kediri Kota Madiun
25 25 25
30252015105
3.0
2.5
2.0
1.5
1.0
0.5
0.0
penduduk miskina
ng
ka
pu
tus s
eko
lah
9.59.08.58.07.57.06.56.0
3.0
2.5
2.0
1.5
1.0
0.5
0.0
laju pertumbuhan ekonomi
an
gka
pu
tus s
eko
lah
0.550.500.450.400.350.300.250.200.15
3.0
2.5
2.0
1.5
1.0
0.5
0.0
persentase sekolah
an
gka
pu
tus s
eko
lah
20.017.515.012.510.07.55.0
3.0
2.5
2.0
1.5
1.0
0.5
0.0
persentase tenaga pengajar
an
gka
pu
tus s
eko
lah
Scatterplot antara Angka Putus Sekolah (Y)
dengan variabel yang diduga Berpengaruh
20
26 26 26 26
Pemilihan Titik Knot Optimal dengan 1 Titik Knot
Model )(ˆˆ)(ˆˆˆˆ
22423112110 KxxKxxy
)(ˆˆ)(ˆˆ4484733635 KxxKxx
No x1 x2 x3 x4 GCV
1 .9380 6.7645 0.2246 6.6473
0.4636
2 12.5369 7.0767 0.2604 8.1878
0.4805
3 15.1359 7.3890 0.2962 9.7283
0.4110
4 16.1755 7.5139 0.3105 10.3445
0.4001
5 17.2151 7.6388 0.3248 10.9607 0.4065
21
27 27 27 27 27 27 19
27 27 27 27 27
Pemilihan Titik Knot Optimal dengan 2 Titik Knot
Model
24213112110ˆ)(ˆ)(ˆˆˆˆ xKxKxxy
)(ˆˆ)(ˆ)(ˆ53837426325 KxxKxKx
)(ˆ)(ˆˆ)(ˆ84127411410639 KxKxxKx
No X1 X2 X3 X4 GCV
1 10.4578 6.8269 0.2318 6.9554
0.3898 15.1359 7.389 0.2962 9.7283
2 10.4578 6.8269 0.2318 6.9554
0.3972 16.6953 7.5763 0.3177 10.6526
3 10.9776 6.8894 0.2389 7.2635
0.3959 13.5765 7.2016 0.2747 8.804
4 10.9776 6.8894 0.2389 7.2635
0.3988 15.6557 7.4514 0.3033 10.0364
5 12.0171 7.0143 0.2532 7.8797
0.3815 12.5369 7.0767 0.2604 8.1878
22
28 28 28 28 28 28 19
28 28 28 28 28
Pemilihan Titik Knot Optimal dengan 3 Titik Knot
Model
)(ˆ)(ˆ)(ˆˆˆˆ314213112110 KxKxKxxy
)(ˆ)(ˆ)(ˆˆ62852742625 KxKxKxx
)(ˆ)(ˆ)(ˆˆ93128311731039 KxKxKxx
)(ˆ)(ˆ)(ˆˆ124161141510414413 KxKxKxx
No X1 X2 X3 X4 GCV
1
9.938 6.7645 0.2246 6.6473
0.3524 10.9776 6.8894 0.2389 7.2635
13.0567 7.1392 0.2675 8.4959
2
9.938 6.7645 0.2246 6.6473
0.3589 10.9776 6.8894 0.2389 7.2635
15.1359 7.389 0.2962 9.7283
3
9.938 6.7645 0.2246 6.6473
0.334 11.4973 6.9518 0.2461 7.5716
12.0171 7.0143 0.2532 7.8797
4
10.4578 6.8269 0.2318 6.9554
0.3125 10.9776 6.8894 0.2389 7.2635
12.0171 7.0143 0.2532 7.8797
5
10.4578 6.8269 0.2318 6.9554
0.3474 11.4973 6.9518 0.2461 7.5716
12.0171 7.0143 0.2532 7.8797
23
29 29 29 29
Pemilihan Titik Knot Optimal dengan 4 Titik Knot No X1 X2 X3 X4 GCV
1
5.6183 6.2455 0.1651 4.0870
0.3337 10.0097 6.7731 0.2256 6.6898
10.8879 6.8786 0.2377 7.2104
16.1576 7.5117 0.3103 10.3338
2
6.4966 6.3510 0.1772 4.6075
0.3177 9.1314 6.6676 0.2135 6.1693
10.8879 6.8786 0.2377 7.2104
17.0359 7.6172 0.3224 10.8544
3
6.4966 6.3510 0.1772 4.6075
0.3292 9.1314 6.6676 0.2135 6.1693
13.5228 7.1952 0.2740 8.7721
14.4010 7.3007 0.2861 9.2927
4
9.1314 6.6676 0.2135 6.1693
0.2810 10.0097 6.7731 0.2256 6.6898
10.8879 6.8786 0.2377 7.2104
12.6445 7.0897 0.2619 8.2516
5
9.1314 6.6676 0.2135 6.1693
0.2968 10.0097 6.7731 0.2256 6.6898
10.8879 6.8786 0.2377 7.2104
15.2793 7.4062 0.2982 9.8133 24
X
1
X
2
X
3
X
4
2
1
1
2
12.0171; 12.5369
7.5139
0.3105
7.8797; 8.1878
0.3118
30 30 30 30
Pemilihan Titik Knot Optimal dengan kombinasi Titik Knot
No Variabel Prediktor
Kombinasi Titik Knot Titik-Titik Knot GCV
1
X1 2 12.0171; 12.5369
0.3118 X2 1 7.5139 X3 1 0.3105 X4 2 7.8797; 8.1878
2
X1 3 10.4578; 10.9776; 12.0171
0.2772 X2 3 6.8269; 6.8894;
7.0143 X3 1 0.3105 X4 3 6.9554; 7.2635;
7.8797
3
X1 4 9.1314; 10.0097; 10.8879;
0.3026
12.6445 X2 3 6.8269; 6.8894;
7.0143 X3 1 0.3105 X4 2 7.8797; 8.1878 25
31 31 31 31
Model Regresi GCV
1 titik knot 0.4001
2 titik knot 0.3815
3 titik knot 0.3125
4 titik knot 0.2810
Kombinasi titik knot 0.2772
Model terbaik
26
32 32 32 32
)10.4578(4.2647-0.13810.3274 - ˆ11 xxy
)12.0171(1.4826)10.9776(5.4882 11 xx
)6.8894( 21.3459)6.8269( 19.7799- 0.4464 222 xxx
)0.3105( 15.3575- 10.3427) 7.0143( 1.3540- 332 xxx
)7.2635( 1.2041)6.9554( 0.8529 0.7153- 444 xxx
Model regresi nonparametrik spline linier multivariabel menghasilkan koefisien determinasi sebesar 77.3740 persen dan
MSE sebesar 0.1678.
Model
27
33 33 33 33
Pengujian Signifikansi Parameter Secara Serentak
Source of Variation df
Sum of Square
Mean Square Fhitung P-value
Regression 14 13.1949 0.9425
5.6181 0.0001 Residual 23 3.8585 0.1678
Total 37 17.0534
* : signifikan pada alpha 0.05
28
Pengujian Signifikansi Parameter Secara Individu
Variabel Parameter Koefisien P-value Keterangan
X1 β1 0.1381 0.1021 Tidak Signifikan
β2 -4.2647 0.0014 Signifikan
β3 5.4882 0.0020 Signifikan
β4 -1.4826 0.0089 Signifikan
X2 β5 0.4464 0.5057 Tidak Signifikan
β6 -19.7799 0.0206 Signifikan
β7 21.3459 0.0440 Signifikan
β8 -1.3540 0.6814 Tidak Signifikan
X3 β9 10.3427 0.0012 Signifikan
β10 -15.3575 0.0011 Signifikan
X4 β11 -0.7153 0.0001 Signifikan
β12 0.8529 0.6211 Tidak Signifikan
β13 1.2041 0.6121 Tidak Signifikan
β14 -1.3732 0.1098 Tidak Signifikan
* : signifikan pada alpha 0.05
29
35 35 35 35 35 19
35
Pengujian Asumsi Residual Identik
2.52.01.51.00.50.0
0.50
0.25
0.00
-0.25
-0.50
-0.75
yhat
res
Scatterplot antara Residual dan Fit
Uji Glejser
Source of
Variation
df Sum of
Square
Mean
Square
Fhitung P-value
Regressi
on 14 0.62292 0.04450
1.97 0.061 Residual 23 0.52064 0.02264
Total 37 1.34356
Asumsi residual identik terpenuhi
30
Pengujian Asumsi Residual Independen
10987654321
1.0
0.8
0.6
0.4
0.2
0.0
-0.2
-0.4
-0.6
-0.8
-1.0
Lag
Au
toco
rre
lati
on
Plot ACF
0:0 iH
0:1 iH
(tidak ada korelasi antar residual)
( ada korelasi antar residual)
Karena tidak terdapat lag yang keluar maka asumsi independen pada residual terpenuhi.
31
Pengujian Asumsi Residual Berdistribusi Normal
0.80.60.40.20.0-0.2-0.4-0.6-0.8
99
95
90
80
70
60
50
40
30
20
10
5
1
res
Pe
rce
nt
Mean -2.74936E-12
StDev 0.3229
N 38
KS 0.107
P-Value >0.150
Uji Kolmogorov Smirnov
:0H
residual berdistribusi normal
H0: Residual berdistribusi Normal H1: Residual tidak berdistribusi Normal
Asumsi residual berdistribusi normal terpenuhi
32
33
Hubungan persentase penduduk miskin (X1) terhadap (Y)
)10.4578(4.2647-0.1381 ˆ11 xxy
)12.0171(1.4826)10.9776(5.4882 11 xx
0171.12;1687.21210.0
0171.129776.10;6479.153616.1
9776.104578.10;5994.441266.4
4578.10;0.1381
11
11
11
11
xx
xx
xx
xx
34
Hubungan laju pertumbuhan ekonomi (X2) terhadap (Y)
)6.8894( 21.3459)6.8269( 19.7799- 0.4464ˆ222 xxxy
) 7.0143( 1.3540- 2x
0143.7;5277.26584.0
0143.78894.6;0251.120124.2
8894.68269.6;0353.1353335.19
8269.6;0.4464
22
22
22
22
xx
xx
xx
xx
35
Hubungan persentase sekolah (X3) terhadap (Y)
)0.3105(15.3575-10.3427ˆ33 xxy
3105.0;7685.40148.5
3105.0;3427.10
33
33
xx
xx
36
Hubungan persentase tenaga pengajar (X4) terhadap (Y)
)7.2635(1.2041)6.9554(0.85290.7153ˆ444 xxxy
)7.8797(1.3732- 4x
8797.7;8579.30315.0
8797.72635.7;6783.143417.1
2635.79554.6;9323.51376.0
9554.6;0.7153-
44
44
44
44
xx
xx
xx
xx
37
1. Rata-rata angka putus sekolah usia SMA di Jawa Timur pada tahun 2011 adalah sebesar 0.9820 dengan varians sebesar 0.4610. Angka putus sekolah usia SMA terendah sebesar 0.2000 yaitu berada di Kabupaten Mojokerto. Kota Blitar menyumbang angka putus sekolah usia SMA tertinggi sebesar 3.0300.
2. Model regresi nonparametrik spline multivariabel terbaik yang terbentuk adalah
model regresi spline linier dengan kombinasi knot. Nilai GCV yang diperoleh sebesar 0.2772 dengan Rsquare yaitu sebesar 77.3740 persen, sedangkan nilai MSEnya adalah 0.1678. Persamaan modelnya adalah sebagai berikut
)10.4578(4.2647-0.13810.3274 - ˆ11 xxy
)12.0171(1.4826)10.9776(5.4882 11 xx
)6.8894( 21.3459)6.8269( 19.7799- 0.4464 222 xxx
)0.3105( 15.3575- 10.3427) 7.0143( 1.3540- 332 xxx
)7.2635( 1.2041)6.9554( 0.8529 0.7153- 444 xxx
)7.8797( 1.3732- 4x
38
3. Variabel-variabel yang berpengaruh terhadap angka putus sekolah usia SMA Jawa Timur adalah persentase penduduk miskin, laju pertumbuhan ekonomi, persentase sekolah, dan persentase tenaga pengajar.
40
1. Pada penelitian selanjutnya dapat dilakukan penambahan variabel prediktor yang mempengaruhi angka putus sekolah usia SMA di Jawa Timur.
2. Penelitian ini masih terbatas menggunakan regresi Spline linier atau orde satu. Pada penelitian selanjutnya dapat mencoba menggunakan regresi spline orde dua atau orde tiga.
Badan Pusat Statistik. 2011, Indikator Pendidikan Ekonomi dan Sosial Provinsi Jawa Timur, Jakarta: BPS.
Budiantara, I.N. 2005, Model Spline Multivariabel dalam Regresi Nonparametrik. Makalah Seminar Nasional Matematika, Jurusan Matematika ITS Surabaya.
Budiantara, I.N. 2007, Model Keluarga Spline Polinomial Truncated Dalam Regresi Semiparametrik. Jurnal Matematika, Ilmu Pengetahuan Alam dan Pengajarannya (MIPA), Vol. 36, No.1, pp. 1-16. Malang: Universitas Negeri Malang.
Budiantara, I. N. 2009, Spline dalam Regresi Nonparametrik dan Semiparametrik: Sebuah Pemodelan Statistika Masa Kini dan Masa Mendatan". Pidato Pengukuhan untuk Jabatan Guru Besar dalam Bidang Ilmu Matematika Statistika dan Probabilitas, pada Jurusan Statistika, Fakultas MIPA. Surabaya: ITS Press.
Consetta, E. G. D. 2013, Tugas Akhir: Faktor-Faktor yang Memepengaruhi Angka Buta Huruf (ABH) Kabupaten/Kota di Jawa Timur dengan Regresi Spline Semiparametrik, Surabaya: Institut Teknologi Sepuluh Nopember Surabaya.
Eubank, R. L. 1988, Spline Smoothing and Nonparametric Regression, New York: Marcel Deker
Grahacendekia.2009, Anak Putus Sekolah dan Cara pembinaannya. Diunduh dari alamat http://www.google.co.id/putus sekolah/Re-ferensi Penelitian Skripsi-Tesis pada Jumat 1 Februari 2012, 08.00 am
41
Gujarati, D. N. 2006, Dasar-Dasar Ekonometrika Edisi Pertama, Jakarta: Erlangga. Rahmawati. 2008, Pengaruh Kemampuan Ekonomi Keluarga dan Motivasi Belajar terhadap
Kecenderungan Putus Sekolah Anak Usia Sekolah di Desa Dedel Kelurahan Lau Kecamatan Dawe Kabupaten Kudus Tahun 2008, Surakarta: Program Sarjana, Universitas Muhammadiyah.
Rasiyo. 2008, Pemerataan Pendidikan Belum Tercapai. Diunduh dari alamat http://els.bappenas.go.id/upload/kliping/Pemerataan%20Pendidikan%20blm.pdf pada Kamis, 31 Januari 2013, 10.00 am.
Septiana, L. 2011, Tugas Akhir: Pemodelan Remaja Putus Sekolah Usia SMA di Provinsi Jawa Timur dengan Menggunakan Metode Regresi Spasial, Surabaya: Institut Teknologi Sepuluh Nopember Surabaya.
Wahba G. 1990, Spline Models for Observational Data, SIAM, Philadelphia. CBMS-NSF Regional Conference Series in Applied Mathematics, Vol. 59.
Wijayanti, T C. 2011, Tugas Akhir: Pemodelan Angka Putus Sekolah bagi Anak Usia Wajib Belajar di Jawa Timur dengan Pendekatan Generalized Poisson Regression, Surabaya: Institut Teknologi Sepuluh Nopember Surabaya.
42
Pemodelan Angka Putus Sekolah Usia SMA
di Jawa Timur dengan Pendekatan
Regresi Spline Multivariabel
Seminar Hasil Tugas Akhir
Mega Pradipta
1309100038
Pembimbing I : Dra. Madu Ratna, M.Si
Pembimbing II : Prof. Dr.Drs.I Nyoman Budiantara, M.S