bab 4 hasil dan pembahasan - statistika terapan · 35 akan tetapi, dengan hanya satu himpunan...
TRANSCRIPT
33
BAB 4
HASIL DAN PEMBAHASAN
4.1 Penaksir Robust MCD
Metode MCD mencari himpunan bagian dari himpunan X sejumlah h
elemen di mana 1 2n p h n di mana determinan matrik kovariansi
minimum. Misalkan himpunan bagian itu adalah hX . Terdapat nhC kombinasi
himpunan bagian yang harus dicari untuk mendapatkan penaksir MCD. Sebagai
ilustrasi Tabel 4.1 berikut menyajikan jumlah himpunan bagian yang harus
ditemukan (kolom ketiga) berdasarkan jumlah pengamatan n (kolom pertama) dan
jumlah variabel p tertentu (kolom kedua).
Tabel 4.1 Jumlah Himpunan Minimal untuk Menghitung Penaksir MCD
Jumlah Pengamatan (n) Jumlah Variabel(p)
Jumlah Kombinasi nhC
20 2 1679607 38760
50 2 1,2155x1014
10 4,7129x1013
100 2 9,8913x1028
20 1,3746x1028
Sumber: Hasil Perhitungan
Tampak pada Tabel 4.1 jumlah himpunan bagian yang harus ditemukan
untuk sejumlah n dan p tertentu sangat besar meskipun untuk jumlah n = 20 dan p
= 2. Untuk meningkatkan kecepatan pencarian penaksir MCD, dapat digunakan
Teorema C-Steps dari algoritma FAST-MCD. Untuk memperjelas teorema C-
Steps, berikut disajikan sebuah contoh.
Contoh 4.1 Diberikan himpunan data1 4 4 3 2 3 4 3 1 3
.4 4 4 4 4 3 5 5 2 3
T
X
34
Temukan MCD dari himpunan data X!
Pertama, himpunan awal 1hX ditentukan dengan jumlah elemen him-punan
bagian 1 2 10 2 1 2 6.h n p Misalkan pengamatan urutan ke-1, 4,
5, 8, 9, dan 10 merupakan elemen 1 .hX Elemen-elemen himpunan 1hX adalah
1
1 3 2 3 1 34 4 4 5 2 3
T
h
X .
Berdasarkan definisi 1 1,t C , diperoleh
1 1
2,17 0,97 0,47, ,
3,67 0,47 1,06
t C , 1det 0,81C , dan 11
1,31 0,570,57 1,19
C .
Jarak mahalanobis untuk setiap pengamatan terhadap rata-rata t1 dan kovariansi
C1 dinyatakan dengan 1 1,54;1,96;1,96;0,85;0,48;1, 44;1,93;1,32;1,69;1.44 .d
Enam pengamatan yang menghasilkan jarak terkecil adalah pengamatan ke-5, 4, 8,
6, 10, dan 1. Keenam pengamatan ini menjadi elemen himpunan 2hX yaitu
2
1 3 2 3 3 34 4 4 3 5 3
T
h
X .
Selanjutnya dihitung:
2 2
2,50 0,70 0,10, , ;
3,83 0,10 0,57
t C 2det 0,39;C 1
2
1, 46 0,26,
0,26 1,81
C
dan 2 1,79;1,86;1,86;0,68;0,61;1,19;2,58;1,77;3, 29;1,19 .d Tampak bahwa
det(C2) < det(C1) tetapi belum konvergen. Oleh karena itu, enam pengamatan
yang menghasilkan jarak terkecil yaitu pengamatan ke-5, 4, 6, 10, 8, dan 1 dicari
kembali. Keenam pengamatan ini menjadi elemen himpunan 3 .hX Sehingga
diperoleh 3
1 3 2 3 3 34 4 4 3 5 3
T
h
X .
Sampai dengan tahap ini telah diperoleh himpunan bagian yang konvergen. C-
Steps telah mempersingkat pencarian 106 210C himpunan bagian menjadi cukup
hanya dengan 3 pencarian himpunan bagian saja.
35
Akan tetapi, dengan hanya satu himpunan bagian permulaan tidak cukup.
Sebab, ada kemungkinan ditemukan himpunan bagian lain dengan determinan
kovariansi yang lebih kecil. Untuk itu, digunakan beberapa himpunan bagian awal
untuk memulai iterasi pencarian determinan kovariansi terkecil. Setelah
ditemukan konvergensi determinan terkecil dari masing-masing himpunan bagian
awal tersebut, dipilih himpunan bagian yang menghasilkan determinan kovariansi
terkecil. Untuk lebih jelasnya, pada Contoh 4.1 digunakan himpunan awal lainnya
dengan menggunakan pengamatan ke-2, 3, 4, 7, 8, dan 10. Selain itu juga
digunakan himpunan awal dengan menggunakan pengamatan ke-2, 3, 4, 6, 7, dan
10. Perbandingan konvergensi determinan kovariansi ketiga himpunan awal
disajikan pada Tabel 4.2.
Tabel 4.2 Perbandingan Konvergensi Determinan Kovariansi
No UrutanPengamatan Awal
DeterminanKovariansi
DeterminanKovariansi
Terkecil
UrutanPengamatan
Akhir1 1, 4, 5, 8, 9, 10 0,81 0,39 1, 4, 5, 8, 6, 102 2, 3, 4, 7, 8, 10 0,16 0,16 2, 3, 4, 6, 7, 83 2, 3, 4, 6, 7, 10 0,08 0,08 2, 3, 4, 6, 7, 10
Sumber: Hasil Perhitungan
Tabel 4.2 menampilkan proses pencarian himpunan bagian yang
menghasilkan determinan kovariansi terkecil. Kolom kedua menyatakan
himpunan bagian yang pertama kali digunakan. Determinan kovariansi dari
himpunan awal ini pada kolom ketiga. Setelah determinan kovariansi terkecil
mencapai konvergen, enam pengamatan yang menghasilkan determinan
kovariansi terkecil disajikan pada kolom terakhir. Tampak pada Tabel 4.2,
himpunan bagian yang menghasilkan determinan kovariansii terkecil adalah untuk
pengamatan ke- 2, 3, 4, 6, 7, dan 10 dengan determinan kovariansi sebesar 0.08.
Rata-rata dan kovariansi dari keenam pengamatan tersebut merupakan penaksir
MCD yaitu:
36
3,50 0,30 0,30
, , .3,83 0,30 0,57MCD MCD
t S
Berdasarkan taksiran rata-rata dan kovariansi dengan metode MCD dapat
dihitung jarak robust (robust distance) :
6,89;1,12;1,12;1,58;4,23;1,12;1,58;3,35;4,74;1,12 .id
Visualisasi dari jarak robust dapat diamati pada Gambar 4.1. Garis batas
menunjukkan 20.975, p = 2.716 sebagai batas pendefinisian outlier. Titik-titik
yang berada di atas garis menunjukkan outlier. Tampak jelas bahwa titik 1, 5, 8
dan 9 berada di atas garis yang berarti titik-titik ini berada relatif jauh dari
sebagian besar kelompok pengamatan.
Gambar 4.1 Plot Sebaran Data Berdasarkan Jarak Robust.
Berikut ini disampaikan breakdown point untuk Contoh 4.1 di atas.
Breakdown point untuk h = 6, n = 10, p = 2 adalah 1 2 5.n p Tabel 4.3 di
bawah menyajikan taksiran MCD untuk rata-rata dan kovariansi ,MCD MCDt S pada
beberapa persentase outlier. Indeks pada X menunjukkan jumlah pengamatan
ekstrim yang menggantikan data X0. Sebagai contoh elemen himpunan X1
diperoleh dari himpunan X0 dengan menggantikan satu pengamatan sembarang,
dalam hal ini pengamatan kesembilan, dengan nilai yang berbeda, misal 10 dan 20.
37
Taksiran ,MCD MCDt S yang dihasilkan melalui penggantian beberapa nilai
pengamatan dengan nilai yang berbeda dapat dilihat pada Tabel 4.3 kolom ketiga.
Sampai dengan baris kelima, ,MCD MCDt S tidak menunjukkan perbedaan yang
berarti. Perubahan ,MCD MCDt S mulai berbeda signifikan pada baris keenam.
Penggantian lima pengamatan dengan nilai ekstrim pada himpunan X0
menghasilkan taksiran ,MCD MCDt S yang berbeda signifikan.
Tabel 4.3 Taksiran Rata-rata dan Kovariansi MCD untuk Beberapa PersentaseOutlier.
No Data ,MCD MCDt S
1 0
1 4 4 3 2 3 4 3 1 34 4 4 4 4 3 5 5 2 3
X3,50 0,30 0,30
,3,83 0,30 0,57
2 1
1 4 4 3 2 3 4 3 10 34 4 4 4 4 3 5 5 20 3
X3,50 0,30 0,30
,3,83 0,30 0,57
3 2
1 4 4 3 2 3 40 3 10 34 4 4 4 4 3 50 5 20 3
X3,14 0, 48 0,02
,3,86 0,30 0, 48
4 3
1 4 4 3 2 30 40 3 10 34 4 4 4 4 30 50 5 20 3
X2,86 1,14 0,00
,4,00 0,00 0,33
54
1 4 40 3 2 30 40 3 10 34 4 40 4 4 30 50 5 20 3
X2,67 1,07 0,00
,4,00 0,00 0,40
65
10 4 40 3 2 30 40 3 10 340 4 40 4 4 30 50 5 20 3
X4,17 8,57 18,67
,6,67 18,67 43,07
Sumber: Hasil Perhitungan
4.2 Penaksir Robust MWCD
Pada bagian ini dibahas penaksir robust MWCD. Untuk lebih jelasnya
berikut disampaikan contoh penaksiran rata-rata dan kovariansi dengan MWCD
menggunakan data yang sama seperti Contoh 4.1. Himpunan awal dibutuhkan
sebagai langkah awal pencarian taksiran rata-rata dan kovariansi MWCD hingga
dicapai taraf konvergen. Untuk itu, digunakan pengamatan 1, 4, 5, 8, 9, dan 10;
38
pengamatan 2, 3, 4, 7, 8, dan 10.; dan pengamatan 2, 3, 4, 6, 7, dan 10. Langkah
rinci perhitungan hanya akan diberlakukan pada pengamatan 1, 4, 5, 8, 9, dan 10.
a. 1
1 3 2 3 1 34 4 4 5 2 3
T
h
X diperoleh dari matrik data X dengan
mengambil 1 2 10 2 1 2 6h n p pengamatan sebagaimana
jumlah minimal pengamatan dalam MCD dengan n = 10 dan p = 2.
Selanjutnya dihitung: 1 1
2,16 4,83 2,33, , .
3,67 2,33 5,33
t C
b. Dihitung 1 1 21 1 1
4,83 2,33 1,07 0,52ˆ det 20,33 .2,33 5,33 0,52 1,18
p
Σ C C
c. Dihitung rata-rata dan kovariansi dari data pada huruf a,
1 1
2,16 1,07 0,52ˆ,̂ , .3,67 0,52 1,18
μ Σ
d. Dihitung jarak setiap pengamatan terhadap rata-rata dengan persamaan
2 11 1 1 1
ˆˆ ˆTi id i x μ Σ x μ
21 2,13;3,46;3,46;0,65;0,21;1,87;3,35;1,58;2,57;1,87d i
e. Diurutkan jarak dari kecil ke besar.
1 6, 9, 10, 2, 1, 4, 8, 3, 7, 5R
f. Dihitung pembobotan untuk masing-masing pengamatan dengan persamaan
1
1 Norminv 1- ,2 1
iRa i
n
1 0,60;0,23;0,11;1,34;1,69;0,91;0,35;1,10;0,47;0,75 .a i
g. Pembobotan diulang dengan mengambil 1 0,50a i karena h yang
ditetapkan optimal.
1 0,60;0;0;1,34;1,69;0,91;0;1,10;0;0,75 .a i
h. Hitung fungsi objektif 21 1 1 1 1 1 1
1
ˆ ˆˆ ˆ, ,n
n i ii
D a R d
μΣ μΣ = 7,35.
39
i. Selanjutnya rata-rata baru dihitung dengan persamaan
11
2
11
2,543,91
n
n i ii
n
n ii
a R
a R
xt
dan
1 2 21
2
11
ˆ ˆ2,79 0, 25
.0,25 2,70
n T
n i i ii
n
n ii
a R R R
a R
x μ x μC
j. Dihitung
1 1 22 2 2
2,79 0, 25 1,02 0,09ˆ det 7,48 .0, 25 2,70 0,09 0,99
p
Σ C C
k. Rata-rata dan kovariansi dihitung pada tahap kedua ini:
2 2
2,54 1,02 0,09ˆ,̂ , .3,91 0,09 0,99
μ Σ
d. Jarak setiap pengamatan terhadap rata-rata dihitung dengan persamaan
2 12 2 2 2
ˆˆ ˆTi id i x μ Σ x μ
22 2,34;2,12;2,12;0,22;0,29;0,98;3,59;1,50;6,64;0,98d i
e. Jarak yang dihasilkan diurutkan dari kecil ke besar.
2 8, 6, 7, 1, 2, 3, 9, 5, 10, 4R
f. Pembobotan dihitung untuk masing-masing pengamatan dengan persamaan
2
2 Norminv 1-2 1
iRa i
n
2 0,35;0,60;0,47;1,69;1,34;1,10;0,23;0,75;0,11;0,91a i
g. Pembobotan diulang dengan mengambil 1 0,50a i ,
2 0,00;1,28;0,00;0,37;0,39;1,07;0,00;1,12;0,00;0,89a i
h. Hitung fungsi objektif 22 2 2 2 2 2 2
1
ˆ ˆˆ ˆ, , 5,12.n
n i ii
D a R d
μ Σ μ Σ
40
Tampak bahwa 2 2 2 1 1 1ˆ ˆˆ ˆ, ,D Dμ Σ μΣ . Karena nilai fungsi objektif
belum konvergen maka proses dilajutkan. Pada langkah selanjutnya diperoleh
3 3
2,88 0,86 0,07ˆ,̂ ,3,80 0,07 1,16
μ Σ dan 3 3 3̂,̂ 4,15D μ Σ .
Keseluruhan langkah pencarian penaksir rata-rata dan kovariansi dengan MWCD
disarikan pada Tabel 4.4 berikut ini.
Tabel 4.4 Fungsi Objektif Penaksir MWCD dari Enam Iterasi
Tahap Penaksir ˆ,̂i iμΣ FungsiObjektif
12,16 1,07 0,52
,3,67 0,52 1,18
7,35
22,54 1,02 0,09
,3,91 0,09 0,99
5,12
32,88 0,86 0,07
,3,80 0,07 1,16
4,15
42,95 0,75 0,04
,3,73 0,04 1,35
4,03
52,98 0,67 0,02
,3,76 0,02 1,48
4,01
62,98 0,67 0,02
,3,76 0,02 1,48
4,01
Sumber: Hasil Perhitungan.
Dengan demikian penaksir rata-rata dan kovariansi yang diperoleh dengan
menyertakan pengamatan ke-1, 4, 5, 8, 9, dan 10 sebagai himpunan awalnya
adalah
2.98 0.67 0.02ˆˆ , ,3.76 0.02 1.48opt opt
μ Σ .
41
Sampai dengan langkah ini belum menjamin taksiran yang dihasilkan memberikan
nilai fungsi objektif minimum. Perlu dilakukan pencarian taksiran lainnya dengan
menggunkan pengamatan awal yang berbeda.
Sebagaimana telah dikemukakan sebelumnya, pengamatan awal lainnya yang
dicoba adalah pengamatan ke-2, 3, 4, 7, 8, dan 10 dan pengamatan ke-2, 3, 4, 6, 7,
dan 10. Dengan mengikuti proses pencarian taksira MWCD sebelumnya diperoleh
hasil konvergensi untuk masing-masing himpunan pengamatan awal sebagaimana
tertera pada Tabel 4.5 di bawah ini.
Tampak pada Tabel 4.5 taksiran rata-rata dan kovariansi dengan MWCD
diperoleh dengan mengambil himpunan awal yang memuat pengamatan 2, 3, 4, 6,
7, dan 10. Pada tahap awal, rata-rata dan kovariansi yang dihasilkan adalah
1 1
3,50 1,06 1,06ˆ,̂ ,3,83 1,06 2,00
μ Σ ,
dengan fungsi jarak
21 13,44;0,35;0,35;0,71;5,07;0,35;0,71;3,18;6,36;0,35 ,d i dan
fungsi pembobot
1 0,00;1,10;0,91;0,75;0,00;1,69;0,60;0,00;0,00;1,34a i
serta nilai fungsi objektif 2,74. Pada tahap konvergen, taksiran rata-rata dan
kovariansi yang dihasilkan adalah
3,40 1,20 1,24ˆˆ , ,3,62 1,24 2,12MWCD MWCD
μ Σ ,
dengan
fungsi jarak 2 14,73;0,35;0,35;0,91:5,70;0,19;1,00;4,05;5,73;0,19optd i ,
fungsi pembobot
0,00;1,10;0,91;0,75;0,00;1,69;0,60;0,00;0,00;1,34opta i dan nilai fungsi
objektifnya 2,56. Pengamatan 1, 5, 8, dan 9 diberi bobot nol. Keempat pengamatan ini
memberikan jarak terhadap rata-rata yang besar sehingga memberikan bobot yang lebih
kecil daripada 0.50.
42
Tabel 4.5. Perbandingan Nilai Fungsi Objektif Penaksir MWCD.
No UrutanPengamatan Awal
NilaiObjektif
Awal
KonvergensiNilai Fungsi
Objektif
UrutanPengamatan
Akhir1 1, 4, 5, 8, 9, dan 10 7,35 4,01 2, 4, 5, 6, 8, dan 102 2, 3, 4, 7, 8, dan 10 3,65 3,58 2, 3, 4, 6, 7, dan 83 2, 3, 4, 6, 7, dan 10 2,74 2,56 2, 3, 4, 6, 7, dan 10
Sumber: Hasil Perhitungan.
Baik taksiran MCD maupun MWCD menghasilkan pengamatan 2, 3, 4, 6,
7, dan 10 sebagai pengamatan yang memberikan determinan kovariansi terkecil
dan nilai fungsi objektif MWCD terkecil. Hal ini disebabkan karena MWCD
sesungguhnya perluasan dari MCD yang membrikan bobot yang didasarkan pada
urutan jarak terhadap rata-rata. Dalam thesis ini fungsi pembobot jarak MWCD
yang digunakan adalah berupa fungsi menurun (non-increasing). Fungsi
pembobot menurun memberikan bobot yang lebih besar pada jarak yang lebih
dekat dengan rata-ratanya dan memebrikan bobot terkecil pada jarak yang paling
jauh dari rata-rata data. Dengan fungsi ini taksiran MWCD menjadi serupa dengan
taksiran MCD.
4.3 Analisis Diskriminan Kuadratik
4.3.1 Simulasi Data
Perbandingan kinerja penaksir robust MCD dan MWCD dalam analisis
dsikriminan kuadratik melalui simulasi data dimaksudkan untuk mencari penaksir
mana yang menghasilkan rata-rata proporsi salah pengelompokkan terkecil. Untuk
maksud tersebut dibangkitkan berbagai variasi simulasi data sebagaimana telah
dijelaskan pada BAB 3 Metodologi Sub Bab 3.1.1. Hasil keseluruhan simulasi
data dapat diamati pada Lampiran 1.A sampai dengan Lampiran.L. Kedua belas
gambar pada Lampiran 1.A-L menunjukkan perbandingan kinerja tiga penaksir
yaitu klasik (garis merah dengan simbol segitiga), MCD (garis terputus biru
dengan simbol lingkaran) dan MWCD (garis hijau dengan simbol lingkaran).
43
Sumbu absis menunjukkan persentase outlier dan sumbu ordinat menunjukkan
rata-rata proporsi salah pengelompokkan dari fungsi diskriminan kuadratik.
Semakin rendah posisi garis semakin kecil rata-rata proporsi salah
pengelompokkan yang berarti semakin baik kinerja suatu penaksir dalam analisis
diskriminan kuadratik. Untuk lebih jelasnya, berikut dibahas perbandingan kinerja
ketiga penaksir dalam diskriminan kuadratik pada data terkontaminasi shift outlier.
(a) (b)
(a) (b)
Gambar 4.2 Perbandingan Kinerja Penaksir Klasik, MCD, dan MWCD dalamAnalisis Diskriminan Kuadratik pada Data Terkontaminasi ShiftOutlier 5pvQ (a) dan 10pvQ (b) dan n1 = n2 = 100 (atas)dan n1 = n2 = 1000 (bawah) .
Gambar 4.2 di atas menggambarkan kondisi data terkontaminasi shift
outlier pada sampel kecil dan sampel besar serta jumlah pengamatan pada kedua
kelompok sama. Tampak bahwa terdapat kesamaan pola perubahan kenerja fungsi
diskriminan yang dihasilkan. Kinerja penaksir klasik dan MWCD dalam
diskriminan kuadratik tampak tidak robust. Setiap persentase outlier bertambah,
44
bertambah pula rata-rata proporsi salah pengelompokan. Berbeda dengan penaksir
MCD, penambahan persentase outlier sampai dengan 25 persen tidak
mempengaruhi rata-rata proporsi salah pengelompokkan. Rata-rata proporsi salah
pengelompokkan dari penaksir MCD di bawah 10 persen sama seperti kondisi
data tanpa outlier bahkan lebih kecil.
(a) (b)
(a) (b)
Gambar 4.3 Perbandingan Kinerja Penaksir Klasik, MCD, dan MWCD dalamAnalisis Diskriminan Kuadratik pada Data Terkontaminasi ShiftOutlier 5pvQ (a) dan 10pvQ (b) dan n1 = 150, n2 = 50(atas) dan n1 = 1500, n2 = 500 (bawah) .
Sementara itu, dibandingkan ketika jumlah pengamatan pada kedua
kelompok sama, Gambar 4.3 menunjukkan kinerja ketiga penaksir dalam
diskriminan kuadratik menunjukkan pola yang berbeda. Gambar 4.3
menggambarkan data terkontaminasi shift outlier pada saat jumlah pengamatan
45
pada kedua kelompok berbeda. Dalam penelitian ini diamati perbandingan jumlah
pengamatan kelompok satu dan dua sebesar 3:1. Pada kondisi ini tampak fungsi
diskriminan kuadratik dengan penaksir MWCD sangat tidak robust. Di sisi lain,
fungsi diskriminan kuadratik dengan penaksir MCD sangat robust pada persentase
outlier kurang dari 25 persen. Bahkan pada persentase 50 persen sekalipun, rata-
rata proporsi salah pengelompokkan dari fungsi diskriminan kuadratik yang
dihasilkan masih di bawah 15 persen.
Pada kasus data terkontaminasi shift outlier ini, tidak satupun simulasi
data yang menunjukkan kinerja penaksir MWCD lebih baik daripada metode
klasik. Rata-rata proporsi salah pengelompokkan dari fungsi diskriminan
kuadratik dengan penaksir MWCD cenderung lebih besar daripada penaksir klasik.
Berbeda dengan penaksir MWCD, penaksir MCD senantiasa menghasilkan fungsi
diskriminan kuadratik yang meminimumkan rata-rata proporsi salah
pengelompokkan khususnya pada data terkontaminasi shift outlier kurang dari 25
persen.
Lampiran 1.E sampai dengan Lampiran 1.H menggambarkan data
terkontaminasi scale outlier dengan faktor pengali K = 9 (atas) dan K = 100
(bawah). Pada faktor pengali K = 9, kinerja penaksir robust MCD dalam fungsi
diskriminan kuadratik terbaik dibanding kinerja dua penaksir lainnya. Rata-rata
proporsi salah pengelompokkan dari fungsi diskriminan kuadratik yang dihasilkan
dengan menggunkan penaksir robust MCD selalu lebih rendah. Sementara itu,
kinerja penaksir robust MWCD lebih baik daripada penaksir klasik pada data
terkontaminasi scale outlier dengan jumlah sampel pada kedua kelompok sama
dengan 1000. Pada data dengan jumlah sampel kecil kinerja penaksir MWCD
sama dengan penaksir klasik bahkan lebih buruk. Rata-rata proporsi salah
pengelompokkan yang dihasilkan fungsi diskriminan kuadratik dengan penaksir
MWCD hampir sama dengan penaksir klasik. Begitu juga pada data dengan
sampel besar tetapi jumlah kedua kelompok tidak sama (perhatikan Lampiran 1.H
bawah).
Pada data dengan kontaminasi scale outlier dengan faktor pengali K = 100
kinerja ketiga penaksir berbeda nyata. Tampak kinerja penaksir klasik dalam
fungsi diskriminan kuadratik buruk meskipun persentase scale outlier hanya lima
46
sampai sepuluh persen. Rata-rata proporsi salah pengelompokkan fungsi
diskriminan kuadratik klasik 20 - 44 persen.
Sementara itu, rata-rata proporsi salah pengelompokkan dari penaksir
robust MCD dalam fungsi diskriminan kuadratik sangat rendah pada persentase
outlier kurang dari 25 persen. Kinerja penaksir MCD lebih baik dari penaksir
klasik pada persentase scale outlier kurang dari 39 persen dengan jumlah sampel
pada kelompok sama. Jika jumlah sampel pada kedua kelompok berbeda, kinerja
penaksir MCD lebih baik daripada penaksir klasik dan MWCD pada persentase
scale outlier berapapun.
Berbeda dengan kasus data terkontaminasi shift outlier, kinerja penaksir
MWCD pada kasus data terkontaminasi scale outlier lebih baik daripada metode
klasik khususnya pada faktor pengali K = 9 dan jumlah sampel n1 = n2 = 1000.
Pada faktor pengali K = 100 terdapat perpotongan daris antara penaksir MWCD
dan penaksir klasik. Pada persentase scale outlier kurang dari 40 persen,
perbedaan rata-rata proporsi salah pengelompokkan antara penaksir MWCD dan
penaksir klasik cukup besar baik pada sampel besar maupun sampel kecil. Kinerja
penaksir MWCD lebih baik daripada MCD pada persentase scale outlier antara 29
dan 39 persen (Lampiran 1.H atas).
Kontaminasi radial outlier (Lampiran 1.I-L), mengandung sifat shift
outlier dan scale outlier. Pada saat shift outlier ± 5 dan scale outlier K = 9, kinerja
penaksir MCD mengikuti kasus data terkontaminasi scale outlier K = 9. Begitu
juga dengan kasus data terkontaminasi shift outlier ± 10 dan scale outlier K = 100,
perbandingan kinerja ketiga penaksir mengikuti pola data terkontaminasi scale
outlier K = 100. Perbedaannya terletak pada perpotongan garis penaksir MCD dan
MWCD terjadi pada n1 = n2 = 1000. Kinerja penaksir MCD lebih baik daripada
MWCD pada persentase radial outlier kurang dari 30 persen (Lampiran 1. K).
Sebaliknya di atas persentase outlier lebih dari 30 persen, kinerja penaksir
MWCD lebih baik daripada MCD. Meskipun demikian, rata-rata proporsi salah
pengelompokkan masih tetap tinggi yaitu di atas 20 persen. Rata-rata proporsi
salah pengelompokkan rendah hanya ditemui pada kinerja penaksir MCD dengan
persentase outlier kurang dari 25 persen.
47
2,236,51
9,395,17
4,138,34
5,744,54
9,948,94
22,7221,02
11,547,17
1,075,29
7,665,62
7,981,77
9,538,62
8,005,92
3,165,07
29,4611,28
13,001,32
5,743,08
1,782,88
1,483,45
2,307,53
- 5,00 10,00 15,00 20,00 25,00 30,00 35,00
01.Pacitan02.Ponorogo
03.Trenggalek04.Tulungagung
05.Blitar06.Kediri
07.Malang08.Lumajang
09.Jember10.Banyuwangi11.Bondowoso12.Situbondo
13.Probolinggo14.Pasuruan15.Sidoarjo
16.Mojokerto17.Jombang18.Nganjuk19.Madiun
20.Magetan21.Ngawi
22.Bojonegoro23.Tuban
24.Lamongan25.Gresik
26.Bangkalan27.Sampang
28.Pamekasan29.Sumenep
71.KotaKediri72.KotaBlitar
73.KotaMalang74.KotaProbolinggo
75.KotaPasuruan76.KotaMojokerto
77.KotaMadiun78.KotaSurabaya
JawaTimur
Kab
up
aten
/Ko
ta
Persen
4.3.2 Penglompokkan Rumah Tangga Miskin di Propinsi Jawa Timur
Tahun 2002 dengan Analisis Diskriminan Kuadratik.
Pada bagian ini dibahas penerapan analisis diskriminan kuadratik baik
metode klasik maupun metode robust. Pertama dikemukankan penentuan rumah
tangga miskin. Selanjutnya, pemilihan variabel-variabel determinan yang dapat
membedakan secara nyata antara rumah tangga miskin dan rumah tangga tidak
miskin di Propinsi Jawa Timur pada tahun 2002. Langkah berikutnya adalah me-
Gambar 4.4 Persentse Rumah Tangga Miskin di Propinsi Jawa Timur Tahun2002 Berdasarkan 8 Variabel Kemiskinan.
48
0,00
100.000,00
200.000,00
300.000,00
400.000,00
500.000,00
600.000,00
01.P
acita
n
02.P
onor
ogo
03.T
reng
gale
k
04.T
ulun
gagu
ng
05.B
litar
06.K
ediri
07.M
alan
g
08.L
umaj
ang
09.J
embe
r
10.B
anyu
wan
gi
11.B
ondo
wos
o
12.S
itubo
ndo
13.P
robo
lingg
o
14.P
asur
uan
15.S
idoa
rjo
16.M
ojok
erto
17.J
omba
ng
18.N
ganj
uk
19.M
adiu
n
20.M
aget
an
21.N
gaw
i
22.B
ojon
egor
o
23.T
uban
24.L
amon
gan
25.G
resi
k
26.B
angk
alan
27.S
ampa
ng
28.P
amek
asan
29.S
umen
ep
71.K
ota
Ked
iri
72.K
ota
Blit
ar
73.K
ota
Mal
ang
74.K
ota
Pro
bolin
ggo
75.K
ota
Pas
urua
n
76.K
ota
Moj
oker
to
77.K
ota
Mad
iun
78.K
ota
Sur
abay
a
Kabupaten/Kota
Rup
iah
Ruta Miskin Ruta Tidak Miskin
0,00
100.000,00
200.000,00
300.000,00
400.000,00
500.000,00
600.000,00
700.000,00
01.P
acita
n
02.P
onor
ogo
03.T
reng
gale
k
04.Tu
lung
agun
g
05.B
litar
06.K
ediri
07.M
alan
g
08.L
umaj
ang
09.Je
mbe
r
10.B
anyu
wan
gi
11.B
ondo
wos
o
12.S
itubo
ndo
13.P
robo
lingg
o
14.P
asur
uan
15.S
idoa
rjo
16.M
ojok
erto
17.J
omba
ng
18.N
ganj
uk
19.M
adiu
n
20.M
aget
an
21.N
gaw
i
22.B
ojon
egor
o
23.Tu
ban
24.La
mon
gan
25.G
resi
k
26.B
angk
alan
27.S
ampa
ng
28.P
amek
asan
29.S
umen
ep
71.K
ota
Ked
iri
72.K
ota
Blit
ar
73.K
ota
Mal
ang
74.K
ota
Pro
bolin
ggo
75.K
ota
Pas
urua
n
76.K
ota
Moj
oker
to
77.K
ota
Mad
iun
78.K
ota
Sur
abay
a
Kabupaten/Kota
Rup
iah
Ruta Miskin Ruta Tidak Miskin
nerapkan analisis diskriminan kuadratik robust untuk mengelompokkan rumah
tangga di Propinsi Jawa Timur menurut status kemiskinan. Kinerja kebaikan
model diskriminan yang terbentuk diukur dari perbandingan prediksi
pengelompokkan dengan kelompok sebenarnya. Fungsi diskriminan terbaik
adalah fungsi diskriminan yang menghasilkan total proporsi salah
pengelompokkan minimum.
Gambar 4.5 Rata-rata Pengeluaran Makanan (atas) dan Non Makanan (bawah)per Bulan oleh Rumah Tangga Miskin dan Tidak Miskin diPropinsi Jawa Timur tahun 2002.
49
0,00
10,00
20,00
30,00
40,00
50,00
60,00
01.P
acita
n
02.P
onor
ogo
03.T
reng
gale
k
04.T
ulun
gagu
ng
05.B
litar
06.K
ediri
07.M
alan
g
08.L
umaj
ang
09.J
embe
r
10.B
anyu
wan
gi
11.B
ondo
wos
o
12.S
itubo
ndo
13.P
robo
lingg
o
14.P
asur
uan
15.S
idoa
rjo
16.M
ojok
erto
17.J
omba
ng
18.N
ganj
uk
19.M
adiu
n
20.M
aget
an
21.N
gaw
i
22.B
ojon
egor
o
23.T
uban
24.L
amon
gan
25.G
resi
k
26.B
angk
alan
27.S
ampa
ng
28.P
amek
asan
29.S
umen
ep
71.K
ota
Ked
iri
72.K
ota
Blit
ar
73.K
ota
Mal
ang
74.K
ota
Pro
bolin
ggo
75.K
ota
Pas
urua
n
76.K
ota
Moj
oker
to
77.K
ota
Mad
iun
78.K
ota
Sur
abay
a
Kabupaten/Kota
Luas
Lant
aiP
erK
apit
a(m
eter
per
segi
)
Ruta Miskin Ruta Tidak Miskin
Gambar 4.5 di atas menggambarkan perbandingan rata-rata pengeluaran
makan dan non makanan per bulan dari rumah tangga miskin dan rumah tangga
tidak miskin di Propinsi Jawa Timur tahun 2002. Keterbandingan rata-rata
pengeluaran makanan dan non makanan dari rumah tangga miskin dan rumah
tangga miskin ditunjukkan oleh garis putus-putus dengan simbol lingkaran dan
garis tebal dengan simbol kotak. Tampak bahwa rata-rata pengeluaran per bulan
rumah tangga tidak miskin lebih besar daripada rumah tangga miskin baik untuk
konsumsi makanan maupun non makanan. Dengan demikian rata-rata pengeluaran
rumah tangga per bulan dapat dijadikan sebagai variabel pembeda antara rumah
tangga miskin dan tidak miskin.
Gambar 4.6 Perbandingan Luas Lantai per Kapita Rumah Tangga Miskin danRumah Tangga Tidak Miskin di Propinsi Jawa Timur Tahun 2002.
Karakteristik lainnya yang biasa ditemui pada rumah tangga miskin adalah
sebagian besar mereka menempati rumah dengan kepadatan cukup tinggi.
Fenomena ini dapat diukur dengan menghitung luas lantai per kapita. Semakin
kecil luas lantai per kapita semakin padat tingkat hunian rumah. Perbandingan
luas lantai per kapita antara rumah tangga miskin dan rumah tangga tidak miskin
50
ditampilkan pada Gambar 4.6 di atas. Sumbu absis menyatakan kabupaten/kota
dan sumbu ordinat menyatakan luas lantai per kapita dalam satuan meter persegi.
Tampak pada Gambar 4.6 rumah tangga miskin di Propinsi Jawa Timur
menempati tempat tinggal dengan luas lantai perkapita yang lebih kecil
dibandingkan dengan rumah tangga tidak miskin khususnya di kota-kota di Jawa
Timur. Perbedaan luas lantai per kapita antara rumah tangga miskin dan tidak
miskin tidak tampak nyata di tingkat kabupaten.
Sebelum dilakukan analisis diskriminan kuadratik, perlu dilakukan
pendeteksian outlier pada data SUSENAS Jawa Timur tahun 2002. Langkah ini
penting untuk mengetahui struktur data. Pendeteksian outlier melalui pendekatan
perbandingan jarak robust setiap pengamatan dengan jumlah variabel
sebagaimana pendeteksian outlier pada (2.13). Level signifikansi yang digunakan
sebesar 2,5 persen. Dengan demikian, outlier yang terdeteksi dapat diyakini
dengan tingkat kepercayaan 97.5 persen.
Berdasarkan pendeteksian outlier diketahui bahwa 343 dari 2.138 (16,04
persen) rumah tangga miskin dan 5.309 dari 26.886 (19,75 persen) rumah tangga
tidak miskin terdeteksi sebagai outlier. Dilihat dari jenis outlier, data ketiga
variabel penelitian terkontaminasi radial outlier. Rata-rata dan kovariansi antara
data outlier dan bukan outlier baik pada rumah tangga miskin dan tidak miskin
berbeda nyata (lihat Lampiran 2.A-B).
Dengan ditemukannya sejumlah outlier dalam pengelompokkan rumah
tangga miskin, ulasan selanjutnya difokuskan pada penerapan analisis diskriminan
kuadratik pada pengelompokkan rumah tangga miskin di Propinsi Jawa Timur
tahun 2002. Total proporsi salah pengelompokkan fungsi diskriminan kuadratik
dengan menggunakan penaksir klasik, MWCD dan MCD akan dibandingkan.
Pengelompokkan rumah tangga dikatakan salah apabila terdapat perbedaan
alokasi kelompok antara sebelum dan sesudah pengelompokkan dengan fungsi
diskriminan yang dibentuk.
Fungsi diskriminan kuadratik adalah suatu fungsi yang dapat memisahkan
beda dua kelompok atau lebih. Fungsi diskriminan kuadratik klasik adalah fungsi
diskriminan kuadratik yang taksiran rata-rata dan kovariansi data diperoleh
51
dengan metode MLE. Istilah klasik mengacu pada penggunaan metode MLE yang
telah digunakan sejak fungsi diskriminan diperkenalkan.
Taksiran rata-rata dan kovariansi dengan metode klasik untuk kelompok
rumah tangga miskin dan tidak miskin dinyatakan oleh indeks 1 untuk rumah
tangga miskin dan indeks 2 untuk rumah tangga tidak miskin. Kolom pertama,
kedua, dan ketiga dari vektor M̂LEμ masing-masing menyatakan rata-rata luas
lantai per kapita, rata-rata pengeluaran makanan perbulan, dan rata-rata
pengeluaran non makanan per bulan. Tampak bahwa rata-rata luas lantai per
kapita, rata-rata pengeluaran konsumsi makanan dan non makanan rumah tangga
miskin lebih kecil daripada rumah tangga tidak miskin.
1
2
ˆ 21,70 240.350,00 88.130,00ˆ 23,19 388.860,00 260.820,00
MLE
MLE
μμ
,
Di sisi lain, variansi pengeluaran makanan dan non makanan di antara
rumah tangga miskin dan tidak miskin sangat besar. Variansi pengeluaran rumah
tangga miskin yang besar sejalan dengan ditemukannya beberapa pengamatan
outlier. Matrik kovariansi selengkapnya sebagai berikut:
2 6 5
6 10 91
5 9 9
4,54 10 -1,15 10 -2,42 10ˆ -1,15 10 1,98 10 4,58 10
-2,42 10 4,58 10 5,84 10MLE
x x x
x x x
x x x
Σ dan
2 5 5
5 10 102
5 10 11
4,58 10 -6,48 10 5,76 10ˆ -6,48 10 4.60 10 4,42 10
5,76 10 4,42 10 3.43 10MLE
x x x
x x x
x x x
Σ .
Dengan terbentuknya rata-rata dan kovariansi, selanjutnya dibentuk fungsi
diskriminan kuadratik. Fungsi diskriminan kuadratik dapat dinyatakan dalam
bentuk persamaan:
T TMLE MLE MLE MLEQ c x x A x b x
dengan
-4 -8 -9
1 1 -8 -11 -112 1
-9 -11 -10
-1,65 10 -5,62 10 1,82 101 ˆ ˆ -5,62 10 -2,26 10 2,29 102
1,82 10 2,29 10 -1,03 10MLE MLE MLE
x x x
x x x
x x x
A Σ Σ
52
2
1 1 61 1 2 2
6
2.60 10ˆ ˆˆ ˆ 6.00 10
6.99 10MLE MLE MLE MLE MLE
x
x
x
b Σ μ Σ μ
2 1
2 1 1 -122 2 1 1
11
ˆ ˆ1 1 ˆ ˆˆ ˆ ˆ ˆlog log -5,48 10 .ˆ ˆ2 2 MLE MLE
MLE T TMLE MLE MLE MLE MLE
MLE
pc x
p
Σμ Σ μ μ Σ μ
Σ
Aplikasi penaksir MCD pada fungsi diskriminan kuadratik sangat sesuai
dengan struktur data dalam penelitian ini. Sebagaimana telah dikemukakan
sebelumnya, data SUSENAS Propinsi Jawa Timur tahun 2002 terkontaminasi
radial outlier. Dengan menerapkan penaksir MCD pada fungsi diskriminan
kuadratik diharapkan prediksi kelompok tidak dipengaruhi oleh pengamatan
outlier.
Taksiran rata-rata dan kovariansi data dengan MCD sebagai berikut:
5 41
5 52
ˆ 1,80 10 2,31 10 7,66 10ˆ 1,93 10 3,57 10 1,75 10
MCD
MCD
x x x
x x x
μμ
,
2 5 5
5 10 91
5 9 9
1,42 10 -7,02 10 -1,70 10ˆ -7,02 10 1,38 10 2,53 10
-1,70 10 2,53 10 1,41 10MCD
x x x
x x x
x x x
Σ ,
2 5 5
5 10 92
5 9 10
1,15 10 -4,88 10 -1,32 10ˆ -4,88 10 2,36 10 8,99 10
-1,32 10 8,99 10 1,06 10MCD
x x x
x x x
x x x
Σ .
Fungsi diskriminan kuadratik robust yang terbentuk dinyatakan dalam
bentuk persamaan:
T TMCD MCD MCD MCDQ c x x A x b x
dengan:
5 8 7
1 1 8 11 112 1
7 11 10
-2,30 10 -9,32 10 -2,46 101 ˆ ˆ -9,32 10 -2,91 10 6,12 102
-2,46 10 6,12 10 -4,70 10MCD MCD MCD
x x x
x x x
x x x
A Σ Σ
53
2
1 1 61 1 2 2
5
4,84 10ˆ ˆˆ ˆ 3,97 10
4,59 10MCD MCD MCD MCD MCD
x
x
x
b Σ μ Σ μ
2 1 1 22 2 2 1 1 1
11
ˆ ˆ1 1 ˆ ˆˆ ˆ ˆ ˆlog log 2,69.ˆ ˆ2 2
MCD T TMCD MCD MCD MCD MCD MCD MCD
MCD
pc
p
Σμ Σ μ μ Σ μ
Σ
Sebagai pembanding, fungsi diskriminan kuadratik dengan menggunakan
penaksir MWCD diterapkan pada pengelompokkan rumah tangga miskin di
Propinsi Jawa Timur. Taksiran rata-rata dan kovariansi data dengan MWCD
diperoleh
5 41
5 52
ˆ 1,46 10 2,02 10 6,67 10ˆ 1,56 10 2,66 10 3,09 10
MWCD
MWCD
x x x
x x x
μμ
,
5 5
5 9 91
5 9 9
4, 46 10 -2,97 10 -7,68 10ˆ -2,97 10 5,08 10 1, 20 10
-7,68 10 1, 20 10 1, 41 10MWCD
x x x
x x x
x x x
Σ ,
5 4
5 9 92
4 9 9
3,08 10 -1,51 10 -3,59 10ˆ -1,51 10 8,07 10 2,12 10
-3,59 10 2,12 10 1,87 10MWCD
x x x
x x x
x x x
Σ .
Berdasarkan rata-rata dan kovariansi MWCD di atas, fungsi diskriminan kuadratik
yang terbentuk adalah:
T TMWCD MWCD MWCD MWCDQ c x x A x b x
dengan
2 7 7
1 1 7 11 112 1
7 11 10
1,91 10 2,40 10 7,13 101 ˆ ˆ 2,40 10 -1,84 10 -6,38 102
7,13 10 -6,38 10 4,11 10MWCD MWCD MWCD
x x x
x x x
x x x
A Σ Σ
1
1 1 51 1 2 2
4
-8,05 10ˆ ˆˆ ˆ 4,52 10
-2,22 10MWCD MWCD MWCD MWCD MWCD
x
x
x
b Σ μ Σ μ
MWCDc
54
2 1 1 22 2 2 1 1 1
11
ˆ ˆ1 1 ˆ ˆˆ ˆ ˆ ˆlog log 32, 4.ˆ ˆ2 2
MWCD T TMWCD MWCD MWCD MWCD MCD MCD
MWCD
pp
Σμ Σ μ μ Σ μ
Σ
Tahap selanjutnya, rumah tangga dikelompokkan ulang menurut masing-
masing fungsi diskriminan. Perbandingan hasil pengelompokkan rumah tangga
disajikan selengkapnya pada Tabel 4.6. Berdasarkan Tabel 4.6 di bawah dapat
diketahui kinerja fungsi diskriminan kuadratik klasik, MWCD dan MCD. Dengan
menggunakan fungsi diskriminan kuadratik, sebanyak 706 dari 2.138 rumah
tangga miskin diprediksi sebagai rumah tangga tidak miskin dan 6.738 dari
26.886 rumah tangga tidak miskin digolongkan sebagai rumah tangga miskin.
Proporsi salah pengelompokkan dari fungsi kuadratik dengan pendekatan metode
klasik sebesar: 706 6.738 29.024 100% 25,64x persen.
Tabel 4.6 Perbandingan Pengelompokkan Rumah Tangga Berdasarkan FungsiDiskriminan Kuadratik Klasik dan MCD.
Klasik MWCD MCDStatusRumahTangga Miskin Tidak
Miskin Miskin TidakMiskin Miskin Tidak
MiskinTotal
Miskin 1.432 706 1.208 930 4 2.134 2.138TidakMiskin 6.738 20.148 4.692 22.194 4 26.882 26.886
Total 8.170 20.854 5.900 23.124 8 29.016 29.024
Sumber: Hasil Perhitungan
Dengan langkah serupa, total proporsi salah pengelompokkan dari fungsi
diskriminan kuadratik dengan MWCD dan MCD dapat dihitung. Hasil
perbandingan total salah pengelompokkan rumah tangga disajikan selengkapnya
pada Tabel 4.7. Berdasarkan Tabel 4.7 di bawah, kinerja penaksir MCD dalam
analisis diskriminan kuadratik menghasilkan proporsi salah pengelompokkan
paling kecil (7,37 persen). Meskipun demikian, proporsi salah pengelompokkan
secara parsial sangat besar hampir 100 persen. Jarak masing-masing pengamatan
dari kelompok rumah tangga miskin lebih dekat ke pusat data kelompok rumah
tangga tidak miskin yang ditaksir dengan rata-rata MCD. Akibatnya, sebanyak
55
2.134 rumah tangga miskin dialokasikan sebagai kelompok tidak miskin dan
hanya empat rumah tangga tidak miskin yang dialokasikan sebagai kelompok
miskin.
Tabel 4.7 Perbandingan Proporsi Salah Pengelompokkan Fungsi DiskriminanKuadratik Menurut Metode Penaksir MLE, MCD, dan MWCD.
Proporsi Salah Pengelompokkan Rumah Tangga (%)MetodePenaksir Miskin Tidak Miskin Total
MLE 33,02 25,06 25,64MCD 99,81 1,50 7,37
MWCD 43,50 17,45 19,37
Sumber: Hasil Perhintungan.
Di sisi lain, meskipun total proporsi salah pengelompokkan rumah tangga
dari fungsi diskriminan kuadratik klasik paling besar tetapi proporsi salah
pengelompokkan rumah tangga miskin relatif lebih kecil daripada metode
penaksir robust. Sementara itu, kinerja penaksir MWCD dalam diskriminan
kuadratik berada di antara penaksir klasik dan MCD. Hal ini sesuai dengan hasil
simulasi data terkontaminasi radial outlier pada sampel besar dengan jumlah
pengamatan pada kedua kelompok berbeda (lihat Lampiran 1.L). Total proporsi
salah pengelompokkan rumah tangga dengan menggunakan penaksir MWCD
19,37 persen lebih kecil daripada penaksir MLE tetapi lebih besar daripada
penaksir MCD.
Dengan demikian, penerapan penaksir robust MCD dalam analisis
dikriminan kuadratik menghasilkan total proporsi salah pengelompokkan terkecil
baik melalui simulasi data maupun dalam pengelompokkan rumah tangga miskin
dan tidak miskin di Propinsi Jawa Timur tahun 2002. Meskipun demikian,
proporsi salah pengelompokkan secara parsial pada kelompok rumah tangga
miskin masih sangat tinggi.