pengklasifikasian objek dengan analisis diskriminan …
TRANSCRIPT
PENGKLASIFIKASIAN OBJEK DENGAN ANALISIS
DISKRIMINAN LINIER KLASIK DAN ANALISIS
DISKRIMINAN LINIER ROBUST
TESIS
Oleh
JUSTIN EDUARDO SIMARMATA
167021014/MT
PROGRAM STUDI MAGISTER MATEMATIKAFAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS SUMATERA UTARAMEDAN
2018
UNIVERSITAS SUMATERA UTARA
PENGKLASIFIKASIAN OBJEK DENGAN ANALISIS
DISKRIMINAN LINIER KLASIK DAN ANALISIS
DISKRIMINAN LINIER ROBUST
T E S I S
Diajukan Sebagai Salah Satu Syaratuntuk Memperoleh Gelar Magister Sains dalam
Program Studi Magister Matematika padaFakultas Matematika dan Ilmu Pengetahuan Alam
Universitas Sumatera Utara
Oleh
JUSTIN EDUARDO SIMARMATA
167021014/MT
PROGRAM STUDI MAGISTER MATEMATIKAFAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS SUMATERA UTARAMEDAN
2018
UNIVERSITAS SUMATERA UTARA
UNIVERSITAS SUMATERA UTARA
Telah diuji padaTanggal : 16 April 2018
PANITIA PENGUJI TESIS
Ketua : Dr. Sutarman, M.Sc
Anggota : 1. Dr. Mardiningsih, M.Si
2. Dr. Sawaluddin, M.IT
3. Dr. Syahril Efendi, M.IT
UNIVERSITAS SUMATERA UTARA
PERNYATAAN ORISINALITAS
PENGKLASIFIKASIAN OBJEK DENGAN ANALISISDISKRIMINAN LINIER KLASIK DAN ANALISIS
DISKRIMINAN LINIER ROBUST
TESIS
Saya mengakui bahwa tesis ini adalah hasil karya sendiri, kecualibeberapa kutipan dan ringkasan yang masing-masing dituliskan sum-bernya
Medan,Penulis,
Justin Eduardo Simarmata
UNIVERSITAS SUMATERA UTARA
PERNYATAAN PERSETUJUAN PUBLIKASI KARYA ILMIAHUNTUK KEPENTINGAN AKADEMIS
Sebagai sivitas akademika Universitas Sumatera Utara, Saya yangbertanda tangan di bawah ini:
Nama : Justin Eduardo SimarmataNIM : 167021001Program Studi : MatematikaJenis Karya Ilmiah: Tesis
Demi pengembangan ilmu pengetahuan, menyetujui untuk memberikankepada Universitas Sumatera Utara Hak Bebas Royalti Non-Eksklusif(Non-Exclusive Royalty Free Right) atas tesis saya yang berjudul:
Pengklasifikasian Objek dengan Analisis Diskriminan Linier Klasikdan Analisis Diskriminan Linier Robust. PENGKLASIFIKASIANOBJEK DENGAN ANALISIS DISKRIMINAN LINIER KLASIK DANANALISIS DISKRIMINAN LINIER ROBUST Beserta perangkat yangada. Dengan Hak Bebas Royalti NonEksklusif ini, Universitas Suma-tera Utara berhak menyimpan, mengalih media, memformat mengelo-la dalam bentuk data-base, merawat dan mempublikasikan Tesis sayatanpa meminta izin dari saya selama mencantumkan nama saya seba-gai pemegang dan atau sebagai penulis dan sebagai pemilik hak cipta.
Demikian pernyataan ini dibuat dengan sebenarnya.
Medan,Penulis,
Justin Eduardo Simarmata
UNIVERSITAS SUMATERA UTARA
PENGKLASIFIKASIAN OBJEK DENGAN ANALISISDISKRIMINAN LINIER KLASIK DAN ANALISIS
DISKRIMINAN LINIER ROBUST
ABSTRAK
Analisis diskriminan merupakan salah satu dari analisis multi-variat dengan metode dependensi. Analisis diskriminan merupakananalisis multivariat yang bertujuan untuk mengklasifikasi amatan ber-dasarkan beberapa variabel independen yang bersifat non kategorikdan variabel dependen yang bersifat kategorik. Analisis diskriminanmemerlukan asumsi sebaran normal multivariat dan kehomogenan ma-triks varians-kovarians. Analisis diskriminan linier klasik dan analisisdiskriminan linier robust dapat diaplikasikan untuk mengklasifikasikanobjek. Klasifikasi didasarkan pada 10 indikator tingkat kemiskinanKabupaten/kota di provinsi Sumatera Utara, 10 indikator tersebutsebagai variabel independen dan tingkat klasifikasi kemiskinan rendahdan kemiskinan tinggi sebagai variabel dependen. Model diskriminanlinier robust mengklasifikasikan objek lebih tepat dari model diskrimi-nan linier klasik. Hal ini dapat dilihat dari total proporsi kesalahanpengklasifikasian sebesar 6%, lebih kecil dari total proporsi kesalahanpengklasifikasian model diskriminan linier klasik yaitu sebesar 21,2%.Hal ini terjadi karena jumlah pencilan yang besar pada data tingkatkemiskinan kabupaten/kota di Sumtera Utara.
Kata kunci : Analisis multivariat, Analisis diskriminan linier klasik,Robust.
i
UNIVERSITAS SUMATERA UTARA
OBJECT CLASSIFICATION WITH CLASSICAL LINEARDISCRIMINANT ANALYSIS AND ROBUST LINEAR
DISCRIMINANT ANALYSIS
ABSTRACT
Discriminant analysis is one of multivariate analysis with de-pendency method. Discriminant analysis is a multivariate analysisthat aims to classify observations based on several independent vari-ables that are non-categorical and categorical dependent variables.Discriminant analysis requires the assumption of the normal multi-variate distribution and the homogeneity of the variance-covariancematrix. Classical linear discriminant analysis and linear robust dis-criminant analysis can be applied to classify objects. The classifica-tion is based on 10 indicators of district/city poverty level in NorthSumatra province, 10 indicators are as independent variable and lowpoverty classification and high poverty classification as dependentvariable. The linear robust discriminant model classifies the objectmore precisely than the classic linear discriminant model. This canbe seen from the total proportion of classification mistakes of 6%,less than the total proportion of classical linear discriminant classi-fier error classification of 21.2%. This is due to the large number ofoutlays in the district/city poverty data in North Sumatra.
Keyword : Multivariate analysis, The classical linear discriminant analysis, Robust.
ii
UNIVERSITAS SUMATERA UTARA
KATA PENGANTAR
Puji dan syukur penulis panjatkan kepada Tuhan Yang Maha Esa dan
Maha Penyayang, dengan limpahan karunia-Nya penulis dapat menye-
lesaikan penyusunan tesis dengan judul PENGKLASIFIKASIAN OB-
JEK DENGAN ANALISIS DISKRIMINAN LINIER DAN ANALI-
SIS DISKRIMINAN ROBUST. Tesis ini merupakan salah satu syarat
untuk menyelesaikan studi pada Program Studi Magister Matematika
Fakultas Matematika dan Ilmu Pengetahuan Alam (FMIPA) Univer-
sitas Sumatera Utara.
Pada kesempatan ini, penulis ingin menyampaikan terima kasih kepa-
da:
Ayahanda (Almarhum) Jidun Simarmata dan Ibunda Nursatia Lubis,
sosok orang tua yang mencurahkan seluruh kasih sayang dan dukun-
gan kepada penulis. Orang tua penulis kagumi dan cintai, yang telah
memberi tauladan, membimbing, mengajarkan kesabaran, kerenda-
han hati dan selalu bersyukur dalam menghadapi kehidupan ini, serta
senantiasa memanjatkan doa yang tulus dan ikhlas bagi keberhasilan
anak-anaknya.
Bapak Prof. Dr. Runtung Sitepu, S.H., M.Hum., selaku Rektor Uni-
versitas Sumatera Utara yang telah memberikan kesempatan penulis
untuk menempuh pendidikan di Universitas Sumatera Utara.
Bapak Dr. Kerista Sebayang, M.S., selaku Dekan Fakultas Mate-
matika dan Ilmu Pengetahuan Alam (FMIPA) Universitas Sumatera
Utara.
Bapak Prof. Dr. Herman Mawengkang, selaku Ketua Program Stu-
di Magister Matematika Fakultas Matematika dan Ilmu Pengetahuan
Alam (FMIPA) Universitas Sumatera Utara.
Bapak Prof. Dr. Saib Suwilo, M.Sc., selaku Sekretaris Program Stu-
iii
UNIVERSITAS SUMATERA UTARA
di Magister Matematika Fakultas Matematika dan Ilmu Pengetahuan
Alam (FMIPA) Universitas Sumatera Utara.
iv
UNIVERSITAS SUMATERA UTARA
Bapak Dr. Sutarman, M.Sc., selaku Pembimbing Pertama tesis ini
yang telah banyak memberikan bimbingan dan arahan serta motivasi
kepada penulis sehingga tesis ini dapat diselesaikan dengan baik.
Ibu Dr. Mardiningsih, M.Si., selaku Pembimbing Kedua tesis ini yang
telah banyak memberikan bimbingan dan arahan serta motivasi kepada
penulis sehingga tesis ini dapat diselesaikan dengan baik.
Bapak Dr. Sawaluddin, M.IT., selaku Penguji tesis ini yang telah ba-
nyak memberikan bimbingan dan arahan serta motivasi kepada penulis
sehingga tesis ini dapat diselesaikan dengan baik.
Bapak Dr. Syahriel Efendi, M.IT., selaku Penguji tesis ini yang telah
banyak memberikan bimbingan dan arahan serta motivasi kepada penulis
sehingga tesis ini dapat diselesaikan dengan baik.
Seluruh Staf Pengajar pada Program Studi Magister Matematika Fakul-
tas Matematika dan Ilmu Pengetahuan Alam (FMIPA) Universitas
Sumatera Utara yang telah banyak memberikan ilmu pengetahuan se-
lama masa perkuliahan.
Ibu Misiani, S.Si., selaku Staf Administrasi Program Studi Magis-
ter Matematika Fakultas Matematika dan Ilmu Pengetahuan Alam
(FMIPA) Universitas Sumatera Utara yang telah banyak memberikan
pelayanan yang baik kepada penulis selama mengikuti perkuliahan.
Adikku yang ganteng, Hendri Jonathan Simarmata, S.Pd., abangku
yang ganteng juga, Martogi Parlindungan Simarmata, Antonius Simar-
mata, S.E., Erwin Pahala Simarmata, S.Kom., serta kakak-kakakku,
Ferawati Imelda Simarmata, Julita V Simarmata, Lasmaria Simar-
mata, S.E., dan Lusiana Simarmata yang memberikan semangat dan
bantuan moril kepada penulis.
Seluruh rekan-rekan Mahasiswa Program Studi Magister Mate-
matika Fakultas MIPA Universitas Sumatera Utara tahun 2016, atas
v
UNIVERSITAS SUMATERA UTARA
kerjasama dan hubungan yang baik selama perkuliahan, semoga per-
sahabatan yang kita jalin abadi dan dorongan kepada penulis dalam
penulisan tesis ini.
Semua pihak yang telah banyak membantu, baik langsung maupun
tidak langsung yang tidak dapat penulis sebutkan namanya satu per
satu, hanya Tuhan Yang Maha Esa yang mampu memberikan balasan
terbaik. Mudah-mudahan tesis ini dapat memberi sumbangan yang
berharga bagi perkembangan dunia ilmu dan bermanfaat bagi banyak
orang. Semoga Tuhan Yang Maha Esa senantiasa memberi rahmat-
NYA kepada kita semua. Amin.
Penulis menyadari bahwa tesis ini masih jauh dari sempurna, un-
tuk itu penulis mengharapkan kritik saran untuk penyempurnaan tesis
ini. Semoga tesis ini dapat bermanfaat bagi pembaca dan pihak-pihak
yang memerlukannya. Terima kasih.
Medan, 16 April 2018
Penulis,
Justin Eduardo Simarmata
vi
UNIVERSITAS SUMATERA UTARA
RIWAYAT HIDUP
Justin Eduardo Simarmata dilahirkan di Sawah Lamo pada tanggal 5
Juli 1991 dari pasangan Bapak Almarhum Jidun Simarmata dan Ibu
Nursatia Lubis. Penulis menamatkan pendidikan Sekolah Dasar di SD
Negeri 155704 Ujung Batu, Kecamatan Barus, Kabupaten Tapanuli
Tengah, Sumatera Utara, pada tahun 2003, setelah itu melanjutkan
pendidikan ke SMP Swasta Santo Thomas 3 Medan dan lulus pada
tahun 2006 kemudian melanjutkan pendidikan ke SMA Swasta San-
to Thomas 3 Medan dan lulus pada tahun 2009. Kemudian di tahun
2011 penulis memasuki perguruan tinggi negeri, Universitas Sumatera
Utara (USU) Fakultas Matematika dan Ilmu Pengetahuan Alam Pro-
gram Studi Matematika dan lulus Strata Satu (S-1) tahun 2015. Pada
tahun 2015 sampai sekarang penulis bekerja di Yayasan Pendidikan
Nasional Marisi Medan dan Lembaga Bimbingan Belajar Sony Sug-
ema College (SSC) Medan. Pada tahun 2016, penulis melanjutkan
pendidikan pada Program Studi Magister Matematika Universitas Su-
matera Utara.
vi
UNIVERSITAS SUMATERA UTARA
DAFTAR ISI
Halaman
ABSTRAK i
ABSTRACT ii
KATA PENGANTAR iii
RIWAYAT HIDUP vi
DAFTAR ISI vii
DAFTAR TABEL x
DAFTAR GAMBAR xi
BAB 1 PENDAHULUAN 1
1.1 Latar Belakang 1
1.2 Perumusan Masalah 5
1.3 Tujuan Penelitian 6
1.4 Manfaat Penelitian 6
BAB 2 TINJAUAN PUSTAKA 7
2.1 Analisis Multivariat 7
2.2 Teknik-teknik Analisis Multivariat 7
2.2.1 Analisis multivariat dengan menggunakanmetode dependensi 8
2.3 Analisis Multivariat dengan Menggunakan MetodeInterdependensi 8
2.4 Software-software yang Tersedia untuk Analisis Mul-tivariat 8
2.5 Analisis Diskriminan 10
2.6 Metode Penaksir Minimum Covariance Determinant(MCD) 10
2.7 Pengujian Perbedaan Vektor Rataan 11
vii
UNIVERSITAS SUMATERA UTARA
2.8 Pengujian Asumsi Analisis Diskriminan 11
2.8.1 Distribusi normal multivariat 12
2.8.2 Pendeteksian pencilan 12
2.9 Metode Robust 13
2.10 Apparent Error Rate (APER) 13
2.11 Kemiskinan 14
2.12 Indikator Kemiskinan 15
BAB 3 METODOLOGI PENELITIAN 17
3.1 Pengujian Asumsi Analisis Diskriminan 18
3.1.1 Uji normal multivariat 18
3.1.2 Uji kesamaan matriks varians lovarians 18
3.1.3 Uji vektor nilai rataan (uji kesamaan rata-rata kelompok) 19
3.2 Fungsi Analisis Diskriminan 21
3.3 Ketepatan Pengelompokkan Fungsi Diskriminan 26
3.4 Langkah-langkah Analisis 27
BAB 4 HASIL DAN PEMBAHASAN 29
4.1 Data Tingkat Kemiskinan Kabupaten/Kota di Suma-tera Utara 29
4.1.1 Pendidikan yang ditamatkan tingkat SD 30
4.1.2 Pendidikan yang ditamatkan tingkat SLTP 30
4.1.3 Pendidikan yang ditamatkan tingkat SLTA 30
4.1.4 Angka tidak bekerja atau pengangguran 30
4.1.5 Angka bekerja di sektor informal 32
4.1.6 Angka bekerja di sektor formal 32
4.1.7 Angka pengguna alat kontrasepsi 32
4.1.8 Persentase balita yang telah diimunisasi 32
viii
UNIVERSITAS SUMATERA UTARA
4.1.9 Rumah tangga pengguna air layak 32
4.1.10 Rumah tangga pengguna jamban sendiri/bersama 33
4.2 Pengujian Asumsi Analisis Diskriminan 34
4.2.1 Uji Normal Multivariat 34
4.2.2 Data uji kesamaan matriks varian kovarian 36
4.2.3 Data pencilan (outlier) 37
4.2.4 Pemilihan ariabel bebas 39
4.2.5 Analisis diskriminan linier klasik 39
4.3 Analisis Diskriminan Linier Robust 41
4.4 Perbandingan Hasil Analisis Diskriminan Linier Klasikdan Analisis Diskriminan Linier Robust 45
BAB 5 KESIMPULAN DAN SARAN 46
5.1 Kesimpulan 46
5.2 Saran 46
DAFTAR PUSTAKA 48
ix
UNIVERSITAS SUMATERA UTARA
DAFTAR TABEL
Nomor Judul Halaman
3.1 Matriks data pengamatan 21
3.2 Matriks data pengamatan dari grup I 24
3.3 Matriks data pengamatan dari grup II 24
3.4 Hasil Klasifikasi model diskriminan linier robust untuk 33data 27
4.1 Persentase tingkat kemiskinan Kabupaten/kota di Sumate-ra Utara 29
4.2 Data persentase penduduk Kabupaten/kota di SumateraUtara dengan 10 peubah indikator kemiskinan 33
4.3 Uji F dalam analisis regresi 39
4.4 Matriks kovariansi dari grup I (S1) 40
4.5 Matriks kovariansi dari grup II (S2) 40
4.6 Matriks kovariansi gabungan grup I dan grup II (S) 40
4.7 Matriks invers kovariansi gabungan grup I dan grup II (S) 41
4.8 Hasil Klasifikasi model diskriminan linier robust untuk 33data 41
4.9 Matriks robust estimate of covariance dari grup I (S1) 43
4.10 Matriks robust estimate of covariance dari grup II (S2) 43
4.11 Matriks robust estimate of covariance gabungan grup I dangrup II (S2) 43
4.12 Matriks invers robust estimate of covariance (S) 44
4.13 Hasil Klasifikasi model diskriminan linier robust untuk 33data 44
x
UNIVERSITAS SUMATERA UTARA
DAFTAR GAMBAR
Nomor Judul Halaman
4.1 Pengelompokan awal dengan cluster hierarchical clusteranalysis 34
4.2 Nilai koefisien korelasi dengan menggunakan softwareSPSS 35
4.3 Scatter plot indikator Kemiskinan kabupaten/kota Provin-si Sumatera Utara 36
4.4 Uji F dalam analisis regresi 37
xi
UNIVERSITAS SUMATERA UTARA
BAB 1
PENDAHULUAN
1.1 Latar Belakang
Analisis multivariat adalah analisis statistika yang dikenakan pada da-
ta yang terdiri dari banyak variabel dan antar variabel saling berko-
relasi. Data multivariat tidak hanya terdiri atas satu variabel saja
melainkan dapat terdiri atas lebih dari satu variabel. Analisis mul-
tivariat merupakan salah satu teknik statistik yang digunakan untuk
memahami struktur data dalam dimensi tinggi. Variabel-variabel itu
saling terkait satu sama lain. Disinilah letak perbedaan antara multi-
variabel dan multivariat. Multivariat pasti melibatkan multivariabel
tetapi tidak sebaliknya. Multivariabel yang saling berkorelasilah yang
dikatakan multivariat.
Analisis diskriminan merupakan salah satu dari analisis multiva-
riat dengan metode dependensi. Ada dua metode dalam analisis mul-
tivariat, yaitu metode dependensi dan metode interdependensi. Yang
dimaksud dengan metode dependensi yaitu variabel-variabelnya tidak
saling bergantung satu dengan yang lain. sedangkan metode interden-
pendensi adalah antar variabelnya ada saling ketergantungan. Analisis
diskriminan merupakan teknik menganalisis data, dimana variabel de-
penden merupakan data kategorik atau kualitatif (ordinal atau rasio),
sedangkan variabel independen berupa data kuantitatif (interval atau
rasio).
Analisis diskriminan merupakan analisis multivariat yang bertu-
juan untuk mengklasifikasi amatan berdasarkan beberapa variabel in-
dependen yang bersifat non kategorik dan variabel dependen yang
bersifat kategorik. Analisis diskriminan memerlukan asumsi sebaran
normal multivariat dan kehomogenan matriks varians-kovarians. Da-
lam aplikasi analisis diskriminan perlu dipertimbangkan adanya pen-
1
UNIVERSITAS SUMATERA UTARA
2
cilan pada data. Analisis diskriminan klasik tidak mampu mengatasi
adanya pencilan karena penduga vektor rata-rata dan matriks varians-
kovarians tidak robust terhadap adanya pencilan. Oleh karena itu,
dilakukan pendugaan vektor rata-rata dan matriks varians-kovarians
dengan metode minimum covariance determinant (MCD) yang ro-
bust terhadap outlier.
Statistika memegang peranan penting dalam menyelesaikan ma-
salah yang terjadi pada berbagai macam bidang. Seperti bidang ekono-
mi, kependudukan, dan kesehatan. Adanya permasalahan-permasalahan
yang terjadi pada bidang-bidang tersebut, maka statistikawan berusa-
ha memberikan solusi berupa suatu hasil analisis yang berkualitas yang
pada akhirnya dapat digunakan untuk pengambilan keputusan.
Menurut Johnson dan Wichern (1982), tujuan dari analisis diskri-
minan adalah untuk menggambarkan ciri-ciri suatu pengamatan dari
bermacam-macam populasi yang diketahui, baik secara grafis maupun
aljabar dengan membentuk fungsi diskriminan. Dengan kata lain, ana-
lisis diskriminan digunakan untuk mengklasifikasikan individu ke da-
lam salah satu dari dua kelompok atau lebih.
Pada prinsipnya, analisis Diskriminan hampir sama dengan anali-
sis Regresi karena termasuk dalam dependence method yang memiliki
variabel terpengaruh (dependent variable) yang berada dalam baris
(Y ) dan variabel mempengaruhi (independent variable) yang berada
dalam kolom (X). Keberadaan dependence method berguna untuk
mengklasifikasikan objek beberapa kelompok. Kombinasi linier dari
variabel-variabel yang ada akan membentuk suatu fungsi diskriminan
(Tatham et al.,1998).
Analisis regresi memiliki beberapa kegunaan (Draper dan Smith,
1992), diantaranya untuk tujuan deskripsi dari fenomena data atau
kasus yang sedang diteliti, untuk tujuan kontrol, dan sebagai prediksi.
Regresi mampu mendeskripsikan fenomena data melalui terbentuknya
UNIVERSITAS SUMATERA UTARA
3
suatu model hubungan yang bersifat numerik. Regresi juga dapat
digunakan untuk melakukan pengendalian (kontrol) terhadap suatu
kasus atau hal-hal yang sedang diamati melalui penggunaan model
regresi yang diperoleh. Selain itu, model regresi juga dapat diman-
faatkan untuk melakukan prediksi variabel terikat. Analisis regresi li-
nier berganda digunakan untuk mengukur pengaruh antara lebih dari
satu variabel prediktor (variabel bebas) terhadap variabel terikat.
Data outlier (Makkulau et al., 2010) adalah data pengamatan
yang berada jauh (ekstrim) dari pengamatan-pengamatan lainnya.
Outlier mungkin ada karena adanya data terkontaminasi, yaitu adanya
kesalahan pada saat melakukan pengambilan sampel pada populasi.
Outlier yang disebabkan oleh data terkontaminasi dapat dihapuskan
dari data penelitian atau jika memungkinkan dapat dilakukan sam-
pling ulang. Jika setelah dilakukan beberapa sampling ulang namun
data outlier tetap muncul maka data tersebut tidak dapat dihapuskan
dari data penelitian, karena analisis data yang dihasilkan akan tidak
mencerminkan populasi yang diteliti.
Pendeteksian outlier merupakan tahapan yang perlu dilakukan
terutama jika estimasi modelnya dengan Ordinary Least Square (OLS),
yang dikenal cukup peka terhadap outlier. Pendeteksian outlier dapat
dilakukan dengan beberapa metode diantaranya dengan boxplot dan
metode Cooks Distance. Metode Boxplot merupakan metode yang
mempergunakan nilai kuartil dan jangkauan untuk mendeteksi outli-
er, sehingga pada metode ini dapat mengetahui adanya outlier untuk
masing-masing variabel. Sedangkan menggunakan metode Cooks Dis-
tance dapat mengetahui adanya outlier secara simultan pada variabel
bebas. Untuk mengatasinya diperlukan metode lain supaya analisis
data dengan adanya data outlier tetap tahan (robust) terhadap asum-
si yang diterapkan pada analisis datanya. Metode tersebut dikenal
dengan metode robust.
UNIVERSITAS SUMATERA UTARA
4
Regresi robust diperkenalkan oleh Andrews (1972), yaitu metode
regresi yang digunakan ketika distribusi dari residual tidak normal
atau adanya beberapa outlier yang berpengaruh pada model. Metode
regresi yang digunakan ketika distribusi dari error tidak normal dan
atau adanya beberapa outlier yang berpengaruh pada model sehingga
dihasilkan model yang robust atau resistance terhadap outlier (Ryan,
1997). Metode ini merupakan alat penting untuk menganalisa data
yang dipengaruhi oleh outlier. Suatu estimasi yang resistant adalah
relatif tidak terpengaruh oleh perubahan besar pada bagian kecil data
atau perubahan kecil pada bagian besar data. Pada penelitian Friday
(2013) mengenai perbandingan Fisher Linear Discriminant Analysis
and Robust Fisher Linear Discriminant Anslysis diperoleh kesimpu-
lan bahwa dengan kinerja FLDA klasik disebabkan kurangnya ketang-
guhan estimator klasik dalam mengklasifikasikan objek.
Menurut Seung Jean Kim (2005) analisis robust memiliki kete-
garan terhadap pengaruh pencilan merupakan satu-satunya yang pal-
ing layak digunakan dalam kaitannya dengan infersia model. Jika ter-
dapat pencilan (outlier) dalam data, maka bentuk sebaran data tidak
lagi simetrik tetapi cenderung menjulur ke arah pencilan sehingga
melanggar asumsi normalitas.
Melihat banyaknya metode dalam pengelompokan objek yang ada
mendorong peneliti untuk membandingkan metode yang satu dengan
yang lainnya untuk mengetahui metode yang paling akurat dalam
mengklasifikasikan suatu objek. Metode yang akan dibentuk dalam
penelitian ini adalah analisis diskriminan linear klasik dan analisis
diskriminan linier robust. Kedua metode ini dipilih karena metode-
metode tersebut merupakan metode pengklasifikasian objek yang pal-
ing banyak digunakan baik secara teoretis maupun praktis. Metode
tersebut juga merupakan jenis metode yang paling banyak dikem-
bangkan oleh banyak peneliti karena memiliki tingkat keakuratan serta
ketepatan dalam mengklasifikasikan suatu objek yang lebih tinggi bila
UNIVERSITAS SUMATERA UTARA
5
dibandingkan jenis metode lain.
1.2 Perumusan Masalah
Banyaknya analisis yang digunakan dalam pengklasifikasian objek yang
ada mendorong peneliti untuk membandingkan analisis yang satu de-
ngan yang lainnya untuk mengetahui analisis yang paling akurat dalam
mengklasifikasikan suatu objek. Analisis yang akan dibentuk dalam
penelitian ini adalah analisis diskriminan linier klasik dan analisis dis-
kriminan robust. Kedua analisis ini dipilih karena analisis tersebut
merupakan analisis prediksi yang paling banyak digunakan baik se-
cara teoretis maupun praktis. Analisis tersebut juga merupakan jenis
model yang paling banyak dikembangkan oleh banyak peneliti karena
memiliki tingkat keakuratan yang lebih tinggi bila dibandingkan je-
nis analisis lain. Maka rumusan masalah dalam penelitian ini adalah
penerapan analisis diskriminan linier klasik dan analisis diskriminan
robust dalam mengklasifikasikan suatu objek.
UNIVERSITAS SUMATERA UTARA
6
1.3 Tujuan Penelitian
Penelitian ini bertujuan untuk mengklasifikasikan data tingkat kemiski-
nan masyarakat kabupaten/kota di Sumatera Utara berdasarkan ana-
lisis diskriminan linier klasik dan analisis diskriminan robust, memper-
oleh proses pengklasifikasian objek ke dalam suatu kelompok dengan
metode analisis diskriminan linier klasik dan robust serta membandin-
gakan hasil pengklasifikasian metode analisis diskriminan linier klasik
dengan analisis diskriminan robust untuk memperoleh hasil yang ter-
baik berdasarkan salah klasifikasi yang minimum.
1.4 Manfaat Penelitian
Hasil-hasil dari penelitian ini penting untuk memberikan informasi
empirik analisis diskriminan linear klasik dan robust pada pengklasi-
fikasian objek. Memberi bahan kajian bagi peneliti selanjutnya me-
ngenai permasalahan yang relevan dengan penelitian ini. Memberikan
kontribusi kepada khazanah literatur dan praktik mengenai pengklasi-
fikasian objek.
UNIVERSITAS SUMATERA UTARA
BAB 2
TINJAUAN PUSTAKA
2.1 Analisis Multivariat
Analisis multivariat (multivariate analysis) adalah analisis yang meli-
batkan banyak variabel atau variabel ganda. Selain istilah-istilah terse-
but yang sering digunakan dalam statistika, ada beberapa istilah lain
yang sering digunakan seperti; elemen/unit analisis adalah sesuatu
yang menjadi objek penelitian; karakteristik/atribut adalah sifat yang
dimiliki elemen; variabel adalah sesuatu yang nilainya berubah-ubah
menurut waktu atau beda menurut elemen atau tempat; Populasi ada-
lah kumpulan yang lengkap dari seluruh elemen yang sejenis akan
tetapi dapat dibedakan karena karakteristiknya; Sampel adalah seba-
gian dari populasi; Sensus adalah cara pengumpulan data bila seluruh
elemen populasi diteliti satu persatu, hasilnya merupakan data sebe-
narnya yang disebut parameter; Sampling adalah cara pengumpulan
data bila hanya elemen sampel yang diteliti, hasilnya merupakan perki-
raan atau estimator; Sampling error adalah kesalahan yang terjadi
pada data perkiraan, disebabkan karena penelitian dilakukan berda-
sarkan sampel. Kegunaannya untuk mengukur tingkat ketelitian data
perkiraan.
2.2 Teknik-teknik Analisis Multivariat
Analisis multivariat dikelompokkan menjadi dua, yaitu: 1) kelompok
dependensi, dimana variabel dikelompokkan menjadi variabel bebas
yang mempengaruhi dan variabel tak bebas yang dipengaruhi; dan 2)
kelompok interdependensi, dimana variabel tidak dibedakan menja-
di variabel bebas dan variabel tak bebas, akan tetapi setiap variabel
mempunyai tingkat yang sama.
7
UNIVERSITAS SUMATERA UTARA
8
2.2.1 Analisis multivariat dengan menggunakan metode dependensi
Analisis multivariat dengan menggunakan metode dependensi bertu-
juan untuk mengetahui pengaruh atau meramalkan nilai tak bebas
berdasarkan lebih dari satu variabel bebas yang mempengaruhi. Jika
hanya ada satu variabel tak bebas, dapat dilakukan dengan menggu-
nakan anova (analysis of variance), ancova (analysis of covariance),
regresi logistik, regresi berganda, analisis diskriminan, dan korelasi
kanonikal.
2.3 Analisis Multivariat dengan Menggunakan Metode Interdepen-densi
Analisis multivariat dengan menggunakan metode interdependensi.
untuk mencari faktor penyebab timbulnya masalah atau membantu
memberi informasi yang diinginkan. Dalam hal ini, peneliti ingin
mengetahui sesuatu yang belum tahu yang merupakan masalah. Tu-
juannya untuk memberikan arti kepada kelompok variabel menjadi
kelompok yang lebih sedikit jumlahnya dan masing-masing kelompok
membentuk variabel baru yang lebih sedikit, tetapi tidak menguran-
gi informasi yang terkandung dalam variabel asli. Jika ada lebih dari
satu variabel tak bebas, dapat dilakukan dengan menggunakan analisis
faktor, analisis klaster, analisis korespondensi, dan penskalaan multi-
dimensi.
2.4 Software-software yang Tersedia untuk Analisis Multivariat
Melakukan pengolahan data analisis multivariat secara manual bukan-
lah pekerjaan mudah, karena memerlukan teknik-teknik perhitungan
matematis yang rumit yang melibatkan banyak variabel dengan uku-
ran data masing-masing variabel yang besar. Oleh karena itu, akan
sangat bijaksana dan sangat membantu kita dalam pengolahan data
jika digunakan software-software program statistik yang ada seperti,UNIVERSITAS SUMATERA UTARA
9
SPSS, SAS, AMOS, LISRELL, Splus, Eview atau MINITAB.
UNIVERSITAS SUMATERA UTARA
10
2.5 Analisis Diskriminan
Analisis diskriminan adalah teknik statistika untuk mengelompokkan
individu ke dalam kelompok-kelompok yang saling bebas dan tegas
berdasarkan segugus peubah bebas. Analisis diskriminan bertujuan
untuk memahami perbedaan kelompok dan meramalkan peluang bah-
wa suatu objek penelitian akan masuk anggota kelompok tertentu.
Analisis diskriminan cocok dipergunakan jika variabel tak bebasnya
berupa kelompok. Sedangkan yang diramalkan adalah keberadaan sua-
tu objek tertentu termasuk pada kelompok yang mana. Tujuan ana-
lisis diskriminan adalah membuat suatu fungsi diskriminan atau kom-
binasi linier dari prediktor atau variabel bebas yang bisa mendiskrim-
inasi atau membedakan kategori variabel tak bebas atau kelompok,
artinya mampu membedakan suatu objek masuk kelompok kategori
yang mana. Menguji apakah ada perbedaan signifikan antara kelom-
pok/kategorik, dikaitkan dengan variabel bebas atau prediktor. Menen-
tukan prediktor atau variabel bebas yang mana yang memberikan
sumbangan terbesar terhadap terjadinya perbedaan antar-kelompok.
Mengelompokkan objek ke dalam suatu kategori didasarkan pada nilai
variabel bebas.
Metode fungsi diskriminan pada awalnya dikembangkan oleh Fis-
her. Fisher menyatakan bahwa apabila ada dua atau lebih popu-
lasi telah diukur dalam beberapa karakter X1,X2, . . . ,XP , maka dap-
at dibangun fungsi linier tertentu dari pengukuran itu dimana fungsi
tersebut merupakan fungsi pembeda bagi populasi yang dipelajari.
Fungsi linier yang dibangun itu disebut sebagai fungsi diskriminan
(discriminant function).
2.6 Metode Penaksir Minimum Covariance Determinant (MCD)
Metode penaksir MCD merupakan metode untuk mendapatkan pe-
naksir yang robust yang didapatkan dari rata-rata dan kovariansi dari
UNIVERSITAS SUMATERA UTARA
11
sebagian pengamatan yang memiliki determinan matriks kovariansi
yang minimum. Menurut Rousseeuw dan van Driessen (1999), pe-
naksir MCD adalah pasangan (x̃, S), dimana x̃ adalah vektor rata-rata
dan S adalah matriks kovariansi yang meminimumkan nilai determi-
nan S pada subsampel yang berisikan tepat sebanyak h anggota dari
n pengamatan, dimana nilai standar dari h = [n + p + 1/2]. Pada popu-
lasi dengan jumlah pengamatan yang kecil, penaksir MCD dapat de-
ngan cepat dihitung dan ditemukan, tetapi jika jumlah pengamatan
besar, maka akan banyak sekali kombinasi subsampel dari X yang
harus ditemukan dan penghitungan pun akan cukup memakan waktu.
Untuk mengatasi keterbatasan ini, maka Rousseeuw dan van Driessen
(1999) menemukan suatu algoritma baru untuk metode MCD yang
dinamakan dengan metode fast-MCD.
2.7 Pengujian Perbedaan Vektor Rataan
Menurut Rencher (2002) untuk menguji perbedaan vektor rataan da-
pat dilakukan dengan menggunakan statistik uji T 2-Hotelling dengan
hipotesis H0 : µ1 = µ2 lawan H1 : µ1 6= µ2. Adapun statistik uji bagi T 2
adalah
T 2 =n1n2
n1 + n2(x̄1 − x̄2)
t S−1gab (x̄1 − x̄2) X̃2
p (2.1)
tolak H0 : µ1 − µ2 jika T 2 ≥ X2p.∝.
2.8 Pengujian Asumsi Analisis Diskriminan
Menurut Hair et al., (1992) asumsi utama yang melandasi analisis
diskriminan adalah sejumlah variabel independen menyebar dengan
sebaran normal multivariat dan matriks varians-kovarians untuk setiap
kelompok klasifikasi adalah sama.
Johnson dan Wichern (2002) menyatakan bahwa pemeriksaan
distribusi normal multivariat dapat dilakukan dengan membuat q-q
plot dari jarak Mahalanobis (d2i ) dengan chi square quantile (qi). Jika
UNIVERSITAS SUMATERA UTARA
12
q − q plot cenderung membentuk garis lurus dan lebih dari 50% ni-
lai (d2i ) ≤ X2
p.∝ maka sejumlah p variabel tersebut mengikuti sebaran
normal multivariat.
Untuk pengujian kehomogenan matriks varians-kovarians. Rencher
(2002) menjelaskan mengenai multivariate tests of equality of covari-
ance matrices yang dinamakan uji Boxs M . Untuk k populasi mul-
tivariat. Hipotesis untuk pengujian kehomogenan matriks varians-
kovarians adalah H0 :∑
1 =∑
2 = . . . =∑
k lawan H1 :∑
1 6=∑
2 6= . . . 6=∑
k dengan statistik uji sebagai berikut
u = −2(1 − c1)In M (2.2)
tolak H0 jika u > X2
(∝.[ 12(k−1)p(p+1)])
.
2.8.1 Distribusi normal multivariat
Distribusi normal multivariat merupakan generalisasi dari distribusi
normal univariat. Jika X1,X2 . . .XP ∼ Ni, N2i dimana i = 1, 2, . . . , p dan
X1,X2, . . .XP saling bebas. Maka vektor random X = [X1,X2, . . . ,XP ]T
berdimensi p mempunyai distribusi bersama dimana fungsi kepadatan
peluang bersamanya didefenisikan sebagai berikut:
f (x) = f (x1) , f (x2) , . . . , f (xp)
f (x) =1
(2π) p2
exp
[−1
2
∑p
i=1
(xi − µ1
σ1
)2]
(2.3)
dengan −∞ < xi < ∞. i = 1, 2, . . . , p
2.8.2 Pendeteksian pencilan
Pencilan merupakan pengamatan yang berada jauh (ekstrim) dari
pengamatan-pengamatan lainnya. Sebuah pengamatan xi dideteksi se-
bagai pencilan jika jarak mahalanobisnya sebagai beikut (Rousseeuw
dan van Driessen. 1999):
d2MD = (xi − x̃)T S−1 (xi − x̃) > x2
p,(∝) (2.4)UNIVERSITAS SUMATERA UTARA
13
2.9 Metode Robust
Menurut Lachenbruch (1975) jika matriks varians-kovarians antar kelom-
pok adalah sama, maka fungsi skor diskriminan yang terbentuk adalah
fungsi skor diskriminan linier. Sedangkan, jika berbeda, maka fungsi
skor diskriminan kuadratik yang paling optimal. Johnson dan Wich-
ern (2002) membentuk fungsi skor diskriminan linier pada persamaan
(1) dan kuadratik pada persamaan (2) dengan metode Minimum Ex-
pected Cost of Misclassification (ECM) dari x yang mengikuti sebaran
normal multivariat sebagai berikut:
dlk (x) = µt
k
∑−1x − 1
2µt
k
∑−1µk + In (pk) . k = 1, 2, . . . , g (2.5)
dQk (x) = −1
2In
∣∣∣∑
k
∣∣∣ − 1
2(x − µk)
∑−1
k(x − µk) + In (pk) . k = 1, 2, . . . , g
(2.6)
Untuk mengatasi adanya pencilan maka digunakan penduga Minimum
Covariance Determinant (MCD) bagi µ dan∑
yang diduga oleh x̄ dan
S yaitu
x̄ =
∑ni=1 wixi∑ni=1 wi
dan S =
∑ni=1 wi (xi − x̄) ((xi − x̄))t
∑ni=1 wi − 1
(2.7)
Sehingga persamaan skor diskriminan bagi RLDA pada persamaan
(2.5) menjadi:
dlk (x) = x̄t
kS−1x− 1
2x̄t
kS−1x̄k + In (pk) .k = 1, 2, . . . , g (2.8)
Serta persamaan skor diskriminan bagi RQDA pada persamaan (2.6)
menjadi:
dQk (x) = −1
2In |Sk| −
1
2(x − x̄k) + In (pk) .k = 1, 2, . . . , g (2.9)
Suatu observasi x akan termasuk dalam kelompok k jika skor diskri-
minan:
dx(x) = maximum dari d1(x).d2(x) . . . dg(x) (2.10)
dimana: dlk= Jarak dari l ke k
2.10 Apparent Error Rate (APER)UNIVERSITAS SUMATERA UTARA
14
Nilai APER dapat dihitung dengan:
APER =n1M + n2M
n1 + n2(2.11)
dimana:
n1M = Jumlah observasi dari kelompok 1 yang salah diklasifikasikan sebagai
kelompok 2
n2M = Jumlah observasi dari kelompok 2 yang salah diklasifikasikan sebagai
kelompok 1
2.11 Kemiskinan
Masalah kemiskinan merupakan salah satu persoalan mendasar yang
menjadi pusat perhatian pemerintah di negara manapun. Salah satu
aspek penting untuk mendukung strategi penanggulangan kemiskinan
adalah tersedianya data kemiskinan yang akurat dan tepat sasaran.
Pengukuran kemiskinan yang dapat dipercaya dapat menjadi instru-
men tangguh bagi pengambil kebijakan dalam memfokuskan perha-
tian pada kondisi hidup orang miskin. Data kemiskinan yang baik
dapat digunakan untuk mengevaluasi kebijakan pemerintah terhadap
kemiskinan, membandingkan kemiskinan antar waktu dan daerah, ser-
ta menentukan target penduduk miskin dengan tujuan untuk memper-
baiki kondisi tersebut.
Definisi miskin menurut Howard Wringins dan Alder Karisson
menyebutkan bahwa kemiskinan merupakan masalah yang kompleks
(multi dimention) yang dapat ditinjau dari beberapa aspek, selain dari
aspek rendahnya pendapatan dan konsumsi pangan, kemiskinan dapat
ditinjau dari aspek pandangan perumahan, kesehatan, kebutuhan air
bersih juga aspek non material.
Indikator yang digunakan dalam menetukan status kemiskinan
rumah tangga terdiri dari 10 variabel yaitu: pendidikan yang dita-UNIVERSITAS SUMATERA UTARA
15
matkan, angka melek huruf, bekerja di sektor informal, bekerja dis-
ektor formal, bekerja di sektor pertanian, bekerja di sektor bukan
pertanian, tidak bekerja/pengangguran, persentase pengeluaran per
kapita untuk makanan, pengguna alat kontrasepsi, persentase balita
yang telah diimunisasi, rumah tangga pengguna air layak, dan rumah
tangga pengguna jamban sendiri/bersama (BPS, 2016).
2.12 Indikator Kemiskinan
Badan Pusat Statistik (BPS) menggunakan konsep kemampuan memenuhi
dasar dalam mengukur kemiskinan. Dengan pendekatan ini, kemiski-
nan dipandang sebagai ketidakmampuan dari sisi ekonomi untuk memenuhi
kebutuhan dasar makanan dan bukan makanan yang diukur dari sisi
pengeluaran. Pendekatan dalam menghitung kemiskinan tingkat ka-
bupaten/kota adalah sebagai berikut:
a). Menentukan Garis Kemiskinan Sementara (GKS) untuk tingkat
kabupaten/kota dengan cara:
GKStij = GKSt−1
ij x(1 + Ejxlij (2.12)
dimana:
GKStij = Garis kemiskinan sementara kabupaten/kota ke-i di provinsi ke-j
di tahun t
GKSt−1ij = Garis kemiskinan kabupaten/kota ke-i di provinsi ke-j di tahun
t − 1
Ej = Elastisitas provinsi ke-j
lij = Inflasi kabupaten/kota ke-i di provinsi ke-j
b). Menentukan P0 sementara kabupaten/kota ke-i di provinsi ke-
j yaitu dengan cara mengalikan pertumbuhan P0 provinsi ke-j
periode t ke t − 1 dengan P0 kabupaten ke-i pada tahun t-1.
c). Menetapkan garis kemiskinan dengan cara menarik titik potong
antara GKS dan P0 sementara.UNIVERSITAS SUMATERA UTARA
16
d). Menghitung indikator kemiskinan dengan menggunakan formu-
lasi FGT.
e). Melakukan prorate jumlah penduduk miskin kabupaten/kota agar
sama dengan angka provinsi yang telah dirilis sebelumnya.
Yang menjadi indikator kemiskinan tingkat kabupaten/kota diantaran-
mya pendidikan yang ditamatkan, angka melek huruf, angka partisipasi
sekolah, bekerja disektor informal, disektor formal, disektor pertani-
an, disektor bukan pertanian, tidak bekerja atau pengangguran, pe-
ngeluaran per kapita untuk makanan, pengguna alat kontrasepsi, imu-
nisasi atau vaksinisasi, balita yang diimunisasi, rumah tangga penggu-
na air layak, dan rumah tangga pengguna jamban sendiri/bersama.
UNIVERSITAS SUMATERA UTARA
BAB 3
METODOLOGI PENELITIAN
Data yang digunakan merupakan data sekunder, karena diper-
oleh dari publikasi resmi, dokumentasi, tulisan-tulisan ilmiah yang
ada maupun buku-buku, jurnal, atau literatur lainnya. Data sekunder
tersebut diperoleh dari data SUSENAS 2016. Data sekunder yang
digunakan adalah data persentase penduduk per-kabupaten/kota ber-
dasarkan indikator kemiskinan masyarakat di Sumatera Utara yang
digunakan sebagai peubah X untuk mengukur tingkat kemiskinan Y .
Data diperoleh pada level kabupaten/kota yang ada di Sumatera Utara
yang terdiri dari 33 kabupaten/kota.
Oleh karena tidak adanya teori atau penelitian sebelumnya yang
mendasari pengklasifikasian tingkat kemiskinan per-kabupaten/kota,
maka peneliti mengelompokkan tingkat kemiskinan Y menjadi 2 kelom-
pok berdasarkan sebaran empirik data. Kelompok 1 adalah kabupa-
ten/kota dengan tingkat kemiskinan rendah. Kelompok 2 adalah ka-
bupaten/kota dengan tingkat kemiskinan tinggi.
Peubah yang digunakan dalam penelitian ini adalah (Badan Pusat
Statistik, 2016):
X1 : Pendidikan yang ditamatkan tingkat SD(%)
X2 : Pendidikan yang ditamatkan tingkat SLTP(%)
X3 : Pendidikan yang ditamatkan tingkat SLTA(%)
X4 : Angka tidak bekerja(%)
X5 : Bekerja di sektor informal (%)
X6 : Bekerja disektor formal (%)
X7 : Pengguna alat kontrasepsi (%)
X8 : Persentase balita yang telah diimunisasi (%)
X9 : Rumah tangga pengguna air layak (%)
17
UNIVERSITAS SUMATERA UTARA
18
X10 : Rumah tangga pengguna jamban sendiri/bersama (%)
3.1 Pengujian Asumsi Analisis Diskriminan
3.1.1 Uji normal multivariat
Menurut Johnson dan Wichern (2007), untuk menguji kenormalan
peubah ganda (Multivariate Normality) adalah dengan mencari nilai jarak
kuadrat untuk setiap pengamatan yaitu:
d2i = (xi − x̄)TS−1(xi − x̄) (3.1)
dimana:
d2i adalah nilai jarak kuadrat untuk setiap pengamatan ke i
xi adalah pengamatan yang ke i, dengan i = 1, 2,. . . ,n
x̄ adalah rata-rata variabel bebas X
S−1adalah kebalikan (inverse) matriks varians-kovarians gabungan S
Kemudian d2i diurutkan dari yang paling kecil ke yang paling be-
sar, selanjutnya dibuat plot d2i dimana: i = urutan = 1, 2, . . .n. Bila
hasil plot dapat didekati dengan garis lurus, maka dapat disimpulkan
bahwa peubah ganda menyebar normal.
3.1.2 Uji kesamaan matriks varians lovarians
Untuk menguji kesamaan matriks varians kovarians kelompok I (S1)
dan kelompok II (S2) digunakan hipotesa:
H0 : S1 = S2, matriks varians kovarians kelompok adalah relatif sama.
H1 : S1 6= S2, matriks varians kovarians kelompok adalah berbeda
secara nyata.
Terima H0, yang berarti matriks varians kovarians sama jika:
UNIVERSITAS SUMATERA UTARA
19
X2hitung ≤ X2
(α,[ 12(k−1)p(p+1)])
(3.2)
dengan:
X2hitung = −2(I − Ci)[
1
2
k∑
i=1
Viln|Si| −1
2ln|S|
k∑
i=1
Vi] (3.3)
k = Banyaknya kelompok (grup)
P = Jumlah peubah pembeda (Y ) dalam fungsi diskriminan = 1
S = Matriks varians kovarians dalam kelompok gabungan
Si = Matriks varian kovarians kelompok ke-i
i = 1, 2, 3, . . . , k
ni = Jumlah responden pada kelompok ke-i
dengan:
Vi = ni − 1 (3.4)
S =
∑ki=1 ViSi∑ki=1 Vi
(3.5)
C1 = [k∑
i=1
1
v1− 1∑k
i=1 Vi
][2p2 + 3p − 1
6(p + 1)(k − 1)] (3.6)
3.1.3 Uji vektor nilai rataan (uji kesamaan rata-rata kelompok)
Menguji apakah semua variabel independen (variabel bebas) berbe-
da secara nyata berdasarkan variabel dependen. Variabel bebas diuji
dengan dua cara:
1. Dengan Uji F
Statistik uji yang digunakan untuk menguji kesamaan rata-rata
antar kelompok adalah statistik F dengan hipotesa:
H0 : µ1 = µ2 = . . . = µk Berarti rata-rata antar kelompok sama (tidak
ada perbedaan)
H1 : µ1 6= µ2 6= . . . 6= µk, Berarti ada perbedaan rata-rata antar kelompok
α= Taraf signifikansi
UNIVERSITAS SUMATERA UTARA
20
Daerah kritis : tolak H0. jika Fhit > Ftabel
Ftabel = F((db1;db2))
db1 = k − 1
db2 = (n − k) = (nj − 1) + (n2 − 1)
Apabila Fhit > Ftabel, maka tolak H0, ini berarti bahwa terdapat
perbedaan vektor nilai rataan antar kelompok. Bila dari hasil
pengujian ada perbedaan vektor nilai rataan, maka fungsi diskri-
minan layak disusun untuk mengelompokkan suatu objek. Kepu-
tusan atas dasar Signifikansi uji F pada output SPSS dilihat angka
Sig.
(a) Jika Sig. > 0.05 maka H0 diterima, berarti tidak ada perbe-
daan yang signifikan antar grup (rata-rata antar kelompok
sama).
(b) Jika Sig. ≤ 0.05 maka H1 diterima, berarti ada perbedaan
yang signifikan antar grup.
2. Dengan angka Wilks Lambda
Angka Wilks Lambda berkisar 0 sampai 1, yaitu:
(a) Jika angka Wilks Lambda mendekati 0, maka data tiap kelom-
pok cenderung berbeda.
(b) Jika angka Wilks Lambda mendekati 1, maka data tiap kelom-
pok cenderung sama (tidak berbeda).
Wilks Lambda = WW+B
dimana:
W = Jumlah Kuadrat Galat (JK dalam kelompok)
B = Jumlah Kuadrat Antar Kelompok
UNIVERSITAS SUMATERA UTARA
21
Analisis varians (Uji F) dan angka Wilks Lambda adalah untuk men-
guji rata-rata setiap variabel.
3.2 Fungsi Analisis Diskriminan
Fungsi diskriminan adalah kombinasi linear dari variabel-variabel yang
dimiliki oleh kelompok-kelompok yang akan diklasifikasikan. Fungsi
diskriminan menentukan ke dalam kelompok mana suatu objek (melalui
karakteristiknya berupa data pengamatan) seharusnya dimasukkan atau
dikategorikan, maka setidak-tidaknya ada dua kelompok. Oleh karena
itu dapat ditinjau bagaimana fungsi diskriminan ini diperoleh apabila
berhadapan dengan dua grup. Sebelumnya akan dijelaskan terlebih
dahulu pengertian matriks varians kovarians.
Pada data pengamatan ke-i yang berukuran n (i = 1, 2, . . ., n)
yang terdiri atas j buah variat (variabel) yaitu X1, X2, . . . , Xj. Data
pengamatan tersebut dapat disajikan dalam bentuk matriks berikut.
Tabel 3.1 Matriks data pengamatan
Variabel X1 X2 ... Xj
Data Pengamatan X11 X12 ... X1jX21 X22 ... X2j. . . .. . . .. . . .Xn1 Xn2 ... Xnj
Untuk variabel Xj yang dihitung adalah variansnya, diberi lambang
Sjj dengan rumus:
Sjj =nΣn
n=1X2nj − (Σn
n=1Xnj)2
n(n − 1)(3.7)
Semuanya ada j buah varians, yaitu S11, S22, ..., Sjj yang masing-masing
merupakan varians untuk variabel X1,X2, ...,Xj. Untuk variabel Xi dan
Xj dimana i 6= j terdapat kovarians, diberi lambang Sij yang dapat di-
hitung dengan rumus berikut.
UNIVERSITAS SUMATERA UTARA
22
Sij =nΣn
n=1XniXnj − (Σnn=1Xni)(Σ
nn=1Xnj)
n(n − 1)(3.8)
Semuanya ada (j2 − j) buah kovarians. Perlu dijelaskan bahwa
untuk i = j maka Sij = Sji diberi lambang menjadi Sjj .
Varians dan kovarian disusun dalam sebuah matriks disebut dengan
nama matriks varians-kovarians dengan lambang S, bentuknya sebagai
berikut.
S1 =
S11 S12 . . . S1jS21 S22 . . . S2j
. . .
Sj1 Sj2 . . . Sjj
Misalkan ada dua grup yang banyak variabelnya masing-masing j buah
yaitu X11, X12, . . . , X1j dalam grup I dan X21, X22, . . . , X2j dalam
grup II. Perhatikan bahwa Xij menyatakan variabel ke j dalam grup
ke i, dengan i = grup I dan grup II. Variabel dalam setiap grup dapat
pula dituliskan dalam bentuk vektor kolom sebagai berikut.
X1 =
X11X12...
X1j
X2 =
X21X22...
X2j
UNIVERSITAS SUMATERA UTARA
23
X1j menyatakan variabel X ke j dalam grup ke 1
X2j menyatakan variabel X ke j dalam grup ke 2
Dari setiap grup berukuran n1 dari grup ke-1 dan berukuran n2
dari grup ke-2. Data pengamatan akan berbentuk matriks yang ben-
tuknya seperti berikut.
UNIVERSITAS SUMATERA UTARA
24
Tabel 3.2 Matriks data pengamatan dari grup I
Variabel X11 X12 ... X1j
Data Pengamatan X11 X12 ... X1jX21 X22 ... X2j. . . .. . . .. . . .Xn1 Xn2 ... Xnj
Rata-rata X̄11 X̄12 ... X̄1j
Tabel 3.3 Matriks data pengamatan dari grup II
Variabel X21 X22 ... X2j
Data Pengamatan X211 X221 ... X2j1X212 X222 ... X2j2. . . .. . . .. . . .X21n2 X22n2 ... X2jn2
Rata-rata X̄11 X̄12 ... X̄2j
Hasil pengamatan ini akan menghasilkan rata-rata untuk tiap va-
riabel yang dibentuk dalam bentuk vektor dapat ditulis:
X̄1 =
X̄11
X̄12...
X̄1j
X̄2 =
X̄21
X̄22...
X̄2j
dimana:
X1jn1 Menyatakan variabel X ke j dalam grup ke 1 yang berukuran n1
X2jn2 Menyatakan variabel X ke j dalam grup ke 2 yang berukuran n2
X̄1j menyatakan rata-rata variabel ke j dalam grup 1
X̄2jmenyatakan rata-rata variabel ke j dalam grup 2
UNIVERSITAS SUMATERA UTARA
25
Dari masing-masing rata-rata dari grup I dan rata-rata dari grup
II, selanjutnya akan dihitung varians dan kovariansnya. Varians ko-
varians tersebut disusun dalam matriks S1 dan S2, masing-masing dari
grup ke-1 dan dari grup ke-2, yaitu:
S1 =
S11 S12 S1jS21 S22 S2j
.
.
.Sj1 Sj2 Sjj
S2 =
S11 S12 S1jS21 S22 S2j
.
.
.Sj1 Sj2 Sjj
dimana :
S1 = matriks varians kovarians dari grup ke 1
S2 = matriks varians kovarians dari grup ke 2
Meskipun dalam S1 dan S2 digunakan Sij yang sama namun jelas
besarnya berlainan antara Sij dalam S1 dan Sij dalam S2, kedua datanya
juga berlainan, yaitu S1 diambil dari grup I dan S1 diambil dari grup
II.
Kedua buah matriks varians-kovarians ini bisa dihitung matriks
varians-kovarians gabungan, diberi lambang S dengan rumus:
S =(n1 − 1)S1 + (n2 − 1)S2
n1 + n2 − 2
Matriks varians-kovarians gabungan ini mempunyai invers, yaitu S−1.
Dengan adanya vektor rata-rata X̄1 dan X̄2 dan juga matriks
varians-kovarians gabungan S bersama dengan persyaratan bahwa da-
ta variabel independen seharusnya berdistribusi normal multivariat
(bervariabel banyak) disingkat multinormal, dan matriks varians-kovarians
kedua grup relatif sama, maka rumus fungsi diskriminan untuk ini ada-
lah:
Y = (X̄1 − X̄2)S−1X (3.9)
UNIVERSITAS SUMATERA UTARA
26
X adalah vektor pengamatan yaitu
X =
X1X2...
Xj
Fungsi diskriminan ini dapat digunakan untuk membuat aturan klasi-
fikasi yang kita cari berdasarkan salah satu dari kedua aturan di bawah
ini:
Aturan I :
Jika Y > 1/2 (X̄1 - X̄2)S−1(X̄1 + X̄2) klasifikasi objek dengan data
pengamatan X dimasukkan ke dalam grup I. Jika Y = 1/2 (X1 -
X2)S−1(X̄1 + X̄2) klasifikasi objek dengan data pengamatan X dima-
sukkan ke dalam grup II.
Aturan II :
Dengan menggunakan statistik W (Wald-Anderson) yaitu:
W = XS−1(X̄1 − X̄2) − 1/2(X̄1 − X̄2)S−1(X̄1 + X̄2) (3.10)
Untuk memperoleh klasifikasi ini. jika W > 0 maka objek dengan
pengamatan X dimasukkan kedalam grup I sedangkan dalam hal lain-
nya objek itu dimasukkan ke dalam grup II.
3.3 Ketepatan Pengelompokkan Fungsi Diskriminan
Tingkat akurasi pengelompokkan sangat menentukan baik atau
tidaknya suatu pengelompokan. Persentase ketepatan pengelompokan
dapat dihitung dari matriks klasifikasi yang menunjukkan nilai sebe-
narnya (actual members) dan nilai prediksi (prediction members) dari
setiap kelompok.
Hasil pengelompokkan menurut fungsi diskriminan tidak selalu
sama dengan pengelompokkan awal. Besarnya kesalahan pengelom-
UNIVERSITAS SUMATERA UTARA
27
pokan. dengan menganggap pengelompokan awal adalah benar, meru-
pakan indikator tingkat akurasi dari fungsi diskriminan yang dihasilkan.
Tabel berikut menunjukkan evaluasi tingkat akurasi terhadap fungsi
diskriminan dengan memperhatikan persentase ketepatan pengelom-
pokan.
Tabel 3.4 Hasil Klasifikasi model diskriminan linier robust untuk 33 data
Pengelompokan MenurutPengelompokan Fungsi Diskriminan Jumlah
Awal Kelompok I Kelompok II
Kelompok I n11 n12 n1
Kelompok II n21 n22 n2
Jumlah n.1 n.2 n
3.4 Langkah-langkah Analisis
Adapun langkah-langkah dalam analisis diskriminan linier klasik dan
analisis diskriminan robust sebagai berikut:
1. Menyiapkan data yang akan digunakan dalam penelitian
2. Melakukan pengujian asumsi analisis diskriminan
3. Mendeteksi adanya pencilan
4. Memilih variabel bebas yang digunakan dalam penelitian
5. Melakukan standarisasi variabel jika satuan variabel berbeda-
beda
6. Melakukan perhitungan analisis diskriminan linier dan analisis
robust dengan langkah sebagai berikut:
(a) Penaksiran parameter untuk analisis diskriminan linier dan
analisis robust
UNIVERSITAS SUMATERA UTARA
28
(b) Menentukan fungsi diskriminan linier dan fungsi analisis ro-
bust
(c) Menghitung skor diskriminan linier dan skor diskriminan ro-
bust untuk masing-masing pengamatan dan mengklasifikasikan-
nya kedalam kelompok pertama atau kelompok kedua
(d) Menghitung jumlah pengamatan yang salah dalam pengk-
lasifikasian analisis diskriminan linier dan diskriminan robust
(e) Menghitung persentase kesalahan dalam pengklasifikasian ana-
lisis diskriminan linier dan analisis robust dengan metode
APER
(f) Menilai tingkat keakuratan pengklasifikasian diskriminan li-
nier dan pengklasifikasian robust dengan menghitung nilai
Presss Q
7. Membandingkan persentase kesalahan pengklasifikasian hasil ana-
lisis diskriminan linier dengan hasil analisis robust
UNIVERSITAS SUMATERA UTARA
BAB 4
HASIL DAN PEMBAHASAN
4.1 Data Tingkat Kemiskinan Kabupaten/Kota di Sumatera Utara
Menurut hasil klasifikasi awal dengan cluster hierarchical cluster analysis,
diketahui bahwa 17 kabupaten/kota di Sumatera Utara merupakan ka-
bupaten/kota dengan status tingkat kemiskinan masyarakat rendah,
sedangkan sisanya 16 kabupaten/kota merupakan kabupaten/kota de-
ngan status tingkat kemiskinan masyarakat tinggi (BPS, 2017).
Tabel 4.1 Persentase tingkat kemiskinan Kabupaten/kota di Sumatera Utara
No. Kabupaten/Kota Tingkat Kemiskinan1. Nias 17.642. Mandailing Natal 10.983. Tapanuli Selatan 11.154. Tapanuli Tengah 14.585. Tapanuli Utara 11.256. Toba Samosir 10.087. Labuhan Batu 8.958. Asahan 11.869. Simalungun 10.8110. Dairi 8.911. Karo 9.8112. Deli Serdang 4.8613. Langkat 11.3614. Nias Selatan 18.615. Humbang Hasundutan 9.7816. Pakpak Bharat 10.7217. Samosir 14.418. Serdang Bedagai 9.5319. Batu Bara 12.2420. Padang Lawas Utara 10.8721. Padang Lawas 8.6922. Labuhan Batu Selatan 11.4923. Labuhan Batu Utara 10.9724. Nias Utara 30.9225. Nias Barat 28.3626. Kota Sibolga 13.327. Kota Tanjung Balai 14.4928. Kota Pematang Siantar 9.9929. Kota Tebing Tinggi 11.730. Kota Medan 9.331. Kota Binjai 6.6732. Kota Padangsidimpuan 8.3233. Kota Gunungsitoli 23.43
29
UNIVERSITAS SUMATERA UTARA
30
4.1.1 Pendidikan yang ditamatkan tingkat SD
Berdasarkan data tingkat pendidikan yang ditamatkan tingkat Sekolah
Dasar kabupaten/kota di Sumatera Utara diketahui bahwa kabupa-
ten/kota dengan status tingkat kemiskinan rendah memiliki rata-rata
pendidikan yang ditamatkan Sekolah Dasar relatif lebih kecil yaitu
15,543. daripada rata-rata pendidikan yang ditamatkan Sekolah Dasar
dengan status tingkat kemiskinan tinggi yaitu 22,124.
4.1.2 Pendidikan yang ditamatkan tingkat SLTP
Berdasarkan data tingkat pendidikan yang ditamatkan tingkat Sekolah
Lanjutan Tingkat Pertama kabupaten/kota di Sumatera Utara dike-
tahui bahwa kabupaten/kota dengan status tingkat kemiskinan ren-
dah memiliki rata-rata pendidikan yang ditamatkan Sekolah Lanju-
tan Tingkat Pertama relatif lebih kecil yaitu 53,997 daripada rata-
rata pendidikan yang ditamatkan Sekolah Dasar dengan status tingkat
kemiskinan tinggi yaitu 54,168.
4.1.3 Pendidikan yang ditamatkan tingkat SLTA
Berdasarkan data tingkat pendidikan yang ditamatkan tingkat Seko-
lah Lanjutan Tingkat Atas kabupaten/kota di Sumatera Utara dike-
tahui bahwa kabupaten/kota dengan status tingkat kemiskinan ren-
dah memiliki rata-rata pendidikan yang ditamatkan Sekolah Lanjutan
Tingkat Atas relatif lebih tinggi yaitu 30,851 daripada rata-rata pen-
didikan yang ditamatkan Sekolah Lanjutan Tingkat Atas dengan status
tingkat kemiskinan tinggi yaitu 22,875.
4.1.4 Angka tidak bekerja atau pengangguran
Berdasarkan data tingkat kemiskinan kabupaten/kota di Sumatera
Utara diketahui bahwa dengan status tingkat kemiskinan rendah memi-
liki rata-rata angka tidak bekerja relatif lebih tinggi yaitu 44,047 dari-
pada rata-rata angka tidak bekerja dengan status tingkat kemiskinan
UNIVERSITAS SUMATERA UTARA
31
tinggi yaitu 17,573.
UNIVERSITAS SUMATERA UTARA
32
4.1.5 Angka bekerja di sektor informal
Berdasarkan data tingkat kemiskinan kabupaten/kota di Sumatera
Utara diketahui bahwa dengan status tingkat kemiskinan rendah memi-
liki rata-rata angka bekerja di sektor informal relatif lebih rendah yaitu
31,527 daripada rata-rata angka bekerja di sektor informal dengan sta-
tus tingkat kemiskinan tinggi yaitu 75,756.
4.1.6 Angka bekerja di sektor formal
Berdasarkan data tingkat kemiskinan kabupaten/kota di Sumatera
Utara diketahui bahwa dengan status tingkat kemiskinan rendah memi-
liki rata-rata angka bekerja di sektor formal relatif lebih tinggi yaitu
24,426 daripada rata-rata angka bekerja di sektor formal dengan status
tingkat kemiskinan tinggi yaitu 6,673.
4.1.7 Angka pengguna alat kontrasepsi
Berdasarkan data tingkat kemiskinan kabupaten/kota di Sumatera
Utara diketahui bahwa dengan status tingkat kemiskinan rendah memi-
liki rata-rata angka pengguna alat kontrasepsi relatif tinggi yaitu 64,954
daripada rata-rata angka pengguna alat kontrasepsi dengan status
tingkat kemiskinan tinggi yaitu 46,065.
4.1.8 Persentase balita yang telah diimunisasi
Berdasarkan data tingkat kemiskinan kabupaten/kota di Sumatera
Utara diketahui bahwa dengan status tingkat kemiskinan rendah memi-
liki rata-rata persentase balita yang telah diimunisasi relatif tinggi
yaitu 78,967 daripada rata-rata persentase balita yang telah diimu-
nisasi dengan status tingkat kemiskinan tinggi yaitu 78,384.
4.1.9 Rumah tangga pengguna air layak
Berdasarkan data tingkat kemiskinan kabupaten/kota di Sumatera
Utara diketahui bahwa dengan status tingkat kemiskinan rendah memi-
liki rata-rata rumah tangga pengguna air layak relatif tinggi yaitu
UNIVERSITAS SUMATERA UTARA
33
62,603 daripada rata-rata rumah tangga pengguna air layak dengan
status tingkat kemiskinan tinggi yaitu 40,861.
4.1.10 Rumah tangga pengguna jamban sendiri/bersama
Berdasarkan data tingkat kemiskinan kabupaten/kota di Sumatera
Utara diketahui bahwa dengan status tingkat kemiskinan rendah memi-
liki rata-rata rumah tangga pengguna jamban sendiri/bersama relatif
tinggi yaitu 87,094 daripada rata-rata rumah tangga pengguna jam-
ban sendiri/bersama dengan status tingkat kemiskinan tinggi yaitu
38,44813.
Data persentase penduduk Kabupaten/kota di Sumatera Utara
dengan 10 peubah indikator kemiskinan dapat dilihat pada tabel 2.
Tabel 4.2 Data persentase penduduk Kabupaten/kota di Sumatera Utara de-ngan 10 peubah indikator kemiskinan
Daerah X1 X2 X3 X4 X5 X6 X7 X8 X9 X10Nias 41.33 48.73 9.94 25.26 73.42 1.32 59.19 90.12 6.90 12.84Mandailing Natal 11.19 65.40 23.41 27.03 50.63 22.34 45.17 82.36 44.02 19.21Tapanuli Selatan 25.57 61.86 12.57 18.89 75.06 6.05 43.26 43.95 29.11 8.62Tapanuli Tengah 31.97 55.50 12.53 21.29 62.22 16.50 57.26 80.53 50.26 24.83Tapanuli Utara 13.59 62.90 23.51 9.27 88.04 2.69 45.67 77.75 61.77 33.32Toba Samosir 9.33 54.69 35.98 12.47 84.75 2.77 44.09 91.85 42.71 74.64Labuhan Batu 17.44 54.43 29.13 45.61 37.46 16.93 61.43 40.51 57.23 89.30Asahan 15.86 59.93 24.21 40.95 25.27 33.78 74.34 70.57 72.81 97.50Simalungun 9.87 56.33 33.80 41.23 39.53 19.24 62.92 96.99 69.49 89.00Dairi 16.96 52.08 30.96 7.71 92.29 9.67 29.58 76.70 33.81 57.64Karo 13.00 59.12 27.88 21.54 70.44 8.02 36.68 98.82 71.05 56.63Deli Serdang 7.15 52.25 40.60 52.85 24.55 22.59 75.12 93.30 78.46 4.87Langkat 10.39 70.70 18.91 50.43 23.86 25.71 77.62 94.71 44.04 86.59Nias Selatan 56.33 32.58 11.09 16.30 77.55 6.15 2.15 23.68 41.29 41.19Humbang Hasundutan 23.15 42.69 34.16 7.52 87.15 5.33 49.58 65.14 78.44 45.22Pakpak Bharat 13.54 67.81 18.65 6.92 91.84 1.25 42.83 98.00 29.26 33.72Samosir 11.80 52.82 35.37 13.64 84.32 2.04 49.35 98.71 51.03 1.89Serdang Bedagai 17.81 58.37 23.82 45.40 38.72 15.88 80.51 90.23 55.81 81.89Batu Bara 23.26 52.92 23.82 40.68 40.01 19.31 74.71 79.15 59.81 94.99Padang Lawas Utara 4.47 59.08 26.44 21.60 69.32 9.08 42.60 77.86 31.04 22.49Padang Lawas 18.39 58.82 22.78 20.55 74.57 4.89 36.09 78.92 24.18 13.43Labuhan Batu Selatan 12.67 67.24 20.10 37.65 34.35 28.01 73.43 78.45 37.89 78.94Labuhan Batu Utara 25.24 61.66 13.10 50.61 40.56 8.83 57.20 74.18 66.70 86.33Nias Utara 40.09 45.73 14.18 19.99 76.47 3.54 60.98 79.63 26.32 58.75Nias Barat 45.25 41.38 13.37 17.35 72.99 9.66 35.54 68.07 37.04 42.24Kota Sibolga 18.26 50.75 30.99 46.11 31.11 22.78 71.43 76.88 83.40 97.74Kota Tanjung Balai 17.29 56.84 25.87 51.66 14.14 34.20 67.48 49.21 79.68 87.37Kota Pematang Siantar 6.06 40.23 53.71V41.25 24.95 33.80 71.08 97.36 83.33 95.47Kota Tebing Tinggi 5.97 55.86 38.17 48.17 20.89 30.94 48.80 97.99 65.50 90.18Kota Medan 7.54 7.54 5.29 46.75 20.26 32.99 47.19 88.28 97.79 98.00Kota Binjai 6.48 43.01 50.51 43.55 26.81 29.64 75.00 73.18 61.29 98.00Kota Padangsidimpuan 12.02 48.89 39.08 48.55 20.51 30.94 50.43 73.38 13.99 72.19Kota Gunungsitoli 26.56 46.88 26.56 31.19 54.02 14.79 62.57 89.49 32.59 45.85
UNIVERSITAS SUMATERA UTARA
34
Gambar 4.1 Pengelompokan awal dengan cluster hierarchical cluster analysis
4.2 Pengujian Asumsi Analisis Diskriminan
4.2.1 Uji Normal Multivariat
Hipotesis:
H0 : Data pendidikan yang ditamatkan tingkat SD, SLTP, SLTA, angka tidak
bekerja, bekerja di sektor informal, bekerja disektor formal, pengguna alat
kontrasepsi, persentase balita yang telah diimunisasi, rumah tangga pengguna
air layak, dan rumah tangga pengguna jamban sendiri/bersama berdistribusi
normal multivariat.
H1 : Data pendidikan yang ditamatkan tingkat SD, SLTP, SLTA, angka tidak
bekerja, bekerja di sektor informal, bekerja disektor formal, pengguna alat
kontrasepsi, persentase balita yang telah diimunisasi, rumah tangga pengguna
air layak, dan rumah tangga pengguna jamban sendiri/bersama berdistribusi
tidak normal multivariat.
Taraf signifikansi (α) = 0.05 Statistik Hitung:
p-value = 0.985
Kriteria Pengujian :
H0 ditolak jika p-value = α
Keputusan :
UNIVERSITAS SUMATERA UTARA
35
H0 diterima karena p-value = 0.985
Kesimpulan :
Data pendidikan yang ditamatkan tingkat SD, SLTP, SLTA, angka
tidak bekerja, bekerja di sektor informal, bekerja disektor formal,
pengguna alat kontrasepsi, persentase balita yang telah diimunisasi,
rumah tangga pengguna air layak, dan rumah tangga pengguna jam-
ban sendiri/bersama berdistribusi normal multivariat.
Gambar 4.2 Nilai koefisien korelasi dengan menggunakan software SPSS
Gambar 4.2 memperlihatkan bahwa 10 peubah indikator kemiski-
nan dari data penduduk kabupaten/kota di Sumatera Utara memiliki
distribusi normal multivariat karena memiliki nilai koefisien korelasi =
0.985 yang lebih besar dari nilai taraf signifikansi (α) = 0.05. Koefisien
korelasi yang diperoleh menunjukkan koefisien korelasi yang sangat
tinggi. Besarnya koefisien korelasi antara -1 sampai dengan +1. Apa-
bila koefisien korelasi > rtabel atau sig. < 0.05 maka terdapat korelasi
yang signifikan. Dalam scatter plot, ini berarti data berasal dari sampel
yang terdistribusi normal.
UNIVERSITAS SUMATERA UTARA
36
Gambar 4.3 Scatter plot indikator Kemiskinan kabupaten/kota Provinsi Suma-tera Utara
4.2.2 Data uji kesamaan matriks varian kovarian
Hipotesis:
H0 : Matriks kovariansi dari kelompok status tingkat kemiskinan tinggi dan
kelompok status tingkat kemiskinan rendah adalah sama.
H1 : Matriks kovariansi dari kelompok status tingkat kemiskinan tinggi dan
kelompok status tingkat kemiskinan rendah adalah berbeda.
Taraf signifikansi (α) = 0.05
Statistik hitung:
MC−1 = 0.08
Sig. = 0.00
Kriteria pengujian :
H0 ditolak jika Sig. ≤ α
Keputusan :
H1diterima karena Sig. = 0.00 ≤ α = 0.05
Kesimpulan :
matriks kovariansi dari kelompok status tingkat kemiskinan tinggi dan
kelompok status tingkat kemiskinan rendah adalah berbeda.UNIVERSITAS SUMATERA UTARA
37
Gambar 4.4 Uji F dalam analisis regresi
Interpretasi output SPSS
Berdasarkan hasil output SPSS di atas, dapat dilihat bahwa nilai F hi-
tung lebih besar dari pada nilai F tabel (7.213 > 2.45) dengan tingkat
signifikan di bawah 0.05 yaitu 0.001. Berdasarkan cara pengambi-
lan keputusan uji simultan dalam analisis regresi disimpulkan bahwa
X1 (pendidikan yang ditamatkan tingkat SD), X2 (pendidikan yang
ditamatkan tingkat SLTP), X3 (pendidikan yang ditamatkan tingkat
SLTA), X4 (angka tidak bekerja), X5 (bekerja di sektor informal), X6
(bekerja disektor formal), X7 (pengguna alat kontrasepsi), X8 (persen-
tase balita yang telah diimunisasi), X9(rumah tangga pengguna air
layak), dan X10 (rumah tangga pengguna jamban sendiri/bersama) ji-
ka diuji secara bersama-sama berpengaruh signifikan terhadap tingkat
kemiskinan di Provinsi Sumatera Utara.
4.2.3 Data pencilan (outlier)
Dalam statistik, outlier atau pencilan adalah sebuah datum yang meny-
impang sangat jauh dari datum lainnya di dalam satu sampel atau
kumpulan datum (kumpulan datum disebut data). Seringkali, pen-
cilan di dalam satu kumpulan datum dapat menjadi peringatan bagi
ahli statistik akan adanya ketidaknormalan atau kesalahan eksperimen
pada pengukuran yang diambil, yang dapat membuat ahli statistik
membuang pencilan tersebut dari kumpulan datum. Jika ahli statistik
membuang pencilan dari kumpulan datum, kesimpulan yang diambil
UNIVERSITAS SUMATERA UTARA
38
dari penelitian dapat menjadi sangat berbeda.
UNIVERSITAS SUMATERA UTARA
39
Oleh karena itu, mengetahui cara menghitung dan menangalisis
pencilan sangat penting untuk memastikan pengertian yang benar dari
sebuah kumpulan datum statistik.
4.2.4 Pemilihan ariabel bebas
Pemilihan variabel bebas dilakukan dengan melakukan uji t yang reka-
pitulasinya disajikan pada tabel 4.2 sebagai berikut:
Tabel 4.3 Uji F dalam analisis regresi
Berdasarkan hasil pemilihan variabel bebas, maka variabel bebas
yang berpengaruh dalam menentukan status tingkat kemiskinan kabu-
paten/kota di Sumatera Utara ialah variabel X1 (pendidikan yang dita-
matkan tingkat SD), X2 (pendidikan yang ditamatkan tingkat SLTP),
X3 (pendidikan yang ditamatkan tingkat SLTA), X4 (angka tidak bek-
erja), X6 (bekerja disektor formal, X7 (pengguna alat kontrasepsi), X8
(persentase balita yang telah diimunisasi), X9 (rumah tangga penggu-
na air layak), dan X10 (rumah tangga pengguna jamban sendiri/bersama).
Oleh karena itu, variabel yang akan disertakan dalam fungsi diskrimi-
nan ialah variabel X1, X2, X3, X4, X6, X7, X8, X9, dan X10.
4.2.5 Analisis diskriminan linier klasik
Penaksiran parameter fungsi diskriminan pada analisis diskriminan
UNIVERSITAS SUMATERA UTARA
40
linier klasik dilakukan dengan mencari x̄ dan S yang merupakan vektor
rata-rata dan matriks kovariansi dari data. Berdasarkan perhitungan
dengan menggunakan data yang sudah distandarkan, diperoleh hasil
vektor rata-rata dan matriks kovariansi sebagai berikut:
Z̄1 =
15, 54353, 99730, 85144, 04724, 42564, 95478, 96762, 60387, 094
Z̄2 =
22, 12354, 16822, 87517, 5736, 67346, 06578, 38440, 86138, 448
Tabel 4.4 Matriks kovariansi dari grup I (S1)
0.010 -0.041 0.000 2.253 -0.003 -0.003 -0.003 -0.036 -0.041-0.041 15.247 0.225 0.372 0.059 0.203 -2.120 15.750 15.2860.000 0.225 0.005 0.007 0.001 0.004 0.000 0.236 0.2262.253 0.372 0.007 0.018 0.002 0.008 0.000 0.394 0.374-0.003 0.059 0.001 0.002 0.003 0.002 0.001 0.062 0.061-0.003 0.203 0.004 0.008 0.002 0.014 -6.096 0.220 0.207-0.003 -2.120 0.000 0.000 0.001 -6.096 0.002 -0.003 0.000-0.036 15.750 0.236 0.394 0.062 0.220 -.003 16.296 15.797-0.041 15.286 0.226 0.374 0.061 0.207 0.000 15.797 15.331
Tabel 4.5 Matriks kovariansi dari grup II (S2)
0.004 0.001 -0.017 0.000 0.000 -0.002 0.003 -0.019 -0.0110.001 0.011 0.023 -0.003 0.000 -0.004 0.000 0.028 0.030-0.017 0.023 17.657 0.560 0.025 0.115 -0.410 17.346 17.5110.000 -0.003 0.560 0.067 -0.007 0.009 -0.048 0.547 0.5430.000 0.000 0.025 -0.007 0.004 0.000 0.006 0.022 0.025-0.002 -0.004 0.115 0.009 0.000 0.006 -0.008 0.109 0.1060.003 0.000 -0.410 -0.048 0.006 -0.008 0.050 -0.400 -0.394-0.019 0.028 17.346 0.547 0.022 0.109 -0.400 17.059 17.204-0.011 0.030 17.511 0.543 0.025 0.106 -0.394 17.204 17.388
Tabel 4.6 Matriks kovariansi gabungan grup I dan grup II (S)
0,00710 -0,02068 -0,00823 1,16284 -0,00155 -0,00252 -0,00010 -0,02777 -0,02648-0,02068 7,87474 0,12726 0,19055 0,03045 0,10284 -1,09419 8,14258 7,90406-0,00823 0,12726 8,54629 0,27458 0,01261 0,05771 -0,19839 8,51503 8,589711,16284 0,19055 0,27458 0,04171 -0,00235 0,00848 -0,02323 0,46803 0,45577-0,00155 0,03045 0,01261 -0,00235 0,00348 0,00103 0,00342 0,04265 0,04358-0,00252 0,10284 0,05771 0,00848 0,00103 0,01013 -3,15019 0,16629 0,15813-0,00010 -1,09419 -0,19839 -0,02323 0,00342 -3,15019 0,02523 -0,19510 -0,19065-0,02777 8,14258 8,51503 0,46803 0,04265 0,16629 -0,19510 16,66519 16,47781-0,02648 7,90406 8,58971 0,45577 0,04358 0,15813 -0,19065 16,47781 16,32632
UNIVERSITAS SUMATERA UTARA
41
Tabel 4.7 Matriks invers kovariansi gabungan grup I dan grup II (S)
-0,01700 0,01193 -0,00266 0,86036 0,76920 -0,00744 0,00087 -0,23840 0,210220,01193 96,65082 95,50730 0,11776 19,31475 -33,6860 -0,11417 -28,12754 -68,38186-0,00266 95,50730 94,68444 0,11813 20,59372 -33,2963 -0,11197 -26,36089 -69,185560,86036 0,11776 0,11813 -0,00453 0,42204 -0,04073 -0,00059 0,01615 -0,134680,76920 19,31475 20,59372 0,42204 313,44673 -6,41012 0,06547 13,02384 -34,11482-0,00744 -33,68600 -33,29636 -0,04073 -6,41012 11,73909 -0,27781 9,75143 23,885880,00087 -0,11417 -0,11197 -0,00059 0,06547 -0,27781 -0,00058 0,10213 0,01363-0,23840 -28,12754 -26,36089 0,01615 13,02384 9,75143 0,10213 44,31046 -17,363910,21022 -68,38186 -69,18556 -0,13468 -34,11482 23,88588 0,01363 -17,36391 86,95631
Kemudian fungsi diskriminan linier klasik ditunjukkan sebagai berikut:
Y = 41,13131X1 - 4810,25X2 - 4771,78X3 - 5,94152X4 - 2080106X6 +
1683,34X7 - 13,0409X8 + 714,8802X9 + 4093,957X10 Kebaikan mod-
el diskriminan linier dapat dilihat dari ketepatan klasifikasi masing-
masing kelompok yang dapat dilihat pada Tabel 4.8.
Tabel 4.8 Hasil Klasifikasi model diskriminan linier robust untuk 33 data
Pengelompokan MenurutPengelompokan Fungsi Diskriminan Jumlah
Awal Kelompok I Kelompok II
Kelompok I 14 3 17
Kelompok II 4 12 16
Jumlah 18 15 33
Tabel 4.8 menjelaskan bahwa banyak objek yang diklasifikasikan secara
tepat untuk model diskriminan linier pada data 33 kabupaten/kota
adalah sebanyak 26 objek dan banyak objek yang salah klasifikasi se-
banyak 7 objek. Berdasarkan nilai APER, diketahui total proporsi
kesalahan analisis diskriminan linier klasik yaitu sebesar 21,2% sehing-
ga ketepatan pengklasifikasian analisis diskriminan linier klasik yaitu
sebesar 78,8%.
4.3 Analisis Diskriminan Linier Robust
Penaksiran parameter fungsi diskriminan pada analisis diskriminan
linier robust dilakukan dengan mengganti x̄ dan S dengan x̄MCD dan
SMCD yang merupakan vektor rata-rata dan matriks kovariansi dengan
metode fast-MCD. Berdasarkan perhitungan dengan menggunakan dataUNIVERSITAS SUMATERA UTARA
42
yang sudah distandarkan. diperoleh hasil vekror rata-rata dan matriks
kovariansi sebagai berikut:
UNIVERSITAS SUMATERA UTARA
43
Z̄1 =
9, 30810, 4627, 9239, 5388, 07710, 2319, 7699, 9239, 769
Z̄2 =
9, 0778, 6928, 7699, 2318, 2318, 7698, 4628, 1548, 538
Tabel 4.9 Matriks robust estimate of covariance dari grup I (S1)
701.46 -439.19 444.44 70.08 -83.87 -270.80 198.26 278.02 279.34-439.19 536.02 -444.93 -15.43 63.02 90.92 15.76 -291.32 -445.10444.44 -444.93 505.50 54.49 -44.64 -112.59 72.05 260.13 370.7570.08 -15.43 54.49 672.57 199.41 -107.99 37.58 216.64 -54.16-83.87 63.02 -44.64 199.41 467.09 -299.19 -274.74 162.32 47.43-270.80 90.92 -112.59 -107.99 -299.19 619.40 -43.33 -289.68 -86.00198.26 15.76 72.05 37.58 -274.74 -43.33 516.98 -126.37 -101.76278.02 -291.32 260.13 216.64 162.32 -289.68 -126.37 509.76 328.08279.34 -445.10 370.75 -54.16 47.43 -86.00 -101.76 328.08 546.85
Tabel 4.10 Matriks robust estimate of covariance dari grup II (S2)
-412.571 276.621 -87.268 260.828 106.318 -298.927 -11.723 42.657 -87.757276.621 -505.375 213.612 4.396 -73.918 298.276 -80.105 79.128 54.706-87.268 213.612 -529.797 -103.061 68.382 7.815 -119.343 -322.698 19.863260.828 4.396 -103.061 -538.264 240.639 4.884 93.944 -227.614 183.329106.318 -73.918 68.382 240.639 -639.860 131.879 134.159 5.210 -83.361-298.927 298.276 7.815 4.884 131.879 -614.461 -60.078 -138.555 32.563-11.723 -80.105 -119.343 93.944 134.159 -60.078 -506.352 -108.109 47.05342.657 79.128 -322.698 -227.614 5.210 -138.555 -108.109 -685.122 86.943-87.757 54.706 19.863 183.329 -83.361 32.563 47.053 86.943 -591.016
Tabel 4.11 Matriks robust estimate of covariance gabungan grup I dan grup II(S2)
162,413 -92,830 187,162 162,377 8,156 -284,410 96,655 164,135 101,712-92,830 32,119 -126,281 -5,837 -3,240 191,254 -30,626 -112,071 -203,258187,162 -126,281 4,550 -21,744 10,048 -54,330 -20,560 -21,884 200,966162,377 -5,837 -21,744 86,683 219,360 -53,374 64,853 1,678 60,7548,156 -3,240 10,048 219,360 -68,531 -90,608 -76,886 86,299 -15,856
-284,410 191,254 -54,330 -53,374 -90,608 22,370 -51,434 -216,555 -28,63196,655 -30,626 -20,560 64,853 -76,886 -51,434 21,819 -117,534 -29,754164,135 -112,071 -21,884 1,678 86,299 -216,555 -117,534 -68,409 211,401101,712 -203,258 200,966 60,754 -15,856 -28,631 -29,754 211,401 -3,730
UNIVERSITAS SUMATERA UTARA
44
Tabel 4.12 Matriks invers robust estimate of covariance (S)
-0,01200 -0,01462 -0,00862 0,00352 0,00099 -0,00418 0,01190 0,00012 0,00261-0,01462 -0,01985 -0,01155 0,00522 0,00250 -0,00228 0,01150 -0,00103 0,00229-0,00862 -0,01155 -0,00579 0,00578 0,00080 0,00346 0,00874 -0,00133 0,008230,00352 0,00522 0,00578 0,00210 0,00334 0,00318 -0,00263 -0,00245 0,000260,00099 0,00250 -0,00080 0,00334 -0,00126 0,00146 -0,00283 0,00146 0,00136-0,00418 -0,00228 0,00346 0,00318 0,00146 0,00162 0,00107 -0,00386 0,002780,01190 0,01150 0,00874 -0,00263 -0,00283 0,00107 -0,00709 -0,00337 -0,005000,00012 -0,00103 -0,00133 -0,00245 0,00146 -0,00386 -0,00337 -0,00002 -0,002460,00261 0,00229 0,00823 0,00026 0,00136 0,00278 -0,00500 -0,00246 -0,00125
Kemudian fungsi diskriminan linier robust ditunjukkan sebagai berikut:
Y = -0,02655X1 - 0,01483X2 + 0,00864X3 + 0,0025X4 - 0,00924X6 -
0,00683X7 - 0,00448X8 - 0,01477X9 - 0,01078X10
Kebaikan model diskriminan linier robust dapat dilihat dari ketepatan
klasifikasi masing-masing kelompok yang dapat dilihat pada Tabel
4.13.
Tabel 4.13 Hasil Klasifikasi model diskriminan linier robust untuk 33 data
Pengelompokan MenurutPengelompokan Fungsi Diskriminan Jumlah
Awal Kelompok I Kelompok II
Kelompok I 16 1 17
Kelompok II 1 15 16
Jumlah 17 16 33
Tabel 4.13 menjelaskan bahwa banyak objek yang diklasifikasikan se-
cara tepat untuk model diskriminan linier pada data 33 kabupaten/kota
adalah sebanyak 31 objek dan banyak objek yang salah klasifikasi se-
banyak 2 objek. Berdasarkan nilai APER, diketahui total proporsi
kesalahan analisis diskriminan linier klasik yaitu sebesar 6% sehing-
ga ketepatan pengklasifikasian analisis diskriminan linier klasik yaitu
sebesar 94%.
UNIVERSITAS SUMATERA UTARA
45
4.4 Perbandingan Hasil Analisis Diskriminan Linier Klasik dan Ana-lisis Diskriminan Linier Robust
Berdasarkan hasil perhitungan, diperoleh total proporsi salah pengk-
lasifikasian analisis diskriminan linier klasik sebesar 21,2% berbeda
dengan analisis diskriminan linier robust yaitu sebesar 6%. Hal ini
terjadi karena jumlah pencilan yang terlalu besar pada data tingkat
kemiskinan kabupaten/kota di Sumatera Utara.
UNIVERSITAS SUMATERA UTARA
BAB 5
KESIMPULAN DAN SARAN
5.1 Kesimpulan
1. Pengklasifikasian pada data tingkat kemiskinan masyarakat kabu-
paten/kota di Sumatera Utara dengan fungsi diskriminan linier
klasik dua kelompok:
Y = 41,13131X1 - 4810,25X2 - 4771,78X3 - 5,94152X4 - 2080106X6
+ 1683,34X7 - 13,0409X8 + 714,8802X9 + 4093,957X10
menghasilkan total proporsi kesalahan pengklasifikasian sebesar
21,2 %.
2. Pengklasifikasian pada data tingkat kemiskinan masyarakat kabu-
paten/kota di Sumatera Utara dengan fungsi diskriminan linier
robust dua kelompok:
Y = -0,02655X1 - 0,01483X2 + 0,00864X3 + 0,0025X4 - 0,00924X6
- 0,00683X7 - 0,00448X8 - 0,01477X9 - 0,01078X10 menghasilkan
total proporsi kesalahan pengklasifikasian sebesar 6 %.
3. Model diskriminan linier robust mengklasifikasikan objek lebih
tepat dari model diskriminan linier klasik. Hal ini dapat dilihat
dari total proporsi kesalahan pengklasifikasian sebesar 6 persen,
lebih kecil dari total proporsi kesalahan pengklasifikasian model
diskriminan linier klasik yaitu sebesar 21,2 persen. Hal ini terjadi
karena jumlah pencilan yang besar pada data tingkat kemiskinan
kabupaten/kota di Sumtera Utara.
5.2 Saran
1. Analisis diskriminan linier yang digunakan pada penelitian ini
masih terbatas pada dua kelompok saja sehingga perlu dilakukan
penelitian untuk analisis diskriminan lebih dari dua kelompok.
46
UNIVERSITAS SUMATERA UTARA
47
2. Analisis diskriminan linier robust pada penelitian ini hanya meng-
gunakan metode fast-MCD sehingga memungkinkan penelitian
selanjutnya untuk menggunakan penaksir robust yang lain.
UNIVERSITAS SUMATERA UTARA
DAFTAR PUSTAKA
Charnes., Cooper E., dan Rhodes (1978). Measuring the Efficiency ofDecision Making Units. EJOR. 2, 429-444.
Dia, M. (2009). A Portfolio Selection Methodology Based on DataEnvelopment Analysi. INFOR:Information Systems and Opera-tional Research. 47, 71- 79.
Dillon, W.R., dan Goldstein, M. (1984). Multivariate Analysis: Meth-ods and Applications. Newyork.
Elton, J.E. dan Gruber, M.J (1995). Modern Portfolio Theory AndInvestment Analysis 5th Edition. John Wiley and Sons.
Fischer, E.D. dan Ronald, J.J (1995). Security Analysis And portofo-lio Management 6th Edition. Prentice Hall Inc.
Jemric, I. dan Vujcic, B. (2002). Efficiency of Bank in Croatia. A DEAApproach Comparative Economin Studies. XLIV, 2, 169-193.
Ke, J., Qiao, J., dan Wang, G.(2008). Emperical Analysis of PortfolioOptimization Based on DEA model. International Seminar onFuture Information Technology and Management Engineering.pp. 490-493.
Ling., Oang, P., dan Kamil, A.A (2010). Data Envelopment Analy-sis (DEA) for Stocks Selection on Bursa Malaysia. School ofDistance Education 11800 USM, Penang, Malaysia.
Marcus, V.A., Marcelo, L.C., Aline, B.S., dan Ana, L.M. (2010). Opti-mization of Selected Portfolios Using Data Envelopment Analysis.Proceedings of The 8th International Conference of DEA.
Markowitz, H.M. (1952) . Portfolio Selection. Journal of Finance.Vol.7 (1). p.77-91.
Moehering, A. (2013). Markowitz Portfolio Optimization with MatrixAlgebra. Linear Algebra Term Paper. Spring.
Ogryczak, W.(2000). Multiple criteria linear programming model forportfolio selection. Annals of Operations Research. 97, 143-162.
Reilly, F.K., dan Brown, K.C. (2000). Investment Analysis and Port-folio Management (6th Edition). USA: Harcourt, Inc.
Saaty, T. L., Rogers, P. C., dan Pell, R. (1980). Portfolio selectionthrough hierarchies. The Journal of Portfolio Management. 6,16-21.
Tiryaki, F., dan Ahlatcioglu, M. (2005). Fuzzy stock selection using anew fuzzy ranking and weighting algorithm. Applied Mathematicsand Computation. 170, 144-157.
Tola, V., Lillo, F., Gallegati, M., dan Mantegna, R.N. (2005). ClusterAnalysis for Portofolio Optimization. Physics.soc-ph.
48
UNIVERSITAS SUMATERA UTARA
49
Zhang, W. G. dan Nie, Z. K.(2004). On admissible efficient portfolioselection problem. Applied Mathematics and Computation. 159,357-371.
UNIVERSITAS SUMATERA UTARA