pengklasifikasian objek dengan analisis diskriminan …

PENGKLASIFIKASIAN OBJEK DENGAN ANALISIS

DISKRIMINAN LINIER KLASIK DAN ANALISIS

DISKRIMINAN LINIER ROBUST

TESIS

Oleh

JUSTIN EDUARDO SIMARMATA

167021014/MT

PROGRAM STUDI MAGISTER MATEMATIKAFAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

UNIVERSITAS SUMATERA UTARAMEDAN

2018

UNIVERSITAS SUMATERA UTARA

PENGKLASIFIKASIAN OBJEK DENGAN ANALISIS

DISKRIMINAN LINIER KLASIK DAN ANALISIS


T E S I S

Diajukan Sebagai Salah Satu Syaratuntuk Memperoleh Gelar Magister Sains dalam

Program Studi Magister Matematika padaFakultas Matematika dan Ilmu Pengetahuan Alam

Universitas Sumatera Utara

Oleh

JUSTIN EDUARDO SIMARMATA

167021014/MT

PROGRAM STUDI MAGISTER MATEMATIKAFAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

UNIVERSITAS SUMATERA UTARAMEDAN

2018


Telah diuji padaTanggal : 16 April 2018

PANITIA PENGUJI TESIS

Ketua : Dr. Sutarman, M.Sc

Anggota : 1. Dr. Mardiningsih, M.Si

2. Dr. Sawaluddin, M.IT

3. Dr. Syahril Efendi, M.IT


PERNYATAAN ORISINALITAS

PENGKLASIFIKASIAN OBJEK DENGAN ANALISISDISKRIMINAN LINIER KLASIK DAN ANALISIS


TESIS

Saya mengakui bahwa tesis ini adalah hasil karya sendiri, kecualibeberapa kutipan dan ringkasan yang masing-masing dituliskan sum-bernya

Medan,Penulis,

Justin Eduardo Simarmata


PERNYATAAN PERSETUJUAN PUBLIKASI KARYA ILMIAHUNTUK KEPENTINGAN AKADEMIS

Sebagai sivitas akademika Universitas Sumatera Utara, Saya yangbertanda tangan di bawah ini:

Nama : Justin Eduardo SimarmataNIM : 167021001Program Studi : MatematikaJenis Karya Ilmiah: Tesis

Demi pengembangan ilmu pengetahuan, menyetujui untuk memberikankepada Universitas Sumatera Utara Hak Bebas Royalti Non-Eksklusif(Non-Exclusive Royalty Free Right) atas tesis saya yang berjudul:

Pengklasifikasian Objek dengan Analisis Diskriminan Linier Klasikdan Analisis Diskriminan Linier Robust. PENGKLASIFIKASIANOBJEK DENGAN ANALISIS DISKRIMINAN LINIER KLASIK DANANALISIS DISKRIMINAN LINIER ROBUST Beserta perangkat yangada. Dengan Hak Bebas Royalti NonEksklusif ini, Universitas Suma-tera Utara berhak menyimpan, mengalih media, memformat mengelo-la dalam bentuk data-base, merawat dan mempublikasikan Tesis sayatanpa meminta izin dari saya selama mencantumkan nama saya seba-gai pemegang dan atau sebagai penulis dan sebagai pemilik hak cipta.

Demikian pernyataan ini dibuat dengan sebenarnya.

Medan,Penulis,



PENGKLASIFIKASIAN OBJEK DENGAN ANALISISDISKRIMINAN LINIER KLASIK DAN ANALISIS


ABSTRAK

Analisis diskriminan merupakan salah satu dari analisis multi-variat dengan metode dependensi. Analisis diskriminan merupakananalisis multivariat yang bertujuan untuk mengklasifikasi amatan ber-dasarkan beberapa variabel independen yang bersifat non kategorikdan variabel dependen yang bersifat kategorik. Analisis diskriminanmemerlukan asumsi sebaran normal multivariat dan kehomogenan ma-triks varians-kovarians. Analisis diskriminan linier klasik dan analisisdiskriminan linier robust dapat diaplikasikan untuk mengklasifikasikanobjek. Klasifikasi didasarkan pada 10 indikator tingkat kemiskinanKabupaten/kota di provinsi Sumatera Utara, 10 indikator tersebutsebagai variabel independen dan tingkat klasifikasi kemiskinan rendahdan kemiskinan tinggi sebagai variabel dependen. Model diskriminanlinier robust mengklasifikasikan objek lebih tepat dari model diskrimi-nan linier klasik. Hal ini dapat dilihat dari total proporsi kesalahanpengklasifikasian sebesar 6%, lebih kecil dari total proporsi kesalahanpengklasifikasian model diskriminan linier klasik yaitu sebesar 21,2%.Hal ini terjadi karena jumlah pencilan yang besar pada data tingkatkemiskinan kabupaten/kota di Sumtera Utara.

Kata kunci : Analisis multivariat, Analisis diskriminan linier klasik,Robust.

i


OBJECT CLASSIFICATION WITH CLASSICAL LINEARDISCRIMINANT ANALYSIS AND ROBUST LINEAR

DISCRIMINANT ANALYSIS

ABSTRACT

Discriminant analysis is one of multivariate analysis with de-pendency method. Discriminant analysis is a multivariate analysisthat aims to classify observations based on several independent vari-ables that are non-categorical and categorical dependent variables.Discriminant analysis requires the assumption of the normal multi-variate distribution and the homogeneity of the variance-covariancematrix. Classical linear discriminant analysis and linear robust dis-criminant analysis can be applied to classify objects. The classifica-tion is based on 10 indicators of district/city poverty level in NorthSumatra province, 10 indicators are as independent variable and lowpoverty classification and high poverty classification as dependentvariable. The linear robust discriminant model classifies the objectmore precisely than the classic linear discriminant model. This canbe seen from the total proportion of classification mistakes of 6%,less than the total proportion of classical linear discriminant classi-fier error classification of 21.2%. This is due to the large number ofoutlays in the district/city poverty data in North Sumatra.

Keyword : Multivariate analysis, The classical linear discriminant analysis, Robust.

ii


KATA PENGANTAR

Puji dan syukur penulis panjatkan kepada Tuhan Yang Maha Esa dan

Maha Penyayang, dengan limpahan karunia-Nya penulis dapat menye-

lesaikan penyusunan tesis dengan judul PENGKLASIFIKASIAN OB-

JEK DENGAN ANALISIS DISKRIMINAN LINIER DAN ANALI-

SIS DISKRIMINAN ROBUST. Tesis ini merupakan salah satu syarat

untuk menyelesaikan studi pada Program Studi Magister Matematika

Fakultas Matematika dan Ilmu Pengetahuan Alam (FMIPA) Univer-

sitas Sumatera Utara.

Pada kesempatan ini, penulis ingin menyampaikan terima kasih kepa-

da:

Ayahanda (Almarhum) Jidun Simarmata dan Ibunda Nursatia Lubis,

sosok orang tua yang mencurahkan seluruh kasih sayang dan dukun-

gan kepada penulis. Orang tua penulis kagumi dan cintai, yang telah

memberi tauladan, membimbing, mengajarkan kesabaran, kerenda-

han hati dan selalu bersyukur dalam menghadapi kehidupan ini, serta

senantiasa memanjatkan doa yang tulus dan ikhlas bagi keberhasilan

anak-anaknya.

Bapak Prof. Dr. Runtung Sitepu, S.H., M.Hum., selaku Rektor Uni-

versitas Sumatera Utara yang telah memberikan kesempatan penulis

untuk menempuh pendidikan di Universitas Sumatera Utara.

Bapak Dr. Kerista Sebayang, M.S., selaku Dekan Fakultas Mate-

matika dan Ilmu Pengetahuan Alam (FMIPA) Universitas Sumatera

Utara.

Bapak Prof. Dr. Herman Mawengkang, selaku Ketua Program Stu-

di Magister Matematika Fakultas Matematika dan Ilmu Pengetahuan

Alam (FMIPA) Universitas Sumatera Utara.

Bapak Prof. Dr. Saib Suwilo, M.Sc., selaku Sekretaris Program Stu-

iii


di Magister Matematika Fakultas Matematika dan Ilmu Pengetahuan

Alam (FMIPA) Universitas Sumatera Utara.

iv


Bapak Dr. Sutarman, M.Sc., selaku Pembimbing Pertama tesis ini

yang telah banyak memberikan bimbingan dan arahan serta motivasi

kepada penulis sehingga tesis ini dapat diselesaikan dengan baik.

Ibu Dr. Mardiningsih, M.Si., selaku Pembimbing Kedua tesis ini yang

telah banyak memberikan bimbingan dan arahan serta motivasi kepada

penulis sehingga tesis ini dapat diselesaikan dengan baik.

Bapak Dr. Sawaluddin, M.IT., selaku Penguji tesis ini yang telah ba-

nyak memberikan bimbingan dan arahan serta motivasi kepada penulis

sehingga tesis ini dapat diselesaikan dengan baik.

Bapak Dr. Syahriel Efendi, M.IT., selaku Penguji tesis ini yang telah

banyak memberikan bimbingan dan arahan serta motivasi kepada penulis

sehingga tesis ini dapat diselesaikan dengan baik.

Seluruh Staf Pengajar pada Program Studi Magister Matematika Fakul-

tas Matematika dan Ilmu Pengetahuan Alam (FMIPA) Universitas

Sumatera Utara yang telah banyak memberikan ilmu pengetahuan se-

lama masa perkuliahan.

Ibu Misiani, S.Si., selaku Staf Administrasi Program Studi Magis-

ter Matematika Fakultas Matematika dan Ilmu Pengetahuan Alam

(FMIPA) Universitas Sumatera Utara yang telah banyak memberikan

pelayanan yang baik kepada penulis selama mengikuti perkuliahan.

Adikku yang ganteng, Hendri Jonathan Simarmata, S.Pd., abangku

yang ganteng juga, Martogi Parlindungan Simarmata, Antonius Simar-

mata, S.E., Erwin Pahala Simarmata, S.Kom., serta kakak-kakakku,

Ferawati Imelda Simarmata, Julita V Simarmata, Lasmaria Simar-

mata, S.E., dan Lusiana Simarmata yang memberikan semangat dan

bantuan moril kepada penulis.

Seluruh rekan-rekan Mahasiswa Program Studi Magister Mate-

matika Fakultas MIPA Universitas Sumatera Utara tahun 2016, atas

v


kerjasama dan hubungan yang baik selama perkuliahan, semoga per-

sahabatan yang kita jalin abadi dan dorongan kepada penulis dalam

penulisan tesis ini.

Semua pihak yang telah banyak membantu, baik langsung maupun

tidak langsung yang tidak dapat penulis sebutkan namanya satu per

satu, hanya Tuhan Yang Maha Esa yang mampu memberikan balasan

terbaik. Mudah-mudahan tesis ini dapat memberi sumbangan yang

berharga bagi perkembangan dunia ilmu dan bermanfaat bagi banyak

orang. Semoga Tuhan Yang Maha Esa senantiasa memberi rahmat-

NYA kepada kita semua. Amin.

Penulis menyadari bahwa tesis ini masih jauh dari sempurna, un-

tuk itu penulis mengharapkan kritik saran untuk penyempurnaan tesis

ini. Semoga tesis ini dapat bermanfaat bagi pembaca dan pihak-pihak

yang memerlukannya. Terima kasih.

Medan, 16 April 2018

Penulis,


vi


RIWAYAT HIDUP

Justin Eduardo Simarmata dilahirkan di Sawah Lamo pada tanggal 5

Juli 1991 dari pasangan Bapak Almarhum Jidun Simarmata dan Ibu

Nursatia Lubis. Penulis menamatkan pendidikan Sekolah Dasar di SD

Negeri 155704 Ujung Batu, Kecamatan Barus, Kabupaten Tapanuli

Tengah, Sumatera Utara, pada tahun 2003, setelah itu melanjutkan

pendidikan ke SMP Swasta Santo Thomas 3 Medan dan lulus pada

tahun 2006 kemudian melanjutkan pendidikan ke SMA Swasta San-

to Thomas 3 Medan dan lulus pada tahun 2009. Kemudian di tahun

2011 penulis memasuki perguruan tinggi negeri, Universitas Sumatera

Utara (USU) Fakultas Matematika dan Ilmu Pengetahuan Alam Pro-

gram Studi Matematika dan lulus Strata Satu (S-1) tahun 2015. Pada

tahun 2015 sampai sekarang penulis bekerja di Yayasan Pendidikan

Nasional Marisi Medan dan Lembaga Bimbingan Belajar Sony Sug-

ema College (SSC) Medan. Pada tahun 2016, penulis melanjutkan

pendidikan pada Program Studi Magister Matematika Universitas Su-

matera Utara.

vi


DAFTAR ISI

Halaman

ABSTRAK i

ABSTRACT ii

KATA PENGANTAR iii

RIWAYAT HIDUP vi

DAFTAR ISI vii

DAFTAR TABEL x

DAFTAR GAMBAR xi

BAB 1 PENDAHULUAN 1

1.1 Latar Belakang 1

1.2 Perumusan Masalah 5

1.3 Tujuan Penelitian 6

1.4 Manfaat Penelitian 6

BAB 2 TINJAUAN PUSTAKA 7

2.1 Analisis Multivariat 7

2.2 Teknik-teknik Analisis Multivariat 7

2.2.1 Analisis multivariat dengan menggunakanmetode dependensi 8

2.3 Analisis Multivariat dengan Menggunakan MetodeInterdependensi 8

2.4 Software-software yang Tersedia untuk Analisis Mul-tivariat 8

2.5 Analisis Diskriminan 10

2.6 Metode Penaksir Minimum Covariance Determinant(MCD) 10

2.7 Pengujian Perbedaan Vektor Rataan 11

vii


2.8 Pengujian Asumsi Analisis Diskriminan 11

2.8.1 Distribusi normal multivariat 12

2.8.2 Pendeteksian pencilan 12

2.9 Metode Robust 13

2.10 Apparent Error Rate (APER) 13

2.11 Kemiskinan 14

2.12 Indikator Kemiskinan 15

BAB 3 METODOLOGI PENELITIAN 17


3.1.1 Uji normal multivariat 18

3.1.2 Uji kesamaan matriks varians lovarians 18

3.1.3 Uji vektor nilai rataan (uji kesamaan rata-rata kelompok) 19

3.2 Fungsi Analisis Diskriminan 21

3.3 Ketepatan Pengelompokkan Fungsi Diskriminan 26

3.4 Langkah-langkah Analisis 27

BAB 4 HASIL DAN PEMBAHASAN 29

4.1 Data Tingkat Kemiskinan Kabupaten/Kota di Suma-tera Utara 29

4.1.1 Pendidikan yang ditamatkan tingkat SD 30

4.1.2 Pendidikan yang ditamatkan tingkat SLTP 30

4.1.3 Pendidikan yang ditamatkan tingkat SLTA 30

4.1.4 Angka tidak bekerja atau pengangguran 30

4.1.5 Angka bekerja di sektor informal 32

4.1.6 Angka bekerja di sektor formal 32

4.1.7 Angka pengguna alat kontrasepsi 32

4.1.8 Persentase balita yang telah diimunisasi 32

viii


4.1.9 Rumah tangga pengguna air layak 32

4.1.10 Rumah tangga pengguna jamban sendiri/bersama 33


4.2.1 Uji Normal Multivariat 34

4.2.2 Data uji kesamaan matriks varian kovarian 36

4.2.3 Data pencilan (outlier) 37

4.2.4 Pemilihan ariabel bebas 39

4.2.5 Analisis diskriminan linier klasik 39

4.3 Analisis Diskriminan Linier Robust 41

4.4 Perbandingan Hasil Analisis Diskriminan Linier Klasikdan Analisis Diskriminan Linier Robust 45

BAB 5 KESIMPULAN DAN SARAN 46

5.1 Kesimpulan 46

5.2 Saran 46

DAFTAR PUSTAKA 48

ix


DAFTAR TABEL

Nomor Judul Halaman

3.1 Matriks data pengamatan 21

3.2 Matriks data pengamatan dari grup I 24

3.3 Matriks data pengamatan dari grup II 24

3.4 Hasil Klasifikasi model diskriminan linier robust untuk 33data 27

4.1 Persentase tingkat kemiskinan Kabupaten/kota di Sumate-ra Utara 29

4.2 Data persentase penduduk Kabupaten/kota di SumateraUtara dengan 10 peubah indikator kemiskinan 33

4.3 Uji F dalam analisis regresi 39

4.4 Matriks kovariansi dari grup I (S1) 40

4.5 Matriks kovariansi dari grup II (S2) 40

4.6 Matriks kovariansi gabungan grup I dan grup II (S) 40

4.7 Matriks invers kovariansi gabungan grup I dan grup II (S) 41


4.9 Matriks robust estimate of covariance dari grup I (S1) 43

4.10 Matriks robust estimate of covariance dari grup II (S2) 43

4.11 Matriks robust estimate of covariance gabungan grup I dangrup II (S2) 43

4.12 Matriks invers robust estimate of covariance (S) 44


x


DAFTAR GAMBAR

Nomor Judul Halaman

4.1 Pengelompokan awal dengan cluster hierarchical clusteranalysis 34

4.2 Nilai koefisien korelasi dengan menggunakan softwareSPSS 35

4.3 Scatter plot indikator Kemiskinan kabupaten/kota Provin-si Sumatera Utara 36

4.4 Uji F dalam analisis regresi 37

xi


BAB 1

PENDAHULUAN

1.1 Latar Belakang

Analisis multivariat adalah analisis statistika yang dikenakan pada da-

ta yang terdiri dari banyak variabel dan antar variabel saling berko-

relasi. Data multivariat tidak hanya terdiri atas satu variabel saja

melainkan dapat terdiri atas lebih dari satu variabel. Analisis mul-

tivariat merupakan salah satu teknik statistik yang digunakan untuk

memahami struktur data dalam dimensi tinggi. Variabel-variabel itu

saling terkait satu sama lain. Disinilah letak perbedaan antara multi-

variabel dan multivariat. Multivariat pasti melibatkan multivariabel

tetapi tidak sebaliknya. Multivariabel yang saling berkorelasilah yang

dikatakan multivariat.

Analisis diskriminan merupakan salah satu dari analisis multiva-

riat dengan metode dependensi. Ada dua metode dalam analisis mul-

tivariat, yaitu metode dependensi dan metode interdependensi. Yang

dimaksud dengan metode dependensi yaitu variabel-variabelnya tidak

saling bergantung satu dengan yang lain. sedangkan metode interden-

pendensi adalah antar variabelnya ada saling ketergantungan. Analisis

diskriminan merupakan teknik menganalisis data, dimana variabel de-

penden merupakan data kategorik atau kualitatif (ordinal atau rasio),

sedangkan variabel independen berupa data kuantitatif (interval atau

rasio).

Analisis diskriminan merupakan analisis multivariat yang bertu-

juan untuk mengklasifikasi amatan berdasarkan beberapa variabel in-

dependen yang bersifat non kategorik dan variabel dependen yang

bersifat kategorik. Analisis diskriminan memerlukan asumsi sebaran

normal multivariat dan kehomogenan matriks varians-kovarians. Da-

lam aplikasi analisis diskriminan perlu dipertimbangkan adanya pen-

1


2

cilan pada data. Analisis diskriminan klasik tidak mampu mengatasi

adanya pencilan karena penduga vektor rata-rata dan matriks varians-

kovarians tidak robust terhadap adanya pencilan. Oleh karena itu,

dilakukan pendugaan vektor rata-rata dan matriks varians-kovarians

dengan metode minimum covariance determinant (MCD) yang ro-

bust terhadap outlier.

Statistika memegang peranan penting dalam menyelesaikan ma-

salah yang terjadi pada berbagai macam bidang. Seperti bidang ekono-

mi, kependudukan, dan kesehatan. Adanya permasalahan-permasalahan

yang terjadi pada bidang-bidang tersebut, maka statistikawan berusa-

ha memberikan solusi berupa suatu hasil analisis yang berkualitas yang

pada akhirnya dapat digunakan untuk pengambilan keputusan.

Menurut Johnson dan Wichern (1982), tujuan dari analisis diskri-

minan adalah untuk menggambarkan ciri-ciri suatu pengamatan dari

bermacam-macam populasi yang diketahui, baik secara grafis maupun

aljabar dengan membentuk fungsi diskriminan. Dengan kata lain, ana-

lisis diskriminan digunakan untuk mengklasifikasikan individu ke da-

lam salah satu dari dua kelompok atau lebih.

Pada prinsipnya, analisis Diskriminan hampir sama dengan anali-

sis Regresi karena termasuk dalam dependence method yang memiliki

variabel terpengaruh (dependent variable) yang berada dalam baris

(Y ) dan variabel mempengaruhi (independent variable) yang berada

dalam kolom (X). Keberadaan dependence method berguna untuk

mengklasifikasikan objek beberapa kelompok. Kombinasi linier dari

variabel-variabel yang ada akan membentuk suatu fungsi diskriminan

(Tatham et al.,1998).

Analisis regresi memiliki beberapa kegunaan (Draper dan Smith,

1992), diantaranya untuk tujuan deskripsi dari fenomena data atau

kasus yang sedang diteliti, untuk tujuan kontrol, dan sebagai prediksi.

Regresi mampu mendeskripsikan fenomena data melalui terbentuknya


3

suatu model hubungan yang bersifat numerik. Regresi juga dapat

digunakan untuk melakukan pengendalian (kontrol) terhadap suatu

kasus atau hal-hal yang sedang diamati melalui penggunaan model

regresi yang diperoleh. Selain itu, model regresi juga dapat diman-

faatkan untuk melakukan prediksi variabel terikat. Analisis regresi li-

nier berganda digunakan untuk mengukur pengaruh antara lebih dari

satu variabel prediktor (variabel bebas) terhadap variabel terikat.

Data outlier (Makkulau et al., 2010) adalah data pengamatan

yang berada jauh (ekstrim) dari pengamatan-pengamatan lainnya.

Outlier mungkin ada karena adanya data terkontaminasi, yaitu adanya

kesalahan pada saat melakukan pengambilan sampel pada populasi.

Outlier yang disebabkan oleh data terkontaminasi dapat dihapuskan

dari data penelitian atau jika memungkinkan dapat dilakukan sam-

pling ulang. Jika setelah dilakukan beberapa sampling ulang namun

data outlier tetap muncul maka data tersebut tidak dapat dihapuskan

dari data penelitian, karena analisis data yang dihasilkan akan tidak

mencerminkan populasi yang diteliti.

Pendeteksian outlier merupakan tahapan yang perlu dilakukan

terutama jika estimasi modelnya dengan Ordinary Least Square (OLS),

yang dikenal cukup peka terhadap outlier. Pendeteksian outlier dapat

dilakukan dengan beberapa metode diantaranya dengan boxplot dan

metode Cooks Distance. Metode Boxplot merupakan metode yang

mempergunakan nilai kuartil dan jangkauan untuk mendeteksi outli-

er, sehingga pada metode ini dapat mengetahui adanya outlier untuk

masing-masing variabel. Sedangkan menggunakan metode Cooks Dis-

tance dapat mengetahui adanya outlier secara simultan pada variabel

bebas. Untuk mengatasinya diperlukan metode lain supaya analisis

data dengan adanya data outlier tetap tahan (robust) terhadap asum-

si yang diterapkan pada analisis datanya. Metode tersebut dikenal

dengan metode robust.


4

Regresi robust diperkenalkan oleh Andrews (1972), yaitu metode

regresi yang digunakan ketika distribusi dari residual tidak normal

atau adanya beberapa outlier yang berpengaruh pada model. Metode

regresi yang digunakan ketika distribusi dari error tidak normal dan

atau adanya beberapa outlier yang berpengaruh pada model sehingga

dihasilkan model yang robust atau resistance terhadap outlier (Ryan,

1997). Metode ini merupakan alat penting untuk menganalisa data

yang dipengaruhi oleh outlier. Suatu estimasi yang resistant adalah

relatif tidak terpengaruh oleh perubahan besar pada bagian kecil data

atau perubahan kecil pada bagian besar data. Pada penelitian Friday

(2013) mengenai perbandingan Fisher Linear Discriminant Analysis

and Robust Fisher Linear Discriminant Anslysis diperoleh kesimpu-

lan bahwa dengan kinerja FLDA klasik disebabkan kurangnya ketang-

guhan estimator klasik dalam mengklasifikasikan objek.

Menurut Seung Jean Kim (2005) analisis robust memiliki kete-

garan terhadap pengaruh pencilan merupakan satu-satunya yang pal-

ing layak digunakan dalam kaitannya dengan infersia model. Jika ter-

dapat pencilan (outlier) dalam data, maka bentuk sebaran data tidak

lagi simetrik tetapi cenderung menjulur ke arah pencilan sehingga

melanggar asumsi normalitas.

Melihat banyaknya metode dalam pengelompokan objek yang ada

mendorong peneliti untuk membandingkan metode yang satu dengan

yang lainnya untuk mengetahui metode yang paling akurat dalam

mengklasifikasikan suatu objek. Metode yang akan dibentuk dalam

penelitian ini adalah analisis diskriminan linear klasik dan analisis

diskriminan linier robust. Kedua metode ini dipilih karena metode-

metode tersebut merupakan metode pengklasifikasian objek yang pal-

ing banyak digunakan baik secara teoretis maupun praktis. Metode

tersebut juga merupakan jenis metode yang paling banyak dikem-

bangkan oleh banyak peneliti karena memiliki tingkat keakuratan serta

ketepatan dalam mengklasifikasikan suatu objek yang lebih tinggi bila


5

dibandingkan jenis metode lain.

1.2 Perumusan Masalah

Banyaknya analisis yang digunakan dalam pengklasifikasian objek yang

ada mendorong peneliti untuk membandingkan analisis yang satu de-

ngan yang lainnya untuk mengetahui analisis yang paling akurat dalam

mengklasifikasikan suatu objek. Analisis yang akan dibentuk dalam

penelitian ini adalah analisis diskriminan linier klasik dan analisis dis-

kriminan robust. Kedua analisis ini dipilih karena analisis tersebut

merupakan analisis prediksi yang paling banyak digunakan baik se-

cara teoretis maupun praktis. Analisis tersebut juga merupakan jenis

model yang paling banyak dikembangkan oleh banyak peneliti karena

memiliki tingkat keakuratan yang lebih tinggi bila dibandingkan je-

nis analisis lain. Maka rumusan masalah dalam penelitian ini adalah

penerapan analisis diskriminan linier klasik dan analisis diskriminan

robust dalam mengklasifikasikan suatu objek.


6

1.3 Tujuan Penelitian

Penelitian ini bertujuan untuk mengklasifikasikan data tingkat kemiski-

nan masyarakat kabupaten/kota di Sumatera Utara berdasarkan ana-

lisis diskriminan linier klasik dan analisis diskriminan robust, memper-

oleh proses pengklasifikasian objek ke dalam suatu kelompok dengan

metode analisis diskriminan linier klasik dan robust serta membandin-

gakan hasil pengklasifikasian metode analisis diskriminan linier klasik

dengan analisis diskriminan robust untuk memperoleh hasil yang ter-

baik berdasarkan salah klasifikasi yang minimum.

1.4 Manfaat Penelitian

Hasil-hasil dari penelitian ini penting untuk memberikan informasi

empirik analisis diskriminan linear klasik dan robust pada pengklasi-

fikasian objek. Memberi bahan kajian bagi peneliti selanjutnya me-

ngenai permasalahan yang relevan dengan penelitian ini. Memberikan

kontribusi kepada khazanah literatur dan praktik mengenai pengklasi-

fikasian objek.


BAB 2

TINJAUAN PUSTAKA

2.1 Analisis Multivariat

Analisis multivariat (multivariate analysis) adalah analisis yang meli-

batkan banyak variabel atau variabel ganda. Selain istilah-istilah terse-

but yang sering digunakan dalam statistika, ada beberapa istilah lain

yang sering digunakan seperti; elemen/unit analisis adalah sesuatu

yang menjadi objek penelitian; karakteristik/atribut adalah sifat yang

dimiliki elemen; variabel adalah sesuatu yang nilainya berubah-ubah

menurut waktu atau beda menurut elemen atau tempat; Populasi ada-

lah kumpulan yang lengkap dari seluruh elemen yang sejenis akan

tetapi dapat dibedakan karena karakteristiknya; Sampel adalah seba-

gian dari populasi; Sensus adalah cara pengumpulan data bila seluruh

elemen populasi diteliti satu persatu, hasilnya merupakan data sebe-

narnya yang disebut parameter; Sampling adalah cara pengumpulan

data bila hanya elemen sampel yang diteliti, hasilnya merupakan perki-

raan atau estimator; Sampling error adalah kesalahan yang terjadi

pada data perkiraan, disebabkan karena penelitian dilakukan berda-

sarkan sampel. Kegunaannya untuk mengukur tingkat ketelitian data

perkiraan.

2.2 Teknik-teknik Analisis Multivariat

Analisis multivariat dikelompokkan menjadi dua, yaitu: 1) kelompok

dependensi, dimana variabel dikelompokkan menjadi variabel bebas

yang mempengaruhi dan variabel tak bebas yang dipengaruhi; dan 2)

kelompok interdependensi, dimana variabel tidak dibedakan menja-

di variabel bebas dan variabel tak bebas, akan tetapi setiap variabel

mempunyai tingkat yang sama.

7


8

2.2.1 Analisis multivariat dengan menggunakan metode dependensi

Analisis multivariat dengan menggunakan metode dependensi bertu-

juan untuk mengetahui pengaruh atau meramalkan nilai tak bebas

berdasarkan lebih dari satu variabel bebas yang mempengaruhi. Jika

hanya ada satu variabel tak bebas, dapat dilakukan dengan menggu-

nakan anova (analysis of variance), ancova (analysis of covariance),

regresi logistik, regresi berganda, analisis diskriminan, dan korelasi

kanonikal.

2.3 Analisis Multivariat dengan Menggunakan Metode Interdepen-densi

Analisis multivariat dengan menggunakan metode interdependensi.

untuk mencari faktor penyebab timbulnya masalah atau membantu

memberi informasi yang diinginkan. Dalam hal ini, peneliti ingin

mengetahui sesuatu yang belum tahu yang merupakan masalah. Tu-

juannya untuk memberikan arti kepada kelompok variabel menjadi

kelompok yang lebih sedikit jumlahnya dan masing-masing kelompok

membentuk variabel baru yang lebih sedikit, tetapi tidak menguran-

gi informasi yang terkandung dalam variabel asli. Jika ada lebih dari

satu variabel tak bebas, dapat dilakukan dengan menggunakan analisis

faktor, analisis klaster, analisis korespondensi, dan penskalaan multi-

dimensi.

2.4 Software-software yang Tersedia untuk Analisis Multivariat

Melakukan pengolahan data analisis multivariat secara manual bukan-

lah pekerjaan mudah, karena memerlukan teknik-teknik perhitungan

matematis yang rumit yang melibatkan banyak variabel dengan uku-

ran data masing-masing variabel yang besar. Oleh karena itu, akan

sangat bijaksana dan sangat membantu kita dalam pengolahan data

jika digunakan software-software program statistik yang ada seperti,UNIVERSITAS SUMATERA UTARA

9

SPSS, SAS, AMOS, LISRELL, Splus, Eview atau MINITAB.


10

2.5 Analisis Diskriminan

Analisis diskriminan adalah teknik statistika untuk mengelompokkan

individu ke dalam kelompok-kelompok yang saling bebas dan tegas

berdasarkan segugus peubah bebas. Analisis diskriminan bertujuan

untuk memahami perbedaan kelompok dan meramalkan peluang bah-

wa suatu objek penelitian akan masuk anggota kelompok tertentu.

Analisis diskriminan cocok dipergunakan jika variabel tak bebasnya

berupa kelompok. Sedangkan yang diramalkan adalah keberadaan sua-

tu objek tertentu termasuk pada kelompok yang mana. Tujuan ana-

lisis diskriminan adalah membuat suatu fungsi diskriminan atau kom-

binasi linier dari prediktor atau variabel bebas yang bisa mendiskrim-

inasi atau membedakan kategori variabel tak bebas atau kelompok,

artinya mampu membedakan suatu objek masuk kelompok kategori

yang mana. Menguji apakah ada perbedaan signifikan antara kelom-

pok/kategorik, dikaitkan dengan variabel bebas atau prediktor. Menen-

tukan prediktor atau variabel bebas yang mana yang memberikan

sumbangan terbesar terhadap terjadinya perbedaan antar-kelompok.

Mengelompokkan objek ke dalam suatu kategori didasarkan pada nilai

variabel bebas.

Metode fungsi diskriminan pada awalnya dikembangkan oleh Fis-

her. Fisher menyatakan bahwa apabila ada dua atau lebih popu-

lasi telah diukur dalam beberapa karakter X1,X2, . . . ,XP , maka dap-

at dibangun fungsi linier tertentu dari pengukuran itu dimana fungsi

tersebut merupakan fungsi pembeda bagi populasi yang dipelajari.

Fungsi linier yang dibangun itu disebut sebagai fungsi diskriminan

(discriminant function).

2.6 Metode Penaksir Minimum Covariance Determinant (MCD)

Metode penaksir MCD merupakan metode untuk mendapatkan pe-

naksir yang robust yang didapatkan dari rata-rata dan kovariansi dari


11

sebagian pengamatan yang memiliki determinan matriks kovariansi

yang minimum. Menurut Rousseeuw dan van Driessen (1999), pe-

naksir MCD adalah pasangan (x̃, S), dimana x̃ adalah vektor rata-rata

dan S adalah matriks kovariansi yang meminimumkan nilai determi-

nan S pada subsampel yang berisikan tepat sebanyak h anggota dari

n pengamatan, dimana nilai standar dari h = [n + p + 1/2]. Pada popu-

lasi dengan jumlah pengamatan yang kecil, penaksir MCD dapat de-

ngan cepat dihitung dan ditemukan, tetapi jika jumlah pengamatan

besar, maka akan banyak sekali kombinasi subsampel dari X yang

harus ditemukan dan penghitungan pun akan cukup memakan waktu.

Untuk mengatasi keterbatasan ini, maka Rousseeuw dan van Driessen

(1999) menemukan suatu algoritma baru untuk metode MCD yang

dinamakan dengan metode fast-MCD.

2.7 Pengujian Perbedaan Vektor Rataan

Menurut Rencher (2002) untuk menguji perbedaan vektor rataan da-

pat dilakukan dengan menggunakan statistik uji T 2-Hotelling dengan

hipotesis H0 : µ1 = µ2 lawan H1 : µ1 6= µ2. Adapun statistik uji bagi T 2

adalah

T 2 =n1n2

n1 + n2(x̄1 − x̄2)

t S−1gab (x̄1 − x̄2) X̃2

p (2.1)

tolak H0 : µ1 − µ2 jika T 2 ≥ X2p.∝.

2.8 Pengujian Asumsi Analisis Diskriminan

Menurut Hair et al., (1992) asumsi utama yang melandasi analisis

diskriminan adalah sejumlah variabel independen menyebar dengan

sebaran normal multivariat dan matriks varians-kovarians untuk setiap

kelompok klasifikasi adalah sama.

Johnson dan Wichern (2002) menyatakan bahwa pemeriksaan

distribusi normal multivariat dapat dilakukan dengan membuat q-q

plot dari jarak Mahalanobis (d2i ) dengan chi square quantile (qi). Jika


12

q − q plot cenderung membentuk garis lurus dan lebih dari 50% ni-

lai (d2i ) ≤ X2

p.∝ maka sejumlah p variabel tersebut mengikuti sebaran

normal multivariat.

Untuk pengujian kehomogenan matriks varians-kovarians. Rencher

(2002) menjelaskan mengenai multivariate tests of equality of covari-

ance matrices yang dinamakan uji Boxs M . Untuk k populasi mul-

tivariat. Hipotesis untuk pengujian kehomogenan matriks varians-

kovarians adalah H0 :∑

1 =∑

2 = . . . =∑

k lawan H1 :∑

1 6=∑

2 6= . . . 6=∑

k dengan statistik uji sebagai berikut

u = −2(1 − c1)In M (2.2)

tolak H0 jika u > X2

(∝.[ 12(k−1)p(p+1)])

.

2.8.1 Distribusi normal multivariat

Distribusi normal multivariat merupakan generalisasi dari distribusi

normal univariat. Jika X1,X2 . . .XP ∼ Ni, N2i dimana i = 1, 2, . . . , p dan

X1,X2, . . .XP saling bebas. Maka vektor random X = [X1,X2, . . . ,XP ]T

berdimensi p mempunyai distribusi bersama dimana fungsi kepadatan

peluang bersamanya didefenisikan sebagai berikut:

f (x) = f (x1) , f (x2) , . . . , f (xp)

f (x) =1

(2π) p2

exp

[−1

2

∑p

i=1

(xi − µ1

σ1

)2]

(2.3)

dengan −∞ < xi < ∞. i = 1, 2, . . . , p

2.8.2 Pendeteksian pencilan

Pencilan merupakan pengamatan yang berada jauh (ekstrim) dari

pengamatan-pengamatan lainnya. Sebuah pengamatan xi dideteksi se-

bagai pencilan jika jarak mahalanobisnya sebagai beikut (Rousseeuw

dan van Driessen. 1999):

d2MD = (xi − x̃)T S−1 (xi − x̃) > x2

p,(∝) (2.4)UNIVERSITAS SUMATERA UTARA

13

2.9 Metode Robust

Menurut Lachenbruch (1975) jika matriks varians-kovarians antar kelom-

pok adalah sama, maka fungsi skor diskriminan yang terbentuk adalah

fungsi skor diskriminan linier. Sedangkan, jika berbeda, maka fungsi

skor diskriminan kuadratik yang paling optimal. Johnson dan Wich-

ern (2002) membentuk fungsi skor diskriminan linier pada persamaan

(1) dan kuadratik pada persamaan (2) dengan metode Minimum Ex-

pected Cost of Misclassification (ECM) dari x yang mengikuti sebaran

normal multivariat sebagai berikut:

dlk (x) = µt

k

∑−1x − 1

2µt

k

∑−1µk + In (pk) . k = 1, 2, . . . , g (2.5)

dQk (x) = −1

2In

∣∣∣∑

k

∣∣∣ − 1

2(x − µk)

∑−1

k(x − µk) + In (pk) . k = 1, 2, . . . , g

(2.6)

Untuk mengatasi adanya pencilan maka digunakan penduga Minimum

Covariance Determinant (MCD) bagi µ dan∑

yang diduga oleh x̄ dan

S yaitu

x̄ =

∑ni=1 wixi∑ni=1 wi

dan S =

∑ni=1 wi (xi − x̄) ((xi − x̄))t

∑ni=1 wi − 1

(2.7)

Sehingga persamaan skor diskriminan bagi RLDA pada persamaan

(2.5) menjadi:

dlk (x) = x̄t

kS−1x− 1

2x̄t

kS−1x̄k + In (pk) .k = 1, 2, . . . , g (2.8)

Serta persamaan skor diskriminan bagi RQDA pada persamaan (2.6)

menjadi:

dQk (x) = −1

2In |Sk| −

1

2(x − x̄k) + In (pk) .k = 1, 2, . . . , g (2.9)

Suatu observasi x akan termasuk dalam kelompok k jika skor diskri-

minan:

dx(x) = maximum dari d1(x).d2(x) . . . dg(x) (2.10)

dimana: dlk= Jarak dari l ke k

2.10 Apparent Error Rate (APER)UNIVERSITAS SUMATERA UTARA

14

Nilai APER dapat dihitung dengan:

APER =n1M + n2M

n1 + n2(2.11)

dimana:

n1M = Jumlah observasi dari kelompok 1 yang salah diklasifikasikan sebagai

kelompok 2

n2M = Jumlah observasi dari kelompok 2 yang salah diklasifikasikan sebagai

kelompok 1

2.11 Kemiskinan

Masalah kemiskinan merupakan salah satu persoalan mendasar yang

menjadi pusat perhatian pemerintah di negara manapun. Salah satu

aspek penting untuk mendukung strategi penanggulangan kemiskinan

adalah tersedianya data kemiskinan yang akurat dan tepat sasaran.

Pengukuran kemiskinan yang dapat dipercaya dapat menjadi instru-

men tangguh bagi pengambil kebijakan dalam memfokuskan perha-

tian pada kondisi hidup orang miskin. Data kemiskinan yang baik

dapat digunakan untuk mengevaluasi kebijakan pemerintah terhadap

kemiskinan, membandingkan kemiskinan antar waktu dan daerah, ser-

ta menentukan target penduduk miskin dengan tujuan untuk memper-

baiki kondisi tersebut.

Definisi miskin menurut Howard Wringins dan Alder Karisson

menyebutkan bahwa kemiskinan merupakan masalah yang kompleks

(multi dimention) yang dapat ditinjau dari beberapa aspek, selain dari

aspek rendahnya pendapatan dan konsumsi pangan, kemiskinan dapat

ditinjau dari aspek pandangan perumahan, kesehatan, kebutuhan air

bersih juga aspek non material.

Indikator yang digunakan dalam menetukan status kemiskinan

rumah tangga terdiri dari 10 variabel yaitu: pendidikan yang dita-UNIVERSITAS SUMATERA UTARA

15

matkan, angka melek huruf, bekerja di sektor informal, bekerja dis-

ektor formal, bekerja di sektor pertanian, bekerja di sektor bukan

pertanian, tidak bekerja/pengangguran, persentase pengeluaran per

kapita untuk makanan, pengguna alat kontrasepsi, persentase balita

yang telah diimunisasi, rumah tangga pengguna air layak, dan rumah

tangga pengguna jamban sendiri/bersama (BPS, 2016).

2.12 Indikator Kemiskinan

Badan Pusat Statistik (BPS) menggunakan konsep kemampuan memenuhi

dasar dalam mengukur kemiskinan. Dengan pendekatan ini, kemiski-

nan dipandang sebagai ketidakmampuan dari sisi ekonomi untuk memenuhi

kebutuhan dasar makanan dan bukan makanan yang diukur dari sisi

pengeluaran. Pendekatan dalam menghitung kemiskinan tingkat ka-

bupaten/kota adalah sebagai berikut:

a). Menentukan Garis Kemiskinan Sementara (GKS) untuk tingkat

kabupaten/kota dengan cara:

GKStij = GKSt−1

ij x(1 + Ejxlij (2.12)

dimana:

GKStij = Garis kemiskinan sementara kabupaten/kota ke-i di provinsi ke-j

di tahun t

GKSt−1ij = Garis kemiskinan kabupaten/kota ke-i di provinsi ke-j di tahun

t − 1

Ej = Elastisitas provinsi ke-j

lij = Inflasi kabupaten/kota ke-i di provinsi ke-j

b). Menentukan P0 sementara kabupaten/kota ke-i di provinsi ke-

j yaitu dengan cara mengalikan pertumbuhan P0 provinsi ke-j

periode t ke t − 1 dengan P0 kabupaten ke-i pada tahun t-1.

c). Menetapkan garis kemiskinan dengan cara menarik titik potong

antara GKS dan P0 sementara.UNIVERSITAS SUMATERA UTARA

16

d). Menghitung indikator kemiskinan dengan menggunakan formu-

lasi FGT.

e). Melakukan prorate jumlah penduduk miskin kabupaten/kota agar

sama dengan angka provinsi yang telah dirilis sebelumnya.

Yang menjadi indikator kemiskinan tingkat kabupaten/kota diantaran-

mya pendidikan yang ditamatkan, angka melek huruf, angka partisipasi

sekolah, bekerja disektor informal, disektor formal, disektor pertani-

an, disektor bukan pertanian, tidak bekerja atau pengangguran, pe-

ngeluaran per kapita untuk makanan, pengguna alat kontrasepsi, imu-

nisasi atau vaksinisasi, balita yang diimunisasi, rumah tangga penggu-

na air layak, dan rumah tangga pengguna jamban sendiri/bersama.


BAB 3

METODOLOGI PENELITIAN

Data yang digunakan merupakan data sekunder, karena diper-

oleh dari publikasi resmi, dokumentasi, tulisan-tulisan ilmiah yang

ada maupun buku-buku, jurnal, atau literatur lainnya. Data sekunder

tersebut diperoleh dari data SUSENAS 2016. Data sekunder yang

digunakan adalah data persentase penduduk per-kabupaten/kota ber-

dasarkan indikator kemiskinan masyarakat di Sumatera Utara yang

digunakan sebagai peubah X untuk mengukur tingkat kemiskinan Y .

Data diperoleh pada level kabupaten/kota yang ada di Sumatera Utara

yang terdiri dari 33 kabupaten/kota.

Oleh karena tidak adanya teori atau penelitian sebelumnya yang

mendasari pengklasifikasian tingkat kemiskinan per-kabupaten/kota,

maka peneliti mengelompokkan tingkat kemiskinan Y menjadi 2 kelom-

pok berdasarkan sebaran empirik data. Kelompok 1 adalah kabupa-

ten/kota dengan tingkat kemiskinan rendah. Kelompok 2 adalah ka-

bupaten/kota dengan tingkat kemiskinan tinggi.

Peubah yang digunakan dalam penelitian ini adalah (Badan Pusat

Statistik, 2016):

X1 : Pendidikan yang ditamatkan tingkat SD(%)

X2 : Pendidikan yang ditamatkan tingkat SLTP(%)

X3 : Pendidikan yang ditamatkan tingkat SLTA(%)

X4 : Angka tidak bekerja(%)

X5 : Bekerja di sektor informal (%)

X6 : Bekerja disektor formal (%)

X7 : Pengguna alat kontrasepsi (%)

X8 : Persentase balita yang telah diimunisasi (%)

X9 : Rumah tangga pengguna air layak (%)

17


18

X10 : Rumah tangga pengguna jamban sendiri/bersama (%)


3.1.1 Uji normal multivariat

Menurut Johnson dan Wichern (2007), untuk menguji kenormalan

peubah ganda (Multivariate Normality) adalah dengan mencari nilai jarak

kuadrat untuk setiap pengamatan yaitu:

d2i = (xi − x̄)TS−1(xi − x̄) (3.1)

dimana:

d2i adalah nilai jarak kuadrat untuk setiap pengamatan ke i

xi adalah pengamatan yang ke i, dengan i = 1, 2,. . . ,n

x̄ adalah rata-rata variabel bebas X

S−1adalah kebalikan (inverse) matriks varians-kovarians gabungan S

Kemudian d2i diurutkan dari yang paling kecil ke yang paling be-

sar, selanjutnya dibuat plot d2i dimana: i = urutan = 1, 2, . . .n. Bila

hasil plot dapat didekati dengan garis lurus, maka dapat disimpulkan

bahwa peubah ganda menyebar normal.

3.1.2 Uji kesamaan matriks varians lovarians

Untuk menguji kesamaan matriks varians kovarians kelompok I (S1)

dan kelompok II (S2) digunakan hipotesa:

H0 : S1 = S2, matriks varians kovarians kelompok adalah relatif sama.

H1 : S1 6= S2, matriks varians kovarians kelompok adalah berbeda

secara nyata.

Terima H0, yang berarti matriks varians kovarians sama jika:


19

X2hitung ≤ X2

(α,[ 12(k−1)p(p+1)])

(3.2)

dengan:

X2hitung = −2(I − Ci)[

1

2

k∑

i=1

Viln|Si| −1

2ln|S|

k∑

i=1

Vi] (3.3)

k = Banyaknya kelompok (grup)

P = Jumlah peubah pembeda (Y ) dalam fungsi diskriminan = 1

S = Matriks varians kovarians dalam kelompok gabungan

Si = Matriks varian kovarians kelompok ke-i

i = 1, 2, 3, . . . , k

ni = Jumlah responden pada kelompok ke-i

dengan:

Vi = ni − 1 (3.4)

S =

∑ki=1 ViSi∑ki=1 Vi

(3.5)

C1 = [k∑

i=1

1

v1− 1∑k

i=1 Vi

][2p2 + 3p − 1

6(p + 1)(k − 1)] (3.6)

3.1.3 Uji vektor nilai rataan (uji kesamaan rata-rata kelompok)

Menguji apakah semua variabel independen (variabel bebas) berbe-

da secara nyata berdasarkan variabel dependen. Variabel bebas diuji

dengan dua cara:

1. Dengan Uji F

Statistik uji yang digunakan untuk menguji kesamaan rata-rata

antar kelompok adalah statistik F dengan hipotesa:

H0 : µ1 = µ2 = . . . = µk Berarti rata-rata antar kelompok sama (tidak

ada perbedaan)

H1 : µ1 6= µ2 6= . . . 6= µk, Berarti ada perbedaan rata-rata antar kelompok

α= Taraf signifikansi


20

Daerah kritis : tolak H0. jika Fhit > Ftabel

Ftabel = F((db1;db2))

db1 = k − 1

db2 = (n − k) = (nj − 1) + (n2 − 1)

Apabila Fhit > Ftabel, maka tolak H0, ini berarti bahwa terdapat

perbedaan vektor nilai rataan antar kelompok. Bila dari hasil

pengujian ada perbedaan vektor nilai rataan, maka fungsi diskri-

minan layak disusun untuk mengelompokkan suatu objek. Kepu-

tusan atas dasar Signifikansi uji F pada output SPSS dilihat angka

Sig.

(a) Jika Sig. > 0.05 maka H0 diterima, berarti tidak ada perbe-

daan yang signifikan antar grup (rata-rata antar kelompok

sama).

(b) Jika Sig. ≤ 0.05 maka H1 diterima, berarti ada perbedaan

yang signifikan antar grup.

2. Dengan angka Wilks Lambda

Angka Wilks Lambda berkisar 0 sampai 1, yaitu:

(a) Jika angka Wilks Lambda mendekati 0, maka data tiap kelom-

pok cenderung berbeda.

(b) Jika angka Wilks Lambda mendekati 1, maka data tiap kelom-

pok cenderung sama (tidak berbeda).

Wilks Lambda = WW+B

dimana:

W = Jumlah Kuadrat Galat (JK dalam kelompok)

B = Jumlah Kuadrat Antar Kelompok


21

Analisis varians (Uji F) dan angka Wilks Lambda adalah untuk men-

guji rata-rata setiap variabel.

3.2 Fungsi Analisis Diskriminan

Fungsi diskriminan adalah kombinasi linear dari variabel-variabel yang

dimiliki oleh kelompok-kelompok yang akan diklasifikasikan. Fungsi

diskriminan menentukan ke dalam kelompok mana suatu objek (melalui

karakteristiknya berupa data pengamatan) seharusnya dimasukkan atau

dikategorikan, maka setidak-tidaknya ada dua kelompok. Oleh karena

itu dapat ditinjau bagaimana fungsi diskriminan ini diperoleh apabila

berhadapan dengan dua grup. Sebelumnya akan dijelaskan terlebih

dahulu pengertian matriks varians kovarians.

Pada data pengamatan ke-i yang berukuran n (i = 1, 2, . . ., n)

yang terdiri atas j buah variat (variabel) yaitu X1, X2, . . . , Xj. Data

pengamatan tersebut dapat disajikan dalam bentuk matriks berikut.

Tabel 3.1 Matriks data pengamatan

Variabel X1 X2 ... Xj

Data Pengamatan X11 X12 ... X1jX21 X22 ... X2j. . . .. . . .. . . .Xn1 Xn2 ... Xnj

Untuk variabel Xj yang dihitung adalah variansnya, diberi lambang

Sjj dengan rumus:

Sjj =nΣn

n=1X2nj − (Σn

n=1Xnj)2

n(n − 1)(3.7)

Semuanya ada j buah varians, yaitu S11, S22, ..., Sjj yang masing-masing

merupakan varians untuk variabel X1,X2, ...,Xj. Untuk variabel Xi dan

Xj dimana i 6= j terdapat kovarians, diberi lambang Sij yang dapat di-

hitung dengan rumus berikut.


22

Sij =nΣn

n=1XniXnj − (Σnn=1Xni)(Σ

nn=1Xnj)

n(n − 1)(3.8)

Semuanya ada (j2 − j) buah kovarians. Perlu dijelaskan bahwa

untuk i = j maka Sij = Sji diberi lambang menjadi Sjj .

Varians dan kovarian disusun dalam sebuah matriks disebut dengan

nama matriks varians-kovarians dengan lambang S, bentuknya sebagai

berikut.

S1 =

S11 S12 . . . S1jS21 S22 . . . S2j

. . .

Sj1 Sj2 . . . Sjj

Misalkan ada dua grup yang banyak variabelnya masing-masing j buah

yaitu X11, X12, . . . , X1j dalam grup I dan X21, X22, . . . , X2j dalam

grup II. Perhatikan bahwa Xij menyatakan variabel ke j dalam grup

ke i, dengan i = grup I dan grup II. Variabel dalam setiap grup dapat

pula dituliskan dalam bentuk vektor kolom sebagai berikut.

X1 =

X11X12...

X1j

X2 =

X21X22...

X2j


23

X1j menyatakan variabel X ke j dalam grup ke 1

X2j menyatakan variabel X ke j dalam grup ke 2

Dari setiap grup berukuran n1 dari grup ke-1 dan berukuran n2

dari grup ke-2. Data pengamatan akan berbentuk matriks yang ben-

tuknya seperti berikut.


24

Tabel 3.2 Matriks data pengamatan dari grup I

Variabel X11 X12 ... X1j

Data Pengamatan X11 X12 ... X1jX21 X22 ... X2j. . . .. . . .. . . .Xn1 Xn2 ... Xnj

Rata-rata X̄11 X̄12 ... X̄1j

Tabel 3.3 Matriks data pengamatan dari grup II

Variabel X21 X22 ... X2j

Data Pengamatan X211 X221 ... X2j1X212 X222 ... X2j2. . . .. . . .. . . .X21n2 X22n2 ... X2jn2

Rata-rata X̄11 X̄12 ... X̄2j

Hasil pengamatan ini akan menghasilkan rata-rata untuk tiap va-

riabel yang dibentuk dalam bentuk vektor dapat ditulis:

X̄1 =

X̄11

X̄12...

X̄1j

X̄2 =

X̄21

X̄22...

X̄2j

dimana:

X1jn1 Menyatakan variabel X ke j dalam grup ke 1 yang berukuran n1

X2jn2 Menyatakan variabel X ke j dalam grup ke 2 yang berukuran n2

X̄1j menyatakan rata-rata variabel ke j dalam grup 1

X̄2jmenyatakan rata-rata variabel ke j dalam grup 2


25

Dari masing-masing rata-rata dari grup I dan rata-rata dari grup

II, selanjutnya akan dihitung varians dan kovariansnya. Varians ko-

varians tersebut disusun dalam matriks S1 dan S2, masing-masing dari

grup ke-1 dan dari grup ke-2, yaitu:

S1 =

S11 S12 S1jS21 S22 S2j

.

.

.Sj1 Sj2 Sjj

S2 =

S11 S12 S1jS21 S22 S2j

.

.

.Sj1 Sj2 Sjj

dimana :

S1 = matriks varians kovarians dari grup ke 1

S2 = matriks varians kovarians dari grup ke 2

Meskipun dalam S1 dan S2 digunakan Sij yang sama namun jelas

besarnya berlainan antara Sij dalam S1 dan Sij dalam S2, kedua datanya

juga berlainan, yaitu S1 diambil dari grup I dan S1 diambil dari grup

II.

Kedua buah matriks varians-kovarians ini bisa dihitung matriks

varians-kovarians gabungan, diberi lambang S dengan rumus:

S =(n1 − 1)S1 + (n2 − 1)S2

n1 + n2 − 2

Matriks varians-kovarians gabungan ini mempunyai invers, yaitu S−1.

Dengan adanya vektor rata-rata X̄1 dan X̄2 dan juga matriks

varians-kovarians gabungan S bersama dengan persyaratan bahwa da-

ta variabel independen seharusnya berdistribusi normal multivariat

(bervariabel banyak) disingkat multinormal, dan matriks varians-kovarians

kedua grup relatif sama, maka rumus fungsi diskriminan untuk ini ada-

lah:

Y = (X̄1 − X̄2)S−1X (3.9)


26

X adalah vektor pengamatan yaitu

X =

X1X2...

Xj

Fungsi diskriminan ini dapat digunakan untuk membuat aturan klasi-

fikasi yang kita cari berdasarkan salah satu dari kedua aturan di bawah

ini:

Aturan I :

Jika Y > 1/2 (X̄1 - X̄2)S−1(X̄1 + X̄2) klasifikasi objek dengan data

pengamatan X dimasukkan ke dalam grup I. Jika Y = 1/2 (X1 -

X2)S−1(X̄1 + X̄2) klasifikasi objek dengan data pengamatan X dima-

sukkan ke dalam grup II.

Aturan II :

Dengan menggunakan statistik W (Wald-Anderson) yaitu:

W = XS−1(X̄1 − X̄2) − 1/2(X̄1 − X̄2)S−1(X̄1 + X̄2) (3.10)

Untuk memperoleh klasifikasi ini. jika W > 0 maka objek dengan

pengamatan X dimasukkan kedalam grup I sedangkan dalam hal lain-

nya objek itu dimasukkan ke dalam grup II.

3.3 Ketepatan Pengelompokkan Fungsi Diskriminan

Tingkat akurasi pengelompokkan sangat menentukan baik atau

tidaknya suatu pengelompokan. Persentase ketepatan pengelompokan

dapat dihitung dari matriks klasifikasi yang menunjukkan nilai sebe-

narnya (actual members) dan nilai prediksi (prediction members) dari

setiap kelompok.

Hasil pengelompokkan menurut fungsi diskriminan tidak selalu

sama dengan pengelompokkan awal. Besarnya kesalahan pengelom-


27

pokan. dengan menganggap pengelompokan awal adalah benar, meru-

pakan indikator tingkat akurasi dari fungsi diskriminan yang dihasilkan.

Tabel berikut menunjukkan evaluasi tingkat akurasi terhadap fungsi

diskriminan dengan memperhatikan persentase ketepatan pengelom-

pokan.

Tabel 3.4 Hasil Klasifikasi model diskriminan linier robust untuk 33 data

Pengelompokan MenurutPengelompokan Fungsi Diskriminan Jumlah

Awal Kelompok I Kelompok II

Kelompok I n11 n12 n1

Kelompok II n21 n22 n2

Jumlah n.1 n.2 n

3.4 Langkah-langkah Analisis

Adapun langkah-langkah dalam analisis diskriminan linier klasik dan

analisis diskriminan robust sebagai berikut:

1. Menyiapkan data yang akan digunakan dalam penelitian

2. Melakukan pengujian asumsi analisis diskriminan

3. Mendeteksi adanya pencilan

4. Memilih variabel bebas yang digunakan dalam penelitian

5. Melakukan standarisasi variabel jika satuan variabel berbeda-

beda

6. Melakukan perhitungan analisis diskriminan linier dan analisis

robust dengan langkah sebagai berikut:

(a) Penaksiran parameter untuk analisis diskriminan linier dan

analisis robust


28

(b) Menentukan fungsi diskriminan linier dan fungsi analisis ro-

bust

(c) Menghitung skor diskriminan linier dan skor diskriminan ro-

bust untuk masing-masing pengamatan dan mengklasifikasikan-

nya kedalam kelompok pertama atau kelompok kedua

(d) Menghitung jumlah pengamatan yang salah dalam pengk-

lasifikasian analisis diskriminan linier dan diskriminan robust

(e) Menghitung persentase kesalahan dalam pengklasifikasian ana-

lisis diskriminan linier dan analisis robust dengan metode

APER

(f) Menilai tingkat keakuratan pengklasifikasian diskriminan li-

nier dan pengklasifikasian robust dengan menghitung nilai

Presss Q

7. Membandingkan persentase kesalahan pengklasifikasian hasil ana-

lisis diskriminan linier dengan hasil analisis robust


BAB 4

HASIL DAN PEMBAHASAN

4.1 Data Tingkat Kemiskinan Kabupaten/Kota di Sumatera Utara

Menurut hasil klasifikasi awal dengan cluster hierarchical cluster analysis,

diketahui bahwa 17 kabupaten/kota di Sumatera Utara merupakan ka-

bupaten/kota dengan status tingkat kemiskinan masyarakat rendah,

sedangkan sisanya 16 kabupaten/kota merupakan kabupaten/kota de-

ngan status tingkat kemiskinan masyarakat tinggi (BPS, 2017).

Tabel 4.1 Persentase tingkat kemiskinan Kabupaten/kota di Sumatera Utara

No. Kabupaten/Kota Tingkat Kemiskinan1. Nias 17.642. Mandailing Natal 10.983. Tapanuli Selatan 11.154. Tapanuli Tengah 14.585. Tapanuli Utara 11.256. Toba Samosir 10.087. Labuhan Batu 8.958. Asahan 11.869. Simalungun 10.8110. Dairi 8.911. Karo 9.8112. Deli Serdang 4.8613. Langkat 11.3614. Nias Selatan 18.615. Humbang Hasundutan 9.7816. Pakpak Bharat 10.7217. Samosir 14.418. Serdang Bedagai 9.5319. Batu Bara 12.2420. Padang Lawas Utara 10.8721. Padang Lawas 8.6922. Labuhan Batu Selatan 11.4923. Labuhan Batu Utara 10.9724. Nias Utara 30.9225. Nias Barat 28.3626. Kota Sibolga 13.327. Kota Tanjung Balai 14.4928. Kota Pematang Siantar 9.9929. Kota Tebing Tinggi 11.730. Kota Medan 9.331. Kota Binjai 6.6732. Kota Padangsidimpuan 8.3233. Kota Gunungsitoli 23.43

29


30

4.1.1 Pendidikan yang ditamatkan tingkat SD

Berdasarkan data tingkat pendidikan yang ditamatkan tingkat Sekolah

Dasar kabupaten/kota di Sumatera Utara diketahui bahwa kabupa-

ten/kota dengan status tingkat kemiskinan rendah memiliki rata-rata

pendidikan yang ditamatkan Sekolah Dasar relatif lebih kecil yaitu

15,543. daripada rata-rata pendidikan yang ditamatkan Sekolah Dasar

dengan status tingkat kemiskinan tinggi yaitu 22,124.

4.1.2 Pendidikan yang ditamatkan tingkat SLTP

Berdasarkan data tingkat pendidikan yang ditamatkan tingkat Sekolah

Lanjutan Tingkat Pertama kabupaten/kota di Sumatera Utara dike-

tahui bahwa kabupaten/kota dengan status tingkat kemiskinan ren-

dah memiliki rata-rata pendidikan yang ditamatkan Sekolah Lanju-

tan Tingkat Pertama relatif lebih kecil yaitu 53,997 daripada rata-

rata pendidikan yang ditamatkan Sekolah Dasar dengan status tingkat

kemiskinan tinggi yaitu 54,168.

4.1.3 Pendidikan yang ditamatkan tingkat SLTA

Berdasarkan data tingkat pendidikan yang ditamatkan tingkat Seko-

lah Lanjutan Tingkat Atas kabupaten/kota di Sumatera Utara dike-

tahui bahwa kabupaten/kota dengan status tingkat kemiskinan ren-

dah memiliki rata-rata pendidikan yang ditamatkan Sekolah Lanjutan

Tingkat Atas relatif lebih tinggi yaitu 30,851 daripada rata-rata pen-

didikan yang ditamatkan Sekolah Lanjutan Tingkat Atas dengan status

tingkat kemiskinan tinggi yaitu 22,875.

4.1.4 Angka tidak bekerja atau pengangguran

Berdasarkan data tingkat kemiskinan kabupaten/kota di Sumatera

Utara diketahui bahwa dengan status tingkat kemiskinan rendah memi-

liki rata-rata angka tidak bekerja relatif lebih tinggi yaitu 44,047 dari-

pada rata-rata angka tidak bekerja dengan status tingkat kemiskinan


31

tinggi yaitu 17,573.


32

4.1.5 Angka bekerja di sektor informal



liki rata-rata angka bekerja di sektor informal relatif lebih rendah yaitu

31,527 daripada rata-rata angka bekerja di sektor informal dengan sta-

tus tingkat kemiskinan tinggi yaitu 75,756.

4.1.6 Angka bekerja di sektor formal



liki rata-rata angka bekerja di sektor formal relatif lebih tinggi yaitu

24,426 daripada rata-rata angka bekerja di sektor formal dengan status


4.1.7 Angka pengguna alat kontrasepsi



liki rata-rata angka pengguna alat kontrasepsi relatif tinggi yaitu 64,954

daripada rata-rata angka pengguna alat kontrasepsi dengan status


4.1.8 Persentase balita yang telah diimunisasi



liki rata-rata persentase balita yang telah diimunisasi relatif tinggi

yaitu 78,967 daripada rata-rata persentase balita yang telah diimu-

nisasi dengan status tingkat kemiskinan tinggi yaitu 78,384.

4.1.9 Rumah tangga pengguna air layak



liki rata-rata rumah tangga pengguna air layak relatif tinggi yaitu


33

62,603 daripada rata-rata rumah tangga pengguna air layak dengan

status tingkat kemiskinan tinggi yaitu 40,861.

4.1.10 Rumah tangga pengguna jamban sendiri/bersama



liki rata-rata rumah tangga pengguna jamban sendiri/bersama relatif

tinggi yaitu 87,094 daripada rata-rata rumah tangga pengguna jam-

ban sendiri/bersama dengan status tingkat kemiskinan tinggi yaitu

38,44813.

Data persentase penduduk Kabupaten/kota di Sumatera Utara

dengan 10 peubah indikator kemiskinan dapat dilihat pada tabel 2.

Tabel 4.2 Data persentase penduduk Kabupaten/kota di Sumatera Utara de-ngan 10 peubah indikator kemiskinan

Daerah X1 X2 X3 X4 X5 X6 X7 X8 X9 X10Nias 41.33 48.73 9.94 25.26 73.42 1.32 59.19 90.12 6.90 12.84Mandailing Natal 11.19 65.40 23.41 27.03 50.63 22.34 45.17 82.36 44.02 19.21Tapanuli Selatan 25.57 61.86 12.57 18.89 75.06 6.05 43.26 43.95 29.11 8.62Tapanuli Tengah 31.97 55.50 12.53 21.29 62.22 16.50 57.26 80.53 50.26 24.83Tapanuli Utara 13.59 62.90 23.51 9.27 88.04 2.69 45.67 77.75 61.77 33.32Toba Samosir 9.33 54.69 35.98 12.47 84.75 2.77 44.09 91.85 42.71 74.64Labuhan Batu 17.44 54.43 29.13 45.61 37.46 16.93 61.43 40.51 57.23 89.30Asahan 15.86 59.93 24.21 40.95 25.27 33.78 74.34 70.57 72.81 97.50Simalungun 9.87 56.33 33.80 41.23 39.53 19.24 62.92 96.99 69.49 89.00Dairi 16.96 52.08 30.96 7.71 92.29 9.67 29.58 76.70 33.81 57.64Karo 13.00 59.12 27.88 21.54 70.44 8.02 36.68 98.82 71.05 56.63Deli Serdang 7.15 52.25 40.60 52.85 24.55 22.59 75.12 93.30 78.46 4.87Langkat 10.39 70.70 18.91 50.43 23.86 25.71 77.62 94.71 44.04 86.59Nias Selatan 56.33 32.58 11.09 16.30 77.55 6.15 2.15 23.68 41.29 41.19Humbang Hasundutan 23.15 42.69 34.16 7.52 87.15 5.33 49.58 65.14 78.44 45.22Pakpak Bharat 13.54 67.81 18.65 6.92 91.84 1.25 42.83 98.00 29.26 33.72Samosir 11.80 52.82 35.37 13.64 84.32 2.04 49.35 98.71 51.03 1.89Serdang Bedagai 17.81 58.37 23.82 45.40 38.72 15.88 80.51 90.23 55.81 81.89Batu Bara 23.26 52.92 23.82 40.68 40.01 19.31 74.71 79.15 59.81 94.99Padang Lawas Utara 4.47 59.08 26.44 21.60 69.32 9.08 42.60 77.86 31.04 22.49Padang Lawas 18.39 58.82 22.78 20.55 74.57 4.89 36.09 78.92 24.18 13.43Labuhan Batu Selatan 12.67 67.24 20.10 37.65 34.35 28.01 73.43 78.45 37.89 78.94Labuhan Batu Utara 25.24 61.66 13.10 50.61 40.56 8.83 57.20 74.18 66.70 86.33Nias Utara 40.09 45.73 14.18 19.99 76.47 3.54 60.98 79.63 26.32 58.75Nias Barat 45.25 41.38 13.37 17.35 72.99 9.66 35.54 68.07 37.04 42.24Kota Sibolga 18.26 50.75 30.99 46.11 31.11 22.78 71.43 76.88 83.40 97.74Kota Tanjung Balai 17.29 56.84 25.87 51.66 14.14 34.20 67.48 49.21 79.68 87.37Kota Pematang Siantar 6.06 40.23 53.71V41.25 24.95 33.80 71.08 97.36 83.33 95.47Kota Tebing Tinggi 5.97 55.86 38.17 48.17 20.89 30.94 48.80 97.99 65.50 90.18Kota Medan 7.54 7.54 5.29 46.75 20.26 32.99 47.19 88.28 97.79 98.00Kota Binjai 6.48 43.01 50.51 43.55 26.81 29.64 75.00 73.18 61.29 98.00Kota Padangsidimpuan 12.02 48.89 39.08 48.55 20.51 30.94 50.43 73.38 13.99 72.19Kota Gunungsitoli 26.56 46.88 26.56 31.19 54.02 14.79 62.57 89.49 32.59 45.85


34

Gambar 4.1 Pengelompokan awal dengan cluster hierarchical cluster analysis


4.2.1 Uji Normal Multivariat

Hipotesis:

H0 : Data pendidikan yang ditamatkan tingkat SD, SLTP, SLTA, angka tidak

bekerja, bekerja di sektor informal, bekerja disektor formal, pengguna alat

kontrasepsi, persentase balita yang telah diimunisasi, rumah tangga pengguna

air layak, dan rumah tangga pengguna jamban sendiri/bersama berdistribusi

normal multivariat.

H1 : Data pendidikan yang ditamatkan tingkat SD, SLTP, SLTA, angka tidak

bekerja, bekerja di sektor informal, bekerja disektor formal, pengguna alat

kontrasepsi, persentase balita yang telah diimunisasi, rumah tangga pengguna

air layak, dan rumah tangga pengguna jamban sendiri/bersama berdistribusi

tidak normal multivariat.

Taraf signifikansi (α) = 0.05 Statistik Hitung:

p-value = 0.985

Kriteria Pengujian :

H0 ditolak jika p-value = α

Keputusan :


35

H0 diterima karena p-value = 0.985

Kesimpulan :

Data pendidikan yang ditamatkan tingkat SD, SLTP, SLTA, angka

tidak bekerja, bekerja di sektor informal, bekerja disektor formal,

pengguna alat kontrasepsi, persentase balita yang telah diimunisasi,

rumah tangga pengguna air layak, dan rumah tangga pengguna jam-

ban sendiri/bersama berdistribusi normal multivariat.

Gambar 4.2 Nilai koefisien korelasi dengan menggunakan software SPSS

Gambar 4.2 memperlihatkan bahwa 10 peubah indikator kemiski-

nan dari data penduduk kabupaten/kota di Sumatera Utara memiliki

distribusi normal multivariat karena memiliki nilai koefisien korelasi =

0.985 yang lebih besar dari nilai taraf signifikansi (α) = 0.05. Koefisien

korelasi yang diperoleh menunjukkan koefisien korelasi yang sangat

tinggi. Besarnya koefisien korelasi antara -1 sampai dengan +1. Apa-

bila koefisien korelasi > rtabel atau sig. < 0.05 maka terdapat korelasi

yang signifikan. Dalam scatter plot, ini berarti data berasal dari sampel

yang terdistribusi normal.


36

Gambar 4.3 Scatter plot indikator Kemiskinan kabupaten/kota Provinsi Suma-tera Utara

4.2.2 Data uji kesamaan matriks varian kovarian

Hipotesis:

H0 : Matriks kovariansi dari kelompok status tingkat kemiskinan tinggi dan

kelompok status tingkat kemiskinan rendah adalah sama.

H1 : Matriks kovariansi dari kelompok status tingkat kemiskinan tinggi dan

kelompok status tingkat kemiskinan rendah adalah berbeda.

Taraf signifikansi (α) = 0.05

Statistik hitung:

MC−1 = 0.08

Sig. = 0.00

Kriteria pengujian :

H0 ditolak jika Sig. ≤ α

Keputusan :

H1diterima karena Sig. = 0.00 ≤ α = 0.05

Kesimpulan :

matriks kovariansi dari kelompok status tingkat kemiskinan tinggi dan

kelompok status tingkat kemiskinan rendah adalah berbeda.UNIVERSITAS SUMATERA UTARA

37

Gambar 4.4 Uji F dalam analisis regresi

Interpretasi output SPSS

Berdasarkan hasil output SPSS di atas, dapat dilihat bahwa nilai F hi-

tung lebih besar dari pada nilai F tabel (7.213 > 2.45) dengan tingkat

signifikan di bawah 0.05 yaitu 0.001. Berdasarkan cara pengambi-

lan keputusan uji simultan dalam analisis regresi disimpulkan bahwa

X1 (pendidikan yang ditamatkan tingkat SD), X2 (pendidikan yang

ditamatkan tingkat SLTP), X3 (pendidikan yang ditamatkan tingkat

SLTA), X4 (angka tidak bekerja), X5 (bekerja di sektor informal), X6

(bekerja disektor formal), X7 (pengguna alat kontrasepsi), X8 (persen-

tase balita yang telah diimunisasi), X9(rumah tangga pengguna air

layak), dan X10 (rumah tangga pengguna jamban sendiri/bersama) ji-

ka diuji secara bersama-sama berpengaruh signifikan terhadap tingkat

kemiskinan di Provinsi Sumatera Utara.

4.2.3 Data pencilan (outlier)

Dalam statistik, outlier atau pencilan adalah sebuah datum yang meny-

impang sangat jauh dari datum lainnya di dalam satu sampel atau

kumpulan datum (kumpulan datum disebut data). Seringkali, pen-

cilan di dalam satu kumpulan datum dapat menjadi peringatan bagi

ahli statistik akan adanya ketidaknormalan atau kesalahan eksperimen

pada pengukuran yang diambil, yang dapat membuat ahli statistik

membuang pencilan tersebut dari kumpulan datum. Jika ahli statistik

membuang pencilan dari kumpulan datum, kesimpulan yang diambil


38

dari penelitian dapat menjadi sangat berbeda.


39

Oleh karena itu, mengetahui cara menghitung dan menangalisis

pencilan sangat penting untuk memastikan pengertian yang benar dari

sebuah kumpulan datum statistik.

4.2.4 Pemilihan ariabel bebas

Pemilihan variabel bebas dilakukan dengan melakukan uji t yang reka-

pitulasinya disajikan pada tabel 4.2 sebagai berikut:

Tabel 4.3 Uji F dalam analisis regresi

Berdasarkan hasil pemilihan variabel bebas, maka variabel bebas

yang berpengaruh dalam menentukan status tingkat kemiskinan kabu-

paten/kota di Sumatera Utara ialah variabel X1 (pendidikan yang dita-

matkan tingkat SD), X2 (pendidikan yang ditamatkan tingkat SLTP),

X3 (pendidikan yang ditamatkan tingkat SLTA), X4 (angka tidak bek-

erja), X6 (bekerja disektor formal, X7 (pengguna alat kontrasepsi), X8

(persentase balita yang telah diimunisasi), X9 (rumah tangga penggu-

na air layak), dan X10 (rumah tangga pengguna jamban sendiri/bersama).

Oleh karena itu, variabel yang akan disertakan dalam fungsi diskrimi-

nan ialah variabel X1, X2, X3, X4, X6, X7, X8, X9, dan X10.

4.2.5 Analisis diskriminan linier klasik

Penaksiran parameter fungsi diskriminan pada analisis diskriminan


40

linier klasik dilakukan dengan mencari x̄ dan S yang merupakan vektor

rata-rata dan matriks kovariansi dari data. Berdasarkan perhitungan

dengan menggunakan data yang sudah distandarkan, diperoleh hasil

vektor rata-rata dan matriks kovariansi sebagai berikut:

Z̄1 =

15, 54353, 99730, 85144, 04724, 42564, 95478, 96762, 60387, 094

Z̄2 =

22, 12354, 16822, 87517, 5736, 67346, 06578, 38440, 86138, 448

Tabel 4.4 Matriks kovariansi dari grup I (S1)

0.010 -0.041 0.000 2.253 -0.003 -0.003 -0.003 -0.036 -0.041-0.041 15.247 0.225 0.372 0.059 0.203 -2.120 15.750 15.2860.000 0.225 0.005 0.007 0.001 0.004 0.000 0.236 0.2262.253 0.372 0.007 0.018 0.002 0.008 0.000 0.394 0.374-0.003 0.059 0.001 0.002 0.003 0.002 0.001 0.062 0.061-0.003 0.203 0.004 0.008 0.002 0.014 -6.096 0.220 0.207-0.003 -2.120 0.000 0.000 0.001 -6.096 0.002 -0.003 0.000-0.036 15.750 0.236 0.394 0.062 0.220 -.003 16.296 15.797-0.041 15.286 0.226 0.374 0.061 0.207 0.000 15.797 15.331

Tabel 4.5 Matriks kovariansi dari grup II (S2)

0.004 0.001 -0.017 0.000 0.000 -0.002 0.003 -0.019 -0.0110.001 0.011 0.023 -0.003 0.000 -0.004 0.000 0.028 0.030-0.017 0.023 17.657 0.560 0.025 0.115 -0.410 17.346 17.5110.000 -0.003 0.560 0.067 -0.007 0.009 -0.048 0.547 0.5430.000 0.000 0.025 -0.007 0.004 0.000 0.006 0.022 0.025-0.002 -0.004 0.115 0.009 0.000 0.006 -0.008 0.109 0.1060.003 0.000 -0.410 -0.048 0.006 -0.008 0.050 -0.400 -0.394-0.019 0.028 17.346 0.547 0.022 0.109 -0.400 17.059 17.204-0.011 0.030 17.511 0.543 0.025 0.106 -0.394 17.204 17.388

Tabel 4.6 Matriks kovariansi gabungan grup I dan grup II (S)

0,00710 -0,02068 -0,00823 1,16284 -0,00155 -0,00252 -0,00010 -0,02777 -0,02648-0,02068 7,87474 0,12726 0,19055 0,03045 0,10284 -1,09419 8,14258 7,90406-0,00823 0,12726 8,54629 0,27458 0,01261 0,05771 -0,19839 8,51503 8,589711,16284 0,19055 0,27458 0,04171 -0,00235 0,00848 -0,02323 0,46803 0,45577-0,00155 0,03045 0,01261 -0,00235 0,00348 0,00103 0,00342 0,04265 0,04358-0,00252 0,10284 0,05771 0,00848 0,00103 0,01013 -3,15019 0,16629 0,15813-0,00010 -1,09419 -0,19839 -0,02323 0,00342 -3,15019 0,02523 -0,19510 -0,19065-0,02777 8,14258 8,51503 0,46803 0,04265 0,16629 -0,19510 16,66519 16,47781-0,02648 7,90406 8,58971 0,45577 0,04358 0,15813 -0,19065 16,47781 16,32632


41

Tabel 4.7 Matriks invers kovariansi gabungan grup I dan grup II (S)

-0,01700 0,01193 -0,00266 0,86036 0,76920 -0,00744 0,00087 -0,23840 0,210220,01193 96,65082 95,50730 0,11776 19,31475 -33,6860 -0,11417 -28,12754 -68,38186-0,00266 95,50730 94,68444 0,11813 20,59372 -33,2963 -0,11197 -26,36089 -69,185560,86036 0,11776 0,11813 -0,00453 0,42204 -0,04073 -0,00059 0,01615 -0,134680,76920 19,31475 20,59372 0,42204 313,44673 -6,41012 0,06547 13,02384 -34,11482-0,00744 -33,68600 -33,29636 -0,04073 -6,41012 11,73909 -0,27781 9,75143 23,885880,00087 -0,11417 -0,11197 -0,00059 0,06547 -0,27781 -0,00058 0,10213 0,01363-0,23840 -28,12754 -26,36089 0,01615 13,02384 9,75143 0,10213 44,31046 -17,363910,21022 -68,38186 -69,18556 -0,13468 -34,11482 23,88588 0,01363 -17,36391 86,95631

Kemudian fungsi diskriminan linier klasik ditunjukkan sebagai berikut:

Y = 41,13131X1 - 4810,25X2 - 4771,78X3 - 5,94152X4 - 2080106X6 +

1683,34X7 - 13,0409X8 + 714,8802X9 + 4093,957X10 Kebaikan mod-

el diskriminan linier dapat dilihat dari ketepatan klasifikasi masing-

masing kelompok yang dapat dilihat pada Tabel 4.8.




Kelompok I 14 3 17

Kelompok II 4 12 16

Jumlah 18 15 33

Tabel 4.8 menjelaskan bahwa banyak objek yang diklasifikasikan secara

tepat untuk model diskriminan linier pada data 33 kabupaten/kota

adalah sebanyak 26 objek dan banyak objek yang salah klasifikasi se-

banyak 7 objek. Berdasarkan nilai APER, diketahui total proporsi

kesalahan analisis diskriminan linier klasik yaitu sebesar 21,2% sehing-

ga ketepatan pengklasifikasian analisis diskriminan linier klasik yaitu

sebesar 78,8%.

4.3 Analisis Diskriminan Linier Robust

Penaksiran parameter fungsi diskriminan pada analisis diskriminan

linier robust dilakukan dengan mengganti x̄ dan S dengan x̄MCD dan

SMCD yang merupakan vektor rata-rata dan matriks kovariansi dengan

metode fast-MCD. Berdasarkan perhitungan dengan menggunakan dataUNIVERSITAS SUMATERA UTARA

42

yang sudah distandarkan. diperoleh hasil vekror rata-rata dan matriks

kovariansi sebagai berikut:


43

Z̄1 =

9, 30810, 4627, 9239, 5388, 07710, 2319, 7699, 9239, 769

Z̄2 =

9, 0778, 6928, 7699, 2318, 2318, 7698, 4628, 1548, 538

Tabel 4.9 Matriks robust estimate of covariance dari grup I (S1)

701.46 -439.19 444.44 70.08 -83.87 -270.80 198.26 278.02 279.34-439.19 536.02 -444.93 -15.43 63.02 90.92 15.76 -291.32 -445.10444.44 -444.93 505.50 54.49 -44.64 -112.59 72.05 260.13 370.7570.08 -15.43 54.49 672.57 199.41 -107.99 37.58 216.64 -54.16-83.87 63.02 -44.64 199.41 467.09 -299.19 -274.74 162.32 47.43-270.80 90.92 -112.59 -107.99 -299.19 619.40 -43.33 -289.68 -86.00198.26 15.76 72.05 37.58 -274.74 -43.33 516.98 -126.37 -101.76278.02 -291.32 260.13 216.64 162.32 -289.68 -126.37 509.76 328.08279.34 -445.10 370.75 -54.16 47.43 -86.00 -101.76 328.08 546.85

Tabel 4.10 Matriks robust estimate of covariance dari grup II (S2)

-412.571 276.621 -87.268 260.828 106.318 -298.927 -11.723 42.657 -87.757276.621 -505.375 213.612 4.396 -73.918 298.276 -80.105 79.128 54.706-87.268 213.612 -529.797 -103.061 68.382 7.815 -119.343 -322.698 19.863260.828 4.396 -103.061 -538.264 240.639 4.884 93.944 -227.614 183.329106.318 -73.918 68.382 240.639 -639.860 131.879 134.159 5.210 -83.361-298.927 298.276 7.815 4.884 131.879 -614.461 -60.078 -138.555 32.563-11.723 -80.105 -119.343 93.944 134.159 -60.078 -506.352 -108.109 47.05342.657 79.128 -322.698 -227.614 5.210 -138.555 -108.109 -685.122 86.943-87.757 54.706 19.863 183.329 -83.361 32.563 47.053 86.943 -591.016

Tabel 4.11 Matriks robust estimate of covariance gabungan grup I dan grup II(S2)

162,413 -92,830 187,162 162,377 8,156 -284,410 96,655 164,135 101,712-92,830 32,119 -126,281 -5,837 -3,240 191,254 -30,626 -112,071 -203,258187,162 -126,281 4,550 -21,744 10,048 -54,330 -20,560 -21,884 200,966162,377 -5,837 -21,744 86,683 219,360 -53,374 64,853 1,678 60,7548,156 -3,240 10,048 219,360 -68,531 -90,608 -76,886 86,299 -15,856

-284,410 191,254 -54,330 -53,374 -90,608 22,370 -51,434 -216,555 -28,63196,655 -30,626 -20,560 64,853 -76,886 -51,434 21,819 -117,534 -29,754164,135 -112,071 -21,884 1,678 86,299 -216,555 -117,534 -68,409 211,401101,712 -203,258 200,966 60,754 -15,856 -28,631 -29,754 211,401 -3,730


44

Tabel 4.12 Matriks invers robust estimate of covariance (S)

-0,01200 -0,01462 -0,00862 0,00352 0,00099 -0,00418 0,01190 0,00012 0,00261-0,01462 -0,01985 -0,01155 0,00522 0,00250 -0,00228 0,01150 -0,00103 0,00229-0,00862 -0,01155 -0,00579 0,00578 0,00080 0,00346 0,00874 -0,00133 0,008230,00352 0,00522 0,00578 0,00210 0,00334 0,00318 -0,00263 -0,00245 0,000260,00099 0,00250 -0,00080 0,00334 -0,00126 0,00146 -0,00283 0,00146 0,00136-0,00418 -0,00228 0,00346 0,00318 0,00146 0,00162 0,00107 -0,00386 0,002780,01190 0,01150 0,00874 -0,00263 -0,00283 0,00107 -0,00709 -0,00337 -0,005000,00012 -0,00103 -0,00133 -0,00245 0,00146 -0,00386 -0,00337 -0,00002 -0,002460,00261 0,00229 0,00823 0,00026 0,00136 0,00278 -0,00500 -0,00246 -0,00125

Kemudian fungsi diskriminan linier robust ditunjukkan sebagai berikut:

Y = -0,02655X1 - 0,01483X2 + 0,00864X3 + 0,0025X4 - 0,00924X6 -

0,00683X7 - 0,00448X8 - 0,01477X9 - 0,01078X10

Kebaikan model diskriminan linier robust dapat dilihat dari ketepatan

klasifikasi masing-masing kelompok yang dapat dilihat pada Tabel

4.13.




Kelompok I 16 1 17

Kelompok II 1 15 16

Jumlah 17 16 33

Tabel 4.13 menjelaskan bahwa banyak objek yang diklasifikasikan se-

cara tepat untuk model diskriminan linier pada data 33 kabupaten/kota

adalah sebanyak 31 objek dan banyak objek yang salah klasifikasi se-

banyak 2 objek. Berdasarkan nilai APER, diketahui total proporsi

kesalahan analisis diskriminan linier klasik yaitu sebesar 6% sehing-

ga ketepatan pengklasifikasian analisis diskriminan linier klasik yaitu

sebesar 94%.


45

4.4 Perbandingan Hasil Analisis Diskriminan Linier Klasik dan Ana-lisis Diskriminan Linier Robust

Berdasarkan hasil perhitungan, diperoleh total proporsi salah pengk-

lasifikasian analisis diskriminan linier klasik sebesar 21,2% berbeda

dengan analisis diskriminan linier robust yaitu sebesar 6%. Hal ini

terjadi karena jumlah pencilan yang terlalu besar pada data tingkat

kemiskinan kabupaten/kota di Sumatera Utara.


BAB 5

KESIMPULAN DAN SARAN

5.1 Kesimpulan

1. Pengklasifikasian pada data tingkat kemiskinan masyarakat kabu-

paten/kota di Sumatera Utara dengan fungsi diskriminan linier

klasik dua kelompok:

Y = 41,13131X1 - 4810,25X2 - 4771,78X3 - 5,94152X4 - 2080106X6

+ 1683,34X7 - 13,0409X8 + 714,8802X9 + 4093,957X10

menghasilkan total proporsi kesalahan pengklasifikasian sebesar

21,2 %.

2. Pengklasifikasian pada data tingkat kemiskinan masyarakat kabu-

paten/kota di Sumatera Utara dengan fungsi diskriminan linier

robust dua kelompok:

Y = -0,02655X1 - 0,01483X2 + 0,00864X3 + 0,0025X4 - 0,00924X6

- 0,00683X7 - 0,00448X8 - 0,01477X9 - 0,01078X10 menghasilkan

total proporsi kesalahan pengklasifikasian sebesar 6 %.

3. Model diskriminan linier robust mengklasifikasikan objek lebih

tepat dari model diskriminan linier klasik. Hal ini dapat dilihat

dari total proporsi kesalahan pengklasifikasian sebesar 6 persen,

lebih kecil dari total proporsi kesalahan pengklasifikasian model

diskriminan linier klasik yaitu sebesar 21,2 persen. Hal ini terjadi

karena jumlah pencilan yang besar pada data tingkat kemiskinan

kabupaten/kota di Sumtera Utara.

5.2 Saran

1. Analisis diskriminan linier yang digunakan pada penelitian ini

masih terbatas pada dua kelompok saja sehingga perlu dilakukan

penelitian untuk analisis diskriminan lebih dari dua kelompok.

46


47

2. Analisis diskriminan linier robust pada penelitian ini hanya meng-

gunakan metode fast-MCD sehingga memungkinkan penelitian

selanjutnya untuk menggunakan penaksir robust yang lain.


DAFTAR PUSTAKA

Charnes., Cooper E., dan Rhodes (1978). Measuring the Efficiency ofDecision Making Units. EJOR. 2, 429-444.

Dia, M. (2009). A Portfolio Selection Methodology Based on DataEnvelopment Analysi. INFOR:Information Systems and Opera-tional Research. 47, 71- 79.

Dillon, W.R., dan Goldstein, M. (1984). Multivariate Analysis: Meth-ods and Applications. Newyork.

Elton, J.E. dan Gruber, M.J (1995). Modern Portfolio Theory AndInvestment Analysis 5th Edition. John Wiley and Sons.

Fischer, E.D. dan Ronald, J.J (1995). Security Analysis And portofo-lio Management 6th Edition. Prentice Hall Inc.

Jemric, I. dan Vujcic, B. (2002). Efficiency of Bank in Croatia. A DEAApproach Comparative Economin Studies. XLIV, 2, 169-193.

Ke, J., Qiao, J., dan Wang, G.(2008). Emperical Analysis of PortfolioOptimization Based on DEA model. International Seminar onFuture Information Technology and Management Engineering.pp. 490-493.

Ling., Oang, P., dan Kamil, A.A (2010). Data Envelopment Analy-sis (DEA) for Stocks Selection on Bursa Malaysia. School ofDistance Education 11800 USM, Penang, Malaysia.

Marcus, V.A., Marcelo, L.C., Aline, B.S., dan Ana, L.M. (2010). Opti-mization of Selected Portfolios Using Data Envelopment Analysis.Proceedings of The 8th International Conference of DEA.

Markowitz, H.M. (1952) . Portfolio Selection. Journal of Finance.Vol.7 (1). p.77-91.

Moehering, A. (2013). Markowitz Portfolio Optimization with MatrixAlgebra. Linear Algebra Term Paper. Spring.

Ogryczak, W.(2000). Multiple criteria linear programming model forportfolio selection. Annals of Operations Research. 97, 143-162.

Reilly, F.K., dan Brown, K.C. (2000). Investment Analysis and Port-folio Management (6th Edition). USA: Harcourt, Inc.

Saaty, T. L., Rogers, P. C., dan Pell, R. (1980). Portfolio selectionthrough hierarchies. The Journal of Portfolio Management. 6,16-21.

Tiryaki, F., dan Ahlatcioglu, M. (2005). Fuzzy stock selection using anew fuzzy ranking and weighting algorithm. Applied Mathematicsand Computation. 170, 144-157.

Tola, V., Lillo, F., Gallegati, M., dan Mantegna, R.N. (2005). ClusterAnalysis for Portofolio Optimization. Physics.soc-ph.

48


49

Zhang, W. G. dan Nie, Z. K.(2004). On admissible efficient portfolioselection problem. Applied Mathematics and Computation. 159,357-371.


pengklasifikasian objek dengan analisis diskriminan …

Documents