anova untuk analisis rata-rata respon mahasiswa...

83
Prosiding SNMPM Universitas Sebelas Maret 2013 Volume 2 Makalah Pendamping: Matematika 3 233 ANOVA UNTUK ANALISIS RATA-RATA RESPON MAHASISWA KELAS LISTENING Novatiara Fury Pritasari 1) , Hanna Arini Parhusip 2) , Bambang Susanto 3) 1) Mahasiswa Program Studi Matematika FSM UKSW 2), 3) Dosen Program Studi Matematika FSM UKSW Fakultas Sains dan Matematika, Universitas Kristen Satya Wacana Jl. Diponegoro 52-60 Salatiga 50711 1) [email protected] , 2) [email protected] , 3) [email protected] Abstract Data pengukuran berulang (repeated measures) memiliki struktur data longitudinal. Dalam makalah ini, data longitudinal yang dianalisa adalah data hasil penyebaran kuesioner mahasiswa FBS UKSW pada 2 kelas Listening FBS UKSW yang berbeda selama 3 kali pertemuan (3 minggu). Adapun tujuan dari makalah ini adalah untuk mengetahui apakah ada perbedaan yang signifikan antara respon mahasiswa kelas Listening terhadap pertanyaan yang diteliti pada setiap kelas menggunakan one-wayrepeated measures dan dua kelas yang bebeda menggunakan two-way repeated measures. Analisis data menggunakan program SPSS 16.0 sebagai alat bantu. Berdasarkan pengujian one-way repeated measures, pada Kelas A ada perbedaan yang signifikan yaitu ada perbedaan respon minggu kedua dengan minggu ketiga. Sedangkan respon mahasiswa pada Kelas B tidak berbeda secara signifikan. Pada pengujian two-way repeated measuresada perbedaan respon Kelas A dan Kelas B, tetapi tidak ada perbedaan respon mahasiswa dari minggu pertama sampai minggu ketiga. Untuk interaksi Kelas dan Rata-rata respon mahasiswa menunjukkan bahwa respon mahasiswa tergantung pada dua kelas yang berbeda. Kata Kunci:One-way repeated measures, two-way repeated measures PENDAHULUAN Pritasari dkk (2013) telah membahas perbedaan respon mahasiswa kelas Listening antar dua minggu yang berbeda dalam tiga minggu yang bertujuan untuk mengetahui perbedaan respon mahasiswa menggunakan paired comparisons. Pada pengujian tersebut disimpulkan bahwa pada kelas A minggu ke-1 dengan minggu ke-3 tidak ada perbedaan respon mahasiswa. Tetapi pada minggu ke-1 dengan minggu ke-2 dan minggu ke-2 dengan minggu ke-3 ada perbedaan respon. Sedangkan pada kelas B tidak ada perbedaan respon mahasiswa pada minggu ke-2 dengan minggu ke-3, tetapi pada minggu ke-1 dengan minggu ke-2 dan minggu ke-1 dengan minggu ke-3 ada perbedaan respon. Hal ini juga diperkuat dengan hasil analisa penghitungan daerah konfidensi 95%. Dalam makalah ini ANOVA digunakan untuk menganalisis data yang sama.ANOVA adalah suatu metode untuk menguji hipotesis kesamaan rata-rata dari tiga atau lebih populasi. Analisis terhadap data pengukuran berulang tersebut dilakukan untuk menyelidiki apakah ada perbedaan yang signifikan antara respon mahasiswa kelas Listening pada setiap kelas dan dua kelas yang berbedamenggunakan one-wayrepeated measures dan two-way repeated measures. Program SPSS 16.0 digunakan sebagai alat bantu untuk melakukan analisis data.

Upload: duongdang

Post on 22-Mar-2019

230 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: ANOVA UNTUK ANALISIS RATA-RATA RESPON MAHASISWA …math.fkip.uns.ac.id/wp-content/uploads/2014/06/Ruang-9.pdf · Makalah Pendamping: Matematika 3 233 ANOVA UNTUK ANALISIS RATA-RATA

Prosiding SNMPM Universitas Sebelas Maret 2013 Volume 2

Makalah Pendamping: Matematika 3 233

ANOVA UNTUK ANALISIS RATA-RATA RESPON MAHASISWA KELAS

LISTENING

Novatiara Fury Pritasari

1), Hanna Arini Parhusip

2), Bambang Susanto

3)

1) Mahasiswa Program Studi Matematika FSM UKSW 2), 3)

Dosen Program Studi Matematika FSM UKSW

Fakultas Sains dan Matematika, Universitas Kristen Satya Wacana

Jl. Diponegoro 52-60 Salatiga 50711 1)

[email protected], 2)

[email protected], 3)

[email protected]

Abstract

Data pengukuran berulang (repeated measures) memiliki struktur data longitudinal. Dalam

makalah ini, data longitudinal yang dianalisa adalah data hasil penyebaran kuesioner

mahasiswa FBS UKSW pada 2 kelas Listening FBS UKSW yang berbeda selama 3 kali

pertemuan (3 minggu). Adapun tujuan dari makalah ini adalah untuk mengetahui apakah ada

perbedaan yang signifikan antara respon mahasiswa kelas Listening terhadap pertanyaan yang

diteliti pada setiap kelas menggunakan one-wayrepeated measures dan dua kelas yang bebeda

menggunakan two-way repeated measures. Analisis data menggunakan program SPSS 16.0

sebagai alat bantu. Berdasarkan pengujian one-way repeated measures, pada Kelas A ada

perbedaan yang signifikan yaitu ada perbedaan respon minggu kedua dengan minggu ketiga.

Sedangkan respon mahasiswa pada Kelas B tidak berbeda secara signifikan. Pada pengujian

two-way repeated measuresada perbedaan respon Kelas A dan Kelas B, tetapi tidak ada

perbedaan respon mahasiswa dari minggu pertama sampai minggu ketiga. Untuk interaksi

Kelas dan Rata-rata respon mahasiswa menunjukkan bahwa respon mahasiswa tergantung pada

dua kelas yang berbeda.

Kata Kunci:One-way repeated measures, two-way repeated measures

PENDAHULUAN

Pritasari dkk (2013) telah membahas perbedaan respon mahasiswa kelas Listening antar dua

minggu yang berbeda dalam tiga minggu yang bertujuan untuk mengetahui perbedaan respon

mahasiswa menggunakan paired comparisons. Pada pengujian tersebut disimpulkan bahwa pada

kelas A minggu ke-1 dengan minggu ke-3 tidak ada perbedaan respon mahasiswa. Tetapi pada

minggu ke-1 dengan minggu ke-2 dan minggu ke-2 dengan minggu ke-3 ada perbedaan respon.

Sedangkan pada kelas B tidak ada perbedaan respon mahasiswa pada minggu ke-2 dengan minggu

ke-3, tetapi pada minggu ke-1 dengan minggu ke-2 dan minggu ke-1 dengan minggu ke-3 ada

perbedaan respon. Hal ini juga diperkuat dengan hasil analisa penghitungan daerah konfidensi

95%.

Dalam makalah ini ANOVA digunakan untuk menganalisis data yang sama.ANOVA adalah

suatu metode untuk menguji hipotesis kesamaan rata-rata dari tiga atau lebih populasi. Analisis

terhadap data pengukuran berulang tersebut dilakukan untuk menyelidiki apakah ada perbedaan

yang signifikan antara respon mahasiswa kelas Listening pada setiap kelas dan dua kelas yang

berbedamenggunakan one-wayrepeated measures dan two-way repeated measures. Program SPSS

16.0 digunakan sebagai alat bantu untuk melakukan analisis data.

Page 2: ANOVA UNTUK ANALISIS RATA-RATA RESPON MAHASISWA …math.fkip.uns.ac.id/wp-content/uploads/2014/06/Ruang-9.pdf · Makalah Pendamping: Matematika 3 233 ANOVA UNTUK ANALISIS RATA-RATA

Volume 2 Prosiding SNMPM Universitas Sebelas Maret 2013

234 Makalah Pendamping: Matematika 3

METODE PENELITIAN

Jenis Penelitian

Penelitian ini menggunakan pendekatan kuantitatif.

Waktu dan Tempat Penelitian

Penyebaran kuesioner dilakukan pada kelas Listening Fakultas Bahasa dan Sastra (FBS)

UKSW selama tiga kali pertemuan pada setiap hari Senin tanggal 11, 18, dan 25 Februari 2013

untuk kelas A. Sedangkan untuk kelas B setiap hari Kamis tanggal 14, 21, dan 28 Februari 2013.

Target atau Subjek Penelitian

Subjek dari penelitian ini adalah mahasiswa baru kelas Listening FBS UKSW pada dua

kelas yang berbeda.

Data dan Teknik Pengumpulan Data

Data yang digunakan adalah data sekunder dari penelitian Rahandika(2013). Data tersebut

diperoleh melalui penyebaran kuesioner yang berisi 13 pertanyaan yang sama di setiap minggu

untuk 29 mahasiswa pada 2 kelas Listening FBS-UKSW selama tiga kali pertemuan. Isi

kuesioner mengenai persepsi mahasiswa tentang variasi latihan pada kelas Listening. Jenis data

adalah data skala 1-5 (skala likert) sebagai skala untuk menyatakan berturut-turut sangat tidak

setuju hingga sangat setuju.

Teknik Analisis Data

ANOVA adalah suatu modelyangcukup komprehensif untukmendeteksi perbedaan

kelompok pada variabel terikat tunggal. Teknik yang lebih umum biasa dikenal sebagai multivariat

analisis varians (MANOVA). MANOVA dapat dianggap sebagai ANOVA untuk situasi dimana

ada beberapa variabel terikat. Pada Tabel 1 dijelaskan perbedaan dari ANOVA dan MANOVA.

Informasi lebih lengkap dapat dilihat di Field(2009) dan Stevens (2009).

Tabel 1. Perbedaan ANOVA dan MANOVA

ANOVA MANOVA

Hanya satu variabel terikat Beberapa variabel terikat

Menguji perbedaan mean pada

variabel terikat untuk beberapa

variabel bebas

Menguji perbedaan vektor mean

beberapa variabel terikat

Sedangkan perbedaan one-way repeated measures dan two-way repeated measures hanya

pada variabel bebas. One-way repeated measures menggunakan satu variabel bebas dan two-way

repeated measures menggunakan dua variabel bebas.

a. Repeated Measures (Pengukuran Berulang) ANOVA

Repeated measures adalah pengukuran berulang terhadap sekumpulan obyek atau partisipan

yang sama. Pada prinsipnya Repeated Measures ANOVA sama dengan paired t-test untuk

membandingkan rata-rata dua sampel yang saling berhubungan. Perbedaannya dengan ANOVA

Page 3: ANOVA UNTUK ANALISIS RATA-RATA RESPON MAHASISWA …math.fkip.uns.ac.id/wp-content/uploads/2014/06/Ruang-9.pdf · Makalah Pendamping: Matematika 3 233 ANOVA UNTUK ANALISIS RATA-RATA

Prosiding SNMPM Universitas Sebelas Maret 2013 Volume 2

Makalah Pendamping: Matematika 3 235

adalah sampel uji ini adalah sampel pengukuran berulang, sementara ANOVA mensyaratkan

sampel bebas.

One-way repeated measures ANOVA biasanya digunakan untuk membandingkan nilai

disain sebelum dan sesudah partisipan yang sama pada satu grup. Sedangkan two-way repeated

measures ANOVA membandingkan pada dua grup. (Web 4)

Dalam disain general linear model repeated measures, level dari within subject factor

mewakili beberapa pengamatan dari skala waktu ke waktu dalam kondisi yang berbeda. Ada 3 jenis

tes yang dilakukan jika within subject factormemiliki lebih dari dua level, yaitustandar univariat uji

F, uji univariat alternatif, dantes multivariat. Tiga jenistes ini mengevaluasi hipotesis yang sama,

rata-rata populasisama untuk semua level pada faktor (Web 1).

Standarunivariatuji F ANOVAtidak dianjurkanketikawithin subject factormemiliki lebih

daridua levelkarenapadaasumsitersebut, asumsi Sphericity umumnyadilanggardanuji F

ANOVAmenghasilkan p-value yangakuratsejauhasumsiini dilanggar.

Tes univariat alternatif memperhitungkan pelanggaran asumsi Sphericity. Tes ini menggunakan

penghitungan statistik F yang sama dengan standar univariat tes. Namun p-value berpotensi

berbeda. Dalam menentukan p-value, sebuah epsilon statistikdihitung berdasarkan data sampel

untuk mengetahui derajat yang melanggar asumsi Sphericity. Pembilang dan penyebut derajat

kebebasan uji standar dikalikan dengan epsilon untuk mendapatkan serangkaian derajat

kebebasanyang sudah dikoreksi untuk membuat nilai F yang baru dan menentukan p-value.

Uji multivariat tidak memerlukan asumsi Sphericity. Perbedaan nilai

dihitung dengan membandingkan nilai-nilai dari berbagai levelwithin subject factor.Misalnya

untuk within subject factor dengan tiga level, nilai perbedaan mungkin

dihitung antara level pertama dengan kedua dan antara level kedua dengan ketiga. Uji

multivariat kemudian akan mengevaluasi apakah rata-rata populasi untuk nilai perbedaan kedua

pasangan secara simultan sama dengan nol. Tes ini tidak hanyamengevaluasi rata-rata terkait

dengan dua pasangan nilai perbedaan, tetapi juga mengevaluasi apakah rata-rata dari nilai

selisih antara level pertama dan ketiga faktor tersebut sama dengan nol sebagaikombinasi linier

dari nilai perbedaan.

Menurut Carey (1998), semua perhitungan statistik multivariat didasarkan pada akar-akar

karakteristik dari matriks A yang dibentuk dari

𝐴 = 𝐻𝐸−1 (1)

dengan H : matriks varians-kovarians perlakuan pada MANOVA

E : matriks varians-kovarians error pada MANOVA.

Dalam uji multivariat sendiri ada beberapa uji yang digunakan, yaitu:

Wilks’ Lamda

Page 4: ANOVA UNTUK ANALISIS RATA-RATA RESPON MAHASISWA …math.fkip.uns.ac.id/wp-content/uploads/2014/06/Ruang-9.pdf · Makalah Pendamping: Matematika 3 233 ANOVA UNTUK ANALISIS RATA-RATA

Volume 2 Prosiding SNMPM Universitas Sebelas Maret 2013

236 Makalah Pendamping: Matematika 3

Statistik uji digunakan jika asumsi homogenitas dipenuhi. Nilai Wilks’ Lamda berkisar

antara 0-1. Statistik uji ini yang sering dipakai (Web 2). Statistik uji Wilks’ Lamda dirumuskan

sebagai:

𝛬 = 𝐸

𝐻+𝐸 =

1

1+𝜆𝑖

𝑠𝑖=1 (2)

dengan 𝛬 : Wilks’ Lamda; 𝐸 : determinan dari matriks E;𝑠 : banyaknya akar-akar karakteristikdari

matriks A;𝜆𝑖 : akar-akar karakteristik ke-i matriks A.

Statistik Wilks’ Lamda di atas dapat ditransformasikan menjadi suatu statistik yang

berdistribusi F. Khususnya

Kasus 1: 𝑝 = 1,𝑔 ≥ 2

1−𝛬

𝛬 𝑛−𝑔

𝑔−1 ~ 𝐹𝑔−1,𝑛−𝑔 . (3)

Kasus 2: 𝑝 ≥ 1,𝑔 = 2

1−𝛬

𝛬 𝑛−𝑝−1

𝑝−1 ~ 𝐹𝑝 ,𝑛−𝑝−1 (4)

dengan 𝑝 : banyaknya variabel; 𝑔 : banyaknya grup; 𝑛 : banyaknya partisipan.

Informasi lebih lanjut dapat dilihat pada Patel dkk (2013).

Pillai’s Trace

Statistik uji ini paling cocok digunakan jika asumsi homogenitas tidak dipenuhi (Web 2).

Statistik uji Pillai’s Trace 𝑉 dirumuskan sebagai:

𝑉 = 𝑡𝑟𝑎𝑐𝑒 𝐻 𝐻 + 𝐸 −1 = 𝜆𝑖

1+𝜆𝑖

𝑠𝑖=1 . (5)

Beberapa ahli statistik menganggapnya paling kuat dari 4 statistik yang lain.

Adapun aturan pengujiannya adalah tolak 𝐻0 ketika 𝑉 ≥ 𝐶, dengan nilai 𝐶 diperoleh dari tabel nilai

kritis statistik tersebut (Giri, 2004).

Hotelling’s Trace

Statistik uji ini jarang digunakan oleh para ahli (Web 2). Berikut rumus dari Hotelling’s

Trace:

𝐻𝑜𝑡𝑒𝑙𝑙𝑖𝑛𝑔 = 𝑡𝑟𝑎𝑐𝑒 𝐻𝐸−1 = 𝜆𝑖𝑠𝑖=1 . (6)

Statistik Hotelling’s Trace di atas dapat ditransformasikan menjadi suatu statistik yang

berdistribusi F (Web 3). Khususnya

𝑣1

𝑣2×

𝐻𝑜𝑡𝑒𝑙𝑙𝑖𝑛𝑔

𝑛 𝑚𝑖𝑛 𝑝 ,𝑞1 ~𝐹𝑣1 ,𝑣2

, (7)

dimana 𝑣1 = 𝑝𝑞1 dan 𝑣2 = 𝑛 − 𝑝 − 1 𝑚𝑖𝑛 𝑝, 𝑞1 , dengan p : akar-akar karakteristik dari matriks

A; n : banyaknya partisipan.

Adapun aturan pengujiannya adalah tolak 𝐻0 ketika 𝐻𝑜𝑡𝑒𝑙𝑙𝑖𝑛𝑔 ≥ 𝐶, dengan nilai 𝐶 diperoleh dari

tabel nilai kritis statistik tersebut (Giri, 2004).

Roy’s Largest Root

Page 5: ANOVA UNTUK ANALISIS RATA-RATA RESPON MAHASISWA …math.fkip.uns.ac.id/wp-content/uploads/2014/06/Ruang-9.pdf · Makalah Pendamping: Matematika 3 233 ANOVA UNTUK ANALISIS RATA-RATA

Prosiding SNMPM Universitas Sebelas Maret 2013 Volume 2

Makalah Pendamping: Matematika 3 237

Roy’s Largest Root digunakan jika asumsi dipenuhi dan berkorelasi dengan kuat. Tetapi uji

ini harus hati-hati dalam penggunaanya (Web 2).

𝑅𝑜𝑦′𝑠 𝐿𝑎𝑟𝑔𝑒𝑠𝑡 𝑅𝑜𝑜𝑡 = 𝑚𝑎𝑥 𝜆𝑖 . (8)

Adapun aturan pengujiannya adalah tolak 𝐻0 ketika 𝑅𝑜𝑦′𝑠 𝐿𝑎𝑟𝑔𝑒𝑠𝑡 𝑅𝑜𝑜𝑡 ≥ 𝐶, dengan nilai 𝐶

diperoleh dari tabel nilai kritis statistik tersebut (Giri, 2004).

Keempat tes multivariat tersebut menggunakan uji statistik sebagai berikut:

𝐻0: 𝜇1 = 𝜇2 = ⋯ = 𝜇𝑘 (tidak ada perbedaan antar perlakuan)

𝐻𝑎 : 𝜇1 ≠ 𝜇2 ≠ ⋯ ≠ 𝜇𝑘 (setidaknya ada perbedaan antar dua perlakuan).

Kriteria pengujiannya tolak 𝐻0 jika p-value < 0.05 dan 𝐹𝑕𝑖𝑡𝑢𝑛𝑔 > 𝐹𝑡𝑎𝑏𝑒𝑙 .

b. Sphericity

Pada dasarnya, asumsi Sphericitymengacu padakesamaanvariansdariperbedaan diantaralevel

pada faktorrepeated measures.Dengan kata lain, kitamenghitungperbedaanantara setiap

pasanganlevelfaktorrepeated measuresdankemudian

menghitungvariansdarinilaiperbedaan.Sphericitymensyaratkan bahwavariansuntuk

setiapnilaiperbedaansama. Kita mengasumsikanbahwa hubunganantara tiap

pasangkelompokadalahsama. Untuk menguji asumsi Sphericity dapat menggunakan tes Mauchly,

uji Greenhouse Geisser dan tes Huynh Feldt.

Hipotesis untuk Sphericity:

𝐻0: 𝜎𝑦1−𝑦22 = 𝜎𝑦1−𝑦3

2 = 𝜎𝑦2−𝑦32 (tidak ada perbedaan yang signifikan diantara varians perbedaan)

𝐻𝑎 : 𝜎𝑦1−𝑦22 ≠ 𝜎𝑦1−𝑦3

2 ≠ 𝜎𝑦2−𝑦32 (ada perbedaan yang signifikan diantara varians perbedaan)

dengan 𝑦1 − 𝑦2 : perbedaan level 1 dengan level 2 pada faktorrepeated measure

𝑦1 − 𝑦3 : perbedaan level 1 dengan level 3 pada faktorrepeated measure

𝑦2 − 𝑦3 : perbedaan level 2 dengan level 3 pada faktorrepeated measure.

Kriteria pengujiannya tolak 𝐻0 jika hasil p-value dari Mauchly Tests< 0.05, yang artinya

bahwa ada perbedaan yang signifikan diantara varians perbedaan, dengan kata lain bahwa kondisi

Sphericity tidak ditemui (Field, 2012). Jika tes Mauchly dari Sphericity tidak signifikan, maka tes

within-subjects effects dapat dilakukan. Sedangkan jika tes Mauchly dari Sphericity signifikan, tes

multivariat yang digunakan (Ho, 2006).

Jika data melanggar asumsi Sphericity, ada beberapa pembenaran yang dapat diterapkan

untuk menghasilkan rasio Fyang valid. SPSS membuat tiga pembenaran berdasarkan perkiraan

Sphericity yang dianjurkan oleh Greenhouse Geisser dan Huynh Feldt. Kedua perkiraan ini

menimbulkan faktor koreksi yang diterapkan pada derajat kebebasan yang digunakan untuk menilai

rasio Fyang telah diteliti.

Koreksi Greenhouse Geisser biasanya dilambangkan dengan 𝜀 bervariasi antara 1

𝑘−1 dan 1,

dimana k adalah jumlah kondisi repeated measures. Semakin 𝜀 dekat ke 1, varians dari perbedaan

semakin homogen.

Page 6: ANOVA UNTUK ANALISIS RATA-RATA RESPON MAHASISWA …math.fkip.uns.ac.id/wp-content/uploads/2014/06/Ruang-9.pdf · Makalah Pendamping: Matematika 3 233 ANOVA UNTUK ANALISIS RATA-RATA

Volume 2 Prosiding SNMPM Universitas Sebelas Maret 2013

238 Makalah Pendamping: Matematika 3

Ketika estimasi Greenhouse Geisser lebih besardari 0,75 maka hipotesis nol ditolak. Ketika

perkiraan Sphericity lebihbesar dari 0.75 maka koreksi Huynh Feldtharus digunakan, tetapi ketika

perkiraan Sphericity kurang dari 0,75 atau Sphericity sama sekali tidak diketahui maka koreksi

Greenhouse Geisser harus digunakansebagai gantinya(Field, 2009).

c. Pengukuran Pengaruh atau Dampak

Ukuran pengaruh keseluruhan untuk pendekatan univariat adalah parsial eta kuadrat 𝜂2

dan dapat dihitung menggunakan persamaan berikut:

Parsial𝜂𝑓𝑎𝑐𝑡𝑜𝑟2 =

𝑆𝑆𝑓𝑎𝑐𝑡𝑜𝑟

𝑆𝑆𝑓𝑎𝑐𝑡𝑜𝑟 +𝑆𝑆𝑒𝑟𝑟𝑜𝑟. (9)

Ukuran pengaruh keseluruhan untuk uji multivariat terkait dengan Wilks’ Lamda 𝛬 adalah

multivariat eta kuadrat dan dapat dihitung menggunakan persamaan berikut:

Multivariat𝜂2 = 1 − 𝛬. (10)

Nilai parsial eta kuadrat dan multivariat eta kuadrat berkisar antara 0 sampai 1. Nilai 0

menunjukkan tidak ada hubungan antara faktor repeated measures dan variabel terikat, sedangkan

nilai 1 menunjukkan adanya hubungan yang kuat. (Web 1)

d. Pairwise Comparisons

Desain within-subjects direkomendasikan menggunakan pendekatan Bonferroni.

Pendekatan ini harus digunakan terlepas dari apakah peneliti merencanakan untuk menguji semua

perbandingan berpasangan atau hanya membuat keputusan untuk memeriksa data (Maxwell dkk,

2004)

Uji statistik disusun sebagai berikut:

𝐻0 : 𝜇1 = 𝜇2 = ⋯ = 𝜇𝑘 (tidak ada perbedaan antar perlakuan)

𝐻𝑎 : 𝜇1 ≠ 𝜇2 ≠ ⋯ ≠ 𝜇𝑘 (ada perbedaan antar perlakuan).

Kriteria pengujiannya tolak 𝐻0 jika p-value < 0.05.

Prosedur

a. Variabel Penelitian

1. Variabel terikat (level) : banyaknya perlakuan, yaitu minggu pertama, minggu kedua dan

minggu ketiga.

2. Variabel bebas (faktor repeated measures) :

One-way repeated measures: rata-rata respon mahasiswa.

Two-way repeated measures : kelas dan rata-rata respon mahasiswa.

b. Langkah-langkah dalam Analisis Data

1. Menghitung rata-rata respon tiap mahasiswa pada tiap minggu.

2. Menganalisa hasil Sphericity. Jika signifikan (p-value< 0.05) dilanjutkan tes multivariat,

sebaliknya jika tidak signifikan dilanjutkan tes within-subject effects.

Page 7: ANOVA UNTUK ANALISIS RATA-RATA RESPON MAHASISWA …math.fkip.uns.ac.id/wp-content/uploads/2014/06/Ruang-9.pdf · Makalah Pendamping: Matematika 3 233 ANOVA UNTUK ANALISIS RATA-RATA

Prosiding SNMPM Universitas Sebelas Maret 2013 Volume 2

Makalah Pendamping: Matematika 3 239

3. Jika dilanjutkan tes multivariat, setelah itu menganalisa keempat uji pada tes multivariat.

Tolak Ho saat p-value < 0.05 dan sebaliknya. Untuk memperkuat hasil tersebut,kemudian

menghitung nilai-nilai dari keempat uji menggunakan persamaan (1), (2) , (5), (6) dan (8).

Statistik uji yang dianalisis adalah Wilks’ Lamda sehingga untuk menghitung penolakan Ho

digunakan persamaan (3) dan (4). Tolak Ho saat 𝐹𝑕𝑖𝑡𝑢𝑛𝑔 > 𝐹𝑡𝑎𝑏𝑒𝑙 dan sebaliknya.

4. Jika dilanjutkan tes within-subject effects, setelah itu menganalisa p-value dari Greenhouse

Geisser dan Huynh-Feldt. Tolak Ho saat p-value < 0.05 dan sebaliknya. Untuk

memperkuat hasil tersebut, kemudian membuat perubahan derajat kebebasan untuk

pembilang dan penyebut yang baru.

5. Menghitung pengaruh faktor dari repeated measures menggunakan persamaan (9) atau

(10).

6. Menganalisa hasil p-value dari Pairwise Comparisons. Tolak 𝐻0 jika p-value < 0.05.

HASIL PENELITIAN DAN PEMBAHASAN

One-Way Repeated Measures

Kasus 1

Akan diuji apakah ada perbedaan yang signifikan pada Kelas A minggu pertama, minggu

kedua dan minggu ketiga. Hasil dari analisis mengindikasikan bahwa tes Mauchlydari Sphericity

signifikan (p-value = 0 < 0.05). Artinya bahwa ada perbedaan yang signifikan diantara varians

perbedaan, dengan kata lain bahwa kondisi Sphericity tidak ditemui. Oleh karena itu, teswithin-

subject effects tidak dapat digunakan, tetapi yang dapat digunakan adalah tes multivariat.

Dari Tabel 2a dapat disimpulkan bahwa rata-rata minggu pertama sampai rata-rata minggu

ketiga semakin meningkat, tetapi perbedaannya tidak terlalu jauh. Sedangkan standart deviasi dari

minggu pertama sampai minggu ketiga semakin menurun.

Tabel 2a. Rata-rata dan standar deviasi

Kelas A

Mean Standart Deviasi

Minggu pertama 4.019 0.396

Minggu kedua 4.098 0.296

Minggu ketiga 4.223 0.232

Tabel 2b. Hasil dari tes multivariat untuk

Kelas A minggu pertama, kedua dan ketiga

Untuk mengetahui apakah rata-rata dari minggu pertama sampai minggu ketiga berbeda

secara signifikan, dapat dilakukan tes multivariat dengan melihat Tabel 2b. Dari semua uji

diperoleh kesimpulan bahwa semua menolak Ho karena semua uji menghasilkan p-value yang

Nama Uji p-value

Pillai’s Trace 0.008

Wilks’ Lamda 0.008

Hotelling’s Trace 0.008

Roy’s Largest Root 0.008

Page 8: ANOVA UNTUK ANALISIS RATA-RATA RESPON MAHASISWA …math.fkip.uns.ac.id/wp-content/uploads/2014/06/Ruang-9.pdf · Makalah Pendamping: Matematika 3 233 ANOVA UNTUK ANALISIS RATA-RATA

Volume 2 Prosiding SNMPM Universitas Sebelas Maret 2013

240 Makalah Pendamping: Matematika 3

sama yaitu 0.008 < 0.05. Maka ada perbedaan yang signifikan antara rata-rata respon

mahasiswa pada minggu pertama sampai minggu ketiga.

Pada tes multivariat yang meliputi uji Pillai’s Trace, Wilks’ Lamda, Hotelling’s Trace

dan Roy’s Largest Root, nilai-nilai dari keempat uji tersebut juga digunakan untuk memperkuat

hasil hipotesis. Setiap uji dapat dihitung nilainya dengan menghitung akar-akar karakteristik

terlebih dahulu. Dengan menggunakan persamaan (1) dapat diperoleh:

𝐻 = 0.605 0.0770.077 0.010

, 𝐸 = 3.262 −1.876−1.876 2.305

dan 𝐸−1 = 0.5763 0.46910.4691 0.8156

.

Sehungga matriks 𝐴 = 0.3848 0.34660.0491 0.0443

dan didapatkan akar-akar karakteristik 0.42900.0001

.

Setelah akar-akar karakteristik diperoleh maka uji-uji dalam tes multivariat dapat dihitung

menggunakan persamaan (2), (5), (6) dan (8) sehingga diperoleh:

𝛬 =1

1+0.4290 .

1

1+0.0001= 0.6997; 𝑉 =

0.4290

1+0.4290+

0.0001

1+0.0001= 0.3003

𝐻𝑜𝑡𝑒𝑙𝑙𝑖𝑛𝑔 = 0.4290 + 0.0001 = 0.4291; 𝑅𝑜𝑦′𝑠 𝐿𝑎𝑟𝑔𝑒𝑠𝑡 𝑅𝑜𝑜𝑡 = 0.4290.

Dalam kasus ini yang dianalisis adalah 1 variabel dan 3 grup. Dari persamaan (3) diperoleh

statistik F (hanya untuk Wilks Lamda karena uji yang lain tabel nilai kritis tidak diketahui)

𝐹𝑕𝑖𝑡𝑢𝑛𝑔 = 1−0.6997

0.6997

29−3

3−1 = 5.5794.

Dengan𝛼 = 0.05 diperoleh nilai dari 𝐹𝑡𝑎𝑏𝑒𝑙 yaitu 𝐹3−1,29−3 = 𝐹2,26 = 3.37. Jadi 𝐻0 ditolak

karena𝐹𝑕𝑖𝑡𝑢𝑛𝑔 > 𝐹𝑡𝑎𝑏𝑒𝑙 . Artinya bahwa ada perbedaan yang signifikan antara rata-rata respon

mahasiswa pada minggu pertama sampai minggu ketiga.

Kemudian mengukur pengaruh rata-rata respon mahasiswa tersebut menggunakan

multivariat eta kuadrat sehingga diperoleh

Multivariat𝜂2 = 1 − 0.6997 = 0.3003.

Dari hasil tersebut menunjukkan bahwa tidak ada hubungan antara rata-rata respon mahasiswa

dan perlakuan yang diberikan setiap minggunya.

Tabel 2d menunjukkan semua perbandingan berpasangan (dengan interval konfidensi

Bonferroni) diantara 3 level. Dengan membandingkan respon setiap minggunya, kita dapat

memasang-masangkan data rata-rata respon antar minggu pertama sampai minggu ketiga.

Tabel 2d. Hasil analisa perbandingan berpasangan Kelas A

Respon mahasiswa p-value Analisa

Minggu ke-1 dan ke-2 1 𝐻0 diterima

Minggu ke-1 dan ke-3 0.092 𝐻0 diterima

Minggu ke-2 dan ke-3 0.042 𝐻0 ditolak

Page 9: ANOVA UNTUK ANALISIS RATA-RATA RESPON MAHASISWA …math.fkip.uns.ac.id/wp-content/uploads/2014/06/Ruang-9.pdf · Makalah Pendamping: Matematika 3 233 ANOVA UNTUK ANALISIS RATA-RATA

Prosiding SNMPM Universitas Sebelas Maret 2013 Volume 2

Makalah Pendamping: Matematika 3 241

Dapat dilihat dari Tabel 2d, dengan = 5% maka rata-rata respon mahasiswa minggu

kedua dan minggu ketiga berbeda secara signifikan (p-value< 0.05). Rata-rata respon

mahasiswa minggu pertama dengan minggu kedua dan rata-rata respon minggu pertama dengan

minggu ketiga tidak berbeda secara signifikan (p-value> 0.05).

Kasus 2

Akan diuji apakah ada perbedaan yang signifikan pada Kelas B minggu pertama,

minggu kedua dan minggu ketiga. Dari hasil analisis mengindikasikan bahwa tes Mauchlydari

Sphericity tidak signifikan (p-value= 0.299 > 0.05). Hasiltes within-subject

effectsmengindikasikan bahwa within-subjects variabel rata-rata respon mahasiswa tidak

signifikan karena p-value = 0.736 >0.05. Artinya, tidak ada perbedaan yang signifikan diantara

varians perbedaan dari minggu pertama, minggu kedua dan minggu ketiga.

Setelah hasil tes Mauchlydari Sphericity sudah diperoleh, kemudian dari tes within-

subject effects dibuat sebuah perubahan derajat kebebasan untuk pembilang dan penyebut. Hal

ini dapat diperoleh dengan mengalikan kedua nilai ini menggunakan Huynh-Feldt karena

perkiraan Sphericity lebih dari 0.75. Perubahan derajat kebebasan pembilangnya adalah

2 × 0.921 = 1.966. Rasio F = 0.308 harus dievaluasi dengan derajat kebebasan yang baru ini.

Setelah dihitung dengan derajat kebebasan yang baru diperoleh F yang sama yaitu 0.308 dan p-

value = 0.733 > 0.05. Ternyata setelah dievaluasi dengan derajat kebebasan yang baru tetap

memperoleh kesimpulan yang sama dengan sebelumnya, yaitu tidak ada perbedaan yang

signifikan diantara varians perbedaan dari minggu pertama, minggu kedua dan minggu ketiga.

Dari Tabel 3a dapat disimpulkan bahwa rata-rata minggu pertama sampai rata-rata

minggu ketiga perbedaannya tidak terlalu jauh.

Tabel 3a. Rata-rata dan standar deviasi

Kelas B

Mean Standar deviasi

Minggu pertama 3.939 0.300

Minggu kedua 3.989 0.184

Minggu ketiga 3.955 0.219

Tabel 3b. Hasil analisa perbandingan

berpasangan Kelas B

Respon mahasiswa p-value Analisa

Minggu ke-1 dan ke-2 1 𝐻0 diterima

Minggu ke-1 dan ke-3 1 𝐻0diterima

Minggu ke-2 dan ke-3 1 𝐻0 diterima

Kemudian mengukur pengaruh rata-rata respon mahasiswa tersebut menggunakan

parsial eta kuadrat sehingga diperoleh

Partial𝜂𝑓𝑎𝑐𝑡𝑜𝑟2 =

0.038

0.038+3.500= 0.011.

Dari hasil tersebut menunjukkan bahwa tidak ada hubungan antara rata-rata respon mahasiswa

dan perlakuan yang diberikan setiap minggunya.

Page 10: ANOVA UNTUK ANALISIS RATA-RATA RESPON MAHASISWA …math.fkip.uns.ac.id/wp-content/uploads/2014/06/Ruang-9.pdf · Makalah Pendamping: Matematika 3 233 ANOVA UNTUK ANALISIS RATA-RATA

Volume 2 Prosiding SNMPM Universitas Sebelas Maret 2013

242 Makalah Pendamping: Matematika 3

Tabel 3b menunjukkan semua pairwise comparisons (dengan interval konfidensi

Bonferroni) diantara 3 level. Dengan membandingkan setiap minggunya, kita dapat memasang-

masangkan data rata-rata antar minggu pertama sampai minggu ketiga.

Dapat dilihat dari Tabel 3b dengan = 5% maka rata-rata respon mahasiswa minggu

pertama, kedua dan ketiga tidak berbeda secara signifikan (p-value> 0.05).

Two-Way Repeated Measures

Akan diuji apakah ada perbedaan yang signifikan interaksi respon dari mahasiswa pada

Kelas A dan Kelas B pada minggu pertama, minggu kedua dan minggu ketiga.Dari Tabel 4a,

variabel Kelas menghasilkan hasil yang sangat signifikan untuk semua tes multivariat dengan p-

value = 0 < 0.05. Artinya ada perbedaan respon Kelas A dan Kelas B.Dari Tabel 4b dapat

dilihat bahwa pada respon Kelas A lebih besar daripada rata-rata respon Kelas B.

Tabel 4a. Hasil tes multivariat Kelas A dan

B untuk variabel Kelas

Nama Uji p-value

Pillai’s Trace 0

Wilks’ Lamda 0

Hotelling’s Trace 0

Roy’s Largest Root 0

Tabel 4b. Perbedaan rata-rata respon Kelas

A dan B untuk variabel Kelas

Kelas Mean

A 4.113

B 3.961

Selanjutnya diuji variabel Rata-rata respon mahasiswa.Padates MauchlydariSphericity

menghasilkan nilai 0.731, dan signifikan karena p-value = 0.015 < 0.05. Asumsi Sphericity

dilanggar, maka harus menginterpretasi tes multivariat. Keempat tes multivariat pada Tabel 4c

menunjukkan bahwa variabel Rata-rata respon mahasiswa tidak signifikan. Hal ini dapat dilihat

dari p-value = 0.170 > 0.05 yang artinya tidak ada perbedaan rata-rata respon mahasiswa dari

minggu pertama sampai minggu ketiga. Tetapi dari Tabel 4ddapat dilihat bahwa rata-rata respon

mahasiswa minggu pertama, minggu kedua dan minggu ketiga semakin meningkat.

Tabel 4c. Hasil tes multivariat rata-rata

respon mahasiswa

Nama Uji p-value

Pillai’s Trace 0.170

Wilks’ Lamda 0.170

Hotelling’s Trace 0.170

Roy’s Largest Root 0.170

Tabel 4d. Rata-rata respon mahasiswa

Respon mahasiswa Mean

Minggu ke-1 3.979

Minggu ke-2 4.044

Minggu ke-3 4.089

Page 11: ANOVA UNTUK ANALISIS RATA-RATA RESPON MAHASISWA …math.fkip.uns.ac.id/wp-content/uploads/2014/06/Ruang-9.pdf · Makalah Pendamping: Matematika 3 233 ANOVA UNTUK ANALISIS RATA-RATA

Prosiding SNMPM Universitas Sebelas Maret 2013 Volume 2

Makalah Pendamping: Matematika 3 243

Untuk interaksi Kelas dengan Rata-rata respon mahasiswa, tes Mauchlydari Sphericity

menghasilkan nilai 0.454 dan signifikan karena p-value = 0.042 < 0.05. Asumsi Sphericity juga

dilanggar, maka harus menginterpretasi tes multivariat. Keempat tes multivariat pada Tabel 4e

menunjukkan bahwa efek interaksi signifikan karena p-value = 0.023 < 0.05. Hal ini

menunjukkan bahwa respon mahasiswa tergantung pada dua kelas yang berbeda.

Tabel 4e. Hasil tes multivariat dari interaksi Kelas dengan Rata-rata respon mahasiswa

Nama Uji p-value

Pillai’s Trace 0.023

Wilks’ Lamda 0.023

Hotelling’s Trace 0.023

Roy’s Largest Root 0.023

Nilai-nilai dari keempat uji pada tes multivariat yang meliputi uji Pillai’s Trace, Wilks’

Lamda, Hotelling’s Trace dan Roy’s Largest Root untuk interaksi Kelas dengan Rata-rata

respon mahasiswa juga digunakan untuk memperkuat hasil hipotesis. Setiap uji dapat dihitung

nilainya dengan menghitung akar-akar karakteristik terlebih dahulu. Menggunakan persamaan

(1) dapat diperoleh:

𝐻 = 0.094 −0.293−0.293 0.907

, 𝐸 = 2.898 −1.695−1.695 2.717

dan 𝐸−1 = 0.5433 0.33890.3389 0.5795

.

Sehingga matriks 𝐴 = −0.0482 −0.13790.1482 0.4263

dan didapatkan akar-akar karakteristik

−0.00030.3784

. Setelah akar-akar karakteristik diperoleh maka uji-uji dalam tes multivariat dapat

dihitung menggunakan persamaan (2), (5), (6) dan (8) sehingga diperoleh:

𝛬 =1

1−0.0003 .

1

1+0.3784= 0.7257; 𝑉 =

−0.0003

1−0.0003+

0.3784

1+0.3784= 0.2742

𝐻𝑜𝑡𝑒𝑙𝑙𝑖𝑛𝑔 = −0.0003 + 0.3784 = 0.3781; 𝑅𝑜𝑦′𝑠 𝐿𝑎𝑟𝑔𝑒𝑠𝑡 𝑅𝑜𝑜𝑡 = 0.3784.

Dalam kasus ini yang dianalisis adalah 3 variabel dan 2 grup. Dari persamaan (4) diperoleh

statistik F (hanya untuk Wilks Lamda karena uji yang lain tabel nilai kritis tidak diketahui)

𝐹𝑕𝑖𝑡𝑢𝑛𝑔 = 1−0.7253

0.7253

29−3−1

3−1 = 4.7342.

Dengan𝛼 = 0.05 diperoleh nilai dari 𝐹𝑡𝑎𝑏𝑒𝑙 yaitu 𝐹𝑝 ,𝑛−𝑝−1 = 𝐹3,25 = 2.99. Jadi 𝐻0

ditolak karena𝐹𝑕𝑖𝑡𝑢𝑛𝑔 > 𝐹𝑡𝑎𝑏𝑒𝑙 . Hal ini menunjukkan bahwa respon mahasiswa tergantung pada

dua kelas yang berbeda.

Kemudian mengukur pengaruh interaksi Kelas dengan Rata-rata respon mahasiswa

tersebut menggunakan multivariat eta kuadrat sehingga diperoleh

Multivariat𝜂2 = 1 − 0.7257 = 0.2743.

Dari hasil tersebut menunjukkan bahwa tidak ada hubungan antara Kelas dengan Rata-rata

respon mahasiswa terhadap perlakuan yang diberikan setiap minggunya.

Page 12: ANOVA UNTUK ANALISIS RATA-RATA RESPON MAHASISWA …math.fkip.uns.ac.id/wp-content/uploads/2014/06/Ruang-9.pdf · Makalah Pendamping: Matematika 3 233 ANOVA UNTUK ANALISIS RATA-RATA

Volume 2 Prosiding SNMPM Universitas Sebelas Maret 2013

244 Makalah Pendamping: Matematika 3

Gambar 1. Grafik rata-rata respon mahasiswa pada Kelas A dan Kelas B

Gambar 1 menunjukkan bahwa rata-rata respon mahasiswa yang diberikan pada 3

minggu tergantung pada perbedaan kelas. Pada kelas A, rata-rata respon mahasiswa semakin

meningkat tetapi pada kelas B rata-rata respon mahasiswa meningkat dan mengalami penurunan

lagi pada minggu ketiga.

Tabel 4f. Hasil analisa perbandingan berpasangan minggu pertama sampai minggu ketiga

Respon mahasiswa p-value Analisa

Minggu ke-1 dan ke-2 1 𝐻0 diterima

Minggu ke-1 dan ke-3 0.248 𝐻0 diterima

Minggu ke-2 dan ke-3 0.868 𝐻0 diterima

Tabel 4f menunjukkan semua perbandingan berpasangan antara dua kelas dan rata-rata

respon mahasiswa tiga minggu dengan menggunakan interval konfidensi Bonferroni 95%.

Dapat dilihat dari Tabel 4f dengan = 5%, rata-rata respon mahasiswa di Kelas A dan Kelas B

pada minggu pertama, kedua dan ketiga tidak berbeda secara signifikan (p-value> 0.05). Artinya

tidak ada perbedaan rata-rata respon mahasiswa di minggu pertama sampai ketiga.

SIMPULAN

Pada makalah ini telah dibahas studi tentang respon mahasiswa dengan metode one-way

dan two-wayrepeated measures untuk dua kelas Listening FBS-UKSW. Berdasarkan hasil yang

diperoleh dapat disimpulkan bahwa:

One-wayRepeated Measures

Pada kelas A

Berdasarkan tes multivariat, ada perbedaan yang signifikan antara rata-rata respon

mahasiswa pada minggu pertama sampai minggu ketiga. Tetapi varians dari minggu

pertama, minggu kedua dan minggu ketiga tidak berbeda secara signifikan. Dari hasil

parsial eta kuadrat menunjukkan bahwa tidak ada hubungan antara rata-rata respon

mahasiswa dan perlakuan setiap minggunya. Dalam pengujian pairwise comparisons,

Page 13: ANOVA UNTUK ANALISIS RATA-RATA RESPON MAHASISWA …math.fkip.uns.ac.id/wp-content/uploads/2014/06/Ruang-9.pdf · Makalah Pendamping: Matematika 3 233 ANOVA UNTUK ANALISIS RATA-RATA

Prosiding SNMPM Universitas Sebelas Maret 2013 Volume 2

Makalah Pendamping: Matematika 3 245

respon minggu kedua dengan respon minggu ketiga berbeda secara signifikan sedangkan

respon minggu pertama dengan minggu kedua dan respon minggu pertama dengan

minggu ketiga tidak berbeda secara signifikan.

Pada kelas B

Berdasarkan tes within-subject effects, varians dari minggu pertama, minggu kedua dan

minggu ketiga tidak berbeda secara signifikan. Dari hasil parsial eta kuadrat menunjukkan

bahwa tidak ada hubungan antara rata-rata respon mahasiswa dan perlakuan setiap

minggunya. Dalam pengujian pairwise comparisons, rata-rata respon mahasiswa minggu

pertama, kedua dan ketiga juga tidak berbeda secara signifikan.

Two-way Repeated Measures

Berdasarkan uji yang dilakukan, dapat disimpulkan bahwa terdapat perbedaan respon

Kelas A dengan Kelas Btetapi tidak ada perbedaan respon mahasiswa dari minggu pertama

sampai minggu ketiga. Untuk interaksi Kelas dengan Rata-rata respon mahasiswa menunjukkan

bahwa respon mahasiswa tergantung pada dua kelas yang berbeda. Pengujian Pairwise

Comparisonsyang dilakukan untuk dua kelas yang berbeda mengindikasikan tidak ada

perbedaan antara respon mahasiswa di minggu pertama sampai ketiga.

DAFTAR PUSTAKA

Carey, G. (1998). Multivariate Analysis of Variance (MANOVA): I. Theory. Diakses tanggal 1

November 2013 pukul 12.40 WIB dari

http://ibgwww.colorado.edu/~carey/p7291dir/handouts/manova1.pdf.

Field, A. (2009). Discovering Statistics Using SPSS. (3thed.). India : Sage.

Field, A. (2012). Discovering Statistics Repeated Measures ANOVA. Diakses tanggal 29

Oktober 2013 dari http://www.discoveringstatistics.com.

Giri, N.C. (2004). Multivariate Statistical Analysis. (2nd

ed). New York : Marcel Dekker.

Ho, R. (2006). Handbook of Univariate and Multivariate Data Analysis and Interpretation with

SPSS. New York : Chapman & Hall/CRC Taylor & Francis Group.

Maxwell, S.E. & Delaney, H.D. (2004). Designing Experiments And Analyzing Data A Model

Comparison Perspective. (2nd

ed.). London: Lawrence Erlbaum Associates.

Patel, S. & Bhavsar, C.D. (2013). Analysis of Pharmocokinetic Data by Wilk‟s Lamda (An

Important Tool of Manova). International Journal of Pharmaceutical Science Invention,

Vol. 2, 36-44.

Pritasari, N.F., Parhusip, H.A. & Susanto, B. (2013). Analisis Respon Mahasiswa Kelas

Listening Menggunakan Metode Paired Comparisons. Prosiding, Seminar Nasional

Matematika VII yang diselenggarakan oleh Jurusan Matematika FMIPA dan Prodi

Pendidikan Matematika Program Pascasarjana UNNES tanggal 26 Oktober 2013.

Semarang: Universitas Negeri Semarang.

Page 14: ANOVA UNTUK ANALISIS RATA-RATA RESPON MAHASISWA …math.fkip.uns.ac.id/wp-content/uploads/2014/06/Ruang-9.pdf · Makalah Pendamping: Matematika 3 233 ANOVA UNTUK ANALISIS RATA-RATA

Volume 2 Prosiding SNMPM Universitas Sebelas Maret 2013

246 Makalah Pendamping: Matematika 3

Rahandika, A. (2013). The Students Perceptions toward Different Task Types in Public

Listening Class. Skripsi. Program Studi Pendidikan Bahasa Inggris, Fakultas Bahasa dan

Sastra, Universitas Kristen Satya Wacana. Salatiga.

Stevens, J.P. (2009). Applied Multivariate Statistics For The Social Sciences. (5thed.). New

York : Routledge Taylor & Francis Group.

Web 1: http://oak.ucc.nau.edu/rh232/courses/EPS625/Handouts/RM-

ANOVA/Understanding%20Repeated-Measures%20ANOVA.pdf. Diakses tanggal 30

Oktober 2013 pukul 09.53 WIB.

Web 2:

https://www.google.com/url?sa=t&rct=j&q=&esrc=s&source=web&cd=6&cad=rja&ved

=0CFQQFjAF&url=http%3A%2F%2Fwww.chsbs.cmich.edu%2Fk_han%2Fpsy613%2F

manova1.doc&ei=4tZ5UvzpOqzwiQfH-

oCwAw&usg=AFQjCNFOCcK9hRRVQczMgt0tSqX6Al8z5Q&sig2=w5KyDbLxz-Ma-

MqVVyntzA&bvm=bv.55980276,d.aGc. Diakses tanggal 6 November 2013 pukul

12.45 WIB.

Web 3: http://www.stat.ncsu.edu/people/bloomfield/courses/st784/twa-08-3.pdf. Diakses

tanggal 7 November 2013 pukul 08.27 WIB.

Web 4: http://www.zu.ac.ae/main/files/contents/research/training/one-

wayrepeatedmeasureanova.pdf. Diakses tanggal 7 November 2013 pukul 09.12 WIB.

Page 15: ANOVA UNTUK ANALISIS RATA-RATA RESPON MAHASISWA …math.fkip.uns.ac.id/wp-content/uploads/2014/06/Ruang-9.pdf · Makalah Pendamping: Matematika 3 233 ANOVA UNTUK ANALISIS RATA-RATA

Prosiding SNMPM Universitas Sebelas Maret 2013 Volume 2

Makalah Pendamping: Matematika 3 247

ANALISIS BIPLOT PADA PEMETAAN KARAKTERISTIK KEMISKINAN

DI PROVINSI NUSA TENGGARA BARAT

Desy Komalasari 1)

, Mustika Hadijati 2)

, Marwan 3)

1) Program Studi Matematika FMIPA UNRAM, email: [email protected]

2) Program Studi Matematika FMIPA UNRAM, email: [email protected]

3) Program Studi Matematika FMIPA UNRAM, email: [email protected]

1), 2), 3). Jln. Majapahit No.62 Mataram- NTB.

Abstrak Penelitian ini bertujuan memberikan inovasi baru mengenai pemetaan

karakteristik kemiskinan pada kabupaten/kota di provinsi Nusa Tenggara Barat,

menggunakan metode analisis Biplot. Analisis Biplot didasarkan pada singular value

decomposition, matriks orthonormal, dan faktorisasi dari matriks data. Penelitian ini

menghasilkan Square Root Biplot (SQRT) atau Biplot Simetri, yaitu grafik Biplot yang

memetakan secara bersamaan kabupaten/kota dengan karakteristik kemiskinan di

provinsi NTB. Analisis Biplot dalam penelitian ini memberikan penyajian yang cukup

baik mengenai informasi data yang sebenarnya berdasarkan nilai 𝑝2 sebesar 84,59%.

Grafik Biplot menampilkan wilayah yang memiliki kesamaan karakteristik kemiskinan

ada pada kabupaten Bima dan kabupaten Sumbawa, dengan jarak Euclid terdekat

sebesar 0.266. Sedangkan jarak terjauh ada pada kabupaten Lombok Tengah dan kota

Mataram, sebesar 9.779. Keragaman karakteristik kemiskinan ditunjukkan dengan

panjang vektor, vektor terpanjang pada penduduk miskin yang bekerja di sektor

pertanian (𝑋7) dan vektor terpendek pada angka partisipasi sekolah penduduk miskin

(𝑋3).

Kata kunci: Analisis Biplot, Singular Value Decomposition, Karakteristik Kemiskinan.

PENDAHULUAN

Kemiskinan merupakan masalah yang sering dihadapi di setiap daerah di Indonesia

seperti halnya provinsi Nusa Tenggara Barat. Jumlah penduduk miskin di provinsi Nusa

Tenggara Barat (NTB) pada Maret 2011 sebesar 19,73%, dan menurun pada Maret 2012

sebesar 18,63% (Berita Resmi Statistik, 2012). Angka penurunan sebsar 1,10% dipengaruhi

oleh beberapa faktor karakteristik kemiskinan di antaranya faktor sosial ekonomi dan faktor

pendidikan. Penurunan yang kurang signifikan menyebabkan perlunya pemetaan karakteristik

kemiskinan, sehingga upaya pengentasan kemiskinan tepat sasaran. Karakteristik kemiskinan

yang digunakan merupakan data kemiskinan makro. Data kemiskinan makro menunjukkan

jumlah dan persentase penduduk miskin di setiap daerah berdasarkan estimasi. Data ini

digunakan untuk perencanaan dan evaluasi program kemisikinan dengan target geografis. Oleh

karena itu, perlunya dilakukan pemetaan karakteristik kemiskinan pada kabupaten/kota di

Provinsi NTB menggunakan analisis Biplot. Analisis Biplot merupakan teknik statistik

deskriptif dimensi ganda dengan menyajikannya secara visual dan simultan sejumlah objek

pengamatan dan variabel dalam suatu grafik. Oleh karena itu, tujuan penelitian ini yaitu untuk

mengetahui gambaran pemetaan karakteristik kemiskinan di Provinsi NTB menggunakan

analisis Biplot. Sehingga manfaat dari pemetaan ini dapat digunakan sebagai bahan acuan

Pemerintah Daerah Provinsi NTB untuk melakukan upaya pengentasan kemiskinan yang tepat

sasaran pada karakteristik kemiskinan di wilayah tersebut.

Page 16: ANOVA UNTUK ANALISIS RATA-RATA RESPON MAHASISWA …math.fkip.uns.ac.id/wp-content/uploads/2014/06/Ruang-9.pdf · Makalah Pendamping: Matematika 3 233 ANOVA UNTUK ANALISIS RATA-RATA

Volume 2 Prosiding SNMPM Universitas Sebelas Maret 2013

248 Makalah Pendamping: Matematika 3

METODE PENELITIAN

Jenis Penelitian

Penelitian ini menggunakan pendekatan kuantitatif dan aplikatif, yaitu mengaplikasikan

data – data numerik ke dalam analisis Biplot. Analisis Biplot adalah salah satu upaya

menggambarkan data - data yang ada pada tabel ringkasan kedalam grafik berdimensi dua.

Grafik yang dihasilkan dari Biplot ini merupakan grafik yang berbentuk bidang datar. Dengan

penyajian seperti ini, ciri-ciri variabel dan objek pengamatan serta posisi relatif antara objek

pengamatan dengan variabel dapat dianalisis (Kohler dan Luniak, 2005).

Waktu dan Tempat Penelitian

Penelitian dilaksanakan mulai bulan Juni 2013 sampai dengan bulan Oktober 2013.

Tempat penelitian di Universitas Mataram dan Badan Pusat Statistik Provinsi NTB.

Data Penelitian

Penelitian ini menggunakan data sekunder yang diperoleh dari Badan Pusat Statistik

(BPS) Provinsi Nusa Tenggara barat. Data yang digunakan yaitu data karakteristik kemiskinan

tahun 2011, terdiri dari 10 kabupaten/kota yang merupakan Objek penelitian dan 10

karakteristik kemiskinan yang merupakan variabel penelitian. Objek penelitian meliputi Kab.

Lombok Barat, Kab. Lombok Tengah, Kab. Lombok Timur, Kab. Sumbawa, Kab. Dompu, Kab.

Bima, Kab. Sumbawa Barat, Kab. Lombok Utara, Kota Mataram, Kota Bima. Variabel

penelitian merupakan karakteristik kemiskinan meliputi Jumlah Penduduk Miskin (𝑋1), Angka

Melek Huruf Penduduk Miskin (𝑋2), Angka Partisipasi Sekolah Penduduk Miskin (𝑋3),

Penduduk miskin yang tidak bekerja (𝑋4), Penduduk miskin yang bekerja di sektor Informal

(𝑋5), Penduduk miskin yang bekerja di sektor formal (𝑋6), Penduduk miskin yang bekerja di

sektor pertanian (𝑋7), Penduduk bekerja di bukan sektor pertanian (𝑋8), Pengeluaran perkapita

untuk makanan (𝑋9), Luas lantai perkapita rumah tangga miskin (𝑋10).

Prosedur Penelitian

Prosedur penelitian ini meliputi observasi pendahuluan, perancangan penelitian,

pengumpulan data, analisis data, interpretasi hasil, dan kesimpulan. Observasi pendahuluan

dilakukan dengan survey data-data yang relevan, dengan tujuan untuk memberikan gambaran

dan informasi mengenai karakteristik kemiskinan di setiap kabupaten/kota di provinsi NTB.

Perancangan penelitian meliputi penetapan rumusan masalah, tujuan penelitian, penentuan alat

dan bahan, pengumpulan data, serta penentuan teknik analisis data. Langkah selanjutnya yaitu

pengumpulan data, data yang dikumpulkan disini adalah data sekunder yang berhubungan

dengan karakteristik kemiskinan. Selanjutnya analisis data menggunakan Biplot, kemudian

Page 17: ANOVA UNTUK ANALISIS RATA-RATA RESPON MAHASISWA …math.fkip.uns.ac.id/wp-content/uploads/2014/06/Ruang-9.pdf · Makalah Pendamping: Matematika 3 233 ANOVA UNTUK ANALISIS RATA-RATA

Prosiding SNMPM Universitas Sebelas Maret 2013 Volume 2

Makalah Pendamping: Matematika 3 249

interpretasi hasil Biplot yaitu memberikan gambaran atau penjelasan secara deskriptif mengenai

kedekatan antar objek yang diamati, keragaman variabel, hubungan atau korelasi antar variabel,

dan nilai variabel pada suatu objek. Berdasarkan hasil interpretasi akan ditarik kesimpulan

mengenai analisis Biplot terhadap posisi kabupaten/kota terhadap karakteristik yang dimilikinya

serta karakteristik kemiskinan mana saja yang paling dominan di suatu kabupaten/kota di

provinsi NTB.

Teknik Analisis Data

Analisis data menggunakan teknik analisis Biplot. Prosedur analisis biplot meliputi

menentukan matriks data yang dikoreksi terhadap rata-rata (𝒀), menentukan matriks 𝒀𝑻𝒀,

menentukan nilai eigen dan vektor eigen, mencari Singular Value Decomposition (SVD) yaitu

mendapatkan matriks U, L dan A, menentukan matriks koordinat dengan 𝛼yang digunakan

berkisar pada 0 ≤ 𝛼 ≤ 1. Namun nilai 𝛼yang lazim digunakan dalah 𝛼 = 1; 𝛼0.5; dan

𝛼0 (Nugroho, 2008). Menentukan matriks G(objek) dan H(variabel) terpilih berdasarkan

𝒀 ≅ 𝑮𝑯𝑻, menggambar grafik menggunakan program, interpretasi hasil dan kesimpulan.

Analisis Biplot bertujuan menggambarkan suatu matriks dengan menumpang tindihkan

vektor-vektor baris dengan vektor-vektor kolom matriks. Analisis Biplot didasarkan pada

penguraian nilai-nilai singular (Singular Value Decomposition) dari suatu matriks data yang

telah dikoreksi oleh rataanya. Biplot dibentuk dari suatu matriks data, dimana setiap kolom

mewakili variabel-variabel penelitian, dan setiap baris mewakili objek penelitian.

Misalkan matriks Xadalah matriks yang terdiri dari variabel-variabel sebanyak p dan

objek penelitian sebanyak n. Misalkan matriks Y merupakan hasil dari matriks X yang dikoreksi

terhadap rataannya, maka akan diuraikan menjadi perkalian tiga buah matriks berikut:

𝒀(𝒏×𝒑) = 𝑼(𝒏×𝒓)𝑳𝒓×𝒓𝑨 𝒓×𝒑 𝑻 (1)

Matriks 𝑳 merupakan nilai singular 𝒀 dengan unsur-unsur diagonalnya akar kuadrat

dari nilai eigen𝒀𝑻𝒀, sedangkan matriks 𝑼diperoleh dari 𝑼 = 𝒀𝑨𝑳−𝟏. Sehingga 𝑼𝑻𝑼 = 𝑨𝑻𝑨 =

𝑰, I adalah matriks identitas dan L adalah matriks diagonal berukuran (rxr) dengan unsur-unsur

diagonalnya adalah akar dari nilai eigen–nilai eigen tak nol 𝒀𝑻𝒀 yaitu 𝜆𝟏 ≥ 𝜆𝟐 … ≥

𝜆𝒓 (Menurut Matjik dan Sumertajaya, 2011)).

Menurut Joellife (1986) dalam Matjik dan Sumertajaya, 2011, dari matriks Y akan

dibentuk matriks G dan H, dimana 𝑮 = 𝑼𝑳𝜶 dan𝑯𝑻 = 𝑳𝟏−𝜶𝑨𝑻 dengan 𝛼 besarnya 0 ≤ 𝛼 ≤

1, yang masing-masing berukuran 𝑛 × 𝑟 dan 𝑟 × 𝑝maka persamaan (1) menjadi:

𝒀 = 𝑼𝑳𝜶𝑳𝟏−𝜶𝑨𝑻 = 𝑮𝑯𝑻 (2)

Masing-masing merupakan matriks G baris ke-i , dimana𝑖 = 1,2,… , 𝑛serta matriks H kolom ke-

j dimana 𝑗 = 1,2,… ,𝑝, dan r adalah rank matriks data Y. Jika matriks Ymempunyai rank dua,

Page 18: ANOVA UNTUK ANALISIS RATA-RATA RESPON MAHASISWA …math.fkip.uns.ac.id/wp-content/uploads/2014/06/Ruang-9.pdf · Makalah Pendamping: Matematika 3 233 ANOVA UNTUK ANALISIS RATA-RATA

Volume 2 Prosiding SNMPM Universitas Sebelas Maret 2013

250 Makalah Pendamping: Matematika 3

maka vektor baris 𝒈𝒊 dan vektor 𝒉𝒋 akan digambarkan dalam dimensi dua. Namun, jika Y

mempunyai rank lebih dari dua maka persamaan di atas menjadi :

𝒚𝒊𝒋 = 𝒖𝒊𝒌𝝀𝒌

𝟏

𝟐𝜶𝒌𝒋𝑻𝒓

𝒌=𝟏 (3)

dengan 𝒖𝒊𝒌merupakan elemen ke-(i,k) pada matriks U, 𝜶𝒌𝒋𝑻 merupakan elemen ke-(k,j) pada

matriks AT serta 𝝀

𝒌

𝟏

𝟐adalah elemen diagonal ke-k matriks Lyang merupakan akar kuadrat nilai

eigen𝒀𝑻𝒀 .

Menurut Gabriel (1971) dalam Matjik dan Sumertajaya, 2011, data pengamatan awal

matriks X yang terdiri dari n objek dan p variabel tereduksi menjadi beberapa himpunan data

yang terdiri dari n baris dengan m kolom.

Jika ada sebanyak m kolom yang ditentukan, maka persamaan (2) menjadi;

𝒚𝒎 𝒊𝒋 = 𝒖𝒊𝒌𝝀𝒌

𝟏

𝟐𝜶𝒌𝒋𝑻𝒎

𝒌=𝟏 ,𝒎 < 𝑟 (4)

Persamaan di atas dapat dibentuk sebagai berikut :

𝒚𝒊𝒋𝒎 = 𝒖𝒊𝒌 𝝀𝒌𝜶

𝟏

𝟐

𝒎

𝒌=𝟏 𝝀𝒌

𝟏−𝜶 𝟏

𝟐𝜶𝒌𝒋𝑻

= 𝒈𝒊𝒌𝒎

𝒌=𝟏𝒉𝒌𝒋𝑻

= 𝒈𝒊∗𝑻𝒉𝒋

∗ (5)

dengan 𝒈𝒊∗𝑻dan𝒉𝒋

∗masing-masing merupakan elemen vektor 𝒈𝒊 dan 𝒉𝒋. Jika 𝑚 = 2 pada

persamaan (5) maka dikatakan sebagai Biplot, sehingga dapat dibentuk menjadi :

𝒚𝒊𝒋 =𝟐 𝒈𝒊∗𝑻𝒉𝒋

∗ (6)

Dengan 𝒚𝒊𝒋𝟐 merupakan elemen matriks Yberdimensi dua, sedangkan 𝒈𝒊∗mengandung elemen

dua kolom pertama vektor 𝒈𝒊, dan 𝒉𝒊∗mengandung dua kolom pertama vektor 𝒉𝒋.

Sehingga dari matriks Y pada dimensi dua diperoleh matriks dengan ukuran tereduksi

yaitu matriks Gdan H sebagai berikut (Johnson danWichern, 2002) :

𝑮 =

𝑔11 𝑔12

⋮ ⋮𝑔𝑖1⋮

𝑔𝑛1

𝑔𝑖2⋮

𝑔𝑛2

dan 𝑯 =

𝑕11 𝑕12

⋮𝑕𝑖1⋮𝑕𝑝1

⋮𝑕𝑖2⋮𝑕𝑝2

Masing-masing pada matriks G dan H merupakan titik-titik koordinat dari n objek dan titik-

titik koordinat dari p variabel.

Rencer (2002), mengemukakan ukuran Biplot dengan pendekatan matriks Y berdimensi

dua dalam bentuk :

𝑝2 =(𝜆1+ 𝜆2)

𝜆𝑘𝑟𝑘=1

(7)

Page 19: ANOVA UNTUK ANALISIS RATA-RATA RESPON MAHASISWA …math.fkip.uns.ac.id/wp-content/uploads/2014/06/Ruang-9.pdf · Makalah Pendamping: Matematika 3 233 ANOVA UNTUK ANALISIS RATA-RATA

Prosiding SNMPM Universitas Sebelas Maret 2013 Volume 2

Makalah Pendamping: Matematika 3 251

Dengan 𝜆1 adalah nilai eigen terbesar pertama, 𝜆2 adalah nilai eigen terbesar kedua dan

𝜆𝑘 ,𝑘 = 1,2,… , 𝑟 adalah nilai eigen ke-k. Apabila nilai 𝑝2 mendekati satu, maka Biplot

memberikan penyajian yang semakin baik mengenai informasi data yang sebenarnya.

Biplot mempunyai beberapa tipe. Perbedaan tipe ini berdasarkan pada nilai 𝛼yang

digunakan. Nilai 𝛼yang digunakan dalam Biplot adalah 0 ≤ 𝛼 ≤ 1. Namun nilai 𝛼yang lazim

digunakan dalah 𝛼 = 1; 𝛼0.5; dan 𝛼0 (Nugroho, 2008).

1) Biplot dengan 𝛼1 disebut juga dengan Biplot komponen utama. Jika 𝛼 yang

digunakan adalah 𝛼 = 1 maka Biplot yang dibentuk disebut Biplot RMP (Row Metric

Preserving). Biplot RMP ini digunakan untuk menduga jarak Euclid secara optimal.

Sehingga Biplot untuk 𝛼 = 1 diperoleh:

𝑮 = 𝑼𝑳𝟏 = 𝑼𝑳dan 𝑯 = 𝑨𝑳𝟏−𝟏 = 𝑨 (8)

Pada kondisi ini jarak Euclid antara 𝑔𝑖 dan 𝑔𝑗 sama dengan jarak antara 𝑦𝑖 dan 𝑦𝑗 pada

pengamatan sesungguhnya. Selain itu koordinat 𝑕𝑗𝑇 merupakan koefisien variabel ke-j

dalam dua komponen utama pertama.

2) Nilai 𝛼lain yang digunakan dalam pembuatan Biplot yaitu 𝛼 = 0.5. Untuk nilai 𝛼ini,

Biplot yang dibentuk disebut Biplot Simetri atau Biplot SQRT (Square Root Biplot)..

Biplot untuk 𝛼 = 0.5 diperoleh:

𝑮 = 𝑼𝑳𝟎,𝟓dan 𝑯 = 𝑨𝑳𝟏−𝟎,𝟓 = 𝑨𝑳𝟎,𝟓 (9)

3) Jika 𝛼yang digunakan adalah 𝛼0, maka akan terbentuk tipe Biplot yang disebut

Biplot CMP (Column Metric Preserving).

Saat 𝛼 = 0 diperoleh matriks G dan H sebagai berikut

diperoleh𝑮 = 𝑼𝑳𝟎 = 𝑼 dan 𝑯 = 𝑨𝑳𝟏−𝟎 = 𝑨𝑳 (10)

sehingga terbentuk 𝒀𝑻𝒀 = 𝑮𝑯𝑻 𝑻

(𝑮𝑯𝑻)

= 𝑯𝑮𝑻 (𝑮𝑯)𝑻

= 𝑯𝑮𝑻𝑮𝑯𝑻

= 𝑯𝑼𝑻𝑼𝑯𝑻

= 𝑯𝑯𝑻 (11)

Matriks U merupakan matriks orthonormal dan 𝒀𝑻𝒀 = 𝑛 − 1 𝑺dengan n merupakan

banyaknya objek serta Smerupakan matriks varian kovarian dari matriks Y, sehingga 𝑯𝑻 =

𝑛 − 1 𝑺 .Hasil kali elemen 𝑕𝑗𝑕𝑘𝑇 akan sama dengan (𝑛 − 1) kali kovarian 𝑠𝑗𝑘 variabel ke-j dan

variabel ke-k. Elemen diagonal utama matriks 𝑯𝑯𝑻, 𝑕112 + 𝑕21

2 ,… ,𝑕𝑗12 + 𝑕𝑗2

2 ,… ,𝑕𝑝12 + 𝑕𝑝2

2

merupakan variansi dari variabel. Sedangkan 𝑕𝑗12 + 𝑕𝑗2

2 , 𝑗 = 1,2, . . ,𝑝 merupakan panjang vektor

variabel (dengan pusat jarak Euclid di titik O(0,0)). Sehingga dapat dikatakan bahwa panjang

vektor variabel sebanding dengan variansi variabel (Matjik dan Sumertajaya, 2011).

Page 20: ANOVA UNTUK ANALISIS RATA-RATA RESPON MAHASISWA …math.fkip.uns.ac.id/wp-content/uploads/2014/06/Ruang-9.pdf · Makalah Pendamping: Matematika 3 233 ANOVA UNTUK ANALISIS RATA-RATA

Volume 2 Prosiding SNMPM Universitas Sebelas Maret 2013

252 Makalah Pendamping: Matematika 3

HASIL DAN PEMBAHASAN

Deskripsi data penelitian

Gambaran data penelitian di tampilkan pada tabel Deskriptif Statistik berikut.

Tabel 1. Deskriptif Statistik

N Minimum Maximum Mean Std. Deviation Variance

Penduduk Miskin (X1) 10 11.69 39.27 19.9220 7.46983 55.798

AMH (X2) 10 72.57 91.63 84.3240 6.12581 37.526

APS (X3) 10 92.58 100.00 96.3380 2.54088 6.456

Tidak Bekerja (X4) 10 31.22 47.67 37.2530 5.46294 29.844

Bekerja Informal (X5) 10 36.38 68.34 54.7690 9.49724 90.197

Bekerja Formal (X6) 10 .45 15.95 7.9810 4.85856 23.606

Bekerja Sektor Pertanian (X7) 10 1.78 55.85 39.6360 16.41475 269.444

Bekerja Bukan Pertanian (X8) 10 12.40 50.54 23.1140 11.71297 137.194

Pengeluaran Makanan (X9) 10 59.69 73.21 67.2390 4.13745 17.118

Luas Lantai (X10) 10 41.12 79.19 59.3520 12.71368 161.638

Valid N (listwise) 10

Pada tabel 1 terlihat Gambaran karakteristik kemiskinan di provinsi NTB, rata-rata

penduduk miskin di 10 kabupaten tersebut sebesar 19.92%, dengan rata-rata angka melek huruf

84.32%, rata-rata angka partisipasi sekolah yang tinggi oleh penduduk miskin sebesar 96.33%

yang berarti semangat penduduk miskin untuk bersekolah sangat tinggi. Persentase penduduk

miskin yang tidak bekerja 37.25%, rata-rata penduduk miskin yang bekerja di sektor informal

54.77%, sedangkan yang bekerja di sektor formal masih sangat kecil yaitu 7.98%. Penduduk

miskin yang bekerja di sektor pertanian 39.64% lebih tinggi daripada penduduk miskin yang

bekerja di bukan sektor pertanian sebesar 23.11%. Rata-rata pengeluaran perkapita untuk

makanan rumah tangga miskin sebesar 67.24%. Pengeluaran perkapita adalah rata-rata

pengeluaran makanan rumah tangga dibagi dengan jumlah anggota rumah tangga yang

bersangkutan. Rata-rata luas lantai rumah tangga miskin di provinsi NTB sebesar 59.35%,

dengan luas lantai setiap rumah tangga lebih kecil dari 8m2 ≤ 8𝑚2 .

Hasil Analisis Biplot

Berdasarkan prosedur analisis Biplot diperoleh hasil berupa grafik Biplot seperti pada

Gambar 1.

Page 21: ANOVA UNTUK ANALISIS RATA-RATA RESPON MAHASISWA …math.fkip.uns.ac.id/wp-content/uploads/2014/06/Ruang-9.pdf · Makalah Pendamping: Matematika 3 233 ANOVA UNTUK ANALISIS RATA-RATA

Prosiding SNMPM Universitas Sebelas Maret 2013 Volume 2

Makalah Pendamping: Matematika 3 253

a. Hasil grafik Biplot untuk 𝛼 = 0.5 ditunjukkan pada gambar di bawah ini:

Gambar 1. Pemetaan Biplot data karakteristik kemiskinan di provinsi NTB

Pada penelitian ini dihasilkan grafik biplot dengan 𝛼 = 0.5. Alasan terpilihnya biplot

dengan 𝛼 = 0.5 yaitu karena hasil kali matriks koordinat Objek (G) dan matriks koordinat

variabel (H) sama dengan elemen-elemen pada matriks data awal 𝒀 ≅ 𝑮𝑯𝑻.Sehingga biplot

dalam penelitian ini merupakan Square Root Biplot (SQRT) atau Biplot Simetri. Biplot Simetri

merupakan tipe Biplot yang membuat kesamaan penskalaan atau pembobotan pada baris dan

kolom secara bersamaan, sehingga digunakan untuk menggambarkan gabungan vektor objek

yaitu kabupaten/kota serta variabel yang merupakan karakteristik kemiskinan secara bersamaan

dalam satu plot (grafik).

b. Interpretasi Informasi Biplot

Biplot adalah upaya membuat gambar di ruang berdimensi banyak menjadi gambar di

ruang dimensi dua. Informasi data yang disajikan dalam Biplot ditentukan berdasarkan nilai

𝑝2,semakin mendekati nilai satu berarti Biplot yang diperoleh dari matriks pendekatan

berdimensi dua akan memberikan penyajian data yang semakin baik mengenai informasi-

informasi yang terkandung pada data yang sebenarnya. Penyajian informasi ini bergantung pada

nilai eigen(𝜆). Pada penelitian ini diperoleh nilai 𝜆1sebesar 5231.74, dan 𝜆2 sebesar 1078.05,

Page 22: ANOVA UNTUK ANALISIS RATA-RATA RESPON MAHASISWA …math.fkip.uns.ac.id/wp-content/uploads/2014/06/Ruang-9.pdf · Makalah Pendamping: Matematika 3 233 ANOVA UNTUK ANALISIS RATA-RATA

Volume 2 Prosiding SNMPM Universitas Sebelas Maret 2013

254 Makalah Pendamping: Matematika 3

sehingga diperoleh nilai 𝑝2 sebesar 84.59%. Nilai 𝑝2 mendekati satu, maka Biplot dalam

penelitian ini memberikan penyajian yang cukup baik mengenai informasi dari data yang

sebenarnya.

c. Kedekatan Antar Objek (Kabupaten/kota)

Informasi ini dijadikan panduan untuk mengetahui kabupaten/kota yang memiliki

kemiripan karakteristik kemiskinan dengan kabupaten/kota lainnya. Kabupaten/kota yang

berada pada kuadran yang sama dapat dikatakan memiki kesamaan karakteristik kemiskinan

yang cukup dekat, jika dibandingkan dengan kabupaten/kota yang berada pada kuadran yang

berbeda. Pada gambar 1. terlihat kabupaten/kota yang berada pada kuadran yang sama yaitu

kuadran keempat, diantaranya Kota Bima dan Kota Mataram. Dapat dikatakan bahwa kedua

kota tersebut memiliki kesamaan karakteristik kemiskinan. Selain itu juga dapat ditentukan

melalui jarak Euclidean, dari plot yang dihasilkan dapat ditentukan jarak Kota Bima dan Kota

Mataram sebesar 4.037, yang berarti kota kabupaten tersebut memiliki kemiripan karakteristik

kemiskinan. Interpretasi yang sama juga berlaku untuk kabupaten/kota lainnya.

d. Interpretasi Nilai Variabel Pada Suatu Objek

Informasi ini digunakan untuk menentukan karakteristik kemiskinan di setiap wilayah

(kabupaten/kota). Suatu wilayah yang terletak searah dengan vektor karakteristik kemiskinan

menunjukkan tingginya nilai karakteristik kemiskinan untuk wilayah tersebut. Atau dapat

interpretasikan bahwa karakteristik kemiskinan untuk wilayah tersebut mempunyai nilai di atas

rata-rata seluruh kabupaten/kota. Sebaliknya, jika suatu wilayah terletak berlawanan arah

dengan vektor karakteristik kemiskinan maka nilai karakteristik kemiskinannya rendah atau di

bawah nilai rata-rata seluruh kabupaten/kota. Sedangkan jika wilayah yang hampir berada di

tengah-tengah berarti wilayah tersebut memiliki nilai karakteristik kemiskinan yang dekat

dengan rata-rata.

Pada gambar 1, terlihat bahwa Kabupaten Lombok Barat searah dengan arah vektor

variabel (𝑋10). Sesuai dengan data asli, dimana luas lantai perkapita rumah tangga miskin (𝑋10)

di Kabupaten Lombok Barat sebesar 79.19% di atas rata-rata keseluruhan yakni 59.35%.

Contoh lainnya pada Kabupaten Lombok Utara yang searah dengan vektor 𝑋1, hal ini

menyatakan jumlah penduduk miskin di kabupaten tersebut sebesar 39.27% berada di atas rata-

rata yakni sebesar 19.92%. Contoh lainnya pada Kabupaten Lombok Tengah yang searah

dengan vektor 𝑋5, hal ini menandakan bahwa penduduk miskin yang bekerja di sektor informal

pada kabupaten Lombok Tengah sebesar 68.34% berada di atas rata-rata keseluruhan yaitu

54.77%. Sedangkan variabel 𝑋6 berlawanan arah dengan kabupaten Lombok Tengah yang

berarti penduduk miskin yang bekerja di sektor formal pada kabupaten tersebut sebesar 0.45%

berada di bawah rata-rata seluruh kabupaten sebesar 7.98%. Interpretasi yang sama pada kota

Page 23: ANOVA UNTUK ANALISIS RATA-RATA RESPON MAHASISWA …math.fkip.uns.ac.id/wp-content/uploads/2014/06/Ruang-9.pdf · Makalah Pendamping: Matematika 3 233 ANOVA UNTUK ANALISIS RATA-RATA

Prosiding SNMPM Universitas Sebelas Maret 2013 Volume 2

Makalah Pendamping: Matematika 3 255

Mataram yang searah dengan vektor variabel 𝑋8 dan berlawan arah dengan vektor variabel 𝑋7.

Hal ini menandakan penduduk miskin yang bekerja di bukan sektor pertanian (𝑋8) sebesar

50.54% berada di atas rata-rata yakni 23.11%. Sedangkan penduduk miskin yang bekerja di

sektor pertanian (𝑋7) sebesar 1.78% berada di bawah rata-rata yakni 39.64%. Interpretasi yang

sama juga berlaku untuk kabupaten/kota dan karakteristik kemiskinan lainnya.

e. Keragaman Variabel (Karakteristik Kemiskinan)

Informasi ini digunakan untuk melihat keragaman karakteristik kemiskinan setiap

kabupaten/kota. Dengan informasi ini, bisa diperkirakan pada karakteristik kemiskinan yang

mana strategi harus ditingkatkan dalam rangka menurunkan angka kemiskinan, dan juga

sebaliknya. Dalam Biplot nantinya komponen-komponen dengan keragaman yang kecil

digambarkan sebagai vektor yang pendek sedangkan komponen-komponen dengan keragaman

yang besar digambarkan sebagai vektor yang panjang.

Pada gambar 1 terlihat bahwa vektor terpanjang pada variabel 𝑋7 yaitu penduduk

miskin yang bekerja di sektor pertanian, dengan nilai keragaman sebesar 34.162. Sesuai data

aslinya penduduk miskin yang bekerja disektor pertanian (𝑋7) untuk kota Mataram sebesar

1.78%, paling kecil di antara 9 kabupaten/kota lainnya. Sedangkan kabupaten Bima menempati

urutan ke sepuluh, dengan jumlah penduduk miskin yang bekerja disektor pertanian paling besar

yaitu 55.85%. Vektor terpendek ada pada variabel 𝑋3 (angka partisipasi sekolah penduduk

miskin), yang berarti keragaman data pada variabel 𝑋3 sebesar 0.232. Ini berarti angka

partisipasi sekolah penduduk miskin sangat tinggi. Kota Bima menempati urutan pertama,

dengan angka partisipasi sekolah penduduk miskin mencapai 100%, sedangkan yang terendah

pada kota Mataram sebesar 92.58%. Hal ini menandakan program pemertintah provinsi NTB

untuk meningkatkan angka partisispasi sekolah penduduk miskin sudah berhasil, terlihat dari

nilai rata-rata angka partisipasi sekolah di 10 kabupaten/kota mencapai 96.34% (Data Tabel 1).

Interpretasi yang sama juga berlaku untuk panjang vektor variabel lainnya. Secara berturut-turut

panjang vektor variabel yang menunjukkan keragaman data karakteristik kemiskinan meliputi

variabel 𝑋7 (penduduk miskin yang bekerja disektor pertanian) sebesar 34.162, 𝑋10 (Luas lantai

perkapita rumah tangga miskin) sebesar 30.230, 𝑋8 (Penduduk miskin bekerja di bukan sektor

pertanian) sebesar 17.389, 𝑋5 (Penduduk miskin yang bekerja di sektor informal) sebesar 9.307,

𝑋1 (Penduduk Miskin) sebesar 4.020, 𝑋4 (Penduduk miskin yang tidak bekerja) sebesar 3.146,

𝑋2 (angka melek huruf penduduk miskin) sebesar 3.140, 𝑋9 (Pengeluaran perkapita untuk

makanan) sebesar 1.878, 𝑋6 (Penduduk miskin yang bekerja di sektor formal) sebesar 1.661,

dan 𝑋3 (angka partisipasi sekolah penduduk miskin) sebesar 0.232.

f. Korelasi Antar Variabel (Karakteristik Kemiskinan)

Page 24: ANOVA UNTUK ANALISIS RATA-RATA RESPON MAHASISWA …math.fkip.uns.ac.id/wp-content/uploads/2014/06/Ruang-9.pdf · Makalah Pendamping: Matematika 3 233 ANOVA UNTUK ANALISIS RATA-RATA

Volume 2 Prosiding SNMPM Universitas Sebelas Maret 2013

256 Makalah Pendamping: Matematika 3

Korelasi atau hubungan saling mempengaruhi antar karakteristik kemiskinan dapat

diinterpretasikan dari penyajian grafik Biplot. Pada grafik Biplot, karakteristik kemiskinan

digambarkan sebagai garis berarah. Dua karakteristik yang memiliki korelasi positif akan

digambarkan sebagai dua garis dengan arah yang sama sehingga membentuk sudut sempit atau

sudut lancip. Sedangkan jika dua buah karakteristik digambarkan sebagai dua garis yang

berlawanan maka dikatakan memiliki korelasi negatif, sehingga membentuk sudut lebar atau

tumpul. Namun jika dua buah karakteristik digambarkan dalam bentuk garis dengan sudut siku-

siku maka dikatakan karakteristik kemiskinan tersebut tidak saling berkorelasi atau

berhubungan.

Sudut yang dibentuk antara dua karakteristik kemiskinan merupakan nilai cosinus. Semakin

kecil nilai cosinus yang dibuat antara dua karakteristik kemiskinan maka semakin tinggi

korelasinya. Sehingga diperoleh hasil bahwa jumlah penduduk miskin (𝑋1) dan pengeluaran

perkapita untuk makanan penduduk miskin (𝑋9)saling mempengaruhi dan berkorelasi positif.

Hal tersebut ditentukan dari sudut yang terbentuk sebesar 18.03°. Semakin banyak jumlah

penduduk miskin dalam satu keluarga, maka semakin banyak pengeluaran perkapita untuk

makanan yang harus dikeluarkan. Contoh lainya yaitu pada karakteristik penduduk miskin yang

bekerja di sektor informal (𝑋5) berkorelasi negative dengan penduduk miskin yang bekerja di

sektor formal (𝑋6), dengan sudut yang terbentuk sebesar 173.84. Semakin banyak jumlah

penduduk miskin yang bekerja di sektor informal maka semakin sedikit penduduk miskin yang

bekerja di sektor formal. Interpretasi yang sama juga berlaku untuk karakteristik kemiskinan

lainnya.

SIMPULAN DAN SARAN

Simpulan

Berdasarkan analisis hasil dan pembahasan, maka dapat disimpulkan hal-hal berikut:

Analisis Biplot dalam penelitian ini memberikan penyajian yang cukup baik mengenai

informasi dari data yang sebenarnya berdasarkan nilai 𝑝2 sebesar 84,59%. Biplot yang terbentuk

dalam pada penelitian ini merupakan Square Root Biplot (SQRT) atau Biplot Simetri. Wilayah

yang memiliki kesamaan karakteristik kemiskinan ada pada kabupaten Bima dan kabupaten

Sumbawa, dengan jarak Euclid terdekat sebesar 0.266. Sedangkan jarak terjauh ada pada

kabupaten Lombok Tengah dan kota Mataram, sebesar 9.779. Keragaman karakteristik

kemiskinan ditunjukkan dengan panjang vektor, dengan vektor terpanjang pada penduduk

miskin yang bekerja di sektor pertanian (𝑋7) dan vektor terpendek pada angka partisipasi

sekolah penduduk miskin (𝑋3).

Saran.

Selain menggunakan analisis Biplot, pemetaan karakteristik kemiskinan juga dapat

dilakukan menggunakan Multidimensional Scalling atau dengan kombinasi Biplot

Page 25: ANOVA UNTUK ANALISIS RATA-RATA RESPON MAHASISWA …math.fkip.uns.ac.id/wp-content/uploads/2014/06/Ruang-9.pdf · Makalah Pendamping: Matematika 3 233 ANOVA UNTUK ANALISIS RATA-RATA

Prosiding SNMPM Universitas Sebelas Maret 2013 Volume 2

Makalah Pendamping: Matematika 3 257

menggunakan analisis faktor dan Cluster. Serta saran bagi pemerintah provinsi NTB dari hasil

pemetaan ini diharapkan program-program pemerintah dalam mengentaskan kemiskinan lebih

tepat sasaran, karena dari plot terlihat beberapa daerah yang memiliki karaktersitik kemiskinan

yang sama. Sehingga nantinya diperoleh distribusi kesejahteraan yang merata di setiap

kabupaten/kota.

DAFTAR PUSTAKA

Berita Resmi Statistik, 2012. BPS Provinsi NTB. BRS No. 44/07/52/TH.VI , 2 Juli 2012

Johnson, R.A. dan D.W. Wichern, 2002, Applied Multivariate Statistical Analysis, Fifth Edition.

Prentice Hall Inc, New Jersey.

Kohler, U. dan Luniak, M. (2005). Data inspection using Biplots. The Stata Journal Vol 5,

Number 2, pp. 208–223.

Matjik, A.A., dan Sumertajaya, (2011) I. M., Sidik Peubah Ganda dengan Menggunakan

SAS. IPB Press. Dermaga. Bogor.

Nugroho, S., 2008. Statistika Multivariat Terapan. UNIB Press. Bengkulu

Rencer, A. C., 2002. Methods of Multivariate Analysis. Brigham Young University.

Page 26: ANOVA UNTUK ANALISIS RATA-RATA RESPON MAHASISWA …math.fkip.uns.ac.id/wp-content/uploads/2014/06/Ruang-9.pdf · Makalah Pendamping: Matematika 3 233 ANOVA UNTUK ANALISIS RATA-RATA

Volume 2 Prosiding SNMPM Universitas Sebelas Maret 2013

258 Makalah Pendamping: Matematika 3

PROBABILITAS WAKTU DELAY MODEL EPIDEMI ROUTING

Dyah Wardiyani1, Respatiwulan, Sutanto

Jurusan Matematika

Fakultas Matematika dan Ilmu Pengetahuan Alam

Universitas Sebelas Maret Surakarta

1) [email protected]

Abstrak Model epidemi routing menjelaskan pengiriman paket data pada jaringan

mobile melalui analogi pada model epidemi penyebaran penyakit. Analogi didasarkan

pada kemiripan proses dan variabel. Pengiriman paket data dapat dilihat berdasarkan

banyaknya node yang menerima paket data. Perubahan banyaknyanode yang

menerima paket data terhadap waktu dapat dinyatakan dengan persamaan diferensial.

Waktu delay merupakan waktu yang dibutuhkan untuk mengirim paket dari satu node

ke node yang lain. Setiap pengiriman paket data memiliki waktu delay yang berbeda,

sehingga waktu delay dapat dipandang sebagai variabel random yang memiliki fungsi

distribusi probabilitas.

Tujuan penelitian ini adalah mengonstruksi model epidemi routing dan

menentukan probabilitas waktu delay. Selanjutnya, model epidemi routing dan

probabilitas waktu delay diterapkan pada kasus pengiriman informasi pada area

militer dan disimulasikan dengan mengambil laju pengiriman paket, 𝛽yang berbeda.

Hasil simulasi menunjukkan semakin besar 𝛽maka semakin cepat waktu yang

diperlukan agar semua node menerima paket data dan probabilitas kumulatif waktu

delay menuju 1.

Kata kunci: delay, epidemi routing, mobile, node, dan probabilitas.

1. Pendahuluan

Model epidemi merupakan model matematika yang dapat menggambarkan pola

penyebaran penyakit. Banyak ilmuwan yang meneliti dan memodelkan pola penyebaran

penyakit, diantaranya Mc.Kendrick dan Kermack [5]. Pada tahun 1927 Mc.Kendrick dan

Kermack berhasil memodelkan pola penyebaran penyakit dalam bentuk deterministik yang

sesuai dengan kasus epidemi sebenarnya. Kesesuaian model epidemi dengan kasus epidemi

sebenarnya, mengakibatkan banyak dilakukan pengembangan model epidemi. Menurut Isham

[4], pengembangan model epidemi dapat dilakukan dengan menambah variabel atau menambah

perlakuan. Pengembangan model epidemi juga dapat dilakukan dengan melakukan analogi

antara proses penyebaran penyakit dengan proses lain yang memiliki kemiripan proses. Salah

satu proses yang mirip dengan penyebaran penyakit adalah proses pengiriman paket data pada

routing (Zhang [10]).

Routing merupakan proses pemilihan jalur pengiriman paket data pada suatu jaringan

mobile (Andrew [1]). Jaringan mobile dibentuk oleh beberapa node yang dapat berpindah

tempat atau bersifat mobile. Menurut Liu [7] dan Zhang [10], pengiriman paket data pada

routing dapat dinyatakan dengan algoritma store- carry-forward. Maksud dari algoritma store-

carry-forward adalah node menerimapaket data, membawa paket data dan mengirimkannya ke

node lain yang belummemiliki paket data sampai semua node memiliki paket data. Menurut

Page 27: ANOVA UNTUK ANALISIS RATA-RATA RESPON MAHASISWA …math.fkip.uns.ac.id/wp-content/uploads/2014/06/Ruang-9.pdf · Makalah Pendamping: Matematika 3 233 ANOVA UNTUK ANALISIS RATA-RATA

Prosiding SNMPM Universitas Sebelas Maret 2013 Volume 2

Makalah Pendamping: Matematika 3 259

Small [8]dan Sun[9], algoritma store-carry-forward mirip dengan proses penyebaran

penyakitpada model susceptible infected (SI ). Pada model SI, individu menularkanpenyakit ke

individu lain yang belum terinfeksi. Karena kemiripan proses penyebaranpenyakit dan

pengiriman paket data pada routing, maka dapat dilakukananalogi.

Model analogi penyebaran penyakit dan pengiriman paket data pada routing disebut

dengan model epidemi routing (Zhang [10]). Model epidemi routing menggambarkan pola

pengiriman paket data pada routing berdasarkan banyaknyanode yang menerima paket data tiap

waktu. Menurut Zhang [10], padamodel epidemi routing diharapkan mampu mencapai

minimum waktu penundaanpengiriman paket data (waktu delay). Waktu delay merupakan

selang waktudari pertama kali paket data diterima oleh sebuah node sampai dikirimkan ke

nodeyang lain. Pengiriman paket yang satu dengan yang lain memiliki waktu delay yang

berbeda, sehingga waktu delay tidak dapat diprediksi dengan pasti. Olehkarena itu waktu delay

dapat dipandang sebagai variabel random. Ketidakpastian waktu delay dapat dinyatakan dalam

fungsi distribusi kumulatif waktu delay.Sehingga pada penelitian ini akan dikonstruksi ulang

model epidemi routing danprobabilitas waktu delay.

2. Model Epidemi Routing

Model epidemi routing merupakan model yang dapat menggambarkan pola pengiriman

paket data pada jaringan mobile berdasarkan banyaknya node yang menerima paket data.

Menurut Zhang [10], model epidemi routing dapat mudah dikonstruksi dengan menganalogikan

pengiriman paket data dan penyebaran penyakit, berdasarkan proses dan variabel yang

berpengaruh. Menurut Small [8] dan Sun [9], model epidemi yang sesuai dengan proses

pengiriman paket data pada routing adalah model susceptible infected (SI).

Pada model SI, populasi individu dibagi ke dalam dua kelompok, yaitu kelompok

individu rentan (𝑆) dan kelompok individu terinfeksi penyakit (𝐼). Individu 𝑆 dapat terinfeksi

penyakit dengan laju penularan sebesar b, sehingga banyaknya individu 𝑆 akan berkurang

sebesar 𝑏𝑆𝐼 ke individu 𝐼. Individu rentan yang terus berkurang mengakibatkan semua individu

akan terinfeksi penyakit.

Karena pengiriman paket data pada routing dapat dianalogikan dengan model SI,

asumsi pada model epidemi routing mengacu pada model SI. Berikut adalah asumsi-asumsi

konstruksi model epidemi routing.

1. Pengiriman paket data terjadi pada suatu jaringan mobile dengan banyaknya node

konstan.

2. Node dalam jaringan mobile tersebut dibagi ke dalam kelompok node tanpa paket dan

node yang memiliki paket.

3. Setiap node memiliki peluang yang sama untuk mendapat paket data.

4. Hanya satu paket data yang dikirimkan

Page 28: ANOVA UNTUK ANALISIS RATA-RATA RESPON MAHASISWA …math.fkip.uns.ac.id/wp-content/uploads/2014/06/Ruang-9.pdf · Makalah Pendamping: Matematika 3 233 ANOVA UNTUK ANALISIS RATA-RATA

Volume 2 Prosiding SNMPM Universitas Sebelas Maret 2013

260 Makalah Pendamping: Matematika 3

Pada model epidemi routing, node-node dibagi dalam kelompok node tanpa paket data

(𝑆) dan kelompok node yang memiliki paket data (𝐼). Node 𝑆dapat terkirimi paket data dengan

laju pengiriman paket data sebesar 𝛽, sehingga node 𝑆akan berkurang ke node 𝐼sebesar 𝛽𝑆𝐼.

Karena setiap node memiliki kemungkinan yang sama untuk menerimat paket data, banyaknya

node kelompok 𝑆berpindah ke kelompok 𝐼sebesar 𝛽𝑆𝐼. Sehingga proses pengiriman dan

penerimaan paket data antar node disajikan dalam Gambar 1.

Gambar 1. Proses pengiriman dan penerimaan paket data antar node

Banyaknya node pada kelompok 𝑆dan 𝐼pada waktu 𝑡, masing-masing dinyatakan

sebagai 𝑆(𝑡) dan 𝐼(𝑡). Jika banyaknya node dalam jaringan mobile dinyatakan dengan 𝑁maka

𝑆(𝑡) = 𝑁 − 𝐼(𝑡). Dengan demikian perubahan banyaknya node yang menerima paket data

terhadap waktu dapat dinyatakan sebagai

𝑑𝐼(𝑡)

𝑑𝑡= 𝛽𝐼 𝑡 𝑁 − 𝐼 𝑡 , (2.1)

dengan laju pengiriman paket data 𝛽 > 0.

Model epidemi routing menggambarkan pola pengiriman paket data berdasarkan

banyaknya node yang menerima paket data. Persamaan (2.1) menyatakan perubahan banyaknya

node yang menerima paket data terhadap waktu. Sehingga persamaan (2.1) perlu diselesaikan

untuk mendapatkan banyaknya node yang menerima paket data tiap waktu.

Persamaan (2.1) harus dibentuk ke dalam persamaan diferensial dengan variabel

terpisah (Campbell [2]), yaitu

𝑑𝐼(𝑡)

𝐼 𝑡 1 −𝐼 𝑡

𝑁

= 𝛽 𝑁𝑑𝑡 (2.2)

Jika diasumsikan 𝐼(0) = 1 yang berarti mula-mula terdapat sebuah node yang memiliki paket

data, maka banyaknya node yang menerima paket data dapat dinyatakan sebagai

𝐼 𝑡 =𝑁

1 + 𝑁 − 1 𝑒−𝛽𝑁𝑡, (2.3)

dengan laju pengiriman paket data 𝛽 > 0.

Jika nilai 𝛽semakin besar maka nilai 𝑒−𝛽𝑁𝑡 semakin mendekati 0. Hal ini

mengakibatkan banyaknya node yang menerima paket data mendekati 𝑁. Sedangkan jika

𝛽bernilai 0 maka 𝑒−𝛽𝑁𝑡bernilai 1, berakibat hanya terdapat sebuah node yang menerima paket

data yaitu node awal. Sehingga dapat disimpulkan bahwa semakin besar 𝛽maka banyaknya

node yang menerima paket data semakin cepat mendekati N.

3. Probabilitas Waktu Delay

Page 29: ANOVA UNTUK ANALISIS RATA-RATA RESPON MAHASISWA …math.fkip.uns.ac.id/wp-content/uploads/2014/06/Ruang-9.pdf · Makalah Pendamping: Matematika 3 233 ANOVA UNTUK ANALISIS RATA-RATA

Prosiding SNMPM Universitas Sebelas Maret 2013 Volume 2

Makalah Pendamping: Matematika 3 261

Ketika terjadi pengiriman paket data pada jaringan mobile dimungkinkan terdapat waktu

penundaan pengiriman paket data atau waktu delay (Groenevelt [3]). Menurut Zhang [10] dan

Zhou [11], waktu delay merupakan selang waktu dari pertama kali paket data diterima oleh

sebuah node sampai dikirimkan ke node yang lain, 𝑡 < 𝑇𝑑 < 𝑡 + 𝛥𝑡dengan 𝛥𝑡 kecil.

Pengiriman paket yang satu dengan yang lain memiliki waktu delay yang berbeda, sehingga

waktu delay tidak dapat diprediksi secara pasti. Oleh karena itu, waktu delay dapat dipandang

sebagai variabel random. Ketidakpastian waktu delay dapat dinyatakan dalam fungsi distribusi

kumulatif waktu delay. Menurut Zhang [10], fungsi distribusi kumulatif dari 𝑇𝑑 ,𝑃𝑁(𝑡) =

𝑃𝑟(𝑇𝑑 < 𝑡).

Fungsi distribusi kumulatif 𝑇𝑑sulit diperoleh secara langsung. Menurut Small [8] dan

Lin [6] perubahan fungsi distribusi kumulatif 𝑇𝑑untuk 𝛥𝑡kecil dapat dinyatakan dengan

𝑑𝑃𝑁 𝑡

𝑑𝑡= lim

∆𝑡→0

𝑃𝑁 𝑡 + ∆𝑡 − 𝑃𝑁 𝑡

∆𝑡

= lim∆𝑡→0

−𝑃 𝑇𝑑 > 𝑡 + ∆𝑡 − 𝑃 𝑇𝑑 > 𝑡

∆𝑡. 3.1

Pada persamaan (3.1),

𝑃 𝑇𝑑 > 𝑡 + ∆𝑡 = 𝑃(𝑡𝑖𝑑𝑎𝑘 𝑎𝑑𝑎 𝑤𝑎𝑘𝑡𝑢 𝑑𝑒𝑙𝑎𝑦 𝑝𝑎𝑑𝑎 [𝑡, 𝑡 + ∆𝑡]|𝑇𝑑 > 𝑡)𝑃(𝑇𝑑 > 𝑡)

= (1 − 𝑃 𝑎𝑑𝑎 𝑤𝑎𝑘𝑡𝑢 𝑑𝑒𝑙𝑎𝑦 𝑝𝑎𝑑𝑎 𝑡, 𝑡 + ∆𝑡 𝑇𝑑 > 𝑡 )𝑃 𝑇𝑑 > 𝑡 . (3.2)

Probabilitas waktu delay pada 𝑡, 𝑡 + ∆𝑡 ditentukan berdasarkan durasi delay dan rata-rata

banyaknya node yang menerima paket data. Karena waktu delay terdapat pada 𝑡, 𝑡 + ∆𝑡 maka

durasi delay sebesar ∆𝑡, sedangkan rata-rata banyaknya node yang menerima paket data sebesar

𝛽𝐼(𝑡). Probabilitas waktu delay pada 𝑡, 𝑡 + ∆𝑡 dinyatakan sebagai

𝑃 𝑎𝑑𝑎 𝑤𝑎𝑘𝑡𝑢 𝑑𝑒𝑙𝑎𝑦 𝑝𝑎𝑑𝑎 𝑡, 𝑡 + ∆𝑡 𝑇𝑑 > 𝑡 = ∆𝑡𝛽𝐼 𝑡 . (3.3)

Persamaan (3.3) disubtitusikan ke persamaan (3.2), sehingga didapatkan

𝑃𝑟 𝑇𝑑 > 𝑡 + ∆𝑡 = 1 − ∆𝑡𝛽𝐼 𝑡 𝑃 𝑇𝑑 > 𝑡 . (3.4)

Selanjutnya, persamaan (3.4) disubstitusikan ke persamaan (3.1), diperoleh

𝑑𝑃𝑁 𝑡

𝑑𝑡= lim

∆𝑡→0−

[𝑃 𝑇𝑑 > 𝑡 1 − ∆𝑡𝛽𝐼 𝑡 − 𝑃 𝑇𝑑 > 𝑡

∆𝑡

= 𝛽𝐼 𝑡 𝑃 𝑇𝑑 > 𝑡 .

Karena 𝑃 𝑇𝑑 > 𝑡 = 1 − 𝑃(𝑇𝑑 < 𝑡), maka

𝑑𝑃𝑁 𝑡

𝑑𝑡= 𝛽𝐼 𝑡 1 − 𝑃𝑁 𝑡 . (3.5)

Persamaan (3.5) diselesaikan untuk mendapatkan persamaan yang menyatakan

probabilitas waktu delay. Persamaan (3.5) harus dibentuk ke dalam persamaan diferensial

dengan variabel terpisah (Campbell [2]). Jika diasumsikan 𝑃(0) = 0, maka penyelesaian

persamaan (3.5) yaitu

Page 30: ANOVA UNTUK ANALISIS RATA-RATA RESPON MAHASISWA …math.fkip.uns.ac.id/wp-content/uploads/2014/06/Ruang-9.pdf · Makalah Pendamping: Matematika 3 233 ANOVA UNTUK ANALISIS RATA-RATA

Volume 2 Prosiding SNMPM Universitas Sebelas Maret 2013

262 Makalah Pendamping: Matematika 3

𝑃𝑁 𝑡 = 1 −𝑁

𝑒𝛽𝑁𝑡 + (𝑁 − 1), (3.6)

dengan laju pengiriman paket data 𝛽 > 0.

Jika nilai 𝛽semakin besar maka nilai 𝑒𝛽𝑁𝑡 juga semakin besar tergantung pada 𝑁. Hal

ini mengakibatkan probabilitas kumulatif waktu delay semakin mendekati 1. Sedangkan jika

𝛽bernilai 0 maka 𝑒𝛽𝑁𝑡bernilai 1, berakibat probabilitas kumulatif waktu delay bernilai 0.

Sehingga dapat disimpulkan bahwa semakin besar 𝛽maka probabilitas kumulatif waktu delay

semakin cepat mendekati 1.

4. Penerapan Kasus

Pada bagian ini diberikan kasus pengiriman paket data jaringan mobile di area militer.

Pada area militer tertentu terdapat 100 node mobile yang dapat mengirimkan paket data dengan

laju 0.222 jam/node (Groenevelt [3]). Semua node dalam jaringan mobile tersebut diharapkan

dapat menerima paket data dengan terdapat sebuah sumber atau node awal yang memiliki paket

data. Banyaknya node pada waktu t pada jaringan mobile di area militer tersebut dapat

dinyatakan dengan

𝐼 𝑡 =100

1 + 99𝑒−22.2𝑡. (4.1)

Pada model epidemi routing juga diharapkan mampu mencapai minimum waktu

penundaan pengiriman paket data (delay).Pengiriman paket yang satu dengan yang lain

memiliki waktu delay yang berbeda, sehingga waktu delay tidak dapat diprediksi dengan pasti.

Oleh karena itu waktu delay dapat dipandang sebagai variabel random. Ketidakpastian waktu

delay dapat dinyatakan dalam fungsi distribusi kumulatif waktu delay. Fungsi distribusi

kumulatif waktu delay pada jaringan mobile dalam area militer tersebut adalah

𝑃𝑁 𝑡 = 1 −100

𝑒22.2𝑡 + 99. (4.2)

Persamaan (4.1) dan persamaan (4.2) yang menyatakan banyaknya node yang menerima paket

data dan probabilitas kumulatif waktu delay dapat dilihat pada Gambar 2.

Gambar 2 (𝑎) menunjukan bahwa pada waktu 0.87 jam semua node dalam jaringan

mobile telah menerima paket data. Gambar 2 (𝑏) menunjukan bahwa probabilitas kumulatif

waktu delay kurang dari 0,87 jam dalam jaringan mobile menuju 1. Hal ini menunjukan

probabilitas waktu delay mendekati 0 atau dapat dikatakan sudah tidak terjadi waktu delay.

Sehingga semua node dalam jaringan mobile pada area militer tersebut menerima paket dan

probabilitas delay mencapai minimum setelah 0,87 jam. Banyaknya node yang menerima paket

data dan probabilitas waktu delay pengiriman paket data dalam area militer tersebut hanya

dipengaruhi oleh laju pengiriman paket data.

Page 31: ANOVA UNTUK ANALISIS RATA-RATA RESPON MAHASISWA …math.fkip.uns.ac.id/wp-content/uploads/2014/06/Ruang-9.pdf · Makalah Pendamping: Matematika 3 233 ANOVA UNTUK ANALISIS RATA-RATA

Prosiding SNMPM Universitas Sebelas Maret 2013 Volume 2

Makalah Pendamping: Matematika 3 263

Gambar 2. (a) Banyaknya node yang menerima paket data dan (b) probabilitas waktu delay

Pengaruh laju pengiriman paket data 𝛽terhadap pola pengiriman paket data dan

probabilitas waktu delay dalam jaringan mobile dapat diperjelas dengan simulasi. Simulasi pola

pengiriman paket data dan probabilitas waktu delay untuk 𝛽 = 0.15, 𝛽 = 0.222, 档𝑎𝑛 𝛽 = 0.9

dapat dilihat pada Gambar 3.

Gambar 3. (𝑎) Banyaknya node yang menerima paket data dan (b) probabilitas waktu delay

dengan 𝛽 = 0.15, 𝛽 = 0.222, 𝑑𝑎𝑛 𝛽 = 0.9

Gambar 3 (𝑎) menunjukan bahwa untuk 𝛽 = 0.15 semua node dalam jaringan mobile

dapat menerima paket data dalam waktu 1.28 jam, untuk 𝛽 = 0.222 memerlukan waktu 0.87

jam, dan 𝛽 = 0.9 memerlukan waktu 0.22 jam. Sedangkan dari Gambar 3 (𝑏) terlihat bahwa

untuk 𝛽 = 0.15 probabilitas waktu delay menuju 1 setelah 1.28 jam, untuk 𝛽 = 0.222 setelah

0.87 jam, dan 𝛽 = 0.9 setelah 0.22 jam. Sehingga dapat disimpulkan bahwa semakin besar laju

pengiriman paket data (𝛽)maka semakin cepat waktu yang diperlukan agar semua node

menerima paket data dan probabilitas waktu delay cepat menuju 1. Hasil simulasi ini

memperjelas pengaruh laju pengiriman paket data (𝛽)terhadap banyaknya node yang menerima

paket data dan probabilitas waktu delay yang telah dijelaskan sebelumnya.

Page 32: ANOVA UNTUK ANALISIS RATA-RATA RESPON MAHASISWA …math.fkip.uns.ac.id/wp-content/uploads/2014/06/Ruang-9.pdf · Makalah Pendamping: Matematika 3 233 ANOVA UNTUK ANALISIS RATA-RATA

Volume 2 Prosiding SNMPM Universitas Sebelas Maret 2013

264 Makalah Pendamping: Matematika 3

5. Kesimpulan

Model epidemi routing pada jaringan mobile dinyatakan sebagai

𝐼 𝑡 =𝑁

1 + 𝑁 − 1 𝑒−𝛽𝑁𝑡 ,

dengan syarat terdapat satu node awal yang memiliki paket data, sedangkan probabilitas

kumulatifwaktu delay pada model epidemi routing yaitu

𝑃𝑁 𝑡 = 1 −𝑁

𝑒𝛽𝑁𝑡 + (𝑁 − 1),

dengan probabilitas waktu delay mula-mula 0, laju pengiriman paket data 𝛽 > 0 dan banyaknya

node dalam jaringan N. Simulasi menunjukan semakin besar laju pengiriman paket data

(𝛽) maka semakin cepat waktu yang diperlukan agar semua node menerima paket data dan

probabilitas waktu delay juga semakin cepat menuju 1.

DAFTAR PUSTAKA

[1] Andrew S.T., Computer Networks, Pearson Education, Inc., Amsterdam, 2003.

[2] Campbell,L. Stephen, An Introduction to Differential Equations and Their Application,

second ed., Wadswordh, Inc, California, USA, 1990.

[3] Groenevelt, R., P. Nain, and G. Koole, The Message Delay in Mobile Ad Hoc Network,

Perform (2005), no. 62, 210-228.

[4] Isham, V., Stochastic Models for Epidemics, Research Report 263, Department of

Statistical Science, University College London, 2004.

[5] Kermack,W.O. and A. G. McKendrick, A Contribution to The Mathematical Theory

ofEpidemics, Proceedings of the Royal Society of London Series A 115(1927), 700-721.

[6] Lin, Y., B. Li, B. Liang, Stochastic Analysis of Network Coding in Epidemic Routing, ACN

MobiOpp (2007).

[7] Liu, J., X. Jiang, H. Nishiyama, and N. Kato, General Model for Store-Carry-

ForwardRouting Schemes with Multicast in Delay Tolerant Networks, IEEE (2011), 494-

500.

[8] Small, T., and Z.J. Haas, The Shared Wireless Infostation Model-A New Ad Hoc

NetworkingParadigm, MobiHoc, Maryland, USA (2003), 233-244.

[9] Sun,L., Epidemic Content Distribution in Mobile Networks, Master of science thesis, KTH

Royal Institute of Technology, Stockholm, Swedia, Februari 2013.

[10] Zhang, E., G. Neglia, J. Kurose, and D. Towsley, Performance Modeling of

EpidemicRouting, Tech. Report 44, UMass Computer Science, 2005.

[11] Zhou, S., L. Ying, S. Tirthapura, Delay, Cost and Infrastructure Tradeoff of Epidemic

Routingin Mobile Sensor Networks, Proceedings of 11 the 6th International Wireless

Communications and Mobile Computing Conference.

Page 33: ANOVA UNTUK ANALISIS RATA-RATA RESPON MAHASISWA …math.fkip.uns.ac.id/wp-content/uploads/2014/06/Ruang-9.pdf · Makalah Pendamping: Matematika 3 233 ANOVA UNTUK ANALISIS RATA-RATA

Prosiding SNMPM Universitas Sebelas Maret 2013 Volume 2

Makalah Pendamping: Matematika 3 265

PIECEWISE POLYNOMIAL SMOOTH SUPPORT VECTOR MACHINE

UNTUK KLASIFIKASI DESA TERTINGGAL

DI PROVINSI KALIMANTAN TIMUR

Ita Wulandari1)

, Santi Wulan Purnami2)

, Santi Puteri Rahayu3)

1,2,3) Program Magister Jurusan Statistika FMIPA ITS

Kampus ITS Keputih, Sukolilo, Surabaya 60111, Jawa Timur,

[email protected], [email protected], [email protected]

Abstrak

Support Vector Machine (SVM) adalah metode yang sangat popular untuk klasifikasi

data biner pada data mining. SVM dapat diaplikasikan secara luas seperti pengenalan

pola, analisis regresi, dan estimasi probabilitas. SVM memanfaatkan optimasi dengan

quadratic programming yang apabila digunakan untuk data berdimensi tinggi dan data

dengan jumlah besar menjadi kurang efisien. Oleh karena itu para peneliti

mengembangkan suatu teknik dengan mengubah formulasi SVM menggunakan

smoothing technique yang disebut Smooth-SVM (SSVM). Teknik ini mampu

mengkonversi quadratic programming pada SVM menjadi linear programming.

Penelitian selanjutnya berkembang dengan memodifikasi smooth function pada SSVM

kedalam bentuk polynomial smooth function seperti: quadratic polynomial function,

fourth polynomial function, piecewise polynomial function dan spline function.

Dibandingkan dengan ketiga polynomial smooth function lainnya, piecewise polynomial

function mempunyai performansi yang lebih baik. Piecewise polynomial function jika

diterapkan pada model SSVM, maka akan diperoleh model Piecewise Polynomial

Smooth Support Vector Machine (PPSSVM). Penelitian ini menggunakan dua model

yaitu Smooth-SVM (SSVM) dan PPSSVM yang ditemukan oleh Wu dan Wang.

Penelitian ini akan mengkaji performansi piecewise polynomial function dan

konvergensi kedua model secara teoritis serta mencoba menerapkan model terbaik

untuk klasifikasi desa tertinggal di Provinsi Kalimantan Timur menggunakan data

PODES (Potensi Desa) 2011.

Keywords: desa tertinggal, klasifikasi, piecewise polynomialsmooth functionSVM,

Smooth SVM.

PENDAHULUAN

SVM adalah suatu teknologi pembelajaran statistik yang dapat menghasilkan

performansi generalisasi terbaik. SVM diperkenalkan untuk pertama kalinya oleh Vapnik pada

tahun 1995 dan sangat berhasil melakukan prediksi, baik dalam kasus klasifikasi maupun

regresi. Metode ini berusaha untuk menemukan fungsi pemisah optimal yang bisa memisahkan

dua set data dari dua kelas atau disebut juga hyperplane terbaik diantara fungsi yang tidak

terbatas (Gunn, 1998).

Lee dan Mangasarian, (2001) menyatakan bahwa SVM memanfaatkan optimasi

dengan quadratic programming yang apabila digunakan untuk data berdimensi tinggi dan data

dengan jumlah besar menjadi kurang efisien. Oleh karena itu para peneliti mengembangkan

smoothing technique untuk mengubah optimasi yang terbatas menjadi optimasi yang tanpa

batas menggunakan formulasi dari SVM standar. Teknik tersebut adalah Smooth-SVM (SSVM)

yang mampu mengkonversi quadratic programming pada SVM menjadi linear programming

dengan menggunakan algoritma Newton-Armijo.

Page 34: ANOVA UNTUK ANALISIS RATA-RATA RESPON MAHASISWA …math.fkip.uns.ac.id/wp-content/uploads/2014/06/Ruang-9.pdf · Makalah Pendamping: Matematika 3 233 ANOVA UNTUK ANALISIS RATA-RATA

Volume 2 Prosiding SNMPM Universitas Sebelas Maret 2013

266 Makalah Pendamping: Matematika 3

Para peneliti kemudian mengembangkan smooth function ke dalam bentuk fungsi

polynomial. Yuan dan Huang, (2005) menemukan quadratic polynomial function dan fourth

polynomial function. Luo dkk, (2006) menemukan piecewise polynomial function. Yuan dkk,

(2007) menemukan spline function. Purnami dkk, (2009a, 2009b) membandingkan keempat

fungsi yang ditemukan oleh peneliti-peneliti tersebut pada permasalahan diagnosis kanker

payudara. Hasil yang diperoleh adalah piecewise polynomial function mempunyai performansi

terbaik.

Penelitian selanjutnya dilakukan oleh Wu dan Wang (2013) yang menemukan

piecewise polynomial function yang berbeda rumus fungsinya dengan yang ditemukan Luo, dkk

(2006). Penelitian tersebut memberikan kesimpulan bahwa piecewise polynomial function

memiliki efisiensi, ketepatan serta akurasi yang terbaik.

Pada penelitian ini akan membandingkan model PPSSVM yang ditemukan Wu dan

Wang dengan model SSVM. Kedua model akan dilihat performansi smooth function dan

konvergensi kedua model secara teoritis untuk mendapatkan model terbaik. Model terbaik

selanjutnya diterapkan untuk klasifikasi desa tertinggal di Provinsi Kalimantan Timur

menggunakan data PODES Tahun 2011.

METODE PENELITIAN

Data dan Prosedur Penelitian

Data yang digunakan dalam penelitian ini adalah data sekunder. Variabel respon

berasal dari Kemendagri pada profil desa dan kelurahan 2011: data dasar tipologi klasifikasi,

kategori desa kelurahan (2012). Variabel prediktor berasal dari BPS yaitu data PODES Provinsi

Kalimantan Timur Tahun 2011 yang terdiri dari 16 variabel. Penelitian dilakukan terhadap 1465

desa. Untuk melakukan analisis data dalam penelitian ini digunakan program aplikasi

MATLAB. Langkah-langkah analisis data penelitian ini antara lain sebagai berikut:

1. Melakukan analisis secara teoritis performansi smooth function dan konvergensi kedua

modeluntuk mendapatkan model terbaik. Langkah-langkah untuk menyelesaikan tahap ini

adalah sebagai berikut:

a. Performansi smooth function: membandingkan selisih antara smooth function dengan

plus function.

b. Konvergensi kedua model: dengan membuktikan bahwa problem optimasi model

SSVM dan PPSSVM dapat mendekati problem optimasi model awal ketika k

mendekati tak hingga.

2. Model terbaik kemudian digunakan untuk klasifikasi desa tertinggal di Provinsi

Kalimantan Timur menggunakan data PODES 2011. Langkah-langkahnya adalah sebagai

berikut:

Page 35: ANOVA UNTUK ANALISIS RATA-RATA RESPON MAHASISWA …math.fkip.uns.ac.id/wp-content/uploads/2014/06/Ruang-9.pdf · Makalah Pendamping: Matematika 3 233 ANOVA UNTUK ANALISIS RATA-RATA

Prosiding SNMPM Universitas Sebelas Maret 2013 Volume 2

Makalah Pendamping: Matematika 3 267

a. Menggunakan fungsi kernel Gaussian dalam implementasi pembentukan model

terbaik.

b. Membagi data training dan testing menggunakan 10-fold cross validation.

c. Mencari kombinasi 2log dan

2log v terbaik sebagai parameter model terbaik dengan

memilih akurasi yang paling tinggi.

d. Membangun model terbaik dengan algorithma Newton-Armijo.

e. Evaluasi performansi klasifikasi dilihat dari akurasinya.

Teknik Analisis Data

1. Support Vector Machine (SVM)

Support Vector Machine (SVM)pertama kali diusulkan oleh Vapnik untuk klasifikasi

dua kategori atau binomial. Pada bentuk yang paling sederhana, SVM memisahkan titik-titik dari

kelas yang berbeda, misalkan kelas {+1} dan {-1} dengan hyperplane tunggal pada ruang

berdimensi banyak yang pada akhirnya partisi-partisi tersebut diselesaikan secara nonlinier.

Hyperplane yang optimum diperoleh melalui program nonlinier, tepatnya quadratic

programming (Bertsimas dan Shioda, 2007).

Diberikan permasalahan klasifikasi dari sebanyak n objek dalam ruang dimensi Rp

sehingga susunan data berupa matrik A berukuran n x p dan keanggotaan tiap titik yaitu yi

terhadap kelas {+1} atau {-1} didefinisikan pada diagonal matriks D berukuran n xn. Untuk

permasalahan klasifikasi program dari algorithma SVM standar adalah sebagai berikut ( 22||.||

SVM

):

1

2122

( , , )min ' || ||

w ye y w

p nRv

(1)

dengan kendala ( )D Aw e y e

y 0

dimana:

v : Parameter yang ditentukan sebagai pengontrol (trade off)

y : Vektor variabel slack berukuran n x 1 yang mengukur kesalahan klasifikasi dan bernilai

nonnegatif.

e : Vektor kolom berukuran n dan bernilai 1.

w : Vektor normal berukuran p x1 .

: Nilai bias yang menentukan lokasi relatifhyperplane terhadap kelas asli.

Hyperplane margin yang mungkin dibentuk dalam memisahkan objek-objek dalam

masalah klasifikasi dua kelas secara linier adalah sebagai berikut:

' 0,x w (2)

Page 36: ANOVA UNTUK ANALISIS RATA-RATA RESPON MAHASISWA …math.fkip.uns.ac.id/wp-content/uploads/2014/06/Ruang-9.pdf · Makalah Pendamping: Matematika 3 233 ANOVA UNTUK ANALISIS RATA-RATA

Volume 2 Prosiding SNMPM Universitas Sebelas Maret 2013

268 Makalah Pendamping: Matematika 3

Sehingga kedua bidang memisahkan dua kelas dengan soft margin yang ditentukan oleh

variabel slack nonnegatif, adalah sebagai berikut:

' 1 ' 1

' 1 ' 1

x w y x A D

x w y x A D

i i ii

i i ii

untuk dan

untuk dan

(3)

Dimana vektor x adalah bagian dari matriks A berukuran p x 1. Dimana i= 1,2,…,n.

Persamaan di atas merupakan subject to bagi fungsi SVM yang dapat ditulis dalam satu

persamaan matriks sebagai berikut:

( )D Aw e y e y 0dan (4)

Penyelesaian persamaan (1) akan mudah diselesaikan dengan meminimumkan fungsi

Lagrange terhadap w, , y serta meminimumkan terhadap Lagrange multiplier α βdan .

2

2

1( , , , , ) || || ' '( ( ) ) '

2w y α β w e y α D Aw e e β yL v (5)

Nonlinier SVM dengan bidang pemisah yang nonlinier diperoleh dengan

mentransformasi formulasi SVM standar sebagai berikut:

'w A Du (6)

Sangat sulit untuk mengetahui fungsi transformasi yang tepat, untuk itu pada SVM

digunakan „kernel trik’. Teknik ini dapat tercapai tanpa perlu mengetahui pemetaan

nonliniernya. Pemetaan tersebut dilakukan melalui sebuah fungsi kernel, yaitu (Hsu dkk, 2008):

a. Kernel Linier

, T

i iK x x x x (7)

b. Polynomial Kernel

, , 0d

T

i iK x x r x x (8)

c. Fungsi Kernel Gaussian

2, exp | | , 0i iK x x x x (9)

d. Eksponensial Kernel

, tanh T

i iK x x x r x (10)

Fungsi kernel yang umum digunakan adalah kernel Gaussian. Dengan ,r dan d merupakan

parameter kernel dan i,j=1,2,…,n.

Dengan menggantikan A’A dengan kernel nonlinier K(A,A’) menghasilkan nonlinear

generalized SVM adalah sebagai berikut:

1( , , )

1min ' ' ' ( , ')

2w ye y u D A A Du

p nRv K

(11)

dengan kendala ( ( ') )D AA Du e y eK

y 0

Page 37: ANOVA UNTUK ANALISIS RATA-RATA RESPON MAHASISWA …math.fkip.uns.ac.id/wp-content/uploads/2014/06/Ruang-9.pdf · Makalah Pendamping: Matematika 3 233 ANOVA UNTUK ANALISIS RATA-RATA

Prosiding SNMPM Universitas Sebelas Maret 2013 Volume 2

Makalah Pendamping: Matematika 3 269

2. Smooth Support Vector Machine (SSVM)

Sejak pertama kali muncul, metode SVM telah banyak dikembangkan dan

dimodifikasi demi meningkatkan performansi dan efisiensinya. Tahun 2001 Lee dan

Mangasarian merekomendasikan formulasi baru dari SVM dengan kernel dan nonlinier untuk

analisis klasifikasi menggunakan smoothing technique sehingga dinamakan smooth support

vector machine (SSVM).

Pendekatan smoothing Lee dan Mangasarian. (2001) menjadikan variabel slack y

menjadi 2-norm yang diboboti 2

v. Dengan demikian problem optimasi pada SSVM adalah:

2

, ,

1min ' '

2 2

v

w yy y w w (12)

dengan kendala ( )D Aw e y e

,y 0

di mana untuk memperoleh solusi problem (12), kendala-kendalanya dapat ditulis sebagai

berikut:

( ( ))y e D Aw e (13)

Subtitusi persamaan (13) terhadap persamaan (12) menghasilkan fungsi objektif tanpa kendala

sebagai berikut

2 2

2,

1min || ( ( )) || ( ' )

2 2we D Aw e w w

v

(14)

Dimana ( ) menggantikan komponen-komponen bernilai negatif dengan nilai nol. Fungsi

objektif dalam persamaan (14) tidak memiliki turunan kedua, smoothing technique yang

diusulkan Lee dan Mangasarian (2001) dilakukan dengan menggantikan fungsi plus dengan p(x,

) yaitu integral dari fungsi sigmoidneural network 1(1 exp( ))x atau dapat dituliskan

sebagai berikut

1( , ) log(1 ), 0xp x x

(15)

di mana adalah smoothing parameter. Menggantikan

dengan p(x, ), maka diperoleh

model SSVM sebagai berikut

1 1

2 2

2( , ) ( , )

1min ( , ) min || ( ( ), || ( ' )

2 2w ww e D Aw e w w

n nR b R

vp

(16)

Sedangkan problem optimasi untuk SSVM non linier diperoleh sebagai berikut:

1 1

2 2

2( , ) ( , )

1min ( , ) : min || ( ( ( , ') ), ) || ( ' )

2 2u uw e D A A Du e u u

n nR R

vp K

(17)

Page 38: ANOVA UNTUK ANALISIS RATA-RATA RESPON MAHASISWA …math.fkip.uns.ac.id/wp-content/uploads/2014/06/Ruang-9.pdf · Makalah Pendamping: Matematika 3 233 ANOVA UNTUK ANALISIS RATA-RATA

Volume 2 Prosiding SNMPM Universitas Sebelas Maret 2013

270 Makalah Pendamping: Matematika 3

Program optimasi linier maupun non linier dapat diselesaikan dengan algoritma Newton-

Armijo.

Langkah-langkah algoritma Newton-Armijo dimulai dengan inisiasi 0 0 1( , )w

nR ,

kemudian mengulangginya sampai gradient dari fungsi objektif (16) atau (17) sama dengan nol

atau ( , ) 0wi i

. Selainnya, menghitung 1 1( , )w

i i sebagai berikut :

1) Newton Direction: menentukan direction 1i nd R dengan menyelesaikan n +1

persamaan linier dengan n +1 variabel sebagai berikut:

2 '( , ) ( , )w wi i i i id

(18)

2) Armijo Stepsize: memilih stepsize i R sedemikian hingga:

1 1, ,w wi i i i i

id (19)

dimana i maksimumkan

1 11, , ,...

2 4

sehingga:

, , ,w w wi i i i i i i i

i id d (20)

dengan 1

0,2

Saat , 0wi i

, iterasi pada algoritma Newton-Armijo berhenti, dan

diperoleh nilai w dan yang konvergen. Dengan demikian fungsi pemisah yang diperoleh

untuk kasus klasifikasi linier adalah :

( ) ( ' ),x wf x sign (21)

Sedangkan fungsi pemisah untuk kasus klasifikasi nonlinier adalah sebagai berikut:

( ) ( ' ) ( ' ' ( , ') ),x w u D A Af x sign sign K (22)

Seperti yang dijelaskan sebelumnya, Lee dan Mangasarian (2001) menemukan SSVM

dengan menggantikan fungsi plus dengan p(x, ) yaitu integral dari fungsi sigmoid neural

network 1(1 exp( ))x atau seperti pada persamaan (15), di mana adalah smooth function.

Beberapa peneliti kemudian memodifikasi smooth function ke dalam bentuk polynomial smooth

function, yaitu quadratic polynomial function, fourth polynomial functionl, spline polynomial

function, dan piecewise polynomial function. Fungsi piecewise polynomial salah satunya

diusulkan oleh Wu dan Wang adalah sebagai berikut (2013):

Page 39: ANOVA UNTUK ANALISIS RATA-RATA RESPON MAHASISWA …math.fkip.uns.ac.id/wp-content/uploads/2014/06/Ruang-9.pdf · Makalah Pendamping: Matematika 3 233 ANOVA UNTUK ANALISIS RATA-RATA

Prosiding SNMPM Universitas Sebelas Maret 2013 Volume 2

Makalah Pendamping: Matematika 3 271

3

2

3

2

10, ,

3

3 1 1, 0,

2 3 3( , )

3 1 1,0 ,

2 3 3

1, ,

3

xk

k x xk k

f x k

x k x xk k

x xk

3. Seleksi Parameter dan Evaluasi Ketepatan Klasifikasi

Seleksi parameter yang digunakan dalam penelitian ini menggunakan uniform design

(UD) dalam dua tahap. Pada dasarnya tahap pertama digunakan untuk mencobakan kombinasi-

kombinasi parameter v dan . Huang dkk, (2007) menggunakan nilai parameter logaritma

berbasis 2 atau logaritma biner. Perlu diperhatikan bahwa nilai 2 2log logv dan digunakan

paling banyak satu kali dalam metode UD tersarang dan tidak ada titik yang ditempatkan di

sudut.

Metode UD pada penelitian ini menggunakan 10-fold cross validation dalam

pembagian data training-testing. Metode ini melakukan pengulangan sebanyak 10kali untuk

membagi sebuah himpunan contoh (sampel) secara acak menjadi 10-subset yang saling bebas.

Setiap ulangan disisakan satu subset untuk testing dan sisanya digunakan untuk training. Hasil

dari percobaan dan pembuktian teoritis, menunjukkan bahwa 10-fold cross validation adalah

pilihan terbaik untuk mendapatkan hasil validasi yang akurat (Kohavi, 1995).

Ukuran ketepatan klasifikasi dapat dilihat dari akurasi klasifikasi. Akurasi

menunjukkan performansi teknik klasifikasi secara keseluruhan, semakin tinggi akurasi

klasifikasi berarti semakin baik performansi teknik klasifikasi.

Tabel.1 Confusion Matrix Untuk Hasil Klasifikasi Biner

Kelas sebenarnya Kelas prediksi

Positif Negatif

Positif tp fn

Negatif fp tn

Keterangan :

tp : true positive (sebenarnya positif dan diklasifikasikan positif)

tn : true negative (sebenarnya negatif dan diklasifikasikan negatif)

fp : false positive (sebenarnya negatif tetapi diklasifikasikan positif)

fn : false negative (sebenarnya positif tetapi diklasifikasikan negatif)

(23)

Page 40: ANOVA UNTUK ANALISIS RATA-RATA RESPON MAHASISWA …math.fkip.uns.ac.id/wp-content/uploads/2014/06/Ruang-9.pdf · Makalah Pendamping: Matematika 3 233 ANOVA UNTUK ANALISIS RATA-RATA

Volume 2 Prosiding SNMPM Universitas Sebelas Maret 2013

272 Makalah Pendamping: Matematika 3

Akurasi klasifikasi (%) = tp tn

tp fp tn fn

(24)

HASIL PENELITIAN DAN PEMBAHASAN

Penelitian ini diawali dengan analisis secara teoritis yang terdiri dari dua tahap. Tahap

pertama menganalisis performasi smooth function dari kedua model dilanjutkan dengan

menganalisis konvergensi dari kedua model. Tahap berikutnya adalah menerapkan model

terbaik untuk klasifikasi desa tertinggal di Provinsi Kalimantan Timur dengan data PODES

2011.

Performansi smooth function

Lemma 1:

1( , ) log(1 ), 0xp x x

, dan x adalah plus function. Untuk x R dan x ,

maka akan diperoleh hasil sebagai berikut:

(i) ( , )p x k x ;

(ii) for 2 20,| | , ( , ) (log2 / ) (2 / ) log2.p x p p x x

Pembuktian

(i) Untuk 0 x , 1 1

( , ) ( ) log(1 ) log 2xp x x x x

Untuk 0x maka didapatkan: ( , ) ( ) ( , ) (0, )p x x p x p

1log 2

Oleh karena itu 1

( , ) ( ) log 2p x x

atau ( , )p x x

(ii) Untuk 0 x , maka 2 2 2

2

1 2( , ) ( ) log (1 ) log(1 )x xx

p x x x

2log 2 2

log 2

Untuk 0x , maka2( , )p x adalah fungsi monoton naik, sehingga didapatkan:

2

2 2 2 2 log 2( , ) ( ) ( , ) (0, )p x x p x p

Oleh karena itu

2

2 2 log 2 2( , ) ( ) log 2p x x

Theorema 1. Piecewise function yang didefinisikan pada (23) mempunyai sifat:

Page 41: ANOVA UNTUK ANALISIS RATA-RATA RESPON MAHASISWA …math.fkip.uns.ac.id/wp-content/uploads/2014/06/Ruang-9.pdf · Makalah Pendamping: Matematika 3 233 ANOVA UNTUK ANALISIS RATA-RATA

Prosiding SNMPM Universitas Sebelas Maret 2013 Volume 2

Makalah Pendamping: Matematika 3 273

(i) 1 2( , ) ( ), ( , ) ( ), ;f x k C f x k C x

(ii) Untuk semua ,x R ( , ) ;f x k x

(iii) Untuk semua ,x R then 2 22

1( , )216

f x k xk

Pembuktian.

(i) f(x,k) memenuhi persamaan pada titik 13

, 0,k

x x

𝑓 −

1

3k, k = 0, lim

𝑥→0−𝑓 𝑥,𝑘 = lim

𝑥→0+𝑓 𝑥,𝑘 , 𝑓

1

3𝑘,𝑘 =

1

3𝑘

𝑓′ −1

3k,𝑘 = 0, lim

𝑥→0−𝑓′ 𝑥,𝑘 = lim

𝑥→0+𝑓′ 𝑥, 𝑘 , 𝑓′ −

1

3𝑘,𝑘 = 1

𝑓′′ −1

3k,𝑘 = 0, lim

𝑥→0−𝑓′′ 𝑥,𝑘 = lim

𝑥→0+𝑓′′ 𝑥,𝑘 , 𝑓′′ −

1

3𝑘,𝑘 = 0

Jika 13

, 0,k

x x disubtitusikan ke dalam persamaan f(x,k), maka hasil pada (i) akan

diperoleh dengan mudah.

(ii) ( , ) ;f x k x

Jika 1

03

xk

, gunakan persamaan ( ) ( , ) ( )Q x f x k x 2 33 1( )

2 3k x k x

Sehingga ' 2 29 1( ) ( )

2 3Q x k x

k

' 13

( ) 0k

Q

Dan " 2 1( ) 9 ( )

3Q x k x

k 2 1

9 ( ) 03

k xk

. Ini mengindikasikan bahwa ( )Q x

monoton turun pada 13

,0k

Jika 1

03

xk

, gunakan persamaan ( ) ( , ) ( )Q x f x k x 2 33 1( )

2 3x k x x

k

Sehingga ' 2 29 1( ) 1 ( )

2 3Q x k x

k

' 13

( ) 0k

Q

Dan " 2 1( ) 9 ( )

3Q x k x

k 2 1

9 ( ) 03

k xk

. Ini mengindikasikan bahwa ( )Q x

monoton turun pada 13

0,k . Sehingga 1

3( )

kQ x Q ( , ) ( )f x k x

(iii) Jika 1

3x

k atau

1

3x

k , maka nilai dari f(x,k) dan x+ adalah sama, sehingga

2 2( , ) 0f x k x Pertidaksamaan pada (iii) terpenuhi.

Page 42: ANOVA UNTUK ANALISIS RATA-RATA RESPON MAHASISWA …math.fkip.uns.ac.id/wp-content/uploads/2014/06/Ruang-9.pdf · Makalah Pendamping: Matematika 3 233 ANOVA UNTUK ANALISIS RATA-RATA

Volume 2 Prosiding SNMPM Universitas Sebelas Maret 2013

274 Makalah Pendamping: Matematika 3

Jika 13

0k

x , maka ketika 0x , maka 2 2 2( , ) ( , )f x k x f x k . Sebab ( , )f x k

adalah fungsi positif, kontinu dan fungsi monoton naik untuk 13

0k

x

sehingga akan didapatkan 2 2

2 2

1 1( , ) (0, )

324 216f x k f k

k k

untuk 1

03

xk

, misalkan

23

2 2 2 23 1( ) ( , )

2 3s x f x k x x k x x

k

6 3

4 29 1 13

4 3 3k x k x x

k k

Untuk mendapatkan hasil, maka a ditransformasi menjadi a=kx , 10,

3a

Setelah mensubsitusi a=kx ke dalam persamaan di atas maka,

6 3

2

3 3 1 1( )

4 3 3s x a a a

k

Untuk1

0,3

a

, titik maksimum pada s(a) adalah a= 0.0605 dan

2 2

2

1( ) ( , ) 0.0046

216s a f x k x

k . Sehingga diperoleh hasil

2 2

2

1( , )

216f x k x

k

Berdasarkan hasil pada Lemma 1 dan Theorema 1, maka diperolah perbandingan performansi

dari smooth function adalah sebagai berikut:

Theorema 2 (Lee dan Mangasarian, 2001). Jika 1k

, dan k>0. Maka hasil dari performansi

smooth function adalah:

(i) Jika smooth function yang didefiniskan pada (15), maka berdasarkan pada Lemma 1

diperoleh:

2

2 2 log 2 2( , ) log 2p x k x

k k

2

2 2

1 1log 2 2log 2 0.69267

k k (25)

(ii) Jika smooth function yang didefiniskan pada (23), berdasarkan pada Theorem 1 maka,

2 2

2 2

1 1( , ) 0.0046

216f x k x

k k (26)

Theorem 2 menunjukkan bahwa piecewise function f(x,k) mempunyai performasi terbaik

untuk plus function x+. Ketika k mempunyai nilai yang pasti, maka akan sangat mudah

mendapatkan perbedaan dari smooth function di atas.

Konvergensi SSVM dan PPSSVM

Page 43: ANOVA UNTUK ANALISIS RATA-RATA RESPON MAHASISWA …math.fkip.uns.ac.id/wp-content/uploads/2014/06/Ruang-9.pdf · Makalah Pendamping: Matematika 3 233 ANOVA UNTUK ANALISIS RATA-RATA

Prosiding SNMPM Universitas Sebelas Maret 2013 Volume 2

Makalah Pendamping: Matematika 3 275

Pembuktian untuk konvergensi dari model SSVM dan PPSSVM akan diperoleh ketika

k mendekati tak hingga. Hal tersebut diperoleh ketika problem optimasi mendekati model awal

(15).

Theorema 3 (Lee dan Mangasarian, 2001). Jika mxnA R ,

1mxR , definisi dari fungsi riil

( ) : nf x R R dan ( , ) : ng x k R N R adalah sebagai berikut:

2 2

22

1 1( )

2 2Af x x x

2 2

22

1 1, ,

2 2g x k f x k x A

Untuk model SSVM dengan α > 0, maka:

(i) ( )f x dan ( , )g x k adalah fungsi kecebungan yang kuat.

(ii) *x adalah solusi unik untuk min nx R

f x

dan *

kx juga merupakan solusi uniq dari

min ,nx Rg x k

(iii) Untuk 0 , diperoleh pertidaksamaan :

22

* * log 2 log 22

2k

mx x

y Dimana *

1max

ii mx b

A (27)

(iv) *x dan *

kx memenuhi * *lim k

kx x

(28)

Untuk model PPSSVM, maka :

(i) ( )f x dan ( , )g x k adalah fungsi kecebungan yang kuat.

(ii) *x adalah solusi unik untuk min nx R

f x

dan *

kx juga merupakan solusi uniq dari

min ,nx Rg x k

(iii) Untuk 1k *x dan *

kx keduanya memenuhi 2

* *

2216k

mx x

k (29)

(iv) *x dan *

kx memenuhi * *lim k

kx x

(30)

Pembuktian Model SSVM dan PPSSVM

Pada point (i) dan (ii) baik model SSVM dan PPSSVM mempunyai pembuktian yang sama,

yaitu:

(i) ( )f x dan ( , )g x k adalah fungsi kecembungan yang kuat karena 2

2. adalah fungsi

kecembungan yang kuat. Jika ( ( ))vL f x adalah level set dari ( )f x dan ( ( , ))vL g x k adalah

level set dari ( , )g x k , maka berdasarkan pada hasil (ii) Theorem 1 diperoleh:

2

2(( ( , ) ( ( )) | 2v vL f x k L f x x x v

Page 44: ANOVA UNTUK ANALISIS RATA-RATA RESPON MAHASISWA …math.fkip.uns.ac.id/wp-content/uploads/2014/06/Ruang-9.pdf · Makalah Pendamping: Matematika 3 233 ANOVA UNTUK ANALISIS RATA-RATA

Volume 2 Prosiding SNMPM Universitas Sebelas Maret 2013

276 Makalah Pendamping: Matematika 3

Oleh karena itu, ( ( , ))vL g x k dan ( ( ))vL f x adalah strict convex set. Dikarenakan hal

tersebut, keduanya merupakan solusi yang unik untuk min nx Rf x

dan min ,nx R

g x k

.

(ii) Jika *x adalah problem optimasi untuk min nx R

f x

dan *

kx adalah problem optimasi

untuk min ,nx Rg x k

, disebabkan oleh problem optimasi dan sifat kecembungan dari

( )f x dan ( , )g x k , maka pertidaksamaan yang diperoleh adalah:

2

* * * * * * *

2

1

2k k kf x f x f x x x x x

2* *

2

1

2kx x

2

* * * * * * *

2

1, , ,

2k k k kf x k f x k f x k x x x x

2* *

2

1

2kx x

Untuk pembuktian point (iii) dan (iv) adalah sebagai berikut:

Model SSVM

(iii) ( , ) 0p x , maka:

2

* * * * * *

2, , ( )k k kx x g x f x f x f x

* *( , ) ( )g x f x

2 2* *

2 2

1 1( ), ( )

2 2p x b x b A A

Sehingga diperoleh

22

* *

2

log 2 2log 2

2k

mx x

y

(iv) Ketika k mendekati tak hingga , maka:

22

* *

2

log 2 2lim lim log 2 0

2k

k k

mx x

ySehingga

* *lim kk

x x

Model PPSSVM

(v) Jika kedua persamaan diatas dijumlahkan dengan catatan ( , )f x k x maka akan

diperoleh:

2

* * * * * *

2, ,k k kx x f x f x f x k f x k

* * * * * *, , ,k kg x k f x f x k f x f x k f x

22

* *

2 2

1 1,

2 2f x k x

A A

Berdasarkan pada hasil (iii) pada Theorema 3 2

* *

22 216k

mx x

k , maka diperoleh

kesimpulan bahwa persamaan (29) adalah benar.

Page 45: ANOVA UNTUK ANALISIS RATA-RATA RESPON MAHASISWA …math.fkip.uns.ac.id/wp-content/uploads/2014/06/Ruang-9.pdf · Makalah Pendamping: Matematika 3 233 ANOVA UNTUK ANALISIS RATA-RATA

Prosiding SNMPM Universitas Sebelas Maret 2013 Volume 2

Makalah Pendamping: Matematika 3 277

(vi) Ketika k mendekati tak hingga pada (29), maka diperoleh

2* *

22lim lim 0

216k

k k

mx x

k Sehingga

* *lim kk

x x

Hasil dari (iv) pada Theorema 3 menjelaskan bahwa problem optimasi model PPSSVM

mendekati model SVM standar ketika k mendekati positif tak hingga.

Hasil analisis teoritis menunjukkan bahwa model PPSSVM lebih baik dibandingkan

dengan model SSVM. Untuk menunjukan secara jelas perbedaan performansi smooth function

dengan plus function, maka kita gunakan k=10 untuk semua fungsi tersebut dan hasilnya dapat

dilihat pada gambar 1.

Gambar 1. Perbandingan performansi smooth function (k-=10)

Terlihat pada Gambar 1 bahwa piecewise polynomial function mempunyai performansi yang

terbaik untuk plus function. Hal tersebut ditunjukkan pada kurva piecewise polynomial function

yang lebih mendekati pada kurva plus function.

Aplikasi Model Terbaik

PPSSVM yang ditemukan Wu dan Wang adalah model terbaik hasil analisis secara

teoritis. Model ini kemudian digunakan untuk klasifikasi desa tertinggal di Provinsi Kalimantan

Timur. Variabel prediktor yang digunakan dalam penelitian ini sebanyak 16 variabel dengan

unit analisis adalah 1465 desa. Hasil Output MATLAB untuk model SSVM dan PPSSVM

diperoleh:

Tabel 2. Hasil Output model SSVM dan PPSSVM

Keterangan Nilai SSVM Nilai PPSSVM

Terr 0.11655 0.106826

Verr 0.118089 0.116041

Best C 1.778279 23.71374

Best Gamma 8.42E-06 5.255e-06

Elapse 9.001258 5137.425

Page 46: ANOVA UNTUK ANALISIS RATA-RATA RESPON MAHASISWA …math.fkip.uns.ac.id/wp-content/uploads/2014/06/Ruang-9.pdf · Makalah Pendamping: Matematika 3 233 ANOVA UNTUK ANALISIS RATA-RATA

Volume 2 Prosiding SNMPM Universitas Sebelas Maret 2013

278 Makalah Pendamping: Matematika 3

Point < 21 x 2 double> < 21 x 2 double>

Ratio 1 1

Sumber : Hasil Output MATLAB

Ketepatan klasifikasi untuk desa tertinggal di Provinsi Kalimantan Timur dapat dilihat

dari tingkat akurasinya. Berdasarkan Tabel 2, maka diperoleh akurasi model PPSSVM:

Akurasi untuk data training : 99.89%

Akurasi untuk data testing : 99.88%

Jika dibandingkan dengan model SSVM maka model PPSSVM mempunyai tingkat akurasi

yang lebih baik, walaupun dapat dikatakan relatif tidak jauh berbeda untuk klasifikasi desa

tertinggal di Provinsi Kalimantan Timur menggunakan data PODES 2011.

SIMPULAN DAN SARAN

Analisis secara teoritis menunjukkan bahwa performansi dan konvergensi piecewise

polynomialfunction penemuan Wu lebih baik dibandingkan dengan smooth function dan model

terbaik yang didapatkan adalah model PPSSVM. Penerapan model terbaik PPSSVM pada

klasifikasi desa tertinggal di Provinsi Kalimantan Timur mendapatkan akurasi yang relative

lebih tinggi dibandingkan dengan model SSVM. Penelitian ini menggunakan algorithma

Newton Armijo dalam menentukan parameter dan model terbaik, sedangkan pembagian data

testing dan training menggunakan 10 fold – cross validation.

Peneliti menyarankan untuk menggunakan polynomial smoothing function yang lebih

baik pada penelitian berikutnya. Selain itu dapat pula dicoba beberapa k fold – cross validation

pada kasus yang sama ataupun berbeda.

DAFTAR PUSTAKA

Andari, S. (2013), Smooth Support Vector Machine dan Multivariate Adaptive Regression

Splines Untuk Mendiagnosis Kanker Payudara. Tesis ITS.

Anguita, D., Ghelardoni, L., and Ghio, A., (2012). The „K‟ in K-fold Cross Validation. ESANN

2012 proceedings, European Symposium on Artificial Neural Network, Computational

Intelligence and Machine Learning. Bruges (Belgium).

Badan Pusat Statistik, (2005), Identifikasi dan Penentuan Desa Tertinggal 2002. BPS, Jakarta.

Bertsimas, D. and Shioda, R. (2007), Clasification and regression via integer optimazion,

Journal of Operation Research, Vol 55, No.2, hal 252-271.

Breiman, L., Friedman, J., Olshen, R. and Stone, C. (1984). Classification and Regression

Trees, Wadsworth International Group.

Dirjen Pemberdayaan Masyarakat Desa (PMD) Kemendagri, (2012), Profil Desa dan

Kelurahan 2011: Data Dasar Tipologi, Klasifikasi, Kategori Desa dan Kelurahan Menurut

Provinsi, Dirjen PMD Kemendagri, Jakarta.

Page 47: ANOVA UNTUK ANALISIS RATA-RATA RESPON MAHASISWA …math.fkip.uns.ac.id/wp-content/uploads/2014/06/Ruang-9.pdf · Makalah Pendamping: Matematika 3 233 ANOVA UNTUK ANALISIS RATA-RATA

Prosiding SNMPM Universitas Sebelas Maret 2013 Volume 2

Makalah Pendamping: Matematika 3 279

Fang, K.T., Winker, P., Lin, D.K.J., and Zhang, Y. (2000), Uniform Design: Theory and

Application, American Statistical Association and American Society for Quality, Vol. 42,

No 3, hal 237 – 248.

Gajdos, C., tarter, P.I., Bleiweiss, I.J., Herman, G., de Csepel, J., Estabrook, A., and Rademaker,

A.W. (2002), Mammography appearance of nonpalpable breast cancer reflects pathologi

characteristics, Annals of Surgery, Vol 235, No. 2, hal 246 – 251.S

Gunn, S. (1998), Support Vector Machines for Clasification and Regression, Technical Report,

ISIS.

Huang, C.M., Lee, Y.J., Lin D.K.J., and Huang, S.Y. (2007), Model selection for support vector

machine via uniform design, Computational Statistics and Data Analysis, Vol. 52. hal. 335-

346.

Hsu, C.W., Chang, C. C., and Lin, C. J. (2008). A practical guide to Support Vector

Classification, Taipe: Information Engineering National Taiwan University.

Kohavi, R. (1995), A Study of Cross-Validation and Bootstrap for Accuracy Estimation and

Model Selection, Appears in the International Joint Coference on Artificial Intelligence

(IJCAI), 1995.

Luo, L., Lin, C., Peng, H. and Zhou, Q. (2006), A Study on Piecewise Polynomial Smooth

Approximation to the Plus Function,In proceedings of the ICARCV.

Lee, Y.J., and Mangasarian, O.L. (2001), A Smooth Support Vector Machine, Jurnal of

Computational Optimization and applications 20:5-22.

Mangasarian, O.L., and Musicant, D.R. (1999), Succesive overrelaxation for support vector

machines, IEEE Transactions on Neural Network, 10, hal. 1032 – 1037.

Metz, C.E. (2006), Receiver Operating Characteristic Analysis: A Tool for the Quantative

Evolution of Observer Performance and Imaging Systems, Journal of Amerian College of

Radiology, Vol.3, hal. 413 – 422.

Purnami, S.W., and Embong, A. (2008b), Smooth Support Vector Machine for breast cancer

classification, The 4th IMT-GT 2008 Conference of Mathematics, Statistics and Its

Application (ICMSA 2008), Banda Aceh, Indonesia.

Purnami, S.W., Embong, A., Zain, J.M., and Rahayu, S.P. (2009), A Comparison of Smoothing

Function In Smooth Support Vector Machine, will be presented in International

Conference on Software Engineering & Computer Systems.

Purnami, S.W., Embong, A., and Zain, J.M. (2009), Application of data mining technique using

best polynomial smoot support vector machine in breast cancer diagnosis, International

Conference in Robotic, Vision, Signal Symposisum and Power Application (Rovsip 2009)

Langkawi Kedah, Malaysia.

Vapnik, V. (1995), The Nature of Statistical Learning Theory, Springer-Verlag, New York

Page 48: ANOVA UNTUK ANALISIS RATA-RATA RESPON MAHASISWA …math.fkip.uns.ac.id/wp-content/uploads/2014/06/Ruang-9.pdf · Makalah Pendamping: Matematika 3 233 ANOVA UNTUK ANALISIS RATA-RATA

Volume 2 Prosiding SNMPM Universitas Sebelas Maret 2013

280 Makalah Pendamping: Matematika 3

Wu, Q., andWenqing, W. (2013), Piecewise-Smooth Support Vector Machine for Clasification,

Hindawi Publishing Corporation Matematical Problems in Engineerin, Volume 2013,

Article ID 135149.

Yuan, Y., and Huang, T. (2005), A Polynomial Smooth Support Vector Machine for

Classification, Springer-Verlag, Berlin Heidelberg, LNAI 3584: 157-164.

Yuan, Y., Yan J., and Xu, C. (2005), Polynomial Smooth Support Vector Machine (PSSVM),

Chinese Journal of Computers, 28: 9-17.

Yuan, Y., Fan, W., and Pu, D. (2007), Spline Function Smooth Support Vector Machine For

Clasification, Journal of Industrial and Management Optimization 3(3): 529 – 542.

Page 49: ANOVA UNTUK ANALISIS RATA-RATA RESPON MAHASISWA …math.fkip.uns.ac.id/wp-content/uploads/2014/06/Ruang-9.pdf · Makalah Pendamping: Matematika 3 233 ANOVA UNTUK ANALISIS RATA-RATA

Prosiding SNMPM Universitas Sebelas Maret 2013 Volume 2

Makalah Pendamping: Matematika 3 281

ANALISIS KETEPATAN KLASIFIKASI STATUS KETERTINGGALAN DESA

DENGAN PENDEKATAN REDUCE SUPPORT VECTOR MACHINE (RSVM) DI

PROVINSI JAWA TIMUR

Herlina Prasetyowati Sambodo1)

, Santi Wulan Purnami2)

, Santi Puteri Rahayu3)

1, 2, 3 Program Pascasarjana Jurusan Statistik Fakultas MIPA ITS

Jl. Keputih Sukolilo Surabaya, 60111

e-mail: [email protected], [email protected], [email protected]

Abstract

Kemiskinan merupakan salah satu masalah serius yang dihadapi oleh bangsa ini.

Pelaksanaan program pengentasan kemiskinan secara langsung diimplementasikan dengan

perumusan beberapa program yang ditujukan untuk membantu kantong-kantong (wilayah)

kemiskinan dengan sasaran wilayah merujuk kepada identifikasi desa tertinggal. Oleh

karena itu identifikasi mengenai status ketertinggalan desa yang tepat sangat diperlukan

terlebih jika itu berhubungan dengan masalah yang cukup krusial seperti perencanaan

program pembangunan dan bantuan dana untuk pembangunan. Beberapa penelitian telah

banyak dilakukan untuk melakukan klasifikasi terhadap status ketertinggalan desa. RSVM

adalah metode klasifikasi untuk data yang berukuran besar dengan beberapa keunggulan

seperti waktu pemrosesan yang lebih pendek dan penggunaan memori yang lebih kecil.

Metode tersebut menggunakan fungsi kernel dan teknik K-fold Cross Validation (KCV)

dalam seleksi model dan estimasi error. Penelitian ini akan mengkaji dan membandingkan

penggunaan lebih dari satu fungsi kernel dan mengatur jumlah subset dalam teknik KCV

sehingga mendapatkan estimasi yang tepat dalam pembentukan model terbaik pada

klasifikasi status ketertinggalan desa di Provinsi Jawa Timur.

Keywords: Desa Tertinggal, Klasifikasi, Fungsi Kernel, KCV, RSVM.

PENDAHULUAN

Kemiskinan merupakan salah satu masalah yang dihadapi oleh bangsa ini. Pemerintah

telah berupaya keras untuk terus menekan angka kemiskinan, dengan terus memperbaiki

perencanaan pembangunan dengan tujuan untuk meningkatkan kesejahteraan masyarakat.

Upaya tersebut dapat dilihat melalui lebih dari 50 program penanggulangan kemiskinan yang

terdapat di 21 kementrian dan lembaga negara (Menko Kesra, 2009).

Pelaksanaan program pengentasan kemiskinan secara langsung pada awalnya

diimplementasikan oleh dengan perumusan beberapa program yang ditujukan untuk membantu

kantong-kantong (wilayah) kemiskinan dengan sasaran penduduk miskin. Sasaran wilayah

merujuk kepada identifikasi wilayah-wilayah (desa/kecamatan) miskin/tertinggal. Sejak tahun

2009, pemerintah melalui Tim Koordinasi Penanggulangan Kemiskinan (TKPK) yang

selanjutnya menjadi Tim Nasional Percepatan Penanggulangan Kemiskinan (TNP2K), akan

meningkatkan cakupan serta keterlibatan masyarakat melalui harmonisasi dan sinkronisasi

program penanggulangan kemiskinan agar lebih efektif dan terukur tingkat keberhasilannya

(Menko Kesra, 2009).

Harmonisasi dan sinkronisasi program penanggulangan kemiskinan diimplementasikan

melalui pengelompokan tiga klaster program, yaitu Program Bantuan dan Perlindungan Sosial,

Program Pemberdayaan Masyarakat (PNPM) Mandiri, serta Program Pemberdayaan Usaha

Page 50: ANOVA UNTUK ANALISIS RATA-RATA RESPON MAHASISWA …math.fkip.uns.ac.id/wp-content/uploads/2014/06/Ruang-9.pdf · Makalah Pendamping: Matematika 3 233 ANOVA UNTUK ANALISIS RATA-RATA

Volume 2 Prosiding SNMPM Universitas Sebelas Maret 2013

282 Makalah Pendamping: Matematika 3

Mikro dan Kecil dengan Kredit Usaha Rakyat (KUR) sebagai salah satu instrumennya (TNP2K,

2012).

PNPM Mandiri merupakan payung dan kerangka kebijakan bagi program-program

penanggulangan kemiskinan berbasis pemberdayaan masyarakat yang merupakan instrumen

untuk mengkoordinasikan seluruh program kemiskinan berbasis pemberdayaan masyarakat pada

semua kementerian dan lembaga (Menko Kesra, 2009). Salah satu ciri program PNPM Mandiri

adalah memberikan Bantuan Langsung Masyarakat (BLM) untuk kegiatan yang dilaksanakan

secara swakelola oleh masyarakat.

Ruang lingkup kegiatan PNPM Mandiri terbuka bagi semua kegiatan penanggulangan

kemiskinan yang diusulkan dan disepakati masyarakat yang diantaranya meliputi penyediaan

prasarana/sarana lingkungan dan infrastruktur pemukiman, sosial dan ekonomi melalui kegiatan

padat karya (TNP2K, 2012). Desa sasaran program dan kegiatan telah ditetapkan oleh

pemerintah melalui Keputusan Menteri Negara Pembangunan Daerah Tertinggal.

Sehubungan dengan penentuan desa sasaran tersebut, Badan Pusat Statistik (BPS)

sebagai penyedia data resmi statistik pemerintahan di Indonesia, memberikan data dasar

sekaligus melakukan identifikasi dan pengelompokan desa tertinggal sebagai pendekatan untuk

mengidentifikasi daerah kantong-kantong kemiskinan.

Penetapan kriteria ketertinggalan selanjutnya dilakukan dengan menggunakan enam

kriteria dasar sesuai kepmen PDT nomor 1 Tahun 2005, yaitu perekonomian masyarakat,

sumber daya manusia, sarana dan prasarana (infrastruktur), kemampuan keuangan lokal (celah

fiskal), aksesbilitas, dan karakteristik daerah (Edy, 2009).

Provinsi Jawa Timur sebagai provinsi dengan jumlah penduduk terbesar kedua di

Indonesia memiliki jumlah desa terbanyak sebesar 8.502 desa. Banyaknya desa tersebut

menyebabkan penentuan status ketertinggalan desa menjadi sangat penting, khususnya apabila

berkaitan dengan perencanaan anggaran dan pengambilan kebijakan.

Provinsi Jawa Timur memiliki jumlah penduduk miskin nomor dua terbesar di

Indonesia pada tahun 2011 yaitu sebesar 5,2 juta jiwa yang sebagian besar terdapat di pedesaan.

3,49 juta jiwa penduduk miskin di Provinsi Jawa Timur berada di pedesaan yang merupakan

jumlah penduduk miskin terbesar di wilayah pedesaan di Indonesia (18,45 persen). Hal tersebut

menunjukkan bahwa kantong kemiskinan di provinsi tersebut terdapat di wilayah sehingga

klasifikasi status ketertinggalan desa yang tepat sangat diperlukan di sini.

Beberapa penelitian yang telah dilakukan mengenai identifikasi desa tertinggal

menggunakan metode seleksi variabel yang diduga menjadi faktor penentu status ketertinggalan

desa. Salah satu metode yang digunakan antara lain Dewi Wahyuningsih (2009) yang

menganalisis karakteristik desa tertinggal dengan Structural Equation Modelling (SEM),

sedangkan Syarif (2008), melakukan pemodelan desa tertinggal di Jawa Barat Tahun 2005

dengan Pendekatan MARS. Penelitian lain mengenai ketertinggalan daerah adalah Evaluasi

Page 51: ANOVA UNTUK ANALISIS RATA-RATA RESPON MAHASISWA …math.fkip.uns.ac.id/wp-content/uploads/2014/06/Ruang-9.pdf · Makalah Pendamping: Matematika 3 233 ANOVA UNTUK ANALISIS RATA-RATA

Prosiding SNMPM Universitas Sebelas Maret 2013 Volume 2

Makalah Pendamping: Matematika 3 283

Ketertinggalan Daerah Dengan Analisis Diskriminan (Djuraidah, 2009) dan Penggunaan

Geographically Weighted Regression-Kriging untuk Klasifikasi Desa Tertinggal (Dimulyo, S.,

2009).

Terdapat beberapa metode klasifikasi lain yang dapat digunakan untuk menentukan

status ketertinggalan desa adalah diantaranya adalah Support Vector Machine (SVM). SVM

merupakan metode machine learning yang banyak digunakan untuk klasifikasi karena tingkat

akurasi klasifikasi maupun prediksi yang tinggi serta proses komputasi yang relatif singkat.

SVM pertama kali diperkenalkan oleh Vapnik pada tahun 1992 sebagai rangkaian harmonis

konsep-konsep unggulan dalam bidang statistical learning theory. SVM berusaha menemukan

hyperplane terbaik pada input space. Prinsip dasar SVM adalah linier classifier dan selanjutnya

dikembangkan agar dapat bekerja pada problem non linier dengan memasukkan konsep kernel

trick pada ruang kerja berdimensi tinggi (Vapnik and Cortez, 1995). Kelebihan SVM

diantaranya mempunyai error generalisasi yang lebih kecil, dapat digunakan pada data sampel

yang terbatas, memiliki landasan teori yang dapat dianalisa dengan jelas, dan dapat

diimplementasikan dengan mudah (Anto, dkk., 2003).

SVM sulit dipakai dalam problem berskala besar dalam hal ini dimaksudkan dengan

jumlah sampel yang diolah. Dalam kasus ini disarankan digunakan Reduced SVM (RSVM).

RSVM merupakan model yang dengan kernel matriks yang telah disederhanakan yang

diturunkan dari General Support Machine (GSVM) dan Smooth Support Vector Machine

(SSVM) (Lee and Mangasarian, 2001). RSVM disarankan digunakan untuk klasifikasi sampel

dalam jumlah besar yaitu untuk mengatasi kesulitan komputasi sekaligus mengurangi

kompleksitas model (Lee and Huang, 2005). Hal ini sesuai dengan kondisi Provinsi Jawa Timur

yang mempunyai jumlah desa yang cukup besar (8.502 desa), sehingga proses klasifikasi yang

tepat dengan efisiensi waktu pemrosesan dan tingkat kompleksitas model yang rendah sangat

diperlukan.

RSVM menggunakan fungsi kernel yang menunjukkan mapping dari input space

menjadi feature space berdimensi tinggi. Terdapat beberapa fungsi kernel dasar yang sering

digunakan seperti fungsi kernel linier, polynomial, gaussian, dan eksponensial (Hsu, Chang, and

Lin, 2005). Penelitian ini menggunakan beberapa fungsi kernel untuk mendapatkan fungsi

kernel yang menghasilkan tingkat akurasi terbaik dengan metode seleksi parameter Uniform

Design (UD).

K-fold Cross Validation (KCV) merupakan salah satu pendekatan yang sering dipakai

para peneliti dalam seleksi parameter dan estimasi error pada metode klasifikasi (Anguita,

Gelardoni, Ghio, Oneto, and Ridella, 2012). Nilai K dalam KCV yang sering digunakan dalam

metode SVM adalah 5 dan 10. Penelitian sebelumnya menunjukkan bahwa 10-fold CV

merupakan yang paling akurat untuk digunakan dalam SVM (Kohavi, 1995), namun ternyata

nilai k sebesar 3 dan 4 juga memberikan tingkat akurasi yang tinggi (Anguita, et al, 2012). Oleh

Page 52: ANOVA UNTUK ANALISIS RATA-RATA RESPON MAHASISWA …math.fkip.uns.ac.id/wp-content/uploads/2014/06/Ruang-9.pdf · Makalah Pendamping: Matematika 3 233 ANOVA UNTUK ANALISIS RATA-RATA

Volume 2 Prosiding SNMPM Universitas Sebelas Maret 2013

284 Makalah Pendamping: Matematika 3

karena itu penelitian ini akan menggunakan teknik KCV dengan beberapa nilai k untuk

mendapatkan model berdasarkan KCV yang mempunyai tingkat akurasi tertinggi.

Berdasarkan paparan di atas, permasalahan yang akan diselesaikan melalui penelitian

ini adalah bagaimana ketepatan metode klasifikasi RSVM menggunakan beberapa fungsi kernel

berdasarkan KCV dengan nilai K yang memiliki tingkat akurasi tertinggi

Berdasarkan permasalahan yang telah dirumuskan sebelumnya, tujuan yang ingin

dicapai melalui penelitian ini adalah membandingkan tingkat ketepatan klasifikasi untuk status

ketertinggalan desa di Provinsi Jawa Timur melalui pendekatan RSVM dengan beberapa fungsi

kernel berdasarkan KCV yang memiliki tingkat akurasi tertinggi.

Manfaat yang ingin diperoleh dari hasil penelitian ini adalah memperoleh klasifikasi

yang tepat mengenai status ketertinggalan desa di Provinsi Jawa Timur untuk membantu

perencanaan dan pengambilan keputusan agar lebih efektif dan tepat sasaran dengan

menggunakan machine learning. Selain itu penelitian ini juga diharapkan dapat menambah

wawasan keilmuan dalam menerapkan RSVM dengan menggunakan fungsi kernel dan teknik

KCV sebagai salah satu alternatif metode untuk klasifikasi sampel dalam ukuran besar

khususnya untuk status ketertinggalan desa.

METODE PENELITIAN

Jenis, Waktu dan Tempat Penelitian

Penelitian ini menggunakan pendekatan kuantitatif dengan metode machine learning yaitu

menggunakan Reduce Support Vector Machine (RSVM).

Target/Subjek Penelitian

Penelitian dilakukan terhadap populasi desa di Provinsi Jawa Timur. Sebanyak 8.502

desa di Provinsi Jawa Timur akan diteliti dan dikaji mengenai status ketertinggalan yang

dimiliki.

Data

Data yang digunakan dalam penelitian ini adalah data sekunder yaitu data Potensi Desa

(PODES) dan data Klasifikasi desa/kelurahan tahun 2011. Data merupakan data Populasi yang

dikumpulkan melalui sensus. Data PODES dikumpulkan oleh Badan Pusat Statistik (BPS) yang

pendataannya dilaksanakan pada tahun 2011, sedangkan data klasifikasi desa/kelurahan

merupakan data yang dikeluarkan oleh Dirjen Pemberdayaan Masyarakat Desa (PMD)

Kementrian Dalam Negeri (Kemendagri).

Variabel Penelitian

Variabel yang akan digunakan dalam penelitian ini dipilih berdasarkan referensi dari

penelitian sebelumnya yaitu pada publikasi BPS mengenai identifikasi dan Penentuan Desa

tertinggal 2002, indikator desa tertinggal menurut Kementrian Pembangunan Daerah Tertinggal

Page 53: ANOVA UNTUK ANALISIS RATA-RATA RESPON MAHASISWA …math.fkip.uns.ac.id/wp-content/uploads/2014/06/Ruang-9.pdf · Makalah Pendamping: Matematika 3 233 ANOVA UNTUK ANALISIS RATA-RATA

Prosiding SNMPM Universitas Sebelas Maret 2013 Volume 2

Makalah Pendamping: Matematika 3 285

(PDT) Tahun 2007 dan Profil Desa dan Kelurahan (2012) menurut Kementrian Dalam Negeri

c.q. Dirjen PMD.

Profil desa dan kelurahan memuat tipologi dan klasifikasi desa dan kelurahan yang

merupakan karakteristik desa dan kelurahan berdasarkan potensi sumber daya alam dan

interaksi dengan kegiatan sosial ekonomi masyarakat (pola nafkah). Tipologi desa dan

kelurahan mempertemukan konsep sumber daya alam, konsep pemberdayaan masyarakat, dan

pola nafkah, dan aspek kewilayahan. Proksi terhadap profil desa dan kelurahan disusun

berdasarkan data Potensi Desa dari Badan Pusat Statistik (BPS) antaralain PODES Tahun

2011.Penelitian dilakukan pada seluruh desa/kelurahan yang ada di Provinsi Jawa Timur yaitu

sebanyak 8.502 desa/kelurahan.

Variabel respon (Y) merupakan variabel yang berisi kelas yang terdiri atas dua kategori

yaitu {+1} untuk desa/kelurahan tertinggal dan {-1} untuk desa/kelurahan tidak tertinggal.

Pengukuran variabel respon didapat Profil Desa dan Kelurahan yang dikeluarkan dari Dirjen

PMD, sedangkan variabel prediktor didapatkan dari hasil pendataan PODES Provinsi Jawa

Timur Tahun 2011 yaitu sebanyak 17 variabel.

Teknik Analisis Data

Smooth Support Vector Machine (SSVM)

SSVM adalah pengembangan baru dari SVM dengan fungsi kernel dan non linier untuk

analisis klasifikasi menggunakan metode smoothing. SVM pertama kali diperkenalkan oleh

Boser, Guyon dan Vapnik pada tahun 1992 sebagai rangkaian harmonis konsep-konsep

unggulan dalam statistical learning theory. Prinsip dasar SVM adalah linier classifier dan

selanjutnya dikembangkan agar dapat bekerja pada problem non linier dengan memasukkan

konsep kernel trick pada ruang kerja berdimensi tinggi (Vapnik, 1995).

SSVM seperti halnya SVM digunakan untuk klasifikasi dua kategori atau binomial untuk

memisahkan titik-titik yang berasal dari dua kelas yang berbeda misalnya kelas {+1} dan {-1},

dengan hyperplane tunggal pada ruang berdimensi banyak yang membentuk partisi yang

kemudian diselesaikan secara non linier (Vapnik and Cortez, 1995). Margin adalah jarak antara

hyperplane dengan pola terdekat masing-masing class. Pola yang paling dengan ini disebut

support vector.

Program algoritma dari SVM linier standar adalah

1( , , )

1min ' '

2

dengan kendala ( )

0

p nb y Rv

we y w w

D Aw e y e

y

(1)

v : merupakan parameter dalam SVM yang bernilai positif

y : adalah vektor variabel slack berukuran n x 1 yang mengukur kesalahan

klasifikasi dan bernilai nonnegative

e : adalah vektor kolom berukuran n dan bernilai satu

Page 54: ANOVA UNTUK ANALISIS RATA-RATA RESPON MAHASISWA …math.fkip.uns.ac.id/wp-content/uploads/2014/06/Ruang-9.pdf · Makalah Pendamping: Matematika 3 233 ANOVA UNTUK ANALISIS RATA-RATA

Volume 2 Prosiding SNMPM Universitas Sebelas Maret 2013

286 Makalah Pendamping: Matematika 3

w : adalah vektor normal berukuran p x 1

: nilai bias yang menentukan lokasi relatif hyperplane

Pemisah kedua kelas yang berbeda tersebut adalah permukaan linier yang berada tepat

di tengah-tengah bidang pemisah yaitu

' x w (2)

Terdapat dua bidang pemisah yang paralel dengan bidang pemisah di atas yang merupakan

batas kedua kelas yaitu

' 1

' 1

x w

x w (3)

dengan jarak tertentu yang disebut margin. Margin terbesar dapat ditemukan dengan

memaksimalkan nilai jarak antara hyperplane dan titik terdekatnya yaitu 1

w. x

merupakan vektor yang menyusun ruang riil berdimensi pR dan menentukan lokasi

relatif terhadap kelas asli. Pada persamaan tersebut y diminimasi dengan bobot v.

Sehingga bidang yang memisahkan kedua kelas dengan soft margin adalah

' 1, untuk ' dan 1

' 1, untuk ' dan 1

dengan kendala ( )

0

i i ii

i i ii

x w y x A D

x w y x A D

D Aw e y e

y

(4)

Dalam pendekatan smoothing, y diminimasi dengan bobot 2

v, sehingga problem dari

SVM yang dimodifikasi menjadi SSVM adalah

1

2

( , , )

1min ( )

2 2

dengan kendala ( )

0

n mu y R

v

y'y w'w

D Aw e y e

y

(5)

dimana untuk memperoleh solusi dari problem tersebut variabel slack dapat ditulis menjadi

( ( )) y e D Aw e (6)

Substitusi y dilakukan sehingga didapatkan problem optimasi SSVM tanpa kendala

dapat ditulis menjadi

1

2 2

2( , )

1min ( )) ( )

2 2nw R

v

e - D(Aw -e w'w (7)

Page 55: ANOVA UNTUK ANALISIS RATA-RATA RESPON MAHASISWA …math.fkip.uns.ac.id/wp-content/uploads/2014/06/Ruang-9.pdf · Makalah Pendamping: Matematika 3 233 ANOVA UNTUK ANALISIS RATA-RATA

Prosiding SNMPM Universitas Sebelas Maret 2013 Volume 2

Makalah Pendamping: Matematika 3 287

dengan fungsi plus didefinisikan sebagai ( ) maks{0,x } untuk =1,2,...,pi ix i . Problem

di atas adalah problem cembung tanpa kendala yang mempunyai solusi unik tapi tidak

mempunyai turunan kedua sehingga memerlukan metode Newton. Problem tersebut di

smoothing dan metode Newton diterapkan, yang kemudian akan menghasilkan problem

nonlinier yang akan dijelaskan kemudian.

Untuk selanjutnya digunakan General Support Vector Machine (GSVM) untuk

membangkitkan bidang pemisah nonlinier dengan menggunakan kernel arbitrary lengkap.

Beberapa jenis fungsi kernel dasar yang biasa dipakai dalam SVM adalah (Gunn, 1998

dan Hsu et al., 2005) sebagai berikut :

1. Linear, dengan fungsi kernel ( , ) T

i j i jK A A A A

2. Polynomial, dengan fungsi ( , ) ( ) dimana 0T d

i j i jK A A A A r

3. Gaussian atau RBF, dengan fungsi 2

2( , ) exp( )i j i jK A A A A

dimana 0

4. Sigmoid ,dengan fungsi ( , ) tanh( )T

i j i jK A A A A r

dimana 0

GSVM memecahkan problem matematis untuk kernel umum ( , ')K A A sehingga

1( , )

2

2

min ( )

dengan kendala ( ( )

0

nw Rv f

K e

e'y u

D A, A')Du - e y

y

(8)

( )f u adalah fungsi cembung pada mR yang meminimasi parameter u dan v merupakan

bilangan positif yang memboboti error klasifikasi e'y dibandingkan minimasi dari u . Program

solusi untuk u dan menghasilkan bidang pemisah nonlinier yaitu

(K x',A')Du (9)

Formulasi linier SSVM didapatkan bila ( ') 'K A,A AA , w = A'Du dan

1( )

2f u u'DAA'Du . Sehingga digunakan tujuan klasifikasi yang berbeda yang meminimasi

parameter u dan dalam persamaan nonlinier

2 1

2

( , , )

1min )

2 2

dengan kendala ( ( )

0

mu y R

v

K

y'y + (u'u

D A, A')Du - e y e

y

(10)

yang dapat ditulis menjadi

Page 56: ANOVA UNTUK ANALISIS RATA-RATA RESPON MAHASISWA …math.fkip.uns.ac.id/wp-content/uploads/2014/06/Ruang-9.pdf · Makalah Pendamping: Matematika 3 233 ANOVA UNTUK ANALISIS RATA-RATA

Volume 2 Prosiding SNMPM Universitas Sebelas Maret 2013

288 Makalah Pendamping: Matematika 3

( ( ( )K y e - D A,A')Du -e (11)

Sehingga didapatkan SSVM dengan problem optimasi tanpa kendala sebagai berikut :

1

22

2( , )

1min ( ( ( )) ( )

2 2mu R

vK

e - D A, A')Du -e u'u (12)

yang merupakan fungsi objektif mempunyai solusi unik tetapi tidak mempunyai turunan kedua,

dan tidak smooth, oleh karena itu disarankan untuk menerapkan metode Newton dengan teknik

smoothing dan menggantikan x atau fungsi plus dengan ( , )p x yaitu integral dari fungsi

sigmoid neural network 1

1 x sehingga dapat dituliskan menjadi

1( , ) log(1 ), 0xp x x

(13)

Fungsi p di atas (dengan sebagai parameter penghalus) digunakan untuk menggantikan fungsi

plus sehingga didapatkan model SSVM yaitu

1

2 2

2( , )

1min ( ), ) ( )

2 2pw R

vp

e - D(Aw -e w'w (14)

Persamaan di atas yang telah dimodifikasi dengan penambahan parameter penghalus

dan dapat diperoleh turunan keduanya sehingga penyelesaian problem tersebut dapat dilakukan

dengan menerapkan algoritma konvergen kuadrat Newton dengan tahapan Armijo atau disebut

Algoritma Newton Armijo yang membuat algoritma tersebut konvergen secara global.

Reduce Support Vector Machine (RSVM)

SVM dengan kernel linier dan non linier menjadi algoritma yang cukup terkenal untuk

klasifikasi. Melalui kernel mapping, bermacam model SVM berhasil dengan efektif dan fleksibel

untuk model non linier. Namun terdapat beberapa keterbatasan yang dimiliki SVM di antaranya

masalah banyaknya waktu dan penyimpanan yang diperlukan untuk memecahkan masalah

pemrograman khususnya untuk data dengan ukuran besar. Kesulitan yang dihadapi dalam

penggunaan kernel non linier pada data berukuran besar secara garis besar ada dua. Pertama

adalah kesulitan komputasi dalam memecahkan problem optimasi tanpa kendala yang besar

yang melibatkan fungsi kernel yang membutuhkan memori sangat besar bahkan sebelum

dimulainya proses pencarian solusi. Kedua adalah kesulitan dalam penggunaan formula untuk

bidang pemisah pada x yang merupakan titik baru yang tidak terlihat. Hal tersebut berarti data

yang berukuran besar memerlukan memori besar dan waktu penghitungan yang lama. Untuk

menangani kesulitan komputasi tersebut, sebagai alternatif, disarankan metode Reduced Support

Vector Machine (RSVM) yang disarankan oleh Lee dan Mangasarian ( 2001).

RSVM diturunkan dari Generalized Support Vector Machine (GSVM) dan Smooth

Support Vector Machine (SSVM) (Lee and Huang, 2005; Purnami, Zain, Heriawan, 2012).

Page 57: ANOVA UNTUK ANALISIS RATA-RATA RESPON MAHASISWA …math.fkip.uns.ac.id/wp-content/uploads/2014/06/Ruang-9.pdf · Makalah Pendamping: Matematika 3 233 ANOVA UNTUK ANALISIS RATA-RATA

Prosiding SNMPM Universitas Sebelas Maret 2013 Volume 2

Makalah Pendamping: Matematika 3 289

RSVMberangkat dari ide menggunakan bagian kecil ( )m dari total dataset ( )m yang dipilih

secara random atau acak ( m selalu lebih kecil dibandingkan m ) yang disebut A . Untuk

selanjutnya digunakan 'A untuk menggantikan 'A pada kedua probel optimasi tanpa kendala

untuk mengatasi masalah ukuran matriks dan waktu pemrosesan.

Formulasi RSVM

Dengan menggunakan formulasi untuk data di mana mxnA R dengan kernel square

( , ') mxmK A A R dan memodifikasi formulasi berikut untuk data reducedmxnA R yang

korespondensi dengan matriks diagonal ( )D dan matriks kernel ( , ') mxnK A A R akan

didapatkan algoritma RSVM yang dipecahkan dengan smoothing. Program kuadratik RSVM

didapatkan dengan mengganti 'A dengan 'A sehingga menjadi

1

2

( , , )

1min ( )

2 2

dengan kendala ( ( )

0

m mu y R

v

K

y'y u'u

D A, A')Du - e y e

y

(15)

Data yang diperoleh akan diolah menggunakan metode RSVM dengan menggunakan

software Matlab. Pendekatan machine learning dengan seleksi parameter dilakukan dalam

penelitian ini untuk mendapatkan model terbaik menggunakan Uniform Design (UD) dan K-fold

Cross Validation (KCV). Dalam penelitian ini dilakukan perbandingan penggunaan fungsi

kernel Gaussian dan Linear dengan nilai K sebesar 3,4,5, dan 10 pada KCV untuk mendapatkan

model terbaik. Langkah-langkah dan metodenya adalah sebagai berikut

1. Analisis Deskriptif

2. Memperoleh klasifikasi status ketertinggalan desa/kelurahan di Provinsi Jawa Timur

dengan metode RSVM menggunakan fungsi kernel dan teknik KCV dengan nilai K yang

memiliki tingkat akurasi tertinggi

i. Membangkitkan atau membentuk subset matriks dari elemen full matriks secara

random untuk menggantikan / representasi dari full matriks

ii. Menerapkan fungsi kernel RBF/Gaussian, dan Linear dalam model RSVM

iii. Membuat partisi data dengan KCV dengan nilai k sebesar 3,4,5, dan 10 dalam

mendapatkan parameter untuk membangun model RSVM

iv. Menentukan kombinasi parameter yang paling tepat untuk model fungsi kernel

Gaussian, dan Linear dengan teknik KCV berdasarkan tingkat akurasi tertinggi

v. Membangun model RSVM menggunakan fungsi kernel Gaussian, dan Linear

berdasarkan teknik KCV yang mempunyai tingkat akurasi tertinggi

3. Membandingkan tingkat akurasi ketepatan klasifikasi untuk status ketertinggalan

desa/kelurahan di Provinsi Jawa Timur dengan pendekatan RSVM dengan fungsi kernel

Page 58: ANOVA UNTUK ANALISIS RATA-RATA RESPON MAHASISWA …math.fkip.uns.ac.id/wp-content/uploads/2014/06/Ruang-9.pdf · Makalah Pendamping: Matematika 3 233 ANOVA UNTUK ANALISIS RATA-RATA

Volume 2 Prosiding SNMPM Universitas Sebelas Maret 2013

290 Makalah Pendamping: Matematika 3

Gaussian, dan Linear berdasarkan teknik KCV dengan nilai K yang mempunyai tingkat

akurasi tertinggi

HASIL PENELITIAN DAN PEMBAHASAN

Data klasifikasi desa menunjukkan dari total 8.502 desa/kelurahan di Provinsi Jawa Timur

pada tahun 2011, sebanyak 4.273 desa/kelurahan (50,26 persen) diklasifikasikan sebagai desa

tertinggal dan sisanya sebanyak 4.229 desa/kelurahan (49,74 persen) termasuk desa tidak

tertinggal. Hal tersebut menunjukkan bahwa separuh desa/kelurahan di Provinsi Jawa Timur

masih tergolong desa tertinggal.

RSVM diterapkan untuk mengklasifikasikan desa/kelurahan tersebut untuk mendapatkan

klasifikasi status ketertinggalan desa. Desa/kelurahan diklasifikasikan ke dalam dua kelas, kelas

+1 untuk desa tertinggal dan kelas -1 untuk desa tidak tertinggal dengan hyperplane tunggal

pada ruang berdimensi banyak yang membentuk partisi yang kemudian diselesaikan secara non

linier dengan memasukkan konsep kernel trick (Vapnik, 1995; Vapnik and Cortez, 1995). Jarak

yang paling optimum antara hyperplane dengan pola terdekat masing-masing kelas disebut

margin.

Penelitian ini ingin membandingkan kernel Linear yang sesuai untuk data dalam jumlah

besar, dan kernel Gaussian/RBF yang dianggap efisien (Hsu, et.al, 2008) untuk klasifikasi status

ketertinggalan desa di Provinsi Jawa Timur dengan metode seleksi parameter UD dan teknik

estimasi error menggunakan KCV. Nilai K yang digunakan dalam penelitian ini adalah 3,4,5,

dan 10, dengan alasan seperti yang telah dijelaskan sebelumnya. Dalam hal ini, ingin didapatkan

model terbaik untuk klasifikasi status ketertinggalan desa di Provinsi Jawa Timur dengan

menggunakan metode RSVM berdasarkan tingkat akurasi tertinggi yang diukur melalui training

error maupun akurasi model.

Tabel 1. Perbandingan Training Error dan Akurasi RSVM

Number of K

of KCV Measure

Kernel Function

RBF/Gaussian Linear

3 Training error 0,36 0,26

Akurasi 0,58 0,72

4 Training error 0,36 0,26

Akurasi 0,55 0,74

5 Training error 0,37 0,27

Akurasi 0,60 0,73

10 Training error 0,34 0,25

Akurasi 0,60 0,74

Page 59: ANOVA UNTUK ANALISIS RATA-RATA RESPON MAHASISWA …math.fkip.uns.ac.id/wp-content/uploads/2014/06/Ruang-9.pdf · Makalah Pendamping: Matematika 3 233 ANOVA UNTUK ANALISIS RATA-RATA

Prosiding SNMPM Universitas Sebelas Maret 2013 Volume 2

Makalah Pendamping: Matematika 3 291

Tabel di atas menunjukkan secara umum, kernel linear memberikan hasil yang lebih

baik dibandingkan dengan kernel RBF, hal tersebut ditunjukkan dengan training error yang

lebih kecil dan tingkat akurasi yang lebih besar.

Apabila dilihat dari teknik KCV, 10-fold CV ternyata memang memberikan hasil yang

paling baik dibandingkan ketiga nilai K yang lain baik dari sisi training error pada kedua fungsi

kernel yaitu berturut-turut sebesar 0,34 persen dan 0,25 persen. Tingkat akurasi pada

penggunaan 10-fold CV juga paling tinggi yaitu sebesar 0,60 persen dan 0,74 persen.

Berdasarkan uraian di atas terlihat bahwa penggunaan fungsi kernel Linear dan 10-fold

CV pada metode RSVM akan memberikan training error terendah dan tingkat akkurasi tertinggi

pada klasifikasi status ketertinggalan desa di Provinsi Jawa Timur.

SIMPULAN DAN SARAN

RSVM adalah salah satu metode yang dapat digunakan untuk mengklasifikasikan data

dalam jumlah besar. Hasil penelitian menunjukkan bahwa penggunaan kedua fungsi kernel

menunjukkan fungsi kernel Linear menunjukkan hasil yang lebih baik dibandingkan fungsi

kernel RBF. Selanjutnya seperti penelitian yang sudah dilakukan sebelumnya (Kohavi, 1995)

10-fold CV adalah teknik terbaik. Berdasarkan hasil tersebut dapat dikatakan bahwa fungsi

kernel Linear dan teknik 10-fold CV merupakan metode terbaik dalam pengklasifikasian status

ketertinggalan desa di Provinsi Jawa Timur.

DAFTAR PUSTAKA

Agresti, A., 1996, An Introduction to Categorical Data Analysis, John Willey and Son, Inc,

United States of America

Andari, S., 2012, Smooth Support Vector Machine dan Multivariate Adaptive Regression

Splines Untuk Mendiagnosis Kanker Payudara, Tesis, Mahasiswa Jurusan Statistika

Fakultas MIPA ITS, Surabaya.

Anguita, D., Gelardoni, L., Ghio, A., Oneto, L., and Ridella, S., (2012), The K in K-fold Cross

Validation, European Symposium on Artificial Neural Networks, Computational

Intelligence and Machine Learning (ESANN 2012) Proceedings, Bruges (Belgium), 25-

27 April 2012 .

Badan Pusat Statistik, 2005, Identifikasi dan Penentuan Desa Tertinggal 2002, Badan Pusat

Statistik, Jakarta.

Badan Pusat Statistik, 2011, Pedoman Pendataan PODES 2011, Badan Pusat Statistik, Jakarta.

Badan Pusat Statistik, 2012, Profil Kemiskinan Indonesia September 2011, Berita Resmi

Statistik No. 06/01/Th. XV, 2 Januari 2012, Badan Pusat Statistik, Jakarta

BAPPENAS, 1993, Panduan Pelaksanaan Program IDT 1994-1999, Jakarta.

Page 60: ANOVA UNTUK ANALISIS RATA-RATA RESPON MAHASISWA …math.fkip.uns.ac.id/wp-content/uploads/2014/06/Ruang-9.pdf · Makalah Pendamping: Matematika 3 233 ANOVA UNTUK ANALISIS RATA-RATA

Volume 2 Prosiding SNMPM Universitas Sebelas Maret 2013

292 Makalah Pendamping: Matematika 3

Chien, L.J., Chang, C.C. and Lee, Y.J., 2010, Variant methods of reduced set selection for

reduced support vector machines, Journal of Information Science and Engineering, Vol.

26 (1).

Cortes, C. And Vapnik, V., 1995, Support vector networks, Machine Learning, 20, 273-297.

Dimulyo S., 2009, Penggunaan Geographically Weighted Regression-Kriging untuk

Klasifikasi Desa Tertinggal, dalam Seminar Nasional Aplikasi Teknologi Informasi

(SNATI) 2009, Yogyakarta.

Dirjen Pemberdayaan Masyarakat Desa (PMD) Kemendagri, (2012), Profil Desa dan

Kelurahan 2011 : Data Dasar Tipologi, Klasifikasi, Kategori Desa dan Kelurahan

Menurut Provinsi,Dirjen PMD Kemendagri, Jakarta.

Djuraidah, A., 2009, Analisis Status Ketertinggalan Daerah dengan Analisis Diskriminan,

Seminar Nasional Matematika dan Pendidikan Matematika, UNY, Yogyakarta.

Edy, L., 2009, Pencapaian Pembangunan Daerah Tertinggal Lima Tahun Terakhir, Jurnal

Sekretariat Negara, No : 13, Agustus 2009.

Gunn, S., 1998, Support Vector Machines for Clasification and Regression, Technical Report,

ISIS.

Hidayat, S., 2008, Permodelan Desa Tertinggal di Jawa Barat Tahun 2005 dengan Pendekatan

Mars, Tesis Mahasiswa Jurusan Statistika Fakultas MIPA ITS, Surabaya

Hsu, C.W., Chang, C. C., & Lin, C. J., 2008. A practical guide to Support Vector Classification,

Taipe: Information Engineering National Taiwan University.

Huang, C.M., Lee, Y.J., Lin, D.K.J. and Huang, S.Y., 2007, “Model selection for support

vector machines via uniform design”, A Special issue on Machine Learning and Robust

DataMining of Computational Statisticsand Data Analysis, Vol. 52, pp. 335-346.

Kementrian Pembangunan Daerah Tertinggal, 2011, Indikator Primer Daerah Tertinggal Tahun

2011, KPDT : kpdt.bps.go.id/index.php?AnalisisData/ analisa1#, Jakarta (diakses 5 Juli

2013).

Kohavi, R., 1995, A study of cross-validation and bootstrap for accuracy estimation and model

selection. InInternational joint Conference on artificial intelligence, volume 14, pages

1137–1145, 1995.

Lee, Y. J., 2001, Support vector machines in data mining, PhD thesis, University of Wisconsin-

Madison, USA.

Lee, Y.J., & Mangasarian, O.L., 2001, A Smooth Support Vector Machine, Jurnal of

Computational Optimization and applications 20:5-22.

Lee, Y.J., & Mangasarian, O.L., 2001 “RSVM: Reduced Support Vector Machines”, In

Proceedings of the First SIAM International Conference on Data Mining.

Lee, Y.J. and Huang, S.Y., 2007, “Reduced Support Vector Machines: A Statistical Theory”,

IEEE Trans.Neural Network, Vol.18, no. 1.

Page 61: ANOVA UNTUK ANALISIS RATA-RATA RESPON MAHASISWA …math.fkip.uns.ac.id/wp-content/uploads/2014/06/Ruang-9.pdf · Makalah Pendamping: Matematika 3 233 ANOVA UNTUK ANALISIS RATA-RATA

Prosiding SNMPM Universitas Sebelas Maret 2013 Volume 2

Makalah Pendamping: Matematika 3 293

Lin, K.M and Lin, C.J., 2003, “A study on reduced supportvector machines”, IEEE

Trans.Neural Network, Vol.14,no.6, pp.1449-1459.

Menteri Negara Pembangunan Daerah Tertinggal Republik Indonesia, 2005, Strategi Nasional

Pembangunan Daerah Tertinggal, Kementerian Negara Pembangunan Daerah Tertinggal

Republik Indonesia, Jakarta

Menteri Koordinator Kesejahteraan Masyarakat, 2009, Membangun Kesejahteraan dan

Kemandirian Bangsa, Kemenkesra

http://www.setneg.go.id/index.php?option=com_content&task=view&id=2263&Itemid=

219 (diakses tanggal 24 Agustus 2013).

Mubyarto, 1994, Keswadayaan Masyarakat Desa Tertinggal, Aditya Media,

Yogyakarta.

Narayan, D., Patel, R., Schafft, K., Rademacher, A., Schulte, S.K, 1999, Can Anyone Hear Us?

Voice From 47 Countries. Poverty Group, PREM. World Banks.

Nugroho, A.S., Witarto, A.A., Handoko, Dwi, Support Vector Machine : Teori dan Aplikasinya

dalam Bioinformatika, http://ilmukomputer.com (diakses 4 Juli 2013).

Purnami, S.W., Zain, J.M., Heriawan, T., (2011), An alternative algorithm for classification

large categorical dataset: k-mode clustering reduced support vector machine.

International Journal of Database Theory and Application Vol. 4, No. 1, March 2011.

Putra, A.S., 2013, Daerah Tertinggal, Perdesaan Swadaya/Tertinggal dan Kecamatan Tertinggal,

http://opentrade2222.blogspot.com/2013/05/daerah-tertinggal-perdesaan.html (diakses

tanggal 24 Agustus 2013).

Tim Nasional Percepatan Penanggulangan Kemiskinan (TNP2K), 2012, Buku Saku PNPM

Mandiri, TNP2K, Jakarta.

Tim Nasional Percepatan Penanggulangan Kemiskinan (TNP2K), 2012, Daftar Indikatif Lokasi

dan Alokasi BLM Program PNPM Mandiri 2012, TNP2K, Jakarta.

Vapnik, V., 1995, The Nature of Statistical Learning Theory, Springer-Verlag, New York.

Wahyuningsih, D., 2009, Analisis Karakteristik Desa Tertinggal dengan Stuctural Equation

Modelling, Tesis Jurusan Statistika Fakultas MIPA ITS, Surabaya.

Page 62: ANOVA UNTUK ANALISIS RATA-RATA RESPON MAHASISWA …math.fkip.uns.ac.id/wp-content/uploads/2014/06/Ruang-9.pdf · Makalah Pendamping: Matematika 3 233 ANOVA UNTUK ANALISIS RATA-RATA

Volume 2 Prosiding SNMPM Universitas Sebelas Maret 2013

294 Makalah Pendamping: Matematika 3

PERBANDINGAN UJI KENORMALAN

PADA KATEGORI FUNGSI DISTRIBUSI EMPIRIS

MENGGUNAKAN METODE SIMULASI MONTE CARLO

Sugiyanto1, Etik Zukhronah

2, dan Sri Sulistijowati H

3

[email protected]

[email protected] [email protected]

Abstrak

Uji kenormalan berdasarkan pada kategori fungsi distribusi empiris ada empat yaitu

uji Kolmogorov-Smirnov, Kuiper, Cramer-von Mises, dan Anderson-Darling.

Keempat uji tersebut memiliki statistik uji yang berbeda. Hal ini menyebabkan adanya

perbedaan kesimpulan diantara keempat uji tersebut sehingga perlu untuk

dibandingkan. Hasil perbandingan dari uji-uji tersebut menggunakan simulasi Monte

Carlo bahwa uji Anderson-Darling mempunyai kepekaan paling tinggi untuk menolak

ketidaknormalan suatu data.

Kata kunci : uji Kolmogorov-Smirnov, uji Kuiper, uji Cramer-von Mises, uji

Anderson-Darling,Simulasi Monte Carlo.

1. LATAR BELAKANG MASALAH

Asumsi kenormalan diperlukan dalam banyak porsedur statistika. Pemeriksaan asumsi

kenormalan dapat menggunakan metode grafik maupun uji kenormalan. Metode grafik yang

dapat digunakan antara lain quantile-quantile plot (q-q plot), histogram, box-plot, dan diagram

batang dan daun. Namun demikian metode grafik tersebut masih belum cukup untuk

memberikan bukti yang menyakinkan.

Uji kenormalan pada kategori fungsi distribusi empiris menurut Arshad dkk. [4] ada

empat macam yaitu uji Kolmogorov-Smirnov, Kuiper, Cramer-von Mises, dan Anderson-

Darling. Keempat uji tersebut memiliki statistik uji yang berbeda. Hal ini menyebabkan adanya

perbedaan kesimpulan diantara keempat uji tersebut sehingga perlu untuk dibandingkan.

Pernyataan ini dikuatkan oleh Razali dan Wah [4] yang mengatakan bahwa antara uji

kenormalan yang satu dengan yang lain menghasilkan kesimpulan yang berbeda. Beberapa uji

menolak hipotesis nol (H0) sedangkan uji yang lain gagal menolak H0 dengan H0 adalah sampel

acak berasal dari populasi berdistribusi normal.

Conover [2] menyatakan bahwa beberapa uji statistik dapat dibandingkan berdasarkan

kekuatan uji masing-masing. Kekuatan uji yaitu besarnya probabilitas menolak H0 ketika H0

salah. Untuk mengetahui kepekaan uji masing-masing untuk menolak H0ketika H0 salah,

dilakukan metode simulasi Monte Carlo.

Stephens [5] pada tahun 1974 melakukan penelitian mengenai perbandingan uji

kenormalan pada kategori fungsi distribusi empiris menggunakan metode simulasi Monte Carlo

sebanyak 1.000 kali pengulangan dengan ukuran sampel yaitu 10,20 dan 30. Hasil perbandingan

uji-uji tersebut disajikan dalam bentuk tabel persentase menolak H0. Penelitian Stephens

menyimpulkan bahwa uji Cramer-von Mises dan Anderson-Darling sama kuat dalam menguji

Page 63: ANOVA UNTUK ANALISIS RATA-RATA RESPON MAHASISWA …math.fkip.uns.ac.id/wp-content/uploads/2014/06/Ruang-9.pdf · Makalah Pendamping: Matematika 3 233 ANOVA UNTUK ANALISIS RATA-RATA

Prosiding SNMPM Universitas Sebelas Maret 2013 Volume 2

Makalah Pendamping: Matematika 3 295

kenormalan data.

Selanjutnya, dalam penelitian ini dilakukan pengembangan terhadap hasil penelitian

Stephens yaitu perbandingan menggunakan metode simulasi Monte Carlo dengan 10.000 kali

pengulangan dan ukuran sampel 10, 20,...,100. Hasil perbandingan keempat uji tersebut

disajikan dalam bentuk grafik persentase menolak H0.

2. PEMBAHASAN

2.1 Prosedural. Prosedural merupakan langkah-langkah pengujian hipotesis untuk mengetahui

sampel acak berasal dari populasi berdistribusi normal atau tidak. Berikut langkah-langkah

pengujian hipotesis.

(1) Hipotesis

H0 : sampel acak berasal dari populasi berdistribusi normal

H1 : sampel acak tidak berasal dari populasi berdistribusi normal

(2) Tingkat signifikansi ()

(3) Daerah kritis

H0 ditolak jika statistik uji > nilai kritis.

Nilai kritis bergantung pada yang diambil.

(4) Statistik uji

Modifikasi statistik Kolmogorov-Smirnov dinyatakan

𝐷∗ = 𝑛 − 0,01 +0,85

𝑛 𝐷

dengan 𝐷+ = max𝑖=1,2,…,𝑛 𝑖

𝑛− 𝑧𝑖 , 𝐷− = max𝑖=1,2,…,𝑛 𝑧𝑖 −

(𝑖−1)

𝑛 , dan

𝐷 = max 𝐷+, 𝐷−

Dimana 𝐷 adalah statistik Kolmogorov-Smirnov, 𝑛 adalah banyaknya sampel acak dan

𝑧𝑖 adalah distribusi probabilitas kumulatif normal standar untuk 𝑤𝑖 =(𝑥𝑖−𝑥 )

𝑠 dengan 𝑥𝑖

merupakan statistik terurut.

Stephens [5] mendefinisikan modifikasi statistik Kuiper 𝑉∗ sebagai

𝑉∗ = 𝑛 + 0,05 +0,82

𝑛 𝑉.

Notasi 𝑉 menunjukkan statistik Kuiper yang nilainya merupakan kombinasi dari

statistik Kolmogorov-Smirnov yaitu 𝐷+ dan 𝐷− sehingga

𝑉 = 𝐷+ + 𝐷−.

Modifikasi statistik Cramer-von Mises adalah

𝑊2∗ = 1 +0,5

𝑛 𝑊2

dengan 𝑊2 =1

12𝑛+ 𝑧𝑖 −

2𝑖−1

2𝑛

2𝑛𝑖=1 . Notasi 𝑊2 merupakan statistik Cramer-von

Mises.

Modifikasi statistik Anderson-Darling ditentukan dengan

Page 64: ANOVA UNTUK ANALISIS RATA-RATA RESPON MAHASISWA …math.fkip.uns.ac.id/wp-content/uploads/2014/06/Ruang-9.pdf · Makalah Pendamping: Matematika 3 233 ANOVA UNTUK ANALISIS RATA-RATA

Volume 2 Prosiding SNMPM Universitas Sebelas Maret 2013

296 Makalah Pendamping: Matematika 3

𝐴2∗ = 1 +0,75

𝑛+

2,25

𝑛2 𝐴2

dengan 𝐴2 = −𝑛 −1

𝑛 2𝑖 − 1 𝑛𝑖=1 ln 𝑧𝑖 + ln(1 − 𝑧𝑛+1−𝑖) .

Notasi 𝐴2 adalah statistik Anderson-Darling.

(5) Kesimpulan

2.2 Simulasi Monte Carlo untuk Keempat Uji. Langkah awal dari simulasi ini adalah

membangkitkan bilangan acak dari distribusi eksponensial, chi-kuadrat, gamma, beta, dan

uniform. Bilangan acak yang dibangkitkan tersebut dipandang sebagai sampel acak.

2.2.1 Sampel Berdistribusi Eksponensial. Pada simulasi pertama, sampel dibangkitkan dari

distribusi eksponensial dengan parameter 𝜃 = 7. Hasil simulasi disajikan dalam grafik

persentase menolak H0 dengan bervariasi ukuran sampel yang tampak dalam Gambar 1. Gambar

1 menunjukkan semakin besar ukuran sampel, persentase menolak H0 untuk keempat uji

tersebut juga semakin besar.

Gambar 1. Persentase menolak H0 dari sampel berdistribusi eksponensial dengan parameter

𝜃 = 7 untuk 𝑛 = 10,20,… ,100

Uji Anderson-Darling memiliki persentase menolak H0 yang lebih besar dari uji Kuiper

dan Cramer-von Mises. Namun, perbedaan persentase menolak H0 untuk ketiga uji tersebut

tidak signifikan sehingga dianggap memiliki kepekaan yang sama. Sedangkan uji Kolmogorov-

Smirnov memiliki persentase menolak H0 yang paling kecil diantara ketiga uji tersebut. Tetapi

mulai 𝑛 = 50, uji Kolmogorov-Smirnov sudah memiliki kepekaan yang sama dengan ketiga

uji yang lain. Ini artinya keempat uji tersebut sama kuat dalam menguji kenormalan sehingga

dapat memberikan kesimpulan yang sama.

10 20 30 40 50 60 70 80 90 10030

40

50

60

70

80

90

100

n

Pers

enta

se m

enola

k H

0

Kolmogorov-Smirnov

Kuiper

Cramer-von Mises

Anderson-Darling

Page 65: ANOVA UNTUK ANALISIS RATA-RATA RESPON MAHASISWA …math.fkip.uns.ac.id/wp-content/uploads/2014/06/Ruang-9.pdf · Makalah Pendamping: Matematika 3 233 ANOVA UNTUK ANALISIS RATA-RATA

Prosiding SNMPM Universitas Sebelas Maret 2013 Volume 2

Makalah Pendamping: Matematika 3 297

2.2.2 Sampel Berdistribusi Chi-Kuadrat. Simulasi kedua ini, sampel yang dibangkitkan

berasal dari distribusi chi-kuadrat dengan derajat bebas 𝜐 = 3. Hasil simulasi disajikan dalam

grafik persentase menolak H0 dengan 𝑛 = 10,20,… ,100 yang tampak dalam Gambar 2. Pada

Gambar 2, menunjukkan bahwa hasil simulasi kedua ini hampir sama dengan hasil simulasi

yang pertama. Ketika sampel dibangkitkan dari distribusi chi-kuadrat dengan ukuran sampel

semakin besar, persentase menolak H0 untuk keempat uji tersebut juga semakin besar.

Gambar 2. Persentase menolak H0 untuk 𝑛 = 10,20,… ,100dari sampel berdistribusi chi-

kuadrat dengan derajat bebas 𝜐 = 3

Persentase penolakan H0 untuk uji Anderson-Darling lebih besar dibandingkan dengan

uji Cramer-von Mises tetapi selisihnya tidak signifikan sehingga kedua uji tersebut dikatakan

memiliki kepekaan yang sama. Ini berarti uji Cramer-von Mises dan Anderson-Darling sama-

sama kuat untuk menguji kenormalan.

Sebaliknya, uji Kolmogorov-Smirnov memiliki persentase penolakan H0 yang paling

kecil diantara keempat uji tersebut. Uji Kuiper, Cramer-von Mises, dan Anderson-Darling

memiliki kepekaan yang sama pada saat ukuran sampel mendekati 60. Sedangkan, ketika

ukuran sampel mendekati 80, uji Kolmogorov-Smirnov dapat dikatakan mempunyai kepekaan

yang sama seperti ketiga uji yang lain.

2.2.3 Sampel Berdistribusi Gamma. Pada simulasi ketiga ini, sampel yang digunakan

dibangkitkan dari distribusi gamma dengan parameter 𝜃 = 3 dan 𝜅 = 5. Hasil simulasi

ditunjukkan dengan grafik persentase penolakan H0 yang tampak dalam Gambar 3. Pada gambar

tersebut tampak bahwa hasil simulasi ini memberikan gambaran yang berbeda dengan hasil

simulasi yang sebelumnya. Namun, hasil simulasi ini juga menunjukkan bahwa jika ukuran

sampelnya semakin besar maka persentase penolakan H0 untuk keempat uji tersebut juga

semakin besar.

10 20 30 40 50 60 70 80 90 10020

30

40

50

60

70

80

90

100

n

Pers

enta

se m

enola

k H

0

Kolmogorov-Smirnov

Kuiper

Cramer-von Mises

Anderson-Darling

Page 66: ANOVA UNTUK ANALISIS RATA-RATA RESPON MAHASISWA …math.fkip.uns.ac.id/wp-content/uploads/2014/06/Ruang-9.pdf · Makalah Pendamping: Matematika 3 233 ANOVA UNTUK ANALISIS RATA-RATA

Volume 2 Prosiding SNMPM Universitas Sebelas Maret 2013

298 Makalah Pendamping: Matematika 3

Gambar 3. Persentase menolak H0 untuk 𝑛 = 10,20,… ,100dari sampel berdistribusi gamma

dengan parameter 𝜃 = 3 dan 𝜅 = 5

Uji Kolmogorov-Smirnov dan Kuiper memiliki persentase penolakan H0 hampir sama

dan lebih kecil dari uji Cramer-von Mises dan Anderson-Darling. Hal ini menunjukkan uji

Kolmogorov-Smirnov dan Kuiper memiliki kepekaan yang sama untuk menolak H0 ketika H0

salah.

Sebaliknya, uji Cramer-von Mises dan Anderson-Darling mempunyai selisih persentase

penolakan H0 yang tidak signifikan sehingga kedua uji tersebut dianggap memiliki kepekaan

yang sama. Hal ini berarti apabila sampel berasal dari distribusi gamma, baik uji Cramer-von

Mises maupun uji Anderson-Darling akan sama-sama kuat dalam menguji kenormalan sehingga

keduanya dapat memberikan kesimpulan yang sama.

2.2.4 Sampel Berdistribusi Beta. Hasil simulasi keempat tampak pada Gambar 4, yang

mana sampel dibangkitkan dari distribusi beta dengan parameter a = 3 dan b = 1. Dari gambar

tersebut, uji Anderson-Darling yang memiliki persentase menolak H0 paling besar daripada

ketiga uji yang lain. Namun, ketika ukuran sampel sebesar 100, persentase menolak H0 untuk

keempat uji tersebut hampir sama dan selisihnya tidak signifikan. Oleh karena itu, keempat uji

tersebut dapat dianggap memiliki kepekaan yang sama untuk menolak H0 ketika H0 salah

sehingga sama kuat dalam menguji kenormalan dan dapat menghasilkan kesimpulan yang sama

pula.

10 20 30 40 50 60 70 80 90 10010

20

30

40

50

60

70

80

90

100

n

Pers

enta

se m

enola

k H

0

Kolmogorov-Smirnov

Kuiper

Cramer-von Mises

Anderson-Darling

Page 67: ANOVA UNTUK ANALISIS RATA-RATA RESPON MAHASISWA …math.fkip.uns.ac.id/wp-content/uploads/2014/06/Ruang-9.pdf · Makalah Pendamping: Matematika 3 233 ANOVA UNTUK ANALISIS RATA-RATA

Prosiding SNMPM Universitas Sebelas Maret 2013 Volume 2

Makalah Pendamping: Matematika 3 299

Gambar 4. Persentase menolak H0 untuk 𝑛 = 10,20,… ,100dari sampel berdistribusi beta

dengan parameter a = 3 dan b = 1

2.2.5 Sampel Berdistribusi Uniform. Hasil simulasi kelima disajikan dalam Gambar 5. Pada

simulasi kelima ini, sampel yang dibangkitkan berasal dari distribusi uniform dengan interval a

=-3 dan b =3. Dari gambar tersebut, ketika ukuran sampel diambil kecil, dalam hal ini n = 10

tampak bahwa uji Kolmogorov-Smirnov, Kuiper, Cramer-von Mises, dan Anderson-Darling

dapat memberikan kesimpulan yang sama. Hal ini karena keempat uji tersebut memiliki

perbedaan persentase menolak H0 yang tidak signifikan. Tetapi, ketika ukuran sampel diambil

besar, yaitu 100, terlihat bahwa uji Anderson-Darling memiliki persentase menolak H0 yang

paling besar diantara keempat uji tersebut sedangkan uji Kolmogrov-Smirnov mempunyai

persentase menolak H0 yang paling kecil. Selain itu, tampak bahwa uji Kuiper dan Cramer-von

Mises memiliki selisih persentase menolak H0 yang tidak signifikan sehingga kepekaan kedua

uji tersebut sama. Dengan demikian, Gambar 5 menunjukkan bahwa semakin besar sampel yang

diambil, uji Anderson-Darling akan semakin kuat untuk menolak H0 ketika H0 salah.

10 20 30 40 50 60 70 80 90 10010

20

30

40

50

60

70

80

90

100

n

Pers

enta

se m

enola

k H

0

Kolmogorov-Smirnov

Kuiper

Cramer-von Mises

Anderson-Darling

10 20 30 40 50 60 70 80 90 1000

10

20

30

40

50

60

70

80

90

100

n

Pers

enta

se m

enola

k H

0

Kolmogorov-Smirnov

Kuiper

Cramer-von Mises

Anderson-Darling

Page 68: ANOVA UNTUK ANALISIS RATA-RATA RESPON MAHASISWA …math.fkip.uns.ac.id/wp-content/uploads/2014/06/Ruang-9.pdf · Makalah Pendamping: Matematika 3 233 ANOVA UNTUK ANALISIS RATA-RATA

Volume 2 Prosiding SNMPM Universitas Sebelas Maret 2013

300 Makalah Pendamping: Matematika 3

Gambar 5. Persentase menolak H0 untuk 𝑛 = 10,20,… ,100dari sampel berdistribusi uniform

dengan interval a =-3 dan b =3

3. KESIMPULAN

Berdasarkan hasil simulasi Monte Carlo, diperoleh kesimpulan bahwa uji Anderson-

Darling memiliki kepekaan tertinggi untuk menguji ketidaknormalan suatu data. Sebaliknya, uji

Kolmogorov-Smirnov merupakan uji yang paling lemah dalam menguji ketidaknormalan suatu

data.

DAFTAR PUSTAKA

[1] Arshad, M., M. T. Rsool and M. I. Ahmad, Anderson darling and modified anderson darling

test for generalized pareto distribution, Pakistan Journal of Applied Sciences 3 (2003), no.

2, 85-88.

[2] Conover, W. J., Practical nonparametric statistics, Third Edition, John Wiley and Sons, Inc,

1999.

[3] Daniel, W. W., Statistika nonparametrik terapan, Gramedia, Jakarta, 1989.

[4] Razali, N. M. and Y. B. Wah, Power comparisons of shapiro-wilk, kolmogorov-smrinov,

liliefors, and anderson-darling tests, Journal of Statistical Modelling and Analytics 2

(2011), 21-33.

[5] Stephens, M. A., Edf statistics for goodness of _t and some comparisons, Journal of the

American Statistical Association 69 (1974), 730-737.

Page 69: ANOVA UNTUK ANALISIS RATA-RATA RESPON MAHASISWA …math.fkip.uns.ac.id/wp-content/uploads/2014/06/Ruang-9.pdf · Makalah Pendamping: Matematika 3 233 ANOVA UNTUK ANALISIS RATA-RATA

Prosiding SNMPM Universitas Sebelas Maret 2013 Volume 2

Makalah Pendamping: Matematika 3 301

DETEKSI POLA PENYEBARAN DEMAM BERDARAH DENGUE DI

KOTA SURAKARTA MENGGUNAKAN

INDEKS MORAN

Etik Zukhronah1, Sugiyanto

2, Respatiwulan

3

Jurusan Matematika FMIPA UNS [email protected],2sugiyanto@yahoo.

co.id, [email protected]

Abstrak

Penyakit demam berdarah dengue disebabkan oleh virus dengue yang disebarkan

oleh nyamuk Aedes Aegypti. Sebagian besar kelurahan di Kota Surakarta merupakan

daerah endemis demam berdarah. Penelitian ini bertujuan untuk mendeteksi pola

penyebaran penyakit demam berdarah secara spasial di Kota Surakarta menggunakan

Indeks Moran. Data diambil dari Dinas Kesehatan Surakarta pada tahun 2012. Hasil

penelitian menunjukkan bahwa terdapat autokorelasi spasial dalam penyebaran

penyakit demam berdarah di Kota Surakarta dan kejadiannya berpola clustered.

Kata kunci: demam berdarah dengue, indeks Moran

PENDAHULUAN

Demam berdarah dengue atau dalam istilah kedokteran Dengue Hemorrhagik Fever

(DHF) adalah suatu penyakit yang disebabkan oleh infeksi virus Dengue dan ditularkan melalui

gigitan nyamuk Aedes Aegypti betina dan beberapa spesies Aedes lainnya. Populasi nyamuk ini

akan meningkat pesat pada saat musim hujan. Namun nyamuk Aedes Aegypti juga dapat hidup

dan berkembang biak pada bak-bak penampungan air sepanjang tahun

(http://www.blogdokter.net).

Demam berdarah banyak ditemukan di daerah tropis dan subtropis. Asia menempati

urutan pertama dalam jumlah penderita demam Dengue setiap tahun.

(http://www.blogdokter.net). Kasus demam berdarah di Indonesia tercatat masih tinggi bahkan

paling tinggi dibanding Negara lain di ASEAN (http://health.detik.com).

Sebagian besar kecamatan di Kota Surakarta, Jawa Tengah merupakan daerah endemis

demam berdarah dengan jumlah penderita hampir meningkat setiap tahunnya.

(http://www.mediaindonesia.com). Dari 51 kelurahan yang ada, terdapat 40 kelurahan yang

merupakan daerah endemis dengan jumlah penderita 826 orang dan 12 orang diantaranya

meninggal pada tahun 2008 (Dinas Kesehatan Kota Surakarta, 2009). Terdapat 46 kelurahan

yang merupakan daerah endemis pada tahun 2009 dengan jumlah penderita 684 orang dan 7

diantaranya meninggal ( Dinas Kesehatan Kota Surakarta, 2010). Sedangkan pada tahun

2010 terdapat 49 kelurahan yang merupakan daerah endemis dengan jumlah penderita 533

orang dan 9 diantaranya meninggal (Dinas Kesehatan Kota Surakarta, 2011)

Melihat tingginya angka kasus DBD di Kota Surakarta, maka perlu dilakukan penelitian

yang berhubungan dengan komponen ruang guna menentukan pola epidemi kasus demam

Page 70: ANOVA UNTUK ANALISIS RATA-RATA RESPON MAHASISWA …math.fkip.uns.ac.id/wp-content/uploads/2014/06/Ruang-9.pdf · Makalah Pendamping: Matematika 3 233 ANOVA UNTUK ANALISIS RATA-RATA

Volume 2 Prosiding SNMPM Universitas Sebelas Maret 2013

302 Makalah Pendamping: Matematika 3

berdarah. Epidemi demam berdarah bervariasi dari satu tempat ke tempat lain, sehingga

komponen ruang juga harus diperhatikan. Autokorelasi spasial merupakan teknik untuk

mengukur tingkat hubungan dalam data yang dipengaruhi oleh keadaan geografis (data spasial)

(Griffith, 2003). Data spasial (ruang) merupakan suatu data yang dipengaruhi oleh ruang

ataupun posisi relatif suatu objek yang diamati (Anselin, 1992).

Untuk mengukur hubungan spasial antar daerah dapat digunakan indeks global dan

indeks local (Wen etal. 2010). Indeks Moran merupakan indeks global yang digunakan

untuk mengukur adanya hubungan spasial dalam penyebaran penyakit. Hubungan spasial ini

diperlukan untuk mengetahui apakah terdapat autokorelasi spasial dalam penyebaran penyakit

demam berdarah yang terjadi di Kota Surakarta.

Penelitian yang berkaitan dengan penyebaran penyakit demam berdarah telah

dilakukan oleh Nakhapakorn dan Supet (2006), kemudian oleh Astutik et al. (2011).

Nakhapakorn dan Supet (2006) meneliti tentang distribusi spasial kasus demam berdarah

yang terjadi di Thailand. Dalam penelitiannya, ia menggunakan indeks Moran, Geary dan

LISA untuk mengukur hubungan spasial antar daerah. Sedangkan Astutik et al. (2011)

mendeteksi hubungan spasial temporal kasus demam berdarah yang terjadi di provinsi Jawa

Timur menggunakan multivariat Moran dan multivariat LISA. Berdasarkan penelitian yang

telah dilakukan oleh Nakhapakorn dan Supet (2006), dan Astutik et al.(2011), maka kasus

kejadian DBD di Kota Surakarta dapat dianalisis secara spasial.

METODE PENELITIAN

Data Penelitian

Data yang digunakan dalam penelitian ini adalah data jumlah penderita DBD di

Surakarta tahun 2012 yang meliputi 51 kelurahan yang berada di 5 kecamatan.Data tersebut

diambil dari di Dinas Kesehatan Kota Surakarta. Data dianalisis menggunakan bantuan software

OpenGeoda dengan melakukan input data ke file shp (shape file) daerah Surakarta.

Metode Analisis Data

1. Langkah awal dalam analisis spasial temporal adalah menyusun matriks pembobotan 𝑊

yang elemen-elemennya 𝑤𝑖𝑗 merupakan spatial weight measure untuk daerah yang

berbatasan. Jika daerah i berbatasan dengan daerah j maka dinotasikan 1 dan jika tidak

berbatasan maka dinotasikan 0.

2. Langkah selanjutnya adalah menghitung nilai indeks Moran dari data jumlah penderita

tiap-tiap kelurahan. Indeks Moran dihitung dengan menggunakan rumus

𝐼 =𝑛 𝑤 𝑖𝑗 𝑥𝑖−𝑥 𝑥𝑗−𝑥

𝑛𝑗=1

𝑛𝑖=1

𝑊 𝑥𝑖−𝑥 2𝑛

𝑖=1

.................................... (1)

dengan

Page 71: ANOVA UNTUK ANALISIS RATA-RATA RESPON MAHASISWA …math.fkip.uns.ac.id/wp-content/uploads/2014/06/Ruang-9.pdf · Makalah Pendamping: Matematika 3 233 ANOVA UNTUK ANALISIS RATA-RATA

Prosiding SNMPM Universitas Sebelas Maret 2013 Volume 2

Makalah Pendamping: Matematika 3 303

𝑊 = 𝑤𝑖𝑗𝑛𝑗=1

𝑛𝑖=1

𝐼 menyatakan indeks Moran,

n menyatakan banyak lokasi kejadian,

𝑥𝑖 menyatakan jumlah penderita demam berdarah pada daerah i,

𝑥𝑗 menyatakan jumlah penderita demam berdarah pada daerah j,

𝑥 menyatakan rata rata dari jumlah penderita demam berdarah,

𝑤𝑖𝑗 menyatakan elemen pada bobot matriks antara daerah 𝑖 dan 𝑗,

W menyatakan jumlah darisemua nilaiselpada bobot matriks

Menurut Pfeiffer et al. (2008), nilai-nilai yang dihasilkan dalam perhitungan indeks

Moran adalah dalam range berkisar antara -1 <I < 1, dengan I merupakan autokorelasi

spasial berdasarkan indeks Moran. Indeks Moran digunakan untuk menentukan apakah

terdapat hubungan spasial yang mempengaruhi terhadap penyebaran penyakit DBD

dengan menentukan adanya autokorelasi spasial atau tidak.

3. Setelah diperoleh indeks Moran, dilakukan uji signifikansi untuk mengetahui apakah

terdapat autokorelasi spasial dalam penyebaran DBD. Uji signifikansi dapat dilakukan

dengan menggunakan p-value yang ada pada output OpenGeoda dan membandingkannya

dengan tingkat signifikansi α = 0,05.

4. Pola penyebaran penyakit DBD di Kota Surakarta dapat ditunjukkan dengan

membandingkan nilai indeks Moran terhadap nilai E I = −1/(n − 1) . Jika nilai indeks

Moran lebih kecil dari E I maka autokorelasi spasial negatif dan jika lebih besar E I

maka autokorelasi spasial positif. Bila autokorelasi spasial positif berarti kelurahan yang

mempunyai jumlah penderita DBD yang tinggi terletak berdekatan dengan kelurahan

yang mempunyai jumlah penderita DBD yang tinggi juga, dan kelurahan yang memiliki

jumlah penderita DBD yang rendah berdekatan dengan kelurahan yang memiliki jumlah

penderita DBD yang rendah.

HASIL DAN PEMBAHASAN

Indeks Moran dihitung menggunakan persamaan 1. Misalkan x1 menyatakan jumlah

penderita demam berdarah di kelurahan Nusukan untuk i=1, xj menyatakan jumlah penderita

demam berdarah di kelurahan j dengan j berjalan dari 1, 2, ..., 51dalam hal ini j menyatakan

kelurahan yang ada di Kota Surakarta. Dengan menggunakan cara yang sama untuk pemilihan i

yang lain. Penghitungan indeks Moran menggunakan bantuan software OpenGeoda dan

diperoleh nilai sebesar 0,123 dengan p value sebesar 0,041. Diperoleh nilai p value kurang dari

α=5%, sehingga dapat disimpulkan bahwa terdapat hubungan spasial yang mempengaruhi

penyebaran penyakit demam berdarah di Kota Surakarta.

Page 72: ANOVA UNTUK ANALISIS RATA-RATA RESPON MAHASISWA …math.fkip.uns.ac.id/wp-content/uploads/2014/06/Ruang-9.pdf · Makalah Pendamping: Matematika 3 233 ANOVA UNTUK ANALISIS RATA-RATA

Volume 2 Prosiding SNMPM Universitas Sebelas Maret 2013

304 Makalah Pendamping: Matematika 3

Selanjutnya membandingkan nilai indeks Moran dengan nilai E[I] untuk mengetahui

pola penyebaran penyakit demam berdarah. Nilai 𝐸 𝐼 = −1

𝑛−1= −0,02 dengan n merupakan

jumlah kelurahan yang ada di Kota Surakarta sebanyak 51 kelurahan. Jika nilai indeks Moran

kurang dari -0,02, maka terdapat autokorelasi spasial negatif dan jika nilai indeks Moran lebih

dari -0,02, maka terdapat autokorelasi spasial positif. Ternyata nilai indeks Moran yang

diperoleh lebih besar dari -0,02, sehingga dapat disimpulkan bahwa terdapat autokorelasi spasial

positif dengan pola penyebaran Clustered. Gambar 1 merupakan Moran scatterplot dan nilai

indeks Moran hasil outputOpenGeoda 9.15.

Gambar 1a. Moran Scatterplot tahun2012

Gambar 1b. Indeks Moran tahun 2012

Pada Gambar 1a. terlihat garis ungu yang menggambarkan indeks Moran miring dari

bawah sebelah kiri ke atas sebelah kanan yang menunjukkan autokorelasi spasial positif dan

pada Gambar 1b. terlihat bahwa indeks Moran berada di sebelah kanan rata-rata. Hal ini

Page 73: ANOVA UNTUK ANALISIS RATA-RATA RESPON MAHASISWA …math.fkip.uns.ac.id/wp-content/uploads/2014/06/Ruang-9.pdf · Makalah Pendamping: Matematika 3 233 ANOVA UNTUK ANALISIS RATA-RATA

Prosiding SNMPM Universitas Sebelas Maret 2013 Volume 2

Makalah Pendamping: Matematika 3 305

menunjukkan bahwa daerah yang mempunyai jumlah penderita demam berdarah tinggi

berdekatan dengan daerah yang mempunyai jumlah penderita demam berdarah tinggi dan

daerah yang mempunyai jumlah penderita demam berdarah rendah berdekatan dengan daerah

yang mempunyai jumlah penderita demam berdarah rendah.

KESIMPULAN

Berdasarkan hasil analisis menggunakan bantuan Software OpenGeoda diperoleh nilai indeks

Moran yang signifikan, yang berarti bahwa pada tahun 2012 terdapat hubungan spasial yang

mempengaruhi penyebaran penyakit demam berdarah dengan pola penyebaran bersifat

clustered.

DAFTAR PUSTAKA

Anselin, L. (1992). Spatial Data Analysis with GIS : An Introduction to Aplicationin the Social

Sciences. National Center for Geographic Information and Analysis of California

Santa Barbara, CA93106.

________. (1995). Local Indicator of Spatial Association. Geographical Analysis27: 93-115.

Astutik, S , B. Rahayudi, A. Iskandar, R. Fitriani, and S. Murtini. (2011). Detection of

Spatial –Temporal Autocorrelation using Multivariate Moran and LISA Method on

Dengue Haemorrhagic Fever (DHF) Incidence, East Java, Indonesia. European

Journal of Scientific Research Vol (49:2) page 279-285.

Dinas Kesehatan Kota Surakarta. (2009). Profil Kesehatan Kota Surakarta Tahun 2008.

Surakarta.

________. (2010). Profil Kesehatan Kota Surakarta Tahun 2009. Surakarta.

________. (2011). Profil Kesehatan Kota Surakarta Tahun 2010. Surakarta.

Griffith, D. (2003). Spatial Autocorrelation Concept. Department of Geography. Syracuse

University.

Nakhapakorn, K. and Supet J. (2006). Temporal and Spatial Autocorrelation Statistics of

Dengue Fever. Dengue Buletin, Vol. 30, pp: 177-183.

Pfeiffer, D. et al. (2008). Spatial Analysis in Epidemiologi. Oxford University Press. New York.

Page 74: ANOVA UNTUK ANALISIS RATA-RATA RESPON MAHASISWA …math.fkip.uns.ac.id/wp-content/uploads/2014/06/Ruang-9.pdf · Makalah Pendamping: Matematika 3 233 ANOVA UNTUK ANALISIS RATA-RATA

Volume 2 Prosiding SNMPM Universitas Sebelas Maret 2013

306 Makalah Pendamping: Matematika 3

PENERAPAN FUZZY MODEL TAHANI

UNTUK PEMILIHAN KENDARAAN BERMOTOR RODA DUA

BERDASARKAN KRITERIA LINGUISTIK

Yosep Bungkus F. M.1)

, Lilik Linawati2)

, Tundjung Mahatma3)

1)

Mahasiswa Program Studi Matematika FSM UKSW 2),3)

DosenProgram Studi Matematika FSM UKSW

Fakultas Sains dan Matematika, Universitas Kristen Satya Wacana

Jl. Diponegoro 52-60 Salatiga 50711 1)

[email protected], 2)

[email protected], 3)

[email protected]

Abstrak

Dalam makalah ini diterapkan pemodelan data fuzzy Model Tahani untuk membantu

merekomendasikan pemilihan kendaraan bermotor roda dua dengan kriteria linguistik

terhadap data kendaraan yang memiliki spesifikasi secara pasti. Dengan menggunakan

model ini dihasilkan nilai fire strength yang menjadi dasar pembuatan rekomendasi. Tiga

kemungkinan rekomendasi yang dihasilkan yakni: tidak terdapat hasil rekomendasi,

terdapat satu hasil rekomendasi dan terdapat lebih dari satu rekomendasi kendaraan

bermotor. Ketiga kemungkinan rekomendasi ini dihasilkan berdasar pada nilai fire strength

yang diperoleh menurut kriteria linguistik tertentu.

Kata kunci : Himpunan Fuzzy, Model Tahani, Kriteria Linguistik.

PENDAHULUAN

Dalam kegiatan jual-beli suatu barang atau jasa, merepresentasi kebutuhan pelanggan

merupakan salah satu faktor penting, dimana pembeli memiliki kriteria akan barang atau jasa

yang diinginkannya. Dalam kehidupan sehari-hari kriteria yang dikemukakan pembeli sering

kali bersifat ambigu dikarenakan setiap individu pembeli memiliki persepsi yang berbeda,

sebagai contoh kriteria harga adalah mahal, murah. Kriteria seperti ini disebut sebagai kriteria

linguistik. Pada kenyataannya kriteria suatu barang biasanya dinyatakan secara pasti atau

deterministik, misalnya harga sebesar tiga belas juta rupiah. Dalam hal ini proses pengambilan

keputusan akan sulit jika seseorang menyebutkan kriteria-kriteria dalam bentuk linguistik.

Data dalam bentuk kualitatif atau linguistik dapat dikelola menggunakan konsep

himpunan fuzzy. Kriteria-kriteria seperti harga, suhu, kecepatan dalam teori himpunan fuzzy

direpresentasikan sebagai variabel fuzzy, yang mana masing-masing variabel fuzzy dinyatakan

dalam beberapa himpunan fuzzy sesuai dengan domain yang ditentukan berdasarkan data crisp.

Sebagai contoh variabel fuzzy harga dikaitkan pada himpunan fuzzy murah, sedang dan mahal

dengan batas-batas domain tertentu.

Bila terdapat beberapa kriteria linguistik dan dimiliki data spesifikasi barang dalam

bentuk crisp, maka untuk menentukan barang yang sesuai kriteria linguistik yang ditentukan,

dapat menggunakan metode pengambilan inferensi yang didasarkan pada pemodelan data fuzzy

Model Tahani. Beberapa penerapan fuzzy Model Tahani yaitu dalam pengambilan keputusan

Page 75: ANOVA UNTUK ANALISIS RATA-RATA RESPON MAHASISWA …math.fkip.uns.ac.id/wp-content/uploads/2014/06/Ruang-9.pdf · Makalah Pendamping: Matematika 3 233 ANOVA UNTUK ANALISIS RATA-RATA

Prosiding SNMPM Universitas Sebelas Maret 2013 Volume 2

Makalah Pendamping: Matematika 3 307

pembelian mobil (Eliyani, 2009) dan pengambilan keputusan pembelian handphone (Amalia,

2010).

Dalam penelitian ini dikaji bagaimana menentukan rekomendasi pemilihan suatu barang

berdasarkan kriteria linguistik terhadap sejumlah barang yang memiliki spesifikasi pasti, dalam

hal ini adalah kendaraan bermotor roda dua. Seperti diketahui bahwa terdapat banyak sekali

merk dan tipe kendaraan bermotor roda dua, yang mana masing-masing mempunyai spesifikasi

berbeda. Dengan menggunakan fuzzy Model Tahani diharapkan dapat dihasilkan suatu

keputusan atau rekomendasi jenis kendaraan yang sesuai dengan kriteria linguistik yang

ditentukan.

METODE PENELITIAN

Penelitian ini merupakan penerapan fuzzy Model Tahani untuk pemilihan kendaraan

bermotor roda dua berdasarkan kriteria linguistik yang dinyatakan sebagai variabel fuzzy dan

dikaitkan dengan himpunan fuzzy yang sesuai, didasarkan pada spesifikasi data berbagai

kendaraan bermotor roda dua yang diperoleh dari internet yang diakses pada tanggal 10

September 2013.

Landasan teori yang akan digunakan sebagai dasar pengkajian akan dipaparkan secara

singkat yaitu tentang himpunan fuzzy dan fuzzy Model Tahani.

Himpunan Fuzzy

Himpunan crisp memiliki definisi secara tegas, artinya bahwa setiap elemen dalam

himpunannya selalu dapat ditentukan secara tegas apakah ia merupakan anggota dari himpunan

atau tidak. Pada kenyataanya tidak semua himpunan terdefinisi secara tegas, misalnya himpunan

kendaraan murah. Pada himpunan kendaraan murah kita tidak dapat menyatakan secara tegas

apakah kendaraan itu murah atau tidak, sebagai contoh didefinisikan kendaraan murah memiliki

harga kurang dari atau sama dengan Rp 13.000.000,- maka kendaraan dengan harga Rp

13.150.000,- atau Rp. 15.000.000,- menurut definisi tersebut tidak termasuk kendaraan yang

murah. Namun harga Rp.13.150.000,- dapat dipandang sebagai harga yang masih murah karena

lebih dekat dengan nilai 13 juta dibanding 15 juta ke 13 juta, hal ini menimbulkan kekabur pada

arti murah. Untuk mengatasi hal ini maka Zadeh mengaitkan elemen-elemen pada himpunan

tersebut dengan suatu fungsi yang dapat menyatakan derajat kesesuaian elemen-elemen dalam

semestanya. Pada contoh di atas misalkan kendaraan seharga Rp.13.150.000,- dikaitkan dengan

suatu fungsi dan mempunyai nilai fungsi sebesar 0,2.

Misalkan dimiliki himpunan A yang dikaitkan dengan himpunan fuzzy𝐴 , maka secara

matematis himpunan fuzzy 𝐴 dalam semesta X dapat dinyatakan sebagai himpunan pasangan

terurut yang didefinisikan oleh :

𝐴 = 𝑥, 𝜇𝐴 𝑥 |𝑥 ∈ 𝑋

Page 76: ANOVA UNTUK ANALISIS RATA-RATA RESPON MAHASISWA …math.fkip.uns.ac.id/wp-content/uploads/2014/06/Ruang-9.pdf · Makalah Pendamping: Matematika 3 233 ANOVA UNTUK ANALISIS RATA-RATA

Volume 2 Prosiding SNMPM Universitas Sebelas Maret 2013

308 Makalah Pendamping: Matematika 3

Dengan 𝜇𝐴 adalah fungsi keanggotaan yang memetakan x anggota himpunan semesta X

ke selang tertutup [0,1]. Nilai 𝜇𝐴 𝑥 adalah nilai fungsi keanggotaan dari x, yang disebut juga

sebagai derajat keanggotaan (Susilo, 2003).

Terdapat beberapa fungsi keanggotaan dalam himpunan fuzzy, di antaranya adalah:

fungsi keanggotaan linear seperti direpresentasikan pada Gambar 1. dan fungsi keanggotaan

segitiga seperti direpresentasikan pada Gambar 2. (Kusumadewi, 2004). Gambar 1.(a)

merepresentasikan fungsi keanggotaan fuzzylinearnaik danGambar 1.(b) menyatakan fungsi

linear turun.

(a) (b)

Gambar 1. Representasi Fungsi Keanggotaan FuzzyLinear.

Rumus fungsi keanggotaan linear naik dinyatakan seperti pada persamaan (1),

sedangkan fungsi keanggotaan linear turun dinyatakan seperti pada persamaan (2).

𝜇 𝑥 =

0; 𝑥 ≤ 𝑎𝑥−𝑎

𝑏−𝑎; 𝑎 ≤ 𝑥 ≤ 𝑏

1; 𝑥 ≥ 𝑏

(1)

𝜇 𝑥 =

1; 𝑥 ≤ 𝑎𝑏−𝑥

𝑏−𝑎; 𝑎 ≤ 𝑥 ≤ 𝑏

0; 𝑥 ≥ 𝑏

(2)

Page 77: ANOVA UNTUK ANALISIS RATA-RATA RESPON MAHASISWA …math.fkip.uns.ac.id/wp-content/uploads/2014/06/Ruang-9.pdf · Makalah Pendamping: Matematika 3 233 ANOVA UNTUK ANALISIS RATA-RATA

Prosiding SNMPM Universitas Sebelas Maret 2013 Volume 2

Makalah Pendamping: Matematika 3 309

Fungsi segitiga direpresentasikan seperti pada Gambar 2. dengan rumus fungsinya

dinyatakan sebagai persamaan (3). Fungsi keanggotaan fuzzy ini merupakan gabungan dari

fungsi keanggotaan linear naik danfungsi keanggotaan linear turun.

Gambar 2. Representasi Fungsi Keanggotaan Fuzzy Segitiga.

𝜇 𝑥 =

0; 𝑥 ≤ 𝑎 𝑎𝑡𝑎𝑢 𝑥 ≥ 𝑏𝑥−𝑎

𝑏−𝑎; 𝑎 ≤ 𝑥 ≤ 𝑏

𝑐−𝑥

𝑐−𝑏; 𝑏 ≤ 𝑥 ≤ 𝑐

(3)

Operasi Himpunan Fuzzy

Terdapat tiga operasi dasar untuk mengkombinasikan dan memodifikasi beberapa

himpunan fuzzy yang dikemukakan oleh Zadeh. Operasi tersebut adalah komplemen pada suatu

himpunan fuzzy serta gabungan dan irisan pada himpunan-himpunan fuzzy (Wang,1997).

Operasi komplemen pada suatu himpunan fuzzy𝐴 , hasilnya dinyatakan sebagai

himpunan fuzzy 𝐴 ′dengan fungsi keanggotaan seperti persamaan (4).

𝜇𝐴 ′ 𝑥 = 1 − 𝜇𝐴 𝑥 (4)

Operasi gabungan antara dua himpunan fuzzy𝐴 dan himpunan fuzzy𝐵 yang ditulis 𝐴 ∪

𝐵 dengan fungsi keanggotaan seperti persamaan (5).

𝜇𝐴 ∪𝐵 𝑥 = 𝑚𝑎𝑥 𝜇𝐴 𝑥 , 𝜇𝐵 𝑥 (5)

Operasi irisan antara dua himpunan fuzzy𝐴 dan himpunan fuzzy𝐵 yang ditulis 𝐴 ∩

𝐵 dengan fungsi keanggotaan seperti persamaan (6).

𝜇𝐴 ∩𝐵 𝑥 = 𝑚𝑖𝑛 𝜇𝐴 𝑥 ,𝜇𝐵 𝑥 (6)

Fuzzy Model Tahani

Fuzzy Model Tahani dideskripsikan sebagai suatu model yang digunakan untuk

memproses pencarian data, hanya saja model ini didasarkan pada operasi-operasi dalam teori

himpunan fuzzy untuk mendapatkan informasi yang sesuai dengan kriteria pencarian datanya,

sehingga fuzzy Model Tahani sangat tepat digunakan dalam proses pencarian data yang akurat

(Bojadziev, 2007). Dalam pencarian data, fuzzy Model Tahani menggunakan nilai fire strength

Page 78: ANOVA UNTUK ANALISIS RATA-RATA RESPON MAHASISWA …math.fkip.uns.ac.id/wp-content/uploads/2014/06/Ruang-9.pdf · Makalah Pendamping: Matematika 3 233 ANOVA UNTUK ANALISIS RATA-RATA

Volume 2 Prosiding SNMPM Universitas Sebelas Maret 2013

310 Makalah Pendamping: Matematika 3

sebagai dasar pengambilan keputusan. Nilai fire strength merupakan nilai derajat keanggotaan

hasil dari operasi-operasi himpunan fuzzy, sehingganilai fire strength berada pada interval [0,1].

Sebagai contoh, seseorang ingin memilih kendaraan bermotor roda dua dengan kriteria :

“harga murah dan kapasitas silinder besar, atau panjang-kendaraan pendek dan harga sedang”.

Maka berdasarkan kriteria tersebut dibentuk himpunan fuzzy hasil operasi dari masing-masing

himpunan fuzzy dengan fungsi keanggotaannya seperti dibawah ini :

𝜇𝐾𝑟𝑖𝑡𝑒𝑟𝑖𝑎 = 𝜇𝐻𝑎𝑟𝑔𝑎𝑀𝑈𝑅𝐴𝐻 ∩ 𝑆𝑖𝑙𝑖𝑛𝑑𝑒𝑟𝐵𝐸𝑆𝐴𝑅 ∪ 𝜇𝑃𝑎𝑛𝑗𝑎𝑛𝑔𝑃𝐸𝑁𝐷𝐸𝐾 ∩ 𝐻𝑎𝑟𝑔𝑎𝑆𝐸𝐷𝐴𝑁𝐺

Dengan fungsi keanggotaan diatas untuk mendapatkan nilai fire strength untuk setiap

kendaraan dapat dicari dengan rumus dibawah ini :

𝜇𝐾𝑟𝑖𝑡𝑒𝑟𝑖𝑎 𝑥

= 𝑚𝑎𝑥 𝑚𝑖𝑛 𝜇𝐻𝑎𝑟𝑔𝑎𝑀𝑈𝑅𝐴𝐻 𝑥 ,𝜇𝑆𝑖𝑙𝑖𝑛𝑑𝑒𝑟𝐵𝐸𝑆𝐴𝑅 𝑥 , 𝑚𝑖𝑛 𝜇𝑃𝑎𝑛𝑗𝑎𝑛𝑔𝑃𝐸𝑁𝐷𝐸𝐾 𝑥 ,𝜇𝐻𝑎𝑟𝑔𝑎𝑆𝐸𝐷𝐴𝑁𝐺 𝑥

Kendaraan roda dua yang mempunyai nilai fire strength lebih besar dari 0 merupakan

kendaraan roda dua yang direkomendasikan karena memenuhi kriteria linguistik yang

diinginkan.

Data

Dalam penelitian ini dikaji data 17 kendaraan bermotor roda dua dari berbagai merk dan

tipe yang dinyatakan sebagai kode A, B, C, dst. Variabel- variabel fuzzy yang digunakan sebagai

kriteria adalah harga, kapasitas-silinder, panjang-kendaraan, volume-tangki-bbm dan jarak-

mesin-ke-tanah. Data tersaji pada Tabel 1.

Tabel 1. Spesifikasi Kendaraan Bermotor Roda Dua *

No. Kode Harga

(Jutaan Rupiah)

Kapasitas

Silinder

(cc)

Panjang

(mm)

Tangki Bahan

Bakar (lt)

Jarak Mesin

ke Tanah

(mm)

1 A 13.125 109 1919 3.7 135

2 B 13.150 108 1863 3.7 140

3 C 22.750 150 2008 12 148

4 D 17.300 124 1923 4.1 130

5 E 17.500 134 1960 4 140

6 F 19.850 149 2050 12 152

7 G 24.000 149 2000 12 167

8 H 12.550 113 1850 3.5 135

9 I 18.875 147 1945 4.2 140

10 J 15.250 124 1895 4.1 135

11 K 12.450 113 1910 4 145

12 L 13.715 124 1900 4 155

Page 79: ANOVA UNTUK ANALISIS RATA-RATA RESPON MAHASISWA …math.fkip.uns.ac.id/wp-content/uploads/2014/06/Ruang-9.pdf · Makalah Pendamping: Matematika 3 233 ANOVA UNTUK ANALISIS RATA-RATA

Prosiding SNMPM Universitas Sebelas Maret 2013 Volume 2

Makalah Pendamping: Matematika 3 311

13 M 11.900 113 1930 4.3 140

14 N 14.650 125 1889 3.7 138

15 O 15.550 125 1918 5.5 128

16 P 17.150 150 2056 12.2 156

17 Q 15.000 113 1880 4.8 152

Keterangan :* Data diambil dari berbagai sumber di internet yang diakses pada 10 September

2013.

Langkah-Langkah Pengolahan Data

Berikut disajikan langkah-langkah pengolahan data kendaraan bermotor roda dua

berdasarkan fuzzy Model Tahani.

1. Penentuan variabel dan himpunan fuzzy serta fungsi keanggotaannya.

Variabel fuzzy yang digunakan sebagai kriteria pemilihan, yaitu harga, kapasitas silinder,

panjang, tangki bahan bakar dan jarak mesin ke tanah. Pada setiap variabel fuzzy ditentukan

3 himpunan fuzzy yang akan digunakan sebagai nilai kriteria linguistiknya. Pada setiap

himpunan fuzzy ditentukan pula fungsi keanggotaannya. Tabel 2. menyajikan daftar variabel

fuzzy, himpunan fuzzy dan fugsi keanggotaan masing-masing himpunan yang digunakan

sebagai dasar pengolahan data.

2. Perhitungan nilai keanggotaan setiap himpunan.

Menggunakan fungsi keanggotaan yang telah ditentukan pada Tabel 2, setiap nilai x yang

merupakan data crisp pada masing-masing variabel fuzzy terkait dipetakan menjadi derajat

keanggotaan (𝜇 𝑥 ). Misalkan motor J dengan variabel fuzzy harga dimana nilai x adalah

Rp15.250.000,- maka derajat keanggotaan pada himpunan fuzzy murah dengan

menggunakan fungsi keanggotaan pada persamaan (1) didapat hasil 0.21.

Tabel 2. Daftar Variabel Fuzzy, Himpunan Fuzzy dan Fungsi Keanggotaannya.

Variabel Himpunan Fungsi Keanggotaan

Harga

MURAH Linear Naik

SEDANG Segitiga

MAHAL Linear Turun

Kapasitas Silinder

KECIL Linear Naik

SEDANG Segitiga

BESAR Linear Turun

Panjang Kendaraan

PENDEK Linear Naik

SEDANG Segitiga

PANJANG Linear Turun

Page 80: ANOVA UNTUK ANALISIS RATA-RATA RESPON MAHASISWA …math.fkip.uns.ac.id/wp-content/uploads/2014/06/Ruang-9.pdf · Makalah Pendamping: Matematika 3 233 ANOVA UNTUK ANALISIS RATA-RATA

Volume 2 Prosiding SNMPM Universitas Sebelas Maret 2013

312 Makalah Pendamping: Matematika 3

Volume Tangki

SEDIKIT Linear Naik

SEDANG Segitiga

BANYAK Linear Turun

Jarak Mesin ke Tanah

PENDEK Linear Naik

SEDANG Segitiga

PANJANG Linear Turun

3. Penyusunan kriteria.

Kriteria linguistik sering kali memuat kata penghubung “atau” dan “dan”. Kata “atau”

dikaitkan dengan operasi gabungan pada himpunan fuzzy, “dan” dikaitkan dengan operasi

irisan pada himpunan fuzzy. Data crisp pada setiap kriteria (x) dipetakan sesuai dengan

fungsi keanggotaan pada variabel dan himpunan fuzzynya seperti pada Tabel 2, sehingga

setiap data akan diperoleh derajat keanggotaannya. Kriteria pemilihan disusun berdasarkan

kombinasi operasi-operasi antara himpunan-himpunan fuzzy dan variabelnya, sehingga

banyaknya kriteria yang terbentuk bergantung pada banyaknya variabel fuzzy yang

digunakan dan himpunan fuzzy masing-masing variabelnya. Pada penelitian ini terdapat

sebanyak lima variabel fuzzy dan setiap variabel fuzzy mempunyai tiga himpunan fuzzy

ditambah kemungkinan tidak memilih satupun himpunan fuzzy pada variabel tersebut,

sehingga setiap variabel fuzzy memiliki 4 kemungkinan dipilih. Jadi, banyaknya kombinasi

pilihan dari kelima variabel fuzzy tersebut adalah 45 = 512 kombinasi pilihan.

4. Penentuan nilai fire stregth.

Pada tahap ini kriteria yang dinyatakan dalam variabel dan himpunan fuzzy akan diolah

dengan menggunakan operasi himpunan fuzzy gabungan dan irisan. Dengan rumus seperti

pada persamaan (5) dan (6) atau kombinasi dari keduanya.

5. Penentuan hasil rekomendasi.

Nilai fire strength yang diperoleh pada langkah sebelumnya akan menjadi dasar

pengambilan keputusan rekomendasi. Kendaraan dengan nilai fire strength lebih besar dari 0

(nol) merupakan kendaraan yang direkomendasikan. Apabila terdapat beberapa kendaraan

dengan nilai fire strength lebih besar dari 0 (nol), maka kendaraan dengan fire strength

terbesar merupakan hasil rekomendasi terbaik.

HASIL PENELITIAN DAN PEMBAHASAN

Berdasarkan Tabel 1. dan Tabel 2. serta menerapkan persamaan (1), (2) dan (3)

diperoleh derajat keanggotaan untuk setiap himpunan fuzzy yang tampak pada Tabel 3.

Kriteria pemilihan kendaraan bermotor roda dua ini sangat bervariasi yaitu diantara 512

kombinasi kriteria. Pada penelitian diambil beberapa beberapa contoh kriteria sebagai

penerapannya, yaitu sebagai berikut :

Page 81: ANOVA UNTUK ANALISIS RATA-RATA RESPON MAHASISWA …math.fkip.uns.ac.id/wp-content/uploads/2014/06/Ruang-9.pdf · Makalah Pendamping: Matematika 3 233 ANOVA UNTUK ANALISIS RATA-RATA

Prosiding SNMPM Universitas Sebelas Maret 2013 Volume 2

Makalah Pendamping: Matematika 3 313

a. Kriteria-1 = Diinginkan kendaraan yang harganya mahal dan kapasitas-silindernya

kecil.

b. Kriteria-2 = Diinginkan kendaraan yang harganya murah dan volume-tangki-bbm

banyak atau panjang-kendaraan sedang dan jarak-mesin-ke-tanah panjang.

Tabel 3. Derajat Keanggotaan Setiap Kendaraan menurut Variabel dan Himpunan Fuzzynya.

Kode Harga (Rp) Kapasitas Silinder (cc) Panjang Kendaraan (mm) Volume Tangki Bahan Bakar (lt) Jarak Mesin ke Tanah (mm)

Murah Sedang Mahal Kecil Sedang Besar Pendek Sedang Panjang Sedikit Sedang Banyak Pendek Sedang Panjang

A 0.71 0.29 0.00 0.95 0.05 0.00 0.19 0.81 0.00 0.92 0.08 0.00 0.54 0.46 0.00

B 0.71 0.29 0.00 1.00 0.00 0.00 0.85 0.15 0.00 0.92 0.08 0.00 0.22 0.78 0.00

C 0.00 0.16 0.84 0.00 0.00 1.00 0.00 0.40 0.60 0.00 0.03 0.97 0.00 0.80 0.20

D 0.00 0.85 0.15 0.19 0.81 0.00 0.14 0.86 0.00 0.76 0.24 0.00 0.87 0.13 0.00

E 0.00 0.83 0.17 0.00 0.72 0.28 0.00 0.79 0.21 0.80 0.20 0.00 0.22 0.78 0.00

F 0.00 0.53 0.47 0.00 0.04 0.96 0.00 0.05 0.95 0.00 0.03 0.97 0.00 0.63 0.37

G 0.00 0.00 1.00 0.00 0.04 0.96 0.00 0.46 0.54 0.00 0.03 0.97 0.00 0.00 1.00

H 0.85 0.15 0.00 0.75 0.25 0.00 1.00 0.00 0.00 1.00 0.00 0.00 0.54 0.46 0.00

I 0.00 0.65 0.35 0.00 0.13 0.87 0.00 0.92 0.08 0.72 0.28 0.00 0.22 0.78 0.00

J 0.21 0.79 0.00 0.19 0.81 0.00 0.47 0.53 0.00 0.76 0.24 0.00 0.54 0.46 0.00

K 0.87 0.13 0.00 0.75 0.25 0.00 0.29 0.71 0.00 0.80 0.20 0.00 0.00 0.93 0.07

L 0.57 0.43 0.00 0.19 0.81 0.00 0.41 0.59 0.00 0.80 0.20 0.00 0.00 0.51 0.49

M 1.00 0.00 0.00 0.75 0.25 0.00 0.06 0.94 0.00 0.68 0.32 0.00 0.22 0.78 0.00

N 0.35 0.65 0.00 0.13 0.87 0.00 0.54 0.46 0.00 0.92 0.08 0.00 0.35 0.65 0.00

O 0.14 0.86 0.00 0.13 0.87 0.00 0.20 0.80 0.00 0.20 0.80 0.00 1.00 0.00 0.00

P 0.00 0.87 0.13 0.00 0.00 1.00 0.00 0.00 1.00 0.00 0.00 1.00 0.00 0.46 0.54

Q 0.27 0.73 0.00 0.75 0.25 0.00 0.65 0.35 0.00 0.48 0.52 0.00 0.00 0.63 0.37

Berdasarkan Kriteria-1 dan Kriteria-2 dibentuk fungsi keanggotaan dari kombinasi

operasi himpunan fuzzy yang sesuai, yaitu :

a. 𝜇𝐾𝑟𝑖𝑡𝑒𝑟𝑖𝑎 1 𝑥 = 𝑚𝑖𝑛 𝜇𝐻𝑎𝑟𝑔𝑎𝑀𝐴𝐻𝐴𝐿 𝑥 ,𝜇𝑆𝑖𝑙𝑖𝑛𝑑𝑒𝑟𝐾𝐸𝐶𝐼𝐿 𝑥

b. 𝜇𝐾𝑟𝑖𝑡𝑒𝑟𝑖𝑎 2 𝑥 =

𝑚𝑎𝑥 min 𝜇𝐻𝑎𝑟𝑔𝑎𝑀𝑈𝑅𝐴𝐻 𝑥 ,𝜇𝑇𝑎𝑛𝑔𝑘𝑖𝐵𝐴𝑁𝑌𝐴𝐾 𝑥 , min 𝜇𝑃𝑎𝑛𝑗𝑎𝑛𝑔𝑆𝐸𝐷𝐴𝑁𝐺 𝑥 ,𝜇𝐽𝑎𝑟𝑎𝑘𝑃𝐴𝑁𝐽𝐴𝑁𝐺 𝑥

Nilai fire strength untuk Kriteria-1 disajikan pada Tabel 4, hanya terdapat satu nilai fire

strength yang lebih besar dari 0 (nol), yaitu bernilai 0.15 yang merupakan kode kendaraan D.

Jadi kendaraan yang direkomendasikan sesuai dengan Kriteria-1 adalah kendaran D.

Tabel 4. Nilai Fire strength untuk Kriteria-1.

Kode

Derajat Keanggotaan Nilai Fire Strength

HargaMAHAL SilinderKECIL HargaMAHAL ∩

SilinderKECIL

D 0.15 0.19 0.15

A 0.00 0.95 0.00

B 0.00 1.00 0.00

C 0.84 0.00 0.00

E 0.17 0.00 0.00

F 0.47 0.00 0.00

G 1.00 0.00 0.00

Page 82: ANOVA UNTUK ANALISIS RATA-RATA RESPON MAHASISWA …math.fkip.uns.ac.id/wp-content/uploads/2014/06/Ruang-9.pdf · Makalah Pendamping: Matematika 3 233 ANOVA UNTUK ANALISIS RATA-RATA

Volume 2 Prosiding SNMPM Universitas Sebelas Maret 2013

314 Makalah Pendamping: Matematika 3

H 0.00 0.75 0.00

I 0.35 0.00 0.00

J 0.00 0.19 0.00

K 0.00 0.75 0.00

L 0.00 0.19 0.00

M 0.00 0.75 0.00

N 0.00 0.13 0.00

O 0.00 0.13 0.00

P 0.13 0.00 0.00

Q 0.00 0.75 0.00

Tabel 5. Nilai fire strength untuk Kriteria-2.

Kode

Nilai Keanggotaan Nilai Fire Strength

HargaMURAH

(a1)

TangkiBANYAK

(a2)

PanjangSEDANG

(b1)

JarakPANJANG

(b2)

a1

a2

b1

b2

(a1 ∩

a2) ∩

(b1 ∩

b2)

L 0.57 0.00 0.59 0.49 0.00 0.49 0.49

G 0.00 0.97 0.46 1.00 0.00 0.46 0.46

Q 0.27 0.00 0.35 0.37 0.00 0.35 0.35

C 0.00 0.97 0.40 0.20 0.00 0.20 0.20

K 0.87 0.00 0.71 0.07 0.00 0.07 0.07

F 0.00 0.97 0.05 0.37 0.00 0.05 0.05

A 0.71 0.00 0.81 0.00 0.00 0.00 0.00

B 0.71 0.00 0.15 0.00 0.00 0.00 0.00

D 0.00 0.00 0.86 0.00 0.00 0.00 0.00

E 0.00 0.00 0.79 0.00 0.00 0.00 0.00

H 0.85 0.00 0.00 0.00 0.00 0.00 0.00

I 0.00 0.00 0.92 0.00 0.00 0.00 0.00

J 0.21 0.00 0.53 0.00 0.00 0.00 0.00

M 1.00 0.00 0.94 0.00 0.00 0.00 0.00

N 0.35 0.00 0.46 0.00 0.00 0.00 0.00

O 0.14 0.00 0.80 0.00 0.00 0.00 0.00

P 0.00 1.00 0.00 0.54 0.00 0.00 0.00

Hasil nilai fire strength untuk Kriteria-2 dapat dilihat pada Tabel 5. Kombinasi kriteria

harga murah dan volume-tangki-bbm banyak memberikan hasil semua nilai fire strength sama

dengan 0 (nol), seperti terlihat pada kolom-6 Tabel 5. Hal ini berarti tidak ada kendaraan yang

direkomendasikan untuk kriteria tersebut. Sedangkan untuk Kriteria-2, terdapat enam nilai fire

strength yang lebih besar dari 0 (nol), yaitu bernilai : 0.05, 0.07, 0.20, 0.35, 0.46, 0.49 pada

kode kendaraan : F, K, C, Q, G, L , ini berarti 6 kendaraan tersebut memenuhi Kriteria-2 .

Page 83: ANOVA UNTUK ANALISIS RATA-RATA RESPON MAHASISWA …math.fkip.uns.ac.id/wp-content/uploads/2014/06/Ruang-9.pdf · Makalah Pendamping: Matematika 3 233 ANOVA UNTUK ANALISIS RATA-RATA

Prosiding SNMPM Universitas Sebelas Maret 2013 Volume 2

Makalah Pendamping: Matematika 3 315

Kendaraan dengan fire strength terbesar, yaitu 0.49 untuk kode kendaraan L merupakan

kendaraan yang mendapat rekomendasi terbaik untuk Kriteria-2.

SIMPULAN DAN SARAN

Dari pembahasan diatas dapat diambil simpulan bahwa penerapan fuzzy model Tahani

untuk kendaraan bermotor roda dua terdapat tiga kemungkinan hasil rekomendasi, yaitu tidak

ada hasil rekomendasi, terdapat satu hasil rekomendasi atau terdapat lebih dari satu rekomendasi

kendaraan bermotor yang dipilih. Apabila terdapat lebih dari satu hasil rekomendasi, maka

kendaraan bermotor roda dua yang mempunyai nilai fire strength tertinggi merupakan

rekomendasi terbaik.

Kemungkinan kriteria pemilihan kendaraan bermotor roda dua dapat berkembang

sesuai dengan variabel dan himpunan fuzzy yang dirumuskan, serta banyaknya jenis dan tipe

kendaraannya, maka perlu adanya pengembangan pada pengelolaan dan pengolahan datanya

dengan memanfaatkan basisdata dan aplikasi yang berbasis pada basisdata, agar proses

pengolahan datanya dapat lebih cepat dan efisien.

DAFTAR PUSTAKA

Amalia, L. 2010. Model Fuzzy Tahani Untuk Pemodelan Sistem Pendukung Keputusan (SPK).

Seminar Nasional Aplikasi Teknologi Informasi 2010, Yogyakarta.

Eliyani. 2009. Decision Support System Untuk Pembelian Mobil Menggunakan Fuzzy Database

Model Tahani. Seminar Nasional Aplikasi Teknologi Informasi 2009., Yogyakarta.

Bojadziev, M & Bojadziev, G. 2007. Fuzzy Logic for Business, Finance, and Management 2nd

Edition.,World Scientific. Singapore.

Kusumadewi, S & Purnomo, H. 2004. Aplikasi Logika Fuzzy Untuk Pendukung

Keputusan.,Graha Ilmu. Yogyakarta.

Susilo, F. 2003. Penghantar Himpunan & Logika Kabur Serta Aplikasinya. Universitas Sanata

Dharma. Yogyakarta.

Wang, L-X. 1997. A Course in Fuzzy System and Control., Prentice Hall Internasional.

Amerika.

http://www.suzuki.co.id/suzuki_motorcycle.htm. Diakses tanggal 10 September 2013.

http://www.suzuki.co.id/suzuki_motorcycle.htm. Diakses tanggal 10 September 2013.

http://www.suzuki.co.id/suzuki_motorcycle.htm. Diakses tanggal 10 September 2013.