cat rrad - unismuh

242

Upload: others

Post on 28-Nov-2021

12 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: CAT RRAD - Unismuh
Page 2: CAT RRAD - Unismuh
Page 3: CAT RRAD - Unismuh

ii

ABSTRAK

RUKLI: Pengembangan Computerized Adaptive Testing dengan Metode Futsuhilow,

Fusuhilow, dan Fumahilow. Disertasi. Yogyakarta: Program Pascasarjana

Universitas Negeri Yogyakarta, 2012.

Penelitian ini bertujuan untuk: (1) pengembangan model Computerized

Adaptive Testing (CAT) yang disebut CerdasCAT dengan metode Futsuhilow,

Fusuhilow, dan Fumahilow berdasarkan model Rasch; (2) menerapkan model CAT

untuk menghasilkan kemampuan peserta tes, panjang tes, tingkat exposure butir soal,

galat baku penaksiran parameter kemampuan, dan waktu respon butir soal; (3)

menemukan prosedur penerapan DSS dalam CAT; dan (4) menerapkan DSS dalam

model CAT untuk menghasilkan laporan kelulusan peserta tes.

Penelitian ini menggunakan model Revised of Rapid Application Development

(RRAD) melalui enam tahap yaitu pemodelan bisnis, pemodelan data, pemodelan

proses, pembentukan aplikasi, pengujian, dan diseminasi. Uji coba CerdasCAT

dilakukan secara simulasi dan pengujian secara terbatas di sekolah dasar. Uji coba

melibatkan dua sekolah dengan menggunakan purposive sampling. Peserta tes dipilih

secara acak dari dua sekolah tersebut sebanyak 90, kemudian peserta tes tersebut

dikelompokkan secara acak ke dalam tiga kelas, yaitu: kelas Futsuhilow sebanyak 30

peserta tes, kelas Fusuhilow sebanyak 30 peserta tes, dan kelas Fumahilow sebanyak 30

peserta tes. Butir soal berasal dari Ujian Nasional Sekolah Dasar. Jumlah butir soal

tersebut sebanyak 240 butir.

Hasil penelitian menunjukkan sebagai berikut. Pertama, CerdasCAT

memberikan butir soal adaptif terhadap kemampuan peserta tes dalam menghasilkan

panjang tes, tingkat exposure butir soal, galat baku penaksiran parameter kemampuan,

dan waktu respon butir soal secara optimal. Kedua, metode Fusuhilow memiliki

panjang tes yang paling pendek. Metode Fumahilow memiliki tingkat exposure butir

soal yang paling kecil. Metode Futsuhilow memiliki rerata galat baku penaksiran

parameter kemampuan yang paling kecil dan memiliki rerata waktu respon butir soal

yang paling kecil. Ketiga, CerdasCAT menghasilkan kemampuan peserta tes.

Pengolahan data tersebut menggunakan prosedur DSS, yakni pembobotan SKL,

pembobotan domain, dan pembobotan kriteria penilaian dalam batasan kuota

maksimum dan skor minimum. Keempat, penerapan DSS pada CerdasCAT

memberikan informasi yang sesuai dengan kriteria user dalam menentukan peserta tes

yang lulus ujian.

Keywords: CAT, model Rasch, Futsuhilow, Fusuhilow, Fumahilow

Page 4: CAT RRAD - Unismuh

iii

ABSTRACT

RUKLI: The Development of Computerized Adaptive Testing by the Futsuhilow,

Fusuhilow, and Fumahilow Methods. Dissertation. Yogyakarta: Graduate School,

Yogyakarta State University, 2012.

This study aims to: (1) develop Computerized Adaptive Testing (CAT) model

called CerdasCAT by Futsuhilow, Fusuhilow, and Fumahilow methods based on

Rasch models; (2) apply the CAT model to obtain examinees’ ability, test lengths,

item exposure levels, standard errors of ability parameter estimates, and item response

time; (3) find the application procedure of DSS in the CAT; and (4) apply DSS in

CAT models to obtain graduation reports of the examinees.

This study used a model of Revised Rapid Application Development (RRAD)

through eight stages of business modeling, data modeling, process modeling,

application creation, testing, and dissemination. CerdasCAT tryouts were conducted

in simulation and testing on a limited basis in primary schools. The tryouts involved

two schools selected using the purposive sampling technique. The examinees were

randomly selected from two schools as many as 90, and then they were grouped

randomly into three classes, namely the class for Futsuhilow consisting of 30

examinees, the class for Fusuhilow consisting of 30 examinees, and the class for

Fumahilow consisting of 30 examinees. The items were taken from of the Primary

School National Examination. The total number of items was 240.

The results of the research are as follows. First, the CerdasCAT model gives

adaptive items to obtain examinees’ ability, test lengths, item exposure levels,

standard errors of ability parameter estimates, and item response time maximally.

Second, the Fusuhilow method has the shortest test length. The Fumahilow method

has the lowest item exposure level. The Futsuhilow method has the smallest mean of

standard errors of the ability parameter estimate and has the shortest item response

time. Third, CerdasCAT produces examinees’ ability. The data processing procedures

use DSS, namely the weighting of SKL, the weighting of domain, and the weighting

of assessment criteria in terms of maximum quota and minimum scores. Fourth, the

DSS implementation in CAT model provides information relevant to users’ criteria in

determining which examinees pass the exam.

Keywords: CAT, Rasch models, Futsuhilow, Fusuhilow, Fumahilow

Page 5: CAT RRAD - Unismuh

iv

Page 6: CAT RRAD - Unismuh
Page 7: CAT RRAD - Unismuh
Page 8: CAT RRAD - Unismuh

vi

KATA PENGANTAR

Alhamdulillah, penulisan disertasi dengan judul Pengembangan Computerized

Adaptive Testing dengan Metode Futsuhilow, Fusuhilow, dan Fumahilow telah

diselesaikan oleh penulis dengan melibatkan bantuan dari berbagai pihak. Oleh karena

itu, penulis menyampaikan ucapan terima kasih dan penghargaan setinggi-tingginya

kepada:

1. Orang tua, mertua, dan keluarga besar penulis di Soppeng-Makassar dan Dago-

Bandung yang telah memberikan segalanya selama perkuliahan dalam

mendampingi keluarga saya dengan bantuan, doa, dan kasih sayang.

2. Istriku tercinta sebagai belahan hatiku, Ati Dwi Septawati, Drg serta ketiga anakku

sebagai mutiaraku Moh. Adli Akbar, Moh. Habibi Akbar, dan Moh. Dliyaul Haq

yang telah memberikan segalanya baik perhatian, pengorbanan, doa, cinta, harta,

dukungan semangat, dan jiwa.

3. Tim promotor yang terdiri atas Bastari Ed.D. dan Prof. Kumaidi, Ph.D. yang telah

meluangkan banyak waktu, tenaga, dan pikiran dalam mendampingi dan

membimbing penulis dengan penuh kecermatan, ketelitian, memberi pengarahan,

koreksi, dan saran konstruktif bagi kesempurnaan penyelesaian disertasi.

4. Rektor Universitas Negeri Yogyakarta dan Direktur Program Pascasarjana UNY

beserta para dosen dan staf yang telah memberikan pelayanan dan bantuan

maksimal.

5. Prof. Djemari Mardapi, Ph. D., sebagai ketua Program Studi PEP pada PPS UNY

dan penguji proposal disertasi yang selalu memberi motivasi, semangat, dan

petunjuk agar supaya cepat selesai sejak program Magister tahun 1995 sampai

program Doktor.

6. Dewan Penguji proposal disertasi dan Dewan Penguji Ujian Tertutup yang telah

memberikan arahan dan koreksi dalam melakukan persiapan penelitian agar lebih

terarah dan lancar saat di lapangan serta mengoreksi hasil penelitian secara akurat.

7. Reviewer, Herman Dwi Surjono, Ph. D yang telah mengoreksi laporan penelitian

disertasi dan menguji coba produk cerdasCAT secara akurat dengan berbagai

masukan bagi penyempurnaan produk tersebut di masa depan.

Page 9: CAT RRAD - Unismuh

vii

8. Validator Expert, Dra. Sri Hartati, M.Sc., Ph.D. dan Dra. Ermatita, M. Kom. yang

telah melakukan validasi produk CerdasCAT secara akurat.

9. Koordinator Kopertis Wilayah IX Sulawesi memberikan ijin melanjutkan studi

Program Doktor di Universtas Negeri Yogyakarta.

10. Ketua Yayasan Lamappapoleonro Soppeng beserta keluarga yang telah

memberikan ijin, bantuan dana, dorongan, dan doa selama kuliah.

11. Dinas Pendidikan Propinsi Sulawesi Selatan yang telah memberikan kesempatan

kepada penulis untuk mengambil data penelitian.

12. Pimpinan proyek BPPS dan Proyek Hibah Program Doktor 2011 Direktorat

Jenderal Pendidikan Tinggi Kementerian Pendidikan Nasional yang telah

memberikan bantuan beasiswa dan bantuan hibah doktor yang sangat mendukung

program S3 saya.

13. Para kepala sekolah, guru, staf (admin), murid kelas VI, dan orang tua murid yang

telah membantu terselenggaranya ujicoba produk CerdasCAT di lapangan.

14. Civitas akademika AMIK, STMIK, dan STIE Lamappapoleonro Soppeng atas

dukungan dan doanya.

15. Rekan-rekan mahasiswa Program Doktor Universitas Negeri Yogyakarta yang telah

membantu dalam mengoreksi disertasi penulis.

16. Keluarga besar Ikatan Mahasiswa Pelajar Soppeng dan Angin Mamiri Sulawesi

Selatan, khususnya Kakak Drs. Muh. Safar Natsir, M.Si. beserta keluarga yang

telah memberi bantuan, nasehat, dan doa.

17. Semua pihak yang terlibat dalam proses penyelesaian dan penulisan disertasi ini.

Semoga bantuan, arahan, bimbingan, koreksi, nasehat, dorongan, masukan,

dan doa serta perhatian yang telah diberikan selama ini bernilai ibadah disisiNya,

Amien yaa Rabbal Alamien. Wasalam.

Yogyakarta, 2012

R u k l i

Page 10: CAT RRAD - Unismuh

ix

DAFTAR ISI

HALAMAN JUDUL ………………………………………………………….

ABSTRAK …………………………………………………………………….

ABSTRACT …………………………………………………………………..

LEMBAR PENGESAHAN ……………………………………………………

PERNYATAAN KEASLIAN ………………………………………………..

KATA PENGANTAR ………………………………………………………...

HALAMAN MOTTO ………………………………………………………..

DAFTAR ISI …………………………………………………………………..

DAFTAR TABEL ……………………………………………………………

DAFTAR GAMBAR …………………………………………………………

DAFTAR PERSAMAAN ……………………………………………………..

DAFTAR LAMPIRAN ……………………………………………………….

BAB I PENDAHULUAN ……………………………………………………..

A. Latar Belakang ………..…………………………………………….

B. Identifikasi Masalah Penelitian …………………………………......

C. Pembatasan Masalah Penelitian …………………………………….

D. Perumusan Masalah Penelitian …………………………………......

E. Tujuan Penelitian …………………………………………………...

F. Spesifikasi Produk yang Dikembangkan …………………………..

G. Manfaat Penelitian ………………………………………………….

H. Asumsi dan Keterbatasan Pengembangan Produk …………………

BAB II STUDI PUSTAKA …………………………………………………..

A. Kajian Butir Soal …..……………………………………………...

1. Teori Tes Klasik ……………………………………………...

2. Model Pengukuran Rasch ……………………………………..

B. Metode Penaksiran ……………………………………………….

1. Metode MLE dan Bayesian ……………………………………

2. Metode High Low …………………………………………….

3. Metode Heuristik ………………………………………………

4. Logika Fuzzy ………………………………………………….

5. Fuzzy pada Karakteristik Soal dan Basis Pengetahuan ………..

C. Sistem Penalaran Fuzzy ...................................................................

1. Metode Fuzzy Tsukamoto ……………………………………..

2. Metode Fuzzy Sugeno …………………………………………

3. Metode Fuzzy Mamdani ……………………………………….

D. Kriteria Pengembangan CAT ………………………………………

1. Panjang Tes …………………………………………………….

2. Tingkat Exposure Butir Soal …………………………………..

3. Galat Baku Penaksiran Parameter Kemampuan ………………

4. Waktu Respon Butir Soal ……………………………………...

E. Decision Support System (DSS) …………………………………...

Halaman

i

ii

iii

iv

v

vi

viii

ix

xii

xiii

xvi

xvii

1

1

11

13

14

14

15

17

18

20

20

22

24

33

33

35

35

36

42

46

48

49

51

54

54

54

55

55

56

Page 11: CAT RRAD - Unismuh

x

F. Hasil-hasil Penelitian CAT yang Relevan ………………………….

G. Kerangka Berpikir …………………………………………………

H. Pertanyaan Penelitian ……………………………………………...

BAB III METODE PENELITIAN ……………………………………………

A. Model Pengembangan ……………………………………………....

B. Prosedur Pengembangan Aplikasi CerdasCAT ……………………..

1. Tahap Pemodelan Bisnis ………………………………………..

2. Tahap Pemodelan Data …………………………………………

3. Tahap Pemodelan Proses ………………………………………

4. Tahap Pembentukan Aplikasi ………………………………….

5. Pengujian ………………………………………………………

C. Uji Coba Produk …………………………………………………...

1. Desain Uji Coba …………….………………………………….

2. Subjek Uji Coba ……………………………………………….

3. Jenis Data ………………………………..…………………….

4. Instrumen ……………………………………………………......

5. Teknik Analisis Data …………………………………………...

BAB IV HASIL PENELITIAN ………………………….…………………..

A. Data Pengembangan ………………………………………………........

1. Data Karakteristik Butir Soal ………………………………………

2. Data Rancangan ……………………………………………………

3. Data Pembentukan Produk …………………………………………

4. Data Validasi Internal …………………………………………….

5. Data Expert Judgement …………………………………………….

6. Data Simulasi …………………………………………………….

7. Data Uji Coba Secara One to One …………………………………

8. Data Uji Coba Secara Terbatas …………………………………….

B. Analisis Data …………………………………………………………..

1. Analisis Butir Soal …………………………………………..……

2. Analisis Data Simulasi aplikasi CerdasCAT ………………………

3. Analisis Data Pendapat User Terhadap aplikasi CerdasCAT …….

4. Sampel Analisis Data Uji Coba Terbatas ………………………….

5. Analisis Perbandingan Ketiga Metode ……………………………..

6. Analisis Pengembangan CAT dengan Fitur DSS …………………...

C. Revisi Produk ………………………………………………………….

1. Inisialisasi Kemampuan ……………………………………….…..

2. Model Prototipe dan Full Release ………………………………….

3. Metode High Low ke Penalaran Fuzzy + High Low ………………..

4. Penambahan Tiga Metode pada Aplikasi CerdasCAT ……………...

5. Output Data menjadi Output Data Sekaligus Informasi …………..

6. Fungsi Informasi Butir ke Tingkat Kesukaran Butir ………………

59

66

70

72

72

76

76

85

88

97

97

98

98

100

101

102

102

104

104

104

104

127

133

135

137

139

147

148

148

150

152

154

163

168

173

173

175

177

179

181

182

Page 12: CAT RRAD - Unismuh

xi

D. Kajian Produk Akhir …………………………………………………..

1. Kajian Proses Update Pengguna ………………………………….

2. Kajian Proses Domain dan SKL dalam Content Balancing ……..

3. Kajian Proses Input Butir Soal ……………………………………

4. Kajian Proses Peserta Tes Mengambil Ujian ……………………..

5. Kajian Proses Pelaporan Kelulusan ……………………………...

6. Kajian Proses Wali Peserta Tes Mencetak Hasil Ujian Walinya …

7. Kajian Sistem Pengamanan Produk ……………………………..

E. Diseminasi Hasil Penelitian …………………………………………...

BAB V SIMPULAN DAN SARAN ……………………………………….

A. Simpulan ………………………………………………………………

B. Keterbatasan Penelitian ………………………………………………..

C. Saran, Pemanfaatan, dan Pengembangan Produk Lebih Lanjut ………

D. Diseminasi …………………………………………………………….

E. Temuan Baru Hasil Penelitian ………………………………………...

DAFTAR PUSTAKA ………………………………………………………….

184

184

187

191

192

200

203

205

206

210

210

211

212

214

215

216

Page 13: CAT RRAD - Unismuh

xii

DAFTAR TABEL

Halaman

Tabel 1. Kaidah Penelahaan Soal Pilihan Ganda ……….………………......

Tabel 2. Perbedaan Model Rasch dan Model 1PL ……….…………………...

Tabel 3. Perbandingan Aplikasi CAT …………………………………….....

Tabel 4. Ukuran Sampel Tiap Paket Soal …………………………………...

Tabel 5. Jumlah Soal Tiap SKL UN SD ……………….……………………

Tabel 6. Tabel Domain .……………………………………………………..

Tabel 7. Tabel Peserta Tes …………………………………………………...

Tabel 8. Tabel SKL ………………………………………………………..

Tabel 9. Tabel Paket Soal Tiga Butir Detail ………………………………...

Tabel 10. Tabel Paket Soal Tiga Butir ………………………..……………

Tabel 11. Tabel Soal ………………………………………………………

Tabel 12. Tabel Paket Soal Tiga Butir Jawaban ………..……………………

Tabel 13. Tabel Waktu Tempuh ……………………...……………………

Tabel 14. Tabel Peserta Tes Domain ……………………………...………..

Tabel 15. Hasil Perhitungan Hasil Tes pada CerdasCAT …………………..

Tabel 16. Hasil Perhitungan Hasil Tes pada Program Excel ………………..

Tabel 17. Data Pendapat Admin pada Aplikasi CerdasCAT ………………..

Tabel 16. Data Pendapat Pimpinan pada Aplikasi CerdasCAT ……………..

Tabel 17. Data Pendapat Pengajar pada Aplikasi CerdasCAT ………….…..

Tabel 18. Data Pendapat Wali Peserta Tes pada Aplikasi CerdasCAT ……..

Tabel 19. Jumlah Butir Soal Fit dan Tidak Fit Model Rasch ……………….

21

25

65

78

80

114

113

114

115

115

116

116

117

117

135

135

140

141

142

147

148

Page 14: CAT RRAD - Unismuh

xiii

DAFTAR GAMBAR

Gambar 1 Perbandingan Kurva Model 1PL dan Model Rasch …..…………

Gambar 2 Representasi Himpunan Klasik ……………………………………

Gambar 3 Representasi Himpunan Fuzzy …………………………………….

Gambar 4 Posisi Fitur pada Fungsi Keanggotaan ……………………………

Gambar 5 Fungsi Keanggotaan Linier ………………………………………..

Gambar 6 Fungsi Keanggotaan Segitiga ……………………………………...

Gambar 7 Fungsi Keanggotaan Trapezium …………………………………...

Gambar 8 Fungsi Keanggotaan Bahu …………………………………………

Gambar 9 Fungsi Keanggotaan S ……………………………………………..

Gambar 10 Sistem Penalaran Fuzzy …………………………………………..

Gambar 11 Metode Fuzzy Tsukamoto ………………………………………...

Gambar 12 Metode Fuzzy Sugeno …………………………………………..

Gambar 13 Posisi Metode Defuzzy ………………………………………….

Gambar 14 Metode Fuzzy Mamdani ………………………………………...

Gambar 15 Struktur DSS dalam CAT ………………………………………...

Gambar 16. Model Kerangka Berpikir Pengembangan CAT ….……………...

Gambar 16 Model RRAD …….…………….…………………………….

Gambar 17 Desain Model Pengembangan Model CerdasCAT .……………...

Gambar 18 Hubungan Entiti Peserta Tes dan Butir Soal ……………….…...

Gambar 19 Hubungan Entiti Domain dan Pimpinan ………………………...

Gambar 20 Representasi Himpunan Fuzzy Variabel Tingkat Kesukaran ……..

Gambar 21 Basis Pengetahuan Futsuhilow dan Fumahilow ……………..……

Gambar 22 Basis Pengetahuan Fusuhilow …………………………………...

Gambar 23 Metode DSS pada Produk CerdasCAT …………………………..

Gambar 24 Rancangan Arsitektur DSS dalam CAT …………………………..

Gambar 25 Arsitektur Aplikasi CAT Berbasis Web ………..…………………..

Gambar 26 Perbandingan Antar Metode dengan Empat Kriteria …………….

Gambar 27 Model Use Case CerdasCAT ……………………………………...

Gambar 28 Diagram Kelas Peserta Tes dan Laporan Kelulusan ……………..

Gambar 29 Flowchart Pengambilan Ujian CerdasCAT ………………………

Gambar 30 Diagram Aktifitas Peserta Tes Mengambil Ujian ………………...

Gambar 31 Diagram Kolaborasi User Mencari Laporan Kelulusan …………..

Gambar 32 Diagram Sekuensial Menampilkan Halaman Ujian ………………

Gambar 33 Diagram Relasi Entitas ……………………………………………

Gambar 34 Antar Muka Utama ……………………………………………..

Gambar 34 Antar Muka Admin ……………………………………………...

Gambar 35 Antar Muka Form Sign Up ……………………………………….

Gambar 36 Antar Muka Pimpinan …………………………………………...

Halaman

27

37

37

39

40

41

41

42

43

47

49

50

51

53

59

70

73

76

89

89

90

92

93

94

95

96

103

105

106

108

110

110

111

112

118

119

120

121

Page 15: CAT RRAD - Unismuh

xiv

Gambar 37 Antar Muka Penetapan Pembobotan SKL ……………………….

Gambar 38 Antar Muka Penetapan Pembobotan Domain ……………………..

Gambar 39 Antar Muka Penetapan Pembobotan Kriteria Penilaian ………….

Gambar 40 Antar Muka Pengajar ……………………………………………..

Gambar 41 Antar Muka Peserta Tes …………………………………………

Gambar 42 Antar Muka Ambil Ujian Adaptasi ……………………………….

Gambar 43 Antar Muka Hasil Ujian Peserta Tes ……………………………...

Gambar 44 Antar Muka Laporan Kelulusan Peserta Tes ……………………..

Gambar 45 Kode Pendaftaran Peserta Tes ……………………………………..

Gambar 47 Form Pendaftaran Peserta Tes ……………………………………

Gambar 46 Kode Log In ………..………………………...................................

Gambar 49 Form Log In ……………………………………………………...

Gambar 50 Kode Verifikasi Nomor Peserta …………………………………..

Gambar 51 Form Verifikasi Nomor Peserta Tes ……………………………...

Gambar 52 Kode Inisialisasi Kemampuan ……………………………………

Gambar 49 Kode Perhitungan Kemampuan Metode Futsuhilow …………….

Gambar 50 Kode Perhitungan Kemampuan Metode Fusuhilow ……………..

Gambar 51 Kode Perhitungan Kemampuan Metode Fumahilow …………….

Gambar 52 Kode Metode High Low …………………………………………

Gambar 53 Kode Waktu Mengerjakan Butir Soal …………………………….

Gambar 58 Konfigurasi Kelulusan ……………………………………………

Gambar 55 Pembobotan SKL ………………………………………………..

Gambar 56 Pembobotan Domain …………………………………………….

Gambar 57 Pembobotan Kriteria ……………………………………………...

Gambar 58 Laporan Kelulusan Memenuhi Kuota …………………………...

Gambar 59 Laporan Kelulusan Memenuhi Skor Minimum ………………….

Gambar 64 Inisialisasi Kemampuan Sebelum (a) dan Sesudah Revisi (b) …...

Gambar 65 Model Prototipe pada Model CAT ………………………………..

Gambar 66 Model Full Release pada Model CAT …………………………….

Gambar 67 Pencarian Butir Soal dengan Metode High Low ………………….

Gambar 68 Metode Fuzzy Diakselerasi oleh Metode High Low ……………...

Gambar 69 Model CAT Satu Metode (a) dan Tiga Metode (b) ………………

Gambar 70 Model CAT Menghasilkan Data (a) dan Informasi (b) …………...

Gambar 71 Fungsi Informasi (a) dan Tingkat Kesukaran (b) ………………...

Gambar 72 Halaman Daftar Admin …………………………………………..

Gambar 73 Halaman Form Admin ……………………………………………

Gambar 74 Halaman Daftar Pimpinan ………………………………………...

Gambar 75 Halaman Form Input Pimpinan ……………………………………

Gambar 76 Spesifikasi Bank Soal CerdasCAT ………………………………..

Gambar 77 Update Dinamis Bank Soal ……………………………………...

Gambar 78 Arsitektur Content Balancing …………………………………….

Gambar 79 Halaman Daftar Soal ……………………………………………..

Gambar 80 Form Memasukkan Butir Soal ……………………………………

Gambar 81 Halaman Data Paket Soal …………………………………………

Gambar 82 Form Paket Soal Tiga Butir ………………………………………

Gambar 83 Form Identitas Peserta Tes ………………………………………..

122

122

123

123

124

125

126

127

127

128

129

129

130

130

131

131

132

132

133

133

169

170

170

171

172

173

175

176

177

178

179

180

182

183

185

185

186

186

188

189

190

191

192

193

194

195

Page 16: CAT RRAD - Unismuh

xv

Gambar 84 Form Penentuan Domain Bagi Peserta Tes ………………………..

Gambar 85 Form Verifikasi Nomor Tes Peserta ……………………………….

Gambar 86 Pilih Domain Soal ………………………………………………...

Gambar 87 Halaman Peserta Tes Menjawab Semua Tiga Butir Soal …………

Gambar 88 Pengerjaan Butir Soal Pertama ……………………………………

Gambar 89 Hasil Ujian pada Domain …………………………………………

Gambar 90 Halaman Konfigurasi Kelulusan …………………………………..

Gambar 91 Pembobotan SKL …………………………………………………

Gambar 92 Pembobotan Domain …………………………. …………………..

Gambar 93 Pembobotan Kriteria Penilaian …………………………………….

Gambar 94 Laporan Kelulusan ……………………………………………….

Gambar 95 Form Input Wali Peserta Tes ……………………………………..

Gambar 96 Wali Peserta Tes Melihat Hasil Ujian Peserta Tes Walinya ………

196

196

197

197

198

199

200

201

201

202

202

203

204

Page 17: CAT RRAD - Unismuh

xvi

DAFTAR PERSAMAAN

Halaman

Persamaan 1 Model Rasch ………………………………………………..

Persamaan 2 Model 1PL …………………………………………………….

Persamaan 3 Kemampuan Peserta Tes secara Maksimum …………………..

Persamaan 4 Fungsi Informasi Butir ………………………………………...

Persamaan 5 Fungsi Informasi Tes …………………………………………..

Persamaan 6 Galat Baku Penaksiran Parameter Kemampuan ……………….

Persamaan 7 Fungsi Keanggotaan Bentuk Kurva Linier …………………….

Persamaan 8 Fungsi Keanggotaan Bentuk Kurva Segitiga ………………….

Persamaan 9 Fungsi Keanggotaan Bentuk Kurva Trapezuim ………………..

Persamaan 10 Fungsi Keanggotaan Bentuk Kurva S ……………………….

Persamaan 11 Aturan Operator AND ………………………………………

Persamaan 12 Aturan Operator OR ………………………………………….

Persamaan 13 Aturan Operator NOT ……………………………………….

Persamaan 14 Metode Penalaran Fuzzy Sugeno Orde Nol ………………….

Persamaan 15 Metode Penalaran Fuzzy Sugeno Orde Satu …………………

Persamaan 16 Centre of Gravity ………………...…………………………..

Persamaan 17 Perhitungan Simple Centre of Gravity ………………………

Persamaan 18 Perhitungan Simple Centre of Gravity Update …………….

Persamaan 19 Tranformasi Theta ke Skor ………………………………….

27

27

30

31

31

32

40

40

41

42

44

44

44

49

50

52

52

53

58

Page 18: CAT RRAD - Unismuh

xvii

DAFTAR LAMPIRAN Halaman

LAMPIRAN A

1. Simulasi Variabel Fuzzy Tingkat Kesukaran dan Kemampuan …………….

2. Simulasi Basis Pengetahuan Metode PenalaranTsukamoto ………………….

3. Simulasi Basis Pengetahuan Metode Penalaran Sugeno …………………….

4. Simulasi Basis Pengetahuan Metode Penalaran Mamdani …………………..

LAMPIRAN B

1. Sampel Data Respon Peserta Tes pada UN SD ……………………………..

2. Desain Analisis Butir Soal Tujuh Paket Soal ………………………............

3. Nama Peserta Analisis Soal dari Guru Kelas IV ……………………………

4. Nama Peserta Analisis Soal dari Guru Kelas V …………………….............

5. Nama Peserta Analisis Soal dari Guru Kelas VI ……………………............

6. Tingkat Kesukaran Butir Soal Tujuh Paket Soal …………………………….

7. Kunci Jawaban Butir Soal Tujuh Paket Soal ………………………………..

LAMPIRAN C

1. Identitas Peserta Tes yang Mengikuti Ujian pada Metoda Futsuhilow ……….

2. Identitas Peserta Tes yang Mengikuti Ujian pada Metoda Fusuhilow ………..

3. Identitas Peserta Tes yang Mengikuti Ujian pada Metoda Fumahilow …......

LAMPIRAN D

1. Sampel Hasil Simulasi Peserta Tes pada Metode Futsuhilow ………............

2. Sampel Hasil Simulasi Peserta Tes pada Metode Fusuhilow ………............

3. Sampel Hasil Simulasi Peserta Tes pada Metode Fumahilow ……………...

4. Hasil Simulasi Empat Pola Respon pada Metode Futsuhilow ……………...

5. Hasil Simulasi Empat Pola Respon pada Metode Fusuhilow ………............

6. Hasil Simulasi Empat Pola Respon pada Metode Fumahilow ……………..

7. Panjang Tes, Galat Baku, dan Waktu Respon pada Metode Futsuhilow………

8. Panjang Tes, Galat Baku, dan Waktu Respon pada Metode Fusuhilow ………

9. Panjang Tes, Galat Baku, dan Waktu Respon pada Metode Fumahilow………

10. Data Tingkat Exposure Butir Soal pada Metode Futsuhilow ………………..

11. Data Tingkat Exposure Butir Soal pada Metode Fusuhilow ………………..

12. Data Tingkat Exposure Butir Soal pada Metode Fumahilow ………............

13. Data Uji Coba Secara One to One pada Metode Futsuhilow ……………….

14. Data Uji Coba Secara One to One pada Metode Fusuhilow ………………..

15. Data Uji Coba Secara One to One pada Metode Fumahilow ……………….

16. Data Validasi Expert Judgment Pertama …………………………………...

17. Data Validasi Expert Judgment Kedua ……………………………………..

18. Kuesioner Validasi Expert Terhadap Model CAT …………………………..

19. Data Prosentase Hasil Validasi Expert Judgment …………………………..

223

224

225

226

227

228

229

230

231

232

233

234

235

236

237

238

239

240

241

242

243

244

245

246

250

254

257

258

259

260

262

264

266

Page 19: CAT RRAD - Unismuh

xviii

LAMPIRAN E

1. Panjang Tes Tiap Peserta Tes Ketiga Metode ……………………………..

2. Skor Tiap Peserta Tes Ketiga Metode ……………………………………..

3. Statistik Deskriptif dan Uji Homogenitas Ketiga Metode …………………

4. Panjang Tes, Galat Baku, dan Waktu Respon Ketiga Metode …………….

LAMPIRAN F

1. Statistik Deskriptif Tingkat Exposure Butir pada Metode Futsuhilow …….

2. Korelasi Tingkat Exposure Butir Tes pada Metode Futsuhilow ……...........

3. Statistik Deskriptif Tingkat Exposure Butir pada Metode Fusuhilow ……..

4. Korelasi Tingkat Exposure Butir Tes pada Metode Fusuhilow …………….

5. Statistik Deskriptif Tingkat Exposure Butir pada Metode Fumahilow ……..

6. Korelasi Tingkat Exposure Butir Tes pada Metode Fumahilow …………….

7. Statistik Deskriptift Exposure Butir Sampel Peserta Tes Ketiga Metode…….

8. Korelasi Tingkat Exposure Butir Sampel Peserta Tes Ketiga Metode ............

LAMPIRAN G

1. Format Verifikasi Internal Komponen Aplikasi CerdasCAT ………………..

2. Hasil Verifikasi Internal Komponen Aplikasi CerdasCAT ………………….

3. Contoh Verifikasi Internal Kompoen Komputasi Hasil Ujian ……………..

LAMPIRAN H

1. Galat Baku Penaksiran Parameter Kemampuan Metode Futsuhilow ……….

2. Galat Baku Penaksiran Parameter Kemampuan Metode Fusuhilow …............

3. Galat Baku Penaksiran Parameter Kemampuan Metode Fumahilow ……….

4. Statistik Deskriptif Galat Baku Penaksiran pada Metode Futsuhilow ……….

5. Statistik Deskriptif Galat Baku Penaksiran pada Metode Fusuhilow ………...

6. Statistik Deskriptif Galat Baku Penaksiran pada Metode Fumahilow ………..

LAMPIRAN I

1. Waktu Respon Tiap Butir Soal pada Metode Futsuhilow …………………..

2. Waktu Respon Tiap Butir Soal pada Metode Fusuhilow …………………..

3. Waktu Respon Tiap Butir Soal pada Metode Fumahilow …………………..

4. Statistik Deskriptif Waktu Respon Peserta Tes Metode Futsuhilow ………...

5. Statistik Deskriptif Waktu Respon Peserta Tes Metode Fusuhilow ………….

6. Statistik Deskriptif Waktu Respon Peserta Tes Metode Fumahilow ………..

LAMPIRAN J

1. Sampel Hasil Ujian Peserta Tes pada Metode Futsuhilow ………………….

2. Sampel Hasil Ujian Peserta Tes pada Metode Fusuhilow …………………..

3. Sampel Hasil Ujian Peserta Tes pada Metode Fumahilow …………………

4. Pendapat Peserta Tes Uji Coba One to One dengan Metode Futsuhilow…….

5. Pendapat Peserta Tes Uji Coba One to One dengan Metode Fusuhilow……..

6. Pendapat Peserta Tes Uji Coba One to One dengan Metode Fumahilow……..

267

268

269

270

271

272

273

274

275

276

277

278

279

280

281

282

283

284

285

286

287

288

289

290

291

292

293

294

295

296

297

298

299

Page 20: CAT RRAD - Unismuh

xix

LAMPIRAN K

1. Kuesioner Pendapat Peserta Tes Terhadap Aplikasi CerdasCAT ………….

2. Kuesioner Pendapat Pimpinan Terhadap Aplikasi CerdasCAT …………..

3. Kuesioner Pendapat Pengajar Terhadap Aplikasi CerdasCAT …………….

4. Kuesioner Wali Peserta Tes Terhadap Aplikasi CerdasCAT ………...........

5. Kuesioner Pendapat Administrator Terhadap Aplikasi CerdasCAT ……….

LAMPIRAN L

1. User’s Guide Aplikasi CerdasCAT ………………………………………...

2. Foto Kegiatan Pelatihan Analisis Soal Program Bilog-MG ………………...

3. Foto Hasil Uji Coba One to One Aplikasi CerdasCAT ……………………...

4. Foto Hasil Uji Coba Terbatas Aplikasi CerdasCAT …………………...........

LAMPIRAN M

1. Surat Ijin dari Pasca Sarjana UNY ………………………………………….

2. Surat Ijin dari Dinas Pendidikan Propinsi Sulawesi Selatan ………………...

3. Surat Keterangan dari Kepala SDN 1 Lamappoloware …………………….

4. Surat Keterangan dari Kepala SDN 161 Karya …………………………..

300

302

303

304

305

306

327

328

329

330

331

332

333

Page 21: CAT RRAD - Unismuh

viii

HALAMAN MOTTO

So far as the laws of mathematics refer to reality, they are not certain. And so

far as they are certain, they do not refer to reality.

_@Albert Einstein

As complexity rises, precise statements lose meaning and meaningful

statements lose precision.

_@Lotfi Zadeh

Bacalah dan tulislah sebab bagaimanapun dengan menuliskannya berarti telah

mengikat, menyebarluaskan, dan mengamalkan sehingga akan berbuah amal

ibadah disisi Allah SWT jika dilakukan secara ikhlas

_@Rukli

Page 22: CAT RRAD - Unismuh

1

BAB I

PENDAHULUAN

A. Latar Belakang Masalah

Pada Modern Test Theory (MTT), skala kemampuan peserta tes yang merespon

butir soal berada pada rentang antara negatif tak terhingga dengan positif tak terhingga.

Untuk mengukur kemampuan tersebut membutuhkan tes yang cakupan jumlah butir

soal besar disertai dengan tingkat kesukaran butir soal yang tinggi pula. Jika rentang

tingkat kemampuan peserta tes besar maka diperlukan lebih banyak butir soal dalam

tes namun akan ada banyak butir soal yang tidak optimal mengukur kemampuan

peserta tes. Jika panjang tes pendek maka kemungkinan tidak akurat dalam mengukur

variasi kemampuan peserta tes yang tinggi.

Tingkat kemampuan peserta tes berada pada skala yang sama dengan tingkat

kesukaran butir soal. Jika rentang tingkat kesukaran butir soal besar dalam suatu tes

maka tidak akurat mengukur kemampuan peserta tes yang bervariasi, sebaliknya jika

rentang tingkat kesukaran butir soal kecil misalnya di sekitar rata-rata tingkat kesukaran

butir soal maka butir soal tersebut sesuai dengan peserta tes berkemampuan sedang.

Oleh karena itu, dibutuhkan suatu mekanisme penyajian butir soal dimana tingkat

kesukaran butir soal adaptif terhadap variasi tingkat kemampuan peserta tes yang tinggi

namun hasilnya tetap adil bagi peserta tes. Menurut Hambleton, et al. (1991: 145)

secara umum kemampuan peserta tes berbeda, sehingga tingkat kesukaran butir soal

perlu dipadankan dengan tingkat kemampuan peserta tes, yakni peserta tes

berkemampuan tinggi diberikan butir soal yang lebih sukar, sebaliknya peserta tes yang

berkemampuan rendah diberikan butir soal yang lebih mudah. Implikasinya, agar

supaya semua butir soal akurat mengukur kemampuan peserta tes maka setiap peserta

tes menempuh butir soal yang unik sesuai dengan keunikan kemampuannya secara

Page 23: CAT RRAD - Unismuh

2

adaptif sehingga kemampuan tersebut terungkap secara maksimum. Mekanisme tes

adaptif berbasis komputer dikenal sebagai Computerized Adaptive Testing (CAT).

Menurut Hambleton, et al. (1991: 146) MTT mempunyai karakteristik butir soal

independen terhadap kelompok uji sehingga cocok dengan tes adaptif. Karakteristik

butir soal tergambar pada kurva karakteristik butir soal dimana butir soal dikaitkan

dengan kemampuan peserta tes dalam bentuk model logistik. Jika tingkat kesukaran

butir soal dikaitkan dengan kemampuan peserta tes maka modelnya adalah logistik satu

parameter (1PL), jika daya beda butir soal dan tingkat kesukaran butir soal dikaitkan

dengan kemampuan peserta tes maka modelnya adalah logistik dua parameter (2PL),

dan jika daya beda butir soal, tingkat kesukaran butir soal, dan peluang tebakan butir

soal dikaitkan dengan kemampuan peserta tes maka modelnya adalah logistik tiga

parameter (3PL). Menurut Linacre (2005), ketiga model tersebut merupakan model

statistik yang ukuran metriknya normal atau model normal ogive dengan nilai D = 1,7.

Disamping ketiga model tersebut, terdapat model lain yang mirip namun tak sama

dengan 1PL yakni model Rasch dengan nilai D = 1.

Model Rasch merupakan model pengukuran bukan model statistik. Model

Rasch secara filosofi psikometri menetapkan bahwa data yang cocok dengan model

bukan model yang cocok dengan data. Model Rasch mempunyai unit skala logistik

(logits) bukan probits. Oleh karena itu, model Rasch merupakan model mapan terhadap

ukuran sampel kecil dan cukup dimana tingkat kesukaran butir soal menjadi ukuran

dalam mengukur kemampuan sedangkan daya beda butir soal sama dan peluang

tebakan butir soal sama dengan nol. Karakteristik butir soal bentuk tes pilihan ganda

dalam CAT diadaptasikan dengan kemampuan peserta tes sehingga peluang tebakan

kurang signifikan dan daya beda kurang memberi sumbangsih pada kemampuan

maksimal peserta tes secara individu. Lebih lanjut, model pengukuran Rasch tidak

Page 24: CAT RRAD - Unismuh

3

memperhatikan (rejected) variasi daya beda yang dianggap sebagai gejala (symptom)

butir soal bias dan multidimensi. Berdasarkan hal tersebut, model Rasch lebih cocok

digunakan dalam pengembangan CAT.

Mekanisme pengembangan CAT membutuhkan beberapa aturan pokok.

Pertama, inisialisasi kemampuan peserta tes atau butir soal pertama yang direspon

peserta tes. Inisialisasi tersebut merupakan titik awal dalam pencarian butir soal

selanjutnya. Jumlah perbedaan aturan inisialisasi kemampuan yang ditetapkan dalam

pengembangan CAT cukup banyak. Misalnya, Peserta tes merespon tiga butir soal

sebagai inisialisasi awal kemampuan. Aturan tersebut memetakan kemampuan awal

dalam kategori kemampuan sangat rendah, rendah, sedang, tinggi, dan sangat tinggi.

Kedua, aturan pemberhentian penyajian butir soal pada CAT juga bervariasi. Misalnya,

peserta tes merespon satu butir soal untuk mendapatkan galat baku penaksiran

parameter kemampuan lebih kecil atau sama dengan 0,43 (Reshetar dalam Hambleton,

et al, 1991: 149) atau lebih kecil atau sama dengan 0,3 (Gustha, 2003: 10). Aturan

lain, peserta tes merespon dua butir soal untuk mendapatkan selisih galat baku

penaksiran parameter kemampuan lebih kecil atau sama dengan 0,01. Aturan

pemberhentian menggunakan satu butir soal dan dua butir soal mirip namun aturan

kedua lebih mapan karena menggunakan selisih dua galat baku penaksiran parameter

kemampuan peserta tes secara berturut-turut. Aturan pemberhentian lain, penetapan

sejumlah butir soal berdasarkan alokasi waktu tertentu seperti Paper and Pencil Test

(P&P), misalnya 25 butir soal (Gustha, 2003) atau 40 butir soal dengan waktu 120

menit dimana setiap butir soal dikerjakan rata-rata selama tiga menit.

Ketiga, pemilihan metode dalam menyajikan butir soal adaptif terhadap

kemampuan peserta. Swaminathan (1983: 24) dan Hambleton, et al. (1991: 46)

mengemukakan bahwa ada beberapa metode penaksiran parameter kemampuan bila

Page 25: CAT RRAD - Unismuh

4

parameter butir soal tes diketahui, antara lain: Maximum Likelihood Estimation (MLE),

bayesian, heuristik, dan analisis faktor non linier. Metode heuristik memiliki banyak

variasi prosedur. Selanjutnya metode tersebut dapat digunakan pada tingkatan diskrit

atau kontinu, misalnya clustering, pelacakan, dan kontrol.

Metode heuristik mencakup metode pencarian, pengontrolan, dan penalaran

sehingga banyak digunakan dalam sistem inteligen, sistem pakar, atau sistem

pendukung keputusan dimana asumsinya tidak ketat. Misalnya, jaringan syaraf tiruan,

algoritma genetika, dan logika fuzzy tidak memerlukan asumsi ketat sehingga

penarapannya semakin luas dalam berbagai pengontrolan dan optimasi baik dalam

rekayasa teknik, kedokteran, maupun psikometri. Salah satu metode heuristik, yakni

logika fuzzy tidak memerlukan pelatihan dan tidak memerlukan aturan logika tinggi

namun dapat diandalkan pada pemecahan masalah ketidakpastian.

Logika fuzzy mempunyai kelebihan jika dibandingkan dengan logika boolean.

Logika boolean mempunyai tingkat ketelitian diskrit sehingga pada penalaran yang

tinggi kurang tepat. Menurut Siler & Buckley (2005) dan user’s guide MATLAB

versi_2 (2004) logika fuzzy menawarkan beberapa karakteristik spesifik sehingga salah

satu pilihan yang baik pada masalah kontrol. Konsep logika fuzzy mudah dimengerti

karena konsep matematis mendasari penalaran fuzzy sangat sederhana dan mudah.

Penerapan logika fuzzy adalah fleksibel dan memiliki toleransi terhadap data-data yang

memerlukan penafsiran lebih lanjut, misalnya pemodelan fungsi-fungsi nonlinear yang

sangat kompleks. Logika fuzzy dapat membangun dan menerapkan pengalaman pakar

dalam bentuk basis pengetahuan secara langsung tanpa harus melalui proses pelatihan.

Basis pengetahuan (aturan fuzzy) sebagai dasar penalaran fuzzy dapat

mengontrol sistem fuzzy sehingga dapat mengoptimalkan ouput sesuai metode fuzzy.

Metode fuzzy terbagi tiga yakni Tsukamoto, Sugeno, dan Mamdani. Ketiga metode

Page 26: CAT RRAD - Unismuh

5

tersebut mempunyai prosedur pencarian yang tidak sama dalam menentukan output

sehingga walaupun bentuk input (anteseden) serupa akan menghasilkan bentuk output

(konsekuen) yang berbeda. Metode fuzzy Tsukamoto mempunyai konsekuensi dari

setiap basis pengetahuan. Setiap basis pengetahuan menggunakan aturan IF-THEN.

Selanjutnya aturan tersebut direpresentasikan dengan suatu himpunan fuzzy ke fungsi

keanggotaan monoton sehingga tidak ada proses defuzifikasi. Metode fuzzy Sugeno

mempunyai konsekuensi berupa konstanta atau fungsi matematika. Bila basis

pengetahuan dikomposisikan maka defuzifikasi dilakukan dengan mencari nilai rerata

berbobot. Metode fuzzy Mamdani menggunakan himpunan fuzzy, baik variabel

masukan maupun variabel keluaran dibagi menjadi satu atau lebih himpunan fuzzy.

Operasi komposisi basis pengetahuan menggunakan aturan MIN. Selanjutnya,

komposisi korelasi basis pengetahuan menggunakan penalaran max, additive, atau

probabilistik OR. Agregasi keluaran semua aturan menggunakan metode defuzzifikasi.

Ketiga metode fuzzy tersebut mempunyai kelebihan dan kekurangan masing-masing.

Metode fuzzy Mamdani lebih intuitif memberikan keluaran dan lebih sesuai

dengan pola pikir namun perhitungan mendapatkan keluaran lebih komplit jika

dibandingkan dengan metode fuzzy Sugeno. Metode fuzzy Sugeno lebih sederhana

namun kurang mengikuti pola pikir. Keduanya mempunyai metode defuzzifikasi dan

keluaran yang berbeda, sedangkan metode fuzzy Tsukamoto tidak melakukan proses

defuzifikasi dalam menghasikan keluaran sehingga paling sederhana namun

mempunyai kesamaan basis pengetahuan metode fuzzy Mamdani walaupun

keluarannya berbeda. Ketiga metode tersebut sama-sama dapat memecahkan masalah

ketidakpastian berupa pengelolaan input menggunakan metode fuzzy dan basis

pengetahuan untuk menghasilkan output. Berdasarkan hal tersebut, ketiga metode

dapat mengontrol butir soal yang terlalu sukar atau terlalu mudah bagi peserta tes

Page 27: CAT RRAD - Unismuh

6

menjadi lebih adaptif terhadap kemampuan peserta tes dengan bantuan suatu metode

pencarian. Ketiga metode fuzzy tersebut dioptimalisasi dengan metode high low.

Metode high low merupakan metode pencarian yang sederhana, yakni jika

respon benar maka tingkat kesulitan butir soal dinaikkan sekitar 0,1 sebaliknya jika

respon salah maka tingkat kesulitan butir soal akan diturunkan sekitar 0,2 (Lord dalam

Hulin, et al. 1983: 217). Metode high low menggunakan tingkat kesukaran butir soal

sebagai kriteria dalam memilih butir soal selanjutnya sehingga lebih cepat proses

retriavel pada saat melakukan query pada basis data jika dibandingkan metode MLE

menggunakan fungsi informasi butir soal.

Perpaduan antara metode fuzzy dan metode high low pada pengembangan CAT

menghasilkan model metode baru, yakni: (1) perpaduan metode fuzzy Tsukamoto

dengan metode high-low menghasilkan metode Futsuhilow, (2) perpaduan metode

fuzzy Sugeno dengan metode high-low menghasilkan metode Fusuhilow, dan (3)

perpaduan metode fuzzy Mamdani dengan metode high-low menghasilkan metode

Fumahilow. Ketiga metode tersebut memiliki mekanisme berlainan dalam

pengembangan CAT.

Pengembangan CAT dapat menggunakan perbandingan antar metode sehingga

diperoleh data panjang tes, tingkat exposure butir soal, galat baku penaksiran

kemampuan peserta tes, dan jumlah waktu respon soal. Informasi tersebut dapat

menjadi pilihan bagi user sesuai preferensinya.

Panjang tes menyangkut jumlah butir soal yang direspon peserta tes sampai

penaksiran kemampuan peserta tes konvergen. Metode yang menyajikan jumlah butir

soal jumlah kecil akan menghemat jumlah butir soal dalam bank soal dan dapat

mencerminkan tingkat kecocokan kemampuan peserta tes dengan butir soal yang

direspon. Tingkat exposure mengungkapkan jumlah butir soal direspon selama ujian

Page 28: CAT RRAD - Unismuh

7

berlangsung yang keluar dari domain himpunan fuzzy inisialisasi kemampuan peserta

tes. Metode yang mempunyai tingkat exposure yang besar menunjukkan metode

tersebut memberikan butir soal kepada peserta tes berada di luar rentang inisialisasi

kemampuan peserta tes. Jika hal tersebut terjadi, kerahasiaan butir soal semakin

menurun sehingga butir soal tidak bisa berfungsi sebagaimana mestinya. Metode yang

dapat menekan tingkat exposure butir soal sekecil mungkin merupakan mekanisme

pemberian soal yang baik terutama dalam menyajikan butir soal yang mempunyai

karakteristik butir soal yang ekstrim walaupun secara statistik hal tersebut sesuatu yang

bisa dipahami secara logika. Galat baku penaksiran parameter kemampuan peserta tes

memberikan informasi sejauh mana metode tersebut menyajikan butir soal yang adaptif

terhadap kemampuan peserta secara akurat. Metode yang menyajikan butir soal yang

lebih adaptif terhadap kemampuan peserta tes akan memiliki galat baku penaksiran

parameter kecil. Jumlah waktu respon bagi peserta tes dalam menjawab butir soal

memberikan informasi tentang kecepatan query-retrival pada basis data. Hal-hal

tersebut merupakan faktor yang perlu diperhatikan dalam pengembangan CAT dengan

dukungan teknologi informasi global jika produk berbasis web.

Perkembangan teknologi informasi dengan dukungan rekayasa produk

perangkat keras dan lunak komputer dapat mempercepat akses user sebagai stakeholder

yang berada di daerah yang berlainan. Pengembangan CAT berbasis web memberi

keuntungan bagi user yakni peserta tes sebagai aktor yang merespon butir tes, pengajar

sebagai aktor memasukkan butir soal, dan pimpinan serta user lain sebagai aktor

mencari data dan informasi jika dibandingkan sistem desktop atau client server bila

tingkat ketepatan, kekinian, dan kerelevanan informasi diprioritaskan.

Beberapa produk CAT berbasis web di beberapa negara telah diaplikasikan

secara online. Misalnya, J-CAT dikembangkan di Jepang (Shinggo Imai, 2008),

Page 29: CAT RRAD - Unismuh

8

SIETTE dikembangkan di Spanyol (Guzman, 2005), CAAS dikembangkan di Malaysia

(Sie, et al. 2005), dan OAVTS dikembangkan di Taiwan (Wen-shuenn Wu, 2004).

Walaupun produk tersebut berbasis web namun user bersifat pasif. Pengembangan CAT

berbasis web memerlukan Decision Support System (DSS) agar user lebih mudah

menerima dan mencari informasi secara aktif sesuai dengan preferensinya.

Pengembangan CAT sebagai media pengujian berbasiskan komputer tak lepas

dari peningkatan kebutuhan user sebagai pemakai produk berupa pendukung

keputusan. CAT sebagai produk dapat menghasilkan informasi sesuai kebutuhan bukan

hanya data sehingga perlu penambahan sistem cerdas berupa DSS. Menurut Turban

(2001) DSS merupakan sistem informasi berbasis komputer yang interaktif, fleksibel,

dan adaptif. DSS dibangun secara khusus untuk mendukung pemecahan masalah

manajemen yang tidak terstruktur dalam meningkatkan kualitas pengambilan

keputusan sesuai dengan preferensi. User dapat melakukan pembobotan terhadap

domain (mata pelajaran) dan memberikan kriteria kelulusan. Penelitian Rukli (2010)

dalam menerapkan DSS menunjukkan bahwa user dapat melakukan pembobotan dan

penetapan kriteria penerimaan sesuai preferensinya. Beberapa hasil penelitian

mengenai model CAT tidak memperhatikan hal tersebut, misalnya penelitian Agus

Santoso (2009) dan Haryanto (2009).

Penerapan CAT dapat dilakukan di Sekolah Dasar (SD) dimana setiap tahun

Pemerintah menyelenggarakan Ujian Nasional (UN). Hasil observasi dilakukan di

Provinsi Sulawesi Selatan tahun 2008 dan 2010 menunjukkan beberapa hal terkait

penyelengaraan UN sebagai berikut. (1) Ada beberapa sekolah menganggap

penyelengaraan UN SD hanya seremonial belaka jika dibandingkan dengan Ujian

Nasional di tingkat Sekolah Menengah Pertama (SMP) dan Sekolah Menengah Atas

(SMA) karena menganggap SMP merupakan kelanjutan SD dalam bingkai pendidikan

Page 30: CAT RRAD - Unismuh

9

dasar sembilan tahun. Akibatnya UN SD tidak terlalu diperhatikan oleh user (peserta

tes, pengajar, wali peserta tes, dan pimpinan). Oleh karena SD merupakan pintu

pertama dan utama dalam mengembangkan potensi peserta tes secara dini dan secara

formal sehingga sistem evaluasi yang ada perlu diperbaiki dan ditingkatkan, misalnya

menggunakan CAT. (2) Tingkat kebocoran butir soal berpeluang terjadi karena dua

guru dari setiap kabupaten/kota membuat butir soal UN di provinsi sehingga menjadi

kendala dalam mengukur kemampuan peserta tes secara jujur, adil, dan akurat. (3)

Penilaian kelulusan diserahkan sepenuhnya kepada sekolah sehingga setiap sekolah

mempuyai standar kelulusan yang berbeda-beda. Keempat, pengawasan ujian

dilakukan secara silang antar sekolah, namun masih terbatas antar sekolah dalam satu

gugus atau kelurahan/desa sehingga tingkat kejujuran kurang terjamin.

Disamping hal tersebut, beberapa hasil observasi terkait perkembangan

teknologi komputer sebagai berikut. (1) Keberadaan teknologi komputer di SD

misalnya pada SD Unggulan mengalami kemajuan pada rentang waktu tersebut,

misalnya fasilitas laboratorium kemputer dan perpustakaan berbasis informasi

teknologi. Data deskriptif menunjukkan keberadaan komputer di sekolah inti dan

unggulan sudah memiliki komputer walaupun jumlahnya tidak sama. Misalnya, SDN

1 Lamappapoloware dan SDN 161 Karya mempunyai komputer cukup memadai bagi

peserta tes kelas empat, lima, dan enam dalam kegiatan praktek komputer. (2) Dana

pembelian dan perawatan komputer berasal dari berbagai sumber. Misalnya, United

States Agency For International Development (USAID) dalam bentuk program

Desentralised Basic Education (DBE) bidang pendidikan dasar sejak tahun 2005, dana

Sekolah Standar Nasional (SSN), Bantuan Operasi Sekolah (BOS), Dana Alokasi

Umum (DAU), Anggaran Pendapatan Belanja Daerah (APBD), dan bantuan dari

anggota komite sekolah. (3) Jumlah SD semakin banyak yang tersebar di beberapa

Page 31: CAT RRAD - Unismuh

10

pulau terpencil memerlukan model CAT berbasis web agar ketimpangan sistem

pengujian dapat diminimalisasi. (4) Kemampuan dan kebiasaan peserta tes SD dalam

menggunakan komputer cukup memadai dimana peserta tes kelas IV sudah belajar dan

praktek komputer berupa latihan menggambar, mewarnai bunga, dan membuat

bagunan sederhana. (5) Jumlah guru SD unggulan dan inti yang memiliki laptop pribadi

sekitar 80%.

Hasil observasi tersebut memberikan informasi bagaimana rentangnya

kerahasian butir soal dan hasil ujian di SD yang perlu dibenahi. Demikian halnya,

memberikan informasi bahwa perkembangan dan penguasaan teknologi komputer di

SD sudah cukup maju. Walaupun bukan solusi mutlak yang dapat menanggulangi

semua permasalahan tersebut namun penerapan model CAT di SD diharapkan akurasi

informasi kemampuan peserta dapat di tingkatkan berdasarkan dukungan teknologi

komputer di daerah dan beberapa manfaat lain bagi user. Adapun hal-hal yang dapat

diperoleh user dengan pengembangan model CAT sebagai berikut. (1) Butir soal yang

dikerjakan sesuai dengan keunikan kemampuan tiap peserta tes. (2) Kerjasama antar

peserta tes (cheating) selama ujian dapat dibatasi karena setiap peserta tes mengerjakan

tes yang berbeda. (3) Waktu pelaporan hasil ujian lebih cepat. (4) Jika terjadi kebocoran

butir soal maka tebakan jawaban soal dalam waktu singkat dapat dibatasi sebab jumlah

butir soal dalam bank soal ratusan bahkan ribuan. (5) Peserta tes dapat mencetak secara

langsung hasil ujian saat ini sehingga kemungkinan rekayasa nilai yang dapat

merugikan peserta tes dapat dihindari secara maksimal. Berdasarkan hal tersebut, perlu

dikembangkan model CAT dengan metode Futsuhilow, Fusuhilow, dan Fumahilow di

SD unggulan dan inti sehingga informasi diperoleh user cepat, akurat, dan relevan

terutama dalam pengujian peserta tes SD masuk SMP.

Page 32: CAT RRAD - Unismuh

11

B. Identifikasi Masalah

Berdasarkan latar belakang masalah yang telah dipaparkan, maka diidentifikasi

beberapa masalah sebagai berikut.

1. User (peserta tes, pengajar, wali peserta tes, dan pimpinan) menganggap kegiatan

ujian UN hanya seremonial belaka pada hal SD pintu utama dan pertama dalam

meningkatkan kemampuan peserta tes sehingga perlu diperbaiki dan ditingkatkan

secara dini.

2. Pemilihan tingkat kesukaran butir soal dalam membuat tes belum memperhatikan

tingkat kemampuan peserta tes secara unik.

3. Penerapan teknologi komputer semakin pesat dalam berbagai bidang ilmu namun

belum digunakan secara optimal dalam sistem pengujian.

4. Butir soal yang diberikan kepada peserta secara adaptif belum menggunakan

metode tanpa persyaratan yang ketat.

5. Panjang tes yang terdapat pada P&P sama bagi semua peserta tes pada hal setiap

peserta tes mempunyai kemampuan yang unik.

6. Waktu respon yang terdapat pada P&P sama bagi semua peserta tes pada hal setiap

peserta tes mempunyai kecepatan dan kemampuan yang tidak sama dalam

merespon butir soal.

7. Tingkat kemunculan butir soal dalam suatu ujian pada P&P sama bagi semua

peserta tes jika terjadi kebocoran butir soal maka tebakan kunci jawaban sangat

tinggi.

8. Galat baku penaksiran kemampuan peserta tes pada P&P besar karena setiap

peserta tes merespon butir soal dengan karakteristik yang sama sedangkan

karakteristik kemampuan peserta tes tidak sama.

Page 33: CAT RRAD - Unismuh

12

9. Belum adanya penilaian standar kelulusan kepada sekolah sehingga setiap sekolah

mempunyai standar kelulusan sendiri.

10. Belum ada sistem pengujian yang menggunakan tiga metode fuzzy berdasarkan

model Rasch dalam satu produk.

11. Bank soal yang ada di sekolah belum optimal menggunakan teknologi komputer.

12. Walaupun sudah beberapa kali diperbaiki namun setiap tahun masih banyak peserta

tes bekerjama selama ujian dan masih terjadi kebocoran butir soal ujian.

13. Belum ada keseragaman waktu pelaporan hasil ujian Nilai Ebtanas Murni (NEM)

di sekolah.

14. Model CAT sudah diaplikasikan di beberapa negara namun keluaran yang diterima

user masih sebatas data hasil ujian belum ada informasi laporan kelulusan.

15. Belum ada kajian sistem ujian adaptif yang memperhatikan panjang tes, tingkat

exposure butir soal, galat baku penaksiran parameter kemampuan, dan waktu

respon butir soal dalam satu model CAT terutama di Indonesia.

C. Pembatasan Masalah

Berdasarkan latar belakang dan identifikasi masalah, maka penelitian dibatasi

pada masalah sebagai berikut.

1. Model CAT dikembangkan dengan metode Futsuhilow, Fusuhilow, dan

Fumahilow. Ketiga metode tersebut mempunyai konsep logika sederhana, mudah,

dan fleksibel sehingga memiliki toleransi terhadap data-data yang memerlukan

penafsiran lebih lanjut, misalnya pemodelan fungsi nonlinear yang sangat

kompleks. Selanjutnya, logika fuzzy dapat membangun dan menerapkan

pengalaman pakar dalan basis pengetahuan secara langsung tanpa proses pelatihan.

Page 34: CAT RRAD - Unismuh

13

2. Ketiga metode tersebut mempunyai kelebihan dan kekurangan karena berbeda

dalam mengelola basis pengetahuan dan proses defuzifikasi walaupun mempunyai

input, starting point, dan stoping rule yang sama. Oleh karena itu, metode tersebut

memerlukan kriteria yang diharapkan dapat menjadi acuan pembanding dalam

kaitan penaksiran parameter kemampuan peserta tes secara unik yang tidak

dipenuhi oleh P&P. Misalnya, jumlah butir soal direspon peserta tes sampai

penaksiran kemampuan konvergen (panjang tes), tingkat exposure butir soal, galat

baku penaksiran parameter kemampuan, dan waktu respon butir soal.

3. Model CAT memerlukan syarat unidimensi agar pengukuran kemampuan peserta

tes tidak dipengaruhi oleh dimensi lain. Oleh karena itu diperlukan suatu tes yang

mempunyai daya beda sama dimana tidak adanya gejala bias (differential item

functioning non_uniform) dan tidak multidimensi. Tes demikian lebih dipenuhi oleh

model Rasch. Lebih lanjut, model Rasch merupakan model pengukuran bukan

model statistik dimana model tersebut lebih mendekati model pengukuran skala

Gutman yang menekankan pada syarat unidimensi suatu tes. Oleh karena itu,

berdasarkan karakteristik tersebut model Rasch lebih memenuhi syarat dalam

pengembangan model CAT.

4. Model CAT di beberapa negara hanya memberikan data kepada user. Hal tersebut

membuat user bersifat pasif terhadap data sehingga kurang adaptif terhadap

kebutuhan user yang lebih spesifik sesuai dengan preferensinya. DSS merupakan

sistem informasi berbasis komputer dimana memberikan informasi kepada user

sesuai dengan preferensinya. Pimpinan mengelola data hasil ujian tiap peserta tes

berupa pembobotan skl, domain, dan kriteria penilaian kemudian menetapkan

kriteria kelulusan dalam suatu ujian untuk menghasilkan informasi laporan

Page 35: CAT RRAD - Unismuh

14

kelulusan. Laporan tersebut dapat diakses oleh peserta tes, wali peserta tes, dan

pengajar. Hal tersebut dapat dilakukan jika DSS diterapkan dalam model CAT.

D. Rumusan Masalah

Berdasarkan identifikasi dan pembatasan masalah yang telah dijelaskan maka

rumusan masalah penelitian sebagai berikut.

1. Bagaimanakah karakteristik model CAT dengan metode Futsuhilow, Fusuhilow,

dan Fumahilow berdasarkan model Rasch untuk menghasilkan kemampuan peserta

tes, panjang tes, tingkat exposure butir soal, galat baku penaksiran parameter

kemampuan, dan waktu respon butir soal?

2. Bagaimanakah prosedur penerapan DSS dalam model CAT untuk menghasilkan

laporan kelulusan?

E. Tujuan Penelitian

Tujuan penelitian ini adalah untuk mengetahui hal-hal sebagai berikut. (1)

Menemukan model CAT dengan metode Futsuhilow, Fusuhilow, dan Fumahilow

berdasarkan model Rasch. (2) Menerapkan model CAT untuk menghasilkan

kemampuan peserta tes, panjang tes, tingkat exposure butir soal, galat baku penaksiran

parameter kemampuan, dan waktu respon butir soal. (3) Menemukan prosedur

penerapan DSS dalam model CAT. (4) Menerapkan DSS dalam model CAT untuk

menghasilkan laporan kelulusan peserta tes.

F. Spesifikasi Produk yang Dikembangkan

Model CAT dikembangkan dengan Futsuhilow, Fusuhilow, dan Fumahilow.

Model tersebut menggunakan model pengukuran Rasch dalam menghasilkan

Page 36: CAT RRAD - Unismuh

15

kemampuan peserta tes, panjang tes, tingkat exposure butir soal, galat baku penaksiran

parameter kemampuan, dan waktu respon butir soal. Selanjutnya, DSS sebagai sistem

cerdas mengolah data kemampuan peserta tes dan referensi user berupa pembobotan

dan penetapan kriteria dalam menghasilkan informasi laporan kelulusan. Oleh karena

itu, produk yang dihasilkan disebut CerdasCAT dengan spesifikasi sebagai berikut.

1. Butir soal diadaptasikan terhadap kemampuan peserta tes dengan metode

Futsuhilow, Fusuhilow, dan Fumahilow.

2. CerdasCAT menggunakan model pengukuran Rasch dimana daya beda tidak

diperhatikan dan peluang tebakan ditetapkan nol.

3. CerdasCAT menghasilkan keluaran tingkat kemampuan peserta tes, panjang tes,

tingkat exposure butir soal, galat baku penaksiran parameter kemampuan, dan

waktu respon.butir soal.

4. Semesta pembicaraan variabel fuzzy tingkat kesukaran butir soal sama dengan

semesta pembicaraan variabel fuzzy tingkat kemampuan peserta tes yakni [-4,4].

5. Variabel fuzzy tingkat kesukaran butir soal dibagi menjadi lima himpunan fuzzy

yakni himpuan fuzzy sangat tinggi dengan domain [2,4], himpunan fuzzy tinggi

dengan domain [0,4], himpunan fuzzy sedang dengan domain [-2,2], himpunan fuzzy

rendah dengan domain [-4,0], himpunan fuzzy sangat rendah dengan domain [-4,-

2]. Himpunan fuzzy variabel tingkat kemampuan peserta tes sama dengan

himpunan fuzzy variabel tingkat kesukaran butir soal.

6. CerdasCAT menghasilkan keluaran data kemampuan peserta tes. Pengolahan data

menggunakan DSS dengan tahapan pembobotan SKL, pembobotan domain, dan

pembobotan kriteria penilaian sehingga menghasilkan informasi laporan kelulusan

sesuai preferensi user dalam batasan kuota maksimum dan skor minimum.

Page 37: CAT RRAD - Unismuh

16

7. Pemrograman CerdasCAT menggunakan program java sehingga produk tersebut

dapat berbasis web, client server, atau localhost selanjutnya sistem pengamanan

lebih tinggi serta fleksibel antar sistem operasi dan browser.

8. Ada lima aktor yang terlibat dalam CerdasCAT yakni administrator, peserta tes,

pimpinan, wali peserta tes, dan pengajar. Kelima aktor tersebut mempunyai peran

yang berbeda terhadap sistem.

9. Modul panduan CerdasCAT merupakan buku petunjuk berisi spesifikasi

kemampuan komputer, penginstalan, dan pengoperasian.

10. Keluaran CerdasCAT berupa hasil ujian dan laporan kelulusan dapat dibaca dan

dicetak oleh user.

11. Peserta tes telah mengikuti ujian domain matematika pada produk CerdasCAT

sedangkan domain lain tidak dilakukan karena data respon butir soal tidak cukup

tersedia di lapangan.

12. CerdasCAT membutuhkan spesifikasi minimal perangkat keras dan lunak

komputer. Perangkat keras yang dibutuhkan, yakni: microprosesor berupa intel

pentium III, kecepatan clock sebesar 1,2 GHz, RAM sebesar 1 gigabyte, hardisk

sebesar 50 gigabyte, tipe layar berupa tube atau flat screen, dan sistem warna berupa

color RGB 24 bit. Perangkat lunak yang dibutuhkan, yakni: semua sistem operasi,

semua browser, database mysql in XAMPP, program server dan client berupa JRE

1.6 dan JavaScript, platform dan desktop, client server atau web, java web server

berupa tomcat apache, web server berupa XAMPP, dan MySQL GUI Tools berupa

MySQL GUI Tools 5.0.

G. Manfaat Penelitian

Page 38: CAT RRAD - Unismuh

17

Model CAT dengan metode Futsuhilow, Fusuhilow, dan Fumahilow

berdasarkan model pengukuran Rasch menghasilkan kemampuan peserta tes, panjang

tes, tingkat exposure butir soal, galat baku penaksiran parameter kemampuan, dan

waktu respon butir soal. Selanjutnya, DSS dalam CAT dapat menghasilkan informasi

laporan kelulusan peserta tes. Oleh karena itu, penelitian ini mempunyai beberapa

manfaat teoritis dan praktik. Manfaat teoritis model CAT yaitu: 1) temuan hasil

penelitian dapat menambah ragam konsep model CAT terutama pada model

pengukuran Rasch sehingga menghasilkan kemampuan peserta tes, panjang tes, tingkat

exposure butir soal, galat baku penaksiran parameter kemampuan, dan waktu respon

butir soal, serta informasi laporan kelulusan peserta tes; 2) menjadi referensi dalam

melakukan penelitian pengembangan selanjutnya; dan 3) menjadi sumbangan

pemikiran dalam melakukan simulasi perbandingan metode pemilihan butir soal.

Manfaat praktik model CAT yaitu: 1) pelaksanaan pengujian lebih sederhana

dan lebih terjamin keamanan dengan tingkat kebocoran butir soal dapat diperkecil jika

database dirancang secara maksimal sesuai dengan kondisi setempat; 2) dapat lebih

menghemat tenaga dan dana dalam melaksanakan ujian sekolah, daerah, dan nasional

jika perangkat keras dan perangkat lunak jaringan komputer telah tersedia; 3) ujian

dilaksanakan lebih efisien dan efektif serta informasi yang diperoleh user lebih relevan,

akurat, dan cepat; 4) produk CAT dikembangkan berbasis web namun produk tersebut

dapat berbasis client server dan desktop sehingga dapat digunakan pada sekolah yang

belum tersedia jaringan internet; 5) penambahan DSS pada CAT membuat user lebih

aktif mencari dan menerima informasi sesuai dengan preferensinya dalam

menghasilkan informasi laporan kelulusan peserta tes; dan 6) produk CAT dapat

digunakan dalam ujian lisensi atau sertifikasi masuk perusahaan atau instansi dengan

menambah domain pengujian sesuai dengan materi ujian.

Page 39: CAT RRAD - Unismuh

18

H. Asumsi dan Keterbatasan Pengembangan Produk

1. Kemampuan setiap peserta tes unik sehingga setiap peserta tes merespon tes yang

unik secara adaptif dengan metode Futsuhilow, Fusuhilow, dan Fumahilow.

2. Pengajar meng_input soal bentuk image dalam bank soal model CAT sedangkan

soal dalam bentuk teks belum tersedia.

3. Model CAT menggunakan model pengukuran Rasch dimana daya beda butir soal

ditetapkan sama, dan peluang tebakan butir soal ditetapkan nol serta D = 1.

4. Butir soal yang tidak memenuhi model direvisi secara kualitatif. Butir soal yang

telah direvisi tersebut, nilai karakteristiknya diasumsikan tidak berubah secara

signifikan.

5. Semesta pembicaraan variabel fuzzy tingkat kesukaran butir soal dan variabel fuzzy

tingkat kemampuan peserta tes dibatasi dalam rentang [-4,4].

6. Variabel fuzzy tingkat kesukaran butir soal dan tingkat kemampuan peserta tes

dibatasi dalam lima himpunan fuzzy yakni sangat tinggi, tinggi, sedang, rendah, dan

sangat rendah.

7. Inisialisasi kemampuan peserta tes menggunakan tiga butir soal.

8. Butir soal menggunakan media tambahan seperti audio, video, games, atau animasi

misalnya soal tes percakapan dalam bahasa Inggris belum tersedia dalam model

CAT.

Page 40: CAT RRAD - Unismuh

20

BAB II

KAJIAN PUSTAKA

A. Kajian Butir Soal

Analisis butir soal terbagi dua yakni kualitatif dan kuantitatif. Analisis

kualitatif (teoritik) mencakup isi (konten), bahasa, dan konstruksi. Cakupan tiap

analisis butir soal secara kualitatif tersebut memerlukan keahlian spesifik, yaitu

penelaahan isi (materi) membutuhkan keahlian bidang studi, penelaahan bahasa

membutuhkan keahlian bahasa, dan penelaahan konstruksi membutuhkan keahlian

psikometri. Spesifikasi keahlian tersebut akan lebih bermakna bila ada pengalaman

dalam menganalisis butir soal. Kemampuan tersebut dibutuhkan dalam pengembangan

butir soal yaitu jika terdapat butir soal yang tidak memenuhi model maka butir soal

tersebut ditelaah lebih lanjut untuk direvisi atau dibuang termasuk butir soal pilihan

ganda. Butir soal bentuk pilihan ganda terdiri atas stem dan option dimana option

terdiri atas key dan distractors memerlukan kaidah-kaidah penelaahan dari segi materi,

konstruksi, dan bahasa (Puspendik, 2007). Kaidah penelaahan butir soal pilihan ganda

yang terdiri atas materi, konstruksi, dan bahasa pada Tabel 1.

Analisis kuantitatif mencakup penelaahan lanjutan dari analisis kualitatif

(empiris). Analisis kuantitatif dapat dilakukan secara manual atau komputer. Misalnya,

analisis kuantitatif menghitung validitas konstruk dengan analisis faktor, reliabilitas

tes dengan analisis alpha, atau karakteristik butir soal berupa daya beda, tingkat

kesukaran, dan peluang tebakan dengan program excel. Untuk data respon butir soal

yang berskala besar lebih mudah menggunakan program komputer. Misalnya, jumlah

data respon sebesar 500 atau lebih dapat menggunakan program Bilog-MG.

Page 41: CAT RRAD - Unismuh

21

Tabel 1.

Kaidah Penelahaan Butir Soal Tes Pilihan Ganda

1 Materi

a. Butir soal harus sesuai dengan indikator.

b. Pilihan jawaban harus homogen.

c. Logis ditinjau dari segi materi.

d. Setiap butir soal harus mempunyai satu jawaban yang benar atau yang

paling benar.

2 Konstruksi

e. Pokok butir soal harus dirumuskan secara jelas dan tegas.

f. Rumusan pokok butir soal dan pilihan jawaban harus merupakan

pernyataan yang diperlukan saja.

g. Pokok butir soal jangan memberi petunjuk ke arah jawaban benar.

h. Pokok butir soal jangan mengandung pernyataan yang bersifat negatif

ganda.

i. Panjang rumusan pilihan jawaban harus relatif sama.

j. Pilihan jawaban jangan mengandung pernyataan, "Semua pilihan jawaban

di atas salah", atau "Semua pilihan jawaban di atas benar". Pilihan jawaban

yang berbentuk angka atau waktu harus disusun berdasarkan urutan besar

kecilnya nilai angka tersebut, atau kronologisnya.

k. Gambar, grafik, tabel, diagram, dan sejenisnya yang terdapat pada butir

soal harus jelas dan berfungsi.

l. Butir soal jangan bergantung pada jawaban butir soal sebelumnya.

3 Bahasa

m. Setiap butir soal harus menggunakan bahasa yang sesuai dengan kaidah

bahasa Indonesia.

n. Jangan menggunakan bahasa yang berlaku setempat, jika butir soal akan

digunakan untuk daerah lain atau nasional.

o. Setiap butir soal harus menggunakan bahasa yang komunikatif.

p. Pilihan jawaban jangan mengulang kata atau frase yang bukan merupakan

satu kesatuan pengertian.

Sumber: Pusat Penilaian Pendidikan, 2007.

Jika analisis kualitatif sudah dilakukan sesuai dengan kaidah Tabel 1 maka

diharapkan analisis kuantitatif menghasilkan karakteristik butir soal dan tes yang

memenuhi kriteria sebagai tes yang baik. Data statistik berupa karakteristik butir soal

tersebut merupakan informasi atau menjadi pertimbangan memasukkan butir soal

tersebut di bank soal walaupun bukan syarat mutlak. Menurut Sumadi Suryabata

(1987) data statistik tersebut bukan semata-mata menjadi rujukan butir soal untuk

Page 42: CAT RRAD - Unismuh

22

dibuang atau diganti namun perlu diperhatikan dari segi lain, misalnya validitas konten.

Oleh karena itu, karakteristik butir soal yang tidak memenuhi data statistik, misalnya

tidak memenuhi model dianalisis secara kualitatif atau ditelaah pola jawaban peserta

tes yang merespon butir tersebut.

1. Teori Tes Klasik

Untuk mengetahui kemampuan peserta tes dan karakteristik butir soal atau tes

dapat menggunakan pendekatan Teori Tes Klasik (TTK), Modern Test Theory (MTT),

dan Cognitive Diagnostics Model (CDM). Setiap pendekatan tersebut mempunyai

asumsi tidak sama sehingga pengaplikasiannya juga tidak sama.

Ada beberapa asumsi melandasi TTK. Pertama, skor amatan (X) tidak pernah

sama dengan skor sebenarnya (T) karena selalu ada kesalahan pengukuran (E) yang

dirumuskan ETX . Kedua, jika tes dilakukan secara berulang pada peserta tes

yang sama dan independen maka nilai harapan skor amatan akan mendekati skor

sebenarnya, yakni TX )( . Ketiga, skor sebenarnya dan galat pengukuran tidak

pernah berkorelasi, yakni 0TE . Keempat, jika dua tes mengukur hal yang sama,

maka galat baku pengukuran kedua tes tersebut tidak berkorelasi, yakni 021 EE .

Kelima, jika dua tes direspon oleh dua kelompok yang sama, maka skor sebenarnya tes

pertama tidak berkorelasi dengan galat baku pengukuran tes kedua, yakni 021 ET .

Berdasarkan asumsi tersebut didefinisikan sebagai berikut. (1) Jika dua tes

mempunyai skor amatan X dan X’. Selanjutnya memenuhi asumsi 1 sampai 5 dan jika

tiap populasi peserta tes memenuhi 'TT dan '22 EE maka kedua tes tersebut

paralel. (2) Jika dua tes mempunyai skor amatan X1 dan X2. Selanjutnya, memenuhi

Page 43: CAT RRAD - Unismuh

23

asumsi 1 sampai 5 dan memenuhi 1221 CTT untuk C12 adalah konstan, maka kedua

tes ekuivalen (Allen& Yen, 1979: 57) dan Feldt & Brennan (1989: 108-110). (3). Jika

dua tes mempunyai skor amatan Xt dan Xt’ dan memenuhi asumsi 1 dan 5. Selanjutnya,

memenuhi 1212 ' CXBX untuk B12 dan C12 konstan dan tidak sama dengan

nol maka kedua tes tersebut konjenerik (Feldt & Brennan dalam Linn, 1989: 110).

Menurut Hambleton & Swaminathan (1985: 2-3), asumsi TTK memiliki

beberapa kelemahan mengenai informasi keadaan tes dan peserta tes sebagai berikut.

(1) Statistik butir tes bergantung pada karakteristik subjek yang di tes. (2)

Penaksiran kemampuan peserta tes bergantung pada butir tes ujian. (3) Galat

baku penaksiran skor berlaku untuk semua peserta tes sehingga galat baku

pengukuran tiap peserta tes tidak ada. (4) Informasi terbatas menjawab benar

atau salah saja namun tidak memperhatikan pola jawaban peserta tes. (5) Asumsi

tes paralel susah dipenuhi.

Ciri butir pada TTK, yang dikenal dengan parameter bergantung pada kelompok

uji, jika kelompok uji berbeda, maka ciri butir soal juga beda, artinya ciri butir soal

bergantung pada kelompok uji sehingga skor yang merupakan cermin kemampuan

peserta tes yang didapat juga bergantung pada kelompok butir.

Berdasarkan asumsi dan ciri TTK tersebut maka para ahli psikometri

mencari model alternatif. Hambleton et al. (1991) dan Hulin et al. (1983)

mengemukakan bahwa model MTT memiliki ciri yakni sekali parameter butir

terkalibrasi maka parameter tersebut invarian, artinya ciri butir tidak berubah

sekalipun dilakukan pada kelompok uji lain, begitu juga kemampuan peserta tes tetap

sekalipun mengerjakan butir yang beda dengan asumsi bahwa distribusi kemampuan

kelompok setara sehingga skor yang merupakan cermin kemampuan peserta tes tidak

bergantung pada kelompok butir. Walaupun TTK dan MTT berbeda asumsi, namun

dalam satu software kadangkala kedua pendekatan tersebut saling melengkapi.

Page 44: CAT RRAD - Unismuh

24

Misalnya, program Bilog-MG keluaran Ph1 dengan pendekatan TTK akan membantu

sekaligus memahami keluaran Ph2 dan Ph3 dengan pendekatan MTT.

Ciri-ciri MTT memiliki kemiripan dengan model Rasch. Model MTT

merupakan model statistik sedangkan model Rasch merupakan model pengukuran

walaupun kurva fungsinya sama-sama monotonik. Artinya semakin tinggi kemampuan

peserta tes maka peluang untuk menjawab benar suatu butir soal semakin tinggi tanpa

memperhatikan daya beda dan peluang tebakan.

2. Model Pengukuran Rasch

a. Asumsi Item Characteristic Curva (ICC)

Model ICC pada MTT mempunyai tiga model, yakni model logistik tiga

parameter (3PL), model logistik dua parameter (2PL), dan model logistik satu parameter

(1PL). Model Rasch atau model pengukuran Rasch ditemukan oleh George Rasch.

Hambleton, et al. (1991: 14) mengemukakan bahwa model Rasch berbeda dengan model

pendekatan MTT walaupun secara matematik bentuknya equivalen dengan IPL. Model

tersebut mempunyai ICC yang beda dengan model 1PL yakni model 1PL mempunyai

nilai D =1,7 sehingga lebih bentuknya lebih curam sedangkan model Rasch mempunyai

nilai D = 1 sehingga bentuknya lebih landai. Haley dalam Hambleton & Swaminathan

(1985: 37) dan Kolen & Brennan (2004: 158) mengemukakan bahwa hubungan antara

fungsi normal kumulatif dengan model logistik dilakukan dengan penambahan faktor D

= 1,7 pada model logistik sehingga selisih nilai absolut )(iP pada kedua model untuk

semua peserta tes lebih kecil dari 0,01 sehingga dianggap sama. Walaupun demikian

Linacre (2005) menguraikan bahwa perbedaan antara keduanya bukan hanya aspek

kuantitatif yakni selisih 0,01 namun juga berbeda pada beberapa aspek antara lain seperti

pada Tabel 2.

Page 45: CAT RRAD - Unismuh

25

Tabel 2.

Perbedaan Model Rasch dan Model 1PL

No

Aspek

Model Dikotomi Rasch

Model Satu Parameter

1 Singkatan Rasch 1PL

2 Alasan (Dasar)

Preskriptif: Taksiran

kemampuan dan butir soal

distribusinya bebas

Deskriptif: Lebih mendekati

model Ogive Normal

3 Peserta Tes

n kemampuan peserta tes Bn

atau ν kemampuan peserta

tes v di dalam logits

Sampel peserta tes

berdistribusi normal dari

distribusi kemampuan theta

(θ). Dikonseptualisasikan

sebagai N(0,1).

4 Butir soal

Tingkat kesukaran butir ke-i

Di atau tingkat kesukaran

butir ke ι di dalam logits

Butir ke-i dari tingkat

kesukaran bi di dalam

probits

5

Formula:Bentuk

exponensial

e = 2.71828 in

in

DB

DB

nie

eP

1

)(7,1

)(7,1

1 i

i

b

b

nie

eP

6

Formula:Bentuk

logit-linear

loge = natural

logarithm in

ni

nie DB

P

P

1log )(7,1

)(1

)(log i

i

ie b

P

P

7

Daerah asal

skala: titik nol

taksiran

parameter

Rerata tingkat kesukaran

butir atau tingkat kesukaran

butir soal yang dispesifikkan

(acuan kriteria)

Rerata kemampuan peserta

tes (acuan norma)

8 Daya beda butir

Kurva karakteristik butir

dimodelkan menjadi paralel

dengan nilai slop 1 (Ogif

logistik alam (natural)

Kurva karakteristiknya

paralel dengan slope 1,7

(mendekati slop ogif normal

kumulatif)

9

Mising data

yang diijinkan

Bergantung pada metode

penaksiran

Bergantung pada metode

penaksiran

10

Fixed

(anchored) nilai

parameter untuk

peserta tes dan

butir soal Bergantung pada software

Butir: bergantung pada

software dan peserta tes

hanya bergantung pada

bentuk distribusi

11

Evaluasi

Kecocokan (fit)

Kecocokan data pada model.

Local, satu parameter pada

satu waktu

Kecocokan model pada

data. Global, menerima atau

menolak model

12

Ketidakcocokan

data dan model

Data cacat tidak mendukung

pemisahan parameter

didalam kerangka kerja

aditif. Pertimbangkan

mengedit data

Data cacat tidak cukup

mendekripsikan data.

Pertimbangkan menjumlah

parameter daya beda (2-PL),

peluang tebakan (3PL)

Page 46: CAT RRAD - Unismuh

26

Sambungan Tabel 2

No Aspek Model Dikotomi Rasch Model Satu Parameter

13

Pertama

menampilkan

Rasch, George (1960).

Model probabilistik untuk

beberapa tes inteligensi dan

prestasi (attainment).

Kopenhagen: Danish

Institute for Educational

Research

Birnbaum, Allan (1968).

Beberapa model

kemampuan laten. Dalam

F.M. Lord &M.R. Novick,

(Eds), Statistical theories of

mental; test scores. Reading,

MA: Addison-Wesley.

14

Pendukung

Pertama

Benjamin D. Wright,

University of Chicago

Frederic M. Lord,

Educatioal Testing Service

15

Otoritas aktif

yang

berwewenang

secara langsung

David Andrich,University of

Western Australia, Perth,

Australia

Ronald Hambleton,

University of Massachusetts

16

Buku teks yang

memperkenalkan

Applying the Rasch Model.

T.G. Bond and C.M. Fox

Fundamentals of Item

Response Theory. R.K.

Hambleton, H.

Swaminathan, and H.J.

Rogers.

17

Software yang

digunakan

secara luas

Winsteps, RUMM,

ConQuest

Logist, BILOG

Tabel 2 menggambarkan perbedaan antara kedua model dimana model Rasch

lebih banyak digunakan pada tes prestasi dan digunakan pada acuan kriteria (patokan).

Jika data tidak cocok dengan model maka model dapat dipertimbangkan dan diganti

dengan model lain. Pergantian model tersebut tetap memperhatikan distribusinya. Oleh

karena itu, penaksiran kemampuan peserta tes dan butir soal tidak bergantung pada

distribusi normal namun bebas. Lebih lanjut, model Rasch merupakan model

pengukuran bukan merupakan model statistik sehingga bagaimana proses data tersebut

diperoleh lebih diperhatikan dibandingkan bagaimana data tersebut dianalisis.

Model Rasch menghubungkan setiap peserta tes sebagai individu (Bn) sebagai

suatu logistik ogive dengan tingkat kesukaran butir soal sedangkan model 1PL

Page 47: CAT RRAD - Unismuh

27

menghubungkan theta (θ) sebagai sebuah distribusi normal ogive dengan tingkat

kesukaran soal. Adapun formula model Rasch dan model 1PL masing-masing sebagai

berikut:

in

in

DB

DB

nie

eP

1 ……….………………………. (1)

)(7,1

)(7,1

1 i

i

b

b

nie

eP

……….…...……………........... (2)

dimana e = 2.71828 dan Pni merupakan peluang peserta tes menjawab butir ke-i benar.

Kurva kedua model pada range kemampuan [-4,4] seperti pada Gambar 1.

Gambar 1.

Perbandingan Kurva Model 1PL dan Model Rasch

Gambar 1 menunjukkan bahwa kurva model 1PL lebih tajam daripada kurva

model Rasch karena mempunyai perbedaan nilai D dimana model 1PL mempunyai nilai

D = 1,7 sedangkan model Rasch mempunyai nilai D = 1. Hal tersebut menunjukkan

perbedaan antara model logistik ogive dan model normal ogive.

Model 1 PL

Model Rasch

Page 48: CAT RRAD - Unismuh

28

b. Asumsi Independensi Lokal

Independensi lokal diartikan sebagai ketidakbergantungan suatu butir soal

dengan butir soal yang lain dalam pengukuran kemampuan peserta tes. Artinya, butir

soal yang satu tidak sama dengan butir soal yang lain dalam mengukur suatu trait

(kemampuan). Secara analogi matematik, tidak ada irisan objek kemampuan yang

diukur. Selanjutnya, secara statistik dapat dikatakan tidak ada korelasi signifikan antara

butir soal yang satu dengan butir soal lain dalam rentang kemampuan.

Independensi menurut Hulin et al. (1983: 43) dan Hambleton (1989: 151)

bahwa pada tingkatan kemampuan dan sikap, sebarang dua butir soal tidak berkorelasi

pada sub populasi yang homogen. Sebaliknya, pada sub populasi yang heterogen

dengan kemampuan yang bervariasi, respon dua butir berkorelasi. Hal tersebut tidak

berarti bahwa respon pada sebarang dua butir tidak berkorelasi secara umum.

Berdasarkan hal tersebut, subjek pada penelitian ini mempunyai sarana dan prasarana

pendidikan yang relatif sama sehingga kemampuan peserta tes dianggap setara.

Implikasinya, pada penelitian ini sebarang respon dua butir soal tidak berkorelasi.

c. Asumsi Unidimensi

Unidimensi mengacu satu dimensi suatu tes dimana domain yang akan

diukur. Jika butir soal tes mengukur kemampuan matematika, maka butir soal yang

ada pada tes tersebut mengacu pada kemampuan mengukur matematika, sedangkan

pada analisis faktor sering disebut sebagai komponen dominan. Menurut Hambleton,

et al. (1991: 9-10) pada pengukuran psikologi, karakteristik butir soal yang

membentuk tes tidak tepat secara eksak berdimensi satu (unidimensi) tetapi hanya

dominan terhadap suatu unjuk kerja. Jadi bila tes mengukur lebih dari satu dimensi

atau tidak dominan maka jawaban peserta tes terhadap butir soal akan merupakan

Page 49: CAT RRAD - Unismuh

29

kombinasi dari berbagai kemampuan, sehingga sulit untuk mengetahui kontribusi dari

setiap butir soal terhadap kemampuan peserta tes. Kalau hal tersebut terjadi maka

dikatakan tes berdimensi dua atau lebih (multidimensi) sehingga perlu diketahui

dimensi suatu tes. Dimensi suatu tes dapat diketahui dengan metode fuzzy c-means.

Metode tersebut sederhana dan tidak memerlukan asumsi yang ketat dalam menentukan

dimensi suatu tes (Rukli, 2011).

Ada beberapa mekanisme untuk mengukur kemampuan peserta tes kalau tes

multidimensi. Misalnya, dimensi dalam tes tersebut dipisahkan dengan suatu

persamaan linier yang mewakili setiap dimensi dalam hal ini variabel sedangkan

parameternya merupakan pembobotan sehingga diperoleh informasi secara

keseluruhan dari kemampuan peserta tes yang diukur oleh tes tersebut. Unidimensi

atau multidimensi suatu tes dipengaruhi oleh kisi-kisi yang membangun tes tersebut.

Djemari Mardapi (1996: 15-19) mengemukakan bahwa pembuatan kisi-kisi tes

mengacu pada konsep bahwa materi pokok bahasan pada materi tes bisa tidak sama,

namun memiliki substansi pokok yang sama, dan penilaian pada ranah kognitif

cenderung berdimansi satu. Oleh karena hanya satu dimensi yang diukur yaitu pada

ranah kognitif sehingga tes UN SD adalah merupakan tes yang dominan dimana kisi-

kisi UN SD pada mata pelajaran matematika dibuat oleh Pusat Penilaian Pendidikan

(Puspendik). Walaupun demikian, butir soal UN SD menggunakan kisi-kisi yang

spesifik bukan pada tingkatan mata pelajaran namun pada tingkatan Standar

Kompetensi Lulusan (SKL) sehingga informasi berapa banyak butir soal yang

direspon peserta tes selama ujian per SKL memerlukan kajian lebih dalam. Seberapa

besar prosentase butir soal diharapakan muncul dalam setiap SKL perlu diperhatikan

prioritasnya dengan tetap memperhatikan faktor lain yakni tingkat kesukaran butir soal

yang paling adaptif terhadap kemampuan peserta tes saat ini. Jadi pembuatan

Page 50: CAT RRAD - Unismuh

30

kisi-kisi butir soal tes yang meliputi pokok bahasan pada hakekatnya mengacu pada

substansi pokok yang sama namun materi tes tidak sama dimana mengungkapkan satu

kemampuan umum sehingga pokok bahasan, SKL, atau content area perlu

diperhatikan dan ditegaskan dimana komponen dominan mengacu pada analisis faktor.

Berdasarkan uraian ciri butir soal yang dependen dan asumsi yang melandasi

konsep TTK jika dibandingkan dengan ciri butir soal dan asumsi yang melandasi

konsep model Rasch maka konsep model Rasch lebih cocok dalam pengembangan

CAT dibandingkan dengan konsep TTK. Begitu juga konsep 1PL merupakan model

statistik bergantung pada distribusi sampel yang berdistribusi normal dibandingkan

model Rasch berdistribusi bebas lebih cocok dalam pengembangan CAT.

d. Fungsi Informasi Butir

Birnbaun dalam Hambleton et al. (1991: 92) mengemukakan bahwa

kemampuan peserta tes secara maksimum pada model 3PL dapat dihitung dengan

formula sebagai berikut:

))81(1(5.0ln1

i

i

i cDa

b ..…………...……… (3)

Jika peluang tebakan 0ic maka ib . Secara umum, jika 0ic maka fungsi

informasi butir soal mempunyai tingkatan kemampuan lebih tinggi daripada tingkat

kesukaran butir. Implikasinya, pemberian butir soal pada tahap awal proses pengujian

selayaknya menggunakan tingkat kesukaran butir lebih rendah dibandingkan dengan

tingkat kemampuan peserta tes agar supaya secara psikologis peserta tes mendapat butir

ransangan untuk menjawab butir yang lebih tinggi tingkat kesukarannya.

Page 51: CAT RRAD - Unismuh

31

Pada model 2PL ditetapkan c = 0 dan 1PL ditetapkan c = 0 dan a = konstan,

sedangkan model Rasch ditetapkan c = 0 dan a = 1. Bila model Rasch diterapkan pada

persamaan (3) maka kemampuan peserta tes sama dengan tingkat kesukaran butir soal

tanpa memperhatikan variasi nilai a dan psikologis peserta tes. Oleh karena itu,

pembentukan basis pengetahuan pada model tersebut menggunakan pendekatan

adjustment bahwa bagaimanapun dalam merespon butir soal berpeluang munculnya

kendala-kendala sehingga kemampuan peserta tes tetap lebih tinggi jika dibandingkan

dengan tingkat kesukaran butir soal bila diharapkan peserta tes merespon secara benar

suatu butir soal. Gambaran tersebut lebih dijelaskan pada persamaan fungsi informasi

butir soal.

Fungsi informasi butir soal maksimum menurut Lord dalam Hambleton dan

Swaminathan (1985:107) bahwa model 2 PL dan 1PL masing-masing mempunyai nilai

22

4

1aD dan 2

4

1D . Jika D = 1 sesuai dengan model Rasch maka fungsi informasi

maksimum mempunyai nilai 4

1. Fungsi informasi butir soal pada model Rasch

mempunyai nilai yang sama yakni 0,25 dan bergerak ke kanan dan ke kiri searah

dengan tingkat kesukaran butir dan kemampuan peserta tes. Fungsi informasi butir soal

jika peserta tes merespon butir soal ke-i sebagai berikut:

)]}(1)[({

)]([)(

2'

ii

ii

PP

PI

………….…………………… (4)

Fungsi informasi tes merupakan penjumlahan fungsi informasi butir soal yang terjadi

secara independen. Fungsi informasi tes terdapat pada persamaan (5).

n

i

iII1

)()( ……………………………………….. (5)

Page 52: CAT RRAD - Unismuh

32

e. Galat Baku Penaksiran Parameter Kemampuan

Parameter kemampuan peserta tes tidak dapat diketahui secara pasti sehingga

perlu dilakukan penaksiran. Penaksiran kemampuan menggunakan metode tertentu

tidak lepas dari galat sehingga penaksiran tersebut menghasilkan nilai pendekatan.

Artinya, jika nilai penaksiran semakin mendekati nilai kemampuan peserta tes maka

penaksiran semakin akurat dimana galat baku penaksiran parameter kemampuan

semakin kecil. Kedekatan tersebut tercermin dari nilai galat baku penaksiran parameter

kemampuan yang semakin kecil.

Penaksiran parameter butir soal terhadap parameter kemampuan peserta tes

dapat menggunakan hasil respon peserta tes. Menurut Hambleton et al. (1991: 95)

besarnya kesalahan baku bergantung beberapa hal. Pertama, jumlah butir soal yakni

semakin panjang tes semakin kecil galat baku. Kedua, kualitas butir tes yakni semakin

tinggi daya beda butir soal maka jawaban peserta tes secara benar tidak dapat diperoleh

dengan menebak. Ketiga, pemadanan antara kesukaran butir soal dengan kemampuan

peserta tes.

Galat baku penaksiran parameter kemampuan peserta tes adalah perbandingan

terbalik akar dari jumlah informasi parameter butir soal yang direspon peserta tes.

Berdasarkan hal tersebut, galat baku penaksiran parameter kemampuan dirumuskan

sebagai berikut:

)(

1)(

ISE

………………………………………… (6)

dimana )(

SE adalah galat baku penaksiran parameter kemampuan sedangkan )(I

adalah jumlah fungsi informasi butir yang direspon peserta tes atau sama dengan

persamaan (5). Galat baku parameter kemampuan peserta tes bergantung pada

keakuratan penaksiran parameter butir dan keakuratan parameter butir menaksir

Page 53: CAT RRAD - Unismuh

33

parameter kemampuan peserta tes. Hasil penaksiran parameter butir pada penelitian ini

dilakukan dengan program Bilog-MG. Ukurann sampel model Rasch adalah sekitar

500 respon butir soal.

Penaksiran parameter kemampuan peserta tes terkait dengan penaksiran

parameter butir soal. Penaksiran parameter butir soal bergantung pada metode yang

dipakai. Misalnya, metode penaksiran kebolehjadian maksimum, semakin besar ukuran

sampel menaksir parameter butir maka galat baku penaksiran semakin kecil. Penaksiran

parameter butir soal pada penelitian ini tidak diuraikan lebih lanjut, namun penelitian

Rukli (1998: 77) menggunakan program ASCAL dengan ukuran sampel 2000

menemukan bahwa penaksiran parameter butir pada bagian akhir tes kurang akurat

karena tingkat kesukaran butir soal lebih besar jika dibandingkan dengan tingkat

kemampuan peserta tes. Hal tersebut disebabkan peluang tebakan butir soal cukup

tinggi disamping penaksiran daya beda butir soal dan tingkat kesukaran butir soal

kurang akurat serta waktu respon tes terbatas.

B. Metode Penaksiran

1. Metode Maximum Likelihood Estimation (MLE) dan Bayesian

Penaksiran kemampuan peserta tes dapat dilakukan secara simultan, yakni

melakukan penaksiran kemampuan peserta tes sekaligus penaksiran parameter butir

soal jika kedua parameter tersebut diketahui. Jika hanya mengetahui parameter butir

soal atau parameter kemampuan saja maka penaksiran parameter dilakukan secara

parsial. Metode penaksiran MLE atau Bayesian dapat digunakan untuk menaksir

parameter kemampuan jika parameter butir soal diketahui.

Hambleton, et al. (1991) mengemukakan bahwa ada dua metode yang sering

dipakai pada penaksiran parameter kemampuan bila parameter butir tes diketahui,

Page 54: CAT RRAD - Unismuh

34

yaitu metode MLE dan metode Bayesian. Metode MLE termasuk metode statistik

parametrik. Hasil taksiran dapat digeneralisasikan jika asumsi tersebut memenuhi

syarat, namun jika asumsi tidak memenuhi syarat maka penaksiran parameter akan

bias. Sedangkan metode Bayesian merupakan probabilitas bersyarat. Kedua metode

tersebut memiliki kelemahan dan keunggulan sebagai berikut. Pertama, metode

Bayesian cocok digunakan bila informasi kemampuan peserta tes tersedia terkait

variabel laten, sebaliknya bila tidak tersedia maka MLE cocok dipakai. Kedua, nilai

penaksiran metode Bayesian tidak memperhatikan pola jawaban sebaliknya metode

MLE memperhatikan pola jawaban namun jika selama jawabannya benar semua atau

salah semua maka nilai penaksiran tak terhingga, akibatnya bila pola tersebut

berlangsung pada beberapa butir soal dapat menggurangi jumlah butir soal pada bank

butir soal. Ketiga, nilai penaksiran metode Bayesian tidak konsisten seiring dengan

bertambah besarnya ukuran sampel sebaliknya metode MLE konsisten seiring dengan

bertambahnya ukuran sampel. Menurut Hambleton et al. (1985:85) untuk memperoleh

penaksiran dengan metode MLE dapat menggunakan prosedur Newton-Raphson.

Perhitungan tersebut amat rumit, namun dapat dilakukan dengan pendekatan iterasi

dengan komputer.

Kedua metode tersebut telah dipakai pada beberapa produk CAT. Misalnya,

Agus Santoso (2009) menggunakan metode MLE dalam menaksir parameter

kemampuan peserta tes. MATHCAT yaitu sistem CAT yang dikembangkan di Belanda

menggunakan MLE dalam menaksir karakteristik butir dan peserta tes (Verschoor, et

al. 2000). Imai (2008) melaporkan bahwa J-CAT menggunakan metode Bayesian dalam

memilih butir soal adaptif terhadap kemampuan peserta tes. Penelitian Chen, et al.

(2007) melakukan perbandingan empat metode penaksiran kemampuan peserta tes,

yakni dua dari kelompok Bayesian yakni OWEN dan EAP, dan yang lainnya MLE

Page 55: CAT RRAD - Unismuh

35

dan WLE menunjukkan OWEN dan EAP lebih lambat konvergen dibandingkan dengan

MLE dan WLE.

2. Metode High Low

Metode high low menggunakan sistem percabangan secara adaptif sesuai

dengan pilihan aturan yang ada. Jika peserta tes menjawab suatu butir soal dengan salah

maka butir soal selanjutnya adalah butir soal tingkat kesukaran lebih rendah sebaliknya

jika peserta tes menjawab butir soal dengan benar maka butir soal selanjutnya adalah

butir soal tingkat kesukaran yang lebih tinggi. Nilai naik dan turun bergantung pada

algoritma.

Pada aturan algoritma metode high low, tingkat kesukaran butir soal dipadankan

dengan tingkat kemampuan peserta tes. Jika respon benar maka tingkat kesulitan butir

soal akan dinaikkan 0,1 atau lebih sebaliknya jika respon salah maka tingkat kesulitan

butir soal akan diturunkan 0,2 atau lebih. Lord dalam Hulin, et al. (1983: 215-217)

menyebut metode tersebut sebagai prosedur percabangan high low, yakni jika benar

dinaikkan 1,01 jj bb dan jika salah diturunkan 2,01 jj bb . Aturan tersebut

dapat mengatasi kekurangan metode MLE yang membutuhkan waktu lama dalam

pencarian butir soal selanjutnya secara iterasi. Metode high low dapat digunakan dalam

pelacakan butir soal tertentu secara adaptif.

3. Metode Heuristik

Metode heuristik dan metode analisis faktor non linier mempunyai perbedaan

dengan metode MLE dan Bayesian. Metode heuristik dan metode analisis factor non

linier tidak termasuk statistik parametrik sehingga tidak memerlukan persyaratan atau

asumsi. Menurut Urry (1974, 1978) metode heuristik dapat diaplikasikan pada model

Page 56: CAT RRAD - Unismuh

36

logistik dua dan tiga parameter, sedangkan metode analisis faktor non linier menurut

McDonald (1967, 1989) dapat diaplikasikan pada model dua parameter, namun pada

model tiga parameter, parameter peluang tebakan di-fixed-kan (Hambleton, et al.

1991:46). Metode heuristik mempunyai berbagai prosedur dan dapat digunakan dalam

berbagai tingkatan pengukuran. Menurut Corne, et al. (2000: 3) perbedaan antara

metode heuristik dengan metode lain terletak pada kemudahan dalam penaplikasiannya,

misalnya jika masalah terlalu kompleks maka program linier sulit diaplikasikan.

Ada beberapa metode heuristik yang sering dipakai yakni metode fuzzy ,

algoritma genetika, dan jaringan syaraf tiruan. Ketiga metode tersebut mempunyai

kelebihan dan perkembangan dalam berbagai bidang. Metode fuzzy misalnya,

memahami logikanya lebih mudah, menggunakan bahasa matematika, dan memiliki

aturan logika sederhana sehingga pengaplikasian pada bidang teknik dan rekayasa

sangat tinggi disamping tidak membutuhkan pelatihan pada variabel input sebagaimana

metode jaringan syarat tiruan. Sebaliknya, metode algoritma genetika membutuhkan

node-node dalam fungsinya sehingga metode tersebut membutuhkan operasi

perhitungan matematika yang tinggi. Berdasarkan hal tersebut, metode fuzzy lebih

memberikan beberapa keuntungan jika dibandingkan dengan metode lain. Misalnya,

keakuratan dalam memilih butir soal yang adaptif tanpa perlu adanya pelatihan node.

4. Logika Fuzzy

Logika fuzzy (fuzzy logic) diperkenalkan oleh Zadeh dari Universitas

California di Berkeley Tahun 1965. Zadeh mempresentasikan logika fuzzy bukan

sebagai suatu metodologi kontrol namun suatu cara pemrosesan data dengan

Page 57: CAT RRAD - Unismuh

37

penerapan partial set membership dibanding crisp set membership atau non-

membership. Logika fuzzy mempunyai karakteristik sebagai berikut.

a. Logika klasik (crisp) dan logika Fuzzy

Logika klasik dan logika fuzzy mempunyai perbedaan dalam menyatakan

tingkat suatu himpunan variabel. Gambar 2 menunjukkan logika klasik yang

mempunyai nilai kebenaran 0 atau 1, sedangkan Gambar 3 menunjukkan logika

fuzzy mempunyai nilai kebenaran antara 0 dan satu, dimana satu titik domain pada

himpunan variabel fuzzy mempunyai dua nilai derajat keanggotaan berbeda.

Gambar 2.

Representasi Himpunan Klasik

Gambar 3.

Representasi Himpunan Fuzzy

Gambar 3 menunjukkan himpunan fuzzy mudah, sedang, dan sukar pada

suatu domain dimana satu titik pada domain menghasilkan dua nilai tertentu yakni

Page 58: CAT RRAD - Unismuh

38

tingkat keanggotaan. Misalnya 1b mempunyai dua nilai keanggotaan sebesar 0,25

pada himpunan fuzzy mudah dan 0,75 pada himpunan fuzzy sedang. Gambaran

tersebut lebih mendekati bahasa alami dibandingkan dengan himpunan tegas

sehingga himpunan fuzzy lebih cocok digunakan dalam metode pencarian yang

tidak pasti. Misalnya, pemilihan butir soal yang adaptif dengan kemampuan peserta

tes dimana satu diantara butir soal tersebut lebih mendekati kemampuan peserta tes

bukan dengan penentuan secara pasti.

Logika fuzzy sebagaimana dengan logika klasik mempunyai aturan operator

penggambungan terhadap dua atau lebih himpunan. Penggabungan dua atau lebih

himpunan logika fuzzy digunakan metode fuzzy yakni mencari butir soal adaptif

terhadap karakteristik kemampuan peserta sesuai dengan ruang lingkup basis

pengetahuan yang telah ditetapkan. Menurut Corne et al. (2000: 11) kekuatan

utama logika fuzzy bergantung pada fungsi keanggotaan secara intuisi sesuai

pikiran.

b. Fungsi Keanggotaan

Fungsi keanggotaan menunjukkan suatu kurva dimana terjadi hubungan

fungsional titik input data sesuai bentangan domain himpunan fuzzy yakni nilai

domain himpunan fuzzy sebagai sumbu mendatar ke dalam nilai keanggotan

sebagai sumbu vertikal. Tingkat keanggotaan fuzzy berbeda dengan istilah

probabilitas walaupun nilai bentangan sama yakni bergerak dari 0 sampai dengan

satu. Tingkat keanggotaan fuzzy berada pada bentangan tertinggi yakni 1, artinya

semakin mendekati 1 semakin besar tingkat keanggotaannya, sedangkan semakin

mendekati 0 berarti semakin kecil tingkat keanggotannya. Interpretasi nilai pada

tingkat keanggotaan fuzzy memberikan ukuran terhadap suatu pendapat atau

Page 59: CAT RRAD - Unismuh

39

keputusan sedangkan probabilitas secara statistik menunjukkan tingkat frekuensi

terjadinya sesuatu hal yang dibicarakan. Walaupun kurva dari fungsi tersebut tidak

sama bergantung objek kajian namun fungsi keanggotaan mempunyai fitur sama.

Fitur fungsi keanggotaan kurva yakni: Pertama, core merupakan daerah

dalam himpunan fuzzy yang mempunyai nilai keanggotaan sama dengan 1 dimana

1)( xA . Kedua, support merupakan daerah dalam himpunan fuzzy dengan nilai

keanggotaan tidak nol dimana 0)( xA . Ketiga, boundary merupakan daerah

dalam himpunan fuzzy yang mempunyai nilai keanggotaan tidak nol dan tidak core

dimana 1)(0 xA . Posisi ketiga fitur fungsi keanggotaan terdapat pada Gambar

4.

Gambar 4.

Posisi Fitur pada Fungsi Keanggotaan

Ada beberapa bentuk kurva fungsi keanggotaan fuzzy yang sering

digunakan, yaitu representasi bentuk kurva linier, bentuk kurva segitga, bentuk

kurva trapezium, bentuk kurva bahu, bentuk kurva S, dan bentuk kurva lonceng

(phi, beta, dan gauss). Uraian bentuk kurva fungsi keanggotaan fuzzy sebagai

berikut. Pertama, bentuk input derajat keanggotaan menggunakan garis lurus

dalam mengaitkan dengan tingkat keanggotaan suatu variabel fuzzy. Bentuk

Page 60: CAT RRAD - Unismuh

40

kurva linear terdapat pada Gambar 5 sedangkan fungsi keanggotaannya terdapat

pada persamaan (7).

bx

bxaabax

ax

xA

;1

);(:)(

;0

)(

……………………………. (7)

Gambar 5.

Fungsi Keanggotaan Bentuk Kurva Linear

Kedua, fungsi keanggotaan bentuk kurva segitiga mempunyai fungsi

keanggotaan gabungan tiga fungsi keanggotaan linear. Gambar 6 menunjukkan

fungsi keanggotaan kurva segitiga sedangkan fungsi keanggotaannya ( )(xA )

terdapat pada persamaan (8).

cx

cxbbcxc

bxaabax

ax

xA

,0

);(:)(

);(:)(

;0

)(

…………………………… (8)

Menurut Bojadziev & Bojadziev (2007:22-23) fungsi keanggotaan bentuk

segitiga amat sering digunakan dalam aplikasi kontrol dan sistem keputusan

manajerial, bisnis, dan pemasaran.

Page 61: CAT RRAD - Unismuh

41

Gambar 6.

Fungsi Keanggotaan Bentuk Kurva Segitiga

Ketiga, fungsi keanggotaan bentuk kurva trapezium merupakan modifikasi

dari bentuk segitiga dimana terdapat lebih dari satu titik yang mempunyai nilai

keanggotaan 1. Bentuk trapezium terdapat pada Gambar 7 sedangkan fungsi

keanggotaan terdapat pada persamaan (9).

dxccdxd

cxb

bxaabax

dxax

xA

);(:)(

;1

);(:)(

;0

)(

………………………..… (9)

Gambar 7.

Fungsi Keanggotaan Bentuk Kurva Trapezium

Keempat, fungsi keanggotaan bentuk kurva bahu merupakan penggabungan

bentuk segitiga dan bentuk trapezium. Kurva bagian tengah menyatakan variabel

dalam bentuk segitiga sedangkan bagian sisi awal dan akhir yakni kanan dan kiri

merepresentasikan suatu variabel dalam bentuk trapezium. Bentuk bahu terdapat

pada Gambar 8.

Page 62: CAT RRAD - Unismuh

42

Gambar 8.

Fungsi Keanggotaan Bentuk Kurva Bahu

Kelima, bentuk kurva S merupakan bentuk kurva sigmoid yang bergerak

dari kiri dengan nilai keanggotaannya nol kearah kanan dalam bentuk S dengan

nilai keanggotannya paling kanan mendekati satu. Bentuk S mempunyai tiga

parameter, yaitu: nilai keanggotaan nol ( ), nilai keanggotaan lengkap ( ), dan

nilai keanggotaan titik infeksi ( ) dimana memiliki domain 50% benar. Kurva S

serupa dengan kurva ICC namun keduanya berbeda makna di sumbu Y dimana

sumbu Y pada kurva ICC menyatakan probabilitas sedangkan sumbu Y pada kurva

S menyatakan tingkat keanggotaan. Selanjutnya, bentuk kurva S terdapat pada

Gambar 9 sedangkan fungsi keanggotaan bentuk S terdapat pada persamaan (10).

x

xx

xx

x

xA

;1

];)(:)(2[1

;)(:)(2

;0

)(2

2

……………………. (10)

Berdasarkan hal tersebut, bentuk kurva segitiga mendeskripsikan

kedudukan titik tertentu dua himpunan fuzzy dengan satu nilai keanggotaan

tertentu jika hanya satu bentuk kurva segitiga. Satu titik himpunan fuzzy

menghasilkan dua nilai keanggotaan fuzzy jika dua atau lebih bentuk kurva

Page 63: CAT RRAD - Unismuh

43

segitiga. Secara praktik, dua atau lebih bentuk kurva segitiga yang digunakan dan

dibandingkan sesuai dengan variabel fuzzy . Hal tersebut terjadi karena variabel

fuzzy selalu dibagi dalam beberapa himpunan fuzzy . Berdasarkan hal tersebut,

fungsi informasi butir pada setiap titik kurva menghasilkan fungsi satu-satu antara

tingkat kesukaran dan tingkat kemampuan dan hanya satu titik mempunyai nilai

maksimum sesuai dengan logika penafsiran bentuk kurva segitiga. Jumlah

himpunan fuzzy pada suatu variabel fuzzy bergantung pada objek kajian yang dapat

diperoleh lewat simulasi, kajian teori, atau pakar. Oleh karena itu, fungsi

keanggotaan bentuk kurva segitiga lebih sesuai objek penelitian ini.

Gambar 9.

Fungsi Keanggotaan Bentuk Kurva S

c. Operator Dasar Logika Fuzzy

Operator dasar logika fuzzy mempunyai tiga bentuk, yaitu: AND, OR,

dan NOT. Ketiga operator tersebut dikenal juga dalam operator logika boolean

atau teori himpunan namun mempunyai aturan yang tidak sama sehingga

mempunyai penafsiran tidak sama juga kecuali NOT. Operator AND dalam teori

himpunan klasik merupakan hasil irisan antara kedua himpunan, namun pada

operator AND pada fuzzy merupakan nilai terkecil dari nilai keanggotaan

Page 64: CAT RRAD - Unismuh

44

himpunan. Aturan operator AND pada fuzzy dengan dua himpunan keanggotaan A

dan B pada persamaan (11).

])[],[min( yx BABA …………………………… (11)

Operator OR dalam teori himpunan klasik merupakan hasil gabungan antara

kedua himpunan, namun operator OR dalam pada fuzzy merupakan nilai terbesar

dari nilai keanggotaan himpunan. Aturan operator OR pada fuzzy dengan dua

himpunan keanggotaan A dan B pada persamaan (12).

])[],[( yxmaks BABA …………………………… (12)

Operator NOT dalam logika boolean merupakan hasil negasi atau

komplemen suatu himpunan sama dengan operator NOT pada fuzzy yakni satu

dikurangkan dengan nilai keanggotaan himpunan yang dikomplemenkan. Aturan

operator NOT pada fuzzy dengan himpunan keanggotaan A pada persamaan (13).

][1][1 xx AA

……………………………………. (13)

Ketiga operator tersebut mempunyai aturan logika sederhana dan fleksibel

untuk menentukan butir soal adaptif terhadap kemampuan peserta tes. Oleh karena

itu, pengembangan model CAT dengan metode fuzzy mempunyai beberapa

keuntungan, yakni: (1) memiliki performa sederhana, murah, mudah, dan

fleksibel, (2) memiliki toleransi terhadap data-data yang tidak tepat, (3) mampu

memodelkan fungsi-fungsi tidak linear, (4) membangun dan mengaplikasikan

pengalaman pakar secara langsung tanpa melewati proses pelatihan, dan (5)

menggunakan bahasa alami sehingga pengaplikasinnya semakin luas dalam

bidang teknik, rekayasa jaringan, dan sistem cerdas. Walaupun demikian, logika

fuzzy mempunyai keterbatasan disebabkan menggunakan penalaran deduktif

Page 65: CAT RRAD - Unismuh

45

dalam membangun basis pengetahuan namun dengan pendalaman teori,

pengalaman para pakar atau simulasi maka aturan if then akan lebih akurat.

Metode fuzzy sudah diterapkan dalam bidang psikometri. Misalnya,

penelitian Haryanto (2009) menggunakan empat basis pengetahuan pada metode

fuzzy Tsukamoto dalam memilih butir soal adaptif terhadap kemampuan peserta tes

dengan memadukan model TTK. Sen-Chi Yu & Berlin Wu (2006) memadukan

antara logika fuzzy dengan Partial Credit Model (PCM) dalam mereduksi

klasifikasi penskoran.

d. Fuzzy Karakteristik Butir Soal dan Basis Pengetahuan

Logika fuzzy memiliki beberapa aturan yang terkait dengan karakteristik

butir soal sebagai berikut. Pertama, variabel fuzzy menyangkut variasi nilai yang

diperhatikan dalam suatu sistem fuzzy. Dalam kaitan karakteristik butir soal,

variabel fuzzy adalah daya beda, tingkat kesukaran, dan peluang tebakan,

sedangkan kaitan karakteristik peserta tes, variabel fuzzy adalah kemampuan

peserta tes. Kedua, himpunan fuzzy adalah kondisi atau keadaan tertentu dari

variabel fuzzy . Misalnya, variabel fuzzy tingkat kesukaran butir soal ada lima

himpunan fuzzy , yakni: sangat rendah, rendah, sedang, tinggi, dan sangat tinggi.

Ketiga, semesta pembicaraan adalah keseluruhan nilai yang masuk dalam rentang

variabel fuzzy yang bisa dioperasikan pada rentang bilangan riil. Misalnya, secara

teori kemampuan peserta tes pada skala logit mempunyai semesta pembicaran

),( . Keempat, domain merupakan bagian dari semesta pembicaraan yang

dapat mengacu pada rentang himpunan fuzzy . Misalnya, semesta pembicaraan

variabel fuzzy tingkat kesukaran butir soal [-4,4] mempunyai domain himpunan

fuzzy sangat tinggi [3,4]. Kelima, fungsi keanggotaan adalah kurva yang

Page 66: CAT RRAD - Unismuh

46

menunjukkan pemetaan titik masukan data ke dalam nilai keanggotannya (derajat

keanggotaannya) yang mempunyai nilai keanggotaan antara 0 dan 1. Aturan

tersebut perlu diperhatikan dalam perancangan basis pengetahuan.

Sistem penalaran fuzzy membutuhkan basis pengetahuan tentang

karaktersitik butir soal. Basis pengetahuan tersebut berlandaskan hubungan

fungsional antara kemampuan peserta tes dalam merespon butir soal yang

tergambar pada kurva ICC. Birnbaun dalam Hambleton et al. (1991: 91)

mengemukakan bahwa fungsi informasi maksimum suatu butir soal terjadi jika

butir soal memiliki karakteristik peluang tebakan sekecil mungkin, daya beda

paling besar, dan tingkat kesukaran butir soal cocok kemampuan peserta tes.

Berdasarkan hal tersebut, persamaan (3) sebagai data preferensi dalam melakukan

simulasi pada model Rasch.

Pada basis pengetahuan model Rasch, variabel fuzzy tingkat kesukaran

butir soal dan variabel fuzzy tingkat kemampuan peserta mempunyai hubungan

adaptif. Misalnya, jika tingkat kemampuan peserta tes tinggi maka butir soal yang

cocok adalah butir soal yang mempunyai tingkat kesukaran sedang atau tinggi, dan

sebaliknya. Aturan tersebut digunakan dalam membangun basis pengetahuan

metode Futsuhilow, Fusuhilow, dan Fumahilow.

C. Sistem Penalaran Fuzzy (Fuzzy Inference Sistems)

Sistem penalaran fuzzy mempunyai tiga bagian yakni masukan, proses, dan

keluaran. Masukan dan keluaran mempunyai nilai tegas sedangkan proses adalah

mengubah nilai tegas ke nilai fuzzy (fuzzifikasi) lalu nilai fuzzy ke nilai tegas

(defuzzifikasi). Gambar 10 menunjukkan tiga proses eksekusi sebagai berikut.

Pertama, fuzzifikasi (komposisi) variabel input yaitu definisi dari himpunan fuzzy

Page 67: CAT RRAD - Unismuh

47

dan penentuan derajat keanggotaan crisp input ke sebuah himpunan fuzzy atau

mengubah masukan crisp ke sebuah variabel linguistik menggunakan fungsi

keanggotaan. Kedua, metode fuzzy merupakan evaluasi aturan fuzzy dalam

menghasilkan keluaran dari tiap aturan. Tiap aturan menggunakan aturan fuzzy jika

maka (if then) atau mengubah masukan fuzzy ke keluaran fuzzy berdasarkan aturan

basis pengetahuan. Ketiga, defuzifikasi (dekomposisi) merupakan perhitungan crisp

output dengan cara mengubah keluaran fuzzy dari mesin metode ke crisp dengan

analogi fungsi keanggotaan yang telah digunakan pada proses pertama. Proses

defuzifikasi yang membedakan ketiga mesin inferensi.

FuzifikasiMetode

(Tsukamoto, Sugeno,

dan Mamdani)

Defuzifikasi

Basis Pengetahuan

Masukan

(a,b,c)Keluaran

(θ)

Gambar 10.

Sistem penalaran Fuzzy

Ada tiga bagian yang perlu diperhatikan pada sistem metode fuzzy Gambar

10. Pertama, basis pengetahuan menyangkut karakteristik butir soal terhadap

kemampuan peserta tes pada model Rasch. Basis pengetahuan tersebut diperoleh dari

kajian teori, simulasi dengan program Microsoft Excel atau pakar. Kedua, komposisi

menyangkut agregasi atau kombinasi dari keluaran semua aturan. Ketiga, pemetaan

tidak linier, yakni sebuah sistem penalaran fuzzy mengimplementasikan pemetaan

tidak linier dari ruang masukan ke ruang keluaran. Secara umum pedoman tersebut

diperlukan pada sistem penalaran fuzzy dengan memperhatikan metode fuzzy yang

terpilih. Metode fuzzy terdiri atas metode fuzzy Tsukamoto, Sugeno, dan Mamdani.

Page 68: CAT RRAD - Unismuh

48

Ketiga metode tersebut mempunyai input serupa namun mempunyai keluaran yang

berbeda karena mempunyai sistem metode berbeda mengelola basis pengetahuan,

fuzzifikasi, dan defuzzifikasi (Jang, et al. (1995) dan Ross (2004).

1. Metode Fuzzy Tsukamoto

Karakteristik metode fuzzy Tsukamoto adalah konsekuensi dari setiap aturan

fuzzy IF-THEN yakni IF x adalah Y THEN z adalah W atau z = f ((x, Y),W) sehingga

tidak ketat mengikuti aturan komposisi atau tidak ada proses defuzifikasi. Mekanisme

demikian disebut direpresentasikan dengan fungsi keanggotaan monotonik (fungsi

bahu), yakni pengambilan keputusan output tiap aturan didefinisikan sebagai nilai tegas

disebabkan oleh nilai keanggotaannya berasal dari anteseden aturan tersebut. Misalkan,

jika tingkat kesukaran adalah sangat tinggi yang ditandai dengan tingkat keanggotaan

adalah tinggi maka tingkat kemampuan adalah sangat tinggi yang ditandai dengan

tingkat keanggotaan adalah tinggi. Operasi nilai tegas ke nilai fuzzy menggunakan

tingkat keanggotaan tiap himpunan fuzzy pada masing-masing variabel fuzzy yang

dibicarakan. Hasil akhir keseluruhan menggunakan rerata berbobot (Z).

Metode fuzzy Tsukamoto dipadukan dengan metode high low disebut metode

Futsuhilow. Metode Futsuhilow merupakan suatu teknik pencarian kemampuan

peserta jika butir soal diketahui. Karakteristik butir soal selanjutnya menggunakan

metode high low, yakni jika respon sebelumnya benar maka dinaikkan 0,1 atau lebih

namun jika salah maka diturunkan 0,2 atau lebih. Gambar 11 menunjukkan model

metode fuzzy Tsukamoto.

Page 69: CAT RRAD - Unismuh

49

Gambar 11.

Metode Fuzzy Tsukamoto

2. Metode fuzzy Sugeno

Metode fuzzy Sugeno menggunakan konstanta atau fungsi matematika sebagai

konsekuensi. Jika metode fuzzy Sugeno menggunakan konstanta sebagai konsekuensi

dikatakan model Sugeno orde nol, jika metode fuzzy Sugeno menggunakan fungsi

matematika sebagai konsekuensi dikatakan model Sugeno orde satu. Jadi konsekuensi

metode fuzzy Sugeno bukan merupakan himpunan fuzzy melainkan konstanta atau

fungsi matematika. Metode fuzzy Sugeno orde nol mempunyai aturan logika pada

persamaan (14).

IF x is A AND y is B THEN z is k ................................ (14)

dimana x, y, dan z adalah variabel linguistik, A dan B himpunan fuzzy untuk X dan Y,

dan k adalah konstanta. Sedangkan metode fuzzy Sugeno orde satu mempunyai aturan

logika pada persamaan (15).

Page 70: CAT RRAD - Unismuh

50

IF x is A AND y is B THEN z is px + qy + r ................ (15)

dimana x, y, dan z adalah variabel linguistik, A dan B himpunan fuzzy untuk X dan Y

serta p, q, dan r adalah konstanta. Proses defuzifikasi menggunakan rerata berbobot

dari nilai konstanta atau fungsi dari tiap himpunan fuzzy . Hal tersebut sebagai cara

mencari output fuzzy . Gambar 12 menunjukkan model metode fuzzy Sugeno orde satu

Gambar 12.

Metode Fuzzy Sugeno Orde Satu

Metode fuzzy Sugeno yang dipadukan dengan metode high low disebut

metode Fusuhilow. Metode Fusuhilow merupakan suatu teknik pencarian butir tes yang

adaptif terhadap kemampuan peserta tes dimana metode fuzzy Sugeno

digunakan dalam menentukan kemampuan peserta yang cocok dengan karakteristik

butir. Pencarian butir selanjutnya menggunakan metode high low yakni jika respon

Page 71: CAT RRAD - Unismuh

51

sebelumnya benar maka dinaikkan 0,1 atau lebih namun jika salah maka diturunkan 0,2

atau lebih.

3. Metode fuzzy Mamdani

Ada empat tahapan metode fuzzy Mamdani, yakni: (1) Pembentukan himpunan

fuzzy , yakni variabel masukan dan variabel keluaran dibagi menjadi satu atau lebih

himpunan fuzzy . Misalnya variabel fuzzy daya beda, maka himpunan fuzzy dapat

terdiri atas rendah, sedang, dan tinggi. (2) Produk fungsi aturan menggunakan AND,

OR, atau NOT. (3) Komposisi aturan, bila terdiri dari beberapa aturan sehingga inferensi

diperoleh dari kumpulan dan korelasi antar aturan. Ada tiga metode dalam melakukan

inferensi yakni max, additive, atau probabilistik OR. (4) Defuzzifikasi adalah konversi

dari himpunan fuzzy yang dihasilkan dari komposisi ke dalam nilai crisp dengan

metode defuzzy . Metode defuzzy yakni metode yang digunakan dalam

mengkomposisikan aturan Mamdani dalam menghasilkan solusi crisp, yakni: centroid,

bisektor, mean of maximum, largest of masimum, dan smallest of maximum.

Perbandingan posisi kelima metode tersebut dalam domain fuzzy dapat dilihat pada

Gambar 13.

Gambar 13.

Posisi Metode Defuzzy

Page 72: CAT RRAD - Unismuh

52

Gambar 13 menunjukkan smallest of max menunjukkan nilai yang paling kecil

berada pada ujung paling kiri, sedangkan largest of max terjadi sebaliknya, yakni

menunjukkan nilai paling besar yang berada pada ujung paling kanan. Mean of max

adalah titik tengah dari nilai µ yang paling tinggi, bisector of area adalah berada pada

pertengahan daerah yang diarsir, dan centorid of area adalah titik pusat dari daerah.

Metode centroid technique mempunyai keunggulan sebagai berikut. (1) Kontinu

(continuity), artinya jika perubahan masukan kecil maka tidak menghasilkan perubahan

keluaran yang besar. (2) Tidak rancu (disambiguity), yakni selalu menghasilkan nilai

yang unik. (3) Logis (plausibility) yakni berada pada daerah pendukung dan tingkat

keanggotaanya tinggi, dan (4) Perhitungan sederhana (computational simplicity).

Rumus menghitung nilai defuzzikasi dengan cara centre of gravity (COG) secara

umum dirumuskan pada persamaan (16).

b

a

A

b

a

A

xdxx

xdxxx

COG

)(

)(

................................................................. (16)

Perhitungan persamaan (16) amat rumit sehingga menggunakan program

Matlab atau pendekatan lain. Rumus pendekatan dalam menghitung COG bervariasi.

Misalnya, Wang dan Luoh (2000) menghitung COG dengan fungsi keanggotaan

bentuk segitiga pada persamaan (17).

)(3

1max

_

bxax .................................................................... (17)

dimana a dan b batas bawah dan batas atas rentang variabel fuzzy yang dihitung

sedangkan maxx adalah puncak paling tinggi tingkat keanggotaan bentuk segitiga.

Page 73: CAT RRAD - Unismuh

53

Antonio dan Gustavo (2010) melakukan update terhadap persamaan 17 sehingga

diperoleh persamaan (18).

)(3

1max

_

LR bbxx ............................................................... (18)

dimana maxx nilai maksimal Rb titik sebelah kanan pada kurva segitiga dan

Lb titik

sebelah kiri pada kurva segitiga. Model metode fuzzy Mamdani terdapat pada Gambar

14.

Gambar 14.

Metode Fuzzy Mamdani

Metode fuzzy Mamdani yang dipadukan dengan metode high low disebut

metode Fumahilow. Metode Fumahilow merupakan suatu teknik pencarian butir tes

yang adaptif terhadap kemampuan peserta tes. Metode fuzzy Mamdani digunakan

untuk menentukan karakteristik kemampuan peserta tes berdasarkan karakteristik

butir soal. Selanjutnya, mencari karakteristik butir soal yang cocok dengan

karakteristik kamampuan peserta dengan menggunakan metode high low. Aturannya,

Page 74: CAT RRAD - Unismuh

54

jika respon sebelumnya benar maka dinaikkan 0,1 atau lebih namun jika salah maka

diturunkan 0,2 atau lebih.

Ketiga metode tersebut mempunyai perbedaan pada bagian defuzifikasi

sedangkan basis pengetahuan yang digunakan hampir sama. Metoda Mamdani

menggunakan himpunan fuzzy sebagai konsekuensi rule dan komputasi lebih

kompleks, namun human-like inference. Metoda Sugeno menggunakan fungsi

matematik atau konstanta, dan mempunyai komputasi lebih efisien tetapi kehilangan

interpretabilitas linguistik. Model metode fuzzy Tsukamoto lebih sederhana karena

tidak melakukan defuzifikasi.

D. Kriteria Pengembangan Model CAT

1. Panjang Tes

Panjang tes dimaksudkan untuk menghitung keterkaitan jumlah butir soal

terhadap pemilihan metode. Jumlah butir soal yang direspon setiap peserta tes

kemungkinan besar berbeda karena aturan pemberhentian pemberian butir soal tidak

menggunakan jumlah butir soal melainkan selisih galat baku penaksiran parameter

kemampuan secara terurut. Beberapa penelitian telah mengkaji perbedaan antara

panjang tes dengan berbagai metode dan model namun kajian panjang tes kaitan

dengan CAT belum pernah dilakukan dengan metode fuzzy .

2. Tingkat Exposure Butir Soal

Exposure butir soal adalah seberapa besar munculnya butir soal yang direspon

peserta tes dimana karakteristik butir soal tidak keluar dari rentang inisialisasi

kemampuan peserta tes. Pengontrolan tingkat exposure butir soal dalam beberapa

hasil penelitian mengkaji dari perspektif bahwa tingkat exposure butir soal

Page 75: CAT RRAD - Unismuh

55

dimaksudkan sebagai tingkat kemunculan butir tersebut selama ujian. Pola berpikir

demikian terlalu dipaksakan karena secara statistik dan logika butir soal yang diberikan

disesuaikan dengan kemampuan peserta tes. Kemampuan peserta tes merespon butir

soal dalam suatu kelompok peserta tes cenderung distribusi kurva normal dimana

kemampuan ekstrim jumlah kecil dan kemampuan sedang jumlah besar sehingga suatu

kewajaran jika butir soal yang mempunyai tingkat kesukaran sedang sering muncul

sedangkan butir soal yang mempunyai tingkat kesukaran sangat tinggi dan sangat

rendah tidak sering muncul.

Pada penelitian ini, inisialisasi kemampuan peserta tes sudah di_setting yakni

peserta tes merespon tiga butir soal. Butir soal yang keluar dari bentangan himpunan

fuzzy inisialisasi kemampuan tersebut dikatakan bahwa butir tersebut sebagai butir

exposure sedangkan tingkat esposure butir soal menunjukkan jumlah butir soal yang

muncul selama ujian berlangsung yang keluar dari bentangan kemampuan tersebut

sampai penaksiran konvergen.

3. Galat Baku Penaksiran Parameter Kemampuan Peserta Tes

Tiap peserta tes merespon butir soal yang berlainan sesuai dengan kemampuan

masing-masing sehingga galat baku penaksiran parameter kemampuan berbeda.

Perbedaan tersebut mengacu pada pengertian bahwa setiap butir soal mengukur

kemampuan laten peserta tes berlainan. Penelitian yang terkait dengan galat baku

penaksiran parameter kemampuan pada model Rasch belum pernah menggunakan

metode fuzzy .

4. Waktu Respon Butir Soal

Waktu respon butir soal merupakan rerata waktu yang dibutuhkan peserta tes

dalam merespon suatu butir soal selama ujian. Waktu respon peserta tes menjadi

Page 76: CAT RRAD - Unismuh

56

kriteria dalam pengembangan produk CAT karena setiap peserta tes menempuh jumlah

waktu yang berbeda-beda baik dalam menjawab butir soal dalam menyelesaikan suatu

ujian. Oleh karena itu, jumlah waktu respon merupakan kriteria yang diperlukan dalam

membandingkan metode fuzzy .

E. Decision Support System (DSS)

DSS adalah sistem informasi berbasis komputer yang menyediakan dukungan

informasi interaktif bagi manajer dan praktisi bisnis dalam proses pengambilan

keputusan. Scoot-Morton (Turban, et al. 2001) mengemukakan bahwa DSS

merupakan sistem interaktif berbasis komputer dengan memanfaatkan data dan model

untuk meenyelesaikan masalah tidak terstruktur. McLeod dan Schell (2007)

mengemukakan kegunaan DSS yakni membantu manajer dalam menyelesaikan

masalah semi terstruktur dan mendukung penilaian manajer. Lebih lanjut dikatakan

bahwa DSS bukan mencoba menggantikan manajer namun lebih meningkatkan

efektifitas daripada efisiensi pengambilan keputusan. Berdasarkan hal tersebut, DSS

merupakan sistem pemodelan berbasis komputer yang interaktif untuk mendukung

pembuatan keputusan bisnis yang semiterstruktur.

DSS menggunakan model analitis, database khusus, penilaian, dan pandangan

pembuat keputusan dalam proses pengambilan keputusan. Hal tersebut berguna untuk

mendukung keputusan manajer dalam melaksanakan pekerjaan yang bersifat analitis,

dalam situasi yang kurang terstruktur dengan kriteria yang kurang jelas. Walaupun

DSS bukan untuk mengotomatisasi pengambilan keputusan namun memberikan

perangkat interaktif yang memungkinkan pengambil keputusan dapat melakukan

Page 77: CAT RRAD - Unismuh

57

berbagai analisis dengan model yang tersedia. Pengambilan keputusan tersebut

memerlukan suatu model dalam mengkaitkan dengan komponen-komponen lain.

Menurut McLeod & Schell (2007) model adalah penyederhanaan dari sesuatu,

sedangkan menurut Turban, et al. (2001) model adalah representasi atau abstraksi

realitas yang disederhanakan. Representasi sistem dan masalah berdasarkan model

dapat dilakukan dengan berbagai tingkatan, yaitu: 1) model ikonik, yakni model

abstraksi paling terkecil yang merupakan refleksi fisik dan sebuah sistem, biasanya

berdasarkan skala dimana model ikonik dapat muncul dengan wujud tiga dimensi

(miniatur), 2) model analog adalah model menyerupai apa adanya atau sistem riil

namun model tersebut lebih abstrak dibandingkan dengan model ikonik yang

merupakan representasi simbolik dan realitas serta biasanya bervariasi baik dalam

bentuk bagan maupun bentuk diagram dua dimensi, dan 3) model matematika

(kuantitatif), yakni model yang lebih kompleks yang berhubungan sistem organisasi

yang tidak dapat disajikan dalam model ikonik dan analog dimana model ini sering

dipakai analisis DSS yang dilakukan secara numerik atau kuantitatif yang lain. Model

Rasch dan metode fuzzy memerlukan analisis kuantitatif sehingga diantara ketiga

model tersebut model matematika lebih memenuhi syarat.

Komponen yang membangun model matematika, yakni model Rasch, metode

Futsuhilow, Fusuhilow, dan Fumahilow, transformasi theta ke skor, model himpunan

fuzzy , dan model pembobotan. Selanjutnya, struktur model matematika DSS

melibatkan beberapa variabel. Pertama, variabel keputusan berupa variabel input

yakni tingkat kesukaran butir. Kedua, variabel kontrol yakni pengaruh lingkungan,

misalnya tingkat kecemasan dan kemampuan komputer. Ketiga, variabel antara

(intervening) yakni kemampuan peserta tes berupa skor yang telah ditranformasikan.

Kemampuan peserta tes pada skala logit ditrasformasikan ke dalam bentuk skor

Page 78: CAT RRAD - Unismuh

58

dengan beberapa ketentuan. Menurut Field (2000: 4-7) untuk mentrasformasikan data

statistik dilakukan dengan tidak mengubah substansi dasar sebaran data baik variannya

maupun tendensi sentralnya. Beberapa model menggunakan bilangan dasar 9 atau

algoritma bilangan e sebesar 0,455. Cara lain menggunakan perbandingan nilai terbesar

dan terkecil dari dua skala. Skala kemampuan peserta tes theta adalah [-4,4]

ditransformasikan pada skala [0,100] sehingga didapat persamaan (19).

508

100 X …………………………………………. (19)

Keempat, variabel hasil merupakan tingkatan efektifitas sistem berupa variasi

nilai. Nilai pembobotan terhadap skor tiap peserta tes dan komponen lain yang

dilakukan oleh user menghasilkan urutan kemampuan peserta tes.

Keempat tahapan tersebut menghasilkan suatu sistem cerdas. Turban, et al.

(2001) mengemukakan bahwa kecerdasan bisnis adalah sekumpulan inovasi teknis

dan proses data yang berfokus pada akselerasi pengambilan keputusan,

mengidentifikasi, mengkalkulasi, dan mendistribusikan informasi mission-critical

terkini sesuai kriteria (preferensi) user.

F. Struktur DSS pada CAT

DSS sebagai sistem informasi tambahan dalam CAT dimana DSS

menghasilkan informasi laporan kelulusan peserta tes. Setiap peserta tes yang telah

mengikuti ujian pada CAT memiliki hasil ujian pada tiap domain. Selanjutnya, hasil

ujian tersebut diproses lebih lanjut dalam mekanisme DSS berupa pembobotan yang

dilakukan oleh pimpinan. Pembobotan tersebut menyangkut SKL, domain, dan

kriteria penilaian dengan proporsi tiap komponen tersebut berbeda-beda sesuai

dengan preferensi pimpinan. Hasil pembobotan tersebut ditindaklanjuti dengan

Page 79: CAT RRAD - Unismuh

59

penetapan jumlah dan kemampuan minimal peserta tes sesuai dengan kuota yang ada.

Hasil penetapan tersebut menghasilkan informasi kelulusan bagi peserta tes yang dapat

diakses oleh user. Struktur DSS dalam CAT terdapat pada Gambar 15.

Gambar 15.

. Struktur DSS dalam CAT

G. Hasil-hasil Penelitian CAT yang Relevan

Hasil penelitian mengenai produk CAT sudah banyak diaplikasikan secara

online (van der Linden & Glass, 2010). Beberapa produk CAT tersebut memiliki

spesifikasi pengembangan yang berbeda-beda sebagai berikut.

1. Produk J-CAT

Shingo Imai (2008) mengemukakan rancangan properti CAT di Jepang dengan

nama J-CAT. Produk tersebut menggunakan model 3PL dengan spesifikasi tertentu,

yakni versi tes testlet, batasan waktu ditetapkan 30 detik sampai lima menit tiap butir,

dan setiap seksi memuat 60 butir. CAT tersebut menggunakan bahasa Jepang dan

Inggris. Sistem operasi menggunakan sistem operasi XP atau Vista. Proses awal ujian

ditetapkan nilai max dan min sama dengan nol. Hasil tiap seksi ditampilkan serta rerata

keempat seksi ditampilkan di screen pada akhir tes.

Page 80: CAT RRAD - Unismuh

60

2. Produk OAVTS.

Wen-shuenn Wu (2004) mengemukakan rancangan properti CAT di Taiwan

dengan nama OAVTS. CAT berbasis online memiliki tiga antar muka yakni peserta tes

mengambil ujian, guru atau pembuat tes menyajikan, mengedit dan meng-upload butir

soal, dan administrator yang menangani sistem dan semua butir soal. Klasifikasi

tingkat kesukaran tatabahasa terbagi enam tingkatan. Tatabahasa tersebut mengacu

pada tiga sumber kamus Inggris yakni Collins COBUILD English Dictionary for

Advanced Learner, Macmillan English Dictionary for Advanced Learner American

English, dan Longman Dictionary of Contemprorary English. Pendefinisian kode butir

soal terdiri 10 tahap dan aturan pemberhentian tes bergantung pada level. Untuk level

tiga diberi waktu 15 menit, level empat diberi waktu 15 menit untuk tiga butir soal

menjawab benar, dan 15 menit untuk tiga butir bagi peserta tes yang menjawab salah.

Jika menjawab 3 butir secara benar, maka naik ke level 4, namun jika gagal maka

diberikan butir yang lebih mudah pada level 2 dan akan dibatasi oleh waktu selama 15

menit. Butir yang pertama kali diberikan pada peserta tes adalah level tingkat kesukaran

menengah dari bank butir soal dengan tiga aturan pemberhentian, yakni target tingkatan

akurasi pengukuran tercapai, butir soal yang tersedia tidak ada lagi, dan jumlah waktu

yang telah ditetapkan telah habis. Model pengukuran menggunakan IRT. Pengamanan

ujian menggunakan beberapa tahap, yakni tampilan soal dalam bentuk full screen, fitur

klik kanan pada mouse dikunci, fungsi backspace dikunci agar tidak kembali ke butir

soal sebelumnya, dan Uniform Resource Locator (URL) ujian hanya akan valid selama

batasan waktu ujian.

3. Produk SIETTE

Guzman (2005) mengemukakan pengembangan property CAT di Spanyol

dengan nama SIETTE. Walaupun CAT tersebut berbasis web namun dapat standalone

Page 81: CAT RRAD - Unismuh

61

atau berbasis lain. CAT tersebut sebagai alat diagnosis. SIETTE menggunakan

bahasa Inggris dan Spanyol namun terbuka untuk bahasa lain. Arsitekturnya terbagi

tiga, yakni interface untuk siswa yang disebut sebagai ruang siswa, interface untuk guru

yang disebut sebagai lingkungan penulisan. Diantara keduanya ada penyimpanan

model peserta tes (history) dan basis pengetahuan. Guru melakukan login dengan

password yang diberikan oleh admin. Selanjutnya, interface ketiga yang terbagi dua

sebagai interface Admin, sebelah kiri mengenai kurikulum sedangkan sebelah kanan

seleksi elemen untuk update. Topik yang sama dapat diakses oleh guru yang berbeda.

Kriteria seleksi butir terbagi dua, yakni kriteria adaptive Owen yaitu butir yang

terseleksi mengecilkan distribusi variance posterior pengetahuan peserta tes dan

kriteria berdasarkan tingkat kesukaran (ICC). Teknik penilaian menggunakan

mekanisme diskret Bayesian. Definisi bentuk butir soal terdiri dari bentuk tes benar

salah, pilihan ganda, jawaban bertingkat, dan butir soal koreksi sendiri (kunci jawaban

sudah ada di basis data).

4. Produk Computer-Adaptive Multiple Choice Assessment (CAAS)

Sie Hoe, Lau, et al. (2005) mengemukakan Computer-Adaptive Multiple

Choice Assessment (CAAS) dikembangkan di Malaysia. CAT tersebut menggunakan

butir soal bentuk tes pilihan ganda dan menggunakan teknik penskoran Number Right

Elimination Testing (NRET) yakni sebuah metode hybrid memadukan antara Number

Right (NR) dan Elimination Testing (ET). Sistem penskoran NRET menutut peserta

tes mencari jawaban dengan tiga alternatif yakni benar, salah dan tidak yakin untuk

tiap pilihan pada tiap butir. Jika ada 4 pilihan untuk tiap butir maka ada 12

kemungkinan untuk menjawab pada butir tersebut. Bentuk respon NRET menetapkan

Page 82: CAT RRAD - Unismuh

62

empat basis pengetahuan, yakni 1) pengetahuan penuh, yakni menjawab benar dan

tiga lainnya diidentifikasi sebagai tidak benar, 2) pengetahuan sebagian, yakni ada

lima kemungkinan dimana tiga jawaban benar dan dua jawaban salah, 3) tidak ada

pengetahuan, yakni jawaban salah, dan tidak ada pilihan dianggap salah, 4)

Ketidakmengertian sebagian yakni jawaban diidentifikasi tidak benar dan

diidentifikasi 2 pilihan sebagai tidak benar dan 1 pilihan yang tidak benar, dan 5)

Ketidakmengertian penuh yakni identifikasi hanya jawaban sebagai

pengindentifikasin tidak benar. Penetapan skor masing-masing tingkatan bergerak

dari [-3,4], dimana -3 artinya ketidakmengertian sama sekali, dan 4 pengertian penuh.

Semua hasil aturan penskoran tersebut dijadikan unpan balik bagi peserta tes dengan

mereviu pertanyaan pada tiap level pengetahuan.

5. Produk Graduate General Examination (GRE)

Graduate General Examination (GRE) CAT yaitu produk pengujian yang

dikembangkan pada tahun 1993 di Amerika Serikat dengan fokus pada ujian akhir

(kelulusan). GRE memuat tes kemampuan umum dan tes prestasi belajar khusus

pada mata pelajaran teknik rekayasa dan psikologi. Produk tersebut dikelola langsung

oleh Educational Testing Service (ETS) dengan tujuan membantu lulusan sekolah

dalam mengidentifikasi dan menyeleksi siswa yang lulus dengan layanan program

pengujian penuh. Walaupun telah dipakai bertahun-tahun namun produk GRE masih

terus disempurnakan. Mills, C. N & Steffen, M. (1999) mengemukakan kondisi GRE,

yakni: butir soal pada GRE tumpang tindih antar butir soal pada level kemampuan

peserta tes, kelangsungan kualitas butir yang sudah kadaluarsa (over time), dan

penskoran yang tidak lengkap.

Page 83: CAT RRAD - Unismuh

63

6. Produk MATHCAT

MATHCAT yaitu produk CAT yang dikembangkan di Belanda pada awalnya

untuk pendidikan orang dewasa. MATHCAT menggunakan bank butir soal khusus

materi matematika dengan empat domain kognitif, yaitu berbasis konsep dan

keterampilan, geometri, statistik, dan aljabar. Butir-butir yang digunakan pada

umumnya butir soal jawaban pendek sedangkan yang lainnya pilihan ganda dengan

format yang sama. Kemudian MATHCAT diperluas pada tes penempatan dan tes

prestasi belajar. Fitur-fitur MATHCAT sebagai berikut. Pertama, MATHCAT

menggunakan model logistik dua parameter dimana nilai daya beda butir dan tingkat

kesukaran butir. Butir soal dianalisis dengan metode penaksiran kebolehjadian

maksimum kondisional, sedangkan penaksiran kemampuan dianalisis dengan metode

kebolehjadian maksimum dimana kedua metode tersebut menggunakan software

OPLM. Butir soal yang tidak terkalibrasi tidak dimasukkan dalam tes adaptif. Kedua,

cut score melalui tiga prosedur, yaitu: (1) membagi konten tiga bagian dengan label

tingkat 1, tingkat 2, dan tingkat 3 sesuai dengan tingkatan kursus, (2) melakukan

perhitungan rata-rata tingkat kesukaran butir pada tiap tingkatan, dan (3)

menggunakan persamaan dasar model OPLM.

Hasil-hasil penelitian lain yang relevan dengan tema penelitian sebagai berikut.

Pertama, hasil penelitian Triantafillou, et al. (2006) memperluas CAT pada

mobile devices. Selanjutnya, CAT tersebut menggunakan model Rasch dan

inisialisasi awal kemampuan sama dengan satu. Kedua, tes adaptif berbasis komputer

dalam proses pembelajaran menggunakan web service dikaji Phankokkruad, et al.

(2008) di Bangkok. Tes adaptif tersebut mengintegrasikan basisdata yang berbeda

platform baik dan segi basis data maupun dan segi sistem operasinya. Ketiga,

Anastasions (2005) mengemukakan daerah orientasi informasi pada butir tes adalah

Page 84: CAT RRAD - Unismuh

64

konten, waktu, tingkat kesukaran, skor, perbandingan antar peserta tes, presentasi,

media dan format, komunikasi dan kolaborasi, umpanbalik, kontrol pada tes,

karakteristik peserta tes, dan bentuknya serta dampak pada pendidikan.

Selanjutnya, hasil penelitian CAT di Indonesia baru pada tahap pengembangan

dan belum diaplikasikan secara online. Penelitian Agus Santoso (2009) melakukan

pengembangan CAT dengan model logistik tiga parameter pada ujian Universitas

Terbuka. Produk CAT tersebut berbasis desktop. Penelitian Rukli (2010) melakukan

pengembangan CAT dengan model 1PL serta dilengkapi DSS. CAT tersebut melibatkan

tiga aktor yakni admin, peserta tes, dan PT, serta menggunakan butir soal UN SMA

pada mata pelajaran matematika, bahasa Indonesia, dan bahasa Inggris. Aturan

pemberhentian menggunakan selisih dua galat baku penaksiran butir berturut-turut

lebih kecil atau sama dengan 0,01.

Lebih lanjut, Haryanto (2009) mengembangkan CAT dengan metode

Tsukamoto berdasarkan model pengukuran TTK dalam memilih butir soal bentuk tes

pilihan ganda dengan beberapa spesifikasi. Berdasarkan hal tersebut, CerdasCAT

mempunyai rancangan spesifikasi-spesifikasi tertentu yang membedakan dengan

produk lainnya, misalnya model CAT hasil penelitian Haryanto (2009). Spesifikasi

tersebut berbeda dengan spesifikasi CAT yang dikembangkan dengan rincian sebagai

berikut. (1) Metode model CAT menggunakan metode fuzzy Tsukamoto, Sugeno, dan

Mamdani yang dipadukan dengan metode high low dalam memilih butir soal yang

adaptif sedangkan Haryanto hanya menggunakan metode fuzzy Tsukamoto.

Pengembangan CAT dengan satu metode menghasilkan data satu sisi saja namun

pengembangan CAT dengan tiga metode secara terpisah akan memberikan data lebih

lengkap, misalnya perbandingan tingkat keakuratan penaksiran butir terhadap

kemampuan peserta tes. (2) Pengembangan CAT menggunakan model Rasch dengan

Page 85: CAT RRAD - Unismuh

65

membandingkan panjang tes, tingkat exposure butir soal, galat baku penaksiran

kemampuan peserta tes, dan waktu respon butir soal sedangkan Haryanto

menggunakan TTK tanpa perbandingan. Model Rasch dibandingkan TTK memberi

argumentasi yang lebih kokoh terutama karakteristik butir soal dan penafsirannya. (3)

Karakteristik tingkat kesukaran butir soal dipadukan dengan tingkat kemampuan

dalam konsep model Rasch sedangkan Haryanto daya beda dan tingkat kesukaran

dipadukan dengan skor peserta tes dalam konsep TTK.

Tabel 3.

Perbandingan Produk CAT

No Nama/Nama CAT Metode Model DSS Aturan

Keberhentian

1 Singo Imai / J_CAT Statistik 3 PL Tidak ada )max( msMdm

)min( mfMum

2 Wen-shuenn Wu/

OAVTS

Statistik IRT Tidak

Ada

Bergantung pada

waktu

3 Guzman /SIETTE Kriteria adaptive

Owen’s dan b

IRT Tidak

Ada

Kecukupan materi

4 Sie Hoe Lau, et al. /

CAAS

Hybrid - Tidak

Ada

Selisih SE < 0,01

5 Mills, C. N &

Steffen /GRE

Statistik IRT Tidak

Ada

Alokasi Materi

6 Agus/CAT Statistik 3PL Tidak

Ada

SE = 0,30 dan

jumlah butir soal

7 Haryanto/CAT Fuzzy

Tsukamoto

Tes

Klasik

Tidak

Ada

Alokasi Materi

8 Rukli/UniversiCAT Statistik 1PL Ada Selisih SE < 0,01

9 Rukli/CerdasCAT Futsuhilow

Fusuhilow

Fumahilow

Rasch Ada Selisih SE < 0,01

Selanjutnya, (4) jumlah pengklasifikasian variabel fuzzy tingkat kesukaran

butir soal yakni sangat rendah, rendah, sedang, tinggi, dan sangat tinggi sehingga lebih

halus memberikan butir soal sedangkan Haryanto melakukan klasifikasi tingkat

kesukaran rendah, sedang, dan tinggi. Penambahan kriteria tersebut akan lebih

Page 86: CAT RRAD - Unismuh

66

memperhalus pemilihan butir soal adaptif terhadap kemampuan peserta tes. (5)

Penambahan DSS memberikan informasi kepada user bukan hanya data kemampuan

peserta tes namun informasi pelaporan kelulusan sedangkan Haryanto tidak tersedia.

Penambahan DSS memberi kesempatan kepada user untuk melakukan pembobotan

dan menentukan kriteria kelulusan sesuai preferensinya.

Adapun perbandingan nama, metode, model, DSS, dan aturan keberhentian

produk CAT terdapat pada Tabel 3.

H. Kerangka Berpikir

Berdasarkan kajian teori dan hasil penelitian relevan, maka kerangka berpikir

penelitian ini mempunyai tiga tahapan, yakni analisis butir soal, karakteristik model

CAT, dan prosedur DSS dalam model CAT. Adapun rincian uraian tiap tahapan

sebagai berikut.

1. Analisis Butir Soal

Data respon peserta tes dan butir soal diambil dari hasil ujian UN SD. Data

tersebut diolah dengan program Bilog-MG untuk menentukan tingkat kesukaran

butir soal dan nilai sig Kai_Kuadrat. Nilai sig Kai_Kuadrat untuk mengetahui butir soal

yang cocok dan tidak cocok dengan model Rasch. Butir soal yang cocok dengan

model di masukkan ke bank butir soal, sedangkan yang tidak memenuhi model

dianalisis secara kualitatif dengan asumsi bahwa tingkat kesukaran butir soal tidak

berubah secara signifikan jika butir soal tersebut dianalisis secara kualitatif.

Selanjutnya butir tersebut dimasukkan dalam bank soal CAT.

2. Pemodelan Karakteristik CAT

Inisialisasi kemampuan peserta tes menggunakan tiga butir soal dari bank butir

soal. Butir soal tersebut dipilih oleh admin dalam satu kali ujian. Ketiga butir

Page 87: CAT RRAD - Unismuh

67

soal diurutkan oleh sistem dari atas ke bawah berdasarkan tingkat kesukarannya,

yakni dari mudah ke sukar. Misalkan, admin memilih tiga butir 1, 2, dan 3. Jika

butir soal (1,2,3) dijawab benar maka tingkat kemampuan sama dengan tiga,

selanjutnya diberikan butir soal pada kategori sangat sukar (tiga atau lebih kecil tiga),

jika butir soal (1), (1,2) atau (1,3) dijawab benar maka tingkat kemampuan sama

dengan dua, selanjutnya diberikan butir soal pada kategori sukar (dua atau lebih kecil

dua), jika hanya butir soal (1,2) atau (2) dijawab benar maka tingkat kemampuan

sama dengan nol, selanjutnya diberikan butir soal pada kategori sedang (nol atau lebih

kecil nol), jika hanya butir soal (3) dijawab benar maka tingkat kemampuan sama

dengan -dua, selanjutnya diberikan butir soal pada kategori mudah (-dua atau lebih

kecil -dua), dan jika tidak ada butir soal dijawab benar maka tingkat kemampuan sama

dengan –tiga, selanjutnya diberikan butir soal pada kategori sangat mudah (-tiga atau

lebih kecil -tiga). Jadi butir tes pertama yang diberikan oleh sistem ke peserta tes

selalu lebih kecil atau sama dengan nilai inisialisasi kemampuan.

Pemilihan butir soal selanjutnya menggunakan aturan fuzzy dari tiap metode

fuzzy . Metode tersebut mentransformasikan tingkat kesukaran butir soal ke tingkat

kemampuan peserta tes sesuai dengan mekanisme tiap metode. Metode tersebut

dioptimalisasi dengan metode high low. Jika respon benar maka tingkat kesulitan

butir soal dinaikkan 0,1 atau lebih, sebaliknya jika respon salah maka tingkat

kesulitan butir soal diturunkan 0,2 atau lebih. Selanjutnya, menghitung galat baku

penaksiran kemampuan peserta tes, selisih galat baku penaksiran kemampuan

peserta tes, kemampuan peserta tes, skor, dan waktu respon butir soal. Jika selisih

galat baku penaksiran kemampuan peserta tes dari hasil respon dua butir soal

berturut-turut dengan nilai lebih kecil atau sama dengan 0,01 maka pengujian

diberhentikan oleh sistem. Artinya, jika diberikan butir soal tambahan maka

Page 88: CAT RRAD - Unismuh

68

kemampuan peserta tes tidak berubah secara signifikan. Jika masih ada domain yang

diujikan maka dilanjutkan proses sebagaimana langkah-langkah sebelumnya.

Pelaksanaan ujian peserta tes pada model CAT melalui beberapa tahapan

sebagai berikut. Peserta tes memasukkan username dan password kemudian

melakukan verifikasi nomor tes. Jika ketiga hal tersebut di-entry secara benar maka

peserta tes baru dapat menempuh ujian dengan metode dan domain yang ada. Peserta

tes memilih domain tersebut, selanjutnya mengerjakan tiga butir soal sebagai

inisialisasi kemampuan. Peserta tes merespon ketiga butir tersebut dengan alokasi

waktu sembilan menit. Hasil respon ketiga butir tersebut menentukan butir

selanjutnya. Selanjutmya, peserta tes merespon butir demi butir selama tiga menit

setiap butir. Jika selama tiga menit tidak menjawab maka dianggap salah sehingga

diberikan soal selanjutnya yang lebih mudah yakni diturunkan 0,2 atau lebih, dan jika

benar maka dinaikkan 0,1 atau lebih. Selama ujian berlangsung, kemampuan peserta

tes, galat baku penaksiran kemampuan peserta tes, selisih galat baku penaksiran

kemampuan peserta tes dan waktu respon peserta tes terus di_update oleh sistem. Jika

penaksiran kemampuan peserta tes konvergen maka pemberian butir soal selesai,

selanjutnya dilaporkan skor peserta tes tersebut pada domain tadi. Hal tersebut

dilakukan dengan cara yang sama pada domain yang lain sampai semua domain yang

telah ditetapkan.

Hasil ujian peserta tes langsung dapat dilihat dan dicetak berupa identitas

peserta tes (nomor peserta tes, nama lengkap, metode, inisialisasi, model, penyajian

soal, nama sekolah, dan foto peserta tes), nilai kuantitatif (id_soal, SKL dari mana

butir soal berasal, tingkat kesukaran butir soal, nilai respon (1 atau 0), galat baku,

selisih galat baku, theta akhir, skor, dan waktu respon butir masing-masing saat ini)

serta kurva kecenderungan pergerakan butir soal terhadap kemampuan peserta tes.

Page 89: CAT RRAD - Unismuh

69

Hal tersebut diharapkan bermanfaat dalam mendiagnosis peserta tes secara dini.

Laporan hasil respon peserta tes untuk tiap domain dan kurva trace kemampuan

peserta baik secara kuantitatif berupa skor maupun secara grafik. Informasi tersebut

bermanfaat bagi peserta tes, tergambar butir soal yang respon salah dan benar

sehingga lebih informatif sebagai bahan remedial selanjutnya. Hasil ujian tersebut

dapat dilihat dan dicetak secara langsung saat setelah ujian baik peserta tes maupun

wali peserta tes.

3. Prosedur DSS dalam CAT

Skor yang diperoleh peserta tes pada saat ujian di CerdasCAT kemudian

diolah kembali sesuai konsep DSS. Pimpinan sebagai aktor melakukan pembobotan

terhadap butir soal secara tidak langsung melalui SKL. Nilai pembobotan tiap SKL

dalam domain tersebut menjadi referensi bagi pimpinan sesuai dengan kebutuhan

institusinya. Jumlah pembobotan tiap SKL di tambah nilai yang diperoleh peserta tes

menjadi nilai tiap domain. Domain yang ada kemudian dibobot sesuai dengan

preferensi kebutuhan pimpinan. Jumlah bobot domain menjadi nilai ujian pada

CerdasCAT tiap peserta tes bersangkutan. Disamping nilai ujian tersebut, pimpinan

juga mempertimbangkan nilai lain, misalnya nilai ujian sekolah, pengamatan sehari-

hari, dan lainnya sebagai syarat kelulusan bagi setiap peserta tes. Nilai-nilai tersebut

kemudian dibobot sesuai dengan preferensi kebutuhan pimpinan. Jumlah nilai bobot

tersebut menjadi nilai akhir peserta tes bersangkutan dalam bersaing dengan peserta

lain. Nilai akhir tiap peserta tes tersebut kemudian disaring dengan dua kriteria yakni

skor minimum dan kuota maksimum. Hasil penjaringan tersebut kemudian diurut

secara ascending sehingga didapat informasi peseta tes yang lulus saringan. Hasil

kelulusan tersebut kemudian dapat diakses oleh peserta tes, pengajar, dan wali peserta

Page 90: CAT RRAD - Unismuh

70

tes untuk dilihat atau dicetak. Adapun skema kerangka berpikir model CAT terdapat

pada Gambar 16. Selanjutnya, kerangka berpikir tersebut dioperasionalkan di Bab III

dengan model RRAD dalam menjawab pertanyaan penelitian.

Bank Butir Soal

Proses Ujian pada Aplikasi CAT

Persiapan

Anaisis

Secara

Kualitatif

Analisis

Data Data Uasbn

Analisis Data Informasi Butir Butir Soal Baik

Peserta Tes

Pilih Domain

Pengerjaan Output

Respon Butir Soal

Sesuai Metode

Update

Karakteristik

Peseta Tes

Konvergen

Jumlah Butir

Username, Password

Verifikasi Nonor Ujian

Inisialisasi

Kemampuan

Trace

Kemampuan

Waktu Respon

Tingkat

Exposure

Galat baku

Bobot SKL Bobot KriteriaBobot DomainHasil Kelulusan

Kemampuan

Gambar 16.

Pola Kerangka Berpikir Model CAT

I. Pertanyaan Penelitian

1. Apakah hasil simulasi CerdasCAT sesuai rancangan metode Futsuhilow,

Fusuhilow, dan Fumahilow dengan memperhatikan tingkat kemampuan peserta

tes, panjang tes, tingkat exposure soal, dan galat baku penaksiran parameter

kemampuan dalam berbagai pola respon?

Page 91: CAT RRAD - Unismuh

71

2. Apakah hasil uji coba CerdasCAT secara one to one dengan metode Futsuhilow,

Fusuhilow, Fumahilow sesuai peran user?

3. Apakah hasil uji coba CerdasCAT secara one to one dengan metode Futsuhilow,

Fusuhilow, Fumahilow sesuai tingkat ketersediaan butir soal di bank butir soal?

4. Bagaimanakah hasil uji coba terbatas CerdasCAT dengan metode Futsuhilow,

Fusuhilow, dan Fumahilow berdasarkan panjang tes?

5. Bagaimanakah hasil uji coba terbatas CerdasCAT dengan metode Fumahilow,

Fusuhilow, dan Fumahilow berdasarkan tingkat exposure butir soal?

6. Bagaimanakah hasil uji coba terbatas CerdasCAT dengan metode Futsuhilow,

Fusuhilow, dan Fumahilow berdasarkan galat baku penaksiran parameter

kemampuan peserta tes?

7. Bagaimanakah hasil uji coba terbatas CerdasCAT dengan metode Futsuhilow,

Fusuhilow, dan Fumahilow berdasarkan waktu respon butir soal?

8. Bagaimanakah prosedur penerapan DSS dalam CerdasCAT menghasilkan informasi

laporan kelulusan sesuai dengan kriteria user?

Page 92: CAT RRAD - Unismuh

72

BAB III

METODE PENELITIAN

A. Pengembangan model

Penelitian ini termasuk jenis penelitian Research and Development (R & D)

dengan model Revised of Rapid Application Development (RRAD ) dalam

mengembangkan model CAT. Model RRAD merupakan model revisi dari model RAD

sedangkan model RAD merupakan metode hybrid dari model System Development Life

Cycle (SDLC) dan model prototipe. Martin, et al., (2005: 400) membagi model RAD

dalam empat tahap yakni requirements planning, user design, construction, dan

cutover. Tahapan tersebut dapat terjadi secara siklus bilamana keinginan user belum

terakomodasi secara optimal. Sedangkan O’Brien (2005: 344) membagi RAD menjadi

empat tahapan juga namun mempunyai spesfikasi yang berbeda dengan penekanan

pengguna akhir, yakni identify an end user’s businees requirements, develop businees

system prototypes, revise the prototypes to better meet end user requirements, dan use

and maintain the accepted business system.

Jika diperhatikan keempat tahapan model RAD dari dua pendapat tersebut

maka keempat tahapan dapat dibagi dalam lima tahapan yakni pemodelan bisnis,

pemodelan data, pemodelan proses, pembentukan aplikasi, dan pengujian. Kelima

tahapan tersebut merupakan tahapan pengembangan model CAT. Model CAT yang

telah menjadi produk CerdasCAT disebarluaskan dalam kegiatan kajian ilmiah baik

menyangkut teori, metode, maupun dari segi kemanfaatan serta prosedur pemakaian

produk. Kegiatan tersebut merupakan bagian integral dalam meyankinkan user

terhadap produk. Kegiatan tersebut merupakan tahapan diseminasi hasil penelitian.

Jadi, diseminasi produk dimaksudkan untuk melakukan penyebaran informasi produk

Page 93: CAT RRAD - Unismuh

73

lewat suatu kajian atau pertemuan ilmiah baik menyangkut teori, metode, maupun

produk yang dihasilkan sehingga menambah tingkat kepercayaan user terhadap

produk. Oleh karena itu, kelima tahapan tadi ditambah menjadi enam tahapan yang

diberi nama Revised of Rapid Application Development (RRAD ).Model RRAD terdapat

pada Gambar 16.

Berdasarkan hal tersebut, pengembangan model mempunyai beberapa

keuntungan, yakni lebih cepat rampung, lebih fokus pada syarat sistem, dan lebih

fleksibel dalam desain sistem, serta user lebih percaya terhadap produk.

Gambar 16.

Model Revised of Rapid Application Development

Sedangkan keterbatasan model tersebut yakni standar kualitas kadang

diabaikan dan sangat bergantung pada keterlibatan user jika diterapkan pada proyek

Page 94: CAT RRAD - Unismuh

74

besar, namun keterbatasan tersebut semakin kurang dengan melakukan observasi,

melakukan analisis kebutuhan, dan memberikan user kuesioner pada saat uji coba

secara one to one. Oleh karena itu, model RRAD tersebut lebih cocok dalam

pengembangan CAT.

Berdasarkan hal tersebut, pengembangan CerdasCAT menggunakan enam

tahapan sebagai berikut. Pertama, pemodelan bisnis yakni mencari informasi yang

mengendalikan proses bisnis, informasi yang dimunculkan, siapa yang memunculkan,

kemana informasi itu diarahkan, dan siapa yang memprosesnya. Kegiatan pada

tahapan tersebut menyangkut data survey, definisi operasional, dan aturan bisinis.

Kedua, pemodelan data yakni data yang dibutuhkan dalam aturan bisnis, karakteristik

atau atribut masing-masing objek dan hubungannya yang telah diidentifikasi pada

kegiatan pemodelan bisnis. Kegiatan pada tahapan tersebut menyangkut objek,

atribut, perilaku , dan rancangan model UML yang berkaitan langsung dengan

pengembangan CAT.

Ketiga, pemodelan proses yaitu menyangkut data yang ada pada pemodelan

data. Data tersebut ditransformasikan untuk mendapatkan aliran informasi bagi

implementasi sistem. Hal tersebut dimaksudkan untuk menambah, memodifikasi,

menghapus atau mendapatkan kembali objek data. Kegiatan tersebut melibatkan

rancangan diagram entitas relasional, rancangan tabel, rancangan antarmuka dan

rancangan basis pengetahuan, rancangan DSS, dan rancangan web. Keempat,

pembentukan aplikasi, yaitu kaitan dengan tahapan ketiga berupa implementasi

rancangan yang telah dilakukan oleh pengembang yakni melakukan koding

antarmuka, basis data, dan aplikasi terhadap komponen pembangun aplikasi CAT.

Selanjutnya, melakukan verifikasi terhadap aplikasi CAT secara internal.

Page 95: CAT RRAD - Unismuh

75

Kelima, pengujian atau testing yakni melatih antarmuka, mengecek aturan

logika ketiga metode, dan mengecek perhitungan dengan program excel, dan menguji

penyebaran karakteristik butir soal dan jumlahnya di dalam bank butir soal. Tahapan

pengujian dimulai dengan validasi internal, validasi expert, simulasi aplikasi, validasi

eksternal, uji coba secara one to one, lalu uji coba terbatas pada sekolah SD unggulan

dan inti. Validasi internal dimaksudkan untuk mengecek kesalahan pemrograman saat

maupun setelah komponen di-run yang dilakukan oleh peneliti. Validasi expert

dimaksudkan untuk mengecek tingkat validitas produk oleh ahli teknologi informasi

dan komputer. Tahap simulasi menggunakan data rill bukan data bangkitan dengan

berbagai variasi pola jawaban. Hal tersebut dimaksudkan untuk mengetahui

kesesuaian aplikasi CAT beserta komponen-komponen kaitan kriteria pengembangan.

Uji coba one to one dilakukan secara perorangan pada setiap user. Validasi eksternal

dimaksudkan untuk mengecek kesalahan setelah komponen di-run yang dilakukan

oleh user sesuai perannya. Uji coba terbatas dilakukan di SD Unggulan atau inti

Kabupaten Soppeng Provinsi Sulawesi Selatan untuk mendapatkan data tingkat

kemampuan peserta tes dan nilai kriteria pengembangan. Keenam, diseminasi hasil

penelitian yakni penyebarluasan produk yang telah dihasilkan kepada user dalam

suatu pertemuan ilmiah.

Berdasarkan hal tersebut, langkah pertama sampai langkah kelima berakhir

pada tahapan pengujian walaupun demikian untuk memeriksa kembali aplikasi yang

telah dibuat dapat dilanjutkan ketahapan sebelumnya secara siklus sampai akhirnya

diperoleh hasil sesuai dengan kebutuhan user yakni produk CerdasCAT. Sedangkan

langkah keenam merupakan tahapan diseminasi hasil penelitian sebagai kegiatan

penyebarluasan produk dalam kegiatan ilmiah. Adapun disain pengembangan model

produk CerdasCAT dengan model RRAD pada Gambar 17.

Page 96: CAT RRAD - Unismuh

76

Pemodelan ProsesPembentukan

AplikasiPengujian

Rancangan

Antarmuka

Koding Antarmuka

Simulasi

One to One

Rancangan Web

Rancangan DSS

Rancangan Fuzzy

& Basis

Pengetahuan

Koding Basis Data

Koding Aplikasi

Terbatas

CerdasCAT

Verifikasi Internal

Validasi Internal

Validasi

Eksternal

Diagram Relasi

Entiti

Rancangan Tabel

Object Atribut

Use Case

Diagram Class

Diagram

Colaborasi

Diagram

Sequensal

Flow Chart

Diagram Aktifitas

Data UASBN

Definisi

Operasional

Aturan Bisnis

Pemodelan DataPemodelan Proses

Diseminasi

Gambar 17.

Disain Pengembangan CerdasCAT dengan RRAD

B. Prosedur Pengembangan CerdasCAT

1. Tahap Pemodelan Bisnis

Kegiatan survey dilakukan bulan November 2008 dan bulan April–Juli

Desember 2010 di dua tempat, yakni Kabupaten Soppeng dan Kota Makassar Provinsi

Sulawesi Selatan. Kegiatan tersebut dilakukan untuk mengetahui kebutuhan sistem,

yakni: 1) data hasil respon peserta tes dan butir soal yang telah dipakai (data

UN SD); 2) kelayakan perangkat keras dan lunak komputer di SD, kemampuan, dan

pengalaman awal siswa dan pengajar terhadap komputer, disamping sarana dan

prasarana pendukung web di daerah baik perangkat keras maupun lunak, kecepatan

akses, pengamanan data, dan data pendukung lainnya; dan 3) objek-objek beserta

Page 97: CAT RRAD - Unismuh

77

atribut dan perilaku nya dalam berinteraksi dengan sistem. Disamping kegiatan survey

juga melakukan simulasi pembentukan himpunan fuzzy termasuk pendefinisian

variabel penelitian. Hasil observasi menunjukkan data respon UN Sekolah Dasar

sudah ada di beberapa kabupaten/kota, begitu juga butir soal sudah ada di sekolah.

a. Data UN Sekolah Dasar (SD)

Jumlah paket UN SD yang digunakan sebanyak tujuh, yakni enam paket

pada domain (mata pelajaran) matematika berasal dari Dinas Pendidikan

Kabupaten/Kota di Provinsi Sulawesi Selatan dan satu paket lagi berasal dari

Kabupaten Sidoarjo Provinsi Jawa Timur. Ketujuh paket tersebut terdiri atas tiga

paket tahun 2008/2009 dengan sepuluh butir soal anchor, tiga paket tahun

2009/2010 dengan sepuluh butir soal anchor, dan satu paket tahun 2007/2008.

Tiap paket tersebut mempunyai 40 butir soal sehingga jumlah butir soal

keseluruhan sebanyak 240. Disamping data respon tersebut, juga terdapat data

teks butir soal beserta kunci jawaban. Adapun ukuran sampel, paket UN SD, dan

nama kabupeten/kota tempat pengambilan data pada Tabel 4. Data mentah hasil

respon peserta tes yang diperoleh tersebut selanjutnya diolah dengan program

Bilog_MG untuk membangkitkan parameter butir soal.

Butir soal tersebut dimasukkan pada bank butir soal dengan

memperhatikan Standar Kompetensi Lulusan (SKL) pada setiap domain.

Persentase jumlah butir soal per SKL menggunakan persentase jumlah butir soal

per SKL pada UN SD Tahun 2008 sampai 2010. Persentase jumlah butir soal per

SKL pada UN SD 2008 sampai 2010 sebagai berikut. (1) Memahami konsep

bilangan bulat dan pecahan, operasi hitung, dan sifat-sifatnya, serta

menggunakannya dalam pemecahan masalah kehidupan sehari-hari sebesar 43%.

Page 98: CAT RRAD - Unismuh

78

(2) Memahami bangun datar dan bangun ruang sederhana, unsur-unsur, dan sifat-

sifatnya, serta menerapkannya dalam pemecahan masalah kehidupan sehari-hari

sebesar 14%. (3) Memahami konsep ukuran dan pengukuran berat, panjang, luas,

volume, sudut, waktu, kecepatan, debit, serta mengaplikasikannya dalam

pemecahan masalah kehidupan sehari-hari sebesar 29%. (4) Memahami konsep

koordinat untuk menentukan letak benda dan menggunakannya dalam pemecahan

masalah kehidupan sehari-hari sebesar 3%. (5) Memahami konsep pengumpulan

data, penyajian data dengan tabel, gambar dan grafik, mengurutkan data,

rentangan data, rerata hitung, modus, serta menerapkannya dalam pemecahan

masalah kehidupan sehari-hari sebesar 11%.

Tabel 4.

Nama Kabupaten/Kota dan Ukuran Sampel Tiap Paket

No. Nama Kabupaten/Kota Paket UN SD Ukuran

Sampel

1. Dinas Pendidikan Kota Pare-

Pare, Wajo, dan Maros

Paket 1 Tahun

2009/2010

500

2. Dinas Pendidikan Kota Makassar,

Sinjai, Soppeng

Paket 2 Tahun

2009/2010

500

3. Dinas Pendidikan Kabupaten

Bone, Sidrap, dan Barru

Paket 3 Tahun

2009/2010

500

4. Dinas Pendidikan Kabupaten

Soppeng

Paket 1 Tahun

2008/2009

500

5. Dinas Pendidikan Kabupaten

Sidoarjo

Paket 2 Tahun

2008/2009

500

6. Dinas Pendidikan Kota Makassar Paket 3 Tahun

2008/2009

500

7. Dinas Pendidikan Kabupaten

Soppeng

Paket 1 Tahun

2007/2008

500

Page 99: CAT RRAD - Unismuh

79

Rancangan aplikasi CAT menggunakan tes yang tidak fixed dan jumlah

butir soal yang direpon setiap peserta tes berbeda sehingga keterwakilan materi

perlu dipertimbangkan. Oleh karena itu, persentase butir soal setiap SKL

digunakan untuk menentukan urutan SKL yang direspon peserta tes setelah butir

pertama dan urutan SKL selanjutnya dengan CATatan bahwa selisih SE dari dua

respon butir berturut-turut tidak lebih kecil atau sama dengan 0,01. Berdasarkan

Tabel 5 diperoleh informasi, yaitu: 1) jumlah SKL dan indikator yang digunakan

dalam membuat butir soal sama walaupun tahun 2008 memakai istilah uraian

bukan indiaktor, 2) persentase jumlah butir soal dan urutan SKL perlu

diperhatikan dalam memilih butir soal agar terwakili secara proporsional pada saat

ujian berlangsung, dan 3) jika jumlah SKL dan alokasi jumlah butir soal tiap SKL

mengalami perubahan maka sistem yang dibangun mengalami perubahan secara

dinamis.

Analisis butir soal UN SD dilakukan secara simultan terhadap tujuh paket

dengan 500 data respon tiap paket. Pengkalibrasian dilakukan secara simultan

untuk menempatkan butir tersebut pada satu skala yakni skala kemampuan pada

model Rasch. Analisis butir tersebut menghasilkan butir soal yang memenuhi

model Rasch dan butir soal yang tidak memenuhi model Rasch. Butir soal yang

tidak memenuhi model Rasch dianalisis lebih lanjut secara kualitatif. Analisis

secara kuantitatif menggunakan program Bilog-MG dengan desain Group-Wise

Adaptive Testing berdasarkan kondisi data respon peserta tes yang ada di

lapangan.

Page 100: CAT RRAD - Unismuh

80

Tabel 5.

Jumlah Butir Soal Tiap SKL UN SD

No Standar Kompetensi Lulusan (SKL) Jumlah Butir Soal Jumlah

Butir

soal

%

2008 2009 2010

1 Memahami konsep bilangan bulat

dan pecahan, operasi hitung dan

sifat-sifatnya, serta menggunakannya

dalam pemecahan masalah

kehidupan sehari-hari

15

18

18

51

43%

2 Memahami bangun datar dan bangun

ruang sederhana, unsur-unsur dan

sifatsifatnya, serta menerapkannya

dalam pemecahan masalah

kehidupan sehari-hari

5

6

6

17

14%

3 Memahami konsep ukuran dan

pengukuran berat, panjang, luas,

volume, sudut, waktu, kecepatan,

debit, serta mengaplikasikannya

dalam pemecahan masalah

kehidupan sehari-hari

13

11

11

35

29%

4 Memahami konsep koordinat untuk

menentukan letak benda dan

menggunakannya dalam pemecahan

masalah kehidupan sehari-hari

2

1

1

4

3%

5 Memahami konsep pengumpulan

data, penyajian data dengan tabel,

gambar dan grafik (diagram),

mengurutkan data, rentangan data,

rerata hitung, modus, serta

menerapkannya dalam pemecahan

masalah kehidupan sehari-hari

5

4

4

13

11%

∑ - 40 40 40 120 100%

Analisis data UN SD menghasilkan dua putaran, yakni: Pertama, output

Ph1 memuat informasi nilai statistik butir tiap kelompok butir. Nilai statistik

tersebut berupa nilai korelasi butir terhadap tes menggunakan Pearson dan

korelasi biserial. Jika nilai kedua statistik pada suatu butir soal kurang dari -0,15

maka butir soal tersebut dihilangkan pada output Ph2 yang diasumsikan kunci

soal tersebut salah. Analisis menunjukkan bahwa tidak ada nilai-nilai statistik

pada butir lebih kecil dari -0,15. Oleh karena itu, semua butir di analisis lebih

lanjut. Output Ph2 memuat informasi parameter butir tingkat kesukaran dan nilai

Page 101: CAT RRAD - Unismuh

81

Kai_Kuadrat yang menginformasikan tingkat kecocokan data dengan model

Rasch. Butir yang tidak memenuhi model didrop. Khusus butir soal anchor yang

terdiri sepuluh butir jika ada yang tidak memenuhi model salah satu dari

kelompok tes maka butir tersebut didrop, sedangkan nilai parameter tingkat

kesukaran butir tersebut memperhatikan nilai signifikansi dari Kai Kuadrat butir

tersebut yang paling besar. Butir soal yang tidak memenuhi model pada tahap

putaran pertama dianalisis secara kualitatif untuk dimasukkan di bank butir soal.

Kedua, setelah butir soal yang tidak fit model dikeluarkan maka dilakukan

analisis putaran kedua. Output Ph1 memuat informasi nilai statistik butir tiap

kelompok butir yakni korelasi butir soal terhadap skor total menggunakan

Pearson dan korelasi biserial. Analisis menunjukkan bahwa tidak ada nilai-nilai

statistik pada butir lebih kecil dari -0,15. Output Ph2 memuat informasi

parameter butir tingkat kesukaran dan nilai Kai_Kuadrat yang menginformasikan

tingkat kecocokan data dengan model Rasch. Butir soal anchor memenuhi model

jika butir soal tersebut memenuhi model pada semua kelompok respon pada paket

tersebut. Sedangkan butir soal anchor yang tidak memenuhi model terjadi jika

ada salah satu kelompok pada butir tersebut yang tidak memenuhi model.

Karakteristik butir soal memenuhi model maupun tidak memenuhi model

ditetapkan pada butir yang mempunyai nilai sig Kai Kuadrat yang paling besar.

Selanjutnya, butir yang tidak memenuhi model dianalisis secara kualitatif.

Analisis kualitatif dilakukan dengan asumsi bahwa karakteristik butir soal

tidak berubah secara signifikan bila dilakukan analisis lebih lanjut terhadap butir

tersebut dengan memperhatikan materi, konstruksi, dan bahasa serta pola respon

peserta tes. Analisis butir soal secara kualitatif dan pola respon peserta tes

Page 102: CAT RRAD - Unismuh

82

dilakukan oleh guru kelas IV, V, dan VI. Guru kelas IV melakukan analisis

pertama menggunakan pedoman analisis yang telah disediakan, kemudian

dilanjutkan guru kelas V dan terakhir guru kelas VI. Walaupun ketiga kelompok

guru tersebut sudah biasa dalam membuat butir soal namun ketiga kelompok guru

tersebut mengikuti pelatihan analisis butir soal dengan program Bilog-MG pada

tanggal 27 Januari 2011 di Kampus I Lamappapoleonro Watansoppeng. Pelatihan

dimaksudkan untuk melatih menganalisis butir soal menggunakan Program

Bilog_MG dan menganalisis butir soal secara kualitatif agar ada kesamaan

persepsi dalam melakukan analisis soal secara kualitatif. Jumlah guru diundang

pada pelatihan analisis butir soal tersebut sebanyak 10 guru tiap kelas, namun

guru yang datang untuk kelas IV berjumlah 10 orang, kelas V berjumlah 8 orang,

dan kelas VI berjumlah 9 orang. Nama guru dan asal sekolah tiap kelas terdapat

pada Lampiran B_3, B_4, dan B_5.

Pelatihan tersebut dilakukan oleh peneliti dan satu guru Bahasa Indonesia

yang mendalami psikometri. Ketiga kelompok guru tersebut kemudian

menganalisis butir soal secara kualitatif dengan memperhatikan aspek materi,

konstruksi, dan bahasa. Jika aspek materi, konstruksi, dan bahasa berfungsi

secara baik maka aspek pola respon peserta tes terhadap butir soal diperiksa.

Misalnya, butir soal 1 2009/2010 secara materi, konstruksi, dan bahasa berfungsi

secara baik namun tidak memenuhi model sehingga diperiksa pola respon

peserta tes. Hasil menunjukkan lebih dari 93% peserta tes merespon benar butir

soal tersebut. Secara teori, butir soal tersebut sangat mudah bagi peserta tes,

namun hasil investigasi dari guru kelas IV, V, dan IV menyimpulkan butir soal

tersebut bukan termasuk butir soal mudah namun disebabkan masalah lain.

Page 103: CAT RRAD - Unismuh

83

Misalnya, sistem penjagaan ruang ujian kurang berfungsi pada saat ujian

berlangsung. Oleh karena itu, butir soal tersebut tidak direvisi dan selanjutnya

dimasukkan di bank butir soal.

b. Definisi operasional variabel

Pengembangan CAT melibatkan dua variabel utama yakni variabel input

dan variabel hasil. Produk CerdasCAT memproses variabel input sehingga

menghasilkan variabel hasil. Variabel input terdiri atas tingkat kesukaran butir.

Variabel hasil terdiri atas kemampuan peserta tes, panjang tes, tingkat exposure,

galat baku penaksiran parameter kemampuan peserta tes, dan jumlah waktu

respon butir soal serta informasi kelulusan peserta tes.

Definisi operasional variabel yakni: (1) tingkat kesukaran butir soal

merupakan titik belok pada skala kemampuan kurva model Rasch atau titik yang

terjadi dimana probabilitas sebuah respon benar sebesar 0,5 dalam kurva ICC

yang diperoleh dari hasil analisis data respon peserta tes menggunakan program

Bilog-MG. (2) Tingkat kemampuan peserta tes merupakan hasil respon peserta tes

terhadap butir soal yang adaptif terhadap kemampuan sampai penaksiran

konvergen setelah mengikuti ujian pada aplikasi CAT. (3) Panjang tes merupakan

jumlah butir soal yang ditempuh peserta tes sampai galat baku penaksiran

parameter kemampuan peserta tes terhadap dua butir soal berturut-turut lebih kecil

atau sama dengan 0,01. (4) Tingkat exposure butir soal merupakan tingkat

kemunculan butir soal yang berada di luar rentang inisialisasi kemampuan. (5)

Galat baku penaksiran parameter kemampuan peserta tes merupakan nilai galat

yang diperoleh dari hasil penaksiran parameter kemampuan menggunakan butir

soal tes saat ini secara adaptif. (6) Jumlah waktu respon butir soal merupakan

Page 104: CAT RRAD - Unismuh

84

rerata jumlah waktu yang dibutuhkan peserta tes dalam merespon butir soal

selama ujian berlangsung pada aplikasi CAT. (7) Kelulusan peserta tes merupakan

hasil pengolahan kemampuan peserta menggunakan konsep DSS.

c. Aturan bisnis sistem CAT

Kebutuhan sistem melibatkan berbagai fakta riil di lapangan, misalnya

objek, kejadian, atau interaksi keduanya. Fakta objek berupa lembaran jawaban

peserta tes, butir soal, peserta tes, pengajar, dan pimpinan serta pihak terkait

misalnya wali peserta tes. Setiap objek mempunyai perilaku dalam berhubungan

sistim. Misalnya, peserta tes mengerjakan butir soal. Kata ’mengerjakan’ adalah

perilaku objek peserta tes terhadap sistim dalam berinteraksi dengan objek butir

soal. Informasi tersebut berguna dalam merancang diagram alur sistem CAT

sehingga tahap pembentukan aplikasi (implementasi) dan uji coba tidak banyak

mengalami kendala dan perubahan.

Hasil analisis kebutuhan menunjukkan ada lima aktor yang terlibat secara

langsung dalam proses pengujian terutama pelaksanaan UN SD, yakni pimpinan

(kepala sekolah), pengajar (guru), peserta tes (siswa), wali peserta tes (orang tua

siswa), ditambah satu yakni admin. Kelima aktor tersebut mempunyai aksi yang

berbeda-beda. Pimpinan melakukan login, konfigurasi kelulusan, pembobotan

SKL, pembobotan domain, pembobotan kriteria penilaian, dan melihat laporan

kelulusan. Pengajar melakukan login, membuat butir soal dan memasukkan butir

soal pada bank butir soal, menetapkan nilai sekolah, pengamatan, dan nilai

lainnya, mencari hasil ujian model, dan melihat laporan kelulusan. Peserta tes

melakukan login, melakukan verifikasi nomor ujian, mengerjakan butir soal,

mencari hasil ujian, dan laporan kelulusan. Wali peserta tes melakukan login,

Page 105: CAT RRAD - Unismuh

85

mencari laporan hasil ujian walinya, dan laporan kelulusan. Admin melakukan

login, mengelola data user dan sistem aplikasi.

Berdasarkan hal tersebut, ada beberapa hubungan yang terjadi antar aktor

dalam membentuk suatu aturan bisnis sistim. Admin memasukkan identitas

Peserta Tes. Pengajar memasukkan butir soal dalam suatu domain tertentu yang

telah ditetapkan Admin. Peserta Tes menjawab butir soal yang dimasukkan

Pengajar berdasarkan identitas yang telah dimasukkan Admin. Peserta Tes

merespon tiga butir soal sebagai inisialsasi kemampuan yang ditetapkan Admin.

Hasil ujian peserta tes tersebut dapat dicetak pada saat ini atau digunakan sebagai

data dalam proses kelulusan. Pengajar menetapkan nilai sekolah, nilai observasi,

dan nilai lainnya yang. Pimpinan melakukan pembobotan terhadap SKL dan

doman yang telah dikerjakan Peserta Tes. Selanjutnya, Pimpinan melakukan

pembobotan nilai ujian peserta tes saat ini dan nilai yang telah ditetapkan Pengajar

sebagai penetapan konfigurasi kelulusan. Hasil pembobotan tersebut

menghasilkan pelaporan kelulusan sehingga menjadi informasi bagi Peserta Tes,

Pengajar, Wali Peserta Tes, dan Pimpinan sendiri, selanjutnya informasi tersebut

dapat dicari atau dicetak jika dianggap perlu.

2. Tahap Pemodelan Data

a. Objek, Atribut dan Relasi

Objek mempunyai atribut atau metode yang berbeda-beda. Perbedaan

metode menyebabkan hubungan antara dua objek atau lebih juga beda. Ada lima

objek sebagai aktor yang terkait dengan sistim CAT sebagai berikut. Pertama,

peserta tes mempunyai atribut username, password, metode, model, inisialisasi

kemampuan, penyajian butir soal, paket tiga butir soal, nomor peserta, nama

Page 106: CAT RRAD - Unismuh

86

lengkap, asal sekolah, tempat lahir, tanggal lahir, dan foto. Selanjutnya peserta tes

mempunyai metode yakni melakukan login, memverifikasi nomor ujian,

mengambil ujian, mencari atau mencetak hasil ujian, dan mencari atau mencetak

laporan kelulusan. Kedua, admin mempunyai atribut username dan password,

selanjutnya admin metode mengelola user, domain, skl, dan paket soal.

Ketiga, pimpinan mempunyai atribut username dan password, selanjutnya

mempunyai metode melakukan login, melakukan konfigurasi kelulusan, melakukan

pembobotan SKL, melakukan pembobotan domain, melakukan pembobotan

kriteria kelulusan, dan mencari atau mencetak laporan kelulusan.

Keempat, pengajar mempunyai atribut username dan password, selanjutnya

mempunyai metode melakukan login, menetapkan nilai sekolah, pengamatan, dan

hasil lainnya, melihat hasil ujian model, dan mencari atau mencetak laporan

kelulusan.

Kelima, wali peserta tes mempunyai atribut username, password, dan

nama walinya, selanjutnya mempunyai metode melalukan login, mencari atau

mencetak hasil ujian walinya, dan mencari atau mencetak laporan kelulusan.

Disamping kelima objek tersebut terdapat objek yang lain, misalnya butir soal,

SKL, domain, pembobotan, dan laporan kelulusan.

b. Diagram Use Case

Diagram use case menggambarkan fungsi-fungsi yang dari sebuah sistem.

Diagram tersebut dirancang dengan penekanan apa yang diperbuat oleh actor

terhadap sistem. Diagram use case mempunyai notasi dasar yakni use case, actor,

dan association. Disamping itu, diagram use case memiliki model khusus yang

terbatas untuk kondisi tertentu yakni <<extend>> dan <<include>>. Model

Page 107: CAT RRAD - Unismuh

87

<<extend>> menunjukkan bahwa satu use case merupakan tambahan fungsional dari

use case yang lain jika kondisi atau syarat tertentu dipenuhi, sebaliknya <<include>>

digunakan untuk menggambarkan bahwa suatu use case seluruhnya merupakan

fungsionalitas dari use case lainnya.

c. Diagram Class

Diagram class menunjukkan struktur statis dari beberapa class dalam

sebuah sistem, dimana class tersebut merepresentasikan satu keadaan

(atribut/property) dan mengerjakan suatu sistem (metode/fungsi). Class memiliki

tiga bagian, yakni nama, atribut, dan metode, sedangkan atribut dan metode

memiliki salah satu sifat sebagai private (hanya dapat diakses oleh class itu

sendiri), protected (hanya dapat diakses oleh class itu sendiri dan turunan dari class

tersebut), dan public (dapat diakses oleh class selain class bersangkutan). Class

dapat mempresentasikan sebuah antarmuka atau sebaliknya merupakan

implementasi sebuah antarmuka yang berupa class abstrak. Class abstrak tidak

memiliki atribut namun hanya memiliki metode.

d. Flow Chart

Sebuah diagram aktivitas menunjukkan alur kegiatan secara berurutan,

dimana mendeskripsikan kegiatan-kegiatan dalam sebuah operasi meskipun juga

dapat digunakan mendekskripsikan alur kegiatan lain seperti use case atau suatu

interaksi.

e. Diagram Aktivitas

Sebuah diagram aktivitas mirip dengan flow chart yakni menunjukkan alur

kegiatan secara urutan, dimana mendeskripsikan kegiatan-kegiatan dalam sebuah

Page 108: CAT RRAD - Unismuh

88

operasi meskipun dapat mendekskripsikan alur kegiatan lain seperti use case atau

suatu interaksi, disamping itu diagram aktivitas dapat mendukung perilaku parallel

sedangkan flow chart tidak dapat.

f. Diagram Kolaborasi

Diagram kolaborasi menggambarkan sebuah objek diagram dimana

sejumlah objek ditunjukkan di sekitarnya dengan hubungan-hubungannya dalam

menghasilkan suatu informasi.

g. Diagram Sekuensial

Diagram sekuensial merupakan diagram kolaborasi dinamis antara objek

satu dengan lainnya secara berurutan. Diagram sekuensial umumnya

menggambarkan suatu skenario atau urutan langkah-langkah yang dilakukan oleh

aktor maupun kelas dari sebuah kejadian untuk mendapatkan hasil atau ouput.

Oleh karena itu, kelas, aktor, atau objek diletakkan dibagian atas diagram dengan

urutan dari kiri ke kanan terhadap garis tegak lifeline.

3. Tahap pemodelan proses

a. Diagram Relasi Entitas

Diagram relasi entitas menggambarkan relasi antara dua objek atau lebih

secara many to many, many to one atau one to one. Misalnya, hubungan antara

peserta tes dengan butir soal dimana peserta tes mengerjakan butir soal pada

Gambar 18 menunjukkan hubungan many to many. Artinya, beberapa peserta tes

mengerjakan beberapa butir yang sama. Hubungan antar domain dengan

pimpinan dimana domain dibobot oleh pimpinan. Gambar 19 menunjukkan

Page 109: CAT RRAD - Unismuh

89

hubungan banyak domain dibobot oleh satu pimpinan. Hubungan antar dua entitas

harus mempunyai hubungan satu-satu dimana bilangan kardinal sama dengan 1-1.

Mengerjakan

Peserta_Tes

mm

Butir_Soal

Gambar 18.

Hubungan Entitas Peserta Tes dan Butir Soal

Dibobot oleh 1m

PimpinanDomain

Gambar 19.

Hubungan Entitas Domain dan Pimpinan

b. Rancangan Tabel

Rancangan tabel disesuaikan dengan diagram relasi entitas yang terkait

dengan foreign key dan primary key serta atirbut-atribut lain yang ada pada setiap

entitas. Jumlah tabel disesuaikan dengan keperluan aplikasi.

c. Rancangan Antarmuka

Rancangan antarmuka model CAT disesuaikan kebutuhan sistem.

Rancangan tersebut memperhatikan peran setiap aktor dan faktor pendukung

dalam melakukan aksi terhadap sistem sehingga proses yang terjadi lebih

akomodatif dan aplikatif terhadap tujuan. Rancangan utama dalam sistem CAT

adalah antarmuka halaman utama, antarmuka sign up, antarmuka login, dan

antarmuka pengguna. Antarmuka pengguna terdiri atas antarmuka admin,

antarmuka pimpinan, antarmuka peserta tes, antarmuka pengajar, dan antarmuka

wali peserta tes.

Page 110: CAT RRAD - Unismuh

90

d. Rancangan Himpunan Fuzzy dan Basis Pengetahuan

Simulasi tingkat kesukaran butir soal dan tingkat kemampuan untuk

menentukan himpunan fuzzy dan basis pengetahuan berpedoman pada persamaan

(3). Simulasi tersebut menggunakan program Microsoft Office Excel 2007. Hasil

simulasi pola hubungan antara a, b, dan c terhadap theta menjadi rujukan dalam

menetapkan variabel fuzzy tingkat kesukaran butir soal dan variabel fuzzy tingkat

kemampuan peserta tes. Jika a = 3 dan c = 0,25 maka perbedaan b dan theta

sebesar 0,061, jika a = 2 dan c = 0,25 maka perbedaan b dan theta sebesar 0,092,

dan jika a = 1 dan c = 0,25 maka perbedaan b dan theta sebesar 0,183. Artinya,

perbedaan b dan theta dipengaruhi oleh nilai a. Semakin besar nilai a maka

perbedaan theta dan b semakin kecil. Jadi, jika a dan c tetap maka nilai

perbedaan theta dan b tidak berubah. Jika hal tersebut disimulasikan pada model

Rasch dimana a = 1 dan c = 0 maka tidak ada perbedaan theta dan b.

Gambar 20.

Representasi Himpunan Fuzzy Variabel Tingkat Kesukaran

Berdasarkan hal tersebut, penetapan kategori variabel fuzzy tingkat

kesukaran yang dikaitkan dengan variabel fuzzy tingkat kemampuan tidak

mengalami pergeseran, artinya pembagian himpunan fuzzy pada variabel fuzzy

tingkat kemampuan sama dengan pembagian himpunan fuzzy pada variabel fuzzy

tingkat kesukaran. Variabel fuzzy tingkat kesukaran butir soal pada kurva segitiga

Page 111: CAT RRAD - Unismuh

91

dibagi dalam lima himpunan fuzzy, yakni sangat tinggi, tinggi, sedang, rendah, dan

sangat rendah dengan domain masing-masing terdapat pada Gambar 20.

Berdasarkan representasi himpunan fuzzy tingkat kesukaran butir soal

tersebut maka keanggotaan himpunan fuzzy sangat tinggi, tinggi, sedang, rendah,

dan sangat rendah dirumuskan sebagai berikut:

4;1

42;24

2

2;0

][

b

bb

b

bgiSangatTingtk ………………………….. (20)

0;0

20;2

42;24

4

4;0

][

b

bb

bb

b

bTinggitk ………………………………….... (21)

2;0

02;)2(0

)2(

20;2

2

2;0

][

b

bb

bb

b

bSedangtk …………………………….. (22)

4;0

02;)2(0

0

24;)4(2

)4(

0;0

][R

b

bb

bb

b

bendahtk …………………………. (23)

4;1

24;)4(2

2

2;0

][Re

b

bb

b

xndahSangattk ……………….….. (24)

Page 112: CAT RRAD - Unismuh

92

Himpunan fuzzy yang telah terbentuk tersebut menjadi dasar dalam

merancang basis pengetahuan. Berdasarkan batasan aturan himpunan fuzzy

tersebut, basis pengetahuan pada model Rasch menggunakan aturan IF THEN

sebagai berikut.

Gambar 21.

Basis Pengetahuan Futsuhilow dan Fumahilow

Basis pengetahuan pada Gambar 21 diterapkan pada metode Futsuhilow

dan Fumahilow dimana hasil simulasi pada Lampiran A_2 dan A_4. Basis

pengetahuan pada metode Fusuhilow mengalami perubahan dengan menetapkan

nilai theta dengan suatu bilangan tertentu tidak menggunakan tingkatan himpunan

fuzzy dimana hasil simulasi pada Lampiran A_3. Walaupun rancangan himpunan

fuzzy tingkat kemampuan dan himpunan fuzzy tingkat kesukaran sama namun jika

dikaitkan dengan gangguan konsentrasi selama ujian dan terbuka peluang

menebak jawaban pada butir soal pilihan ganda sehingga perlu

mempertimbangkan hubungan antara tingkat kesukaran butir dengan tingkat

kemampuan peserta tes yakni tingkat kemampuan lebih tinggi atau sama dengan

nilai tingkat kesukaran butir untuk menjawab benar suatu butir. Oleh karena itu,

dalam rentang [-4,4] tingkat kemampuan sama atau lebih tinggi daripada tingkat

1. Jika b sangat tinggi maka theta sangat tinggi

2. Jika b tinggi maka theta tinggi

3. Jika b sedang maka theta sedang

4. Jika b rendah maka theta rendah

5. Jika b sangat rendah maka theta sangat rendah

Page 113: CAT RRAD - Unismuh

93

kesukaran. Hal tersebut searah dengan basis pengetahuan metode Fusuhilow

terdapat pada Gambar 22.

Gambar 22.

Basis Pengetahuan Fusuhilow

e. Rancangan Disicion Support Sistem (DSS)

Rancangan DSS pada produk CerdasCAT melibatkan beberapa model

matematika, yakni model Rasch, metode Futsuhilow, metode Fusuhilow,

metode Fumahilow, model tranformasi theta ke skor, model pembobotan (SKL,

domain, dan kriteria penilaian), dan kriteria kelulusan (skor minumum dan kuota

maksimal). Pengelolaan karakteristik butir soal dan kemampuan peserta tes

menggunakan model Rasch dengan membandingkan ketiga metode. Theta

mempunyai bentangan [-4,4] ditransformasikan ke dalam bentuk skor dengan

bentangan [0,100]. Skor tersebut digunakan oleh pimpinan untuk melakukan

aktivitas secara terurut yakni pembobotan SKL, pembobotan domain, kemudian

pembobotan kriteria penilaian.

Hasil tersebut dilanjutkan dengan penetapan kriteria kelulusan yakni skor

minimal dan kuota maksimal sebagai preferensi kelulusan menjaring preferensi

sebelumnya sebagai pilihan keputusan. Artinya, sistem komputer mengolah

1. Jika b sangat tinggi maka theta sama dengan 4,000

2. Jika b tinggi maka theta sama dengan 2,001

3. Jika b sedang maka theta sama dengan 0,001

4. Jika b rendah maka theta sama dengan -1,999

5. Jika b sangat rendah maka sama dengan -3,999

Page 114: CAT RRAD - Unismuh

94

request menjadi respons berupa urutan kriteria kelulusan sehingga dapat

ditetapkan pilihan diantara pilihan yang ada sesuai dengan preferensinya dalam

menghasilkan informasi kelulusan peserta tes. Adapun model DSS terdapat pada

Gambar 23.

Futsuhilow

Fusuhilow

Fumahilow

Krite

ria K

elu

lusa

n

Skor

KelulusanT

ran

form

asi N

ilai

SKL

Domain

Penilaian

Pe

mb

ob

ota

n

Pilihan

Keputusan θ Skor

Tingkat

Kesukaran

Gambar 23.

Model DSS pada produk CerdasCAT

f. Rancangan Arsitektur DSS pada CAT

Rancangan arsitektur DSS pada CAT merupakan bagian dari arsitektur

CAT. Sistem mula-mula menerima input domain, SKL, dan paket soal dari Admin,

kemudian butir soal di_input oleh pengajar ke SKL dengan memperhatikan

domain. Hasil aksi tersebut disimpan oleh sistem ke database server lewat proses

request-respon secara asynchronous sebagai bagian teknologi

JavaScript+HTML+JSP. Demikian halnya, Admin memasukkan nama user dan

menetapkan username dan password, dan khusus peserta tes ada tambahan

nomor peserta. Soal yang di_input pengajar tersebut direspon peserta tes dengan

terlebih dulu login dan verifikasi nomor soal. Hasil respon peserta tes

menghasilkan hasil ujian yang dapat diperoleh peserta tes dan walinya.

Kemampuan peserta tes berupa hasil ujian tersebut kemudian di kelola lebih

Page 115: CAT RRAD - Unismuh

95

lanjut dalam sistem DSS. Adapun rancangan arsitektur DSS pada CAT terdapat

pada Gambar 24.

Gambar 24.

Rancangan Arsitektur DSS pada CAT

Setiap peserta tes mempunyai hasil ujian sehingga data tersebut dapat menjadi

informasi kelulusan. Data tersebut dikelola dengan sistem DSS. Pimpinan melakukan

pembobotan SKL, domain, dan kriteria kelulusan sebagai bagian dari konfigurasi

kelulusan. Selanjutnya, pimpinan melakukan penetapan penjaringan berdasarkan

konsep standar setting namun bersifat dinamis yakni jumlah kuota diterima dan

tingkat kemampuan minimal yang diterima. Hasil aksi pimpinan tersebut tersimpan di

database server sehingga informasi tersebut dapat diperoleh user termasuk wali

peserta tes, pengajar, peserta tes, dan pimpinan.

Page 116: CAT RRAD - Unismuh

96

g. Rancangan CAT berbasis web

Pengembangan CAT berbasis web terbagi tiga bagian sebagai berikut. (1)

User (peserta tes, admin, pengajar, pimpinan, dan wali peserta tes) melakukan

browsing lewat aplikasi, misalnya mozilla firefox. (2) Produk CerdasCAT yang

dirancang sebagai basis logic. (3) Basis data sebagai bank butir soal. Adapun

arsitektur produk CerdasCAT berbasis web pada Gambar 25 dimana peserta tes

merupakan aktor yang mengikuti ujian, pimpinan merupakan kepala sekolah yang

menjadi pimpinan di SD, pengajar adalah guru mengajar di SD, wali peserta tes

adalah orang tua peserta tes, dan admin adalah pengelola aplilkasi.

Peserta Test

Tomcat Web Server

MySQL Database Server

Pendidik

Admin

AJAX Engine

Web Container

Java

Web Browser

JavaScript HTML

Internet

Pimpinan Wali Peserta Tes

Gambar 25.

Arsitektur Aplikasi CAT Berbasis Web

Page 117: CAT RRAD - Unismuh

97

4. Tahap Pembentukan Aplikasi

Setelah tahap rancangan dalam pemodelan proses selesai, selanjutnya

melakukan pembentukan aplikasi rancangan dengan membuat koding setiap

komponen yang ada yakni koding antarmuka, koding basis data, koding aplikasi, dan

verifikasi internal.

5. Pengujian

Proses pengujian produk CerdasCAT melalui lima tahapan, yakni: Pertama,

validasi internal mengenai kesalahan terjadi saat atau sesudah komponen atau

pembentukan aplikasi. Kedua, expert judgment dilakukan oleh dua validator yakni

Dra. Sri Hartati, M.Sc., Ph.D. sebagai dosen pada jurusan ilmu komputer, MIPA

Universitas Gadjah Mada dan Dra. Ermatita, M. Kom sebagai dosen pada jurusan

sistem informasi, Fasikom Universitas Sriwijaya. Ketiga, simulasi produk

CerdasCAT dengan empat pola respon dimaksudkan untuk mengetahui aplikasi yang

telah dibuat serta komponen-komponen sesuai prosedur pengembangan. Variasi pola

jawaban menggunakan pola benar semua, salah semua, salah-benar, dan normal. Jika

variasi pola jawaban tersebut sudah memenuhi syarat secara maksimal dengan

memperhatikan logika setiap metode, antarmuka, dan ketersediaan jumlah butir soal

di bank butir soal maka aplikasi diujicobakan secara one to one. Keempat, tahap uji

coba one to one menggunakan sampel kecil pada semua kelompok user. Semua

kelompok user tersebut melakukan validasi eksternal dengan mengisi kuesioner skala

sikap setelah menguji coba produk CerdasCAT. Kelima, uji coba produk CerdasCAT

secara terbatas di SD. Setiap tahapan tersebut, diuraikan lebih lanjut pada bagian uji

coba produk.

Page 118: CAT RRAD - Unismuh

98

C. Uji Coba Produk

1. Desain Uji Coba

Sebagaimana telah dijelaskan pada bagian pengujian, uji coba produk

CerdasCAT melalui empat tahap yakni tahap validasi internal, validasi expert

judgement, simulasi, tahap uji coba one to one, validasi eksternal, dan tahap uji coba

terbatas. Validasi internal menyangkut kesalahan yang terjadi selama pengembangan

aplikasi CAT yakni kesalahan bank soal, kesalahan antarmuka, kesalahan komputasi,

dan kesalahan input output. Pemeriksaan kesalahan-kesalahan tersebut dirinci dalam

satu pedoman validasi internal pada Lampiran G_1. Validasi expert judgement

dilakukan setelah validasi internal namun sebelum simulasi. Validasi tersebut

dilakukan secara terpisah dan terbuka oleh kedua validator sehingga independensi

penilaian tetap akurat. Sedangkan desain simulasi memperhatikan inisialisasi

kemampuan peserta tes menggunakan tiga butir soal dengan kategori 1 (mudah), 2

(sedang), dan 3 (tinggi). Berdasarkan kategori tersebut, kegiatan simulasi

memperhatikan pola penyajian butir soal yakni pola respon benar semua, respon salah

semua, respon salah-benar, dan respon normal.

Desain uji coba one to one dilakukan setelah tahap simulasi. Uji coba

dilaksanakan di SDN Kabupaten Soppeng terdiri tujuh sekolah. Jumlah user

sebanyak 39 orang terdiri sembilan siswa sebagai peserta tes, sembilan orang tua

siswa sebagai wali peserta tes, tujuh kepala sekolah sebagai pimpinan, tujuh pegawai

tata usaha/operator komputer sebagai admin, dan tujuh guru sebagai pengajar. Uji

coba tersebut menggunakan lima laptop dimana laptop tersebut sudah diinstal produk

CerdasCAT. Selanjutnya, user yang sudah menguji coba produk CerdasCAT,

diberikan kuesioner sesuai dengan perannya masing-masing.

Page 119: CAT RRAD - Unismuh

99

Desain uji coba terbatas didasarkan data observasi sebelumnya. Hasil

observasi menunjukkan peralatan komputer SDN sudah mencukupi walaupun masih

bervariasi. Misalnya, Kabupaten Soppeng mempunyai satu sekolah unggulan yakni

SDN 1 Lamappoloware dan tujuh sekolah inti. Sekolah unggulan mempunyai

laboratorium komputer yang lengkap sedangkan sekolah inti memiliki laboratorium

komputer namun belum difungsikan secara maksimal dengan sarana dan prasarana

masih minim walaupun sudah beberapa yang mempunyai fasilitas jaringan internet

yang memadai misalnya SDN 161 Karya. Kedua SDN tersebut memiliki jumlah

komputer yang berbeda dimana SDN 1 Lamappoloware mempunyai 40 komputer

namun yang layak hanya 35 komputer sedangkan SDN 161 Karya mempunyai 20

komputer namun yang layak hanya 15 komputer sudah termasuk laptop. SDN 1

Lamappoloware mempunyai 3 kelas VI yang paralel sebagai kelas ungggulan

sedangkan SDN 161 Karya hanya mempunyai satu kelas unggulan. Pengambilan

keempat kelas tersebut sebagai tempat uji coba menggunakan teknik pengambilan

sampel secara purposive sampling berdasarkan tingkat kelayakan perangkat keras dan

lunak komputer. Oleh karena itu, tempat uji coba produk CerdasCAT secara terbatas

di SDN 1 Lamappoloware dan SDN 161 Karya.

Desain uji coba terbatas melalui tiga tahap, yakni: Pertama, tahap persiapan

terdiri atas pengelolaan ruangan, pemeriksaan komputer termasuk hardware dan

software, penginstalan produk CerdasCAT, sosialisasi produk CerdasCAT kepada

peserta tes, dan uji coba produk CerdasCAT oleh peneliti. Peneliti dibantu oleh Admin

laboratorium komputer sekolah bersangkutan dan tiga mahasiswa STMIK

Lamappapopleonro Soppeng. Kedua, pelaksanaan uji coba produk CerdasCAT selama

dua hari. Hari Senin tanggal 16 Mei 2011 di SD 1 Lamappoloware dan hari

Page 120: CAT RRAD - Unismuh

100

Rabu tanggal 18 Mei 2011 di SDN 161 Karya dengan masing-masing dua

gelombang ujian. Gelombang I jam 08.00-10.00 WITA dan gelombang II jam 10.00-

12 WITA. Sebelum ujian dimulai, pengawas ujian membagikan username, password,

dan nomor peserta kepada peserta tes. Pengawasan ujian dilakukan oleh peneliti dan

Admin sekolah bersangkutan. Ketiga, pengumpulan data dilakukan saat setelah

semua ujian selesai. Data yang sudah tersimpan pada tabel peserta_test_jawaban_

dengan_model dapat dipanggil lagi menggunakan query atau login menggunakan

username dan password peserta tes tersebut. Data tersebut kemudian di_ copy paste ke

program Microsoft Excel pada format yang telah tersedia untuk masing-masing

metode.

2. Subjek Uji Coba

Subjek ujicoba produk CerdasCAT secara one to one melibatkan admin,

pimpinan, peserta tes, pengajar, dan wali peserta tes. Jumlah subjek ujicoba one to one

untuk peserta tes sebanyak sembilan orang, pimpinan sebanyak tujuh orang, wali

peserta tes sebanyak sembilan orang, pengajar sebanyak tujuh orang, dan admin

sebanyak tujuh orang. Jumlah sekolah sebagai sampel uji coba one to one sebanyak

tujuh sekolah. Uji coba berlangsung selama satu hari untuk tiap sekolah.

Jumlah peserta tes sebagai subjek uji coba terbatas sebanyak 90 orang dengan

prosedur pemilihan sebagai berikut. Jumlah peserta tes SDN 1 Lamappoloware kelas

A dipilih secara acak 23 dari 25 orang, kelas B dipilih secara acak 23 dari 27 orang,

dan kelas C dipilih semua karena jumlahnya hanya 23 orang. Jadi, jumlah peserta tes

berasal dari SDN 1 Lamappoloware sebanyak 69 orang. Selanjutnya, jumlah peserta

tes SDN 161 Karya kelas VI dipilih secara acak 21 dari 27 orang.

Page 121: CAT RRAD - Unismuh

101

Selanjutnya, penetapan siswa sebagai peserta tes pada tiap metode dilakukan

secara acak pada tiap sekolah. Demikian halnya, penamaan tiap kelas tersebut sebagai

kelas uji coba dilakukan secara acak dimana nama kelas disesuaikan dengan nama

metode yang digunakan dalam kelas tersebut. Jadi ada kelas Futsuhilow, kelas

Fusuhilow, dan kelas Fumahilow. Daftar nama peserta tes yang ikut uji coba produk

CerdasCAT untuk tiap metode pada Lampiran C_1, C_2, dan C_3.

3. Jenis Data

Data pengembangan produk CerdasCAT termasuk jenis data kuantitatif,

yakni data UN SD, data rancangan, data simulasi, data validasi internal, data expert

judgement, data sikap user terhadap produk CerdasCAT, data hasil uji coba one to

one, dan data hasil uji coba terbatas. Data UN SD merupakan data UN SD tahun

2007-2009. Data rancangan merupakan data perancangan aplikasi CAT. Data simulasi

merupakan data pola respon untuk tiap metode dengan memperhatikan inisialisasi

kemampuan. Data validasi internal merupakan data pengecekan komponen aplikasi.

Disamping data tersebut, terdapat data expert judgement merupakan data

validasi ahli komputer dan database terhadap produk CerdasCAT. Data sikap user

merupakan data hasil respon user terhadap produk CerdasCAT. Data sikap user

berasal dari kuesioner skala sikap yang direspon peserta tes, pengajar, wali peserta tes,

pimpinan, dan administrator pada saat uji coba one to one. Selanjutnya, data hasil

uji coba terbatas berupa data ujian peserta tes terdiri dari kemampuan peserta tes

ditambah empat data kriteria pengembangan produk CerdasCAT pada setiap metode

Page 122: CAT RRAD - Unismuh

102

yakni panjang tes, tingkat exposure butir soal, galat baku penaksiran parameter

kemampuan, dan waktu respon butir soal.

4. Instrumen

Instrumen pengumpulan data menggunakan kuesioner skala sikap. Setiap

pernyaatan mempunyai empat pilihan yakni sangat setuju, setuju, tidak setuju, dan

sangat tidak setuju dengan skor masing-masing 4, 3, 2, dan 1 untuk pernyataan positif

sedangkan skor masing-masing 1, 2, 3, dan 4 untuk pernyataan negatif. Pembuatan

instrumen mengacu pada aksi aktor pada sistem model CAT dimana aksi tersebut

tergambar pada setiap use case. Oleh karena itu, jumlah kuesioner skala sikap pada

penelitian ini terbagi lima bagian sesuai dengan jumlah aktor dalam diagram use case.

Instrumen peserta tes, pengajar, wali peserta tes, pimpinan, dan admin masing-

masing terdapat pada Lampiran K1_, K_2, K_3, K_4, dan K_5. Pilihan setiap

responden terhadap setiap penyataan dihitung lalu dinyatakan secara persentase.

Penentuan sikap user diambil dari persentase yang paling tinggi dari pilihan yang ada.

Instrumen validasi expert model CAT terdiri tiga komponen, yakni komponen

aksi user terhadap produk pada pernyataan 1-24, komponen kemampuan produk pada

pernyataan 25-28, dan komponen pelengkap produk pada pernyataan 29-30.

Instrumen validasi expert judgment model CAT terdapat pada Lampiran D_18.

5. Teknik Analisis Data

Data panjang tes, galat baku penaksiran parameter kemampuan, dan jumlah

waktu respon butir soal dianalisis secara deskriptif dan secara inferensial dengan uji t

kecuali data tingkat exposure butir soal dianalisis dengan uji korelasi, sedangkan data

sikap aktor terhadap produk CerdasCAT dianalisis secara deskriptif. Analisis data

Page 123: CAT RRAD - Unismuh

103

secara deskriptif dan inferensial menggunakan program SPSS. Perbandingan ketiga

metode tersebut terdapat pada Gambar 26.

Model

Rasch

Futsuhilow

Fusuhilow

Fumahilow

Panjang Tes,

Tingkat Exposure

Butir Soal, Galat

Baku Penaksiran

Parameter

Kemampuan

Peserta Tes, dan

Jumlah Waktu

Respon Butir

Soal

b

θ

Karakteristik Butir

Soal dan

Kemampuan Model ICC Metode Kriteria

Gambar 26.

Perbandingan Metode dengan Empat Kriteria

Gambar 26 menunjukkan perbandingan ketiga metode dengan memperhatikan

panjang tes, tingkat exposure butir soal, galat baku penaksiran parameter kemampuan,

dan rerata jumlah waktu respon butir soal. Perbandingan tersebut menggunakan dua

parameter input yakni tingkat kesukaran butir soal dan tingkat kemampuan peserta tes

sesuai model ICC dari model pengukuran Rasch.

Page 124: CAT RRAD - Unismuh

104

BAB IV

HASIL PENELITIAN

A. Data Pengembangan

1. Data Karateristik Butir Soal

Data UN SD berasal dari tujuh paket dimana enam paket dari Provinsi Sulawesi

Selatan dan satu paket dari Provinsi Jawa Timur. Tiap butir soal untuk paket tersebut

diambil secara acak 500. Pengambilan acak tersebut memperhatikan sub rayon dan

sekolah untuk tiap paket sehingga jumlah keseluruhan data respon sebanyak 3500.

Cuplikan data UN SD terdapat pada Lampiran B_1, sedangkan desain analisis butir soal

tiap paket tersebut terdapat pada Lampiran B_2. Selanjutnya, setiap paket

mempunyai 40 butir soal sehingga jumlah keseluruhan butir soal 280 butir. Namun,

terdapat 10 butir anchor pada tahun yang sama kecuali tahun 2007/2008 hanya satu

paket sehingga jumlah butir soal 240 butir. Analisis secara kuantitatif dan kualitatif

butir soal tersebut diuraikan lebih lanjut pada bagian B.1.

2. Data Rancangan

a. Diagram use case

Diagram use case menggambarkan kegiatan aktor terhadap sistem.

Gambar 27 menunjukkan ada lima aktor untuk sistem produk CerdasCAT sebagai

berikut. (1) Admin mempunyai use case, yaitu: melakukan Log In, men_update

data user (Admin, peserta tes, pengajar , pimpinan, dan wali peserta tes),

menetapkan tiga butir soal, menetapkan SKL, menetapkan domain, dan

menetapkan pendaftaran. (2) Peserta tes mempunyai use case, yaitu: melakukan

Log In, melakukan verifikasi nomor ujian, mengambil ujian, mencari atau

mencetak hasil kelulusan, dan mencari atau mencetak hasil ujian. (3) Pimpinan

Page 125: CAT RRAD - Unismuh

105

mempunyai use case, yaitu: melakukan Log In, melakukan konfigurasi kelulusan,

melakukan pembobotan SKL, melakukan pembobotan domain, melakukan

pembobotan kriteria kelulusan, dan memcari atau mencetak hasil kelulusan. (4)

Pengajar mempunyai use case, yaitu: melakukan Log In dan mencari atau

mencetak hasil kelulusan, melakukan input penilaian, mengelola soal, dan

melihat hasil ujian model. (5) Wali peserta tes mempunyai use case, yaitu:

melakukan Log In, mencari atau mencetak hasil kelulusan, dan mencari atau

mencetak hasil ujian walinya.

Gambar 27.

Model UML Produk CerdasCAT

b. Diagram kelas

Kelas mempunyai satu atau lebih objek. Setiap kelas mempunyai nama,

atribut, dan metode. Misalnya, kelas peserta tes mempunyai beberapa atribut dan

metode dalam berhubungan dengan kelas lain, misalnya Laporan Kelulusan.

Page 126: CAT RRAD - Unismuh

106

Kedua kelas tersebut dihubungkan dengan kata ’mencari’ dalam membentuk

diagram kelas seperti pada Gambar 28.

Gambar 28.

Diagram Kelas Peserta Tes dan Laporan Kelulusan

c. Flowchart

Flowchart produk CerdasCAT dapat dirancang secara implisit maupun

eksplisit. Secara eksplisit, flowchart produk CerdasCAT dimana peserta tes

mengambil ujian seperti pada Gambar 29 dengan tahapan sebagai berikut.

Pertama, peserta tes memasukkan username dan password lalu melakukan

verifikasi nomor peserta ujian. Kedua, peserta tes memilih domain, misalnya

matematika, bahasa Indonesia, dan IPA. Jumlah domain ditetapkan oleh Admin

dalam satu kali ujian untuk semua peserta tes.

Page 127: CAT RRAD - Unismuh

107

Ketiga, peserta tes mengerjakan tiga butir soal sebaga inisialisasi

kemampuan. Butir soal tersebut ditetapkan oleh Admin untuk semua peserta tes

dalam satu kali ujian. Butir soal tersebut diurutkan dari atas ke bawah dengan

tingkat kesukaran semakin tinggi. Jika butir soal (1,2,3) di jawab benar maka

diberikan butir soal pada kategori sangat sukar (3 atau lebih kecil 3), jika hanya

butir soal (1), (1,2) atau (1,3) dijawab benar maka diberikan butir soal pada

kategori sukar (2 atau lebih kecil 2), jika hanya butir soal (2,3) atau (2) dijawab

benar maka diberikan butir soal pada kategori sedang (0 atau lebih kecil 0), jika

hanya butir soal (3) dijawab benar maka diberikan butir soal pada kategori mudah

(-2 atau lebih kecil -2), dan jika tidak ada butir soal dijawab benar maka diberikan

butir soal pada kategori sangat mudah (-3 atau lebih kecil -3). Jadi, butir soal

pertama diberikan berdasarkan kategori kemampuan yang dimiliki masing-

masing peserta tes dengan memperhatikan mekanisme ketiga.

Keempat, peserta tes mengerjakan butir soal selanjutnya dengan

menggunakan metode fuzzy dan metode high low. Jika respon benar maka tingkat

kesulitan butir soal dinaikkan, sebaliknya jika respon salah maka tingkat

kesulitan butir soal diturunkan. Sistem menghitung kemampuan peserta tes

dengan metode yang terpilih (Futsuhilow, Fusuhilow, atau Fumahilow). Kelima,

sistem menghitung galat baku penaksiran kemampuan peserta tes dan

menghitung selisih galat baku penaksiran kemampuan peserta tes berdasarkan

hasil respon pada dua butir soal berturut-turut dengan nilai lebih kecil atau

sama dengan 0,01. Artinya jika diberikan butir soal tambahan maka kemampuan

peserta tes tidak berubah secara signifikan.

Page 128: CAT RRAD - Unismuh

108

Mulai

Input UserName,

Password, Nomor

Peserta

Pilih

Domain

Y

Bank

Soal

Respon Soal

u=1

Soal

Lebih Sukar

Sesuai Metode

Soal

Lebih Mudah

Sesuai Metode

Cetak θ

Pindah

Domain

Cetak Hasil

UjianAkhir

TY

Y

T

T

Y

Hitung θ

Selisih SE(θ)<=0,01

Transformasi θ ke Skor

Hitung SE(θ)

Ketegori

Kemampuan

Inisialisasi

Kemampuan Awal

(3 butir)

Rerata Kategori

Kemampuan

Gambar 29.

Flowchart Peserta Tes Mengambil Ujian

Keenam, hasil theta ditransformasikan ke skor nol sampai 100, selanjutnya

peserta tes mencetak hasil ujian untuk domain saat ini (optional) jika hanya satu

domain. Ketujuh, domain dipilih oleh peserta tes jika masih diperlukan dan

dilanjutkan proses sebagaimana langkah-langkah sebelumnya sampai semua

domain ditetapkan oleh Admin. Kedelapan, peserta tes dapat melihat atau

mencetak hasil ujian baik secara kuantitatif maupun secara grafik. Informasi

Page 129: CAT RRAD - Unismuh

109

tersebut bermanfaat bagi peserta tes untuk menggambarkan butir soal mana

respon salah dan benar sehingga lebih informatif sebagai bahan remedial

selanjutnya.

d. Diagram Aktifitas

Diagram aktifitas peserta tes mengambil ujian dimana peserta tes

melakukan log in dan verifikasi nomor. Admin menetapkan tiga butir soal sebagai

inisialisasi kemampuan. Peserta tes mengerjakan tiga butir soal tersebut sebagai

awal mengerjakan butir soal yang lain secara adaptif. Selanjutnya, peserta tes

merespon butir soal tersebut, lalu sistem melakukan perhitungan selisih SE di

objek AmbilUjian.java. Jika selisih SE lebih kecil atau sama dengan 0,01 maka

ujian dihentikan sebaliknya peserta tes mengerjakan butir soal adaptif yang lain

sampai selisih SE lebih kecil atau sama dengan 0,01. Diagram aktifitas peserta tes

mengambil ujian pada Gambar 30.

e. Diagram Kolaborasi

Diagram kolaborasi mencari informasi laporan kelulusan pada produk

CedasCAT. Peserta tes mengerjakan soal saat ini sehingga menghasilkan hasil ujian

saat ini. Pimpinan menerima hasil ujian tersebut. Pengajar mencari identitas

peserta tes tersebut untuk memberikan nilai kelulusan sekolah (nilai sekolah,

pengamatan, dan lainnya). Pimpinan menerima nilai tersebut. Pimpinan

melakukan pembobotan data-data tersebut sehingga menghasilkan nama-nama

peserta tes yang lulus beserta atributnya. Laporan_Kelulusan menyimpan

informasi tersebut. Laporan kelulusan tersebut menjadi informasi bagi peserta tes,

pengajar, dan pimpinan. Diagram kolaborasi peserta tes mencari laporan kelulusan

pada Gambar 31.

Page 130: CAT RRAD - Unismuh

110

Gambar 30.

Diagram Aktifitas Peserta Tes Mengambil Ujian

Gambar 31.

Diagram Kolaborasi User Mencari Laporan Kelulusan

Page 131: CAT RRAD - Unismuh

111

f. Diagram sekuensial

Diagram sekuensial menampilkan halaman ujian peserta tes. Peserta tes

mempunyai data diri yang dimasukkan Admin dalam Objek SignUp.jsp, Peserta

tes menerima username, password , dan nomor peserta kemudian memasukkan

username, password , dan nomor peserta yang sesuai sehingga Log In.jsp

menampilkan halaman ujian pada Gambar 32.

Gambar 32.

Diagram Sekuensial Menampilkan Halaman Ujian

g. Diagram Relasi Entitas

CerdasCAT memiliki beberapa entitas. Ada sembilan entitas dalam kaitan

peserta tes mengambil ujian, yakni peserta tes, paket tes tiga butir, paket tes tiga

butir detail, paket soal tiga butir jawaban, soal, domain, skl, waktu tempuh, dan

Page 132: CAT RRAD - Unismuh

112

peserta tes domain. Relasi entitas dalam kaitan peserta tes mengambil ujian pada

Gambar 33.

Peserta_Tes

PK Idpeserta_tes

username

password

peran

nomor_peserta_tes

metode

mode_logistik

metode_penyajian

nama_lengkap

asal

tempat_lahir

tanggal_lahir

jenis_kelamin

foto

skor_akhir

idpaket_soal_tiga_butir

tingkat_kesukaran

verified

skor_domain

Paket_Soal Tiga Butir

PK idpaket_soal_tiga_butir

tanggal

keterangan

waktu_maksimal

Paket_Tiga_Soal_Tiga_Butir_Detail

PK idpaket_soal_tiga_butir_detail

FK1 idsoal

FK2 idpaket_soal_tiga_butir

Soal

PK idsoal

soal

gambar

jawaban

rasch_b

FK1 idskl

FK2 iddomain

Domain

PK iddomain

domain SKL

PK idskl

nama_skl

prioritas

FK1 iddomain

Paket Soal Tiga Butir Jawaban

PK idpaket_soal_tiga_butir_jawaban

jawaban

FK1 idpaket_soal_tiga_butir

FK2 idsoal

FK3 idpeserta_tes

Waktu Tempuh

PK idwaktu_tempuh

FK1 iddomain

waktu_tempuh

FK2 Idpeserta_tesPeserta Tes Domain

PK idpeserta_tes_domain

FK2 iddomain

FK1 Idpeserta_tes

Gambar 33.

Diagram Relasi Entitas

h. Data rancangan tabel

Berdasarkan diagram relasi entitas pada Gambar 28 maka rancangan tabel

yang kaitan langsung peserta tes mengambil ujian sebagai berikut.

1. Tabel Domain

Tabel Domain berfungsi untuk menyimpan domain soal tertentu yang

terdiri dua field yakni iddomain dan domain. Pimpinan melakukan pembobotan

terhadap domain tersebut pada Tabel 6.

Page 133: CAT RRAD - Unismuh

113

Tabel 7.

Tabel Peserta_Tes

No Field Tipe Data Constraint Keterangan

1. Idpeserta_tes Integer Unique ,

Not Null

Auto Number PK

2. username Varchar(45) Not Null Nama user

3. password Varchar(45) Not Null Sandi Setiap User

4. Peran Varchar(45) Not Null Sesuai Peran User

5. Nomor_Peserta Varchar(45) Not Null Nomor ujian

6. Metode Varchar(45) Not Null Metode yang

digunakan ujian

7. Model_logistik Varchar(45) Not Null Model yang

digunakan ujian

8. Metode_penyajian Varchar(45) Not Null Metode penyajian

9. NamaLengkap Varchar(45) Not Null Nama lengkap

peserta test

10. Asal Varchar(45) Not Null Asal SD peserta es

11. Tempat_lahir Varchar(45) Not Null Tempat lahir

pesertat tes

12. Tanggal_lahir DATE Not Null Tanggal lahir

peserta

13. Jenis_kelamin Byte Not Null Jenis kelamin

pesertat tes

14. Foto Varchar(45) Not Null Foto peserta tes

15. Skor_akhir Double Not Null Skor setelah ujian

16. Id_paket_soal _

tiga_butir

Int(10) Not Null Foreign key ke

tabel paket soal

tiga butir

17. Tingkat_kesukaran Double Not Null Himpunan fuzzy

tingkat kesukaran

18. Verified Tinyint Not Null Verifikasi nomor

peserta

19. Skor_domain Double Not Null Skor ujian domain

Page 134: CAT RRAD - Unismuh

114

\

2. Tabel Peserta_Tes

Tabel Peserta_Test menyimpan informasi peserta tes dengan hak akses

username, password , dan peran serta nomor peserta pada Tabel 7.

Tabel 6.

Tabel Domain

No Field Tipe Data Constraint Keterangan

1 Iddomain Integer Unique , Not Null Auto Number PK

2 Domain Varchar(45) Not Null Nama domain ini

3. Tabel SKL

Tabel SKL menyimpan soal tertentu yang terdiri empat field yakni

idskl, nama_skl, iddomain, dan prioritas seperti pada Tabel 8. Prioritas SKL

ditentukan oleh Admin sedangkan pembobotan SKL ditentukan oleh

Pimpinan.

Tabel 8.

Tabel SKL

No Field Tipe Data Constraint Keterangan

1. Idskl Integer(10) Unique , Not Null Auto Number PK

2. Nama_skl Varchar(45) Not Null Nama skl diujikan

3. Iddomain Integer(10) Not Null Foreign key ke tabel

domain

4. Prioritas Integer(10) Not Null Prioritas SKL dalam

domain tertentu

Page 135: CAT RRAD - Unismuh

115

4. Tabel Paket Soal Tiga Butir Detail

Tabel Paket Soal Tiga Butir Detail menyimpan informasi kaitan dengan butir

soal yakni butir soal yang dikerjakan peserta tes setelah inisialisasi

kemampuan seperti pada Tabel 9.

Tabel 9.

Paket Soal Tiga Butir Detail

No Field Tipe Data Constraint Keterangan

1 Idpaket_soal

tiga_butir_detail

Int(10) Unique , Not

Null

Auto Number PK

2 Idpaket_soal

tiga_butir

Int(10) Not Null Foreign key ke tabel

soal tiga butir

3 Idsoal Int(10) Not Null Foreign key ke tabel

soal

5. Tabel Paket Soal Tiga Butir

Tabel Paket Soal Tiga Butir menyimpan tiga butir soal untuk inisialisasi

kemampuan peserta test yang meliputi tanggal, keterangan, dan batasan waktu

maksimal seperti pada Tabel 10.

Tabel 10.

Paket Soal Tiga Butir

No Field Tipe Data Constraint Keterangan

1 Idpaket_soal

tiga_butir

Int(10) Unique , Not

Null

Auto Number PK

2 Tanggal DATE Not Null Hari diambilnya test

3 Keterangan Text Not Null Keterangan ujian

4. Waktu_maksimal Time Not Null Batasan waktu ujian

Page 136: CAT RRAD - Unismuh

116

6. Tabel Soal

Tabel soal menyimpan soal SKL tertentu pada suatu domain tertentu yang

meliputi idsoal, iddomain, gambar, jawaban, rasch_b, dan idskl seperti pada

Tabel 11.

. Tabel 11.

Tabel Soal

No Field Tipe Data Constraint Keterangan

1. Idsoal Integer Unique , Not

Null

Auto Number PK

2. Iddomain Integer Not Null Foreign Key ke tabel

domain

3. Gambar Image Not Null Soal ujian image

4. Jawaban Enum Not Null Pilihan jawaban benar

5. Rasch_b Double Not Null Tingkat kesukaran soal ini

6. Id_skl Int(10) Not Null Foreign Key ke tabel skl

7. Tabel Paket Soal Tiga Butir Jawaban

Tabel Paket Soal Tiga Butir Jawaban menyimpan jawaban peserta tes pada

saat inisialisasi kemampuan seperti pada Tabel 12.

Tabel 12.

Tabel Paket Soal Tiga Butir Jawaban

No Field Tipe Data Constraint Keterangan

1. IdPaket_soal_

tiga_butir_jawaban

Int(10) Unique , Not

Null

Auto Number PK

2. Idpaket_soal

tiga_butir

Int(10) Unique , Not

Null

Foreign key ke tabel

soal tiga butir

3. Id_soal Int(10) Unique , Not

Null

Foreign key ke tabel

soal

4. Idpeserta_test Integer Not Null Foreign Key ke tabel

peserta test

5. Jawaban Enum Not Null Pilihan (A,B,C,D)

Page 137: CAT RRAD - Unismuh

117

8. Tabel Waktu Tempuh

Tabel Waktu Tempuh menyimpan waktu peserta tes saat ujian pada suatu

domain tertentu seperti pada Tabel 13.

. Tabel 13.

Tabel Waktu Tempuh

No Field Tipe Data Constraint Keterangan

1 Idwaktu_

tempuh

Int(10) Unique ,

Not Null

Auto Number PK

2 Idpeserta_tes Int(10) Not Null Foreign key ke tabel

peserta tes

3 Iddomain Int(10) Not Null Foreign key ke tabel

domain

4. Waktu_tempuh Varchar Not Null Waktu yang digunakan

peserta test untuk ujian

domain

9. Tabel Peserta Ujian Domain

Tabel Peserta Ujian Domain menyimpan domain yakni domain yang telah

dikerjakan peserta tes seperti pada Tabel 14.

Tabel 14.

Tabel Peserta Tes Domain

No Field Tipe Data Constraint Keterangan

1, Idpeserta_tes_

domain

Int(10) Unique , Not

Null

Auto Number PK

2. Idpeserta_tes Int(10) Not Null Foreign key ke tabel

peserta tes

3. iddomain Int(10) Not Null Foreign key ke tabel

domain

Page 138: CAT RRAD - Unismuh

118

i. Data rancangan antarmuka (interface)

Ada beberapa produk CAT yang sudah online menggunakan antarmuka

dinamis. Produk CerdasCAT mempunyai antarmuka, antara lain antarmuka

utama, antarmuka Admin, antarmuka pimpinan, antarmuka peserta tes,

antarmuka pengajar, dan antarmuka wali peserta tes. Adapun antarmuka

utama produk CerdasCAT terdapat pada Gambar 34.

Gambar 34.

Antarmuka Utama Produk

Bagian antarmuka utama terdiri atas bantuan help, about, dan log in.

Help memuat buku panduan (user’s guide) dari produk CerdasCAT. About

memuat nama pengembang (penemu), versi dan tahun penemu, copyright,

promotor, penguji serta ucapan terima kasih. Log in merupakan pintu masuk

bagi user (Admin, pimpinan, pengajar, peserta tes, dan wali peserta tes) dalam

melakukan kegiatan pada produk dengan memasukkan username dan

password, serta memilih peran yang sesuai. Penampilan antarmuka

selanjutnya ditentukan oleh siapa yang melakukan Log In dan apa yang

dikerjakan. Kegiatan tersebut mempengaruhi pilihan halaman selanjutnya.

Page 139: CAT RRAD - Unismuh

119

Bagian antarmuka Admin terdiri atas home, kelola pengguna, kelola

domain, kelola SKL, kelola paket soal, dan log out pada Gambar 35. Admin

sebagai aktor yang mengelola sistem produk. Kelola pengguna menyangkut

mengupdate data Admin, pimpinan, pengajar, peserta tes, dan wali peserta tes.

Kelola domain menyangkut update domain terdiri nama domain dan aksi.

Kelola SKL menyangkut update SKL dalam domain terdiri nama domain,

nama SKL, prioritas, dan aksi. Kelola paket soal menyangkut penentuan paket

tiga butir soal untuk inisialisasi dan penetuan domain soal bagi peserta tes.

Log out menyangkut aksi Admin kembali ke halaman utama.

Gambar 35.

Antarmuka Admin

Pendaftaran merupakan persyaratan bagi user untuk Log In yang terdiri

atas username, password , dan peran. Pendaftaran juga merupakan kegiatan

Admin dalam memasukkan identitas peserta tes seperti pada Gambar 36.

Page 140: CAT RRAD - Unismuh

120

Gambar 36.

Antarmuka Sign Up

Bagian model, metode, inisialisasi, penyajian butir soal, nomor

peserta, nama lengkap, asal, tempat lahir, tanggal lahir, jenis kelamin, dan

foto. Atribut tersebut dientri oleh Admin ke tabel pendaftaran (sign up) .

Khusus bagian nomor peserta tes yang telah dientri oleh Admin, setiap peserta

tes wajib memasukkan nomor peserta tes pada form verifikasi. Peserta tes

harus memasukkan nomor peserta dengan tepat agar supaya peserta tes dapat

mengambil ujian. Nomor peserta terdiri 14 digit dimana nomor provinsi,

nomor kabupaten/kota, nomor kecamatan, nomor desa/kelurahan, dan nomor

sekolah masing-masing terdiri dua digit lalu underscot terdiri satu digit

kemudian nomor urut peserta tes terdiri tiga digit.

Bagian antarmuka pimpinan terdiri atas home, konfigurasi kelulusan,

pembobotan SKL, pembobotan domain, pembobotan kriteria penilaian,

laporan kelulusan, dan logout pada Gambar 37. Pimpinan adalah kepala

institusi, misalnya kepala sekolah. Home dimaksudkan untuk kembali ke

halaman pimpinan. Kriteria penilaian terdiri ujian akhir nasional, nilai ujian

sekolah, nilai amatan, dan nilai lain. Nilai ujian akhir nasional diperoleh dari

Page 141: CAT RRAD - Unismuh

121

ujian lewat produk CerdasCAT, nilai ujian sekolah diperoleh dari ujian yang

sekolah, dan nilai amatan merupakan nilai yang diperoleh dari amatan tingkah

laku peserta tes di sekolah, dan kriteria lain. Laporan kelulusan menggunakan

dua kriteria yakni jumlah alokasi maksimal dan skor minimal peserta tes yang

diterima yang terdapat pada konfigurasi kelulusan. Pimpinan mengklik

laporan kelulusan maka sistem memberikan laporan yang sesuai dengan aksi

sebelumnya. Log out dimaksudkan untuk kembali kehalaman utama pimpinan.

Gambar 37.

Antarmuka Pimpinan

Bagian antarmuka penetapan pembobotan SKL berisi jumlah SKL pada

mata pelajaran yang diikuti oleh peserta tes, nama SKL beserta

persentase pembobotannya dengan jumlah pembobotan sama dengan 100%

pada Gambar 38. Jika pembobotan yang ditetapkan lebih atau kurang dari 100%

maka sistem memberikan konfirmasi pembobotan tidak sama dengan 100%.

Page 142: CAT RRAD - Unismuh

122

Gambar 38.

Antarmuka Penetapan Pembobotan SKL

Bagian antarmuka penetapan pembobotan domain berisi jumlah mata

pelajaran. Nama mata pelajaran beserta persentase pembobotan terdapat pada

Gambar 39. Jika penetapan persentase yang ditetapkan lebih atau kurang 100%

maka ada konfirmasi yang ditampilkan pembobotan tidak sama dengan 100%.

Gambar 39.

Antarmuka Penetapan Pembobotan Domain

Bagian antarmuka penetapan pembobotan kriteria penilaian berisi nilai

pembobotan domain, nilai ujian sekolah, pengamatan, dan kriteria lain. Jumlah

persentase pembobotan sama dengan 100% terdapat pada Gambar 40. Jika lebih

atau kurang maka ada konfirmasi bahwa pembobotan tidak sama dengan 100%.

Page 143: CAT RRAD - Unismuh

123

Gambar 40.

Antarmuka Penetapan Pembobotan Kriteria Penilaian

Bagian antarmuka pengajar terdiri atas home, kelola soal, input

penilaian, hasil ujian model, laporam kelulusan, dan logout pada Gambar 41.

Home menyangkut aksi pengajar untuk kembali ke halaman pengajar. Kelola

soal yakni kegiatan pengajar untuk menambah data soal yang terdiri domain,

skl, soal dalam bentuk image, jawaban, dan tingkat kesukaran butir serta save

dan batal. Input penilaian menyangkut nilai ujian peserta tes, nilai amatan, dan

nilai lainnya. Hasil ujian model menyangkut hasil ujian peserta tes secara

detail untuk diagnosis. Laporan Kelulusan menyangkut laporan kelulusan

peserta. Laporan tersebut dapat dilihat atau diprint oleh pengajar. Logout

dimaksudkan untuk kembali kehalaman utama.

Gambar 41.

Antarmuka Pengajar

Page 144: CAT RRAD - Unismuh

124

Bagian antarmuka peserta tes terdiri atas home, ambil ujian, hasil ujian,

laporan kelulusan, dan logout pada Gambar 42. Home berguna untuk kembali

ke halaman peserta tes. Ambil ujian menyangkut peserta tes ambil ujian domain.

Hasil ujian menyangkut hasil ujian yang telah ditempuh oleh peserta

tes saat ini. Laporan kelulusan merupakan informasi kelulusan peserta tes.

Logout dimaksudkan untuk kembali ke halaman utama.

Gambar 42.

Antarmuka Peserta Tes

Bagian antarmuka ambil ujian terdiri atas waktu ujian (timer), butir soal

dan pilihan jawaban pada Gambar 43. Waktu ujian ditetapkan 3 menit

setiap butir soal. Ada pemberitahuan waktu lima detik terakhir dari tiga menit

tersebut yang menunjukkan waktu ujian tinggal lima detik. Jika tidak memilih

dalam waktu tersebut maka peserta tes dianggap tidak tahu sehingga dapat

nilai nol selanjutnya peserta tes merespon butir soal berikutnya sesuai dengan

tingkat kemampuan saat ini. Butir soal ujian berupa tes pilihan ganda yang

terdiri atas stem dan empat pilihan. Jawaban terdiri atas empat pilihan dan

Page 145: CAT RRAD - Unismuh

125

harus dipilih salah satunya. Alokasi jumlah waktu ujian adalah sebanyak 120

menit dengan total jumlah butir soal sebanyak 40 butir soal.

Gambar 43.

Antarmuka Ambil Ujian Adaptasi

Bagian antarmuka hasil ujian memuat identitas peserta tes, domain,

nilai statistik, dan kurva. Identitas peserta tes terdiri atas nomor ujian , nama

lengkap, metode, inisialisasi, model, dan cara penyajian serta foto diri pada

Gambar 44. Domain terdiri atas mata pelajaran yang diujikan yang terdiri atas

id_soal, skl, theta_awal kemampuan peserta tes, nilai b yang sesuai, nilai

benar (1) salah (0), galat baku penaksiran parameter kemampuan, selisih galat

baku tersebut, nilai theta akhir untuk butir soal saat ini, skor yang nilainya

bergerak 0 sampai 100, dan waktu respon tiap butir soal. Kurva merupakan

gambaran trace dari pola jawaban peserta tes untuk tiap domain.

Page 146: CAT RRAD - Unismuh

126

Gambar 44.

Hasil Ujian Peserta Tes

Bagian antarmuka laporan kelulusan memuat kemampuan minimum

dan jumlah kuota maksimun yang lulus. Laporam tersebut terdiri atas nomor

urut kelulusan, nomor peserta, nama lengkap, asal, nilai pembobotan domain,

nilai kriteria penilain, dan skor akhir dari kriteria kelulusan pada Gambar 45.

Page 147: CAT RRAD - Unismuh

127

Gambar 45.

Laporan Kelulusan Peserta Tes

3. Data Pembentukan Produk

a. Pendaftaran peserta tes

Pendaftaran user dilakukan oleh Admin termasuk peserta tes. Khusus atribut

nomor peserta, peserta tes melakukan validasi nomor peserta tersebut sebelum

ujian. Kode pendaftaran peserta tes pada Gambar 46.

public class SignUp extends Controller {

public SignUp() {

modelForm = new PesertaTestModel();

controllerName = "SignUp";

viewPage = "peserta_test/signup.jsp";

validationAddRule("nomor_peserta", "required");

validationAddRule("nama_lengkap", "required");

validationAddRule("asal", "required");

validationAddRule("tempat_lahir", "required");

validationAddRule("tanggal_lahir", "required");

}

public void index() {

String id = ((PesertaTestModel)

request.getSession().getAttribute("user_credential")).getId();

PesertaTestModel model = (PesertaTestModel)

Db.getById("peserta_test", "id", PesertaTestModel.class.getName(), id);

request.setAttribute("model", model);

index(viewPage);

}

Gambar 46.

Kode Pendaftaran Peserta Tes

Berdasarkan kode tersebut, form pendaftaran peserta tes dipaparkan seperti

pada Gambar 47.

Page 148: CAT RRAD - Unismuh

128

Gambar 47.

Form Pendaftaran Peserta Tes

b. Log In

Peserta tes log in dengan username dan password sesuai peran. Jika

peserta tes memasukkan username, password , atau peran terjadi kesalahan maka

ada konfirmasi kesalahan log in. Kode log in terdapat pada Gambar 48.

Page 149: CAT RRAD - Unismuh

129

String data[][] = Db.getDataSet("select " + pkFieldName + " from " +

table + " where username='"+ username + "' and password ='" + password +

"'");

if(data.length>0){

Object user_credential = Db.getById(table, pkFieldName, fqn,

data[0][0]);

request.getSession().setAttribute("user_credential",

user_credential);

request.getSession().removeAttribute("flash_error_message");

ServletUtil.redirect(Config.base_url +"index/home",request,

response);

}else{

request.getSession().setAttribute("flash_error_message", "Maaf,

informasi Log In Anda tidak dikenali");

ServletUtil.redirect(Config.base_url, request, response);

}

}else{

request.getSession().setAttribute("flash_error_message", "Pilih

jenis Log In Anda terlebih dahulu");

ServletUtil.redirect(Config.base_url, request, response);

}

}

public void logout() throws IOException

{

request.getSession().invalidate();

ServletUtil.redirect(Config.base_url, request, response);

Gambar 48.

Kode Log In

Berdasarkan kode tersebut, form log in user terdapat pada Gambar 49.

Gambar 49.

Form Log In User

c. Verifikasi nomor peserta tes

Peserta tes melakukan log in dengan sukses, selanjutnya peserta tes

melakukan verifikasi nomor peserta sebelum ujian. Peserta tes memasukkan

nomor peserta selanjutnya ada konfirmasi kesuksesan atau kegagalan. Kode

verifikasi nomor peserta tes pada Gambar 50.

Page 150: CAT RRAD - Unismuh

130

.

out = response.getWriter();

String nomorPeserta = (String)

request.getParameter("txtNomorPeserta");

PesertaTestModel user_credential;// = session.

user_credential = (PesertaTestModel)

request.getSession().getAttribute("user_credential");

if (user_credential.getNomor_peserta().equals(nomorPeserta))

{

Db.executeQuery("update peserta_test set verified=1 where

id="+user_credential.getId());

user_credential.setVerified("1");

request.getSession().removeAttribute("user_credential");

user_credential);

request.setAttribute("verifiCATion_error", "Verifikasi

nomor peserta berhasil!");

index();

}else{

request.setAttribute("verifiCATion_error", "Verifikasi

nomor peserta salah");

index();

CATch (IOException ex) {

Logger.getLogger(SignUp.class.getName()).log(Level.SEVERE,

null, ex);

} finally }

out.print(nomorPeserta + " = " +

user_credential.getNomor_peserta());

}

Gambar 50.

Kode Verifikasi Nomor Peserta

Berdasarkan kode tersebut, form verifikasi nomor peserta tes terdapat pada

Gambar 51.

Gambar 51.

Form Verifikasi Nomor Peserta Tes

d. Tahap inisialisasi kemampuan

Inisialiasi kemampuan peserta tes menggunakan tiga butir soal. Setiap

peserta tes mengerjakan tiga butir tersebut sebelum ujian. Kemampuan peserta tes

Page 151: CAT RRAD - Unismuh

131

tersebut dibagi dalam lima kategori sesuai dengan tingkat kesukaran butir soal

jawaban benar, yakni sangat tinggi, tinggi, sedang, rendah, dan sangat rendah.

Kode inisialisasi kemampuan terdapat pada Gambar 52.

if (isSoal1Benar && isSoal2Benar && isSoal3Benar) {

tingkat_kesukaran = "Sangat Tinggi";

thetaAwal = 3;

} else if ((isSoal1Benar && isSoal3Benar) || isSoal3Benar ||

(isSoal2Benar && isSoal3Benar)) {

tingkat_kesukaran = "Tinggi";

thetaAwal = 2;

} else if ((isSoal1Benar && isSoal2Benar) || isSoal2Benar) {

tingkat_kesukaran = "Sedang";

thetaAwal = 0;

} else if (isSoal1Benar) {

tingkat_kesukaran = "Rendah";

thetaAwal = -2;

} else {

tingkat_kesukaran = "Sangat Rendah";

thetaAwal = -3;}

Gambar 52.

Kode Inisialisasi Kemampuan

e. Perhitungan kemampuan dengan metode Futsuhilow

Perhitungan kemampuan peserta menggunakan metode Futsuhilow.

Peserta tes merespon butir pertama sesuai theta awal. Nilai theta awal menetukan

posisi kategori kemampuan. Peserta tes merespon tiap butir soal, selanjutnya

sistem menghitung kemampuan peserta tes sesuai metode Futsuhilow. Kode

perhitungan kemampuan dengan metode Futsuhilow terdapat pada Gambar 53.

if ("Futsuhilow".equals(userCredential.getMetode())) {

……………….

sum_alpha += alpha;

sum_theta_x_alpha += alpha *

thetaAwalTigaSoal;

} else if (thetaSoal >= 2 && thetaSoal <= 4) {

u_sangat_tinggi = (thetaSoal - 2.0) / (4.0 -

2.0);

alpha = u_sangat_tinggi;

thetaAwalTigaSoal = (alpha * 2) + 2;

-------

thetaHasilPerhitunganModel = sum_theta_x_alpha /

sum_alpha;

Gambar 53.

Kode Perhitungan Kemampuan dengan Metode Futsuhilow

Page 152: CAT RRAD - Unismuh

132

f. Perhitungan theta dengan metode Fusuhilow

Proses perhitungan theta dengan metode Fusuhilow sama dengan metode

Futsuhilow, kecuali basis pengetahuan dan defuzifikasi. Kode perhitungan

kemampuan dengan metode Fusuhilow terdapat pada Gambar 54.

if ("Fusuhilow".equals(userCredential.getMetode())) {

//Sangat Tinggi

double st_a = 0, st_b = 0, st_c = 0;

if (thetaSoal >= 2 && thetaSoal <= 4) {

st_b = (thetaSoal - 2) / (4 - 2);

}

if (thetaSoal >= 4) {

st_b = 1;

}

…………………….

thetaHasilPerhitunganModel = sumUxtheta / sumU;

Gambar 54.

Kode Perhitungan Kemampuan dengan Metode Fusuhilow

g. Perhitungan theta dengan metode Fumahilow

Proses perhitungan theta dengan metode Fumahilow sama dengan metode

Futsuhilow, kecuali konsekuensi tiap aturan dan defuzifikasi. Kode perhitungan

kemampuan dengan metode Fumahilow terdapat pada Gambar 55.

if ("Fumahilow".equals(userCredential.getMetode())) {

double st_b = 0, st_c = 0, t_b = 0, t_c = 0, s_b = 0,

s_c = 0, r_b = 0, r_c = 0, sr_b = 0, sr_c = 0;

//sangat tinggi

if (thetaSoal >= 2 && thetaSoal <= 4) {

st_b = (thetaSoal - 2) / 2;

}

if (thetaSoal >= 4) {

st_c = 1;

}

………………………………………

double sumTheta = theta_st_b + theta_st_c + theta_t_b

+ theta_t_c + theta_s_b + theta_s_c + theta_r_b + theta_r_c + theta_sr_b

+ theta_sr_c;

double sumU = (st_b + st_c) * 1 + (t_b + t_c) * 2 +

(s_b + s_c) * 2 + (r_b + r_c) * 2 + (sr_b + sr_c) * 2;

thetaHasilPerhitunganModel = sumTheta / sumU;

Gambar 55.

Kode Perhitungan Kemampuan dengan Metode Fumahilow

Page 153: CAT RRAD - Unismuh

133

h. Metode high low

Metode high low merupakan metode percabangan dengan aturan, jika butir

soal direspon salah oleh peserta tes maka tingkat kesukaran butir soal diturunkan

0,2, atau lebih dan jika butir soal direspon benar oleh peserta tes maka tingkat

kesukaran butir soal dinaikkan 0,1 atau lebih. Kode metode high low terdapat pada

Gambar 56.

boolean jawaban_benar = soal.getJawaban().equals(jawaban);

if (!jawaban_benar) {

thetaSoal -= 0.2;

} else {

thetaSoal += 0.1;

}

Gambar 56.

Kode Metode High Low

i. Waktu mengerjakan tiap butir soal

Peserta tes merespon setiap butir soal selama tiga menit. Batas waktu tiga

menit berkurang sampai batas waktu tersebut habis untuk memberikan soal

berikutnya. Jika peserta tes tidak menjawab selama batas waktu tersebut maka peserta

tes dianggap salah. Kode waktu mengerjakan tiap butir soal pada Gambar 57.

String waktu = request.getParameter("waktu");

DateFormat df = new SimpleDateFormat("mm:ss");

Date date2 = df.parse("03:00");

Date date1 = df.parse(waktu);

long remainder = date2.getTime() - date1.getTime();

Gambar 57.

Kode Waktu Mengerjakan Butir Soal

4. Data Validasi Internal

Validasi internal kesalahan pengembangan CerdasCAT dilakukan pada

komponen bank butir soal, antarmuka, komputasi, dan input output. Data hasil validasi

internal komponen tersebut pada Lampiran G_2. Salah satu contoh validasi internal

Page 154: CAT RRAD - Unismuh

134

pada komponen komputasi hasil ujian peserta tes dengan metode Futsuhilow pada

Lampiran G_3. Validasi hasil perhitungan dengan pola jawaban, input u, dan input b

sama menghasilkan nilai theta awal, SE, selisih SE, theta akhir, dan skor yang sama

pada setiap butir menggunakan program Microsoft Excel 2007.

Validasi internal bank soal dalam mengidentifikasi kesalahan bank soal terkait

dengan input domain dan SKL oleh Admin sudah valid. Input tingkat kesukaran, kunci

jawaban serta kesesuaian kunci jawaban dan butir soal sudah valid. Selanjutnya,

jumlah butir soal setiap himpunan fuzzy dan tingkat ketersediaan butir soal dalam

rentang theta serta jumlah butir soal sudah valid. Butir soal yang telah digunakan

inisialisasi tidak muncul lagi saat ujian selanjutnya dengan perintah query in not telah

valid. Selanjutnya, antarmuka halaman user beserta fungsi-fungsinya telah valid.

Kesesuaian ukuran huruf, warna tiap halaman, dan kejelasan kalimat telah valid.

Logout tiap halaman dan sub halaman ke halaman awal telah valid demikian halnya

tampilan form secara proporsional telah divalidasi.

Validasi komputasi perhitungan hasil ujian telah dilakukan dengan

menggunakan program excel. Hasil validasi terhadap perhitungan pembobotan

pimpinan, waktu respon, tranformasi theta ke skor, laporan kelulusan, dan, hasil

perhitungan ketiga metode telah divalidasi secara akurat. Jika hasil komputasi output

produk CerdasCAT berbeda dengan program excel maka dilakukan pengecekan ulang

terhadap syntax atau melakukan perhitungan mekanik dengan kalkulator. Hal yang

sama juga dilakukan terhadap komponen input-ouput telah valid. Misalnya, hasil ujian

peserta tes terhadap tiga butir soal pertama pada CerdasCAT menghasilkan hasil

perhitungan pada Tabel 15.

Page 155: CAT RRAD - Unismuh

135

Tabel 15.

Hasil Perhitungan Hasil Tes pada CerdasiCAT

No. ID

Soal SKL

Theta Awal

b u SE Selisih

SE Theta Akhir

Skor Waktu

1 407 Ukuran -2 -2.091 0 2.002 -2.091 23.862 1:07

2 375 Bangun -2.091 -2.324 1 1.42 0.58 -2.324 20.95 1:14

3 221 Data -2.324 -1.672 1 1.177 0.24 -1.672 29.1 1:39

Validasi hasil Tabel 12 menggunakan persamaan (1), (4), dan (5) dalam

menghitung theta awal -2,091 dan b -2,091. Hasilnya diperoleh galat baku 2,012,

sedangkan validasi hasil theta akhir -2,091 menggunakan metode Futsuhilow.

Selanjutnya theta akhir sebesar -2,091 ditransformasikan menjadi skor sebesar 23,862

menggunakan persamaan (19). Hasil pengecekan dua butir selanjutnya terdapat pada

Tabel 16 dengan prosedur pengecekan yang sama.

Tabel 16.

Hasil Perhitungan Hasil Tes pada Program Excel

No

Theta Awal b u P Q PQ SE

Selisih SE

Theta Akhir Skor

1 -2.000 -2.091 0 0.523 0.477 0.249 2.002 -2.091 23.863

2 -2.091 -2.324 1 0.558 0.442 0.247 1.420 0.58 -2.324 20.950

3 -2.324 -1.672 1 0.343 0.657 0.225 1.177 0.24 -1.672 29.100

Berdasarkan validasi internal menunjukkan bahwa produk CerdasCAT dapat

ujicoba di lapangan namun sebelumnya perlu dilakukan penilaian dari expert

judgment agar tidak bias.

5. Data Expert Judgment

Data validasi expert pertama terhadap komponen model CAT terdapat pada

Lampiran D_16 sedangkan data validasi expert kedua terhadap komponen model

CAT terdapat pada Lampiran D_17.

Page 156: CAT RRAD - Unismuh

136

Persentase hasil validasi expert judgment pada produk model CAT sebagai

berikut. (1) Validator pertama menyatakan 33% sangat baik dan 67% baik sedangkan

validator kedua menyatakan 67% sangat baik dan 33% baik pada komponen aksi user

terhadap produk. (2) Validator pertama menyatakan 75% sangat baik dan 25% baik

sedangkan validator kedua menyatakan 100% sangat baik pada komponen

kemampuan produk. (3) Validator pertama maupun validator kedua menyatakan

100% baik pada komponen pelengkap produk. Persentase hasil validasi expert pada

produk model CAT terdapat pada Lampiran D_19. Berdasarkan hal tersebut, produk

model CAT dapat diujicobakan di lapangan dengan memperhatikan saran-saran dari

para validasi expert.

Di samping data tersebut, terdapat beberapa saran yang diberikan oleh

validator pertama, yakni: (1) inisialisasi kemampuan disesuaikan kemampuan awal

masing-masing peserta tes; (2) produk full release lebih mudah diaplikasikan lebih

lanjut daripada prototipe; (3) metode fuzzy sebagai metode pencarian butir soal

selanjutnya dapat dipadukan metode high low; (4) metode pencarian butir soal adaptif

dalam CAT dengan starting poin dan stopping rule yang sama menjadi pilihan bagi

user berdasarkan beberapa kriteria; (5) informasi yang dihasilkan konsep DSS lebih

akomodatif bila pembobotan dilakukan secara detail; dan (6) pencarian butir soal

menggunakan tingkat kesukaran agar lebih cepat namun akurat. Sedangkan validator

kedua menyatakan model CAT berjalan baik. Berdasarkan saran-saran dari validator

tersebut, produk model CAT mengalami revisi sebagaimana pada bagian revisi produk.

Page 157: CAT RRAD - Unismuh

137

6. Data Simulasi

Data simulasi menggunakan empat pola respon, yakni benar semua, salah

semua, salah-benar, dan normal untuk semua inisialisasi kemampuan. Keempat pola

tersebut diterapkan ketiga metode dengan memperhatikan panjang tes, tingkat

exposure butir soal, galat baku penaksiran parameter kemampuan, dan waktu respon

butir soal. Selanjutnya, data tersebut menjadi acuan melihat kesesuaian rancangan

produk CAT dengan aturan logika ketiga metode, antarmuka, dan kemampuan bank

butir soal.

a. Metode Futsuhilow

Data simulasi pola respon benar-semua menunjukkan tingkat exposure

paling tinggi 9 dengan inisialisasi -3, panjang tes paling tinggi 18 dengan

inisialisasi -2 dan -3, rerata galat baku paling kecil 0,802 dengan inisialisasi -2,

dan jumlah penaksiran konvergen sebanyak 3 dengan inisialisasi 0, -2, dan -3.

Data simulasi pola respon salah-semua nmenunjukkan tingkat exposure paling

tinggi 9 dengan inisialisasi 3, panjang tes paling tinggi 15 dengan inisialisasi 3,

rerata galat baku paling kecil 0,873 dengan inisialisasi 3, dan jumlah penaksiran

konvergen nol.

Data simulasi pola respon salah-benar menunjukkan tingkat exposure

paling tinggi 4 dengan inisialisasi 3, panjang tes paling tinggi 18 dengan

inisialisasi 3, 2 dan 0, rerata galat baku paling kecil 0,803 dengan inisialisasi 0,

dan jumlah penaksiran konvergen sebanyak 4 dengan inisialisasi 3, 2, 0, dan -2.

Data simulasi pola respon normal menunjukkan tingkat exposure paling tinggi 3

dengan inisialisasi 0, panjang tes paling tinggi 18 dengan inisialisasi 2 dan -2,

rerata galat baku paling kecil 0,802 dengan inisialisasi -2, dan jumlah penaksiran

Page 158: CAT RRAD - Unismuh

138

konvergen sebanyak 3 dengan inisialisasi 2, 0, dan -2. Hasil simulasi metode

Futsuhilow pada Lampiran D_4.

b. Metode Fusuhilow

Data simulasi pola respon benar-semua menunjukkan tingkat exposure paling tinggi

13 dengan inisialisasi -3, panjang tes paling tinggi 18 dengan inisialisasi -2,

rerata galat baku paling kecil 0,802 dengan inisialisasi -2, dan jumlah penaksiran

konvergen sebanyak 3 dengan inisialisasi 0,-2, dan -3. Data simulasi pola respon

salah-semua menunjukkan tingkat exposure paling tinggi 9 dengan inisialisasi 3,

panjang tes paling tinggi 15 dengan inisialisasi 3, rerata galat baku terkecil 0,874

dengan inisialisasi 3, dan jumlah penaksiran konvergen nol.

Data simulasi pola respon salah-benar menunjukkan tingkat exposure

paling tinggi 4 dengan inisialisasi 3, panjang tes paling tinggi 18 dengan

inisialisasi 2 dan 0, rerata galat baku paling kecil 0,805 dengan inisialisasi 0, dan

jumlah penaksiran konvergen sebanyak 4 dengan inisialisasi ,3 , 2, 0, dan -2. Data

simulasi pola respon normal menunjukkan tingkat exposure paling tinggi 1 dengan

inisialisasi 0, panjang tes paling tinggi 18 dengan inisialisasi 2 dan -2, rerata galat

baku paling kecil 0,802 dengan inisialisasi -2, dan jumlah penaksiran konvergen

sebanyak 3 dengan inisialisasi 0, -2, dan -3. Hasil simulasi metode Fusuhilow pada

Lampiran D_5.

c. Metode Fumahilow

Data simulasi pola respon benar-semua menunjukkan tingkat exposure

paling tinggi 12 dengan inisialisasi -3, panjang tes paling tinggi 18 dengan

inisialisasi 0 dan -3, rerata galat baku paling kecil 0,799 dengan inisialisasi 0 dan

-3, dan jumlah penaksiran konvergen sebanyak 3 dengan inisialisasi 0, -2, dan -3.

Page 159: CAT RRAD - Unismuh

139

Data simulasi pola respon salah-semua menunjukkan tingkat exposure paling

tinggi 8 dengan inisialisasi 3, panjang tes paling tinggi 15 dengan inisialisasi 3,

rerata galat baku paling kecil 0,903 dengan inisialisasi 3, dan jumlah penaksiran

konvergen nol.

Data simulasi pola respon salah-benar menunjukkan tidak ada tingkat

exposure paling tinggi, panjang tes paling tinggi 18 dengan semua inisialisasi

kecuali -3, rerata galat baku terkecil 0,816 dengan inisialisasi 0, dan jumlah

penaksiran konvergen sebanyak 4 dengan semua inisialisasi kecuali -3. Data

simulasi pola respon normal menunjukkan tingkat exposure tidak ada, panjang tes

paling tinggi 18 dengan inisialisasi 0, rerata galat baku paling kecil 0,812

dengan inisialisasi 0, dan jumlah penaksiran konvergen sebanyak 3 dengan

inisialisasi 2, 0, dan -2. Hasil simulasi metode Fumahilow pada Lampiran D_6.

7. Data Uji Coba Produk CerdasCAT Secara One to One

Hasil uji coba secara one to one menghasilkan data respon peserta tes dan

data verifikasi eksternal produk CerdasCAT. Data respon peserta tes ketiga metode

terdapat pada Lampiran D_13, D_14, dan D_15. Sedangkan data verifikasi eksternal

merupakan respon user terhadap kuesioner setelah mencoba produk CerdasCAT.

Data pendapat setiap user terhadap produk CerdasCAT sebagai berikut.

a. Data pendapat Admin

Kuesioner pendapat Admin terhadap produk CerdasCAT terdiri 10

pernyataan. Jumlah Admin merespon pernyataan tersebut sebanyak 7. Data

pendapat Admin terhadap produk CerdasCAT terdapat pada Tabel 17.

Page 160: CAT RRAD - Unismuh

140

Tabel 17.

Data Pendapat Admin Terhadap Produk CerdasCAT

No Pernyataan %

A B

1 Proses instalisasi produk CerdasCAT 57 43

2 Tampilan antarmuka utama CerdasCAT 43 57

3 Proses Log In di CerdasCAT 71 29

4 Form pendaftaran data user 86 14

5 Form update data user 71 29

6 Form update data SKL 57 43

7 Form update data domain 57 43

8 Form update tiga butir soal 29 71

9 Fungsi navigasi logout 57 43

10 Ujian peserta tes dengan CerdasCAT 43 57

Tabel 17 menunjukkan proses instalisasi produk CerdasCAT 57%

menyatakan sangat baik dan 43% menyatakan baik, tampilan antarmuka utama

CerdasCAT 43% menyatakan sangat baik dan 57% menyatakan baik, proses log

in di CerdasCAT 57% menyatakan sangat baik dan 43% menyatakan baik, form

pendaftaran data user 86% menyatakan sangat baik dan 14% menyatakan baik,

form update data user 71% menyatakan sangat baik dan 29% menyatakan baik,

form update data SKL 57% menyatakan sangat baik dan 43% menyatakan baik,

form update data domain 57% menyatakan sangat baik dan 43% menyatakan

baik, form update tiga butir soal 29% menyatakan sangat baik dan 71%

menyatakan baik, fungsi navigasi logout 57% menyatakan sangat baik dan 43%

menyatakan baik, dan ujian peserta tes dengan CerdasCAT 43% menyatakan

sangat baik dan 57% menyatakan baik.

b. Data pendapat pimpinan

Kuesioner pendapat pimpinan terhadap produk CerdasCAT terdiri 11

pernyataan Jumlah pimpinan merespon pernyataan tersebut sebanyak 7. Data

pendapat pimpinan terhadap produk CerdasCAT terdapat pada Tabel 18.

Page 161: CAT RRAD - Unismuh

141

Tabel 18.

Data Pendapat Pimpinan Terhadap Produk CerdasCAT

No Pernyataan %

A B

1 Tampilan halaman utama CerdasCAT 57 43

2 Proses Log In di CerdasCAT 29 71

3 Tampilan halaman konfigurasi kelulusan 71 29

4 Tampilan halaman pembobotan SKL 29 71

5 Tampilan halaman pembobotan domain 57 43

6 Tampilan halaman pembobotan kriteria 57 43

7 Tampilan halaman kriteria kelulusan 57 43

8 Tampilan halaman kelulusan 43 57

9 Mencetak hasil kelulusan peserta tes 57 43

10 Fungsi navigasi logout 29 71

11 Ujian peserta tes dengan CerdasCAT 29 27

Tabel 18 menunjukkan tampilan halaman utama CerdasCAT 57%

menyatakan sangat baik dan 43% menyatakan baik, proses log in di CerdasCAT

29% menyatakan sangat baik dan 71% menyatakan baik, tampilan halaman

konfigurasi kelulusan 71% menyatakan sangat baik dan 29% menyatakan baik,

tampilan halaman pembobotan SKL 29% menyatakan sangat baik dan 71%

menyatakan baik, tampilan halaman pembobotan domain 57% menyatakan sangat

baik dan 43% menyatakan baik, tampilan halaman pembobotan kriteria 57%

menyatakan sangat baik dan 43% menyatakan baik, tampilan halaman kriteria

kelulusan 57% menyatakan sangat baik dan 43% menyatakan baik, tampilan

halaman kelulusan 43% menyatakan sangat baik dan 57% menyatakan baik,

mencetak hasil kelulusan peserta tes 57% menyatakan sangat baik dan 43%

menyatakan baik, fungsi navigasi logout 57% menyatakan sangat baik dan 43%

menyatakan baik, 57% menyatakan sangat baik dan 43% menyatakan baik, 57%

menyatakan sangat baik dan 43% menyatakan baik, dan ujian peserta tes dengan

CerdasCAT 57% menyatakan sangat baik dan 43% menyatakan baik.

Page 162: CAT RRAD - Unismuh

142

c. Data pendapat pengajar

Kuesioner pendapat pengajar terhadap produk CerdasCAT terdiri 12

pernyataan. Data pendapat pengajar terhadap produk CerdasCAT pada Tabel 19.

Tabel 19.

Data Pendapat Pengajar Terhadap Produk CerdasCAT

No Pernyataan %

A B C

1 Tampilan halaman utama CerdasCAT 43 57

2 Proses Log In di CerdasCAT 29 71

3 Tampilan halaman kelola butir soal 57 43

4 Tampilan halaman entry butir soal 14 86

5 Tampilan halaman update butir soal 14 72 14

6 Form penetapan penilaian 57 43

7 Tampilan halaman penetapan penilaian 57 43

8 Tampilan halaman hasil ujian model 29 71

9 Tampilan halaman laporan kelulusan 43 57

10 Mencetak laporan kelulusan 43 57

11 Fungsi navigasi logout 43 57

12 Ujian peserta tes dengan CerdasCAT 43 57

Tabel 19 menunjukkan tampilan halaman utama CerdasCAT 43%

menyatakan sangat baik dan 57% menyatakan baik, proses log in di CerdasCAT

29% menyatakan sangat baik dan 71% menyatakan baik, tampilan halaman kelola

butir soal 57% menyatakan sangat baik dan 43% menyatakan baik, tampilan

halaman entry butir soal 14% menyatakan sangat baik dan 86% menyatakan

baik, tampilan halaman update butir soal 14% menyatakan sangat baik dan 72%

menyatakan baik serta 14% menyatakan tidak baik, form penetapan penilaian

57% menyatakan sangat baik dan 43% menyatakan baik, tampilan halaman

penetapan penilaian 57% menyatakan sangat baik dan 43% menyatakan baik,

tampilan halaman hasil ujian model 29% menyatakan sangat baik dan 71%

menyatakan baik, tampilan halaman laporan kelulusan 43% menyatakan sangat

Page 163: CAT RRAD - Unismuh

143

baik dan 57% menyatakan baik, mencetak laporan kelulusan 43% menyatakan

sangat baik dan 57% menyatakan baik, fungsi navigasi logout 43% menyatakan

sangat baik dan 57% menyatakan baik, dan ujian peserta tes dengan CerdasCAT

43% menyatakan sangat baik dan 57% menyatakan baik.

d. Data pendapat peserta tes

Kuesioner pendapat peserta tes terhadap produk CerdasCAT terdiri 20

pernyataan Jumlah peserta tes merespon pernyataan tersebut sebanyak 9. Data

pendapat peserta tes terhadap produk CerdasCAT pada tiap metode terdapat pada

Lampiran J_4, J_5, dan J_6.

Lampiran J_4 menunjukkan tampilan antarmuka utama 67% menyatakan

sangat baik dan 33% menyatakan baik, proses log in 44% menyatakan sangat baik

dan 56% menyatakan baik, proses verifikasi nomor peserta 56% menyatakan

sangat baik dan 44% menyatakan baik, jumlah waktu mengerjakan butir soal

inisialisasi selama sembilan menit 56% menyatakan sangat baik dan 44%

menyatakan baik, jumlah waktu mengerjakan tiap butir soal selama tiga menit

67% menyatakan sangat baik dan 33% menyatakan baik, tingkat kesukaran butir

soal sesuai dengan kemampuan 67% menyatakan sangat baik dan 33%

menyatakan baik, butir soal mewakili pokok bahasan yang diajarkan di sekolah

100% menyatakan baik, konsentrasi saat mengerjakan butir soal 22% menyatakan

sangat baik dan 78% menyatakan baik, tampilan butir soal produk CerdasCAT

67% menyatakan sangat baik dan 33% menyatakan baik, memilih jawaban benar

menggunakan mouse (cara klik) 43% menyatakan sangat baik dan 57%

menyatakan baik, tampilan hasil ujian 22% menyatakan sangat baik dan 78%

menyatakan baik, mencetak hasil ujian 44% menyatakan sangat baik dan 56%

Page 164: CAT RRAD - Unismuh

144

menyatakan baik, tampilan hasil kelulusan 22% menyatakan sangat baik dan 78%

menyatakan baik, mencetak hasil kelulusan 44% menyatakan sangat baik dan

56% menyatakan baik, jawaban tidak dapat diperbaiki di CerdasCAT sehingga

menggangu konsentrasi 78% menyatakan tidak setuju dan 22% menyatakan

sangat tidak setuju, lebih mudah membaca butir soal menggunakan CerdasCAT

daripada P&P 33% menyatakan sangat baik dan 67% menyatakan baik, ujian lewat

produk CerdasCAT lebih mencemaskan daripada P&P 44% menyatakan

tidak setuju dan 56% menyatakan sangat tidak setuju, jumlah butir soal lebih

sedikit dikerjakan di produk CerdasCAT daripada P&P 100% menyatakan sangat

setuju, waktu menyelesaikan ujian lebih cepat di produk CerdasCAT daripada

P&P 100% menyatakan sangat setuju, dan ujian lewat CerdasCAT lebih baik

daripada lewat P&P 44% menyatakan sangat baik dan 56% menyatakan baik.

Lampiran J_5 menunjukkan tampilan antarmuka utama 56% menyatakan

sangat baik dan 44% menyatakan baik, proses log in 44% menyatakan sangat

baik dan 56% menyatakan baik, proses verifikasi nomor peserta 56% menyatakan

sangat baik dan 44% menyatakan baik, jumlah waktu mengerjakan butir soal

inisialisasi selama sembilan menit 56% menyatakan sangat baik dan 44%

menyatakan baik, jumlah waktu mengerjakan tiap butir soal selama tiga menit

56% menyatakan sangat baik dan 44% menyatakan baik, tingkat kesukaran butir

soal sesuai dengan kemampuan 67% menyatakan sangat baik dan 33%

menyatakan baik, butir soal mewakili pokok bahasan yang diajarkan di sekolah

44% menyatakan sangat baik dan 56% menyatakan baik, konsentrasi saat

mengerjakan butir soal 11% menyatakan sangat baik dan 89% menyatakan baik,

tampilan butir soal produk CerdasCAT 11% menyatakan sangat baik dan 89%

menyatakan baik, memilih jawaban benar menggunakan mouse (cara klik) 22%

Page 165: CAT RRAD - Unismuh

145

menyatakan sangat baik dan 78% menyatakan baik, tampilan hasil ujian 22%

menyatakan sangat baik dan 44% menyatakan baik, mencetak hasil ujian 44%

menyatakan sangat baik dan 56% menyatakan baik, tampilan hasil kelulusan 56%

menyatakan sangat baik dan 44% menyatakan baik, mencetak hasil kelulusan

100% menyatakan baik, jawaban tidak dapat diperbaiki di CerdasCAT sehingga

menggangu konsentrasi 22% menyatakan tidak setuju dan 78% menyatakan

sangat tidak setuju, lebih mudah membaca butir soal menggunakan CerdasCAT

daripada P&P 44% menyatakan sangat baik dan 56% menyatakan baik, ujian

lewat produk CerdasCAT lebih mencemaskan daripada P&P 44% menyatakan

tidak setuju dan 56% menyatakan sangat tidak setuju, jumlah butir soal lebih

sedikit dikerjakan di produk CerdasCAT daripada P&P 100% menyatakan sangat

setuju, waktu menyelesaikan ujian lebih cepat di produk CerdasCAT daripada

P&P 100% menyatakan sangat setuju, dan ujian lewat CerdasCAT lebih baik

daripada lewat P&P 56% menyatakan sangat baik dan 44% menyatakan baik.

Lampiran J_6 menunjukkan tampilan antarmuka utama 56% menyatakan

sangat baik dan 44% menyatakan baik, proses log in 67% menyatakan sangat baik

dan 33% menyatakan baik, proses verifikasi nomor peserta 11% menyatakan sangat

baik dan 89% menyatakan baik, jumlah waktu mengerjakan butir soal

inisialisasi selama sembilan menit 78% menyatakan sangat baik dan 22%

menyatakan baik, jumlah waktu mengerjakan tiap butir soal selama tiga menit

78% menyatakan sangat baik dan 22% menyatakan baik, tingkat kesukaran butir

soal sesuai dengan kemampuan 89% menyatakan sangat baik dan 11%

menyatakan baik, butir soal mewakili pokok bahasan yang diajarkan di sekolah

78% menyatakan sangat baik dan 22% menyatakan baik, konsentrasi saat

mengerjakan butir soal 22% menyatakan sangat baik dan 78% menyatakan baik,

Page 166: CAT RRAD - Unismuh

146

tampilan butir soal produk CerdasCAT 33% menyatakan sangat baik dan 67%

menyatakan baik, memilih jawaban benar menggunakan mouse (cara klik) 22%

menyatakan sangat baik dan 78% menyatakan baik, tampilan hasil ujian 44%

menyatakan sangat baik dan 56% menyatakan baik, mencetak hasil ujian 67%

menyatakan sangat baik dan 56% menyatakan baik, tampilan hasil kelulusan 22%

menyatakan sangat baik dan 33% menyatakan baik, mencetak hasil kelulusan

33% menyatakan sangat baik dan 67% menyatakan baik, jawaban tidak dapat

diperbaiki di CerdasCAT sehingga menggangu konsentrasi 44% menyatakan

tidak setuju dan 56% menyatakan sangat tidak setuju, lebih mudah membaca butir

soal menggunakan CerdasCAT daripada P&P 56% menyatakan sangat baik dan

44% menyatakan baik, ujian lewat produk CerdasCAT lebih mencemaskan

daripada P&P 56% menyatakan tidak setuju dan 44% menyatakan sangat tidak

setuju, jumlah butir soal lebih sedikit dikerjakan diproduk CerdasCAT daripada

P&P 100% menyatakan sangat setuju, waktu menyelesaikan ujian lebih cepat di

produk CerdasCAT daripada P&P 100% menyatakan sangat setuju, dan ujian lewat

CerdasCAT lebih baik daripada lewat P&P 56% menyatakan sangat baik dan

44% menyatakan baik.

e. Data pendapat wali peserta tes

Kuesioner pendapat wali peserta tes terhadap produk CerdasCAT terdiri 8

pernyataan. Jumlah wali peserta tes merespon pernyataan tersebut sebanyak 9.

Data pendapat wali peserta tes terhadap produk CerdasCAT pada Tabel 20.

Page 167: CAT RRAD - Unismuh

147

Tabel 20.

Data Pendapat Wali Peserta Tes Terhadap Produk CerdasCAT

No Pernyataan %

A B

1 Tampilan antarmuka utama CerdasCAT 56 44

2 Proses Log In di CerdasCAT 23 67

3 Tampilan hasil ujian peserta tes 56 44

4 Mencetak hasil ujian peserta tes. 11 89

5 Tampilan hasil kelulusan peserta tes 33 67

6 Mencetak hasil kelulusan peserta tes 67 33

7 Fungsi navigasi logout 67 33

8 Ujian peserta tes dengan CerdasCAT 67 33

Tabel 20 menunjukkan tampilan antarmuka utama CerdasCAT 56%

menyatakan sangat baik dan 44% menyatakan baik, proses log in di CerdasCAT

23% menyatakan sangat baik dan 67% menyatakan baik, tampilan hasil ujian

peserta tes 56% menyatakan sangat baik dan 44% menyatakan baik, mencetak

hasil ujian peserta tes 11% menyatakan sangat baik dan 89% menyatakan baik,

tampilan hasil kelulusan peserta tes 33% menyatakan sangat baik dan 67%

menyatakan baik, mencetak hasil kelulusan peserta tes 67% menyatakan sangat

baik dan 33% menyatakan baik, fungsi navigasi logout 67% menyatakan sangat

baik dan 33% menyatakan baik, dan ujian peserta tes dengan CerdasCAT 67 %

menyatakan sangat baik dan 33% menyatakan baik.

8. Data Uji Coba Produk CerdasCAT Secara Terbatas

Data hasil uji coba produk dengan metode Futsuhilow, Fusuhilow, dan

Fumahilow yang terdiri panjang tes, galat baku penaksiran parameter kemampuan

peserta tes, dan waktu respon peserta tes masing-masing terdapat pada Lampiran D_7,

D_8, dan D_9. Sedangkan data tingkat exposure butir soal dari hasil uji coba produk

dengan metode Futsuhilow, Futsuhilow, dan Futsuhilow masing-masing pada

Lampiran D_10, D_11, dan D_12.

Page 168: CAT RRAD - Unismuh

148

B. Analisis Data

1. Analisis Butir Soal

Analisis butir soal tujuh paket tes matematika UN SD dilakukan secara

simultan. Untuk tujuan tersebut, analisis butir soal menggunakan desain Group-Wise

Adaptive Testing program Bilog_MG. Hasilnya analisis menunjukkan jumlah soal

paket Provinsi Sulawesi Selatan dan Kabupaten Sidoarjo Provinsi Jawa Timur yang

fit dan tidak fit dengan model Rasch pada Tabel 21.

Tabel 21.

Jumlah Butir Soal Fit dan Tidak Fit Model Rasch

Tempat/Tahun Jumlah

Soal

Analisis Tahap I Analisis Tahap II

Bank

Soal Fit

Model

Tidak Fit

Model

Fit

Model

Tidak

Fit

Model

Kabupaten

Soppeng/2007

40 35 5 35 0 40

Kabupataten Sidoarjo,

Kabupaten Soppeng,

dan Kota Makassar/

2008

120-20

90

10

90

0

100

Provinsi Sul-Sel/2009 120-20 78 22 78 0 100

Jumlah Butir Soal 240 203 37 203 0 240

Pada Tabel 21 kolom analisis tahap I menunjukkan 203 butir soal fit model

dianalisis lebih lanjut secara kuantitatif pada tahap II sedangkan 37 butir soal tidak fit

model dianalisis lebih lanjut secara kualitatif. Hasil analisis secara kuantitatif

menunjukkan semua butir soal sudah fit model sehingga analisis kuantitatif tahap ke

tiga tidak dilakukan. Selanjutnya, hasil analisis kualitatif melibatkan tiga kelompok

guru masing-masing guru kelas IV, V, dan VI menunjukkan 11 butir soal direvisi

karena pokok butir soal tidak dirumuskan secara jelas dan tegas, 5 butir soal direvisi

karena butir soal tidak menggunakan bahasa yang sesuai dengan kaidah bahasa

Indonesia, dan 21 butir soal tidak direvisi karena masalah respon peserta tes terhadap

butir tersebut hampir sama.

Page 169: CAT RRAD - Unismuh

149

Berdasarkan asumsi yang telah ditetapkan bahwa butir soal yang tidak

memenuhi model setelah dianalisis secara kualitatif dan pola respon tidak mengalami

perubahan secara signifikan karakteristiknya sehingga 240 butir soal tersebut

dimasukkan pada bank butir soal. Butir soal tersebut terdiri dari lima SKL, yakni 87

butir soal dari SKL bilangan, 61 butir soal dari SKL ukuran, 67 butir soal dari SKL

bangun, lima butir soal dari SKL koordinat, dan 20 butir soal dari SKL data. Karena,

jumlah butir soal pada SKL koordinat sebanyak lima tidak dimasukkan dalam bank

butir soal dalam SKL koordinat tersendiri namun digabung ke SKL bangun sehingga

pada produk CerdasCAT tidak ada SKL koordinat. Hal tersebut dilakukan karena hasil

simulasi menunjukkan jika SKL tersebut dimasukkan maka tidak ada simulasi yang

bisa konvergen karena pada saat pelacakan butir soal yang adaptif pada SKL tersebut

maka penaksiran berhenti karena butir soal tidak tersedia. Oleh karena itu, kelima

butir SKL koordinat tersebut digabung ke SKL bangun karena lebih sesuai

dibandingkan dengan SKL lain. Jadi, jumlah butir soal yang dientri pada bank butir

soal sebanyak 240 butir. Tingkat kesukaran dan kunci butir soal tersebut masing-

masing terdapat pada Lampiran B_6 dan B_7.

Jumlah butir soal tersebut jika dibagi dengan jumlah kategori tingkat

kemampuan sebanyak 5 maka tiap SKL mempunyai butir soal cukup besar walaupun

penyebaran tingkat kesukaran butir soal tidak merata. Jika dibandingkan penelitian

Haryanto (2009) menggunakan 62 butir soal dengan tiga kategori yakni hanya sekitar

20 butir soal maka butir soal yang ada pada bank butir soal produk CerdasCAT

termasuk dalam jumlah yang besar.

Page 170: CAT RRAD - Unismuh

150

2. Analisis Data Simulasi produk CAT

a. Simulasi Metode Futsuhilow

Sampel hasil simulasi pada pola respon benar-semua menunjukkan galat

baku penaksiran parameter kemampuan semakin kecil seiring meningkatnya

jumlah butir soal. Artinya simulasi pola respon benar-semua pada metode

Futsuhilow sesuai dengan teori pengembangan CAT yang telah ditetapkan. Hasil

pola respon benar-semua pada Lampiran D_1.

Selanjutnya, hasil simulasi dengan empat pola respon pada metode

Futsuhilow menunjukkan semua pola respon sudah sesuai dengan metode

Tsukamoto dan metode high-low dimana exposure butir soal yang diberikan

secara adaptif dengan kemampuan peserta tes pada umumnya berada pada setiap

domain kategori inisialisasi. Semakin panjang tes maka semakin kecil galat baku

walaupun pada panjang tes yang sama nilai galat baku bervariasi bergantung pada

karakteristik butir tes yang direspon saat ini. Galat baku penaksiran parameter

kemampuan sudah sesuai dengan teori dan terkait dengan konvergen suatu

taksiran. Hal tersebut dapat dilihat pada Lampiran D_4. Berdasarkan hal tersebut

metode Futsuhilow dapat diujicobakan secara riil di lapangan.

b. Simulasi Metode Fusuhilow

Sampel hasil simulasi pola respon salah-benar pada metode Fusuhilow

menunjukkan penaksiran konvergen dengan panjang tes 15 butir soal dan skor

36,825 serta tingkat exposure butir soal dalam kategori tinggi karena tidak

terdapat butir soal yang melewati batas domain inisialisasi kemampuan -2. Galat

baku penaksiran parameter kemampuan menurun seiring meningkatnya jumlah

butir soal yang direspon. Artinya simulasi pola respon salah-benar pada metode

Page 171: CAT RRAD - Unismuh

151

Fusuhilow sesuai dengan teori pengembangan CAT yang telah ditetapkan. Hasil

pola respon salah-benar pada Lampiran D_2.

Selanjutnya, hasil simulasi dengan empat pola respon pada metode

Fusuhilow menunjukkan semua pola respon sudah sesuai dengan teori metode

fuzzy Sugeno dan metode High-Low dimana exposure butir soal yang diberikan

secara adaptif dengan kemampuan peserta tes pada umumnya berada pada setiap

domain kategori inisialisasi. Semakin panjang tes maka semakin kecil galat baku

walaupun pada panjangn tes sama nilai galat baku bervariasi bergantung pada

karakteristik butir tes yang direspon saat ini. Galat baku penaksiran parameter

kemampuan sudah sesuai dengan teori dan terkait dengan konvergen suatu

taksiran. Hal tersebut dapat dilihat pada Lampiran D_5. Berdasarkan hal tersebut

metode Fusuhilow dapat diujicobakan secara riil di lapangan.

c. Simulasi Metode Fumahilow

Sampel hasil simulasi pola respon normal pada metode Fumahilow

menunjukkan penaksiran konvergen dengan panjang tes 15 butir soal dengan skor

86,388 dimana tingkar exposure butir soal dalam kategori sedang karena hanya

satu butir soal terakhir melewati batas domain himpunan fuzzy parameter

kemampuan atau inisialisasi kemampuan = 0. Galat baku penaksiran parameter

kemampuan menurun seiring meningkatnya jumlah butir soal yang direspon dan

selama proses tersebut tingkat kemampuan meningkat terus sampai penaksiran

konvergen. Artinya simulasi pola respon normal pada metode Fumahilow sesuai

dengan teori pengembangan CAT yang telah ditetapkan. Hasil pola respon normal

pada Lampiran D_3.

Selanjutnya, hasil simulasi menggunakan empat pola respon metode

Futsuhilow menunjukkan pada semua pola respon sudah sesuai dengan teori

Page 172: CAT RRAD - Unismuh

152

penalaran Mamdani dan metode high-low dimana exposure butir soal yang

diberikan secara adaptif dengan kemampuan peserta tes pada umumnya berada

pada setiap domain kategori inisialisasi. Semakin panjang tes maka semakin kecil

galat baku walaupun pada panjang tes yang sama nilai galat baku bervariasi

bergantung pada karakteristik butir tes yang direspon saat ini. Galat baku

penaksiran parameter kemampuan sudah sesuai dengan teori dan terkait dengan

konvergen suatu taksiran. Hal tersebut dapat dilihat pada Lampiran D_6.

Berdasarkan hal tersebut metode Fumahilow dapat diujicobakan secara riil di

lapangan.

Berdasarkan hasil simulasi pola respon ketiga metode dengan

memperhatikan panjang tes, tingkat exposure soal, dan galat baku penaksiran

parameter kemampuan sudah sesuai dengan rancangan dengan memperhatikan

rancangan antamuka, aturan logika ketiga metode, dan karakteristik bank butir soal.

3. Analisis Data Instrumen Pendapat User Terhadap Produk CerdasCAT

Analisis pendapat user terhadap produk CerdasCAT dimaksudkan untuk

menyelidiki bagian-bagian yang dianggap belum baik sesuai dengan peran masing-

masing terhadap produk. Hal tersebut dimaksudkan agar yang belum berfungsi secara

maksimal dapat diupdate sebelum uji coba secara terbatas. Adapun pendapat user

Admin terhadap 10 pernyaatan menunjukkan rerata 57% menjawab sangat baik, dan

42% menjawab baik sedangkan yang menjawab tidak baik dan sangat tidak baik tidak

ada. Artinya, pendapat Admin terhadap produk CerdasCAT sangat baik. Pendapat

pimpinan terhadap 11 pernyaatan menunjukkan 47% menjawab sangat baik, dan 49%

menjawab baik sedangkan yang menjawab tidak baik dan sangat tidak baik tidak ada.

Page 173: CAT RRAD - Unismuh

153

Artinya, pendapat pimpinan terhadap produk CerdasCAT sangat baik. Pendapat

pengajar terhadap 12 pernyaatan menunjukkan 39% menjawab sangat baik, 60%

menjawab baik, dan 1,2% menjawab tidak baik, sedangkan yang menjawab sangat

tidak baik tidak ada. Artinya, pendapat pengajar terhadap produk CerdasCAT baik.

Pendapat wali peserta tes terhadap 8 pernyaatan menunjukkan 48% menjawab sangat

baik, 51% menjawab sedangkan yang menjawab tidak baik dan sangat tidak baik tidak

ada. Artinya, pendapat wali peserta tes terhadap produk CerdasCAT baik.

Pendapat peserta tes setelah mengambil ujian dengan metode Futsuhilow

menunjukkan 49% menjawab sangat baik, dan 48% menjawab baik sedangkan yang

menjawab tidak baik dan sangat tidak baik tidak ada. Artinya, pendapat peserta tes

yang mengambil ujian dengan metode Futsuhilow terhadap produk CerdasCAT sangat

baik. Pendapat peserta tes setelah mengambil ujian dengan metode Fusuhilow

menunjukkan 50% menjawab sangat baik, dan 49% menjawab baik sedangkan yang

menjawab tidak baik dan sangat tidak baik tidak ada. Artinya, pendapat peserta tes

yang mengambil ujian dengan metode Fusuhilow terhadap produk CerdasCAT sangat

baik. Pendapat peserta tes setelah mengambil ujian dengan metode Fumahilow

menunjukkan 55% menjawab sangat baik, dan 45% menjawab baik sedangkan yang

menjawab tidak baik dan sangat tidak baik tidak ada. Artinya, pendapat peserta tes

yang mengambil ujian dengan metode Fumahilow terhadap produk CerdasCAT

sangat baik. Pendapat wali peserta tes terhadap 8 pernyaatan menunjukkan rerata

47,5% menjawab sangat baik, dan 52,5% menjawab baik sedangkan yang menjawab

tidak baik dan sangat tidak baik tidak ada. Artinya, pendapat wali peserta tes terhadap

produk CerdasCAT baik.

Satu pernyataan yang diberikan pada Admin, pimpinan, pengajar, dan wali

peserta tes yakni ”Ujian peserta tes Menggunakan CerdasCAT” rata-rata menjawab

Page 174: CAT RRAD - Unismuh

154

sangat baik, sedangkan satu pernyataan diberikan kepada semua peserta tes berkenaan

dengan pernyataan ”Ujian lewat CerdasCAT lebih baik daripada lewat P&P” rerata

menjawab sangat setuju. Berdasarkan hal tersebut, proses ditempuh user melakukan

aksi sudah sesuai pengembangan dan sangat setuju produk CerdasCAT sabagai

alternatif media ujian.

Analisis secara deskriptif terhadap pola respon dari sembilan hasil ujian peserta

tes ketiga metode dalam merespon butir soal menunjukkan penaksiran kemampuan

peserta tes menggunakan butir soal dalam bank soal semuanya konvergen dengan

inisialisasi kemampuan yang berbeda. Artinya bahwa ketersediaan butir soal pada

bank butir soal cukup dalam melingkungi kemampuan peserta tes. Oleh karena itu,

tingkat kesukaran butir soal di dalam bank butir soal dapat digunakan dalam

mengukur kemampuan peserta tes dengan tingkat kemampuan yang berbeda,

selanjutnya produk CerdasCAT dapat digunakan dalam uji coba terbatas.

4. Sampel Analisis Data Uji Coba Terbatas

Hasil simulasi dan uji coba secara one to one menjadi rujukan uji coba secara

terbatas produk CerdasCAT di lapangan.

a. Sampel uji coba terbatas CerdasCAT menggunakan metode Futsuhilow

Sampel uji coba ujian peserta tes dengan metode Futsuhilow atas nama

Moh. Adli Akbar mempunyai nomor peserta 10100101001_021 dari SD 1

Lamappoloware pada Lampiran J_1. Moh. Adli Akbar mempunyai theta awal

sama dengan -2, artinya Moh. Adli Akbar hanya mampu menjawab benar satu

butir soal dengan tingkat kesukaran rendah sehingga merespon butir soal dengan

tingkat kesukaran lebih kecil -2 yakni -2,091. Theta akhir pada putaran pertama

sebesar -2,091. Nilai tersebut sudah memenuhi aturan basis pengetahuan metode

Page 175: CAT RRAD - Unismuh

155

fuzzy Tsukamoto. Selanjutnya diperoleh galat baku 2,002 dan skor akhir 23,682

serta waktu respon 1:07 (satu menit lebih tujuh detik) untuk butir soal tersebut.

Butir soal tersebut direspon salah kemudian tingkat kesukaran diturunkan sebesar

0,2 atau lebih besar sehingga diperoleh butir soal dengan tingkat kesukaran -2,324.

Butir tersebut direspon benar sehingga butir soal selanjutnya dinaikkan 0,1 atau

lebih diperoleh -1,672 dengan nilai galat baku 1,42, selisih galat baku 0,58, dan skor

20,95 serta waktu respon 1:14 (satu menit lebih 14 detik). Naik turun nilai tersebut

sudah memenuhi aturan metode high low. Mekanisme tersebut berlanjut sampai

penaksiran kemampuan peserta tes konvergen dimana selisih galat baku lebih kecil

atau sama dengan 0,01.

Moh. Adli Akbar mempunyai data tambahan yakni panjang tes 17 butir

soal dan jumlah waktu respon tes 56:21 (56 menit 21 detik) serta kemampuan akhir

sebesar -0,566, Selanjutnya, Moh. Adli Akbar mempunyai data kemampuan

-0,566. Data tersebut salah satu indikator seleksi kelulusan menggunakan konsep

DSS.

Moh. Adli Akbar mempunyai panjang tes sebesar 17 butir soal yang berasal

dari SKL ukuran 5 butir, bangun 4 butir, data 4 butir, dan bilangan 4 butir

soal. Proporsi jumlah butir soal setiap SKL yang direspon terkait inisialisasi

kemampuan dan urutan prioritas. Urutan butir soal sudah tetap yakni dilakukan

secara siklus ukuran, bangun, data, bilangan, ukuran, bangun, data, bilangan dan

seterusnya seperti pola respon Moh. Adli Akbar. Urutan tersebut tidak dapat

berubah sehingga butir soal pertama yang direspon peserta tes yang paling

menentukan. Panjang tes dari keseluruhan peserta tes yang mengambil ujian dengan

metode Fusuhilow pada Lampiran D_7 kolom 1 dan pada Lampiran E_3.

Page 176: CAT RRAD - Unismuh

156

Rerata panjang tes yang ditempuh sebanyak 17 butir soal dengan panjang tes

paling pendek 15 butir dan paling panjang 18 butir soal.

Moh. Adli Akbar mempunyai theta awal -2. Nilai tersebut merupakan nilai

tengah himpunan fuzzy rendah dengan domain -4 sampai nol. Semua butir soal yang

direspon oleh Moh. Adli Akbar berada dalam domain theta awal. Artinya

metode Futsuhilow dapat mengendalikan tingkat exposure butir soal. Selanjutnya,

korelasi antara kemampuan Moh. Adli Akbar dengan tingkat kesukaran butir soal

yang dikerjakan 0,826 sangat tinggi (Lampiran F_8), dan secara deskriptif selisih

rerata dan simpangan baku antara theta awal dan tingkat kesukaran masing-

masing 0,084 dan 0,019 (Lampiran F_7). Hal tersebut menunjukkan bahwa butir

soal yang dikerjakan oleh Moh. Adli Akbar sesuai dengan tingkat

kemampuannya.

Moh. Adli Akbar mempunyai galat baku penaksiran parameter butir

pertama 2,002 dimana nilai 2,002 terjadi karena P dan Q mempunyai nilai yang

hampir sama 0,5. Nilai galat baku semakin menurun seiring dengan meningkatnya

jumlah butir yang ditempuh. Nilai galat terakhir 0,492 sampai penaksiran

parameter kemampuan konvergen. Data galat baku penaksiran parameter

kemampuan terdapat pada Lampiran H_1. Selanjutnya, Lampiran J_1

menunjukkan semakin banyak butir soal yang direspon peserta tes maka galat baku

penaksiran tiap butir soal semakin kecil walaupun penurunannya berbeda-

beda sesuai dengan karakterisk butir soal dan kemampuan peserta tes yang

direspon saat ini. Lampiran E_3 menunjukkan rerata jumlah galat baku

penaksirannya 0,818 dengan jumlah galat baku yang paling kecil sampai

konvergen 0,776 dan jumlah galat baku yang paling besar 0,879.

Page 177: CAT RRAD - Unismuh

157

Moh. Adli Akbar merespon butir soal selama 24 menit 48 detik sebanyak

17 butir soal sehingga rerata waktu respon tiap butir soal adalah 1 menit 27 detik.

Selama waktu respon tersebut, butir soal paling cepat direspon 33 detik dengan

jawaban salah pada butir soal ke-16 berasal dari SKL bilangan dengan tingkat

kesukaran butir soal -0,531 dan nomor ID butir soal 315, sedangkan paling lama

selama 2 menit 6 detik dengan jawaban benar pada butir soal ke-8 berasal dari

SKL ukuran dengan tingkat kesukaran butir soal -0,94 dan nomor ID butir soal

313. Data waktu respon tiap peserta tes pada tiap butir soal terdapat pada

Lampiran I_1. Selanjutnya pada Lampiran I_4 menunjukkan waktu respon tiap

butir soal bervariasi secara keseluruhan, yakni paling cepat adalah 4 detik dan

paling lama adalah 2 menit 23 detik. Rerata waktu respon keseluruhan peserta tes

sebesar 1 menit 17 detik sampai penaksiran konvergen. Waktu paling cepat 1 menit

2 detik dan waktu paling lama 1 menit 38 detik pada Lampiran E_3.

b. Sampel uji coba terbatas CerdasCAT Menggunakan Metode Fusuhilow

Sampel uji coba ujian peserta tes dengan metode Fusuhilow atas nama

Moh. Habibi Akbar mempunyai nomor peserta 10100101001_062 dari SD 1

Lamappoloware terdapat pada Lampiran J_2. Moh. Habibi Akbar mempunyai

theta awal 0, artinya hanya mampu menjawab butir soal benar pada dengan

tingkat kesukaran (rendah,cukup) atau cukup sehingga Moh. Habibi Akbar

merespon butir soal dengan tingkat kesukaran lebih kecil 0 yakni -0,008 dengan

theta akhir pada putaran pertama -0,007. Nilai tersebut sudah memenuhi aturan

basis pengetahuan metode fuzzy Sugeno. Selanjutnya, nilai galat baku 2 dan skor

49,913 dengan waktu respon 1:34 (satu menit lebih tiga puluh empat detik). Butir

soal tersebut direspon benar sehingga dinaikkan sebesar 0,1 atau lebih sehingga

Page 178: CAT RRAD - Unismuh

158

diperoleh butir soal dengan tingkat kesukaran 0,216. Butir tersebut direspon benar

dan nilai galat baku 1,419, selisih galat baku 0,58 dan skor 52,713 dengan waktu

respon 1:43 (satu menit lebih 43 detik). Nilai tingkat kesukaran naik turun

tersebut sudah sesuai dengan aturan metode high low. Mekanisme tersebut

berlanjut sampai penaksiran kemampuan peserta tes konvergen dimana selisih

galat baku sama dengan 0,01. Moh. Habibi Akbar mempunyai data tambahan

yakni panjang tes 15 butir, rerata galat baku penaksiran parameter kemampuan

0,871 dengan galat baku terakhir saat penaksiran konvergen 0,53 dan waktu

respon tes 25:02 (25 menit 2 detik) serta kemampuan akhir sebesar 2,912.

Selanjutnya, Moh. Habibi Akbar mempunyai data kemampuan 2,912. Data

tersebut salah satu indikator seleksi kelulusan menggunakan konsep DSS.

Moh. Habibi Akbar mempunyai panjang tes 15 butir soal yang terdiri dari

SKL ukuran 4 butir, bangun 4 butir, data 4 butir, dan bilangan 3 butir. Proporsi

munculnya jumlah butir setiap SKL terkait dengan urutan yang paling

menentukan adalah inisialisasi kemampuan kemudian prioritas. Proporsi jumlah

butir setiap SKL yang direspon terkait inisialisasi kemampuan dan urutan

prioritas. Urutan butir soal sudah tetap yakni dilakukan secara siklus ukuran,

bangun, data, bilangan, ukuran, bangun, data, bilangan dan seterusnya seperti

pola respon Moh. Habibi Akbar. Urutan tersebut tidak dapat berubah sehingga

butir soal pertama yang direspon peserta tes yang paling menentukan. Panjang tes

keseluruhan peserta tes yang mengambil ujian pada metode Fusuhilow pada

Lampiran E_1 kolom 2 dan pada Lampiran E_3 dimana diperoleh rerata panjang

tes yang ditempuh sebanyak 14 butir soal dengan panjang tes paling pendek 11

butir dan paling panjang 17 butir soal.

Page 179: CAT RRAD - Unismuh

159

Moh. Habibi Akbar mempunyai theta awal 0 merupakan nilai tengah dari

himpunan fuzzy sedang dengan domain -2 sampai 2. Data butir soal yang direspon

berada pada domain theta awal sehingga dalam sampel tersebut metode Fusuhilow

dapat mengendalikan tingkat exposure butir soal. Selanjutnya, korelasi antara

kemampuan Moh. Habibi Akbar dengan tingkat kesukaran butir soal sebesar

0,713 sangat tinggi (Lampiran F_8), dan secara deskriptif selisih rerata dan

simpangan baku antara theta awal dan tingkat kesukaran masing-masing 0,193

dan 0,113 (Lampiran F_7). Hal tersebut menunjukkan bahwa butir soal yang

dikerjakan oleh Moh. Habibi Akbar sesuai dengan tingkat kemampuannya.

Moh. Habibi Akbar mempunyai galat baku penaksiran parameter butir

pertama 2 karena nilai P dan Q mempunyai nilai sama 0,5. Nilai galat baku akan

semakin menurun seiring dengan meningkatnya jumlah butir dimana nilai galat

baku terakhir 0,53 sampai penaksiran parameter kemampuan konvergen. Data

galat baku penaksiran parameter kemampuan terdapat pada Lampiran H_2.

Selanjutnya, Lampiran J_2 menunjukkan galat baku penaksiran tiap butir soal

semakin kecil seiring dengan bertambah banyaknya jumlah butir soal walaupun

penurunannya berbeda sesuai dengan karakterisk butir soal dan kemampuan

peserta tes saat ini. Lampiran E_3 menunjukkan rerata jumlah galat baku

penaksiran 0,877 dengan jumlah galat baku yang paling kecil sampai konvergen

0,809 dan jumlah galat baku yang paling besar 0,954.

Moh. Habibi Akbar merespon butir soal selama 25 menit 2 detik dengan

jumlah butir soal 15 butir sehingg rerata tiap butir 1 menit 4 detik. Selama waktu

respon tersebut, butir soal yang paling cepat adalah butir ke-8 pada SKL

bilangan dimana nomor ID butir soal 404 dengan jawaban benar selama 48 detik,

sedangkan yang paling lama adalah butir ke-9 pada SKL ukuran dimana nomor ID

Page 180: CAT RRAD - Unismuh

160

butir soal 193 dengan jawaban benar selama 2 menit 17 detik dengan jangka

waktu yang diberikan 3 menit. Data waktu respon tiap peserta tes pada tiap butir

soal pada Lampiran I_2 dan I_5. Data tersebut menunjukkan waktu respon tiap

butir soal bervariasi antara 4 detik sampai 2 menit 23 detik. Rerata waktu respon

keseluruhan peserta tes sebesar 1 menit 24 detik sampai penaksiran konvergen.

Waktu paling cepat 1 menit 6 detik dan waktu paling lama 1 menit 46 detik pada

Lampiran E_3.

c. Uji Coba CerdasCAT Menggunakan Metode Fumahilow

Sampel uji coba ujian peserta tes dengan metode Fumahilow atas nama

Moh. Dliyaul Haq mempunyai nomor peserta 10100101001_010 dari SD 1

Lamappoloware terdapat pada Lampiran J_3. Moh. Dliyaul Haq mempunyai

nilai theta awal -2, artinya Moh. Dliyaul Haq dapat menjawab butir soal dengan

benar dengan tingkat kesukaran rendah. Butir soal selanjutnya mempunyai tingkat

kesukaran lebih kecil -2 yakni -2,091 dan theta akhir pada putaran pertama -1,591.

Nilai tersebut sudah memenuhi aturan basis pengetahuan metode fuzzy Mamdani.

Selanjutnya nilai galat baku 2,002 dan skor 22,586 serta waktu respon 2:19 (dua

menit lebih sembilan belas detik). Butir soal tersebut direspon salah sehingga

diturunkan 0,2 atau lebih besar sehingga diperoleh butir soal dengan tingkat

kesukaran -2,324 dan tingkat kemampuan -1,824. Butir tersebut direspon benar

sehingga butir soal selanjutnya dinaikkan 0,1 atau lebih diperoleh -1,672 dengan

nilai galat baku 1,42, selisih galat baku 0,58 dan tingkat kemampuan -1,172 atau

skor 35,35 dengan waktu respon 1:22 (satu menit lebih 22 detik). Nilai tingkat

kesukaran naik turun tersebut sudah memenuhi aturan metode high low

Mekanisme tersebut berlanjut sampai penaksiran kemampuan peserta tes

Page 181: CAT RRAD - Unismuh

161

konvergen dimana selisih galat baku 0,01 atau lebih kecil. Moh. Dliyaul Haq

mempunyai data tambahan yakni panjang tes 17 butir dan waktu respon tes 26:25

(26 menit 25 detik). Jadi Moh. Dliyaul Haq membutuhkan jumlah butir soal 17

butir sampai penaksiran konvergen dengan kemampuan akhir -1,197 atau skor

35,038. Selanjutnya, Moh. Dliyaul Haq mempunyai data kemampuan -1,197. Data

tersebut salah satu indikator seleksi kelulusan menggunakan konsep DSS.

Moh. Dliyaul Haq mempunyai panjang tes 17 butir yang terdiri SKL ukuran

5 butir, bangun 4 butir, data 4 butir, dan bilangan 4 butir . Data panjang tes

keseluruhan dari peserta tes yang mengambil ujian dengan metode Fumahilow

pada Lampiran E_1 kolom 3. Selanjutnya, pada Lampiran E_3 menunjukkan

rerata panjang tes yang ditempuh 16 butir dengan panjang tes paling pendek 14

butir dan paling panjang 18 butir.

Moh. Dliyaul Haq mempunyai nilai theta awal -2 dimana nilai tersebut

merupakan nilai tengah dari himpunan fuzzy rendah dengan domain -4 sampai nol.

Semua butir soal tersebut yakni butir ke-1 sampai butir ke-17 menunjukkan nilai

theta setiap putaran berada antara -4 sampai nol sehingga pola respon peserta tes

tersebut tetap dalam kategori tinggi. Selanjutnya, korelasi antara kemampuan

Moh. Dliyaul Haq dengan tingkat kesukaran butir soal 0,802 (Lampiran F_8).

Secara deskriptif menunjukkan selisih rerata dan simpangan baku antara theta awal

dan tingkat kesukaran masing-masing 0,053 dan 0,032 (Lampiran F_7). Hal

tersebut menunjukkan bahwa butir soal yang dikerjakan oleh Moh. Dliyaul Haq

sesuai dengan tingkat kemampuannya.

Moh. Dliyaul Haq mempunyai galat baku penaksiran parameter butir

pertama sebesar 2,002 karena nilai P dan Q mempunai nilai hampir sama yakni

sekitar 0,5. Nilai galat baku akan semakin menurun seiring dengan meningkatnya

Page 182: CAT RRAD - Unismuh

162

jumlah butir yang ditempuh dimana nilai galat baku yang terakhir sebesar 0,49

sampai penaksiran parameter kemampuan konvergen. Data galat baku penaksiran

parameter kemampuan pada Lampiran H_3. Selanjutnya, Lampiran J_3

menunjukkan galat baku penaksiran tiap buti soal semakin kecil seiring dengan

bertambah banyaknya jumlah butir soal yang direspon peserta tes walaupun

penurunannya berbeda-beda sesuai dengan karakterisk butir soal dan kemampuan

peserta tes saat ini. Lampiran E_3 menunjukkan rerata jumlah galat baku

penaksiran parameter kemampuan sebesar 0,839 dengan jumlah galat baku yang

paling kecil sampai konvergen 0,782 dan jumlah galat baku yang paling besar

0,887.

Moh. Dliyaul Haq merespon butir sola selama 24 menit 48 detik dengan

jumlah soal sebanyak 17 butir, artinya rerata waktu respon tiap butir soal selama 1

menit 32 detik sampai penaksiran parameter kemampuannya konvergen

(Lampiran I_6). Selama waktu respon tersebut, Moh. Adli Akbar merespon butir

soal paling cepat pada butir ke-10 mengenai SKL bangun dengan tingkat

kesukaran butir soal -2,262 dan nomor ID butir soal 335 dengan jawaban salah

selama 7 detik, sedangkan yang paling lama pada butir ke-12 mengenai SKL

bilangan dengan tingkat kesukaran butir soal -0,633 dan nomor ID butir soal 312

dengan jawaban salah selama 2 menit 23 detik.

Selanjutnya, pada Lampiran I_6 menunjukkan waktu respon tiap butir soal

bervariasi, yakni yang paling cepat 2 detik sedangkan paling lama 2 menit 23

detik. Sedangkan rerata tiap butir direspon oleh setiap peserta tes sekitar 1 menit

lebih dimana yang paling cepat adalah 1 menit 6 detik. Data rerata waktu respon

keseluruhan peserta tes 1 menit 25 detik sampai penaksiran konvergen dan waktu

paling cepat 1 menit 6 detik serta paling lama 1 menit 46 detik pada Lampiran E_3.

Page 183: CAT RRAD - Unismuh

163

5. Analisis perbandingan ketiga metode pengembangan

Uji coba terbatas produk CerdasCAT menghasilkan output panjang tes,

tingkat exposure, galat baku penaksiran parameter kemampuan, dan jumlah waktu

respon butir soal. Ketiga metode pengembangan mempunyai mekanisme berlainan

menghasilkan output sehingga nilainya berbeda-beda. Oleh karena itu, perbandingan

ketiga metode tersebut dengan memperhatikan panjang tes, tingkat exposure butir

soal, galat baku penaksiran parameter kemampuan, dan jumlah waktu respon butir soal

memerlukan analisis lebih lanjut.

Data panjang tes ketiga metode terdapat pada Lampiran E_1. Ketiga metode

mempunyai perbedaan secara signifikan dimana metode Fusuhilow mempunyai

panjang tes yang paling kecil dengan rerata 14 butir soal, kemudian metode

Fumahilow dengan rerata 16 butir soal, dan metode Futsuhilow mempunyai rerata 17

yang terdapat pada Lampiran E_3 dan E_4.

Tingkat exposure butir soal ketiga metode memperhatikan tingkat kemapanan

butir soal yang direspon peserta tes dengan domain himpunan fuzzy kemampuan peserta

tes saat inisialisasi. Secara statistik kecenderungan tersebut diperoleh dengan

mengkategorikan kemapanan tersebut berdasarkan letak inisialisasi awal kemampuan

pada himpunan fuzzy dengan pergerakan nilai theta dan tingkat kesukaran butir soal

dengan analisis korelasi.

Tingkat exposure butir soal pada metode Futsuhilow dapat dilihat pada

analisis secara deskriptif. Perbedaan rerata dan simpangan baku tiap kategori theta dan

tingkat kesukaran hampir sama. Artinya, ada hubungan dan positif, namun belum

diketahui tingkat hubungan tersebut. Oleh karena itu, dilakukan analisis lanjutan

Page 184: CAT RRAD - Unismuh

164

menggunakan analisis korelasi Pearson. Kategori himpunan fuzzy kemampuan sangat

tinggi mempunyai korelasi 0,816, kategori himpunan fuzzy kemampuan tinggi

mempunyai korelasi 0,857, kategori himpunan fuzzy kemampuan sedang mempunyai

korelasi 0,898, kategori himpunan fuzzy kemampuan rendah mempunyai korelasi

0,724, sedangan kategori himpunan fuzzy kemampuan sangat rendah tidak

mempunyai data disebabkan tidak ada peserta tes yang menempuh kategori

kemampuan tersebut. Analisis secara deskriptif dan korelasi terdapat pada Lampiran

F_1 dan F_2.

Tingkat exposure butir soal pada metode Fusuhilow dapat dilihat pada

analisis secara deskriptif. Perbedaan rerata dan simpangan baku antara tiap kategori

theta dan tingkat kesukarannya hampir sama. Artinya ada hubungannya dan positif,

namun belum diketahui tingkat hubungan tersebut. Oleh karena itu, dilakukan analisis

lanjutan menggunakan analisis korelasi. Kategori himpunan fuzzy kemampuan sangat

tinggi mempunyai korelasi 0,730, kategori himpunan fuzzy kemampuan tinggi

mempunyai korelasi 0,791, kategori himpunan fuzzy kemampuan sedang mempunyai

korelasi 0,786, kategori himpunan fuzzy kemampuan rendah mempunyai korelasi

0,105, dan kategori himpunan fuzzy kemampuan sangat rendah mempunyai korelasi

0,840. Analisis secara deskriptif dan korelasi terdapat pada Lampiran F_3 dan F_4.

Berdasarkan hal tersebut hanya kategori himpunan fuzzy kemampuan rendah

mempunyai korelasi tidak signifikan.

Tingkat exposure butir soal pada metode Fumahilow dapat dilihat pada

analisis deskriptif. Perbedaan rerata dan simpangan baku antara tiap kategori theta

dan tingkat kesukarannya hampir sama. Artinya ada hubungannya dan positif, namun

belum diketahui tingkat hubungan tersebut. Oleh karena itu, dilakukan analisis

lanjutan menggunakan analisis korelasi. Kategori himpunan fuzzy kemampuan sangat

Page 185: CAT RRAD - Unismuh

165

tinggi mempunyai korelasi 0,795, kategori himpunan fuzzy kemampuan tinggi

mempunyai korelasi 0,841, kategori himpunan fuzzy kemampuan sedang mempunyai

korelasi 0,821, kategori himpunan fuzzy kemampuan rendah mempunyai korelasi

0,848, dan kategori himpunan fuzzy kemampuan sangat rendah mempunyai korelasi

0,874. Analisis secara deskriptif dan korelasi terdapat pada Lampiran F_3 dan F_4.

Berdasarkan analisis tersebut menunjukkan bahwa metode Fumahilow mempunyai

korelasi yang paling tinggi di antara semua kategori kemampuan lalu metode

Futsuhilow walaupun tidak mempunyai informasi pada kategori sangat rendah.

Sedangkan metode Fusuhilow terdapat korelasi yang tidak signifikan pada kategori

kemampuan rendah.

Analsis secara deskriptif data galat baku penaksiran parameter kemampuan

ketiga metode terdapat pada Lampiran E_3. Ketiga metode mempunyai perbedaan

secara signifikan dimana metode Futsuhilow mempunyai rerata galat baku penaksiran

parameter kemampuan yang paling kecil dengan rerata sebesar 0,818, kemudian

metode Fumahilow mempunyai rerata galat baku penaksiran parameter kemampuan

dengan rerata sebesar 0,839. Sedangkan metode Fusuhilow mempunyai rerata galat

baku penaksiran parameter kemampuan dengan rerata 0,877. Hasil analisis galat baku

penaksiran parameter kemampuan terdapat pada Lampiran E_4.

Analsis secara deskriptif menunjukkan rerata jumlah waktu respon butir soal

ketiga metode terdapat pada Lampiran E_3 dimana rerata jumlah waktu respon butir

soal tes pada metode Futsuhilow yang paling kecil yakni rerata selama 1 menit17

detik per butir soal, lalu metode Fusuhilow yakni rerata selama 1 menit 24 detik per

butir soal, terakhir metode Fumahilow selama 1 menit 25 detik per butir soal . Metode

Futsuhilow berbeda secara signifikan dengan Fusuhilow dan metode Fumahilow,

sedangkan tidak terdapat perbedaan secara signifikan antara Fusuhilow dan metode

Page 186: CAT RRAD - Unismuh

166

Fumahilow. Hasil analisis jumlah waktu respon butir soal tes terdapat pada Lampiran

E_4. Walaupun demikian, jika waktu respon yang diolah menggunakan jumlah respon

tiap peserta tes maka metode Fusuhilow yang paling singkat jika dibandingkan

dengan metode Futsuhilow walaupun tidak signifikan. Metode Fumahilow berbeda

secara signifikan dengan metode Futsuhilow pada taraf signifikasi 0,05 sedangkan

dengan metode Fusuhilow tidak berbeda secara signifikan.

Uji coba produk menunjukkan bahwa panjang tes yang paling pendek ditempuh

peserta tes sampai penaksiran konvergen pada metode Fusuhilow sebanyak 14

butir soal. Hal tersebut terjadi karena metode Fusuhilow memberikan butir soal

yang adaptif dengan mengelola basis pengetahuan dalam memberikan butir soal lebih

mudah jika dibandingkan dengan kemampuan peserta tes. Metode Futsuhilow

memberikan butir soal adaptif yang persis sama dengan kemampuan peserta tes sesuai

dengan basis pengetahuan tanpa ada proses defuzzifikasi. Selanjutnya, metode

Fumahilow memberikan butir soal adaptif lebih sukar sesuai dengan basis

pengetahuan yang sama dengan basis pengetahuan metode Futsuhilow namun

menggunakan proses defuzzifikasi model centroid. Hasil penelitian Agus Santoso

(2009) dengan metode MLE membutuhkan 8-15 butir soal sampai konvergen

sedangkan penelitian Haryanto (2009) menggunakan fuzzy Tsukamoto dengan tiga

kategori tingkat kesukaran butir menggunakan konsep CTT menunjukkan jumlah

butir soal yang dikemas sekitar 20 butir soal menunjukkan adanya pola yang sesuai

dengan kemampuan peserta tes. Selanjutnya, penelitian Rukli dan Sri Hartati (2011)

menguji coba produk CAT menggunakan metode high low di SMA membutuhkan

sekitar 10 butir soal. Oleh karena itu, jumlah butir soal 14 terjadi karena pencarian

butir soal memperhatikan SKL dimana butir soal berada, selanjutnya pencarian butir

soal adaptif bersifat fluktuatif disamping jumlah butir soal dalam SKL belum merata.

Page 187: CAT RRAD - Unismuh

167

Jika jumlah butir soal pada SKL lebih banyak dan merata maka fluktuatif tersebut

dapat diredam sehingga untuk mencapai penaksiran konvergen membutuhkan butir

soal dengan jumlah lebih kecil.

Uji coba produk menunjukkan metode Fumahilow mempunyai tingkat

exposure butir soal lebih kecil dibandingkan dengan metode lain, walaupun secara

sekilas metode Futsuhilow yang lebih kecil karena butir soal yang diberikan sesuai

dengan kemampuan peserta tes. Hal tersebut terjadi karena metode Fumahilow

memberikan butir soal sesuai dengan pengelolaan basis pengetahuan yang lebih alami

sehingga butir yang diberikan lebih sesuai dengan nilai theta awal. Selanjutnya,

metode Fumahilow memberikan butir soal yang lebih tinggi dimana sesuai dengan

karakteristik butir soal di bank butir soal mempunyai tingkat kesukaran di atas rerata

yakni 0,462 jika dibandingkan dengan butir soal di bawah rerata, sementara metode

Fusuhilow memberikan butir soal yang lebih rendah sehingga butir soal yang

diberikan banyak yang keluar dari batas domain inisialisasi awal.

Uji coba produk menunjukkan galat baku penaksiran parameter kemampuan

pada metode Futsuhilow mempunyai galat baku penaksiran parameter kemampuan

yang paling kecil kemudian metode Fumahilow terus Fusuhilow. Hal tersebut terjadi

karena metode Fumahilow dan Fusuhilow memberikan butir soal adaptif kepada

peserta masing-masing menurunkan dan menaikkan sehingga perhitungan galat baku

mengalami fluktuasi pencarian butir soal lebih besar walaupun selisih galat baku

berbeda dimana selisih galat baku dihitung dari selisih galat baku antar dua butir soal.

Uji coba produk menunjukkan metode Futsuhilow mempunyai waktu

respon yang paling pendek yakni 1:17 (1 menit 17 detik) bukan metode Fusuhilow

yang mempunyai panjang tes paling pendek. Panjang pendek tes tidak bisa

menunjukkan bahwa metode tersebut waktu respon paling pendek. Waktu yang

Page 188: CAT RRAD - Unismuh

168

dibutuhkan 1 menit 17 detik termasuk respon butir yang cepat jika dibandingkan

dengan alokasi waktu yang diberikan respon tiap butir soal yakni 3 menit walaupun

tidak diinformasikan jawaban benar dan salah selama selang waktu ujian tersebut.

Jika rerata waktu respon tiap peserta tes menjadi data mentah bukan jumlah waktu

respon tiap peserta tes maka yang paling cepat waktu respon butir adalah metode

Futsuhilow, sebalilknya jika jumlah waktu respon menjadi data mentah bukan rerata

waktu respon tiap peserta tes maka yang paling pendek waktu respon tiap butir adalah

metode Fusuhilow. Namun cara perhitungan yang terakhir menyesatkan karena tidak

bisa ditetapkan secara pasti bahwa peserta tes yang menempuh butir soal banyak

mempunyai waktu respon lebih lama selama ujian. Oleh karena itu, peserta tes yang

mengambil ujian pada metode Futsuhilow mempunyai waktu yang paling singkat

merespon butir soal secara adaptif.

6. Pengembangan CAT dengan fitur DSS

Pengembangan CAT dengan fitur DSS melibatkan aktor pimpinan dalam

melakukan konfigurasi kelulusan, pembobotan SKL tiap domain, pembobotan

domain, dan pembobotan kriteria. Rincian kegiatan sebagai berikut:

1. Konfigurasi Kelulusan

Konfigurasi kelulusan sebagai langkah awal bagi Pimpinan menentukan laporan

kelulusan peserta tes yakni penetapan skor minimum sebesar 100 dan kuota

maksimum kelulusan sebesar 5 . Selanjutnya, hasil ujian yang akan ditampilkan

berupa inisialisasi tiga butir, model Rasch, metode Futsuhilow, dan domain

berupa Bahasa Indonesia, IPA, dan Matematika. Hasil konfigurasi kelulusan pada

Gambar 58.

Page 189: CAT RRAD - Unismuh

169

Gambar 58.

Konfigurasi Kelulusan

2. Pembobotan SKL tiap domain

Fitur DSS memberikan informasi kepada user dalam hal ini pengajar,

pimpinan, dan wali peserta tes, serta peserta tes sendiri mengenai kemampuan

peserta tes. Pimpinan melakukan empat aksi terhadap data kemampuan peserta

tes sampai diperoleh informasi laporan kelulusan. Adapun halaman pembobotan

SKL setiap domain pada Gambar 59. Gambar tersebut menunjukkan ada tiga

domain dengan jumlah SKL berbeda. Jumlah domain dan SKL dapat diupdate

secara dinamis oleh Admin. Penetapan pembobotan setiap SKL dilakukan

Pimpinan. Jumlah pembobotan SKL supaya ter_update sebesar 100%.

3. Pembobotan Domain

Gambar 60 menunjukkan penetapan pembobotan domain secara dinamis

terhadap tiga domain. Penetapan pembobotan domain dilakukan setelah

pembobotan SKL. Jumlah pembobotan domain supaya ter_update sebesar 100%.

Page 190: CAT RRAD - Unismuh

170

Gambar 59.

Pembobotan SKL

Gambar 60.

Penetapan Pembobotan Domain

Page 191: CAT RRAD - Unismuh

171

4. Pembobotan Kriteria

Gambar 61.

Pembobotan Kriteria

Gambar 61 menunjukkan pembobotan empat kriteria. Pembobotan kriteria

dapat dilakukan jika pembobotan domain telah dilakukan karena pada

pembobotan kriteria ada nilai pembobotan domain yang perlu diketahui. Jumlah

pembobotan kriteria supaya ter_update sebesar 100%.

5. Laporan Kelulusan

Berdasarkan kriteria kelulusan menggunakan dua patokan yakni kuota

maksimum yang diterima dan skor minimum pada Gambar 58 maka diperoleh

informasi laporan kelulusan seperti pada Gambar 62.

Page 192: CAT RRAD - Unismuh

172

Gambar 62.

Laporan Kelulusan Memenuhi Kuota

Gambar 62 menunjukkan laporan kelulusan yang terdiri atas inisialisasi

menggunakan tiga soal, model menggunakan Rasch, metode menggunakan

Futsuhilow, penyajian butir soal menggunakan proporsioanl. Semua record tadi

di-input oleh Admin saat sebelum ujian dilaksanakan namun pada saat pelaporan,

data record tadi dipilih oleh Pimpinan. Selanjutnya, skor minimum dan kuota

maksimum sebagai syarat kelulusan ditetapkan oleh Pimpinan. Hasil pembobotan

yang telah dilakukan pada Gambar 59, 60, dan 61 dilanjutkan dengan menetapkan

skor minimum 100 dan kuota maksimum 5 memberikan informasi laporan

kelulusan kepada peserta tes, pimpinan, pengajar, dan wali peserta tes. Informasi

tersebut dapat dicetak secara online oleh user. Informasi pelaporan kelulusan

tersebut menunjukkan bahwa masih ada peserta tes yang mempunyai skor di atas

100 namun kuota yang dibutuhkan sudah terpenuhi sehingga peserta tes yang

mempunyai skor tersebut tidak lulus. Sebaliknya boleh jadi kuota masih ada

namun skor minimum yang ditetapkan sudah terpenuhi seperti pada Gambar 63.

Gambar tersebut menunjukkan Pimpinan menetapkan skor minimum 128 dan

Page 193: CAT RRAD - Unismuh

173

kuota maksimum 10. Laporan kelulusan menunjukkan kriteria skor minimum

yang lebih dahulu terpenuhi walaupun jatah kelulusan masih ada sebanyak 5

peserta tes.

Gambar 63.

Laporan Kelulusan Memenuhi Skor Minimun

C. Revisi Produk

Berdasarkan hasil validasi dari para expert yang telah dijelaskan pada bagian

A.5, maka dilakukan revisi produk sebagai berikut.

1. Inisialisasi Kemampuan

Pemberian soal pertama kepada peserta tes berdasarkan inisialisasi

kemampuan. Ada berbagai cara menentukan inisialisasi kemampuan peserta tes.

Rancangan awal produk CerdasCAT menggunakan inisialisasi kemampuan sama

Page 194: CAT RRAD - Unismuh

174

dengan nol karena nilai tersebut merupakan nilai tengah dari rentang kemampuan dari

[-4,4]. Cara tersebut benar secara statistik namun setiap peserta tes merespon butir

soal pertama yang sama atau berpeluang 100%, butir soal kedua berpeluang 50%,

butir soal ketiga berpeluang 25%, dan seterusnya.

Berdasarkan hal tersebut, peluang peserta tes merespon butir yang sama

terbuka lebar. Butir soal dengan tingkat kesukaran di sekitar nilai tengah atau nol dari

rentang [-4,4] di bank soal mempunyai tingkat kemunculan sangat tinggi sehingga

soal tersebut menurun tingkat kerahasiaannya. Jika hal tersebut terjadi maka

berpeluang butir soal tidak berfungsi secara optimal mengukur kemampuan peserta

tes secara akurat. Oleh karena itu, pemberian butir soal menggunakan satu titik

tumpuan yang sama untuk semua peserta tes dalam satu ujian perlu direvisi dengan

menggunakan titik tumpuan yang berbeda. Adapun model awal inisialisasi

kemampuan peserta tes dengan titik tengah kemampuan sama dengan nol pada model

CAT ditunjukkan oleh flow chart pada Gambar 64 (a).

Berdasarkan hal tersebut, inisialisasi kemampuan peserta tes direvisi dengan

tiga butir soal sebagai inisialisasi kemampuan. Tiga butir soal tersebut akan membagi

kemampuan peserta tes menjadi beberapa kategori, yakni sangat tinggi, tinggi,

sedang, rendah, dan sangat rendah. Hal tersebut menunjukkan peluang peserta tes

merespon butir soal yang sama menjadi semakin rendah sehingga tingkat kemunculan

butir soal tertentu dalam suatu ujian semakin rendah walaupun jumlah butir soal di

bank soal berkurang tiga butir. Jumlah butir tersebut tidak signifikan pada bank butir

soal besar. Adapun model revisi akhir inisialisasi kemampuan peserta tes pada model

CAT ditunjukkan oleh flow chart pada Gambar 64 (b).

Page 195: CAT RRAD - Unismuh

175

Rentang

Kemampuan

Peserta Tes

[-4,4]

Mulai

Titik Tengah

Kemampuan

0

Peserta tes

Stop

Peluang Tingkat

Kesukaran sama

100%

Peluang Tingkat

Kesukaran sama

50%

Peluang Tingkat

Kesukaran sama

25%

Mulai

Peserta tes

Tiga Butir Soal

(1,2,3)

{1,2,3}

Benar?Theta= 3

{1,3},{2,3},{3}

Benar?Theta= 2

{1,2},{2}

Benar?

{1}

Benar?

{ }

Stop

Theta= 0

Theta= -2

Theta= -3

Y

T

Y

Y

Y

Y

T

T

T

(a) (b)

Gambar 64.

Inisialiasi Kemampuan Sebelum Revisi (a) dan Sesudah Revisi (b)

2. Model Prototipe dan Full Release

Rancangan pertama model CAT berdasarkan model prototipe agar pelaporan

hasil ujian peserta tes lebih cepat. Produk prototipe merupakan produk yang sudah

Page 196: CAT RRAD - Unismuh

176

running dengan tampilan seperti hasil akhir, namun belum memiliki koneksi ke basis

data. Produk yang tidak didukung oleh basis data hanya sebatas model rancangan dan

sudah lama ditinggalkan oleh pengembang. Produk prototipe mengalami keterbatasan

simulasi dengan data riil dari bank soal apalagi jika model tersebut diujicobakan di

sekolah. Adapun model prototipe sebagai model awal CAT ditunjukkan pada

Gambar 65.

Peserta Test

Tomcat Web Server

Pengajar

Admin

AJAX Engine

Web Container

Java

Web Browser

JavaScript HTML

Internet

Pimpinan Wali Peserta Tes

Gambar 65.

Model Prototipe pada Model CAT

Selanjutnya, model prototipe akan menjadi beban bagi pengembang untuk

melanjutkan jika tidak punya tim untuk bekerjasama. Oleh karena itu, produk

CerdasCAT direvisi sehingga menjadi model full release dimana model CAT

Page 197: CAT RRAD - Unismuh

177

dihubungkan dengan database yakni MySQL Database Server sebagai bank soal

produk CerdasCAT seperti pada Gambar 66.

Peserta Test

Tomcat Web Server

MySQL Database Server

Pengajar

Admin

AJAX Engine

Web Container

Java

Web Browser

JavaScript HTML

Internet

Pimpinan Wali Peserta Tes

Gambar 66.

Model Full Release pada Produk CerdasCAT

3. Metode High Low ke Metode Fuzzy + High Low

Metode high low merupakan metode praktis, yakni peserta tes merespon butir

soal dengan aturan jika peserta tes merespon salah maka tingkat kesukaran diturunkan

0,2 atau lebih namun jika peserta tes merespon benar maka tingkat kesukaran

dinaikkan 0,1 atau lebih. Naik turun tingkat kesukaran butir soal tersebut

Page 198: CAT RRAD - Unismuh

178

mempengaruhi pemberian soal berikutnya. Jika peserta tes menjawab benar salah

secara terus menerus maka pemberian butir soal monoton. Demikian halnya, jika

peserta tes menjawab benar semua atau salah semua maka skor peserta tes divergen

positif atau negatif (Rukli, 2010). Model awal pencarian butir soal dengan metode

high low ditunjukkan pada Gambar 67.

b

b-0,2-0,2<=

b-0,2<=

b+0,1>=

B

S

b+0,1-0,2<=

b-0,2+0,1>=

B

S

B

S

b+0,1+0,1>=

Gambar 67.

Pencarian Butir Soal dengan Metode High Low

Sebaliknya, jika pencarian butir soal menggunakan aturan metode fuzzy

dengan membagi variabel fuzzy dalam beberapa himpunan fuzzy. Hal tersebut

berpengaruh terhadap soal berikutnya yang lebih dinamis bergantung metode yang

digunakan dalam mengelola basis pengetahuan selanjutnya dan skor divergen positif

dan negatif tidak terjadi. Selanjutnya, agar lebih cepat dalam melakukan pencarian

butir soal adaptif terhadap kemampuan peserta tes maka metode fuzzy diakselerasi

oleh metode high low. Pencarian butir soal dengan metode fuzzy diakselerasi oleh

metode high low pada Gambar 68. Pertama-tama peserta tes merespon butir soal

dengan tingkat kesukaran b kemudian menghitung nilai theta dengan metode fuzzy

yang terpilih. Jika butir soal tersebut direspon benar maka dinaikkan 0,1 atau lebih

Page 199: CAT RRAD - Unismuh

179

sebaliknya jika butir soal tersebut direspon salah maka diturunkan 0,2 atau lebih. Hal

tersebut dilakukan secara siklus sampai penaksiran konvergen.

b

Fuzzifikasi

Metode Fuzzy

Defuzzifikasi

Theta

b-0,2<=b+0,1>= Y TBenar

Fuzzifikasi

Metode Fuzzy

Defuzzifikasi

Theta

Fuzzifikasi

Metode Fuzzy

Defuzzifikasi

Theta

Benar? Benar?

Gambar 68.

Metode Fuzzy Diakselerasi oleh Metode High Low

4. Penambahan tiga metode pada Model CAT

Produk CAT sudah banyak dibuat bahkan digunakan secara online namun masih

sebatas menggunakan satu metode penyajian butir soal bagi peserta tes. Produk

tersebut hanya sebatas tempat melakukan ujian peserta tes dan tidak tersedia pilihan

lain. Selanjutnya, model CAT tersebut mengalami keterbatasan dalam melakukan

Page 200: CAT RRAD - Unismuh

180

kajian-kajian ilmiah misalnya simulasi distribusi butir soal terhadap suatu metode.

Peserta tes mengambil ujian dengan login dan verifikasi nomor peserta, selanjutnya

ujian dengan menggunakan metode untuk mendapatkan theta dan selesai. Hasil

tersebut memberikan data kepada user namun data tersebut kurang bermakna dalam

melakukan analisis lebih lanjut dalam model CAT. Model CAT dengan satu metode

ditunjukkan pada Gambar 69 (a).

Peserta Tes

Password/

Username/Nomor

Peserta

Statistik

Theta

Mulai

Stop

Peserta Tes

Password/

Username/Nomor

Peserta

Fumahilow

Kriteria

Mulai

Futsuhilow Fusuhilow

Theta

Stop

(a) (b)

Gambar 69.

Model CAT Satu Metode (a) dan Tiga Metode (b)

Pengembangan produk berbasis teknologi informasi semakin memanjakan

user dimana user diberi pilihan menu-menu penting pada produk tersebut. Produk

dengan tiga metode penyajian soal akan memberikan pilihan metode yang sesuai

dengan kepentingannya kepada user. Model CAT dengan tiga metode ditunjukkan

pada Gambar 69 (b). Peserta tes melakukan login dan verifikasi nomor peserta.

Page 201: CAT RRAD - Unismuh

181

Peserta tes mengambil ujian yang telah ditetapkan user sesuai preferensinya dengan

kriteria yang ada dari masing-masing metode. Hasil tersebut memuaskan user dan

ketepatan tujuan yang ingin dicapai akan lebih maksimal sesuai dengan kelebihan dan

kelemahan tiap metode. Selanjutnya, model CAT dengan tiga metode menjadi bahan

kajian bagi peneliti dalam melakukan perbandingan terhadap dua atau tiga metode.

Artinya, produk CerdasCAT bukan hanya sebagai alat untuk ujian namun dapat

dipakai sebagai alat untuk melakukan penelitian atau pengembangan produk lebih

lanjut.

5. Output data menjadi output data sekaligus informasi

Produk CAT yang ada sekarang pada umumnya mempunyai mekanisme

runitas yang sama, yakni butir soal dimasukkan di dalam bank butir soal, butir soal

direspon peserta tes secara adaptif, dan hasil ujian berupa data kemampuan peserta tes

diperoleh user. Mekanisme tersebut hampir sama dengan ujian P&P dengan dua

perbedaan yakni menggunakan media komputer dan pemberian butir soal secara

adaptif. Model CAT menghasilkan output data kemampuan peserta tes pada Gambar

70 (a).

Dalam sistem cerdas, output diperoleh user bukan hanya data yakni data

kemampuan peserta tes namun data sekaligus informasi. Penambahan fitur DSS pada

produk CerdasCAT memberikan data kemampuan peserta tes sekaligus informasi

pelaporan kelulusan peserta tes berdasarkan data kemampuan peserta tes. Hal

tersebut menjadi lebih relevan meningkatkan efektifitas kegiatan user dengan

preferensi masing-masing sesuai kebutuhan yang lebih akurat, cepat, dan relevan.

Model CAT menghasilkan data kemampuan peserta tes dan informasi kelulusan

peserta pada Gambar 70 (b).

Page 202: CAT RRAD - Unismuh

182

Peserta Tes

Mulai

Theta

Stop

User

Peserta Tes

Mulai

Theta

Stop

Informasi

Laporan Kelulusan

Decision Support

System

Data Hasil

Ujian

User

(a) (b)

Gambar 70.

Model CAT Menghasilkan Data (a) dan Informasi (b)

6. Fungsi informasi butir ke tingkat kesukaran butir

Beberapa produk menggunakan fungsi informasi butir sebagai dasar dalam

memilih butir soal berikutnya. Jika pemberian butir soal menggunakan fungsi

informasi butir soal maka pemberian butir soal selanjutnya ditentukan oleh nilai

fungsi informasi maksimal kemampuan peserta tes saat ini. Fungsi informasi butir

maksimal dapat diartikan bahwa butir soal menaksir parameter kemampuan peserta

tes secara maksimal. Artinya, butir soal yang mengungkap kemampuan peserta secara

maksimal merupakan butir yang baik dalam mengukur kemampuan peserta tes secara

akurat.

Page 203: CAT RRAD - Unismuh

183

Secara teori, fungsi informasi butir paling baik digunakan sebagai dasar

pemberian soal berikutnya. Namun, secara praktek fungsi informasi butir mengalami

kendala, yakni pencarian butir soal yang mempunyai fungsi informasi maksimal

mensyaratkan kemampuan peserta tes di_update terus menerus selama ujian. Hal

tersebut akan memberi beban besar kepada komputer dan server sehingga lebih

lambat menampilkan soal berikutnya. Hal tersebut semakin lambat seiring

bertambah besar jumlah butir soal dalam bank soal. Pemberian butir soal dengan fungsi

informasi butir soal ditunjukkan pada Gambar 71 (a).

Mulai

Theta

Fungsi Informasi

Butir Maksimum

Theta Baru

FIBM sesuai

Theta?

Stop

Hitung FIBM

di Bank Soal

Y

T

Mulai

Theta

Theta Baru

b sesuai theta?

Stop

Cari b di Bank

Soal

Y

T

(a) (b)

Gambar 71

Fungsi Informasi (a) dan Tingkat Kesukaran (b)

Page 204: CAT RRAD - Unismuh

184

Sebaliknya, secara teori tingkat kesulitan butir soal mempunyai dasar yang

kokoh sebagai dasar pemberian butir soal selanjutnya yakni tingkat kesulitan butir

soal mempunyai skala yang sama dengan tingkat kemampuan peserta tes. Hal

tersebut lebih mudah dipahami jika dikaitkan model Rasch dimana peluang tebakan

sama dengan nol dan daya beda sama dengan satu. Selanjutnya secara praktik, tingkat

kesukaran butir soal akan lebih mudah di_rietrival sesuai kemampuan peserta tes saat

ini, karena untuk mencari tingkat kesukaran butir soal yang sesuai tidak perlu proses

komputasi namun hanya proses pencarian yang sudah tersedia di bank soal.

Pemberian butir soal dengan tingkat kesukaran butir ditunjukkan pada Gambar 71 (b).

D. Kajian Produk Akhir

Pengembangan produk CerdasCAT melalui beberapa tahap rancangan,

implementasi, dan pengujian. Produk tersebut dapat digunakan sebagai salah satu

alternatif media pengujian adaptif berbasis komputer. Kajian produk akhir sebagai

pengenalan dan pendalalaman proses aturan bisnis produk CerdasCAT dilakukan

melalui kajian proses sebagai berikut.

1. Kajian proses update pengguna

Pengguna atau aktor pada produk CerdasCAT yakni Admin, pimpinan peserta

tes, pengajar, dan wali peserta tes. Admin sebagai pengendali utama dalam setiap

sistem mempunyai hak untuk melakukan update data pengguna berupa menghapus

atau mengganti. Data pengguna yang sudah dihapus oleh Admin, pengguna tersebut

tidak dapat mengakses data sesuai dengan perannya, dan jika data pengguna diganti

maka boleh jadi ada bagian tertentu yang merupakan kewenangannya tidak bisa

diakses. Kegiatan Admin meng_update Admin dengan memilih kelola pengguna lalu

Page 205: CAT RRAD - Unismuh

185

memilih Admin sehingga tampil halaman daftar Admin yang terdiri nomor urutan,

username, dan aksi seperti Gambar 72. Data Admin dapat ditambah dengan memilih

Tambah Data bagian atas kiri halaman daftar Admin sehingga tampil halaman form

Admin yang sudah berisi username dengan Admin2 dan password dengan Admin2

seperti Gambar 73. Data tersebut dapat disimpan dengan klik simpan atau dibatalkan

dengan klik batal.

Gambar 72.

Halaman Daftar Admin

Gambar 73.

Halaman Form Admin

Page 206: CAT RRAD - Unismuh

186

Kegiatan Admin meng_update pimpinan dengan pilihan kelola pengguna lalu

pimpinan maka tampil halaman daftar pimpinan yang terdiri nomor urutan,

username, peran, dan aksi seperti Gambar 74. Data pimpinan dapat ditambah dengan

memilih Tambah Data bagian atas kiri halaman daftar pimpinan sehingga tampil

halaman form input pimpinan yang sudah berisi username dengan Moh. Adli Akbar

dan password dengan adli seperti Gambar 75. Data tersebut dapat disimpan dengan

klik simpan dan dibatalkan dengan klik batal.

Gambar 74.

Halaman Daftar Pimpinan

Gambar 75.

Halaman Input Pimpinan

Page 207: CAT RRAD - Unismuh

187

Khusus pengguna pengajar cara meng_update sama dengan pengguna

pimpinan. Update pengguna peserta tes diuraikan lebih lanjut pada bagian kajian

proses peserta tes mengambil ujian. Update pengguna wali peserta tes diuraikan lebih

lanjut pada bagian kajian proses wali peserta tes mencetak hasil peserta tes walinya.

2. Kajian proses domain dan skl dalam content balancing

Domain dan skl ditetapkan secara dinamis oleh Admin dimana domain

memiliki satu atau lebih skl. Artinya, domain dan skl dapat diupdate sehingga domain

dapat berubah menjadi skl sesuai kebutuhan. Satu domain dapat mempunyai satu skl

saja atau skl berubah menjadi content areas misalnya aritmetika, aljabar, atau

geometri sesuai dengan ruang lingkup konsep komponen dominan suatu tes.

Walaupun tes memenuhi unidimensi atau dominan namun memiliki unique content

areas namun memiliki content areas berbeda.

Produk CerdasCAT menghandel konsep unidimensi atau dominan jika kedua

konsep tersebut dibedakan walaupun unidimensi suatu tes bersifat teoritis.

Unidimensi hanya satu dimensi sesuai dengan model pengukuran bersifat

deterministik namun dapat diperlunak dengan istilah dominan yakni beberapa

dimensi mengumpul seperti dalam konsep analisis faktor (Hambleton, et al. 1991).

Jika istilah unidimesi suatu tes digunakan dalam produk CerdasCAT maka Admin

dapat menetapkan satu domain memiliki satu skl atau content area. Jika Admin

menggunakan istilah dominan maka satu domain dapat memiliki satu atau lebih

content area namun tetap mengacu pada istilah dominan untuk menghandel content

balancing. Konsep terakhir kelihatannya tidak konsisten secara konsep untuk

mengakomodasi dari istilah unidimensi secara tegas, walaupun demikian konsep

terakhir lebih dapat diaplikasikan karena tidak ada tes secara tepat berdimensi satu

Page 208: CAT RRAD - Unismuh

188

dalam mengukur suatu trait atau single ability peserta tes. Istilah tidak konsisten lebih

tepat diganti istilah lemah dalam mencapai unidimensi. Oleh karena itu, dominan

sebagai pelunakan dari unidimensi dapat diterapkan dalam produk CerdasCAT sesuai

ruang lingkup bank soal. Bagan asal butir soal dan spesifikasi bank soal CerdasCAT

pada Gambar 76 memperlihatkan semakin kearah kiri semakin spesifik content area

sehingga semakin kabur batas antar komponen.

Domain

240 Soal

Bilangan

87 Soal

Koordinat

5 Soal

Bangun

67 Soal

Ukuran

61 Soal

Data

20 Soal

Waktu

Panjang

Berat

Luas

Valume

Indikator1

Indikator2

Indikator3

Indikator4

Paket3

(2010)

Paket1

(2008)

Paket1

(2010)

Paket3

(2009)

Paket2

(2009)

Paket2

(2010)

Paket1

(2009)

Gambar 76.

Spesifikasi Bank Soal CerdasCAT

Selanjutnya, Admin dapat melakukan update bank soal secara dinamis seperti

Gambar 77.

Page 209: CAT RRAD - Unismuh

189

Gambar 77.

Update Dinamis Bank Soal CerdasCAT

Lebih lanjut, arsitektur contets balancing dalam produk CerdasCAT terdapat

pada Gambar78 inisialisasi kemampuan (butir soal pertama menggunakan tingkat

kesukaran butir soal yang paling dekat di bawah inisialisasi kemampuan tiap peserta

tes) menjadi skala prioritas utama dalam pemilihan butir soal, kemudian SKL atau

contets area, lalu tingkat kesukaran. Misalkan, terdapat empat content area yakni

CA1, CA2, CA3, dan CA4 sedangkan peserta tes mempunyai inisialisasi kemampuan

sangat tinggi dengan pendekatan komponen dominan sehingga dapat didekati dengan

konsep fuzzy, dan andaikan peserta tes tersebut merespon butir soal sebanyak 12 butir

maka setiap content area mempunyai 3 butir soal. Hal tersebut menunjukkan bahwa

produk CerdasCAT mengakomodasi content balancing. Sebaliknya, jika tes tersebut

’unidimensi’ maka peserta tes dapat mengambil ujian tanpa memperhatikan contets

area. Andaikan peserta tes merespon butir 12 butir soal maka peserta tes tersebut

Page 210: CAT RRAD - Unismuh

190

merespon butir soal sebanyak 12 butir dalam tes tersebut. Dalam hal ini, unidimensi

dapat di_update menjadi SKL atau content area atau lebih spesifik lagi.

Mulai

Model Rasch

Polytomous

Dimensi Tes

Unidimensi? Dominan? MultidimensionalT T

Y

Tiga

Butir

Soal

Stop

Respon Butir

Konsep

Fuzzy

Y

Y

TSesuai

Konsep Fuzzy?

Y

Y

Sangat Tinggi

CA1

Sangat

Rendah

Rendah

Sedang

Tinggi

Konvergen

CA4CA3CA2

Konvergen

Konvergen

Konvergen

Konvergen

Tiga

Butir

Soal

Stop

Sangat Tinggi

Sangat

Rendah

Rendah

Sedang

Tinggi

Konvergen

Konvergen

Konvergen

Konvergen

Konvergen

Respon Butir

Contents Area

Skala Prioritas

Gambar 78.

Arsitektur Contets Balancing

Page 211: CAT RRAD - Unismuh

191

3. Kajian proses input butir soal

Input butir soal dilakukan oleh pengajar. Pengajar mengklik pilihan Kelola

Soal di bagian paling atas sebelah kanan halaman Pengajar sehingga halaman daftar

soal ditampilkan seperti Gambar 79. Halaman daftar soal memuat informasi butir

soal yang terdiri nama domain butir soal, tingkat kesukaran, SKL, gambar soal dalam

bentuk image, aksi yang terdiri atas hapus atau ubah. Tombol ubah merupakan

kewenangan pengajar untuk update butir soal sedangkan tombol hapus untuk hapus

butir soal.

Gambar 79.

Halaman Daftar Soal

Page 212: CAT RRAD - Unismuh

192

Gambar 80.

Form Memasukkan Butir Soal

Jika Tambah Data di klik pada Gambar 79 maka halaman Form Input Soal

ditampilkan seperti pada Gambar 80. Butir soal tersebut dimasukkan oleh pengajar

untuk domain dan skl dimana butir tersebut berada disertai dengan kunci dan tingkat

kesukarannya. Selanjutnya, karakteristik tersebut diverifikasi kemudian soal tersebut

di-save dan dimasukkan di bank butir soal.

4. Kajian proses peserta tes mengambil ujian

Pengambilan ujian peserta tes melibatkan kegiatan aktor Admin. Pemilihan

tiga butir soal sebagai inisialisasi kemampuan dilakukan oleh Admin. Pemilihan

tersebut dilakukan secara dinamis pada setiap ujian untuk setiap SKL dalam satu

domain. Admin memilih tombol paket tiga butir soal di sebelah kanan sehingga tampil

Page 213: CAT RRAD - Unismuh

193

halaman seperti Gambar 81. Gambar tersebut menunjukkan kolom pertama kaitan

tanggal penetapan paket butir soal, kolom kedua kaitan keterangan tentang domain,

sedangkan kolom aksi kaitan kegiatan aksi ubah atau hapus paket soal. Selanjutnya,

untuk menambah paket soal dapat dipilih tombol Tambah Data dipojok kiri atas. Jika

tombol tersebut diklik maka diperoleh halaman seperti Gambar 82.

Gambar 81.

Halaman Data Paket Soal

Gambar 82 menunjukkan form paket soal tiga butir yang terdiri tanggal, nama

paket yakni paket Bahasa Indonesia, dan waktu respon tiga butir yakni 9 menit.

Langkah selanjutnya, Admin memilih tiga butir soal yang dilengkapi informasi SKL,

tingkat kesukaran, dan gambar soal dalam bentuk image. Gambar tersebut dapat

dilihat dengan dua kali klik tombol Tampilkan. Proses selanjutnya, Admin

menyimpan tiga butir soal tersebut dengan memilih Simpan yang letaknya di sebelah

kiri paling atas halaman form paket soal tiga butir. Gambar 82 menunjukkan butir

nomor 2, 4 dan 6 yang terpilih sebagai butir soal untuk menginisialisasi kemampuan

peserta tes pada domain matematika. Dalam contoh tersebut, ketiga butir tersebut

berasal dari SKL bilangan dengan tingkat kesukaran yang tidak sama.

Page 214: CAT RRAD - Unismuh

194

Gambar 82.

Form Paket Butir Soal Tiga Butir

Proses selanjutnya, Admin memasukkan identitas peserta tes ke form input

peserta tes seperti pada Gambar 83. Berdasarkan identitas tersebut, peserta tes dapat

melakukan log in ke produk CerdasCAT dengan memasukkan username dan

password . Selanjutnya, setelah identitas peserta tes diinput, Admin menetapkan tiga

butir soal pada form penentuan domain bagi peserta tes. Karena Moh. Habibi Akbar

hanya didaftar pada paket soal dengan domain matematika, bahasa Indonesia, dan

IPA saja sehingga hanya domain tersebut yang dicentang seperti pada Gambar 84.

Page 215: CAT RRAD - Unismuh

195

Gambar 83.

Form Identitas Peserta Tes

Peserta tes melakukan log in dengan memasukkan username dan password

untuk membuka halaman verifikasi nomor peserta. Sebelum mengambil ujian pada

produk CerdasCAT, peserta tes melakukan verifikasi nomor peserta tes. Nomor

peserta tes bersifat unik dan wajib dimiliki oleh peserta tes. Verifikasi nomor peserta

dilakukan sampai nomor peserta sukses, namun untuk melakukan log in di lain waktu

tidak perlu melakukan verifikasi lagi selama nomor tersebut masih valid. Moh. Habibi

Akbar melakukan verifikasi nomor peserta seperti pada Gambar 85 dengan mengklik

tombol verifikasi.

Page 216: CAT RRAD - Unismuh

196

Gambar 84.

Form Penentuan Domain Bagi Peserta Tes

Gambar 85.

Form Verifikasi Nomor Peserta Tes

Jika sukses melakukan verifikasi nomor ujian maka terbuka halaman pemilihan

domain soal yang akan diujikan seperti pada Gambar 86. Gambar tersebut

menunjukkan Moh. Habibi Akbar mengikuti ujian domain bahasa indonesia,

matematika, dan IPA sebagaimana rujukan Gambar 84. Moh. Habibi Akbar dapat

memilih secara bebas domain tersebut. Domain yang telah dikerjakan tidak aktif lagi

dan pindah ke domain lain, demikian seterusnya sampai semua pilihan domain habis.

Page 217: CAT RRAD - Unismuh

197

Gambar 86.

Pilih Domain Soal

Gambar 87.

Peserta Tes Menjawab Benar Semua Tiga Butir Soal

Page 218: CAT RRAD - Unismuh

198

Moh. Habibi Akbar merespon ketiga butir tersebut seperti pada Gambar 87

selama 9 menit. Jika ia menjawab semua butir dengan benar selama waktu tersebut

maka kemampuannya masuk dalam kategori sangat tinggi pada himpunan fuzzy

tingkat kemampuan yakni titik tengah himpunan fuzzy tersebut sebesar tiga seperti

Gambar 89. Misalnya, Moh. Habibi Akbar mengambil ujian dengan metode

Fumahilow maka pemilihan soal berikutnya bergantung pada mekanisme logika

pemberian pada metode tersebut. Moh. Habibi Akbar merespon butir soal pertama

dengan tingkat kesukaran 2,991 dimana nilai yang paling dekat di bawah tiga yang

ada di bank soal saat ini. Moh. Habibi Akbar merespon butir soal pertama seperti pada

Gambar 88. Butir soal tersebut dijawab salah sehingga diberikan soal yang lebih kecil.

Moh. Habibi Akbar merespon butir demi butir sampai butir ke 14 dimana

selisih SE sudah sama dengan 0,01, dan hasil ujian menunjukkan skor 90,496 seperti

pada Gambar 89. Kalau dlihat dari nilai SE = 0,495 lebih besar dari 0,43 yang

ditetapkan oleh Reshetar (Hambleton, et.al. 1991) menunjukkan adanya gejala

ketidakstabilan penaksiran. Namun hal tersebut kurang berarti jika dilihat dari segi

kemapanan keakuratan penaksiran parameter kemampuan. Hasil ujian tersebut dipakai

sebagai data dalam proses pelaporan kelulusan selanjutnya.

Gambar 88.

Pengerjaan Soal Pertama

Page 219: CAT RRAD - Unismuh

199

Gambar 89.

Hasil Ujian pada Domain

Page 220: CAT RRAD - Unismuh

200

Hasil ujian tersebut dapat dilihat dan dicetak oleh Moh. Habibi Akbar maupun wali

Moh. Habibi Akbar yakni Ati Dwi Septawati.

5. Kajian proses pelaporan kelulusan

Proses pelaporan kelulusan dilakukan oleh Pimpinan. Pimpinan melakukan

konfigurasi kelulusan, pembobotan SKL, pembobotan domain, dan pembobotan

kriteria penilaian. Konfigurasi kelulusan dilakukan oleh Pimpinan dengan penetapan

skor minimum sama dengan 120 dan kuota maksimum sama dengan tujuh.

Selanjutnya, Pimpinan menetapkan inisialisasi dengan tiga butir, model Rasch,

metode Fusuhilow, dan penyajian proporsional serta domain matematika. Kriteria ini

sebagai proses penjaringan peserta tes lulus yang akan diterima oleh Pimpinan.

Halaman konfigurasi kelulusan pada Gambar 90.

Gambar 90.

Halaman Konfigurasi Kelulusan

Setelah konfigurasi kelulusan ditetapkan, Pimpinan melakukan pembobotan SKL.

Oleh karena domain matematika saja dicentang pada Gambar 90 sehingga hanya

domain matematika beserta SKLnya ditampilkan pada Gambar 91. Jumlah

Page 221: CAT RRAD - Unismuh

201

pembobotan SKL dalam satu domain harus 100% dimana SKL bangun sebesar

10%, bilangan 30%, data 20%, dan ukuran 40%.

Gambar 91.

Pembobotan SKL

Pimpinan melakukan pembobotan domain matematika seperti Gambar 92 sebesar

100%. Selanjutnya, pimpinan melakukan pembobotan SKL seperti Gambar 91,

lalu pembobotan kriteria penilaian seperti Gambar 93. Input penilaian ujian

sekolah, pengamatan, dan lain-lain dilakukan oleh pengajar untuk setiap peserta

tes sedangkan nilai domain diperoleh dari hasil ujian pada produk CerdasCAT.

Gambar 92.

Pembobotan Domain

Page 222: CAT RRAD - Unismuh

202

Gambar 93.

Pembobotan Kriteria Penilaian

Gambar 94.

Informasi Laporan Kelulusan

Page 223: CAT RRAD - Unismuh

203

Hasil pembobotan kriteria menjadi skor akhir setiap peserta tes yang

mengambil ujian saat ini pada metode tersebut. Selanjutnya, skor digunakan dalam

pengurutan berdasarkan kriteria alokasi maksimum dan kemampuan minimal seperti

pada Gambar 90. Hasil proses konfigurasi dan beberapa pembobotan yang sesuai

dengan preferensi Pimpinan menghasilkan informasi laporan kelulusan bagi user.

Informasi tersebut dapat dilihat atau dicetak oleh peserta tes, wali peserta tes,

pengajar, dan pimpinan seperti Gambar 94.

6. Kajian proses wali peserta tes mencetak hasil ujian walinya

Username dan password wali peserta tes ditetapkan oleh Admin. Admin

mencari peserta tes yang menjadi walinya seperti pada Gambar 95. Misalnya,

Islahuddin mempunyai username adalah Islahuddin dan password adalah uddin,

sedangkan yang menjadi peserta tes walinya adalah Kamel. Data tadi disave dan

dimasukkan ke tabel wali peserta tes.

Gambar 95.

Form Input Wali Peserta Tes

Page 224: CAT RRAD - Unismuh

204

Islahuddin menggunakan username dan password tersebut untuk log in

sehingga dapat melihat dan mencetak hasil ujian Kamel tanpa melihat dan mencetak

hasil ujian peserta tes lain bukan walinya pada Gambar 96.

Nomor Peserta : 10100101001_006

Nama Peserta Test : Kamel A Islahuddin

Metode : Futsuhilow

Inisialisasi : Tiga Butir

Model : Rasch

Penyajian Soal : Proporsional

Nama Sekolah SDN 1 Lamappoloware

Matematika Cetak

No. ID Soal

SKL Theta Awal

b u SE Selisih

SE Theta Akhir

Skor Waktu

1 398 Bilangan 3 2.991 0 2 2 2.991 87.388 00:20

2 333 Ukuran 2.991 2.321 0 1.453 0.55 2.321 79.012 00:06

3 383 Bangun 2.321 2.109 0 1.178 0.28 2.109 76.362 00:05

4 288 Data 2.109 1.379 1 1.031 0.15 1.379 67.238 00:02

5 317 Bilangan 1.379 1.532 1 0.917 0.11 1.532 69.15 00:02

6 232 Ukuran 1.532 1.635 1 0.834 0.08 1.635 70.438 00:05

7 250 Bangun 1.635 1.772 1 0.77 0.06 1.772 72.15 00:06

8 386 Data 1.772 1.943 1 0.719 0.05 1.943 74.288 00:02

9 392 Bilangan 1.943 2.081 1 0.677 0.04 2.081 76.012 00:04

10 191 Ukuran 2.081 2.812 1 0.645 0.03 2.812 85.15 00:06

11 382 Bangun 2.812 3.091 0 0.614 0.03 3.091 88.638 00:02

12 351 Data 3.091 1.043 1 0.603 0.01 1.043 63.038 00:05

Gambar 96.

Hasil Ujian Peserta Tes Wali Islahuddin

Page 225: CAT RRAD - Unismuh

205

7. Kajian Sistem Pengamanan Produk

Sistem pengamanan produk CerdasCAT berlapis sesuai dengan konsep

program java yang berorientasi objek. Setiap kelas mempunyai metode dan

atribut yang dapat dikhususkan hubungannya dengan kelas lain. Misalnya kelas

bersifat private merupakan kelas yang tidak dapat diakses oleh kelas lain baik

metode maupun atributnya. Sistem penyembunyian (encapsulation) metode dan

atribut memungkinkan data-data yang penting dapat disimpan dalam kelas

tersebut, misalnya karakteristik butir soal.

Setiap user harus login dengan memasukkan username dan password

sesuai dengan peran baru dapat masuk ke halaman selanjutnya. Pemberian

username dan password kepada user dikendalikan oleh top Admin. Top Admin

adalah admin di atas admin yang tidak dapat dihapus namun dapat menghapus

admin lain atau user lain.

Setiap user yang sukses melakukan konfirmasi username dan password

hanya dapat masuk ke halaman selanjutnya sesuai dengan perannya sehingga tidak

dapat mengambil aksi apapun di luar perannya. Hal tersebut memberi batasan

kepada penyusup (hacker) untuk masuk ke halaman lain kalau dapat mengenal

username dan password dari salah satu user. Username dan password yang telah

dihapus tidak dapat dipakai lagi oleh user bersangkutan sehingga hanya berlaku

pada saat itu saja, sedangkan sistem hanya aktif saat ujian berlangsung dapat

disetting berdasarkan jaringan yang digunakan.

Bank soal menggunakan produk Mysql dimana tingkat pengamanan data

soal dan kunci dibatasi akses bagi pengguna lain dengan membuat username dan

password tersendiri yang melekat dalam program di dalam kelas bersifat private

Page 226: CAT RRAD - Unismuh

206

sehingga terdapat dua pintu pengamanan yakni username dan password di dalam

kelas bersifat private dan user hanya dapat masuk ke dalam basisdata jika

mengetahui username dan password . Username dan password dapat di_update

setiap waktu.

E. Diseminasi Hasil Penelitian

Hasil penelitian berhubungan dengan topik penelitian yang telah dan dalam

proses diseminasi sebagai berikut.

1. Prosedur Rancangan Tes Adaptif Berbasis Komputer, dipresentasikan pada

seminar Nasional Fakultas MIPA Universitas Negeri Semarang, Semarang, 2009.

Hasil penelitian tersebut memaparkan bagaimana merancang CAT dengan metode

berbasis objek sesuai dengan program java. Peserta seminar tersebut berasal dari

dosen perguruan tinggi dan guru dari seluruh Indonesia sedangkan pemakalah

berasal dari Belanda, BSNP, dan dosen serta guru.

2. Penerapan Model Logistik Satu Parameter pada Computerized Adaptive Testing

Ujian Masuk Perguruan Tinggi, dipresentasikan pada seminar Nasional HEPI,

Jakarta, 2010. Hasil penelitian tersebut mendemonstrasikan UniversiCAT dengan

model logistik satu parameter. Peserta seminar tersebut berasal dari berbagai

perguruan tinggi dan pengajar serta staf Puspendik sedangkan pemakalah berasal

dari BNSP, Wamen Kementerian Pendidikan Nasional, dosen, serta staf

Puspendik.

3. Aplikasi Computerized Adaptive Testing (CAT) pada ujian Seleksi Masuk

Perguruan Tinggi sebagai makalah poster session yang diselengarakan oleh Pusat

Penelitian Kebijakan dan Inovasi Pendidikan, Balitbang, Kemdiknas, Jakarta,

Page 227: CAT RRAD - Unismuh

207

2010. Hasil penelitian tersebut mendemonstrasikan model CAT sebagai seleksi

ujian masuk PT. Peserta seminar tersebut berasal dari berbagai perguruan tinggi

dan pengajar dari PT dan instansi lain seluruh Indonesia.

4. Decision Support Sistem dalam Testing Adaptive dengan Metode High Low,

dipresentasikan pada Seminar Nasional Ilmu Komputer: General Approach on

Multidisciplinary Application diselenggarakan oleh Ilmu Komputer FMIPA UGM

bekerjasama dengan IndoCeiss, 2011. Hasil penelitian tersebut

mendemonstrasikan metode high low dalam menyajikan butir soal pada aplikasi

UniversiCAT. Peserta seminar tersebut berasal dari berbagai perguruan tinggi dan

pemerhati IT seluruh Indonesia sedangkan pemakalah berasal staf DIKTI, dosen

serta praktisi IT dari berbagai PT.

5. Penerapan Sistem Pendukung Keputusan dalam Sistem Pengujian Computerized

Adaptive Testing dalam Indonesian Journal of Computing and Cybernetics

Sistems (Indo Ceiss), Volume 5 No. 3, 2011. ISSN 1978-1520. Hasil penelitian

tersebut menguraikan perancangan dan penerapan Decision Support System

dalam CAT .

6. Studi Simulasi Menggunakan Fuzzy C-Means dalam mengklasifikasi Konstruk

Tes dalam jurnal Penelitian dan Evaluasi Pendidikan, Tahun 15, Nomor 1, 2011

ISSN 1410-4725. Akreditasi No. 64a/DIKTI/Kep/2010. Hasil penelitian

memaparkan secara simulasi menggunakan Fuzzy C-Means dalam

mengklasifikasi konstruk Tes. Data simulasi dibangkitkan lewat program

Page 228: CAT RRAD - Unismuh

208

Microsoft Excel 2007 dengan respon dikotomi dan politomi. Data tersebut di

analisis dengan program SPSS dan program Matlab. Hasil kedua program tersebut

dibandingkan hasilnya untuk mendapatkan kelebihan metode fuzzy C-Means. Hasil

penelitian menunjukkan metode fuzzy C-Means lebih luwes dalam menafsirkan

pola kecenderungan pengelompokan komponen jika jumlah butir soal sekitar 30

butir.

7. Examinees Response Test Pattern Simulation-Based Adaptive Computer Using

Fuzzy Reasoning Tsukamoto, dipresentasikan pada Internasional Conference and

Call for Paper (ICCP) yang diselenggarakan oleh ILP2MI dan UKM Penelitian

Universitas Negeri Yogyakarta, 2012. Peserta seminar berasal dari praktisi dan

dosen serta mahasiswa dari dalam dan luar negeri sedangkan pemakalah berasal

dari praktisi dan dosen dalam dan luar negeri.

8. Simulasi Pola Inisialisasi Kemampuan dengan Metode fuzzy Tsukamoto dalam

Mengidentifikasi Cheating. Seminar Nasional diselenggarakan Program

Pascasarjana UNY bekerjasama HEPI Yogyakarta, tanggal 12 Mei, 2012 di

Univeristas Negeri Yogyakarta. Hasil penelitian menunjukkan metode fuzzy

Tsukamoto dapat mengeliminasi cheating dengan simulasi pola inisialisasi dan dua

pola respon. Peserta seminar berasal dari dosen dan mahasiswa serta praktisi

pendidikan dan penguruan dari berbagai PT sedangkan pemakalah berasal dari

dosen, staf DIKTI, BSNP, dan mahaisiswa Pascasarjana dari berbagai PT di

Indonesia.

Page 229: CAT RRAD - Unismuh

209

9. Pengembangan Computerized Adaptive Testing dengan metode Fusuhilow.

Penelitian sebagai pemenang kompetisi hibah doktor 2011. Hasil penelitian ini

sebagai bagian dari penelitian disertasi menunjukkan bahwa metode Fusuhilow

dapat menyajikan butir soal secara adptif terhadap kemampuan peserta tes secara

maksimal.

10. Pengembangan Computerized Adaptive Testing dengan metode Futsuhilow,

Fusuhilow, dan Fumahilow sebagai makalah ringkasan dari disertasi. Makalah

tersebut disajikan pada seminar berkala Program Studi Penelitian dan Evaluasi

Pendidikan Program Pascasarjana Universitas Negeri Yogyakarta pada tanggal 28

Mei 2012. Seminar tersebut dihadiri oleh civitas akademika Program Studi

Penelitian dan Evaluasi Pendidikan.

Page 230: CAT RRAD - Unismuh

210

BAB V

SIMPULAN DAN SARAN

A. Simpulan

Berdasarkan hasil analisis dan pembahasan pengembangan produk

CerdasCAT, maka dilakukan simpulan penelitian sebagai berikut.

1. Hasil simulasi menunjukkan bahwa CerdasCAT memenuhi aturan fuzzy ketiga

metode dalam penyajian butir soal kepada peserta tes dengan memperhatikan

panjang tes, tingkat exposure butir soal, dan galat baku penaksiran parameter

kemampuan.

2. Hasil uji coba one to one menunjukkan bahwa ketersediaan tingkat kesukaran

butir soal dalam bank soal bersesuaian dengan cakupan kemampuan peserta tes

pada rentang [-4,4].

3. Hasil uji coba one to one menunjukkan bahwa sikap user terhadap CerdasCAT

termasuk tinggi.

4. CerdasCAT dapat menyajikan butir soal adaptif terhadap kemampuan peserta tes

secara optimal dengan metode Futsuhilow, Fusuhilow, dan Fumahilow.

5. Rerata jumlah butir soal paling kecil yang direspon peserta tes sampai penaksiran

konvergen sebanyak 14 butir pada metode Fusuhilow kemudian metode

Fumahilow dan terakhir metode Futsuhilow.

6. Tingkat exposure butir soal yang paling sedikit terdapat pada metode Fumahilow

kemudian metode Fusuhilow dan terakhir metode Futsuhilow.

7. Rerata galat baku penaksiran parameter kemampuan paling kecil sebesar 0,818

terdapat pada metode Futsuhilow kemudian metode Fumahilow dan terakhir

metode Fusuhilow.

Page 231: CAT RRAD - Unismuh

211

8. Rerata waktu respon butir soal yang paling pendek selama 1 menit 17 detik

terdapat pada metode Futsuhilow kemudian metode Fusuhilow dan terakhir

metode Fumahilow.

9. CerdasCAT menghasilkan keluaran data kemampuan peserta tes. Pengolahan data

tersebut menggunakan prosedur DSS yakni pembobotan SKL, pembobotan

domain, dan pembobotan kriteria penilaian dalam batasan kuota maksimum dan

skor minimum.

10. DSS dalam CerdasCAT dapat memberikan informasi laporan kelulusan sesuai

preferensi user.

B. Keterbatasan Penelitian

Hasil penelitian berupa produk CerdasCAT mempunyai beberapa keterbatasan

pengembangan sebagai berikut.

1. Desain CerdasCAT menggunakan model Rasch dikotomous sesuai dengan

pengskoran bentuk soal pilihan ganda.

2. Butir soal audio, video, dan animasi tidak tersedia di CerdasCAT.

3. Analisis data respon UN SD menggunakan program Bilog-MG sehingga analisis

butir soal tidak menyatu dengan CerdasCAT.

4. Karakteristik butir soal mengukur kemampuan peserta tes melibatkan tingkat

kesukaran butir soal sedangkan daya beda ditetapkan sama dan peluang tebakan

ditetapkan nol.

5. CerdasCAT dirancang berbasis web namun uji coba one to one dan terbatas berbasis

desktop sehingga informasi mengenai kelebihan dan kekurangan web tidak ada.

Page 232: CAT RRAD - Unismuh

212

6. Data user di_input oleh Admin satu persatu demikian halnya butir soal di_input

oleh Pengajar satu persatu sehingga waktu input data cukup lama jika data

tersebut banyak.

C. Saran Pemanfaatan dan Pengembangan Produk Lebih Lanjut

Hasil penelitian ini memberikan saran-saran pemanfaatan dan pengembangan

produk lebih lanjut sebagai berikut.

1. Butir soal bersesuaian kemampuan peserta tes berdasarkan tingkat kesukaran butir

soal sedangkan daya beda dan peluang tebakan butir tidak diperhatikan. Oleh

karena itu, dalam penelitian selanjutnya dapat menggunakan dua atau tiga

parameter dalam penentuan butir soal yang cocok dengan kemampuan peserta tes.

2. Setiap metode mempunyai kelebihan dan kekurangan dengan empat kriteria, yakni

panjang tes, tingkat exposure butir soal, galat baku penaksiran parameter

kemampuan, dan waktu respon butir soal. Oleh karena itu, disarankan untuk

penelitian lanjutan menggunakan simulasi karakteristik butir soal pada bank soal.

Misalnya, distribusi tingkar kesukaran butir soal juling ke kiri dibandingkan

distribusi tingkat kesukaran butir soal juling ke kanan pada bank butir soal

dengan empat kriteria tersebut.

3. Perpaduan metode fuzzy dan metode high low dalam menyajikan butir soal sesuai

kemampuan peserta lebih akurat sehingga disarankan untuk melakukan penelitian

lanjutan, misalnya metode jaringan syarat tiruan (anfis) atau metode heuristik

dalam bentuk sistim pakar.

4. CerdasCAT dapat diterapkan dalam sistem seleksi ujian masuk atau ujian

kelulusan, misalnya ujian tingkat nasional, lokal atau sekolah dengan memilih

metode sesuai dengan preferensi user.

Page 233: CAT RRAD - Unismuh

213

5. CerdasCAT telah disimulasikan dengan data rill, diujicobakan secara one to one,

dan diujicobakan terbatas di sekolah. Selama ini sistim ujian masih menggunakan

P&P dengan banyak keluhan dari user. CerdasCAT dapat meminimalisir

kekurangan tersebut sehingga dapat dijadikan alternatif sistem pengujian sekarang

dan masa depan.

6. Model CAT yang ada saat ini hanya melibatkan satu metode, CerdasCAT

menawarkan tiga metode. Tiga metode tersebut dapat dibandingkan hasilnya

sesuai dengan kondisi riil di lapangan dan kondisi karakteristik bank butir soal.

Oleh karena itu, CerdasCAT dapat sebagai wadah untuk melakukan penelitian

lebih lanjut dengan pilihan spesifik, misalnya DSS.

D. Diseminasi

Hasil penelitian terkait dengan topik penelitian yang telah dan dalam proses

diseminasi sebagai berikut.

1. Prosedur Rancangan Tes Adaptif Berbasis Komputer, dipresentasikan pada

seminar Nasional Fakultas MIPA Universitas Negeri Semarang, Semarang, 2009.

2. Penerapan Model Logistik Satu Parameter pada Computerized Adaptive Testing

Ujian Masuk Perguruan Tinggi, dipresentasikan pada seminar Nasional HEPI,

Jakarta, 2010.

3. Aplikasi Computerized Adaptive Testing (CAT) pada ujian Seleksi Masuk

Perguruan Tinggi sebagai makalah poster session yang diselengarakan oleh Pusat

Penelitian Kebijakan dan Inovasi Pendidikan, Balitbang, Kemdiknas, Jakarta, 2010.

Page 234: CAT RRAD - Unismuh

214

4. Decision Support System dalam Testing Adaptive dengan Metode High low,

dipresentasikan pada Seminar Nasional Ilmu Komputer: General Approach on

Multidisciplinary Application diselenggarakan oleh Ilmu Komputer FMIPA UGM

bekerjasama dengan IndoCeiss, 2011.

5. Penerapan Sistim Pendukung Keputusan dalam Sistim Pengujian Computerized

Adaptive Testing dalam Indonesian Journal of Computing and Cybernetics

Systems (Indo Ceiss), Volume 5 No. 3, 2011. ISSN 1978-1520.

6. Studi Simulasi Menggunakan Fuzzy C-Means dalam mengklasifikasi Konstruk

Tes dalam jurnal Penelitian dan Evaluasi Pendidikan, Tahun 15, Nomor 1, 2011

ISSN 1410-4725. Akreditasi No. 64a/DIKTI/Kep/2010.

7. Examinees Response Test Pattern Simulation-Based Adaptive Computer Using

Fuzzy Reasoning Tsukamoto, dipresentasikan pada Internasional Conference and

Call for Paper (ICCP) yang diselenggarakan oleh ILP2MI dan UKM Penelitian

Universitas Negeri Yogyakarta, 2012.

8. Simulasi Pola Inisialisasi Kemampuan dengan Metode fuzzy Tsukamoto dalam

Mengidentifikasi Cheating. Seminar Nasional diselenggarakan Program

Pascasarjana UNY bekerjasama HEPI Yogyakarta, 12 Mei, 2012.

9. Analisis Soal dengan Desain Group Wise Adative Testing. Tahap usulan ke Jurnal

Psikologi UGM, 2012.

10. Simulasi Pola Seleksi Dog Bone pada Computerized Adaptive Testing. Tahap

usulan ke seminar Nasional HEPI di Makassar, 2012.

11. Simulasi Pola Respon Peserta Tes Menggunakan Metode Fuzzy Sugeno. Tahap

usulan ke Jurnal IndoCeis, UGM, 2012.

Page 235: CAT RRAD - Unismuh

215

E. Temuan Baru Hasil Penelitian

Temuan baru hasil penelitian berupa produk CerdasCAT dengan spesifikasi

sebagai berikut.

1. Menemukan pengembangan model CAT dengan metode fuzzy pada model Rasch.

2. Menemukan tiga metode baru dalam menyajikan butir soal adaptif terhadap

kemampuan peserta tes yakni metode Futsuhilow (perpaduan antara metode fuzzy

tsukamoto dengan metode high low), metode Fusuhilow (perpaduan antara metode

fuzzy Sugeno dengan metode high low), dan metode Fumahilow (perpaduan antara

metode fuzzy Mamdani dengan metode high low)

3. Model CAT pertama mempunyai tiga metode penyajian yang memberi peluang

kepada user dalam memilih metode yang sesuai dengan preferensinya.

4. Model CAT pertama yang memadukan DSS dengan model CAT berdasarkan model

Rasch sehingga menghasilkan informasi laporan kelulusan.

5. Model CAT pertama menghasilkan output kemampuan peserta tes, panjang tes,

tingkat exposure butir soal, galat baku penaksiran parameter kemampuan, dan

waktu respon butir soal dengan metode fuzzy dipadukan metode high low.

6. Buku panduan menggunakan produk CerdasCAT.

Page 236: CAT RRAD - Unismuh

216

DAFTAR PUSTAKA

Abbass, H. A., Sarker, R. A., & Newton, C. S. (2002). Data mining: a heuristic

approach. Australia. Idea Group Publishing.

Agus Santoso. (2009). Computerized adaptive testing untuk pengukuran hasil belajar

mahasiswa univeristas terbuka. Disertasi doktor, tidak diterbitkan, Universitas

Negeri Yogyakarta, Yogyakarta.

Al-A’ali, M. (2007). Implementation of an improved adaptive testing theory.

Educational Technology & Society, 10(4), 80-94. Artikel. Diambil pada

tanggal 5 September 2009, dari http://www.ifets.info/journals/10_4/9.pdf.

Allen, M. J., & Yen, W. M. (1979). Introduction to measurement theory. Monterey,

CA: Brooks/Cole.

Anastasions, A. (2005). Adaptive orientation methods in computer adaptive testing.

Proceeding E-Learn World Conference on E-Learning in Corporate,

Government, Healthcare and Higher Education: AACE. Diambil pada tanggal

12 Juli 2009, dari http://www.education.ualberta.ca/ educ/psych/crame/

files/GushtaCSSE2003.pdf.

Antonio, G., & Gustavo, S. (2010). Fast defuzzification method based on centroid

estimation. Diambil pada tanggal 23 Juni 2010, dari http://prof.usb.ve/

gsanchez/articulos/382-088.pdf

Bojadziev, G. & Bojadziev, M. (2007). Fuzzy logic for business, finance, and

management. Singapura, World Scientific Publishing Co. Pte. Ltd

Chaowprapha Chuesathuchon dan Russell Waugh. (2010). Item banking and

Computerized Adaptive Testing with rasch measurement: An example for

primary Mathematics in thailand. Dalam russell Waugh (Eds) Applications

of Rasch Measurement in Education, New York. Nnova Science Publishers, inc.

Chen, D. J., Lai, A. F., & Mao, C. C. (2007). The analysis of response patterns on IRT

ability estimation methods in computerized adaptive test. Artikel. Seventh

IEEE International Conference on Advanced Learning Technologies . Artikel.

Diambil pada tanggal 5 Oktober 2009 dari http://csdl2.computer.org/comp/

proceedings /icalt/2007/2916/00/ 29160721.pdf.

Cheng, I., Shen, T., & Basu, A. (2008). An algorithm for automatic difficulty level

estimation of multimedia mathematical test items. Eighth IEEE International

Conference on Advanced Learning Technologies. Diambil pada tanggal 23

Oktober 2009, dari http://www.computer.org/portal/web/csdl/abs/proceedings

/icalt/ 2008/3167/00/3167a175abs.htm.

Page 237: CAT RRAD - Unismuh

217

Corne, D. W., Oates, M. J., & Smith, G. D. (2000). Heuristic and Adaptive

Computation Techniques in Telecommunications: an Introduction. Dalam

Corne, D.W., Oates, M. J. & Smith, G. D (Eds.) Telecommunications

optimization: heuristic and adaptive techniques (pp.1-13). England: John

Wiley & Sons Ltd.

Cox, E. (1994). The fuzzy systems handbook: A practitioner’s guide to building,

using, and maintaining fuzzy systems. Massachusetts: Academic Press, Inc.

Djemari Mardapi. (1991). Penilaian unjuk kerja sebagai usaha meningkatkan

kemampuan sumber daya manusia. Pidato Dies Natalis XXXII IKIP

Yogyakarta, Yogyakarta.

Efrain T., Aronson, J. E., & Liang, T. P. (2001). Decision support sistem and

intelligent sistems. New Jersey: Pearson Education, Inc.

Feldt, L. S., & Brennan, R. L. (1989). Reliability. Dalam R. L. Linn (Eds.),

Educational measurement (pp. 105-146). New Work: Macmillan.

Fernando de Arriaga and Mohamed El Alami, (2006). Evaluation of a fuzzy intelligent

learning system. Diambil pada tanggal 17 Desember 2009, dari http://www.

uop. edu.jo/csit2006/vol2%20pdf/pg127.pdf.

Field, A. (2000). Discovering statistic using SPSS for windows: Advanced techniques

for beginner. London: Sage Publications Ltd.

Fisher, W. P. Jr. (2005). Meaningfulness, measurement and Item Response Theory

(IRT). Rasch Measurement Transactions, 19 (2), 1018-1020. Diambil pada

tanggal 25 Juli 2008, dari http://www.rasch.org/rmt/rmt192d.htm.

Georgiadou, E., Triantafillou, E., & Economides, A. A. (2006). Evaluation

parameters for computer-adaptive testing, British Journal of Educational

Technology Vol 37 No. 2, pp 261 – 278. Diambil pada tanggal 13 Januari 2009,

dari http://citeseerx.ist.psu.edu/viewdoc/download?doi= 10.1.1. 104.

2221&rep=rep 1 & type=pdf.

Guo, W. W., Li, L, D., & Whymark, G. (2009). Statistic and neural networks for

approaching nonlinier relations between wheat plantation and production in

Queensland of Australia. Artikel. Diambil pada tanggal 15 Oktober 2009, dari

http://portal.acm.org/citation.cfm?id=1488023.pdf.

Gushta, M. M. (2003). Standard setting issues in computerized adaptive testing.

Artikel. Diambil pada tanggal 12 Juli 2009, dari http://www.education.

ualberta.ca/ educ/psych/crame/files/GushtaCSSE2003.pdf.

Guzman, E., Conejo, R., & Garcia-Hervas, E. (2005). An authoring enviroment for

adaptive testing. Diambil pada tanggal 25 November 2009, dari

http://scholar.google.co.id/ scholar?q=An+ Authoring+ Environment+ for+

Adaptive+Testing&hl=Id &um= 1&ie= UTF-8 &o =scholar.

Page 238: CAT RRAD - Unismuh

218

Hambleton, R. K. (1989). Principles and selected applications of item response

theory. Dalam R. L. Linn (Eds.), Educational Measurement (pp.147-200). New

York: Macmillan.

Hambleton, R. K., Swaminathan, H., & Rogers, H. J. (1991). Fundamentals of item

response theory. Newbury Park, CA: Sage.

Hambleton, R. K., & Swaminathan, H. (1985). Item response theory: Principles and

applications. Boston: Kluwer.

Hambleton, R. K., Zaal, J. N., & Pieters. (1991). Computerized adaptive testing:

Theory, applications and standards. Dalam R.K.J. Zael (Eds.), Advances in

educational and psychological testing. Boston: Kluwer.

Haryanto. (2009). Pengembangan computerized adaptive testing (CAT) dengan

algoritma logika fuzzy. Disertasi doktor, tidak diterbitkan, Universitas Negeri

Yogyakarta, Yogyakarta.

Hatzigaidas, A., Papastergiou, A., Tryfon, G., et al. (2003). Adaptive student test

evaluation incorporating probabilities. Proceedings of the International

Conference on Theory and Applications of Mathematics and Informatics –

ICTAMI, Alba Iulia. Diambil pada tanggal 25 November 2009, dari http://emis.

impa. br/EMIS/ journals/AUA/ acta6/17_ ADAPTIVE%20 STUDENT

%20TEST_fin_8v.pdf.

Hossain, M.A., Madkour, A. A. M., Dahal, K. P., et al. (2004). Intelligent active

vibration control for a flexible beam system. Proceedings of the IEEE SMC

UK-RI Chapter Conference on Intelligent Cybernetic Systems September 7-8,

Londonderry, U.K. Diambil pada tanggal 8 November 2009, dari http://

www.epsrcham. org.uk/MCDS/MCDSPublications files/ E2-Hossain.pdf.

Hulin, L. H., Drasgow, F., & Parsons, C. K. (1983). Item response theory: Application

to psychological measurement. Homewood, IL: Thorsey Professional Series.

Jang, J. S. R., Sun, C. T., & Mizutani, E. (1997). Neuro-fuzzy and soft computing.

London: Prentice-Hall.

Jian Ma & Duanning Zhou. (2008). Fuzzy set approach to the assessment of student-

centered learning. Diambil pada tanggal 2 Desember 2009, dari

http://sclab.yonsei.ac.kr/ courses/09-AI /Papers/Fuzzy-Fuzzy.pdf.

Kolen, M. J., & Brennan, R. L. (2004). Test equating, scaling and linking: Methods

and practices (2nd ed.). New York: Springer-Verlag.

Lin, C. H., Chen, K. P., & Tsai, C. H, (2008). Modeling the examinee ability on the

computerized adaptive test using adaptive network-based fuzzy inference

system. IEEE Asia Pacific Computing Conference. Artikel. Diambil pada

tanggal 15 Oktober 2009, dari http://portal.acm.org/citation.cfm?id=

1488023.pdf.

Page 239: CAT RRAD - Unismuh

219

Linacre J. M. (2005). Rasch dichotomous model vs. One-parameter Logistic Model.

Rasch Measurement Transactions, 19:3, 1032. Diambil pada tanggal 18 Mei

2010, dari http://www.rasch.org/rmt/rmt193h.htm.

________. (2000). Computer-adaptive testing: A methodology whose time has come.

Artikel. Diambil pada tanggal 17 Mei 2009, dari http://www.rasch.org/

memo69.pdf.

Lord, F. M. (1980). Applications of item response theory to practical testing problem.

Hillsdate, NJ: Lawrence Erlbaum Associates.

Martin, E. W., Brown, C. V., DeHayes, D., et al. (2005). Managing Information

Technology. 5th edition. Upper Saddle River, New Jersey: Prentice Hall, Inc.

Mead, R. J. (2008). A Rasch primer: the measurement theory of Georg Rasch.

Psychometrics services research memorandum 2008–001. Maple Grove, MN:

Data Recognition Corporation. Diambil pada tanggal 12 Juli 2010, dari

http://www.data recognitioncorp.com/Assets/Downloads/Rasch%20 Primrr

%20-%20Ronald %20Mead.pdf

McLeod, R. dan Schell, G. P. (2007). Management Information Sistems. 7th edition.

Upper Saddle River, New Jersey: Prentice Hall, Inc.

Mills, C.N., & Steffen, M. (2000). The gre computer adaptive test: Operational

issues. Dalam Linden W.J., & Glas, G.A.W. (Eds.). Computerized adaptive

testing: theory and practice. (pp. 75-99). Bonston, PA: Kluwer.

Mustafa Palancioglu and Kate Beard. (2005). Modeling moving objects and their

movements using fuzzy logic approach. Artikel. Diambil pada tanggal 15

Oktober 2009, dari http://www.gis.usu.edu/docs/protected/procs/asprs/ asprs

2001/ Proceed/00111.pdf.

O’Brien, J. A. (2005). Introduction to information systems, Twelfth Edition. New

York: The McGraw-Hill Companies Inc.

Olsen, J. B., Maynes, D. D., Slawson, D., et al. (1989). Comparison of

paperadministered, computer-administered and computerized adaptive

achievement tests. Journal of Educational Computing Research, 5, 311-326

Ossi Nykänen. (2006). Inducing Fuzzy Models for Student Classification. Diambil

pada tanggal 2 Juli 2009, dari http://www.ebiblioteka.lt/resursai/Uzsienio%20

leidiniai/ I EEE/ English/2006/Volume%209/Issue%202/Jets_v9i2_18.pdf.

Phankokkruad, M., & Woraratpanya W. (2008). Web service architecture for

computer-adaptive testing on e-learning. [Versi electronik]. Pwaset Vol. 36,

December 2008 ISSN 2070-3740.

Page 240: CAT RRAD - Unismuh

220

______. (2008). An Automated decision system for computer adaptive testing using

genetic algotithms. Artikel. Diambil pada tanggal 5 Oktober 2009, dari

http://dspace.lib.fcu.edu.tw/bitstream/2377/ 3728/1/ ce07ics 00200

6000254.pdf.

Poo, D., Kiong, D., & Ashok S. (2008). Object-Oriented Programing and Java.

Springer. London.

Rosenberg, D., & Stephens, M. (2007). Use Case Driven Object Modeling with UML,

Theory and Practice, Springer-Verlag New York, Inc, New York.

Ross, T. J. (2004). Fuzzy logic with engineering applications (2rd ed.). England: John

Wiley & Sons Ltd.

Rukli. (1998). Galat baku penaksiran parameter butir tes Ebtanas SLTP pada mata

pelajaran matematika. Tesis magister, tidak diterbitkan, IKIP Yogyakarta,

Yogyakarta.

______.(2010). Penerapan model logistik satu parameter pada Computerized

Adaptive Testing ujian masuk Perguruan Tinggi. Prosiding Seminar Nasional

Himpunan Evaluasi dan Pendidikan Indonesia, Jakarta. ISBN 978-602-96343-

0-3. 93-108.

______(2010). Sistem pendukung keputusan dalam menentukan soal tes yang sesuai

dengan kemampuan peserta tes. Tesis magister, tidak diterbitkan, Universitas

Gadjah Mada, Yogyakarta.

______,(2011). Studi Simulasi Menggunakan Fuzzy C-Means dalam mengklasifikasi

Konstruk Tes. Jurnal Penelitian dan Evaluasi Pendidikan. ISSN 1410-4725,

Tahun 15 Nomor 1. Akreditasi No. 64a/DIKTI/Kep/2010. 115-137.

Rukli dan Hartati (2011). Penerapan Sistem Pendukung Keputusan dalam Sistem

Ujian Computerized Adaptive Testing. Indonesian Journal of Computing and

Cybernetic Systems, ISSN 1978-1520, Vol. 5 No. 3. 71-81

Rumbaugh, J., Blaha, M., Premerlani, et al. (1991). Object-Oriented Modeling. New

Jersey Prentice-Hal International, Inc..

Sen-Chi Yu, & Berlin Wu. (2006). Fuzzy item response model: a new approach to

generate membership function to score psychological measurement. Diambil

pada tanggal 12 Juli 2009, dari http://www.springerlink.com/content/?k=

Fuzzy+item+response + model.pdf.

Shingo Imai. (2008). Development of Japanese-Computerized Adaptive Test. Diambil

pada tanggal 18 Juli 2009, dari http://web.cc.yamaguchi-u.ac.jp/~imai2002/j-

cat/gaiyou/ 2008Development-of-J-CAT.pdf.

Sie Hoe Lau, Kian Sam Hong, Ngee Kiong Lau, et al. (2005). Web based computer-

Adaptie multiple choive assessment (CAAS) using the new NRET scoring

Page 241: CAT RRAD - Unismuh

221

mtehod. Diambil pada tanggal 27 November 2009, dari http://atcm.

mathandtech.org/ EP2008/ papers_full/2412008_15339.pdf.

Siler, W., & Buckley, J. J. (2005). Fuzzy expert systems and fuzzy reasoning. Canada:

John Wiley & Sons, Inc.

Suarez, J. (2003). Student evaluation through membership function in CAT systems.

Revista Mexicana De fisika 49(4) 371-378. Diambil pada tanggal 5 Oktober

2009, dari http://www.ejournal.unam.mx/rmf/no494/RMF49414.pdf.

Suarez-Cansino J., and Hernandez-Gomez, R. A. (2007). Adaptive testing system

modeled through fuzzy logic. Artikel. Diambil pada tanggal 5 Oktober 2009,

dari http://www.wseas.us/e-library/conferences/2007cscc/papers/561-467.pdf.

Sumadi Suryabrata. (1987). Pengembangan Tes Hasil Belajar. Rajawali Pers., Jakarta.

Swaminathan, H. (1983). Parameter estimation in item response models. Dalam R. K.

Hambleton (Eds.), Applications of Item Response Theory (pp. 24-44)

Columbia: Eduacational Research Institute of British Columbia.

The Mathworks, Inc. (2004). Fuzzy Logic Toolbox For Use with MATLAB®, The

MathWorks, Inc.

Tian Jian-quan, Miao Dan-min, Zhu Xia, & Gong Jing-Jing. (2007). An introduction

to the computerized adaptive testing. Volume 4 No. 1 Serial no. 26. Diambil

pada tanggal 17 Januari 2009, dari http://www.eric.ed.gov/ERICDocs/

data/ericdocs2sql/ content_ storage_01/0000019b/80/2b/68/bc.pdf.

Triantafillou, E., Georgiadou, E., & Economides, A. A. (2006). CAT-MD: Computer

adaptive test on mobile divices. Diambil pada tanggal 17 November 2009,

dari http://www. formatex.org/micte2006/pdf/773-777.pdf.

Turban, E., Aronson. J. E., & Liang, T. P. (2001). Decission support system and

inteligent system, 7th Ed. Printice-Hall International, Inc., New Jersey.

Van der Linden, W. J., & Glas, C. A. W. (Eds.). (2000). Computerized adaptive

testing theory and practice. The Netherlands: Kluwer Academic Publishers.

_______. (2010). Elements of adaptive testing. New York: Springer-Verlag.

Verschoor. A. J., & Straetmans, G. J. J. M. (2002). Mathcat: A flexible testing system

in mathematics education for adults. Dalam Linden W.J., & Glas, G.A.W.

(Eds.), Computerized adaptive testing: theory and practice (pp. 101-116).

Bonston, PA: Kluwer.

Wainer, H. (2000). Computer adaptive testing: A primer (2nd ed.). Marwah, NJ:

Lawrence Erlbaum Associates, Inc.

Page 242: CAT RRAD - Unismuh

222

_______.(1983). Some practical considerations when converting a linearly

administered test to an adaptive format. Educational Measurement: Issues and

Practice, 12, 15-20.

Wang, T., & Kolen, M. J. (2001). Evaluating comparability in computerized adaptive

testing: Issues, criteria and an example. [Versi electronik]. Journal of

Educational Measurement, 38(1), 19-49.

Wen-June Wang & Leh Luoh, (2000). Simple computation for the fuzzification of

center of sum and center of grafity. [Versi electronik]. Journal of Inteligent

and Fuzzy System. 9.53-59.

Wen-shuenn Wu. (2004). Development of an online adaptive vocabulary test system.

Diambil pada tanggal 23 November 2009, dari http://people.chu.edu.tw/

~wswu/ publications/papers/conferences/06.pdf.

Whitten, J. L., Bentley, L.D., & Dittman, K. C. (2004). Sistems analisys and design

methods. Indianapolis : The McGraw-Hill Companies, Inc.

Wu, C. L., & Chau, K. W. (2006). Evalution of several algorithms in forecasting

flood. Artikel. Diambil pada tanggal 1 Oktober 2009, dari http://portal.acm. org/

citation. cfm?id= 1488023.pdf.