review jurnal disertasi
TRANSCRIPT
8/8/2019 Review Jurnal Disertasi
http://slidepdf.com/reader/full/review-jurnal-disertasi 1/5
Review jurnal disertasi“ Penyetaraan Tes Model Campuran Butir Dikotomus dan
Politomus pada tes Hasil Belajar Karya Kartono”
PENDAHULUAN
Kegiatan menganalisis butir soal merupakan suatu kegiatan yang harusdilakukan guru untuk meningkatkan mutu soal yang telah ditulis. Kegiatan ini
merupakan proses pengumpulan, peringkasan, dan penggunaan informasi dari jawaban
siswa untuk membuat keputusan tentang setiap penilaian (Nitko, 1996: 308). Tujuan
penelaahan adalah untuk mengkaji dan menelaah setiap butir soal agar diperoleh
soal yang bermutu sebelum soal digunakan. Di samping itu, tujuan analisis butir soal
juga untuk membantu meningkatkan tes melalui revisi atau membuang soal yang tidak
efektif, serta untuk mengetahui informasi diagnostik pada siswa apakah mereka
sudah/belum memahami materi yang telah diajarkan (Aiken, 1994: 63). Soal yang
bermutu adalah soal yang dapat memberikan informasi setepat-tepatnya sesuai
dengan tujuannya di antaranya dapat menentukan peserta didik mana yang sudah atau
belum menguasai materi yang diajarkan guru.
Tes adalah suatu prosedur yang sistematik yang terdiri dari stimulus yang didesain
dengan baik dalam rangkaian tertentu berdasar kepada prinsip-prinsip konstruksi tes.
Stimulus disebut juga dengan item. Sedangkan test psikologi adalah suatu prosedur
standar untuk mengukur secara kuantitatif (skor) maupun kualitatif (evaluasi) satu /
beberapa aspek atribut psikologis dengan menggunakan sample perilaku verbal maupun
non verbal.
Dalam melaksanakan analisis butir soal, para penulis soal dapat menganalisis secara
kualitatif, dalam kaitan dengan isi dan bentuknya, dan kuantitatif dalam kaitan dengan
ciri-ciri statistiknya (Anastasi dan Urbina, 1997: 172) atau prosedur peningkatan secara
judgment dan prosedur peningkatan secara empirik (Popham, 1995: 195). Analisis
kualitatif mencakup pertimbangan validitas isi dan konstruk, sedangkan analisis
kuantitatif mencakup pengukuran kesulitan butir soal dan diskriminasi soal yang
termasuk validitas soal dan reliabilitasnya.
Jadi, ada dua cara yang dapat digunakan dalam penelaahan butir soal yaitu
penelaahan soal secara kualitatif dan kuantitatif. Kedua teknik ini masing-masing
memiliki keunggulan dan kelemahan. Oleh karena itu teknik terbaik adalah
8/8/2019 Review Jurnal Disertasi
http://slidepdf.com/reader/full/review-jurnal-disertasi 2/5
menggunakan keduanya (penggabungan). Kedua cara ini diuraikan secara rinci dalam
jurnal Himpunan Evaluasi edisi nomor 2 Tahun XII, 2008 ini.
Abstrak
Dalam Abstrak
Kartono mengungkapkan bahwa tujuan penelitian untuk mengungkapakan,
1. Level pada faktor banyak butir Anchor, banyaknya kategori butir politomus dan dikotomus,
ukuran sampel dan metode transformasi yang digunakan
2. kombinasi level antar faktor yang mempengaruhi hasil penyetaraan tes campuran 3
PL/GPCM.
Hasil penelitian ini menyatakan bahwa
1. banyaknay butir anchor berpengaruh pada hasil penhyetaraan tes yaitu 40 % pada level
pertama dan 20 %
2. banyaknaya butir politomus pada 2 level yaitu 5 kategori pada level kedua
a. Karakteristik Tes dalam Teori Respon Butir (TRB)
TRB banyak memecahkan permasalahan di dalam desain tes. Ini tentu dicirikan oleh
berbagai hal. Dalam pandangan TRB, butir tes sesungguhnya independen dari pesertaujian, dan peserta ujian independen dari butir tes. Itulah yang dinamakan independensilokal. Lokal di sini diasumsikan sebagai sebuah titik di dalam suatu kontinum parameter
karakteristik peserta ujian, yang berupa interval yang mengandung subpopulasi peserta
ujian yang homogen. Independen dipahami sebagai independensi semua peserta ujiandari butir tes di dalam subpopulasi. Independensi lokal dengan demikian dipahami
sebagai skor komposit suatu butir yang diberikan oleh subpopulasi peserta ujian yang
homogen yang independen (Naga, 1992 dikutip di dalam Widiatmoko, 2005: 76). Ini berarti pula bahwa respon terhadap dua butir tes tidak saling berkorelasi di dalam
subpopulasi homogen (Hulin, Drasgow, & Parsons, 1983: 43). Hambleton, Swaminathan,
& Rogers (1991: 10) menyatakan bahwa apabila karakteristik yang mempengaruhi
performansi tes bersifat konstan, respon yang diberikan oleh peserta ujian terhadap pasangan butir tes secara statistik menjadi independen. Dengan perkataan lain, setelah
mempertimbangkan karakteristik peserta ujian, keberadaan antara respon peserta ujian
dan butir-butir tes yang berbeda menjadi saling bebas. Ini menyiratkan bahwakarakteristik yang ditentukan oleh sebuah model menjadi faktor yang menentukan
bagaimana respon peserta ujian terhadap butir-butir tes. Lord & Novick (1968: 361) dan
McDonald (1999: 255) menyatakan bahwa independensi lokal sebagai keadaan di dalamsekelompok peserta ujian yang semuanya dicirikan dengan nilai yang sama, distribusi
8/8/2019 Review Jurnal Disertasi
http://slidepdf.com/reader/full/review-jurnal-disertasi 3/5
skor butir menjadi saling bebas antara butir satu dan butir lainnya.
Yang kedua adalah invariansi parameter. Invariansi parameter dipahami sebagai sebuah
fungsi dari karakteristik parameter peserta ujian atau butir tes yang tidak akan berubah didalam subpopulasi meskipun subpopulasi tersebut berubah. Ini kemudian dipahami
sebagai karakteristik peserta ujian yang tidak berubah meskpin butir yang dipilihnya
berubah (Hulin, Drasgow, & Parsons, 1983; Naga, 1992 dikutip di dalam Widiatmoko,2005: 76). Bahkan, ini bermakna bahwa parameter-parameter yang menjadi ciri suatu
butir tes tidak bergantung pada distribusi karakteristik peserta ujian dan parameter yang
menjadi ciri peserta ujian tidak bergantung pada perangkat butir tes (Hambleton,Swaminathan, & Rogers, 1991: 18). Oleh karena itu, invariansi merupakan ciri TRB yang
penting juga. Apabila invariansi tersebut tidak ada, butir tes ditengarai menjadi bias dari
nilai parameter sesungguhnya (Wells, Subkovlak, & Serlin, 2002: 77).
Ada 3 Parameter Butir dalam IRTa. Daya Pembeda Butir (soal/item)
yaitu Kemampuan item untuk membedakan subjek yang mempunyai kemampuan tinggi
dan kemampuan rendah.
b. Tingkat Kesukaran Soalyaitu Perbandingan antara jumlah subjek yang menjawab benar pada suatu soal dengan
keseluruhan subjek.Misalnya :
Ada 100 subjek, yang menjawab benar pada satu soal adalah 80 anak maka taraf
kesukaran soal (menurut Pak Pras lebih enak menyebutnya taraf kemudahan soal) : P = B
/ T = 80 / 100 = 0,8 c. Faktor Kebetulan Menjawab Benar/ Faktor Tebakan Kondisi itemdijawab benar bukan oleh kemampuan tetapi oleh faktor tebakan.
c. Faktor Kebetulan Menjawab Benar/ Faktor Tebakan
Kondisi item dijawab benar bukan oleh kemampuan tetapi oleh faktor tebakan.
Yang ketiga adalah unidimensi. Unidimensi didefinisikan sebagai kehadiran komponen
atau faktor yang dominan yang mempengaruhi performansi tes. Komponen atau faktor dominan ini dianggap sebagai karakteristik yang diukur oleh tes (Hambleton,
Swaminathan, & Rogers, 1991: 9-10). Unidimensi juga ditafsirkan sebagai suatu butir
yang mengukur satu ciri pada peserta ujian (Traub, 1983: 58; Naga, 1992: 164). Ini bermakna bahwa probabilitas suatu respon butir adalah sebagai suatu fungsi karakteristik
laten tunggal peserta ujian (Hulin, Drasgow, & Parsons, 1983 dikutip di dalam
Widiatmoko, 2005: 77). Karena setiap karakteristik ditentukan oleh satu keberukuran,
keberukuran itu dapat dimaknai sebagai persyaratan untuk mengukur hanya satu dimensikarakteristik peserta ujian di dalam subpopulasi.
b. Penerapan Model-model IRT
Teori tes modern termauk IRT dibedakan dalam beberapa model. Untuk menentukan
model, kita bisa melihat kepada berapa banyak parameter item yang dilibatkan dalammodel tersebut, model ini termasuk moel dikotomis, yaitu:
1. Model logistik 1 parameter : melibatkan 1 parameter yaitu taraf kesukaran soal.
2. Model logistik 2 parameter Melibatkan 2 parameter, yaitu :
a. Taraf kesukaran soal.
8/8/2019 Review Jurnal Disertasi
http://slidepdf.com/reader/full/review-jurnal-disertasi 4/5
b. Indeks daya beda.
3. Model logistik 3 parameter: melibatkan 3 parameter, yaitu :
a. Taraf kesukaran soal. b. Indeks daya beda.
c. Faktor kebetulan
Ada berbagai campuran model IRT. Dikotomis model termasuk satu-parameter logistik
(1PL),-parameter logistik dua (2PL), dan tiga Parameter logistik (3PL) model. Model
Polytomous termasuk kredit parsial (PC) model (Masters & Wright, 1997), kredit umum parsial (GPC) model (Muraki, 1997), dan respon dinilai (GR) model (Samejima, 1997).
Berikut campuran enam model dipekerjakan: PC + 1PL, 2PL + GPC, 3PL + GPC, 1PL +
GR, 2PL + GR, GR + dan 3PL. Untuk semua enam kombinasi model, model dikotomis
dianggap sebagai kasus khusus model polytomous terkait. untuk kombinasi + GR 1PL,diskriminasi parameter untuk model GR adalah tetap sebesar 1.0.
Hasil dari studi empiris menunjukkan, secara umum, bahwa:
1. Klasifikasi konsistensi dan indeks diperkirakan marjinal akurasi untuk DIF-IRT bedamodel kombinasi tidak berbeda secara substansial.
2. D dan metode P menghasilkan hasil yang sama.3. Bila dibandingkan dengan prosedur non-IRT, prosedur IRT cenderung menghasilkan
diperkirakan lebih besar klasifikasi marjinal konsistensi dan ketepatan indeks.
4. Perkiraan konsistensi bersyarat klasifikasi dan indeks akurasi menunjukkan pola
bergelombang dengan nilai terendah dekat skor dipotong. Meskipun enam kombinasimodel menghasilkan indeks klasifikasi diperkirakan yang mirip satu sama lain, mereka
cenderung berbeda untuk menghasilkan hasil yang lebih saat model tidak sesuai dengan
data yang memadai.
Pengertian tingkat kesukaran dan daya beda dalam teori respon butir berbeda dengan
pengertian tingkat kesukaran dna daya beda dalam teori tes klasik. Untukbutir soal nomor g misalakan bg notasi untuk tingkat kesukaran. Tingkat kesukaran disini adalah tingkat
kemampuan (laten trait), misalkan dikatakan peserta tes dengan tingkat kemampuan bg =
1 mempunyai peluang 0,5 akan menjawab dengan soal nomor g. hal ini berarti, dariseluruh peserta tes dengan tingkat kemampuan bg =, maka 50% diantara mereka akan
menjawab benar soal g tersebut. Secara matematis dituliskan Pg (Bg = 1) = 0,5. Jika ada
butir soal lain, misalnya soal nomor h, dengan Ph (bh=2) = 0,5, maka dikatakan bahwasoal hmemerlukan kemampuan 2 sedangkan soal g hanya memerlukan kemampuan 1
(lihat gambar diatas)
Daya beda dalam teori respon butir, misalnya dinotasikan dengan Ag, adalah kemiringan
8/8/2019 Review Jurnal Disertasi
http://slidepdf.com/reader/full/review-jurnal-disertasi 5/5
KKB jika kemiringan KKB dari butir soal selalu datar, maka butir tersebut kurang efektif
dalam membedakan tingkat kemampuan yang berbeda, dalam hal ini nilai ag kecil.
Sedangkan jika kemiringan KKB dari butir soal selalu tegak, bentuk KKB menyerupaifungsi tangga dan dalam hal ini nilai ag ekstrim besar. Kemiringan KKb yang diharapkan
adalah kemiringan yang moderat seperti gambar diatas (butir 2; a = 1,0) dan dalam hal ini
nilai ag juga moderat. Nilai-nilai daya beda kecil dan besar sangat mempengaruhi bentuk KKB sebagaimana ditunjukkan pada gambar diatas.
Misalnya ada tiga butir soal dengan nomor 1, 2 dan 3 dan ketiganya P1 (b1 = 1,5) = P2
(b2 = 1,5) = P3 (b3 = 1,5). Ini berarti kelompok dengan kemampuan (laten trait) 1,5mempunyai peluang 0,5 akan menjawab dengan benar ketiga soal tersebut misalkan KKB
ketiga butir soal tersebut masing-masing pempunyai kemiringan a1 = o,1 , a2=1,0, dan a3
= 100, KKb dari ke tiga butir soal tersebut disajikan pada gambar 2 diatas.
Untuk KKB daya beda a1 = 0,1, pada gambar dapat dilihat bahwa soal tersebut tidak bisamembedakan tes dengan tingkat kemampuan yang berbeda-beda. Untik kemmapuan Ө
mulai dari 0 sampai tertinggi peluang menjawab hampir sama. Sementara itu soal nomer
3 mempunyai KKB dengan daya beda a3 = 100. Butir soal seperti itu hanya membedakan
kelompok yang mempunyai kemampuan dibawah 1,5 dengan kemampuan diatas 1,5.Untuk soal nomor 2 KKBnya mempunyai daya beda a2 = 1,0 (dianggap moderat) dan
soal seperti inilah yang dianggap baik.