review jurnal disertasi

8/8/2019 Review Jurnal Disertasi

http://slidepdf.com/reader/full/review-jurnal-disertasi 1/5

Review jurnal disertasi“ Penyetaraan Tes Model Campuran Butir Dikotomus dan

Politomus pada tes Hasil Belajar Karya Kartono”

PENDAHULUAN

Kegiatan menganalisis butir soal merupakan suatu kegiatan yang harusdilakukan guru untuk meningkatkan mutu soal yang telah ditulis. Kegiatan ini

merupakan proses pengumpulan, peringkasan, dan penggunaan informasi dari jawaban

siswa untuk membuat keputusan tentang setiap penilaian (Nitko, 1996: 308). Tujuan

penelaahan adalah untuk mengkaji dan menelaah setiap butir soal agar diperoleh

soal yang bermutu sebelum soal digunakan. Di samping itu, tujuan analisis butir soal

juga untuk membantu meningkatkan tes melalui revisi atau membuang soal yang tidak

efektif, serta untuk mengetahui informasi diagnostik pada siswa apakah mereka

sudah/belum memahami materi yang telah diajarkan (Aiken, 1994: 63). Soal yang

bermutu adalah soal yang dapat memberikan informasi setepat-tepatnya sesuai

dengan tujuannya di antaranya dapat menentukan peserta didik mana yang sudah atau

belum menguasai materi yang diajarkan guru.

Tes adalah suatu prosedur yang sistematik yang terdiri dari stimulus yang didesain

dengan baik dalam rangkaian tertentu berdasar kepada prinsip-prinsip konstruksi tes.

Stimulus disebut juga dengan item. Sedangkan test psikologi adalah suatu prosedur

standar untuk mengukur secara kuantitatif (skor) maupun kualitatif (evaluasi) satu /

beberapa aspek atribut psikologis dengan menggunakan sample perilaku verbal maupun

non verbal.

Dalam melaksanakan analisis butir soal, para penulis soal dapat menganalisis secara

kualitatif, dalam kaitan dengan isi dan bentuknya, dan kuantitatif dalam kaitan dengan

ciri-ciri statistiknya (Anastasi dan Urbina, 1997: 172) atau prosedur peningkatan secara

judgment dan prosedur peningkatan secara empirik (Popham, 1995: 195). Analisis

kualitatif mencakup pertimbangan validitas isi dan konstruk, sedangkan analisis

kuantitatif mencakup pengukuran kesulitan butir soal dan diskriminasi soal yang

termasuk validitas soal dan reliabilitasnya.

Jadi, ada dua cara yang dapat digunakan dalam penelaahan butir soal yaitu

penelaahan soal secara kualitatif dan kuantitatif. Kedua teknik ini masing-masing

memiliki keunggulan dan kelemahan. Oleh karena itu teknik terbaik adalah



menggunakan keduanya (penggabungan). Kedua cara ini diuraikan secara rinci dalam

jurnal Himpunan Evaluasi edisi nomor 2 Tahun XII, 2008 ini.

Abstrak

Dalam Abstrak

Kartono mengungkapkan bahwa tujuan penelitian untuk mengungkapakan,

1. Level pada faktor banyak butir Anchor, banyaknya kategori butir politomus dan dikotomus,

ukuran sampel dan metode transformasi yang digunakan

2. kombinasi level antar faktor yang mempengaruhi hasil penyetaraan tes campuran 3

PL/GPCM.

Hasil penelitian ini menyatakan bahwa

1. banyaknay butir anchor berpengaruh pada hasil penhyetaraan tes yaitu 40 % pada level

pertama dan 20 %

2. banyaknaya butir politomus pada 2 level yaitu 5 kategori pada level kedua

a. Karakteristik Tes dalam Teori Respon Butir (TRB)

TRB banyak memecahkan permasalahan di dalam desain tes. Ini tentu dicirikan oleh

berbagai hal. Dalam pandangan TRB, butir tes sesungguhnya independen dari pesertaujian, dan peserta ujian independen dari butir tes. Itulah yang dinamakan independensilokal. Lokal di sini diasumsikan sebagai sebuah titik di dalam suatu kontinum parameter

karakteristik peserta ujian, yang berupa interval yang mengandung subpopulasi peserta

ujian yang homogen. Independen dipahami sebagai independensi semua peserta ujiandari butir tes di dalam subpopulasi. Independensi lokal dengan demikian dipahami

sebagai skor komposit suatu butir yang diberikan oleh subpopulasi peserta ujian yang

homogen yang independen (Naga, 1992 dikutip di dalam Widiatmoko, 2005: 76). Ini berarti pula bahwa respon terhadap dua butir tes tidak saling berkorelasi di dalam

subpopulasi homogen (Hulin, Drasgow, & Parsons, 1983: 43). Hambleton, Swaminathan,

& Rogers (1991: 10) menyatakan bahwa apabila karakteristik yang mempengaruhi

performansi tes bersifat konstan, respon yang diberikan oleh peserta ujian terhadap pasangan butir tes secara statistik menjadi independen. Dengan perkataan lain, setelah

mempertimbangkan karakteristik peserta ujian, keberadaan antara respon peserta ujian

dan butir-butir tes yang berbeda menjadi saling bebas. Ini menyiratkan bahwakarakteristik yang ditentukan oleh sebuah model menjadi faktor yang menentukan

bagaimana respon peserta ujian terhadap butir-butir tes. Lord & Novick (1968: 361) dan

McDonald (1999: 255) menyatakan bahwa independensi lokal sebagai keadaan di dalamsekelompok peserta ujian yang semuanya dicirikan dengan nilai yang sama, distribusi



skor butir menjadi saling bebas antara butir satu dan butir lainnya.

Yang kedua adalah invariansi parameter. Invariansi parameter dipahami sebagai sebuah

fungsi dari karakteristik parameter peserta ujian atau butir tes yang tidak akan berubah didalam subpopulasi meskipun subpopulasi tersebut berubah. Ini kemudian dipahami

sebagai karakteristik peserta ujian yang tidak berubah meskpin butir yang dipilihnya

berubah (Hulin, Drasgow, & Parsons, 1983; Naga, 1992 dikutip di dalam Widiatmoko,2005: 76). Bahkan, ini bermakna bahwa parameter-parameter yang menjadi ciri suatu

butir tes tidak bergantung pada distribusi karakteristik peserta ujian dan parameter yang

menjadi ciri peserta ujian tidak bergantung pada perangkat butir tes (Hambleton,Swaminathan, & Rogers, 1991: 18). Oleh karena itu, invariansi merupakan ciri TRB yang

penting juga. Apabila invariansi tersebut tidak ada, butir tes ditengarai menjadi bias dari

nilai parameter sesungguhnya (Wells, Subkovlak, & Serlin, 2002: 77).

Ada 3 Parameter Butir dalam IRTa. Daya Pembeda Butir (soal/item)

yaitu Kemampuan item untuk membedakan subjek yang mempunyai kemampuan tinggi

dan kemampuan rendah.

b. Tingkat Kesukaran Soalyaitu Perbandingan antara jumlah subjek yang menjawab benar pada suatu soal dengan

keseluruhan subjek.Misalnya :

Ada 100 subjek, yang menjawab benar pada satu soal adalah 80 anak maka taraf

kesukaran soal (menurut Pak Pras lebih enak menyebutnya taraf kemudahan soal) : P = B

/ T = 80 / 100 = 0,8 c. Faktor Kebetulan Menjawab Benar/ Faktor Tebakan Kondisi itemdijawab benar bukan oleh kemampuan tetapi oleh faktor tebakan.

c. Faktor Kebetulan Menjawab Benar/ Faktor Tebakan

Kondisi item dijawab benar bukan oleh kemampuan tetapi oleh faktor tebakan.

Yang ketiga adalah unidimensi. Unidimensi didefinisikan sebagai kehadiran komponen

atau faktor yang dominan yang mempengaruhi performansi tes. Komponen atau faktor dominan ini dianggap sebagai karakteristik yang diukur oleh tes (Hambleton,

Swaminathan, & Rogers, 1991: 9-10). Unidimensi juga ditafsirkan sebagai suatu butir

yang mengukur satu ciri pada peserta ujian (Traub, 1983: 58; Naga, 1992: 164). Ini bermakna bahwa probabilitas suatu respon butir adalah sebagai suatu fungsi karakteristik

laten tunggal peserta ujian (Hulin, Drasgow, & Parsons, 1983 dikutip di dalam

Widiatmoko, 2005: 77). Karena setiap karakteristik ditentukan oleh satu keberukuran,

keberukuran itu dapat dimaknai sebagai persyaratan untuk mengukur hanya satu dimensikarakteristik peserta ujian di dalam subpopulasi.

b. Penerapan Model-model IRT

Teori tes modern termauk IRT dibedakan dalam beberapa model. Untuk menentukan

model, kita bisa melihat kepada berapa banyak parameter item yang dilibatkan dalammodel tersebut, model ini termasuk moel dikotomis, yaitu:

1. Model logistik 1 parameter : melibatkan 1 parameter yaitu taraf kesukaran soal.

2. Model logistik 2 parameter Melibatkan 2 parameter, yaitu :

a. Taraf kesukaran soal.



b. Indeks daya beda.

3. Model logistik 3 parameter: melibatkan 3 parameter, yaitu :

a. Taraf kesukaran soal. b. Indeks daya beda.

c. Faktor kebetulan

Ada berbagai campuran model IRT. Dikotomis model termasuk satu-parameter logistik

(1PL),-parameter logistik dua (2PL), dan tiga Parameter logistik (3PL) model. Model

Polytomous termasuk kredit parsial (PC) model (Masters & Wright, 1997), kredit umum parsial (GPC) model (Muraki, 1997), dan respon dinilai (GR) model (Samejima, 1997).

Berikut campuran enam model dipekerjakan: PC + 1PL, 2PL + GPC, 3PL + GPC, 1PL +

GR, 2PL + GR, GR + dan 3PL. Untuk semua enam kombinasi model, model dikotomis

dianggap sebagai kasus khusus model polytomous terkait. untuk kombinasi + GR 1PL,diskriminasi parameter untuk model GR adalah tetap sebesar 1.0.

Hasil dari studi empiris menunjukkan, secara umum, bahwa:

1. Klasifikasi konsistensi dan indeks diperkirakan marjinal akurasi untuk DIF-IRT bedamodel kombinasi tidak berbeda secara substansial.

2. D dan metode P menghasilkan hasil yang sama.3. Bila dibandingkan dengan prosedur non-IRT, prosedur IRT cenderung menghasilkan

diperkirakan lebih besar klasifikasi marjinal konsistensi dan ketepatan indeks.

4. Perkiraan konsistensi bersyarat klasifikasi dan indeks akurasi menunjukkan pola

bergelombang dengan nilai terendah dekat skor dipotong. Meskipun enam kombinasimodel menghasilkan indeks klasifikasi diperkirakan yang mirip satu sama lain, mereka

cenderung berbeda untuk menghasilkan hasil yang lebih saat model tidak sesuai dengan

data yang memadai.

Pengertian tingkat kesukaran dan daya beda dalam teori respon butir berbeda dengan

pengertian tingkat kesukaran dna daya beda dalam teori tes klasik. Untukbutir soal nomor g misalakan bg notasi untuk tingkat kesukaran. Tingkat kesukaran disini adalah tingkat

kemampuan (laten trait), misalkan dikatakan peserta tes dengan tingkat kemampuan bg =

1 mempunyai peluang 0,5 akan menjawab dengan soal nomor g. hal ini berarti, dariseluruh peserta tes dengan tingkat kemampuan bg =, maka 50% diantara mereka akan

menjawab benar soal g tersebut. Secara matematis dituliskan Pg (Bg = 1) = 0,5. Jika ada

butir soal lain, misalnya soal nomor h, dengan Ph (bh=2) = 0,5, maka dikatakan bahwasoal hmemerlukan kemampuan 2 sedangkan soal g hanya memerlukan kemampuan 1

(lihat gambar diatas)

Daya beda dalam teori respon butir, misalnya dinotasikan dengan Ag, adalah kemiringan



KKB jika kemiringan KKB dari butir soal selalu datar, maka butir tersebut kurang efektif

dalam membedakan tingkat kemampuan yang berbeda, dalam hal ini nilai ag kecil.

Sedangkan jika kemiringan KKB dari butir soal selalu tegak, bentuk KKB menyerupaifungsi tangga dan dalam hal ini nilai ag ekstrim besar. Kemiringan KKb yang diharapkan

adalah kemiringan yang moderat seperti gambar diatas (butir 2; a = 1,0) dan dalam hal ini

nilai ag juga moderat. Nilai-nilai daya beda kecil dan besar sangat mempengaruhi bentuk KKB sebagaimana ditunjukkan pada gambar diatas.

Misalnya ada tiga butir soal dengan nomor 1, 2 dan 3 dan ketiganya P1 (b1 = 1,5) = P2

(b2 = 1,5) = P3 (b3 = 1,5). Ini berarti kelompok dengan kemampuan (laten trait) 1,5mempunyai peluang 0,5 akan menjawab dengan benar ketiga soal tersebut misalkan KKB

ketiga butir soal tersebut masing-masing pempunyai kemiringan a1 = o,1 , a2=1,0, dan a3

= 100, KKb dari ke tiga butir soal tersebut disajikan pada gambar 2 diatas.

Untuk KKB daya beda a1 = 0,1, pada gambar dapat dilihat bahwa soal tersebut tidak bisamembedakan tes dengan tingkat kemampuan yang berbeda-beda. Untik kemmapuan Ө

mulai dari 0 sampai tertinggi peluang menjawab hampir sama. Sementara itu soal nomer

3 mempunyai KKB dengan daya beda a3 = 100. Butir soal seperti itu hanya membedakan

kelompok yang mempunyai kemampuan dibawah 1,5 dengan kemampuan diatas 1,5.Untuk soal nomor 2 KKBnya mempunyai daya beda a2 = 1,0 (dianggap moderat) dan

soal seperti inilah yang dianggap baik.

review jurnal disertasi

Documents