review jurnal disertasi

5
Review jurnal disertasi“ Penyet araan Tes Model Campuran Butir Dikotomus dan Politomus pada tes Hasil Belajar Karya Kartono” PENDAHULUAN Kegi atan menganalisis butir soal merupakan suatu kegiat an yang harus dilakukan guru untu k me ni ngkatk an mutu so al ya ng te la h di tu li s. Ke gi atan in i merupakan proses pengumpulan, peringkasan, dan penggunaan informasi dari jawaban siswa untuk membuat keputusan tentang setiap penilaian (Nitko, 1996: 308). Tujuan  penelaahan adalah untuk mengkaji dan menel aah set iap but ir soal agar diperoleh soal yang bermutu sebelum soal digunakan. Di samping itu, tujuan analisis butir soal  juga untuk membantu meningkatkan tes melalui revisi atau membuang soal yang tidak efektif, serta unt uk menge tahui inf ormasi diagnostik pada si swa apa kah mer eka sudah/belum memahami materi yang telah diajarkan (Aiken, 1994: 63). Soal yang  ber mutu adalah soal yang dapat memberikan informasi setepat-tepatnya sesuai denga n tujuann ya di antaranya dapa t menent ukan peser ta didik mana yang sudah atau  belum menguasai materi yang diajarkan guru. Tes adalah suatu prosedur yang sistematik yang terdiri dari stimulus yang didesain dengan baik dalam rangkaian tert entu berdas ar kepada prinsip- prins ip konstr uksi tes. Stimul us disebut juga dengan item. Sedangkan tes t psi kol ogi adal ah sua tu prosedur standa r untuk mengukur secara kuanti tatif (skor) maupun kualitatif (evaluasi) satu /  beberapa aspek atribut psikologis dengan menggunakan sample perilaku verbal maupun non verbal. Dalam melaksanakan analisis butir soal, para penulis soal dapat menganalisis secara kualitatif, dalam kaitan dengan isi dan bentuknya, dan kuantitatif dalam kaitan dengan ciri-ci ri stati stikn ya (Anas tasi dan Urbin a, 1997: 172) atau prosedur peningkatan secar a  judgment dan prosedur peningkat an sec ara empir ik (Po pha m, 1995: 195). Ana lis is kua li tatif me nca kup per ti mbangan val idit as isi dan konst ruk, sedangka n  analisis kua nti tatif men cakup penguk ura n kesul it an but ir soal dan diskriminasi soal yang termasuk validitas soal dan reliabilitasnya. Jadi, ada dua cara yang dapat digunakan dalam penelaahan butir soal yaitu  penelaahan soal secara kualitatif dan kuantitatif. Kedua teknik ini masing-masing memiliki keunggulan dan kelemahan. Oleh karena itu teknik terbaik adalah

Upload: suwahono-mpd

Post on 10-Apr-2018

220 views

Category:

Documents


0 download

TRANSCRIPT

8/8/2019 Review Jurnal Disertasi

http://slidepdf.com/reader/full/review-jurnal-disertasi 1/5

Review jurnal disertasi“ Penyetaraan Tes Model Campuran Butir Dikotomus dan

Politomus pada tes Hasil Belajar Karya Kartono”

PENDAHULUAN

Kegiatan menganalisis butir soal merupakan suatu kegiatan yang harusdilakukan guru untuk meningkatkan mutu soal yang telah ditulis. Kegiatan ini

merupakan proses pengumpulan, peringkasan, dan penggunaan informasi dari jawaban

siswa untuk membuat keputusan tentang setiap penilaian (Nitko, 1996: 308). Tujuan

 penelaahan adalah untuk mengkaji dan menelaah setiap butir soal agar diperoleh

soal yang bermutu sebelum soal digunakan. Di samping itu, tujuan analisis butir soal

 juga untuk membantu meningkatkan tes melalui revisi atau membuang soal yang tidak 

efektif, serta untuk mengetahui informasi diagnostik pada siswa apakah mereka

sudah/belum memahami materi yang telah diajarkan (Aiken, 1994: 63). Soal yang

  bermutu adalah soal yang dapat memberikan informasi setepat-tepatnya sesuai

dengan tujuannya di antaranya dapat menentukan peserta didik mana yang sudah atau

 belum menguasai materi yang diajarkan guru.

Tes adalah suatu prosedur yang sistematik yang terdiri dari stimulus yang didesain

dengan baik dalam rangkaian tertentu berdasar kepada prinsip-prinsip konstruksi tes.

Stimulus disebut juga dengan item. Sedangkan test psikologi adalah suatu prosedur 

standar untuk mengukur secara kuantitatif (skor) maupun kualitatif (evaluasi) satu /

 beberapa aspek atribut psikologis dengan menggunakan sample perilaku verbal maupun

non verbal.

Dalam melaksanakan analisis butir soal, para penulis soal dapat menganalisis secara

kualitatif, dalam kaitan dengan isi dan bentuknya, dan kuantitatif dalam kaitan dengan

ciri-ciri statistiknya (Anastasi dan Urbina, 1997: 172) atau prosedur peningkatan secara

  judgment dan prosedur peningkatan secara empirik (Popham, 1995: 195). Analisis

kualitatif mencakup pertimbangan validitas isi dan konstruk, sedangkan  analisis

kuantitatif mencakup pengukuran kesulitan butir soal dan diskriminasi soal yang

termasuk validitas soal dan reliabilitasnya.

Jadi, ada dua cara yang dapat digunakan  dalam penelaahan butir soal yaitu

 penelaahan soal secara kualitatif dan kuantitatif. Kedua teknik ini masing-masing

memiliki keunggulan dan kelemahan. Oleh karena itu teknik terbaik adalah

8/8/2019 Review Jurnal Disertasi

http://slidepdf.com/reader/full/review-jurnal-disertasi 2/5

menggunakan  keduanya (penggabungan). Kedua cara ini diuraikan secara rinci dalam

 jurnal Himpunan Evaluasi edisi nomor 2 Tahun XII, 2008 ini.

Abstrak 

Dalam Abstrak 

Kartono mengungkapkan bahwa tujuan penelitian untuk mengungkapakan,

1. Level pada faktor banyak butir Anchor, banyaknya kategori butir politomus dan dikotomus,

ukuran sampel dan metode transformasi yang digunakan

2. kombinasi level antar faktor yang mempengaruhi hasil penyetaraan tes campuran 3

PL/GPCM.

Hasil penelitian ini menyatakan bahwa

1. banyaknay butir anchor berpengaruh pada hasil penhyetaraan tes yaitu 40 % pada level

 pertama dan 20 %

2. banyaknaya butir politomus pada 2 level yaitu 5 kategori pada level kedua

a. Karakteristik Tes dalam Teori Respon Butir (TRB)

TRB banyak memecahkan permasalahan di dalam desain tes. Ini tentu dicirikan oleh

 berbagai hal. Dalam pandangan TRB, butir tes sesungguhnya independen dari pesertaujian, dan peserta ujian independen dari butir tes. Itulah yang dinamakan independensilokal. Lokal di sini diasumsikan sebagai sebuah titik di dalam suatu kontinum parameter 

karakteristik peserta ujian, yang berupa interval yang mengandung subpopulasi peserta

ujian yang homogen. Independen dipahami sebagai independensi semua peserta ujiandari butir tes di dalam subpopulasi. Independensi lokal dengan demikian dipahami

sebagai skor komposit suatu butir yang diberikan oleh subpopulasi peserta ujian yang

homogen yang independen (Naga, 1992 dikutip di dalam Widiatmoko, 2005: 76). Ini berarti pula bahwa respon terhadap dua butir tes tidak saling berkorelasi di dalam

subpopulasi homogen (Hulin, Drasgow, & Parsons, 1983: 43). Hambleton, Swaminathan,

& Rogers (1991: 10) menyatakan bahwa apabila karakteristik yang mempengaruhi

 performansi tes bersifat konstan, respon yang diberikan oleh peserta ujian terhadap pasangan butir tes secara statistik menjadi independen. Dengan perkataan lain, setelah

mempertimbangkan karakteristik peserta ujian, keberadaan antara respon peserta ujian

dan butir-butir tes yang berbeda menjadi saling bebas. Ini menyiratkan bahwakarakteristik yang ditentukan oleh sebuah model menjadi faktor yang menentukan

 bagaimana respon peserta ujian terhadap butir-butir tes. Lord & Novick (1968: 361) dan

McDonald (1999: 255) menyatakan bahwa independensi lokal sebagai keadaan di dalamsekelompok peserta ujian yang semuanya dicirikan dengan nilai yang sama, distribusi

8/8/2019 Review Jurnal Disertasi

http://slidepdf.com/reader/full/review-jurnal-disertasi 3/5

skor butir menjadi saling bebas antara butir satu dan butir lainnya.

Yang kedua adalah invariansi parameter. Invariansi parameter dipahami sebagai sebuah

fungsi dari karakteristik parameter peserta ujian atau butir tes yang tidak akan berubah didalam subpopulasi meskipun subpopulasi tersebut berubah. Ini kemudian dipahami

sebagai karakteristik peserta ujian yang tidak berubah meskpin butir yang dipilihnya

 berubah (Hulin, Drasgow, & Parsons, 1983; Naga, 1992 dikutip di dalam Widiatmoko,2005: 76). Bahkan, ini bermakna bahwa parameter-parameter yang menjadi ciri suatu

 butir tes tidak bergantung pada distribusi karakteristik peserta ujian dan parameter yang

menjadi ciri peserta ujian tidak bergantung pada perangkat butir tes (Hambleton,Swaminathan, & Rogers, 1991: 18). Oleh karena itu, invariansi merupakan ciri TRB yang

 penting juga. Apabila invariansi tersebut tidak ada, butir tes ditengarai menjadi bias dari

nilai parameter sesungguhnya (Wells, Subkovlak, & Serlin, 2002: 77).

Ada 3 Parameter Butir dalam IRTa. Daya Pembeda Butir (soal/item)

yaitu Kemampuan item untuk membedakan subjek yang mempunyai kemampuan tinggi

dan kemampuan rendah.

 b. Tingkat Kesukaran Soalyaitu Perbandingan antara jumlah subjek yang menjawab benar pada suatu soal dengan

keseluruhan subjek.Misalnya :

Ada 100 subjek, yang menjawab benar pada satu soal adalah 80 anak maka taraf 

kesukaran soal (menurut Pak Pras lebih enak menyebutnya taraf kemudahan soal) : P = B

/ T = 80 / 100 = 0,8 c. Faktor Kebetulan Menjawab Benar/ Faktor Tebakan Kondisi itemdijawab benar bukan oleh kemampuan tetapi oleh faktor tebakan.

c. Faktor Kebetulan Menjawab Benar/ Faktor Tebakan

Kondisi item dijawab benar bukan oleh kemampuan tetapi oleh faktor tebakan.

Yang ketiga adalah unidimensi. Unidimensi didefinisikan sebagai kehadiran komponen

atau faktor yang dominan yang mempengaruhi performansi tes. Komponen atau faktor dominan ini dianggap sebagai karakteristik yang diukur oleh tes (Hambleton,

Swaminathan, & Rogers, 1991: 9-10). Unidimensi juga ditafsirkan sebagai suatu butir 

yang mengukur satu ciri pada peserta ujian (Traub, 1983: 58; Naga, 1992: 164). Ini bermakna bahwa probabilitas suatu respon butir adalah sebagai suatu fungsi karakteristik 

laten tunggal peserta ujian (Hulin, Drasgow, & Parsons, 1983 dikutip di dalam

Widiatmoko, 2005: 77). Karena setiap karakteristik ditentukan oleh satu keberukuran,

keberukuran itu dapat dimaknai sebagai persyaratan untuk mengukur hanya satu dimensikarakteristik peserta ujian di dalam subpopulasi.

 b. Penerapan Model-model IRT

Teori tes modern termauk IRT dibedakan dalam beberapa model. Untuk menentukan

model, kita bisa melihat kepada berapa banyak parameter item yang dilibatkan dalammodel tersebut, model ini termasuk moel dikotomis, yaitu:

1. Model logistik 1 parameter : melibatkan 1 parameter yaitu taraf kesukaran soal.

2. Model logistik 2 parameter Melibatkan 2 parameter, yaitu :

a. Taraf kesukaran soal.

8/8/2019 Review Jurnal Disertasi

http://slidepdf.com/reader/full/review-jurnal-disertasi 4/5

 b. Indeks daya beda.

3. Model logistik 3 parameter: melibatkan 3 parameter, yaitu :

a. Taraf kesukaran soal. b. Indeks daya beda.

c. Faktor kebetulan

Ada berbagai campuran model IRT. Dikotomis model termasuk satu-parameter logistik 

(1PL),-parameter logistik dua (2PL), dan tiga Parameter logistik (3PL) model. Model

Polytomous termasuk kredit parsial (PC) model (Masters & Wright, 1997), kredit umum parsial (GPC) model (Muraki, 1997), dan respon dinilai (GR) model (Samejima, 1997).

Berikut campuran enam model dipekerjakan: PC + 1PL, 2PL + GPC, 3PL + GPC, 1PL +

GR, 2PL + GR, GR + dan 3PL. Untuk semua enam kombinasi model, model dikotomis

dianggap sebagai kasus khusus model polytomous terkait. untuk kombinasi + GR 1PL,diskriminasi parameter untuk model GR adalah tetap sebesar 1.0.

Hasil dari studi empiris menunjukkan, secara umum, bahwa:

1. Klasifikasi konsistensi dan indeks diperkirakan marjinal akurasi untuk DIF-IRT bedamodel kombinasi tidak berbeda secara substansial.

2. D dan metode P menghasilkan hasil yang sama.3. Bila dibandingkan dengan prosedur non-IRT, prosedur IRT cenderung menghasilkan

diperkirakan lebih besar klasifikasi marjinal konsistensi dan ketepatan indeks.

4. Perkiraan konsistensi bersyarat klasifikasi dan indeks akurasi menunjukkan pola

 bergelombang dengan nilai terendah dekat skor dipotong. Meskipun enam kombinasimodel menghasilkan indeks klasifikasi diperkirakan yang mirip satu sama lain, mereka

cenderung berbeda untuk menghasilkan hasil yang lebih saat model tidak sesuai dengan

data yang memadai.

Pengertian tingkat kesukaran dan daya beda dalam teori respon butir berbeda dengan

 pengertian tingkat kesukaran dna daya beda dalam teori tes klasik. Untukbutir soal nomor g misalakan bg notasi untuk tingkat kesukaran. Tingkat kesukaran disini adalah tingkat

kemampuan (laten trait), misalkan dikatakan peserta tes dengan tingkat kemampuan bg =

1 mempunyai peluang 0,5 akan menjawab dengan soal nomor g. hal ini berarti, dariseluruh peserta tes dengan tingkat kemampuan bg =, maka 50% diantara mereka akan

menjawab benar soal g tersebut. Secara matematis dituliskan Pg (Bg = 1) = 0,5. Jika ada

 butir soal lain, misalnya soal nomor h, dengan Ph (bh=2) = 0,5, maka dikatakan bahwasoal hmemerlukan kemampuan 2 sedangkan soal g hanya memerlukan kemampuan 1

(lihat gambar diatas)

Daya beda dalam teori respon butir, misalnya dinotasikan dengan Ag, adalah kemiringan

8/8/2019 Review Jurnal Disertasi

http://slidepdf.com/reader/full/review-jurnal-disertasi 5/5

KKB jika kemiringan KKB dari butir soal selalu datar, maka butir tersebut kurang efektif 

dalam membedakan tingkat kemampuan yang berbeda, dalam hal ini nilai ag kecil.

Sedangkan jika kemiringan KKB dari butir soal selalu tegak, bentuk KKB menyerupaifungsi tangga dan dalam hal ini nilai ag ekstrim besar. Kemiringan KKb yang diharapkan

adalah kemiringan yang moderat seperti gambar diatas (butir 2; a = 1,0) dan dalam hal ini

nilai ag juga moderat. Nilai-nilai daya beda kecil dan besar sangat mempengaruhi bentuk KKB sebagaimana ditunjukkan pada gambar diatas.

Misalnya ada tiga butir soal dengan nomor 1, 2 dan 3 dan ketiganya P1 (b1 = 1,5) = P2

(b2 = 1,5) = P3 (b3 = 1,5). Ini berarti kelompok dengan kemampuan (laten trait) 1,5mempunyai peluang 0,5 akan menjawab dengan benar ketiga soal tersebut misalkan KKB

ketiga butir soal tersebut masing-masing pempunyai kemiringan a1 = o,1 , a2=1,0, dan a3

= 100, KKb dari ke tiga butir soal tersebut disajikan pada gambar 2 diatas.

Untuk KKB daya beda a1 = 0,1, pada gambar dapat dilihat bahwa soal tersebut tidak bisamembedakan tes dengan tingkat kemampuan yang berbeda-beda. Untik kemmapuan Ө

mulai dari 0 sampai tertinggi peluang menjawab hampir sama. Sementara itu soal nomer 

3 mempunyai KKB dengan daya beda a3 = 100. Butir soal seperti itu hanya membedakan

kelompok yang mempunyai kemampuan dibawah 1,5 dengan kemampuan diatas 1,5.Untuk soal nomor 2 KKBnya mempunyai daya beda a2 = 1,0 (dianggap moderat) dan

soal seperti inilah yang dianggap baik.