Transcript
Page 1: Komparasi Metode Estimasi dalam Pengukuran Pendidikan

KOMPARASI KARAKTERISTIK PESERTA TES TOEFL MELALUI PERBEDAAN

METODE ESTIMASI

OlehWIDIATMOKO

E.: [email protected].: http://mokogeong.multiply.com

Jakarta, Indonesia

Estimasi di dalam Teori Respon ButirManakala seorang pendidik hendak mengkonstruksi alat ukur, khususnya tes yang berdata dikotomi, ia tentu akan memilihnya dalam bentuk pilihan berganda. Lazimnya, ia mendasarkan pada keputusan atau dugaan awal tentang karakteristik peserta ujian itu. Dengan demikian, taraf kesukaran butir tes dan daya pembeda butir tes akan selalu bergantung pada karakteristik peserta ujian (responden) itu. Sebaliknya, karakteristik responden akan bergantung pada karakteristik butir tesnya pada kelompok norma. Keadaan yang demikian itu sejatinya merupakan kelemahan yang dapat ditemui di dalam teori tes klasik (TTK).

Untuk mengatasi kelemahan yang terjadi di dalam TTK, teori respon butir (TRB) menawarkan alternatif penyelesaiannya. Secara umum, TRB menyodorkan tiga syarat, yakni unidimensi, invariansi parameter, dan independensi lokal. Unidimensi dipahami sebagai salah satu ciri butir tes yang hanya mengukur satu karakteristik laten tunggal responden. Biasanya ini dideteksi melalui analisis faktor. Invariansi parameter, syarat yang kedua, merupakan keadaan di mana nilai ciri butir tes tidak berubah (invarian) manakala responden berubah, dan nilai karakteristik responden tidak berubah manakala butir tes berubah. Ini bermakna bahwa ciri butir tes tidak akan berubah manakala dikenakan pada responden yang berbeda, dan ciri responden tidak akan berubah manakala mengerjakan butir tes yang berbeda. Dan, ketiga, yakni independensi lokal

1

Page 2: Komparasi Metode Estimasi dalam Pengukuran Pendidikan

dipahami sebagai titik pada kontinum parameter ciri responden yang berbentuk interval yang terdiri atas subpopulasi responden yang homogen yang independen dari butir tes. Ini biasanya dibuktikan dengan hubungan antara butir tes-responden yang tidak saling berkorelasi. Dengan demikian, manakala ketiga syarat itu dipenuhi, alat ukur yang dikonstruksi akan memenuhi syarat sebagai alat ukur yang baik.

Di dalam implementasinya, alat ukur yang berpijak pada TRB itu akan selalu diuji. Biasanya ia dilakukan melalui pencocokan dengan model yang dipilihnya. Ada banyak sekali model di dalam TRB, salah satu di antara mereka adalah model logistik satu parameter. Model itu dipilih karena secara empirik ia banyak mencirikan keadaan populasi yang sejatinya. Di samping itu, model dengan satu parameter itu hanya memanfaatkan taraf kesukaran butir tes dengan menganggap daya pembeda dan tebakan respon betul adalah sama. Setelah itu, untuk mengetahui karakteristik butir tes, yakni taraf kesukaran butir tes, dan karakteristik responden, yakni ciri laten abilitas responden, diperlukan suatu metode yang mampu mengestimasi keadaan subpopulasi itu.

Memang, ada banyak sekali metode untuk mengestimasi karakteristik butir tes-responden. Salah satu di antara mereka adalah metode Prox. Metode ini digunakan untuk mengestimasi karakteristik butir tes-responden secara simultan. Ini dilakukan dengan mempertimbangkan keadaan responden yang merespon butir tes dan butir tes yang telah dijawab oleh responden. Dengan menggunakan logaritma natural pada probabilitas respon betul dan probabilitas respon salah responden, nilai awal ciri responden dan nilai awal ciri butir tes dapat diketahui. Selanjutnya dengan menggunakan faktor perluasan, ciri butir tes dan ciri responden akan dapat diestimasi secara simultan.

Setelah mengetahui ciri butir tes-responden, kurva karakteristik butir tes dapat diperoleh untuk mencocokan dengan model logistik satu parameter. Dari hasil estimasi, ditemukan bahwa kurva karakteristik itu belum memenuhi

2

Page 3: Komparasi Metode Estimasi dalam Pengukuran Pendidikan

kecocokan. Hal ini disebabkan oleh dugaan adanya keterbatasan jumlah responden dan butir tes.

Untuk memastikan apakah ciri responden yang diestimasi secara simultan itu juga cocok dengan nilai estimasi dengan metode Newton-Raphson (N-R), nilai estimasi ciri butir tes digunakan sebagai pijakan. Ternyata, nilai estimasi ciri responden pun tidak memiliki kecocokan dengan yang dihasilkan dari estimasi dengan menggunakan metode Prox. Perlu diketahui, estimasi dengan metode N-R dilakukan secara marginal dengan menggunakan nilai awal ciri laten responden sebagai pijakan untuk melakukan iterasi selanjutnya. Iterasi itu dilakukan sedemikian rupa sehingga nilai selisih antariterasi itu mendekati atau sama dengan 0,001. Nilai selisih itu sejatinya dijadikan sebagai patokan karena dengan mempertimbangkan konvergensi kurva yang akan dihasilkan. Dengan demikian, meskipun TRB memiliki kelebihan-kelebihan dibandingkan dengan TTK, namun ia juga memiliki beberapa kelemahan. Kelemahan yang dapat ditemukan dari riset itu di mana butir tes sebagai unit analisisnya adalah ketidakcocokan nilai estimasi dengan metode yang berbeda.

Implikasi Hasil EstimasiMengacu pada nilai hasil estimasi dengan menggunakan metode Prox dan metode N-R pada TRB, dapat diketahui bahwa untuk mengkonstruksi alat ukur tes yang berdata dikotomi diperlukan kehati-hatian. Ini bermakna bahwa setelah penyusunan spesifikasi tes hingga pengujian secara internal dan eksternal melalui uji validitas isi oleh pakar dan uji validitas empirik, diperlukan uji persyaratan melalui konsep TRB. Persyaratan itu mencakupi unidimensi, invariansi parameter, dan independensi lokal. Implikasi yang dapat diperoleh setelah persyaratan tersebut dipenuhi adalah bahwa alat ukur tes yang dikonstruksinya telah mampu mengukur keadaan peserta ujian (responden) secara akurat. Hanya saja, akurasi tersebut mengalami perbedaan manakala metode yang digunakan berbeda. Namun, secara umum, pembuktian nilai parameter yang

3

Page 4: Komparasi Metode Estimasi dalam Pengukuran Pendidikan

membentuk kurva karakteristik butir tes dengan model logistik akan dapat dipenuhi.

Pemenuhan tersebut menyiratkan adanya rekomendasi kepada para penyusun alat ukur tes dan bahkan alat ukur nontes untuk tidak mengesampingkan konsep TRB. Konsep itu sejatinya lahir dari perpaduan lebih dari satu disiplin keilmuan yang berbeda. Dengan demikian, pertimbangan kualitatif di dalam konstruksi alat ukur tes dan nontes tidak akan lepas dari pertimbangan kuantitatif dengan pemahaman statistika yang memadai.

4


Top Related