perencanaan dan pengembangan pembelajaran …€¦ · perencanaan dan pengembangan pembelajaran...
TRANSCRIPT
1
PERENCANAAN DAN PENGEMBANGAN PEMBELAJARAN
“MENGEMBANGKAN TES BERDASARKAN KRITERIA”
Dosen Pengampu:
MAHARANI IZZATIN, M.Pd
Disusun Oleh:
1. SULISTYASNINGSIH
2. HERIANSYAH
3. PUTRIYANTI
4. MUHAIMINA SA’ADAH HELVY EFFENDI
5. NURUL AKSAR
(1640604023)
(1640604035)
(1640604037)
(1640604055)
(15601040004)
JURUSAN PENDIDIKAN MATEMATIKA
FAKULTAS KEGURUAN DAN ILMU PENDIDIKAN
UNIVERSITAS BORNEO TARAKAN
2018
i
KATA PENGANTAR
Puji syukur kehadirat Tuhan Yang Maha Kuasa atas segala limpahan Rahmat,
Inayah, Taufik dan Hinayahnya sehingga kami dapat menyelesaikan penyusunan
makalah ini dalam bentuk maupun isinya yang sangat sederhana. Semoga makalah ini
dapat dipergunakan sebagai salah satu acuan, petunjuk maupun pedoman bagi
pembaca dalam memahami maksud dari Mengembangkan Tes Berdasarkan Kriteria.
Tak lupa kami ucapkan terima kasih yang sebanyak-banyaknya kepada semua pihak
yang terlibat dalam penyusunan makalah Perencanaan dan Pengembangan
Pembelajaran:
1. Kepada Ibu Maharani Izzatin, M.Pd selaku dosen pengampu mata kuliah.
2. Orang tua kami yang telah membantu dalam hal materiil sehingga makalah ini
dapat terselesaikan.
3. Teman-teman yang saling membantu dalam menyelesaikan penyusunan makalah
ini.
Harapan kami semoga makalah ini membantu menambah pengetahuan dan
pengalaman bagi para pembaca. Makalah ini kami akui masih banyak kekurangan
karena pengalaman yang kami miliki sangat kurang. Oleh kerena itu kami harapkan
kepada para pembaca untuk memberikan masukan-masukan yang bersifat
membangun untuk kesempurnaan makalah ini.
Tarakan, Maret 2018
Penyusun
ii
DAFTAR ISI
KATA PENGANTAR ................................................................................................................................ i
DAFTAR ISI ............................................................................................................................................. ii
1. 1 Latar Belakang .......................................................................................................................... 1
1. 2 Rumusan Masalah ..................................................................................................................... 2
1. 3 Tujuan ........................................................................................................................................ 2
BAB II PEMBAHASAN ........................................................................................................................... 1
2.1 Konsep Tes Berdasarkan Kriteria ................................................................................................. 1
2.2 Tiga Jenis Tes Berdasarkan Kriteria (Criterion Referenced Test) dan
Penggunaannya ..................................................................................................................................... 1
2.3 Merancang Tes .......................................................................................................................... 5
2.4 Menentukan Tingkat Penguasaan............................................................................................ 5
2.6 Mengurutkan Item Tes ............................................................................................................. 8
2.7 Evaluasi Tes dan Item Tes ........................................................................................................ 9
2.8 Pengembangkan Instrumen Untuk Mengukur Kinerja, Hasil dan Perilaku ...................... 10
2.9 Tes Berdasarkan Kriteria dan Tes Beracuan Norma ........................................................... 15
2.10 Contoh Penerapan Dalam Pengembangan Tes Berdasarkan Kriteria................................ 16
BAB III PENUTUP ................................................................................................................................. 18
3.1 Kesimpulan .............................................................................................................................. 18
3.2 Saran ........................................................................................................................................ 18
DAFTAR PUSTAKA .............................................................................................................................. 19
1
BAB I
PENDAHULUAN
1. 1 Latar Belakang
Dalam beberapa tahun terakhir, tes di kelas telah berperan sangat berbeda.
Beberapa perubahan ini dapat dikaitkan dengan dampak dari tujuan perilaku.
Karena banyaknya penekanan pada perilaku eksplisit bahwa siswa harus
menunjukkan, sehingga memperjelas bahwa sistem evaluasi yang baik adalah
sistem evaluasi yang mengukur perilaku – perilaku tertentu. Tes yang dirancang
untuk mengukur seperangkat tujuan eksplisit disebut tes berdasarkan kriteria
(criterion referenced test).
Selama ini tes merupakan alat ukur yang sering digunakan untuk
mengukur keberhasilan siswa atau pembelajar dalam rangka mencapai
kompetensi. Dalam kasus tertentu sering kali hasil tes digunakan sebagai satu-
satunya kriteria keberhasilan. Suatu tes yang telah tersusun tergolong kepada tes
yang baik. Hendaklah tes itu dinilai terlebih dahulu. Sederetan tes yang telah
disusun, siap digunakan alat pengukur hasil belajar siswa atau pelajar. Tes yang
telah disusun tersebut telah memenuhi kriteria-kriteria yang ditetapkan atau tes
yang telah memiliki kualitas tinggi, sehingga menjadi alat penilaian yang tepat
dan akurat. Hasil dari tes acuan berdasarkan kriteria yang memberikan indikasi
instruktur seberapa baik pelajar mampu mencapai setiap tujuan pembelajaran, dan
mengindikasikan komponen mana dari pembelajaran yang bisa berjalan dengan
baik, dan komponen mana yang perlu direvisi. Selain itu juga, tes berdasarkan
kriteria memungkinkan pelajar untuk mereflesikan diri untuk menilai hasil kerja
mereka sendiri.
Seringkali dalam proses belajar mengajar, aspek evaluasi hasil belajar ini
diabaikan. Artinya, guru atau instruktur terlalu memperhatikan saat yang
bersangkutan memberikan pelajaran saja. Perkuliahan atau pelajaran memang
berjalan baik, praktikum berjalan rapi, namun saat membuat soal ujian atau soal
praktikum, guru sudah tidak lagi melihat kriteria yang pernah dibuatnya.
2
Akibatnya, soal ujian yang dibuat sangat sulit untuk dikerjakan oleh siswa
sehingga proses penilaiaan pun tidak maksimal. Artinya guru membuat soal ujian
menjadi seadanya atau seingatnya saja, tanpa harus memenuhi kriteria pembuatan
soal ujian yang baik dan benar. Misalnya apakah soal ujian tersebut sudah sesuai
dengan kriteria juga memperhatikan aspek kognitif, afektif dan psikomotoriknya.
1. 2 Rumusan Masalah
1. Apa saja jenis tes berdasarkan kriteria?
2. Bagaimana cara merancang tes?
3. Bagaimana cara menentukan tingkat penguasaan siswa?
4. Bagaimana cara menulis tes item?
5. Bagaimana cara mengurutkan item tes?
6. Bagaimana cara melakukan evaluasi tes dan item tes?
7. Bagaimana cara mengembangkan instrumen untuk mengukur kinerja, hasil
dan perilaku?
8. Apa perbedaan antara tes berdasarkan kriteria dan tes beracuan norma?
9. Apa saja contoh penerapan dalam pengembangan tes berdasarkan kriteria?
1. 3 Tujuan
1. Untuk mengetahui jenis tes berdasarkan kriteria
2. Untuk mengetahui cara merancang tes
3. Untuk mengetahui cara menentukan tingkat penguasaan siswa
4. Untuk mengetahui cara menulis tes item
5. Untuk mengetahui cara mengurutkan item tes
6. Untuk mengetahui cara melakukan evaluasi tes dan item tes
7. Untuk mengetahui cara mengembangkan instrumen untuk mengukur kinerja,
hasil dan perilaku
8. Untuk mengetahui perbedaan antara tes berdasarkan kriteria dan tes beracuan
norma
9. Untuk mengetahui contoh penerapan dalam pengembangan tes berdasarkan
kriteria
1
BAB II
PEMBAHASAN
2.1 Konsep Tes Berdasarkan Kriteria
Ada dua pemaknaan istilah kriteria (criterion) yang digunakan ketika mengacu
pada soal tes berdasarkan kriteria (criterion referenced test). Pertama, mengacu
pada hubungan antara tujuan kinerja dan soal tes. Jika siswa menunjukkan
perilaku yang memadai seperti yang dinyatakan dalam tujuan, maka mereka telah
mencapai kriteria pada tujuan itu. Kedua, istilah kriteria (criterion) berkaitan
dengan spesifikasi kinerja yang diperlukan untuk penguasaan, mencakup tolok
ukur seperti “siswa akan menjawab semua soal dengan benar", dan "siswa akan
membuat potongan dengan akurasi 5 derajat”.
Jenis spesifikasi kriteria dapat dibentuk dari satu soal tes tertulis untuk satu
tujuan perilaku. Beberapa soal tes tertulis untuk satu tujuan, atau beberapa soal tes
untuk banyak tujuan. Kejelasan dalam menetapkan tujuan dan kriteria untuk
mengukur kinerja diperlukan sebagai panduan untuk konstruksi tes yang
memadai.
2.2 Tiga Jenis Tes Berdasarkan Kriteria (Criterion Referenced Test) dan
Penggunaannya
Tes acuan patokan terdiri atas soal-soal yang secara langsung mengukur istilah
patokan yang dideskripsikan dalam suatu perangkap tujuan khusus. Istilah
patokan (criterion) dipergunakan karena soal-soal tes merupakan rambu-rambu
untuk menentukan kelayakan penampilan siswa dalam tujuan, keberhasilan siswa
dalam tes ini menentukan apakah siswa telah mencapai tujuan khusus yang telah
ditentukan atau belum, tes acuan patokan (criterion-referenced test) disebut juga
tes acuan tujuan (objective-referenced test).
2
Bagi seorang perancang pembelajaran harus mengembangkan butir tes
acuan patokan, karena hasil tes pengukuran tersebut berguna untuk: (1)
mendiagnosis dan menempatkannya dalam kurikulum; (2) menceking hasil
belajar dan menemukan kesalahan pengertian, sehingga dapat diberikan
pembelajaran remedial sebelum pembelajaran dilanjutkan; (3) menjadi dokumen
kemajuan belajar.
Mengembangkan butir-butir tes acuan patokan, Dick and Carrey (1985)
dalam Amiruddin (2016: 42-43) merekomendasikan tiga macam tes acuan
patokan, yaitu (1) Pretest merupakan tes acuan patokan untuk mengukur
keterampilan sebagaimana adanya pada permulaan pembelajaran, (2) embedded
test, (3) post test
1. Pretest
Menurut Dick and Carrey (1985) dalam Amiruddin (2016: 43) Pretes
merupakan tes berdasarkan kriteria yang berguna bagi keperluan tujuan yang
telah dirancang sehingga diketahui sejauh mana pengetahuan anak didik
terhadap semua keterampilan yang berada di atas batas, yakni keterampilan
prasyarat. Maksud dari pretes ini bukanlah untuk menentukan nilai akhir
(perolehan belajar) tetapi lebih mengenal profil anak didik berkenaan analisis
pembelajaran. Pretest dapat terdiri dari soal yang mengukur keterampilan
prasyarat dan soal yang menguji keterampilan yang akan diajarkan dalam
pembelajaran. Soal kemampuan awal untuk pretest didasarkan pada tujuan
untuk siswa yang keterampilannya di bawah standar pada setiap grafik
analisis pembelajaran.
Pretest juga mengukur keterampilan – keterampilan yang akan diajarkan
dalam pembelajaran. Biasanya termasuk satu atau lebih soal untuk setiap
keterampilan yang diidentifikasi dalam analisis pembelajaran, termasuk
tujuan pembelajaran.
2. Embedded Tests
Tes sisipan (embedded Tests) merupakan tes berdasarkan kriteria yang
melayani dua fungsi penting, yaitu (1) mengetes setelah satu atau dua tujuan
3
pembelajaran diajarkan, sebelum pasca-tes, (2) Untuk mengetes kemajuan
anak didik, sehingga dapat dilakukan perbaikan (remedial) yang dibutuhkan
sebelum pasca-tes yang lebih formal, (Dick and Carrey (1985) dalam
Amiruddin (2016: 43). Soal embedded tests seperti soal praktek tanpa umpan
balik. Soal ini hanya untuk kepentingan guru dalam menjawab pertanyaan
"Apakah siswa tahu bagaimana melakukan keterampilan ini segera setelah
itu diajarkan?" Jika soal embedded tests digunakan dengan informasi verbal,
akan menuntut siswa baik untuk mengingat informasi atau merujuk kembali
ke instruksi untuk menjawab pertanyaan. Masalahnya adalah bahwa guru
tidak tahu jika siswa hanya menebak jawabannya atau siswa memang ingat.
Soal embedded tests biasanya tidak digunakan untuk keterampilan
psikomotor, tetapi mungkin penting dalam beberapa jenis pembelajaran, agar
siswa berhenti di satu atau lebih point sehingga guru dapat memastikan
bahwa siswa mengikuti prosedur dengan benar. Hal ini berlaku khususnya
untuk setiap situasi yang berpotensi merugikan. Soal embedded tests akan
dibahas secara lebih rinci sebagai bagian dari strategi pembelajaran dan
evaluasi formatif.
3. Posttest
Pasca-tes atau postes; merupakan tes acuan patokan yang mencakup
seluruh tujuan pembelajaran yang mencerminkan tingkat perolehan belajar,
sehingga dengan demikian dapat diidentifikasi bagian-bagian mana di antara
tujuan pembelajaran yang belum tercapai, (Dick and Carrey (1985) dalam
Amiruddin (2016: 43).
Misalnya diterapkan pada mata kuliah perencanaan pengajaran, maka
untuk melaksanakan test entry behavioral dilaksanakan bersama-sama dengan
pretes, mengapa? Hal ini didasarkan pada dua alternatif, yaitu (1) kedua tes
tersebut sejauh mana keterampilan yang dimiliki si pembelajar sebelum
pembelajaran dimulai, sehingga bagi perancang dapat menentukan Star awal
pembelajarannya; (2) jam yang tersedia menurut kurikulum sangat terbatas
4
mengingat jumlah sksnya hanya 3, sehingga jika dilakukan secara terpisah
dianggap merugikan jam pembelajaran.
Untuk keperluan pascates atau post test mata kuliah perencanaan
pengajaran yang dirancang dilakukan tiga kali pascatest, mengapa? Hal ini
disebabkan oleh mata kuliah permcanaan pembelajaran mempunyai pascates
30 soal. Sebagian besar tes tersebut adalah informasi verbal, sehingga si
belajar (mahasiswa) harus mengingat sejumlah konsep untuk keperluan
pensintesian jawaban, dalam hal ini apabila pascates dilakukan satu kali
diperhitungkan waktu yang tersedia (100 menit) tidak cukup. Mengapa bentuk
soal yang dibuat untuk keperluan pascates berbentuk esay? Hal ini sesuai
dengan mata kuliah perencanaan pembelajaran yang telah ditentukan pada
kurikulum, yaitu menganalisis, sehingga soal yang cocok untuk keperluan
menganalisis adalah soal dengan bentuk esay. Untuk mempelajari masing-
masing pokok bahasan mata kuliah Perencanaan Pengajaran dapat dilakukan
secara terpisah tanpa tergantung pada pokok bahasan yang lain, sehingga
pascates dapat dilakukan 3 (tiga) kali, bahkan lebih baik jika dilakukan tiap
satu pokok bahasan selesai diajarkan jika waktu yang tersedia pada kurikulum
memungkinkan.
Posttest harus menilai semua tujuan, dan terutama fokus pada tujuan
akhir. Sama seperti pretest, posttest mungkin cukup lama jika mengukur
semua keterampilan. Namun, tujuan dari posttest adalah untuk membantu
guru mengidentifikasi kompenen pembelajaran yang tidak bekerja. Jika
seorang siswa gagal untuk melakukan tujuan akhir, guru harus mampu
mengidentifikasi di bagian mana dalam proses pembelajaran siswa mulai
gagal untuk memahami pelajaran. Dengan memilah – milah soal pada
keterampilan pada posttest .
Jenis Tes Tujuan yang diuji
Pretest Kemampuan awal ( keterampilan prasyarat) dan
tujuan pembelajaran yang terpilih
5
Embedded Test Tujuan pembelajaran yang terpilih
Posttest Semua tujuan pembelajaran
2.3 Merancang Tes
Guru menulis satu atau lebih soal tes untuk mewakili masing – masing tujuan
perilaku. Faktor penting adalah bahwa ada pertanyaan pada tes yang
berhubungan langsung ke masing – masing tujuan kinerja. Tujuan dalam domain
keterampilan intelektual umumnya memerlukan paper and pencil test, atau soal
yang membutuhkan produk atau kinerja tertentu. Hal ini relatif mudah untuk
menentukan pencapaian tujuan keterampilan intelektual. Pada tingkat yang lebih
tinggi keterampilan intelektual, lebih sulit untuk dinilai. Misal, jika tujuan
memerlukan siswar untuk menciptakan solusi unik atau produk, perlu untuk
menetapkan seperangkat kriteria yang dapat dikonversi ke daftar atau rating
skala yang dapat digunakan untuk menilai produk siswa.
Penilaian dalam domain sikap juga sulit. Tujuan afektif umumnya berkaitan
dengan sikap atau preferensi pembelajar. Biasanya tidak ada cara langsung untuk
mengukur sikap siswa, soal untuk tujuan sikap umumnya memerlukan bahwa
siswa menyatakan pilihan mereka atau guru mengamati perilaku siswa dan
menyimpulkan sikap mereka.
Soal untuk tujuan dalam domain psikomotorik tidak sama dengan informasi
verbal atau keterampilan intelektual. Biasanya siswa diminta untuk melakukan
urutan langkah – langkah yang secara kolektif merupakan tujuan pembelajaran.
Oleh karena itu, tes sering terdiri dari daftar yang digunakan guru untuk
menunjukkan apakah setiap langkah telah dilaksanakan dengan baik. Daftar
tersebut dapat dikembangkan langsung dari keterampilan yang diidentifikasi
dalam analisis pembelajaran.
2.4 Menentukan Tingkat Penguasaan
Untuk setiap tujuan perilaku harus ada tingkatan kriteria yang terspesifikasi,
yang menunjukkan seberapa baik siswa harus melakukan keterampilan yang
dijelaskan dalam tujuan pada soal tes yang yang diberikan. Pada dasarnya,
6
kriteria imengindikasikan tingkat penguasaan yang diperlukan siswa. Konsep
tingkat penguasaan. Jika guru ingin memastikan bahwa siswa "benar – benar
tahu" keterampilan sebelum menuju ke unit pembelajaran berikutnya, maka
siswa harus diberikan kesempatan untuk melakukan keterampilan sehingga
hampir tidak mungkin untuk hasil benar berasal dari kebetulan semata. Ketika
soal tes pilihan ganda yang digunakan, maka lebih berpeluang bahwa setiap
jawaban yang benar untuk satu soal bisa karena kebetulan. Lebih mudah untuk
meyakinkan orang lain bahwa kinerja bukan hanya masalah kesempatan. Namun,
tingkat kinerja yang tinggi tidak tidak berarti tingkat penguasaan juga tinggi.
2.5 Menulis Tes Item
Jenis pembelajaran yang melibatkan tujuan, tes tulis yang sesuai harus
diterapkan pada pengembangan tes berdasarkan kriteria (criterion referenced
test). Ada beberapa hal yang guru harus ingat saat menulis soal tes berdasarkan
kriteria (criterion referenced test). Soal harus sesuai dengan perilaku dan kondisi
yang ditentukan dalam tujuan, dan soal harus memberi kesempatan kepada siswa
untuk memenuhi kriteria yang diperlukan untuk menunjukkan penguasaan
tujuan.
Sangat penting bahwa soal tes mengukur perilaku yang ada dalam tujuan.
Sebagai contoh, jika tujuan menunjukkan bahwa siswa dapat mencocokkan
deskripsi konsep tertentu dengan label tertentu, maka soal tes harus mencakup
deskripsi konsep dan satu set label, dimana siswa akan diminta untuk
mencocokkan. Soal tes harus memperhitungkan kondisi di mana keterampilan
yang akan dilakukan. Kondisi yang diharapkan dari kinerja termasuk dalam
tujuan kinerja berfungsi sebagai panduan untuk penulis soal uji.
Jenis perilaku tertentu dapat diuji dalam beberapa cara berbeda. Namun,
beberapa soal tes dapat menilai perilaku tertentu lebih baik daripada yang lain.
Sebagai contoh, jika penting bagi siswa untuk mengingat fakta, meminta mereka
untuk menyatakan lebih baik daripada meminta reaksi terhadap pertanyaan
pilihan ganda. Menggunakan tujuan sebagai panduan, pilih jenis soal tes yang
memberikan siswa kesempatan terbaik untuk menunjukkan kinerja yang
7
ditentukan dalam tujuan. Dalam menggunakan soal tes pilihan ganda, misalnya
sering sulit untuk memikirkan soal sedang yang tidak rumit. Multiple choise
test, tes pilihan ganda merupakan tes objektif dimana masing-masing tes
disediakan lebih dari kemungkinan jawaban, dan hanya satu dari pilihan-pilihan
tersebut yang benar atau yang paling benar (Asrul, dkk. 2014: 46). Kelemahan
lain dari jenis ini adalah siswa dapat menggunakan beberapa isyarat dalam soal
untuk menebak jawaban yang benar. Berikut ini beberapa jenis soal tes tulis
Tipe Perilaku
Berdasarkan Tujuan
pembelajaran E
sai
Men
gis
i T
itik
-tit
ik
Mel
engkap
i
Pil
ihan
Gan
da
Men
coco
kan
Pro
duk
Kin
erja
Lan
gsu
ng
Menyatakan x x x
Mengidentifikasi x x x x
Mendiskusikan x x
Mendefinisikan x x x
Memilih x x
Membedakan x x
Memecahkan x x x x x
Mengembangkan x x x
Menempatkan x x x x x
Membangun x x x x x
Menghasilakan x x x x
Mengoperasikan x
Memilih (sikap) x x x
Untuk memilih jenis terbaik dari soal yang sesuai, pertimbangkan seperti
faktor waktu sebagai respon yang dibutuhkan oleh siswa, waktu yang dibutuhkan
untuk menganalisa jawaban, lingkungan pengujian, dan kemungkinan menebak
jawaban yang benar.
8
Kosakata yang digunakan dalam petunjuk untuk menyelesaikan pertanyaan
dan pertanyaan itu sendiri harus sesuai bagi siswa yang dimaksudkan. Item tes
sebaiknya tidak ditulis di tingkat kosakata dari instruktur kecuali tingkat yang
sama dengan yang diharapkan bagi peserta didik sasaran. Siswa tidak boleh
melewatkan pertanyaan karena istilah yang tidak familiar. Jika definisi tertentu
merupakan prasyarat untuk melakukan keterampilan, maka definisi tersebut
harus dimasukkan dalam instruksi. Penghilangan istilah dan definisi yang
diperlukan adalah kesalahan umum yang dibuat oleh banyak instruktur.
Pengaturan soal adalah pertimbangan penting lainnya. Soal yang dapat dibuat
tidak terlalu sulit dengan menempatkan tujuan kinerja yang diinginkan dalam
pengaturan yang tidak biasa. Ketika hal ini dilakukan, guru tidak hanya menguji
perilaku yang diinginkan, tetapi juga uji tambahan, perilaku yang tidak terkait.
Meskipun ini adalah praktek yang umum, itu adalah penulisan yang tidak biasa.
Semakin asing contoh, jenis pertanyaan, format respon dan prosedur pengujian,
menjadikan tes lebih sulit diselesaikan.
2.6 Mengurutkan Item Tes
Tidak ada aturan baku yang membimbing urutan penempatan soal pada tes
keterampilan intelektual atau informasi verbal, tetapi ada saran yang dapat
membimbing penempatan. Keputusan akhir biasanya didasarkan pada situasi
tertentu dan pengujian kinerja yang akan diuji.
Metode tradisional pengurutan soal pada tes adalah untuk mengelompokkan soal
berdasarkan format soal. Menggunakan strategi ini, penyelesaian soal – soal
ditempatkan bersama soal pilihan ganda, soal essay dan sebagainya. Dalam setiap
kelompok pertanyaan, konten dapat berbeda-beda diisesuaikan dengan tujuan.
Hasil metode ini muncul dalam tes yang terorganisasi dengan baik dan sedikit
petunjuk. Meskipun menarik, strategi format ini memiliki cacat, guru yang harus
menganalisa penguasaan siswa terhadap tujuan yang diukur. Setelah mencetak
setiap soal dan sebelum menentukan penguasaan siswa terhadap tujuan, data
harus disusun kembali untuk dianalisis. Ini adalah langkah yang sangat memakan
waktu.
Sebuah strategi pengurutan yang baik untuk guru , membangun dan untuk
menganalisis tanggapan dalam tujuan, akan mengelompokkan item untuk satu
tujuan bersama, terlepas dari format soal. Pertanyaan esai biasanya terletak pada
9
akhir tes untuk membantu peserta didik dalam mengelola waktu mereka selama
tes. Sebuah tes yang diselenggarakan dengan cara ini jauh lebih fungsional untuk
siswa dan guru. Hal ini memungkinkan siswa untuk berkonsentrasi pada satu
bidang informasi dan keterampilan pada satu waktu, dan memungkinkan guru
untuk menganalisis kinerja individu dan kelompok berdasarkan tujuan dengan
pengurutan.
2.7 Evaluasi Tes dan Item Tes
Petunjuk tes dan butir – butir tes objektif sebaiknya menjalani uji coba evaluasi
formatif sebelum digunakan untuk menilai hasil kerja siswa. Sebuah butir tes
mungkin terlihat sangat jelas bagi orang yang menulisnya tetapi membingungkan
bagi orang yang menjawabnya. Banyak hal yang menjadi salah dengan adanya
sebuah tes. Agar tidak terjadi kesalahan pada instrumen tes, beberapa hal yang
harus guru pastikan dalam menyusun tes dan butir tes, antara lain :
1. Petunjuk arah yang jelas, sederhana, dan mudah diikuti
2. Setiap tes jelas dan disampaikan kepada siswa yang dimaksudkan untuk
informasi atau rangsangan yang diinginkan.
3. Kondisi di mana tanggapan dibuat realistis;
4. Metode tanggapan jelas bagi siswa;
5. Ruang, waktu, dan peralatan yang sesuai tersedia bagi siswa untuk merespons
dengan tepat.
Ketika menyusun butir – butir tes dan tes pada umumnya, sebaiknya guru
mengingat bahwa tes mengukur kecukupan pada:
1. pengujian itu sendiri
2. bentuk tanggapan
3. bahan – bahan pengajaran
4. lingkungan pembelajaran dan situasi
5. pencapaian siswa
Setelah menulis sebuah tes, guru sebaiknya melaksanakan tes itu kepada
siswa secara individu. Bahkan setelah ujian diberikan, guru sebaiknya menilai
hasil untuk kejelasan butir tes. Butir tes yang salah ditanggapi atau tidak terjawab
oleh banyak siswa sebaiknya dianalisis. Butir – butir tes yang dicurigai sebaiknya
dianalisis dan mungkin direvisi sebelum tes dilaksanakan kembali.
10
2.8 Pengembangkan Instrumen Untuk Mengukur Kinerja, Hasil dan Perilaku
Pengembangan instrument digunakan untuk mengukur keterampilan psikomotor,
hasil atau perilaku pada hakekatnya tidak hanya melibatkan butir – butir tes
tertulis. Sebaliknya, kinerja, hasil dan sikap memerlukan penulisan petunjuk
untuk mengarahkan kegiatan siswa dan membangun sebuah rubrik untuk
memandu evaluasi dari kinerja, hasil atau perilaku.
1. Menulis petunjuk
Petunjuk bagi peserta didik dalam kinerja dan hasilnya sebaiknya harus bisa
mendeskripsikan apa yang harus dilakukan dan bagaimana hal itu dilakukan.
Dalam penulisan petunjuk, guru juga perlu mempertimbangkan jumlah
petunjuk yang diberikan (disediakan). Beberapa hal yang digunakan dalam
menentukan jumlah petunjuk tes adalah:
a. Bentuk keterampilan yang diuji
b. Kompleksitas tes
c. Tingkat pengalaman dari siswa
d. Situasi yang sesuai bagi peserta didik untuk mentransfer keterampilan
Instruksi kepada peserta ujian yang berkaitan dengan pengukuran sikap
berbeda dengan instruksi yang diberikan untuk mengukur kinerja dan hasil
belajar. Untuk ketepatan penilaian sikap, penting bagi peserta ujian untuk
merasa bebas dalam “memilih” untuk berperilaku sesuai dengan sikap
mereka. Peserta ujian yang menyadari bahwa mereka sedang diamati oleh
seorang pengawas atau guru, mungkin tidak menunjukkan perilaku yang
mencerminkan sikap mereka yang sebenarnya.
2. Pengembangan instrumen
Di samping menulis instruksi untuk peserta didik, guru juga perlu
mengembangkan sebuah instrumen untuk menuntun evaluasi dari kinerja,
hasil atau perilaku. Langkah – langkah dalam mengembangkan instrumen
adalah:
a. Mengidentifikasi elemen – elemen yang akan dievaluasi
11
Elemen-elemen tersebut harus diambil langsung dari siswa dan ditentukan
kriterianya untuk mencapai tujuan. Hal terpenting memastikan bahwa
elemen yang dipilih dapat diamati selama pelaksanaan.
b. Menguraikan masing – masing elemen
Elemen harus diparafrasekan untuk mengurangi instrumen kinerja
yang panjang. Tanggapan “Ya” pada instrumen selalu sesuai dengan
kinerja yang positif, dan "Tidak" selalu sesuai dengan kinerja yang
negatif.
c. Mengurutkan elemen – elemen pada instrumen
Urutan elemen terdaftar harus sesuai urutan kinerja alami.
d. Memilih jenis pertimbangan yang akan dibuat oleh penilai
Ketika mengevaluasi kinerja, produk, atau sikap, penilaian dapat
dibuat dengan menggunakan daftar cek, skala penilaian, atau
jumlah frekuensi. Daftar pembanding memberikan tanggapan "ya"
atau "tidak", apakah ada atau tidak seorang siswa yang memenuhi
kriteria. Skala penilaian mengambil langkah lebih lanjut dengan
memungkinkan untuk tanggapan “ya" atau "tidak. Jumlah frekuensi
yang digunakan untuk menunjukkan berapa kali seorang siswa
menampilkan kriteria atau elemen tertentu. Ini bagus jika elemen
dapat diamati lebih dari sekali.
e. Menentukan bagaimana instrumen akan dicetak
Dengan penggolongan lalu menjumlahkan jawaban "ya" untuk
mendapatkan skor untuk masing-masing tujuan dan untuk seluruh
proses atau produk. Guru dapat menambahkan nomor yang ditetapkan
untuk setiap elemen. Frekuensi jumlah yang sedikit lebih rumit karena
harus ditentukan cara membuat skor. Kemudian harus ditentukan nilai
yang baik.
3. Elemen-elemen
Hampir sama dengan butir – butir tes, elemen – elemen yang dijadikan
pertimbangan dalam instrumen diambil secara langsung dari perilaku
12
termasuk tujuan perilaku. Sebaiknya guru memastikan bahwa elemen –
elemen yang terpilih benar – benar dapat diamati selama kinerja atau pada
hasilnya.
Setiap elemen sebaiknya diuraikan sendiri untuk dimasukkan pada
instrumen. Waktu yang tersedia untuk pengamatan dan penilaian, terutama
untuk keaktifan yang terbatas dalam pembelajaran dan deskripsi yang panjang
seperti yang termasuk dalam tujuan akan menghambat proses. Seringkali
hanya satu atau dua kata yang diperlukan untuk penyampaian langkah atau
aspek dari hasil atau kinerja penilai. Dalam penguraian, hal itu juga penting
dalam mengatakan setiap butir seperti jawaban “ya” dari penilai yang
mencerminkan hasil yang positif, dan jawaban “tidak” yang mencerminkan
hasil yang negatif.
4. Mengembangkan format penilaian
Kegiatan keempat dalam mengembangkan instrumen untuk mengukur kinerja,
hasil atau perilaku adalah menentukan bagaimana penilai akan membuat dan
mencatat penilaian. Setidaknya ada tiga format penilaian termasuk daftar cek
(misalnya ya atau tidak), skala penilaian yang memerlukan tingkat kualitas
perbedaan (misalnya kurang, cukup dan baik), jumlah frekuensi terjadinya
setiap elemen yang dipertimbangkan, atau beberapa kombinasi dari ketiga
format ini. Model penilaian terbaik bergantung pada beberapa faktor, antara
lain
1. Sifat dan kerumitan dari elemen – elemen yang diamati
2. Waktu yang tersedia untuk pengamatan, membuat penilaian, dan
mencatat penilaian
3. Ketelitian atau kekonsistenan penilai dalam membuat penilaian
4. Kualitas umpan balik yang disediakan untuk peserta ujian.
Beberapa format penilaian yang dapat digunakan, antara lain
a. Daftar cek
Yang paling dasar dari tiga bentuk penilaian adalah daftar cek. Jika guru
memilih daftar cek, dengan mudah guru melengkapi instrumennya dengan
13
memasukkan dua kolom di samping masing – masing uraian, urut dengan
elemen – elemen yang diamati. Satu kolom untuk menandai “ya” yang
menunjukkan bahwa setiap elemen ditunjukkan. Kolom lainnya untuk
menandai “tidak” yang menunjukkan bahwa salah satu dari ketidakhadiran
atau ketidakcakapan pada suatu elemen.
Adapun keuntungan dari daftar cek antara lain
1. Sejumlah elemen yang berbeda dapat diamati pada jumlah waktu yang
diberikan
2. Cepat diselesaikan oleh penilai
3. Kekonsistenan atau keandalan dengan penilaian yang dibuat
4. Dengan mudah hasil pembelajaran secara keseluruhan dapat diperoleh.
Salah satu keterbatasan dari daftar cek adalah tidak adanya informasi
yang diberikan kepada peserta ujian tentang mengapa penilaian “tidak”
diberikan.
b. Skala penilaian
Sebuah daftar cek dapat diubah dalam skala penilaian dengan
mengembangkan jumlah dari tingkat kualitas penilaian pada setiap elemen
di mana kualitas perbedaannya memungkinkan. Daripada menggunakan
dua kolom untuk penilaian sebuah elemen, setidaknya ada tiga yang dapat
digunakan. Ketiga kolom dapat mencakup salah satu dari tidak diberikan
(0), diberikan (1), dan baik (2) atau kurang (1), cukup (2), dan baik (3).
Dengan memasukkan salah satu dari (0) atau (1) sebagai nilai terendah
tergantung pada apakah elemen yang dinilai dapat lepas dari hasil atau
proses.
Sama dengan daftar cek, skala penilaian memiliki sisi positif dan
negatif. Pada sisi positifnya, skala penilaian memungkinkan penilaian
analitik pada subkomponen kinerja atau hasilnya dan memberikan umpan
balik yang lebih baik pada peserta ujian tentang kualitas kinerja daripada
yang dapat diberikan melalui daftar cek. Pada sisi negatifnya, skala
penilaian membutuhkan lebih banyak waktu dalam menggunakannya,
14
karena perbedaan yang lebih jelas harus dibuat tentang kualitas setiap
elemen yang dinilai. Skala penilaian dapat memberikan nilai yang kurang
dipercaya dibandingkan daftar cek, terutama ketika tingkat kualitas lebih
disertakan daripada perbedaaan waktu yang tersedia atau daripada
kekonsistenan yang dinilai.
Ada dua strategi pengembangan yang dapat membantu memastikan
penilaian yang lebih dipercaya. Pertama adalah memberikan deskripsi
verbal yang jelas pada setiap tingkat kualitas. Daripada menggunakan
kategori angka yang sederhana dan bentuk umum seperti (1) tidak
memadai (kurang), (2) memadai (cukup) dan (3) baik, guru sebaiknya
menggunakan deskripsi verbal yang lebih tepat yang menggambarkan
kriteria khusus untuk setiap tingkat kualitas.
Strategi pemgembangan kedua yang dapat guru gunakan adalah
membatasi jumlah dari tingkat kualitas yang termasuk dalam setiap skala.
Hal ini tidak ada peraturan yang menyatakan bahwa semua elemen
penilaian harus memiliki jumlah yang sama dari tingkat kualitas, seperti
pada skala 4 atau 5. Jumlah tingkat yang disertakan sebaiknya ditentukan
oleh kekomplekan penilaian elemen dan waktu yang tersedia untuk menilai
itu.
c. Jumlah frekuensi
Format penilaian yang ketiga yang penilai dapat gunakan dalam
penilaian hasil, kinerja, dan perilaku adalah jumlah frekuensi.
Perhitungan frekuensi diperlukan ketika sebuah elemen diamati, baik
positif maupun negatif, dapat diulangi beberapa kali oleh peserta ujian
selama kinerja atau pada hasilnya.
Sebuah instrumen jumlah frekuensi dapat dibuat dengan
menyediakan ruang yang cukup di samping setiap elemen dihitung
dengan jumlah kejadian yang terjadi. Sama dengan daftar cek, hal yang
lebih sulit pada penyusunan instrumen jumlah frekuensi adalah dalam
mengidentifikasi dan mengurutkan elemen yang diamati.
15
5. Prosedur penilaian
Kegiatan terakhir dalam membuat instrumen untuk mengukur hasil, kinerja
dan perilaku adalah menentukan bagaimana instrumen akan dinilai. Penilaian
tingkat tujuan dapat diperoleh dari skala penilaian dengan menambahkan
secara bersamaan angka yang diberikan pada setiap nilai elemen dalam
sebuah tujuan. Nilai menunjukkan seluruh kinerja peserta ujian pada tujuan
yang diperoleh dengan menjumlahkan nilai individu di semua elemen
termasuk dalam instrumen.
6. Evaluasi instrumen
Kriteria tertentu yang digunakan dalam penilaian elemen yang ada
dalam instrumen adalah:
1. Pengamatan setiap elemen yang dinilai
2. Kejelasan cara di mana elemen diuraikan
3. Keefisienan rangkaian urutan
Terkait dengan format penilaian, guru sebaiknya mengecek apakah
kategori jawaban dan kriteria pantas dari segi jumlah dan jenis penilaian yang
diperlukan dalam membuat dan waktu yang tersedia bagi guru untuk
mengamati, memutuskan, dan menilai.
2.9 Tes Berdasarkan Kriteria dan Tes Beracuan Norma
Perbedaan utama antara tes beracuan patokan dan tes beracuan norma terletak
pada bagaimana kinerja siswa pada tes ditafsirkan. Pada tes beracuan kriteria,
kinerja semua siswa dalam kelompok ini dibandingkan dengan jumlah
keterampilan bawah dan tujuan yang diberikan. Sebagai contoh, jika menjawab
80% dari butir soal dengan benar ditetapkan sebagai kriteria kelulusan, maka
kinerja masing – masing siswa ditinjau lagi mengingat kriteria, 80%. Hal ini
memungkinkan bagi semua siswa dalam kelompok melampaui kriteria, juga
mungkin bahwa tidak ada siswa akan melampaui kriteria yang ditentukan.
Di sisi lain, interpretasi beracuan norma membandingkan kinerja siswa
dengan satu sama lainnya. Peringkat siswa atau posisi dalam kelompok adalah
titik acuan untuk menentukan kualitas kinerja daripada proporsi tertentu dari
tujuan yang diberikan.
16
2.10 Contoh Penerapan Dalam Pengembangan Tes Berdasarkan Kriteria
1. Butir tes untuk informasi verbal
Kondisi dan perilaku merupakan bagian dari tujuan yang digunakan untuk
memandu penyusunan butir soal. Ransangan kunci atau isyarat yang
ditentukan dalam kondisi muncul dalam setiap pernyataan atau pertanyaan.
Perilaku yang ditentukan dalam tujuan sesuai dengan perilaku yang
diperlukan dalam butir soal. Perhatikan bahwa hanya jawaban pendek,
melengkapi, atau mengisi butir soal yang kosong yang digunakan.
Berdasarkan kondisi dan perilaku yang ditentukan, jawaban alternatif soal
seperti soal pilihan ganda dan mencocokkan bukan yang paling tepat,
meskipun relatif mudah disusun.
2. Butir tes untuk keterampilan intelektual
Dalam menganalisis contoh – contoh butir soal, periksa apakah siswa
diberikan bahan pelajaran yang merupakan bagian dari tujuan dan apakah
siswa perlu menjawab dengan cara yang ditentukan atau tersirat oleh kata -
kata dalam tujuan. Periksa juga apakah contoh butir soal termasuk untuk
mengukur keterampilan. Beberapa butir soal diperlukan pada beberapa
tujuan, sedangkan hanya satu atau dua butir soal yang diperlukan untuk
yang lainnya.
3. Daftar cek untuk menilai keterampilan motorik
Dalam mengukur kinerja keterampilan motorik, guru membutuhkan
petunjuk untuk kinerja dan sebuah instrumen yang dapat digunakan untuk
mencatat evaluasi kinerja.Informasi juga disediakan untuk peserta ujian
tentang bagaimana kinerja akan dinilai. Petunjuk ini memberitahu peserta
ujian bahwa untuk menerima kredit, mereka harus: (1) mengingat setiap
langkah, (2) melakukan itu dengan menggunakan alat yang tepat, (3)
menggunakan setiap alat dengan benar, (4) selalu sadar keselamatan dalam
melakukan setiap langkah. Dengan informasi ini, mereka akan memahami
bahwa kegagalan mematuhi salah satu dari empat kriteria akan berarti
hilangnya kredit untuk langkah itu. Mereka juga diberitahu bahwa mereka
17
dapat berhenti pada setiap titik selama tes. Mengetahui bahwa ini bisa
terjadi, mengapa hal itu bisa terjadi, dan konsekuensi dari hal itu terjadi
akan mengurangi kecemasannya jika mereka berhenti selama ujian.
4. Petunjuk untuk tes kemampuan psikomotor
Kinerja Anda pada setiap langkah akan dinilai dengan menggunakan tiga
kriteria dasar. Yang pertama adalah bahwa Anda ingat untuk melakukan
setiap langkah. Yang kedua adalah bahwa Anda menjalankan masing-
masing dengan menggunakan alat yang tepat dengan cara yang tepat. Yang
ketiga adalah bahwa Anda melakukan setiap langkah dengan pikiran yang
tenang. Untuk alasan keamanan, penguji dapat menghentikan Anda pada
suatu saat dalam ujian dan meminta Anda: 1) melakukan langkah yang telah
Anda lupa, 2) mengubah cara di mana Anda menggunakan alat atau
meminta Anda mengubah ke alat lain, atau 3) mengulangi langkah yang
tidak dilakukan dengan aman. Jika ini terjadi, Anda tidak akan menerima
pengulangan untuk langkah itu. Namun, Anda akan menerima pengujian
kembali langkah-langkah yang dieksekusi dan dilakukan setelah ujian itu.
18
BAB III
PENUTUP
3.1 Kesimpulan
Tes yang dirancang untuk mengukur serangkaian tujuan eksplisit1 disebut tes
berdasarkan kriteria. Jenis pengtesan ini penting untuk (1) mengetes dan
mengevaluasi kemajuan siswa, dan (2) memberikan informasi tentang
keefektifan pembelajaran. Hasil tes berdasarkan kriteria menunjukkan kepada
guru dengan tepat seberapa baik siswa dapat mencapai setiap tujuan
pembelajaran, dan ini menunjukkan kepada guru, apa saja komponen dari
pembelajaran yang bekerja dengan baik, dan mana yang memerlukan revisi.
Dengan demikian pengetesan berdasarkan kriteria adalah fitur penting dari
hampir semua model desain pembelajaran .
Konsep utama pembahasan ini adalah pengtesan berdasarkan kriteria. Tes
berdasarkan kriteria terdiri dari item yang secara langsung mengukur perilaku
yang digambarkan dalam seperangkat tujuan perilaku tertentu. Istilah kriteria
digunakan karena item tes berfungsi sebagai patokan untuk menentukan
kecukupan kinerja siswa dalam mencapai tujuan; Artinya, keberhasilan pada
item ini menentukan apakah seorang siswa telah mencapai tujuan di unit
pembelajaran.
Oleh karena itu, untuk menentukan apakah item tes benar-benar kriteria
yang diacu, guru harus terlebih dahulu menentukan apakah kinerja yang
dibutuhkan dalam item tes atau item sesuai atau sejajar dengan perilaku yang
dinyatakan dalam tujuan perilaku, dan kedua, apakah kriteria telah ditetapkan
untuk menentukan seberapa baik seorang siswa harus melakukan
keterampilan untuk menguasai tujuannya.
3.2 Saran
Jadi, dalam suatu satuan pendidikan harus diwajibkan adanya penerapan tes
berdasarkan kriteria, tidak hanya itu tetapi juga berdasarkan norma. Agar
peserta didiknya dapat mencapai tujuan akhir pembelajaran. Peserta didik juga
lebih cenderung untuk mengutamakan belajar dan juga nantinya akan
menghasilkan peserta didik yang sesuai dengan tujuan pendidikan nasional,
yaitu siswa menjadi beriman dan bertakwa kepada tuhan yang maha esa,
bertanggung jawab, cakap, kreatif, dan mandiri.
19
DAFTAR PUSTAKA
Amiruddin. 2016. Perencanaan Pembelajaran. Yogyakarta: Parama Ilmu
Asrul, dkk. 2014. Evaluasi Pembelajaran. Bandung: Citapustaka Media.
Dick, Walter, and Lou Carey. 1990. The Systematic Design of Intruction, Florida :
Herpes Collins Publishers
1
TRANSLATE BAB. 7
MENGEMBANGKAN TES BERDASARKAN KRITERIA
LATAR BELAKANG
Kami telah mengtes kemampuan umum dan spesifik orang selama bertahun-tahun.
Tes kemampuan umum seperti Stanford-Binet dan juga tes yang dirancang untuk kursus
tertentu banyak digunakan. Anda mungkin paling terbiasa dengan tes yang diberikan oleh
guru yang digunakan untuk mendapatkan data untuk memberi nilai kepada siswa. Cukup
sering tes ini ditulis setelah instruksi diberikan dan dibuat lebih atau kurang sulit,
tergantung pada kemampuan peserta didik di kelas atau persepsi guru tentang seberapa
baik topik tertentu diajarkan. Format tes dari tipe ini terkadang ditentukan oleh minat dan
kemampuan guru dan bukan oleh sifat konten yang telah diajarkan.
1 Mengidentifikasi
Tujuan Pembelajaran
4 Merumuskan
Tujuan Pembelajaran
5 Mengembangkan Tes Berdasarkan
Kriteria
6 Mengembangka
n Strategi
Pembelajaran
7 Mengembngkan
Dan Menentukan
Materi Pembelajaran
8 Mengembangkan
Dan Membuat Evaluasi Formatif
10 Mendesain
dan Membuat Evaluasi Sumatif
2 Melakukan
Analisis Pembelajaran
9 Revisi
Program Pembelajaran
3 Menganalisis Kemampuan Awal Peserta
Didik
2
Ada juga penulis tes profesional, biasanya membangun tes dengan mengambil sampel
dari domain konten ke selektif2 item tersebut untuk tes yang akan menghasilkan berbagai
nilai siswa. Untuk mengembangkan jenis tes ini, penulis harus membuang item yang
telah dijawab dengan benar atau tidak benar oleh hampir seluruh siswa. Meskipun, proses
ini cenderung meningkatkan reabilitas pengtesan, pengaruhnya terhadap validitas tes
dapat dipertanyakan.
Dalam beberapa tahun terakhir pengtesan kelas telah mengalami perubahan yang
sangat berbeda, dari perubahan ini dapat dikaitkan dengan dampak tujuan perilaku.
Karena semakin banyak penekanan pada pernyataan perilaku eksplisit yang harus
ditunjukkan oleh siswa, semakin jelas bahwa sistem evaluasi yang adil dan setara adalah
pendekatan yang mengukur perilaku spesifik tersebut. Setelah siswa diberi tahu apa yang
harus mereka lakukan, sukseslah di unit pembelajaran, mereka harus dites dengan benar.
Tes yang dirancang untuk mengukur serangkaian tujuan eksplisit3 disebut tes
berdasarkan kriteria. Jenis pengtesan ini penting untuk (1) mengetes dan mengevaluasi
kemajuan siswa, dan (2) memberikan informasi tentang keefektifan pembelajaran. Hasil
tes berdasarkan kriteria menunjukkan kepada guru dengan tepat seberapa baik siswa
dapat mencapai setiap tujuan pembelajaran, dan ini menunjukkan kepada guru, apa saja
komponen dari pembelajaran yang bekerja dengan baik, dan mana yang memerlukan
revisi. Dengan demikian pengetesan berdasarkan kriteria adalah fitur penting dari hampir
semua model desain pembelajaran .
Anda mungkin bertanya-tanya mengapa pengembangan tes muncul pada tahap ini
dalam proses perancangan pembelajaran daripada, setelah pembelajaran telah
dikembangkan. Alasan utama adalah bahwa item tes yang dibuat harus sesuai satu lawan
satu dengan tujuan yang telah dikembangkan. Kinerja yang dibutuhkan dalam tujuan
harus sesuai dengan kinerja yang dibutuhkan dalam item tes. Demikian pula, sifat dari
item yang diberikan kepada siswa utama sebagai kunci pengembangan strategi
pembelajaran.
2Penyaringan 3 Tegas
3
KONSEP
Konsep utama dalam bab ini adalah pengtesan berdasarkan kriteria. Tes berdasarkan
kriteria terdiri dari item yang secara langsung mengukur perilaku yang digambarkan
dalam seperangkat tujuan perilaku tertentu. Istilah kriteria digunakan karena item tes
berfungsi sebagai patokan untuk menentukan kecukupan kinerja siswa dalam mencapai
tujuan; Artinya, keberhasilan pada item ini menentukan apakah seorang siswa telah
mencapai tujuan di unit pembelajaran. Namun, semakin sering istilah yang dirujuk
sebagai referensi menunjukkan hubungan antara item tes dan tujuan perilaku. Item tes
didasarkan secara langsung pada kinerja yang diuraikan dalam tujuan bahan ajar. Oleh
karena itu, Anda mungkin menganggap kedua istilah ini pada dasarnya sama.
Setidaknya ada dua cara kriteria jangka digunakan bila mengacu pada item tes yang
berdasarkan kriteria. Yang pertama mengacu pada hubungan antara tujuan kinerja dan
item tes. Jika siswa cukup melakukan perilaku yang dinyatakan dalam tujuan, maka
mereka telah mencapai kriteria atau penguasaan pada tujuan itu, karena penguasaan pada
tujuan adalah kriteria untuk melangkah maju.
Penggunaan kedua kata kriteria berkaitan dengan spesifikasi kecukupan kinerja yang
dibutuhkan untuk penguasaan. Contoh kriteria jenis kedua ini termasuk tolak ukur seperti
"siswa akan menjawab semua item dengan benar", "siswa akan menambahkan tanda baca
yang dihilangkan", dan "siswa akan memotong dengan akurasi 5 derajat". Spesifikasi
kriteria jenis ini dapat ditetapkan untuk satu item tes yang ditulis untuk satu tujuan
perilaku, beberapa item tes yang ditulis untuk satu tujuan, atau beberapa item tes yang
ditulis untuk banyak tujuan. Kejelasan dalam menentukan tujuan dan kriteria untuk
kinerja yang memadai diperlukan sebagai panduan untuk konstruksi tes yang memadai.
Berdasarkan tujuan perilaku dan kriteria tertentu, posttest hanya memerlukan satu butir
tes atau mungkin memerlukan banyak.
Oleh karena itu, untuk menentukan apakah item tes benar-benar kriteria yang diacu,
guru harus terlebih dahulu menentukan apakah kinerja yang dibutuhkan dalam item tes
atau item sesuai atau sejajar dengan perilaku yang dinyatakan dalam tujuan perilaku, dan
4
kedua, apakah kriteria telah ditetapkan untuk menentukan seberapa baik seorang siswa
harus melakukan keterampilan untuk menguasai tujuannya.
Tiga Jenis Tes berdasarkan Kriteria dan Kegunaannya
Pada dasarnya ada tiga jenis tes yang bisa digunakan guru. Yang pertama adalah
pretest. Ini adalah tes berdasarkan kriteria yang dirancang untuk mengukur keterampilan
yang telah diidentifikasi penting untuk memulai pengajaran dan yang dimaksudkan oleh
perancang masing-masing. Oleh karena itu, dalam mempertimbangkan analisis
pembelajaran hirarkis, pretest mengukur semua keterampilan yang muncul di bawah
garis maupun yang muncul di atas garis.
Tes kedua yang paling umum digunakan oleh guru adalah posttest. Tes berdasarkan
kriteria ini sejajar dengan prestest, kecuali hal itu tidak termasuk item yang tidak ada
perilaku peserta didik. Seperti prestest, itu mengukur tujuan yang diajarkan dalam
program pembelajaran.
Jenis ketiga tes adalah embedded test. Ini mungkin terdiri dari satu item yang menguji
satu tujuan tunggal, atau mungkin merupakan tes yang terdiri dari sejumlah besar item
untuk sejumlah tujuan. Item ini disertakan sebagai bagian dari strategi pembelajaran, dan
mungkin muncul setiap beberapa halaman, atau setelah urutan pembelajaran utama.
Mereka menyajikan dua fungsi penting. Yang pertama adalah pengujian peserta didik
setelah pembelajaran pada tujuan dan sebelum posttest. Ini memberikan data berharga
untuk evaluasi formatif dan revisi pembelajaran. Tujuan kedua terkait dengan
pelaksanaan pembelajaran tersebut. Mungkin bermanfaat bagi guru untuk memiliki tes
tertanam untuk memeriksa kemajuan siswa dan untuk memberikan indikasi apakah
kegiatan perbaikan diperlukan sebelum posttest yang lebih formal.
Ayo melihat setiap jenis tes dari sudut pandang orang yang merancang pembelajaran.
Apa tujuan mereka menyajikan? Akhirnya tes mungkin akan digunakan untuk memberi
nilai pada siswa. Tapi masalah yang sangat nyata adalah sedikit perhatian pada guru saat
ini. Ketiga tipe tersebut memiliki fungsi penting dalam proses perancangan pembelajaran.
5
PRETEST Pretest dapat menentukan item yang mengukur kemampuan awal
(keterampilan prasyarat) dan item yang menguji keterampilan yang akan diajarkan dalam
pengajaran. Item kemampuan awal untuk pretest didasarkan pada tujuan untuk
keterampilan tersebut yang muncul "di bawah garis" pada grafik analisis pembelajaran.
Ini adalah keterampilan, berasal langsung dari keterampilan yang akan diajarkan, dimana
siswa harus memulai pengajaran. Jika ada kemampuan awal peserta didik untuk unit
pembelajaran, item tes harus dikembangkan dan digunakan dengan siswa selama evaluasi
formatif. Dapat ditemukan bahwa, seperti yang dikemukakan oleh teori, siswa yang
kekurangan keterampilan ini akan mengalami kesulitan besar dalam pengajaran ini. Atau,
dapat ditemukan bahwa karena beberapa alasan, kemampuan awal tidak penting bagi
kesuksesan dalam pengajaran. Perlu dicatat bahwa jika tidak ada kemampuan awal
signifikan yang diidentifikasi selama analisis pembelajaran, tidak akan ada item tes yang
sesuai pada pretest.
Pretest juga mengukur keterampilan yang akan diajarkan dalam pengajaran.
Biasanya itu mencakup satu atau lebih item untuk setiap keterampilan yang diidentifikasi
dalam analisis pembelajaran, termasuk tujuan pembelajaran.
Fungsi dari bagian pretest ini adalah untuk menentukan berapa banyak pengetahuan
awal tentang apa yang harus diajarkan. Apakah mereka tidak tahu satupun, atau banyak?
Tujuan pengujian keterampilan ini tidak harus menunjukkan keuntungan dalam belajar
setelah pembelajaran dibandingkan dengan posttest, namun untuk profil siswa berkaitan
dengan analisis pembelajaran. Dapat ditemukan, misalnya, bahwa pada pretest semua
siswa dalam evaluasi formatif dapat menjawab beberapa pertanyaan tentang keterampilan
tingkat rendah yang akan diajarkan. Ini menunjukkan bahwa pengajaran untuk topik
tersebut dapat dieliminasi dari unit.
Apakah Anda selalu memberikan pretest atas keterampilan yang harus diajarkan?
Terkadang perlu. Jika Anda mengajarkan topik yang Anda baru tahu bagi populasi target
Anda, dan jika kinerjanya pada pretest hanya akan menjadi hasil dari dugaan acak,
mungkin tidak disarankan untuk melakukan pretest. Pretest bernilai hanya jika ada
kemungkinan sebagian siswa akan memiliki pengetahuan parsial dari konten. Jika waktu
6
untuk pengujian adalah masalah, mungkin untuk merancang pretest singkat yang menilai
tujuan terminal dan beberapa tujuan bawahan. Guru harus menggunakan penilaiannya
mengenai tujuan mana yang paling penting untuk dites.
TEST EMBEDDED Item tes yang disematkan seperti item latihan tanpa umpan balik.
Item ini hanya untuk kepentingan guru. Apakah yang digunakan untuk menjawab
pertanyaan "Apakah siswa tahu bagaimana melakukan skill ini segera setelah diajar"?
embedded test berlaku hampir secara eksklusif untuk keterampilan intelektual, karena
perancang harus dapat menggunakan item yang baru bagi siswa yaitu, contoh penerapan
keterampilan yang tidak teratasi. Jika embedded item digunakan dengan informasi verbal,
mereka akan meminta siswa untuk mengingat kembali informasi yang merujuk kembali
ke pengajaran untuk menjawab pertanyaan tersebut. Hal ini tidak sepenuhnya tidak
diinginkan, karena dapat memperlancar penyimpanan informasi. Masalahnya,
perancangnya tidak tahu apakah siswa itu hanya mencari jawabannya dan
menuliskannya, atau murid itu benar; ingat itu embedded item biasanya tidak digunakan
dengan keterampilan psikomotorik, namun penting dalam beberapa jenis pengajaran agar
siswa berhenti pada satu atau beberapa titik agar guru memastikan bahwa mereka
mengikuti prosedur dengan benar. Hal ini berlaku khususnya situasi yang berpotensi
membahayakan. Embedded item yang disematkan akan dibahas lebih rinci sebagai bagian
dari strategi pembelajaran dan evaluasi formatif.
POSTTEST Dapat dikatakan dengan sangat pasti bahwa guru akan memiliki posttest
untuk pengajaran. Posttest harus menilai semua tujuan, dan terutama fokus pada tujuan
akhir. Sekali lagi, seperti pretest, posttest mungkin cukup panjang jika mengukur semua
keterampilan bawahan. Namun, tujuan posttest adalah untuk membantu guru
mengidentifikasi komponen pembelajaran yang tidak berjalan. Jika seorang siswa gagal
untuk melakukan tujuan akhir, guru harus dapat mengidentifikasi di mana dalam proses
pembelajaran siswa mulai gagal memahami pembelajarannya. Dengan memanfaatkan
item pada keterampilan bawaan pada posttest, guru harus bisa melakukan hal itu.
7
Jika waktu adalah faktor dan pengujian yang lebih singkat harus dikembangkan,
tujuan terminal dan subskill penting harus diuji. Item yang menguji subskill yang paling
mungkin memberi siswa masalah pada tujuan terminal harus digunakan. Pada tes ini,
seperti untuk semua tes lainnya telah dijelaskan, guru harus dapat menunjukkan keahlian
apa yang dites dengan item tes yang diberikan.
Ketiga jenis tes ini dimaksudkan untuk digunakan selama proses perancangan.
Setelah evaluasi formatif dari instruksi selesai, mungkin disarankan untuk mengubah
item embedded test ke praktik dengan item umpan balik (ini dibahas lebih rinci pada bab
berikutnya), untuk melepaskan sebagian atau seluruh pretest dan memodifikasi posttest
hanya untuk mengukur tujuan terminal. Intinya, lebih sedikit waktu yang akan dihabiskan
untuk pengtesan saat instruksi mulai beroperasi.
Jenis Tes Tujuan yang diuji
Pretest Kemampuan awal ( keterampilan prasyarat)
dan tujuan pembelajaran yang terpilih
Embedded Test Tujuan pembelajaran yang terpilih
Posttest Semua tujuan pembelajaran
Merancang Tes
Bagaimana cara merancang dan mengembangkan tes berdasarkan kriteria? Guru
menulis satu atau lebih soal tes untuk mewakili masing – masing tujuan pembelajaran
perilaku. Faktor penting adalah bahwa ada pertanyaan pada tes yang berhubungan
langsung ke masing – masing tujuan pembelajaran pembelajaran.
Tujuan pembelajaran dalam domain keterampilan intelektual umumnya
memerlukan paper and pencil test, atau soal yang membutuhkan produk atau kinerja
tertentu. Hal ini relatif mudah untuk menentukan pencapaian tujuan pembelajaran
keterampilan intelektual: baik siswa "paham" respon yang tepat atau tidak. Pada tingkat
yang lebih tinggi keterampilan intelektual, lebih sulit untuk dinilai. Misalnya, jika suatu
tujuan pembelajaran memerlukan siswa untuk menciptakan solusi unik atau produk,
8
maka perlu untuk menetapkan seperangkat kriteria yang dapat dikonversi ke daftar atau
rating skala yang dapat digunakan untuk menilai produk siswa.
Penilaian dalam domain sikap juga sulit. Tujuan pembelajaran afektif umumnya
berkaitan dengan sikap atau preferensi pelajar. Biasanya tidak ada cara langsung untuk
mengukur sikap siswa (contohnya, apakah mereka menikmati baseball). Soal untuk
tujuan pembelajaran sikap umumnya diperlukan bagi siswa untuk menyatakan pilihan
mereka atau guru mengamati perilaku siswa dan menyimpulkan sikap mereka. Sebagai
contoh, jika siswa secara sukarela terlibat dalam permainan baseball pada tiga
kesempatan yang berbeda, guru dapat menyimpulkan bahwa mereka menikmati bisbol.
Dari hal tersebut, dapat dinyatakan bahwa preferensi mengamati perilaku dan kesimpulan
tentang sikap dapat dibuat.
Soal untuk tujuan pembelajaran dalam domain psikomotorik tidak sama dengan
informasi verbal atau keterampilan intelektual. Biasanya siswa diminta untuk melakukan
urutan langkah – langkah yang secara kolektif merupakan tujuan pembelajaran
pembelajaran. Oleh karena itu, tes sering terdiri dari daftar yang digunakan oleh guru
untuk menunjukkan apakah setiap langkah telah dilaksanakan dengan baik. Daftar
tersebut dapat dikembangkan langsung dari keterampilan yang diidentifikasi dalam
analisis pembelajaran. Guru mungkin juga ingin menguji kemampuan awal dalam
prosedur analisis. Ini sering merupakan keterampilan intelektual atau informasi lisan
yang harus diuji menggunakan format paper and pencil test, sebelum siswa melakukan
psikomotor keterampilan. Kadang-kadang kinerja dari ketrampilan psikomotor
menghasilkan produk kreasi. Hal itu adalah mungkin dalam mengembangkan daftar
kriteria untuk menilai kecukupan dari produk ini.
Menentukan Tingkat Penguasaan
Untuk setiap tujuan pembelajaran perilaku harus ada tingkatan kriteria yang
terspesifikasi, yang menunjukkan seberapa baik siswa harus melakukan keterampilan
yang dijelaskan dalam tujuan pembelajaran pada soal tes yang yang diberikan. Pada
dasarnya, kriteria menunjukkan tingkat penguasaan yang diperlukan siswa. Konsep
tingkat penguasaan sebagai tingkat kriteria lawan lebih sering digunakan dalam tes untuk
9
seluruh unit pembelajaran atau seluruh kursus. Guru dapat menyatakan bahwa dalam
rangka untuk siswa pada "Master" unit ini, mereka harus mencapai tingkat tertentu pada
kinerja, tetapi pertanyaannya tetap: bagaimana anda menentukan tingkat materinya ?
Peneliti yang telah bekerja dengan sistem pembelajaran penguasaan memiliki
pengaruh yang penguasaannya setara ke tingkat kinerja yang biasanya diharapkan dari
siswa terbaik. Metode ini mendefinisikan penguasaan yang jelas direferensikan dari
norma, tetapi mungkin satu-satunya standar yang dapat cukup menjadi pengguna.
Pendekatan kedua penguasaan adalah salah satu yang terutama jika guru ingin
memastikan bahwa siswa "benar-benar tahu" keterampilan sebelum menuju ke unit
pembelajaran berikutnya, maka siswa harus diberikan kesempatan untuk melakukan
keterampilan sehingga hampir tidak mungkin untuk hasil benar berasal dari kebetulan
semata. Ketika soal tes pilihan ganda yang digunakan, maka lebih berpeluang bahwa
setiap jawaban yang benar untuk satu soal bisa karena kebetulan. Dengan berbagai jenis
item tes lain yang lebih sulit untuk menghitung probabilitas kesempatan kinerja, tetapi
lebih mudah untuk meyakinkan orang lain yang kinerjanya bukan hanya masalah
kesempatan. Namun, tingkat kinerja yang tinggi tidak berarti tingkat penguasaan juga
tinggi. Pengaturannya yang lebih tinggi dari kesempatan adalah keputusan yang agak
sewenang-wenang.
Situasi yang ideal di mana untuk mengatur tingkat penguasaan adalah salah satu
yang tepat, tingkat eksplisit dari kinerja yang mendefinisikan penguasaan. mungkin
dalam rangka berpendapat untuk murid belajar dalam mengirim pesan teletype, dia harus
paham bagaimana untuk mengeja istilah standar militer. Oleh karena itu, sebuah matery
tingkat 100 persen pada unit istilah ejaan militer hal ini tidak seluruh sewenang-wenang.
Hal ini didasarkan pada bahaya dari keterampilan yang dimaksud dengan belajar dari
ketrampilan berikutnya. Semakin besar hubungan antara keduanya, semakin tinggi
penguasaan tingkat yang harus ditetapkan. Sebagai prinsip umum, level penguasaan atas
kinerja harus dipertimbangkan sehubungan dengan evaluasi kinerja pada saat waktu itu
dan meningkatkan pembelajaran selanjutnya, berkaitan keterampilan dalam unit atau di
seluruh kursus.
10
Menulis tes item
Terlepas dari jenis pembelajaran yang terlibat dalam tujuan pembelajaran, sesuai
menulis tes item teknik harus diterapkan pada pengembangan kriteria tes yang
direferensikan. Ada beberapa hal yang guru harus ingat saat menulis kriteria tes item
yang direferensikan. item harus sesuai dengan perilaku dan kondisi yang ditentukan
dalam tujuan pembelajaran, dan item harus memberikan siswa dengan kesempatan untuk
memenuhi kriteria yang diperlukan untuk menunjukkan penguasaan tujuan pembelajaran.
Untuk mencocokkan respon yang diperlukan dalam tes item dengan perilaku yang
ditentukan di tujuan pembelajaran, guru harus mempertimbangkan tugas pembelajaran
atau kata kerja yang ditentukan dalam tujuan pembelajaran. Tujuan pembelajaran yang
meminta siswa untuk menyatakan atau menentukan, melakukan dengan bimbingan, atau
melakukan secara independen semua akan memerlukan format yang berbeda untuk
pertanyaan dan jawaban.
Itu sangat penting bahwa tes item mengukur tepat penjelasan tingkah laku di
tujuan pembelajarannya. Misalnya, jika tujuan pembelajaran menunjukkan bahwa murid
akan dapat mencocokan deskripsi dari konsep tertentu dengan label tertentu, maka tes
item harus mencakup deskripsi dari konsep dan satu set label, kemudian siswa akan
diminta untuk mencocokkan.
Mari kita melihat contoh. Diberikan tanda skala di persepuluh dan diminta untuk
mengidentifikasi titik yang dirancang pada skala persepuluh, label point perancangan
dalam bentuk desimal formulir di unit persepuluh. Sesuai tes item untuk tujuan
pembelajaran ini ikuti :
A B
1.0 2.0
11
1. Di unit persepuluh, titik berapa pada skala yang ditunjukkan pada huruf A?
2. Di unit persepuluh, titik berapa pada skala yang ditunjukkan pada huruf B?
Anda dapat melihat dalam contoh ini bahwa tujuan pembelajaran membutuhkan
siswa membaca tepat titik pada skala yang dibagi menjadi unit sepersepuluh. tes item
menyediakan siswa sedemikian skala dan dua huruf yang terletak di titik tertentu pada
skala. Siswa harus menunjukkan nilai pada setiap titik di persepuluh.
Anda akan menghadapi ilustrasi lain yang mirip dengan ini dalam contoh dan
bagian praktek ini. Hal ini penting untuk dicatat dengan hati-hati penjelasan perilaku oleh
kata kerja dari tujuan pembelajaran. Jika kata kerjanya untuk mencocokkan, mendaftar,
memilih, atau menjelaskan, maka Anda harus memberikan tes yang memungkinkan siswa
untuk mencocokkan, mendaftarkan, memilih, atau menggambarkan. Tujuan pembelajaran
akan menentukan sifat item. Anda jangan sewenang-wenang memutuskan untuk
menggunakan format item tertentu seperti pilihan ganda. Format akan tergantung pada
kata-kata dari tujuan pembelajaran anda.
Tes item harus mempertimbangkan kondisi di mana keterampilan akan dilakukan.
Tes open book sangat berbeda dari tes yang referensi bahannya dilarang. yang diharapkan
kondisi kinerja termasuk dalam kinerja tujuan pembelajaran melayani sebagai panduan
untuk tes item penulis. kondisi menentukan apakah siswa dengan kinerja menggunakan
referensi atau dengan tersedia peralatan tertentu.
Terkadang kelas gagal untuk menyediakan lingkungan atau peralatan yang
diperlukan untuk menghasilkan kondisi kinerja yang tepat. Guru terkadang harus kreatif
dalam upaya memberikan kondisi yang serealitas mungkin. lebih realistis kondisi
pengetes adalah respon siswa yang lebih baik. Sebagai contoh, jika perilaku yang akan
ditampilkan di depan siswa, maka siswa harus hadir untuk tes.
Tujuan pembelajaran perilaku juga mencakup kriteria pengguna untuk menilai
penguasaan dari keterampilan. Tidak ada aturan mutlak yang menyatakan bahwa kriteria
kinerja tidak harus diberikan kepada siswa. Terkadang diperlukan bagi siswa untuk
12
mengetahui kriteria kinerja dan terkadang tidak. Siswa biasanya berasumsi bahwa untuk
menerima point untuk pertanyaan, mereka harus menjawabnya dengan benar.
Pertanyaan besar yang selalu muncul adalah, "berapa jumlah item yang
dibutuhkan untuk menentukan penguasaan objektif?" berapa banyak item yang
dibutuhkan siswa untuk menjawab dengan benar penilaian yang berhasil pada tujuan
pembelajaran tertentu ? jika siswa menjawab salah satu item dengan benar, apakah anda
bisa menganggap mereka telah mencapai tujuan pembelajaran? atau, jika mereka
melewatkan satu item, apakah Anda yakin mereka tidak menguasai konsep? mungkin jika
Anda memberikan peserta Didik sepuluh item per tujuan pembelajaran dan mereka
menjawab semuanya dengan benar atau kehilangan semuanya, anda akan memiliki
banyak kepercayaan penilaian anda. Ada beberapa saran praktis yang dapat membantu
Anda dalam menentukan berapa banyak tes item objektif yang akan diperlukan. jika item
atau tes membutuhkan format respon yang akan memungkinkan siswa untuk menebak
jawaban yang benar, maka Anda mungkin ingin menyertakan beberapa paralel tes item
untuk yang tujuan pembelajaran yang sama. Jika kemungkinan menebak jawaban yang
benar langsung, bagaimanapun, maka Anda dapat memutuskan bahwa satu atau dua item
cukup untuk menentukan kemampuan siswa untuk melakukan keterampilan.
jika Anda memeriksa pertanyaan ini dalam hal tujuan pembelajaran domain, hal
ini lebih mudah untuk menjadi lebih spesifik. Untuk menilai keterampilan intelektual, hal
ini biasanya diperlukan untuk menyediakan tiga atau lebih kesempatan untuk
menunjukkan keterampilan. Namun, dengan informasi lisan, hanya satu item yang
dibutuhkan untuk mengambil informasi spesifik dari memori. Jika tujuan pembelajaran
informasi mencakup berbagai pengetahuan (misalnya, mengidentifikasi ibukota negara),
maka guru harus memilih sampel acak sebagai contoh, dan menganggap bahwa kinerja
siswa mewakili bagian dari tujuan pembelajaran informasi lisan yang telah dikuasai.
Dalam kasus keterampilan psikomotor, ada juga biasanya salah satu cara untuk menguji
keterampilan, yaitu meminta siswa melakukan keterampilan untuk penilai. Tujuan
pembelajaran mungkin memerlukan siswa untuk melakukan keterampilan dalam
13
beberapa situasi yang berbeda. ini harus diulangi dalam melakukan ketrampilan
psikomotor.
Pertanyaan penting lainnya yang perlu dipertimbangkan adalah, "jenis tes item
apa yang terbaik dalan penilaian kinerja siswa?" Ada banyak format tes item berbeda.
Beberapa yang Umum adalah benar/salah, penyelesaian, mengisi titik-titik, pencocokan,
pilihan ganda, dan definisi.
Perilaku ditentukan dalam tujuan pembelajaran yang memberikan petunjuk pada
jenis item yang dapat digunakan untuk menguji perilaku. Pada tabel berikut, bagian
kolom sebelah kiri mendaftarkan jenis perilaku pada tujuan pembelajaran perilaku.
Bagian atas adalah jenis tes item yang dapat digunakan untuk mengevaluasi kinerja siswa
untuk setiap jenis perilaku. Tabel hanya mencakup saran. "Rasa" dari tujuan
pembelajaran harus menunjukkan jenis penilaian apa yang paling tepat.
Grafik menunjukkan beberapa jenis perilaku yang dapat diuji dalam beberapa cara
yang berbeda. Namun, beberapa tes item dapat menilai perilaku yang lebih baik daripada
yang lainnya. Sebagai contoh, jika itu penting bagi siswa untuk mengingat fakta, minta
mereka untuk menyatakan bahwa fakta lebih baik daripada meminta untuk pertanyaan
pilihan ganda. Gunakan tujuan pembelajaran sebagai panduan, pilih jenis tes item yang
memberikan siswa kesempatan terbaik untuk menunjukkan kinerjanya yang ditentukan
dalam tujuan pembelajaran. Dalam membangun tes item pilihan ganda, sebagai contoh,
hal ini sering sulit untuk memikirkan item pengecoh cukup yang tidak rumit. Kelemahan
lain dari jenis ini adalah siswa dapat menggunakan beberapa isyarat dalam soal tersebut
untuk menebak jawaban yang benar.
Jenis Perilaku dan Jenis Item yang Berkaitan
Jenis Tes Item
Tipe Perilaku Esai Mengisi
Titik-
Meleng Pilihan Mencoco Produk Kinerja
14
Berdasarkan
Tujuan
pembelajaran
titik kapi Ganda kan Langsung
Menyatakan x x x
Mengidentifikasi x x x x
Mendiskusikan x x
Mendefinisikan x x x
Memilih x x
Membedakan x x
Memecahkan x x x x X
Mengembangkan x x X
Menempatkan x x x x X
Membangun x x x X x
Menghasilakan x x X x
Mengoperasikan x
Memilih (sikap) x x x
Ada faktor-faktor lain yang perlu dipertimbangkan ketika memilih format tes item
untuk digunakan. Masing-masing jenis tes item memiliki manfaat dan kelemahan. Untuk
memilih jenis item yang terbaik dari orang-orang yang memadai, pertimbangkan faktor
seperti waktu respon yang dibutuhkan oleh siswa, skor waktu yang diperlukan untuk
kelas dan menganalisis jawaban, pengtes lingkungan, dan peluang menebak jawaban
yang benar.
15
Waktu yang diperlukan bagi siswa untuk menyelesaikan tes merupakan faktor
penting. Jika tujuan pembelajaran perilaku membutuhkan siswa untuk mendefinisikan
istilah, dan terbatasnya waktu pengtes yang tersedia, Anda mungkin ingin membangun
tes item yang membutuhkan siswa untuk memasok kata kunci dalam definisi, daripada
jenis yang membutuhkan pernyataanblengkap dari definisi. Namun, setiap pertanyaan
harus ditulis sangat hati-hati jika hal itu dipahami oleh siswa.
Format item tertentu menjadi konten yang tidak patut ketika mereka mempercepat
proses pengtes. Hal itu menjadi konten yang tidak patut menggunakan pertanyaan
benar/salah untuk menentukan apakah siswa paham betul istilah definisi. Diberikan
seperti pilihan, siswa tidak mendefinisikan, tetapi membedakan antara definisi yang
disajikan dalam tes item dan dipelajari selama pembelajaran. Selain menjadi format
jawaban yang tidak patut untuk menentukan tujuan pembelajaran perilaku, pertanyaan
yang benar/salah memberikan siswa kesempatan fifty-fifty dalam menebak jawaban yang
benar.
Tes item dapat diubah dari format jawaban "terbaik" untuk salah satu yang akan
menghemat waktu pengtes atau mencetak waktu, tetapi jenis alternatif atau pertanyaan
yang digunakan harus tetap memberikan siswa kesempatan yang wajar untuk
menunjukkan perilaku yang ditentukan dalam tujuan pembelajaran. Ketika pelajaran
diimplementasikan, penting bagi guru dapat menggunakan prosedur evaluasi. Oleh
karena itu, designer mungkin menggunakan salah satu jenis format item saat pelajaran
skala luas siap digunakan. Hal ini sering dianggap tantangan sulit oleh guru kreativitas.
Pengtes lingkungan juga merupakan faktor penting dalam seleksi format item.
Apakah peralatan dan fasilitas yang tersedia untuk situasi tes siswa benar-benar sesuai
keterampilan mengingat dengan kondisi yang ditentukan dalam tujuan pembelajaran? jika
tidak, dapatkah simulasi yang realitas baik paper and pencil atau yang lainnya akan
dibangun? jika simulasi tidak mungkin, akan ada pertanyaan seperti " daftar langkah-
langkah yang akan Anda ambil untuk ....." menjadi tepat atau memadai untuk situasi
Anda? yang lebih jauh dihapus perilaku dalam test item yang ditentukan dalam tujuan
pembelajaran, kurang akurat prediksi anak itu baik dapat atau tidak bisa melakukan
16
perilaku tertentu. Terkadang kinerja yang tepat seperti yang dijelaskan di tujuan
pembelajaran tersebut mustahil untuk dinilai, dan lainnya, kurang diinginkan cara yang
dapat digunakan. Ini juga akan menjadi pertimbangan penting ketika strategi
pembelajaran dikembangkan.
Peluang menebak jawaban yang benar adalah faktor lain yang harus
dipertimbangkan selanjutnya saat menulis tes item. Beberapa metode jawaban
memungkinkan siswa untuk menebak jawaban yang benar lebih sering daripada yang
lain. Pertanyaan pilihan ganda dengan tiga, empat, atau lebih jawaban memberikan siswa
kesempatan untuk menebak jawaban yang benar, meskipun kemungkinan untuk
melakukannya tipis. Dengan memberikan tambahan jawaban yang diminta, guru
mendapat kemungkinan siswa akan menebak dengan benar. Setiap kali waktu
mengizinkan, bangun tes item untuk meminimalkan penebakan(contohnya, mengisi isian
kosong, definisi, menjelaskan kata, menemukan posisi, menjelaskan fitur membangun
objek, dll). Format jawaban dari jenis item dapat meningkatkan baik penilaian waktu dan
mencetak waktu, tetapi mereka memberikan yang lebih dapat diandalkan dari
kemampuan siswa untuk melakukan tugas yang ditentukan oleh tujuan pembelajaran.
Setelah Anda memutuskan pada format tes item terbaik, langkah selanjutnya
melibatkan penulisan yang sebenarnya tes item "baik". Anda akan mempertimbangkan
hal-hal seperti kosa kata, "pengaturan" dari item, kejelasan item dan sulitnya item.
Kosakata yang digunakan dalam petunjuk untuk menyelesaikan pertanyaan dan
pertanyaan itu sendiri harus sesuai bagi siswa yang dimaksudkan. Item tes sebaiknya
tidak ditulis di tingkat kosakata dari guru kecuali tingkat yang sama dengan yang
diharapkan bagi peserta didik sasaran. Siswa tidak boleh melewatkan pertanyaan karena
istilah yang tidak familiar. Jika definisi tertentu merupakan prasyarat untuk melakukan
keterampilan, maka definisi tersebut harus dimasukkan dalam pembelajaran.
Penghilangan istilah dan definisi yang diperlukan adalah kesalahan umum yang dibuat
oleh banyak guru.
Pengaturan soal adalah pertimbangan penting lainnya. Soal yang dapat dibuat
tidak terlalu sulit dengan menempatkan tujuan pembelajaran yang diinginkan dalam
17
pengaturan yang tidak biasa. Ketika hal ini dilakukan, guru tidak hanya menguji perilaku
yang diinginkan, tetapi juga uji tambahan, perilaku yang tidak terkait. Meskipun ini
adalah praktek yang umum, itu adalah penulisan yang tidak biasa. Semakin asing contoh,
jenis pertanyaan, format respon dan prosedur pengtes, menjadikan tes lebih sulit
diselesaikan.
Salah satu contoh dari kesulitan "bertahap" ini adalah menciptakan masalah
aritmatika verbal dengan menggunakan situasi yang tidak sengaja dan tidak biasa.
Pengaturan masalah, baik di pantai, di toko, atau di sekolah, harus akrab bagi kelompok
sasaran (siswa). Dalam contoh lain, siswa dapat diminta untuk menulis sebuah paragraf
tentang topik yang tidak biasa ketika objek sebenarnya dari item tes adalah untuk
mengetahui apakah mereka dapat menulis sebuah paragraf yang mencakup kalimat topik,
mendukung kalimat deskriptif, dan ringkasan siswa dapat menunjukkan hal ini.
keterampilan yang lebih baik dengan menggunakan topik yang familiar, bukan yang tidak
familiar. Jika item tersebut dibuat tidak perlu, mungkin akan menghambat penilaian yang
akurat terhadap perilaku yang bersangkutan.
Kejelasan item juga penting. Untuk membantu memastikan kejelasan dan
meminimalkan kecemasan tes peserta tes, peserta tes harus diberi semua informasi yang
diperlukan untuk menjawab pertanyaan sebelum mereka diminta untuk menanggapi.
Idealnya, peserta tes harus membaca sebuah pertanyaan, menyusun secara mental
jawaban dan kemudian memberikan jawabannya atau memilihnya dari serangkaian
alternatif yang ada. Item isian dan pilihan ganda akan digunakan untuk menggambarkan
hal ini.
Contoh yang salah:
1. ............. diberikan kepada siswa sebelum instruksi
2. Pretest adalah:
a. Diatur sebelum instruksi
b. Diatur selama instruksi
c. Berikan instruksi berikut
18
Contoh yang lebih baik
1. Tes yang diberikan kepada siswa sebelum instruksi disebut ................
2. Kapan pretest diberikan?
a. Sebelum instruksi
b. Selama instruksi
c. Mengikuti instruksi
Dalam mengisi salah contoh tes isian, satu-satunya informasi yang diberikan sebelum
bertemu dengan yang isian yang kosong adalah huruf A; Dengan demikian, isian kosong
itu penempatannya tidak tepat. Mengingat pernyataan yang lengkap, tidak menunjukkan
bahwa istilah yang dicari adalah jenis tes. Dalam contoh yang lebih baik, semua
informasi yang dibutuhkan untuk merespons disajikan sebelum peserta didik menemukan
yang kosong, dan informasi ditambahkan yang menunjukkan bahwa jenis jenis tes dicari.
Dalam contoh pilihan ganda yang salah, bagian "bagian tes", bukanlah pemikiran yang
lengkap. Dalam contoh yang disempurnakan, semua informasi yang dibutuhkan untuk
merumuskan jawabannya termasuk sub bagian. Dalam menyusun item tes Anda, terlepas
dari formatnya, selalu pastikan bahwa semua rangsangan isyarat yang harus disediakan
terdapat dalam item. Meskipun menghilangkan informasi penting dapat meningkatkan
kompleksitas item, namun juga mengurangi kualitas pengtes.
Item yang ditulis untuk "trik" siswa sering menghasilkan pengtes perilaku selain yang
ditentukan dalam tujuan. Guru akan disarankan untuk meluangkan waktu mereka untuk
membuat item simulasi yang baik daripada menemukan pertanyaan yang rumit. Jika
objeknya adalah untuk menentukan seberapa baik siswa dapat menampilkan
keterampilan, daripada serangkaian pertanyaan mulai dari yang sangat mudah hingga
yang sangat sulit, akan memberikan indikasi yang lebih baik tentang tingkat kinerja siswa
daripada satu atau dua pertanyaan rumit. Jika guru ingin menantang untuk mengevaluasi
siswa tingkat lanjut, mereka harus membuat item uji pada tingkat kesulitan yang lebih
tinggi.
19
Urutan Item Tidak ada aturan yang ketat dan cepat yang memandu urutan penempatan
item pada tes keterampilan intelektual atau informasi lisan, namun saran ulang yang
dapat memandu penempatan. Keputusan akhir biasanya didasarkan pada situasi pengtes
khusus dan kinerja yang akan diuji.
Metode tradisional untuk urutan item pada pengtes adalah mengumpulkan item
berdasarkan format item. Dengan menggunakan item penyelesaian strategi ditempatkan
bersama, beberapa item pilihan ganda digabungkan, item esai dikumpulkan bersama-
sama dan sebagainya. Dalam setiap kelompok pertanyaan, konten dapat bervariasi di
seluruh konten yang disertakan dalam tujuan. Cara ini berakibat pada yang atraktif. Uji
yang tampak terorganisir dengan baik dan membutuhkan jumlah arah minimum. Terlepas
dari daya tariknya, strategi pemformatan ini memiliki kelemahan besar bagi guru yang
paling menganalisa penguasaan siswa terhadap tujuan yang diukur setelah mencetak
setiap item dan sebelum menentukan penguasaan siswa terhadap tujuan, data harus
disusun ulang dengan tujuan untuk analisis ini sangat memakan waktu dan langkah yang
tidak perlu. Individu yang menganjurkan strategi pengurutan mirip format baik item
mereka disusun ulang dinilai oleh mesin atau mereka tidak secara terpisah menganalisis
kinerja pada tujuan dalam pengtes.
Strategi urutan unggul untuk guru, yang perlu memberikan skor tanggapan yang
disengaja dan untuk menganalisis respons dalam tujuan, adalah mengumpulkan item
untuk satu tujuan bersama-sama, terlepas dari format item. Satu-satunya jenis item yang
akan menjadi pengecualian untuk strategi ini adalah pertanyaan esai panjang. Pertanyaan
semacam itu biasanya ada di akhir tes kepada peserta didik tersebut dalam mengelola
waktu mereka selama tes berlangsung. Sebuah tes yang diselenggarakan dengan cara ini
tidak semenarik yang diatur oleh format item, namun ini jauh lebih fungsional bagi
pelajar dan guru. Hal ini memungkinkan peserta didik untuk berkonsentrasi pada satu
area informasi dan keterampilan setiap saat, dan ini memungkinkan guru untuk
menganalisis kinerja individu dan kelompok secara obyektif tanpa terlebih dahulu
melakukan pengurutan ulang data.
20
MENULIS PETUNJUK. Tes harus mencakup petunjuk yang jelas dan singkat. Memulai
tes biasanya menyebabkan kecemasan di antara siswa yang akan dinilai berdasarkan
kinerja mereka dalam tes. Tidak ada keraguan dalam pikiran mereka tentang apa yang
harus mereka lakukan untuk melakukan tes dengan benar. Biasanya ada pengantar arah
ke seluruh tes dan arah bagian ketika format item berubah.
Sifat perubahan petunjuk tes sesuai dengan situasi pengetesan namun jenis
informasi berikut biasanya ditemukan dalam petunjuk tes sebuah judul tes yang
menyarankan konten tertutupi bukan hanya pretest atau "Test I": pernyataan singkat
tentang tujuan atau kinerja yang harus ditunjukkan: jumlah kredit yang akan diberikan
untuk jawaban yang benar sebagian, apakah siswa harus menebak jika mereka tidak
yakin akan jawabannya apakah kata-kata harus dieja dengan benar untuk menerima kredit
penuh; apakah siswa harus menggunakan nama mereka atau hanya mengidentifikasi diri
mereka sebagai anggota kelompok; apakah ada batas waktu, batas kata, atau batasan
ruang untuk tanggapan; dan apakah mereka memerlukan sesuatu yang istimewa untuk
menanggapi tes seperti pensil nomor 2, lembar jawaban dengan skor mesin, teks khusus,
atau peralatan khusus seperti kalkulator atau peta. Sulit untuk menulis petunjuk arah yang
jelas dan ringkas. Apa yang jelas bagi Anda mungkin membingungkan orang lain. Tulis
dan tinjau petunjuk dengan seksama untuk memastikan bahwa siswa memiliki semua
informasi yang mereka butuhkan untuk merespons dengan benar tes ini.
Mengevaluasi tes dan Item tes
Petunjuk uji dan item uji untuk tes objektif harus menjalani uji coba evaluasi
formatif sebelum benar-benar digunakan untuk menilai kinerja siswa. Item tes mungkin
tampak sangat jelas bagi orang yang menulisnya tapi sangat membingungkan individu
yang diminta untuk menanggapinya. Banyak hal bisa salah dengan tes. Guru harus
memastikan bahwa (1) petunjuk arah yang jelas, sederhana, dan mudah diikuti; (2) setiap
tes jelas dan disampaikan kepada siswa yang dimaksudkan untuk informasi atau
rangsangan yang diinginkan. (3) kondisi di mana tanggapan dibuat realistis; (4) metode
tanggapan jelas bagi siswa; dan (5) ruang, waktu, dan peralatan yang sesuai tersedia bagi
siswa untuk merespons dengan tepat.
21
Setelah menulis sebuah tes, guru harus mengelolanya kepada siswa atau individu
(bukan satu dari kelompok sasaran sebenarnya) yang akan membaca dan menjelaskan
dengan nyaring apa yang dimaksud dengan arah dan pertanyaan, dan menanggapi setiap
pertanyaan dalam format tanggapan yang dituju. . Dalam membangun sebuah tes, guru
secara tidak sadar dapat membuat kesalahan; dan evaluasi awal tes ini dapat mencegah
banyak momen kecemasan bagi siswa, waktu terbuang bagi siswa dan guru, bahkan hasil
tes yang tidak valid. Item bernomor yang salah akan menghasilkan jawaban acak pada
lembar jawaban. Hal yang sama berlaku untuk arah yang tidak jelas, contoh atau
pertanyaan yang membingungkan, dan kosa kata yang terlalu maju untuk siswa yang
sedang diuji. Evaluasi awal pengtes dengan setidaknya satu orang, dan lebih baik
beberapa orang, akan membantu menentukan kelemahan dalam pengtes atau item uji
individual yang dapat dikoreksi sebelum waktu tes.
Bahkan setelah tes benar-benar diberikan. guru harus menilai hasilnya untuk
kejelasan item. Uji item yang dilewatkan oleh sebagian besar siswa harus dianalisis. alih-
alih mengukur kinerja para siswa. Pertanyaan semacam itu mungkin menunjukkan
beberapa ketidakmampuan dalam item tes, petunjuk untuk menyelesaikan tes, atau
instruksi. Tes yang diduga harus dianalisis dan mungkin direvisi sebelum tes diberikan
lagi.
Masalah pengtes praktis ada untuk Guru yang harus menguji beberapa kelompok
siswa yang berbeda pada tujuan yang sama pada waktu yang sama atau dalam rentang
waktu singkat dalam satu hari atau minggu. Untuk menjamin integritas jawaban siswa,
guru mungkin perlu membuat beberapa versi posttest yang berbeda. Jadi, selain pretest
dan “the embedded test”, sebanyak lima atau enam versi posttest mungkin diperlukan.
Dalam situasi ini, guru mungkin ingin membuat beberapa item tes yang berbeda,
atau kumpulan item, untuk setiap tujuan kinerja. Bila ini dilakukan, guru perlu
memastikan bahwa semua barang yang dibangun untuk satu tujuan sejajar dan pada
tingkat kesulitan yang sama. Dengan menetapkan sebuah pertanyaan dalam situasi yang
tidak biasa atau menggunakan istilah yang lebih sulit, sulitnya item dapat ditingkatkan.
Hal ini dapat menyebabkan item untuk menilai perilaku selain yang dimaksudkan. Bila
banyak item yang berbeda digunakan, guru harus memastikan bahwa item sejajar dalam
22
menilai kinerja dengan tingkat kesulitan yang sama.
Saat membangun item uji - dan tes secara umum - guru harus mengingat bahwa tes
mengukur kecukupan (1) pengujian itu sendiri, (2) bentuk tanggapan, (3) bahan – bahan
pengajaran, (4) lingkungan pembelajaran dan situasi, dan (5) pencapaian siswa.
Semua saran dalam diskusi ini harus membantu dalam pengembangan kriteria -
yang dirujuk pada konstruktor uji beberapa referensi mengenai teknik pengtes disertakan
pada akhir bab ini. Mengembangkan Instrumen untuk Mengukur Pertunjukan, Produk,
dan Perilaku (Sikap).
Mengembangkan Instrumen yang digunakan untuk mengukur penampilan, hasil
dan Tingkah Laku (sikap)
Mengembangkan instrumen yang digunakan untuk mengukur keterampilan
psikomotor, perilaku produk tidak melibatkan item uji tulis per se. Sebagai gantinya, ini
memerlukan petunjuk untuk membimbing aktivitas peserta didik atau perilaku dan
panduan instrumen untuk memandu evaluasi kinerja, perilaku produk Anda.
MENULIS PETUNJUK Petunjuk kepada peserta didik untuk produk pertunjukan harus
secara jelas menggambarkan apa yang harus dilakukan dan bagaimana caranya. Setiap
kondisi pengeluaran seperti sumber daya atau batas waktu harus dijelaskan. Di arah
Anda, Anda juga perlu mempertimbangkan jumlah panduan yang diberikan. Satu sisi
mungkin diinginkan untuk mengingatkan peserta didik membentuk Langkah-langkah
tertentu dan memberi tahu mereka tentang kriteria yang akan kita evaluasi pekerjaan
mereka. Dalam kasus seperti itu (contoh: mengembangkan penelitian atau membuat
laporan lisan). peserta tes dapat diberi salinan daftar periksa evaluasi atau skala penilaian
yang akan digunakan untuk menilai pekerjaan mereka sebagai arahan. Dalam keadaan
lain (contoh: menjawab pertanyaan esai mengganti kelelahan). memberikan panduan
seperti itu akan mengalahkan tes tujuan. Faktor-faktor yang dapat Anda gunakan dalam
menentukan jumlah barang yang sesuai adalah sifat dari keterampilan yang diuji.
termasuk Kompleksitasnya, tingkat kecanggihan sasaran siswa, dan situasi alami yang
harus dipelajari adalah untuk mentransfer keterampilan.
23
Instruksi untuk peserta tes terkait dengan pengukuran sikap dari yang diberikan
untuk mengukur kinerja dan produk. Untuk evaluasi akun terhadap sikap, penting bagi
peserta tes untuk merasa bebas untuk "memilih" untuk berperilaku sesuai dengan sikap
mereka. Memeriksa yang sadar bahwa sedang diamati oleh atasan atau guru mungkin
tidak menunjukkan perilaku yang mencerminkan sikap sejati mereka.
Secara diam-diam mengamati karyawan, bagaimanapun, dapat menjadi masalah
dalam banyak situasi. Kesepakatan sering dilakukan antara karyawan dan pengusaha
mengenai siapa yang bisa dievaluasi, siapa yang bisa melakukan evaluasi, apa yang bisa
dievaluasi, apakah informasinya diinformasikan terlebih dahulu, dan bagaimana data
tersebut digunakan. Bahkan dengan keterbatasan yang dapat dimengerti ini, terkadang
dimungkinkan melalui perencanaan dan kesepakatan sebelumnya untuk menciptakan
situasi di mana penilaian sikap wajar yang masuk akal dapat terjadi.
MENGEMBANGKAN INSTRUMEN Selain menulis arahan untuk peserta didik, Anda
perlu instrumen pengembangan untuk memandu evaluasi kinerja, produk, atau perilaku
Anda. Langkah-langkah dalam mengembangkan instrumen adalah:
1. untuk mengidentifikasi elemen yang akan dievaluasi.
2. untuk parafrase (istilah linguistik yang berarti pengungkapan kembali suatu
konsep dengan cara lain dalam bahasa yang sama, namun tanpa mengubah
maknanya) masing-masing.
3. untuk mengurutkan elemen pada instrumen.
4. untuk memilih jenis penilaian yang akan dibuat oleh penilai, dan
5. untuk menentukan bagaimana Instrumen akan dinilai.
UNSUR Sama dengan item tes, unsur yang akan dinilai diambil langsung dari perilaku
yang termasuk dalam tujuan perilaku. Anda harus memastikan bahwa unsur yang dipilih
benar-benar dapat diamati selama pertunjukan atau produk. Setiap unsur harus
diparafrasekan untuk dimasukkan ke instrumen.
24
Waktu yang tersedia untuk pengamatan dan penilaian, terutama untuk kinerja
aktif, terbatas, dan deskripsi panjang seperti yang tercakup dalam tujuan akan
menghambat prosesnya. Seringkali hanya satu atau dua kata yang diperlukan untuk
mengkomunikasikan langkah atau segi produk atau kinerja ke penilai. Dengan parafrase,
juga penting untuk memberi tahu setiap Item sehingga respons "ya" dari penilai
menghasilkan hasil positif dan respons "tidak" mencerminkan hasil negatif. Perhatikan
contoh berikut untuk pidato lisan:
Salah
1. pertahankan kontak mata
2. Jeda dengan "dan, eh"
3. kehilangan pemikiran,
ide
Ya
No
Benar
1. Pertahankan kontak mata
2. Menghindari "dan, eh"
berhenti sebentar
3. Pertahankan pemikiran, ide
Ya
No
Dalam contoh yang salah, daftar perilaku yang diparafrasekan mencampur hasil
positif dan negatif yang akan sangat sulit untuk dinilai. Dalam daftar yang diparafrase
dengan benar, item diungkapkan sedemikian rupa sehingga respons "ya" adalah penilaian
positif dan respons "tidak" adalah negatif. Konsistensi ini akan memungkinkan saya
untuk memberikan peringkat "ya" untuk mendapatkan skor keseluruhan yang
menunjukkan kualitas kinerja atau produk.
Setelah urutan diparafrasekan, mereka harus diurutkan sesuai instrumennya. Yang
lain di mana mereka disertakan harus sesuai dengan tatanan asli oleh kejadian, jika ada.
Misalnya, daftar periksa evaluasi esai atau paragraf akan mencakup fitur yang terkait
dengan pendahuluan terlebih dahulu, hingga gagasan pendukung kedua, dan kesimpulan
terakhir. Langkah-langkah kronologis yang diperlukan untuk mengganti kelelahan harus
memandu urutan langkah pada daftar periksa. Urutan paling efisien untuk perilaku teller
niscaya akan menyapa pelanggan, melakukan bisnis. dan menyimpulkan transaksi.
25
Bila urutan kejadian atau komponen alami dapat diidentifikasi, strategi
pengurutan lainnya harus digunakan. Contoh mungkin mencakup pentingnya tindakan
atau komponen atau frekuensi terjadinya perilaku tertentu. Jika tidak ada urutan logis
untuk fitur daftar sudah jelas. Anda harus memeriksa produk sampel atau mengamati
beberapa pertunjukan untuk menentukan urutan paling efisien untuk komponen peristiwa
atau komponen. Anda mungkin menemukan bahwa satu-satunya urutan logis adalah
urutan alfabetis. Urutan yang dipilih harus memungkinkan penilai untuk menemukan
setiap unsur dengan cepat selama evaluasi.
MENGEMBANGKAN FORMAT JAWABAN Aktivitas keempat dalam
mengembangkan instrumen untuk mengukur kinerja, produk, atau perilaku adalah untuk
menentukan bagaimana penilai akan membuat dan mencatat penilaian. Setidaknya ada
tiga format tanggapan evaluator termasuk daftar tanggal cek (contoh: Ya atau tidak)
memerlukan tingkat diferensiasi kualitas (contoh: Miskin, memadai dan bagus); hitungan
frekuensi kejadian setiap unsur mempertimbangkan atau beberapa kombinasi dari format
ini. Modus respon penilai terbaik ditunjukkan pada beberapa faktor termasuk sifat dan
kompleksitas unsur yang dilayani; waktu yang tersedia untuk mengamati, membuat
penilaian yang menceritakan penghakiman; keakuratan atau konsistensi yang dengannya
penilai dapat menilai, dan kualitas umpan balik yang diberikan kepada peserta tes.
Daftar Periksa paling dasar dari tiga daftar format penilaian. Jika Anda memilih
daftar l, Anda dapat dengan mudah menyelesaikan instrumen Anda dengan memasukkan
dua kolom di samping masing-masing elemen yang diparafrase dan diurut untuk diamati.
Satu kolom jika untuk mengecek "ya" untuk menunjukkan setiap unsur ada. Perintahnya
adalah untuk mengecek "tidak" untuk menunjukkan tidak adanya ketidakmampuan unsur.
Manfaat daftar periksa mencakup jumlah unsur yang berbeda yang dapat diamati pada
waktu tertentu, kecepatan penyelesaiannya oleh evaluator, sistency atau reliabilitas
dengan penilaian mana yang dapat dilakukan, dan kemudahan skor keseluruhan dapat
dilakukan diperoleh. Satu pembatasan daftar periksa adalah tidak adanya informasi yang
diberikan kepada peserta tes tentang penilaian "tidak".
26
SKALA PENILAIAN Daftar cek dapat dikonversi ke skala penilaian yang memperluas
penilaian tingkat kualitas untuk setiap unsur diferensiasi kualitas yang mungkin
dilakukan. Alih-alih menggunakan dua kolom untuk unsur, setidaknya tiga digunakan.
Ketiga kolom ini bisa termasuk dieliminasi tidak hadir (0), sekarang (1), dan bagus (2);
atau buruk (1), memadai (2), dan baik Termasuk baik (0) atau (1) sebagai nilai terendah
tergantung pada apakah penilaian dapat benar-benar hilang dari produk atau pertunjukan.
Misalnya, beberapa tingkat kontak mata akan disajikan dalam laporan lisan, penilaian
terendah harus berupa 1. Sebuah paragraf bagaimanapun, sama sekali tidak memiliki
kalimat penutup; Dengan demikian skor 0 akan paling sesuai dalam jarak ini. Rating
tertentu yang dipilih bergantung pada sifat unsur yang akan dinilai.
Mirip dengan daftar cek, skala penilaian memiliki tingkat positif dan negatif. Sisi
positifnya, mereka memungkinkan evaluasi analitis terhadap subkomponen kinerja atau
produk, dan memberikan umpan balik yang lebih baik kepada peserta tes tentang kualitas
kinerja daripada yang dapat dilakukan oleh daftar cek. Di sisi negatifnya, mereka
membutuhkan lebih banyak waktu untuk menggunakan penyebab perbedaan yang lebih
baik harus dibuat mengenai kualitas setiap unsur yang diperiksa. Mereka juga dapat
menghasilkan skor yang kurang dapat diandalkan daridaftar periksa, terutama tingkat
kualitas lebih disertakan daripada yang dapat dibedakan dalam waktu yang tersedia atau
daripada yang dapat dilakukan secara konsisten. Bayangkan skala penilaian yang
mengandung 10 tingkat kualitas berbeda pada setiap skala unsur. Apa tepatnya perbedaan
antara rating 3 dan 4 atau rating 6 dan 7? Terlalu banyak lintang dalam membuat evaluasi
akan menyebabkan tidak konsisten baik di dalam maupun di antara evaluator.
Dua strategi perkembangan dapat membantu memastikan peringkat yang lebih andal
pertama adalah memberikan deskripsi verbal yang jelas pada setiap tingkat kualitas.
Sebagai gantinya hanya menggunakan kategori angka dan istilah umum seperti (1)
ketidakmampuan, (2) memadai, dan (3) bagus, Anda harus menggunakan deskriptor
verbal yang lebih tepat yang mewakili kriteria khusus untuk setiap tingkat kualitas.
Perhatikan contoh berikut yang berkaitan dengan kalimat topik dalam sebuah paragraf.
27
Umum
No Hilang Buruk Cukup Baik
1. kalimat topik 0 1 2 3
Improved
hilang Terlalu
luas/spesifik
Benar
spesifisitas
Benar spesifisitas &
nilai bunga
1. kalimat topik 0 1 2 3
Kedua skala respon memiliki empat tingkat keputusan. Contoh di atas berisi
deskriptor verbal untuk setiap penilaian, namun pertanyaan tentang apa yang merupakan
penilaian tropik yang buruk, memadai, dan bagus tetap tidak jelas. Dalam format
tanggapan di bagian bawah, kriteria untuk memilih setiap kualitas lebih jelas. Semakin
spesifik Anda bisa dalam menamai kriteria yang sesuai dengan setiap tingkat kualitas,
semakin dapat diandalkan Anda dapat mengukur kualitas unsur yang dinilai.
Strategi pengembangan kedua yang dapat Anda gunakan adalah membatasi
jumlah tingkat kualitas yang disertakan dalam setiap skala. Tidak ada peraturan yang
menyatakan bahwa semua unsur yang dinilai harus memiliki jumlah tingkat kualitas yang
sama, katakanlah skala 4 atau 5 poin. Jumlah level yang disertakan harus ditentukan oleh
kompleksitas unsur yang dinilai dan waktu yang tersedia untuk menilaiinya. Perhatikan
dua unsur berikut dari contoh paragraf.
Yes No
(1) (2)
1. Indentifikasi 1. indentasi 0 1 2 3
2. kalimat topik 2. kalimat topik 0 1 2 3
28
Dalam daftar cek di sebelah kiri, unsur masing-masing dapat dinilai berdasarkan
daftar ini dengan handal. Mengingat skala penilaian di sebelah kanan, Anda bisa melihat
masalah segera. Indentifikasi paragraf dan penulisan kalimat topik berbeda secara drastis
dalam kompleksitas keterampilan. Bayangkan mencoba untuk membedakan secara
konsisten empat tingkat yang berbeda dari seberapa baik sebuah paragraf diindentifikasi!
Namun, seperti yang ditunjukkan pada contoh sebelumnya, empat tingkat kualitas
kalimat topik yang berbeda akan masuk akal.
Aturan yang baik untuk menentukan ukuran skala untuk setiap unsur adalah
memastikan bahwa setiap jumlah level termasuk sesuai dengan kriteria spesifik untuk
membuat keputusan. Bila Anda kehabisan kriteria, Anda memiliki semua tingkat yang
dapat Anda menilainya secara konsisten.
MENGHITUNG FREKUENSI
format jawaban ketiga yang dapat digunakan evaluator dalam menilai produk,
kinerja, dan perilaku adalah jumlah frekuensi. Perhitungan frekuensi diperlukan bila
unsur yang diamati baik positif maupun negatif, dapat diulang beberapa kali oleh
pemeriksaan selama kinerja atau produk. Misalnya, pada produk seperti tulisan. Selama
pertunjukan seperti pertandingan tenis, service diulang berkali-kali, terkadang efektif dan
terkadang tidak. Dalam perilaku penilaian seperti yang dipamerkan oleh teller bank, teller
dapat diamati selama transisi dengan banyak pelanggan berbeda dan pada hari yang
berbeda. Perilaku positif dan negatif yang ditunjukkan oleh teller harus dihitung terjadi
pada pelanggan dan hari.
Alat penghitung frekuensi dapat dibuat dengan hanya menyediakan dan mengutip
ruang di samping setiap unsur untuk menghitung jumlah instance yang terjadi. Serupa
dengan daftar cek, bagian tersulit dalam pembuatan alat penghitung frekuensi adalah
mengidentifikasi urutan unsur yang harus diamati.
PROSEDUR PENCATATAN Kegiatan akhir membuat instrumen untuk
mengukur produk, kinerja, dan perilaku adalah untuk menentukan bagaimana instrumen
29
akan dinilai. Sama seperti dengan paper and pencil test, anda pasti akan membutuhkan
nilai tingkat objektif dan juga skor kinerja keseluruhan. Daftar cek adalah format
termudah dari tiga format instrumen. Namun, tanggapan untuk semua unsur yang terkait
dengan satu tujuan dapat dijumlahkan untuk mendapatkan skor tingkat objektif, dan
tanggapan "ya" dapat disimpulkan di instrumen tersebut mendapatkan penilaian
keseluruhan untuk peserta ujian pada tujuan.
Skor tingkat obyektif dapat diperoleh dari skala penilaian dengan menambahkan
mengumpulkan angka yang ditetapkan untuk setiap unsur yang dinilai dalam skor
objektif yang menunjukkan keseluruhan kinerja peserta ujian pada tujuan dapat diperoleh
dengan menjumlahkan peringkat individual di semua unsur yang termasuk dalam
instrumen.
Tidak seperti tes objektif, daftar cek, dan skala penilaian, menentukan dan sesuai
prosedur penilaian untuk instrumen hitungan frekuensi dapat menjadi tantangan. Prosedur
terbaik yang harus digunakan harus ditentukan berdasarkan situasi tertentu, dan
tergantung pada sifat keterampilan atau sikap yang diukur dan pada pengaturan.
Misalnya, saat menilai kinerja interaktif guru kelas atau tenaga penjualan, beberapa
contoh perilaku yang ingin Anda amati akan terjadi selama evaluasi, sementara yang lain
tidak melakukannya. Dalam kasus seperti itu Anda harus mempertimbangkan apakah
kurangnya kejadian adalah hasil negatif atau netral. Dalam situasi lain seperti tenis, Anda
akan memiliki banyak kesempatan untuk mengamati unsur seperti service dan reaktif
menghitung jumlah servis pertama yang ditempatkan secara strategis, kesalahan kaki,
atau membiarkan serves. Cukup mudah menghitung jumlah server yang dibuat oleh
pemain dan untuk menghitung proporsi keseluruhan server yang ditempatkan secara
strategis pertama kali berfungsi, kesalahan kaki, membiarkan servis, dan sebagainya.
Namun, begitu perhitungan ini dilakukan, Anda tetap harus memutuskan bagaimana
menggabungkan informasi ini untuk menciptakan skor pada sasaran pembelajaran yang
terkait dengan penyajian.
Terlepas dari bagaimana Anda memutuskan untuk mencetak instrumen hitungan
frekuensi penting yang Anda pertimbangkan selama proses pengembangan itu akan
30
dilakukan dan bandingkan konsekuensi dari penilaian satu cara alternatif. Cara yang
Anda butuhkan untuk mencetak instrumen mungkin memerlukan modifikasi pada daftar
unsur yang ingin Anda amati; Oleh karena itu, prosedur penilaian harus direncanakan
sebelum mulai menilai kinerja peserta didik. Bila tidak ada prosedur penilaian yang layak
dapat ditemukan untuk instrumen hitungan frekuensi, Anda dapat mempertimbangkan
kembali baik menggunakan daftar cek, skala penilaian, atau format kombinasi.
EVALUASI INSTRUMEN Petunjuk dan instrumen uji untuk mengevaluasi
pertunjukan, produk, dan perilaku juga harus dievaluasi secara format sebelum benar-
benar digunakan untuk mengevaluasi pekerjaan peserta ujian. Sama seperti denganpaper
and pencil test, Anda harus memastikan bahwa petunjuknya jelas bagi pelajar dan bahwa
peserta didik dapat mengikuti arahan untuk menghasilkan kinerja atau produk yang
diantisipasi.
Anda juga harus mengevaluasi kegunaan instrumen evaluasi. Kriteria khusus
untuk digunakan dalam mengevaluasi unsur-unsur yang termasuk dalam instrumental
adalah (1) pengamatan masing-masing unsur untuk diadili, (2) kejelasan cara di mana
mereka diparafrasekan, dan (3) pengaturan efisiensi urutan. Terkait dengan format
tanggapan evaluator, Anda harus memeriksa, apakah kategori dan kriteria tanggapannya
masuk akal dalam hal jumlah dan jenis penilaian yang perlu Anda buat dan waktu yang
tersedia untuk Anda amati, hakim, dan tandai penghakiman. Jika Anda tidak dapat
"menjaga" dengan pemain, keakuratan penilaian Anda akan terpengaruh.
Keandalan penilaian yang dibuat harus dievaluasi. Hal ini dapat dilakukan dengan
menilai kinerja atau produk yang sama dua kali atau lebih dengan interval waktu
intervensi. Hal ini juga dapat diperiksa dengan meminta dua atau lebih evaluator
menggunakan instrumen tersebut untuk menilai kinerja atau produk yang sama. Ketika
beberapa penilaian diperoleh dari satu evaluator pada satu produk, instrumen harus
direvisi. Area instrumen untuk dipertimbangkan kembali adalah jumlah unsur yang harus
dinilai, jumlah tingkat penilaian yang akan dibuat, dan kejelasan kriteria untuk setiap
tingkat. Jumlah unsur yang harus diperhatikan dan jumlah kategori penilaian harus
dikurangi ke titik di mana konsistensi penilaian dibuat dengannya.
31
Akhirnya, Anda harus mengevaluasi strategi penilaian Anda. Menggunakan data
yang Anda kumpulkan selama evaluasi formatif instrumen, menggabungkan atau
meringkas nilai tingkat unsur seperti yang direncanakan. Tinjau kembali skor gabungan
ini dalam hal tingkat objektif dan keseluruhan kinerja. Apakah skor itu logis dan bisa
ditafsirkan? Bisakah mereka digunakan untuk mengevaluasi bagian instruksi dan kinerja
tertentu? Jika tidak, ubah prosedur penilaian dan / atau penilaian sampai diperoleh data
yang dapat digunakan.
Tes Berdasarkan Kriteria dan Tes yang Dirujuk Normatif
Perbedaan utama antara tes berdasarkan kriteria dan tes yang dirujuk referensi
terletak pada bagaimana kinerja siswa pada tes ditafsirkan. Dalam kriteria tes yang
direferensikan, kinerja semua siswa dalam kelompok dibandingkan dengan jumlah
kemampuan awal atau tujuan yang disahkan. Misalnya, jika sebuah, sumpah 80 persen
item benar ditetapkan sebagai kriteria untuk lulus. Kemudian setiap kinerja siswa ditinjau
berdasarkan kriteria 80 persen. Adalah mungkin bagi semua siswa dalam kelompok untuk
melampaui kriteria juga mungkin bahwa tidak ada siswa yang melampaui kriteria yang
ditentukan.
Interpretasi norma yang direferensikan di sisi lain, membandingkan kinerja siswa
satu sama lain. Peringkat atau posisi siswa dalam kelompok adalah titik acuan untuk
menentukan kualitas kinerja daripada proporsi tujuan yang ditetapkan.
Kinerja tes siswa dapat dijelaskan baik dalam kriteria yang dirujuk dan norma
yang dirujuk. Kriteria perbandingan yang diacu adalah bahwa seorang siswa menjawab
85 persen item dengan benar sedangkan deskripsi yang dirujuk norma adalah bahwa
kinerja ini, 85 persen benar sama atau melebihi 90 persen anggota kelas. Satu metode
membandingkan kinerja siswa dengan isi tes dimana membandingkan kinerja siswa
lainnya dengan siswa lain dalam kelompok.
Pengujian yang dikembangkan hanya dengan menggunakan analisis instruksional
untuk item yang relevan yang dipilih untuk disertakan dalam pengujian dapat
diinterpretasikan dengan menggunakan kriteria yang direferensikan atau kriteria yang
32
dirujuk. Namun, ketika item dipilih untuk dimasukkan dalam pengujian dengan
menggunakan informasi sebelumnya tentang sifat statistik dari item, maka struktur dasar
pengujian yang berkaitan dengan analisis instruksional atau kerangka disiplin yang
mendasari mungkin telah disusupi. Memilih item untuk dimasukkan dalam tes
berdasarkan pada faktor kesulitan dan diskriminasi, walaupun item ini awalnya diambil
dari analisis instruksional yang dapat dibenarkan atau spesifikasi domain, kata kerangka
mengubah sifat pengujian dan membuatnya tidak dapat ditafsirkan sebagai kriteria tes
yang direferensikan untuk mencerminkan secara akurat. kinerja siswa pada keterampilan
bawahan dalam analisis yang dibangun dengan hati-hati.
Praktek memilih item tidak hanya didasarkan pada domain, tetapi juga pada
properti statistik item yang dirancang untuk secara otomatis menciptakan variabilitas
(memaksimalkan kisaran skor pada item dan dengan demikian pengujian) dalam kinerja
siswa pada pengujian adalah strategi yang biasanya diterapkan dalam membangun
membuat tes standar. Meskipun banyak perusahaan tes standar meniadakan kriteria yang
direferensikan, atau tingkat penguasaan. Skor untuk tes mereka, perancang dan guru
harus diingat bahwa skor ini merupakan perkiraan dari konten sejati dan status keahlian
structor dan tidak harus merupakan cerminan. Pengetahuan dan keterampilan siswa
terhadap keseluruhan analisis instruksional, Ada kemungkinan untuk menafsirkan nilai
tes standar sebagai kriteria yang direferensikan walaupun laporan tersebut dilaporkan
oleh perusahaan uji dapat dipertanyakan.
Untuk menentukan apakah tes standar adalah kriteria tes yang direferensikan atau
abstraksi, Anda hanya perlu membaca manual administrator untuk mendapatkan
informasi tentang apakah faktor kesulitan dan diskriminasi item digunakan sebagai
kriteria untuk memilih Item untuk pengujian dan tentang rangkaian yang berlaku yang
digunakan untuk menulis barang.
Saat ini di bidang pendidikan, tes yang diacu oleh kriteria dirancang untuk
menilai kinerja siswa pada tujuan yang ditentukan. Hal ini menjadi praktik yang umum
untuk menggunakan tes yang mengacu kriteria yang sama ini tidak hanya untuk menilai
kemajuan individu, tetapi juga untuk membandingkan kinerja relatif siswa, seperangkat
33
tujuan perilaku. Ada banyak alasan untuk melakukan hal ini. Hasil komparatif digunakan
untuk menentukan siswa mana yang tidak lebih cepat, untuk menentukan kriteria mana
yang melampaui kriteria atau standar minimum, mengidentifikasi penempatan kelompok
pada keterampilan apa pun dalam suatu rangkaian, atau untuk memilih pembelajar yang
menonjol, rata-rata, atau kurang baik untuk program khusus.
Meskipun tes yang direferensikan kriteria sekarang digunakan untuk
perbandingan normatif dengan atau di antara kelompok-kelompok, dan walaupun kinerja
suatu kelompok, pada suatu waktu mungkin menyerupai kurva normal pada seperangkat
tujuan, metode di mana item untuk kriteria- Uji yang direferensikan dibuat dan dipilih
berbeda dari yang digunakan untuk menyusun apa yang secara tradisional disebut uji
referensi yang dirujuk.
Contoh
Item uji harus konsisten dengan tujuan perilaku yang telah mereka tulis untuk
diukur. Kinerja yang dibutuhkan dalam tes Item harus sesuai dengan kinerja yang
ditunjukkan dalam tujuan. Contoh Item dalam bagian ini didasarkan pada tujuan
informasi verbal pada Tabel 6, tujuan keterampilan intelektual pada Tabel 6.2,
keterampilan psikomotorik pada Tabel 6.3, dan tujuan sikap pada Tabel 6.5.
Item untuk Informasi Verbal
Tabel 7.2
Test item untuk tujuan informasi verbal dalam tabel 6.1
Tujuan kinerja Item uji parallel
5.1 Mengingat istilah subjek, tentukan
istilahnya. Definisi harus menyertakan
bahwa subjek menyebutkan sebuah
topik.
1. Tentukan bagian subjek kalimat.
2. Apa yang dimaksud dengan bagian
subjek dari sebuah kalimat?
3. Bagian subjek dari sebuah kalimat
nama .......
34
5.2 Dengan istilah predikat, tentukan
istilahnya. Definisi harus mencakup
bahwa predikat tersebut mengatakan
sesuatu tentang subjek atau topik.
1. Tentukan bagian predikat sebuah
kalimat.
2. Apa yang dimaksud dengan bagian
predikat kalimat?
3. Bagian predikat kalimat menceritakan
sesuatu tentang .......
5.4 Mengingat istilah kalimatnya lengkap.
Tentukan konsepnya. Definisi harus
menyebutkan subjek dan predikatnya.
1. Tentukan kalimat yang lengkap.
2. Unsur apa yang mengandung kalimat
lengkap?
3. Kalimat lengkap mengandung
keduanya (n) .... Dan a (n) ... ..
5.6 Dengan istilah deklaratif kalimat dan
tujuan, nyatakan tujuan sebuah kalimat
deklaratif. Tujuannya harus mencakup
menyampaikan / memberi tahu
informasi.
1. Apa tujuan kalimat deklaratif?
2. Tujuan untuk kalimat deklaratif adalah
untuk ... ..
5.8 Dengan istilah deklaratif kalimat dan
penutup tanda baca. Periode sebagai
tanda baca penutupan. Istilah periode
harus dieja dengan benar.
5.1 Tanda baca penutup yang digunakan
dengan kalimat deklaratif disebut ….
5.2 Kalimat deklaratif ditutup
menggunakan tanda baca?
Dua atau lebih item uji disertakan pada Tabel 7.2 untuk masing-masing tujuan
pada Tabel 6.1. Perhatikan bagaimana kondisi dan perilaku bagian dari tujuan digunakan
untuk memandu pembangunan barang. Key stimuli atau isyarat yang diresepkan dalam
kondisi muncul di setiap pernyataan atau pertanyaan. Perilaku yang ditentukan dalam
tujuan sesuai dengan perilaku yang dibutuhkan dalam item. Karena tujuannya dengan
jelas menentukan fitur dari item ini, item apa pun yang akan Anda bangun untuk tujuan
yang sama ini akan serupa dengan yang telah dikembangkan. Perhatikan bahwa hanya
jawaban singkat, penyelesaian, atau item isi-dalam-kosong yang digunakan. Berdasarkan
35
kondisi dan perilaku yang ditentukan, item respons alternatif seperti pilihan ganda dan
item yang cocok bukanlah yang paling sesuai, walaupun konstruksinya relatif mudah.
Item Tes untuk Kecakapan Intelektual
Tabel 7.3 berisi item uji yang sejajar dengan tujuan keterampilan intelektual yang
terdapat pada Tabel 6.2. Dalam menganalisis contoh-contoh item ini, periksa apakah
siswa tersebut adalah: (1) mengingat materi yang ditentukan dalam kondisi bagian dari
tujuan dan (2) diperlukan untuk merespons dengan cara yang ditentukan atau tersirat oleh
kata kerja dalam tujuan. Periksa juga untuk melihat apakah item amni disertakan untuk
mengukur ketrampilan. Beberapa item tes diperlukan untuk beberapa tujuan, sedangkan
hanya satu atau dua item yang dibutuhkan untuk beberapa hal.
Pertimbangkan tujuan 5.5.2 dan item uji yang sesuai pada Tabel 7.3 tujuan
menyatakan bahwa siswa diberi hukuman deklaratif yang lengkap dan tidak lengkap.
Untuk kalimat yang tidak lengkap, ada juga subjek yang hilang dan yang lainnya
kehilangan predikat. Enam item disediakan subjek mengukur tujuan ini: dua item, satu
dan tiga, lengkap: empat item tidak lengkap. Item dua dan lima hanya berisi subjek,
sedangkan item untuk dan enam hanya berisi predikat. Lebih banyak item dapat
dimasukkan untuk mengukur tujuan ini, namun enam item tampaknya merupakan jumlah
praktis minimum yang harus dipresentasikan.
Perhatikan bahwa untuk sebagian besar contoh, petunjuknya terpisah dari item.
Untuk memastikan arah itu jelas, keterampilan intelektual dilakukan terlebih dahulu.
Pernyataan ini diikuti dengan petunjuk tentang bagaimana menanggapi untuk
menunjukkan keahliannya. Lihatlah petunjuk untuk menjawab item yang terkait dengan
tujuan 5.3 sampai 5.7 dan 5.10. Sedikit informasi yang diberikan menunjukkan
kemampuan intelektual yang sebenarnya. Semua informasi yang tersisa memberikan
arahan tentang bagaimana menandai barang untuk menunjukkan keterampilan. Meskipun
ini tampaknya merupakan arah pengujian perbedaan yang jelas, fokus ini pertama pada
metode tanggapan dan kemudian (jika sama sekali) pada keterampilan bisa sangat
membingungkan bagi peserta didik.
36
Daftar cek untuk Evaluasi Keterampilan Motorik
Dalam mengukur kinerja keterampilan motorik, Anda memerlukan instruksi
untuk kinerja dan instrumen yang dapat Anda gunakan untuk mencatat evaluasi kinerja
Anda. Contoh yang diberikan didasarkan pada ban mobil yang mengubah sasaran
instruksional pada Gambar 5.5 dan tujuan kinerja yang sesuai yang tercakup dalam Tabel
6.3.
Petunjuk langsung untuk peserta ujian tercantum dalam Tabel 7.4. Arahnya
sedikit berbeda dari tujuan akhir pada Tabel 6.3. Untuk pemeriksaan, mobil tidak akan
memiliki ban kempes tertentu. Sebagai gantinya, peserta didik mengganti ban yang
ditunjuk oleh pemeriksa, bayangkan masalah logistik karena harus mengevaluasi 20 atau
20 siswa tentang keterampilan ini dan harus melakukan uji pantai dengan ban kempes di
mobil. Informasi lain yang termasuk dalam instruksi juga didasarkan pada kepraktisan
dalam mengelola tes.
Tabel 7.3
Item tes parallel untuk ketrampilan intelektual objektive
Tujuan kinerja Uji item pararel
5.3 Dengan beberapa kalimat deklaratif
yang Lengkap dan sederhana,
cari semua subjek dan predikat
Arah: cari subjek dan predikat dalam kalimat
berikut.
Menggambar satu baris di bawah subjek dan
dua baris di bawah predikat di setiap kalimat
1. Karnaval itu sukses melonjak
2. Tim sepak bola adalah victorius
musim ini
3. Susan mendapat pekerjaan setelah
sekolah menyiangi tempat tidur bunga
37
4. Ayah george senang dengan
rapornya
5.5.1 Dengan beberapa kalimat deklaratif
yang lengkap dan tidak lengkap, cari
semua yang lengkap
Arah: cari kalimat lengkap. Tempatkan X di
tempat sebelum setiap indera lengkap
1. John mengikutinya dengan seksama
2. Tim yang paling bersemangat
3. Anjing-anjing itu tersentak dan
terbentur tanah yang membeku
4. Menemukan teman yang hilang
5. Senang melihatnya tanaman di
kebun
5.5.2 Dengan beberapa kalimat deklaratif
yang lengkap dan tidak lengkap,
temukan semua subjek yang hilang
dan semua predikat yang hilang
Arah: cari subjek dan predikat yang hilang,
letakkan P sebelum semua item yang hilang
dari predikat. Tempatkan S sebelum semua
item yang hilang dalam subjek
5.1 John mengikutinya dengan seksama
5.2 Tim yang paling bersemangat
5.3 Anjing-anjing itu bergabung dan
menabrak tanah yang beku
5.4 Menemukan teman yang hilang
38
senang menjadi dirinya
5.5 Tanaman di kebun
5.6 Dimainkan di pantai sepanjang hari
5.7 Diberikan beberapa kalimat sederhana
lengkap yang mencakup deklaratif.
Kalimat interogatif dan seruan yang
ditutup dengan benar atau salah
dengan menggunakan suatu periode.
Cari semua yang deklaratif.
Petunjuk: cari kalimat deklaratif yang sesuai
dengan huruf D di ruang sebelum kalimat
yang bersifat deklaratif.
1. Kocok stempel di sudut kanan atas
amplop
2. Apakah kamu lapar
3. Sarah memilih buku misteri
4. Hutan tampak sepi dan damai
5. Wow, lihat api itu
6. Beberapa burung tidak bermigrasi
7. Burung mana yang bermigrasi
39
5.9 Diberi ilustrasi aperiod, koma, tanda
seru, dan tanda tanya, istilah kalimat
deklarasi dan tanda baca penutup.
Pilih periode
Lingkari tanda baca penutup yang digunakan
untuk dan untuk kalimat desktop
1. .
2. !
3. ,
4. ?
3. Diberi beberapa kalimat deklaratif
sederhana dengan tanda baca yang
benar dan salah. Pilih semua kalimat
deklaratif dengan tanda baca penutup
yang benar
Arah: cari tanda baca yang benar untuk
sebuah kalimat deklaratif. Letakkan huruf d di
tempat sebelum semua kalimat deklaratif
yang diakhiri dengan tanda baca yang benar
1. John suka membaca batu ruang
angkasa
2. Aku naik dua mil ke sekolah di bus
3. Saya mendapatkan nilai A dalam
tes mengeja.
4. Juanida sedang berpergian dengan
orang tuanya.
40
4. Tulislah kalimat deklaratif pada: (1)
topik yang ada dan (2) topic yang
dipilih siswa. Kalimat harus lengkap
dan sesuai periodenya
1. Petunjuk: tulislah lima kalimat
deklaratif yang menjelaskan
pertemuan hari ini
2. Petunjuk: tulislah 5 kalimat deklaratif
dengan pilihan topic kalian sendiri
bahwa siswa diharuskan untuk mengembalikan dan mengamankan semua perkakas,
peralatan, dan bagian-bagoannya ke tempat yang semestinya. Selagi membantu untuk
menjamin bahwa yang peserta ujian tahu bagiamana mengerjakan tugas tersebut, hal itu
juga menjamin bahwa peralatan dan mobil telah siap untuk peserta ujian berikutnya.
Informasi juga tersedia untuk para peserta ujian tentang bagaimana peforma akan di nilai.
Instruksi berikut ini memberitahukan peserta ujian bahwa untuk mendapatkan
penghargaan, mereka harus: (1) mengulangi tiap langkah, (2) melakukannya dengan
peralatan yang pantas, (2) menggunakan tiap peralatan dengan sesuai, dan (4) selalu
berhati-hati dalam melakukan tiap langkah. Diberikannya informasi ini, mereka akan
paham bahwa gagal dalam mengikuti satu dari 4 kriteria tadi akan mengakibatkan gagal
dalam menerima penghargaan untuk langkah tersebut. Mereka juga diberitahu bahwa
mereka bisa berhenti pada tiap poin selama tes berlangsung. Mengetahui bahwa hal
tersebut bisa terjadi, mengapa itu bisa terjadi, dan konsekuensi terjadinya hal itu akan
mengurai kegelisahan mereka jika mereka berhenti selagi tes berlangsung.
Penanda sementara yang bisa digunakan untuk mengevaluasi peformatermasuk didalam
table 7.5. hanya dua langkah utama, mengangkat mobil, yang diilustrasikan. Mengetahui
bahwa langkah utama berada di langkah 2 yang diberikan nomor secara konsisten dengan
langkah-langkah di dalam analisis prosedur (contoh 5.5) dan tujuan behavioralnya berada
41
di tabel 6.3. Daftar kriteria dari tiap tujuan berada di tabel 6.3 telah di uraikan dan di
susun secara berurut (a, b, c, dan seterusnya) untuk ditandai.
Berhubungan dengan format respon evaluasi, dua kolom telah disediakan. Sebuah format
alternative yang mana dianggap untuk diberikan 4 kolom kriteria selain dari tiap lang
seperti ilustrasi dibawah:
Proper:
Done? Tool? Use? Safety
a. Mencolokkan ganggang kabel secara aman
b. Memompa ganggang untuk mengangkat kabel
c. Melepas dan menurunkan kabel
x
x
x
x
?
?
x
?
?
x
?
x
Sebuah X di tiap kolom berindikasi bahwa kriteria tersebut sesuai. Hal itu menjadi lebih
pasti bahwa semua nama kriteria tidak sesusai untuk setiap langkah. Strategi format
seperti ini juga menghasilkan instrumen yang sangat tidak praktis. Untuk alasan tersebut,
format checklist atau penanda yang dipilih. Ini berarti, bagaimanapun, bahwa orang yang
mengevaluasi harus mengulangi kriteria yang sesuai dan menilai setiap langkah secara
keseluruhan. Akurasi yang kemungkinan akan terjadi harus di periksa selama ……..
Tabel 7.4
Arahan untuk tes skil psikomotorik (mengganti sebuah ban)
Menggunakan perlengkapan yang disediakan di bagasi mobil. Melepaskan apa
saja model ban yang didesign oleh instruktur. Mengganti ban tersebut dengan ban
cadangan yang aman berada di bagasi mobil. Tes akan selesai apabila anda telah: (1)
42
mengembalikan mobil keadaan aman untuk dikemudikan. (2) mengamankan semua
peralatan di dalam tempat yang sesuai dan dimasukkan kedalam bagasi mobil. (3)
mengamankan ban yang telah di lepas di tempat ban cadangan didalam bagasi mobil. Dan
(4) mengganti apasaja yang menutupi ban atau didalam bagasi yang mengganggu selama
tes berjalan.
Peforma anda untuk setiap langkah akan di nilai dengan 3 kriteria dasar. Yang pertama
adalah anda mengingat untuk melakukan tiap-tiap langkah. Kedua adalah anda
mengerjakan tiap hal dengan peralatan yang sesuai serca tindakan yang sesuai. Ketiga
adalah anda melakukan tiap langkah secara aman. Untuk alasan keselamatan, penguji
boleh memberhentikan anda di poin apa saja saat di ujian dan meminta anda untuk: (1)
melakukan langkah yang anda lupakan, (2) merubah tindakan yang mana anda
menggunakan peralatan atau menanyakan anda untuk mengganti peralatan anda, atau (3)
mengulangi langkah yang tidak dilakukan dengan aman. Jika hal ini terjadi, anda tidak
akan mendapatkan penghargaan untuk langkah tersebut. Bagaimanapun, anda akan
mendapatkan penghargaan untuk melakukan tiap tindakan secara benar setelah poin
tersebut.
Tabel 7.5
Checklist atau penanda sebagian untuk menilai skil psikomotorik (mengganti sebuah ban)
Nama
Karen
Hown
Tanggal 6-12 Nilai
1. Mengambil cadangan dan peralatan
2. Mengangkat mobil
mengecek operasi kabel
2.1 Memeriksa operasi kabel
a. memasang kabel secara aman
b. memompa ganggang untuk
Yes
No
43
mengangkat kabel
c. melepas dan menurunkan kabel
2.2 Posisi kabel
a. mengecek lokasi mobil dan
kestabilannnya
b. mengerek ulang lokasi mobil jika
diperlukan
c. menandai tempat untuk dipasangkan
kabel
d. menempatkan kabel di tempat yang
sesuai
2.3 memasang kabel ke mobil
a. mengangkat kabel kearah kerangka
b. mengevaluasi sentuhan antara
kabel/mobil
c. mengatur lokasi kabel jika diperlukan
2.4 menaruh penghalang diantara ban
a. menemukan penghalang yang sesuai
b. menaruh penghalang sebelum roda
c. menaruh penghalang dibelakang roda
3. Melepas ban
4. Mengganti ban
Dan seterusnya,
x
x
x
x
x
x
x
x
x
x
44
x
x
x
Langkah selanjutnya dalam mengembangkan instrument adalah untuk
menentukan bagaimana nilai siswa akan di jumlahkan. Hal ini ditentukan untuk
mendapatkan kedua nilai langkah utama (contoh mengangkat mobil) sama dengan nilai
total untuk tes. Untuk memfasilitasi rencana penilaian ini, halaman kosong di letakkan
pada bagian kiri dari setiap langkah utama. Total dari jumlah poin kemungkinnan berada
di langkah 2 adalah disimpan didalam kurung dibawah spasi. Poin nomor diperoleh oleh
tiap siswa bisa di tentukan oleh menghitung jumlah X didalam kolom Yes. Nilai ini bisa
disimpan dalam bagian kosong disamoing langkah utama 2. Sebagai contoh, anda bisa
melihat bahwa penguji mendapatkan 11 dari kemungkinan 13 poin. Jumlah dari poin
direkam untuk langkah utama di bagian kiri kolom akan menghasilkan total nilai dari tes.
Nilai akan direkam atau disimpan dibagian atas disamping nama. Total poin untuk tes
akan di rekam di dalam kurung dibawah nilai yang diperoleh.
Observasi terakhir harus dilakukan. Penilai harus menentukan bagaimana nilai
soal 2.2b dam 2.3c ketika tidak di sesuaikan untuk mobil dan kabel yang diperlukan. Satu
strategi boleh di taruhkan tanda X di dalam kolom untuk tiap langkah-langkah bahkan
ketika mereka tidak memerlukannya. Singkatnya meninggalkan kertas kosong atau
“tidak” di kolom mengindikasikan bahwa siswa melakukan sebuah eror.
INSTRUMEN UNTUK MENILAI KELAKUAN YANG BERHUBUNGAN
DENGAN SIKAP
Untuk menilai kelakukan dari sikap bisa disimpulkan, anda akan …. Atau ceklist,
tingkatan skala, atau hitungan frekuensi. Contohnya adalah berdasarkan ilustrasi di bab 2
dan tabel 6.5. karena …. Harus di nilai menggunakan beberapa contoh transaksi dengan
45
disesuakan frekuensi hitungannya format respon akan pastinya bekerja dengan baik.
Contoh instrumennya ada di tabel 7.6
Mengetahui bahwa di atas dari instrument ada ruang untuk mengidentifikasi kasir
dan tanggal dari observasi. Terdapat juga ruang atau bagian untuk …. Nomor dari
transaksi yang di obervasi. Informasi ini akan dibutuhkan nantinya untuk
menginterpretasi data. Terdapat juga ruang untuk merekam total …. Dari kelakuan positif
dan negative oleh kasir selama observasi.
Kelakuan tertentu yng dicari di uraikan lagi di kolom bagian kiri sama seperti
ceklis, terdapat 2 kolom respon untuk penilai. Perbedaannya hanyalah ruang yang
disediakan di contoh ini untuk……. Kelakuan selama beberapa perbedaan transaksi.
Dalam menentukan bagaimana menilai instrument nomor dari kelakuan yang dirasa
sebagai positif sebanyak (186), dan nomor yang dirasa negative sebanyak (19).
Keseluruhan dari jumlah data simulasi ini, menunjukkan bahwa kasir
berkelakuan dalam sikap pesuruh terhadap kostumernya dalam kebanyakan mayoritas.
Informasi ini bisa di interpretasikan dalam 2 cara, tergantung dari pengetahuan si kasir
dari observasi. Jika kasir tidak sigap pada observasi dan memilih untuk berprilaku seperti
itu, si penilai bisa mengetahui bahwa kasir tersebut pasti menampilkan sikap positif
dalam ….., pelayanan yang bersahabat. Sebaliknya, jika kasir sadar akan examinali maka
evaluator bisa menyimpulkan bahwa teller tahu bagaimana bersikap sopan selama
bertransaksi dengan konsumen dan memilih untuk melakukannya sambil memahami
pengamatan.
TABEL 7.6
alat penghitung frekuensi untuk mengevaluasi perilaku dari mana sikap akan disimpulkan
(layanan sopan santun)
A. pendekatan pelanggan dan kasir
IYA TIDAK
46
1. tersenyum lllll lllll lllll
2. memulai ucapan lisan lllll lllll lllll
3. personalisasi komentar lllll lllll lllll
4. alasan sendiri saat tertunda llll ll
5. bertanya tentang layanan lllll lllll llll l
6. hadir semua dalam antrean lllll lllll lll
7. lainnya
B. selama transaksi, kasir
1. mendengarkan dengan penuh perhatian lllll lllll lllll
2. meminta klarifikasi informasi lllll llll
3. menyediakan formulir yang dibutuhkan lllll llll
4. lengkap / amend bentuk lllll llll
5. menjelaskan perubahan yang dilakukan lllll llll
6. menjelaskan materi kembali lllll lllll ll lll
7. lainnya
C. pekerjaan penutup, kasir
1. bertanya tentang layanan lainnya lllll lllll lllll
2. mengatakan, "terima kasih" lllll lllll lllll
3. menanggapi komentar pelanggan lllll lllll lllll
4. membuat harapan penutup lllll lllll lllll
5. lainnya
Format tes objektif akan menjadi yang terbaik bagi banyak informasi verbal dan
tujuan keterampilan intelektual. Namun, Anda tetap harus memutuskan item objektif apa
yang formal paling sesuai dengan kondisi dan perilaku yang ditentukan. Item yang
obyektif harus ditulis untuk meminimalkan kemungkinan menebak jawaban dengan tepat,
dan harus ditulis dengan jelas sehingga semua rangsangan atau isyarat yang ditentukan
dalam tujuan ada pada item atau intruksi. Anda juga harus memutuskan berapa banyak
kemampuan yang Anda perlukan untuk mengukur kinerja secara memadai pada setiap
tujuan. Dalam menentukan jumlah barang yang akan diproduksi, Anda harus
mempertimbangkan berapa kali informasi atau keterampilan akan diuji. cukup banyak
barang untuk mendukung konstruksi pretest, tes tersemat, dan tes pasca harus diproduksi.
Bila memungkinkan, siswa harus diberi item yang berbeda setiap kali tujuan diukur.
Beberapa keterampilan intelektual tidak dapat diukur dengan menggunakan item uji
tujuan, contohnya termasuk menulis paragraf, membuat pidato yang persuasif, dan
menganalisis dan membandingkan fitur tertentu. keterampilan intelektual yang
menghasilkan produk atau kinerja, keterampilan psikomotorik, dan perilaku yang
berkaitan dengan sikap harus diukur dengan menggunakan tes yang terdiri dari intruksi
untuk siswa dan observasi instrumen untuk evaluator. Dalam membuat instrumen ini,
47
Anda harus mengidentifikasi, menguraikan, dan mengurutkan elemen yang dapat diamati
dari produk, kinerja, perilaku pr. Anda juga perlu memilih format penilaian yang masuk
akal untuk evaluator dan menentukan bagaimana instrumen akan dinilai.
Jika penting untuk mengevaluasi dan menyempurnakan item uji objektif, petunjuk
arah kepada peserta didik, dan instrumen untuk menilai produk, pertunjukan, atau
perilaku sebelum benar-benar digunakan untuk mengevaluasi kemajuan peserta didik
atau kualitas materi intruksi. Item uji dan instrumen evaluasi diatur oleh hukum murphy:
jika ada yang bisa salah, akan salah. Kriteria yang paling penting untuk menilai kualitas
item atau instrumen adalah kesesuaiannya dengan kondisi, perilaku, dan kriteria yang
ditentukan dalam tujuan. Penghakiman ini berkaitan dengan validitas konten item. Dosis
item mengukur apa itu soppo untuk mengukur? Kriteria terpenting kedua adalah
kesesuaian konteks bahasa, kondisi, dan kriteria yang digunakan untuk tingkat
kemampuan siswa targert. Kriteria penting lainnya adalah kelayakan penyelenggaraan tes
di lingkungan yang diberikan dan waktu yang tersedia. Jika Anda tidak memiliki barang
atau instrumen yang menghasilkan nilai tes yang valid dan reliabel, Anda tidak dapat
menggunakannya untuk menilai penguasaan siswa atas sasaran atau pengajaran
berkualitas.
Tentu saja, kualitas item dan instrumen Anda bergantung pada kualitas sasaran Anda,
yang pada gilirannya bergantung pada kualitas analisis instruksional dan pernyataan
tujuan Anda. Mengikuti bagian latihan dan umpan balik bab ini adalah bagian evaluasi
desain. Setelah meninjau item yang telah Anda kembangkan untuk tujuan Anda, Anda
harus menghentikan kemajuan dalam proses perancangan dan mengevaluasi keseluruhan
desain Anda sampai saat ini.
Setelah evaluasi desain secara keseluruhan, Anda dapat melanjutkan bab berikutnya
mengenai strategi instruksional. Selama tahap proses perancangan ini, Anda akan
menentukan tes apa yang akan disertakan dalam paket dan jam instruksional Anda. Pada
bab berikutnya mengenai pengembangan bahan ajar, Anda akan menggunakan contoh
benda tujuan dan rencana pengujian untuk membuat tes objektif yang akan Anda
butuhkan. Jika Anda telah mengembangkan instrumen dan bukan item yang obyektif,
Anda akan merencanakan bagaimana dan kapan menggunakan instrumen ini yang terkait
dengan strategi dan bahan ajar