teknik penskoran
TRANSCRIPT
1
BAB I
PENDAHULUAN
1.1 Latar Belakang
Guru adalah pendidik dan pengajar pada pendidikan anak usia dini jalur sekolah atau
pendidikan formal, pendidikan dasar, dan pendidikan menengah. Dalam menjalani
perannya sebagai seorang pendidik dan pengajar, guru juga berperan untuk menilai hasil
kinerja siswa atau mengolah skor hasil belajar siswa. Dilingkungan sekolah, kita melihat
pula bahwa pada waktu-waktu tertentu guru selalu mengadakan evaluasi. Kenyataan
yang biasa dilakukan di sekolah-sekolah Indonesia sampai dewasa ini ialah bahwa pada
akhir semester guru mengadakan ulangan-ulangan, pada akhir tahun mengadakan ujian-
ujian kenaikan kelas, dan pada akhir kelas tertinggi pada setiap taraf atau level
pendidikan, sekolah mengadakan ujian akhir (Evaluasi Belajar Tahap Akhir). Ulangan,
ujian kenaikan kelas, dan evaluasi belajar tahap akhir tadi, merupakan contoh tentang
evaluasi yang lazim dilaksanakan di setiap institusi pendidikan. Proses penilaian adalah
suatu proses membandingkan skor yang diperoleh tiap siswa dengan acuan yang dipakai
penilaian aturan patokan atau penilaian aturan normal (PAN atau PAP), yang hasilnya
berbentuk nilai dengan skala 0 – 10 atau A – E. Dalam proses tersebut dapat dilihat
bahwa penskoran atau scoring adalah pemberian angka-angka terhadap prestasi seseorang
sesudah melaksanakan suatu tugas tertentu. Setelah selesai pengukuran yang salah satu
alatnya biasa disebut tes, barulah dilakukan perbandingan hasil pengukuran yang
berbentuk biji/skor dengan acuan yang dipakai yang dihasilkan nilai tersebut kita kenal
dengan pemberian nilai atau granding.
Dalam pelaksanaan sehari-hari scoring dan granding disatukan atau tidak mengenal
pemisahan; pemberian biji/skor sekaligus berarti pemberian nilai. Sebagai hasilnya ialah
bahwa penilaian tersebut tidak comparable dan penafsiran terhadap nilai yang diberikan
dapat berbeda-beda. Untuk dapat melakukan evaluasi yang lebih memadai maka kedua
kegiatan tersebut harus dipisahkan artinya; granding baru dapat dilaksanakan setelah
skoring selesai, sehingga nilai tiap siswa dapat dibandingkan, penafsiran terhadap nilai
sama, sifat terbuka dapat terpenuhi, obyektivitas lebih terjamin. Apa yang telah
dicapai oleh siswa berupa skor mentah artinya skor i t u belum mempunyai makna
apa pun sebelum diolah lebih lanjut. Agar skor siswa bermakna, maka diperlukan
pengolahan lebih lanjut sehingga skor siswa dapat bermakna nilai, baik nilai kualitatif
1
maupun nilai kuantitatif. Oleh sebab itu, guru harus dapat memahami dan menguasai
lebih mendalam tentang teknik pengolahan skor hasil belajar untuk menunjang proses
pembelajaran dan sebagai alat untuk mengetahui sampai sejauh mana guru berhasil dalam
menranfer ilmu yang dimilikinya kepada siswa.
1.2 Perumusan Masalah
Apa saja jenis pendekatan dalam penilaian?
Apa perbedaan antara penilaian formatif dan sumatif?
Bagaimana cara mengolah hasil tes formastif dan sumatif?
Bagaimana cara menginterpretasikan skor hasil belajar?
1.3 Tujuan Penulisan
Dapat menyebutkan dan memahami dua jenis pendekatan dalam penilaian
Dapat membedakan penilaian formatif dan sumatif
Dapat mengolah hasil tes formatif dan sumatif
Dapat menginterpretasikan skor hasil belajar
1.4 Manfaat Penulisan
Agar mahasiswa dapat menyebutkan dan memahami dua jenis pendekatan dalam
penilaian
Agar mahasiswa dapat membedakan penilaian formatif dan sumatif
Agar mahasiswa dapat mengolah hasil tes formatif dan sumatif
Agar mahasiswa dapat menginterpretasikan skor hasil belajar
1
BAB II
PEMBAHASAN
2.1 Pendekatan – Pendekatan Dalam Penilaian
Dalam penafsiran hasil tes ada dua pendekatan penilaian yaitu Penilaian Acuan Patokan
(PAP) dan Penilaian Acuan Normatif (PAN)
1) Penilaian Acuan Patokan (PAP)
Suatu pendekatan penilaian yang memberikan penilaian terhadap hasil belajar peserta
didik dengan membandingkan skor yang didapat seorang siswa dengan suatu standar yang
sifatnya mutlak. Penilaian Acuan Patokan ini berusaha mengukur tingkat pencapaian tujuan
belajar siswa. Siswa yang tidak mencapai tujuan yang telah ditetapkan berarti ia gagal,
artinya pengajaran yang diberikan belum berhasil. Jadi, penilaian acuan patokan ini ditujukan
sudah atau belumnya siswa mencapai tujuan yang telah ditetapkan. Dengan kata lain
penilaian ini lebih mengutamakan apa yang dapat dilakukan oleh siswa, kemampuan apa
yang sudah dicapai, setelah mereka menyelesaikan satu bagian kecil dari keseluruhan
program.
Melalui pendekatan ini, guru dapat mengambil keputusan tindakan pengajaran. Jika hasil
belajar siswa belum mencapai tujuan dengan kriteria 85% dari target yang diharapkan, berarti
pengajaran itu gagal dan harus diulang kembali. Untuk tes seharusnya dapat menggambarkan
keseluruhan bahan pengajaran atau keseruluhan tujuan pengajaran.
Sebaiknya penilaian berdasarkan acuan patokan ini seyogyanya jangan digunakan dalam
pengolahan dan penentuan nilai hasil tes sumatif seperti pada ulangan umum dalam rangka
mengisi raport. Diantara kelemahan dari PAP ini adalah tidak mempertimbangkan
kemampuan kelompok, jadi besar kemungkinan ada siswa yang tidak dapat dinyatakan lulus
atau naik kelas. Kelemahan yang lain adalah apabila butir-butir soal yang diberikan dalam tes
terlalu sukar, maka tes tersebut betapapun pintarnya testee akan memperolah nilai yang
rendah, sebaliknya apabila butir soal yang dikeluarkan dalam tes terlalu mudah, maka
betapapun bodohnya testee akan berhasil memperoleh nilai yang tinggi sehingga gambaran
tingkat kemampuan testee yang sebenarnya tidak dapat diketahui. Batas kelulusan
berdasarkan pada PAP yaitu:
1
- Batas Lulus Purposif (BLP)
BLP saat ini digunakan pada jenjang pendidikan dasar dan menengah dalam
memberikan nilai pada siswa seperti yang tertera pada ruang lingkup penilaian oleh
pendidik yang menyatakan bahwa kegiatan yang dilakukan oleh pendidik pada tahap
analisis adalah menganalisis hasil penilaian menggunakan acuan kriteria yaitu
membandingkan hasil penilaian masing-masing peserta didik dengan standar yang telah
ditetapkan. Untuk penilaian yang dilakukan oleh pendidik hasil penilaian masing-masing
peserta didik dibandingkan dengan Kriteria Ketuntasan Minimal (KKM). Analisis ini
dimaksudkan untuk mengetahui kemajuan hasil belajar dan kesulitan belajar peserta
didik, serta untuk memperbaiki pembelajaran.
Dapat ditarik kesimpulan bahwa angka KKM adalah angka yang dipakai sebagai
batas minimum atau batas kelulusan atau batas ketercapaian yang menunjukkan seorang
siswa telah menguasai kompetensi yang ada dalam materi tes atau belum pada satu
satuan periode tertentu misalnya satu semester. BLP ini secara perhitungan relatif
mudah, karena nilai diambil langsung dari nilai mentah kemudian dibandingkan dengan
kriteria yang dipakai misalnya KKMmata pelajaran IPS dan lainnya.
PAP antara lain dimanfaatkan dalam:
Penentuan prestasi siswa dalam mencapai tujuan pengajaran.
Meneyeleksi siswa atas dasar kualitas prestasi.
Mengukur keefektifan pengajaran (metode, teknik, pemilihan bahan, penggunaan alat,
dan sebagainya).
Umpan balik bagi perbaikan pengajaran.
Mengetahui kelemahan/kesulitan siswa untuk pengajaran remedial.
PAP digunakan pada:
Tes akhir (sumatif).
Tes seleksi dengan acuan diluar kelompok, misalnya patokan tujuan yang harus
dicapai (standar tertentu).
Tes formatif (tes pembinaan dalam pengajaran), termasuk tes unit, postes ulangan
harian/formatif.
Tes diagnosis, mengetahui jenis dan penyebab kesulitan belajar siswa.
2) Penilaian Acuan Normatif (PAN)
PAN (Penilaian Acuan Patokan) adalah penilaian yang dalam menginterpretasi data hasil
pengukuran didasarkan pada pretasi anggota kelompok lainnya. Beberapa teknik analisis
1
yang bisa digunakan untuk mengolah data dengan pendekatan acuan patokan adalah deviasi
standar, mean, standar skor, rank, persentil dan sejenisnya. Bentuk acuan tersebut salah
satunya yang paling sering dipakai dalam dunia pendidikan adalah batas kelulusan (passing
grade). Berdasarkan pada PAN ada dua jenis batas kelulusan yaitu:
- Batas Lulus Aktual (BLA)
BLA didasarkan atas nilai rata-rata aktual atau nilai rata-rata yang dapat dicapai oleh
suatu kelompok siswa yang mengikuti tes/ulangan.
- Batas Lulus Ideal (BLI)
BLI hampir sama dengan BLA yaitu menentukan rata-rata ideal dan simpangan baku
(SD) ideal. Perbedaannya dalam mencari rata-rata dan SD tidak perlu memakai formula
tetapi dipakai ketetapan sebagai berikut: rata-rata ideal (X ideal)=V2 dari skor
maksimum yang mungkin dicapai. Simpangan baku (SD) = 1/3 dari rata-rata ideal (X
ideal).
Suatu cara membandingkan skor yang didapat oleh seorang peserta didik dengan skor
yang didapat oleh peserta didik lainnya dalam kelompok tes yang diberikan. Penilaian Acuan
Norma (Norm Referenced Evaluation) dikenal pula dengan Standar Relatif atau Norma
Kelompok. Pendekatan penilaian ini menafsirkan hasil tes yang diperoleh testee dengan
membandingkan dengan hasil tes dari testee lain dalam kelompoknya. Alat pembanding
tersebut yang menjadi dasar standar kelulusan dan pemberian nilai ditentukan berdasarkan
skor yang diperoleh testee dalam satu kelompok. Dengan demikian, standar kelulusan baru
dapat ditentukan setelah diperoleh skor dari para peserta testee.
Hal ini berarti setiap kelompok mempunyai standar masing-masing dan standar satu
kelompok tidak dapat dipergunakan sebagai standar kelompok yang lain. Standar dari hasil
tes sebelumnya pun tidak dapat dipergunakan sebagai standar sehingga setiap memperoleh
hasil tes harus dibuat norma yang baru. Dasar pemikiran dari penggunaan standar PAN
adalah adanya asumsi bahwa di setiap populasi yang heterogen terdapat siswa dengan
kelompok baik, kelompok sedang dan kelompok kurang. Pengolahan skor dengan Penilaian
Acuan Norma (PAN) mengharuskan kita menghitung dengan statistik. Cara perhitungan
menggunakan statistik yang cukup kompleks dan beberapa kurva normal. Menggunakan
perhitungan perentase atau rumus-rumus sederhana.
PAN antara lain dimanfaatkan dalam:
Mengklasifikasi siswa dalam kelompoknya.
Menentukan peringkat siswa dalam grupnya.
1
Menyeleksi siswa berdasarkan prestasi apa adanya dan pembanding anggota
kelompoknya.
PAN digunakan pada:
Tes akhir (sumatif).
Tes seleksi dengan acuan intra kelompok (situasi pada kelompok tersebut).
Tes prognostik, yang bertujuan membuat ramalan (dasar: apabila seseorang
menduduki tempat yang sama, semakin tampaklah tingkat kemampuan orang
tersebut).
Kelemahan sistem PAN adalah dengan tes apapun dalam kelompok apapun dan dengan
dasar prestasi yang bagaimanapun, pemberian nilai dengan sistem ini selalu dapat dilakukan.
Karena itu penggunaan sistem PAN dapat dilakukan dengan baik apabila memenuhi syarat
yang mendasari kurva normal, yaitu:
Skor nilai terpencar atau dapat dianggap terpencar sesuai dengan pencaran kurva
normal
Jumlah yang dinilai minimal 50 orang atau sebaiknya 100 orang ke atas.
Penilaian Acuan Norma ini berdasarkan pada asumsi yaitu:
a. Psikologis, artinya semua peserta didik memiliki kemampuan yang sama, adanya
perbedaan kemampuan Intelegensi Question, latar belakang pendidikan, dan lain-lain.
b. Tujuan penilaian hasil belajar adalah untuk melihat dan menentukan kedudukan
seseorang peserta didik dari teman atau kelompoknya, apakah ia berada pada posisi
“atas” di “ tengah” dan di “ bawah”.
c. Penilaian ini digunakan apabila pendidik menghadapi kurikulum yang bersifat
dinamis, artinya materi pelajaran yang dikembangkan selalu berubah sesuai dengan
tuntutan zaman, sehingga peserta didik agak sulit menetapkan kriteria benar atau
salah.
d. Tujuan pembelajaran tida ditekankan pada penguasaan materi atau keterampilan
tertentu, melainkan untuk mengembangkan kreatifitas individual, kemampuan
apersepsi, serta kemampuan berkompetensi antar sesama peserta didik.
e. Penggunaan acuan ini sangat dependen dengan jenis kelompok, tempat, dan waktu.
Kelompok yang homogen akan berbeda dengan yang heterogen, kelompok belajar di
kota akan berbeda dengan kelompok belajar di daerah terpencil. Oleh karena itu
penilaian acuan norma ini adalah menilai kemampuan rata-rata kelompok, kemudian
individu diukur seberapa jauh penyimpangan terhadap rata-rata tersebut. Hal ini
1
berarti tes tersebut dapat memberikan gambaran diskriminatif antara kemampuan
peserta didik yang pandai dengan yang bodoh.
Perbedaan Pendekatan PAP dan PAN
Penilaian dengan pendekatan PAP dan PAN merupakan dua pendekatan yang berbeda
atau bertentangan. Adanya perbedaan ini menyebabkan kita harus mengetahui dan
memahami karakteristik dari kedua pendekatan tersebut.
PAN (Penilaian Acuan Norma) PAP (Penilaian Acuan Patokan)
1. Berfungsi untuk menetapkan
kedudukan relatif seorang siswa di
dalam kelas
2. Tujuan pembelajaran dinyatakan
secara umum atau khusus
3. Belajar tuntas tak begitu diutamakan
4. Tes atau pernyataan harus
mencakup tingkat kesukaran yang
bervariasi dari yang mudah, sedang,
dan sulit
5. Skor-skor diolah dengan
menggunakan statistik seperti mean,
standar deviasi dan lain-lain
6. Tepat dipakai untuk tes penempatan
dan tes sumatif
7. Hasil penilaian tepat ditransformasi
dalam skala harus seperti A, B, C,
D, dan E
1. Berfungsi menetapkan apakah siswa
telah mencapai atau menguasai
tujuan yang diharapkan
2. Tujuan pembelajaran harus
dinyatakan secara khusus
3. Sangat mengutamakan adanya belajar
tuntas
4. Penyusunan soal lebih
mengutamakan pada performance
dan kemampuan yang harus dikuasai
5. Tidak selalu skor diolah dengan
menggunakan statistik
6. Tepat dipakai untuk diagnostik dan
tes formatif
7. Hasil penilaian tepat dinyatakan
dalam bentuk pernyataan sangat
memuaskan, cukup, kurang, dan
gagal.
Tabel Perbedaan PAN dan PAP
2.2 Penilaian Formatif dan Sumatif
Penilaian Formatif
Kata formatif bersal dari kata dalam bahasa Inggris “to form” yang berarti
membentuk. Tes formatif dimaksudkan sebagai tes yang digunakan untuk mengetahui
1
sejauh mana siswa telah terbentuk setelah mengikuti proses belajar mengajar. Setiap
program atau pokok bahasan membentuk prilaku tertentu sebagaimana dirumuskan
dalam tujuan pembelajarannya. Tes formatif diujikan untuk mengetahui sejauh mana
proses belajar mengajar dalam satu program telah membentuk siswa dalam prilaku
menjadi tujuan pembelajaran program tersebut. Setiap akhir program atau pokok
bahasan, siswa dievaluasi penguasaan atau perubahan prilakunya dalam pokok bahasan
tersebut. Evaluasi dilakukan berdasarkan hasil pengukuran yang dilakukan menggunakan
tes formatif.
Tes formatif dalam praktik pembelajaran dikenal sebagai ulangan harian. Dalam
perencanaan pengajaran, komponen-komponen dan proses pembelajaran untuk satu
pokok bahasan direncanakan dalam sebuah satuan pembelajaran. Oleh karenanya dalam
satuan pembelajaran termuat komponen-komponen seperti tujuan pembelajaran, materi,
metode, strategi pembelajaran, media dan evaluasi. Evaluasi yang direncanakan dalam
satuan pembelajaran merupakan evaluasi yang dilakukan berdasarkan tes formatif.
Penilaian Formatif, yakni penilaian yang dilakukan pada setiap akhir satuan
pelajaran, dan fungsinya untuk memperbaiki proses belajar-mengajar atau memperbaiki
program satuan pelajaran.
Cara Menilai Tes Formatif
Tes formatif adalah tes yang diberikan kepada murid-murid pada setiap akhir program
satuan pelajaran. Fungsinya untuk mengetahui sampai di mana pencapaian hasil belajar
murid dalam penguasaan bahan atau materi pelajaran yang telah diberikan sesuai dengan
tujuan instruksional khusus yang telah dirumuskan di dalam satuan pelajaran tersebut.
Dalam penilaian formatif ini, jika tujuan-tujuan instruksional khusus telah dirumuskan
dengan tepat, distribusi tingkat kesukaran soal-soal (item tes) dan daya pembeda masing-
masing soal (discriminating power of a test item) tidak begitu penting. Yang penting
adalah bahwa setiap soal betul-betul mengukur tujuan instruksional yang hendak dicapai
yang telah dirumuskan di dalam program satuan pelajaran.
Penilaian Sumatif
Kata sumatif berasal dari kata dalam bahasa Inggris yaitu “sum” yang artinya jumlah
atau total. Tes sumatif dimaksudkan sebagai tes yang digunakan untuk mengetahui
penguasaan siswa atas semua jumlah materi yang disampaikan dalam satuan waktu
tertentu seperti caturwulan atau semester. Setelah semua materi selesai disampaikan,
maka evaluasi dilakukan atas perubahan perilaku yang terbentuk pada siswa setelah
1
memperoleh semua materi pelajaran. Evaluasi dilakukan berdasarkan hasil pengukuran
menggunakan tes sumatif. Dalam praktik pengajaran tes sumatif dikenal sebagai ujian
akhir semester atau caturwulan tergantung satuan waktu yang digunakan untuk
menyelesaikan materi.
Skor hasil pengukuran yang merupakan data hasil belajar yang dikumpulkan dari
proses testing belum dapat digunakan untuk membuat pengambilan keputusan. Untuk
dapat digunakan sebagai dasar pengambilan keputusan maka skor tersebut harus terlebih
dulu diubah menjadi nilai dalam poses penilaian.
Nilai merupakan hasil dari proses penilaian. Nilai diperoleh dengan mengubah skor
dengan skala dan acuan tertentu. Oleh karena itu, nilai hanya dapat dimaknai dan
digunakan sebagai dasar pengambilan keputusan dengan memerhatikan skala dan acuan
yang digunakan.
Penilaian Sumatif, yakni penilaian yang dilakukan tiap caturwulan atau semester
(setelah siswa menyelesaikan suatu unit atau bagian dari mata pelejaran tertentu),
berfungsi untuk menentukan angka atau hasil belajar siswa dalam tahap-tahap tertentu.
Cara Menilai Tes Sumatif
Tes sumatif biasanya diadakan tiap caturwulan sekali atau setiap semester. (Yang baik
adalah tiap jangka waktu tertentu bila suatu unit atau bagian bahan pelajaran telah selesai
diajarkan melalui satuan-satuan pelajaran). Fungsi tes sumatif ialah untuk menilai
prestasi siswa, sampai di mana penguasaan siswa terhadap bahan pelajaran yang telah
diajarkan selama jangka waktu tertentu. Kegunaannya antara lain untuk pengisian rapor,
penentuan kenaikan kelas, dan penentuan lulus-tidaknya siswa pada ujian akhir sekolah.
Pada umumnya jumlah item atau soal-soal tes sumatif lebih banyak daripada item tes
formatif, dan bentuk soalnya pun dapat terdiri atas campuran beberapa bentuk item tes
(seperti true-false, multiple choice, completion, matching, dan essay).
Aspek Tingkah Laku yang Dinilai
Penilaian sumatif diadakan untuk menilai hasil jangka panjang dari suatu proses
belajar-mengajar, aspek tingkah laku yang dinilai meliputi aspek kemampuan
(pengetahuan, keterampilan) maupun aspek nilai dan sikap yang dipandang sebagai hasil
belajar. Namun, tulisan ini lebih menitikberatkan pembahasan mengenai penilaian
terhadap hasil belajar dalam bentuk kemampuan penilaiannya dapat dilakukan dengan
menggunakan tes buatan guru.
Penyusunan Tes Sumatif
1
Penilaian ini dilakukan pada akhir unit pelajaran yang cukup panjang, tes hendaknya
lebih dititikberatkan pada penilaian terhadap aspek kemampuan yang lebih tinggi,
disesuaikan dengan tujuan instruksional umum. Bila aspek ingatan masih dirasakan
perlu, hendaknya diusahakan agar proporsinya lebih kecil dibandingkan dengan aspek-
aspek kemampuan yang lebih tinggi (pemahaman dan aplikasi).
Bahan Rincian Tes IPA
Kelas : ..........
Semester : ..........
Ruang LingkupTumbuhanHewanUdaraKesehatanAir Jumlah
AspekIngatan 4 3 5 2 4 18Pemahaman 8 6 8 4 6 32Aplikasi 8 6 7 4 8 33JUMLAH 20 15 20 10 18 83Untuk menjamin agar ruang lingkup bahan (daerah cukup) dan berbagai aspek
kemampuan dapat terangkum dalam tes sumatif, dalam merencanakan tes perlu dibuat
bahan rincian (layout) seperti di atas.
Aspek Uraian Contoh soal tes (matematika)
Ingatan Kemampuan untuk mengingat
dan menyatakan kembali apa-
apa yang telah dipelajari
sebelumnya.
Sebutkan unsur-unsur yang
terdapat di dalam suatu grafik.
Pemahaman Kemampuan untuk
menangkap arti suatu bahan
yang telah dipelajari yang
terlihat antara lain dalam
kemampuan seseorang
menafsirkan informasi,
meramalkan akibat suatu
peristiwa, dan kemampuan-
kemampuan lain yang sejenis.
Di bawah ini tercantum sebuah
grafik yang menggambarkan
laju pertambahan penduduk dari
tahun ke tahun. Coba buatlah
tafsiran singkat mengenai data
yang digambarkan oleh grafik
tersebut.
Aplikasi Kemampuan menggunakan
pengetahuan yang telah
dimiliki dalam memecahkan
Di bawah ini terdapat jumlah
penduduk pada setiap tahun,
dari tahun 1965 sampai dengan
1
persoalan atau situasi yang
baru.
1970. Coba buatlah grafik
pertambahan penduduk
berdasarkan angka-angka
tersebut.
Angka-angka di dalam kotak-kotak di atas menunjukkan jumlah soal yang
direncanakan untuk tes sumatif. Mengingatwaktu yang disediakan untuk melaksanakan
tes terbatas, jumlah soal tersebut di atas dapat dikurangi dengan jalan mengambil
cuplikan (sampel) dari setiap kotak sedemikian rupa sehingga proporsi antara berbagai
aspek dan ruang lingkup tetap.
Dalam tes sumatif, distribusi tingkat kesukaran soal-soal tes dan daya pembeda
masing-masing soal penting untuk diperhatikan, sebab, semakin bervariasi hasil tes
sumatif, semakin baik ditinjau dari fungsinya untuk pemberian angka, penentuan
kenaikan kelas, dan sebagainya. Perlu dipikirkan kemungkinan untuk mengembangkan
tes sumatif dalam bentuk tugas. Dengan memberikan sejumlah data, siswa ditugasi untuk
menyusun suatu program sederhana mengenai suatu topik tertentu yang mendorongnya
menerapkan berbagai pengetahuan yang dimilikinya dalam menghadapi tugas tersebut.
2.3 Pengolahan Hasil Tes Formatif dan Sumatif
Cara Mengolah Hasil Tes Formatif
1) Standar dan Cara Mengolah Hasil tes
Karena hasil penilaian formatif akan dijadikan dasar bagi penyempurnaan proses
belajar-mengajar, maka standar yang dipergunakan dalam mengolah hasil tes tersebut
adalah standar mutlak (criterion-refernced test). Tes ini bertujuan untuk mengetahui
sejauh mana tujuan-tujuan instruksional khusus telah dicapai oleh siswa, dan bukan
untuk mengetahui status setiap siswa dibandingkan dengan siswa-siswa lainnya dalam
kelas yang sama.
Ada dua jenis pengolahan yang diperlukan di dalam penilaian formatif ini, yaitu:
a) Pengolahan untuk mendapat angka presentase siswa yang gagal dalam setiap soal,
misalnya:
1
Soal Nomor % siswa yang gagal1 30%2 85%3 60%
dan sebagainya dan seterusnyaUntuk soal bentuk uraian, pengertian “siswa yang gagal” di atas diartikan
sebagai siswa yang jawabannya terhadap suatu soal dipandang kurang memuaskan.
b) Pengolahan untuk mendapat hasil yang dicapai setiap siswa dalam tes secara
keseluruhan ditinjau dari presentase jawaban yang memuaskan, misalnya:
Nama SiswaHasil yang dicapai
(% jawaban yang memuaskan)1. Hamid 90%2. Suwarni 50%3. Basiran 75%dan seterusnya
Sebagai contoh, bila skor maksimum yang harus dicapai dalam suatu tes adalah
60, angka yang dicapai Basiran dalam tes tersebut adalah:
4560
x 100% = 75%
Cara menilai tes formatif dilakukan dengan precentages correction (hasil yang
dicapai setiap siswa dihitung dari presentase jawaban yang benar).
Rumusnya adalah sebagai berikut:
Keterangan:
S : nilai yang diharapkan (dicari)
R : jumlah skor dari item atau soal yang dijawab benar
N : skor maksimum dari tes tersebut
2) Penggunaan Hasil tes
a. Implikasi hasil pengolahan setiap soal
Dengan mempertimbangkan hasil-hasil penelitian yang pernah dilakukan dalam
mengembangkan tes formatif, untuk menetapkan hasil pengolahan setiap soal hendaknya
diikuti ketentuan-ketentuan sebagai berikut:
S=RN
x 100
1
Bila mayoritas siswa (sekitar 60% atau lebih) gagal dalam mengerjakan suatu soal
tertentu, perlu diulang kembali pengajaran mengenai bahan yang berhubungan
dengan soal atau item tersebut, bagi seluruh kelas.
Bila kurang dari 60% siswa yang gagal mengerjakan suatu soal atau item tertentu,
pengulangan kembali bahan yang berhubungan dengan soal tersebut dapat dilakukan
sendiri-sendiri oleh siswa yang bersangkutan dengan petunjuk dan pengarahan dari
guru.
Catatan:
Bila presentase siswa yang gagal 60% atau lebih (seperti dikemukakan dalam
butir 1 di atas), untuk tahun berikutnya perlu pula dipertimbangkan penggunaan cara
yang lebih baik dalam mengerjakan bahan yang bersangkutan.
b. Implikasi hasil pengolahan setiap siswa
Dengan mempertimbangkan hasil-hasil penelitian yang telah dilakukan dalam
bidang mastery learning, untuk menetapkan hasil pengolahan setiap siswa dipergunakan
ketentuan-ketentuan sebagai berikut:
Bila hasil yang dicapai oleh siswa dalam tes adalah 75% atau lebih, siswa tersebut
dipandang telah menguasai bahan pelajaran yang bersangkutan dan siap untuk
mengikuti program atau satuan pelajaran berikutnya.
Bila hasil yang dicapai siswa kurang dari 75%, siswa tersebut masih dapat diizinkan
untuk mengikuti program atau satuan pelajaran berikutnya, tetapi kepada siswa
tersebut perlu diberikan perhatian atau bantuan khusus sehubungan dengan
kesulitan-kesulitan yang masih dialaminya.
Dari uraian di atas dapat disimpulkan bagaimana pentingnya peran penilaian formatif
(pada akhir setiap program atau satuan pelajaran) bagi penyempurnaan proses
belajar-mengajar untuk para siswa.
Cara Mengolah Hasil Tes Sumatif
Standar dan Cara Mengolah Hasil Tes Sumatif
a. Standar yang dipakai
Meskipun penilaian sumatif dapat menggunakan standar yang mutlak (criterion-
referenced), biasanya orang lebih cenderung untuk menggunakan norma yang
relatif (norm-referenced). Dengan menggunakan norma yang relatif, hasil yang
dicapai siswa lebih menggambarkan statusnya dibandingkan dengan teman-teman
1
sekelasnya. Untuk pengisian rapor, ijazah, dan sebagainya, norma yang relatif ini
dipandang lebih sesuai untuk digunakan.
b. Cara mengolah hasil tes sumatif
Untuk mengolah hasil tes dengan menggunakan norma yang relatif digunakan
nilai-nilai standar (standard scores) seperti nilai berskala 1-10, nilai Z (skor
standar Z), atau persentile.
Untuk keseragaman penilaian di sekolah-sekolah yang menjalankan sistem
pengajaran PPSI, dalam menentukan nilai akhir untuk rapor dan ujian akhir
sekolah dianjurkan untuk menggunkan nilai berskala 1-10.
Proses pengolahan dari skor mentah (raw score) ke dalam nilai berskala 1-10
dilakukan dengan menyusun distribusi frekuensi, mencari atau menghitung angka
rata-rata (mean) dan deviasi standar (DS), dan kemudian mentransformasikan
skor-skor mentah tersebut ke dalam nilai berskala 1-10.
Jika tes sumatif terdiri atas beberapa bentuk item tes objektif (true-false,
multiple choice, matching, essay, dan sebagainya), untuk menskornya harus
menggunakan rumus-rumus penskoran yang berlaku untuk tiap bentuk item.
True-False,
Multiple choice,
Fill in, completion, dan matching, S = R
Essay, dengan pembobotan (weighting) untuk tiap item
Keterangan:
S : skor yang diharapkan atau dicari
R : jumlah item yang dijawab betul (Right)
W : jumlah item yang dijawab salah (Wrong)
n : jumlah option (alternatif jawaban)
1 : bilangan tetap.
Skor mentah yang diperoleh seorang siswa dari suatu tes sumatif yang terdiri atas
beberapa macam bentuk tes merupakan jumlah skor dari tiap-tiap bentuk tes
tersebut yang telah dihitung menurut rumus masing-masing. Skor mentah inilah
yang kemudian ditransformasikan ke dalam nilai skala 1-10 dengan menyusun
tabel distribusi frekuensi seperti yang telah dikemukakan.
S = R-W;
S = R W
n−1;
1
Mengolah skor mentah (raw score) menjadi nilai huruf dan beberapa skor standar
dengan urutan uraian sebagai berikut:
1. Mengolah skor mentah menjadi nilai huruf
Pengolahan skor mentah menjadi nilai huruf pun menggunakan sifat-sifat yang
terdapat pada kurva normal atau distribusi normal sebagai dasar perhitungan. Adapun
ciri-ciri atau sifat-sifat distribusi normal adalah:
a. Memiliki jumlah atau kepadatan frekuensi yang tetap pada jarak deviasi-deviasi
tertentu
b. Pada distribusi normal, mean, median, dan mode berimpit (sama besar), terletak
tepat di tengah kurva dan membagi dua sama besar jarak deviasi antara – 3 DS
dan + DS
Berdasarkan sifat-sifat distribusi itulah maka penjabaran skor mentah menjadi nilai
huruf dipergunakan mean dan DS.
i. Mengolah Skor Mentah Menjadi Nilai Huruf dengan Menggunakan Mean (M) dan
Deviasi Standar (DS)
Mencari mean (M) dan deviasi standar (DS) dalam rangka mengolah skor
mentah menjadi nilai huruf dapat dilakukan dengan dua cara yaitu jika banyaknya
skor yang diolah kurang dari 30 digunakan tabel distribusi frekuensi tunggal, jika
banyaknya skor yang diolah lebih dari 30 sebaiknya digunakan tabel distribusi
frekuensi bergolong.
Misalnya seorang dosen memperoleh skor mentah dari hasil tes yang telah
diberikan kepada 20 orang mahasiswanya sebagai berikut:
73, 70, 68, 68, 67, 67, 65, 65, 63, 62
60, 59, 59, 58, 58, 56, 52, 50, 41, 40
Skor mentah itu akan diolah menjadi nilai huruf A, B, C, D, TL dengan
menggunakan M dan DS. Untuk itu kita akan membuat tabel sebagai berikut:
Langkah-langkah menyusun tabel:
Masukkan nama siswa (kedalam kolom 1) dan skor masing-masing siswa
(ke dalam kolom 2) kemudian jumlahkan akan memperoleh ∑X.
1
Hitung mean (M) dengan membagi jumlah skor itu (∑X) dengan N
(banyaknya mahasiswa yang dites). Jadi rumus untuk mencari M adalah
M = ∑ XN
Isi kolom 3 dengan selisih (deviasi) tiap skor dari mean (X-M)
Isi kolom 4 dengan menguadratkan angka-angka dari kolom 3. Kemudian
jumlahkan sehngga akan memperoleh ∑ (X-M)2
Hitung mean dan DS dengan rumus berikut:
M = ∑ XN
DS = √ ∑(X−M )2
N atau DS = √ ∑d2
N
TABEL UNTUK MENGHITUNG MEAN DAN DS
Nama Siswa Skor Mentah (X) (X-M) atau (d) (X-M)2 atau (d)2
1 2 3 4
Amrin
Dahron
Mardi
Popon
Jamilah
Sarman
Ronald
Nursam
Marnah
Kamerun
Djufri
Rajiman
Jugil
Bonteng
Pairah
Gurita
Marlopo
Karmin
Nirmala
Brutal
73
70
68
68
67
67
65
65
63
62
60
59
59
58
58
56
52
50
41
40
13
10
8
8
7
7
5
5
3
2
0
-1
-1
-2
-2
-4
-8
-10
-19
-20
169
100
64
64
49
49
25
25
9
4
0
1
1
4
4
16
64
100
361
400
1
Jumlah 1201 (∑X) - 1509 ∑(X-M)2
Dari tabel tersebut kemudian dicari mean dan DS:
M = ∑ XN
= 1201
20 = 60,05 dibulatkan = 60
DS = √ ∑(X−M )2
N = √ 1509
20 = √75,45 = 8,69
Penjabaran Menjadi Nilai Huruf:
Dari perhitungan tersebut diperoleh mean (M) = 60 dan DS = 8,69. Selanjutnya
langkah-langkah penjabaran skor mentah menjadi nilai huruf adalah:
Tentukan besarnya skala unit deviasi (SUD). Misalnya, menggunakan seluruh
jarak range dari kurva normal yaitu antara -3 DS s. d. +3 DS = 6 DS. Karena nilai
huruf yang akan digunakan adalah A – B – C – D – TL yang berarti = 4 unit,
SUD nya = 6 DS : 4 = 1,5 DS. Jadi, SUD = 1,5 x 8, 69 = 13, 035, dibulatkan
menjadi 13
Titik tengah nilai C terletak pada mean = 60 karena C merupakan nilai tengah
pada skala penilaian A – B – C – D – TL
Tentukan batas bawah (lower limit) dan batas atas (upper limit) dari masing-
masing nilai huruf
Karena titik tengah C = M = 60, maka
Batas bawah C = M – 0,5 SUD = 60 – 0,5 (13) = 53,5
Batas atas C = M + 0,5 SUD = 60 + 0,5 (13) = 66,5
Batas bawah D = M – 1,5 SUD = 60 – 1,5 (13) = 34
Skor bawah 34 = TL
Batas atas B = M + 1,5 SUD = 60 + 1,5 (13) = 79,5
Skor diatas 79,5 = A
Berdasarkan hasil perhitungan pada langkah diatas, skor mentah dari 20 orang
mahasiswa ke dalam nilai huruf adalah:
Skor 80 keatas = A = tidak ada
Skor 67 s. d. 79,5 = B = 6 orang
Skor 54 s. d. 66,5 = C = 10 orang
1
Skor 34 s. d. 53,5 = D = 4 orang
Skor dibawah 34 = TL = tidak ada
ii. Mengolah Skor Mentah Menjadi Nilai Huruf dengan Batas Lulus = Mean
Cara lain untuk mengolah skor mentah menjadi nilai huruf ialah dnegan
menggunakan mean dan DS yang diperoleh dengan membuat tabel frekuensi.
Misalnya seorang dosen memperoleh skor dari hasil ujian semester dari 50
mahasiswa:
97, 93, 92, 90, 87, 86, 86, 83, 81, 80,
80, 78, 76, 76, 75, 74, 73, 72, 72, 71,
69, 67, 67, 67, 64, 63, 63, 62, 62, 60,
58, 57, 57, 56, 56, 54, 52, 50, 47, 45,
43, 39, 36, 36, 32, 29, 27, 26, 20, 16.
Skor mentah ini akan diolah menjadi nilai huruf A, B, C, D, dan TL. Untuk
mencari mean dan DS susun skor mentah tersebut ke dalam tabel frekuensi. Cari
terlebih dahulu range untuk menentukan besarnya interval dan kelas interval.
Range = 97 – 16 = 81
Kelas interval = Ri+1=81
10+1=9
Jadi dengan menentukan besarnya interval = 10, kelas intervalnya = 9.
TABEL DISTRIBUSI FREKUENSI
Kelas Interval f d Fd fd2
1
2
3
4
5
6
7
8
9
96 – 105
86 – 95
76 – 85
66 – 75
56 – 65
46 – 55
36 – 45
26 – 35
16 - 25
1
6
7
10
11
4
5
3
3
+4
+3
+2
+1
0
-1
-2
-3
-4
+4
+18
+14
+10
0
-4
-10
-9
-12
16
54
28
10
0
4
20
27
48
50 +11 207
1
(N) (∑fd) (∑fd2)
Dari tabel tersebut, meannya adalah:
M = M’ + i ∑fd
n
Keterangan:
M = mean sebenarnya yang akan dicari
M’ = mean dugaan dalam tabel
= 56+65
2=121
2=60,5
i = interval = 10
∑fd = jumlah dari kolom fd = +11
Maka, M = M’ + i ∑fd
n
=60,5 + 10 (+1150
¿=60 ,5+11050
= 60,5 + 2,2
= 62,7 dibulatkan = 63
Cara mencari deviasi standar (DS) adalah:
DS = i √ ∑ fd2
N−(∑ fd
N)
2
DS = 10 √ 20750
−(+1150
)2
DS = 10 √4,14−0,48 = 10 √3,66 = 10 x 1,9 = 19
Selanjutnya, cara mengubah skor mentah yang diperoleh dosen itu menjadi
nilai huruf A, B, C, D, dan TL dengan batas lulus = mean adalah:
Telah ditentukan bahwa batas lulus = mean = 63. Jadi skor mentah dari 63
keatas dibagi menjadi nilai huruf A, B, C, D, dan skor dibawah 63 dinyatakan
TL.
SUD = 0,75; DS = 0,75 x 19 = 14,25. Dengan demikian, selanjutnya akan
dapat menghitung dengan mudah batas atas dan batas bawah dari masing-
masing nilai huruf sebagai berikut:
Batas bawah D atau batas lulus = mean = 63
1
Skor dibawah 63 = TL
Batas atas D = M + 1 SUD = M + 0,75 DS = 63 + 14,25 = 77
Batas atas C = M + 2 SUD = M + 1,5 DS = 63 + 28,5 = 92
Batas atas B = M + 3 SUD = M + 2,25 DS = 63 + 42,75 = 106
Skor diatas 106 = A
Dengan perhitungan tersebut maka hasil kelulusan dari 50 mahasiswa adalah:
Yang tidak lulus (TL), skor dibawah 63 = 23 orang
Yang mendapat nilai D, skor 63 – 77 = 15 orang
Yang mendapat nilai C, skor 78 – 92 = 10 orang
Yang mendapat nilai B, skor 93 – 106 = 2 orang
Yang mendapat nilai A, skor diatas 106 = tidak ada
Jika dibandingkan dengan cara penjabaran terdahulu, maka cara yang terakhir
ini ternyata lebih mahal. Dari 50 mahasiswa yang ujian, ternyata sebanyak 23
orang tidak lulus (hampir 50 persen). Akan tetapi jika cara yang terakhir
dibandingkan dengan pengubahan skor mentah menjadi nilai 1 – 10 ternyata
lebih mudah. Jika skor mentah yang diperoleh 50 mahasiswa dijabarkan
menjadi nilai 1 – 10 dengan menggunakan mean dan DS aktual dengan batas
lulus M + 0,25 DS = 63 + 4,75 = 68, maka yang dapat dinyatakan lulus = 21
orang dan yang tidak lulus = 29 orang.
iii. Mengolah Skor Mentah Menjadi Nilai Huruf dengan Menggunakan Mean Ideal
dan DS Ideal
Jika skor maksimum ideal dari tes yang diberikan kepada 50 mahasiswa
tersebut = 120, maka mean ideal = 12
x skor maksimum ideal = 12
x 120 = 60 dan
DS ideal dari tes tersebut = 13
x 60 = 20
Dengan cara menjabarkan yang telah diuraikan, yakni dengan ketentuan batas
lulus = mean dan dengan demikian 1 SUD = 0,75 DS, maka:
Batas bawah D atau batas lulus = mean = 60
Skor dibawah 60 = TL
Batas atas D = M + 1 SUD = M + 0,75 DS = 60 + (0,75 x 20) = 60 + 15 = 75
Batas atas C = M + 2 SUD = M + 1,5 DS = 60 + (1,5 x 20) = 60 + 30 = 90
1
Batas atas B = M + 3 SUD = M + 2,25 DS = 60 + (2,25 x 20) = 60 +45 = 105
Skor diatas 105 = A
Dengan perhitungan tersebut maka hasil kelulusan dari 50 orang mahasiswa
adalah:
Yang tidak lulus (TL), skor dibawah 60 = 20 orang
Yang mendapat nilai D, skor 60 – 75 = 16 orang
Yang mendapat nilai C, skor 76 – 90 = 11 orang
Yang mendapat nilai B, skor 91 – 105 = 3 orang
Yang mendapat nilai A, skor diatas 105 tidak ada
Jika dibandingkan hasil perhitungan tersebut dengan hasil perhitungan yang
lalu, ternyata bahwa hasil kelulusan berimbang atau hampir sama. Yang tidak lulus
hanya selisih 3 orang dan kedua-duanya tidak ada yang memperoleh nilai A. Hal
ini antara lain adalah karena skor maksimum ideal dari tes yang diolah adalah 120
sedangkan nilai maksimum aktual (nilai tertinggi dari kelompok yang dites) adalah
97, yang berarti masih jauh dibawah nilai maksimum ideal 120. Akan tetapi jika
nilai maksimum ideal dari tes itu 100 misalnya maka mean ideal 100
2 = 50 dan DS
ideal 503
= 16,7 dibulaykan = 17. Dengan demikian mungkin ada beberapa orang
mahasiswa yang memperoleh nilai A dan yang tidak lulus pun jumlahnya
berkurang.
2. Mengolah skor mentah menjadi skor standar 1-10
Untuk mengolah skor mentah menjadi nilai 1-10, kita perlu mencari mean (rata-rata)
dan DS. Untuk itu skor mentah harus disusun ke dalam tabel distribusi frekuensi.
Langkah-langkah menyusun tabel distribusi adalah:
a. Kita tentukan dulu banyaknya kelas interval dengan cara:
b. Mengisi kolom 2 (kolom interval) di dalam tabel yang telah tersedia, mulailah
dari skor minimum berturut-turut dengan interval yang telah ditemukan dan
sejumlah kelas yang ditentukan pada langkah pertama.
c. Membuat tally pada kolom 3 (menabulasikan tiap-tiap skor ke dalam kelasnya
d. Mengisikan angka (jumlah) tally ke dalam kolom 4 (lajur frekuensi = f)
e. Menentukan deviasi pada lajur d dengan menetapkan letak mean dugaan (M’)
dengan angka nol pada kelas tertentu. Untuk menduga letaknol tersebut dapat
1
kita pilih kelas yang mengandung frekuensi yang paling tinggi. Selanjutnya
kita letakkan angka-angka deviasi itu dari nol ke atas dan ke bawah. Angka-
angka diatas nol kita beri tanda + (plus) dan angka-angka dibawah nol diberi
tanda – (minus)
f. Mengisi lajur fd dengan mengalikan angka-angka pada lajur f dan d.
Kemudian hasilnya dijumlahkan pada bagian bawah dari tabel ( = fd). Sampai
dengan kolom 6 ini (lajur fd) kita telah dapat menghitung besarnya mean yang
sebenarnya dari table tersebut. Akan tetapi, karena kita masih memerlukan
mencari DS (deviasi standar), kita perlu menambah satu kolom lagi untuk
mencari fd2
g. Mengisi lajur fd2, kemudian dijumlahkan pula pada bagian bawah dari tabel
sehingga kita peroleh ∑fd2 yang diperlukan dalam rumus untuk mencari DS.
Umpamakan seorang guru memperoleh skor mentah sari hasil ulangan sejarah di
kelas III SMP yang berjumlah 50 siswa:
Dari skor mentah hasil ulangan sejarah tersebut kita dapat menyusun tabel
distribusi frekuensi seperti berikut:
Skor maksimum = 87
Skor minimum = 7
Range = 87 – 7 = 80
Banyaknya kelas interval:
Ri+1=80
8+1=11
Jadi, interval (i) = 8; kelas interval = 11
Kela
s
Interval Tally f d fd fd2
16 64 87 36 65 42 43 54 47 51
77 55 68 42 40 47 42 46 45 50
20 57 28 7 44 51 40 39 39 57
28 39 21 48 46 37 41 43 49 71
29 44 34 50 45 35 44 52 56 45
1
1
2
3
4
5
6
7
8
9
10
11
87-94
79-86
71-78
63-70
55-62
47-54
39-46
31-38
23-30
15-22
7-14
I
-
II
III
IIII
IIII IIII I
IIII IIII IIII III
IIII
III
III
I
1
0
2
3
4
11
18
4
3
3
1
+6
+5
+4
+3
+2
+1
0
-1
-2
-3
-4
6
0
8
9
8
11
0
-4
-6
-9
-4
36
0
32
27
16
11
0
4
12
27
16
N = 50 +19
(∑fd)
181
(∑fd2)
Sekarang kita cari angka rata-rataa (mean) dari tabel di atas
Rumus mean M=M '+i(∑ fdN
)
Dengan melihat pada tabel distribusi frekuensi maka:
M=42,5+8(+1950 )=42,5+3,04=45,54
Mean dugaan (M’) sebesar 42,5 adalah nilai titik tengah dari kelas interval 39 – 46,
yaitu kelas interval yang kita duga tempat letaknya mean. Cara menghitung:
M '=39+462
=852
=42,5
Dari tabel itu juga searang kita mencari DS
Rumusnya:
DS = i √ ∑ fd2
N−(∑ fd
N)
2
Dengan menggunakan rumus tersebut maka:
DS = 8 √ 18150
−(+1950 )
2
= 8 √3,62−0,1444
= 8 √3,5756
1
= 8 x 1,89 = 15,12 dibulatkan = 15
Setelah ditemukan besarnya mean dan DS (mean = 45,54 dan DS = 15), langkah
selanjutnya adalah menjabarkan skor mentah yang diperoleh dari ulangan sejarah ke
dalam nilai 1-10 dengan menggunakan rumus penjabaran sebagai berikut:
Rumus penjabaran:
M + 2,25 DS = 10
M + 1,75 DS = 9
M + 1,25 DS = 8
M + 0,75 DS = 7
M + 0,25 DS = 6
M - 0,25 DS = 5
M - 0,75 DS = 4
M - 1,25 DS = 3
M - 1,75 DS = 2
M - 2,25 DS = 1
Hasil perhitungan: Penjabarannya:
45,54 + (2,25 x 15) = 79,29 dibulatkan = 79 Skor 79 keatas = 10
45,54 + (1,75 x 15) = 71,79 dibulatkan = 72 72 s. d. 78 = 9
45,54 + (1,25 x 15) = 64,29 dibulatkan = 64 64 s. d. 71 = 8
45,54 + (0,75 x 15) = 56,79 dibulatkan = 57 57 s. d. 63 = 7
45,54 + (0,25 x 15) = 49,29 dibulatkan = 49 49 s. d. 56 = 6
45,54 – (0,25 x 15) = 41,79 dibulatkan = 42 42 s. d. 48 = 5
45,54 – (0,75 x 15) = 34,29 dibulatkan = 34 34 s. d. 41 = 4
45,54 – (1,25 x 15) = 26,79 dibulatkan = 27 27 s. d. 33 = 3
45,54 – (1,75 x 15) = 19,29 dibulatkan = 19 19 s. d. 26 = 2
45,54 – (2,25 x 15) = 11,79 dibulatkan = 12 12 s. d. 18 = 1
11 ke bawah = 0
Dengan pedoman penjabaran tersebut, sekarang guru tinggal mentransfer atau
mengubah skor mentah yang diperoleh setiap siswa ke dalam nilai 1-10.
Dengan penjabaran secara statistik, dengan membuat tabel distribusi frekuensi
dan menggunakan mean dan DS aktual, yaitu mean dan DS yang diperoleh dari
perhitungan skor mentah yang benar-benar dicapai oleh kelompok siswa yang dites,
bagaimanapun hasil tes yang kita peroleh akan menghasilkan nilai diantara 1-10 atau
1
antara 0-10. Dengan kata lain,akan selalu terdapat anak yang memperoleh nilai tinggi
dan nilai yang terendah karena dalam penyusunan tabel yang menjadi dasar
perhitungan menggunakan skor maksimum dan skor minimum yang benar-benar
dicapai oleh kelompok siswa yang dites. Dengan demikian, nilai-nilai yang diperoleh
siswa masing-masing menunjukkan status kepandaian siswa tersebut dibandingkan
dengan teman-teman yang lain didalam kelompok itu. Kebaikan sistem penskoran
seperti ini ialah bahwa nilai-nilai yang diperoleh siswa benar-benar mencerminkan
kapasitas kelompok. Akan tetapi, kelemahannya ialah bahwa nilai-nilai yang
diperoleh sistem tersebut belum mencerminkan sampai dimana pencapaian scope
bahan pelajaran yang diteskan. Oleh karena itu, untuk mengurangi kelemahan ini kita
juga melakukan sistem penskoran tersebut dengan menggunakan mean ideal dan DS
ideal.
Caranya adalah sebagai berikut:
Misalkan tes yang dipergunakan untuk ulangan sejarah tersebut memiliki skor
maksimum ideal = 100
Mean ideal = skor maksimum ideal
2 =
1002
= 50
DS ideal = meanideal
3=50
3=16,6
Dengan menggunakan rumus penjabaran, maka:
50 + (2,25 x 16,6) = 87,35 dibulatkan = 87 – 10
50 + (1,75 x 16,6) = 79,05 dibulatkan = 79 – 9
50 + (1,25 x 16,6) = 70,75 dibulatkan = 71 – 8
50 + (0,75 x 16,6) = 62,45 dibulatkan = 62 – 7
50 + (0,25 x 16,6) = 54,15 dibulatkan = 54 – 6
50 – (0,25 x 16,6) = 45,85 dibulatkan = 46 – 5
50 – (0,75 x 16,6) = 37,55 dibulatkan = 38 – 4
50 – (1,25 x 16,6) = 29,25 dibulatkan = 29 – 3
50 – (1,75 x 16,6) = 20,95 dibulatkan = 21 – 2
50 – (2,25 x 16,6) = 12,65 dibulatkan = 13 – 1
Dengan menggunakan mean ideal dan DS ideal, ternyata bahwa hasilnya
menjadi berlainan. Siswa yang mendapat nilai 10 adalah siswa yang memperoleh skor
mentah 87 keatas dan bukan 79 keatas seperti hasil perhitungan dengan menggunakan
mean dan DS aktual. Juga yang mendapat nilai 6 adalah siswa yang memperoleh skor
1
mentah 54 s. d. 61 dan bukan 49 s.d. 56 seperti perhitungan yang lalu. Perubahan skor
mentah menjadi nilai 1-10 dengan menggunakan mean ideal dan DS ideal lebih
mudah dan praktis karena kita tidak perlu menyusun tabel distribusi frekuensi. Untuk
menghitung mean ideal dan DS ideal kita hanya memerlukan skor maksimum ideal
dari tes yang kita laksanakan. Yang dimaksud dengan skor maksimum ideal adalah
skor tertinggi yang seharusnya dicapai jika tes tersebut dikerjakan dengan betul
semua. Dengan demikian, besarnya skor maksimum pada jumlah item dan
pembobotan dalam tes yang dipergunakan.
PENILAIAN DENGAN PERSEN
Cara menilai lain yang dapat juga kita lakukan ialah dengan menggunakan
persen atau yang disebut presentages correction. Nilai yang diperoleh siswa benar-
benar merupakan “nilai” dan bukan lagi “skor”.
Rumus penilaian adalah sebagai berikut:
Keterangan:
NP : nilai persen yang dicari atau diharapkan
R : skor mentah yang diperoleh siswa
SM : skor maksimum ideal dari tes yang bersangkutan
100 : bilangan tetap
Beberapa contoh sebagai penjelasan
Siswa A memperoleh skor 64 dari tes matematika yang memiliki skor
maksimum ideal = 80.Maka nilai A yang sebenarnya adalah 6480
x 100 = 80.
Siswa B memperoleh skor 64 dari tes bahasa Indonesia yang memiliki skor
maksimum ideal = 100. Maka nilai B = 64.
Cara menilai dengan persen seperti di atas banyak dilakukan oleh guru-guru dan
para dosen. Hal ini adalah karena dianggap lebih mudah dan praktis. Suatu perguruan
tinggi mempunyai pedoman penilaian sebagai berikut:
NP = R
S Mx
1
Tingkat PengNilai H BoboPredikat86-100 % A 4Sangat Baik76-85 % B 3Baik60-75 % C 2Cukup55-59 % D 1Kurang≤ 54 % TL 0Kurang Sekali
Jika nilai si A dan si B pada contoh yang baru lalu akan ditransfer ke dalam nilai
huruf menurut pedoman penilaian tersebut di atas, maka nilai si A = 80 = B, nilai si B
= 64 = C.
Demikian pula jika nilai-nilai persen itu akan diubah menjadi nilai dengan skala 1-10,
tinggal membagi nilai itu dengan angka 10, kemudian dibulatkan menurut ketentuan
pembulatan angka desimal. Sebagai contoh, nilai si A = 80 menjadi nilai 8 (pada skal
1-10); nilai si B = 64 menjadi 6,4 dan dibulatkan menjadi 6.
3. Mengolah Skor Mentah Menjadi Skor Standar Z
Yang dimaksud dengan Z skor adalah skor yang penjabarannya didasarkan atas unit
deviasi standar dari mean. Dalam hal ini mean dinyatakan 0 (nol).
Pengolahan skor mentah menjadi skor Z ini sering kali dirasakan perlunya karena
dengan hanya melihat skor mentah saja kita belum dapat memberikan tafsiran yang
baik dan tepat. Atau dengan kata lain, dengan hanya mengetahui skor mentah saja
dapat menimbulkan tafsiran yang salah mengenai kecakapan seseorang.
Misalkan kita melihat hasil tes (ujian SD) dari seorang anak bernama Umar sebagai
berikut:
Bahasa Indonesia = 65
Matematika = 55
IPS = 70
Untuk dapat lebih mengetahui bagaimana kecakapan Umar itu sebenarnya jika
dibandingkan dengan teman-teman sekelasnya, kita perlu mengetahui besarnya mean
dan DS dari skor yang diperoleh Umar itu sebagai berikut:
Mata Pelajaran Skor Mean DS
Bahasa Indonesia 65 60 4.0
Matematika 55 45 4.0
IPS 70 75 5.0
1
Dengan membandingkan skor yang dicapai Umar itu dengan mean-nya masing-
masing, sepintas lalu kita telah melihat bahwa Umar bukan sangat pandai dalam IPS,
malah ia lebih baik dalam matematika dan bahasa Indonesia jika dibandingkan
dengan rata-rata kelas (teman-temannya). Untuk dapat mengetahui bagaimana
kedudukan Umar yang sebenarnya di dalam kelompok teman-temannya itu, di
samping mean perlu pula kita mengetahui DS dari tiap mata pelajaran itu.
Dengan mempergunakan mean dan DS itulah kita dapat menjabarkan atau mengubah
skor-skor yang diperoleh Umar itu menjadi skor Z.
Rumusnya :
Dengan menggunakan rumus tersebut kita dapat mengubah skor yang dicapai Umar
tadi ke dalam skor Z sebagai berikut:
Bahasa Indonesia = 65−60
4.0 =
+54
= +1,25
Matematika = 55−45
4.0 =
+154
= +2,5
IPS =70−75
5.0 =
−55
= -1,0
Melihat hasil skor Z di atas kita dapat mengatakan bahwa kedudukan Umar dalam
bahsa Indonesia adalah 1,25 DS di atas mean, untuk matematika 2,5 DS di atas mean,
sedangkan IPS 1,0 DS di bawah mean.Dengan demikian, justru umar kurang pandai
dalam IPS dibandingkan dengan teman- teman sekelasnya, dan jauh lebih pandai
dalam matematika dan bahasa Indonesia.
Disamping itu, skor Z sering pula dipergunakan untuk membandingkan prestasi anak
dengan anak yang lain dalam beberapa matapelajaran.
Misalnya, teman umar tadi bernama basir hasil tes yang dicapai oleh basir:
Bahasa Indonesia 70
Matematika 60
IPS 60
Pertanyaan yang timbul pada kita ialah: siapa diantara kedua anak tersebut yang
sebenarnya lebih baik prestasinya? Umar atau basir? Jika kita hanya melihat sepintas
lalu atau hanya melihatnya dari hasil rata- rata dari kedua hasil tes masing- masing,
tentu kita akan mengatakan umar sama pandai dengan basir karena jumlah skor umar
65 + 55 + 70 = 190, dan jumlah skor basir 70 + 60 + 60 = 190. Akan tetapi,
Skor Z = X−M
DS
1
kesimpulan kita itu belum tentu benar. Dengan menggunakan skor standar (skor Z)
kita dapat mengetahui siapa sebenarnya lebih baik atau lebih tinggi prestasinya.
Dalam hal ini perlu diingat mean dan DS untuk tiap mata pelajaran yang dicapai oleh
kedua anak itu sama.
Dengan melihat hasil tersebut diatas, dapat diambil kesimpulan bahwa prestasi basir
ternyata lebih baik daripada umar.
4. Mengolah Skor Mentah Menjadi Skor Standar T
Dengan bersumber pada skor Z seperti telah dibicarakan di muka, banyak pula
dikembangkan skor- skor standar lainnya yang dikenal orang sebagai angka skala.
Jenis skor standar yang merupakan angka skala yang telah banyak dikenal orang
antara lain ialah skor T. Yang dimaksud dengan skor T ialah angka skala yang
menggunakan dasar mean = 50 dan jarak tiap deviasi standar (DS) = 10. Di dalam
range – 3 DS, T tersebar dari 20 s.d. 80, tanpa bilangan-bilangan minus.
Penjabaran skor mentah ke dalam skor T ini pun sering kali kita perlukan untuk
mengetahui bagaimana kedudukan seorang anak yang memperoleh skor tersebut
dibandingkan dengan kelompoknya di dalam suatu hasil tes. Selesai itu, dengan
penjabaran ke dalam skor T ini, hasil-hasil tes (skor mentah) yang diperoleh dari
beberapa mata pelajaran yang memiliki mean dan DS yang berbeda-beda dapat
diubah menjadi skor- skor standar dengan satu skala unit deviasi. Dengan demikian,
Skor Z Umar:
Bahasa Indonesia:
65−604,0
= +54
= +1,25
Matematika:
55−454,0
= +10
4 = +2,5
IPS:
70−755,0
= −55
= +1,0
Jumlah + 2,75
Skor Z Basir:
Bahasa Indonesia:
70−604,0
= +10
4 = +2,5
Matematika:
60−454,0
= +15
4 = +3,75
IPS:
60−755,0
= −15
5 = -3,25
Jumlah + 3,25
1
suatu panitia ujian sekolah, misalnya, dapat menentukan “batas lulus” dari berbagai
mata pelajaran dengan kedudukan nilai skor yang sama setelah setiap skor dari mata
pelajaran-mata pelajaran tersebut dijabarkan kedalam skor T.
Rumusnya:
Skor T = (X−M
DS)10 + 50 atau skor T = 10z + 50
Jika skor- skor yang diperoleh umar tadi kita jabarkan ke dalam Skor T, akan kita
peroleh seperti berikut:
Bahasa Indonesia
= (65−50
4) x 10 + 50 = (+1,25)x 10 + 50 =62,5
Matematika
= (55−45
4)x 10 + 50 = (+2,5)x 10 +50 = 75,0
IPS
= (70−76
5)x 10 + 50 =(-1,0)x 10 +50 = 40,0
Dengan melihat hasil penjabaran ke dalam skor T di atas, secara cepat kita dapat
mengatakan bahwa umar memiliki prestasi yang cukup baik dalam matematika
dibandingkan dengan teman- teman sekelompoknya, dan kurang baik prestasinya
dalam IPS. Ingat bahwa dengan menjabarkan kedalam skor T itu kita telah
menyamakan besarnya mean dari ketiga mata pelajaran tersebut, yaitu mean = 50.
Skor Z -3 -2 -1 0 +1 +2 +3
B. ind 48 52 56 60 64 65 68 72
Mtk 33 37 41 45 49 53 55 57
IPS 60 65 70 75 80 85 90
Skor T 20 30 40 50 60 70 70
-1,0
+1,25 +2,5
1
Jika skor–skor yang diperoleh umar tadi kita letakkan di dalam skala skor T yang
disejajarkan dengan skor Z, akan kita lihat seperti terlukis pada gambar diatas.
Dengan memperhatikan gambar itu, jelas kiranya bagaimana kedudukan skor- skor
yang diperoleh umar dibandingkan dengan rata- rata kelompoknya. Perhatikan skor-
skor yang dicetak miring pada gambar, dan skor Z-nya yang terletak diatas dasar
kurva.
2.4 Interpretasi Skor
1) Pengertian Interpretasi
Interpretasi adalah suatu proses untuk menyederhanakan ide-ide atau issu-issu
yang rumit dan kemudian membaginya dengan masyarakat awam/umum. Suatu
interpretasi yang baik adalah suatu interpretasi yang dapat membangun hubungan
antara audiens dengan obyek interpretasi. Apabila dilakukan secara efektif,
interpretasi dapat digunakan untuk meyakinkan orang lain, dapat mendorong orang
lain untuk merubah cara berpikir dan tingkah laku mereka. Interpretasi (penafsiran)
merupakan suatu analisa seseorang terhadap suatu kejadian atau peristiwa tentang
obyektif atau subyektif. Leon H. Levy dalam buku yang berjudul “Psychological
Interpretation” (1963) menyatakan bahwa interpretasi adalah suatu kegiatan yang
dilakukan apabila ada suatu keadaan yang sulit untuk dipahami secara biasa atau
secara langsung. Pada dasarnya interpretasi terdiri dari kegiatan memberikan suatu
kerangka referensi yang lain atau mengemukakan suatu bahasa lain bagi sejumlah
observasi atau tingkah laku, dengan tujuan agar hal ini dapat dipergunakan.
Interpretasi atau penafsiran hasil tes bertujuan untuk menerjemahkan dan memberi
makna terhadap skor yang diperoleh testee (orang yang diuji).
2) Jenis Interpretasi
Ada dua jenis interpretasi yaitu interpretasi kelompok dan interpretasi individual.
Interpretasi kelompok adalah penafsiran yang dilakukan untuk mengetahui
karakteristik kelompok berdasarkan data hasil evaluasi, antara lain prestasi
kelompok, rata-rata kelompok, sikap kelompok terhadap guru dan mata
pelajaran yang diberikan, dan distribusi nilai kelompok. Tujuan utamanya
adalah sebagai persiapan untuk melakukan penafsiran kelompok, untuk
mengetahui sifat-sifat tertentu pada suatu kelompok, dan untuk mengadakan
perbandingan antarkelompok.
1
Interpretasi individual adalah penafsiran yang hanya tertuju kepada individu
saja. Misalnya, dalam kegiatan bimbingan dan penyuluhan atau situasi klinis
lainnya. Tujuan utamanya adalah untuk melihat tingkat kesiapan siswa
(readiness), pertumbuhan dan kemajuan, serta kesulitan-kesulitan yang
dihadapinya.
3) Analisis dan Interpretasi Soal Tes Objektif
Setelah diuraikan dengan agak panjang tentang bagaimana menganalisis soal tes
dengan menghitung taraf kesukaran dan daya pembedanya, dan
menginterpretasikannya dengan menggunakan rumus- rumus tertentu, dalam uraian
berikut ini akan dibicarakan cara menganalisis dan mengiterpretasikan soal- soal tes
objektif, khususnya soal tes yang berbentuk pilihan ganda (multiple choice). Uraian
ini kami adaptasikan dari buku Measurement and Evaluation in Psychology and
Education karangan R.L. Throndike dan E.P. Hagen (1977) halaman 251-255, dengan
perubahan pada isi soal- soalnya.
Berlainan dengan cara menganalisis yang telah diuraikan terdahulu, cara
analisis yang dilakukan oleh Throndike dan Hagen ini kelihatan lebih praktis dan
sekaligus diikuti bagaimana menginterpretasikannya, dengan demikian, penganalisis
dapat mengetahui di mana atau pada bagian mana dari soal tersebut yang masih lemah
dan perlu mendapat perbaikan.
Suatu cara yang sederhana untuk menyiapkan pencatatan jawaban- jawaban dari
tiap item dapat dibuat dalam bentuk kartu- kartu seperti dibawah ini.
10
17 1 2
1 5 1 3
Soal no. . . . Hasil perkebunan di daerah lampung yang terbesar adalah:
A. Karet
B. Lada
C. Kelapa sawit
D. Kopi
Alternatif jawaban
A B C D E Kosong
Alt Jawaban
kelompok
Upper 25 %
Middle 50 %
Lower 25 %
1
Kartu semacam itu dapat digunakan untuk soal-soal pilihan ganda (multiple choice)
yang mempunyai alternatif jawaban sampai dengan lima buah, tetapi dapat pula
digunakan untuk tes benar-salah (true-false) yang hanya mempunyai dua alternative
jawaban. Tiap kartu dipergunakan untuk satu soal. Kemudian kartu- kartu yang berisi
keterangan tentang soal itu dapat disusun dalam suatu file soal yang permanen, dan
sewaktu- waktu dapat dipergunakan bilamana diperlukan.
Contoh Analisa Soal (Item Analysis)
Misalkan 100 orang murid dites dengan tes pilihan ganda yang berjumlah 95 soal.
Hasil tes menunjukkan skor tertinggi 85 dan terendah 14. Dari hasil tes itu kita ambil
25 orang (25 %) yang tergolong upper group, dan 25 orang (25 %) yang tergolong
lower group.cara mengambil kelompok upper group dan lower group adalah sebagai
berikut: mula-mula kita susun lembaran hasil tes itu dari lembaran yang memiliki skor
tertinggi (85) berturut-turut sampai kepada lembaran yang memiliki skor terendah
(14). Kemudian kita ambil 25 lembar dari atas, dan inilah kelompok upper group ;dan
25 lembar dari bawah, inilah kelompok lower group. Misalkan dari kelompok upper
group yang kita ambil terdapat skor dari 59 s.d. 85, dan dari kelompok lower group
terdapat skor 14 s.d. 34. Kelompok sedang (middle group) yang berjumlah 50 lembar
(50%) kita biarkan.
Jawaban- jawaban dari kedua kelompok upper group dan lower group itulah yang
kemudian kita tabulasikan dan kita analisis.
Berikut ini beberapa contoh
Soal no. 1 hasilnya sebagai berikut:
1) Penyebar agama Islam yang mula- mula dijawa barat ialah:
Upper Lower
A. Sultan Hasanuddin 0 2
B. Fatahillah 25 20
C. Untung Surapati 0 0
D. Sunan Kalijaga 0 1
Dikosongkan 0 0
1
Interpretasi:
Soal ini mudah karena semua (25) orang dari kelompok upper group dan 20 orang
dari lower group dapat menjawab soal itu dengan benar. Namun, soal ini termasuk
baik karena dapat membedakan arah yang diinginkan : ternyata jawaban- jawaban
yang salah terdapat pada kelompok lower group. Dua atau tiga soal semacam ini baik
digunakan sebagai permulaan suatu tes.
Soal no. 2 hasilnya sebagai berikut:
2) Kegembiraan kerja bagi guru- guru di sekolah dapat tercapai apabila:
Upper lower
A. Guru- guru menerima tugas pembagian kerja yang
sama beratnya. 3 5
B. Tidak pernah ada kecaman dari kepala sekolah. 9 15
C. Kepala sekolah memperhatikan dan menghargai tiap
usaha guruu yang dilakukan dengan rasa tanggung
jawab. 13 5
D. Kepala sekolah memperhatikan penghidupan guru-
guru. 0 0
Di kosongkan 0 0
Interpretasi:
Soal ini sukar, tetapi sangat efektif. Bahwa soal tersebut tergolong sukar dapat dilihat
hanya 13 dari 50 orang yang dapat menjawab soal itu dengan benar. Bahwa soal itu
dikatakan efektif dapat dilihat dari kenyataan bahwa ke 13 orang yang menjawab
benar itu semua terdapat pada kelompok upper group yang sejumlahnya lebih besar
dari pada kelompok upper group yang menjawab salah. Sepintas lalu soal semacam
ini menunjukkan betapa sulit untuk menjawabnya secara menerka dengan membabi
buta saja. Sebagian besar dari kelompok lower group memusatkan perhatiannya pada
satu alternatif jawaban yang salah yang seolah- olah benar atau dapat diterima.
Soal no. 3 mendapat hasil sebagai berikut:
3) Maksud pemerintah mengadakan ikatan dinas bagi siswa- siswa SPG ialah:
Upper Lower
A. Untuk menarik para lulusan SLP agar mau masuk ke
sekolah guru 15 6
B. Membatasi lulusan SPG yang akan melanjutkan
pelajarannya ke sekolah yang lebih tinggi. 4 6
1
C. Membantu para siswa yang kurang mampu dalam
melanjutkan pelajarannya. 2 6
D. Karena yang masuk SPG kebanyakan anak- anak orang
yang miskin 4 7
Dikosongkan 0 0
Interpretasi
Soal ini tidak baik karena: pertama, soal ini terlalu sukar, hanya 8 dari 50, atau 16 %
saja dari murid, yang dapat menjawab benar. Keedua, soal tersebut kurang
mempunyai daya pembeda (discriminating power); ternyata dari jawaban yang benar
itun banyak terdapat pada lower group ,dan bukan pada upper group.
Dalam hal ini ada dua keterangan yang mungkin untuk data analisis soal tersebut:
(1) soal tersebut bersifat ambiguous (mempunyai dua arti), terutama bagi siswa- siswa
yang mengetahui banyak tentang hal yang ditanyakan, atau (2) para siswa belum
pernah mempelajari hal- hal seperti yang ditanyakan.
Soal no. 4 hasilnya sebagai berikut:
4) Danau yang terbesar di pulau sumatra ialah:
Upper Lower
A. Danau Toba 21 17
B. Danau Poso 0 0
C. Danau Batur 0 0
D. Danau Kerinci 4 8
Dikosongkan 0 0
Interpretasi:
Soal ini menunjukkan beberapa diskriminasi pada arah atau tujuan yang diingini (21
lawan 17), tetapi perbedaan itu tidak begitu tajam. Pola respons adalah satu dang
terlalu umum. Hanya dua dari empat alternatif jawaban yang berfungsi atau dipilih
oleh siswa. Jika soal ini akan diperbaiki maka yang perlu diubah atau diganti adalah
alternatif jawaban B dan C. Mungkin kedua alternatif jawaban tersebut tidak dipilih
oleh siswa karena mereka mengetahui bahwa danau poso dan danau batur itu tidak
ada di pulau sumatra, tetapi di pulau sulawesi dan bali. Maka untuk menggantinya
sebaiknya dicarikan nama danau lain yang ada dipulau sumatera, misalnya danau
ranau dan danau maninjau.
Analisis soal (item analysis) seperti tersebut diatas, kecuali berguna bagi perbaikan
penyusunan kembali soal- soal tes, juga berguna untuk melihat atau meneliti materi-
Item no 1
Alternatif A B* C D E
Upper 10 0 6 3 1 0
Lower 10 3 2 2 3 01
materi mana dari bahan pelajaran yang belum dikuasai siswa (soal atau item yang
sukar) untuk selanjutnya kita dapat mengulang kembali atau memperbaiki proses
belajar- mengajarnya. Soal atau item yang sukar bagi keseluruhan kelas berguna
untuk pembimbingan ke arah eksplorasi yang lebih luas. Soal- soal yang ternyata
sukar itu dapat didiskusikan bersama kelas sehingga, dsamping memperluas
pengetahuan siswa, juga mnghilangkan salah pengertian pada mereka.
4) Prosedur Analisis Item yang Lebih Sederhana untuk Norm-Referenced Test
Ada beberapa prosedur analisis item yang dapat dilakukan terhadap norma refereced
test (Throndike, 1971). Bagi tes- tes hasil belajar yang informal yang digunakan
dalam pengajaran, agaknya diperlukan prosedur yang sederhana saja. Langkah-
langkah berikut merupakan prosedur yang simpel, tetapi efektif.
Misalkan kita akan menganalisis 32 lembar jawaban tes multiple choice dengan 5
option. Maka langkah- langkahnya adalah sebagai berikut:
1. Susunlah 32 lembar jawaban tes tersebut pada skor yang paling tinggi sampai
kepada skor yang paling rendah.
2. Ambil + sepertiga dari jumlah lembar jawaban tes itu yang mendapat skor
tinggi, dan sebutlah ini upper group (10 lembar). Dan ambil pula + sepertiga dari
jumlah lembar jawaban tes yang memperoleh skor rendah, dan sebutlah lower group
(10 lembar pula). Pisahkan yang selebihnya, yaitu yang termasuk middle group (12
lembar). Meskipun lembaran middle group ini dapat dimasukan kedalam analisis,
penggunaan upper dan lower group saja sudah cukup menyederhanakan prosedur
pengolahan (analisis).
3. Untuk tiap item, hitunglah jumlah siswa dari upper group yang memilih tiap
alternatif (option), kemudian kerjakan. Begitu juga pada lower group.
4. Catatlah jumlah dari langkah 3 tersebut di dalam catatan tes dalam kolom
dimana alternatif itu dipilih. Atau untuk ini gunakanlah “kartu item” yang terpisah
seperti berikut:
1
*jawaban yang benar
5. Taksirlah tingkat kesukaran soal (item dificully) dengan menghitung
persentase siswa yang menjawab item itu dengan benar. Prosedur sederhana ini adalah
untuk mendasarkan penaksiran itu hanya pada siswa- siswa yang termasuk didalam
kelompok analisis item itu. Dengan demikian, jumlah siswa dalam upper dan lower
group (10+10 =20) yang memilih jawaban benar pada item no. 1 diatas adalah 6 + 2 =
8. Dari situ kita dapat menghitung indeks kesukaran soal sebagai berikut:
Index of item difficulty = 8
20 x 100 = 40 %
Meskipun perhitungan kita hanya didasarkan atas kelompok upper dan lower,
hasilnya akan menyediakan suatu taksiran mendekati kebenaran yang berlaku untuk
jumlah kelompok seluruhnya. Ini berarti bahwa indeks kesukaran soal no.1 sebesar
40% itu berlaku untuk kelompok (32 orang) yang mengerjakan tes itu.
Dengan demikian, karena “tingkat kesukaran” itu menunjukkan “persentase jawaban
item yang benar”, maka makin kecil persentase menunjukkan makin sulit item itu.
Rumus untuk menghitung item difficulty adalah sebagai berikut:
Keterangan:
P = persentase yang menjawab item itu dengan benar
R = jumlah yang menjawab item itu dengan benar.
T = jumlah total (siswa) yang mencoba menjawab item itu
6. Taksirlah daya pembeda (discriminating power) item itu dengan
membandingkan jumlah siswa dalam upper group yang menjawab item dengan benar.
Dari contoh di atas ternyata bahwa 6 siswa pada upper group dan 2 siswa pada lower
group menjawab dengan benar. Ini menunjukkan daya pembeda yang positif karena
item itu dapat membedakan siswa yang pandai (upper) dan siswa yang kurang
(lower); yang menjawab benar dari upper group jumlahnya lebih banyak daripada
yang menjawab benar dari lower group. Dari item no. 1 kita dapat menghitung
besarnya daya pembeda item itu sebagai berikut:
P= RT
x 100
1
Index of item discriminating power = 6−210
= 0,40
Rumus daya pembeda; DP= U−L
12
T
DP = daya pembeda atau discriminating power yang dicari
U = jumlah jawaban yang benar dari upper-group
L = jumlah jawaban yang benar dari lower-group
1/2T = setengah dari jumlah upper dan lower-group
Daya pembeda dari suatu item dinyatakan dengan pecahan desimal dan indeks
maksimum daya pembeda yang positif = 1,00
Angka1,00 ini diperoleh dari: jika hanya siswa upper group yang dapat menjawab
item itu dengan benar, sedangkan dari siswa lower-group tidak seorang pun yang
dapat menjawab item itu dengan benar. Dari tes tersebut di muka mungkin terdapat
suatu item yang DP-nya sebagai berikut:
DP = 10−0
10 = 1,00
Perlu dicatat disini bahwa item itu berada pada tingkat 50 persen dari tingkat
kesukaran (10 upper menjawabnya dengan benar, 10 lower menjawabnya salah). Hal
ini menjelaskan kepada kita ,mengapa pembuat tes memberanikan diri untuk
menyiapkan items untuk tes- tes norm- referenced pada tingkat kesukaran 50 persen.
Hanya pada tingkat inilah maksimum daya pembeda dimungkinkan.
Daya pembeda nol (0,00) diperoleh jika jumlah siswa yang sama pada kedua
kelompok (upper dan lower) menjawab item itu dengan benar.
Jadi:
DP = 10−10
10 = 0,00
Daya pembeda negatif diperoleh jika yang menjawab benar suatu item pada lower
group jumlahnya lebih besar ketimbang pada upper group.
Jadi:
DP = 2−610
= -0,40
Jika dari hasil analisis suatu item diperoleh DP = 0 (nol) atau DP = - (minus), item
yang bersangkutan harus dibuang atau diganti dengan yang baru.
1
7. Tentukan keefektifan distruktornya dengan membandingkan jumlah siswa
pada upper group dan lower group yang memilih tiap alternatif yang salah. Distruktor
yaang baik akan memikat lebih banyak siswa dari lower group ketimbang dari upper
group. Dengan melihat contoh pada langkah 4 di muka, dapat kita lihat bahwa
alternatif A dan D berfungsi secara efektif, alternatif C kurang baik karena ia menarik
lebih banyak dari siswa upper group, dan alternatif E sama sekali tidak efektif karena
ia tidak memikat seorang pun dari kedua kelompok itu.
Analisis seperti ini sangat berguna untuk mengevaluasi suatu item tes, dan jika
dikombinasikan dengan maksud untuk memeriksa item itu sendiri, hasil analisis itu
memberikan informasi yang sangat berguna bagi pengembangan item itu.
Langkah–langkah penganalisisan soal seperti telah diuraikan diatas dapat dimodifikasi
menurut kebutuhan dan situasi tertentu. Juga dalam penetapan jumlah upper dan
lower group dapat digunakan 25% upper dan 25% lower jika jumlah kelompok besar,
atau bahkan 50% upper dan 50% lower jika jumlah kelompok itu kecil. Yang penting
disini adalah menggunakan sebesar mungkin pecahan kelompok itu sehingga kita
memperoleh informasi yang berguna. Penggunaan angka 27% untuk upper dan 27%
untuk lower, seperti dianjurkan dalam beberapa buku yang biasanya didasarkan atas
analisis statistik, untuk penganalisisan tes pencapaian belajar dalam kelas (classroom
achievement test) tidak merupakan jaminan atau keharusan yang mutlak.
5) Interpretasi Data Analisis Item Tes Norm-Referenced
Jika kita menggunakan jumlah siswa yang relatif kecil dalam menganalisa item tes
hasil belajar kelas, informasi analisisJika kita menggunakan jumlah siswa yang relatif
kecil dalam menganalisa item tes hasil belajar kelas, informasi analisis item
hendaknya diinterpretasikan dengan sangat berhati- hati. Baik tingkat kesukaran
maupun daya pembeda suatu item dapat berubah- ubah atau berbeda- beda antara
kelompok yang satu dengan kelompok yang lain. Dengan demikian, tidaklah
bijaksana menentukan suatu tingkat minimum dari daya pembeda untuk pemilihan
item, atau membeda- bedakan items berdasarkan perbedaan yang kecil dalam indeks-
indeks diskriminasinya. Oleh karena itu, kita hendaknya lebih memperhatikan items
yang memiliki daya pembeda yang tertinggi. Namun, sifat tentatif dari data yang kita
peroleh memberikan kelonggaran yang besar pada kita untuk berbuat kesalahan.
Jika suatu item menunjukkan indeks positif dalam diskriminasi, jika semua
alternatifnya berfungsi secara efektif, dan jika item itu mengukur secara pedagogis
1
hasil yang signifikan, item itu hendaknya dipertahankan dan disimpen dalam file item
untuk digunakan pada waktu yang akan datang.
Jika item itu disimpan dalam file dan digunakan kembali sesudah beberapa saat
tertentu, data hasil analisis item itu sebaiknya dicatat pada kartu setiap saat item itu
digunakan. Kumpulan data semacam itu akan memperlihatkan variabilitas dalam
indeks kesukaran item dan daya pembedanya dan dengan demikian informasi itu lebih
interpretable.
6) Prosedur Analisis Item untuk Criterion Referenced Test
Dasar pemikiran dalam mengevaluasi items dalam test penguasaan criterion-
refrerenced adalah sampai sejauh mana tiap item dapat mengukur hasil pengajaran
(effects of instruction), jika suatu item dapat dijawab dengan benar oleh semua siswa,
baik sebelum maupun sesudah diajari, jelaslah bahwa item itu tidak mengukur hasil
pengajaran. Demikian juga, jika suatu item dijawab salah oleh semua siswa, baik
sebelum maupun sesudah siswa mendapat pelajaran, item tersebut tidak berfungsi
sebagai alat evaluasi kedua-duanya merupakan contoh ekstrem; namun, kedua contoh
tersebut memberikan petunjuk penting bagi pencapaian pengukur hasil pengajaran
sebagai satu dasar bagi penentuan kwalitas item.
Untuk memperoleh ukuran keefektifan item berdasarkan hasil pengajaran, guru
harus memberikan tes yang sama sebelum dan sesudah mengajar. Item yang efektif
akan dijawab oleh sejumlah lebih besar siswa sesudah pengajaran dari pada sebelum
pengajaran. Indeks sensitifitas bagi keberhasilan pengajaran (sensitifity of
instructional effect) (s) dapat dihitung dengan menggunakan rumus berikut:
Keterangan:
S =sensitifitas keberhasilan yang dicari.
RA =jumlah siswa yang menjawab benar item itu sesudah pengajaran
RB =jumlah siswa yang menjawab benar item itu sebelum pengajaran.
T =jumlah total jawaban item itu yang benar kedua- duanya, sebelum dan
sesudah pengajaran
Misalkan suatu item dijawab salah oleh semua siswa (32 orang) sebelum pengajaran,
dan dijawab benar oleh semua siswa sesudah pengajaran. Dengan menggunakan
rumus diatas akan kita peroleh sebagai berikut:
S = R A−RB
T
1
S = 32−0
32 = 1,00
Jadi maksimum sensitifitas keberhasilan pengajaran dinyatakan dengan indeks 1,00.
Indeks items yang efektif akan berada diantara 0,00 dan 1,00, dan makin besar nilai
positif yang diperoleh menunjukkan bahwa item itu sensitifitas keberhasilan
pengajarannya makin besar pula. Dengan kata lain, makin besar angka indeks yang
diperoleh, makin besar pula sensitifitas keberhasilan pengajarannya.
Ada beberapa pembatasan dan penggunaan indeks sensitifitas itu. Pertama, guru
harus memberikan tes itu 2 kali untuk menghitung indeks. Kedua, suatu indeks yang
rendah tidak selalu benar menunjukkan item yang tidak efektif atau pengajaran yang
tidak efektif. Ketiga, respons para siswa terhadap item-item itu sesudah menerima
pelajaran, mungkin sedikit-banyak dipengaruhi oleh pengerjaan mereka pada tes yang
sama yang telah dilakukan pada waktu sebelum menerima pelajaran. Pembatasan
yang terakhir ini akan lebih terlihat dan dirasakan siswa jika pengajaran itu diberikan
dalam waktu yang singkat.
Meskipun ada pembatasan-pembatasan seperti tersebut diatas, indeks sensitifitas itu
tetap mengandung arti yang penting bagi penilaian keefektifan item didalam tes
penguasaan criterion-referenced. Item tes akan mempunyai nilai yang kecil bagi
pengukuran hasil pengajaran yang diharapkan jika item itu tidak atau kurang memiliki
sensitifitas terhadap hasil pengajaran.
BAB III
Penutup
3.1 Kesimpulan
Dari penjelasan di atas dapat disimpulkan bahwa pemberian skor ini sangat penting
untuk mendapatkan hasil pengolahan belajar siswa dan mahasiswa sehingga kita dapat
mengetahui seberapa jauh pemahaman dan penerimaan siswa terhadap materi pelajaran
1
yang diberikan. Penskoran merupakan langkah pertama dalam proses pengolahan hasil tes
pekerjaan siswa atau mahasiswa. Penskoran adalah suatu proses pengubahan jawaban-
jawaban tes menjadi angka-angka (mengadakan kuantifikasi). Angka-angka hasil
penskoran itu kemudian diubah menjadi nilai-nilai melalui suatu proses pengolahan
tertentu.
Untuk penilaian yang dilakukan oleh pendidik hasil penilaian masing-masing peserta
didik harus dibandingkan dengan Kriteria Ketuntasan Minimal (KKM). Analisis ini
dimaksudkan untuk mengetahui kemajuan hasil belajar dan kesulitan belajar peserta
didik, serta untuk memperbaiki pembelajaran.
Hal yang paling mengandung kemungkinan penyalahgunaan tes adalah
penginterpretasian hasil tes secara salah. Oleh karena itu maka interpretasi hasil tes harus
diikuti tanggung jawab professional. Bila hasil tes diinterpretasi secara tidak patut, dalam
jangka panjang akan dapat membahayakan kehidupan peserta tes. Suatu interpretasi dapat
merupakan bagian dari suatu presentasi atau penggambaran informasi yang diubah untuk
menyesuaikan dengan suatu kumpulan simbol spesifik. Informasi itu dapat berupa lisan,
tulisan, gambar, matematika, atau berbagai bentuk bahasa lainnya. Makna yang kompleks
dapat timbul sewaktu penafsir baik secara sadar ataupun tidak melakukan rujukan silang
terhadap suatu objek dengan menempatkannya pada kerangka pengalaman dan
pengetahuan yang lebih luas.
3.2 Saran
Untuk tes seharusnya dapat menggambarkan keseluruhan bahan pengajaran atau
keseruluhan tujuan pengajaran. Sebaiknya penilaian berdasarkan acuan patokan ini
seyogyanya jangan digunakan dalam pengolahan dan penentuan nilai hasil tes sumatif
seperti pada ulangan umum dalam rangka mengisi raport, ini tidak mempertimbangkan
kemampuan kelompok, jadi besar kemungkinan ada siswa yang tidak dapat dinyatakan
lulus atau naik kelas. setiap kelompok mempunyai standar masing-masing dan standar
satu kelompok tidak dapat dipergunakan sebagai standar kelompok yang lain. Standar
dari hasil tes sebelumnya pun tidak dapat dipergunakan sebagai standar sehingga setiap
memperoleh hasil tes harus dibuat norma yang baru.Kelemahan yang lain adalah apabila
butir-butir soal yang diberikan dalam tes terlalu sukar, maka tes tersebut betapapun
pintarnya testee akan memperolah nilai yang rendah, sebaliknya apabila butir soal yang
dikeluarkan dalam tes terlalu mudah, maka betapapun bodohnya testee akan berhasil
1
memperoleh nilai yang tinggi sehingga gambaran tingkat kemampuan testee yang
sebenarnya tidak dapat diketahui.
DAFTAR PUSTAKA
Andartari, dkk. 2009. Buku Ajar Evaluasi Pendidikan. Jakarta: Universitas Negeri
Jakarta.
Arikunto, Suharsimi. 2007. Dasar-dasar Evaluasi Pendidikan. Jakarta: Bina Aksara.
1
Fijra, TEKNIK PENGOLAHAN HASIL BELAJAR,
matahariku-fijra.blogspot.com/2011/06/teknik-pengolahan-hasil-belajar.html, 9 September
2012.
Purwanto, Ngalim. 2002. Prinsip-prinsip dan Teknik Evaluasi Pengajaran. Bandung:
Rosdakarya.
Purwanto. 2011. Evaluasi Hasil Belajar.Yogyakarta: Pustaka Pelajar.
Sudijono, Anas. 2011. Pengantar Evaluasi Pendidikan. Jakarta: PT RajaGrafindo
Persada.
LAMPIRAN-LAMPIRAN
1. Power Point (PPT) Makalah “Teknik Pengolahan Skor Hasil Belajar”.
1