teknik penskoran

1

BAB I

PENDAHULUAN

1.1 Latar Belakang

Guru adalah pendidik dan pengajar pada pendidikan anak usia dini jalur sekolah atau

pendidikan formal, pendidikan dasar, dan pendidikan menengah. Dalam menjalani

perannya sebagai seorang pendidik dan pengajar, guru juga berperan untuk menilai hasil

kinerja siswa atau mengolah skor hasil belajar siswa. Dilingkungan sekolah, kita melihat

pula bahwa pada waktu-waktu tertentu guru selalu mengadakan evaluasi. Kenyataan

yang biasa dilakukan di sekolah-sekolah Indonesia sampai dewasa ini ialah bahwa pada

akhir semester guru mengadakan ulangan-ulangan, pada akhir tahun mengadakan ujian-

ujian kenaikan kelas, dan pada akhir kelas tertinggi pada setiap taraf atau level

pendidikan, sekolah mengadakan ujian akhir (Evaluasi Belajar Tahap Akhir). Ulangan,

ujian kenaikan kelas, dan evaluasi belajar tahap akhir tadi, merupakan contoh tentang

evaluasi yang lazim dilaksanakan di setiap institusi pendidikan. Proses penilaian adalah

suatu proses membandingkan skor yang diperoleh tiap siswa dengan acuan yang dipakai

penilaian aturan patokan atau penilaian aturan normal (PAN atau PAP), yang hasilnya

berbentuk nilai dengan skala 0 – 10 atau A – E. Dalam proses tersebut dapat dilihat

bahwa penskoran atau scoring adalah pemberian angka-angka terhadap prestasi seseorang

sesudah melaksanakan suatu tugas tertentu. Setelah selesai pengukuran yang salah satu

alatnya biasa disebut tes, barulah dilakukan perbandingan hasil pengukuran yang

berbentuk biji/skor dengan acuan yang dipakai yang dihasilkan nilai tersebut kita kenal

dengan pemberian nilai atau granding.

Dalam pelaksanaan sehari-hari scoring dan granding disatukan atau tidak mengenal

pemisahan; pemberian biji/skor sekaligus berarti pemberian nilai. Sebagai hasilnya ialah

bahwa penilaian tersebut tidak comparable dan penafsiran terhadap nilai yang diberikan

dapat berbeda-beda. Untuk dapat melakukan evaluasi yang lebih memadai maka kedua

kegiatan tersebut harus dipisahkan artinya; granding baru dapat dilaksanakan setelah

skoring selesai, sehingga nilai tiap siswa dapat dibandingkan, penafsiran terhadap nilai

sama, sifat terbuka dapat terpenuhi, obyektivitas lebih terjamin. Apa yang telah

dicapai oleh siswa berupa skor mentah artinya skor i t u belum mempunyai makna

apa pun sebelum diolah lebih lanjut. Agar skor siswa bermakna, maka diperlukan

pengolahan lebih lanjut sehingga skor siswa dapat bermakna nilai, baik nilai kualitatif

http://id.wikipedia.org/wiki/Sekolah

http://id.wikipedia.org/wiki/Pendidikan

1

maupun nilai kuantitatif. Oleh sebab itu, guru harus dapat memahami dan menguasai

lebih mendalam tentang teknik pengolahan skor hasil belajar untuk menunjang proses

pembelajaran dan sebagai alat untuk mengetahui sampai sejauh mana guru berhasil dalam

menranfer ilmu yang dimilikinya kepada siswa.

1.2 Perumusan Masalah

Apa saja jenis pendekatan dalam penilaian?

Apa perbedaan antara penilaian formatif dan sumatif?

Bagaimana cara mengolah hasil tes formastif dan sumatif?

Bagaimana cara menginterpretasikan skor hasil belajar?

1.3 Tujuan Penulisan

Dapat menyebutkan dan memahami dua jenis pendekatan dalam penilaian

Dapat membedakan penilaian formatif dan sumatif

Dapat mengolah hasil tes formatif dan sumatif

Dapat menginterpretasikan skor hasil belajar

1.4 Manfaat Penulisan

Agar mahasiswa dapat menyebutkan dan memahami dua jenis pendekatan dalam

penilaian

Agar mahasiswa dapat membedakan penilaian formatif dan sumatif

Agar mahasiswa dapat mengolah hasil tes formatif dan sumatif

Agar mahasiswa dapat menginterpretasikan skor hasil belajar

1

BAB II

PEMBAHASAN

2.1 Pendekatan – Pendekatan Dalam Penilaian

Dalam penafsiran hasil tes ada dua pendekatan penilaian yaitu Penilaian Acuan Patokan

(PAP) dan Penilaian Acuan Normatif (PAN)

1) Penilaian Acuan Patokan (PAP)

Suatu pendekatan penilaian yang memberikan penilaian terhadap hasil belajar peserta

didik dengan membandingkan skor yang didapat seorang siswa dengan suatu standar yang

sifatnya mutlak. Penilaian Acuan Patokan ini berusaha mengukur tingkat pencapaian tujuan

belajar siswa. Siswa yang tidak mencapai tujuan yang telah ditetapkan berarti ia gagal,

artinya pengajaran yang diberikan belum berhasil. Jadi, penilaian acuan patokan ini ditujukan

sudah atau belumnya siswa mencapai tujuan yang telah ditetapkan. Dengan kata lain

penilaian ini lebih mengutamakan apa yang dapat dilakukan oleh siswa, kemampuan apa

yang sudah dicapai, setelah mereka menyelesaikan satu bagian kecil dari keseluruhan

program.

Melalui pendekatan ini, guru dapat mengambil keputusan tindakan pengajaran. Jika hasil

belajar siswa belum mencapai tujuan dengan kriteria 85% dari target yang diharapkan, berarti

pengajaran itu gagal dan harus diulang kembali. Untuk tes seharusnya dapat menggambarkan

keseluruhan bahan pengajaran atau keseruluhan tujuan pengajaran.

Sebaiknya penilaian berdasarkan acuan patokan ini seyogyanya jangan digunakan dalam

pengolahan dan penentuan nilai hasil tes sumatif seperti pada ulangan umum dalam rangka

mengisi raport. Diantara kelemahan dari PAP ini adalah tidak mempertimbangkan

kemampuan kelompok, jadi besar kemungkinan ada siswa yang tidak dapat dinyatakan lulus

atau naik kelas. Kelemahan yang lain adalah apabila butir-butir soal yang diberikan dalam tes

terlalu sukar, maka tes tersebut betapapun pintarnya testee akan memperolah nilai yang

rendah, sebaliknya apabila butir soal yang dikeluarkan dalam tes terlalu mudah, maka

betapapun bodohnya testee akan berhasil memperoleh nilai yang tinggi sehingga gambaran

tingkat kemampuan testee yang sebenarnya tidak dapat diketahui. Batas kelulusan

berdasarkan pada PAP yaitu:

1

- Batas Lulus Purposif (BLP)

BLP saat ini digunakan pada jenjang pendidikan dasar dan menengah dalam

memberikan nilai pada siswa seperti yang tertera pada ruang lingkup penilaian oleh

pendidik yang menyatakan bahwa kegiatan yang dilakukan oleh pendidik pada tahap

analisis adalah menganalisis hasil penilaian menggunakan acuan kriteria yaitu

membandingkan hasil penilaian masing-masing peserta didik dengan standar yang telah

ditetapkan. Untuk penilaian yang dilakukan oleh pendidik hasil penilaian masing-masing

peserta didik dibandingkan dengan Kriteria Ketuntasan Minimal (KKM). Analisis ini

dimaksudkan untuk mengetahui kemajuan hasil belajar dan kesulitan belajar peserta

didik, serta untuk memperbaiki pembelajaran.

Dapat ditarik kesimpulan bahwa angka KKM adalah angka yang dipakai sebagai

batas minimum atau batas kelulusan atau batas ketercapaian yang menunjukkan seorang

siswa telah menguasai kompetensi yang ada dalam materi tes atau belum pada satu

satuan periode tertentu misalnya satu semester. BLP ini secara perhitungan relatif

mudah, karena nilai diambil langsung dari nilai mentah kemudian dibandingkan dengan

kriteria yang dipakai misalnya KKMmata pelajaran IPS dan lainnya.

PAP antara lain dimanfaatkan dalam:

Penentuan prestasi siswa dalam mencapai tujuan pengajaran.

Meneyeleksi siswa atas dasar kualitas prestasi.

Mengukur keefektifan pengajaran (metode, teknik, pemilihan bahan, penggunaan alat,

dan sebagainya).

Umpan balik bagi perbaikan pengajaran.

Mengetahui kelemahan/kesulitan siswa untuk pengajaran remedial.

PAP digunakan pada:

Tes akhir (sumatif).

Tes seleksi dengan acuan diluar kelompok, misalnya patokan tujuan yang harus

dicapai (standar tertentu).

Tes formatif (tes pembinaan dalam pengajaran), termasuk tes unit, postes ulangan

harian/formatif.

Tes diagnosis, mengetahui jenis dan penyebab kesulitan belajar siswa.

2) Penilaian Acuan Normatif (PAN)

PAN (Penilaian Acuan Patokan) adalah penilaian yang dalam menginterpretasi data hasil

pengukuran didasarkan pada pretasi anggota kelompok lainnya. Beberapa teknik analisis

1

yang bisa digunakan untuk mengolah data dengan pendekatan acuan patokan adalah deviasi

standar, mean, standar skor, rank, persentil dan sejenisnya. Bentuk acuan tersebut salah

satunya yang paling sering dipakai dalam dunia pendidikan adalah batas kelulusan (passing

grade). Berdasarkan pada PAN ada dua jenis batas kelulusan yaitu:

- Batas Lulus Aktual (BLA)

BLA didasarkan atas nilai rata-rata aktual atau nilai rata-rata yang dapat dicapai oleh

suatu kelompok siswa yang mengikuti tes/ulangan.

- Batas Lulus Ideal (BLI)

BLI hampir sama dengan BLA yaitu menentukan rata-rata ideal dan simpangan baku

(SD) ideal. Perbedaannya dalam mencari rata-rata dan SD tidak perlu memakai formula

tetapi dipakai ketetapan sebagai berikut: rata-rata ideal (X ideal)=V2 dari skor

maksimum yang mungkin dicapai. Simpangan baku (SD) = 1/3 dari rata-rata ideal (X

ideal).

Suatu cara membandingkan skor yang didapat oleh seorang peserta didik dengan skor

yang didapat oleh peserta didik lainnya dalam kelompok tes yang diberikan. Penilaian Acuan

Norma (Norm Referenced Evaluation) dikenal pula dengan Standar Relatif atau Norma

Kelompok. Pendekatan penilaian ini menafsirkan hasil tes yang diperoleh testee dengan

membandingkan dengan hasil tes dari testee lain dalam kelompoknya. Alat pembanding

tersebut yang menjadi dasar standar kelulusan dan pemberian nilai ditentukan berdasarkan

skor yang diperoleh testee dalam satu kelompok. Dengan demikian, standar kelulusan baru

dapat ditentukan setelah diperoleh skor dari para peserta testee.

Hal ini berarti setiap kelompok mempunyai standar masing-masing dan standar satu

kelompok tidak dapat dipergunakan sebagai standar kelompok yang lain. Standar dari hasil

tes sebelumnya pun tidak dapat dipergunakan sebagai standar sehingga setiap memperoleh

hasil tes harus dibuat norma yang baru. Dasar pemikiran dari penggunaan standar PAN

adalah adanya asumsi bahwa di setiap populasi yang heterogen terdapat siswa dengan

kelompok baik, kelompok sedang dan kelompok kurang. Pengolahan skor dengan Penilaian

Acuan Norma (PAN) mengharuskan kita menghitung dengan statistik. Cara perhitungan

menggunakan statistik yang cukup kompleks dan beberapa kurva normal. Menggunakan

perhitungan perentase atau rumus-rumus sederhana.

PAN antara lain dimanfaatkan dalam:

Mengklasifikasi siswa dalam kelompoknya.

Menentukan peringkat siswa dalam grupnya.

1

Menyeleksi siswa berdasarkan prestasi apa adanya dan pembanding anggota

kelompoknya.

PAN digunakan pada:

Tes akhir (sumatif).

Tes seleksi dengan acuan intra kelompok (situasi pada kelompok tersebut).

Tes prognostik, yang bertujuan membuat ramalan (dasar: apabila seseorang

menduduki tempat yang sama, semakin tampaklah tingkat kemampuan orang

tersebut).

Kelemahan sistem PAN adalah dengan tes apapun dalam kelompok apapun dan dengan

dasar prestasi yang bagaimanapun, pemberian nilai dengan sistem ini selalu dapat dilakukan.

Karena itu penggunaan sistem PAN dapat dilakukan dengan baik apabila memenuhi syarat

yang mendasari kurva normal, yaitu:

Skor nilai terpencar atau dapat dianggap terpencar sesuai dengan pencaran kurva

normal

Jumlah yang dinilai minimal 50 orang atau sebaiknya 100 orang ke atas.

Penilaian Acuan Norma ini berdasarkan pada asumsi yaitu:

a. Psikologis, artinya semua peserta didik memiliki kemampuan yang sama, adanya

perbedaan kemampuan Intelegensi Question, latar belakang pendidikan, dan lain-lain.

b. Tujuan penilaian hasil belajar adalah untuk melihat dan menentukan kedudukan

seseorang peserta didik dari teman atau kelompoknya, apakah ia berada pada posisi

“atas” di “ tengah” dan di “ bawah”.

c. Penilaian ini digunakan apabila pendidik menghadapi kurikulum yang bersifat

dinamis, artinya materi pelajaran yang dikembangkan selalu berubah sesuai dengan

tuntutan zaman, sehingga peserta didik agak sulit menetapkan kriteria benar atau

salah.

d. Tujuan pembelajaran tida ditekankan pada penguasaan materi atau keterampilan

tertentu, melainkan untuk mengembangkan kreatifitas individual, kemampuan

apersepsi, serta kemampuan berkompetensi antar sesama peserta didik.

e. Penggunaan acuan ini sangat dependen dengan jenis kelompok, tempat, dan waktu.

Kelompok yang homogen akan berbeda dengan yang heterogen, kelompok belajar di

kota akan berbeda dengan kelompok belajar di daerah terpencil. Oleh karena itu

penilaian acuan norma ini adalah menilai kemampuan rata-rata kelompok, kemudian

individu diukur seberapa jauh penyimpangan terhadap rata-rata tersebut. Hal ini

1

berarti tes tersebut dapat memberikan gambaran diskriminatif antara kemampuan

peserta didik yang pandai dengan yang bodoh.

Perbedaan Pendekatan PAP dan PAN

Penilaian dengan pendekatan PAP dan PAN merupakan dua pendekatan yang berbeda

atau bertentangan. Adanya perbedaan ini menyebabkan kita harus mengetahui dan

memahami karakteristik dari kedua pendekatan tersebut.

PAN (Penilaian Acuan Norma) PAP (Penilaian Acuan Patokan)

1. Berfungsi untuk menetapkan

kedudukan relatif seorang siswa di

dalam kelas

2. Tujuan pembelajaran dinyatakan

secara umum atau khusus

3. Belajar tuntas tak begitu diutamakan

4. Tes atau pernyataan harus

mencakup tingkat kesukaran yang

bervariasi dari yang mudah, sedang,

dan sulit

5. Skor-skor diolah dengan

menggunakan statistik seperti mean,

standar deviasi dan lain-lain

6. Tepat dipakai untuk tes penempatan

dan tes sumatif

7. Hasil penilaian tepat ditransformasi

dalam skala harus seperti A, B, C,

D, dan E

1. Berfungsi menetapkan apakah siswa

telah mencapai atau menguasai

tujuan yang diharapkan

2. Tujuan pembelajaran harus

dinyatakan secara khusus

3. Sangat mengutamakan adanya belajar

tuntas

4. Penyusunan soal lebih

mengutamakan pada performance

dan kemampuan yang harus dikuasai

5. Tidak selalu skor diolah dengan

menggunakan statistik

6. Tepat dipakai untuk diagnostik dan

tes formatif

7. Hasil penilaian tepat dinyatakan

dalam bentuk pernyataan sangat

memuaskan, cukup, kurang, dan

gagal.

Tabel Perbedaan PAN dan PAP

2.2 Penilaian Formatif dan Sumatif

Penilaian Formatif

Kata formatif bersal dari kata dalam bahasa Inggris “to form” yang berarti

membentuk. Tes formatif dimaksudkan sebagai tes yang digunakan untuk mengetahui

1

sejauh mana siswa telah terbentuk setelah mengikuti proses belajar mengajar. Setiap

program atau pokok bahasan membentuk prilaku tertentu sebagaimana dirumuskan

dalam tujuan pembelajarannya. Tes formatif diujikan untuk mengetahui sejauh mana

proses belajar mengajar dalam satu program telah membentuk siswa dalam prilaku

menjadi tujuan pembelajaran program tersebut. Setiap akhir program atau pokok

bahasan, siswa dievaluasi penguasaan atau perubahan prilakunya dalam pokok bahasan

tersebut. Evaluasi dilakukan berdasarkan hasil pengukuran yang dilakukan menggunakan

tes formatif.

Tes formatif dalam praktik pembelajaran dikenal sebagai ulangan harian. Dalam

perencanaan pengajaran, komponen-komponen dan proses pembelajaran untuk satu

pokok bahasan direncanakan dalam sebuah satuan pembelajaran. Oleh karenanya dalam

satuan pembelajaran termuat komponen-komponen seperti tujuan pembelajaran, materi,

metode, strategi pembelajaran, media dan evaluasi. Evaluasi yang direncanakan dalam

satuan pembelajaran merupakan evaluasi yang dilakukan berdasarkan tes formatif.

Penilaian Formatif, yakni penilaian yang dilakukan pada setiap akhir satuan

pelajaran, dan fungsinya untuk memperbaiki proses belajar-mengajar atau memperbaiki

program satuan pelajaran.

Cara Menilai Tes Formatif

Tes formatif adalah tes yang diberikan kepada murid-murid pada setiap akhir program

satuan pelajaran. Fungsinya untuk mengetahui sampai di mana pencapaian hasil belajar

murid dalam penguasaan bahan atau materi pelajaran yang telah diberikan sesuai dengan

tujuan instruksional khusus yang telah dirumuskan di dalam satuan pelajaran tersebut.

Dalam penilaian formatif ini, jika tujuan-tujuan instruksional khusus telah dirumuskan

dengan tepat, distribusi tingkat kesukaran soal-soal (item tes) dan daya pembeda masing-

masing soal (discriminating power of a test item) tidak begitu penting. Yang penting

adalah bahwa setiap soal betul-betul mengukur tujuan instruksional yang hendak dicapai

yang telah dirumuskan di dalam program satuan pelajaran.

Penilaian Sumatif

Kata sumatif berasal dari kata dalam bahasa Inggris yaitu “sum” yang artinya jumlah

atau total. Tes sumatif dimaksudkan sebagai tes yang digunakan untuk mengetahui

penguasaan siswa atas semua jumlah materi yang disampaikan dalam satuan waktu

tertentu seperti caturwulan atau semester. Setelah semua materi selesai disampaikan,

maka evaluasi dilakukan atas perubahan perilaku yang terbentuk pada siswa setelah

1

memperoleh semua materi pelajaran. Evaluasi dilakukan berdasarkan hasil pengukuran

menggunakan tes sumatif. Dalam praktik pengajaran tes sumatif dikenal sebagai ujian

akhir semester atau caturwulan tergantung satuan waktu yang digunakan untuk

menyelesaikan materi.

Skor hasil pengukuran yang merupakan data hasil belajar yang dikumpulkan dari

proses testing belum dapat digunakan untuk membuat pengambilan keputusan. Untuk

dapat digunakan sebagai dasar pengambilan keputusan maka skor tersebut harus terlebih

dulu diubah menjadi nilai dalam poses penilaian.

Nilai merupakan hasil dari proses penilaian. Nilai diperoleh dengan mengubah skor

dengan skala dan acuan tertentu. Oleh karena itu, nilai hanya dapat dimaknai dan

digunakan sebagai dasar pengambilan keputusan dengan memerhatikan skala dan acuan

yang digunakan.

Penilaian Sumatif, yakni penilaian yang dilakukan tiap caturwulan atau semester

(setelah siswa menyelesaikan suatu unit atau bagian dari mata pelejaran tertentu),

berfungsi untuk menentukan angka atau hasil belajar siswa dalam tahap-tahap tertentu.

Cara Menilai Tes Sumatif

Tes sumatif biasanya diadakan tiap caturwulan sekali atau setiap semester. (Yang baik

adalah tiap jangka waktu tertentu bila suatu unit atau bagian bahan pelajaran telah selesai

diajarkan melalui satuan-satuan pelajaran). Fungsi tes sumatif ialah untuk menilai

prestasi siswa, sampai di mana penguasaan siswa terhadap bahan pelajaran yang telah

diajarkan selama jangka waktu tertentu. Kegunaannya antara lain untuk pengisian rapor,

penentuan kenaikan kelas, dan penentuan lulus-tidaknya siswa pada ujian akhir sekolah.

Pada umumnya jumlah item atau soal-soal tes sumatif lebih banyak daripada item tes

formatif, dan bentuk soalnya pun dapat terdiri atas campuran beberapa bentuk item tes

(seperti true-false, multiple choice, completion, matching, dan essay).

Aspek Tingkah Laku yang Dinilai

Penilaian sumatif diadakan untuk menilai hasil jangka panjang dari suatu proses

belajar-mengajar, aspek tingkah laku yang dinilai meliputi aspek kemampuan

(pengetahuan, keterampilan) maupun aspek nilai dan sikap yang dipandang sebagai hasil

belajar. Namun, tulisan ini lebih menitikberatkan pembahasan mengenai penilaian

terhadap hasil belajar dalam bentuk kemampuan penilaiannya dapat dilakukan dengan

menggunakan tes buatan guru.

Penyusunan Tes Sumatif

1

Penilaian ini dilakukan pada akhir unit pelajaran yang cukup panjang, tes hendaknya

lebih dititikberatkan pada penilaian terhadap aspek kemampuan yang lebih tinggi,

disesuaikan dengan tujuan instruksional umum. Bila aspek ingatan masih dirasakan

perlu, hendaknya diusahakan agar proporsinya lebih kecil dibandingkan dengan aspek-

aspek kemampuan yang lebih tinggi (pemahaman dan aplikasi).

Bahan Rincian Tes IPA

Kelas : ..........

Semester : ..........

Ruang LingkupTumbuhanHewanUdaraKesehatanAir Jumlah

AspekIngatan 4 3 5 2 4 18Pemahaman 8 6 8 4 6 32Aplikasi 8 6 7 4 8 33JUMLAH 20 15 20 10 18 83Untuk menjamin agar ruang lingkup bahan (daerah cukup) dan berbagai aspek

kemampuan dapat terangkum dalam tes sumatif, dalam merencanakan tes perlu dibuat

bahan rincian (layout) seperti di atas.

Aspek Uraian Contoh soal tes (matematika)

Ingatan Kemampuan untuk mengingat

dan menyatakan kembali apa-

apa yang telah dipelajari

sebelumnya.

Sebutkan unsur-unsur yang

terdapat di dalam suatu grafik.

Pemahaman Kemampuan untuk

menangkap arti suatu bahan

yang telah dipelajari yang

terlihat antara lain dalam

kemampuan seseorang

menafsirkan informasi,

meramalkan akibat suatu

peristiwa, dan kemampuan-

kemampuan lain yang sejenis.

Di bawah ini tercantum sebuah

grafik yang menggambarkan

laju pertambahan penduduk dari

tahun ke tahun. Coba buatlah

tafsiran singkat mengenai data

yang digambarkan oleh grafik

tersebut.

Aplikasi Kemampuan menggunakan

pengetahuan yang telah

dimiliki dalam memecahkan

Di bawah ini terdapat jumlah

penduduk pada setiap tahun,

dari tahun 1965 sampai dengan

1

persoalan atau situasi yang

baru.

1970. Coba buatlah grafik

pertambahan penduduk

berdasarkan angka-angka

tersebut.

Angka-angka di dalam kotak-kotak di atas menunjukkan jumlah soal yang

direncanakan untuk tes sumatif. Mengingatwaktu yang disediakan untuk melaksanakan

tes terbatas, jumlah soal tersebut di atas dapat dikurangi dengan jalan mengambil

cuplikan (sampel) dari setiap kotak sedemikian rupa sehingga proporsi antara berbagai

aspek dan ruang lingkup tetap.

Dalam tes sumatif, distribusi tingkat kesukaran soal-soal tes dan daya pembeda

masing-masing soal penting untuk diperhatikan, sebab, semakin bervariasi hasil tes

sumatif, semakin baik ditinjau dari fungsinya untuk pemberian angka, penentuan

kenaikan kelas, dan sebagainya. Perlu dipikirkan kemungkinan untuk mengembangkan

tes sumatif dalam bentuk tugas. Dengan memberikan sejumlah data, siswa ditugasi untuk

menyusun suatu program sederhana mengenai suatu topik tertentu yang mendorongnya

menerapkan berbagai pengetahuan yang dimilikinya dalam menghadapi tugas tersebut.

2.3 Pengolahan Hasil Tes Formatif dan Sumatif

Cara Mengolah Hasil Tes Formatif

1) Standar dan Cara Mengolah Hasil tes

Karena hasil penilaian formatif akan dijadikan dasar bagi penyempurnaan proses

belajar-mengajar, maka standar yang dipergunakan dalam mengolah hasil tes tersebut

adalah standar mutlak (criterion-refernced test). Tes ini bertujuan untuk mengetahui

sejauh mana tujuan-tujuan instruksional khusus telah dicapai oleh siswa, dan bukan

untuk mengetahui status setiap siswa dibandingkan dengan siswa-siswa lainnya dalam

kelas yang sama.

Ada dua jenis pengolahan yang diperlukan di dalam penilaian formatif ini, yaitu:

a) Pengolahan untuk mendapat angka presentase siswa yang gagal dalam setiap soal,

misalnya:

1

Soal Nomor % siswa yang gagal1 30%2 85%3 60%

dan sebagainya dan seterusnyaUntuk soal bentuk uraian, pengertian “siswa yang gagal” di atas diartikan

sebagai siswa yang jawabannya terhadap suatu soal dipandang kurang memuaskan.

b) Pengolahan untuk mendapat hasil yang dicapai setiap siswa dalam tes secara

keseluruhan ditinjau dari presentase jawaban yang memuaskan, misalnya:

Nama SiswaHasil yang dicapai

(% jawaban yang memuaskan)1. Hamid 90%2. Suwarni 50%3. Basiran 75%dan seterusnya

Sebagai contoh, bila skor maksimum yang harus dicapai dalam suatu tes adalah

60, angka yang dicapai Basiran dalam tes tersebut adalah:

4560

x 100% = 75%

Cara menilai tes formatif dilakukan dengan precentages correction (hasil yang

dicapai setiap siswa dihitung dari presentase jawaban yang benar).

Rumusnya adalah sebagai berikut:

Keterangan:

S : nilai yang diharapkan (dicari)

R : jumlah skor dari item atau soal yang dijawab benar

N : skor maksimum dari tes tersebut

2) Penggunaan Hasil tes

a. Implikasi hasil pengolahan setiap soal

Dengan mempertimbangkan hasil-hasil penelitian yang pernah dilakukan dalam

mengembangkan tes formatif, untuk menetapkan hasil pengolahan setiap soal hendaknya

diikuti ketentuan-ketentuan sebagai berikut:

S=RN

x 100

1

Bila mayoritas siswa (sekitar 60% atau lebih) gagal dalam mengerjakan suatu soal

tertentu, perlu diulang kembali pengajaran mengenai bahan yang berhubungan

dengan soal atau item tersebut, bagi seluruh kelas.

Bila kurang dari 60% siswa yang gagal mengerjakan suatu soal atau item tertentu,

pengulangan kembali bahan yang berhubungan dengan soal tersebut dapat dilakukan

sendiri-sendiri oleh siswa yang bersangkutan dengan petunjuk dan pengarahan dari

guru.

Catatan:

Bila presentase siswa yang gagal 60% atau lebih (seperti dikemukakan dalam

butir 1 di atas), untuk tahun berikutnya perlu pula dipertimbangkan penggunaan cara

yang lebih baik dalam mengerjakan bahan yang bersangkutan.

b. Implikasi hasil pengolahan setiap siswa

Dengan mempertimbangkan hasil-hasil penelitian yang telah dilakukan dalam

bidang mastery learning, untuk menetapkan hasil pengolahan setiap siswa dipergunakan

ketentuan-ketentuan sebagai berikut:

Bila hasil yang dicapai oleh siswa dalam tes adalah 75% atau lebih, siswa tersebut

dipandang telah menguasai bahan pelajaran yang bersangkutan dan siap untuk

mengikuti program atau satuan pelajaran berikutnya.

Bila hasil yang dicapai siswa kurang dari 75%, siswa tersebut masih dapat diizinkan

untuk mengikuti program atau satuan pelajaran berikutnya, tetapi kepada siswa

tersebut perlu diberikan perhatian atau bantuan khusus sehubungan dengan

kesulitan-kesulitan yang masih dialaminya.

Dari uraian di atas dapat disimpulkan bagaimana pentingnya peran penilaian formatif

(pada akhir setiap program atau satuan pelajaran) bagi penyempurnaan proses

belajar-mengajar untuk para siswa.

Cara Mengolah Hasil Tes Sumatif

Standar dan Cara Mengolah Hasil Tes Sumatif

a. Standar yang dipakai

Meskipun penilaian sumatif dapat menggunakan standar yang mutlak (criterion-

referenced), biasanya orang lebih cenderung untuk menggunakan norma yang

relatif (norm-referenced). Dengan menggunakan norma yang relatif, hasil yang

dicapai siswa lebih menggambarkan statusnya dibandingkan dengan teman-teman

1

sekelasnya. Untuk pengisian rapor, ijazah, dan sebagainya, norma yang relatif ini

dipandang lebih sesuai untuk digunakan.

b. Cara mengolah hasil tes sumatif

Untuk mengolah hasil tes dengan menggunakan norma yang relatif digunakan

nilai-nilai standar (standard scores) seperti nilai berskala 1-10, nilai Z (skor

standar Z), atau persentile.

Untuk keseragaman penilaian di sekolah-sekolah yang menjalankan sistem

pengajaran PPSI, dalam menentukan nilai akhir untuk rapor dan ujian akhir

sekolah dianjurkan untuk menggunkan nilai berskala 1-10.

Proses pengolahan dari skor mentah (raw score) ke dalam nilai berskala 1-10

dilakukan dengan menyusun distribusi frekuensi, mencari atau menghitung angka

rata-rata (mean) dan deviasi standar (DS), dan kemudian mentransformasikan

skor-skor mentah tersebut ke dalam nilai berskala 1-10.

Jika tes sumatif terdiri atas beberapa bentuk item tes objektif (true-false,

multiple choice, matching, essay, dan sebagainya), untuk menskornya harus

menggunakan rumus-rumus penskoran yang berlaku untuk tiap bentuk item.

True-False,

Multiple choice,

Fill in, completion, dan matching, S = R

Essay, dengan pembobotan (weighting) untuk tiap item

Keterangan:

S : skor yang diharapkan atau dicari

R : jumlah item yang dijawab betul (Right)

W : jumlah item yang dijawab salah (Wrong)

n : jumlah option (alternatif jawaban)

1 : bilangan tetap.

Skor mentah yang diperoleh seorang siswa dari suatu tes sumatif yang terdiri atas

beberapa macam bentuk tes merupakan jumlah skor dari tiap-tiap bentuk tes

tersebut yang telah dihitung menurut rumus masing-masing. Skor mentah inilah

yang kemudian ditransformasikan ke dalam nilai skala 1-10 dengan menyusun

tabel distribusi frekuensi seperti yang telah dikemukakan.

S = R-W;

S = R W

n−1;

1

Mengolah skor mentah (raw score) menjadi nilai huruf dan beberapa skor standar

dengan urutan uraian sebagai berikut:

1. Mengolah skor mentah menjadi nilai huruf

Pengolahan skor mentah menjadi nilai huruf pun menggunakan sifat-sifat yang

terdapat pada kurva normal atau distribusi normal sebagai dasar perhitungan. Adapun

ciri-ciri atau sifat-sifat distribusi normal adalah:

a. Memiliki jumlah atau kepadatan frekuensi yang tetap pada jarak deviasi-deviasi

tertentu

b. Pada distribusi normal, mean, median, dan mode berimpit (sama besar), terletak

tepat di tengah kurva dan membagi dua sama besar jarak deviasi antara – 3 DS

dan + DS

Berdasarkan sifat-sifat distribusi itulah maka penjabaran skor mentah menjadi nilai

huruf dipergunakan mean dan DS.

i. Mengolah Skor Mentah Menjadi Nilai Huruf dengan Menggunakan Mean (M) dan

Deviasi Standar (DS)

Mencari mean (M) dan deviasi standar (DS) dalam rangka mengolah skor

mentah menjadi nilai huruf dapat dilakukan dengan dua cara yaitu jika banyaknya

skor yang diolah kurang dari 30 digunakan tabel distribusi frekuensi tunggal, jika

banyaknya skor yang diolah lebih dari 30 sebaiknya digunakan tabel distribusi

frekuensi bergolong.

Misalnya seorang dosen memperoleh skor mentah dari hasil tes yang telah

diberikan kepada 20 orang mahasiswanya sebagai berikut:

73, 70, 68, 68, 67, 67, 65, 65, 63, 62

60, 59, 59, 58, 58, 56, 52, 50, 41, 40

Skor mentah itu akan diolah menjadi nilai huruf A, B, C, D, TL dengan

menggunakan M dan DS. Untuk itu kita akan membuat tabel sebagai berikut:

Langkah-langkah menyusun tabel:

Masukkan nama siswa (kedalam kolom 1) dan skor masing-masing siswa

(ke dalam kolom 2) kemudian jumlahkan akan memperoleh ∑X.

1

Hitung mean (M) dengan membagi jumlah skor itu (∑X) dengan N

(banyaknya mahasiswa yang dites). Jadi rumus untuk mencari M adalah

M = ∑ XN

Isi kolom 3 dengan selisih (deviasi) tiap skor dari mean (X-M)

Isi kolom 4 dengan menguadratkan angka-angka dari kolom 3. Kemudian

jumlahkan sehngga akan memperoleh ∑ (X-M)2

Hitung mean dan DS dengan rumus berikut:

M = ∑ XN

DS = √ ∑(X−M )2

N atau DS = √ ∑d2

N

TABEL UNTUK MENGHITUNG MEAN DAN DS

Nama Siswa Skor Mentah (X) (X-M) atau (d) (X-M)2 atau (d)2

1 2 3 4

Amrin

Dahron

Mardi

Popon

Jamilah

Sarman

Ronald

Nursam

Marnah

Kamerun

Djufri

Rajiman

Jugil

Bonteng

Pairah

Gurita

Marlopo

Karmin

Nirmala

Brutal

73

70

68

68

67

67

65

65

63

62

60

59

59

58

58

56

52

50

41

40

13

10

8

8

7

7

5

5

3

2

0

-1

-1

-2

-2

-4

-8

-10

-19

-20

169

100

64

64

49

49

25

25

9

4

0

1

1

4

4

16

64

100

361

400

1

Jumlah 1201 (∑X) - 1509 ∑(X-M)2

Dari tabel tersebut kemudian dicari mean dan DS:

M = ∑ XN

= 1201

20 = 60,05 dibulatkan = 60

DS = √ ∑(X−M )2

N = √ 1509

20 = √75,45 = 8,69

Penjabaran Menjadi Nilai Huruf:

Dari perhitungan tersebut diperoleh mean (M) = 60 dan DS = 8,69. Selanjutnya

langkah-langkah penjabaran skor mentah menjadi nilai huruf adalah:

Tentukan besarnya skala unit deviasi (SUD). Misalnya, menggunakan seluruh

jarak range dari kurva normal yaitu antara -3 DS s. d. +3 DS = 6 DS. Karena nilai

huruf yang akan digunakan adalah A – B – C – D – TL yang berarti = 4 unit,

SUD nya = 6 DS : 4 = 1,5 DS. Jadi, SUD = 1,5 x 8, 69 = 13, 035, dibulatkan

menjadi 13

Titik tengah nilai C terletak pada mean = 60 karena C merupakan nilai tengah

pada skala penilaian A – B – C – D – TL

Tentukan batas bawah (lower limit) dan batas atas (upper limit) dari masing-

masing nilai huruf

Karena titik tengah C = M = 60, maka

Batas bawah C = M – 0,5 SUD = 60 – 0,5 (13) = 53,5

Batas atas C = M + 0,5 SUD = 60 + 0,5 (13) = 66,5

Batas bawah D = M – 1,5 SUD = 60 – 1,5 (13) = 34

Skor bawah 34 = TL

Batas atas B = M + 1,5 SUD = 60 + 1,5 (13) = 79,5

Skor diatas 79,5 = A

Berdasarkan hasil perhitungan pada langkah diatas, skor mentah dari 20 orang

mahasiswa ke dalam nilai huruf adalah:

Skor 80 keatas = A = tidak ada

Skor 67 s. d. 79,5 = B = 6 orang

Skor 54 s. d. 66,5 = C = 10 orang

1

Skor 34 s. d. 53,5 = D = 4 orang

Skor dibawah 34 = TL = tidak ada

ii. Mengolah Skor Mentah Menjadi Nilai Huruf dengan Batas Lulus = Mean

Cara lain untuk mengolah skor mentah menjadi nilai huruf ialah dnegan

menggunakan mean dan DS yang diperoleh dengan membuat tabel frekuensi.

Misalnya seorang dosen memperoleh skor dari hasil ujian semester dari 50

mahasiswa:

97, 93, 92, 90, 87, 86, 86, 83, 81, 80,

80, 78, 76, 76, 75, 74, 73, 72, 72, 71,

69, 67, 67, 67, 64, 63, 63, 62, 62, 60,

58, 57, 57, 56, 56, 54, 52, 50, 47, 45,

43, 39, 36, 36, 32, 29, 27, 26, 20, 16.

Skor mentah ini akan diolah menjadi nilai huruf A, B, C, D, dan TL. Untuk

mencari mean dan DS susun skor mentah tersebut ke dalam tabel frekuensi. Cari

terlebih dahulu range untuk menentukan besarnya interval dan kelas interval.

Range = 97 – 16 = 81

Kelas interval = Ri+1=81

10+1=9

Jadi dengan menentukan besarnya interval = 10, kelas intervalnya = 9.

TABEL DISTRIBUSI FREKUENSI

Kelas Interval f d Fd fd2

1

2

3

4

5

6

7

8

9

96 – 105

86 – 95

76 – 85

66 – 75

56 – 65

46 – 55

36 – 45

26 – 35

16 - 25

1

6

7

10

11

4

5

3

3

+4

+3

+2

+1

0

-1

-2

-3

-4

+4

+18

+14

+10

0

-4

-10

-9

-12

16

54

28

10

0

4

20

27

48

50 +11 207

1

(N) (∑fd) (∑fd2)

Dari tabel tersebut, meannya adalah:

M = M’ + i ∑fd

n

Keterangan:

M = mean sebenarnya yang akan dicari

M’ = mean dugaan dalam tabel

= 56+65

2=121

2=60,5

i = interval = 10

∑fd = jumlah dari kolom fd = +11

Maka, M = M’ + i ∑fd

n

=60,5 + 10 (+1150

¿=60 ,5+11050

= 60,5 + 2,2

= 62,7 dibulatkan = 63

Cara mencari deviasi standar (DS) adalah:

DS = i √ ∑ fd2

N−(∑ fd

N)

2

DS = 10 √ 20750

−(+1150

)2

DS = 10 √4,14−0,48 = 10 √3,66 = 10 x 1,9 = 19

Selanjutnya, cara mengubah skor mentah yang diperoleh dosen itu menjadi

nilai huruf A, B, C, D, dan TL dengan batas lulus = mean adalah:

Telah ditentukan bahwa batas lulus = mean = 63. Jadi skor mentah dari 63

keatas dibagi menjadi nilai huruf A, B, C, D, dan skor dibawah 63 dinyatakan

TL.

SUD = 0,75; DS = 0,75 x 19 = 14,25. Dengan demikian, selanjutnya akan

dapat menghitung dengan mudah batas atas dan batas bawah dari masing-

masing nilai huruf sebagai berikut:

Batas bawah D atau batas lulus = mean = 63

1

Skor dibawah 63 = TL

Batas atas D = M + 1 SUD = M + 0,75 DS = 63 + 14,25 = 77

Batas atas C = M + 2 SUD = M + 1,5 DS = 63 + 28,5 = 92

Batas atas B = M + 3 SUD = M + 2,25 DS = 63 + 42,75 = 106

Skor diatas 106 = A

Dengan perhitungan tersebut maka hasil kelulusan dari 50 mahasiswa adalah:

Yang tidak lulus (TL), skor dibawah 63 = 23 orang

Yang mendapat nilai D, skor 63 – 77 = 15 orang

Yang mendapat nilai C, skor 78 – 92 = 10 orang

Yang mendapat nilai B, skor 93 – 106 = 2 orang

Yang mendapat nilai A, skor diatas 106 = tidak ada

Jika dibandingkan dengan cara penjabaran terdahulu, maka cara yang terakhir

ini ternyata lebih mahal. Dari 50 mahasiswa yang ujian, ternyata sebanyak 23

orang tidak lulus (hampir 50 persen). Akan tetapi jika cara yang terakhir

dibandingkan dengan pengubahan skor mentah menjadi nilai 1 – 10 ternyata

lebih mudah. Jika skor mentah yang diperoleh 50 mahasiswa dijabarkan

menjadi nilai 1 – 10 dengan menggunakan mean dan DS aktual dengan batas

lulus M + 0,25 DS = 63 + 4,75 = 68, maka yang dapat dinyatakan lulus = 21

orang dan yang tidak lulus = 29 orang.

iii. Mengolah Skor Mentah Menjadi Nilai Huruf dengan Menggunakan Mean Ideal

dan DS Ideal

Jika skor maksimum ideal dari tes yang diberikan kepada 50 mahasiswa

tersebut = 120, maka mean ideal = 12

x skor maksimum ideal = 12

x 120 = 60 dan

DS ideal dari tes tersebut = 13

x 60 = 20

Dengan cara menjabarkan yang telah diuraikan, yakni dengan ketentuan batas

lulus = mean dan dengan demikian 1 SUD = 0,75 DS, maka:

Batas bawah D atau batas lulus = mean = 60

Skor dibawah 60 = TL

Batas atas D = M + 1 SUD = M + 0,75 DS = 60 + (0,75 x 20) = 60 + 15 = 75

Batas atas C = M + 2 SUD = M + 1,5 DS = 60 + (1,5 x 20) = 60 + 30 = 90

1

Batas atas B = M + 3 SUD = M + 2,25 DS = 60 + (2,25 x 20) = 60 +45 = 105

Skor diatas 105 = A

Dengan perhitungan tersebut maka hasil kelulusan dari 50 orang mahasiswa

adalah:

Yang tidak lulus (TL), skor dibawah 60 = 20 orang

Yang mendapat nilai D, skor 60 – 75 = 16 orang

Yang mendapat nilai C, skor 76 – 90 = 11 orang

Yang mendapat nilai B, skor 91 – 105 = 3 orang

Yang mendapat nilai A, skor diatas 105 tidak ada

Jika dibandingkan hasil perhitungan tersebut dengan hasil perhitungan yang

lalu, ternyata bahwa hasil kelulusan berimbang atau hampir sama. Yang tidak lulus

hanya selisih 3 orang dan kedua-duanya tidak ada yang memperoleh nilai A. Hal

ini antara lain adalah karena skor maksimum ideal dari tes yang diolah adalah 120

sedangkan nilai maksimum aktual (nilai tertinggi dari kelompok yang dites) adalah

97, yang berarti masih jauh dibawah nilai maksimum ideal 120. Akan tetapi jika

nilai maksimum ideal dari tes itu 100 misalnya maka mean ideal 100

2 = 50 dan DS

ideal 503

= 16,7 dibulaykan = 17. Dengan demikian mungkin ada beberapa orang

mahasiswa yang memperoleh nilai A dan yang tidak lulus pun jumlahnya

berkurang.

2. Mengolah skor mentah menjadi skor standar 1-10

Untuk mengolah skor mentah menjadi nilai 1-10, kita perlu mencari mean (rata-rata)

dan DS. Untuk itu skor mentah harus disusun ke dalam tabel distribusi frekuensi.

Langkah-langkah menyusun tabel distribusi adalah:

a. Kita tentukan dulu banyaknya kelas interval dengan cara:

b. Mengisi kolom 2 (kolom interval) di dalam tabel yang telah tersedia, mulailah

dari skor minimum berturut-turut dengan interval yang telah ditemukan dan

sejumlah kelas yang ditentukan pada langkah pertama.

c. Membuat tally pada kolom 3 (menabulasikan tiap-tiap skor ke dalam kelasnya

d. Mengisikan angka (jumlah) tally ke dalam kolom 4 (lajur frekuensi = f)

e. Menentukan deviasi pada lajur d dengan menetapkan letak mean dugaan (M’)

dengan angka nol pada kelas tertentu. Untuk menduga letaknol tersebut dapat

1

kita pilih kelas yang mengandung frekuensi yang paling tinggi. Selanjutnya

kita letakkan angka-angka deviasi itu dari nol ke atas dan ke bawah. Angka-

angka diatas nol kita beri tanda + (plus) dan angka-angka dibawah nol diberi

tanda – (minus)

f. Mengisi lajur fd dengan mengalikan angka-angka pada lajur f dan d.

Kemudian hasilnya dijumlahkan pada bagian bawah dari tabel ( = fd). Sampai

dengan kolom 6 ini (lajur fd) kita telah dapat menghitung besarnya mean yang

sebenarnya dari table tersebut. Akan tetapi, karena kita masih memerlukan

mencari DS (deviasi standar), kita perlu menambah satu kolom lagi untuk

mencari fd2

g. Mengisi lajur fd2, kemudian dijumlahkan pula pada bagian bawah dari tabel

sehingga kita peroleh ∑fd2 yang diperlukan dalam rumus untuk mencari DS.

Umpamakan seorang guru memperoleh skor mentah sari hasil ulangan sejarah di

kelas III SMP yang berjumlah 50 siswa:

Dari skor mentah hasil ulangan sejarah tersebut kita dapat menyusun tabel

distribusi frekuensi seperti berikut:

Skor maksimum = 87

Skor minimum = 7

Range = 87 – 7 = 80

Banyaknya kelas interval:

Ri+1=80

8+1=11

Jadi, interval (i) = 8; kelas interval = 11

Kela

s

Interval Tally f d fd fd2

16 64 87 36 65 42 43 54 47 51

77 55 68 42 40 47 42 46 45 50

20 57 28 7 44 51 40 39 39 57

28 39 21 48 46 37 41 43 49 71

29 44 34 50 45 35 44 52 56 45

1

1

2

3

4

5

6

7

8

9

10

11

87-94

79-86

71-78

63-70

55-62

47-54

39-46

31-38

23-30

15-22

7-14

I

-

II

III

IIII

IIII IIII I

IIII IIII IIII III

IIII

III

III

I

1

0

2

3

4

11

18

4

3

3

1

+6

+5

+4

+3

+2

+1

0

-1

-2

-3

-4

6

0

8

9

8

11

0

-4

-6

-9

-4

36

0

32

27

16

11

0

4

12

27

16

N = 50 +19

(∑fd)

181

(∑fd2)

Sekarang kita cari angka rata-rataa (mean) dari tabel di atas

Rumus mean M=M '+i(∑ fdN

)

Dengan melihat pada tabel distribusi frekuensi maka:

M=42,5+8(+1950 )=42,5+3,04=45,54

Mean dugaan (M’) sebesar 42,5 adalah nilai titik tengah dari kelas interval 39 – 46,

yaitu kelas interval yang kita duga tempat letaknya mean. Cara menghitung:

M '=39+462

=852

=42,5

Dari tabel itu juga searang kita mencari DS

Rumusnya:

DS = i √ ∑ fd2

N−(∑ fd

N)

2

Dengan menggunakan rumus tersebut maka:

DS = 8 √ 18150

−(+1950 )

2

= 8 √3,62−0,1444

= 8 √3,5756

1

= 8 x 1,89 = 15,12 dibulatkan = 15

Setelah ditemukan besarnya mean dan DS (mean = 45,54 dan DS = 15), langkah

selanjutnya adalah menjabarkan skor mentah yang diperoleh dari ulangan sejarah ke

dalam nilai 1-10 dengan menggunakan rumus penjabaran sebagai berikut:

Rumus penjabaran:

M + 2,25 DS = 10

M + 1,75 DS = 9

M + 1,25 DS = 8

M + 0,75 DS = 7

M + 0,25 DS = 6

M - 0,25 DS = 5

M - 0,75 DS = 4

M - 1,25 DS = 3

M - 1,75 DS = 2

M - 2,25 DS = 1

Hasil perhitungan: Penjabarannya:

45,54 + (2,25 x 15) = 79,29 dibulatkan = 79 Skor 79 keatas = 10

45,54 + (1,75 x 15) = 71,79 dibulatkan = 72 72 s. d. 78 = 9

45,54 + (1,25 x 15) = 64,29 dibulatkan = 64 64 s. d. 71 = 8

45,54 + (0,75 x 15) = 56,79 dibulatkan = 57 57 s. d. 63 = 7

45,54 + (0,25 x 15) = 49,29 dibulatkan = 49 49 s. d. 56 = 6

45,54 – (0,25 x 15) = 41,79 dibulatkan = 42 42 s. d. 48 = 5

45,54 – (0,75 x 15) = 34,29 dibulatkan = 34 34 s. d. 41 = 4

45,54 – (1,25 x 15) = 26,79 dibulatkan = 27 27 s. d. 33 = 3

45,54 – (1,75 x 15) = 19,29 dibulatkan = 19 19 s. d. 26 = 2

45,54 – (2,25 x 15) = 11,79 dibulatkan = 12 12 s. d. 18 = 1

11 ke bawah = 0

Dengan pedoman penjabaran tersebut, sekarang guru tinggal mentransfer atau

mengubah skor mentah yang diperoleh setiap siswa ke dalam nilai 1-10.

Dengan penjabaran secara statistik, dengan membuat tabel distribusi frekuensi

dan menggunakan mean dan DS aktual, yaitu mean dan DS yang diperoleh dari

perhitungan skor mentah yang benar-benar dicapai oleh kelompok siswa yang dites,

bagaimanapun hasil tes yang kita peroleh akan menghasilkan nilai diantara 1-10 atau

1

antara 0-10. Dengan kata lain,akan selalu terdapat anak yang memperoleh nilai tinggi

dan nilai yang terendah karena dalam penyusunan tabel yang menjadi dasar

perhitungan menggunakan skor maksimum dan skor minimum yang benar-benar

dicapai oleh kelompok siswa yang dites. Dengan demikian, nilai-nilai yang diperoleh

siswa masing-masing menunjukkan status kepandaian siswa tersebut dibandingkan

dengan teman-teman yang lain didalam kelompok itu. Kebaikan sistem penskoran

seperti ini ialah bahwa nilai-nilai yang diperoleh siswa benar-benar mencerminkan

kapasitas kelompok. Akan tetapi, kelemahannya ialah bahwa nilai-nilai yang

diperoleh sistem tersebut belum mencerminkan sampai dimana pencapaian scope

bahan pelajaran yang diteskan. Oleh karena itu, untuk mengurangi kelemahan ini kita

juga melakukan sistem penskoran tersebut dengan menggunakan mean ideal dan DS

ideal.

Caranya adalah sebagai berikut:

Misalkan tes yang dipergunakan untuk ulangan sejarah tersebut memiliki skor

maksimum ideal = 100

Mean ideal = skor maksimum ideal

2 =

1002

= 50

DS ideal = meanideal

3=50

3=16,6

Dengan menggunakan rumus penjabaran, maka:

50 + (2,25 x 16,6) = 87,35 dibulatkan = 87 – 10

50 + (1,75 x 16,6) = 79,05 dibulatkan = 79 – 9

50 + (1,25 x 16,6) = 70,75 dibulatkan = 71 – 8

50 + (0,75 x 16,6) = 62,45 dibulatkan = 62 – 7

50 + (0,25 x 16,6) = 54,15 dibulatkan = 54 – 6

50 – (0,25 x 16,6) = 45,85 dibulatkan = 46 – 5

50 – (0,75 x 16,6) = 37,55 dibulatkan = 38 – 4

50 – (1,25 x 16,6) = 29,25 dibulatkan = 29 – 3

50 – (1,75 x 16,6) = 20,95 dibulatkan = 21 – 2

50 – (2,25 x 16,6) = 12,65 dibulatkan = 13 – 1

Dengan menggunakan mean ideal dan DS ideal, ternyata bahwa hasilnya

menjadi berlainan. Siswa yang mendapat nilai 10 adalah siswa yang memperoleh skor

mentah 87 keatas dan bukan 79 keatas seperti hasil perhitungan dengan menggunakan

mean dan DS aktual. Juga yang mendapat nilai 6 adalah siswa yang memperoleh skor

1

mentah 54 s. d. 61 dan bukan 49 s.d. 56 seperti perhitungan yang lalu. Perubahan skor

mentah menjadi nilai 1-10 dengan menggunakan mean ideal dan DS ideal lebih

mudah dan praktis karena kita tidak perlu menyusun tabel distribusi frekuensi. Untuk

menghitung mean ideal dan DS ideal kita hanya memerlukan skor maksimum ideal

dari tes yang kita laksanakan. Yang dimaksud dengan skor maksimum ideal adalah

skor tertinggi yang seharusnya dicapai jika tes tersebut dikerjakan dengan betul

semua. Dengan demikian, besarnya skor maksimum pada jumlah item dan

pembobotan dalam tes yang dipergunakan.

PENILAIAN DENGAN PERSEN

Cara menilai lain yang dapat juga kita lakukan ialah dengan menggunakan

persen atau yang disebut presentages correction. Nilai yang diperoleh siswa benar-

benar merupakan “nilai” dan bukan lagi “skor”.

Rumus penilaian adalah sebagai berikut:

Keterangan:

NP : nilai persen yang dicari atau diharapkan

R : skor mentah yang diperoleh siswa

SM : skor maksimum ideal dari tes yang bersangkutan

100 : bilangan tetap

Beberapa contoh sebagai penjelasan

Siswa A memperoleh skor 64 dari tes matematika yang memiliki skor

maksimum ideal = 80.Maka nilai A yang sebenarnya adalah 6480

x 100 = 80.

Siswa B memperoleh skor 64 dari tes bahasa Indonesia yang memiliki skor

maksimum ideal = 100. Maka nilai B = 64.

Cara menilai dengan persen seperti di atas banyak dilakukan oleh guru-guru dan

para dosen. Hal ini adalah karena dianggap lebih mudah dan praktis. Suatu perguruan

tinggi mempunyai pedoman penilaian sebagai berikut:

NP = R

S Mx

1

Tingkat PengNilai H BoboPredikat86-100 % A 4Sangat Baik76-85 % B 3Baik60-75 % C 2Cukup55-59 % D 1Kurang≤ 54 % TL 0Kurang Sekali

Jika nilai si A dan si B pada contoh yang baru lalu akan ditransfer ke dalam nilai

huruf menurut pedoman penilaian tersebut di atas, maka nilai si A = 80 = B, nilai si B

= 64 = C.

Demikian pula jika nilai-nilai persen itu akan diubah menjadi nilai dengan skala 1-10,

tinggal membagi nilai itu dengan angka 10, kemudian dibulatkan menurut ketentuan

pembulatan angka desimal. Sebagai contoh, nilai si A = 80 menjadi nilai 8 (pada skal

1-10); nilai si B = 64 menjadi 6,4 dan dibulatkan menjadi 6.

3. Mengolah Skor Mentah Menjadi Skor Standar Z

Yang dimaksud dengan Z skor adalah skor yang penjabarannya didasarkan atas unit

deviasi standar dari mean. Dalam hal ini mean dinyatakan 0 (nol).

Pengolahan skor mentah menjadi skor Z ini sering kali dirasakan perlunya karena

dengan hanya melihat skor mentah saja kita belum dapat memberikan tafsiran yang

baik dan tepat. Atau dengan kata lain, dengan hanya mengetahui skor mentah saja

dapat menimbulkan tafsiran yang salah mengenai kecakapan seseorang.

Misalkan kita melihat hasil tes (ujian SD) dari seorang anak bernama Umar sebagai

berikut:

Bahasa Indonesia = 65

Matematika = 55

IPS = 70

Untuk dapat lebih mengetahui bagaimana kecakapan Umar itu sebenarnya jika

dibandingkan dengan teman-teman sekelasnya, kita perlu mengetahui besarnya mean

dan DS dari skor yang diperoleh Umar itu sebagai berikut:

Mata Pelajaran Skor Mean DS

Bahasa Indonesia 65 60 4.0

Matematika 55 45 4.0

IPS 70 75 5.0

1

Dengan membandingkan skor yang dicapai Umar itu dengan mean-nya masing-

masing, sepintas lalu kita telah melihat bahwa Umar bukan sangat pandai dalam IPS,

malah ia lebih baik dalam matematika dan bahasa Indonesia jika dibandingkan

dengan rata-rata kelas (teman-temannya). Untuk dapat mengetahui bagaimana

kedudukan Umar yang sebenarnya di dalam kelompok teman-temannya itu, di

samping mean perlu pula kita mengetahui DS dari tiap mata pelajaran itu.

Dengan mempergunakan mean dan DS itulah kita dapat menjabarkan atau mengubah

skor-skor yang diperoleh Umar itu menjadi skor Z.

Rumusnya :

Dengan menggunakan rumus tersebut kita dapat mengubah skor yang dicapai Umar

tadi ke dalam skor Z sebagai berikut:

Bahasa Indonesia = 65−60

4.0 =

+54

= +1,25

Matematika = 55−45

4.0 =

+154

= +2,5

IPS =70−75

5.0 =

−55

= -1,0

Melihat hasil skor Z di atas kita dapat mengatakan bahwa kedudukan Umar dalam

bahsa Indonesia adalah 1,25 DS di atas mean, untuk matematika 2,5 DS di atas mean,

sedangkan IPS 1,0 DS di bawah mean.Dengan demikian, justru umar kurang pandai

dalam IPS dibandingkan dengan teman- teman sekelasnya, dan jauh lebih pandai

dalam matematika dan bahasa Indonesia.

Disamping itu, skor Z sering pula dipergunakan untuk membandingkan prestasi anak

dengan anak yang lain dalam beberapa matapelajaran.

Misalnya, teman umar tadi bernama basir hasil tes yang dicapai oleh basir:

Bahasa Indonesia 70

Matematika 60

IPS 60

Pertanyaan yang timbul pada kita ialah: siapa diantara kedua anak tersebut yang

sebenarnya lebih baik prestasinya? Umar atau basir? Jika kita hanya melihat sepintas

lalu atau hanya melihatnya dari hasil rata- rata dari kedua hasil tes masing- masing,

tentu kita akan mengatakan umar sama pandai dengan basir karena jumlah skor umar

65 + 55 + 70 = 190, dan jumlah skor basir 70 + 60 + 60 = 190. Akan tetapi,

Skor Z = X−M

DS

1

kesimpulan kita itu belum tentu benar. Dengan menggunakan skor standar (skor Z)

kita dapat mengetahui siapa sebenarnya lebih baik atau lebih tinggi prestasinya.

Dalam hal ini perlu diingat mean dan DS untuk tiap mata pelajaran yang dicapai oleh

kedua anak itu sama.

Dengan melihat hasil tersebut diatas, dapat diambil kesimpulan bahwa prestasi basir

ternyata lebih baik daripada umar.

4. Mengolah Skor Mentah Menjadi Skor Standar T

Dengan bersumber pada skor Z seperti telah dibicarakan di muka, banyak pula

dikembangkan skor- skor standar lainnya yang dikenal orang sebagai angka skala.

Jenis skor standar yang merupakan angka skala yang telah banyak dikenal orang

antara lain ialah skor T. Yang dimaksud dengan skor T ialah angka skala yang

menggunakan dasar mean = 50 dan jarak tiap deviasi standar (DS) = 10. Di dalam

range – 3 DS, T tersebar dari 20 s.d. 80, tanpa bilangan-bilangan minus.

Penjabaran skor mentah ke dalam skor T ini pun sering kali kita perlukan untuk

mengetahui bagaimana kedudukan seorang anak yang memperoleh skor tersebut

dibandingkan dengan kelompoknya di dalam suatu hasil tes. Selesai itu, dengan

penjabaran ke dalam skor T ini, hasil-hasil tes (skor mentah) yang diperoleh dari

beberapa mata pelajaran yang memiliki mean dan DS yang berbeda-beda dapat

diubah menjadi skor- skor standar dengan satu skala unit deviasi. Dengan demikian,

Skor Z Umar:

Bahasa Indonesia:

65−604,0

= +54

= +1,25

Matematika:

55−454,0

= +10

4 = +2,5

IPS:

70−755,0

= −55

= +1,0

Jumlah + 2,75

Skor Z Basir:

Bahasa Indonesia:

70−604,0

= +10

4 = +2,5

Matematika:

60−454,0

= +15

4 = +3,75

IPS:

60−755,0

= −15

5 = -3,25

Jumlah + 3,25

1

suatu panitia ujian sekolah, misalnya, dapat menentukan “batas lulus” dari berbagai

mata pelajaran dengan kedudukan nilai skor yang sama setelah setiap skor dari mata

pelajaran-mata pelajaran tersebut dijabarkan kedalam skor T.

Rumusnya:

Skor T = (X−M

DS)10 + 50 atau skor T = 10z + 50

Jika skor- skor yang diperoleh umar tadi kita jabarkan ke dalam Skor T, akan kita

peroleh seperti berikut:

Bahasa Indonesia

= (65−50

4) x 10 + 50 = (+1,25)x 10 + 50 =62,5

Matematika

= (55−45

4)x 10 + 50 = (+2,5)x 10 +50 = 75,0

IPS

= (70−76

5)x 10 + 50 =(-1,0)x 10 +50 = 40,0

Dengan melihat hasil penjabaran ke dalam skor T di atas, secara cepat kita dapat

mengatakan bahwa umar memiliki prestasi yang cukup baik dalam matematika

dibandingkan dengan teman- teman sekelompoknya, dan kurang baik prestasinya

dalam IPS. Ingat bahwa dengan menjabarkan kedalam skor T itu kita telah

menyamakan besarnya mean dari ketiga mata pelajaran tersebut, yaitu mean = 50.

Skor Z -3 -2 -1 0 +1 +2 +3

B. ind 48 52 56 60 64 65 68 72

Mtk 33 37 41 45 49 53 55 57

IPS 60 65 70 75 80 85 90

Skor T 20 30 40 50 60 70 70

-1,0

+1,25 +2,5

1

Jika skor–skor yang diperoleh umar tadi kita letakkan di dalam skala skor T yang

disejajarkan dengan skor Z, akan kita lihat seperti terlukis pada gambar diatas.

Dengan memperhatikan gambar itu, jelas kiranya bagaimana kedudukan skor- skor

yang diperoleh umar dibandingkan dengan rata- rata kelompoknya. Perhatikan skor-

skor yang dicetak miring pada gambar, dan skor Z-nya yang terletak diatas dasar

kurva.

2.4 Interpretasi Skor

1) Pengertian Interpretasi

Interpretasi adalah suatu proses untuk menyederhanakan ide-ide atau issu-issu

yang rumit dan kemudian membaginya dengan masyarakat awam/umum. Suatu

interpretasi yang baik adalah suatu interpretasi yang dapat membangun hubungan

antara audiens dengan obyek interpretasi. Apabila dilakukan secara efektif,

interpretasi dapat digunakan untuk meyakinkan orang lain, dapat mendorong orang

lain untuk merubah cara berpikir dan tingkah laku mereka. Interpretasi (penafsiran)

merupakan suatu analisa seseorang terhadap suatu kejadian atau peristiwa tentang

obyektif atau subyektif. Leon H. Levy dalam buku yang berjudul “Psychological

Interpretation” (1963) menyatakan bahwa interpretasi adalah suatu kegiatan yang

dilakukan apabila ada suatu keadaan yang sulit untuk dipahami secara biasa atau

secara langsung. Pada dasarnya interpretasi terdiri dari kegiatan memberikan suatu

kerangka referensi yang lain atau mengemukakan suatu bahasa lain bagi sejumlah

observasi atau tingkah laku, dengan tujuan agar hal ini dapat dipergunakan.

Interpretasi atau penafsiran hasil tes bertujuan untuk menerjemahkan dan memberi

makna terhadap skor yang diperoleh testee (orang yang diuji).

2) Jenis Interpretasi

Ada dua jenis interpretasi yaitu interpretasi kelompok dan interpretasi individual.

Interpretasi kelompok adalah penafsiran yang dilakukan untuk mengetahui

karakteristik kelompok berdasarkan data hasil evaluasi, antara lain prestasi

kelompok, rata-rata kelompok, sikap kelompok terhadap guru dan mata

pelajaran yang diberikan, dan distribusi nilai kelompok. Tujuan utamanya

adalah sebagai persiapan untuk melakukan penafsiran kelompok, untuk

mengetahui sifat-sifat tertentu pada suatu kelompok, dan untuk mengadakan

perbandingan antarkelompok.

1

Interpretasi individual adalah penafsiran yang hanya tertuju kepada individu

saja. Misalnya, dalam kegiatan bimbingan dan penyuluhan atau situasi klinis

lainnya. Tujuan utamanya adalah untuk melihat tingkat kesiapan siswa

(readiness), pertumbuhan dan kemajuan, serta kesulitan-kesulitan yang

dihadapinya.

3) Analisis dan Interpretasi Soal Tes Objektif

Setelah diuraikan dengan agak panjang tentang bagaimana menganalisis soal tes

dengan menghitung taraf kesukaran dan daya pembedanya, dan

menginterpretasikannya dengan menggunakan rumus- rumus tertentu, dalam uraian

berikut ini akan dibicarakan cara menganalisis dan mengiterpretasikan soal- soal tes

objektif, khususnya soal tes yang berbentuk pilihan ganda (multiple choice). Uraian

ini kami adaptasikan dari buku Measurement and Evaluation in Psychology and

Education karangan R.L. Throndike dan E.P. Hagen (1977) halaman 251-255, dengan

perubahan pada isi soal- soalnya.

Berlainan dengan cara menganalisis yang telah diuraikan terdahulu, cara

analisis yang dilakukan oleh Throndike dan Hagen ini kelihatan lebih praktis dan

sekaligus diikuti bagaimana menginterpretasikannya, dengan demikian, penganalisis

dapat mengetahui di mana atau pada bagian mana dari soal tersebut yang masih lemah

dan perlu mendapat perbaikan.

Suatu cara yang sederhana untuk menyiapkan pencatatan jawaban- jawaban dari

tiap item dapat dibuat dalam bentuk kartu- kartu seperti dibawah ini.

10

17 1 2

1 5 1 3

Soal no. . . . Hasil perkebunan di daerah lampung yang terbesar adalah:

A. Karet

B. Lada

C. Kelapa sawit

D. Kopi

Alternatif jawaban

A B C D E Kosong

Alt Jawaban

kelompok

Upper 25 %

Middle 50 %

Lower 25 %

1

Kartu semacam itu dapat digunakan untuk soal-soal pilihan ganda (multiple choice)

yang mempunyai alternatif jawaban sampai dengan lima buah, tetapi dapat pula

digunakan untuk tes benar-salah (true-false) yang hanya mempunyai dua alternative

jawaban. Tiap kartu dipergunakan untuk satu soal. Kemudian kartu- kartu yang berisi

keterangan tentang soal itu dapat disusun dalam suatu file soal yang permanen, dan

sewaktu- waktu dapat dipergunakan bilamana diperlukan.

Contoh Analisa Soal (Item Analysis)

Misalkan 100 orang murid dites dengan tes pilihan ganda yang berjumlah 95 soal.

Hasil tes menunjukkan skor tertinggi 85 dan terendah 14. Dari hasil tes itu kita ambil

25 orang (25 %) yang tergolong upper group, dan 25 orang (25 %) yang tergolong

lower group.cara mengambil kelompok upper group dan lower group adalah sebagai

berikut: mula-mula kita susun lembaran hasil tes itu dari lembaran yang memiliki skor

tertinggi (85) berturut-turut sampai kepada lembaran yang memiliki skor terendah

(14). Kemudian kita ambil 25 lembar dari atas, dan inilah kelompok upper group ;dan

25 lembar dari bawah, inilah kelompok lower group. Misalkan dari kelompok upper

group yang kita ambil terdapat skor dari 59 s.d. 85, dan dari kelompok lower group

terdapat skor 14 s.d. 34. Kelompok sedang (middle group) yang berjumlah 50 lembar

(50%) kita biarkan.

Jawaban- jawaban dari kedua kelompok upper group dan lower group itulah yang

kemudian kita tabulasikan dan kita analisis.

Berikut ini beberapa contoh

Soal no. 1 hasilnya sebagai berikut:

1) Penyebar agama Islam yang mula- mula dijawa barat ialah:

Upper Lower

A. Sultan Hasanuddin 0 2

B. Fatahillah 25 20

C. Untung Surapati 0 0

D. Sunan Kalijaga 0 1

Dikosongkan 0 0

1

Interpretasi:

Soal ini mudah karena semua (25) orang dari kelompok upper group dan 20 orang

dari lower group dapat menjawab soal itu dengan benar. Namun, soal ini termasuk

baik karena dapat membedakan arah yang diinginkan : ternyata jawaban- jawaban

yang salah terdapat pada kelompok lower group. Dua atau tiga soal semacam ini baik

digunakan sebagai permulaan suatu tes.


2) Kegembiraan kerja bagi guru- guru di sekolah dapat tercapai apabila:

Upper lower

A. Guru- guru menerima tugas pembagian kerja yang

sama beratnya. 3 5

B. Tidak pernah ada kecaman dari kepala sekolah. 9 15

C. Kepala sekolah memperhatikan dan menghargai tiap

usaha guruu yang dilakukan dengan rasa tanggung

jawab. 13 5

D. Kepala sekolah memperhatikan penghidupan guru-

guru. 0 0

Di kosongkan 0 0

Interpretasi:

Soal ini sukar, tetapi sangat efektif. Bahwa soal tersebut tergolong sukar dapat dilihat

hanya 13 dari 50 orang yang dapat menjawab soal itu dengan benar. Bahwa soal itu

dikatakan efektif dapat dilihat dari kenyataan bahwa ke 13 orang yang menjawab

benar itu semua terdapat pada kelompok upper group yang sejumlahnya lebih besar

dari pada kelompok upper group yang menjawab salah. Sepintas lalu soal semacam

ini menunjukkan betapa sulit untuk menjawabnya secara menerka dengan membabi

buta saja. Sebagian besar dari kelompok lower group memusatkan perhatiannya pada

satu alternatif jawaban yang salah yang seolah- olah benar atau dapat diterima.

Soal no. 3 mendapat hasil sebagai berikut:

3) Maksud pemerintah mengadakan ikatan dinas bagi siswa- siswa SPG ialah:

Upper Lower

A. Untuk menarik para lulusan SLP agar mau masuk ke

sekolah guru 15 6

B. Membatasi lulusan SPG yang akan melanjutkan

pelajarannya ke sekolah yang lebih tinggi. 4 6

1

C. Membantu para siswa yang kurang mampu dalam

melanjutkan pelajarannya. 2 6

D. Karena yang masuk SPG kebanyakan anak- anak orang

yang miskin 4 7

Dikosongkan 0 0

Interpretasi

Soal ini tidak baik karena: pertama, soal ini terlalu sukar, hanya 8 dari 50, atau 16 %

saja dari murid, yang dapat menjawab benar. Keedua, soal tersebut kurang

mempunyai daya pembeda (discriminating power); ternyata dari jawaban yang benar

itun banyak terdapat pada lower group ,dan bukan pada upper group.

Dalam hal ini ada dua keterangan yang mungkin untuk data analisis soal tersebut:

(1) soal tersebut bersifat ambiguous (mempunyai dua arti), terutama bagi siswa- siswa

yang mengetahui banyak tentang hal yang ditanyakan, atau (2) para siswa belum

pernah mempelajari hal- hal seperti yang ditanyakan.


4) Danau yang terbesar di pulau sumatra ialah:

Upper Lower

A. Danau Toba 21 17

B. Danau Poso 0 0

C. Danau Batur 0 0

D. Danau Kerinci 4 8

Dikosongkan 0 0

Interpretasi:

Soal ini menunjukkan beberapa diskriminasi pada arah atau tujuan yang diingini (21

lawan 17), tetapi perbedaan itu tidak begitu tajam. Pola respons adalah satu dang

terlalu umum. Hanya dua dari empat alternatif jawaban yang berfungsi atau dipilih

oleh siswa. Jika soal ini akan diperbaiki maka yang perlu diubah atau diganti adalah

alternatif jawaban B dan C. Mungkin kedua alternatif jawaban tersebut tidak dipilih

oleh siswa karena mereka mengetahui bahwa danau poso dan danau batur itu tidak

ada di pulau sumatra, tetapi di pulau sulawesi dan bali. Maka untuk menggantinya

sebaiknya dicarikan nama danau lain yang ada dipulau sumatera, misalnya danau

ranau dan danau maninjau.

Analisis soal (item analysis) seperti tersebut diatas, kecuali berguna bagi perbaikan

penyusunan kembali soal- soal tes, juga berguna untuk melihat atau meneliti materi-

Item no 1

Alternatif A B* C D E

Upper 10 0 6 3 1 0

Lower 10 3 2 2 3 01

materi mana dari bahan pelajaran yang belum dikuasai siswa (soal atau item yang

sukar) untuk selanjutnya kita dapat mengulang kembali atau memperbaiki proses

belajar- mengajarnya. Soal atau item yang sukar bagi keseluruhan kelas berguna

untuk pembimbingan ke arah eksplorasi yang lebih luas. Soal- soal yang ternyata

sukar itu dapat didiskusikan bersama kelas sehingga, dsamping memperluas

pengetahuan siswa, juga mnghilangkan salah pengertian pada mereka.

4) Prosedur Analisis Item yang Lebih Sederhana untuk Norm-Referenced Test

Ada beberapa prosedur analisis item yang dapat dilakukan terhadap norma refereced

test (Throndike, 1971). Bagi tes- tes hasil belajar yang informal yang digunakan

dalam pengajaran, agaknya diperlukan prosedur yang sederhana saja. Langkah-

langkah berikut merupakan prosedur yang simpel, tetapi efektif.

Misalkan kita akan menganalisis 32 lembar jawaban tes multiple choice dengan 5

option. Maka langkah- langkahnya adalah sebagai berikut:

1. Susunlah 32 lembar jawaban tes tersebut pada skor yang paling tinggi sampai

kepada skor yang paling rendah.

2. Ambil + sepertiga dari jumlah lembar jawaban tes itu yang mendapat skor

tinggi, dan sebutlah ini upper group (10 lembar). Dan ambil pula + sepertiga dari

jumlah lembar jawaban tes yang memperoleh skor rendah, dan sebutlah lower group

(10 lembar pula). Pisahkan yang selebihnya, yaitu yang termasuk middle group (12

lembar). Meskipun lembaran middle group ini dapat dimasukan kedalam analisis,

penggunaan upper dan lower group saja sudah cukup menyederhanakan prosedur

pengolahan (analisis).

3. Untuk tiap item, hitunglah jumlah siswa dari upper group yang memilih tiap

alternatif (option), kemudian kerjakan. Begitu juga pada lower group.

4. Catatlah jumlah dari langkah 3 tersebut di dalam catatan tes dalam kolom

dimana alternatif itu dipilih. Atau untuk ini gunakanlah “kartu item” yang terpisah

seperti berikut:

1

*jawaban yang benar

5. Taksirlah tingkat kesukaran soal (item dificully) dengan menghitung

persentase siswa yang menjawab item itu dengan benar. Prosedur sederhana ini adalah

untuk mendasarkan penaksiran itu hanya pada siswa- siswa yang termasuk didalam

kelompok analisis item itu. Dengan demikian, jumlah siswa dalam upper dan lower

group (10+10 =20) yang memilih jawaban benar pada item no. 1 diatas adalah 6 + 2 =

8. Dari situ kita dapat menghitung indeks kesukaran soal sebagai berikut:

Index of item difficulty = 8

20 x 100 = 40 %

Meskipun perhitungan kita hanya didasarkan atas kelompok upper dan lower,

hasilnya akan menyediakan suatu taksiran mendekati kebenaran yang berlaku untuk

jumlah kelompok seluruhnya. Ini berarti bahwa indeks kesukaran soal no.1 sebesar

40% itu berlaku untuk kelompok (32 orang) yang mengerjakan tes itu.

Dengan demikian, karena “tingkat kesukaran” itu menunjukkan “persentase jawaban

item yang benar”, maka makin kecil persentase menunjukkan makin sulit item itu.

Rumus untuk menghitung item difficulty adalah sebagai berikut:

Keterangan:

P = persentase yang menjawab item itu dengan benar

R = jumlah yang menjawab item itu dengan benar.

T = jumlah total (siswa) yang mencoba menjawab item itu

6. Taksirlah daya pembeda (discriminating power) item itu dengan

membandingkan jumlah siswa dalam upper group yang menjawab item dengan benar.

Dari contoh di atas ternyata bahwa 6 siswa pada upper group dan 2 siswa pada lower

group menjawab dengan benar. Ini menunjukkan daya pembeda yang positif karena

item itu dapat membedakan siswa yang pandai (upper) dan siswa yang kurang

(lower); yang menjawab benar dari upper group jumlahnya lebih banyak daripada

yang menjawab benar dari lower group. Dari item no. 1 kita dapat menghitung

besarnya daya pembeda item itu sebagai berikut:

P= RT

x 100

1

Index of item discriminating power = 6−210

= 0,40

Rumus daya pembeda; DP= U−L

12

T

DP = daya pembeda atau discriminating power yang dicari

U = jumlah jawaban yang benar dari upper-group

L = jumlah jawaban yang benar dari lower-group

1/2T = setengah dari jumlah upper dan lower-group

Daya pembeda dari suatu item dinyatakan dengan pecahan desimal dan indeks

maksimum daya pembeda yang positif = 1,00

Angka1,00 ini diperoleh dari: jika hanya siswa upper group yang dapat menjawab

item itu dengan benar, sedangkan dari siswa lower-group tidak seorang pun yang

dapat menjawab item itu dengan benar. Dari tes tersebut di muka mungkin terdapat

suatu item yang DP-nya sebagai berikut:

DP = 10−0

10 = 1,00

Perlu dicatat disini bahwa item itu berada pada tingkat 50 persen dari tingkat

kesukaran (10 upper menjawabnya dengan benar, 10 lower menjawabnya salah). Hal

ini menjelaskan kepada kita ,mengapa pembuat tes memberanikan diri untuk

menyiapkan items untuk tes- tes norm- referenced pada tingkat kesukaran 50 persen.

Hanya pada tingkat inilah maksimum daya pembeda dimungkinkan.

Daya pembeda nol (0,00) diperoleh jika jumlah siswa yang sama pada kedua

kelompok (upper dan lower) menjawab item itu dengan benar.

Jadi:

DP = 10−10

10 = 0,00

Daya pembeda negatif diperoleh jika yang menjawab benar suatu item pada lower

group jumlahnya lebih besar ketimbang pada upper group.

Jadi:

DP = 2−610

= -0,40

Jika dari hasil analisis suatu item diperoleh DP = 0 (nol) atau DP = - (minus), item

yang bersangkutan harus dibuang atau diganti dengan yang baru.

1

7. Tentukan keefektifan distruktornya dengan membandingkan jumlah siswa

pada upper group dan lower group yang memilih tiap alternatif yang salah. Distruktor

yaang baik akan memikat lebih banyak siswa dari lower group ketimbang dari upper

group. Dengan melihat contoh pada langkah 4 di muka, dapat kita lihat bahwa

alternatif A dan D berfungsi secara efektif, alternatif C kurang baik karena ia menarik

lebih banyak dari siswa upper group, dan alternatif E sama sekali tidak efektif karena

ia tidak memikat seorang pun dari kedua kelompok itu.

Analisis seperti ini sangat berguna untuk mengevaluasi suatu item tes, dan jika

dikombinasikan dengan maksud untuk memeriksa item itu sendiri, hasil analisis itu

memberikan informasi yang sangat berguna bagi pengembangan item itu.

Langkah–langkah penganalisisan soal seperti telah diuraikan diatas dapat dimodifikasi

menurut kebutuhan dan situasi tertentu. Juga dalam penetapan jumlah upper dan

lower group dapat digunakan 25% upper dan 25% lower jika jumlah kelompok besar,

atau bahkan 50% upper dan 50% lower jika jumlah kelompok itu kecil. Yang penting

disini adalah menggunakan sebesar mungkin pecahan kelompok itu sehingga kita

memperoleh informasi yang berguna. Penggunaan angka 27% untuk upper dan 27%

untuk lower, seperti dianjurkan dalam beberapa buku yang biasanya didasarkan atas

analisis statistik, untuk penganalisisan tes pencapaian belajar dalam kelas (classroom

achievement test) tidak merupakan jaminan atau keharusan yang mutlak.

5) Interpretasi Data Analisis Item Tes Norm-Referenced

Jika kita menggunakan jumlah siswa yang relatif kecil dalam menganalisa item tes

hasil belajar kelas, informasi analisisJika kita menggunakan jumlah siswa yang relatif

kecil dalam menganalisa item tes hasil belajar kelas, informasi analisis item

hendaknya diinterpretasikan dengan sangat berhati- hati. Baik tingkat kesukaran

maupun daya pembeda suatu item dapat berubah- ubah atau berbeda- beda antara

kelompok yang satu dengan kelompok yang lain. Dengan demikian, tidaklah

bijaksana menentukan suatu tingkat minimum dari daya pembeda untuk pemilihan

item, atau membeda- bedakan items berdasarkan perbedaan yang kecil dalam indeks-

indeks diskriminasinya. Oleh karena itu, kita hendaknya lebih memperhatikan items

yang memiliki daya pembeda yang tertinggi. Namun, sifat tentatif dari data yang kita

peroleh memberikan kelonggaran yang besar pada kita untuk berbuat kesalahan.

Jika suatu item menunjukkan indeks positif dalam diskriminasi, jika semua

alternatifnya berfungsi secara efektif, dan jika item itu mengukur secara pedagogis

1

hasil yang signifikan, item itu hendaknya dipertahankan dan disimpen dalam file item

untuk digunakan pada waktu yang akan datang.

Jika item itu disimpan dalam file dan digunakan kembali sesudah beberapa saat

tertentu, data hasil analisis item itu sebaiknya dicatat pada kartu setiap saat item itu

digunakan. Kumpulan data semacam itu akan memperlihatkan variabilitas dalam

indeks kesukaran item dan daya pembedanya dan dengan demikian informasi itu lebih

interpretable.

6) Prosedur Analisis Item untuk Criterion Referenced Test

Dasar pemikiran dalam mengevaluasi items dalam test penguasaan criterion-

refrerenced adalah sampai sejauh mana tiap item dapat mengukur hasil pengajaran

(effects of instruction), jika suatu item dapat dijawab dengan benar oleh semua siswa,

baik sebelum maupun sesudah diajari, jelaslah bahwa item itu tidak mengukur hasil

pengajaran. Demikian juga, jika suatu item dijawab salah oleh semua siswa, baik

sebelum maupun sesudah siswa mendapat pelajaran, item tersebut tidak berfungsi

sebagai alat evaluasi kedua-duanya merupakan contoh ekstrem; namun, kedua contoh

tersebut memberikan petunjuk penting bagi pencapaian pengukur hasil pengajaran

sebagai satu dasar bagi penentuan kwalitas item.

Untuk memperoleh ukuran keefektifan item berdasarkan hasil pengajaran, guru

harus memberikan tes yang sama sebelum dan sesudah mengajar. Item yang efektif

akan dijawab oleh sejumlah lebih besar siswa sesudah pengajaran dari pada sebelum

pengajaran. Indeks sensitifitas bagi keberhasilan pengajaran (sensitifity of

instructional effect) (s) dapat dihitung dengan menggunakan rumus berikut:

Keterangan:

S =sensitifitas keberhasilan yang dicari.

RA =jumlah siswa yang menjawab benar item itu sesudah pengajaran

RB =jumlah siswa yang menjawab benar item itu sebelum pengajaran.

T =jumlah total jawaban item itu yang benar kedua- duanya, sebelum dan

sesudah pengajaran

Misalkan suatu item dijawab salah oleh semua siswa (32 orang) sebelum pengajaran,

dan dijawab benar oleh semua siswa sesudah pengajaran. Dengan menggunakan

rumus diatas akan kita peroleh sebagai berikut:

S = R A−RB

T

1

S = 32−0

32 = 1,00

Jadi maksimum sensitifitas keberhasilan pengajaran dinyatakan dengan indeks 1,00.

Indeks items yang efektif akan berada diantara 0,00 dan 1,00, dan makin besar nilai

positif yang diperoleh menunjukkan bahwa item itu sensitifitas keberhasilan

pengajarannya makin besar pula. Dengan kata lain, makin besar angka indeks yang

diperoleh, makin besar pula sensitifitas keberhasilan pengajarannya.

Ada beberapa pembatasan dan penggunaan indeks sensitifitas itu. Pertama, guru

harus memberikan tes itu 2 kali untuk menghitung indeks. Kedua, suatu indeks yang

rendah tidak selalu benar menunjukkan item yang tidak efektif atau pengajaran yang

tidak efektif. Ketiga, respons para siswa terhadap item-item itu sesudah menerima

pelajaran, mungkin sedikit-banyak dipengaruhi oleh pengerjaan mereka pada tes yang

sama yang telah dilakukan pada waktu sebelum menerima pelajaran. Pembatasan

yang terakhir ini akan lebih terlihat dan dirasakan siswa jika pengajaran itu diberikan

dalam waktu yang singkat.

Meskipun ada pembatasan-pembatasan seperti tersebut diatas, indeks sensitifitas itu

tetap mengandung arti yang penting bagi penilaian keefektifan item didalam tes

penguasaan criterion-referenced. Item tes akan mempunyai nilai yang kecil bagi

pengukuran hasil pengajaran yang diharapkan jika item itu tidak atau kurang memiliki

sensitifitas terhadap hasil pengajaran.

BAB III

Penutup

3.1 Kesimpulan

Dari penjelasan di atas dapat disimpulkan bahwa pemberian skor ini sangat penting

untuk mendapatkan hasil pengolahan belajar siswa dan mahasiswa sehingga kita dapat

mengetahui seberapa jauh pemahaman dan penerimaan siswa terhadap materi pelajaran

1

yang diberikan. Penskoran merupakan langkah pertama dalam proses pengolahan hasil tes

pekerjaan siswa atau mahasiswa. Penskoran adalah suatu proses pengubahan jawaban-

jawaban tes menjadi angka-angka (mengadakan kuantifikasi). Angka-angka hasil

penskoran itu kemudian diubah menjadi nilai-nilai melalui suatu proses pengolahan

tertentu.

Untuk penilaian yang dilakukan oleh pendidik hasil penilaian masing-masing peserta

didik harus dibandingkan dengan Kriteria Ketuntasan Minimal (KKM). Analisis ini

dimaksudkan untuk mengetahui kemajuan hasil belajar dan kesulitan belajar peserta

didik, serta untuk memperbaiki pembelajaran.

Hal yang paling mengandung kemungkinan penyalahgunaan tes adalah

penginterpretasian hasil tes secara salah. Oleh karena itu maka interpretasi hasil tes harus

diikuti tanggung jawab professional. Bila hasil tes diinterpretasi secara tidak patut, dalam

jangka panjang akan dapat membahayakan kehidupan peserta tes. Suatu interpretasi dapat

merupakan bagian dari suatu presentasi atau penggambaran informasi yang diubah untuk

menyesuaikan dengan suatu kumpulan simbol spesifik. Informasi itu dapat berupa lisan,

tulisan, gambar, matematika, atau berbagai bentuk bahasa lainnya. Makna yang kompleks

dapat timbul sewaktu penafsir baik secara sadar ataupun tidak melakukan rujukan silang

terhadap suatu objek dengan menempatkannya pada kerangka pengalaman dan

pengetahuan yang lebih luas.

3.2 Saran

Untuk tes seharusnya dapat menggambarkan keseluruhan bahan pengajaran atau

keseruluhan tujuan pengajaran. Sebaiknya penilaian berdasarkan acuan patokan ini

seyogyanya jangan digunakan dalam pengolahan dan penentuan nilai hasil tes sumatif

seperti pada ulangan umum dalam rangka mengisi raport, ini tidak mempertimbangkan

kemampuan kelompok, jadi besar kemungkinan ada siswa yang tidak dapat dinyatakan

lulus atau naik kelas. setiap kelompok mempunyai standar masing-masing dan standar

satu kelompok tidak dapat dipergunakan sebagai standar kelompok yang lain. Standar

dari hasil tes sebelumnya pun tidak dapat dipergunakan sebagai standar sehingga setiap

memperoleh hasil tes harus dibuat norma yang baru.Kelemahan yang lain adalah apabila

butir-butir soal yang diberikan dalam tes terlalu sukar, maka tes tersebut betapapun

pintarnya testee akan memperolah nilai yang rendah, sebaliknya apabila butir soal yang

dikeluarkan dalam tes terlalu mudah, maka betapapun bodohnya testee akan berhasil

1

memperoleh nilai yang tinggi sehingga gambaran tingkat kemampuan testee yang

sebenarnya tidak dapat diketahui.

DAFTAR PUSTAKA

Andartari, dkk. 2009. Buku Ajar Evaluasi Pendidikan. Jakarta: Universitas Negeri

Jakarta.

Arikunto, Suharsimi. 2007. Dasar-dasar Evaluasi Pendidikan. Jakarta: Bina Aksara.

1

Fijra, TEKNIK PENGOLAHAN HASIL BELAJAR,

matahariku-fijra.blogspot.com/2011/06/teknik-pengolahan-hasil-belajar.html, 9 September

2012.

Purwanto, Ngalim. 2002. Prinsip-prinsip dan Teknik Evaluasi Pengajaran. Bandung:

Rosdakarya.

Purwanto. 2011. Evaluasi Hasil Belajar.Yogyakarta: Pustaka Pelajar.

Sudijono, Anas. 2011. Pengantar Evaluasi Pendidikan. Jakarta: PT RajaGrafindo

Persada.

LAMPIRAN-LAMPIRAN

1. Power Point (PPT) Makalah “Teknik Pengolahan Skor Hasil Belajar”.

teknik penskoran

Documents