literasi asesmen

48
LITERASI ASESMEN DAN ANALISIS POKOK UJI Makalah Disusun untuk memenuhi tugas Mata Kuliah Evaluasi Pendidikan biologi Dosen Pengajar: 1. Prof. Dr. Nuryani Y. Rustaman, M.Pd 2. Dr. Ana Ratna Wulan, M.Pd Oleh Didi Nur Jamaludin 1103321 Supriyadi 1103875 0

Upload: bunga-pertiwi

Post on 17-Jan-2016

413 views

Category:

Documents


97 download

TRANSCRIPT

LITERASI ASESMEN DAN ANALISIS POKOK UJI

Makalah

Disusun untuk memenuhi tugas Mata Kuliah Evaluasi Pendidikan biologi

Dosen Pengajar: 1. Prof. Dr. Nuryani Y. Rustaman, M.Pd

2. Dr. Ana Ratna Wulan, M.Pd

Oleh

Didi Nur Jamaludin 1103321

Supriyadi 1103875

PENDIDIKAN BIOLOGI

SEKOLAH PASCASARJANA

UNIVERSITAS PENDIDIKAN INDONESIA

2012

0

A. Pendahuluan

Dalam proses pendidikan di tingkat sekolah, faktor guru memegang peran

penting dalam menciptakan pembelajaran yang bermutu dan bermakna. Terdapat tiga

tugas utama guru dalam proses pembelajaran, yaitu (1) membuat persiapan

pembelajaran, (2) melaksanakan kegiatan belajar mengajar, dan (3) melakukan

evaluasi pembelajaran dan memanfaatkan umpan balik (Rustaman, 2005:7). Ketiga

tahapan tersebut merupakan satu kesatuan, saling tergantung, saling berpengaruh, dan

memiliki tingkat kepentingan yang sama dalam mencapai tujuan pembelajaran.

Evaluasi merupakan komponen penting dari proses pembelajaran dantelah

ditetapkanstandar nasional tentang tuntutan bahwa guru harus memiliki kemampuan

dalam mengevaluasi siswa. Meskipun seorang guru telah memiliki pengetahuan dan

keterampilan mengajar, pengetahuan tentang evaluasi merupakan syarat dalam

mengindikasi pembelajaran yang efektif.Kemampuan guru dalam menilai belajar

siswa akan memiliki dampak besar pada seberapa baik siswa berhasil. Menurut Hitam

dan Wiliam (1998), penilaian kelas dilakukan secara teratur, bila dilakukan

menggunakan praktek-praktek yang sehat, memiliki hasil positif pada prestasi siswa.

NSES mendefinisikan asesmen sebagai suatu proses sistematik dan variatif

yang meliputi pengumpulan data yang berperan untuk umpan balik dalam Pendidikan.

Lebih lanjut Faichhney memberikan pengertian asesmen merupakan suatu proses yang

membantu guru untuk memahami prestasi, penampilan dan perkembangan siswa

(NRC:1996)

Evaluasi hasil belajar dalam pembelajaran IPA lebih tepat jika dimaknai

sebagai asesmen.Asesmen lebih sesuai karena sejalan dengan hakikat IPA sebagai

proses, produk, dan nilai, sehingga yang diukur tidak hanya hasil belajar tetapi juga

proses belajar.Asesmen merupakan proses penting karena hasilnya dapat digunakan

untuk merencanakan pengajaran, memandu belajar siswa, menentukan tingkat/urutan,

membuat perbedaan, menentukan untuk pendidikan lanjut, pengembangan teori

pendidikan, merumuskan kebijakan, mengalokasikan sumberdaya, dan mengevaluasi

kurikulum (NRC, 1996:76). Oleh karena itu asesmen perlu direncanakan,

dilaksanakan, dan dianalisis dengan baik sehingga berfungsi sebagaimana mestinya.

1

Keberhasilan asesmen sangat tergantung pada pengetahuan dan keterampilan guru

dalam memilih dan mengembangkan jenis asesmen dalam mengukur kompetensi

siswa, sehingga, pemahaman tentang prinsip dasar asesmen yang berkualitas harus

dipahami oleh guru agar dapat melakukan asesmen terhadap siswa secara tepat.

Dalam melakukan asesmen harus memperhatikan hal penting untuk menjamin

kualitas soal atau instrumen yang digunakan dalam menilai, yakni penggunaan analisis

pokok uji. Analisis pokok uji merupakan serangkaian proses pengujian perangkat

asesmen dengan tujuan: (a) sebagai upaya memperbaiki atau meningkatkan kualitas

tes; (b) mengidentifikasi soal yang baik, kurang baik dan jelek; (c) mendiagnostik

kemampuan siswa; (d) mengevaluasi pelaksanaan pembelajaran untuk menjadi lebih

baik (Rustaman: 2007)

Makalah ini menyajikan uraian mengenai literasi asesmen dan analisis pokok uji

yang merupakan dasar pengetahuan dalam mengembangkan perangkat asesmen

khususnya dalam pembelajaran IPA.

B. Asesmen Formatif dan Asesmen Sumatif

Michael Scriven (1981) mengutip pendapat Bob Shake: “When the cook tastes

the soup, that’s formative; when the guests taste the soup, that’s

summative”.Asesmen tumbuh dan berkembang menjadi bagian penting dari proses

pendidikan secara keseluruhan. Asesmen sebagai bagian keseluruhan langkah proses

pendidikan, sama pentingnya dengan langkah lain dalam proses pembelajaran

(Rustaman:2012).

1. Asesmen Formatif

Hasil (20) penelitian yang direviu menunjukkan inovasi, termasuk peningkatan

pelaksanaan asesmen formatif, peningkatan hasil belajar secara substansial dan

signifikan. Typical effect sizes dari eksperimen asesmen formatif berkisar antara 0.4

dan 0,7 yang berarti asesmen formatif berpengaruh sangat besar terhadap gain hasil

belajar. Perbaikan pada asesmen formatif lebih membantu peserta didik yang

tergolong low achievers dari pada peserta didik yang biasa. Umpan balik yang

diberikan dalam proses asesmen formatif mempunyai pengaruh substansial dan

signifikan kepada peserta biasa dan peserta didik low achievers. Asesmen formatif

2

terutama dapat memperbaiki 3 bidang, yaitu: (1) belajar efektif, (2) mengurangi

akibat negatif dari belajar, (3) peran manajerial belajar.

Bila fokus belajar di sekolah dipusatkan kepada budaya rewards, maka peserta

didik akan terbiasa mengejar angka atau nilai tinggi ketimbang memperbaiki budaya

belajar. Karena itu maka dalam pembelajaran yang terpenting ialahmenanamkan

budaya berhasil (a culture of success), bukan budaya nilai tinggi. Dalam hal ini

asesmen formatif dapat menjadi alat yang efektif.Penerapan asesmen formatif untuk

meningkatkan proses, hasil dan standar pendidikan, yaitu:(1) umpan balik dalam

asesmen formatif (peserta didik, guru) (2) Swa asesmen (self assessment).

Komponen utama umpan balik antara lain: (a) mengingatkan peserta didik

akan tujuan yang ingin dicapai, (b) Kenyataan yang dicapai oleh peserta didik. Upaya

memberikan umpan balik efektif (oleh guru), dapat dilakukan dengan berbagai strategi

antara lain: (1) Dengan memfasilitasi swa asesmen setiap siswa untuk melakukan

refleksi diri; (2) mendorong terjadinya dialog antar teman, antarsiswa dan antara guru

dengan siswa; (3) memberikan gambaran kepada setiap siswa tentang kinerja yang

dianggap bermutu; (4) memperkecil kesenjangan antara kenyataan kinerja siswa

dengan kinerja yang diharapkan; (5) merespon kebutuhan siswa; (6) didasarkan pada

kriteria dan standar yang tetap, agar siswa dapat menetapkan langkah untuk

mencapainya secara konsisten pula; (7) mendorong motivasi belajar dan pembentukan

kepercayaan diri kepada tiap siswa.

Manfaat swa asesmen proses pembelajaran adalah bahwa swa asesmen

merupakan nilai interinsik proses pembelajaran. Swa asesmen juga suatu aspek

pendidikan untuk menanamkan kepribadian yang mampu melakukan self control.

Secara psikologis, pengendalian diri itu akanterbentuk bila peserta didik dapat

melakukan internal locus of control pada diri mereka. Keuntungan belajar swa

asesmen antara lain dapat membelajarkan siswa: (a) bertanggung jawab atas proses

belajarnya sendiri; (b) mampu menetapkan langkah berikutnya dalam belajar; (c)

dapat bangkit kembali, walau mengalami kegagalan; (d) menjadi pembelajar yang

percaya diri; (e) menjadi pembelajar yang aktif dalam proses pembelajaran; (f)

menjadi lebih independen dan bermotivasi tinggi.

3

Swa asesmen di lingkungan sekolah dikatakan efektif apabilaproses swa

asesmen mendapat dukungan dan tuntunan dari manajemen dan pimpinan sekolah.

Pimpinan dan manajemen sekolah harus pula memberikan dukungan yang berbeda

untuk setiap siswa sesuai dengan kebutuhan siswa (karena hakekat swa asesmen

beragam setiap siswa). Kemajuan peserta didik dalam melakukan swa asesmen

senantiasa dimonitor, sehingga secara terukur dapat dilihat adanya perbaikan dan

kemajuan.Capaian standar nasional oleh setiap individu siswa haruslah menjadi tolok

ukur bagi manajemen dan siswa sehingga secara terukur dapat dilihat capaiannya.

Pimpinan dan manajemen sekolah dapat menunjukkan suatu proses swa asesmen

yang dapat dicontoh oleh siswa. Pihak sekolah juga melibatkan pihak luar (orang tua,

masyarakat atau pimpinan dinas pendidikan di daerahnya) untuk memperkuat proses

swa asesmen siswa.

2. Asesmen sumatif.

Asesmen sumatif bentuk penilaian yang mengukur outcome belajar siswa yang

dilaksanakan setelah proses pembelajaran. Asesmen formatif memiliki kelebihan dan

kelemahan antara lain:

Tabel 1. Asesmen formatif memiliki kelebihan dan kelemahan

Kekuatan Kelemahan

Sangat dibutuhkan untuk menentukan nilai akhir siswa

Membuat ketergantungan yang berlebihan pada hasil asesmen sumatif

Dapat meningkatkan akuntabilitas guru / program / sekolah

Dapat meningkatkan berbagai upaya yang tidak benar hanya untuk mencapai hasil asesmen sumatif yang tinggi

Dapat digunakan untuk menentukan efektifitas proses pembelajaran.

Dapat mendorong guru untuk melakukan pendidikan untuk tes / pembelajaran tentang tes

Dapat memotivasi keterlibatan peserta didik dalam proses pembelajaran

Tidak banyak informasi yang dapat dipetik untuk perbaikan pembelajaran.

Dapat meningkatkan penguasaan materi pembelajaran peserta didik

Peserta menjadikan tes sebagai tujuan belajar, bukan perubahan tingkah laku untuk menghadapi masa depan.

4

Pelaksanaan asesmen sumatif dapat memberikan informasipenting antara lain:

(1) informasi tentang tingkat penguasaan (mastery) oleh siswa dalam mata pelajaran

tertentu; (2) sebagai dasar bagi membandingkan hasil belajar siswa dengan kelompok

norma atau kriteria kinerja eksternal; (3) alat untuk menentukan keefektifan proses

pembelajaran yang telah dilakukan; (4) informasi obyektif sebagai dasar memberikan

nilai akhir; (5) data komparatif untuk menentukan kedudukan siswa; (6) alat untuk

menentukan tanggung jawab guru dan sekolah tentang proses belajar siswa; (7)

informasi spesifik tentang isi pembelajaran yang dapat dipakai sebagai dasar bagi

orang tua / guru di pendidikan berikutnya; (8) informasi diagnostik tentang kekuatan

dankelemahan kinerja siswa; (9) data untuk menentukan tingkat capaian program atau

kriteria capaian standar dalam kurikulum (Rustaman:2012)

C. Literasi Asesmen

Literasi asesmen merupakan kemampuan dalam memahami prinsip-prinsip

dasar asesmen yang berkualitas, dan bertindak sesuai tujuan pembelajaran yang

dirancang dengan mengupayakan penggunaan yang seimbang berbagai asesmen

alternatif. Selanjutnya semua asesmen tersebut digunakan sebagai pemandu dalam

mengambil keputusan dan sebagai alat bantu mengajar (teaching tools) untuk

memanusiakan peserta didik (Stiggins,1994:8). Orang yang mampu melakukan

penilaian dan memahami prinsip dasar penilaian disebut assessment literates.Literasi

asesmen juga mencakuppengetahuan tetang seberapa sering asesmen dilakukan, apa

yang harus diases, dan bagaimana mempersiapkan siswa untuk diases.

Pentingnya literasi asesmen ditekankan oleh Heritage (2007:141), yang

menyatakan, "Para guru belajar bagaimana mengajar tanpa belajar banyak tentang

bagaimana menilai". Lebih lanjut, Stiggins (2004:16) menegaskan bahwa seperempat

sampai sepertiga waktu guru semestinya digunakan untuk penilaian terkait proses

pembelajaran. Oleh karena itu, guru harus mengetahui dan memahami prinsip-prinsip

penilaian.

Kemampuan untuk mengases diri sendiri dan orang lain membutuhkan

pemikiran kritis danreflektif. Menurut King dan Kitchener (1994) perbedaan antara

pemikiran kritis dan reflektif bahwa berpikir kritis berfokus pada logika induktif atau

deduktif, sedangkan berpikir reflektif berfokus pada asumsi tentang pengetahuan yang

5

berhubungan dengan situasi bermasalah. Sementara iru, Gamire dan Pearson (2006)

menyatakan bahwa kemampuan untuk mengasesmen terdiri tiga komponen.

Komponen-komponen ini adalah pengetahuan tentang asesmen, keterampilan berpikir

kritis dan asesmen reflektif, dan kemampuan dalam penggunaan pengetahuan konten

untuk memecahkan masalah praktis yakni mengases,mengevaluasi, dan meningkatkan

pembelajaran siswa.

Dalam pendidikan IPA, kemampuan dalam melakukan asesmen meliputi

pemahaman tentang fungsi, tujuan dan prinsip asesmen yang berkualitas. Asesmen

berfungsi untuk mengestimasi tingkat prestasi siswa setelah diberikan suatu pengaruh

pendidikan dan lingkungan, (Faisal dalam Rustaman,-:-). Sementara, menurut

Terrence Croocks (dalam Moss) asesmen berfungsi memandu siswa untuk : (1)

menilai apayang penting dipelajari; (2) mengetahui minat serta motivasi belajarnya;

(3) menilai kemampuan belajarnya; (4) mengembangkan strategi belajar (5) menilai

keterampilan yang dimilikinya; (6) merencanakan waktu belajarnya.

Asesmen asesmen harus diperhatikan prinsip-prinsip asesmen yang baik yakni

kondisi lingkungan asesmen yang konstruktif dan positif. Prinsip-prinsip tersebut

terdiri dari:

1. Pemikiran yang jelas dan komunikasi efektif; Meskipun tingkat pencapaian sering

kali diterjemahkan menjadi skor, ada dua fakta penting yang perlu dipahami. Pertama,

angka bukanlah satu-satunya cara untuk menyatakan pencapaian. Kita dapat

memanfaatkan kata-kata, gambar, ilustrasi, contoh, dan berbagai cara lainnya. Kedua,

simbol untuk menyatakan pencapaian siswa sama bermaknanya dan sama bergunanya

dengan definisi pencapaian dan kualitas penilaian yang digunakan untuk

menghasilkannya.

2. Guru yang memegang peranan; Guru berperan mengarahkan penilaian untuk

menentukan apa yang harus dipelajari oleh siswa dan apa yang siswa rasakan

berkaitan dengan penilaian yang dilakukan. Dalam berbagai konteks pendidikan, hasil

penilaian tingkat kotamadya/kabupaten, provinsi, nasional seolah-olah dianggap

sebagai satu-satunya hasil penilaian yang menentukan. Penilaian ini bahkan tidak

dapat disamakan dengan dengan penilaian kelas yang dilakukan oleh guru, berkaitan

dengan dampaknya terhadap keadaan siswa. Gurulah yang menentukan bagaimana

6

bentuk interaksi yang dilakukan dengan siswanya, rata-rata sebanyak satu kali setiap

dua atau tiga menit (mengajukan pertanyaan dan menginterpretasikan jawaban,

mengamati kinerja siswa, memeriksa pekerjaan rumah, menggunakan tes dan kuis).

Umumnya, penilaian dalam kelas berlangsung secara terus menerus.Dengan

demikian, jelas bahwa penilaian kelas adalah penilaian yang paling mudah dilakukan

oleh guru. Tidak perlu diragukan lagi, guru adalah pengendali sistem penilaian yang

menentukan keefektifan sekolah.

3. Siswa sebagai pengguna yang harus diperhatikan; Siswa adalah pihak yang paling

memanfaatkan hasil penilaian. Melalui penilaian kelas, mereka dapat mempelajari

kinerjanya serta mempelajari standar kualitas kinerjanya dari guru. Tidak seorang

pun, selain siswa, yang dapat memanfaatkan menggunakan hasil penilaian kelas yang

dilakukan oleh guru untuk menetapkan apa yang dapat mereka harapkan dari diri

mereka sendiri. Siswa dapat memperkirakan peluang keberhasilannya berdasarkan

kinerja yang ditunjukkan oleh hasil penilaian sebelumnya. Tidak ada satu keputusan

lain yang dapat memberikan pengaruh lebih besar pada keberhasilan siswa.

4. Sasaran yang jelas dan sesuai;Kita tidak dapat menilai hasil pendidikan secara

efektif jika kita tidak mengetahui dan memahami apa sebenarnya nilai keluaran

tersebut. Ada berbagai jenis keluaran dari sistem pendidikan kita, mulai dari

penguasaan materi sampai kemampuan menyelesaikan masalah yang kompleks.

5. Penilaian yang baik; Penilaian yang baik merupakan suatu keharusan dalam setiap

konteks penilaian. Lima standard yang harus dipenuhi untuk mencapai penilaian yang

baik meliputi: sasaran pencapaian yang jelas, maksud/tujuan yang jelas, metode yang

sesuai, kinerja contoh yang layak, pembatasan, dan adanya upaya untuk mencegah

kesalahan pengukuran.

6. Perhatian terhadap dampak antarpersonal; Kita harus selalu berusaha

melaksanakan penilaian yang baik, mengkomunikasikan hasilnya secara hati-hati dan

pribadi, dan mengantisipasi hasilnya sehingga dapat mempersiapkan diri untuk

memberikan dukungan terhadap siswa yang pencapaiannya rendah. Semakin muda

siswa, semakin penting adanya bimbingan bagi mereka.

7. Penilaian sebagai pembelajaran; Penilaian dan pengajaran dapat menjadi suatu

kesatuan. Potensi terbesar yang tersimpan dalam penilaian kelas adalah

7

kemampuannya untuk menjadikan siswa sebagai mitra penuh dalam proses penilaian.

Siswa yang mampu mendalami sasaran pencapaian secara menyeluruh mampu secara

percaya diri melakukan evaluasi, baik terhadap hasil kerjanya sendiri maupun hasil

kerja temannya.Tantangan yang kita hadapi dalam penilaian kelas adalah memastikan

bahwa siswa memiliki seluruh informasi yang diperlukannya, dalam bentuk yang

mudah dipahami, pada waktu yang tepat sehingga dapat digunakan secara efektif.

Asesmen yang baik hendaknya memenuhi standar spesifik asesmen berkualitas

yang terdiri dari (a) target yang jelas dan tepat; (b) tujuan asesmen yang jelas; (c)

metode yang sesuai dengan target dan tujuan; (d) penentuan sampel yang tepat; dan (e)

pencegahan atau minimalisir terhadap bias dan eror dalam menilai.

Sejalan dengan uraian diatas, asesmen dikatakan baik jika memenuhi

pesyaratan tes:

1. Validitas; Anderson (dalam Arikunto, 2008; 65) A test is valid is measure what it

purpose to measure atau dapat artikan sebuah tes dikatakan disebut valid, jika dapat

tepat mengukur apa yang hendak diukur.

2. Reliabilitas; Tes yang reliabel (dapat dipercaya), jika memberikan hasil yang tetap

apabila diteskan berkali-kali. Anderson (dalam Arikunto, 2008; 87) A reliable

measure in one that provides consistent and stable indication of the characteristic

being investigated.

3. Objektivitas; Tes yang baik harus bersifat objektif, tidak ada unsur pribadi

(subjektivitas) yang mempengaruhi. Arikunto (2008) faktor yang mempengaruhi

subjektivitas.

4. Bentuk tes; Tes yang berbentuk uraian akan memberikan peluang untuk memberikan

penilaian subjektif, oleh karena itu dalam mengvaluasi tes perlu rentangan derajat

skor dalam item soal uraian.

5. Penilai; Subjektivitas penilai akan dapat mempengerahi secara leluasa terutama

dalam bentuk tes uraian, seperti faktor kesan terhadap siswa, tulisan, bahasa,

kelelahan dsb, untuk menghindari hal tersebut maka penilai dalam melakukan

evaluasi pertama secara kontinuitas (terus menerus) dalam arti bisa dilakukan lebih

dari 2 kali dan komprehensip yakni menyeluruh isi materi, aspek berpikir dan teknik

tes yang diguakan.

8

6. Praktibilitas (Practicability); Tes dikatakan memiliki praktibilitas yang tinggi,

apabila bersifat praktis dan mudah pengadminstrasian termasuk mudah dilaksanakan,

mudah pemeriksaan dan dilengkapi petunjuk yang jelas.

7. Ekonomis; Tes yang baik tidak terlalu membutuhkan biaya yang terlalu mahal,

tenaga yang banyak dan waktu yang lama.

Sejalan dengan perkembangan pendidikan, peranan dan pelaksanaan asesmen

mengalami perubahan dari asesmen pendidikan masa lalu ke asesmen pendidikan

masa sekarang yakni sebagai berikut:

Tabel 2. Perkembangan pendidikan, peranan dan pelaksanaan asesmen mengalami perubahan dari asesmen pendidikan masa lalu ke asesmen pendidikan masa sekarang

Peranan Dulu Sekarang          Guru Mengajar Mendefinisikan hasil pembelajaran,

mengajar, melaksanakan penilaian utama

          Siswa Dinilai Menilai diri sendiri dan temanKepala Sekolah Menginterpretasi

hasil ujian terstandard

Menginterpretasi hasil ujian dan menyediakan dukungan terhadap penilaian kelas

 Pelaksanaan Dulu Sekarang

          Tujuan Akuntabilitas Akuntabilitas, pembelajaran

          Penggunaan

Penyaringan hasil pengujian dari atas ke bawah

Penyaringan hasil pengujian dari atas ke bawah dan dari kelas ke atas

          Sasaran Bersifat umumTidak terbuka

Sangat terarahBersifat terbuka

          Metode Terutama berupa respon terpilih

Terutama berupa penilaian kinerja dan essay dengan beberapa respon terpilih

9

Sementara itu, Berdasarkan National Science Education Standard in the United

States (National Research Council, 1996: 100) perubahan fokus yang terjadi pada

standard penilaian adalah sebagai berikut.

Tabel 3 Perubahan fokus yang terjadi pada standar penilaian berdasarkan National Science Education Standard in the United States

Hal yang dikurangi Hal yang diutamakanMenilai yang mudah diukur Menilai yang paling berharga

Menilai pengetahuan yang memiliki ciri yang jelas

Menilai pengetahuan yang kaya dan berstruktur baik

Menilai pengetahuan yang bersifat ilmiah

Menilai pemahaman dan pemikiran ilmiah

Menilai untuk mempelajari apa yang tidak dipahami siswa

Menilai untuk mempelajari apa yang dipahami siswa

Hanya melakukan penilaian atas pencapaian

Menilai pencapaian dan peluang untuk belajar

Penilaian akhir dilakukan oleh guru

Siswa terlibat dalam penilaian yang sedang berlangsung  atas hasil kerjanya dan hasil kerja temannya

Pengembangan penilaian eksternal hanya oleh ahli

Guru terlibat dalam pengembangan penilaian eksternal

D. Analisis Pokok Uji

1. Pengertian

Analisis pokok uji adalah suatu prosedur yang sistematis, untuk menyelidiki

informasi-informasi khusus terhadap alat evaluasi yang disusun.

2. Tujuan

Analisis pokok uji lebih banyak digunakan pada alat evauasi yang bersifat

obejektif seperi tes pilihan ganda (multiple choice), mengengingat untuk tes yang

bersifat uraian belum banyak dikaji tentang standar baku yang digunakan, namun

demikian semua alat evaluasi dapat dianalisis pokok uji sesuai dengan ketentuan

masing-masing. Tujuan analisis pokok uji sebagai berikut.

10

a. Upaya memperbaiki atau meningkatkan kualitas alat evaluasi.

b. Mengidentifikasi soal yang baik, kurang baik dan jelek.

c. Mendiagnostik kemampuan siswa.

d. Mengevaluasi pelaksanaan pembelajaran untuk menjadi lebih baik.

3. Aspek analisis pokok uji meliputi,

a. Penyusunan instrumen

b. Menentukan tingkat validitas soal.

c. Menentukan tingkat reliabilitas soal.

d. Menentukan tingkat kesulitan soal (difficulty level of an item).

e. Menentukan daya pembeda (discriminating power).

f. Menentukan pengecoh.

4. Jenis Validitas

Tes yang jika dapat digunakan untuk mengukur tujuan tertentu, maka tes tersebut

dikatakan valid. R.L. Thondrike dan H.P Hagen (1977 dalam Arifin, 2009) mengatakan

validity is always in relation to a spesific decesion or use. Sugiyomo (2011; 350)

validitas internal instrumen berupa tes harus memneuhi validitas kontruksi dan validitas

isi, jika instrumen untuk mengukur sikap cukup menggunakan validitas kontruksi. Jenis

validitas yang dikembangkan Arikunto (2008) sebagai berikut.

a. Validas logis

Tes yang valid, secara logis sesuai dengan aturan yang telah ditentukan, misalnya soal

yang lazim digunakan untuk jenjang SMP secara logis sesuai dengan materi SMP,

kecuali jika digunakan untuk kepentingan seleksi khusus olimpiade. Semua alat

evaluasi, soal harus tersusun secara validitas logis.

b. Validitas empiris

Tes yang valid secara pengalaman (empiris) sudah teruji. Validitas empiris meliputi

empat hal berikut.

1. Validitas isi (content validity)

Tes dikatakan mempunyai validitas isi, jika dapat mengukur isi materi dan tujuan

pembelejaran. Soal objektif maupun soal uraian dapat dapat dilakukan validitas isi

11

oleh pakar ahli melaui judment. Seorang guru biologi jika akan memastikan soal

untuk diagnostik peserta didik maka harus meninjau validitas isi.

2. Validitas kontruksi (construct validity)

Tes memiliki validitas kontruksi, apabila butir-butir soal dapat mengukur aspek

berpikir siswa. Seorang guru biologi jika memberikan soal postes untuk

diagnostik peserta didik maka harus meninjau validitas kontruksi. Antara validitas

isi dan kontruksi, keduanya saling berkaitan

3. Validitas empiris atau validitas ada sekarang (concurrent validity)

Tes memiliki validitas empiris jika secara pengalaman, sudah pernah diujikan dan

untuk perhitungan dijelaskan pada pembahasan dibawah ini.

4. Validitas prediksi (predictive validity)

Tes memiliki validitas empiris, jika dapat memprediksi kemampuan peserta didik,

sebagai contoh tes masuk perguruan tinggi diharapkan dapat menyeleksi

mahasiswa yang dapat mampu mengikuti proses studi perguruan tinggi.

Prinsip analisa soal yang valid disesuaikan dengan kegunaan evaluasi, agar

memperoleh tingkat kevalidan Grounlund (1977 dalam Arifin, 2009) menjelaskan ada

tiga faktor yang mempengaruhi validitas soal sebagai berikut

a. faktor instrumen evaluasi

Kualitas instrumen termasuk daya pembeda, tingkat kesulitan, pengecoh, bahasa

yang komunikatif da jelas sangat mempengaruhi validitas soal

b. faktor administrasi dan penskoran

Proses adminstrasi dan penskoran yang tidak tepat akan mempengaruhi validitas

soal, diantaranya semakin banyak siswa yang bekerjasama dalam tes (contek menyontek),

maka nilai kevalidan menjadi bekurang, karena tes tidak bisa mengukur secara akurat

kemampuan peserta didik

c. faktor jawaban dari peserta didik

Peserta didik yang memilih jawaban dengan mandiri atau spekulasi akan

mempengaruhi kevalidan tes.

12

5. Analisis pokok uji

1. Penyusunan instrumen

Analisis pokok uji berkaitan dengan penyusunan instrumen meliputi standar

penggunaan bahasa dalam menyusun tes maupun non tes, petunjuk instrumen dan

proporsi jumlah instrumen yang digunakan berkaitan dengan waktu yang dibutuhkan

peserta tes (testee). Penyusunan instrumen yang mengacu hal tersebut akan meningkatkan

kualitas hasil evaluasi.

Arifin (2009; 132) menjealaskan penyusunan intrumen baik soal pilihan ganda

dan uraian, dapat dianalisis sebagai berikut; 1) secara rasional dan 2) secara empiris.

Tabel 4. Tela’ah soal secara rasional

Nomor soal: Jenis soal:No Aspek yang ditelaah ya tidak

A. Materi1 Soal sesuai dengan indikator2 Batasan pertanyaan dan jawaban yang diharapkan jelas3 Isi materi sesuai dengan tujuan tes4 Isi materi sesuai dengan jenjang sekolah

B. Kontruksi5 Ada petunjuk soal tentang menjawab soal6 Ada pedoman penskoran7 Gambar, grafik, label, diagram dan sejenisnya disajikan dengan

jelas dan terbacaC. Bahasa

8 Rumusan soal komunikatif9 Rumusan soal tidak menggunakan kata yang menimbulkan

penafsiran ganda10 Rumusan soal tidak menggunakan negatif ganda11 Menggunakan bahasa baku Catatan;

2. Validitas

Sebuah instrumen dikatakan valid apabila valis secara logis, isi, empiris, prediksi,

sehingga dapat mengungkapkan data dari variabel yang diteliti secara tepat. Sebuah tes

dapat diukur tingkat kevalidan dengan meggunakan teknik korelasi product moment yang

ditemukan oleh Pearson dengan rumus sebagai berikut:

13

a. Korelasi product moment dengan simpangan

rxy= ∑ xy

√(∑ x2)(∑ y2)

Keterangan:rxy = koefisien korelasi antara variabel X dan variabel Y, dua variabel yang

dikorelasikan (x= X-Xrata-rata dan y= Y-Yrata-rata) Σ xy = jumlah perkalian skor item dan skor totalΣ x2 = jumlah kuadrat skor itemΣ y2 = jumlah kuadrat skor total

b. Korelasi product moment dengan angka kasar

rxy= N ∑ XY−∑ X ∑Y

√[ N ∑ X2−(∑ X)2 ][ N ∑Y 2−(∑Y )2]

Keterangan:rxy = koefisien korelasi tiap itemN = banyaknya subjek uji cobaΣ X = jumlah skor itemΣY = jumlah skor totalΣ X2 = jumlah kuadrat skor itemΣ Y2 = jumlah kuadrat skor totalΣ XY = jumlah perkalian skor item dan skor total

Penafsiran nilai koefisien korelasi dapat menggunakan dua cara:

a. Mengacu pada standar koefesien korelasi, yang dijelaskan pada tabel 5.

Tabel 5. Interval koefesien korelasi

Diadaptasi dari Arikunto (2008).

b. Hasil rxy dikonsultasikan dengan rtabel product moment dengan =5%. Jika rxy >

rtabel maka alat ukur dikatakan valid. Untuk mengukur validitas pengukuran

keterampilan kooperatif dilakukan dengan uji korelasi spearman rho. Hasil

korelasi menghasilkan signifikansi ≤ 0,05 maka terdapat kesesuaian yang

signifikan (Sugiyono, 2007).

14

Interval rxy Kriteria

0,00 rxy 0,20 sangat rendah

0,20 < rxy 0,40 Rendah

0,40 < rxy 0,60 Cukup

0,60 < rxy 0,80 Tinggi0,80 < rxy < 0,10 sangat tinggi

Rumus validitas lain dapat menggunakan rumus γpbi sebagai berikut:

γpbi = Mp−Mt

St √ Pq

Keterangan:γpbi = koefisien korelas biseralMp = rerata skor dari subjek yang menjawab betul bagi item yang dicari validitasnyaMt = rerata skor totalSt = Standar deviasi dari skor totalp = proporsi siswa yang menjawab benar (p = banyaknya siswa yang benar)

jumlah seluruh siswa q = proporsi siswa yang menjawab salah, (q = 1-p)

3. Reliabilitas

Alat instrumen evaluasi untuk dapat digunakan sebagai alat ukur yang dapat

dipercaya, harus memiliki nilai reliabel, sehingga ketika akan digunakan mempunyai

ukuran yang konsisten. Anastasi (1976 dalam Arifin, 2009) reliability refers to the

consistency of score obtained by the same persons when reexamined the same test on

different occasion or white different sets of equivalent items or under other variable

exmining conditions. Arikunto (2008) menjelaskan cara mengukur reliabilitas soal,

dengan menggunakan tiga teknik;

a. Metode bentuk pararel (equivalent)

Tes yang reliabel jika 2 tes atau lebih diujikan kepada siswa, misalnya ada 2 jenis tes

dengan tingkat kesulitan sama, namun butir soal yang berbeda kemudian diteskan

kepada siswa dan hasil kedua tes dikorelasikan, contohnya pada tabel 5 berikut ini,

siswa yang memiliki hasil belajar tinggi akan tetap terlihat tinggi pada tipe soal I dan

II khususnya pada peserta didik kode A dan D dan peserta didik dengan kode A dan

D menunjukan hasil belajar yang lebih rendah, sehingga tes tipe I dan II menunjukan

hasil yang reliabel, walaupun ada perbedaan angka tapi secara umum siswa yang

diteskan tipe II mengalami kenaikan yang sama. Hasil yang tidak reliabel jika hasil

belajar tipe II nilai yang diperoleh peserta didik kebalikannya dengan tipe I misal

peserta didik kode A tes tipe I memperoleh nilai 80 dan nilai tes tipe II nilai 50,

sedangkan peserta didik kode B tes tipe I memperoleh nilai 50 dan nilai tes tipe II

nilai 90. Reliabilitas memiliki makna kekonsistenan, soal yang reliabel semestinya

15

dapat menunjukan hasil yang konsisten pada prestasi siswa golongan upper dan

lower.

Tabel 6. Pengukuran reliabilitas menggunakan metode bentuk pararel

Kode peserta didik Tes tipe I Tes tipe II

A 80 83

B 50 53

C 60 62

D 90 94

b. Metode tes ulang (test-retest method)

Tes yang reliabel jika 1 tes telah diujikan 2 dua kali atau lebih kepada siswa yang

sama, hasil tes kedua dapat dihitung korelasinya. Pendekatan metode tes ulang

hampir sama dengan bentuk pararel namun yang berbeda tes yang akan digunakan

pada metode tes ulang terdiri satu jenis. Metode tes ulang menjadi tipe tes yang

sering digunakan untuk mengukur reliabilitas khususnya evaluasi yang sifatnya non

objektif seperti tes uraian. Ada beberapa trik-trik penerapan yang biasa digunakan

untuk menerapkan reliabilitas menggunakan metode tes ulang yakni dengan

pemberian suatu tes dilakukan pada hari tertentu, kemudian diberikan tes lagi pada

H+1 dan H+7, kemudian dapat dinilai tingkat reliabelnya.

c. Menggunakan rumus reliabilitas

Analisis relibilitas dengan menggunakan rumus reliabilitas, dapat dilakukan dengan

memberikan tes hanya 1 kali dan dapat diukur tingkat reliabilitasnya.

1. Penggunaan rumus K-R 20

Analisis realibilitas bentuk tes pilihan ganda menggunakan KR-20 yang

dikemukakan oleh Kuder dan Richardson. (Arikunto, 2008) bahwa penggunaan

rumus KR 20 dapat menghasilkan tingkat relibilitas dibandingkan dengan KR 21,

kedua rumus tersebut tanpa menggunakan teknik belahan ganjil-genap atau awal-

akhir.

r 11=( n

n−1)( S2−∑ pq

S2 )

16

Keterangan:r11 = reliabilitas tes secara keseluruhan p = proporsi siswa yang menjawab benarq = proporsi siswa yang menjawab salah (q =1 – p)Σpq = jumlah hasil perkalian antara p dan qn = banyaknya itemS = standar deviasi dari tes (standar deviasi adalah akar dari varians)

Kriteria reliabel soal tes dapat dianalisis dengan cara membandingkan r11 dengan

harga rtabel yang sesuai pada tabel harga produk moment maka dikatakan soal yang

diujikan reliabel. Harga r11 yang diperoleh diinterpretasikan dengan derajat reabilitas

pada tabel 7 dibawah ini.

Penafsiran nilai koefisien korelasi dapat menggunakan dua cara:

1). Mengacu pada standar koefesien korelasi, yang dijelaskan pada tabel 6.

Tabel 7. Interval reliabilias (r11)

* Diadaptasi dari Arikunto (2008)

2). Kriteria reliabel soal tes dapat dianalisis dengan cara membandingkan r11 dengan

harga rtabel yang sesuai pada tabel harga produk moment maka dikatakan soal yang

diujikan reliabel. rtabel product moment dengan =5%. Jika r11 > rtabel maka alat

ukur dikatakan reliabel.

2. Penggunaan rumus K-R 21

r 11=( nn−1 )(1− M−(n−M )

nS t2

)

Keterangan;M = rerata skor totalSt

2 = standar deviasi total

3. Penggunaan rumus Spearman-Brown.

17

Interval r11 Kriteria

0,00 r11 0,20 sangat rendah

0,20 < r11 0,40 Rendah

0,40 < r11 0,60 Cukup

0,60 < r11 0,80 Tinggi

0,80 < r11 0,10 sangat tinggi

Analisis reliabilitas menggunakan rumus speraman-brown, dikenal dengan metode

belah dua (split half method) yakni dengan dua cara membelah butir soal, 1)

membelah item-item genap dan item-item ganjil, 2) membelah item nomor awal da

akhir, sehingga agar dapat membelah butir soal harus genap. Oleh karena itu indek

korelasi menunjukan hubungan dua belahan instrument, adapun rumusnya sebagai

berikut.

r 11=2 xr 1

212

(1+r 12

12

) ,

Nilai rxy dalam belahan ini disebut dengan istilah r 12

12 atau r ganjil-genap

(Arikunto, 2002)

Hasil analisa reliabilitas menggunakan rumus Speraman-Brown dengan teknik dua

belahan, seringkali menunjukan hasil yang berbeda, jika hasilnya negatif maka menunjukan

tes yang tidak reliabel dan jika hasilnya positif maka dapat diukur dengan menggunakan

indeks reliabelitas. Oleh karena itu dalam menggunakan penelitian, kita dapat menggunakan

salah satu teknik yang dipandang dapat menghasilkanhasil yang lebih baik.

4. Penggunaan rumus Flanagan

Teknik menggunakan rumus Flanagan, dapat dilakukan dengan teknik dua belahan

gajil dan genap seperti halnya rumus speraman-brown. Rumus Flanagan sebagi

berikut.

r 11=2(1−V 1 x V 2

V t

) dimana V=

∑ X−(∑ X )2

NN

Keterangan:V1 = varians beahan pertama (varians skor butir-butir ganjil)V2 = varians belahan kedua (varians skor butir-butir genap)Vt = varians total (Arikunto, 2002).

5. Penggunaan rumus Rulon

Teknik menggunakan rumus Flanagan, dapat dilakukan dengan teknik dua belahan

gajil dan genap seperti halnya rumus speraman-brown. Rumus Flanagan sebagi

berikut.

18

r 11=1−V d

V t

Keterangan:

Vd = varians different

d = skor belahan awal dikurangi skor belahan akhir (Arikunto, 2002).

6. Penggunaan rumus Alpha

Penggunaan rumus Alpha, secara khusus untuk mengukur reliabilitas soal dalam

bentuk uraian, maka dapat dilakukan dengan langkah berikut.

1. Menentukan gradien penilaian tiap item soal, misalnya soal 1, penskoran antara

0-5, soal 2 penskoran antara 0-10 dst.

2. Menghitung koefisien korelasi dengan menggunakan rumus alpha;

r11¿(n

(n−1))(1−

∑ σ12

σ12 ) dimana

σ 2=∑ X−

(∑ X)2

NN

Keterangan:r11 = reliabilitas yang dicari∑σ 1

2 = jumlah varians skor setiap item soal

σ 12 = varians total (Arikunto, 2002).

Contoh perhitugan mencari reliabilitas soal uraian pada tabel 8:

Tabel 8. Perhitugan mencari reliabilitas soal uraian

No

Nama Nomor Itom Skor total Kuadrat skor total1 2 3 4 5 6

1 A 10 6 8 8 10 10 52 27042 B 6 4 4 6 6 5 31 9613 C 8 2 6 8 7 8 39 15214 D 7 3 7 7 6 6 36 12965 E 0 5 3 2 4 4 18 3246 F 2 4 2 8 6 8 30 9007 G 4 3 6 6 6 6 31 9618 H 5 5 5 7 7 7 36 12969 I 5 5 4 6 8 5 33 108610 J 3 6 3 4 6 6 28 784

Jumlah50 43 48 62 66 65 334 11836

Jumlah 328 201 264 418 458 451 2120

19

kuadrat

Diketahui σ 12 = 7,8; σ 2

2 = 1,61; σ 32 = 3,36; σ 4

2 = 3,36 σ 52 = 2,24; σ 6

2 = 2,85 dan varian total (

σ 2¿ berjumlah 68,40, kemudian dimasukan dala rumus alpha diperoleh 0,83, sehingga

interpretasi tingkat reliabilitas sangat tinggi (Arikunto, 2008).

4. Tingkat kesulitan

Tingkat kesulitan bisanya digunakan untuk menganalisa soal jenis objektif. Soal

yang baik adalah soal yang tidak terlalu mudah dan tidak terlalu sulit, soal yang terlalu

mudah akan menyebabkan peserta didik tidak dapat merangsang berfikit tingkat tinggi,

sedangkan soal yang terlalu sulit akan menyebabkan siswa berputus asa. Sriyati (2012)

menuturkan keseimbangan tingat kesulitan mengacu pada kurva normal yakni 30%

mudah, 50% sedang dan 20% sulit. Keseimbangan tingkat kesulitan pada prinsipnya

mengacu pada tujuan tes, jika tes tersebut digunakan untuk menseleksi kompetisi

olimpiade mata pelajaran, maka bisa saja proporsi tigkat kesulitan bisa diterapkan hingga

diatas 75%.

Analisa tingkat kesulitan, dapat dijadikan dalam penyusunan soal, seperti soal

yang mudah akan menjadi lebih baik jika diposisikan di awal soal, mengingat soal yang

mudah dapat meningkatkan motivasi siswa untuk mengerjakan soal. Analisis pokok uji

dapat dilakukan dengan mengukur tingkat kesulitan soal, sebagai berikut.

Keterangan:P = indek kesulitanB = banyaknya siswa yang menjawab benar.JS = jumlah seluruh siswa peserta tes.

Tingkat kesulitan diinterpretasikan pada tabel 9, dibawah ini.

Tabel 9. Interval tingkat kesulitan

* Diadaptasi dari Arikunto (2008).

20

JS

BP

Interval P Kriteria

0,00 P 0,30 Sulit

0,30 < P 0,70 Sedang

0,70 < P 1,00 Mudah

5. Daya pembedaAnalisis pokok uji soal objektif misalnya multiple choice dapat dilakukan dengan

mengukur daya pembeda soal. Tahapan awal dalam pengukuran daya pembeda, dengan

cara menentukan kelompok atas (upper group) dan kelompok bawah (lower group),

dengan mengacu pada nilai yang diperoleh berdasarkan tes. Rumus yang digunakan

untuk mencari daya pembeda sebagai berikut.

DP=BAJA

−BBJB

=PA−PB

Keterangan:

DP = daya pembedaJA = banyaknya peserta kelompok atasJB = banyaknya peserta kelompok bawahBA = banyaknya peserta kelompok atas yang menjawab benarBB = banyaknya peserta kelompok bawah yang menjawab benarPA = proporsi peserta kelompok atas yang menjawab benarPB = proporsi peserta kelompok bawah yang menjawab benar

Tabel 10. Interval daya pembeda

Interval DP Kriteria

0,00 DP 0,20 Jelek

0,20 < DP 0,40 Cukup

0,40 < DP 0,70 Baik

0,70 < DP 1,00 Baik sekali

* Diadaptasi dari Arikunto (2008).

6. Tingkat pengecoh (distraktor)

Tingkat pengecoh merupakan distribusi peserta tes (testee) dalam memilih jawaban,

dengan melihat pola jawaban soal dapat diketahui, 1) taraf kesulitan, 2) daya

pembeda soal, 3) baik dan tidaknya pengecoh (distraktor). Daya pembeda yang jelek,

diduga terjadi akibat adanya pengecoh (distraktor) yang tidak berfungsi dengan baik,

sehingga untuk peningkatan tingkat daya pembemda maka pilihan jawaban dapat

diganti yang lebih baik. Suatu distraktor dapat diperlakukan dengan cara, 1) diterima

karena sudah baik, 2) ditolak kareana tidak baik, 3) ditulis kembali karena kurang

baik (Arikunto, 2008; 220). Sriyati (2012) menuturkan analisis pengecoh dilakukan

denagan memperhatikan ciri sebagai berikut, sebagai berikut.

a. Ada yang memilih, khususnya dari kelompok bawah kelompok bawah

b. Dipilih lebih banyak oleh kelompok rendah dari pada kelompok tinggi

21

c. Jumlah pemilih kelompok tinggi pada pengecoh itu tidak menyamai pada

kelompok rendah yang memilih kunci jawaban yang benar.

d. Minimial distraktor dipilih oleh peserta tes sebanyak 5%.

Contoh analisis sebuah item soal tipe pilihaan ganda (multiple choice), sebagai

berikut. Diketahui jumlah siswa 60, kunci jawaban ada di pilihan D, pada table 9 berikut.

Tabel 9. Analisis item soal

Pilihan jawaban A B C D* Jumlah

Kelompok atas 5 6 3 16 30

Kelompok bawah 8 11 8 3 30

Jumlah 13 17 11 19 60

1). Tingkat kesulitan

P = 16 = 0,3 Tingkat kesulitan soal tergolong tipe sulit

60

2). Daya pembeda

DP = PA-PB = 0,53-0,1 = 0,43

Daya pembeda soal tergolong baik

3). Pengecoh soal, tergolong sudah baik, karena tiap distraktor (pengecoh) terpilih

oleh peserta didik 5% dari jumlah peserta didik atau minimal 3 orang memilih

distraktor.

Perkembangan analisis pokok uji, sangat dibantu oleh kajian statistik dan aplikasi

teknologi seperti Microsoft Office Excel, SPSS dll.

7. Pengembangan tes

a. Pengembangan tes bentuk uraian

Arifin (2009; 129) menjelaskan bentuk tes uraian ditinjau dari luas sempitnya materi

dibedakan menjadi dua jenis, sebagai berikut:

1. Uraian terbatas (restricted respons items)

Peserta didik dalam menjawab tes uraian memiliki batasan-batasan tertentu,

sebagai contoh sebagai berikut:

22

1) Jelaskan yang dimaksud dengan fotorespirasi

2) Jelaskan proses gilkolisis dan siklus krebs?

3) ……. merupakan organela yang berfungsi dalam respirasi seluler

2. Uraian bebas (extended respons items)

Peserta didik dalam menjawab tes uraian ini memiliki kebebasan dengan cara dan

sistematika sendiri, sebagai contoh sebagai berikut:

1) Jelaskan manfaat perkembangan bioteknologi?

2) Jelaskan dampak pencemaran insektisida?

Tes uraian memiliki keunggulan dalam menggali pengetahuan peserta didik, namun

dalam melakukan penilaian memiliki kesulitan yang lebih tinggi dibandingkan tes

objektif dan kecenderungan bersifat subjektif, oleh karena itu perlu cara untuk

mencari solusi atas kesulitan dan subjektivitas penilaian, sebagai berikut:

1. Menyusun bentuk uraian objektif

Pensokoran bentuk uraian objektif, biasanya digunakan dalam penskoran jawaban

uraian yang singkat. Skor hanya ditentukan 2 kategori yakni benar diberi skor 1,

diberi salah skor 0, misalnya jawaban uraian berupa mitokondria, jika benar skor1

dan jika salah skor 0.

2. Menyusun bentuk uraian non objektif

Dalam penskoran soal uraian non objektif, skor dijabarkan dalam bentuk

rentangan, besarnya rentangan ditentukan berdasarkan dengan kompleksitas

jawaban. Misalnya penjelasan tahapan glikolisis rentangan skor 1-10, dengan isi

jawaban meliputi reaksi enzimatis, pembentukan air dan subtrat, pembentukan

ATP dan NADPH. Guru dapat menilai soal dengan mengacu pada kelengkapan

jawaban sol uraian.

3. Pendekatan metode pengoreksian

a. Metode per lembar, yakni guru mengoreksi soal uraian pada tiap lembar dari

soal nomor awal sampai soal akhir. Keunggulan metode tersebut memerlukan

waktu yang lebih cepat, tinjauan biaya lebih murah, namun kelemahannya

penilaian skor antara peserta didik satu dengan yang lainnya cenderung

berbeda pada kualitas jawaban yang sama, sehingga untuk mengatasinya perlu

23

menyusun bentuk uraian objektif maupun uraian non objektif yang sudah

dijelaskan sebelumnya.

b. Metode per nomor, yakni guru mengoreksi soal uraian pada tiap nomor untuk

seluruh peserta didik, sebagai contoh guru mengoreksi nomor 1 untuk seluruh

peserta didik, kemudina dilanjutkan nomor 2 untuk seluruh peserta didik dan

seterusnya. Keunggulan metode tersebut akan sangat membantu dalam

memberikan skor dan membandingkatan jawaban antara peserta didik, namun

kekurangannya membutuhkan waktu yang lebih lama dibandingkan metode per

lembar.

c. Metode bersilang, yakni guru mengoreksi jawaban peserta didik dengan jalan

hasil koreksi dari satu korektor, kemudian dikoreksi (dinilai) ke korektor

lainnya. Keunggulan metode tersebut faktor subjektif bisa dikurangi namun

kelemahnnya membutuhkan waktu lebih lama dan tenaga yang lebih banyak.

Metode bersilang dianjurkan dalam penilaian untuk kepentingan yang bersifat

selektif, misalnya dalam penentuan tingkat peserta didik.

d. Point method merupakan metode pengkoreksian jawaban dibandingkan dengan

jawaban ideal yang telah ditetapkan dalam kunci jawaban, sehingga penskoran

sangat bergantung dengan tingkat kepadanan. Metode tersebut sangat tepat

digunakan untuk uraian terbatas.

e. Rating method yaitu setiap jawaban peserta didik ditetapkan dalam salah satu

kelompok yang sudah dipilah-pilah berdasarkan kualitasnya, misalnya sebuah

soal akan diberi skor antara 0-10, metode ini seperti penyusunan bentuk uraian

non objektif, sehingga tepat digunakan pada soal uraian soal uraian bebas

b. Pengembangan tes bentuk objektif

Tes bentuk objektif memiliki keunggulan mudah dikoreksi dan unsur objektifnya

lebih kuat dibandingkan soal uraian, sehingga siapapun yang mengoreksi maka akan

sama hasilnya. Perkembangan teknologi juga ikut membantu penilaian tes objektif

dalam sistem komputerisasi, sehingga aplikasinya sering digunakan misalnya tes

seleksi perguruan tinggi, tes toefl, tes CPNS. Kelemahan tes bentuk objektif

dimungkinkan unsur jawaban spekulasi menjadi benar dan jawaban peserta didik

24

terbatas sehingga belum bisa mengeksplor pengetahuan peserta didik lebih luas. Oleh

karena itu perlu meragamkan bentuk tes pilihan ganda diantaranya sebagai berikut:

1. Pilihan ganda (multiple choice)

Pilihan ganda merupakan jenis soal yang sering digunakan, karena memiliki

keunggulan diantaranya 1) mudah dikoreksi, 2) memiliki pengecoh (distraktor

yang banyak, 3) pengukuran untuk validitas dan reliabelitas lebih mudah.

Implimentasi dalam tes yang standar digunakan dalam proses pembelajaran

hendaknya memperhatikan hal-hal sebagai berikut:

a. Petunjuk soal jelas, meliputi teknis pengisian, waktu pelaksanaan dsb.

b. Bahasa dalam soal pilihan ganda standar baku.

c. Jika ada gambar, tabel atau bagan tersusun jelas dan komunikatif.

d. Memiliki komposisi soal yang mudah, sedang dan sulit. Soal yang mudah

hendaknya diletakan urutan bagian depan, karena dapat memotivasi peserta

didik dalam menjawab soal, namun jika soal sulit kecenderungan siswa

motivasi akan menurun khususnya bagi peserta didik dengan prestasi

golongan lower.

e. Pola jawaban soal tidak mengarahkan membentuk pola seperti jawaban no 1-5

kunci jawaban AAAAA dan kunci jawaban no 6-10 BBBBB, karena dapat

membantu spekulasi jawaban peserta didik.

f. Penggunaan soal negatif, sebaiknya diberi tanda khusus dengan bercetak tebal

seperti kecuali atau ditulis miring kecuali, untuk memperhatikan kejelasan

pada peserta tes.

g. Tidak menggunakan negatif ganda, karena akan menjadi kesulitan peserta

didik dalam memahami soal. Contoh soal pertanyaan negatif ganda sebegai

berikut. Organela sel yang tidak telibat langsung dalam sintesis protein

kecuali…, jika disusun pertanyaan yang tepat maka kata negatif cukup satu

saja.

Soal pilihan ganda untuk kepentingan penelitian menyusunan tes sangat perlu

diperhatiakan validitas, reliabelitas, tingkat kesukaran, daya pembeda dan

pengecoh, sehingga dalam penyusunan perlu memperhatikan beberapa pola

sebagai berikut (Arifin, 2009; 132):

25

Petunjuk.

Pilihlah jawaban soal pilihan ganda dengan jawaban menulis huruf A, B, C, D

atau E sesuai dengan jawaban yang paling tepat.

a. Distracters yaitu setiap pertanyaan atau pernyataan mempunyai beberapa

pilihan jawaban yang salah dan satu pilihan jawaban yang paling tepat,

contoh.

1. Jika darah seorang ditetesi serum anti A tidak menggumpal dan ditetesi serum anti B menggumpal, kemungkinan golongan darahnya...A. AB. ABC. A dan ABD. OE. B Jawaban A

b. Analisis hubungan antara hal yakni bentuk soal dapat digunakan untuk

menunjukan pernyataan (statement) dan alasan (reason), sehingga siswa

dapat diketahui tingkat pemahamanya lebih tinggi. Jenis soal ini diperlukan

keterangan untuk memilih jawaban misalnya.

a. Jika pernyataan benar, alasan benar dan alasan merupakan sebab dari

pernyataan.

b. Jika pernyataan benar, alasan benar tetapi merupakan alasan tidak

merupakan sebab dari pernyataan.

c. Jika pernyataan benar tetapi alasan salah.

d. Jika pernyataan salah tetapi alasan benar.

e. Jika pernyataan salah tetapi alasan salah.

Soal:

Retikulum endoplasma halus berfungsi dalam sintesis protein sebab di bagian

retikulum endoplasma melekat ribosom.

Penjelasan:

1. Retikulum endoplasma halus berfungsi dalam sintesis lemak (pernyatan

salah)

2. Retikulum endoplasma (RE) terdapat ribosom yang dikenal dalam RE

kasar (pernyataan benar)

26

Jadi jawabannya D

c. Variasi negatif yakni setiap pertanyaan atau pernyataan memiliki jawaban

yang benar namun disediakan jawaban yang salah. Tugas peserta didik

memilih jawaban yang salah, contoh.

Faktor-faktor yang mempengaruhi pembekuan darah, Kecuali...A. TromboplastinB. TrombokinaseC. Ca-

D. Vitamin KE. K+

Jadi jawabanya Ed. Variasi berganda yaitu memilih beberapa kemungkinan jawaban yang hampir

semuanya benar, tetapi ada satu jawaban yang paling benar contoh.

Sintesis polipeptida dimulai pada saat…

A. Menempelnya ribosom subunit kecil dan sub unit besar

B. mRNA meninggalkan nukleus ke sitosol

C. Ribosom bertemu mRNA kodon AUG

D. Ribosom melekat pada RE

E. mRNA menempel ribosom

Jawaban C

e. Pertanyaaan dalam bentuk studi kasus.

Ibu Misa sedang memilih makanan yang dapat meningkatkan perkembangan

otak anaknya, suatu ketika dia bertanya dengan Supriyono anak SMA N 3

Lampung untuk memastikan pilihan makanan yang tepat untuk buah hatinya,

melalui uji praktikum diperoleh data sebagai berikut:

Makana

n

Uji Benedik Uji Fehling Uji Biuret Uji lemak

I ++++ +++ + +

II ++++ ++ + +++

III ++ ++ ++ ++

IV + - ++++ +

Keterangan: tanda positif (+) menunjukan kadar tingkat senyawa tertentu dan

27

tanda negatif (-) menunjukan tidak ada senyawa tertentu

Pilihan makanan yang tepat sesuai dengan hasil uji makanan diatas adalah:

A. I

B. II

C. III

D. IV

E. I dan III

Jawaban D, karena uji biuret merupakan uji protein. Makanan yang mengandung

banyak protein pada makanan IV

f. Pertanyaan berkaitan dengan susunan dengan pernyataan yang tidak lengkap,

contoh.

Proses peredaran darah.

1. Darah masuk ke serambi kiri

2. Darah dari vena kava inferior menuju serambi kanan

3. Darah dipompa dari bilik kanan menuju paru-paru

4. Darah di pompa dari bilik kiri ke aorta

5. Darah melewati vena pulmonalis

6. Darah melewati arteri pulmonalis

Urutan peredaran darah dari darah yang banyak CO2 menjadi darah

banyak O2 adalah

A. 1-2-6-5-4-1

B. 5-4-6-5-1-4

C. 2-3-5-6-4-1

D. 2-3-6-5-1-4

E. 5-3-6-5-1-4

Jawaban D

2. Menjodohkan (Matching)

Soal tipe menjodohkan memiliki persamaan dengan soal tipe pilihan ganda yakni

pada memilih jawaban yang tepat, namun yang membedakan dua tipe tersebut

pada soal tipe menjodohkan soal berada pada kolom khusus dan jawaban berada

28

pada kolom khusus, jumlah jawaban biasanya melebihi jumlah soal dengan tujuan

sebagai pengecoh (distractor), berikut contohnya.

Petunjuk: Dibawah ini terdapat dua kelompok A dan kelompok B, pasangkan

antara kelompok A dan B yang memiliki hubungan yang tepat, dengan mengisi

kode huruf yang sesuai di kelompok A.

Kelompok A kelompok B

1. Proses pertukaran O2 dan CO2 melalui proses... (e) a. mitokondia

2. (c)... tempat pertukaran udara pernapasan b. paru-paru

3. Proses ekspirasi, keadaan di rongga dada...(i) c. alveolus

4. (a)... Organela respirasi d. osmosis

5. Kadar HCO3- menyebabkan…(g) e. difusi

f. emfisema

g. asidosis

h. golgi

i. tekanan besar

j. tekanan kecil

3. Soal tipe benar salah

Soal tipe benar salah, memiliki tingkat pengecoh yang paling sedikit jika

dibandingkan dengan tipe soal pilihan objektif, berikut ini contohnya.

Petunjuk, berilah tanda silang pada huruf B jika pernyataan benar dan huruf S jika

jawaban pernyataan salah

1. B- S : Semua mamalia tidak bisa terbang

2. B- S : Ribosom melekat pada RE kasar

3. B- S : Penderita hemofili lebih didominasi pada laki-laki

29

DAFTAR PUSTAKA

Arifin, Zaenal. (2009). Evaluasi Pembelajaran. Bandung: PT Remaja Rosdakarya.

Arikunto, S. (2002). Prosedur Penelitian suatu Pendekatan Praktek. Edisi V. Jakarta: Rineka Cipta

___________(2008). Dasar-Dasar Evaluasi Pendidikan (edisi revisi). Jakarta: PT Bumi Aksara.

NRC.(1996). National Science Education Standards.Washington: National Academic Press

Rustaman, Nuryani (___) Assesment Literacy Pdf. PPT

Rustaman, N.Y. dkk.(2005). Strategi Belajar Mengajar Biologi. Malang: UM Press

Sriyati, Siti. (2012). Bahan Ajar Pembelajaran Analisis Pokok Uji. Bandung: UPI. Tidak diterbitkan. [on line] at http://ebookbrows.com. (10 Februari 2012)

Stiggins, R.J. (1994). Student-centered Classroom Assessment. New York: Macmillan College Publishing Company.

Sugiyono. (2007). Statistika untuk Penelitian. Bandung: Alfabeta.

30