analisis tes buatan guru revisi

71
BAB I PENDAHULUAN Tes pada hakikatnya untuk melihat keberhasilan siswa terhadap materi yang diteskan. Tes merupakan sebagai alat untuk mengukur perbedaan individu untuk mendiagnosa atau mengukur perbedaan individu tersebut. Hasil tes menunjukkan level kemampuan yang dimiliki siswa. Tes sangat bermanfaat bagi guru, selain mengukur kemampuan siswa juga sebagai perbaikan terhadap guu, menentukan tempat atau posisi siswa dalam suatu kelas atau kelompok, memberikan bimbingan kepada siswa dalam pendidikan dan menentukan pilihan program-program khusus. Meskipun tes sangat bermanfaat, tetapi ada yang kurang menjadi perhatian oleh bagi pengguna tes itu sendiri. Menurut idealnya, tes yang diberikan kepada siswa harus merupakan tes yang baik, yaitu yang memenuhi syarat seperti validitas, reabilitas, tingkat kesukaran, daya beda dan daya pengecoh. Tes biasanya dibuat oleh guru. Terutama tes yang digunakan untuk Ulangan Harian (UH). Guru membuat soal sesuai kemampuan masing-masing dan dengan caranya masing-masing. Akibatnya, tidak semua tes memenuhi persyaratan dari sebuah tes yang baik. Hal ini juga berpengaruh terhadap hasil tes siswa. Analisis Tes Buatan Guru 1

Upload: ulfia-rahmi

Post on 26-Nov-2015

396 views

Category:

Documents


9 download

TRANSCRIPT

BAB I

PENDAHULUAN

Tes pada hakikatnya untuk melihat keberhasilan siswa terhadap materi

yang diteskan. Tes merupakan sebagai alat untuk mengukur perbedaan individu

untuk mendiagnosa atau mengukur perbedaan individu tersebut. Hasil tes

menunjukkan level kemampuan yang dimiliki siswa. Tes sangat bermanfaat bagi

guru, selain mengukur kemampuan siswa juga sebagai perbaikan terhadap guu,

menentukan tempat atau posisi siswa dalam suatu kelas atau

kelompok, memberikan bimbingan kepada siswa dalam

pendidikan dan menentukan pilihan program-program khusus.

Meskipun tes sangat bermanfaat, tetapi ada yang kurang menjadi perhatian oleh

bagi pengguna tes itu sendiri. Menurut idealnya, tes yang diberikan kepada siswa

harus merupakan tes yang baik, yaitu yang memenuhi syarat seperti validitas,

reabilitas, tingkat kesukaran, daya beda dan daya pengecoh.

Tes biasanya dibuat oleh guru. Terutama tes yang digunakan untuk

Ulangan Harian (UH). Guru membuat soal sesuai kemampuan masing-masing dan

dengan caranya masing-masing. Akibatnya, tidak semua tes memenuhi

persyaratan dari sebuah tes yang baik. Hal ini juga berpengaruh terhadap hasil tes

siswa.

Oleh karena itu, perlu dianalisis tes buatan guru yang telah digunakan

untuk mengetahui tingkat keterpenuhi persyaratan suatu tes yang baik. Apakah tes

buatan guru sudah realibel, valid, memiliki tingkat kesukaran, daya beda dan daya

pengecoh yang diharapkan. Dalam analisis tes buatan guru ini diambil tes

Matematika dan tes IPS di sekolah dasar. Tes buatan guru tersebut dianalisis

secara kuantitatif dan kualitatif.

Analisis Tes Buatan Guru 1

BAB II

TES DAN PERSYARATAN TES YANG BAIK

A. Defenisi Soal Tes

Definisi tes banyak sekali dikemukan oleh para ahli, diantaranya:

1. Menurut Arikunto, 2009:53 mengemukakan Tes merupakan alat atau

prosedur yang digunakan untuk mengetahui atau mengukur sesuatu dalam

suasana dengan cara dan aturan-aturan yang sudah ditentukan. Dalam tes

ada istilah testing yang merupakan saat pada waktu tes itu dilaksanakan,

dengan kata lain merupakan saat pengambilan tes. Kemudian ada istilah

testee yang merupakan responde yang sedang mengerjakan tes sedangkan

tester adalah orang yang diserahi untuk melakukan pengambilan tes

terhadap para responden.

2. Menurut Riduwan ( 2006: 37) tes sebagai instrumen pengumpulan data

adalah serangkaian pertanyaan / latihan yang digunakan untuk mengukur

ketrampilan pengetahuan, intelegensi, kemampuan atau bakat yang dimiliki

individu / kelompok.

3. Menurut Allen Philips (1979: 1-2) A test is commonly difined as a tool or

instrument of measurement that is used to obtain data about a specific trait

or characteristic of an individual or group.( Test biasanya diartikan sebagai

alat atau instrumen dari pengukuran yang digunakan untuk memperoleh data

tentang suatu karakteristik atau ciri yang spesifik dari individu atau

kelompok.)

4. Menurut Rusli Lutan (2000:21) tes adalah sebuah instrument yang dipakai

untuk memperoleh informasi tentang seseorang atau obyek.

Sementara Tes pertama kali diperkenalkan oleh James Ms. Cattel pada

tahun 1890.

B. Teknik Tes

1. Tes Objektif

Tes objektif adalah tes yang keseluruhan informasi yang diperlukan

untuk menjawab tes telah tersedia. Oleh karena sifatnya yang demikian

Analisis Tes Buatan Guru 2

Popham (1981:235) menyebutnya dengan istilah tes pilihan jawaban (selected

response test). Butir soal telah mengandung kemungkinan jawaban yang

harus dipilih atau dikerjakan oleh peserta tes. Kemungkinan jawaban telah

dipasok oleh pengkonstruksi tes dan peserta hanya memilih jawaban dari

kemungkinan jawaban yang telah disediakan (Zainul dan Nasoetion, 1996).

Menurut Subino (1987:4) perbedaan yang khas bentuk soal objektif

dibanding dengan soal esai adalah tugas peserta tes (testee) dalam merespons

tes. Pada tes objektif, tugas testi adalah memanipulasikan data yang telah ada

dalam butir soal. Hal ini berbeda dengan soal esai dimana testi harus

menciptakan dan mencari sendiri unsur-unsur yang dibutuhkan untuk

menjawab soal.

Sebagaimana nama yang digunakannya, soal objektif adalah soal yang

tingkat kebenarannya objektif. Oleh karenanya, tes objektif adalah tes yang

dalam pemeriksaannya dapat dilakukan secara objektif (Arikunto, 1995:165).

Karena sifatnya yang objektif maka penskorannya dapat dilakukan dengan

bantuan mesin. Soal ini tidak memberi peluang untuk memberikan penilaian

yang bergradasi karena dia hanya mengenal benar dan salah. Apabila respons

siswa sesuai dengan jawaban yang dikehendaki maka respons tersebut benar

dan biasa diberi skor 1. Apabila kondisi yang terjadi sebaliknya, maka

respons siswa salah dan biasa diberi skor 0. Jawaban siswa bersifat mengarah

kepada satu jawaban yang benar (convergence).

Merujuk kepada berbagai pendapat tentang tes objektif dapat diambil

kesimpulan bahwa tes objektif adalah tes yang semua informasi yang

diperlukan peserta tes untuk memberikan respon telah disediakan oleh

penyusun tes, sehingga peserta tes tinggal memilihnya. Jawaban yang berupa

pilihan bersifat deterministik, sehingga hanya ada dua kemungkinan

kebenaran jawaban – benar atau salah.

Soal objektif sangat bervariasi bentuknya. Variasi yang bisa dibuat dari

soal objektif adalah benar-salah, pilihan ganda, menjodohkan, melengkapi dan

jawaban singkat. Berikut akan dijelaskan macam-macam tes evaluasi hasil

belajar

Analisis Tes Buatan Guru 3

Keunggulan tes objektif adalah:

1) Tes objektif dapat digunakan untuk mengukur berpikir rendah sampai

dengan sedang ( ingatan, pemahaman, dan penerapan)

2) Dengan menggunakan tes objektif maka semua atau sebagian besar materi

yang telah diajarkan dapat ditanyakan saat ujian

3) Dengan menggunakan tes objektif maka pemberian skor pada setiap siswa

dpat dilakukan dengan cepat, tepat dan konsisten karena jawaban yang

benar untuk setiap butir soal sudah jelas dan pasti

4) Dengan tes objektif khususnya pilihan ganda, akan memungkinkan untuk

dilakukan analisis butir soal

5) Tingkat kesukaran butir soal dapat dikendalikan

6) Informasi yang diperoleh dari tes objektif lebih kaya

Sementara kelemahan dari tes objektif adalah:

1) Walaupun tes objektif dapat digunakan untuk mengukur semua berpikir

sederhana (ingatan) sampai dengan jenjang berpikir tinggi (kreasi), tetapi

pada kenyataannya butir soal yang diujikan kepada siswa atau mahasiswa

kebanyakan hanya mengukur proses berpikir rendah

2) Membuat pertanyaan tes objektif yang baik lebih sukar daripada membuat

pertanyaan tes uraian

3) Kemampuan anak dapat terganggu oleh kemampuannya dalam membaca

dan menerka

4) Anak tidak dapat mengorganisasikan, menghubungkan, dan menyatakan

idenya sendiri karena semua alternatif jawaban untuk setiap pertanyaan

sudah diberikan oleh penulis soal.

Ada beberapa macam tes objektif, diantaranya:

a. Bentuk Tes Benar Salah (True-False Test)

Tes benar salah adalah bentuk tes yang mengajukan beberapa

pernyataan yang bernilai benar atau salah. Biasanya ada dua pilihan

jawaban yaitu huruf B yang berarti pernyataan tersebut benar dan S yang

berarti pernyataan tersebut salah. Tugas peserta tes adalah menentukan

Analisis Tes Buatan Guru 4

apakah pernyataan tersebut benar atau salah. Contoh salah satu tes bentuk

subjektif adalah :

B S : Ibukota Peru berjumlah lima buah.

B S : Manado adalah Ibukota propinsi Sulawesi Utara

Kelebihan Tes Benar Salah:

1) Dapat mencakup bahan yang luas dan tidak memakan tempat yang

banyak

2) Mudah dalam penyusunannya

3) Petunjuk mengerjakannya mudah dimengerti

4) Dapat digunakan berkali-kali

5) Objektif

6) Praktis

Kelemahan Tes Benar Salah:

1) Mudah ditebak

2) Banyak masalah yang tidak dapat dinyatakan hanya dengan

kemungkinan benar atau salah

3) Reliabilitasnya rendah.

4) Hanya dapat mengungkapkan daya ingat dan pengenalan kembali

Petunjuk Penyusunan:

1) Hindari kalimat negatif, yakni kalimat yang mengandung kata “tidak”

atau “bukan”.

2) Pernyataan harus disusun sedemikian rupa sehingga siswa yang

memiliki pengertian samar-samar dapat terkecoh dalam

menjawabnya.

3) Dalam menyusun keseluruhan tes, diharapkan item yang mengandung

“salah sedikit” cukup banyak.

b. Bentuk Pilihan Ganda (Multiple Choice Test)

Tes pilihan ganda merupakan tes yang menggunakan pengertian/

pernyataan yang belum lengkap dan untuk melengkapinya maka kita harus

memilih satu dari beberapa kemungkinan jawaban benar yang telah

disiapkan.

Analisis Tes Buatan Guru 5

Apabila dilihat konstruksinya maka tes pilihan ganda terdiri dari

dua hal pokok yaitu stem atau pokok soal dengan 4 atau 5 alternatif

jawaban. Satu di antara alternatif jawaban tersebut adalah kunci jawaban.

Alternatif jawaban selain kunci disebut dengan pengecoh (distractor).

Semakin banyak alternatif jawaban yang ada (misalnya 5) maka

probabilitas menebaknya akan semakin kecil. Ada lima ragam tes pilihan

ganda yang sering digunakan yaitu:

1) Pilihan ganda biasa (melengkapi pilihan)

Bentuk ini merupakan suatu kalimat pernyataan yang belum

lengkap dan diikuti empat atau lima kemungkinan jawaban yang tepat

dan melengkapi pernyataan tersebut.

2) Hubungan antar hal (Sebab akibat)

Bentuk tes ini terdiri dari dua kalimat : satu kalimat pernyataan dan

satu kalimat alasan. Ditanyakan apakah pernyataan memiliki hubungan

sebab akibat atau tidak dengan alasan.

3) Analisa Kasus

Bentuk tes analisa kasus ini menghadapkan peserta pada satu

masalah.

4) Membaca Diagram, atau tabel

Bentuk soal ini mirip dengan bentuk pilihan ganda biasa, hanya

saja disertai dengan tabel.

5) Asosiasi pilihan ganda

Bentuk soal ini sama dengan bentuk soal melengkapi pilihan, yakni

suatu pernyataan yang tidak lengkap yang diikuti dengan beberapa

kemungkinan, hanya perbedaan pada bentuk asosiasi pilihan ganda

kemungkinan jawaban bisa lebih dari satu, sedangkan melengkapi

pilihan hanya satu yang paling tepat.

Saran Pembuatan Soal Pilihan Ganda:

1) Pernyataan dan pilihan merupakan suatu rangkaian kalimat

2) Hindari pilihan yang tidak ada kaitannya satu sama lain

3) Buat pilihan yang mirip dengan jawaban kunci

Analisis Tes Buatan Guru 6

4) Letak kunci jawaban sebaiknya tidak selalu berada pada tempat (poin)

yang sama

5) Hindari kaitan antara satu soal dengan soal lainnya

Dalam evaluasi hasil belajar, tes pilihan ganda mempunyai beberapa

kelebihan yang secara ringkas :

1) Jumlah materi yang dapat ditanyakan relatif tak terbatas dibandingkan

dengan materi yang dapat dicakup soal bentuk lainnya. Jumlah soal

yang ditanyakan umumnya relatif banyak.

2) Dapat mengukur berbagai jenjang kognitif mulai dari ingatan sampai

evaluasi.

3) Penskorannya mudah, cepat, objektif, dan dapat mencakup ruang

lingkup bahan dan materi yang luas dalam satu tes untuk suatu kelas

atau jenjang.

4. Sangat tepat untuk ujian yang peserta banyak sedangkan hasilnya

harus segera seperti ujian akhir nasional maupun ujian sekolah.

4) Reliabilitas soal pilihan ganda relatif lebih tinggi dibandingkan

dengan soal uraian.

Segi-segi kelemahan tes objektif khususnya tes objektif bentuk pilihan

ganda antara lain adalah:

1) Kurang dapat digunakan untuk kemampuan verbal.

2) Peserta didik tidak mempunyai keleluasaan dalam

menulis,mengorganisasikan, dan mengekspresikan gagasan yang

mereka miliki yang dituangkan dalam kata atau kalimatnya sendiri.

3) Tidak dapat digunakan untuk mengukur kemampuan problem solving.

4) Penyusunan soal yang baik memerlukan waktu yang relatif lama

dibandingkan dengan bentuk soal lainnya.

5) Sangat sukar menentukan alternatif jawaban yang benar-benar

homogen, logis dan berfungsi.

c. Menjodohkan (Matching Test)

Menjodohkan terdiri atas satu sisi pertanyaan dan satu sisi

jawaban, setiap pertanyaan mempunyai jawaban pada sisi sebelahnya.

Analisis Tes Buatan Guru 7

Siswa ditugaskan untuk memasangkan atau mencocokkan, sehingga setiap

pertanyaan mempunyai jawaban yang benar.

Kelebihan:

1) Dipergunakan untuk menilai bermacam-macam hal, misalnya: problem

dan penyelesaiannya, sebab akibat, istilah dan definisinya, dsb.

2) Relatif mudah disusun.

3) Jika disusun dengan baik, maka faktor menerka-nerka dapat

dihilangkan.

4) Dapat dinilai dengan mudah, cepat dan objektif.

Kelemahan:

1) Sukar menyusun test jenis ini yang benar-benar baik.

2) Untuk menilai ingatan saja.

3) Pengarahan jawaban sering terjadi

4) Memakan banyak waktu dan tenaga untuk menyusunnya.

Saran Penulisan:

1) Banyaknya jawaban di sebelah kanan lebih dari jawaban di sebelah kiri

2) Lebihnya jawaban hendaknya menunjukkan jawaban yang salah

3) Materinya setiap sisi baiknya mengenai satu pokok bahasan saja

4) Pisahkan menjadi dua kolom, kolom pertama memuat jawaban, nomor

soal dan pertanyaan. Sedangkan kolom kedua memuat kode dan pilihan

jawaban.

d. Tes Isian (Complementary Test)

Tes isian terdiri dari kalimat yang dihilangkan (diberi titik-titik).

Bagian yang dihilangkan ini yang diisi oleh peserta tes merupakan

pengertian yang diminta agar pernyataan yang dibuat menjadi pernyataan

yang benar.

Contoh:

1) Yang merupakan nama asli dari Sultan Hamengkubuwono X adalah

…..

2) Para filsuf zaman modern menegaskan bahwa pengetahuan tidak

berasal dari kitab suci atau ajaran agama, tidak juga dari para

Analisis Tes Buatan Guru 8

penguasa, tetapi dari diri manusia sendiri. Namun tentang aspek

mana yang berperan ada beda pendapat. Aliran ………………..

beranggapan bahwa sumber pengetahuan adalah rasio: kebenaran

pasti berasal dari rasio (akal). Aliran ……………, sebaliknya,

meyakini pengalamanlah sumber pengetahuan itu, baik yang batin,

maupun yang inderawi

2. Tes Subjektif

Tes subjektif (essay) adalah suatu bentuk tes yang terdiri dari

pertanyaan atau suruhan yang menghendaki jawaban yang berupa uraian-

uraian yang relatif panjang Nurkancana dan Sumartana (1986: 42). Tes

dirancang untuk mengukur hasil belajar di mana unsur-unsur yang diperlukan

untuk menjawab soal dicari, diciptakan dan disusun sendiri oleh pengambil

tes. Peserta tes harus menyusun sendiri kata-kata dan kalimat-kalimat dalam

merumuskan jawabannya. Butir soal mengandung pertanyaan atau tugas yang

jawaban atau pengerjaan soal tersebut harus dilakukan dengan cara

mengekspresikan pikiran peserta tes (Zainul dan Nasoetion, 1996 : 33).

Soal subjektif (essay) berbeda dengan soal objektif dalam

kebenarannya yang bertingkat. Jawaban tidak dinilai mulai dari 100% benar

dan 100% salah. Kebenaran bertingkat tergantung tingkat kesesuaian jawaban

siswa dengan jawaban yang dikehendaki yang dituangkan dalam kunci.

Jawaban mungkin mengarah kepada jawaban yang tidak tunggal

(divergence). Kebenaran yang dicapai bisa 0%, 20%, 30%, 50%, 70%, atau

100% tergantung ketepatan jawabannya.

Mengenai tes esai, berdasarkan berbagai pendapat dapat disimpulkan

sebagai tes yang semua unsur yang diperlukan oleh peserta tes untuk

menjawabnya harus diciptakan, dicari dan disusun sendiri. Jawaban yang

berupa subjektif menyebabkan tingkat kebenarannya berderajad, sesuai

dengan tingkat kesesuaian jawaban dengan kunci jawabannya. Secara garis

besar tes subjektif dapat dikelompokkan menjadi dua yaitu:

a. Tes subjektif terbuka (Extended respons question)

Analisis Tes Buatan Guru 9

Tes subjektif terbuka tepat digunakan untuk mengukur kemampuan

siswa dalam: menghasilkan, mengorganisasi, mengekspresikan ide;

mengintegrasikan pelajaran dalam berbagai bidang; membuat desain

eksperimen; mengevaluasi manfaat suatu ide; dan sebagainya. Pada test

subjektif bentuk terbuka, jawaban yang dikehendaki muncul dari test

sepenuhnya diserahkan kepada teste itu sendiri. Artinya, teste mempunyai

kebebasan yang seluas-luasnya dalam merumuskan,mengorganisasikan dan

menyajikan jawabannya dalam bentuk subjektif.

Contoh : “Allah telah melimpahkan nikmatnya kepada kita yang amat

banyak, sehingga kita tak mampu untuk menghitungnya. Oleh karena itu

sudah sepatuhnya kita mensyukuri nikmat tersebut kepada Allah SWT”.

Jelaskan, bagaimana caranya kita mensyukuri nikmat Allsah itu sesuai

dengan ajaran Rasulullah!

b. Tes subjektif terbatas (Restricted respons question).

Tes subjektif terbatas tepat digunakan untuk mengukur kemampuan

siswa dalam: menjelaskan hubungan sebab akibat, menerapkan suatu prinsip

atau teori, memberikan alasan yang relevan, merumuskan hipotesis, membuat

kesimpulan yang tepat, menjelaskan suatu prosedur, dan sebagainya.

Contoh: Coba jelaskan tentang peringat Hari Ulang Tahun

Kemerdekaan RI yang diadakan di Kantor Kabupaten tanggal 17 Agustus

1998 yang lalu, ceritakan mengenai :

1) Pengaturan tempat

2) Pejabat dan undangan yang hadir

3) Acara peringatan

4) Atraksi yang disuguhkan

5) Hidangan yang diberikan

c. Kelebihan dan kelemahan Tes Subjektif

Kelebihan:

1) Kekuatan soal untuk mengukur hasil belajar yang kompleks dan

melibatkan level kognitif yang tinggi.

Analisis Tes Buatan Guru 10

2) Memberi kesempatan pada anak untuk menyusun jawaban sesuai

dengan jalan pikirannya sendiri.

3) Tepat digunakan untuk melatih siswa dalam mengemukakan dan

mengorganisasi gagasan atau ide, serta lebih cepat dan mudah

membuatnya.

Kelemahan

1) Terdapat subjektivitas dalam penilaiannya karena penilai yang berbeda

atau situasi yang berbeda.

2) Tes esai menghendaki jawaban yang panjang, sehingga tidak

memungkinkan ditulis butir tes dalam jumlah banyak (soal menjadi

tidak representatif).

3) Penggunaan soal esai membutuhkan waktu koreksi yang lama dalam

menentukan nilai.

C. Soal Tes yang Memehuni Syarat

Sebuah tes dikatakan baik apabila memenuhi beberapa syarat, secara

garis besar syarat tes yang baik ada dua yaitu:

a. Hanya mengukur satu dimensi ( Unidemensionalty). Suatu tes yang

mengukur suatu bidang studi tertentu, setiap butir soal pada perangkat tes

hanya mengukur satu bidang saja. Dengan dipenuhinya persyaratan ini,

maka tes disebut valid

b. Kehandalan ( reliabilitas). Kehandalan tes meliputi kecermatan (precion)

dan keajegan (consistency) dari hasil pengukuran.

Selain syarat valid dan reliabel masih ada beberapa syarat lagi yang

perlu juga diperhatikan dalam penyusunan soal, diantaranya daya pembeda,

keseimbangan tes, efisiensi atau daya guna, obyektivitas tes, kekhususan tes,

tingkat kesulitan tes, tingkat kepercayaan tes, keadilan tes dan alokasi waktu

tes.

Langkah-langkah penyusunan tes hasil belajar:

a. Penentuan tujuan tes

b. Penyusunan kisi-kisi tes

c. Penulisan soal

Analisis Tes Buatan Guru 11

d. Penelaahan soal

e. Uji coba soal

f. Perakitas soal menjasi perangkat tes

g. Penyajian tes

h. Scoring

i. Pelaporan hasil tes

j. Pemanfaatan hasil tes

Sementara tekini penyusunan Tes Hasil Belajar adalah:

a. Kisi-kisi adalah suatu format yang dapat berupa matriks yang memuat

informasi untuk dijadikan pedoman dalam menulis soal dan merakit soal

menjadi tes. kisi-kisi disusun berdasarkan tujuan penggunaan tes. Dalam

kisi-kisi tes berisikan indicator

b. Fungsi kisi-kisi tes adalah sebagai pedoman dalam penulisan soal dan

perakitan tes. Jika kisi-kisi soal dapat dibuat dengan baik, maka penulis

soal yang berbeda akan membuat soal yang relative sama baik dam

tingkat kedalaman atau cakupan materi yang dinyatakan

Syarat-syarat kisi-kisi yang baik adalah:

a. Mewakili isi kurikulum ayng akan diujikan

b. Komponen-komponen disusun secara rinci, jelas dan mudah dipahami

c. Soal-soal dibuat sesuai dengan indicator dan bentu soal yang ditetapkan

Setelah ditentukan kisi-kisi soal, pemiliha materi yang diujikan juga

sangat menentukan tes yang baik, kriteria pemilihan materi yang diujikan

antara lain:

a. Urgensi; materi atau kompetensi yang secara teoritis, mutlak harus

dikuasai siswa ( kompetensi minimal)

b. Kuntinuitas: kompetensi yang dipilih merupakan lanjutan yang

merupakan pendalaman dari satu atau lebih kompetensi yang sudah

dikuasai sebelumnya, baik dalam jenjang yang sama antar jenjang

c. Relevansi: kompetensi/ sub kompetensi yang terpilih merupakan

kompetensi dasar yang digunakan untuk memahami materi lain

Analisis Tes Buatan Guru 12

d. Keterpakaian: kompetensi/ sub kompetensi yang terpilih memiliki nilai

terapan tinggi dalam kehidupan sehari-hari.

Setelah tes hasil belajar (THB) di tulis sesuai dengan kaidah penulisan

butir THB yang baik dan kisi-kisi yang di rencanakan, maka THB tersebut  secara

teoritik sudah baik. THB yang baik harus teruji dalam dua tahap pengujian, yaitu

secara teoritik dan empiric. Untuk menguji apakah THB baik secara empirik maka

harus di lakukan uji coba untuk membakukan THB sebagai THB yang baik.

Analisis di lakukan atas data hasil uji coba baik dalam butir maupun

perangkatnya.

THB merupakan instrumen atau alat ukur yang di gunakan untuk

mengumpulka data hasil delajar dengan cara mengukur atau mengujikan nya.

Sebagai sebuah alat ukur maka THB harus memenuhi parsyaratan yang di tuntut

untuk di miliki oleh sebuah alat ukur yang baik sebagaimana alat ukur yang di

gunakan untuk mengumpulkan data dalam ilmu alam .Alat ukur pengumpulan

data harus memenuhi dua syarat yaitu validitas dan reliabilitas.

  Dalam pengujian validits dan reliabilitas, THB di uji kualitas nya sebagai

sebuah perangkat secara keseluruhan .pengujian kualitas perangkat dilakukan

setelah dilakukan pengujian atas kualitas butir-butirnya. Setelah dilakukan

pemilihan butir-butir THB yang baik dan membuang butir-butir yang jelek, butir-

butir yang baik di tata sebagai sebuah perangkat. Perangkat inilah yang kemudian

di uji dalam validitas dan reliabilitas .Oleh karena itu ,sebelum pengujian kualitas

perangkat di lakukan ,terlebih dulu di periksa mutu butir-butir nya dengan

melakukam analisis butir.

D. Analisis Butir Soal Tes Hasil Belajar

Analisis butir dapat di lakukan dengan salah satu dari dua cara tergantung

teori tes yang di gunakan .Teori tes itu dapat berupa teori tes klasik atau

modern .Dewasa ini karenaketerbatasan yang di miliki oleh teori tes klasik maka

di kembang kan teori tes modern .Namun begitu ,teori tes klasik masih lebih

sering di gunakan karena penggunaannya yang lebih mudah ,di saamping teori tes

Analisis Tes Buatan Guru 13

modern masih dalam proses pengembangan .Oleh karena itu ,pada bagian ini akan

di bahas analisis butir tes menggunakanteori tes klasik.

1. Analisis Kuantitatif

Analisis kuantitatif maksudnya adalah penelaahan butir soal didasarkan

pada data empirik dari butir soal yang bersangkutan. Data empirik ini diperoleh

dari soal yang telah diujikan. Analisis kuantitatif mencakup validitas butir soal,

indeks kesukaran , daya pembeda, reliabilitas tes dan daya pengecoh.

a. Analisis Kuantitatif Soal Pilihan Ganda

Analisis kuantitatif untuk soal pilihan ganda dapat dilakukan secara

manual dan menggunakan program Anates. Rumus yang digunakan, untuk

menentukan validitas butir soal, indeks kesukaran, daya pembeda, reliabilitas tes

dan daya pengecoh dapat dilihat pada penjelasan berikut ini.

1) Validitas Tes

Validitas berkenaan dengan ketetapan alat penilaian terhadap konsep

yang dinilai sehingga betul-betul menilai apa yang yang seharusnya dinilai.

Sebagai contoh menilai kemampuan siswa dalam matematika. Misalnya

diberikan soal dengan kalimat yang panjang dan berbelit-belit sehingga sukar

ditangkap maknanya. Akhirnya siswa tidak dapat menjawab karena tidak

memahami pertanyaannya. Contoh lain adalah menilai kemampuan berbicara,

tetapi ditanyakan mengenai tata bahasa atau kesusastraan seperti puisi atau

sajak. Penilaian tersebut tidak tepat (valid). Validitas tidak berlaku universal

sebab bergantung pada situasi dan tujuan penilaian. Alat penilaian yang telah

valid untuk suatu tujuan tertentu belum otomatis akan valid untuk tujuan yang

lain.

Contoh prestasi belajar dan motivasi belajar dapat dinilai oleh tes

ataupun oleh kuesioner. Caranya juga bisa berbeda, bisa dilaksanakan secara

tertulis atau bisa secara lisan. Ketentuan penting dalam evaluasi adalah bahwa

hasilnya harus sesuai dengan keadaan yang dievaluasi. Mengevaluasi dapat

diumpamakan sebagai pekerjaan memotret. Gambar potret atau foto

dikatakan baik apabila sesuai dengan aslinya. Gambar pemotretan hasil

Analisis Tes Buatan Guru 14

evaluasi tersebut di dalam kegiatan evaluasi dikenal dengan data evaluasi.

Data evaluasi yang baik sesuai dengan kenyataan disebut data valid. Agar

dapat dieroleh data yang valid, instrumen atau alat untuk mengevaluasinya

harus valid. Jika pernyataan tersebut dibalik, instrumen evaluasi dituntut

untuk valid karena diinginkan dapat diperoleh data yang valid. Dengan kata

lain, instrumen evaluasi dipersyaratkan valid agar hasil yang diperoleh dari

kegiatan evaluasi valid.

Di dalam buku Encyclopedia of Educational Evaliation yang ditulis

oleh Scarvia B. Anderson dan kawan-kawan disebutkan: A test is valid if it

measures what it purpose to measure. Atau jika diartikan lebih kurang

demikian: sebuah tes dikatakan valid apabila tes tersebut mengukur apa yang

hendak diukur. Dalam bahasa Indonesia “valid” disebut dengan istilah

“sahih”.

Sebenarnya pembicaraan validitas ini bukan ditekankan pada tes itu

sendiri tetapi pada hasil pengetesan atau skornya. Contoh: Skor yang

diperoleh dari hasil mengukur kemampuan mekanik akan menunjukkan

kemampuan seseorang dalam memegang dan memperbaiki mobil, bukan

pengetahuan orang tersebut dalam hal yang berkaitan dengan mobil. Tes yang

mengukur pengetahuan tentang mobil bukanlah tes yang sahih untuk

mekanik.

Validitas sebuah tes dapat diketahui dari hasil pemikiran dan dari hasil

pengalaman. Hal yang pertama akan diperoleh validitas logis (logical

validity) dan hal yang kedua diperoleh validitas empiris (empirical validity).

Dua hal inilah yang dijadikan dasar pengelompokan validitas tes. Secara garis

besar ada dua macam validitas, yaitu validitas logis dan validitas empiris.

a) Validitas Logis

Istilah “validitas logis” mengandung kata “logis” berasal dari kata

“logika” atau validitas logis sering juga disebut sebagai analisis kualitatif

yaitu berupa penalaran atau penelaahan. Dengan makna demikian maka

validitas logis untuk sebuah instrumen yang memenuhi persyaratan valid

berdasarkan hasil penalaran. Kondisi valid tersebut dipandang terpenuhi

Analisis Tes Buatan Guru 15

karena instrumen yang bersangkutan sudah dirancang secara baik,

mengikuti teori dan ketentuan yang ada. Sebagaimana pelaksanaan tugas

lain misalnya membuat sebuah karangan, jika penulisan sudah mengikuti

aturan mengarang, tentu secara logis karangannya sudah baik.

Berdasarkan penjelasan tersebut maka instrumen yang sudah disusun

berdasarkan teori penyusunan instrumen, secara logis sudah valid. Dari

penjelasan tersebut dapat dipahami bahwa validitas logis dapat dicapai

apabila instrumen disusun mengikuti ketentuan yang ada. Dengan

demikian, dapat disimpulkan bahwa validitas logis tidak perlu diuji

kondisinya tetapi langsung diperoleh sesudah instrumen tersebut selesai

disusun.

Ada dua macam validitas logis yang dapat dicapai oleh sebuah

instrumen, yaitu validitas isi dan validitas konstrak (construct validity).

Validitas isi bagi sebuah instrumen menunjuk suatu kondisi sebuah

instrumen yang disusun berdasarkan isi materi pelajaran yang dievaluasi.

Selanjutnya validitas konstrak sebuah instrumen menunjuk suatu kondisi

sebuah instrumen yang disusun berdasarkan konstrak aspek-aspek

kejiwaan yang seharusnya dievaluasi.

Untuk menganalisis soal ditinjau dari segi teknis, isi, dan

editorial. Analisis secara teknis dimaksudkan sebagai penelaahan soal

berdasarkan prinsip-prinsip pengukuran dan format penulisan soal.

Analisis secara isi dimaksudkan sebagai penelaahan khusus yang

berkaitan dengan kelayakan pengetahuan yang ditanyakan. Analisis

secara editorial dimaksudkan sebagai penelaahan yang khususnya

berkaitan dengan keseluruhan format dan keajegan editorial dari soal

yang satu ke soal yang lainnya.

Analisis kualitatif lainnya dapat juga dikategorikan dari segi

materi, konstruksi, dan bahasa. Analisis materi dimaksudkan sebagai

penelaahan yang berkaitan dengan substansi keilmuan yang ditanyakan

dalam soal serta tingkat kemampuan yang sesuai dengan soal. Analisis

konstruksi dimaksudkan sebagai penelaahan yang umumnya berkaitan

Analisis Tes Buatan Guru 16

dengan teknik penulisan soal. Analisis bahasa dimaksudkan sebagai

penelaahan soal yang berkaitan dengan penggunaan bahasa Indonesia

yang baik dan benar menurut EYD. Melalui analisis kualitatif dapat

diketahui berfungsi tidaknya sebuah soal.

b) Validitas Empiris

Istilah “validitas empiris” memuat kata “empiris” yang artinya

“pengalaman”. Sebuah instrumen dapat dikatakan memiliki validitas

empiris apabila sudah diuji dari pengalaman. Analisis soal secara

kuantitatif menekankan pada analisis karakteristik internal tes melalui

data yang diperoleh secara empiris. Karakteristik internal secara

kuantitatif dimaksudkan meliputi parameter soal tingkat kesukaran, daya

pembeda dan reliabilitas. Khusus soal-soal pilihan ganda, dua tambahan

parameter yaitu dilihat dari peluang untuk menebak atau menjawab soal

benar dan berfungsi tidaknya pilihan jawaban, yaitu penyebaran semua

alternative jawaban dari subyek-subyek yang dites. Salah satu tujuan

dilakukannya analisis adalah untuk meningkatkan kualitas soal, yaitu

apakah suatu soal dapat diterima karena telah didukung oleh data statistik

yang memadai, diperbaiki karena terbukti terdapat beberapa kelemahan

atau bahkan tidak digunakan sama sekali karena terbukti secara empiris

tidak berfungsi sama sekali.

Sebagai contoh sehari-hari, sesorang dapat diakui jujur oleh

masyarakat apabila dalam pengalaman dibuktikan bahwa orang tersebut

memang jujur. Contoh lain, seseorang dapat dikatakan kreatif apabila

dari pengalaman dibuktikan bahwa orang tersebut sudah banyak

menghasilkan ide-ide baru yang diakui berbeda dari hal-hal yang sudah

ada. Dari penjelasan dan contoh-contoh tersebut diketahui bahwa

validitas empiris tidak dapat diperoleh hanya dengan menyusun

instrumen berdasarkan ketentuan seperti halnya validitas logis, tetapi

harus dibuktikan melalui pengalaman.

Ada dua macam validitas empiris, yakni ada dua cara yang dapat

dilakukan untuk menguji bahwa sebuah instrumen memang valid.

Analisis Tes Buatan Guru 17

Pengujian tersebut dilakukan dengan membandingkan kondisi instrumen

yang bersangkutan dengan kriterium atau sebuah ukuran. Kriterium yang

digunakan sebagai pembanding kondisi instrumen dimaksud ada dua cara,

yaitu yang sudah tersedia dan yang belum ada tetapi akan terjadi di waktu

yang akan datang. Bagi instrumen yang kondisinya sesuai dengan

kriterium yang sudah ada tersedia, yang sudah ada disebut memiliki

validitas “ada sekarang”, yang ada dalam istilah bahasa inggris disebut

memiliki concurrent validity. Selanjutnya instrumen yang kondisinya

sesuai dengan kriterium yang diramalkan akan terjadi, disebut memiliki

validitas ramalan atau validitas prediksi, yang dalam istilah bahasa inggris

disebut memiliki predictive validity.

Ada empat jenis validitas yang sering digunakan, yakni:

a) Validitas isi (content validity)

Sebuah tes dikatakan memilki validitas isi apabila mengukur tujuan

khusus tertentu yang sejajar dengan materi atau isis pelajaran yang

diberikan. Oleh karena materi yang diajarkan tertera dalam kurikulum

maka validitas isi ini sering juga disebut validitas kurikuler.

Validitas isi berkenaan dengan kesanggupan alat penilaian data

mengukur isi yang seharusnya. Artinya, tes tersebut mampu

mengungkapkan isi suatu konsep atau variabel yang hendak diukur.

Misalnya tes hasil belajar bidang studi IPS harus bisa mengungkapkan isi

bidang studi tersebut. Hal ini bisa dilakukan dengan cara menyusun tes

yang bersumber dari kurikulum bidang studi yang hendak diukur.

Disamping kurikulum dapat juga diperkaya dengan melihat atau mengkaji

buku sumber.

Tes hasil belajar tidak mungkin dapat mengungkapkan semua

materi yang ada dalam bidang studi tertentu sekalipun hanya untuk satu

semester. Oleh sebab itu, harus diambil sebagian dari materi dalam bentuk

sampel tes. Sampel harus dapat mencerminkan materi yang terkandung

dalam sseluruh materi bidang studi. Cara yang ditempuh dalam

menetapkan sampel tes adalah memilih konsep-konsep materi yang

Analisis Tes Buatan Guru 18

esensial. Misalnya menetapkan sejumlah konsep dari setiap pokok bahasan

yang ada. Dari setiap konsep dikembangkan beberapa pertanyaan tes.

Disinilah pentingnya peranan kisi-kisi sebagai alat untuk memenuhi

validitas isi. Dalam hal tertentu untuk tes yang telah disusun sesuai dengan

kurikulum (materi dan tujuannya) agar memenuhi validitas isi, dapat pula

dimintakan bantuan ahli bidang studi untuk menelaah apakah konsep

materi yang diajukan telah memadai atau tidak sebagai sampel tes. Dengan

demikian validitas isi tidak memerlukan uji coba dan analisis statistic atau

dinyatakan dalam bentuk angka-angka.

b)      Validitas konstruksi (construct validity)

Sebuah tes dikatakan memiliki validitas konstruksi apabila butir-

butir soal yang membangun tes tersebut mengukur setiap aspek berfikir

seperti yang disebutkan dalam tujuan instruksional khusus. Dengan kata

lain jika butir-butir soal mengukur aspek berfikir tersebut sudah sesuai

dengan aspek berfikir yang menjadi tujuan instruksional.

Sebagai contoh jika rumusan Tujuan Instruksional Khusus (TIK).

“Siswa dapat membandingkan antara efek biologis dan efek psikologis”,

maka butir soal pada tes merupakan perintah agar siswa membedakan

anatar dua efek tersebut.

“Konstruksi” dalam pengertian ini bukanlah “susunan” seperti

yang sering dijumpai dalam teknik, tetapi merupakan rekaan psikologis

yaitu suatu rekaan yang dibuat oleh para ahli ilmu jiwa yang dengan suatu

cara tertentu “memerinci” isi jiwa atas beberapa aspek seperti ingatan

(pengetahuan), pemahaman, aplikasi dan seterusnya. Dalam hal ini,

mereka menganggap seolah-olah jiwa dapat dibagi-bagi. Tetapi

sebenarnya tidak demikian. Pembagian ini hanya merupakan tindakan

sementara untuk mempermudah mempelajari.

Seperti halnya validitas isi, validitas konstruksi dapat diketahui

dengan cara memerinci dan memasangkan setiap butir soal dengan setiap

aspek dalam TIK. Pengerjaannya dilakukan berdasarkan logika bukan

pengalaman.

Analisis Tes Buatan Guru 19

c)      Validitas “ada sekarang” (concurrent validity)

Validitas ini lebih umum dikenal dengan validitas empiris. Sebuah

tes dikatakan memiliki validitas empiris jika hasilnya sesuai dengan

pengalaman. Jika ada istilah “sesuai” tentu ada dua hal yang dipasangkan.

Dalam hal ini hasil tes dipasangkan dengan hasil pengalaman. Pengalaman

selalu mengenai hal yang telah lampau sehingga data pengalaman tersebut

sekarang sudah ada (ada sekarang, concurrent).

Dalam membandingkan hasil sebuah tes maka diperlukan suatu

kriterium atau alat banding. Maka hasil tes merupakan sesuatu yang

dibandingkan. Untuk jelasnya di bawah ini dikemukakan sebuah contoh.

Misalnya seorang guru ingin mengetahui apakah tes sumatif yang

disusun sudah valid atau belum. Untuk ini diperlukan sebuah kriterium

masa lalu yang sekarang datanya dimiliki. Misalnya nilai ulangan harian

atau nilai ulangan sumatif yang lalu.

d)     Validitas prediksi (predictive validity)

Memprediksi artinya meramal, dengan meramal selalu mengenai

hal yang akan datang jadi sekarang belum terjadi. Sebuah tes dikatakan

memiliki validitas prediksi atau validitas ramalan apabila mempunyai

kemampuan untuk meramalkan apa yang akan terjadi pada masa yang

akan datang.

Misalnya tes masuk Perguruan Tinggi adalah sebuah tes yang

diperkirakan mampu meramalkan keberhasilan peserta tes dalam

mengikuti kuliah di masa yang akan datang. Calon yang tersaring

berdasarkan hasil tes diharapkan mencerminkan tinggi-rendahnya

kemampuan mengikuti kuliah. Jika nilai tesnya tinggi tentu menjamin

keberhasilannya kelak. Sebaliknya seorang calon dikatakan tidak lulus tes

karena memiliki nilai tes yang rendah jadi diperkirakan akan tidak mampu

menikuti perkuliahan yang akan datang.

Sebagai alat pembanding validitas prediksi adalah nilai-nilai yang

diperoleh setelah peserta tes mengikuti pelajaran di Perguruan Tinggi. Jika

ternyata siapa yang memiliki nilai tes lebih tinggi gagal dalam ujian

Analisis Tes Buatan Guru 20

semester 1 dibandingkan dengan yang dahulu nilai tesnya lebih rendah

maka tes masuk yang dimaksud tidak memiliki validitas prediksi.

Sekali lagi diulangi bahwa sebuah tes dikatakan memiliki validitas jika

hasilnya sesuai dengan kriterium, dalam arti memiliki kesejajaran antara hasil tes

tersebut dengan kriterium. Teknik yang digunakan untuk mengetahui kesejajaran

adalah teknik korelasi product moment yang dikemukakan oleh Pearson.

rxy =

keterangan :

r : koefisien validitas

N : banyaknya siswa

X: Skor item

Y: Skor Total

Kriteria yang digunakan untuk menentukan validitas butir soal terdapat

pada Tabel berikut.

Tabel 2. Kriteria Validitas Tes

Nilai r Interpretasi

0,80 – 1,00 Sangat tinggi

0,60 – 0,80 Tinggi

0,40 – 0,60 Cukup

0,20 – 0,40 Rendah

0,00 – 0,20 Sangat rendah

2) Indeks Kesukaran

Tingkat kesukaran soal adalah peluang untuk menjawab benar suatu soal

pada tingkat kemampuan tertentu yang biasanya dinyatakan dalam bentuk indeks.

Indeks tingkat kesukaran ini pada umumnya dinyatakan dalam bentuk proporsi

yang besarnya berkisar 0,00 - 1,00 (Aiken (1994: 66). Semakin besar indeks

tingkat kesukaran yang diperoleh dari hasil hitungan, berarti semakin mudah soal

itu. Suatu soal memiliki TK= 0,00 artinya bahwa tidak ada siswa yang menjawab

Analisis Tes Buatan Guru 21

benar dan bila memiliki TK= 1,00 artinya bahwa siswa menjawab benar.

Perhitungan indeks tingkat kesukaran ini dilakukan untuk setiap nomor soal. Pada

prinsipnya, skor rata-rata yang diperoleh peserta didik pada butir soal yang

bersangkutan dinamakan tingkat kesukaran butir soal itu. Rumus ini dipergunakan

untuk soal obyektif. Rumusnya adalah seperti berikut ini (Nitko, 1996: 310).

Fungsi tingkat kesukaran butir soal biasanya dikaitkan dengan tujuan tes.

Misalnya untuk keperluan ujian semester digunakan butir soal yang memiliki

tingkat kesukaran sedang, untuk keperluan seleksi digunakan butir soal yang

memiliki tingkat kesukaran tinggi/sukar, dan untuk keperluan diagnostik biasanya

digunakan butir soal yang memiliki tingkat kesukaran rendah atau mudah.

3) Daya Pembeda

Daya pembeda soal adalah kemampuan suatu butir soal dapat

membedakan antara siswa yang telah menguasai materi yang ditanyakan dan

siswa yang tidak atau kurang atau belum menguasai materi yang ditanyakan.

Manfaat daya pembeda butir soal adalah seperti berikut ini. 1) Untuk

meningkatkan mutu setiap butir soal melalui data empiriknya. Berdasarkan indeks

daya pembeda, setiap butir soal dapat diketahui apakah butir soal itu baik, direvisi,

atau ditolak. 2) Untuk mengetahui seberapa jauh setiap butir soal dapat

mendeteksi/membedakan kemampuan siswa, yaitu siswa yang telah memahami

atau belum memahami materi yang diajarkan guru. Apabila suatu butir soal tidak

dapat membedakan kedua kemampuan siswa itu, maka butir soal itu dapat

dicurigai "kemungkinannya" seperti berikut ini.

a) Kunci jawaban butir soal itu tidak tepat.

b) Butir soal itu memiliki 2 atau lebih kunci jawaban yang benar

c) Kompetensi yang diukur tidak jelas

d) Pengecoh tidak berfungsi

Analisis Tes Buatan Guru 22

e) Materi yang ditanyakan terlalu sulit, schingga banyak siswa yang

menebak

f) Sebagian besar siswa yang memahami materi yang ditanyakan berpikir

ada yang salah informasi dalam butir soalnya

Indeks daya pembeda setiap butir soal biasanya juga dinyatakan dalam

bentuk proporsi. Semakin tinggi indeks daya pembeda soal berarti semakin

mampu soal yang bersangkutan membedakan siswa yang telah memahami materi

dengan peserta didik yang belum memahami materi. Indeks daya pembeda

berkisar antara -1,00 sampai dengan +1,00. Semakin tinggi daya pembeda suatu

soal, maka semakin kuat/baik soal itu. Jika daya pembeda negatif (<0) berarti

lebih banyak kelompok bawah (warga belajar/peserta didik yang tidak memahami

materi) menjawab benar soal dibanding dengan kelompok atas (warga

belajar/peserta didik yang memahami materi yang diajarkan guru).

Untuk mengetahui daya pembeda soal bentuk pilihan ganda adalah dengan

menggunakan rumus berikut ini.

Keterangan:

DP = Daya pembeda

BA = jumlah jawaban benar pada kelompok atas

BB = jumlah jawaban benar pada kelompok bawah

N = Banyak siswa

4) Reliabilitas

Sudah diterangkan dalam persyaratan tes, bahwa reliabilitas berhubungan

dengan masalah kepercayaan. Suatu tes dapat dikatakan mempunyai taraf

kepercayaan yang tinggi jika tes tersebut dapat memberikan hasil yang tetap.

Maka pengertian reliabilitas tes, berhubungan dengan masalah ketetapan hasil tes.

Atau seandainya hasilnya berubah-ubah, perubahan yang terjadi dapat dikatakan

tidak berarti.

Analisis Tes Buatan Guru 23

Konsep tentang reliabilitas ini tidak akan sulit dimengerti apabila pembaca

telah memahami konsep validitas. Tuntutan bahwa instrumen evaluasi harus valid

menyangkut harapan diperolehnya data yang valid, sesuai dengan kenyataan.

Dalam hal reliabilitas ini tuntutannya tidak jauh berbeda. Jika validitas terkait

dengan ketepatan objek yang tidak lain adalah tidak menyimpangnya data dari

kenyataan, artinya bahwa data tersebut benar, maka konsep reliabilitas terkait

dengan pemotretan berkali-kali. Instrumen yang baik adalah instrumen yang dapat

dengan ajeg memberikan data yang sesuai dengan kenyataan.

Yang sering ditangkap kurang tepat bagi pembaca adalah adanya pendaat

bahwa “ajeg” atau “tetap” diartikan sebagai “sama”. Dalam pembicaraan evaluasi

ini tidak demikian. Ajeg atau tetap tidak selalu harus sama, tetapi mengikuti

perubahan secara ajeg. Jika keadaan si A mula-mula berada lebih rendah

dibandingkan dengan B, maka jika diadakan pengukuran ulang, si A juga berada

lebih rendah dari B. Itulah yang dikatakan ajeg atau tetap, yaitu sama dalam

kedudukan siswa di antara anggota kelompok yang lain. Tentu saja tidak dituntut

semuanya tetap. Besarnya ketetapan itulah menunjukkan tingginya reliabilitas

instrumen.

Sehubungan dengan reliabilitas ini, Scarvia B. Anderson dan kawan-

kawan menyatakan bahwa persyaratan bagi tes, yaitu validitas dan reliabilitas ini

penting. Dalam hal ini validitas lebih penting, dan reliabilitas ini perlu, karena

menyokong terbentuknya validitas. Sebuah tes mungkin reliable tetapi tidak valid.

Sebalinya, sebuah tes yang valid biasanya reliable.

A reliable measure in one that provides consistent and stable indication of

the characteristic being investigated. Untuk dapat memperoleh gambaran yang

ajeg memang sulit karena unsur kejiwaan manusia itu sendiri tidak ajeg. Misalnya

kemampuan, kecakapan, sikap dan sebagainya berubah-ubah dari waktu ke waktu.

Beberapa hal yang sedikit banyak mempengaruhi hasil tes banyak sekali.

Namun secara garis besar dapat dikelompokkan menjadi 3 hal:

a) Hal yang berhubungan dengan tes itu sendiri, yaitu panjang tes dan kualitas

butir-butir soalnya. Tes yang terdiri dari banyak butir, tentu saja lebih valid

dibandingkan dengan tes yang hanya terdiri dari beberapa butir soal. Tinggi

Analisis Tes Buatan Guru 24

rendahnya validitas menunjukkan tinggi rendahnya reliabilitas tes. Dengan

demikian maka semakin panjang tes, maka reliabilitasnya semakin tinggi.

Dalam menghitung besarnya reliabilitas berhubung dengan penambahan

banyaknya butir soal dalam tes ini ada sebuah rumus yang diberikan oleh

Spearman dan Brown sehingga terkenal dengan rumus Spearman – Brown.

b) Hal yang berhubungan dengan tercoba (testee).

Suatu tes yang dicobakan kepada kelompok yang terdiri dari banyak siswa

akan mencerminkan keragaman hasil yang menggambarkan besar-kecilnya

reliabilitas tes. Tes yang dicobakan kepada bukan kelompok terpilih, akan

menunjukkan reliabilitas yang lebih besar daripada yang dicobakan pada

kelompok tertentu yang diambil secara dipilih.

c) Hal yang berhubungan dengan penyelenggaraan tes

Sudah disebutkan bahwa faktor penyelenggaraan tes yang bersifat

administrative sangat menentukan hasil tes.

Sekali lagi reliabilitas adalah ketetapan suatu tes apabila diteskan kepada

subjek yang sama. Untuk mengetahui ketetapan ini pada dasarnya dilihat

kesejajaran hasil. Seperti halnya beberapa teknik juga menggunakan rumus

korelasi product moment untuk mengetahui validitas, kesejajaran hasil dalam

reliabilitas tes.

Kriterium yang digunakan untuk mengetahui ketetapan ada yang berada di

luar tes (consistency eternal) dan pada tes itu sendiri (consistency internal).

1)      Metode bentuk paralel (equivalent)

Tes paralel atau tes equivalent adalah dua buah tes yang mempunyai

kesamaan tujuan, tingkat kesukaran dan susunan, tetapi butir-butir soalnya

berbeda. Dalam istilah bahasa Inggris disebut alternative-form method (parallel

forms).

Dengan metode bentuk parallel ini, dua buah tes yang paralel misalnya tes

Matematika seri A yang akan dicari reliabilitasnya dan tes seri B diteskan kepada

sekelompok siswa yang sama, kemudian hasilnya dikorelasikan. Koefisien

korelasi dari kedua hasil tes inilah yang menunjukkan koefisien reliabilitasnya tes

Analisis Tes Buatan Guru 25

seri A. jika koefisiennya tinggi maka tes tersebut sudah reliable dan dapat

digunakan sebagai alat pengetes yang terandalkan.

Dalam menggunakan metode tes paralel ini pengetes harus menyiapkan

dua buah tes dan masing-masing dicobakan pada kelompok siswa yang sma. Oleh

karena itu, ada orang menyebutkan sebagai double test-double-trial method.

Penggunaan metode ini baik karena siswa dihadapkan kepada dua macam tes

sehingga tidak ada faktor “masih ingat soalnya” yang dlam evaluasi disebut

adanya practice-effect dan carry-over effect, artinya ada faktor yang dibawa oleh

pengikut tes karena sudah mengerjakan soal tersebut.

Kelemahan dari metode ini adalah bahwa pengetes pekerjaannya berat

karena harus menyusun dua seri tes. Lagi pula harus tersedia waktu yang lama

untuk mencobakan dua kali tes.

2)      Metode tes ulang (test-retest method)

Metode tes ulang dilakukan orang untuk menghindari penyusunan dua seri

tes. Dalam menggunakan teknik atau metode ini pengetes hanya memiliki satu

seri tetapi dicobakan dua kali. Oleh karena tesnya hanya satu dan dicobakan dua

kali, maka metode ini dapat disebut dengan single-test-double-trial method.

Kemudian hasil dari kedua kali tes tersebut dihitung korelasinya.

Untuk tes yang banyak mengungkap pengetahuan (ingatan) dan

pemahaman, cara ini kurang mengena karena tercoba akan masih ingat akan butir-

butir soalnya. Ooleh karena itu, tenggang waktu antara pemberian tes pertama

dengan kedua menjadi permasalahan tersendiri. Jika tenggang waktu terlalu

sempit, siswa masih banyak ingat materi. Sebaliknya kalau tenggang waktu terlalu

lama, maka faktor-faktor atau kondisi tes sudah akan berbeda dan siswa sendiri

barangkali sudah mempelajari sesuatu. Tentu saja faktor-faktor ini akan

berpengaruh pula terhadap reliabilitas.

Pada umumnya hasil tes yang kedua cenderung lebih baik daripada hasil

tes pertama. Hal ini tidak mengapa karena pengetes harus sadar akan adanya

practice effect dan carry over effect. Yang penting adalah adanya kesejahteraan

hasil atau ketetapan hasil yang ditunjukkan oleh koefisien korelasi yang tinggi.

Tes Pertama Tes Kedua

Analisis Tes Buatan Guru 26

Siswa Skor Ranking Skor Ranking

ABCDE

152091812

31524

2025152318

31524

Walaupun tampak skornya naik, akan tetapi kenaikannya dialami oleh

semua siswa. Metode ini juga disebut self-correlation method (korelasi diri

sendiri) karena mengkorelasikan hasil dari tes yang sama.

3)      Metode belah dua atau split-half method

Kelemahan penggunaan metode dua-tes dua kali percobaan dan satu-tes

dua kali percobaan diatasi dengan metode ketiga ini yaitu metode belah dua.

Dalam menggunakan metode ini pengetes hanya menggunakan sebuah tes dan

dicobakan satu kali. Oleh karena itu, disebut juga single-test-single-trial method.

Berbeda dengan metode pertama dan kedua yang setelah diketemukan

koefisien korelasi langsung ditafsirkan itulah koefisiensi reliabilita, maka dengan

ketiga metode ini tidak dapat demikian. Pada waktu membelah dua dan

mengkorelasikan dua belahan, baru diketahui reliabilitas separo tes. Untuk

mengetahui reliabilitas seluruh tes harus digunakan rumus Spearman-Brown

sebagai berikut:

Banyak pemakai metode ini salah membela hasil tes pada waktu,

menganalisis. Yang mereka lakukan adalah mengelompokkan hasil separo subjek

peserta tes dan separo yang lain kemudian hasil kedua kelompok ini

dikorelasikan. Yang benar adalah membelah item atau butir soal. Tidak akan

keliru kiranya bagi pemakai metode ini harus ingat bahwa banyaknya butir soal

harus genap agar dapat dibelah.

Ada dua cara membelah butir soal ini, yaitu:

a)Membelah atas item-item genap dan item-item ganjil yang selanjutnya disebut

belahan ganjil-genap, dan

b)Membelah atas item-item awal dan item-item akhir yaitu separo jumlah pada

nomor-nomor awal dan separo pada nomor-nomor akhir yang selanjutnya

disebut belahan awal-akhir.

Analisis Tes Buatan Guru 27

Untuk menentukan koefisien reliabelitas digunakan rumus alpha yang

dinyatakan oleh Arinkunto (2012:122).

Keterangan :

= reliabilitas yang dicari

= jumlah variansi skor tiap-tiap item

= variansi total

= jumlah butir soal

Dengan kriteria sebagai berikut :

0.80 < < 1.00 reliabilitas tinggi sekali

0.60 < < 0.80 reliabilitas tiggi

0.40 < < 0.60 reliabilitas sedang

0.20 < < 0.40 reliabilitas rendah

0.0 < 0.20 sangat rendah

5) Daya Pengecoh ( Distraktor )

Pengecoh adalah suatu pola yang menggambarkan bagaimana peserta tes

menentukan pilihan jawabannya terhadap kemungkinan-kemungkinan jawaban

yang telah dipasangkan pada setiap butir soal. Pengecoh bertujuan untuk

mengecoh mereka yang kurang mampu ( tidak tahu ) untuk dibedakan dengan

yang mampu (lebih tahu). Pengecoh berfungsi dengan baik jika sudah dipilih oleh

lebih dari 5% pengikut tes ( p > 5%) dan jika kurang atau sama dengan 5%

berarti pengecoh tidak berfungsi dengan baik.

Tujuan utama dari pemasangan pengecoh pada setiap butir soal adalah

agar dari sekian banyak siswa yangmengikuti tes hasil belajar ada yang tertarik

atau terangsang untuk memilihnya, sebab mereka menyangka bahwa pengecoh

yang mereka pilih merupakan jawaban yang betul. Dengan kata lain, pengecoh

baru dapat dikatakan telah dapat menjalankan fungsinya dengan baik apabila

Analisis Tes Buatan Guru 28

pengecoh tersebut telah memiliki daya rangsang yang tinggi sehingga siswa

merasa bimbang dan ragu sehingga akhirnya mereka terkecoh untuk memilih

pengecoh untuk memilih jawaban yang betul, sebab mereka mengira yang mereka

pilih itu adalah kunci jawaban item, padahal bukan

b. Analisis Soal Essay

1) Validitas Butir Tes

Untuk menguiji validitas setiap butir soal maka skor-skor yang ada pada

butir yang dimaksud dikorelasikan dengan skor totalnya. Skor tiap butir soal

dinyatakan dengan X dan skot total dinyatakan sebagai skor Y, dengan

diperolehnya indeks validitas setiap butir soal, dapat diketahui butir-butir soal

manakah yang memenuhi syarat dilihat dari indeks validitasnya

(Arikunto,2012:87). Untuk menghitung koefisien korelasi tersebut digunakan

rumus Produk Momen Pearson, yaitu :

rxy =

keterangan :

r : koefisien validitas

N : banyaknya siswa

X: Skor item

Y: Skor Total

Kriteria yang digunakan untuk menentukan validitas butir

soal terdapat pada Tabel 2.

Tabel 2. Kriteria Validitas Tes

Nilai r Interpretasi0,80 – 1,00 Sangat tinggi0,60 – 0,80 Tinggi0,40 – 0,60 Cukup

Analisis Tes Buatan Guru 29

0,20 – 0,40 Rendah0,00 – 0,20 Sangat rendah

2) Indeks Kesukaran

Untuk menentukan indeks kesukaran ( ) soal essay dapat digunakan

rumus yang dinyatakan oleh Prewironegoro (1985:14) adalah sebagai berikut :

Keterangan : = Indeks kesukaran soal = Jumlah Skor dari kelompok tinggi = Jumlah skor dari kelompok rendah

= Skor setiap soal jika benar = Banyak peserta tes

= 27% x N

Dengan kriteria :

< 27% Soal sukarSoal sedang

> 73% Soal mudah

Tingkat kesukaran butir soal memiliki 2 kegunaan, yaitu kegunaan bagi

guru dan kegunaan bagi pengujian dan pengajaran (Nitko, 1996: 310-313).

Kegunaannya bagi guru adalah: (1) sebagai pengenalan konsep terhadap

pembelajaran ulang dan memberi masukan kepada siswa tentang hasil belajar

mereka, (2) memperoleh informasi tentang penekanan kurikulum atau mencurigai

terhadap butir soal yang bias. Adapun kegunaannya bagi pengujian dan

pengajaran adalah: (a) pengenalan konsep yang diperlukan untuk diajarkan ulang,

(b) tanda-tanda terhadap kelebihan dan kelemahan pada kurikulum sekolah, (c)

memberi masukan kepada siswa, (d) tanda-tanda kemungkinan adanya butir soal

yang bias, (e) merakit tes yang memiliki ketepatan data soal. Di samping kedua

kegunaan di atas, dalam konstruksi tes, tingkat kesukaran butir soal sangat penting

karena tingkat kesukaran butir dapat: (1) mempengaruhi karakteristik distribusi

skor (mempengaruhi bentuk dan penyebaran skor tes atau jumlah soal dan

korelasi antarsoal), (2) berhubungan dengan reliabilitas. Menurut koefisien alfa

Analisis Tes Buatan Guru 30

clan KR-20, semakin tinggi korelasi antarsoal, semakin tinggi reliabilitas

(Nunnally, 1981: 270-271).

3) Daya Pembeda

Untuk menghitung daya pembeda soal essay, dengan cara sebagai berikut :

a) Data diurutkan dari nilai tertinggi sampai nilai terendah

b) Kemudian diambil 27 % dari kelompok yang mendapat nilai tertinggi dan

27% dari kelompok yang mendapat nilai rendah

c) Hitung degress of freedom (df) dengan rumus :

, dimana

Rumus daya pembeda soal adalah sebagai berikut.

Keterangan :

Indeks Pembeda soal

Rata-rata skor kelompok tinggi

Rata-rata kelompok rendah

Jumlah kuadrat deviasi kelompok tinggi

= Jumlah kuadrat deviasi skor kelompok rendah

N = Banyak peserta tes

Suatu soal mempunyai daya pembeda yang berarti (signifikan) jika

hitung tabel pada df yang telah ditentukan (Prawironegoro, 1985:11).

4) Reliabilitas Tes

Reliabilitas tes adalah ukuran apakah tes tersebut dapat dipercaya. Suatu

tes dikatakan reliable apabila beberapa kali pengujian menunjukan hasil yang

reliable sama. Untuk menentukan koefisien reliabelitas digunakan rumus alpha

yang dinyatakan oleh Arinkunto (2012:122)

Analisis Tes Buatan Guru 31

Keterangan :

= reliabilitas yang dicari

= jumlah variansi skor tiap-tiap item

= variansi total

= jumlah butir soal

Dengan kriteria sebagai berikut :

0.80 < < 1.00 reliabilitas tinggi sekali

0.60 < < 0.80 reliabilitas tiggi

0.40 < < 0.60 reliabilitas sedang

0.20 < < 0.40 reliabilitas rendah

1.0 < 0.20 sangat rendah

2. Analisis Kualitatif

Pada prinsipnya analisis butir soal secara kualitatif dilaksanakan

berdasarkan kaidah penulisan soal (tes tertulis, perbuatan, dan sikap). Penelaahan

ini biasanya dilakukan sebelum soal digunakan/diujikan.

Aspek yang diperhatikan di dalam penelaahan secara kualitatif ini adalah

setiap soal ditelaah dari segi materi, konstruksi, bahasa/budaya, dan kunci

jawaban/pedoman penskorannya. Dalam melakukan penelaahan setiap butir soal,

penelaah perlu mempersiapkan bahan-bahan penunjang seperti: (1) kisi-kisi

tes, (2) kurikulum yang digunakan, (3) buku sumber, dan (4) kamus bahasa

Indonesia.

a. Teknik Analisis Secara Kualitatif

Ada beberapa teknik yang dapat digunakan untuk menganalisis butir soal

secara kualitatif, diantaranya adalah teknik moderator dan teknik panel.Teknik

moderator merupakan teknik berdiskusi yang di dalamnya terdapat satu orang

sebagai penengah. Berdasarkan teknik ini, setiap butir soal didiskusikan secara

bersama-sama dengan beberapa ahli seperti guru yang mengajarkan materi, ahli

materi, penyusun/pengembang kurikulum, ahli penilaian, ahli bahasa, berlatar

belakang psikologi. Teknik ini sangat baik karena setiap butir soal dilihat secara

bersama-sama berdasarkan kaidah penulisannya. Di samping itu, para penelaah

Analisis Tes Buatan Guru 32

dipersilakan mengomentari/ memperbaiki berdasarkan ilmu yang dimilikinya.

Setiap komentar/masukan dari peserta diskusi dicatat oleh notulis. Setiap butir

soal dapat dituntaskan secara bersama-sama, perbaikannya seperti apa. Namun,

kelemahan teknik ini adalah memerlukan waktu lama untuk rnendiskusikan setiap

satu butir soal.

Teknik panel merupakan suatu teknik menelaah butir soal yang setiap

butir soalnya ditelaah berdasarkan kaidah penulisan butir soal, yaitu ditelaah dari

segi materi, konstruksi, bahasa/budaya, kebenaran kunci jawaban/pedoman

penskorannya yang dilakukan oleh beberapa penelaah. Caranya adalah beberapa

penelaah diberikan: butir-butir soal yang akan ditelaah, format penelaahan, dan

pedoman penilaian/ penelaahannya. Pada tahap awal para penelaah diberikan

pengarahan, kemudian tahap berikutnya para penelaah berkerja sendiri-sendiri

di tempat yang tidak sama. Para penelaah dipersilakan memperbaiki langsung

pada teks soal dan memberikan komentarnya serta memberikan nilai pada setiap

butir soalnya yang kriterianya adalah: baik, diperbaiki, atau diganti.

Secara ideal penelaah butir soal di samping memiliki latar belakang

materi yang diujikan, beberapa penelaah yang diminta untuk menelaah butir soal

memiliki keterampilan, seperti guru yang mengajarkan materi itu, ahli

materi, ahli pengembang kurikulum, ahli penilaian, psikolog, ahli bahasa, ahli

kebijakan pendidikan, atau lainnya.

Dalam menganalisis butir soal secara kualitatif, penggunaan format

penelaahan soal akan sangat membantu dan mempermudah prosedur

pelaksanaannya. Format penelaahan soal digunakan sebagai dasar untuk

menganalisis setiap butir soal. Agar penelaah dapat dengan mudah

menggunakan format penelaahan soal, maka para penelaah perlu

memperhatikan petunjuk pengisian formatnya. Petunjuknya adalah seperti

berikut ini.

1) Analisislah setiap butir soal berdasarkan semua kriteria yang tertera di

dalam format!

2) Berilah tanda cek (V) pada kolom "Ya" bila soal yang ditelaah sudah

sesuai dengan kriteria!

Analisis Tes Buatan Guru 33

3) Berilah tanda cek (V) pada kolom "Tidak" bila soal yang ditelaah tidak sesuai

dengan kriteria,kemudian tuliskan alasan pada ruang catatan atau pada

teks soal dan perbaikannya.

a. Format Penelaahan Butir Soal Bentuk Uraian

FORMAT PENELAAHAN BUTIR SOAL BENTUK URAIAN

Mata Pelajaran : .................................Kelas/semester : .................................Penelaah : .................................

No. Aspek yang ditelaah

Nomor Soal1 2 3 4 5 6 7 8 9 …

Analisis Tes Buatan Guru 34

A.

1

2

3

4

B

5

6

78

Materi

Soal sesuai dengan indikator (menuntut tes tertulis untuk bentuk Uraian)Batasan pertanyaan dan jawaban yang diharapkan sudahsesuaiMateri yang ditanyakan sesuai dengan kompetensi (urgensi, relevasi, kontinyuitas, keterpakaian sehari-hari tinggi)Isi materi yang ditanyakan sesuai dengan jenjang jenis sekolah atau tingkat kelasKonstruksi

Menggunakan kata tanya atau perintah yang menuntut jawaban uraianAda petunjuk yang jelas tentang cara mengerjakan soalAda pedoman penskorannyaTabel, gambar, grafik, peta, atau yang sejenisnya disajikan dengan jelas dan terbaca

C.9

1 01 1

1 21 3

Bahasa/BudayaRumusan kalimat coal komunikatifButir soal menggunakan bahasa Indonesia yang baku Tidak menggunakan kata/ungkapan yang menimbulkan penafsiran ganda atau salah pengertian

Keterangan: Berilah tanda (V) bila tidak sesuai dengan aspek yang ditelaah!

2. Format Penelaahan Soal Bentuk Pilihan GandaFORMAT PENELAAHAN SOAL BENTUK PILIHAN GANDA

Mata Pelajaran : .............................Kelas/semester : ............................

.....Penelaah : .................................

No.Nomor Soal

1 2 3 4 5 …

Analisis Tes Buatan Guru 35

A.1

2

3.

4.B.5.

6.

7.8

9.

10.

11.

12.

MateriSoal sesuai dengan indikator (menuntut tes tertulis untuk bentuk pilihan gandaMateri yang ditanyakan sesuai dengan kompetensi (urgensi, relevasi, kontinyuitas, keterpakaian sehari-hari tinggi)Pilihan jawaban homogen dan logisHanya ada satu kunci jawabanKonstruksiPokok soal dirumuskan dengan singkat, jelas, dan tegasRumusan pokok soal dan pilihan jawaban merupakan pernyataan yang diperlukan sajaPokok soal tidak memberi petunjuk kunci jawabanPokok soal bebas dan pernyataan yang bersifat negatif ganda Pilihan Jawaban homogen dan logis ditinjau dari segi materi Gambar, grafik, tabel, Diagram, atau sejenisnya jelas dan berfungsi Panjang pilihan jawaban relatif samaPilihan jawaban tidak menggunakan pernyataan "semua jawaban di atas salah/benar" dan sejenisnyaPilihan jawaban yang berbentuk angka/waktu disusun berdasarkan urutan besar kecilnya angka atau kronologisnyaButir soal tidak bergantung pada jawaban soal sebelumnya

C.

15.

16.

17.

18.

Bahasa/Budaya

Menggunakan bahasa yang sesuai dengan kaidah bahasa Indonesia

Menggunakan bahasa yang komunikatif

Tidak menggunakan bahasa yang berlaku setempat/tabu

Keterangan: Berilah t a n d a ( V ) bila tidak sesuai dengan aspek yang ditelaah!

Analisis Tes Buatan Guru 36

BAB IIIANALISIS TES BUATAN GURU

A. Analisis Tes Buatan Guru

Sebagai contoh untuk analisis tes buatan guru di ambil soal matematika

dan soal IPS kelas V salah satu Sekolah Dasar Islam terpadu yang ada di Padang.

Soal tes buatan guru ini akan dianalisis secara kuantitatif dan kualitatif.

1. Analisis Soal Matematika

Dari hasil penelusuran soal yang disusun oleh guru matematika diperoleh

informasi, bahwa guru dalam menyusun soal jarang sekali menggunakan teknik

penyusunan tes hasil belajar yang baik seperti ayng telah dijelaskan dalam BAB

sebelumnya.

Guru matematika sebenarnya ada melakukan analisis, tetapi analisis yang

dilakukan hanya secara umum, tanpa menggunakan analisis sesuai teori. Analisis

soal penting dilakukan, salah satu tujuannya adalah dapat dijadikan pedoman bagi

guru dalam menentukan metode atau strategi yang akan digunakan dalam

pembelajaran matematika selanjutnya. Soal yang disusun guru berupa soal

objektif dan soal essay. Soal objektif terdiri dari 25 butir soal dan 5 butir saol

essay. Analisis dilakukan secara kuantitatif dan kualitatif. Kuantitatif dapat dicari

secara manual, tetapi disini digunakan program Anatest.

Hasil analisis kuantitatif soal matematika dengan program Anatest

diuraikan sebagai berikut:

1) Validitas Tes

Berdasarkan hasil jawaban siswa yang telah dikoreksi, skor yang

diperoleh siswa kelas III SD IT dapat dilihat pada Lampiran . Dari data yang telah

diperoleh dapat ditentukan validitas butir soal tes yang telah disusun oleh guru

matematika Kelas III SD IT. Berdasarkan data pada Lampiran tersebut, diperoleh

hasil validitas butir soal dapat dilihat pada Tabel 3.1 berikut:

Analisis Tes Buatan Guru 37

Tabel 3.1 Validitas Butir Soal

Soal Hasil Kevalidan Soal Hasil Kevalidan 1 0.00 sangat rendah 16 0.000 sangat rendah2 0.00 sangat rendah 17 0.019 sangat rendah3 0.00 sangat rendah 18 0.000 sangat rendah4 0.454 Cukup 19 0.416 cukup5 0.331 Rendah 20 0,285 sangat rendah6 0.00 sangat rendah 21 0.189 sangat rendah7 0.136 sangat rendah 22 0.436 cukup8 0.286 Rendah 23 0.246 rendah9 0.605 Tinggi 24 0.419 cukup10 0.136 sangat rendah 25 0.641 tinggi11 0.333 Rendah12 0.076 sangat rendah13 0.005 sangat rendah14 0.411 Cukup15 0.78 Tinggi

Berdasarakan Tabel 3.1 dapat dilihat dari 25 soal, terdapat 13 soal yang

mempunyai validitas sangat rendah, 4 soal mempunyai validitas rendah, 4 soal

mempunyai validitas cukup dan 3 soal mempunyai validitas tinggi. Persentase

hasil tersebut dapat dilihat pada diagram 3.1 berikut.

Diagram 3.1. Validitas Butir Soal Kelas III SD IT

Berdasarkan diagram 3.1` dapat dilihat bahwa soal matematika yang

disusun oleh guru matematika Kelas III SD IT yang telah diberikan guru pada

siswa hanya 12 % soal yang memiliki validitas tinggi. Lebih rendah

dibandingkan dengan sekolah yang telah dibahas sebelumnya. 12 % soal yang

memang mengukur apa yang seharusnya di ukur oleh guru terhadap siswanya. 84

Analisis Tes Buatan Guru 38

% soal perlu dilakukan perbaikan sehingga soal memang dapat digunakan untuk

mengukur kemampuan siswa. Ini sangat disayangkan karena hanya sedikit sekali

sola yang bisa dijadikan alat ukur, sementara jumlah soalnya cukup banyak, tetapi

tidak dapat dijadikan alat ukur yang baik. Bahkan 52 % soal memiliki validitas

yang sangat rendah. 52% soal ini perlu diperbaiki dari semua aspek penyusunan

soal.

2) Daya Pembeda Soal

Dari Skor hasil belajar yang diperoleh dari lembar jawaban siswa pada

Lampiran dapat dihitung daya beda soal matematika Kelas III yang disusun oleh

guru SD IT seperti pada Tabel 3.2berikut:

Tabel 3.2 Daya Pembeda Soal Kelas III SD IT

Soal Hasil Kriteria Soal Hasil Kriteria1 0.00 Sangat tidakbaik 16 0.00 sangat tidak baik2 0.00 Sangat tidak baik 17 0.00 Sangat tidak baik3 0.00 Sangat tidak baik 18 0.00 sangat tidak baik4 0.57 Baik 19 0.28 Tidak baik5 0.28 Tidak baik 20 0.42 baik6 0.00 sangat tidak baik 21 0.52 Baik7 0.14 Tidak baik 22 0.63 Baik8 0.28 Tidak baik 23 0.74 Baik9 0.28 Tidak baik 24 0.81 Baik10 0.14 Tidak baik 25 0.63 Baik11 0.14 Tidak baik12 0.00 sangat tidak baik13 0.14 Tidak baik14 0.42 baik15 0.42 baik

Pada Tabel 3.2 dapat dilihat bahwa dari 25 soal terdapat 8 soal mempunyai

daya beda yang sangat tidak baik, 8 soal yang mempunyai daya beda tidak baik

dan 9 soal yang mempunyai daya beda baik. Artinya 16 soal yang perlu diperbaiki

sehingga memiliki kualitas yang baik dalam membedakan siswa berkemampuan

tinggi dengan siswa berkemampuan rendah.

3) Tingkat kesukaran

Analisis Tes Buatan Guru 39

Penghitungan tingkat kesukaran soal digunakan juga skor yang diperoleh

dari lembar jawaban siswa kelas III SD IT yang ada pada Lampiran 1. Dari

pengolahan data tersebut diperoleh indek tingkat kesukaran soal seeperti pada

Tabel 3.3 berikut:

Tabel 3.3 Tingkat Kesukaran Soal Kelas III SD IT

Soal Hasil Kriteria Soal Hasil Kriteria 1 1 Sangat mudah 16 1 Sangat mudah2 1 Sangat mudah 17 0.88 Sangat mudah3 1 Sangat mudah 18 1 Sangat mudah4 0.44 Sedang 19 0.88 Sangat mudah5 0.81 Mudah 20 0.81 Sangat mudah6 1 Sangat mudah 21 0.88 Sangat mudah7 0.96 Sangat mudah 22 0.48 Sedang8 0.77 Mudah 23 0.88 Sangat mudah9 0.92 Sangat mudah 24 0.96 Sangat mudah10 0.96 Sangat mudah 25 0.95 Sangat mudah11 0.92 Sangat mudah12 0.92 Sangat mudah13 0.74 Mudah14 0.74 Mudah15 0.55 Sedang

Pada Tabel 3.3 dapat dilihat bahwa dari 25 soal terdapat 18 soal yang

mempunyai tingkat kesukaran sangat mudah, 4 soal mempunyai tingkat kesukaran

mudah dan hanya 3 soal yang mempunyai tingkat kesukaran sedang.

4) Reliabilitas Tes

Berdasarkan hasil perhitungan reliabilitas tes yang dilakukan dengan

Program Anates, diperoleh reliabilitas tes US SD IT Budi Mulia adalah 0,28. Ini

berarti sesuai dengan kriteria reliabilitas, tes yang telah dilakukan memiliki

reliabilitas rendah.

Dari rangkaian analisis kuantitatif di atas dapat disimpulkan bahwa soal

matematika yang disusun oleh guru perlu diperbaiki karena memiliki validitas

yang rendah, daya pembeda dan tingkat kesukaran yang tidak bagus serta

reliabilitas yang rendah.

Analisis Tes Buatan Guru 40

Untuk analisis kualitatir aspek yang diperhatikan di dalam penelaahan

secara kualitatif ini adalah setiap soal ditelaah dari segi materi, konstruksi,

bahasa/budaya, dan kunci jawaban/pedoman penskorannya. Dalam melakukan

penelaahan setiap butir soal, penelaah perlu mempersiapkan bahan-bahan

penunjang seperti: (1) kisi-kisi tes, (2) kurikulum yang digunakan, (3) buku

sumber, dan (4) kamus bahasa Indonesia.

Format penelaahan soal digunakan sebagai dasar untuk menganalisis

setiap butir soal. Format penelaahan soal yang dimaksud adalah format

penelaahan butir soal: uraian, pilihan ganda, tes perbuatan dan instrumen non-tes.

Dalam penelitian ini soal yang akan di telaah adalah soal pilihan ganda.

Berdasarkan hasil telaah butir soal matematika kelas III yang disusun

oleh guru yang telah dilakukan diperoleh masih banyak guru dalam membuat soal

belum memenuhi kriteria soal yang baik. Dari segi materi, soal yang dibuat guru

pada umumnya sesuai dengan materi yang telah dipelajari. Dari segi kontruksi,

guru banyak keliru dalam membuat urutan pilihan jawaban-jawaban yang

berbentuk angka. Sesuai dengan petunjuk dalam pembuatan soal yang baik,

pilihan jawaban yang berbentuk angka dan waktu disusun berdasarkan besar

kecilnya angka atau kronologinya. Kriteria lainnya sudah sesuai dengan yang

diharapkan walaupun belum maksimal. Dari segi bahasa, ditemukan beberapa

sekolah yang banyak salah dalam penulisan soal atau soalnya tidak komunikatif.

Berdasarkan hasil yang diperoleh dapat disimpulkan bahwa masih terdapat

kekeliruan guru dalam membuat soal. Yang paling banyak mengalami kesalahan

adalah pada segi konstruksi soal. Jadi soal-soal yang ada perlu diperbaiki kembali

untuk menghasilkan hasil yang maksimal.

Berdasarkan analisis Kuantitatif dan Analisis Kualitatif dapat disimpulkan

bahwa kualitas soal matematika yang disusun oleh guru matematika SD IT masih

memiliki kualitas yang kurang. Hal ini berdasarkan validitas soal masih banyak

yang rendah, daya pembeda soal yang belum mampu membedakan siswa

berkemampuan tinggi dengan siswa berkemampuan rendah, tingkat kesukaran

soal yang masih belum memilikim proporsi yang merata untuk semua tingkat

kesukaran soal, reliabilitas soal yang masih rendah. Sebenarnya soal yang

Analisis Tes Buatan Guru 41

memiliki validitas rendah bahkan sangat rendah tidak dapat lagi dipakai, harus

diganti, dan tidak perlu lagi dicari reliabilitasnya.

Selanjutnya kualitas soal ini juga dilihat dari hasil analisis kualitatif

dengan menggunakan penelaahan soal. Seperti yang telah dikemukakan di atas

bahwa masih banyak soal yang belum memenuhi dari segi konstruk, bahasa, dan

masih banyak yang tidak komunikatif. Berdasarkan hasil tersebut soal masih

harus diperbaiki sehingga memiliki kualitas yang baik dan dapat digunakan

dengan efektif dan efisien serta mencapai tujuan yang diinginkan.

Hasil analisis kuantitatif soal IPS dengan program Anatest diuraikan

sebagai berikut:

1) Validitas Tes

Berdasarkan hasil jawaban siswa yang telah dikoreksi, skor yang

diperoleh siswa kelas III SD IT dapat dilihat pada Lampiran . Dari data yang telah

diperoleh dapat ditentukan validitas butir soal tes yang telah disusun oleh guru

matematika Kelas III SD IT. Berdasarkan data pada Lampiran tersebut, diperoleh

hasil validitas butir soal dapat dilihat pada Tabel 3. 5 berikut:

Tabel 3.5. Validitas butir soal IPS

Soal Hasil Kevalidan Soal Hasil Kevalidan 1 0.139 Sangat rendah 21 0.389 Rendah2 0.059 Sangat rendah 22 -0.114 Sangat Rendah3 0.000 Sangat rendah 23 0.590 cukup4 0.534 Cukup 24 0.288 Rendah5 0.102 Sangat rendah 25 0.000 Sangat Rendah6 0.487 Cukup 26 0.286 Rendah7 0.548 Cukup 27 0.000 Sangat Rendah8 0.244 Rendah 28 0.466 Cukup9 0.335 Rendah 29 0.657 tinggi10 0.358 Rendah 30 0.242 Rendah11 0.496 Cukup 31 0.000 Sangat Rendah12 0.710 Tinggi 32 0.371 Rendah13 0.279 Rendah 33 -0.116 Sangat Rendah14 0.303 Rendah 34 0.316 Rendah15 0.343 Rendah 35 0.365 Rendah16 0.151 Sangat rendah17 0.539 Cukup18 0.570 Cukup

Analisis Tes Buatan Guru 42

19 0.051 Sangat rendah20 0.389 Rendah

Dari tabel dapat dilihat bahwa terdapat 11 soal yang mempunyai validitas

sangat rendah, 14 soal mempunyai validitas rendah, 8 soal mempunyai validitas

cukup dan hanya 2 soal yang mempunyai validitas tinggi.

2) Daya Pembeda Soal

Dari Skor hasil belajar yang diperoleh dari lembar jawaban siswa pada

Lampiran dapat dihitung daya beda soal IPS Kelas III yang disusun oleh guru SD

IT seperti pada Tabel 3.6 berikut:

Tabel 3. 6 Daya Pembeda Soal IPS

Soal Hasil Kriteria Soal Hasil kriteria1 0.28 Tidak baik 21 0.28 Tidak baik2 0.00 Tidak baik 22 -0.14 Tidak baik3 0.00 Tidak baik 23 0.71 baik4 0.42 Baik 24 0.14 Tidak baik5 0.00 Tidak baik 25 0.00 Tidak baik6 0.28 Tidak baik 26 0.28 Tidak baik7 0.28 Tidak baik 27 0.00 Tidak baik8 0.28 Tidak baik 28 0.57 Baik9 0.42 Baik 29 0.57 baik10 0.42 Baik 30 0.28 Tidak baik11 0.57 Baik 31 0.00 Tidak baik12 0.57 Baik 32 0.14 Tidak baik13 0.28 Tidak baik 33 -0.14 Tidak baik14 0.28 Tidak baik 34 0.14 Tidak baik15 0.57 Baik 35 0.42 baik16 0.14 Tidak baik17 0.71 Baik18 0.71 Baik19 0.00 Tidak baik20 0.28 Tidak baik

Dari tabel dapat dilihat bahwa terdapat 24 soal yang mempunyai daya

pembeda tidak baik dan hanya 11 soal yang mempunyai daya pembeda baik.

3) Tingkat Kesukaran

Analisis Tes Buatan Guru 43

Penghitungan tingkat kesukaran soal digunakan juga skor yang diperoleh

dari lembar jawaban siswa kelas III SD IT yang ada pada Lampiran 1. Dari

pengolahan data tersebut diperoleh indek tingkat kesukaran soal IPS seeperti pada

Tabel 3.7 berikut:

Tabel 3.7. Tingkat kesukaran Soal IPS

Soal Hasil Kriteria Soal Hasil kriteria1 0.65 Sedang 21 0.92 Sangat mudah2 0.92 Sangat mudah 22 0.15 Sukar3 1 Sangat mudah 23 0.65 Sedang4 0.80 Mudah 24 0.53 Sedang5 0.15 Sukar 25 1 Sangat mudah6 0.88 Sangat mudah 26 0.80 mudah7 0.88 Sangat mudah 27 1 Sangat mudah8 0.30 Sangat mudah 28 0.84 mudah9 0.80 Mudah 29 0.80 mudah10 0.84 Mudah 30 0.88 mudah11 0.69 Sedang 31 1 Sangat mudah12 0.84 Mudah 32 0.96 Sangat mudah13 0.92 Sangat mudah 33 0.30 Sukar14 0.88 Sangat mudah 34 0.92 Sangat mudah15 0.61 Sedang 35 0.65 sedang16 0.26 Sukar17 0.69 Sedang18 0.65 Sedang19 0.70 Sedang20 0.92 Sangat mudah

Berdasarkan tabel diperoleh 14 soal mempunyai tingkat kesukaran sangat

mudah, 8 soal mempunyai kriteria mudah, 9 soal mempunyai kriteria sedang dan

terdapat 3 soal yang berkriteria sukar.

4) Reabilitas tesDari hasil analisis diperoleh reabilitas tes US IPS kelas V adalah 0.83. ini

berarti tesnya mempunyai reabilitas tinggi

5) Kualitas PengecohUntuk kualitas pengecoh dapat dilihat pada Tabel berikut.

Analisis Tes Buatan Guru 44

Soal A B C D

1 Kunci jawaban baik Sangat baik Baik2 Sangat buruk Kunci jawabab buruk buruk3 - - Kunci jawaban -4 Sangan baik Sangat baik baik Kunci jawaban5 Kunci jawaban Sangat baik Sangat baik Sangat baik6 buruk Kunci jawaban buruk Sangat baik

7 buruk Sangat baik Kunci jawaban buruk

8 Sangat baik Sangat baik Sangat baik Kunci jawaban

9 Kunci jawaban Sangat baik Sangat baik baik

10 baik Kunci jawaban baik baik

11 baik baik Kunci jawaban baik

12 baik baik baik Kunci jawaban

13 Kunci jawaban Sangat buruk buruk buruk

14 buruk Kunci jawaban buruk Sangat baik

15 Sangat baik Sangat baik Kunci jawaban baik16 Sangat baik baik Kurang baik Kunci jawaban17 Kunci jawaban baik Sangat baik Kurang baik18 Kurang baik Sangat baik baik baik19 buruk Sangat baik Kunci jawaban buruk20 Sangat buruk buruk buruk Kunci jawaban21 Kunci jawaban Sangat buruk buruk buruk22 Sangat baik Kunci jawaban Sangat baik Sangat baik23 Kurang baik baik Kunci jawaban baik24 baik baik buruk Kunci jawaban25 Kunci jawaban - - -26 buruk Kunci jawaban buruk Sangat baik27 - - Kunci jawaban -28 Sangat buruk baik buruk Kunci jawaban29 Buruk Kunci jawaban baik Baik30 Kunci Jawaban buruk Sangat baik Buruk31 - Kunci Jawaban - -32 Sangat buruk Buruk Kunci Jawaban Buruk33 baik Sangat baik Kurang baik kunci jawaban34 Kunci Jawaban Sangat buruk Buruk Buruk35 Kurang baik Kunci Jawaban Kurang baik Sangat baik

BAB IVKESIMPULAN

Analisis Tes Buatan Guru 45

Dari hasil analisis soal matematika dan soal IPS yang disusun oleh guru

yang diambil dari salah satu SD IT dapat disimpulkan bahwa guru jarang

melakukan prosedur penyusunan soal sesuai dengan langkah-langkah yang telah

ditentukan. Setelah itu guru jarang sekali melakukan analsis soal yang mereka

susun. Setelah dilakukan analisis disimpulkan juga bahwa soal yang disusun guru

tersebut juga belum dapat dikriteriakan sebagai soal yang baik, karena dari hasil

analisis masih banyak butir soal yang memiliki validates, tingkat kesukaran, daya

beda, dan reliabilitas yang belum baik

DAFTAR BACAAN

Analisis Tes Buatan Guru 46

Anas Sudijono. 1995. Pengantar Evaluasi Pendidikan. Jakarta: Raja Grafindo Persada

Eko Putro Widoyoko. 2011. Evaluasi Program Pembelajaran. Yogyakarta: Pustaka Pelajar

Rusyan, T. 1993. Evaluasi Dalam Proses Belajar Mengajar. Bandung: Bina Budaya

Suharsimi Arikunto. 2009. Dasar-dasar Evaluasi Pendidikan. Jakarta: Bumi Aksara

Tabrani Rusyan. 1993. Evaluasi Dalam Proses Belajar Mengajar. Bandung: Refika Ofset

Phillips, Allen D. (1979). Measurement and Evaluation in physical education. Canada: John Whiley & Sons, Inc.

Prihastuti Ekawatiningsih. 2009 makalah Penyusunan Tes Hasil Belajar.Fakultas Teknik UNY

Panduan Analisis Soal. http://gurupembaharu.com. Diakses 9 september 2013PP no 32 tahun 2013 tentang Standar Nasional Pendidikan

http://mathsamah1989.blogspot.com/

Analisis Tes Buatan Guru 47