bab ii kajian pustaka evaluation, dalam bahasa indonesia...

29
5 BAB II KAJIAN PUSTAKA 2.1 Evaluasi Pendidikan 2.1.1 Pengertian Evaluasi Evaluasi berasal dari bahasa Inggris evaluation, dalam bahasa Indonesia berarti penilaian. Dengan demikian secara harfiah evaluasi pendidikan (educational evaluation) dapat diartikan sebagai penilaian dalam (bidang) pendidikan atau penilaian mengenai hal-hal yang berkaitan dengan kegiatan pendidikan (Sudijono, 2011:1). Sedangkan dalam arti luas, evaluasi adalah suatu proses merencanakan, memperoleh, dan menyediakan informasi yang sangat diperlu kan untuk membuat alternatif - alternatif keputusan (Mehrens & Lehman 1978 dalam Purwanto, 2008 : 3). Edwind wand dan Gerald W. Brown (dalam Sudijono, 2001:1) menjelaskan: Evaluation refer to the act process to determining the value of something. Menurut definisi ini, maka evaluasi adalah tindakan atau proses untuk menentukan nilai dari sesuatu. Sesuai dengan pendapat tersebut maka evaluasi pendidikan dapat diartikan sebagai suatu tindakan atau proses untuk menentukan nilai dari sesuatu dalam dunia pendidikan atau segala sesuatu yang ada hubungannnya dengan dunia pendidikan. Evaluasi pendidikan adalah kegiatan atau proses penentuan nilai pendidikan, sehingga dapat diketahui mutu dan hasilnya.

Upload: docong

Post on 24-Jun-2019

227 views

Category:

Documents


0 download

TRANSCRIPT

5

BAB II

KAJIAN PUSTAKA

2.1 Evaluasi Pendidikan

2.1.1 Pengertian Evaluasi

Evaluasi berasal dari bahasa Inggris evaluation, dalam bahasa Indonesia

berarti penilaian. Dengan demikian secara harfiah evaluasi pendidikan

(educational evaluation) dapat diartikan sebagai penilaian dalam (bidang)

pendidikan atau penilaian mengenai hal-hal yang berkaitan dengan kegiatan

pendidikan (Sudijono, 2011:1). Sedangkan dalam arti luas, evaluasi adalah suatu

proses merencanakan, memperoleh, dan menyediakan informasi yang sangat

diperlu kan untuk membuat alternatif - alternatif keputusan (Mehrens & Lehman

1978 dalam Purwanto, 2008 : 3).

Edwind wand dan Gerald W. Brown (dalam Sudijono, 2001:1)

menjelaskan: Evaluation refer to the act process to determining the value of

something. Menurut definisi ini, maka evaluasi adalah tindakan atau proses untuk

menentukan nilai dari sesuatu. Sesuai dengan pendapat tersebut maka evaluasi

pendidikan dapat diartikan sebagai suatu tindakan atau proses untuk menentukan

nilai dari sesuatu dalam dunia pendidikan atau segala sesuatu yang ada

hubungannnya dengan dunia pendidikan. Evaluasi pendidikan adalah kegiatan

atau proses penentuan nilai pendidikan, sehingga dapat diketahui mutu dan

hasilnya.

6

Arikunto (2002:13) mendefinisikan evaluasi dengan terlebih dahulu

menjelaskan tentang mengukur dan menilai. Mengukur adalah membandingkan

sesuatu dengan satu ukuran dan bersifat kuantitatif. Menilai adalah mengambil

sesuatu keputusan terhadap sesuatu dengan ukuran baik buruk dan bersifat

kualitatif. Sedangkan mengadakan evaluasi meliputi kedua langkah diatas, yaitu

mengukur dan menilai. Dengan demikian evaluasi adalah menilai (tetapi

dilakukan dengan mengukur terlebih dahulu).

Dalam konteks kalimat yang berbeda tetapi mengandung arti yang sama,

Wrigstone dkk 1956 (dalam Purwanto 2008 : 3) mengemukakan rumusan evaluasi

pendidikan sebagai berikut : “Educational evaluation is the estimation of the

growth and progress of pupils toward objectives or values in the curriculum.”

(Evaluasi pendidikan ialah penafsiran terhadap pertumbuhan dan kemajuan siswa

kearah tujuan-tujuan dan nilai-nilai yang telah ditetapkan di dalam kurikulum).

2.1.2 Dasar-Dasar Evaluasi Pendidikan

Dalam pelaksanaannya, evaluasi harus mempunyai dasar yang kuat. Dasar

yang dimaksud adalah prinsip ilmiah yang melandasi penyusunan dan

pelaksanaan evaluasi yang mencakup 7 konsep yaitu: filsafat, psikologi,

komunikasi, kurikulum, manajemen dan sosiologi-antropologi (Slameto, 2001:8).

Dasar filsafat dalam evaluasi pendidikan berhubungan dengan masalah

masalah yang merupakan dasar dalam pendekatan sistem yang menyangkut

pertanyaan-pertanyaan apakah evaluasi itu, mengapa evaluasi perlu diberikan dan

bagaimana cara memberikannya, yang dimaksud dengan dasar psikologi adalah

bahwa evaluasi itu dilaksanakan harus mempertimbangkan tingkat kesukaran

7

dengan tingkat perkembangan siswa, tingkat kemampuan yang dimiliki siswa, dan

teori-teori yang dianut dalam pendidikan. Dasar komunikasi dimaksudkan bahwa

evaluasi itu dapat dilaksanakan secara langsung maupun tidak langsung. Adapun

yang menjadi dasar evaluasi selanjutnya adalah kurikulum, maksudnya, isi

evaluasi harus sesuai dengan materi yang diajarkan seperti tercantum dalam

kurikulum yang telah ada dan dilaksanakan. Sedangkan dasar manajemen, artinya

bahwa evaluasi perlu diorganisasikan pelaksanaannya, apakah secara individual

atau kelompok dan bagaimana pengelolaannya. Disamping itu evaluasi harus

sesuai dan berguna dalam masyarakat untuk mencapai suatu kemajuan.

2.1.3 Tujuan dan Fungsi Evaluasi Pendidikan

Dalam konteks yang lebih luas lagi, Sax (1980 : 28) mengemukakan

tujuan evaluasi dan pengukuran adalah untuk “selection, placement, diagnosis

and remediation, feedback : norm-referenced and criterion-referenced

interpretation, motivation and guidance of learning, program and curriculum

improvement : formative and summative evaluations, and theory development”.

(seleksi, penempatan, diagnosis dan remediasi, umpan balik : penafsiran acuran-

norma dan acuan-patokan, motivasi dan bimbingan belajar, perbaikan program

dan kurikulum : evaluasi formatif dan sumatif, dan pengembangan teori).

Cronbach (1963 : 236) menjelaskan “evaluation used to improved the

course while it is still fluid contributes more to improvement of education than

evaluation used to appraise a product already on the market”. Cronbach

nampaknya lebih menekankan fungsi evaluasi untuk perbaikan, sedangkan

Scriven (1967) (dalam Purwanto, 2008) membedakan fungsi evaluasi menjadi dua

8

macam, yaitu fungsi formatif dan fungsi sumatif. Fungsi formatif dilaksanakan

apabila hasil yang diperoleh dari kegiatan evaluasi diarahkan untuk memperbaiki

bagian tertentu atau sebagian besar bagian kurikulum yang sedang dikembangkan.

Sedangkan fungsi sumatif dihubungkan dengan penyimpulan mengenai kebaikan

dari sistem secara keseluruhan. Fungsi ini baru dapat dilaksanakan jika

pengembangan program pembelajaran telah dianggap selesai.

Menurut Purwanto (2008:5) fungsi evaluasi sebagai berikut: a. Mengetahui tarap kesiapan siswa untuk menempuh suatu tujuan tertentu

(pendidikan tertentu). b. Mengetahui seberapa jauh hasil yang telah dicapai dalam proses pendidikan

yang telah dilaksanakan. c. Mengetahui apakah suatu mata pelajaran yang diajarkan dapat dilanjutkan

dengan bahan yang baru atau harus kembali ke bahan semula. d. Mendapatkan bahan-bahan informasi dalam memberikan bimbingan tentang

jenis pendidikan atau jenis jabatan untuk siswa tersebut e. Untuk mendapatkan bahan-bahan informasi untuk menentukan apakah

seorang anak dapat dinaikan kelasnya atau tidak f. Untuk membandingkan prestasi yang telah dicapai siswa sesuai dengan

kapasitasnya atau belum g. Untuk menafsirkan apakah seorang anak telah cukup matang untuk

dilepaskan ke masyarakat atau ke jenjang pendidikan yang lebih tinggi h. Untuk mengadakan seleksi untuk mengetahui taraf efesiensi/efektivitas

metode yang dipergunakan dalam pembelajaran

Bagi penyusun soal, fungsi evaluasi perlu diperhatikan secara sungguh-

sungguh agar evaluasi yang diberikan betul-betul mengenai sasaran yang

diharapkan. Berikut ini dikemukakan pendapat para ahli tentang tujuan dan fungsi

evaluasi. Nurgiyantoro (1987:14) (dalam Purwanto, 2008) menyebutkan 5 tujuan

dan fungsi evaluasi, yaitu:

a. untuk mengetahui seberapa jauh tujuan-tujuan pendidikan yang telah ditetapkan itu dapat dicapai dalam kegiatan belajar mengajar yang dilakukan,

b. untuk memberikan objektifitas pengamatan kita terhadap tingkah laku hasil belajar siswa,

9

c. untuk mengetahui kemampuan siswa dalam bidang-bidang atau topik-topik tertentu,

d. untuk menentukan layak tidaknya seorang siswa dinaikkan ketingkat diatasnya atau dinyatakan lulus dari tingkat pendidikan yang ditempuhnya,

e. untuk memberikan umpan balik bagi kegiatan belajar mengajar yang dilakukan. Menurut Arikunto (2001:10), tujuan atau fungsi penilaian ada beberapa hal,

yaitu: 1) penilaian berfungsi selektif, 2) penilain berfungsi diagnostik, 3) penilain

berfungsi sebagai penempatan dan 4) penilaian berfungsi sebagai pengukur

keberhasilan.

2.2 Tes

2.2.1 Pengertian Tes

Menurut Anne Anastasi (dalam Sudijono, 2001: 66), yang dimaksud

dengan tes adalah alat pengukur yang mempunyai standar yang objektif sehingga

dapat digunakan secara meluas, serta dapat betul-betul digunakan untuk mengukur

dan membandingkan keadaan psikis atau tingkah laku individu. Sedangkan

Sudijono (2001: 67) menyatakan bahwa tes adalah suatu tugas atau serangkaian

tugas yang diberikan kepada individu atau sekelompok individu, dengan maksud

untuk membandingkan kecakapan mereka, satu dengan yang lain.

Arikunto (2010: 53), tes merupakan alat atau prosedur yang digunakan

untuk mengetahui atau mengukur sesuatu dalam suasana, dengan cara dan aturan-

aturan yang sudah ditentukan. Sedangkan menurut Jacobs & Chase (1992) dalam

Alwasilah (1996), tes merupakan suatu alat penilaian dalam bentuk tulisan untuk

mencatat atau mengamati prestasi siswa yang sejalan dengan target penilaian.

Selanjutnya, tes didefinisikan sebagai pertanyaan atau tugas atau seperangkat

tugas yang direncanakan untuk memperoleh informasi tentang suatu atribut

10

pendidikan atau suatu atribut psikologis tertentu. Setiap butir pertanyaan atau

tugas tersebut mempunyai jawaban atau ketentuan yang dianggap benar

(Zainul dan Nasution, 2001).

Menurut Muljono (2008) ada beberapa istilah yang terkait dengan tes, yaitu:

1. Tes: alat atau prosedur yang digunakan dalam pelaksanaan tes.

2. Testing: saat pada waktu pelaksanaan tes.

3. Testee: responden atau individu yang sedang mengerjakan tes.

4. Tester: orang yang melaksanakan pengambilan tes terhadap para testee yang

bertugas untuk: (a) Mempersiapkan ruangan dan perlengkapan yang diperlukan

(b) Membagikan lembaran tes dan alat-alat lain untuk mengerjakan (c)

Menerangkan cara mengerjakan tes (d) Mengawasi testee mengerjakan tes (e)

Memberikan tanda-tanda waktu (f) Mengumpulkan pekerjaan testee (g)

Mengisi berita acara atau laporan yang diperlukan (jika ada).

2.2.2 Fungsi Tes

Beberapa fungsi tes dalam dunia pendidikan menurut Djaali (dalam

Muljono 2008) adalah:

1. Sebagai alat untuk mengukur prestasi belajar siswa.Tes dimaksudkan

untuk mengukur tingkat perkembangan atau kemajuan yang telah dicapai

siswa setelah menempuh proses belajar-mengajar dalam jangka waktu

tertentu.

2. Sebagai motivator dalam pembelajaran. Tes dianggap sebagai motivator

ekstrinsik, yaitu siswa akan belajar lebih giat dan berusaha lebih keras

untuk memperoleh nilai dan prestasi yang baik.

11

3. Sebagai upaya perbaikan kualitas pembelajaran. Dalam rangka perbaikan

kualitas pembelajaran, ada tiga jenis tes yang perlu dibahas yaitu; tes

penempatan, tes diagnostik, dan tes formatif.

4. Sebagai penentu berhasil atau tidaknya siswa sebagai syarat untuk

melanjutkan pendidikan ke jenjang yang lebih tinggi dengan

melaksanakan tes sumatif.

2.2.3 Jenis-Jenis Tes

Jenis – jenis tes menurut Muljono (2008) adalah:

1. Berdasarkan fungsinya sebagai alat pengukur perkembangan atau kemajuan

siswa, yaitu:

a. Tes seleksi (selection test).

Tes seleksi digunakan untuk memilih atau menyeleksi siswa yang terbaik

dari semua peserta tes, materinya berupa materi prasyarat untuk mengikuti

program pendidikan yang akan diikuti oleh calon siswa. Tes seleksi dapat

dilakukan secara lisan, secara tertulis, dengan tes perbuatan, dan dapat

juga ketiganya dikombinasikan secara serempak.

b. Tes awal (pre-test).

Tes awal merupakan tes yang dilaksanakan sebelum bahan pelajaran

diberikan kepada siswa dengan tujuan untuk mengetahui sejauh manakah

materi atau bahan pelajaran yang akan diajarkan telah dapat dikuasai oleh

siswa.

12

c. Tes akhir (post-test)

Tes akhir merupakan tes yang dilaksanakan dengan tujuan untuk

mengetahui apakah semua materi pelajaran yang tergolong penting sudah

dikuasai dengan sebaik-baiknya oleh siswa. Pada dasarnya materi pre-test

sama dengan materi post-test.

d. Tes diagnostik (diagnostic test)

Tes diagnostik merupakan tes yang dilaksanakan untuk menentukan tepat

jenis kesukaran yang dihadapi oleh para siswa dalam mata pelajaran

tertentu. Tes diagnostik dapat dilaksanakan dengan secara lisan, tertulis,

perbuatan atau kombinasi dari ketiganya.

e. Tes formatif (formative test)

Tes formatif merupakan tes hasil belajar yang bertujuan untuk mengetahui

sudah sejauh manakah siswa sudah memahami pelajaran setelah mereka

mengikuti proses pembelajaran dalam jangka waktu tertentu dan

memperbaiki kualitas pembelajaran. Tes formatif biasa dilaksanakan di

tengah-tengah perjalanan program pembelajaran, yaitu dilaksanakan pada

setiap kali satuan pelajaran atau sub pokok bahasan berakhir atau dapat

diselesaikan dan dikenal dengan istilah ulangan harian.

f. Tes sumatif (summative test)

Tes sumatif merupakan tes hasil belajar yang dilaksanakan setelah

sekumpulan materi pelajaran atau satuan program pengajaran selesai

diberikan. Tes sumatif dilaksanakan dengan tujuan untuk menentukan nilai

13

yang menjadi lambang keberhasilan siswa setelah mereka menempuh

proses pembelajaran dalam jangka waktu tertentu.

2. Berdasarkan aspek psikis yang ingin diungkapkan, yaitu:

a. Tes intelegensi (intellegency test)

Tes intelegensi merupakan tes yang dilaksanakan dengan tujuan untuk

mengungkapkan atau memprediksi kecerdasan seseorang.

b. Tes kemampuan (aptitude test)

Tes kemampuan merupakan tes yang dilaksanakan dengan tujuan untuk

mengungkap kemampuan dasar atau bakat khusus yang dimiliki oleh

testee.

c. Tes sikap (attitude test)

Tes sikap merupakan tes yang dilaksanakan dengan tujuan untuk

mengungkap predisposisi atau kecenderungan seseorang untukmelakukan

suatu respon tertentu terhadap dunia sekitarnya, baik berupa individu-

individu maupun objek-objek tertentu.

d. Tes kepribadian (personality test)

Tes kepribadian merupakan tes yang dilaksanakan dengan tujuan

mengungkapkan dengan ciri-ciri khas dari seseorang yang banyak

sedikitnya bersifat lahiriyah, seperti gaya bicara, cara berpakaian, nada

suara, hobi, bentuk tubuh, cara bergaul, cara mengatasi masalah,

kesenangan, dan lain sebagainya.

14

e. Tes hasil belajar (achievement test)

Tes hasil belajar merupakan tes yang dilaksanakan dengan tujuan untuk

mengungkap tingkat pencapaian terhadap tujuan pembelajaran atau

prestasi belajar, untuk melaksanakaan evaluasi mengajar seorang guru

pada tes belajar ini dapat menggunakan dua macam tes, yakni tes yang

telah distandarkan (standardized tes) dan tes buatan guru (teacher-made

test).

Menurut Purwanto (2008:34) adapun perbedaan tes standard an tes buatan

guru adalah sebagai berikut :

Standardized achievement tes

a) Didasarkan atas isi dan tujuan-tujuan umum bagi sekolah-sekolah (yang

sejenis) diseluruh negara atau daerah.

b) Berhubungan dari bagian-bagian yang luas dari pengetahuan,

kecakapan atau keterampilan, biasanya dengan hanya sejumlah item

yang diperlukan untuk mengukur suatu skill atau topic tertentu.

c) Dikembangkan dengan bantuan penulis-penulis professional, para ahli

me-review dan editor-editor soal tes.

d) Menggunakan item-item yang telah di-tryout-kan, dianalis, direvisi,

sebelum menjadi bagian dari tes itu.

e) Memiliki keadaan yang tinggi

f) Memiliki ukuran-ukuran untuk bermacam-macam kelompok yang

secara luas mewakili performance seluruh negara atau daerah.

15

Techaer – made test

a) Berdasarkan isi dan tujuan-tujuan khusus untuk kelas atau sekolah di

tempat guru itu mengajar.

b) Dapat menyangkut topik, kecakapan, atau keterampilan khusus dan

tertentu, tetapi dapat juga menyangkut bagian-bagian yang lebih luas

dari pengetahuan dan keterampilan.

c) Biasanya dikembangkan oleh seorang guru dengan sedikit atau tanpa

bantuan dari luar.

d) Menggunakan item-item yang jarang atau tidak pernah di-tryout-kan, di

analisis, atau direvisi sebelum menjadi bagaian dari tes tersebut.

e) Memiliki kendala yang sedang atau rendah.

f) Biasanya terbatas pada suatu kelas atau sekolah sebagai kelompok

pemakainya.

3. Berdasarkan dari banyaknya peserta yang mengikuti tes, yaitu:

a. Tes individual (individual test)

Tes individual merupakan tes dimana tester hanya berhadapan dengan satu

orang testee saja.

b. Tes kelompok (group test)

Tes kelompok merupakan tes dimana tester berhadapan dengan lebih dari

satu orang testee.

4. Berdasarkan waktu yang disediakan bagi testee untuk melaksanakan tes,yaitu:

16

a. Power test

Power test merupakan tes dimana waktu yang disediakan buat testee untuk

menyelesaikan tes tidak terbatas.

b. Speed test

Speed test merupakan tes dimana waktu yang disediakan buat testee untuk

menyelesaikan tes dibatasi.

5. Berdasarkan bentuk responnya, yaitu:

a. Tes verbal (verbal test)

Tes verbal merupakan tes yang menghendaki jawaban yang tertuang dalam

bentuk kata-kata atau kalimat, baik secara lisan maupun tertulis.

b. Tes non-verbal (non-verbal test)

Tes non-verbal merupakan tes yang menghendaki jawaban bukan berupa

ungkapan kata-kata atau kalimat, melainkan berupa tindakan atau tingkah

laku.

6. Berdasarkan cara mengajukan pertanyaan dan cara memberikan jawaban, yaitu:

a. Tes tertulis (pencil and paper test)

Tes tertulis merupakan tes dimana tester dalam mengajukan butir-butir

pertanyaan atau soalnya dilakukan secara tertulis dan testee memberikan

jawabannnya juga secara tertulis.

b. Tes lisan (non-pencil and paper test)

Tes lisan merupakan tes dimana tester dalam mengajukan butir-butir

pertanyaan atau soalnya dilakukan secara tidak tertulis (lisan) dan testee

memberikan jawabannya juga tidak tertulis.

17

7. Berdasarkan dari segi bentuk soal dan kemungkinan jawabannya, yaitu:

a. Tes Essay (Uraian)

Tes Essay adalah tes yang disusun dalam bentuk pertanyaan terstruktur

dan siswa menyusun, mengorganisasikan sendiri jawaban tiap pertanyaan

itu dengan bahasa sendiri. Tes essay ini sangat bermanfaat untuk

mengembangkan kemampuan dalam menjelaskan atau mengungkapkan

suatu pendapat dalam bahasa sendiri.

b. Tes Objektif

Tes objektif adalah tes yang disusun sedemikian rupa dan telah disediakan

alternatif jawabannya. Tes ini terdiri dari berbagai macam bentuk, antara

lain ;

a) Tes Betul-Salah (TrueFalse)

b) Tes Menjodohkan (Matching)

c) Tes Analisa Hubungan (Relationship Analysis)

d) Tes Pilihan Ganda (Multiple Choice)

2.2.4 Karakteristik Tes yang Baik

Arikunto (2010) menyatakan bahwa suatu tes dapat dikatakan sebagai alat

pengukur yang baik jika memenuhi karakteristik berikut ini yaitu:

1. Memiliki validitas

Tes dikatakan memiliki validitas jika tes tersebut dengan secara tepat,

secara benar, secara shahih, atau secara absah dapat mengukur apa yang

seharusnya diukur, yaitu mengukur hasil belajar yang telah dicapai oleh

siswa setelah mereka menempuh proses belajar mengajar dalam jangka

18

waktu tertentu. Untuk menganalisis validitas suatu tes dapat dianalisis secara

logika (logical analysis) dan secara empirik (empirical analysis).

2. Memiliki reliabilitas

Tes dikatakan memiliki reliabilitas jika hasil-hasil pengukuran yang

dilakukan dengan menggunakan tes tersebut secara berulang kali terhadap

subjek yang sama, senantiasa menunjukkan hasil yang tetap atau sifatnya

stabil. Dengan kata lain, tes memiliki reliabel jika nilai-nilai yang diperoleh

para testee adalah stabil kapan saja, dimana saja, dan oleh siapa saja ujian

itu dilaksanakan, diperiksa dan dinilai.

3. Memiliki objektivitas

Tes dikatakan memiliki objektivitas jika tes tersebut disusun dan

dilaksanakan menurut tujuan instruksional khusus yang telah ditentukan,

bukan atas kemauan dan kehendak dari tester, serta dalam pemberian skor

dan penentuan nilai harus terhindar dari unsur-unsur subjektivitas tester.

4. Memiliki praktikabilitas

Tes dikatakan memiliki praktikabilitas jika tes tersebut praktis

(mudah dilaksanakan, mudah pemeriksaannya, dan dilengkapi dengan

petunjuk-petunjuk yang jelas) dan mudah mudah pengadministrasiannya.

5. Memiliki nilai ekonomis

Tes dikatakan memiliki nilai ekonomis jika pelaksanaan tes tersebut

tidak membutuhkan ongkos/biaya yang mahal, tenaga banyak, dan waktu

yang lama.

19

2.2.5 Langkah-Langkah untuk Menyusun Tes

Purwanto (2008:30) menyatakan bahwa para ahli penyusunan tes maupun

para pengajar umumnya telah menyepakati langkah-langkah sebagai berikut:

1. Menetapkan tujuan tes

Sebelum tes dibuat, hendaknya tujuan pembuatan tes harus jelas seperti tes

yang bertujuan untuk mengadakan seleksi, mendiagnosis kesulitan belajar

siswa, dan lain sebagainya.

2. Analisis kurikulum

Analisis kurikulum bertujuan untuk menentukan bobot setiap pokok

bahasan yang akan dijadikan dasar dalam menentukan jumlah item atau

butir soal untuk setiap pokok bahasan soal objektif atau bobot soal untuk

bentuk uraian, dalam membuat kisi-kisi tes sesuai dengan kurikulum yang

berlaku.

3. Analisis buku pelajaran dan sumber dari materi belajar lainnya

Analisis buku pelajaran dan sumber dari materi belajar lainnya bertujuan

untuk menentukan bobot setiap pokok bahasan berdasarkan jumlah

halaman materi yang termuat dalam buku pelajaran atau sumber materi

belajar lainnya dengan harapan dapat mencakup seluruh construct atau

content yang diajarkan.

4. Membuat kisi-kisi

Kisi – kisi bermanfaat untuk menjamin sampel soal yang baik yaitu

mencakup semua pokok bahasan secara proporsional. Sebuah kisi-kisi

20

memuat jumlah butir yang harus dibuat untuk setiap bentuk soal dan setiap

pokok bahasan serta untuk setiap aspek kemampuan yang hendak diukur.

5. Penulisan Tujuan Instruksional Khusus (TIK)

Penulisan TIK harus sesuai dengan ketentuan yang telah ditetapkan yang

mencerminkan tingkah laku siswa.

6. Penulisan soal

Banyaknya butir soal yang harus dibuat untuk setiap bentuk soal dan untuk

setiap pokok bahasan, serta untuk setiap aspek kemampuan yang hendak

diukur harus disesuaikan dengan yang tercantum dalam kisi-kisi.

7. Reproduksi tes terbatas

Tes yang sudah dibuat diperbanyak dalam jumlah yang cukup menurut

jumlah sampel uji-coba atau peserta yang akan mengerjakan tes tersebut

dalam suatu kegiatan uji-coba tes.

8. Uji-coba tes

Tes yang sudah dibuat dan sudah direproduksi atau diperbanyak itu diuji

cobakan kepada sejumlah sampel yang telah ditentukan. Sampel uji-coba

harus mempunyai karakteristik yang kurag lebih sama dengan karakteristik

peserta tes sesungguhnya.

9. Analisis hasil uji-coba

Berdasarkan data hasil uji-coba dilakukan analisis, terutama analisis butir

soal yang meliputi validitas butir, tingkat kesukaran, dan fungsi pengecoh.

Soal-soal yang tidak valid akan didrop dan soal-soal yang valid akan

ditetapkan untuk dipakai atau dirakit menjadi suatu tes yang valid.

21

10. Revisi soal

Soal-soal yang valid berdasarkan kriteria validitas empiric dikonfirmasikan

dengan kisi-kisi. Apabila soal-soal tersebut sudah memenuhi syarat dan

telah mewakili semua materi yang akan diujikan, soal-soal tersebut

selanjutnya dirakit menjadi sebuah tes, tetapi apabila soal-soal yang valid

belum memenuhi syarat berdasarkan hasil konfirmasi dengan kisi-kisi maka

dapat dilakukan perbaikan terhadap beberapa soal yang diperlukan.

11. Merakit soal menjadi tes

Soal-soal yang valid dan telah mencerminkan semua pokok bahasan serta

aspek kemampuan yang hendak diukur dapat dirakit menjadi sebuah tes

yang valid. Urutan soal dalam suatu tes pada umumnya dilakukan menurut

kesukaran soal, yaitu dari soal mudah sampai soal yang sulit.

2.2.6 Tes Sebagai Hasil Belajar Kognitif

Dalam penyusunan tes perlu diperhatikan tipe hasil belajar atau tingkat

kemampuan berpikir mana saja yang akan diukur atau dinilai. Untuk menentukan

tipe hasil belajar atau tingkat kemampuan berpikir yang akan dinilai, penyusun tes

dapat berpedoman pada indikator pembelajaran atau tujuan evaluasi itu sendiri.

Sehingga pemilihan alat evaluasi dan penyusunan instrumen tes akan tepat sesuai

dengan tingkat kemampuan peserta didik ( Purwanto, 2008).

Bloom membagi tingkat kemampuan atau tipe hasil belajar yang termasuk

aspek kognitif menjadi enam yaitu pengetahuan hafalan, pemahaman atau

komprehensif, penerapan atau aplikasi, analisis dan sintesis, evaluasi serta

kreativitas. Berikut adalah penjelasannya yaitu:

22

1. Mengetahui (C1) atau knowledge ialah tingkat kemampuan yang hanya

meminta responden atau testee untuk mengenal atau mengetahui adanya

konsep, fakta, atau istilah-istilah tanpa harus mengerti atau dapat menilai

atau dapat menggunakannya. Dalam hal ini biasanya testee hanya dituntut

untuk menyebutkan kembali (recall) atau menghafal saja.

2. Memahami (C2) adalah tingkat kemampuan yang mengharapkan testee

mampu memahami arti atau konsep, situasi serta fakta yang diketahuinya.

Dalam hal ini testee tidak hanya hafal secara verbal akan tetapi juga

memahami konsep dari masalah atau fakta yang ditanyakan

3. Menerapkan (C3) adalah penggunaan abstraksi pada situasi konkret atau

situasi khusus. Testee dituntut kemampuannya untuk menerapkan atau

menggunakan apa yang telah diketahuinya dalam situasi baru baginya

(diabstrakkan). Abstraksi ini dapat berupa ide, teori, atau petunjuk praktis.

4. Menganalisis (C4) adalah kemampuan yang mengukur testee untuk

menganalisis atau menguraikan suatu integritas atau situasi tertentu ke

dalam komponen-komponen atau unsur-unsur pembentuknya. Diharapkan

siswa dapat memahami dan sekaligus mampu memilah-milahnya menjadi

bagian-bagian, termasuk juga menguraikan bagaimana proses terjadinya

sesuatu, cara bekerjanya sesuatu, atau mungkin juga sistematikanya.

Sedangkan kemampuan sintesis adalah penyatuan unsur-unsur atau bagian

bagian ke dalam suatu bentuk yang menyeluruh. Diharapkan testee mampu

menemukan hubungan kausal atau urutan tertentu atau menemukan

abstraksinya yang berupa integritas.

23

5. Mengevaluasi (C5) adalah kemampuan testee untuk membuat suatu

penilaian tentang suatu pernyataan, konsep, situasi, dan sebagainya

berdasarkan suatu kriteria tertentu. Kegiatan penilaian dapat dilihat dari segi

tujuannya, gagasannya, cara bekerjanya, cara pemecahannya, metodenya,

materinya atau lainnya.

6. Mengkreasi (C6) adalah tingkat kemampuan untuk merancang, membangun,

merencanakan, memproduksi, menemukan, membaharui, menyempurnakan,

memperkuat dan menggubah sesuatu menjadi baru (Ratumanan dan laurens,

2011).

2.2.7 Bentuk Soal Tes Pilihan Ganda

Soal pilihan ganda merupakan bentuk soal yang jawabannnya dapat

dipilih dari beberapa kemungkinan jawaban yang telah disediakan. Konstruksinya

terdiri dari pokok soal dan pilihan jawaban. Pilihan jawaban terdiri atas kunci dan

pengecoh. Kunci harus merupakan jawaban benar atau paling benar sedangkan

pengecoh merupakan jawaban tidak benar, namun daya jebak harus berfungsi,

artinya siswa memungkinkan memilihnya jika tidak menguasai materi

(Depdiknas, 2007).

Menurut Sudjana (2008:48) soal pilihan ganda adalah bentuk tes yang

mempunyai satu jawaban yang benar atau paling tepat. Dilihat dari strukturnya,

bentuk soal pilihan ganda terdiri atas: a) Stem – pertanyaan atau pernyataan yang

berisis permasalahan yang akan ditanyakan, b) Option – sejumlah pilihan atau

alternative jawaban, c) Kunci – jawaban yang benar atau yang paling tepat, d)

Distractor – jawaban-jawaban lain selain kunci jawaban.

24

Soal pilihan ganda dapat diskor dengan mudah, cepat dan memiliki

objektivitas yang tinggi, mengukur berbagai tingkatan kognitif, serta dapat

mencakup ruang lingkup materi yang luas dalam suatu tes. Bentuk ini sangat tepat

digunakan untuk ujian berskala besar dan hasilnya harus segera diumumkan,

seperti ujian nasional dan ujian akhir sekolah. Hanya saja, untuk menyusun soal

pilihan ganda bermutu perlu waktu lama dan biaya cukup besar, disamping itu,

penulis soal akan kesulitan membuat pengecoh yang homogen dan berfungsi,

terdapat peluang untuk menebak kunci jawaban, dan peserta mudah mencontek

kunci jawaban. Secara umum, setiap soal pilihan ganda terdiri dari pokok soal

(stem) dan pilihan jawaban (option). Pilihan jawaban terdiri atas kunci jawaban

dan pengecoh (distractor) (Depdiknas, 2007).

Menurut Sudjana (2008:49) bentuk soal tes pilihan ganda memiliki kebaikan dan kelemahan diantaranya sebgai berikut: Kebaikan bentuk soal tes pilihan ganda

(1) Materi yang diujikan dapat mencakup sebagian besar dari bahan pengajaran yang telah diberikan.

(2) Jawaban siswa dapat dikoreksi (dinilai) dengan mudah dan cepat dengan menggunakan kunci jawaban.

(3) Jawaban untuk setiap pertanyaan sudah pasti benar atau salah sehingga penilaiannya bersifat objektif.

Kelemahan bentuk soal tes pilihan ganda (1) Kemungkinan untuk melakukan tebakan jawaban masih cukup besar. (2) Proses berpikir siswa tidak dapat dilihat dengan nyata.

2.2.8 Bentuk Soal Tes Uraian

Menurut Ratumanan dan laurens (2008:67), tes uraian tepat digunakan

untuk mengukur kemampuan mengorganisasikan, menuangkan gagasan,

mengekspresikan gagasan, menganalisis, atau kemampuan tingkat tinggi lainnya

yang tidak dapat diukur menggunakan tes pilihan gada atau objektif lainnya.

Sedangkan menurut Sudjana (2008:35) tes uraian disebut juga essay, merupakan

25

alat penilaian yang hasil belajar yang paling tua. Secara umum tes uraian ini

adalah pertanyaan yang menuntut siswa menjawab dalam bentuk menguraikan,

menjelaskan, mendiskusikan, membandingkan, memberikan alasan, dan bentuk

lain yang sejenis sesuai dengan tuntutan pertanyaan dengan menggunakan kata-

kata dan bahasa sendiri, Dengan demikian, dalam tes ini dituntut kemampuan

siswa dalam mengekspresikan gagasannya melalui bahasa tulisan.

Menurut Sudjana (2008:36) bentuk soal tes uraian memiliki kebaikan dan kelemahan diantaranya sebgai berikut: Kebaikan bentuk soal tes uraian:

(1) Dapat mengukur proses mental yang tinggi atau aspek kognitif tingkat tinggi;

(2) Dapat meningkatkan kemampuan berbahasa, baik lisan maupun tulisan, dengan bail dan benar sesuai dengan kaidah-kaidah bahasa;

(3) Dapat melatih kemampuan berfikir teratur atau penalaran, yakni berfikir logis, analitis dan sistematis;

(4) Mengembangkan keterampilan pemecahan masalah (problem solving); (5) Adanya keuntungan teknis seperti mudah membuat soalnya sihingga tanpa

memakan waktu yang lama, guru dapat secara langsung melihat proses berfikir siswa.

Kekurangan bentuk soal tes uraian: (1)Sampel tes sangat terbatas sebab dengan tes ini tidak mungkin dapat

menguji semua bahan yang telah diberikan, tidak seperti pada tes objektif yang dapat menanyakan banyak hal melalui sejumlah pertanyaan.

(2)Sifatnya sangat subjektif, baik dalam menanyakan, dalam membuat pertanyaan, maupun dalam cara memeriksanya.

(3)Tes ini bisaanya kurang reliabel, mengungkap aspek yang terbatas, pemeriksaannya memerlukan waktu lama sehingga tidak praktis bagi kelas yang jumlah siswanya relatif besar.

2.3 Analisis Butir Soal

Analisis butir soal atau analisis item adalah pengkajian pertanyaan-

pertanyaan tes agar diperoleh perangkat tes yang memiliki kualitas yang memadai.

Ada dua jenis analisis butir soal, yakni analisis tingkat kesukaran soal dan analisis

daya pembeda disamping validitas dan reliabilitas. Menganalisis tingkat

kesukaran pada soal artinya mengkaji soal-soal tes dari segi kesulitannya sehingga

26

dapat diperoleh soal-soal mana yang termasuk mudah, sedang dan sukar.

Sedangkan menganalisis daya pembeda artinya mengkaji soal-soal tes dari segi

kesanggupan tes tersebut dalam membedakan siswa yang termasuk dalam kategori

lemah atau rendah dan kategori kuat atau tinggi prestasinya. Sedangkan validitas

dan reliabilitas mengkaji kesulitan pertanyaan tes (Sudjana, 2008:135).

Menurut Aiken (dalam Ratumanan dan laurens, 2008), analisis butir soal

bertujuan untuk membantu meningkatkan tes melalui revisi atau membuang soal

yang tidak efektif, serta untuk mengetahui informasi diagnostic pada peserta didik

apakah mereka sudah/ belum memahami materi yang telah diajarkan. Kualitas

butir soal dapat dilakukan dengan cara menganalisis butir soal melalui analisis

empiric atau validitas empiric meliputi tingkat kesukaran, daya beda, validitas,

reliabilitas dan kualitas pengecoh untuk soal pilihan ganda dan analisis teoritik

atau validitas logis yang meliputi isi, konstruksi dan bahasa.

2.3.1 Analisis empirik

2.3.1.1 Tingkat Kesukaran

Tingkat kesukaran adalah angka yang menunjukan proporsi siswa yang

menjawab betul suatu soal (Slameto, 2001). Jika semua atau bagian peserta didik

dapat menjawab atau menyelesaikan soal dengan benar, maka soal tersebut dapat

dikategorikan sebagai soal mudah. Sebaliknya jika semua atau sebagian besar

peserta didik tidak dapat menyelesaikan soal tersebut dengan benar, maka soal

tersebut dikategorikan sebagai soal sulit. Sedangkan menurut Taruh (2008) tingkat

kesukaran butir soal sangat dipengaruhi oleh tingkat kemampuan anggota

kelompok pada tes. Tingkat kesukaran berada pada interval 0,0 sampai 1.

27

Semakin tinggi tingkat kesukaran soal berarti semakin mudah soal tersebut dan

sebaliknya semakin rendah tingkat kesukaran soal berarti semakin sukar soal

tersebut .

2.3.1.2 Validitas

Validitas yaitu ketepatan mengukur yang dimiliki oleh sebutir item (yang

merupakan bagian tak terpisahkan dari tes sebagai suatu totalitas), dalam

mengukur apa yang seharusnya diukur lewat butir item tersebut (Sudijono, 2001).

Suatu alat penilaian dikatakan mempunyai validitas yang tinggi apabila

alat penilaian tersebut mampu mengukur apa yang seharusnya diukur (Purwanto,

2008). Arikunto (2001) menjelaskan adanya empat bentuk validitas yaitu:

validitas isi, validitas konstruksi, validitas yang ada sekarang, dan validitas

prediksi.

Sebuah tes disebut memiliki validitas isi apabila tes tersebut mengukur

tujuan khusus tertentu yang sejajar dengan materi atau isi pelajaran yang

diberikan. Alat tes yang dianggap layak dan dapat dipertanggungjawabkan

validitas isinya apabila dalam penyusunannya mendasarkan diri pada tabel kisi-

kisi. Nurgiyantoro (1987) (dalam Purwanto 2008) menjelaskan bahwa validitas isi

merujuk pada kesesuaian antara butir-butir soal dengan tujuan dan bahan

pengajaran. Karena tujuan dan bahan pengajaran tersebut tercantum pada tabel

kisi-kisi sehingga tidak salah apabila dikatakan bahwa penyusunan butir-butir soal

yang mendasar pada Tabel kisi-kisi dianggap layak dan dapat

dipertanggungjawabkan validitas isinya. Secara sederhana dapat dikatakan bahwa

28

tes yang disusun tidak boleh keluar dari isi mata pelajaran yang ada di dalam

kurikulum.

Sebuah tes dikatakan memiliki validitas konstruksi apabila butir-butir soal

yang membangun tes tersebut mengukur setiap aspek berpikir (ingatan,

pemahaman dan aplikasi) seperti yang disebutkan dalam indikator dalam Tabel

kisi-kisi. Validitas isi dan validitas konstruksi ini digolongkan ke dalam validitas

logis atau validitas rasional (Arikunto, 2001). Untuk mengetahui tingkat validitas

rasional dapat dilakukan dengan mengadakan analisis rasional (Nurkancana,

1986) dalam Sudjana (2008), yaitu analisis berdasarkan pikiran-pikiran yang logis

bahan-bahan apa yang perlu dikemukakan dalam suatu tes. Jika penganalisaan

secara rasional itu menunjukan hasil yang membenarkan tentang telah

tercerminnya tujuan instruksional khusus itu di dalam tes hasil belajar yang telah

memiliki validitas isi maupun validitas konstruksi.

Menurut Sudijono (2001), upaya lain yang dapat ditempuh dalam rangka

mengetahui validitas isi dan validitas konstruksi sebuah tes hasil belajar adalah

dengan jalan menyelenggarakan diskusi panel. Dalam diskusi tersebut para pakar

yang dipandang memiliki keahlian yang ada hubungannya dengan mata pelajaran

yang diujikan, diminta pendapat dan rekomendasinya terhadap isi atau materi

yang terkandung dalam tes hasil belajar yang bersangkutan. Adapun sebuah tes

dikatakan memiliki validitas ada sekarang (concurent validity) jika hasilnya sesuai

dengan pengalaman. Nurkancana (1986) (dalam Sudjana, 2008) menjelaskan,

untuk menilai validitas ada sekarang dapat dilakukan dengan jalan

mengkorelasikan hasil-hasil yang dicapai dalam tes yang sejenis yang telah

29

diketahui mempunyai validitas yang tinggi. Sedangkan sebuah tes memiliki

validitas ramalan apabila mempunyai kemampuan untuk meramalkan apa yang

akan terjadi pada masa yang akan datang. Cara pengujian dengan jalan mencari

korelasi antara nilai-nilai yang dicapai oleh anak-anak dalam tes tersebut dengan

nilai-nilai yang dicapai kemudian.

2.3.1.3 Reliabilitas

Menurut Gualford (1978) dalam Dewanto (1995), realibilitas adalah

proporsi dari varian dengan varian yang sesungguhnya. Reliabilitas suatu tes pada

hakekatnya menguji keajegan pertanyaan tes yang di dalamnya berupa

seperangkat butir soal apabila diberikan berulang kali pada objek yang sama.

Suatu tes dikatakan reliabel apabila beberapa kali pengujian menunjukan hasil

yang relatif sama (Sudjana, 2008).

Menurut (Sudjana, 2008:148), untuk melakukan analisis reliabilitas suatu

tes dapat digunakan beberapa metode yaitu:

1) Reliabilitas tes ulang

Tes ulang adalah penggunaaan alat penilaian terhadap subjek yang sama,

dilakukan dua kali dalam waktu yang berlainan.

2) Reliabilitas belah dua

Reliabilitas belah dua mirip dengan reliabilitas pecahan setara, terutama

dalam pelaksanaannya. Butir-butir soal dibagi menjadi dua bagian yang

sebanding, biasanya dengan membedakan soal nomor genap dengan soal

nomor ganjil.

30

3) Kesamaan rasional

Prosedur menghitung reliabilitas tanpa melakukan korelasi dari dua

pengukuran atau pecahan setara atau belah dua. Prosedur ini dilakukan

dengan menghubungkan setiap butir dalam satu tes dengan butir-butir

lainnya dalam tes itu sendiri secara keseluruhan.

Reliabilitas dapat tinggi dapat rendah. Ada faktor-faktor yang

mempengaruhi koefisien reliabilitas. Faktor-faktor tersebut adalah: panjang

pendeknya tes, kadar homogenitas tes, rentangan kemampuan siswa, luas dan

tidaknya sampel yang diambil, suasana dan kondisi waktu tes serta keakuratan

penskoran (Purwanto, 2008).

Dengan demikian, untuk memperoleh hasil penilaian yang sesuai dengan

tuntutan syarat-syarat penilaian (valid dan reliabel) maka pemilihan alat penilaian

menjadi sangat penting. Hal ini disebabkan karena kemampuan dari siswa yang

akan diungkapkan ditentukan oleh alat penilaian yang akan digunakan.

2.3.1.4 Daya Pembeda

Daya pembeda item adalah kemampuan suatu butir item tes hasil belajar

untuk dapat membedakan antara testee yang berkemampuan tinggi dengan testee

yang kemampuannya rendah demikian rupa sehingga sebagian besar testee yang

memiliki kemampuan yang tinggi untuk menjawab butir item tersebut lebih

banyak menjawab butir item tersebut lebih banyak yang menjawab betul,

sementara testee yang kemampuannya rendah untuk menjawab butir item tersebut

sebagian besar tidak dapat menjawab item dengan betul (Sudijono, 2001).

31

Menurut (Sudjana, 2008:141), daya pembeda mengkaji butir-butir soal

dengan tujuan untuk mengetahui kesanggupan soal dalam membedakan siswa

yang tergolong mampu (tinggi prestasinya) dengan siswa yang tergolong kurang

mampu atau lemah prestasinya. Artinya, bila soal tersebut diberikan kepada anak

yang mampu, hasilnya menunjukkan prestasi yang tinggi; dan bila diberikan pada

siswa yang lemah, hasilnya rendah.

2.3.1.5 Distraktor

Distraktor hanya untuk soal pilihan ganda, distractor yaitu suatu pola yang

dapat menggambarkan bagaimana testee menentukan pilihan jawabanannya

terhadap kemungkinan jawabn-jawaban yang telah dipasangkan pada butir item

(Sudijono, 2001). Suatu option dikatakan efektif jika memenuhi fungsi atau tujuan

disajikannya option tersebut. Hal ini berarti bahwa setiap option yang disajikan

memiliki kemungkinan yang sama untuk dipilih, jika testee menjawab soal

tersebut dengan cara menerka (spekulasi).

Kusaeri (2012: 107) mengemukakan bahwa: “Pengecoh adalah jawaban

yang tida benar atau kurang tepat, namun memungkinkan seseorang terkecoh

untuk memilihnya apabila ia tidak menguasai materi dengan baik”. Jawaban

pengecoh yang terdapat pada soal-soal obyektif atau pilihan ganda yang

digunakan untuk mengecoh siswa sebagai peserta tes. Oleh karena itu jawaban

pengecoh harus diformulasikan sedemikian rupa agar berfungsi dengan baik dan

tepat sasaran.

32

2.3.2 Analisis teoritik/ validitas logis

Ada beberapa teknik yang dapat dilakukan untuk menganalisis butir soal

secara kualitatif, diantaranya adalah teknik panel. Teknik panel merupakan teknik

menelaah butir soal berdasarkan kaidah penulisan butir soal yaitu ditelaah dari

segi materi, konstruksi dan bahasa yang dilakukan oleh beberapa penelaah.

Kriteria telaah dari segi materi, konstruksi, dan bahasa adalah sebagai berikut:

1) Materi

Dari segi materi yang harus diperhatikan adalah:

a. Kesesuaian soal dengan indikator, apabila soal didasarkan atas kisi-kisi yang

memuat indikator soal harus sesuai dengan kisi-kisi

b. Kesesuaian materi yang diukur dengan kompetensi relevansi, kontinuitas,

keterpakaian sehari-hari tinggi.

c. Pilihan jawaban homogen dan logis.

d. Hanya ada satu kunci jawaban.

2) Konstruksi

a. Pokok soal dirumuskan dengan singkat, jelas, dan tegas.

b. Rumusan pokok soal dan pilihan jawaban merupakan pernyataan yang

diperlukan saja.

c. Pokok soal tidak memberi petunjuk kunci jawaban.

d. Pokok soal bebas dari pernyataan yang bersifat negatif ganda.

e. Pilihan jawaban homogeny dan logis ditinjau dari segi materi.

f. Gambar, Grafik, Tabel, diagram, atau sejenisnya jelas dan berfungsi.

g. Panjang pilihan jawaban relatif sama.

33

h. Pilihan jawaban tidak menggunakan pernyataan “semua jawaban di atas

salah/benar” dan sejenisnya.

i. Pilihan jawaban yang berbentuk angka/waktu disusun berdasarkan urutan

besar kecilnya angka atau kronologisnya.

j. Butir soal tidak bergantung pada jawaban soal sebelumnya.

3) Bahasa

a. Menggunakan bahasa yang sesuai dengan kaidah bahasa Indonesia.

b. Menggunakan bahasa yang komunikatif.

c. Tidak menggunakan bahasa yang berlaku setempat/ tabu.

d. Pilihan jawaban tidak mengulang kata/kelompok kata yang sama,

e. kecuali merupakan satu kesatuan pengertian (Suke Silverius 1991 : 80-

81).