analisis kualitas butir soal ulangan tengah …digilib.unila.ac.id/61690/3/3. skripsi full tanpa bab...
TRANSCRIPT
ANALISIS KUALITAS BUTIR SOAL ULANGAN TENGAH SEMESTERGANJIL PADA MATA PELAJARAN BIOLOGI
(Studi Kasus Kelas X, XI, dan XII MIPA SMA Negeri 11 Bandar LampungTahun 2019/2020)
(SKRIPSI)
Oleh
BELLA ANDRIANA YOLANDA
FAKULTAS KEGURUAN DAN ILMU PENDIDIKANUNIVERSITAS LAMPUNG
BANDAR LAMPUNG2020
ii
ABSTRAK
ANALISIS KUALITAS BUTIR SOAL ULANGAN TENGAH SEMESTERGANJIL PADA MATA PELAJARAN BIOLOGI
(Studi Kasus Kelas X, XI, dan XII SMA Negeri 11 Bandar Lampung Tahun2019/2020)
Oleh
BELLA ANDRIANA YOLANDA
Penelitian ini dilakukan dengan tujuan untuk mengetahui kualitas butir soal tes
pilihan ganda mata pelajaran biologi kelas X, XI, dan XII SMA Negeri 11 Bandar
Lampung tahun ajaran 2019/2020. Metode penelitian yang digunakan adalah
metode deskriptif dengan pendekatan kuantitatif.
Sampel penelitian adalah seluruh lembar jawaban ulangan tengah semester kelas
X MIPA, XI MIPA, dan XII MIPA yang berjumlah 180 peserta didik. Teknik
pengumpulan data yang dilakukan dengan menggunakan teknik dokumentasi.
Data yang dikumpulkan berupa soal pilihan ganda ulangan tengah semester ganjil
mata pelajaran biologi, kunci jawaban, dan seluruh lembar jawaban peserta didik
yang mengikuti tes. Kemudian untuk proses analisis butir soal dilakukan dengan
menggunakan program komputer Anates versi 4.09 dimana program tersebut akan
menganalisis butir soal dari segi validitas, reliabilitas, tingkat kesukaran, daya
iii
pembeda dan efektivitas pengecoh yang kemudian akan menyimpulkan kualitas
butir soal.
Hasil penelitian yang dilakukan menunjukkan bahwa kualitas butir soal pilihan
ganda ulangan tengah semester ganjil mata pelajaran biologi memiliki kualitas
yang kurang baik.
Kata kunci : analisis butir soal, Anates Versi 4
ANALISIS KUALITAS BUTIR SOAL ULANGAN TENGAH SEMESTERGANJIL PADA MATA PELAJARAN BIOLOGI
(Studi Kasus Kelas X, XI, dan XII MIPA SMA Negeri 11 Bandar LampungTahun 2019/2020)
Oleh
BELLA ANDRIANA YOLANDA
Skripsi
Sebagai salah satu syarat untuk mencapai gelarSARJANA PENDIDIKAN
Pada
Program Studi Pendidikan BiologiJurusan Pendidikan Matematika Ilmu Pengetahuan Alam
Fakultas Keguruan dan Ilmu Pendidikan Universitas Lampung
FAKULTAS KEGURUAN DAN ILMU PENDIDIKANUNIVERSITAS LAMPUNG
BANDARLAMPUNG2020
RIWAYAT HIDUP
Penulis dilahirkan di Bandar Lampung, Provinsi Lampung,
pada tanggal 30 Juni 1995, sebagai anak pertama dari dua
bersaudara, pasangan Bapak Andri Wira Dharma, S.Pd.,
M.Pd., dengan Ibu May Ratna Hidayati. Penulis beralamat
di Perum. Sukajaya Darat RT 002/ RW 005, Kelurahan
Sukajaya Lempasing, Kecamatan Teluk Pandan,
Kabupaten Pesawaran, Provinsi Lampung. Nomor Handphone: 089634237118.
Pendidikan yang ditempuh penulis adalah TK An-Nur (2000-2001), SD Negeri 1
Keteguhan (2001-2007), SMP Negeri 3 Bandar Lampung (2007-2009), SMA
Negeri 3 Bandar Lampung (2009-2013). Pada tahun 2013 penulis terdaftar
sebagai mahasiswa Pendidikan Biologi FKIP Unila melalui jalur seleksi bersama
masuk peguruan tinggi negeri (SBMPTN).
Pada tahun 2016, penulis melaksanakan praktik mengajar melalui Program
Pengalaman Lapangan (PPL) di SMA Negeri 1 Trimurjo Lampung Tengah dan
Kuliah Kerja Nyata (KKN) di Desa Simbarwaringin, Kecamatan Trimurjo,
Lampung Tengah. Tahun 2019 peneliti melakukan penelitian di SMA Negeri 11
MOTTO
“Maka sesungguhnya bersama kesulitan ada kemudahan. Sesungguhnyabersama kesulitan ada kemudahan. Maka apabila engkau telah selesai (darisesuatu urusan), tetaplah bekerja keras (untuk urusan yang lain). Dan hanya
kepada Tuhanmulah engkau berharap”(QS. Al-Insyirah : 6-8)
“setiap orang membutuhkan tiga hal yang akan membuat mereka berbahagia didunia ini, yaitu seseorang untuk dicintai, sesuatu untuk dilakukan dan sesuatu
untuk diharapkan”(Tom Bodett)
Dengan menyebut nama Allah yang Maha pengasih lagi Maha penyayang
PERSEMBAHAN
Alhamdulillahirobbil ‘alamin, segala puji bagi Allah SWT atas segala rahmat danjuga kesempatan dalam menyelesaikan tugas akhir skripsi saya dengan segala
kekurangannya.
Dengan segala cinta dan kasih sayang kupersembahkan karya ini untuk orang-orang yang berharga dalam hidupku dan juga untuk yang selalu bertanya :
“Kapan wisuda?”
Papa (Andri Wira Dharma) dan Mama (May Ratna Hidayati)
Papa yang selalu memberikan support terbaik untuk anak-anaknya, terimakasihatas peluh yang sampai saat ini telah kau kucurkan untuk menjadikanku seperti
sekarang ini. Mama yang selalu ada kapanpun aku membutuhkan tempatbersandar, terimakasih atas do’a yang tak henti-hentinya kau ucapkan untukku.
Tanpa kalian, skripsi ini tidak akan pernah ada.
Adikku (Aldhi Oktariand Rinaldi)
Anak ganteng yang kakak sayangi. Meskipun kamu terlihat cuek dan tak peduli,tapi ketika kakak membutuhkan bantuanmu, kamu bisa diandalkan. Terimakasih
telah membantu menginput data penelitian ketika kakak lelah.
Para Pendidikku (Guru dan Dosenku)
Para pendidikku yang selalu memberi bimbingan dan pengajarannya untukmenaklukan dunia dengan belajar.
Almamater Tercinta Universitas Lampung
SANWACANA
Puji syukur kepada Allah SWT, karena atas berkat rahmat dan karunia-Nya
penulis dapat menyelesaikan skripsi yang berjudul “Analisis Kualitas Butir Soal
Ulangan Tengah Semester Ganjil pada Mata Pelajaran Biologi kelas X, XI, dan
XII MIPA SMA Negeri 11 Bandar Lampung Tahun 2019/2020” sebagai salah
satu syarat untuk memperoleh gelar Sarjana Pendidikan Biologi di FKIP
Universitas Lampung.
Penulis menyadar bahwa dalam penyusunan skripsi ini tidak dapat terlepas dari
peran dan bantuan berbagai pihak. Untuk itu penulis mengucapkan terima kasih
kepada:
1. Prof. Dr. Patuan Raja, M.Pd., selaku Dekan FKIP Universitas Lampung.
2. Dr. Caswita, M.Si., selaku Ketua Jurusan Pendidikan MIPA FKIP Universitas
Lampung.
3. Rini Rita T Marpaung, S.Pd.,M.Pd. selaku Ketua Program Studi Pendidikan
Biologi sekaligus Pembimbing II yang telah memberikan motivasi dan
bimbingan hingga skripsi ini dapat selesai.
4. Berti Yolida, S.Pd.,M.Pd., selaku Pembimbing I atas kesediaannya untuk
memberikan bimbingan, saran, dan kritik, serta memotivasi dan mengarahkan
penulis dalam proses penyelesaian skripsi ini.
xii
5. Drs. Darlen Sikumbang, M. Biomed., selaku Pembahas yang telah banyak
memberikan saran dan kritik yang bersifat positif dan membangun untuk
penyusunan skripsi ini.
6. Para Dosen dan staff Jurusan Pendidikan MIPA Program Studi Pendidikan
Biologi Universitas Lampung yang telah membimbing penulis dalam
pembelajaran.
7. Kepala Sekolah SMA Negeri 11 Bandar Lampung yang telah memberikan izin
untuk melakukan penelitian.
8. Guru Biologi SMA Negeri 11 Bandar Lampung yang telah membantu dan
mendukung penulis dalam penelitian.
9. Peserta didik seluruh kelas X, XI dan XII MIPA SMA Negeri 11 Bandar
Lampung yang telah membantu dalam penelitian.
10. Semua pihak yang telah membantu dalam menyelesaikan skripsi ini.
Semoga Allah SWT melimpahkan berkat dan karunia-Nya kepada kita semua dan
semoga skripsi yang sederhana ini bermanfaat bagi kita semua.
Bandar Lampung, 26 Februari 2020Penulis,
Bella Andriana Yolanda
DAFTAR ISI
Halaman
DAFTAR TABEL
I. PENDAHULUAN
A. Latar Belakang ........................................................................................... 1B. Rumusan Masalah ...................................................................................... 8C. Tujuan Penelitian ....................................................................................... 9D. Manfaat Penelitian ..................................................................................... 10E. Ruang Lingkup Penelitian.......................................................................... 11
II. TINJAUAN PUSTAKA
A. Evaluasi Pendidikan................................................................................... 12B. Tujuan dan Fungsi Evaluasi Pendidikan ................................................... 14C. Prinsip dan Alat Evaluasi Pendidikan........................................................ 16D. Cakupan Evaluasi Pendidkan..................................................................... 18E. Pelaksanaan Evaluasi Pendidikan .............................................................. 19F. Analisis Soal .............................................................................................. 23G. Kerangka Pikir ........................................................................................... 38
III. METODE PENELITIAN
A. Waktu dan Tempat Penelitian .................................................................... 41B. Populasi dan Sampel .................................................................................. 41C. Desain Penelitian ....................................................................................... 42D. Prosedur Penelitian .................................................................................... 42E. Jenis Data dan Teknik Pengambilan Data.................................................. 43F. Instrumen Penelitian .................................................................................. 44G. Teknik Analisis Data.................................................................................. 44
xiv
IV. HASIL PENELITIAN DAN PEMBAHASAN
A. Hasil Penelitian ......................................................................................... 54B. Pembahasan............................................................................................... 61
V. SIMPULAN DAN SARANA. Simpulan .................................................................................................... 71B. Saran ......................................................................................................... 72
DAFTAR PUSTAKALAMPIRAN
DAFTAR TABEL
Tabel Halaman
1. Kriteria Koefisien Reliabilitas..................................................... 332. Klasifikasi Daya Pembeda........................................................... 343. Klasifikasi Indeks Kesukaran...................................................... 364. Kriteria Keberfungsian Pengecoh ............................................... 385. Format Analisis Validitas Isi ....................................................... 456. Kriteria Validitas isi .................................................................... 467. Kriteria Koefisien Reliabilitas..................................................... 488. Klasifikasi Daya Pembeda........................................................... 509. Klasifikasi Indeks Kesukaran...................................................... 5110. Kriteria Keberfungsian Pengecoh ............................................... 5311. Distribusi Soal Pilihan Ganda berdasarkan Daya Pembeda
kelas X MIPA.............................................................................. 5512. Distribusi Soal Pilihan Ganda berdasarkan Daya Pembeda
kelas XI MIPA ............................................................................ 5613. Distribusi Soal Pilihan Ganda berdasarkan Daya Pembeda
kelas XII MIPA ........................................................................... 5714. Distribusi Soal Pilihan Ganda berdasarkan Tingkat Keukaran
kelas X MIPA.............................................................................. 5715. Distribusi Soal Pilihan Ganda berdasarkan Tingkat Keukaran
kelas XI MIPA ............................................................................16. Distribusi Soal Pilihan Ganda berdasarkan Tingkat Keukaran
kelas XII MIPA ........................................................................... 5717. Distribusi Soal Pilihan Ganda berdasarkan Efektivitas Pengecoh
kelas X MIPA.............................................................................. 5818. Distribusi Soal Pilihan Ganda berdasarkan Efektivitas Pengecoh
kelas XI MIPA ............................................................................ 5919. Distribusi Soal Pilihan Ganda berdasarkan Efektivitas Pengecoh
kelas XII MIPA ........................................................................... 6020. Validitas Butir Soal/Item kelas X, XI, dan XII ........................... 61
I. PENDAHULUAN
A. Latar Belakang
Pendidikan memegang peranan yang sangat penting dalam mencerdaskan
kehidupan bangsa, oleh karena itu setiap individu yang terlibat dalam
pendidikan dituntut berperan serta secara maksimal guna meningkatkan
mutu pendidikan. Menurut pendapat Dewey dalam Arifin (2012: 3)
pendidikan adalah sebagai proses pembentukan kemampuan dasar yang
fundamental, yang menyangkut daya berpikir (intelektual) maupun daya
rasa (emosi) manusia.
Tiga bagian yang sangat penting dalam pendidikan adalah kurikulum,
proses pembelajaran, dan penilaian atau evaluasi. Ketiga unsur tersebut
saling berkaitan antara satu dengan yang lainnya. Kurikulum merupakan
penjabaran dari tujuan pendidikan yang menjadi acuan dalam proses
pembelajaran. Proses pembelajaran merupakan suatu proses yang
ditujukan agar peserta didik dapat belajar melalui perencanaan dan
pengaturan lingkungan, sarana, dan prasarana yang mendukung
terwujudnya kegiatan belajar. Penilaian merupakan kegiatan yang
dilakukan untuk mengukur dan menilai tingkat ketercapaian kurikulum
(Nuraeni, 2012: 25).
2
Menurut Arikunto (2018: 4) pendidik adalah pihak yang dianggap paling
bertanggung jawab atas hasil kegiatan belajar mengajar di sekolah,
khususnya di kelas. Dengan demikian, pendidik patut dibekali dengan
evaluasi sebagai ilmu yang mendukung tugasnya, yakni mengevaluasi
hasil belajar peserta didik. Dalam hal ini, pendidik bertugas mengukur
apakah peserta didik sudah menguasai ilmu yang dipelajari oleh peserta
didik atas bimbingan pendidik sesuai dengan tujuan yang dirumuskan.
Senada dengan hal tersebut, Zainal Arifin (2012: 1) mengatakan bahwa
pendidik harus memiliki kemampuan dalam mengevaluasi pembelajaran,
sebab kemampuan melakukan evaluasi pembelajaran merupakan
kemampuan dasar yang mutlak harus dimiliki setiap pendidik atau calon
pendidik.
Kenyataannya permasalahan yang terlihat pada pendidikan sekarang
adalah rendahnya mutu pendidikan di Indonesia dibandingkan dengan
negara - negara sekitar, karena sistem pendidikan di Indonesia belum
berfungsi dengan baik. Menurut survei PISA pada tahun 2012
menunjukkan kualitas pendidikan di Indonesia menurun. Indonesia
termasuk dalam peringkat 6 terbawah dari 64 negara (OECD 2013, PISA
2012 result). Penilaian merupakan salah satu faktor yang menentukan
keberhasilan proses dan hasil belajar, selain itu untuk meningkatkan
kemampuan mengajar pendidik dan membantu peserta didik untuk
mencapai perkembangan belajarnya secara optimal (Arifin, 2009: 5).
Kegiatan untuk menilai atau pemberian nilai atau menentukan suatu
kualitas disebut sebagai evaluasi. Evaluasi pendidikan memerlukan suatu
3
alat evaluasi atau instrumen penilaian untuk dapat memenuhi tujuan secara
lebih efektif dan efisien. Alat evaluasi atau instrumen penilaian memiliki
dua teknik, yaitu teknik tes dan non tes. Teknik nontes meliputi skala
bertingkat, kuesioner, check list, wawancara, observasi dan riwayat hidup
(Arikunto, 2018: 39-44).
Penilaian yang dimaksud adalah penilaian berbasis kelas yang dilakukan
pendidik untuk mengetahui sejauh mana transformasi pembelajaran di
kelas. Salah satu bentuk penilaian berbasis kelas adalah ulangan tengah
semester (tes pilihan ganda dan tes uraian). Evaluasi atau penilaian
merupakan hal penting, karena hasil evaluasi dapat dijadikan cerminan
kualitas suatu sekolah maupun peserta didik.
Menurut Purwanto (2000: 15) evaluasi adalah suatu proses yang sistematis
untuk menentukan atau membuat keputusan sampai sejauh mana tujuan
pelajaran telah dicapai peserta didik. Tes memiliki fungsi sebagai alat ukur
tingkat keberhasilan peserta didik dalam mengikuti proses belajar
mengajar. Prestasi peserta didik sering dijadikan cermin kualitas seorang
peserta didik, bahkan menggambarkan keberhasilan suatu sekolah dalam
menjalankan misi pendidikan yang diembannya.
Kegiatan evaluasi bagi peserta didik mempunyai makna yang sangat
penting yakni peserta didik akan mengetahui sejauh mana keberhasilannya
mengikuti pelajaran yang diberikan oleh pendidiknya dan peserta didik
akan selalu termotivasi untuk selalu meningkatkan pengetahuannya. Bagi
para pendidik dengan adanya evaluasi ini dia akan mengetahui peserta
4
didik mana yang sudah menguasai pelajaran yang telah diberikan dan
mana peserta didik yang belum menguasai sehingga untuk yang belum dia
akan dapat mengadakan pelajaran tambahan ataupun remedial, selain itu
kegiatan evaluasi akan memberi gambaran kepada pendidik apakah materi
yang disampaikan telah tepat bagi peserta didik dan apakah metode
pengajaran yang dibawakan sudah tepat atau belum. Sedangkan bagi
sekolah, proses evaluasi akan memberi gambaran sejauh mana tujuan
pembelajaran yang ditetapkan telah tercapai dari proses belajar mengajar
yang dilaksanakan dan proses evaluasi yang digunakan juga bisa menjadi
pedoman untuk tahun-tahun berikutnya bagi sekolah. Maka dengan
demikian, evaluasi pendidikan merupakan salah satu komponen utama
yang tidak dapat dipisahkan dari pendidikan. Informasi tentang tingkat
keberhasilan pendidikan akan dapat dilihat melalui proses evaluasi.
Arti pentingnya sebuah tes sebagai alat bantu evaluasi, menuntut pendidik
untuk senantiasa mengembangkan kemampuannya dalam menyusun tes.
Bentuk tes dapat berupa subjektif maupun objektif, dapat dilakukan secara
lisan (tes lisan), secara tertulis (tes tertulis), maupun tes perbuatan atau
tindakan. Pada tes tertulis soal dan jawabannya dituangkan dalam bentuk
tulisan. Tes lisan merupakan tes yang berupa pertanyaan. Hal ini
tercantum pada Permendikbud Nomor 66 Tahun 2013 tentang Standar
Penilaian.
Tes objektif dikenal sebagai istilah jawaban pendek atau jawaban singkat.
Kelebihan tes objektif adalah representatif mewakili isi dan luas mata
5
pelajaran, terdiri dari option jawaban yang tersedia, dapat digunakan cepat,
sehingga memungkinkan peserta didik menjawab soal dengan waktu yang
relatif singkat dan pengoreksian jawaban tes dapat diserahkan kepada
orang lain dengan menggunakan kunci jawaban yang tersedia dan tidak
ada unsur subjektif dari penilai, namun tes objektif mempunyai beberapa
kelemahan, yaitu memungkinkan kerjasama antar peserta didik pada
waktu mengerjakan tes, banyak kesempatan asal menebak jawaban atau
untung-untungan, persiapan menyusun tes objektif lebih sulit daripada
menyusun tes subjektif karena soalnya relatif banyak. Soalnya cenderung
untuk mengungkapkan ingatan dan daya pengenalan kembali saja dan
sukar untuk mengukur proses mental yang tinggi (Arikunto, 2018: 110-
111).
Pelaksanaan evaluasi, terdapat dua macam tes, yaitu tes standar
(standardized test) dan tes buatan pendidik (teacher made test). Tes
standar adalah tes yang mengalami proses standarisasi yang disusun oleh
tenaga profesional dan sudah dilakukan uji coba beberapa kali sebelum tes
tersebut diberikan kepada peserta didik, sehingga hasilnya dapat
dipertanggung jawabkan, sedangkan tes buatan pendidik adalah tes yang
disusun oleh seorang pendidik yang belum memiliki keahlian profesional
dalam memilih tes atau mereka memiliki keahlian tetapi tidak sempat
untuk menyusun tes secara baik, menguji coba dan menganalisis sehingga
kualitasnya belum dapat dipertanggung jawabkan. Sebuah tes dapat
dikatakan baik atau berkualitas jika tes tersebut telah memiliki ciri-ciri
sebagai alat ukur yang baik, yaitu memiliki validitas, reliabilitas,
6
obyektifitas, praktibilitas, dan ekonomis. Jadi, setiap soal yang telah
dianalisis akan memberikan informasi taraf kesukaran yang sedang, daya
pembeda yang baik dan pilihan jawaban yang baik, sehingga kualitas dari
butir soal yang disajikan pendidik dapat diketahui validitas dan
reliabilitasnya.
Berdasarkan hasil wawancara dengan pendidik bidang studi biologi di
SMA Negeri 11 Bandar Lampung pada tanggal 13 Maret 2019, diketahui
bahwa instrumen butir soal yang dibuat dan digunakan oleh pendidik pada
ujian tengah semester belum pernah dianalisis dan divalidasi. Hal ini
disebabkan kurangnya waktu luang bagi pendidik bidang studi untuk
melakukan analisis butir soal karena jam mengajar yang padat, dimana
dalam pelaksanaan analisis butir soal tersebut memerlukan waktu yang
cukup banyak. Adanya hal tersebut membuat tes yang dibuat belum
diketahui kehandalan dan keterpercayaannya.
Tujuan utama analisis soal dalam sebuah tes yang dibuat pendidik adalah
untuk mengidentifikasi kekurangan-kekurangan dalam tes atau dalam
pembelajaran. Analisis butir soal penting dilakukan untuk mengetahui soal
yang bermutu dan tidak. Soal yang bermutu adalah soal yang dapat
memberikan informasi yang tepat sesuai dengan tujuannya. Penelitian
mengenai analisis butir soal telah banyak dilakukan oleh peneliti
sebelumnya, beberapa diantaranya penelitian yang dilakukan oleh Lilis Tri
Hariyana dengan judul “Analisis Butir Soal Ulangan Akhir Semester
Gasal IPA Kelas IX SMP 8 Grobon” dan hasil penelitian tersebut
7
menunjukkan tes tidak akan berfungsi dengan baik untuk mengukur
kemampuan atau kompetensi peserta didik jika soal-soal yang diujikan
tidak memiliki kualitas yang baik. Oleh karena itu, instrumen tes yang
belum pernah diujicobakan, dianalisis, dan direvisi cenderung meragukan
dari segi kualitas sebab belum diketahui mutunya. Sementara itu, kualitas
suatu tes sangat bertalian erat dengan kualitas butir soal atau item yang
terdapat di dalamnya. Oleh karena itu agar suatu tes dapat digunakan
untuk mengukur dengan baik apa yang hendak diukur, maka butir-butir
soal yang digunakan dalan tes tersebut harus memiliki mutu yang baik.
Berdasarkan dari penelitian relevan lainnya yang telah dilakukan
sebelumnya oleh Risma Darni dengan judul ”Analisis Butir Soal Buatan
pendidik Hasil Ujian Akhir Semester Ganjil Kelas XI di SMA Negeri 1
Liliriaja Kabupaten Soppeng” disimpulkan bahwa sebaiknya tes yang
digunakan sebagai instrumen evaluasi dianalisis sebelum maupun setelah
tes dilaksanakan, baik dari aspek kualitatif maupun kuantitatif sehingga
dapat diketahui kualitas butir-butir soal yang digunakan, adapun penelitian
relevan lainnya yang telah dilakukan oleh Dira Mustara dengan judul
“Analisis Soal Ulangan Akhir Semester (UAS) Biologi SMA Kelas X
ditinjau dari Taksonomi Bloom” disimpulkan bahwa sebaiknya
pemerintah daerah melakukan pelatihan bagi pendidik-pendidik mata
pelajaran dalam menyusun instrumen evaluasi dan melakukan analisis soal
sehingga diperoleh butir-butir soal yang baik dan bermutu (Risma, 2014:
30).
8
Kegiatan yang dapat dilakukan untuk mengetahui baik tidaknya sebuah
instrumen penilaian adalah kegiatan analisis butir soal, baik secara
kualitatif maupun secara kuantitatif. Dari hasil analisis butir soal tersebuat
akan diketahui butir soal yang baik dan soal yang jelek, sehingga dapat
dilakukan revisi apabila terdapat kekurangan. Dengan demikian, maka
hasil yang diperoleh dari pelaksanaan evaluasi dapat benar-benar
menggambarkan kondisi dari objek evaluasi (Risma, 2014: 20).
Berdasarkan uraian latar belakang tersebut peneliti tertarik melakukan
penelitan yang berjudul “Analisis Kualitas Butir Soal Ulangan Tengah
Semester Ganjil pada Mata Pelajaran Biologi Kelas X, XI, dan XII SMA
Negeri 11 Bandar Lampung tahun pelajaran 2019/2020”.
B. Rumusan Masalah
Berdasarkan latar belakang di atas, maka rumusan masalah dalam
penelitian ini adalah :
1. Bagaimanakah validitas butir soal ulangan tengah semester (UTS)
ganjil tahun pelajaran 2019/2020 pada mata pelajaran Biologi kelas X,
XI, dan XII SMA Negeri 11 Bandar Lampung?
2. Bagaimanakah reliabilitas butir soal ulangan tengah semester (UTS)
ganjil tahun pelajaran 2019/2020 pada mata pelajaran Biologi kelas X,
XI, dan XII SMA Negeri 11 Bandar Lampung?
9
3. Bagaimanakah tingkat kesukaran butir soal ulangan tengah semester
(UTS )ganjil tahun pelajaran 2019/2020 pada mata pelajaran Biologi
kelas X, XI, dan XII SMA Negeri 11 Bandar Lampung?
4. Bagaimanakah daya pembeda butir soal ulangan tengah semester
(UTS) ganjil tahun pelajaran 2019/2020 pada mata pelajaran Biologi
kelas X, XI, dan XII SMA Negeri 11 Bandar Lampung?
5. Bagaimanakah efektifitas pengecoh butir soal ulangan tengah semester
(UTS) ganjil tahun pelajaran 2019/2020 pada mata pelajaran Biologi
kelas X, XI, dan XII SMA Negeri 11 Bandar Lampung?
C. Tujuan Penelitian
Berdasarkan rumusan masalah di atas, tujuan dari penelitian ini adalah
untuk:
1. Mengetahui validitas butir soal ulangan tengah sekolah (UTS) ganjil
tahun pelajaran 2019/2020 pada mata pelajaran Biologi kelas X, XI,
dan XII SMA Negeri 11 Bandar Lampung?
2. Mengetahui reliabilitas butir soal ulangan tengah sekolah (UTS) ganjil
tahun pelajaran 2019/2020 pada mata pelajaran Biologi kelas X, XI,
dan XII SMA Negeri 11 Bandar Lampung?
3. Mengetahui tingkat kesukaran butir soal ulangan tengah sekolah (UTS)
ganjil tahun pelajaran 2019/2020 pada mata pelajaran Biologi kelas X,
XI, dan XII SMA Negeri 11 Bandar Lampung?
10
4. Mengetahui daya pembeda butir soal ulangan tengah sekolah (UTS)
ganjil tahun pelajaran 2019/2020 pada mata pelajaran Biologi kelas X,
XI, dan XII SMA Negeri 11 Bandar Lampung?
5. Mengetahui efektifitas pengecoh butir soal ulangan tengah sekolah
(UTS) ganjil tahun pelajaran 2019/2020 pada mata pelajaran Biologi
kelas X, XI, dan XII SMA Negeri 11 Bandar Lampung?
D. Manfaat Penelitian
Manfaat yang diperoleh dari penelitian ini sebagai berikut:
1. Kegunaan Teoritis
Hasil penelitian ini diharapkan dapat dijadikan bahan informasi bagi
para tenaga pendidik mengenai kualitas butir soal.
2. Kegunaan Praktis
a. Bagi Peneliti
Menambah pengetahuan dan sebagai latihan dalam menganalisis
suatu masalah terutama dalam menganalisis kualitas butir soal
tentang validitas isi, reliabilitas, daya pembeda, tingkat kesukaran
dan efektifitas pengecoh soal.
b. Bagi Pendidik
Hasil penelitian ini dapat dijadikan sebagai referensi/acuan dalam
pembuatan soal yang akan datang sehingga dapat memperbaiki dan
meningkatkan kualitas penyusunan soal.
11
c. Bagi Sekolah
Hasil penelitian ini dapat dijadikan bahan masukan akan kualitas
soal yang dibuat oleh pendidik.
d. Bagi Peneliti Selanjutnya
Hasil penelitian ini dapat dijadikan sebagai acuan dalam menyusun
rancangan penelitian yang lebih baik lagi.
E. Ruang Lingkup Penelitian
Untuk menghindari anggapan yang berbeda terhadap masalah yang akan
dibahas maka peneliti membatasi masalah sebagai berikut :
1. Analisis soal merupakan proses pengumpulan, peringkasan, dan
penggunaan informasi dari jawaban peserta didik untuk membuat
keputusan setiap penilaian.
2. Soal Ulangan Tengah Semester merupakan suatu alat evaluasi yang
harus dilalui oleh peserta didik dalam setiap semester untuk masuk pada
semester berikutnya.
3. Objek pada penelitian ini adalah lembar soal Ulangan Tengah
Semester Ganjil yang dibuat oleh pendidik di SMA Negeri 11 Bandar
Lampung mata pelajaran Biologi tahun pelajaran 2019/2020.
4. Subjek dalam penelitian ini adalah pendidik kelas X, XI, dan XII MIPA
di SMA Negeri 11 Bandar Lampung.
II. TINJAUAN PUSTAKA
A. Evaluasi Pendidikan
Evaluasi diartikan sebagai “a qualitative judgement that uses measurement
results from test and assessment information to assign grades” (suatu
pertimbangan kualitatif yang menggunakan hasil pengukuran lewat
informasi tes dan asesmen untuk menentukan kualitas). Adapun istilah
evaluasi sendiri berasal dari bahasa Inggris evaluation yang secara bahasa
diartikan penilaian atau penaksiran (Sukiman, 2012: 75).
Secara harfiah kata evaluasi berasal dari bahasa Inggris evaluation; dalam
bahasa Indonesia berarti: penilaian. Akar katanya adalah value, dalam
bahasa Indonesia berarti: nilai. Dengan demikian secara harfiah, evaluasi
pendidikan (educational evaluation) dapat diartikan sebagai penilaian
dalam bidang pendidikan atau penilaian mengenai hal-hal yang berkaitan
dengan kegiatan pendidikan. Adapun dari segi istilah, sebagaimana
dikemukakan oleh Edwind Wandt dan Gerald W. Brown (1977)
Evaluation refer to the act or process to determining the value of
something. Menurut definisi ini, maka istilah evaluasi itu menunjukkan
kepada atau mengandung pengertian suatu tindakan atau suatu proses
untuk menentukan nilai dari sesuatu. Apabila definisi evaluasi yang
dikemukakan oleh Edwind Wandt dan Gerald W. Brown itu untuk
13
memberikan definisi tentang evaluasi pendidikan, maka evaluasi
pendidikan itu dapat diberi pengertian sebagai suatu tindakan atau
kegiatan yang dilaksanakan dengan maksud untuk atau suatu proses yang
berlangsung dalam rangka menentukan nilai dari segala sesuatu dalam
dunia pendidikan. Atau dengan kata lain evaluasi pendidikan adalah
kegiatan atau proses penentuan nilai pendidikan, sehingga dapat diketahui
mutu atau hasil-hasilnya (Gito Supriadi, 2011: 3-4).
Menurut Arikunto (2018: 1-3) Istilah yang terkait dengan pekerjaan
evaluasi, yaitu pengukuran dan penilaian. Istilah evaluasi, pengukuran dan
penilaian cenderung diartikan sebagai suatu pengertian yang sama.
Sementara itu sebenarnya terdapat persamaan, perbedaan, dan hubungan
antara ketiganya. Mengukur adalah membandingkan sesuatu dengan satu
ukuran dan bersifat kuantitatif. Menilai adalah mengambil sesuatu
keputusan terhadap sesuatu dengan ukuran baik buruk dan bersifat
kualitatif. Sedangkan mengadakan evaluasi meliputi kedua langkah diatas,
yaitu mengukur dan menilai. Evaluasi berarti menilai (tetapi dilakukan
dengan mengukur terlebih dahulu).
Evaluasi pendidikan (educational evaluation) dapat diartikan sebagai
penilaian dalam bidang pendidikan atau penilaian mengenai hal-hal yang
berkaitan dengan kegiatan pendidikan. Sejalan dengan pendapat-pendapat
tersebut, dapat dikatakan bahwa evaluasi atau penilaian adalah serangkaian
kegiatan untuk memperoleh, menganalisis, dan menafsirkan data tentang
proses dan hasil belajar peserta didik yang dilakukan secara sistematis dan
14
berkesinambungan, sehingga menjadi informasi yang bermakna dalam
pengambilan keputusan. Hal ini tercantum pada Rancangan Penilaian
Hasil Belajar oleh Direktorat Pembinaan SMA yang dibuat pada Juli 2008.
Abdul Haris dan Asep (2013: 37) menjelaskan bahwa inti dari penilaian
adalah proses memberikan atau menentukan terhadap hasil belajar tertentu.
Proses pemberian nilai tersebut berlangsung dalam bentuk interpretasi
yang diakhiri dengan judgement.
B. Tujuan dan Fungsi Evaluasi Pendidikan
Kegiatan evaluasi harus dilaksanakan dengan menggunakan sistem
evaluasi yang baik dan terencana, agar evaluasi yang diberikan tepat
mengenai sasaran yang diharapkan. Berikut dikemukakan beberapa
pendapat para ahli tentang tujuan, fungsi dan prinsip evaluasi (Gyata
Mehta, 2014: 9).
Tujuan evaluasi dalam kaitannya dengan belajar mengajar terdapat 6,
antara lain: (1) Menilai ketercapaian (attainment) tujuan, (2) Mengukur
macam-macam aspek belajar yang bervariasi, (3) Sebagai sarana (means)
untuk mengetahui apa yang peserta didik telah ketahui, (4) Memotivasi
belajar peserta didik, (5) Menyediakan informasi untuk tujuan bimbingan
dan konseling, (6) Menjadikan hasil evaluasi sebagai dasar perubahan
kurikulum (Sukardi, 2011: 9-10).
Secara umum tujuan evaluasi hasil belajar diarahkan pada dua hal, yaitu:
(1) untuk mendapatkan data yang akan dijadikan sebagai bukti mengenai
15
taraf perkembangan atau taraf kemajuan belajar yang dicapai oleh para
peserta didik, setelah mereka mengikuti proses pembelajaran dalam jangka
waktu tertentu, (2) untuk mengetahui tingkat efektivitas dari program
pembelajaran yang disusun oleh pendidik serta proses pembelajaran yang
telah diselenggarakan (Depdiknas, 2008: 13).
Wina (2008: 54) memaparkan beberapa fungsi evaluasi, yakni:
(1) sebagai umpan balik bagi peserta didik dan semua pihak yang
berkepentingan dengan pendidikan di sekolah, (2) untuk mengetahui
bagaimana ketercapaian peserta didik dalam menguasai tujuan yang telah
ditentukan, (3) untuk mengembangkan program kurikulum, (4) untuk
pengambilan keputusan dalam menentukan masa depan, (5) untuk
pengembangan kurikulum dalam menentukan kejelasan tujuan khusus
yang ingin dicapai.
Seperti halnya dengan Wina (2008: 54), Sukardi (2011: 4) juga
mengatakan bahwa evaluasi juga mempunyai fungsi yang bervariasi di
dalam proses belajar mengajar, yaitu sebagai berikut: (1) sebagai alat guna
mengetahui apakah peserta didik telah menguasai pengetahuan, nilai-nilai,
dan keterampilan yang telah diberikan oleh seorang pendidik, (2) untuk
mengetahui aspek-aspek kelemahan peserta didik dalam melakukan
kegiatan belajar, (3) mengetahui tingkat ketercapaian peserta didik dalam
kegiatan belajar, (4) sebagai sarana umpan balik bagi pendidik, yang
bersumber dari peserta didik, (5) sebagai alat untuk mengetahui
16
perkembangan belajar peserta didik, (6) sebagai materi utama laporan hasil
belajar kepada orang tua peserta didik.
C. Prinsip dan Alat Evaluasi Pendidikan
Evaluasi harus memiliki minimal tujuh prinsip berikut: (1) terpadu, (2)
menganut cara belajar peserta didik aktif, (3) kontinuitas, (4) koherensi
dengan tujuan, (5) menyeluruh, (6) membedakan (diskriminasi), dan
(7) pedagogis. Sementara itu, prinsip-prinsip evaluasi pembelajaran dapat
dibedakan menjadi dua, yaitu prinsip umum dan prinsip khusus. Hal-hal
yang termasuk prinsip umum antara lain: (1) valid, (2) mendidik, (3)
berorientasi pada kompetensi, (4) adil dan objektif, (5) terbuka, (6)
berkesinambungan, (7) menyeluruh, dan (8) bermakna. Adapun prinsip
khusus dalam evaluasi pembelajaran adalah: (1) evaluasi proses dan hasil
belajar harus memungkinkan adanya kesempatan yang terbaik bagi peserta
didik untuk menunjukkan apa yang mereka ketahui dan pahami, serta
mendemonstrasikan kemampuannya, (2) setiap pendidik harus mampu
melaksanakan prosedur evaluasi dan pencatatan secara tepat (Slameto,
2001: 23).
Menurut Arikunto (2018: 37) mengatakan ada satu prinsip umum dan
penting dalam kegiatan evaluasi, yaitu adanya triangulasi atau hubungan
erat tiga komponen, yaitu:
a) Tujuan pembelajaran
b) Kegiatan pembelajaran atau KBM
c) Evaluasi
17
Tujuan
KBM Evaluasi
Skema 1 Triangulasi tujuan, KBM, dan evaluasi
Penjelasan dari bagan triangulasi sebagai berikut:
1) Hubungan antara Tujuan dengan KBM
Kegiatan belajar mengajar yang dirancang dalam bentuk rencana
mengajar disusun oleh pendidik dengan mengacu pada tujuan yang
hendak dicapai. Dengan demikian, anak panah yang menunjukkan
hubungan antara keduanya mengarah pada tujuan dengan makna
bahwa KBM mengacu pada tujuan, tetapi juga mengarah dari tujuan
ke KBM, menunjukkan langkah dari tujuan dilanjutkan pemikirannya
ke KBM.
2) Hubungan antara Tujuan dengan Evaluasi
Evaluasi adalah kegiatan pengumpulan data untuk mengukur sejauh
mana tujuan sudah tercapai. Dengan makna demikian maka anak
panah berasal dari evaluasi menuju ke tujuan. Di sisi lain, jika dilihat
dari langkah, dalam menyusun alat evaluasi ia mengacu pada tujuan
yang sudah dirumuskan.
3) Hubungan antara KBM dengan Evaluasi
Seperti yang sudah disebutkan dalam nomor (1) KBM dirancang dan
disusun dengan mengacu pada tujuan yang telah dirumuskan. Telah
disebutkan pula dalam nomor (2) bahwa alat evaluasi juga disusun
dengan mengacu pada tujuan. Selain mengacu pada tujuan, evaluasi
18
juga harus mengacu atau disesuaikan dengan KBM yang
dilaksanakan. Sebagai misal, jika kegiatan belajar-mengajar dilakukan
oleh pendidik dengan menitikberatkan pada keterampilan, evaluasinya
juga harus mengukur tingkat keterampilan peserta didik, bukannya
aspek pengetahuan.
Alat adalah sesuatu yang dapat digunakan untuk mempermudah
seseorang dalam melaksanakan tugas atau mencapai tujuan secara
lebih efektif dan efisien. Kata “alat” biasa disebut juga dengan istilah
“instrumen”. Dengan demikian, alat evaluasi juga dikenal dengan
instrumen evaluasi. Alat evaluasi dapat dikatakan baik apabila mampu
mengevaluasi sesuatu dengan hasil seperti keadaan yang dievaluasi.
Teknik evaluator dalam menggunakan hal tersebut dikenal dengan
teknik evaluasi yang dibagi menjadi 2, yaitu teknik non tes dan teknik
tes (Arikunto, 2018: 39).
D. Cakupan Evaluasi Pendidikan
Evaluasi bidang pendidikan memiliki cakupan yang luas. Mengingat
luasnya cakupan bidang pendidikan, dapat dikelompokkan ke dalam tiga
cakupan penting, yaitu evaluasi pembelajaran, evaluasi program, dan
evaluasi sistem. Hal ini sesuai dengan Pasal 57 ayat 2, UU RI No. 20
Tahun 2003, evaluasi dilakukan terhadap peserta didik, lembaga, dan
program pendidikan pada jalur formal dan nonformal untuk semua jenjang
satuan dan jenis pendidikan. Evaluasi pembelajaran merupakan inti
bahasan evaluasi yang kegiatannya dalam lingkup kelas atau dalam
19
lingkup proses belajar mengajar. Evaluasi program mencakup evaluasi
kurikulum sampai pada evaluasi program dalam suatu bidang studi.
Adapun evaluasi sistem merupakan evaluasi di bidang yang paling luas.
Macam-macam kegiatan yang termasuk evaluasi sistem di antaranya
evaluasi diri, evaluasi internal, evaluasi eksternal, dan evaluasi
kelembagaan, contohnya adalah evaluasi akreditasi lembaga pendidikan
(Sukardi, 2011: 5).
Objek dari evaluasi pendidikan jika disoroti dari segi transformasi,
meliputi kurikulum atau materi pelajaran, metode mengajar dan teknik
penilaian, sarana atau media pendidikan, sistem administrasi, dan pendidik
serta unsur-unsur personal lain yang terlibat dalam proses pendidikan.
Sedangkan dari segi output yang menjadi sasaran evaluasi adalah tingkat
pencapaian atau prestasi belajar yang berhasil dalam proses pendidikan
selama jangka waktu yang telah ditentukan (C. Boopathiraj, 2013: 182).
E. Pelaksanaan Evaluasi Pendidikan
Situasi kelas yang sebenarnya, di mana seorang pendidik misalnya
memiliki 24 peserta didik atau lebih, perlu dilakukan evaluasi dengan cara
yang baik. Untuk mencapai tujuan tersebut ia perlu menguasai macam-
macam metode untuk melakukan evaluasi yang relevan. Secara garis
besar, metode evaluasi dalam pendidikan dapat dibedakan menjadi dua
macam bentuk, yaitu tes dan non tes. Tipe evaluasi yang pertama adalah
tes yang biasanya direalisasikan dengan tes tertulis. Tes ini digunakan
terutama untuk memperoleh data, baik data kuantitatif maupun kualitatif.
Tes tertulis juga dapat dibedakan menjadi tes objektif dan essai. Bentuk
20
kedua adalah nontes. Alat nontes ini digunakan untuk mengevaluasi
penampilan dan aspek-aspek belajar afektif dari peserta didik (Yolanda
Putri, 2014: 9).
Secara umum penilaian terdiri atas dua jenis, yaitu tes dan non tes. Jenis
penilaian berbentuk tes merupakan semua jenis penilaian yang hasilnya
dapat dikategorikan menjadi benar atau salah, misalnya jenis penilaian
untuk mengungkap aspek kognitif dan psikomotorik. Jenis penilaian non
tes hasilnya tidak dapat dikategorikan benar atau salah, dan pada
umumnya dipakai untuk mengungkap aspek afektif (Syamsudduha, 2012:
57).
Adapun jenis penilaian dapat kita bedakan menjadi dua bentuk tes, yaitu
sebagai berikut:
a. Tes Tertulis
Bentuk tes ada yang berupa tes non verbal dan verbal. Tes non verbal
dipakai untuk mengukur kemampuan pskimotorik. Tes verbal dapat
berupa tes tulis dan dapat berupa tes lisan. Tes tulis dapat
dikategorikan menjadi dua yaitu tes objektif dan non objektif.
1. Tes Objektif
Tes obejktif adalah tes yang dalam pemeriksaannya dapat
dilakukan secara objektif. Hal ini memang dimaksudkan untuk
mengatasi kelemahan-kelemahan dari tes bentuk essai.
21
Adapun macam-macam tes objektif adalah sebagai berikut:
a) Soal Benar Salah
Soal - soalnya berupa pernyataan - pernyataan (statement).
Statement tersebut ada yang benar dan ada yang salah. Peserta
didik bertugas untuk menandai masing - masing pernyataan itu
dengan melingkari huruf B jika pernyataan betul menurut
pendapatnya dan melingkari huruf S jika pernyataannya salah
(Arikunto, 2018: 110-111).
b) Soal Pilihan Ganda
Multiple Choice Test terdiri atas suatu keterangan atau
pemberitahuan tentang suatu pengertian yang belum lengkap .
Untuk melengkapinya harus memilih satu dari beberapa
kemungkinan jawaban yang telah disediakan. Atau multiple
choice test terdiri atas satu jawaban yang benar, yaitu kunci
jawaban dan beberapa pengecoh (Arikunto, 2018: 114).
c). Soal Menjodohkan (Matching Test)
Soal menjodohkan dapat kita ganti dengan istilah
mencocokkan, memasangkan, atau menjodohkan. soal ini
terdiri atas satu seri pertanyaan dan satu seri jawaban. Masing-
masing pertanyaan mempunyai jawaban yang tercantum dalam
seri jawaban.Tugas peserta didik adalah mencari dan
menempatkan jawaban-jawaban sehingga sesuai atau cocok
dengan pertanyaannya (Arikunto, 2018: 118).
22
d) Soal Isian (Completion Test)
Tes melengkapi adalah tes yang dibuat dalam bentuk
pertanyaan yang belum lengkap yang meminta peserta didik
untuk melengkapinya dengan satu atau dua kata yang benar.
Jawaban dapat berupa kata, bilangan, kalimat, simbol dan
jawaban hanya dapat dinilai benar atau salah (Syamsudduha,
2012: 67).
e) Tes jawaban Singkat
Tes jawaban singkat adalah tes yang menuntut peserta didik
untuk menjawab dengan perkataan, ungkapan atau kalimat
pendek sebagai jawaban terhadap kalimat soal atau jawaban
atas suatu pernyataan atau jawaban atas asosiasi yang harus
dilakukan.
2. Tes Subjektif
Tes subjektif adalah tes tulis yang meminta peserta didik
memberikan jawaban berupa uraian. Adapun bentuk-bentuknya
sebagai berikut :
a) Tes Esai Bebas
Tes ini adalah tes yang memberikan kesempatan kepada
peserta didik untuk menjawab soal sesuai dengan sistematika
jawaban peserta didik seluas-luasnya. Tes Esai bebas, peserta
didik tidak dibatasi untuk memberikan jawaban sesuai dengan
perspektif dan argumen jawaban yang dikemukakan oleh
23
peserta didik selama tidak menyimpang atau keluar dari materi
soal yang ditanyakan dan jawabannya masih bersifat logis
(Syamsudduha, 2012: 69).
b) Esai Terbatas
Esai terbatas adalah esai yang butir soalnya memberikan
batasan kepada peserta didik dalam menjawabnya. Bentuk
pertanyaan-pertanyaan yang dibuat diarahkan pada hal-hal
tertentu atau dilakukan pembatasan tertentu dari jawaban orang
yang akan di tes (Arikunto, 2018: 189).
b. Tes Lisan (Oral Test)
Tes lisan merupakan tes yang sangat bermanfaat untuk mengukur
aspek yang berkaitan dengan komunikasi (communication skill). Tes
lisan juga dapat digunakan untuk menguji peserta didik, baik secara
individual maupun secara berkelompok. Kelebihan tes lisan adalah
pendidik mampu mengetahui kemampuan peserta didik dalam
mengemukakan pendapatnyan secara langsung (Syamsudduha, 2012:
72).
F. Analisis Soal
1. Pengertian Analisis Soal dan Butir Soal
Kegiatan menganalisis butir soal merupakan suatu kegiatan yang
harus dilakukan oleh pendidik untuk menjaga dan meningkatkan mutu
soal yang dibuat. Tugas melakukan evaluasi terhadap alat pengukuran
24
yang telah digunakan untuk mengukur keberhasilan belajar peserta
didik inilah yang seringkali diabaikan oleh evaluator.
Kegiatan analisis merupakan penyelidikan terhadap suatu peristiwa
untuk mengetahui keadaan yang sebenarnya. Soal merupakan
pertanyaan atau pernyataan yang menimbulkan situasi masalah yang
harus dipecahkan oleh peserta didik. Adapun satuan untuk soal adalah
butir sehingga tiap item pertanyaan atau pernyataan dikenal sebagai
butir soal.
Analisis soal adalah suatu prosedur sistematis yang akan memberikan
informasi-informasi mengenai kualitas tes yang kita susun (Daryanto,
2007: 67). Sementara itu, analisis butir soal atau analisis item adalah
pengkajian pertanyaan-pertanyaan tes agar diperoleh perangkat
pertanyaan yang memiliki kualitas yang memadai (Sudjana, 2006:
123).
Analisis soal dilakukan untuk mengetahui berfungsi tidaknya sebuah
soal. Analisis pada umumnya dilakukan melalui dua cara, yaitu
analisis kualitatif (qualitative control) dan analisis kuantitatif
(quantitative control). Analisis kualitatif sering pula dinamakan
sebagai validitas logis (logical validity) yang dilakukan sebelum soal
digunakan untuk melihat berfungsi tidaknya sebuah soal. Analisis soal
secara kuantitatif sering pula dinamakan sebagai validitas empiris
(empirical validity) yang dilakukan untuk melihat lebih berfungsi
25
tidaknya sebuah soal, setelah soal itu diujicobakan kepada sampel
yang referesentatif (Gito Supriadi, 2011:149).
Analisis secara kualitatif yaitu berupa penelaahan yang dimaksudkan
untuk menganalisis soal ditinjau dari segi teknis, isi, dan editorial.
Analisis secara teknis dimaksudkan sebagai penelaahan soal
berdasarkan prinsip-prinsip pengukuran dan format penulisan soal.
Analisis secara isi dimaksudkan sebagai penelaahan khusus yang
berkaitan dengan kelayakan pengetahuan yang ditanyakan. Analisis
secara editorial dimaksudkan sebagai penelaahan yang khususnya
berkaitan dengan keseluruhan format dan keajegan editorial dari soal
yang satu ke soal yang lain (Gito Supriadi, 2011:150).
Analisis secara kuantitatif dilakukan setelah soal tes di kerjakan oleh
peserta tes. Hasil analisis dimaksudkan untuk mengetahui sejauh mana
soal dapat membedakan antara peserta tes yang kemampuannya tinggi
dalam hal yang didefenisikan oleh kriteria dengan peserta tes yang
kemampuannya rendah. Dalam hal memilih kriteria yang akan
digunakan orang menginginkan adanya ukuran yang baik untuk
kemampuan ataupun keterampilan yang diukur oleh soal. Informasi
lainnya adalah bagaimana soal dapat membedakan antara individu
maupun antar kelompok (Sumarna Surapranata, 2004:10).
Analisis soal secara kuantitatif menekankan pada analisis karakteristik
internal tes melalui data yang diperoleh secara empiris. Karakterisik
internal secara kuantitatif dimaksudkan meliputi parameter soal
26
tingkat kesukaran, daya pembeda, dan reliabilitas. Khusus soal-soal
pilihan ganda, dua tambahan parameter yaitu dilihat dari peluang
untuk menebak atau menjawab soal benar dan berfungsi tidaknya
pilihan jawaban, yaitu penyebaran semua alternatif jawaban dari
subyek-subyek yang dites (Gito Supriadi, 2011:150).
2. Tujuan Analisis Butir Soal
Tujuan penelaahan butir soal adalah untuk mengkaji dan menelaah
setiap butir soal agar diperoleh soal yang bermutu untuk digunakan.
Di samping itu, tujuan analisis butir soal juga untuk membantu
meningkatkan tes melalui revisi atau membuang soal yang tidak
efektif serta untuk mengetahui informasi diagnostik pada peserta didik
apakah mereka sudah atau belum memahami materi yang telah
diajarkan.
Analisis soal antara lain bertujuan untuk mengadakan identifikasi
soal-soal yang baik, kurang baik, dan soal yang jelek. Dengan analisis
soal dapat diperoleh informasi tentang kejelekan sebuah soal dan
petunjuk untuk mengadakan perbaikan.
Soal yang bermutu adalah soal yang dapat memberikan informasi
setepat-tepatnya sesuai dengan tujuannya, di antaranya dapat
menentukan peserta didik mana yang sudah atau belum menguasai
materi yang diajarkan pendidik. Salah satu cara memperbaiki proses
belajar-mengajar yang paling efektif adalah dengan cara mengevaluasi
tes hasil belajar yang diperoleh dari proses belajar-mengajar itu
27
sendiri. Dengan kata lain, hasil tes tersebut kita olah sedemikian rupa
sehingga hasil dari pengolahan itu dapat diketahui komponen
manakah dari proses belajar-mengajar itu yang masih lemah.
Pengolahan tes hasil belajar dalam rangka memperbaiki proses
belajar-mengajar salah satunya adalah dengan melakukan analisis
butir soal (Amalia dan Widyawati, 2013: 91).
3. Cara Pelaksanaan Analisis Butir Soal
Hasil belajar kognitif dinilai dengan teknik tes dengan butir-butir soal
sebagai instrumennya. Cara menganalisis butir-butir tes tersebut dapat
ditempuh melalui dua cara, yaitu (1) analisis soal secara teoretik atau
kualitatif dan (2) analisis soal secara empiris atau kuantitatif.
1) Analisis tes secara teoretik atau kualitatif
Analisis teoritik, merupakan penyelidikan terhadap soal untuk
mengetahui keadaan yang sebenarnya. Analisis secara teoretis atau
analisis kualitatif dapat dilakukan sebelum maupun sesudah
dilaksanakan uji coba. Cara analisisnya adalah dengan mencermati
butir-butir soal yang telah disusun dari pemenuhan persyaratan
aspek isi (materi), konstruksi, maupun bahasa (Sukiman, 2012: 66).
Pendidik dan praktisi menggunakan jenjang kognitif (cognitive)
dalam merumuskan tujuan pembelajaran dan penentuan jenjang
soal. Istilah dimaksud diambil dari taksonomi tujuan pembelajaran
yang dikemukakan oleh Bloom, Engelhart, Furst, Hill dan
Krathwohl pada tahun 1956. Namun taksonomi ini kemudian
28
mengalami revisi untuk lebih mengadopsi perkembangan dan
temuan baru dalam dunia pendidikan, dan disebut sebagai
taksonomi Bloom revisi Anderson. Taksonomi yang baru
melakukan pemisahan yang tegas antara dimensi pengetahuan
dengan dimensi proses kognitif. Seperti halnya taksonomi yang
lama, taksonomi yang baru secara umum juga menunjukkan
penjenjangan, dari proses kognitif yang sederhana ke proses
kognitif yang lebih kompleks, antara lain:
a) Menghafal (remember) adalah proses kognitif di mana
informasi yang tersimpan dalam memori jangka panjang
ditarik kembali. Kategori ini mencakup dua macam proses
kognitif, yaitu mengenali (recognizing) dan mengingat
(recalling).
b) Memahami (understand) adalah mengkonstruksi makna atau
pengertian berdasarkan pengetahuan awal yang dimiliki, dan
mengaitkan informasi yang baru dengan pengetahuan yang
telah dimiliki. Kategori ini mencakup tujuh proses kognitif,
yaitu menafsirkan (interpreting), memberikan contoh
(exemplifying), mengklasifikasikan (classifying), meringkas
(summarizing), menarik inferensi (inferring), membandingkan
(comparing), dan menjelaskan (explaining).
c) Mengaplikasikan (applying) mencakup penggunaan suatu
prosedur guna menyelesaikan masalah atau mengerjakan tugas.
Kategori ini mencakup dua macam proses kognitif, yaitu
29
menjalankan (executing) dan mengimplementasikan
(implementing).
d) Menganalisis (analyzing) menguraikan suatu permasalahan
atau obyek ke unsur-unsurnya dan menentukan bagaimana
saling keterkaitan antar unsur- unsur tersebut dan struktur
besarnya. Ada tiga macam proses kognitif yang tercakup
dalam kategori ini, yaitu membedakan (differentiating),
mengorganisir (organizing), dan menemukan pesan tersirat
(attributting).
e) Mengevaluasi adalah membuat suatu pertimbangan
berdasarkan kriteria dan standar yang ada. Ada dua macam
proses kognitif yang tercakup dalam kategori ini, yaitu
memeriksa (checking) dan mengritik (critiquing).
f) Membuat (create) adalah menggabungkan beberapa unsur
menjadi suatu bentuk kesatuan. Terdapat tiga macam proses
kognitif yang tergolong dalam kategori ini, yaitu membuat
(generating), merencanakan (planning), dan memproduksi
(producing) (Ari Widodo, 2006: 58-67).
2) Analisis tes secara empirik atau kuantitatif
Analisis empirik, merupakan penyelidikan terhadap suatu soal
untuk mengetahui keadaan yang sebenarnya berdasarkan kenyataan
(Mujiyanto, 2007). Analisis tes secara kuantitatif diarahkan untuk
menelaah tingkat validitas soal, reliabilitas, daya pembeda, tingkat
30
kesukaran dan khusus untuk model soal pilihan ganda perlu juga
ditelaah efektivitas fungsi distraktor (Sukiman, 2012: 66).
a) Validitas
Validitas (validity) berkaitan dengan permasalahan apakah tes
yang dimaksudkan dapat mengukur secara tepat sesuatu yang
akan diukur tersebut. Analisis tes dapat dilakukan dari dua
segi, yaitu dari segi tes sebagai suatu totalitas dan dari segi
itemnya sebagai bagian tak terpisahkan dari tes secara totalitas
(Mujiyanto, 2007: 14).
1. Validitas Tes
Penganalisisan terhadap tes hasil belajar sebagai suatu
totalitas dapat dilakukan dengan dua cara yaitu
penganalisisan dengan jalan berpikir secara rasional
(logical analysis) dan penganalisisan yang dilakukan
dengan mendasarkan diri pada kenyataan empiris
(empirical analysis). Validitas sebuah tes dapat diketahui
dari hasil pemikiran (validitas logis) dan dari hasil
pengalaman (validitas empiris). Validitas logis atau rasional
adalah validitas yang pertimbangannya lewat analisis
rasional. Jenis validitas yang termasuk dalam kategori ini
adalah validitas isi (content validity) dan validitas konstruk
(construct validity) (Sudijono, 2011: 39).
Sebuah tes disebut memiliki validitas isi apabila tes tersebut
mengukur tujuan khusus tertentu yang sejajar dengan materi
31
atau isi pelajaran yang diberikan. validitas isi merujuk pada
kesesuaian antara butir-butir soal dengan tujuan dan bahan
pengajaran. Secara sederhana dapat dikatakan bahwa tes
yang disusun tidak boleh keluar dari isi mata pelajaran yang
ada di dalam kurikulum. Sementara itu, sebuah tes disebut
memiliki validitas konstrak apabila butir-butir soal yang
membangun tes tersebut mengukur setiap aspek berpikir
seperti yang disebutkan dalam Tujuan Instruksional Khusus
(Sudijono, 2011: 40).
2. Validitas Item atau Validitas Butir Soal
Selain validitas soal secara keseluruhan tes, juga perlu
diperhatikan validitas item atau validitas butir soal.,
“validitas item dari suatu tes adalah ketepatan mengukur
yang dimiliki oleh sebutir item (yang merupakan bagian tak
terpisahkan dari tes sebagai suatu totalitas), dalam
mengukur apa yang seharusnya diukur lewat butir item
tersebut”. Eratnya hubungan antara butir item dengan tes
hasil belajar sebagai suatu totalitas adalah bahwa semakin
banyak butir-butir item yang dapat dijawab oleh peserta
didik, maka skor total hasil tes tersebut akan semakin tinggi
(Sudijono, 2011: 41).
32
b) Reliabilitas
Salah satu syarat tes sebagai instrumen evaluasi adalah
memiliki reliabilitas yang tinggi. Reliabilitas tes atau keajekan
berhubungan dengan masalah kepercayaan. Suatu tes akan
menghasilkan kepercayaan yang tinggi apabila tes tersebut
dapat memberikan hasil yang tetap. Atau seandainya hasilnya
berubah, perubahan yang terjadi dapat dikatakan tidak berarti
(Sukiman, 2012: 66).
Reliabilitas alat penilaian adalah ketetapan atau keajegan alat
tersebut dalam menilai apa yang dinilainya. Artinya, kapan pun
alat penilaian tersebut digunakan akan memberikan hasil yang
relatif sama. Reliabilitas sebuah soal perlu karena sebagai
penyokong terbentuknya validitas butir soal sehingga sebuah
soal yang valid biasanya reliabel (Sudijono, 2011: 44).
Untuk mencari reliabilitas tes bentuk objektif dapat dilakukan
dengan menggunakan KR21.
r11 = [( 1)] [1-( )2 ]
Keterangan :r11 : reliabilitas tes secara keseluruhann : banyaknya itemM : mean atau rerata skor totalSt : standar deviasi dari tes (Arikunto, 2018: 219).
Tingkat korelasi reliabilitas soal yang telah dicari dapat
diinterpretasikan pada tabel berikut.
33
Tabel 1 Kriteria Koefisien Korelasi Reliabilitas Tes
Reliabilitas Tes (r11) Kategori
0,00 – 0,19 Sangat rendah
0,20 – 0,39 Rendah
0,40 – 0,59 Sedang/Cukup
0,60 – 0,79 Tinggi
0,80 – 1,00 Sangat tinggi (Sempurna)
(Sumber Sudijono,2011: 135)
c) Daya Pembeda
Daya pembeda item adalah kemampuan suatu butir item tes
hasil belajar untuk dapat membedakan antara testee yang
berkemampuan tinggi dengan testee yang berkemampuan
rendah. Mengetahui daya pembeda item sangat penting, sebab
salah satu dasar pegangan untuk menyusun butir tes hasil
belajar adalah adanya bahwa kemampuan antara testee yang
satu dengan testee yang lain berbeda-beda. Selain itu, butir tes
hasil belajar harus mampu memberikan hasil tes yang
mencerminkan adanya perbedaan kemampuan yang terdapat di
kalangan testee tersebut (Sudijono, 2011: 44).
Daya pembeda soal dapat diketahui dengan melihat besar
kecilnya angka indeks daya pembeda (IDP). Indeks daya
pembeda biasanya juga dinyatakan dalam bentuk proporsi.
Semakin tinggi indeks daya pembeda soal berarti semakin
mampu soal yang bersangkutan membedakan peserta didik
34
yang pandai dengan peserta didik yang kurang pandai. Indeks
daya pembeda berkisar antara -1,00 sampai dengan 1,00
(Sukiman, 2012: 67).
Untuk menghitung daya pembeda tes bentuk objektif dapat
dilakukan dengan menggunakan rumus sebagai berikut.
D = − = –
Keterangan :D : angka diskriminasiBA : banyaknya peserta kelompok atas yang menjawab
soal dengan benarBB : banyaknya peserta kelompok bawah yang
menjawab soal dengan benarJA : banyaknya peserta kelompok atasJB : banyaknya peserta kelompok bawahPA : proporsi peserta kelompok atas yang menjawab
benarPB : proporsi peserta kelompok bawah yang berhasil
menjawab benar
Cara memberikan interpretasi terhadap hasil perhitungan yang
diperoleh dengan mengonsultasikan hasil perhitungan yang
diperoleh dengan kriteria berikut.
Tabel 2 Klasifikasi Daya PembedaDaya pembeda (D) Kategori
< 0,20 Lemah/Jelek0,20 – 0,39 Cukup0,40 – 0,69 Baik0,70 – 1,00 Baik sekali
Tanda negative Tidak ada daya beda(Sumber Sudjana, 2006: 176)
35
d) Tingkat Kesukaran
Bilangan yang menunjukkan sukar dan mudahnya sesuatu soal
disebut indeks kesukaran (difficulty index). Indeks kesukaran
butir adalah bilangan yang menunjukkan sukar dan mudahnya
soal. Semakin tinggi indeks kesukaran butir maka soal semakin
mudah. Soal yang baik adalah soal tidak terlalu mudah atau
tidak terlalu sukar. Analisis tingkat kesukaran soal adalah
mengkaji soal-soal dari segi kesulitannya sehingga dapat
diperoleh soal-soal mana yang termasuk mudah, sedang, dan
sukar. Butir-butir item tes hasil belajar dapat dikatakan sebagai
butir item yang baik apabila butir-butir tes tersebut tidak
terlalu sukar dan tidak pula terlalu mudah. Dengan kata lain
derajat kesukaran tes tersebut adalah sedang atau cukup
(Arikunto, 2018: 232).
Angka indeks kesukaran butir itu besarnya berkisar antara 0,00
sampai dengan 1,00. Semakin besar angka indeks kesukaran
maka soal semakin mudah. Jika seluruh peserta ujian
menjawab dengan salah butir tersebut maka soal tersebut
sangat sukar dengan angka kesukaran 0,00 dan jika angka
kesukaran 1,00 maka soal sangat mudah karena dijawab
dengan benar oleh seluruh peserta tes (Arikunto, 2018: 232).
Untuk menghitung indeks kesukaran tes bentuk objektif dapat
dilakukan dengan menggunakan rumus sebagai berikut.
36
P =
Keterangan :P : indeks kesukaranB : banyaknya peserta didik yang menjawab soal dengan
BenarJS : Jumlah seluruh peserta didik peserta tes
Mengklasifikasikan indeks kesukaran seperti yang terlihat
pada tabel berikut.
Tabel 3 Klasifikasi Indeks KesukaranIndeks Kesukaran (P) Kategori
0,00 ≤ 0,30 Sukar0,31 ≤ p ≤0,70 Sukup/Sedang
0,71 ≤ 1,00 Mudah(Sumber Arifin, 2012: 273)
e) Pengecoh/Distractor
Analisis fungsi distractor dilakukan khusus untuk soal bentuk
objektif model pilihan ganda (multiple choice item). Di dalam
soal model pilihan ganda, dilengkapi dengan beberapa
alternatif jawaban yang disebut dengan option (opsi) (Sukiman
2012: 60).
Pada soal pilihan ganda, di antara pilihan jawaban yang ada,
hanya satu yang benar. Selain jawaban yang benar tersebut,
adalah jawaban yang salah. Jawaban yang salah itulah yang
dikenal dengan distractor (pengecoh). Distractor yang baik
dapat dihindari oleh peserta didik yang pandai dan akan dipilih
oleh peserta didik yang kurang pandai. Distractor dapat
dikatakan telah berfungsi dengan baik apabila distractor
37
tersebut telah memiliki daya rangsang atau daya tarik yang
baik (Amalia dan Widyawati, 2013: 90).
Distractor telah dapat menjalankan fungsinya dengan baik
apabila distractor tersebut telah dipilih sekurang-kurangnya
5% dari seluruh peserta tes. Distractor yang telah menjalankan
fungsinya dengan baik dapat digunakan kembali pada tes yang
akan datang. Dengan demikian, efektivitas distractor adalah
seberapa baik pilihan yang salah tersebut dapat mengecoh
peserta tes yang memang tidak mengetahui kunci jawaban
yang tersedia. Semakin banyak peserta tes yang memilih
distractor tersebut, maka distractor itu dapat menjalankan
fungsinya dengan baik. Jika peserta tes mengabaikan semua
option (tidak memilih) disebut omit. Dilihat dari segi omit,
sebuah item dikatakan baik jika omitnya tidak lebih dari 10 %
pengikut tes (Sudijono, 2011: 45).
Perhitungan efektifitas pengecoh dapat menggunakan rumus
sebagai berikut.
IP = x 100%
Keterangan :IP : indeks pengecohP : jumlah peserta didik yang memiliki pengecohN : jumlah peserta didik yang ikut tesB : jumlah peserta didik yang menjawab benar pada setiap
soaln : jumlah alternatif jawaban (opsi)1 : bilangan tetap
38
Keberfungsian pengecoh dapat dilihat dari dua kriteria: a)
pengecoh yang dipilih oleh peserta didik dari kelompok
rendah, b) pengecoh yang dipilih oleh kelompok tinggi
(Azwar, 1996: 142). Jika IP = 0 maka soal tesrebut jelek, dan
demikian pengecoh tidak berfungsi. Berikut kriteria
keberfungsian pengecoh.
Tabel 4 Kriteria Keberfungsian Pengecoh
No Nilai IP Kriteria
1 76% - 125% Sangat Baik
2 51% - 75% atau 126% - 150% Baik
3 26% - 50% atau 151% - 175% Kurang Baik
4 0% - 25% atau 176% - 200% Jelek
5 Lebih dari 200% Sangat Jelek
(Sumber Arifin, 2012: 280)
G. Kerangka Pikir
Seorang pendidik berkewajiban untuk melakukan kegiatan evaluasi atau
penilaian. Terdapat banyak metode yang dapat digunakan untuk
melakukan penilaian terhadap hasil belajar peserta didik, antara lain
melalui teknik tes maupun non-tes. Tes merupakan instrumen yang paling
umum digunakan untuk mengukur penguasaan peserta didik terhadap
materi yang telah diajarkan oleh pendidik. Tes biasanya diujikan setelah
peserta didik memperoleh sejumlah materi, dan pengujian dilakukan
dengan tujuan untuk mengetahui penguasaan peserta didik terhadap materi
(Arikunto, 2018: 27).
39
Tes tidak akan berfungsi dengan baik untuk mengukur kemampuan atau
kompetensi peserta didik jika soal-soal yang diujikan tidak memiliki
kualitas yang baik. Oleh karena itu, instrumen tes yangbelum pernah
diujicobakan, dianalisis, dan direvisi cenderung meragukan dari segi
kualitas sebab belum diketahui mutunya. Sementara itu, kualitas suatu tes
sangat bertalian erat dengan kualitas butir soal atau item yang terdapat di
dalamnya. Oleh karena itu agar suatu tes dapat digunakan untuk mengukur
dengan baik apa yang hendak diukur, maka butir-butir soal yang
digunakan dalam tes tersebut harus memiliki mutu yang baik juga
(Arikunto, 2018: 28).
Kegiatan yang dapat dilakukan untuk mengetahui baik tidaknya sebuah
instrumen penilaian adalah kegiatan analisis butir soal, baik secara
kualitatif maupun secara kuantitatif. Dari hasil analisis butir soal tersebuat
akan diketahui butir soal yang baik dan soal yang jelek, sehingga dapat
dilakukan revisi apabila terdapat kekurangan. Dengan demikian, maka
hasil yang diperoleh dari pelaksanaan evaluasi dapat benar-benar
menggambarkan kondisi dari objek evaluasi dan dengan dilakukannya
proses evaluasi dapatlah diketahui segi-segi yang mendukung dan
menghambat jalannya proses kependidikan menuju tujuan yang hendak
dicapai dan segi-segi yang mendukung dikembangkan dan segi-segi yang
menghambat diperbaiki atau diganti. Kerangka pikir tersebut dapat
dituangkan dalam bagan sebagai berikut:
40
Mata Pelajaran Biologi
Secara Kuantitatif meliputiAnalisis Kevalidan,
Reliabilitas, Daya Pembeda,Tingkat Kesukaran danEfektivitas Pengecoh
Kunci Jawaban dan LembarJawaban
Tengah Semester Genap
Secara Kualitatif meliputiAnalisis terhadap Kualitas
Aspek Isi dan Kontruksi
Analisis Butir Soal secaraKualitatif dan Kuantitatif
Kualitas Butir Soal diketahui
Naskah Soal Ulangan
Tengah Semester Ganjil
Soal Baik Soal Buruk
III. METODE PENELITIAN
A. Waktu dan Tempat Penelitian
Penelitian ini telah dilaksanakan di SMA Negeri 11 Bandar Lampung yang
beralamat di Jl. Re. Martadinata km 4 Kelurahan Sukamaju, Kecamatan
Teluk Betung Timur, Kota Bandar Lampung, Provinsi Lampung. Waktu
pelaksanaan penelitian ini pada tanggal 25 September - 30 September
semester ganjil tahun pelajaran 2019/2020.
B. Populasi dan Sampel
1. Populasi
Populasi dalam penelitian ini adalah seluruh lembar jawaban peserta
didik kelas X MIPA, XI MIPA, dan XII MIPA semester ganjil SMA
Negeri 11 Bandar Lampung tahun ajaran 2019/2020 yang berjumlah
180 peserta didik.
2. Sampel
Sampel yang digunakan pada penelitian ini adalah soal ulangan tengah
semester ganjil dan lembar jawaban Biologi kelas X, XI, dan XII
SMA Negeri 11 Bandar Lampung tahun pelajaran 2019/2020.
Dalam penelitian ini penulis mengambil sampel dengan menggunakan
teknik purposive sampling. Mengenai hal ini, Arikunto (2013: 183)
42
menjelaskan bahwa purposive sampling dilakukan dengan cara
mengambil subjek bukan didasarkan atas strata, random atau daerah
tetapi didasarkan atas adanya tujuan tertentu. Begitu pula menurut
Sugiyono (2012: 85) sampling purposive adalah teknik penentuan
sampel dengan pertimbangan tertentu. Sampel yang digunakan pada
penelitian ini ialah kelas X MIPA, XI MIPA, dan XII MIPA.
C. Desain Penelitian
Penelitian ini tidak menggunakan variabel penelitian karena penelitian ini
termasuk penelitian kuantitatif deskriptif non eksperimental. Penelitian
kuantitatif deskriptif merupakan penelitian yang meniliti keadaan
berdasarkan fakta dan tidak melakukan kontrol dan manipulasi variabel
penelitian (Darmawan, 2013: 38).
Penelitian ini dilakukan dengan menggunakan data yang berupa kata - kata
dan angka. Data yang berupa angka tersebut kemudian diolah dan dianalisis
untuk mendapatkan suatu informasi ilmiah dibalik angka - angka tersebut
(Nanang Martono, 2010: 20). Data tersebut berupa teks butir soal Ulangan
Tengah Semester Ganjil di kelas X, XI, dan XII SMA Negeri 11 Bandar
Lampung Tahun Pelajaran 2019/2020, yang mencakup tingkat kesukaran
soal, daya pembeda soal, validitas tes, reliabilitas tes dan efektifitas
pengecoh soal.
D. Prosedur Penelitian
Penelitian ini terdiri dari dua tahap, yaitu prapenelitian dan pelaksanaan
penelitian. Adapun langkah-langkah dari tahap tersebut sebagai berikut :
43
1. Prapenelitian
Kegiatan yang dilakukan pada prapenelitian adalah sebagai berikut :
a. Membuat surat penelitian pendahuluan (observasi) ke fakultas
untuk sekolah;
b. Mengadakan observasi ke sekolah tempat diadakannya penelitian,
berkonsultasi dengan pendidik mata pelajaran Biologi untuk
mendapatkan informasi mengenai Ulangan Tengah Semester;
c. Menetapkan sampel penelitian untuk kelas X, XI, dan XII.
2. Pelakasanaan Penelitian
a. Pengambilan data penelitian berupa soal ulangan tengah semester
ganjil (termasuk kunci jawaban).
b. Pengambilan lembar jawaban seluruh peserta didik kelas X MIPA,
XI MIPA, dan XII MIPA SMA Negeri 11 Bandar Lampung beserta
perangkat pembelajaran Biologi.
E. Jenis Data dan Teknik Pengambilan Data
Jenis dan teknik pengumpulan data pada penelitian ini adalah sebagai
berikut:
1. Jenis Data
Jenis data dalam penelitian ini adalah data kualitatif dan kuantitatif.
Data kualitatif berupa soal ulangan tengah semester yang dibuat oleh
pendidik mata pelajaran Biologi kelas X, XI, dan XII di SMA Negeri
11 Bandar Lampung. Data kuantitatif adalah berupa data lembar
jawaban peserta didik pada ulang tengah semester ganjil biologi.
44
2. Teknik Pengumpulan Data
Teknik pengumpulan data pada penelitian ini adalah dengan melalui
observasi dan pengambilan soal ulangan tengah semester dan lembar
jawaban peserta didik. Data diambil setelah peserta didik telah selesai
melakukan ulangan tengah semester genap dan pendidik telah selesai
mengevaluasi lembar jawaban peserta didik. Bentuk soal ulangan
tengah semester genap yang diberikan berupa pilihan ganda dengan
jumlah soal sebanyak 40 butir dengan skor maksimal 100.
F. Instrumen Penelitian
Sugiyono ( 2015: 148) mengatakan bahwa instrumen adalah alat ukur
penelitian. Instrumen penelitian yang digunakan oleh peneliti adalah daftar
cek (check list). Menurut Ratnawulan dan Rusdiana (2014: 208)
mengatakan bahwa daftar cek (check list) adalah sebuah daftar yang
memuat sejumlah pernyataan singkat berbagai gejala yang dimaksudkan
sebagai penolong pencatatan ada tidaknya suatu gejala dengan memberikan
tanda centang ( √ ) pada setiap kemunculan gejala.
G. Teknik Analisis Data
Teknik analisis data merupakan proses penyederhanaan data ke dalam
bentuk yang lebih, mudah dibaca dan ditafsirkan. Analisis data dalam
penelitian ini menggunkan dua teknik analisis yaitu analisis kualitatif dan
analisis kuantitatif. Analisis data yang dengan cara kualitatif yaitu
menganalisis validitas isi dan validitas konstruk butir soal pilihan ganda
Ulangan Tengah Semester Genap tahun pelajaran 2018/2019 mata
45
pelajaran Biologi kelas XI SMA Negeri Bandar Lampung. Sedangkan
untuk analisis dengan cara kuantitatif yaitu dengan menggunakan program
Anates Versi 4.
1. Analisis Data Kualitatif
Analisis data secara kualitatif dilakuakn dengan menganalisis validitas
isi yaitu dengan menyesuaikan antara indikator pembelajaran dengan
butir soal Ulangan Tengah Semester Genap yang diujikan kepada
peserta didik. Penggunaan validitas isi tidak dilakukan dengan analisis
statistika melainkan analisis rasional. Salah satu cara untuk
mengetahui butir soal dinyatakan valid adalah dengan melihat ada
atau tidak adanya kesesuaian antara butir soal dengan indikator
pembelajaran (Azwar, 1996: 175). Analisis data secara kualitatif
dilakukan dengan menganalisis validitas isi dan validitas konstruk
butir soal diperoleh dengan menggunakan dengan format sebagai
berikut :
Tabel 5 Format Analisis Validitas Isi dan Validitas Konstruk ButirSoal
No Aspek yang ditelaahNomor Soal
1 2 3 4 5 …A. Isi/Materi1 Soal sesuai dengan indikator2 Pilihan jawaban homogen dan logis
3Setiap butir soal hanya mempunyai satujawaban yang benar
Soal mengacu pada ranah kognitifC1C2C3C4C5C6
B. Konstruk
5Pernyataan atau pokok soal dirumuskansecara jelas dan tegas
6 Pernyataan atau pokok soal tidak memberi
46
petunjuk jawaban yang benar
7Rumusan pokok soal dan pilihan jawabanmerupakan pernyataan yang diperlukansaja
8Butir soal tidak bergantung pada jawabansoal sebelumnya
9Gambar, grafik, tabel, diagram, atausejenisnya disajikan dengan jelas danterbaca (jika ada)
10Pilihan jawaban pada optsi terakhir tidakmenggunkan pernyataan “semua pilihan diatas salah/benar”
11Panjang rumusan pilihan jawaban relatifsama
12Pokok soal bebas dari pernyataan negatifganda
13
Pilihan jawaban yang benar berbentukangka/waktu disusun secara berurutan dariyang terkecil hingga yang terbesar atauberdasarkan kronologisnya
14Setiap soal menggunakan bahasa yangsesuai dengan kaidah bahasa Indonesia
15Bahasa yang digunakan komunikatif,sehingga pernyataannya mudah dimengertipeserta didik
16Tidak menggunakan bahasa yang berlakusetempat/tabu
17Pilihan jawaban tidak mengulangkata/kelompok kata yang sama, kecualimerupakan satu kesatuan pengertian
Menentukan tingkat karakteristik perangkat tes dari hasil telaah yang
memenuhi kriteria dilakukan sebagai berikut:
a. Menghitung presentase validitas dalam butir soal
f (%) = x 100%
b. Menentukan kualitas validitas tes. Penentuan tinggi rendahnya
kualitas valisitas tes ditentukan dengan menggunakan kriteria
sebagai berikut:
Tabel 6 Kriteria Kualitas Validitas TesPresentase Kriteria
90% sampai dengan 100% Sangat Baik80% sampai dengan 89% Baik70% sampai dengan 79% Cukup Baik60% sampai dengan 69% Sedang≤ 59% Kurang Baik
(Sumber Sugiyono, 2014: 53)
47
2. Analisis Data Kuantitatif
Analisis data secara kuantitatif data penelitian ini berupa angka-angka
sedangkan deskriptif digunkan untuk menganalisa data dengan
mendeskripsikan/menggambarkan data yang telah terkumpul tanpa
membuat kesimpulan umum (Sugiyono, 2014: 208). Analisis data
kuantitatif dilakukan dengan bantuan program Anates Versi 4.
Program tersebut digunakan untuk menganalisis reliabilitas, daya
pembeda, tingkat kesukaran, dan efektifitas pengecoh. Berikut empat
penjabaran singkat deskripsi analisis butir soal yang dimaksud dalam
penelitian ini adalah sebagai berikut :
a. Reliabilitas
Salah satu syarat tes sebagai instrumen evaluasi adalah memiliki
reliabilitas yang tinggi. Reliabilitas tes atau keajekan
berhubungan dengan masalah kepercayaan. Suatu tes akan
menghasilkan kepercayaan yang tinggi apabila tes tersebut dapat
memberikan hasil yang tetap. Atau seandainya hasilnya berubah,
perubahan yang terjadi dapat dikatakan tidak berarti (Sukiman,
2012:66).
Reliabilitas alat penilaian adalah ketetapan atau keajegan alat
tersebut dalam menilai apa yang dinilainya. Artinya, kapan pun
alat penilaian tersebut digunakan akan memberikan hasil yang
relatif sama. Reliabilitas sebuah soal perlu karena sebagai
48
penyokong terbentuknya validitas butir soal sehingga sebuah soal
yang valid biasanya reliabel (Sudijono, 2011: 44).
Untuk mencari reliabilitas tes bentuk objektif dapat dilakukan
dengan menggunakan KR21.
r11 = [( 1)] [1-( )2 ]
Keterangan :r11 : reliabilitas tes secara keseluruhann : banyaknya itemM : mean atau rerata skor totalSt : standar deviasi dari tes (Arikunto, 2018: 219).
Tingkat korelasi reliabilitas soal yang telah dicari dapat
diinterpretasikan pada tabel berikut.
Tabel 7 Kriteria Koefisien Korelasi Reliabilitas TesReliabilitas Tes (r11) Kategori
0,00 – 0,19 Sangat rendah
0,20 – 0,39 Rendah
0,40 – 0,59 Sedang/Cukup
0,60 – 0,79 Tinggi
0,80 – 1,00 Sangat tinggi (Sempurna)
(Sumber Sudijono, 2011: 135)
b) Daya Pembeda
Daya pembeda item adalah kemampuan suatu butir item tes hasil
belajar untuk dapat membedakan antara testee yang
berkemampuan tinggi dengan testee yang berkemampuan rendah.
49
Mengetahui daya pembeda item sangat penting, sebab salah satu
dasar pegangan untuk menyusun butir tes hasil belajar adalah
adanya bahwa kemampuan antara testee yang satu dengan testee
yang lain berbeda-beda. Selain itu, butir tes hasil belajar harus
mampu memberikan hasil tes yang mencerminkan adanya
perbedaan kemampuan yang terdapat di kalangan testee tersebut
(Sudijono, 2011: 44).
Daya pembeda soal dapat diketahui dengan melihat besar
kecilnya angka indeks daya pembeda (IDP). Indeks daya
pembeda biasanya juga dinyatakan dalam bentuk proporsi.
Semakin tinggi indeks daya pembeda soal berarti semakin mampu
soal yang bersangkutan membedakan peserta didik yang pandai
dengan peserta didik yang kurang pandai. Indeks daya pembeda
berkisar antara -1,00 sampai dengan 1,00 (Sukiman, 2012: 67).
Untuk menghitung daya pembeda tes bentuk objektif dapat
dilakukan dengan menggunakan rumus sebagai berikut.
D = − = –
Keterangan :D : angka diskriminasiBA : banyaknya peserta kelompok atas yang menjawab soal
dengan benarBB : banyaknya peserta kelompok bawah yang menjawab soal
dengan benarJA : banyaknya peserta kelompok atasJB : banyaknya peserta kelompok bawahPA : proporsi peserta kelompok atas yang menjawab benarPB : proporsi peserta kelompok bawah yang berhasil menjawab
benar
50
Cara memberikan interpretasi terhadap hasil perhitungan yang
diperoleh dengan mengonsultasikan hasil perhitungan yang
diperoleh dengan kriteria berikut.
Tabel 8 Klasifikasi Daya PembedaDaya pembeda (D) Kategori
< 0,20 Lemah/Jelek0,20 – 0,39 Cukup0,40 – 0,69 Baik0,70 – 1,00 Baik sekali
Tanda negatif Tidak ada daya beda(Sumber Sudjana, 2006: 176)
c) Tingkat Kesukaran
Bilangan yang menunjukkan sukar dan mudahnya sesuatu soal
disebut indeks kesukaran (difficulty index)(Arikunto, 2018: 232).
Indeks kesukaran butir adalah bilangan yang menunjukkan sukar
dan mudahnya soal. Semakin tinggi indeks kesukaran butir maka
soal semakin mudah. Soal yang baik adalah soal tidak terlalu
mudah atau tidak terlalu sukar. Analisis tingkat kesukaran soal
adalah mengkaji soal-soal dari segi kesulitannya sehingga dapat
diperoleh soal-soal mana yang termasuk mudah, sedang, dan
sukar. Butir-butir item tes hasil belajar dapat dikatakan sebagai
butir item yang baik apabila butir-butir tes tersebut tidak terlalu
sukar dan tidak pula terlalu mudah. Dengan kata lain derajat
kesukaran tes tersebut adalah sedang atau cukup.
Angka indeks kesukaran butir itu besarnya berkisar antara 0,00
sampai dengan 1,00. Semakin besar angka indeks kesukaran
51
maka soal semakin mudah. Jika seluruh peserta ujian menjawab
dengan salah butir tersebut maka soal tersebut sangat sukar
dengan angka kesukaran 0,00 dan jika angka kesukaran 1,00
maka soal sangat mudah karena dijawab dengan benar oleh
seluruh peserta tes (Arikunto, 2013: 59).
Untuk menghitung indeks kesukaran tes bentuk objektif dapat
dilakukan dengan menggunakan rumus sebagai berikut.
P =
Keterangan :P : indeks kesukaranB : banyaknya peserta didik yang menjawab soal dengan
benarJS : jumlah seluruh peserta didik peserta tes
Mengklasifikasikan indeks kesukaran seperti yang terlihat pada
tabel berikut:
Tabel 9 Klasifikasi Indeks KesukaranIndeks Kesukaran (P) Kategori
0,00 ≤ 0,30 Sukar0,31 ≤ p ≤0,70 Sukup/Sedang
0,71 ≤ 1,00 Mudah(Sumber Arifin, 2012: 273)
d) Pengecoh/Distractor
Analisis fungsi distractor dilakukan khusus untuk soal bentuk
objektif model pilihan ganda (multiple choice item). Di dalam
soal model pilihan ganda, dilengkapi dengan beberapa alternatif
jawaban yang disebut dengan option (opsi) (Sukiman 2012: 60).
52
Pada soal pilihan ganda, di antara pilihan jawaban yang ada,
hanya satu yang benar. Selain jawaban yang benar tersebut,
adalah jawaban yang salah. Jawaban yang salah itulah yang
dikenal dengan distractor (pengecoh). Distractor yang baik dapat
dihindari oleh peserta didik yang pandai dan akan dipilih oleh
peserta didik yang kurang pandai. Distractor dapat dikatakan
telah berfungsi dengan baik apabila distractor tersebut telah
memiliki daya rangsang atau daya tarik yang baik (Amalia dan
Widyawati, 2013: 90).
Distractor telah dapat menjalankan fungsinya dengan baik
apabila distractor tersebut telah dipilih sekurang-kurangnya 5%
dari seluruh peserta tes. Distractor yang telah menjalankan
fungsinya dengan baik dapat digunakan kembali pada tes yang
akan datang. Dengan demikian, efektivitas distractor adalah
seberapa baik pilihan yang salah tersebut dapat mengecoh peserta
tes yang memang tidak mengetahui kunci jawaban yang tersedia.
Semakin banyak peserta tes yang memilih distractor tersebut,
maka distractor itu dapat menjalankan fungsinya dengan baik.
Jika peserta tes mengabaikan semua option (tidak memilih)
disebut omit. Dilihat dari segi omit, sebuah item dikatakan baik
jika omitnya tidak lebih dari 10 % pengikut tes (Sudijono, 2011:
45).
53
Perhitungan efektifitas pengecoh dapat menggunakan rumus
sebagai berikut.
IP = x 100%
Keterangan :IP : indeks pengecohP : jumlah peserta didik yang memiliki pengecohN : jumlah peserta didik yang ikut tesB : jumlah peserta didik yang menjawab benar pada setiap
soaln : jumlah alternatif jawaban (opsi)1 : bilangan tetap
Keberfungsian pengecoh dapat dilihat dari dua kriteria: a)
pengecoh yang dipilih oleh peserta didik dari kelompok rendah,
b) pengecoh yang dipilih oleh kelompok tinggi (Azwar, 1996:
142). Jika IP = 0 maka soal tesrebut jelek, dan demikian
pengecoh tidak berfungsi. Berikut kriteria keberfungsian
pengecoh.
Tabel 10 Kriteria Keberfungsian Pengecoh
No Nilai IP Kriteria
1 76% - 125% Sangat Baik
2 51% - 75% atau 126% - 150% Baik
3 26% - 50% atau 151% - 175% Kurang Baik
4 0% - 25% atau 176% - 200% Jelek
5 Lebih dari 200% Sangat Jelek
(Sumber Arifin, 2012: 280)
V. SIMPULAN DAN SARAN
A. Simpulan
Berdasarkan hasil penelitian dan pembahasan analisis butir soal pilihan ganda
ulangan tengah semester ganjil pada mata pelajaran biologi kelas X, XI, dan
XII MIPA SMA Negeri 11 Bandar Lampung tahun 2019/2020 dapat
disimpulkan bahwa:
1. Soal ulangan tengah semester ganjil pada kelas X, XI, dan XII MIPA
memiliki reliabilitas rendah.
2. Soal ulangan tengah semester ganjil pada kelas X, XI, dan XII MIPA
memiliki daya beda jelek.
3. Soal ulangan tengah semester ganjil pada kelas X, XI, dan XII MIPA
memiliki tingkat kesukaran yang mudah.
4. Soal ulangan tengah semester ganjil pada kelas X, XI, dan XII MIPA
memiliki lebih dari 50% pengecoh yang tidak berfungsi.
5. Soal ulangan tengah semester ganjil pada kelas X, XI, dan XII MIPA
memiliki lebih dari 50% validitas butir soal/item yang tidak valid.
6. Soal ulangan tengah semester ganjil pada kelas X, XI, dan XII MIPA
memiliki kualitas kurang baik.
72
B. Saran
Berdasarkan hasil penelitian yang telah dilakukan, peneliti memberi saran
sebagai berikut:
1. Bagi guru, untuk soal yang telah baik bisa dipertahankan, yang belum baik
untuk dilakukan perbaikan, yang buruk diperlukan penggantian soal.
2. Bagi kepala sekolah, untuk meningkatkan pengawasan terhadap guru dalam
menulis soal.
DAFTAR PUSTAKA
Amalia, A.N. & Widayati, A. 2013. Analisis Butir Soal Tes Kendali Mutu KelasXII SMA Mata Pelajaran Ekonomi Akuntasi di Kota Yogyakarta. Skripsi.Universitas Negeri Yogyakarta. Yogyakarta.
Arifin, Zainal. 2012. Evaluasi Pembelajaran. Rosdakarya. Bandung. 440 hlm.
Arikunto, Suharsimi. 2018. Dasar – Dasar Evaluasi Pendidikan . Bumi Aksara.Jakarta. 334 hlm.
Azwar, Saifuddin. 1996. Tes Prestasi. Pustaka Pelajar. Yogyakarta. 193 hlm.
Boopthiraj, C and K. Chellamani. 2013. Analysis of Test Item on Difficulty Leveland Discrimination Index in The Test of Research in Education.International Journal of Social Science & Interdisciplinary Research 2, No.2.
Darmawan, D. 2013. Metode Penelitian Kuantitatif. Remaja Rosdakarya.Bandung.
Daryanto. 2007. Evaluasi Pendidikan. Rineka Cipta. Jakarta. 227 hlm.
Depdiknas. 2008. Kurikulum Berbasis Kompetensi Mata Pelajaran Biologi UntukSekolah Menengah Atas. Pusat Kurikulum Balitbang. Jakarta.
Haris, Abdul dan Asep. 2013. Evaluasi Pembelajaran. Multi Pressindo.Yogyakarta. 191 hlm.
Martono, Nanang. 2010. Metode Penelitian Kuantitatif Analisis Isi dan AnalisisData Sekunder. Rajawali Press. Jakarta. 360 hlm.
Mehta, Gyata. 2014. Analisis Item Multiple Choice Question an Assesment of TheAssesment Tool. Diakses pada http://www.jihsr.org, tanggal 2 Maret 2019.Vol 4 (7): 9.
Mujiyanto. 2007. Analisis Butir Soal Ulangan Akhir Semester Gasal IPA kelasVIII tahun pelajaran 2006/2007. Diakses melalui
74
http://id.scribd.com/doc/56448415/Analisis-Butir-Soal tanggal 2 Maret2019
Nuraeni. 2012. Pengantar pendidikan. Unindra Press. Jakarta Selatan.
Permendikbud. 2013. Permendikbud RI Nomor 66 Tahun 2013 Tentang StandarPenilaian Pendidikan. Kemendikbud. Jakarta.
Purwanto, Ngalim. 2000. Prinsip-Prinsip Evaluasi Pendidikan. Alfabeta.Bandung. 334 hlm.
Ratnawulan, Elis dan Rusdiana. 2015. Evaluasi Pembelajaran. Pustaka Setia.Bandung. 312 hlm.
Sanjaya, Wina. 2008. Perencanaan dan Desain Sistem Pembelajaran. KencanaPrenada Media Group. Jakarta. 235 hlm.
Slameto. 2001. Evaluasi Pendidikan. Bumi Aksara. Jakarta.
Sudjana, Nana. 2006. Penilaian Hasil Belajar Proses Belajar Mengajar. RemajaRosdakarya. Bandung. 180 hlm.
Sudijono, Anas. 2011. Pengantar Evaluasi Pendidikan. Raja Grafindo Persada.Jakarta. 504 hlm.
Sugiyono. 2012. Metode Penelitian Kuantitatif, Kualitatif, dan R&D. Alfabeta.Bandung. 334 hlm
Sugiyono. 2015. Penelitian Pendidikan Pendekatan Kuantitatif, Kualitatif danR&D. Alfabeta. Bandung. 458 hlm.
Sukardi. 2011. Evaluasi Pendidikan: Prinsip & Operasionalnya. Bumi Aksara.Jakarta. 250 hlm.
Sukiman. 2012. Pengembangan Sistem Evaluasi. Insan Madani. Yogyakarta.
Supranata, Sumarna. 2004. Analisis Validitas, Reliabilitas, dan Interpretasi HasilTes. Remaja Rosdakarya. Bandung. 162 hlm.
Supriadi, Gito. 2011. Pengantar dan Teknik Evaluasi Pembelajaran. IntimediaPress. Malang.
Syamsudduha. 2012. Penilaian Kelas. UIN Alauddin Press. Makassar
Umiarso. 2011. Pendidikan Pembebasan. Ar-Ruzz Media. Jakarta. 212 hlm.
75
Widodo, Ari. 2006. Revisi Taksonomi Bloom dan Pengembangan Butir Soal.Buletin Puspendik Pendidikan Biologi FPMIPA UPI. Bandung. 14 hlm.
Yolanda Putri. 2014. Analisis Butir Soal Pilihan Ganda Menggunakan TeoriPengukuran Klasik pada Ulangan Umum Akhir Semester Genap BahasaPerancis SMA Negeri 9 Yogyakarta tahun ajaran 2013/2014. Skripsi.Universitas Negeri Yogyakarta. Yogyakarta.