analisis perbaikan butir soal ranz

15
Analisis perbaikan butir soal A. Mengapa Analisis Butir Soal Penting? Dengan melakukan analisis butir soal dapat diperoleh banyak informasi yang bermanfaat, baik untuk guru, siswa maupun proses pembelajaran itu sendiri. Menganalisis butir soal dilakukan dengan harapan dapat meningkatkan kualitas butir soal tersebut. Menurut Nitko (1983), analisis butir soal menggambarkan suatu proses pengambilan data dan penggunaan informasi tentang butir-butir soal, terutama informasi tentang respon siswa terhadap setiap butir soal. Lebih lanjut penggunaan analisis butir soal adalah sebagai berikut: 1. Untuk mengetahui apakah butir-butir soal yang disusun sudah berfungsi sesuai dengan apa yang dikehendaki oleh penyusun soal. Untuk itu perlu diperhatikan hal-hal sebagai berikut: a. Apakah soal-soal yang disusun sudah sesuai untuk mengukur perubahan tingkah laku seperti telah dirumuskan dalam tujuan pembelajaran khusus? b. Apakah tingkat kesukaran soal sudah diperhitungkan? c. Apakah soal tersebut sudah mampu membedakan antara siswa yang pandai dengan siswa yang kurang pandai? d. Apakah kunci soal sudah sesuai dengan maksud soal? e. Jika digunakan tes pilihan ganda, apakah pengecoh (distractor) yang dipilih sudah berfungsi dengan baik? f. Apakah soal tersebut masih dapat ditafsirkan ganda atau tidak? 2. Sebagai umpan balik bagi siswa untuk mengetahui kemampuan mereka dalam menguasai suatu materi. 3. Sebagai umpan balik bagi guru untuk mengetahui kesulitan-kesulitan yang dialami siswa dalam memahami suatu materi. 4. Sebagai acuan untuk merevisi soal. 5. Untuk memperbaiki (meningkatkan) kemampuan guru dalam menulis soal. B. Kapan Analisis Butir Soal Dilakukan? Pada saat guru mengujikan suatu set soal untuk mengambil keputusan penting tentang hasil belajar siswa, maka idealnya guru harus yakin bahwa set soal tersebut adalah valid dan reliabel. Validitas set soal dapat diketahui dari kisi-kisi soal sedangkan reliabilitas soal baru dapat diketahui setelah uji coba. Sehingga untuk mengetahui reliabilitas set soal dilakukanlah analisis butir soal. 1. Tingkat Kesukaran (P) Tingkat kesukaran suatu butir soal merupakan salah satu yang dapat menunjukkan kualitas butir soal tersebut (mudah, sedang, sukar). Suatu butir soal dikatakan mudah jika sebagian besar siswa dapat menjawab dengan benar dan dikatakan sukar jika sebagian besar siswa tidak dapat menjawab dengan benar. Besarnya tingkat kesukaran butir soal dapat dihitung dengan memperhatikan proporsi peserta tes yang menjawab benar terhadap setiap butir soal, dalam hal ini dapat dihitung dengan menggunakan rumus: P = B / N Keterangan: P adalah indeks tingkat kesukaran butir soal B adalah jumlah peserta tes yang menjawab benar N adalah jumlah seluruh peserta tes Contoh: Jika butir soal nomor 1 yang Anda ujikan dapat dijawab dengan benar oleh 10 dari 40 siswa, maka indeks tingkat kesukaran butir soal tersebut adalah: P = 10 / 40 = 0,25

Upload: iman-chimonx-nurjaman

Post on 09-Dec-2014

525 views

Category:

Documents


19 download

DESCRIPTION

abcd

TRANSCRIPT

Page 1: Analisis Perbaikan Butir Soal Ranz

Analisis perbaikan butir soal A. Mengapa Analisis Butir Soal Penting?

Dengan melakukan analisis butir soal dapat diperoleh banyak informasi yang bermanfaat, baik untuk guru, siswa maupun proses pembelajaran itu sendiri. Menganalisis butir soal dilakukan dengan harapan dapat meningkatkan kualitas butir soal tersebut. Menurut Nitko (1983), analisis butir soal menggambarkan suatu proses pengambilan data dan penggunaan informasi tentang butir-butir soal, terutama informasi tentang respon siswa terhadap setiap butir soal. Lebih lanjut penggunaan analisis butir soal adalah sebagai berikut:

1. Untuk mengetahui apakah butir-butir soal yang disusun sudah berfungsi sesuai dengan apa yang dikehendaki oleh penyusun soal. Untuk itu perlu diperhatikan hal-hal sebagai berikut:

a. Apakah soal-soal yang disusun sudah sesuai untuk mengukur perubahan tingkah laku seperti telah dirumuskan dalam tujuan pembelajaran khusus?

b. Apakah tingkat kesukaran soal sudah diperhitungkan?c. Apakah soal tersebut sudah mampu membedakan antara siswa yang pandai dengan siswa yang kurang

pandai?d. Apakah kunci soal sudah sesuai dengan maksud soal?e. Jika digunakan tes pilihan ganda, apakah pengecoh (distractor) yang dipilih sudah berfungsi dengan

baik?f. Apakah soal tersebut masih dapat ditafsirkan ganda atau tidak?

2. Sebagai umpan balik bagi siswa untuk mengetahui kemampuan mereka dalam menguasai suatu materi.3. Sebagai umpan balik bagi guru untuk mengetahui kesulitan-kesulitan yang dialami siswa dalam

memahami suatu materi.4. Sebagai acuan untuk merevisi soal.5. Untuk memperbaiki (meningkatkan) kemampuan guru dalam menulis soal.

B. Kapan Analisis Butir Soal Dilakukan?Pada saat guru mengujikan suatu set soal untuk mengambil keputusan penting tentang hasil belajar siswa,

maka idealnya guru harus yakin bahwa set soal tersebut adalah valid dan reliabel. Validitas set soal dapat diketahui dari kisi-kisi soal sedangkan reliabilitas soal baru dapat diketahui setelah uji coba. Sehingga untuk mengetahui reliabilitas set soal dilakukanlah analisis butir soal.

1. Tingkat Kesukaran (P)Tingkat kesukaran suatu butir soal merupakan salah satu yang dapat menunjukkan kualitas butir soal

tersebut (mudah, sedang, sukar). Suatu butir soal dikatakan mudah jika sebagian besar siswa dapat menjawab dengan benar dan dikatakan sukar jika sebagian besar siswa tidak dapat menjawab dengan benar. Besarnya tingkat kesukaran butir soal dapat dihitung dengan memperhatikan proporsi peserta tes yang menjawab benar terhadap setiap butir soal, dalam hal ini dapat dihitung dengan menggunakan rumus:P = B / N Keterangan:P adalah indeks tingkat kesukaran butir soalB adalah jumlah peserta tes yang menjawab benarN adalah jumlah seluruh peserta tesContoh:Jika butir soal nomor 1 yang Anda ujikan dapat dijawab dengan benar oleh 10 dari 40 siswa, maka indeks tingkat kesukaran butir soal tersebut adalah:P = 10 / 40 = 0,25

Indeks tingkat kesukaran butir soal bergerak antara 0,00 sampai dengan 1,00. Indeks tingkat kesukaran suatu butir soal (P) = 0,00 akan tercapai apabila seluruh peserta tes tidak ada yang menjawab dengan benar dan indeks tingkat kesukaran suatu butir soal (P) = 1,00 akan tercapai apabila seluruh peserta tes dapat menjawab dengan benar. Jadi butir soal yang mudah akan mempunyai P mendekati 1,00 dan butir soal yang sukar akan mempunyai P mendekati 0,00.

Menurut Fernandes (1984) kategori indeks tingkat kesukaran butir soal adalah sebagai berikut:P >= 0,76 : mudah0,25 P 0,75 : sedangP 0,24 : sukarButir soal yang dianggap sangat bermanfaat (useful) adalah butir soal yang mempunyai indeks tingkat

kesukaran dalam kategori sedang.2. Daya Pembeda (D)

Daya pembeda butir soal memiliki pengertian seberapa jauh butir soal tersebut dapat membedakan kemampuan individu peserta tes. Butir soal yang didukung oleh potensi daya pembeda yang baik akan mampu membedakan peserta tes (peserta didik) yang memiliki kemampuan tinggi (pandai) dengan peserta didik yang memiliki kemampuan rendah (kurang pandai).

Indeks daya pembeda butir soal dapat dihitung dengan menggunakan rumus:D = PA – PB

Keterangan:D adalah indeks daya pembeda butir soalPA adalah proporsi kelompok atas yang menjawab benarPB adalah proporsi kelompok bawah yang menjawab benar

Page 2: Analisis Perbaikan Butir Soal Ranz

Contoh:Dalam menjawab butir soal nomor 2, diperoleh 6 dari 10 siswa yang termasuk dalam kelompok atas

dapat menjawab benar dan 2 dari 10 siswa yang termasuk kelompok bawah dapat menjawab benar, maka indeks daya pembeda butir soal tersebut adalah:

D = (6/10) – (2/10) = 4/10 = 0,4 Yang dimaksud siswa kelompok atas adalah kelompok siswa yang memperoleh skor tinggi sedangkan

yang dimaksud dengan siswa kelompok bawah adalah kelompok siswa yang memperoleh skor rendah setelah mengerjakan satu set suatu mata pelajaran.

Nilai indeks daya pembeda butir soal bergerak dari –1 sampai 1. Semakin tinggi indeks daya pembeda menunjukkan bahwa butir soal tersebut semakin dapat membedakan antara siswa yang pandai dengan siswa yang kurang pandai.

Secara teoritis indeks daya pembeda soal (D) = 1 akan tercapai apabila semua siswa kelompok atas dapat menjawab benar dan semua siswa kelompok bawah menjawab salah. Indeks daya pembeda soal (D) = – 1 akan tercapai apabila semua siswa dalam kelompok atas menjawab salah dan semua siswa kelompok bawah dapat menjawab benar. Sedangkan indeks daya pembeda soal (D) = 0 tercapai apabila proporsi siswa yang menjawab benar dalam kelompok atas dan kelompok bawah adalah sama.

Butir soal yang mempunyai indeks daya pembeda negatif adalah butir soal yang kurang baik karena soal tersebut tidak bisa membedakan siswa yang pandai dengan siswa yang kurang pandai, di mana siswa yang kurang pandai justru lebih banyak menjawab benar daripada siswa yang pandai.

Butir soal mempunyai daya pembeda yang baik jika kunci (jawaban soal) mempunyai daya pembeda positif dan pengecohnya mempunyai daya pembeda negatif. Menurut Fernandes (1984) kategori indeks daya pembeda butir soal adalah sebagai berikut:

D 0,40 : sangat baik 0,30 D 0,39 : baik0,20 D 0,29 : sedang D <= 0,19 : tidak baik

C. Bagaimana Cara Melakukan Analisis Secara Sederhana?Untuk melakukan analisis butir soal secara sederhana, berikut ini disajikan langkah-langkah yang

diperlukan:1. Hitunglah jumlah jawaban yang benar untuk seluruh siswa.2. Berdasarkan jumlah jawaban yang benar dari seluruh siswa tersebut susunlah skor siswa mulai skor

tertinggi ke skor terendah.3. Berdasarkan urutan skor tersebut tentukan siswa yang termasuk dalam kelompok atas dan siswa dalam

kelompok bawah. Untuk menentukan berapa persen siswa yang termasuk kelompok atas dan berapa persen yang masuk kelompok bawah gunakan rambu-rambu sebagai berikut:a. Jika jumlah siswa <= 20, maka jumlah kelompok atas dan kelompok bawah masing-masing 50%.b. Jika jumlah siswa 21 – 40 , maka jumlah kelompok atas dan kelompok bawah masing-masing 33,3%.c. Jika jumlah siswa 41, maka jumlah kelompok atas dan kelompok bawah masing-masing 27%.

4. Hitunglah jumlah siswa dalam kelompok atas yang memilih tiap-tiap alternatif jawaban yang disediakan.5. Dengan cara yang sama hitunglah jumlah siswa dalam kelompok bawah yang memilih tiap-tiap alternatif

jawaban yang disediakan. 6. Hitung jumlah seluruh peserta tes (kelompok atas, tengah, bawah) yang menjawab benar.7. Tentukanlah tingkat kesukaran dan daya pembeda butir soal dengan menggunakan rumus yang telah

disediakan.Contoh:Perhatikan jawaban 100 siswa terhadap butir soal nomor 1 berikut:

Kelompok Alternatif Jawaban JumlahA B* C D E

AtasTengahBawah

53

15257

012

00

75

2727

Catatan: * (kunci jawaban)Indeks tingkat kesukaran butir soal di atas adalah:P = B / N = (15 + 25 + 7)/100 = 47/100 = 0,47Indeks daya pembeda butir soal di atas adalah :D = PA – PB = (15/27) – (7/27) = 0,30D. Bagaimana Memperbaiki Butir Tes?

Beberapa hal yang perlu diperhatikan dalam memperbaiki butir soal adalah sebagai berikut:1. Perhatikan tingkat kesukaran butir soal. Butir soal dianggap baik jika mempunyai indeks tingkat

kesukaran (P) antara 0,25 sampai dengan 0,75 atau yang mendekati angka tersebut.2. Perhatikan daya pembeda butir soal. Butir soal dianggap baik jika kunci (jawaban soal) mempunyai

indeks daya pembeda positif tinggi dan pengecohnya mempunyai indeks daya pembeda negatif. 3. Perhatikan stem atau pokok soalnya sebab stem yang ambigius akan membingungkan peserta ujian untuk

menentukan jawabannya.

Page 3: Analisis Perbaikan Butir Soal Ranz

Salah satu upaya dalam meningkatkan kualitas proses dan hasil belajar sebagai bagian dari peningkatan kualitas pendidikan dapat dilakukan melalui sistem penilaian. Dalam penilaian proses dan hasil belajar siswa di sekolah, guru memberikan suatu evaluasi untuk mengetahui sejauh mana penguasaan materi yang telah dikuasai oleh siswa selama proses belajar mengajar mengenai materi yang disampaikan.Dalam melaksanakan kegiatan evaluasi, berhasil atau tidaknya sangat ditentukan oleh tepat atau tidaknya pelaksanaan ujian. Untuk melaksanakan ujian ini memerlukan alat-alat. Bagi ujian tertulis maka alatnya adalah butir-butir soal tertulis. Bagi ujian lisan maka alatnya adalah butir soal tertulis yang disediakan bagi setiap testi, atau sekurang-kurangnya pokok pertanyaan yang sudah tertulis dan dipersiapkan sebelumnya. Bagi ujian praktek, maka alatnya adalah lembar pengamatan yang berisi segi-segi yang diamati beserta rentang skor masing-masing.Idealnya sebelum suatu tes dipergunakan maka tes tersebut harus memenuhi syarat-syarat sebagi tes yang baik, maka tes yang bersangkutan perlu diuji cobakan. Namun sebelum diuji cobakan tes tersebut harus memperlihatkan indokator-indikator sebagai tes yang baik. Dalam hal ini dilakukan suatu analisis butir soal.Analisis butir soal adalah pengkajian pertanyaan tes agar diperoleh perangkat pertanyaan yang memiliki kualitas memadai. Analisis yang dilakukan atas dasar uji coba dinamakan analisis empiris. Sedangkan analisis berdasarkan karakteristik yang tampak pada tes tersebut tanpa uji coba dinamakan analisis rasional, karena semata-mata dilakukan atas dasar pertimbangan rasio.Ada beberapa analisis butir soal, yakni analisis tingkat kesukaran soal dan analisis daya pembeda disamping validitas dan reabilitas. Menganalisis tingkat kesukaran soal artinya mengakaji soal dari segi kesulitannya sehingga dapat diperoleh soal mana yang termasuk mudah, sedang dan sukar. Sedang menganalisis daya pembeda artinya mengkaji soal tes dari segi kesanggupan tes tersebut dalam membedakan siswa yang termasuk kategori kuat/tinggi prestasinya. Sedangkan validitas dan reabilitas mengkaji kesulitan dan keajegan pertanyaan tes.

ANALISIS BUTIR SOALAnalisis butir soal yang dalam bahasa inggris disebut item analiysis dilakukan terhadap empirik.Maksudnya, analisis itu baru dapat dilakukan apabila suatu tes telah dilaksanakan dan hasil jawaban terhadap butir-butir soal telah kita peroleh.Pengertian,Tujuan,dan Manfaat Analisis butir soal.Analisis butir soal adalah suatu kegiatan analisis untuk menentukan tingkat kebaikan butir-butir soal yang terdapat dalam suatu tes sehingga informasi yang dihasilkan dapat kita pergunakan untuk memperbaiki butir soal dan tes tersebut.Tujuan analisis butir soal yaitu untuk mengadakan identifikasi soal-soal yang baik,kurang baik dan soal yang buruk. Sehingga dapat petunjuk untuk mendapatkan perbaikan.Manfaat yang dapat diberikan apabila dilakukan analisis terhadap butir soal,sebagai berikut :Untuk mengetahui soal yang dianalisis telah berfungsi sebagaimana yang diharapkan.Untuk mengetahui tingkat kesukaran soal.Untuk mengetahui apakah tanggapan-tanggapan soal yang dianalisis sudah baik susunannya.Untuk mengetahui apakah soal yang dianalisis sudah betul/baik konstruksinya.Untuk bahan masukan menyusun program remedial teaching.Untuk meningkatakan keterampilan guru dalam merencanakan dan mengolah hasil tes.Jenis-jenis analisisAda dua jenis analisis butir soal yang dapat pendidik laksanakan, yaitu : prosedur peningkatan secara judgement, terkait dengan isi dan bentuk soal.Analisis secara kualitatif Teknik analisis kualitatifTeknik moderator merupakan teknik berdiskusi yang di dalamnya terdapat satu orang sebagai penengah. Berdasarkan teknik ini, setiap butir soal didiskusikan secara bersama-sama dengan beberapa ahli dan dimoderatori oleh satu orang.Kelebihan : Setiap butir soal dapat dituntaskan secara bersama-sama, perbaikannya seperti apa.Kelemahan : Teknik ini adalah memerlukan waktu lama untuk rnendiskusikan setiap satu butir soal.Teknik panel merupakan suatu teknik menelaah butir soal yang setiap butir soalnya ditelaah berdasarkan kaidah penulisan butir soal. Para penelaah dipersilakan memperbaiki langsung pada teks soal dan memberikan komentarnya serta memberikan nilai pada setiap butir soalnya yang kriterianya adalah: baik, diperbaiki, atau diganti. prosedur peningkatan secara empirik,Analisis secara kuantitatif terkait dengan ciri-ciri statistiknya. Penelaahan butir soal didasarkan pada data empirik dari butir soal terkait yang telah diujikan.Pendekatan Analisis Kuantitatif- KlasikAnalisis butir soal secara klasik adalah proses penelaahan butir soal melalui informasi dari jawaban peserta didik guna meningkatkan mutu butir soal yang bersangkutan dengan menggunakan teori tes klasik.Kelebihan : mudah , murah, sederhana, familier digunakan guru-guru, dapat menggunakan data sampel kecil.Kelemahan :(1) Tingkat kemampuan dalam teori klasik adalah “true score”. Jika tes sulit artinya tingkat kemampuan peserta didik mudah. Jika tes mudah artinya tingkat kemampuan peserta didik tinggi.(2) Tingkat kesukaran soal didefinisikan sebagai proporsi peserta didik dalam grup yang menjawab benar

Page 4: Analisis Perbaikan Butir Soal Ranz

soal. Mudah/sulitnya butir soal tergantung pada kemampuan peserta didik yang dites dan kemampuan tes yang diberikan.(3) Daya pembeda, reliabilitas, dan validitas soal/tes didefinisikan berdasarkan grup peserta didik.-ModernPenelaahan butir soal dengan menggunakan Item Response Theory (IRT) atau teori jawaban butir soal. Teori ini merupakan suatu teori yang menggunakan fungsi matematika untuk menghubungkan antara peluang menjawab benar suatu soal dengan kemampuan siswa. IRT merupakan hubungan antara probabilitas jawaban suatu butir soal yang benar dan kemampuan siswa atau tingkatan/level prestasi siswa.Kelebihan :(1) asumsi banyak soal yang diukur pada trait yang sama, perkiraan tingkat kemampuan peserta didik adalah independen;(2) asumsi pada populasi tingkat kesukaran, daya pembeda merupakan independen sampel yang menggambarkan untuk tujuan kalibrasi soal;(3) statistik yang digunakan untuk menghitung tingkat kemampuan siswa diperkirakan dapat terlaksanaKelemahan : prosesnya cukup rumit dan sulitPenghitungan dalam penelaahan butir soal secara kuantitatif dapat menggunakan bantuan kalkulator scientific atau program komputer.Program yang sudah dikenal secara umum adalah EXCEL, SPSS (Statitistical Program for Social Science), atau program khusus seperti ITEMAN (analisis secara klasik), RASCAL, ASCAL, BILOG (analisis secara item respon teori atau IRT), FACETS (analisis model Rasch untuk data kualitatif).Dalam analisis butir soal secara kuantitatif ada empat yang perlu dianalisis pada setiap soal yang telah dikerjakan siswa yaitu:Analisis Tingkat Kesukaran SoalSoal yang baik adalah soal yang tidak terlalu mudah atau tidak terlalu sukar. Soal yang terlalu mudah tidak merangsang siswa untuk mempertinggi usaha memecahkan. Sebaliknya soal yang terlalu sukar akan menyebabkan siswa menjadi putus asa dan tidak mempunyai semangat untuk mencoba lagi karena di luar jangkauannya.Dalam menentukan kriteria soal, apakah soal tersebut termasuk mudah, sedang, atau sukar adalah berdasarkan pertimbangan – pertimbangan tertentu. Pertimbangan tersebut antara lain adalah:Aspek yang di ukur dalam pernyataan tersebut.Sifat materi yang di ujikan atau ditanyakan.Isi bahan yang di tanyakan sesuai dengan bidang keilmuannya, baik luasnya maupun kedalamannya.Cara melakukan analisis untuk menentukan tingkat kesukaran soal adalah sebagai berikut :1). Menentukan indeks kesukaran (difficulty index), yaitu bilangan yang menunjukan sukar dan mudahnya sesuatu soal. Dalam dunia evaluasi belajar umumnya dilambangkan dengan huruf P (proporstion).0,0 1,0Sukar Mudah Rumus mencari indeks kesukaran soal :P= B/Js x 100 %Dengan:P=Indeks kesukaranB= banyaknya siswa yang menjawab soal itu dengan betulJs= jumlah seluruh siswa peserta tes2). Menentukan tingkat kesukaran, adalah ukuran yang menunjukan derajat kesulitan soal untuk diselesaikan oleh siswa dan mengetahui soal-soal yang termasuk mudah, sedang dan sukar.Rumus mencari tingkat kesukaran soali).Tk=JB/JJ x 100 % Dengan: TK= Tingkat kesukaranJB= Jumlah jawaban yang benarJJ= Jumlah jawaban keseluruhanii).F=(PH+PL)/2Dengan: F =Tingkat kesukaranPH = Prosentase pada kelompok tinggiPL = Prosentase pada kelompok rendahContoh soal :kita misalkan murid yang mengikuti tes yang kita berikan adalah sebanyak 50 orang .lembar jawababn murid-murid tersebut kita susun dari skor tertinggi paling atas sampai dengan skor terendah paling bawah.Kita ambil 27% dari mereka yang mendapatkan skor tertinggi.Dalam hal ini 27% X 50 orang sama dengan 13,5 orang kita bulatkan menjadi 14 orang.begitu pula kita ambil 27% dari mereka yang mendapatkan skor terendah.jumlahnya tentu sama dengan kelompok atas ,yaitu 14 orang juga.Misalkan data yang diperoleh adalah sebagi berikut :Untuk item no.1,dari kelompok bawah salah 9 orang dan dari kelompok atas salah 2 orang.Untuk item no.2,dari kelompok bawah salah 8 orang dan dari kelompok atas salah 85orang.Untuk item no.3,dari kelompok bawah salah 14 orang dan dari kelompok atas salah 8 orang.Untuk item no.4,dari kelompok bawah salah 6 orang dan dari kelompok atas tidak ada yang salah.

Page 5: Analisis Perbaikan Butir Soal Ranz

Untuk item no.5,dari kelompok bawah salah 13 orang dan dari kelompok atas salah 11 orang.Untuk item no.6,dari kelompok bawah salah 2 orang dan dari kelompok atas salah 3 orang.Berdasarkan data tersebut ,maka dapat dibuat tabel sebagai berikut :No.item PL PH PL +PH PL-PH1 9 2 11 72 8 5 13 33 14 8 23 64 6 0 6 65 13 11 24 26 2 3 5 -1DST Dari tabel tersebut,maka tingkat kesukaran untuk masing-masing item dapat dicari sebagi berikut :Untuk item no.1.Tk=JB/JJ x 100 %= 11 x 100%28= 39%Untuk item no.2Tk=JB/JJ x 100 %=13 x 100 % = 46%28Untuk item no.3Tk=JB/JJ x 100 %=23 x 100 % = 82%28Untuk item no.4Tk=JB/JJ x 100 %= 6 x 100 % = 21%28Untuk item no.5Tk=JB/JJ x 100 %= 24 x 100 % = 86%28Untuk item no.6Tk=JB/JJ x 100 %= 5 x 100 % = 18%28Derajat kesukaran yang baik adalah derajat kesukaran yang bergerak 25% sampai 75%.item yang mempunyai derajat kesukaran dibawah 25% berarti bahwa itemtersebut terlalu mudah .sebaliknya item yang mempunyai derajat kesukaran 75% ,berarti bahwa item tersebut terlalu sukar.Kriteria indeks kesukaran soal adalah sebagai berikut.Kriteria yang digunakan adalah makin kecil indeks yang diperoleh, makin sulit soal tersebut. Sebaliknya, makin besar indeks yang diperoleh makin mudah soal tersebut. 0,00-0,30 Soal sukar0,31-0,70 Soal sedang0,71-0,90 Soal mudahAnalisis Daya PembedaDaya pembeda adalah mengkaji soal-soal tes dari segi kesanggupan tes tersebut dalam membedakan siswa yang termasuk ke dalam kategori rendah dan kategori tinggi prestasinya. Tujuan daya pembeda yaitu untuk mengetahui kesanggupan soal dalam membedakan siswa yang tergolong mampu (tinggi prestasinya) dengan siswa yang tergolong kurang atau lemah prestasinya.Cara melakukan analisis daya pembeda adalah sebagai berikut:a). Daya pembeda soal ditunjukan indeks diskriminasi (D) yang dihitung dengan menggunakan rumus:D=PH-PL Dengan: D = Daya PembedaPH= Prosentase pada kelompok tinggiPL = Prosentase pada kelompok rendahb). Cara lain menghitung daya pembedaDP=(PL-pH)/nDengan :DP = Indeks DP atau daya pembeda yang di cariPH = Prosentase pada kelompok tinggiPL = Prosentase pada kelompok rendan=jumlah kelompok atas atau kelompok bawah

Page 6: Analisis Perbaikan Butir Soal Ranz

Mengambil dari tabel dari soal tingkat kesukaran tadi bisa dilihat juga daya pembedaNo.item PL PH PL +PH PL-PH1 9 2 11 72 8 5 13 33 14 8 23 64 6 0 6 65 13 11 24 26 2 3 5 -1DST Untuk item no.1DP=(PL-pH)/nDp = 9-2 = 0,5014Untuk item no.2DP=(PL-pH)/nDp = 8-5 = 0,2114Untuk item no.3DP=(PL-pH)/nDp = 14-8 = 0,4314Untuk item no.4DP=(PL-pH)/nDp = 6-0 = 0,4314Untuk item no.5DP=(PL-pH)/nDp = 13-11 = 0,1414Untuk item no.6DP=(PL-pH)/nDp = 2-3 = -0,0714c). Klasifikasi daya pembeda adalah sebagai berikut:0,00-0,20 Buruk0,21-0,40 Cukup0,41-0,70 Baik0,71-1,00 Baik sekali Analisis validitasSuatu alat pengukur dapat dikatakan alat pengukur yang valid apabila alat pengukur tersebut dapat mengukur apa yang hendak diukur secara tepat. Penganalisaan terhadap tes hasil belajar sebagai suatu totalitas dapat dilakukan dengan dua cara.Pertama, penganalisaan yang dilakukan dengan jalan berpikir secara rasional atau penganalisaan dengan menggunakan logika (logical analysis). Kedua, penganalisaan yang dilakukan dengan mendasarkan diri kepada kenyataan empiris, di mana penganalisaan dilaksanakan dengan menggunakan empirical analysis.a. Pengujian Validitas Tes Secara RasionalTes hasil belajar yang setelah dilakukan penganalisaan secara rasional ternyata memiliki daya ketepatan mengukur, disebut tes hasil belajar yang telah memiliki validitas logika (logical validity). Validitas rasional adalah validitas yang diperoleh atas dasar hasil pemikiran, validitas yang diperoleh dengan berpikir secara logis.1). Validitas isi (content validity)Sebuah tes dikatakan memiliki validitas isi apabila mengukur tujuan khusus tertentu yang sejajar dengan materi atau isi pelajaran yang diberikan. Validitas isi ini sering juga disebut validitas kurikuler.Validitas isi adalah validitas yang ditilik dari segi isi tes itu sendiri sebagai alat pengukur hasil belajar peserta didik, isinya telah dapat mewakili secara representatif terhadap keseluruhan materi atau bahan pelajaran yang seharusnya diteskan (diujikan). Upaya lain yang dapat ditempuh dalam rangka mengetahui validitas isi dari tes hasil belajar adalah dengan jalan menyelenggarakan diskusi panel. Dalam forum diskusi tersebut, para pakar yang dipandang memiliki keahlian yang ada hubungannya dengan mata pelajaran yang diujikan, diminta pendapat dan rekomendasinya terhadap isi atau materi yang terkandung dalam tes hasil belajar yang bersangkutan. Hasil-hasil diskusi itu selanjutnya dijadikan pedoman atau bahan acuan untuk memperbaiki dan menyempurnakan isi atau materi hasil belajar tersebut. Jadi kegiatan menganalisis validitas isi dapat dilakukan baik sesudah maupun sebelum tes hasil belajar dilaksanakan.Dalam hal tertentu tes yang telah disusun sesuai dengan kurikulum (materi dan tujuannya) agar memenuhi validitas isi, peneliti atau pemakai tes dapat meminta bantuan ahli bidang studi untuk mene¬laah apakah konsep materi yang diajukan telah memadai atau tidak, sebagai sampel tes. Dengan demikian validitas isi

Page 7: Analisis Perbaikan Butir Soal Ranz

tidak memerlukan uji coba dan analisis statistik atau dinyatakan dalam bentuk angka¬-angka.Contoh :Misalnya apabila kita ingin memberikan tes biology kepada anak-anak kelas II, maka item-itemnya harus diambil dari pelajaran kelas II. Kalau terdapat item-item yang diambil dari kelas III maka tes itu tidak valid lagi.2).Validitas konstruksi (construct validity).Sebuah tes dikatakan memiliki validitas konstruksi apabila butir-butir soal yang membangun tes tersebut mengukur setiap aspek berfikir seperti yang disebutkan dalam tujuan instruksional khusus.Tes hasil belajar dapat dinyatakan sebagai tes yang telah memiliki validitas konstruksi apabila tes hasil belajar tersebut (–ditilik dari segi susunan, kerangka atau rekaannya–) telah dapat dengan secara tepat mencerminkan suatu konstruksi dalam teori psikologis. Tes hasil belajar baru dapat dikatakan telah memiliki validitas susunan apabila butir-butir soal atau item yang membangun tes tersebut benar-benar telah dapat dengan secara tepat mengukur aspek-aspek berpikir (seperti: aspek kognitif, aspek efektif, aspek pdikomotorik dan sebagainya) sebagaimana telah ditentukan dalam tujuan instruksional khusus.Penganalisaan validitas konstruksi juga dapat dilakukan dengan jalan menyelenggarakan diskusi panel. Pengujian validitas konstruksi tes ini pun dapat dilakukan baik sesudah maupun sebelum tes hasil belajar tersebut dilaksanakan.Contoh :Konsep mengenai “hubungan social”, konsep sikap dapat dilihat dari indikatornya secara teoretis (deduksi teori) : dilihat dari pengalaman:- kesediaan menerima stimulus - (bisa bergaul dengan orang lain)- kemauan reaksi stimulus - (disenangibanyak temannya)- menilai stimulus - (menerima pendapat orang lain)- menyusun/mengorganisasi - (tidak memaksakan pendapat)- internalisasi nilai - (bisa bekerjasama dgn siapapun)Apabila hasil tes menunjukkan indicator ang tidak berhubungan secara positif satu sama lain, berarti ukuran tersebut tidak memiliki validitas konstruksi. Maka prlu ditinjau atau diperbaiki kembali.b. Pengujian Validitas Tes Secara Empirik.Dimaksud dengan validitas empirik adalah ketepatan mengukur yang didasarkan pada hasil analisis yang bersifat empiric yang bersumber pada atau diperoleh atas dasar pengamatan di lapangan. Untuk dapat menentukan apakah tes hasil belajar sudah memiliki validitas empirik ataukah belum, dapat dilakukan penelusuran dari dua segi, yaitu dari segi daya ketepatan meramalnya (predictive validity) dan daya ketepatan bandingannya (concurrent validity).3).Validitas “Ada Sekarang” (Concurrent Validity)Validitas ini lebih umum dikenal dengan validitas empiris. Dikatakan validitas empiris jika hasilnya sesuai dengan pegalaman. Pengalaman selalu mengenal hal yang telah lampau sehingga data pengalaman tersebut sekarang sudah ada (ada sekarang, concurrent).Cara yang dipergunakan untuk menilai validitas ini dengan jalan mengkorelasikan hasil-hasil yang dicapai dalam tes dengan hasil-hasil yang dicapai dalam tes yang sejenis yang telah diketahui mempunyai validitas tinggi (misalnya tes standar). Tinggi rendahnya koefisien korelasi yang diperoleh menunjukkan tinggi rendahnya validitas tes yang akan kita nilai kualitasnya.4).Validitas Prediksi (Predictive Validity)Sebuah tes dikatakan memiliki validitas prediksi atau validitas ramalan apabila mempunyai kemampuan untuk meramalkan apa yang akan terjadi pada masa yang akan datang. Istilah “ramalan” jika dikaitkan dengan validitas tes, maka yang dimaksud dengan validitas ramalan dari suatu tes adalah suatu kondisi yang menunjukan seberapa jauhkah sebuah tes telah dapat dengan secara tepat menunjukan kemampuannya untuk meramalkan apa yang bakal terjadi pada masa mendatang.Sebagai alat pembanding validitas prediksi adalah nilai-nilai yang diperoleh setelah peserta tes mengikuti pelajaran di perguruan tinggi. Jika ternyata siapa yang memiliki nilai tes lebih tinggi gagal dalam ujian semester 1 dibandingkan dengan dahulu nilai tesnya lebih rendah maka tes masuk yang dimaksud tidak memiliki prediksi.Untuk mengetahui apakah suatu tes hasil belajar dapat dinyatakan sebagai tes yang telah memiliki validitas ramalan ataukah belum, dapat ditempuh dengan cara: mencari korelasi antara tes hasil belajar yang sedang diuji validitas ramalannya dengan kriterium yang ada. Jika diantara kedua variabel tersebut terdapat korelasi positif yang signifikan, maka tes hasil belajar yang sedang diuji validitas ramalannya itu, dapat dinyatakan sebagai tes hasil belajar yang telah memiliki daya ramal yang tepat, artinya: apa yang telah diramalkan, betul-betul telah terjadi secara nyata dalam praktek.Dalam rangka mencari korelasi antara tes hasil belajar yang sedang diuji validitas ramalannya dengan kriterium yang telah ditentukan itu, cara sederhana yang paling sering digunakan adalah dengan menerapkan Teknik Analisis Korelasional Product Moment dari Karl Pearson.Cara mengetahui Validitas Alat ukur.Sebuah tes dikatakan memiliki validitas jika hasilnya sesuai dengan kriterium, dalam arti memiliki kesejajaran antara hasil tes tersebut dengan kriterium. Teknik yang digunakan untuk mengetahui kesejajaran adalah teknik korelasi product moment yang dikemukakan oleh Pearson.

Page 8: Analisis Perbaikan Butir Soal Ranz

Rumus korelasi product moment ada 2 macam,yaitu :Korelasi product moment dengan simpanganDengan : ┌xy = koefisien korelasi antara variable x dan variable y,dua variable yang dikorelasikan (x=X-x dan y=Y-y)Σxy = jumlah perkalian x dengan yx2 = kuadrat dari x.y2 = kuadrat dari y.Korelasi product moment dengan kata kasarDengan : ┌xy = koefisien korelasi anatara variable x dan variable y,dua variable yangdikorelasikan.N= Banyaknya siswaX= Nilai totalY= Skor total.Interprestasi mengenai besarnya koefisien korelasi adalah sebagai berikut:R INTERPRESTASIAntara 0,81-1,00 TinggiAntara 0,61-0,80 CukupAntara 0,41-0,60 Agak rendahAntara 0,21-0,40 RendahAntara 0,00-0,20 Sangat rendahContoh soal :Tabel : Persiapan U/ Mencari Validitas Tes Prestasi B.InggrisNo Nama X Y x y x2 y2 xy1 Nadia 6,5 6,3 0 -0,1 0,0 0,01 0,02 Susi 7 6,8 +0,5 +0,4 0,25 0,16 +0,23 Cecep 7,5 7,2 +1,0 +0,8 1,0 0,64 +0,84 Erna 7 6,8 +0,5 +0,4 0,25 0,16 +0,25 Dian 6 7 -0,5 +0,6 0,25 0,36 -0,36 Asmara 6 6,2 -0,5 -0,2 0,25 0,04 +0,17 Siswoyo 5,5 5,1 -0,1 -1,3 1,0 1,69 +1,38 Jihad 6,5 6 0 -0,4 0,0 0,16 0,09 Yanna 7, 6,5 +0,5 +0,1 0,25 0,01 +0,0510 Lina 6 5,9 -0,5 -0,6 0,25 0,36 +0,3Jumlah 65,0 63,8 3,5 3,59 2,65Bila dilihat pada kedua hitungan diatas terdpt perbedaan 0,003 lebih besar pd simpangan ini wajar karna adanya pembulatan .Koefisien Korelasi adalah sebagai berikut:Antara 0,800 sampai dengan 1,00 = sangat tinggiAntara 0,600 sampai dengan 0,800 = tinggiAntara 0,400 sampai dengan 0,600 = cukupAntara 0,200 sampai dengan 0,400 =rendahAntara 0,00 sampai dengan 0,200 = sangat rendah Validitas Butir Soal Atau Validitas Item.Validitas di atas adalah validitas soal secara keseluruhan tes. Di samping mencari validitas soal perlu juga mencari validitas butir soal atau validitas item. Sebuah item memiliki validitas yang tinggi jika skor pada item mempunyai kesejajaran dengan skor total. Kesejajaran ini dapat diartikan dengan korelasi sehingga untuk mengetahui validitas item digunakan rumus korelasi.Untuk soal-soal bentuk objektif skor untuk item biasa diberikan dengan 1 (bagi item yang dijawab benar) dan 0 (bagi item yang dijawab salah). Sedangkan skor total merupakan jumlah dari skor untuk semua item yang membangun soal tersebut. Rumus untuk menghitung validitas item.Dengan :Rpbis = koefisien korelasi biserial.Mp = rerata skor dari subjek yang menjawab betul bagi item yang dicari validitasnya.Mt = rerata skor totalSt = standar deviasi dan skor otalP = proporsi siswa yang menjawab benar (banyakknya siswa yang benar dibagi jumlah seluruh siswa)g= proporsi siswa yang menjawab salah (g=1-p)Sedangkan untuk menghitung validitas item pada soal-soal tes dan soal-soal bentuk uraian di mana skor untuk setiap item diberikan menghendaki gradualisasi penialain, menggunakan rumus korelasi product moment baik dengan simpanagan atau dengan angka kasar antara skor setiap item dengan skor total. Penafsiran koefisien korelasinya dapat melihat ke tabel harga kritik r product moment pearson dengan kriteria jika r yang dihitung lebih besar dari r tabel maka item tersebut valid.Analisis Reliabilitas.Suatu tes dapat dikatakan mempunyai kepercayaan yang tinggi jika tes tersebut dapat memberikan hasil yang tetap. Maka pengertian realibilitas tes berhubungan dengan masalah ketetapan hasil tes atau seandainya

Page 9: Analisis Perbaikan Butir Soal Ranz

hasilnya berubah-rubah, perubahan yang terjadi dapat dikatakan tidak berarti.Reliabilitas alat penilaian adalah ketetapan atau keajegan alat dalam menilai apa yang dinilainya.Beberapa hal yang memepengaruhi hasil tes:Hal yang berhubungan dengan tes itu sendiri, yaitu panjang tes dan kualitas butir-butir soalnya.Hal yang berhubungan dengan tercoba (testee)Suatu tes yang dicobakan kepada kelompok yang terdiri dari banyak siswa akan mencerminkan keragaman hasil yang menggambarakan besar kecilnya reliabilitas tes.Hal yang berhubungan dengan penyelenggaraan tes.Faktor penyelenggaraan tes yang bersifat administrasi sangat menentukan hasil tes.Kualitas butir-butir soal ditentukan oleh :Jelas tidaknya rumusan soal.Baik tidaknya pengarahan soal kepada jawaban sehingga tidak menimbulkan salah jawab.Petunjuknya jelas sehingga mudah dan cepat dikerjakan.Cara – cara mencari besarnya reliabilitas yaitu :Metode Bentuk Parallel (Equivalent).Tes parallel atau tes ekuivalen adalah dua buah tes yang mempunyai kesamaan tujuan, tingkat kesukaran, dan susunan tetapi butir-butir soalya berbeda.Metode Tes Ulang (Test-Retest Method)Metode tes ulang dilakukan orang untuk menghindari penyusunan dua seri tes. Dalam menggunakan teknik atau metode ini pengetesannya memiliki satu segi tetapi dicobakan dua kali.3.) Metode Belah Dua(Split-Half Method).Dalam menggunakan metode ini pengetes hanya menggunakan sebuah tes dan dicobakan satu kali pada waktu membelah dua dan mengkorelasikan dua belahan baru diketahui reliabiltas separo tes. Syarat menggunakan metode ini adalah bahwa banyaknya butir soal harus genap agar dapat dibelah, item-item yang membangun soal harus homogeny atau dibelah terdapat keseimbangan antara belahan pertama dan belahan kedua. Rumus empiris Spearman-Brown sebagai berikut :r_(11=) (2 .r 1⁄2 1⁄2)/(( 1+r 1⁄(2 1⁄2)))dengan keterangan:r11 : koefisien realiabilitas yang sudah disesuaikan.r1/21/2 : korelasi antara skor-skor setiap belahan tes.. Contoh: Koefisien korelasi belah dua adalah 0,60R11 = = Sedangkan untuk mengatasi kesulitan bila berhadapan dengan banyaknya butir soal ganjil atau genap, maka digunakan rumus kuder-Richhardson (KR-20) sebagai berikut :r_11=[n/(n-1)][(S^2- ∑▒pq)/S^2 ]dengan : r11 = reliabilitas instrumentn= banyakknya butir soalS=standar deviasi dari tes (akar varians)P=proporsi subjek yang menjawab item dengan benarq =proporsi subjek yang menjawab item dengan salah.Σpq= jumlah hasil perkalian p dan qUntuk mecari reliabilitas tes bentuk uraian dan bentuk non tes digunakan rumus Alpha sebagai berikut :Misalnya disusun tes sebanyak 80 soal. Setelah diberikan kepada sejumlah siswa dalam kelas tertentu, lalu dicari nilai rata rata dan simpangan bakunya. Misalnya diperoleh nilai rata rata 60 dan simpangan bakunya 8. Dengan rumus di atas maka:R11 ==== 0,77Uraian ukuran reliabilitas yang telah dijelaskan di atas dapat dipertimbangkan oleh peneliti, cara mana yang paling tepat digunakan bergantung pada peneliti. Pertimbangan tersebut, antara lain sifat variabel yang diukur, jenis alat ukur, jumlah subjek yang diukur, serta hasil hasil pengukuran yang diharapkan sesuai dengan tujuan penelitian.Misalnya seorang guru hendak melihat reliabilitas tes yang telah dibuatnya. Setelah melakukan dua kali pengukuran didapatkan skor tes sebagai berikut:Koefisien reliabilitas test di atas dapat dihitung dengan menggunakan formula korelasi produk momen dari Pearson sebagai berikut:Dengan demikian, korelasi sebesar 0,954 menggambarkan bahwa reliabilitas tes cukup tinggi. Salah satu kelemahan mendasar dari teknik test-retest adalah carry-over effect. Masalah ini disebabkan oleh adanya kemungkinan pada test yang kedua dipengaruhi oleh test pertama. Misalnya, jika peserta tes masih ingat dengan soal-soal dan bahkan jawaban ketika dilakukan test pertama.CONTOHPERHITUNGAN RELIABILITAS (METODA BELAH DUA)Nama Skor SkorSiswa Ganjil Genap

Page 10: Analisis Perbaikan Butir Soal Ranz

X Y X2 Y2 X.YA 20 25 400 625 500B 38 40 1444 1600 1520C 28 26 784 676 728D 33 32 1089 1024 1056E 33 43 1089 1849 1419F 44 45 1936 2025 1980G 17 16 289 256 272H 33 32 1089 1024 1056I 36 35 1296 1225 1260J 35 32 1225 1024 1120K 30 26 900 676 780L 42 38 1764 1444 1596—————————————————————————————————- Jumlah:389 390 13305 13448 13287Setelah dihitung / dijumlahkan diperoleh harga-harga:Y=390,X=389, N=12, XY=13287Y2=13448, X2=13305, Harga-harga tersebut di atas dimasukkan ke dalam rumus Pearson’s ProductMoment sebagai berikut:Y)X) (XY) – (N (rxy = –____________________________—Y) 2]Y2) - ( X)2] [N(X2) - ( √ [N(Dengan rumus itu diperoleh harga rxy atau rgg = 0,882 x 0,88 1,72Koef. reliabilitas (rtt) = ————- = —— = 0,941 + 0,88 1,88Berarti tes ini tergolong baik sebab reliabilitasnya tinggi.KESIMPULANAnalisis butir soal bertujuan untuk memperoleh kualitas soal yang baik sehingga dapat memperoleh gambaran tentang prestasi siswa yang sebenarnya.Ada beberapa cara melalukan analisis butir soal: untuk dapat membedakan soal kategori mudah, sedang dan sukar.Analisis tingkat kesukaran soal mengkaji apakah soalAnalisis daya pembeda mempunyai kemampuan dalam membedakan siswa termasuk kategori mempunyai kemampuan tinggi atau rendah. mengkaji kesahihan alat ukur (soal) dalam menilaiAnalisis validitas apa yang seharusnya diukur atau mengkaji ketepatan soal sebagai alat ukur. mengkaji keajegan atau ketetapan hasil tesAnalisis reliabilitas manakala tes tersebut diujikan kepada siswa yang sama lebih dari satu kali.