analisis butir soal

18
ANALISIS BUTIR SOAL Data hasil tes dengan jumlah soal 20 butir dan jumlah responden 25 siswa, analisisnya meliputi : A. Daya Pembeda Butir Soal Daya beda butir soal adalah kemampuan butir soal untuk membedakan antara murid yang berkemampuan tinggi dengan murid yang memiliki kemampuan rendah. Indeks daya beda dikategorikan menjadi 3, yaitu : a. < 0,10 = ditolak b. 0,10 – 0,29= direvisi c. > 0,30 = diterima Menurut Suharsimi Arikunto, indeks daya beda dikategorikan sebagai berikut: a. 0,00 – 0,20 = jelek b. 0,21 – 0,40 = cukup c. 0,41 – 0,70 = baik d. 0,71 – 1,00 = baik sekali Untuk butir soal yang ideal, daya bedanya berkisar antara 0,2 hingga 1,00. Sehingga apabila ditemukan daya beda butir yang negatif, sebaiknya guru mengganti butir tersebut apabila hendak dimunculkan dalam tes berikutnya. Karena daya beda negatif memberi pengertian bahwa kelompok lower (kurang mampu) lebih baik dari pada kelompok upper (paling baik) sebesar angka negatif yang diperoleh. 1 Komputer dan Teknologi Informasi – Hariyatunnisa Ahmad/K7113093/24/3A

Upload: hariyatunnisa-ahmad

Post on 29-Jul-2015

25 views

Category:

Education


0 download

TRANSCRIPT

Page 1: Analisis Butir Soal

ANALISIS BUTIR SOALData hasil tes dengan jumlah soal 20 butir dan jumlah responden 25 siswa, analisisnya

meliputi :

A. Daya Pembeda Butir Soal

Daya beda butir soal adalah kemampuan butir soal untuk membedakan antara murid yang

berkemampuan tinggi dengan murid yang memiliki kemampuan rendah. Indeks daya beda

dikategorikan menjadi 3, yaitu :

a. < 0,10 = ditolak

b. 0,10 – 0,29 = direvisi

c. > 0,30 = diterima

Menurut Suharsimi Arikunto, indeks daya beda dikategorikan sebagai berikut:

a. 0,00 – 0,20 = jelek

b. 0,21 – 0,40 = cukup

c. 0,41 – 0,70 = baik

d. 0,71 – 1,00 = baik sekali

Untuk butir soal yang ideal, daya bedanya berkisar antara 0,2 hingga 1,00. Sehingga

apabila ditemukan daya beda butir yang negatif, sebaiknya guru mengganti butir tersebut apabila

hendak dimunculkan dalam tes berikutnya. Karena daya beda negatif memberi pengertian bahwa

kelompok lower (kurang mampu) lebih baik dari pada kelompok upper (paling baik) sebesar

angka negatif yang diperoleh.

TABEL DAYA PEMBEDA

NOMOR

SOAL

Indeks daya beda 3 kategori Indeks daya beda 4 kategori

DAYA

PEMBEDA

KATEGORI

DAYA BEDA

DAYA

PEMBEDA

KATEGORI

DAYA BEDA

1 0,391 DITERIMA 0,391 CUKUP

2 0,251 DIREVISI 0,251 CUKUP

3 0,417 DITERIMA 0,417 BAIK

4 0,269 DIREVISI 0,269 CUKUP

5 0,301 DITERIMA 0,301 CUKUP

1Komputer dan Teknologi Informasi – Hariyatunnisa Ahmad/K7113093/24/3A

Page 2: Analisis Butir Soal

6 0,417 DITERIMA 0,417 BAIK

7 0,251 DIREVISI 0,251 CUKUP

8 0,279 DIREVISI 0,279 CUKUP

9 0,532 DITERIMA 0,532 BAIK

10 0,494 DITERIMA 0,494 BAIK

11 0,348 DITERIMA 0,348 CUKUP

12 0,495 DITERIMA 0,495 BAIK

13 0,448 DITERIMA 0,448 BAIK

14 0,677 DITERIMA 0,677 BAIK

15 0,373 DITERIMA 0,373 CUKUP

16 0,421 DITERIMA 0,421 BAIK

17 0,532 DITERIMA 0,532 BAIK

18 0,306 DITERIMA 0,306 CUKUP

19 0,475 DITERIMA 0,475 BAIK

20 0,339 DITERIMA 0,339 CUKUP

Dari tabel diatas, dapat disimpulkan bahwa :

a. Soal yang dikategorikan dapat diterima yaitu soal nomor 1, 3, 5, 6, 9, 10, 11, 12, 13, 14,

15, 16, 17, 18, 19 dan 20. Dan soal yang dikategorikan baik yaitu soal nomor 3, 6, 9, 10,

12, 13, 14, 16, 17 dan 19.

b. Soal yang dikategorikan perlu direvisi yaitu soal nomor 2, 4, 7 dan 8. Dan soal yang

dikategorikan cukup yaitu soal nomor 1, 2, 4, 5, 7, 8, 11, 15, 18 dan 20.

c. Sedangkan untuk soal yang dikategorikan ditolak dan jelek tidak ditemukan pada hasil

analisis tabel diatas, begitu juga dengan soal yang dikategorikan sangat baik.

B. Tingkat Kesukaran Butir Soal

Dari Prop. Correct juga dapat diketahui indeks tingkat kesukaran soal secara klasikal.

Indeks kesukaran butir soal atau p dinyatakan dengan angka yang yang berada antara 0,00

sampai dengan 1,00. Klasifikasi indeks/ tingkat kesukaran butir soal adalah:

a. Soal Sangat Sukar : p < 0,210 tidak dapat digunakan

b. Soal Sukar : p = 0,210 – 0,400 dapat digunakan

c. Soal Sedang : p = 0,410 – 0,700 dapat digunakan

2Komputer dan Teknologi Informasi – Hariyatunnisa Ahmad/K7113093/24/3A

Page 3: Analisis Butir Soal

d. Soal Mudah : p = 0,710 – 0,900 dapat digunakan

e. Soal Sangat Mudah : p > 0,900 tidak dapat digunakan

Berikut ini data yang menunjukkan hasil indeks/tingkat kesukaran tiap soal pada analisis

iteman yang sudah dilakukan :

TABEL TINGKAT KESUKARAN

No. Soal Prop. Correct TingkatKesukaran

Dapat Digunakan Tidak Dapat Digunakan

1 0,720 Mudah √2 0,760 Mudah √

3 0,720 Mudah √

4 0,840 Mudah √

5 0,800 Mudah √

6 0,720 Mudah √

7 0,760 Mudah √

8 0,760 Mudah √

9 0,800 Mudah √

10 0,720 Mudah √

11 0,680 Sedang √

12 0,720 Mudah √

13 0,680 Sedang √

14 0,800 Mudah √

15 0,680 Sedang √

16 0,600 Sedang √

17 0,800 Mudah √

18 0,760 Mudah √

19 0,800 Mudah √

20 0,720 Mudah √

Berdasarkan table tersebut dapat diketahui bahwa soal-soal tersebut dapat digunakan. Jika

dilihat dari rata-rata tingkat kesukaran semua butir soal dalam tes secara klasikal (Mean P), soal-

soal tersebut mempunyai Mean P sebesar 0,744 yang artinya bahwa soal-soal tersebut termasuk

soal yang mudah.

C. Distraktor (Jawaban Pengecoh)

Setiap tes pilihan ganda memiliki satu pertanyaan serta beberapa pilihan jawaban. Diantara

pilihan jawaban yang ada, hanya satu benar. Selain jawaban yang benar tersebut, adalah jawaban

3Komputer dan Teknologi Informasi – Hariyatunnisa Ahmad/K7113093/24/3A

Page 4: Analisis Butir Soal

yang salah. Jawaban yang salah itulah yang dikenal dengan distraktor. Dengan demikian

efektifitas distraktor adalah seberapa baik pilihan yang salah tersebut dapat mengecoh peserta tes

yang memang tidak mengetahui kunci jawaban yang tersedia. Semakin banyak peserta tes yang

memilih distraktor tersebut, maka distraktor itu dapat menjalankan fungsinya dengan baik.

Apabila proporsi siswa yang memilih pengecoh kurang dari 0,05 maka pengecoh tersebut

harus direvisi dan apabila proporsinya 0,00 ditolak. Untuk mengetahui proporsi siswa yang

memilih pengecoh pada program ITEMAN dapat dilihat pada Prop. Endorsing.

TABEL FUNGSI JAWABAN PENGECOH

NO.

SOAL

KUNCI

JAWABAN

PROPORSI

JAWABAN BENAR

JAWABAN

SALAH

PROPORSI

JAWABAN SALAH

FUNGSI

PENGECOH

1 A 0,72 B 0,12 Berfungsi

C 0,04 Tidak Berfungsi

D 0,04 Tidak Berfungsi

E 0,08 Berfungsi

2 C 0,76 A 0,04 Tidak Berfungsi

B 0,08 Berfungsi

D 0,08 Berfungsi

E 0,04 Tidak Berfungsi

3 B 0,72 A 0,04 Tidak Berfungsi

C 0,08 Berfungsi

D 0,12 Berfungsi

E 0,04 Tidak Berfungsi

4 D 0,84 A 0,04 Tidak Berfungsi

B 0,04 Tidak Berfungsi

C 0,04 Tidak Berfungsi

E 0,04 Tidak Berfungsi

5 E 0,80 A 0,04 Tidak Berfungsi

B 0,04 Tidak Berfungsi

C 0,04 Tidak Berfungsi

D 0,08 Berfungsi

4Komputer dan Teknologi Informasi – Hariyatunnisa Ahmad/K7113093/24/3A

Page 5: Analisis Butir Soal

6 E 0,72 A 0,12 Berfungsi

B 0,04 Tidak Berfungsi

C 0,08 Berfungsi

D 0,04 Tidak Berfungsi

7 D 0,76 A 0,04 Tidak Berfungsi

B 0,08 Berfungsi

C 0,04 Tidak Berfungsi

E 0,08 Berfungsi

8 A 0,76 B 0,08 Berfungsi

C 0,04 Tidak Berfungsi

D 0,08 Berfungsi

E 0,04 Tidak Berfungsi

9 C 0,80 A 0,08 Berfungsi

B 0,04 Tidak Berfungsi

D 0,04 Tidak Berfungsi

E 0,04 Tidak Berfungsi

10 C 0,72 A 0,08 Berfungsi

B 0,12 Berfungsi

D 0,04 Tidak Berfungsi

E 0,04 Tidak Berfungsi

11 B 0,68 A 0,04 Tidak Berfungsi

C 0,12 Berfungsi

D 0,08 Berfungsi

E 0,08 Berfungsi

12 D 0,76 A 0,12 Berfungsi

B 0,04 Tidak Berfungsi

C 0,04 Tidak Berfungsi

E 0,04 Tidak Berfungsi

13 A 0,68 B 0,16 Berfungsi

C 0,04 Tidak Berfungsi

5Komputer dan Teknologi Informasi – Hariyatunnisa Ahmad/K7113093/24/3A

Page 6: Analisis Butir Soal

D 0,08 Berfungsi

E 0,04 Tidak Berfungsi

14 E 0,80 A 0,04 Tidak Berfungsi

B 0,04 Tidak Berfungsi

C 0,04 Tidak Berfungsi

D 0,08 Berfungsi

15 D 0,68 A 0,12 Berfungsi

B 0,04 Tidak Berfungsi

C 0,08 Berfungsi

E 0,08 Berfungsi

16 C 0,60 A 0,08 Berfungsi

B 0,12 Berfungsi

D 0,08 Berfungsi

E 0,12 Berfungsi

17 C 0,80 A 0,04 Tidak Berfungsi

B 0,12 Berfungsi

D 0,04 Tidak Berfungsi

E 0,00 Ditolak

18 B 0,76 A 0,04 Tidak Berfungsi

C 0,08 Berfungsi

D 0,08 Berfungsi

E 0,04 Tidak Berfungsi

19 A 0,80 B 0,00 Ditolak

C 0,12 Berfungsi

D 0,04 Tidak Berfungsi

E 0,04 Tidak Berfungsi

20 E 0,72 A 0,04 Tidak Berfungsi

B 0,08 Berfungsi

C 0,08 Berfungsi

D 0,08 Berfungsi

Jadi, kesimpulan dari tabel diatas adalah :

6Komputer dan Teknologi Informasi – Hariyatunnisa Ahmad/K7113093/24/3A

Page 7: Analisis Butir Soal

a. Kunci Jawaban dan Pengecoh Layak Untuk Digunakan

Artinya daya beda kunci jawaban lebih besar daripada daya beda pengecoh. Dan semua

pengecoh ada yang memilih dan proporsinya lebih dari 0,05. Yang termasuk dalam

kategori ini adalah soal nomor 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 18 dan

20.

b. Pengecoh Ditolak

Artinya pengecoh tidak ada yang memilih atau proporsinya 0,00. Yang termasuk dalam

kategori ini adalah pengecoh pada soal nomor 17 (poin E) dan soal nomor 19 (poin B).

c. Kunci Jawaban Digugurkan

Artinya kunci jawaban memiliki daya beda yang lebih rendah dari salah satu daya beda

pengecoh, artinya kunci jawaban perlu direvisi. Tidak ada yang termasuk dalam kategori

ini.

D. Deskripsi Reliabilitas

Sebenarnya tidak terdapat suatu ukuran yang pasti mengenai berapa tinggi koefisien

reliabilitas. Reliabilitas yang baik tergantung pada tujuan atau kegunaan tes. Menurut Remmers

et al. (1960) menyatakan bahwa kebanyakan tes-tes di bidang pendidikan pada umumnya

memiliki koefisien reliabilitas minimal 0,8 untuk populasi yang sesuai. Sedangkan menurut

Nunally (1972) dan Kaplan & Saccuzo, koefisien reliabilitas 0,7 s.d. 0,8 sudah termasuk cukup

tinggi untuk penelitian dasar. Berdasarkan hasil analisis, diperoleh :

Scale Statistics

----------------

Scale: 0

-------

N of Items 20

N of Examinees 25

Mean 14.880

Variance 11.946

Std. Dev. 3.456

Skew -0.451

Kurtosis -0.137

7Komputer dan Teknologi Informasi – Hariyatunnisa Ahmad/K7113093/24/3A

Page 8: Analisis Butir Soal

Minimum 6.000

Maximum 20.000

Median 15.000

Alpha 0.722

SEM 1.821

Mean P 0.744

Mean Item-Tot. 0.401

Mean Biserial 0.549

Tampak bahwa koefisien reliabilitas Alpha sebesar 0.722.

a. < 0.60 = tidak baik

b. 0.61 sampai dengan 0.70 = kurang baik

c. 0.71 sampai dengan 0.80 = baik

d. 0.81 = sangat baik

Jadi, koefisisen reliabilitasnya BAIK.

E. Deskripsi Nilai-nilai Statistik

Di bawah ini adalah data-data hasil

analisis program iteman dari statistik

tes, yaitu :

a. N of Items adalah jumlah butir

soal dalam tes/skala yang ikut

dianalisis.

Dalam hal ini, jumlah soal yang

dianalisis ada 20 butir soal.

b. N of Examinees adalah jumlah

peserta tes (jumlah responden).

Jumlah peserta tes ada sebanyak

25 orang

c. Mean adalah skor rata-rata

peserta tes. Skor rata-rata dari

responden yaitu 14.880

d. Variance adalah varians dari

distribusi skor peserta tes. Varians

distribusi peserta tes yaitu 11.946

e. Std. Dev. adalah deviasi standar

dari distribusi skor peserta tes.

Standar deviasinya yaitu 3.456

f. Skew adalah kemiringan

distribusi skor peserta tes.

Kemiringan distribusi skor peserta

tes yaitu -0,451

g. Kurtosis adalah puncak distribusi

skor atau keruncingan kurva.

Keruncingan kurvanya yaitu -

0.137

8Komputer dan Teknologi Informasi – Hariyatunnisa Ahmad/K7113093/24/3A

Page 9: Analisis Butir Soal

h. Minimum adalah skor terendah

peserta tes. Skor terendah dari

peserta tes yaitu 6.000

i. Maximum adalah skor tertinggi

peserta tes. Skor tertinggi peserta

tes yaitu 20.000

j. Median adalah skor tengah

peserta tes. Nilai tengah dari

pesera tes yaitu 15.000

k. Alpha adalah koefisien reliabilitas

alpha untuk tes/skala tersebut.

Homogenitas tes tersebut adalah

0.722

a. < 0.60 = tidak baik

b. 0.61 sampai dengan 0.70

= kurang baik

c. 0.71 sampai dengan 0.80

= baik

d. > 0.81 = sangat baik

l. SEM adalah kesalahan

pengukuran standar. Kesalahan

pengukuran standar yaitu 1.821

m. Mean P adalah rata-rata tingkat

kesukaran semua butir soal dalam

tessecara klasikal. Rata-rata

tingkat kesukaran semua butir

soal dalam tes yaitu 0.744

n. Mean Item Tot adalah nilai rata-

rata indeks daya pembeda dari

semua soal dalam tes, yang

dihitung dari rata-rata koefisien

point-biserial. Nilai rata-rata

indeks daya pembeda dari

koefisien point biserial yaitu

0.401

o. Mean Beserial adalah juga nilai

rata-rata indeks daya pembeda

dari semua soal dalam tes, yang

dihitung dari rata-rata koefisien

biserial.

Nilai rata-rata indeks pembeda dari

semua soal dari koefisien biserial

yaitu 0.549

F. Perolehan Skor Setiap Responden

TABEL PEROLEHAN SKOR RESPONDEN

NO. NAMA

RESPONDEN

TOTAL

JAWABAN

BENAR

NO. NAMA

RESPONDEN

TOTAL

JAWABAN

BENAR

1 Aliya 15.00 14 Ninis 20.00

2 Aulia 12.00 15 Fazri 18.00

9Komputer dan Teknologi Informasi – Hariyatunnisa Ahmad/K7113093/24/3A

Page 10: Analisis Butir Soal

3 Intan 13.00 16 Rozak 15.00

4 Harry 20.00 17 Ratih 17.00

5 Ahmad 13.00 18 Santi 19.00

6 Ilham 10.00 19 Riyan 13.00

7 Iklas 12.00 20 Mugio 16.00

8 Malia 12.00 21 Mario 17.00

9 Rosia 14.00 22 Yanti 17.00

10 Rijal 20.00 23 Nurul 16.00

11 Fenny 10.00 24 Laila 18.00

12 Ambar 6.00 25 Linda 16.00

13 Annis 13.00 - - -

G. Rangkuman Butir Soal yang Layak Sebagai Bank Soal

Butir soal yang layak sebagai bank soal harus memenuhi kriteria sebagai berikut:

1. Daya pembeda ≥ 0.3

2. Pengecoh berfungsi dengan baik, Prop. Endorsing harus memenuhi ≥ 0.050

3. Daya pembedanya rbis dan rpbis (Biser dan Point Biser) pada kolom Item Statistics bernilai

positif

4. rbis dan rpbis (Biser dan Point Biser) pada alternatif jawaban pengecoh bernilai negatif dengan

daya pembeda tidak lebih besar dari alternatif kunci jawaban.

5. Koefisien reliabilitas alpha > 0.71

Pada soal nomor 1 Tingkat kesukaran soal ini adalah 0,720 (mudah), yakni sebanyak 72%

peserta tes dapat menjawab soal dengan benar. Daya pembedanya, rbis=0,521 dan rpbis=0,391

menunjukkan keduanya bertanda positif. Hal ini berarti bahwa peserta tes yang pintar (skor

totalnya tinggi) cenderung menjawab benar soal ini dan peserta tes yang kurang pintar cenderung

menjawab salah soal ini. Karena alternatif jawaban A merupakan kunci, maka tanda positif ini

menunjukkan bahwa kunci jawaban sudah berfungsi sebagaimana mestinya. Ditinjau dari

distribusi jawaban yaitu persentase peserta tes merespons alternatif jawaban, tidak semua

pengecoh berfungsi dengan baik. Dapat dilihat pada kolom Prop Endorsing (Pengecoh yang

berfungsi dengan baik jika proporsi jawaban siswa lebih dari 5%), pengecoh yang berfungsi

dengan baik tampak bahwa peserta tes merespons alternatif jawaban B dan E sebanyak 12% dan

10Komputer dan Teknologi Informasi – Hariyatunnisa Ahmad/K7113093/24/3A

Page 11: Analisis Butir Soal

8%; sedangkan pengecoh tidak berfungsi dengan baik tampak pada peserta tes yang merespons

alternative jawaban C dan D keduanya 4%. Ditinjau dari daya pembeda masing-masing

pengecoh juga dapat dikatakan berfungsi baik karena rbis atau rpbis untuk alternatif jawaban B,

C, D, dan E seluruhnya bernilai negatif artinya peserta tes yang pintar cenderung tidak memilih

alternatif jawaban itu dan siswa yang kurang pintar cenderung memilih aternatif jawaban

tersebut. Dengan kata lain, peserta tes yang skornya rendah lebih memilih pengecoh sebagai

jawaban yang benar.

Kesimpulan : butir soal nomor 1 sudah cukup baik dan dapat digunakan. Sama halnya dengan

butir soal nomor 3, 4, 7, 8, 10, 12, 13, 14, 17, 18 dan 20 sudah cukup baik dan dapat digunakan

karena memiliki analisis butir soal yang sama dengan butir soal nomor 1. Akan tetapi tingkat

kesukaran pada butir soal tersebut ada yang berbeda, yaitu butir soal nomor 13 termasuk dalam

kategori soal yang sedang (0,30 sampai dengan 0,70).

Sedangkan pada soal nomor 2, tingkat kesukarannya adalah 0,760 (mudah), sebanyak

76% peserta tes dapat menjawab soal tersebut dengan benar. Daya pembedanya, rbis=0,345 dan

rpbis=0,251 menunjukkan keduanya bertanda positif. Hal ini berarti bahwa peserta tes yang

pintar cenderung menjawab benar soal ini dan peserta tes yang kurang pintar cenderung

menjawab salah. Karena alternatif jawaban C merupakan kunci, maka tanda positif ini

menunjukkan bahwa kunci jawaban sudah berfungsi sebagaimana mestinya. Dengan demikian

soal ini termasuk kategori soal yang cukup baik dan dapat digunakan walaupun ditinjau dari

pengecohnya tampak bahwa alternatif jawaban B, daya pembedanya juga bernilai positif dengan

sebanyak 8% peserta tes merespons alternatif jawaban B. Pada soal ini tidak ada peringatan

untuk mengecek kembali, karena besarnya nilai daya pembeda pada kunci jawaban C tetap lebih

besar dari alternative jawaban B, sehingga butir soal ini tetap bisa diterima dan baik untuk

digunakan.

Kesimpulan : butir soal nomor 2 sudah cukup baik dan dapat digunakan. Sama halnya dengan

butir soal nomor 5, 6, 9, 11, 15, 16 dan 19 sudah cukup baik dan dapat digunakan karena

memiliki analisis butir soal yang sama dengan butir soal nomor 2. Akan tetapi tingkat kesukaran

pada butir soal tersebut berbeda, yaitu butir soal nomor 11, 15, dan 16 termasuk soal sedang

(0,30 sampai dengan 0,70)

11Komputer dan Teknologi Informasi – Hariyatunnisa Ahmad/K7113093/24/3A

Page 12: Analisis Butir Soal

12Komputer dan Teknologi Informasi – Hariyatunnisa Ahmad/K7113093/24/3A