validitas dan reabilitas hasil pengukuran makalahku

33
VALIDITAS DAN RELIABILITAS HASIL PENGUKURAN MAKALAH UNTUK MEMENUHI TUGAS MATAKULIAH Evaluasi Pendidikan Dosen Pengampu Bapak Dr. Eddy Sutadji, M.Pd Oleh KELOMPOK 5 Eko Yusup Edi Wijaya (130513605961) Eka Yuda Primasatya (130513605950) UNIVERSITAS NEGERI MALANG

Upload: eko-yusup

Post on 16-Nov-2015

46 views

Category:

Documents


12 download

DESCRIPTION

makalah evaluasi pendidikan tentang Validitas dan Reliabilitas

TRANSCRIPT

VALIDITAS DAN RELIABILITAS HASIL PENGUKURAN

MAKALAHUNTUK MEMENUHI TUGAS MATAKULIAHEvaluasi PendidikanDosen Pengampu Bapak Dr. Eddy Sutadji, M.Pd

OlehKELOMPOK 5Eko Yusup Edi Wijaya (130513605961)Eka Yuda Primasatya (130513605950)

UNIVERSITAS NEGERI MALANGFAKULTAS TEKNIKPROGRAM STUDI PENDIDIKAN TEKNIK OTOMOTIFFebruari 2015

KATA PENGANTAR

Assalamualaikum Wr. Wb.Segala puji syukur kami limpahkan kehadirat Allah SWT, Tuhan semesta alam yang telah melimpahkan rahmat taufik, hidayah dan inayahnya sehingga penulis dapat menyelesaikan punyusunan makalah ini dengan baik dan tepat waktu tanpa ada suatu halangan apapun.Tak lupa ucapan terima kasih kami ucapkan kepada pihak-pihak yang telah membantu dan bekerja sama dalam penyusunan makalah dengan tema VALIDITAS DAN RELIABILITAS HASIL PENGUKURAN ini, antara lain :1. Kedua orang tua kami di rumah yang selalu memberi dukungan serta doa pada kami.2. Bapak Dr. Eddy Sutadji, M.Pd selaku dosen pengampu mata kuliah Evaluasi Pendidikan yang selalu membimbing dan mendampingi kami dalam proses perkuliahan3. Rekan-rekanan kelompok yang menyumbangkan tenaga dan pikiran untuk bekerja sama dalam penyusunan makalah ini.4. Serta rekan-rekan mahasiswa dan semua pihak yang bersedia memberikan partisipasinya dalam penyusunan makalah ini.

Semoga dengan adanya makalah ini dapat bermanfaat buat kami pribadi selaku penyusun makalah ini khususnya serta buat semua pembaca umumnya. Kami sadar bahwa penyusunan makalah ini masih jauh dari sempurna, maka kami selaku penyusun mengharap kritik serta saran-saran yang membangun dari para pembaca.Wallahul Muafieq Illaa Aqwaamieth TharieqWassalamualaikum Wr. Wb. Malang, Februari 2015

Penulis

BAB IPENDAHULUAH

A. LATAR BELAKANGDalam proses pembelajaran terdapat rencana tujuan yang ingin dicapai. Untuk mengetahuai tingkat keberhasilan dari proses pembelajaran adalah dengan mengadakan evaluasi. Evaluasi berasal dari bahasa Inggris evaluation yang berarti penilaian. Evaluasi diartikan sebagai suatu proses penilaian untuk mengambil keputusan yang menggunakan seperangkat hasil pengukuran dan berpatokan kepada tujuan yang telah dirumuskan.Evaluasi dapat dilakukan dengan menggunakan tes dan non tes. Dalam tes maupun non tes proses evaluasi biasanya dengan memberikan pertanyaan atau soal-soal kepada yang dievaluasi/diukur. Menurut Arikunto dalam pelaksanaan tes hasil belajar dapat dikatakan baik jika setidaknya mencangkup lima ciri-ciri berikut ini, yaitu: validitas, reliabilitas, objektifitas, praktikabilitas dan ekonomis.Sedangkan menurut Anas (2007) yaitu: valid, reliabel, obyektif, dan praktis. Valid dapat diartkan sebagai ketepatan, kebenaran, keshahihan. Reliabel yaitu keajegan, kemantapan. Obyektif maksudnya jika suatu tes itu menurut apa adanya dari sumber. Praktis artinya suatu tes tersebut harus mudah dilaksanakan karena test itu harusbersifat sederhana dan lengkap.Dari kedua pendapat di atas dalam ciri-ciri pelaksanaan evaluasi hasil belajar yang baik masing-masing menyebutkan evaluasi haruslah valid (validitas) dan reliabel (reliabilitas). Kedua hal tersebut lah yang akan kami bahas dalam makalah ini.

B. POKOK BAHASANDalam makalah ini penulis akan menyajikan dua pokok bahasan yaitu:1. Validitas: pengertian, jenis-jenis dan cara-cara mengetahui validitas alat ukur2. Reliabilitas: pengertian, cara mencari besar reliabilitas soal objektif dan soal uraian3. Hubungan antara validitas dan reliabilitas

BAB IIPEMBAHASAN

A. VALIDITAS 1. Pengertian ValiditasKarakter pertama dan memiliki peranan sangat penting dalam instrument evaluasi adalah valid. Suatu instrument dikatakan valid, seperti yang diterangkan oleh Gay (1983) dan Johnson (2002), apabila instrument yang digunakan dapat mengukur apa yang seharusnya diukur (Sukardi, 2008).Pernyataan serupa juga disampaikan oleh Scarvia B. Anderson (dalam Arikunto, 1997) bahwa A test is valid if it measures what is purpose to measure. Atau jika diartikan kurang lebih adalah, sebuah tes dikatakan valid apabila tes tersebut mengukur apa yang hendak diukur. Dalam bahasa Indonesia Valid bisa disebut dengan istilah Sahih.Sebuah data atau informasi dapat dikatakan valid apabila sesuai dengan data yang sebenarnya. Sebagai contoh, informasi tentang seorang bernama A menyebutkan bahwa si B pendek karena tingginya tidak lebih dari 130 sentimeter. Data tentang si B ini dikatakan valid apabila memang sesuai dengan kenyataan, yakni bahwa tinggi A kurang dari 130 sentimeter. Contoh lain data si E yang diperoleh dari cerita orang lain menunjukkan bahwa ia pembohong. Bukti bahwa si E pembohong diperoleh dari kenyataan bahwa si E sering berbicara tidak benar, tidak sesuai dengan kenyataan. Dengan demikian maka data tentang si E tersebut valid dan cerita orang tersebut benar.Jika data yang dihasilkan dari sebuah instrument valid, maka dapat dikatakan bahwa instrument tersebut valid, karena dapat memberikan gambaran tentang data secara benar sesuai dengan kenyataan atau keadaan sesungguhnya. Dari sedikit uraian dan contoh tersebut dapat disimpulkan bahwa: Jika data yang dihasilkan oleh instrument benar dan valid, sesuai kenyataan, maka instrument yang digunakan tersebut juga valid.

2. Jenis-jenis ValiditasValiditas sebuah tes dapat diketahui dari hasil pemikiran dan dari hasil pengalaman. Hal yang pertama akan diperoleh adalah validitas logis (logical validity) dan selanjutnya adalah validitas empiris (empirical validity). Dua hal tersebut yang dijadikan unsur dasar pengelompokan validitas tes.a. Validitas logisPada istilah validitas logis terdapat kata logis yang berasal dari kata logika, yag berarti penalaran. Maksudnya ialah evaluasi apabila telah dirancang dengan baik, mengikuti teori dan ketentuan yang ada, maka secara logis sudah valid. Ada dua macam yang dapat dicapai oleh sebuah instrumen, yaitu:1) Validitas isi (content validity)Validitas isi merupakan validitas yang diperoleh setelah penganalisisan terhadap isi yang terkandung dalam tes hasil belajar. Validitas isi sering disebut validitas kurikuler karena materi yang diajarkan pada umumnya tertuang pada GBPP. Validitas isi dapat diketahui dengan membandingkan isi yang terkandung dalam tes hasil belajar dengan tujuan instruksional khusus yang telah ditentukan.2) Validitas konstruksi (contruct validity)Sebuah tes dikatakan memiliki validitas konstuksi apabila butir-butir soal yang membangun tes tersebut mengukur setiap aspek berfikir seperti yang disebutkan oleh Tujuan Intruksional Khusus. Dengan kata lain jika butir-butir soal mengukur aspek berfikir tersebut sudah sesuai dengan aspek berfikir yang menjadi tujuan intruksional.Sebagai contoh jika rumusan Tujuan Intruksional Khusus (TIK) siswa dapat membandingkan antara motor bensin dengan motor diesel, maka butir soal pada tes merupakan perintah agar siswa membedakan antara kedua jenis motor tersebut. Sekarang TIK dikenal dengan Indikator.b. Validitas empirisPada istilah validitas empiris terdapat kata empiris, yang artinya adalah pengalaman. Sebuah instrument dapat dikatakan memiliki validitas empiris apabila sudah diuji dari pengalaman. Sebagai contoh sehari-hari seseorang dapat diakui jujur oleh masyarakat apabila dalam pengalaman dibuktikan bahwa orang tersebut memang jujur. Validitas empiris tidak bisa didapat hanya dengan menyusun instrumen berdasarkan ketentuan saja seperti layaknya validitas logis, tetapi validitas ini harus dibuktikan berdasarkan pengalaman di lapangan. Validitas tes secara empiris dapat ditelusuri dari dua segi, yaitu:1) Validitas ada sekarang (concurrent validity)Validitas ini sering disebut validitas empiris (sesuai dengan pengalaman). Pengalaman selalu mengenai hal yang telah berlalu sehingga data pengalaman tersebut sekarang sudah ada (ada sekarang, concurent).Dalam hal ini dapat disimpulkan bahwa hasil tes harus dibandingkan hasil tes yang sejenis mas lampau (yang sudah ada).Contohnya guru ingin mengetahui kevalidan hasil tes sumatif yang akan disusun. Dengan begitu maka guru harus membandingkan hasil nilai tes sumatif sekarang dengan hasil nilai sumatif yang lampau.2) Validitas prediksi (predictive validity)Memprediksi artinya meramal, dengan meramal selalu mengeai hal-hal yang akan datang jadi sekarang belum terjadi. Validitas ramalan dari sebuah tes merupakan suatu kondisi yang menunjukkan sejau mana sebuah tes dapat menunjukkan kemampuannya untuk memberikan ramalan terhadap kondisi yang akan terjadi pada masa yang akan datang. Misalnya, tes masuk Perguruan Tinggi adalah sebuah tes yang diperkirakan mampu meramalkan keberhasilan peserta tes dalam mengikuti kuliah dimasa yang akan dating. Calon yang tersaring berdasarkan hasil tes diharapkan mencerminkan tinggi rendahnya kemampuan mengikuti kuliah. Jika nilai tesnya tinggi, tentu menjamin keberhasilannya kelak. Sebaliknya, seorang calon dikatakan tidak lulus tes karena memiliki nilai tes yang rendah jadi diperkirakan akan tidak mampu menikuti perkuliahan yang akan datang.Sebuah tes dikatakan memiliki validitas ramalan apabila terdapat korelasi yang positif dan signifikan antara tes hasil belajar yang sedang diuji dengan kriterium yang ada. Korelasi tersebut dapat diketahui dengan menggunakan teknik analisis korelasi product moment dari Karl Pearson.

3. Cara Mengetahui Validitas Alat UkurTes dikatakan memiliki validitas jika hasilnya sesuai dengan kriterium, dalam arti memiliki kesejajaran antara hasil tes tersebut dengan kriterium. Teknik yang digunakan untuk mengetahui kesejajaran adalah teknik korelasi product moment yang dikemukakan oleh Pearson.Rumus kolerasi product moment ada 2 (dua) macam, yaitu:a. Kolerasi Product moment dengan simpangan, dan b. Kolerasi Product moment dengan angka kasar.

Rumus korelasi product moment dengan simpangan: Keterangan:rxy= koefisien kolerasi antara variabel X dan variabel Y, dua variabel yang dikolerasikan (x = X dan y = Y ).xy= jumlah perkalian x dengan yx2= kuadrat dari xy2= kuadrat dari y

Contoh perhitungan: Suatu misal akan menghitung validitas tes prestasi belajar matematika. Sebagai kriterium diambil rata-rata ulangan yang akan dicari validitasnya diberi kode X dan rata-rata nilai harian diberi kode Y. Kemudian dibuat tabel persiapan sebagai berikut.TABEL PERSIAPAN UNTUK MENCARI VALIDITASTES PRESTASI MATEMATIKANo.NamaXYXyx2y2Xy

1.Andi6,56,30 0,10,00,010,0

2.Ardi76,8+ 0,5+ 0,40,250,16+ 0,2

3.Aziz7,57,2+ 0,1+ 0,81,00,64+ 0,8

4.Bagus76,8+ 0,5+ 0,40,250,16+ 0,2

5.Bunga67 0,5+ 0,60,250,36 0,3

6.Citra66,2 0,5 0,20,250,04+ 0,1

7.Deni5,55,1 0,1 1,31,01,69+ 0,1

8.Eko6,560 0,40,00,160,0

9.Nana76,5+ 0,1+ 0,10,250,01+ 0,05

10.Rina65,9 0,5 0,60,250,36+ 0,3

Jumlah65,063,83,53,592,65

= = = 6,5 = = = 6,38 dibulatkan menjadi 6,4 = X - y = Y - Kemudian dimasukkan ke rumus= 0,749Indeks korelasi antara X dan Y inilah indeks validitas soal yang dicari.

Rumus korelasi product moment dengan angka kasar:

Di mana: = koefisien korelasi antara variabel X dan variabel Y, dua variabel yang Dikorelasikan.Dengan menggunakan hasil data tes prestasi matematika di atas sekaran dihitung dengan rumus korelasi product moment dengan angka kasar yang tabel persiapannya sebagai berikut:TABEL PERSIAPANNo.NamaXYX2Y2XY

1.Andi6,56,342,2539,6940,95

2.Ardi76,84946,2447,6

3.Aziz7,57,256,2551,8454,0

4.Bagus76,84946,2547,6

5.Bunga67364942

6.Citra66,23638,4437,2

7.Deni5,55,130,2526,0128,05

8.Eko6,5642,2545,539

9.Nana76,5493645,5

10.Rina65,93634,8135,4

Jumlah65,063,8426,0410,52417,3

Kemudian dimasukkan dalam rumus:= = 0,745

Dari hasil tersebut jika dibandingkan dengan validitas soal yang dihitung dengan rumus simpangan ternyata terdapat selisih 0,003. Hal tersebut wajar karena dalam perhitungan terdapat pembulatan angka pada 3 angka dibelakang koma. Perbedaan 0,003 sangat kecil jadi dapat diabaikan.

4. Validitas Butir Soal atau Validitas ItemApa yang sudah dibicarakan di atas adalah validitas soal secara keseluruhan tes. Disamping mencari validitas soal perlu juga dicari validitas item. Jika seorang peneliti atau seorang guru mengetahui bahwa validitas soal tes misalnya terlalu rendah dan rendah saja, maka selanjutnya ingin mengetahui butir-butir tes manakah yang menyebabkan soal secara keseluruhan tersebut jelek karena memiliki validitas rendah. Untuk kepentingan inilah dicari validitas butir soal.Pengertian umum untuk validitas item adalah demikian sebuah item dikatakan valid apabila mempunyai dukungan yang besar terhadap skor total. Skor pada item menyebabkan skor total menjadi tinggi atau rendah. Dengan kata lain dapat dikemukakan di sini bahwa item memiliki validitas yang tinggi jika skor pada item mempunyai kesejajaran dengan skor total. Kesejajaran ini dapat diartikan dengan kolerasi sehingga untuk mengetahui validitas item digunakan rumus kolerasi seperti sudah diterangkan di atas.Untuk soal yang bersifat objektif biasanya diberikan nilai 1 untuk benar dan 0 untuk yang salah. Sedangkan skor total merupakan jumlah total dari skor untuk semua item yang diujikan.Contoh perhitungan:TABEL ANALISA ITEM UNTUKPERHITUNGAN VALIDITAS ITEM

NamaNomor Butir SoalTotal

Skor

12345678910

Andi10101111118

Ardi00101001115

Aziz01000101014

Bagus11001100105

Bunga11111100006

Citra10101010004

Deni11111110007

Eko01011111118

Dari tabel di atas misalnya dihitung validitas item nomor 6, maka skor item tersebut variabel X dan skor total disebut variabel Y. Selanjutnya disini saya menggunakan rumus korelasi product moment dengan angka kasar.Untuk menghitung validtas item nomor 6, maka dibuat dahulu tabel persiapan sebagai berikut:No.NamaXY

1.Andi18

2.Ardi05

3.Aziz14

4.Bagus15

5.Bunga16

6.Citra04

7.Deni17

8.Eko18

Keterangan:X = skor item nomor 6Y = skor totalX = 6= 6Y = 46= 288XY = 37 = 5,57 = 6,17p = = 0,75q = = 0,25Selanjutnya dimasukkan ke rumus korelasi product moment angka kasar: = = = = 0,421 Dengan hasil tersebut dapat disimpulkan validitas item tersebut kurang meyakinkan. Tentu saja validitasnya rendah.Selain dengan rumus di atas untuk mengetahui validitas item juga dapaat menggunakaan rumus sebagai berikut:Keterangan:= Koefisiensi korelasi biserial = Rerata skor dari subjek yang menjawab betul pada item yang dicari validitasnya = Rerata skor total= Standart deviasi dari skor total= Proporsi siswa yang menjawab benar ( p = )q = Proporsi siswa yang menjawab salah ( q = 1 p )Apabila item nomor 6 di atas dicari validitasnya dengan rumus ini makaa melalui langkah-langkah sebagai berikut: Mencari = = = 6,17 Mencari = = = 5,75 Dari perhitungan dihasilkan standar deviasi, = 1,7139 Mencari p,p = = 0,75 Mencari q,q = = 0,25 Masukkan ke rumus x 1,7321= 0,4244Hasil dari perhitungan ini berbada sedikt dengan yang sebelumnya, itu wajar karena dalam perhitungan sering terjadi pembulatan.

5. Tes Terstandar sebagai Kriterium dalam Menentukan ValiditasTes terstandar adalah tes yang yang diulang berkali-kali sehingga terjamin kebaikannya. Tes ini biasa diterapkan di negara-negara berkembang. Tes terstandar biasanya memiliki kriteria: sudar dicoba beberapa kali dan di mana-mana, beberapa koefisien validitas, reliabilitas, taraf kesukaran, daya pembeda dan lain-lain keterangan yang dianggap perlu.Cara menentukan validitas soal yang menggunakan tes terstandar sebagai kriterium dilakukan dengan mengalikan koefisien validitas yang diperoleh dengan koefisien validitas tes terstandar tersebut.

6. Validitas FaktorSelain validitas soal secara keseluruhan dan validitas item harus pula dihitung validitas faktor-faktor atau bagian keseluruhan materi. Butir-butir soal dalam faktor dikatakan valid apabila mempunyai dukungan terhadap soal-soal secara keseluruhan. Bentuk dukungan yaang diaksud adalah jika jumlah skor untuk butir-butir faktor tersebut menunjukkan adanya keselarasan dengan skor soal secara keseluruhan.

B. RELIABILITAS1. Pengertian ReliabilitasYang dimaksud reliabilitas adalah sebagai berikut:a. Sejauh mana hasil pengukuran dapat dipercayab. Sejauh mana hasil pengukuran dapat dipercaya bila dilakukan pengukuran pada waktu yg berbeda pada kelompok subjek yg sama diperoleh hasil yang relatif sama asalkan aspek yg diukur dalam diri subjek memang belum berubahc. Tinggi/rendahnya reliabilitas secara empirik ditunjukkan oleh suatu angka yang disebut nilai koefisien reliabilitasd. Reliabilitas yg tinggi ditunjukkan dengan nilai 1.00, reliabilitas yg dianggap sudah cukup memuaskan atau tinggi adalah 0.70Sehubungan dengan reliabilitas ini, Scarvia B. Anderson nmenyatakan bahwa persyaratan bagi tes, yaitu validitas dan reliabilitas ini penting. Dalam hal ini, validitas lebih penting, dan reliabilitas ini perlu karena menyokong terbentuknya validitas. Sebuah tes mungkin reliable tetapi bisa tidak valid. Sebaliknya, sebuah tes yang valid biasanya reliable.Untuk dapat memperoleh gambaran yang ajeg memang sulit karena unsur kejiwaan manusia itu sendiri tidak ajeg. Misalnya, kemampuan, kecakapan, sikap, dan sebagainya berubah-ubah dari waktu ke waktu.Ada beberapa hal yang sedikit banyak mempengaruhi hasil tes. Secara garis besar dapat dikelompokkan menjadi 3 hal berikut ini:a. Hal yang berhubungan dengan tes itu sendiri, yaitu panjang tes dan kualitas butir-butir soalnya.Semakin banyak jumlah soal maka lebih valid. Maka tingginya jumlah soal membuat tinggi pula reliabilitas dari tes tersebut. Untuk menghitung tingginya reliabilitas soal dalam tes mengenai penambahan soal bisa dihitung dengan rumus Spearman Brown berikut ini: Keterangan: = besar koefisien reliabilitas sesudah tes tersebut ditambah butir soal = berapa kali butir-butir soal ditambah = besar kooefisien reabilitas sebelum penambaahan butir soalPenambahan butir soal dapat menambah tinggi reliabilitas, tetapi ada kalanya penambahan tidak berarti bahkan bisa merugikan.b. Hal yang berhubungan dengan tercoba (testee)Suatu tes yang dicobakan pada suatu kelompok yang terdiri dari banyak siswa akan menunjukkan keragaman hasil tes yang menggambarkan besar kecilnya reliabilitas tes. Tes yang dicobakan pada bukan kelompok terpilih, akan menunjukkan reliabilitas yang lebih tinggi dari pada yang diujikan kepada kelompok tertentu yang dipilih.c. Hal yang berhubungan dengan penyelenggaraan tesHal administratif sangat menentukan hasil tes.Contoh: Petunjuk pengerjaan tes Pengawas yang tertib Suasana lingkungan dan tempat tesAdanya beberapa hal yang mempengaruhi hasil tes di atas, maka akan berdampak pula pada reliabilitas soal tes.

2. Cara-cara Mencari Besarnya Reliabilitas Jenis ObjektifUntuk mengetahui besarnya reliabilitas maka harus ada beberapa hasil ujian untuk dikorelasikan.Ada beberap metode atau cara yang bisa digunakan untuk mengetahui besarnya reliabilitas, antara lain adalah sebagai berikut:a. Metode bentuk paralel (equivalent)Tes peralel atau equivalen adalah dua tes yang mempunyai kesamaan tujuan, tingkat kesukaran dan susunan, tetapi butir soal dibuat berbeda.Contoh dalam tes Matematika Seri A yang dicari reliabilitasnya dan Seri B yang diteskan kepada kelompok siswa yang sama, kemudian hasilnya dikorelasikan. Jika koefisien korelasi tinggi maka tes tersebut sudah reliabel dan dapat digunakan sebagai alat pengetes yang terandalkan.Kelebihan metode ini baik digunakan karena siswa mengerjakan dua Seri tes dengan soal yag berbeda jadi tidak terjadi faktor ingatan dalaam pengerjaannya.kelemahannya adalah bahwa pengetes (Guru) harus membuat dua seri tes yang berbeda.b. Metode tes ulang (test-retest method)Metode tes ulang ini biasa diterapkan karena pengetes tidak perlu membuat dua Seri tes yang berbeda. Dalam metode ini pengetes melakukan satu Seri tes yang dicobakan dua kali. Kemudian hasil kedua tes dikorelasikan.Untuk tes yang banyak mengungkap ingatan metode ini kurang mengena karena eserta tes bisa mengingat tes yang pertama dan tentunya berakibat membaiknya skor yang diperoleh pada tes kedua. Hal tersebut tidak mengapa yang terpenting adalah adanya kesejajaaran hasil yang ditunjukkan oleh koefisien korelasi yang tinggi (kenaikan skor dialami oleh semua siswa).c. Metode belah dua atau split-half methodMetode ini mempermudah dari dua metode sebelumnya. Dalam metode ini pengetes hanya membuat satu Seri tes dan melakukan pengetesan satu kali. Dalam mencari reliabilitas pada metode ini haris menghitung dengan rumus Spearman-Brown sebagai berikut: = Korelasi antara skor-skor setiap belahan tes = Koefisien reliabilitas yang sudah disesuaikanDalam penggunaan metode ini ada persyaratannya yaitu item soal harus berjumlah genap, sehingga dapat dibelah menjadi dua bagian.Dalam metode belaah dua ada dua cara yang dapat dilakukan, yaitu:1 Membelah item-item genap dan item-item ganjil, biasa disebut belahan genap ganjil.2 Membelah setengah awal dari jumlah item keseluruhan dan setengah ahir dari keseluruhan item, biasaa disebut dengan belahan awal ahir.Selain dengan mengunakan rumus di atas ada seorang ahli yang bernama Flanagan membuat rumus belah dua ganjil-genap, dan Rulon membuat rumus belah dua awal-ahir.1 Penggunaan rumus FlanaganRumus = )Di mana:= reliabilitas tes= varian belahan pertama (1), varian skor item ganjil= varian belahan kedua (2), varian skor item genap= varian total2 Penggunaan rumus RulonRumus =Di mana: = varian beda (varians difference)= difference yaitu perbedaan antara skor belahan pertama (awal) dengan skor belahan kedua (ahir)Telah disinggung di bagian depan bahwa syarat untuk menggunakan metode belah dua adalah jumlah item harus genap dan antara belahan terjadi keseimbangan (homogen).Untuk mengatasi kesulitan dalam memenuhi persyaratan tersebut, mencari reliabilitas juga dapat dicari dengan menggunakan rumus dari Kuder dan Richardson. Rumus yang digunakan untuk mencari reliabilitas yang biasa digunakan ada dua yaitu rumus K-R.20 dan rumus K-R.21.1 Penggunaan rumus K-R. 20Rumus =Di mana: = reliabilitas tes secara keseluruhan = proporsi subjek yang menjawap item dengan benar = proporsi subjek yang menjawap item dengan salah (q = 1-p) = jumlah hasil perkalian antara p dan q = banyaknya item = standar deviasi item (standar deviasi adalah akar varians)Dalam referensi lain untuk n diganti pakai k, dan S biasa diganti dengan SB. Hal tersebut juga sama pada rumus K-R.21. 2 Penggunaan rumus K-R. 21Rumus K-R. 21:M= Mean atau rerata skor totalSelain dengan rumus-rumus di atas masih ada satu rumus lagi yang dapat digunakan untuk menghitung reliabilitas, yaitu dengan rumus Hoyt.1 Penggunaan rumus HoytRumus: atau= Reliabilitas seluruh soal= Varians responden= Varians sisaUntuk mencari reliabilitas dengan rumus ini harus melalui beberapa langkah-langkah sebagai berikut:Langkah 1: mencari jumlah kuadrat responden:= jumlah kuadrat responden= skor total tiap respondenk = banyaknya itemN= banyaknya responden atau subjekLangkah 2: mencari jumlah kuadrat item:= jumlah kuadrat item= jumlah kuadrat jawaban benar seluruh item= kuadrat dari jumlah skor totalLangkah 3: mencari jumlah kuadrat total:= jummlah kuadrat total= jumlah jawab benar seluruh item= jumlah jawab salah seluruh itemLangkah 4: mencari jumlah kuadrat sisa:Langkah 5: mencari varians responden dan varians sisa dengan tabel F.Dalam mencari varians ini deperlukan d.b (derajat kebebasan)dari masing-masing sumber varians kemudian d.b ini digunakansebagai penyebut terhadap setiap jumlah kuadrat untuk memperoleh variansi.d.b= banyaknya N setiap sumber variansi dikurangi 1.Jadi Variansi= Langkah 6: memasukkan ke rumus Rumus adalah rumus Hoyt yang telah tertulis di atas.

3. Mencari reliabilitas tes bentuk soal uraianRumus-rumus yang telah kami uraikan di atas merupakan rumus yang hanya untuk mencari reliabilitas pada soal tes jenis objektif, yaitu soal yang terdiri dari butir soal yang dinilai hanya benar atau salah. Untuk menilai soal bentuk uraian tidak bisa dilakukan seperti itu. Suatu soal uraian menghendaki gradualisasi penilaian. Bisa jadi pada butir soal nomor 1 penilaian terendah 0 dan tertinggi 8, tetapi nomor dua tertinggi 6, butir nomor 3 tertinggi 10, dan lain sebagainya.Untuk keperluan mencari reliabilitas soal keseluruhan perlu juga dilakukan asalisa butir soal seperti halnya pada soal bentuk objektif. Skor untuk masing-masing butir soal dicantumkan pada kolom item menurut apa adanya. Rumus yang digunakan untuk menghitung reliabilitas soal bentuk uraian adalah rumus Alpha sebagai berikut:Di mana:= reliabilitas yang dicari= jummlah varians skor tiap-tiap item= varians totalMenguji reliabilitas angket penelitian dalam pengumpulan data, rumus Alpha ini dapat diterapkan. Karena untuk rumus belah dua hanya dapat digunakan jika jumlah item harus genap, rumus Alpha ini bisa jadi alternatif.

C. HUBUNGAN VALIDITAS DENGAN RELIABILITASHubungan antara validitas dan reliabilitas sering membingungkan para guru muda/baru, terutama bagi yang baru mengetahui batasan dalam konteks instrumen evaluasi dan penelitian ini. Reliabilitas pengukuran instrumen evaluasi diperlukan untuk mencapai hasil pengukuran yang valid. Dalam kaitannya dengan posisi konsistensi, para guru bisa memiliki instrumen evaluasi yang reliabel tanpa valid, dan sebaliknya bisa memiliki instrumen valid dengan reliabilitas yang baik.Gambar di bawah ini akan menunjukkan kaitan antara validitas dan reliabilitas:

Gambaran valid dan reliabel ditunjukan dari hasil tembakan pada target yang telah ditetapkan: Gambar a: hasil tembakan menunjukkan valid dan reliabel, karena tembakan tepat sasaran dan dalam luasan yang konsisten Gambar b: hasil tembakan menunjukkan tidak valid dan juga tidak reliabel, karena sasaran gerak labil dan berpencar merata pada seluruh sasaran. Gambar c: hasil tembakan menunjukkan reliabel tetapi tidak valid, karena hasil tembakan konsisten pada luasan tetapi diluar dari ketetapan target.

BAB IIIPENUTUP

KESIMPULANDari uraian di atas dapat ditarik kesimpulan bahwa bila dikaji secara umum, persyaratan minimal yang lazim dimiliki oleh instrumen yang dibuat adalah alat ukur harus memiliki minimal dua keunggulan, yakni validitas dan reliabilitas. Validitas dan reliabilitas lazim diperlukan bila instrumen yang dibuat merupakan instrumen baru dan belum pernah digunakan oleh peneliti-peneliti terdahulu. Karena biasanya instrumen baru secara umum belum memiliki validitas dan reliabilitas. Dengan demikian, jika alat ukur yang digunakan mampu memberikan informasi yang sesungguhnya tentang apa yang kita inginkan untuk diukur dinamakan valid. Atau dengan kata lain, instrumen yang dipakai dalam penelitian memiliki validitas yang baik.Dengan validnya alat ukur makaa akaan menimbulkan reliabilitas pula, karena biasaanya sebuah tes atau evaluasi yang valid juga reliabel. Dengan valid dan reliabelnya tes atau evaluasi diharapkan akan terpenuhi pula tujuan dari tes atau evaluasi tersebut yang sesuai dengan semestinya.

DAFTAR PUSTAKA

Arikunto. (2012). Dasar-Dasar Evaluasi Pendidikan. Jakarta. Bumi Aksara.Sukardi. (2008). Evaluasi Pendidikan (Prinsip & Operasionalnya). Jakarta. Bumi Aksara.Sudargo. (2012). Bahan Kuliah Pertemuan 7 Validitas dan Reliabilitas Instrumen (http://file.upi.edu/Direktori/SPS/PRODI.PENDIDIKAN_IPA/195107261978032-FRANSISCA_SUDARGO/KULIAH_PENPENDS2/Pertemuan_7.pdf). (Online). Diakses pada 10 Februari 2015.Pramana, dkk. Evaluasi PendidikanZulkifli. (2011). Validitas dan Reliabilitas Instrumen (http://digilib.unimed.ac.id/-public/UNIMED-Article-24576-Zulkifli.pdf). (Online). Diakses pada 12 Februari 2015.Zuhaili. (2013). Resume Buku Dasar-dasar Evaluasi Pendidikan Suhasimi Arikunto (https://zainzuhaili.wordpress.com/2013/06/25/resume-buku-evaluasi-pai-prof-dr-suharsimi-arikunto/). (Online). Diakses pada 12 Februari 2015.