bhn uas evaluasi pendidikn

57
TES STANDAR DAN TES NONSTANDAR A. Pengertian Tes Secara harfiah, kata “tes” berasal dari bahasa Perancis kuno: testum dengan arti: piring untuk menyisihkan logam-logam mulia (maksudnya dengan menggunakan alat berupa piring itu akan diperoleh jenis-jenis logam mulia yang nilainya sangat tinggi), dalam bahasa Inggris ditulis dengan test yang dalam bahasa Indonesianya diterjemahkan dengan makana “tes, ujian atau percobaan”. Dalam bahasa Arab Imtihan.[1] Sedangkan Sumadi Suryabrata, mengartikan tes adalah: “pertanyaan- pertanyaan yang harus dijawab dan atau perintah-perintah yang harus dijalankan, yang mendasarkan harus bagaimana testee menjawab pertanyaan- pertanyaan atau melakukan perintah-perintah itu, penyelidik mengambil kesimpulan dengan cara membandingkan dengan standar atau testee lainnya”.[2] Dari kedua pengertian diatas, diambil pengertian, tes adalah alat pengukuran berupa pertanyaan, perintah dan petunjuk yang dutujukan kepada testee unruk mendapatkan respon sesuai dengan petunjuk itu. Atas dasar respon tersebut ditentukan tinggi rendahnya skor dalam bentuk kuantitatif, selanjutnya dibandingkan dengan standar yang telah ditentukan untuk ditarik kesimpulan yang bersifat kualitatif. B. Tes Standar 1. Pengertian Tes Standar Pengertian tes standar secara sempit adalah tes yang disusun oleh satu tim ahli, atau disusun oleh lembaga yang khusus menyelenggarakan secara professional. Tes tersebut diketahui memenuhi syarat sebagai tes yang baik. Tes ini dapat digunakan dalam waktu yang relatif lama, dapat diterapkan pada beberapa obyek mencakup wilayah yang luas. Istilah “standar” dalam tes dimaksudkan bahwa semua siswa menjawab pertanyaan-pertanyaan yang sama dari sejumlah besar pertanyaan dikerjakan dengan menggunakan petunjuk yang sama dan dalam batasan waktu yang sama pula. Dengan demikian maka seolah-olah ada suatu standar atau ukuran sehingga diperoleh suatu standar penampilan (performance) dan penampilan kelompok lain dapat dibandingkan dengan penampilan kelompok standar tersebut. Istilah “standar” tidak mengandung arti bahwa tes tersebut mengukur apa yang harus dan dapat diajarkan pada suatu tingkat tertentu atau bahwa tes itu menyiapkan suatu standar prestasi dimana siswa harus dan dapat mencapai suatu tingkat tertentu. Sekali lagi, tes standar dipolakan untuk penampilan prestasi sekarang (yang ada) yang dilaksanakan secara seragam, diusahakan dalam kondisi yang seragam, baik itu diberikan kepada siswa dalam pelaksanaan perseorangan maupun siswa sebagai anggota dari suatu kelompok.[3] 1

Upload: musa-muhammad-sangquite

Post on 26-Sep-2015

249 views

Category:

Documents


3 download

DESCRIPTION

Evaluasi pendidikan

TRANSCRIPT

TES STANDAR DAN TES NONSTANDAR

A. Pengertian TesSecara harfiah, kata tes berasal dari bahasa Perancis kuno: testum dengan arti: piring untuk menyisihkan logam-logam mulia (maksudnya dengan menggunakan alat berupa piring itu akan diperoleh jenis-jenis logam mulia yang nilainya sangat tinggi), dalam bahasa Inggris ditulis dengan test yang dalam bahasa Indonesianya diterjemahkan dengan makana tes, ujian atau percobaan. Dalam bahasa Arab Imtihan.[1]Sedangkan Sumadi Suryabrata, mengartikan tes adalah: pertanyaan-pertanyaan yang harus dijawab dan atau perintah-perintah yang harus dijalankan, yang mendasarkan harus bagaimana testee menjawab pertanyaan-pertanyaan atau melakukan perintah-perintah itu, penyelidik mengambil kesimpulan dengan cara membandingkan dengan standar atau testee lainnya.[2]Dari kedua pengertian diatas, diambil pengertian, tes adalah alat pengukuran berupa pertanyaan, perintah dan petunjuk yang dutujukan kepada testee unruk mendapatkan respon sesuai dengan petunjuk itu. Atas dasar respon tersebut ditentukan tinggi rendahnya skor dalam bentuk kuantitatif, selanjutnya dibandingkan dengan standar yang telah ditentukan untuk ditarik kesimpulan yang bersifat kualitatif.

B. Tes Standar1. Pengertian Tes Standar Pengertian tes standar secara sempit adalah tes yang disusun oleh satu tim ahli, atau disusun oleh lembaga yang khusus menyelenggarakan secara professional. Tes tersebut diketahui memenuhi syarat sebagai tes yang baik. Tes ini dapat digunakan dalam waktu yang relatif lama, dapat diterapkan pada beberapa obyek mencakup wilayah yang luas.Istilah standar dalam tes dimaksudkan bahwa semua siswa menjawab pertanyaan-pertanyaan yang sama dari sejumlah besar pertanyaan dikerjakan dengan menggunakan petunjuk yang sama dan dalam batasan waktu yang sama pula. Dengan demikian maka seolah-olah ada suatu standar atau ukuran sehingga diperoleh suatu standar penampilan (performance) dan penampilan kelompok lain dapat dibandingkan dengan penampilan kelompok standar tersebut.Istilah standar tidak mengandung arti bahwa tes tersebut mengukur apa yang harus dan dapat diajarkan pada suatu tingkat tertentu atau bahwa tes itu menyiapkan suatu standar prestasi dimana siswa harus dan dapat mencapai suatu tingkat tertentu. Sekali lagi, tes standar dipolakan untuk penampilan prestasi sekarang (yang ada) yang dilaksanakan secara seragam, diusahakan dalam kondisi yang seragam, baik itu diberikan kepada siswa dalam pelaksanaan perseorangan maupun siswa sebagai anggota dari suatu kelompok.[3]

2. Kegunaan Tes StandarSecara singkat dapat dikemukakan bahwa kegunaan tes standar adalah:a. Jika ingin membuat perbandingan.b. Jika banyak orang yang akan memasuki suatu sekolah tetapi tidak tersedia data tentang calon ini.Secara garis besar kegunaan tes standar adalah:a. Membandingkan prestasi belajar dengan pembawaan individual atau kelompok.b. Membandingkan tingkat prestasi siswa dalam keterampilan di berbagai bidang studi untuk individual atau kelompok.c. Membandingkan prestasi siswa berbagai sekolah atau kelas.d. Mempelajari perkembangan siswa dalam suatu periode atau waktu tertentu.

3. Kelengkapan Tes Standar Sebuah tes yang sudah distandarisasikan dan sudah dapat disebut sebagai tes standar, biasanya dilengkapi dengan sebuah manual. Manual ini memuat keterangan-keterangan atau petunju-petunjuk yang perlu terutama yang menjelaskan tentang pelaksanaan, mengskor, dan mengadakan interpretasi. Secara garis besar manual tes standar ini memuat:a. Ciri-ciri mengenai tes.Misalnya menyebutkan tingkat validitas. Tingkat reliabilitas dan sebagainya.b. Tujuan serta keuntungan-keuntungan dari tes. Misalnya yang disebutkan untuk siapa tes tersebut diberikan dan untuk tujuan apa.c. Proses standarisasi tes. Misalnya mengenai hal-hal yang berhubungan dengan sampel.-Besarnya sampel,-Teknik sampling,-Kelompok mana yang diambil sebagai sampel(sifat sampel).d. Petunjuk-petunjuk tentang cara melaksanakan tes. Misalnya: dilaksanakan dengan lisan atau tertulis, watu yang digunakan untuk mengerjakan setiap bagian, boleh tidaknya tercoba keluar jika sudah selesai mengerjaan soal itu dan sebagainya.e. Petunjuk-petunjuk bagaimana cara menskor. Misalnya: untuk beberapa skor tiap-tiap soal/unit, menggunakan sistem hukuman atau tidak, bagaimana cara menghitung nilai akhir dan sebagainya.f. Petunjuk-petunjuk untuk menginterpretasikan hasil. Misalnya:-Betul nomor sekian sampai sekian cocok untuk jabatan kepala seksi,-Betul nomor sekian saja, cocok untuk jabatan guru dan sebagainya.g. Saran-saran lain. Misalnya: siapa pun harus menjadi pengawas, bagaimana seandainya tidak ada calon yang mencapai skor tertentu dan sebagainya.[4]

4. Jenis-jenis Tes Standar Tes standar diklasifikasikan menjadi 7 jenis utama dan beberapa contoh dari setiap jenis yang sering digunakan dalam penelitian:

1) Tes kecerdasan Tes kecerdasan memberikan perkiraan tingkat intelektual umum dengan sampling kinerja seseorang pada berbagai tugas. Tugas-tugas ini dapat mencakup definisi kata, pemecahan masalah matematika, pengetahuan umum, dan memori jangka pendek. Tes kecerdasan sangat dijunjung tinggi oleh para peneliti pendidikan dan personil sekolah karena keberhasilan mereka dalam memprediksi prestasi sekolah. Bahkan sering disebut tes bakat skolastik karena mayoritas dari tes tersebut mengukur spek-aspek kecerdasan yang tampaknya diperlukan untuk suksesd alam belajar di sekolah. 2) Tes bakat Tes bakat ditujukan untuk prediksi kinerja siswa dalam perilaku spesifik. Tes yang tersedia untuk mengukur bakat bagi banyak mata pelajaran tertentu seperti bahasa asing, seni, musik, dan matematika. Sebuah kecenderungan utama dalam pengujian pendidikan adalah perkembangan dari pengujian yang mengukur berbagai macam bakat yang berkaitan dengan keberhasilan kejuruan dan skolastik.3) Tes prestasi Tes prestasi banyak tersedia. Beberapa tes dimaksudkan untuk mengukur pengetahuan siswa mengenai fakta yang spesifik, pemahaman siswa dan penguasaan prinsip-prinsip dasar. Meskipun tes prestasi telah dikritik atas dasar sosial, tes tersebut mungkin yang paling valid, dapat diandalkan, dan berguna untuk peneliti pendidikan. Administrasi waktu untuk tes prestasi yang berbeda sangat bervariasi, beberapa tes mengambil sedikitnya 30 menit, sedangkan yang lain memerlukan dua hari pengujian. Tes prestasi juga berbeda dalam subjek-materi cakupan. Dalam memilih suatu tes prestasi untuk proyek penelitian, harus terlebih dahulu memutuskan bidang prestasi yang akan diukur dan kemudian mengevaluasi tes yang dimaksudkan untuk mengukur prestasi di bidang ini.

4) Tes diagnostic Tes diagnostik adalah bentuk tes prestasi. Namun, tes prestasi biasanya menghasilkan skor tunggal menunjukkan tingkat umum prestasi siswa dalam mata pelajaran tertentu. Beberapa tes diagnostik digunakan umum adalah Stanford Diagnostic Reading Test, Stanford Diagnostic Mathematics Test, dan Diagnostic Skreening Test. Ada beberapa keuntungan untuk administrasi tes diagnostik dalam program penelitian atau perbaikan. Pertama, siswa yang memiliki kekurangan tertentu dalam subjek dapat diidentifikasi. Kedua, penggunaan tes diagnostik sangat membantu dalam perencanaan perbaikan instruksi individual, pendekatan yang dianjurkan oleh banyak pendidik. Kerugian dari beberapa tes diagnostik adalah bahwa sub scores memiliki reliabilitas yang rendah dan sangat saling berkorelasi dengan satu sama lain.5) Mengukur kreatifitas Cara untuk mengidentifikasi dan melatih kreatifitas seseorang merupakan masalah utama dalam penelitian pendidikan selama dua dekade ini. Sangat mengejutkan bahwa ternyata telah banyak berkembang pula cara untk mengukur kreatifitas pada waktu yang dua dekade ini. Alasan mendasar dalam melakukan penelitian dalam kreativitas adalah meningkatnya ketertarikan para pendidik terhadap factor-faktor non-intelektual, seperti kreatifitas dan personalitas, dalam pencapaian siswa di sekolah. Kebanyakan pengukuran tentang kreativitas ditekankan pada penilaian terhadap kemampuan belajar siswa dan sifat-sifat siswa yang dapat berkontribusi pada pencapaian kreatif siswa. Hal tersebut tidak mengukur secara langsung tingkat krativitas siswa.6) Self-report dalam pengukuran kepribadian Pengukuran ini digunakan secara berkelanjutan dalam penelitian pendidikan untuk menggambarkan karakteristik kepribadian kelompok yang sesuai dengan kebutuhan peneliti; seperti kelompok minoritas, kelompok anak-anak kurang beruntung dsb. Mereka juga menggunakan cara tersebut dalam penelitian yang dilakukannya untuk melihat keterkaitan antara karakteristik seseorang dengan faktor-faktor lainnya, seperti tingkat kecerdasan, prestasi dalam kelompoknya atau popularitas. Keuntungan dari tes tersebut adalah murah dan mudah untuk diatur dan dinilai. Pertanyaan yang dikemukakan pada tes tersebut sebagian besar berupa pertanyaan objektif; seperti pertanyaan ya-tidak atau pertanyaan berbentuk pilihan ganda. Kekurangan dari tes ini adalah tes ini biasanya merupakan self-report dari individu yang dites. Seperti self-report pada umumnya, tes tersebut akan akurat apabila persepsi diri dari individu tersebut juga akurat dan juga terkait dengan kejujuran individu tersebut dalam mengisi tes tersebut. Hal tersebut merupakan masalah bagi banyak penelitian di bidang pendidikan dan psikologi.7) Teknik proyektif Istilah teknik-teknik proyektif ini dipopulerkan oleh Frank LK. Salah satu keuntungan yang diklaim sebagai teknik proyektif atas diri sendiri-laporan persediaan adalah bahwa mereka kurang tunduk pada berpura-pura. Teknik-teknik proyektif yang paling banyak digunakan adalah Uji Rorschach dan Test Apperception Tematik (TAT). Di Rorschach, subjek menanggapi satu set percikan tinta, sedangkan dalam TAT subjek menanggapi satu set gambar. Terlepas dari popularitas tes proyektif kami akan merekomendasikan bahwa mereka akan digunakan dengan hati-hati dalam proyek penelitian, karena sebagai aturan, ukuran ini membutuhkan pelatihan yang ekstensif dan pengalaman untuk mengelola, skor, dan menafsirkan. Jika Anda memutuskan untuk menggunakan Rorschach atau teknik proyektif serupa dalam proyek Anda, anda harus mempekerjakan orang-orang yang memenuhi syarat untuk mengelola, skor dan menginterpretasikan hasil.[5]

C. Tes Nonstandar1. Pengertian Tes Nonstandar Tes nonstandar adalah kebalikan tes standar, yaitu tes yang disusun oleh seorang pendidik yang belum memiliki keahlian professional dalam penyusunan tes, atau mereka yang memiliki keahlian tetapi tidak sempat menyusun tes secara baik, mengujicobakan, melakukan analisis sehingga validitas dan reliabilitas belum dapat dipertanggungjawabkan. Tes buatan guru memang memiliki beberapa kekhususan, bisa jadi syarat kualitatif belum terpenuhi, tetapi ia memiliki kelebihan lebih cocok untuk mengukur hal-hal khusus yang tidak dapat distandarisasikan, seperi formatif, tes diagnostik, hasilnya lebih realistik. Sebab tes ini dirancang sesuai dengan keadaan peserrta didik.

2. Kegunaan Tes NonStandar1) Untuk menentukan seberapa baik siswa telah menguasai bahan pelajaran yang diberikan dalam waktu tertentu.2) Untuk menentukan apakah sesuatu tujuan telah tercapai.3) Untuk memperoleh suatu nilai.Selanjutnya baik tes standard an tes buatan guru dianjurkan dipakai jika hasilnya akan digunakan untuk:1) Mengadakan diagnosis terhadap ketidak mampuan siswa.2) Menentukan tempat siswa dlam suatu kelas atau kelompok.3) Memberikan bimbingan kepada siswa dalam pendidikan dan pemilihan jurusan.4) Memilih siswa untuk program-program khusus.[6]

3. Menilai Tes Nonstandar Ada 4 cara untuk menilai tes yaitu :1) Cara pertama meneliti secara jujur soal-soal yang sudah disusun, kadang-kadang dapat diperoleh jawaban tentang ketidakjelasan perintah atau bahasa, taraf kesukaran, dan lain-lain keadaan soal tersebut. Pertanyaan-pertanyaan tersebut, antara lain: Apakah banyaknya soal untuk tiap topik sudah seimbang? Apakah semua soal menanyakan bahan yang telah diajarkan? Apakah soal yang kita susun tidak merupakan pertanyaan yang membingungkan? Apakah soal itu tidak sukar untuk dimengerti? Apakah soal itu tidak dapat dikerjakan oleh sebagian siswa?2) Cara kedua adalah mengadakan analisis soal (item analysis). Analisis soal adalah suatu prosedur yang sistematis, yang akan memberikan informasi-informasi yang sangat khusus terhadap butir tes yang kita susun.Faedah mengadakan analisis soal: Membantu kita dalam mengidentifikasi butir-butir soal yang jelek. Memperoleh informasi yang akan dapat digunakan untuk menyempurnakan soal-soal untuk kepentingan lebih lanjut. Memperoleh gambaran secara selintas tentang keadaan yang kita susun.3) Cara ketiga adalah mengadakan checking validitas. Validitas yang paling penting dari tes buatan guru adalah validitas kurikuler. Untuk mengadakan checking validitas kurikuler, kita harus merumuskan tujuan setiap bagian pelajaran secara khusus dan jelas sehingga setiap soal dapat kita jodohkan dengan setiap tujuan khusus tersebut. Dalam hal ini Terry D. Ten Brink, mengemukakan pendapatnya demikian: Untuk tes yang dirancang akan menggunakan norm-referenced tidak harus menuliskan setiap tujuan khusus, tetapi cukup dengan tujuan-tujuan yang esensial saja. Untuk tes yang dirancang akan menggunakan criterion referenced, maka setiap tujuan khusus harus dicantumkan dalam tabek spesifikasi. Cara keempat adalah dengan mengadakan checking reliabilitas. Salah satu indikator untuk tes yang mempunyai reliabilitas yang tinggi adalah bahwa kebanyakan dari soal-soal tes itu mempunyai daya pembeda yang tinggi.[7]

D. Perbandingan Tes Standar dan Tes Buatan Guru. Tes standar disusun dalam tipe-tipe soal yang sama yang meliputi bahan atau pengetahuan yang sama banyak dengan bahan atau pengetahuan yang dicakup oleh tes buatan guru. Lalu apakah perbedaan antara tes standar dengan tes nonstandar, atau apakah keburukan dan keuntungan tes standar?Pertama, marilah kita tinjau perbedaan antara tes standar dengan tes buatan guru. Perbedaannya adalah sebagai berikut:

Tes StandarTes Nonstandar

Didasarkan atas bahan dan tujuan umum dari sekolah-sekolah di seluruh Negara.Didasarkan atas bahan dan tujuan khusus yang dirumuskan oleh guru untuk kelasnya sendiri.

Mencakup aspek yang luas dan pengetahuan atau keterampilan dengan hanya sedikit butir tes untuk setiap keterampilan atau topik.Dapat terjadi hanya mencakup pengetahuan atau keterampilan yang sempit.

.Disusun dengan kelengkapan staf profesor, pembahas, dan editor butir tes.Biasanya disusun sendiri oleh guru dengan sedikit atau tanpa bantuan orang lain/tenaga ahli.

Menggunakan butir tes yang sudah diujicobakan (try out), dianalisis dan direvisi sebelum menjadi sebuah tes.Jarang menggunakan butir tes yang sudah diujicobakan, dianalisis dan direvisi.

Mempunyai reliabilitas yang tinggi.Mempunyai reliabilitas sedang atau rendah.

Dimungkinkan menggunakan norma untuk seluruh Negara.Norma kelompok terbatas kelas tertentu.

Sumardi Suryabrata, menegaskan bahwa dalam masalah norma, sebenarnya ada tiga jenis, yaitu:a. Norma nasionalb. Norma lokal c. Norma sekolahPerbedaan antar norma nasional dan norma lokal mencakup daerah liputannya. Norma nasional memiliki karateristik yang unik, tidak sederhana, dan tidak mudah menyusunnya. Sedangkan norma lokal lebih cermat dalam menginterprestasikan prestasi dalam jangkauan wilayahnya, hal ini penting bilamana akan dipakai untuk melakukan penilaian pendidikan. Norma nasional sekalipun sulit, namun bila sudah tersusun sangat berguna untuk acuan menginterpretasikan taraf kompetensi individual, sekolah, dan wilayahnya.Norma sekolah dapat dipakai sebagai acuan interpretasi hasil tes peserta didik dari sekolah bersangkutan. Oleh karena itu masing-masing sekolah memiliki norma sendiri sesuai dengan kualitas sekolah bersangkutan.Pada saat ini hasil belajar peserta didik kita jumpai penggunaan dua norma, yaitu norma sekolah dan norma nasional Norma sekolah ditemuan dalam STTB dan nilai rata-rata rapor, sedangkan norma nasional ditemukan pada NEM (Nilai Ebtanas Murni). Secara ideal lebih baik bilamana setiap peserta didik juga memiliki norma lokal.[8] Kedua, untuk menyusun tes standar, dibutuhkan waktu yang lama. Seperti disebutkan bahwa untuk memperoleh sebuah tes standar melalui prosedur: Penyusunan Uji coba Analisa Revisi Edit.Kelima kegiatan ini membutuhkan waktu lama.[9]

1.1 Jenis Jenis Teknik Non Tes Teknik non-tes merupakan prosedur pengumpulan data untuk memahami pribadi siswa pada umumnya yang bersifat kualitatif. Dalam hubungannya dengan memahami kesulitan belajar siswa, berikut macam macam teknik non tes yang dapat dilakukan: A. Teknik Observasi Observasi adalah suatu metode pengumpulan data dengan jalan pengamatan yang bertujuan untuk mendapatkan data tentang suatu masalah sehingga diperoleh suatu pemahaman dan dilakukan secara langsung, seksama dan sistematis. Sehingga pengamatan memungkinkan untuk melihat dan mengamati sendiri kemudian mencatat perilaku dan kejadian yang terjadi pada keadaan sebenarnya. Observasi yang intensif bisa dilakukan baik di dalam maupun di luar kelas. Pengamat mencatat hal-hal yang berhubungan dengan perilaku siswa, terutama dalam mengikuti pelajaran maupun dengan teman-temannya. Pengamatan ini bertujuan untuk mengetahui keseharian peserta didik yang diduga mengalami kesulitan belajar.Dalam teknik observasi, ada beberapa hal yang perlu dilakukan, diantaranya : Rencanakan terlebih dahulu observasi yang akan dilakukan, meliputi : Apa yang akan diobservasi , dimana letak lokasi observasi, kapan observasi akan dilakukan, siapa yang akan melaksanakan observasi tersebut, siapa yang akan diobservasi, bagaimana melaksanakan observasi tersebut Lengkapilah dengan catatan selama observasi Kaji ulang hasil observasi dengan individu-individu yang terlibat

Hal hal yang tidak boleh dilakukan dalam observasi, yaitu: Menggangu kerja individu yang diobservasi maupun individu lainnya. Terlalu menekankan pada pekerjaan-pekerjaan yang tidak penting.

Disamping itu, teknik ini memiliki beberapa kelebihan dan kekurangan. Diantaranya : Kelebihan : Data yang dikumpulkan melalui observasi cenderung mempunyai keandalan yang tinggi. Kadang observasi dilakukan untuk mengecek validitas dari data yang telah diperoleh sebelumnya dari individu-individu. Dapat melihat langsung apa yang sedang dikerjakan, aktivitas yang rumit kadang-kadang sulit untuk diterangkan. Dapat menggambarkan lingkungan fisik dari kegiatan-kegiatan, misalnya tata letak fisik peralatan, penerangan, gangguan suara dan lain-lain. Dapat mengukur tingkat suatu pekerjaan, dalam hal waktu yang dibutuhkan untuk menyelesaikan satu unit pekerjaaan tertentu.Sedangkan kekurangannya adalah sebagai berikut : Umumnya orang yang diamati merasa terganggu atau tidak nyaman, sehingga akan melakukan pekerjaannya dengan tidak semestinya. Dapat mengganggu proses yang sedang diamati. Orang yang diamati cenderung melakukan pekerjaannya dengan lebih baik dari biasanya dan sering menutup-nutupi kejelekan-kejelekannya.

B. Teknik WawancaraWawancara adalah suatu metode pengumpulan data dengan jalan mengadakan komunikasi dengan sumber data. Komunikasi tersebut dilakukan dengan dialog (tanya jawab) secara lisan, baik langsung maupun tidak langsung. Wawancara bisa dilakukan dengan peserta didik yang bersangkutan atau dengan guru, wali kelas, orang tua maupun teman-temannya bila hal ini diperlukan. Adapun hal-hal yang perlu dilakukan dalam wawancara, yaitu : Pewawancara harus mendengar, mengamati, menyelidiki, menanggapi, dan mencatat apa yang sumber data berikan. Kadang-kadang ia seperti seorang penginterogasi, kadang-kadang secara tajam ia menyerang dengan menunjukkan kesalahan-kesalahan orang yang diwawancarai, kadang-kadang ia mengklarifikasi, kadang-kadang pula ia seperti pasif atau menjadi pendengar yang baik. Suksesnya suatu wawancara tergantung pada kemampuan melakukan kombinasi berbagai keterampilan sesuai dengan tuntutan situasi dan orang yang diwawancarai. Dalam proses wawancara, pewawancara harus meredam egonya dan melakukan pengendalian tersembunyi. Pewawancara memantau semua yang diucapkan oleh dan bahasa tubuh orang yang diwawancarai, sambil berusaha menciptakan suasana santai yakni suasana yang konduksif bagi berlangsungnya wawancara. Dalam prakteknya, berbagai pikiran muncul dibenak pewawancara ketika wawancara sedang berlangsung. Seperti : Apa yang harus saya tanyakan lagi? Bagaimana nada bicara orang yang diwawancarai ini? Dari gerak tubuh dan nada suaranya, apakah ia terlihat bicara jujur atau mencoba menyembunyikan sesuatu?

Disamping itu, terdapat kelebihan dan kekurangan dalam teknik wawancara. Berikut adalah uraiannya.Kelebihan:Flexibility. Pewawancara dapat secara luwes mengajukan pertanyaan sesuai dengan situasi yang dihadapi pada saat itu. Jika dia menginginkan informasi yang mendalam maka dapat melakukan probing. Demikian pula jika ingin memperoleh informasi tambahan, maka dia dapat mengajukan pertanyaan tambahan, bahkan jika suatu pertanyaan dianggap kurang tepat ditanyakan pada saat itu, maka dia dapat menundanya.Nonverbal Behavior. Pewawancara dapat mengetahui perilaku nonverbal, misalnya rasa suka, tidak suka atau perilaku lainnya pada saat pertanyaan diajukan dan dijawab oleh sumber .Question Order. Pertanyaan dapat diajukan secara berurutan sehingga sumber dapat memahami maksud penelitian secara baik, sehingga dapat menjawab pertanyaan dengan baik pula.Respondent alone can answer. Jawaban tidak dibuat oleh orang lain tetapi benar oleh sumber yang telah ditetapkan.Melalui wawancara, dapat ditanyakan hal-hal yang rumit dan mendetail.Completeness. Pewawancara dapat memperoleh jawaban atas seluruh pertanyaan yang diajukan.

Kelemahan : Mengadakan wawancara dengan individu satu persatu memerlukan banyak waktu dan tenaga dan juga mungkin biaya. Walau dilakukan secara tatap muka, namun kesalahan bertanya dan kesalahan dalam menafsirkan jawaban, masih bisa terjadi. Sering atribut (jenis kelamin, etnik, status sosial, jabatan, usia, pakaian, penampilan fisik, dsb) sumber dan juga pewawancara mempengaruhi jawaban. Keberhasilan wawancara sangat tergantung dari kepandaian pewawancara dalam melakukan hubungan antar manusia (human relation). Wawancara tidak selalu tepat pada kondisi-kondisi tempat tertentu, misalnya di lokasi-lokasi ribut dan ramai. Sangat tergantung pada kesediaan, kemampuan dan keadaan sementara dari subyek wawancara, yang mungkin menghambat ketelitian hasil wawancara.

C. Angket Angket (Questioner) adalah alat pengumpul data melalui komunikasi tidak langsung, yaitu melalui tulisan. Angket ini berisi daftar pertanyaan yang ditujukan kepada responden untuk dijawabnya, dimana peneliti tidak langsung bertanya jawab dengan responden, yang bertujuan untuk mengumpulkan keterangan tentang berbagai hal yang berkaitan dengan responden. Karena angket dijawab atau diisi oleh responden dan peneliti tidak selalu bertemu langsung dengan responden, maka dalam penyusuna angket perlu diperhatikan beberapa hal. Pertama, sebelum butir-butir pertanyaan atau pernyataan ada pengantar atau petunjuk pengisian. Kedua, butir-butir pertanyaan dirumuskan secara jelas menggunakan kata-kata yang lazim digunakan (popular), kalimat tidak terlalu panjang. Dan Ketiga, untuk setiap pertanyaan atau pernyataan terbuka dan berstruktur disediakan kolom untuk menuliskan jawaban atau respon dari responden secukupnya.

Berikut kelebihan menggunakan angket : Bila lokasi responden jaraknya cukup jauh, metode pengumpulan data yang paling mudah adalah dengan angket. Pertanyaan-pertanyan yang sudah disiapkan adalah merupakan waktu yang efisien untuk menjangkau responden dalam jumlah banyak. Dengan angket akan memberi kesempatan mudah pada responden untuk mendiskusikan dengan temannya apabila menemui pertanyaan yang sukar dijawab. Responden dapat lebih leluasa menjawabnya dimana saja, kapan saja, tanpa terkesan terpaksa.Kelemahan dari angket : Apabila penelitian membutuhkan reaksi yang sifatnya spontan dengan metode ini adalah kurang tepat. Metode ini kurang fleksibel, kejadiannya hanya terpancang pada pertanyaan yang ada. Jawaban yang diberikan oleh responden akan terpengaruh oleh keadaan global dari pertanyaan. Sangat mungkin jawaban yang sudah diberikan di atas secara spontan dapat berubah setelah melihat pertanyaan di lain nomor. Ada kemungkinan terjadi respons yang salah dari responden. Hal ini terjadi karena kurang kejelasan pertanyaan atau karena keragu-raguan responden menjawab.

Karakteristik pertanyaan pada angket: Susun kalimat sederhana tapi jelas Konfidensial : Data yang diberikan responden merupakan rahasia informasi yang dapat dipercaya. Anonim : Nama dari responden seyogyanya bukan menjadi masalah yang penting dalam penelitian. Pertanyaan mudah dipahami oleh responden. Spesifik : Pertanyaan harus dirumuskan secara spesifik dan jelas. Ambigiositas : Bila pertanyaan bersifat mendua arti akan menyulitkan bagi responden untuk menjawabnya. Contoh : Anda suka naik gunung dengan sepeda dan naik kuda? Disini dua pertanyaan ditanyakan bersama. Faktual : Pertanyaan seyogyanya bersifat meminta fakta bukan opini.Contoh : beberapa orang terbunuh dalam peperangan itu?(fakta) . Bagaimana pendapat anda pada pembunuhan itu. (opini) Ketidakjelasan atau kesamaran : Pertanyaan seyogyanya tidak mengandung ketidak jelasan atau samar-samar keraguan. Contoh : Pada suatu pertandingan sepak bola, anda suka bila ada taruhannya? Pertanyaan seyogyanya tidak memberi petunjuk responden terarah pada suatu masalah tertentu. Contoh : Bukankah anda berfikir bahwa menambah dosis obat yang diminum membahayakan, bukan? Pertanyanan hendaknya tidak mempersukar responden untuk menjawabnya.Contoh : Berapa kali anda setiap hari mandi atau sikat gigi? Pertanyaan hendaknya jangan bersifat pribadi. Kecuali kalau perlu sekali, hindari pertanyaan yang bersifat pribadi. Contoh : Apakah anda suka kawin lagi ? Petanyaan hendaknya besifat logis. Tanpa bertanya apakah anda mempunyai TV? Sudah ditanya Program TV apa yang anda suka?

D. Sosiometri Sosiometri adalah alat yang tepat untuk mengumpulkan data mengenai hubungan - hubungan sosial dan tingkah laku sosial murid (I. Djumhur dan Muh. Surya). Sosiometri adalah alat untuk meneliti struktur sosial dari suatu kelompok individu dengan dasar penelaahan terhadap relasi sosial dan status sosial dari masing-masing anggota kelompok yang bersangkutan (Depdikbud). Sosiometri adalah alat untuk dapat melihat bagaimana hubungan sosial atau hubungan berteman seseorang (Bimo Walgito).Sosiometri merupakan suatu metode untuk memperoleh data tentang hubungan sosial dalam suatu kelompok, yang berukuran kecil sampai sedang (10 50 orang ), berdasarkan preferensi pribadi antara anggota-anggota kelompok (WS. Winkel). Sosiometri adalah suatu alat yang dipergunakan mengukur hubungan sosial siswa dalam kelompok ( Dewa Ktut Sukardi,). Dari beberapa pendapat di atas dapat disimpulkan pengertian sosiometri adalah suatu teknik untuk mengumpulkan data tentang hubungan sosial seorang individu dengan individu lain, struktur hubungan individu dan arah hubungan sosialnya dalam suatu kelompok.

Macam macam Sosimetri:Tes Sosiometri ada dua macam, yaitu :1. Tes yang mengharuskan untuk memilih beberapa teman dalam kelompok sebagai pernyataan kesukaan untuk melakukan kegiatan tertentu ( criterium ) bersama sama dengan teman-teman yang dipilih.2. Tes yang mengharuskan menyatakan kesukaannya atau ketidaksukaannya terhadap teman-teman dalam kelompok pada umumnya.

Tes sosiometri jenis pertama paling sering digunakan di institusi-institusi pendidikan dengan tujuan meningkatkan jaringan hubungan sosial dalam kelompok,sedangkan jenis yang kedua jarang digunakan, dan inipun untuk mengetahui jaringan hubungan sosial pada umumnya saja.

Ciri khas penggunaan angket sosiometri:Ciri khas penggunaan angket sosiometri atau tes sosiometri , yang terikat pada situasi pergaulan sosial atau kriterium tertentu. 1. Dijelaskan kepada siswa yang tergabung dalam suatu kelompok, misalnya satuan kelas, bahwa akan dibentuk kelompok-kelompok lebih kecil (4-6 orang ) dalam rangka mengadakan kegiatan tertentu, seperti belajar kelompok dalam kelas, rekreasi bersama ke pantai, dsb. Kegiatan tertentu itu merupakan situasi pergaulan social yang menjadi dasar bagi pilihan-pilihan. 2. Setiap siswa diminta untuk menulis pada blanko yang disediakan nama beberapa teman di dalam kelompok, dengan siapa dia ingin dan lebih suka melakukan kegiatan itu. Jumlah teman yang boleh dipilih biasanya tiga orang, dalam urutan pilihan pertama, kedua, dan ketiga. Yang terungkap dalam pilihan-pilihan itu bukanlah jaringan hubungan sosial yang sekarang ini sudah ada, melainkan keinginan masing-masing siswa terhadap kegiatan-kegiatan tertentu dalam hal pembentukan kelompok. Pilihan-pilihan itu dapat berubah, bila tes sosiometri diterapkan lagi pada lain kesempatan terhadap kegiatan lain (kriterium berbeda ). Ada kemungkinan siswa akan memilih teman-teman yang lain untuk belajar bersama di kelas, dibanding dengan pilihan-pilihannya untuk pergi piknik bersama. Pilihan-pilihan siswa tidak menyatakan alasan untuk memilih, kecuali bila hal itu dinyatakan dalam tes. Pilihan-pilihan juga tidak menyatakan tentang sering tidaknya bergaul dengan teman-teman tertentu, atau intim tidaknya pergaulan dengan teman-teman tertentu; bahkan tidak mutlak terungkapkan taraf popularitas siswa tertentu, dalam arti biasanya mempunyai banyak teman, beberapa teman atau sama sekali tidak mempunyai teman. 3. Setiap siswa dalam kelompok menangkap dengan jelas kegiatan apa yang dimaksud, dan mengetahui bahwa kegiatan itu terbuka bagi semua. 4. Pilihan-pilihan dinyatakan secara rahasia dan hasil keseluruhan pemilihan juga dirahasiakan. Hal ini mencegah timbulnya rasa tidak enak pada siswa, yang tidak suka pilihannya diketahui umum atau akan mengetahui bahwa ia tidak dipilih. Ciri kerahasiaan juga memungkinkan bahwa dibentuk kelompok-kelompok kecil yang tidak seluruhnya sesuai dengan pilihan-pilihan siswa. 5. Biasanya siswa diminta untuk menyatakan siapa yang mereka pilih, bukan siapa yang tidak mereka pilih dalam urutan tidak begitu disukai, kurang disukai, tidak disukai, sama sekali tidak disukai. menyatakan pilihan yang negatif mudah dirasakan sebagai beban psikologis. 6. Tenaga kependidikan yang dapat menerapkan tes sosiometri adalah guru bidang studi, wali kelas, dan tenaga ahli bimbingan, tergantung dari kegiatan yang akan dilakukan.

Tahap-tahap Pelaksanaan Sosiometri 1. Tahap Persiapan. Menentukan kelompok siswa yang akan diselidiki. Memberikan informasi atau keterangan tentang tujuan penyelenggaraan sosiometri. Mempersiapkan angket sosiometri. 2. Tahap Pelaksanaan. Membagikan dan mengisi angket sosiometri. Mengumpulkan kembali dan memeriksa apakah angket sudah diisi dengan benar. 3. Tahap Pengolahan. Memeriksa hasil angket, Mengolah data sosiometri dengan cara menganalisa indeks, menyusun table tabulasi, membuat sosiogram.

Kegunaan Sosiometri: Sosiometri dapat dipergunakan untuk :1. Memperbaiki hubungan insani.2. Menentukan kelompok kerja3.Meneliti kemampuan memimpin seseorang individu dalam kelompok tertentu untuk suatu kegiatan tertentu.4.Mengetahui bagaimana hubungan sosial / berteman seorang individu dengan individu lainnya.5.Mencoba mengenali problem penyesuaian diri seorang individu dalam kelompok sosial tertentu. 6.Menemukan individu mana yang diterima / ditolak dalam kelompok social tertentu.

Norma-norma Sosiometri: Baik tidaknya hubungan sosial individu dengan individu lain dapat dilihat dari beberapa segi yaitu : 1. Frekwensi hubungan, yaitu sering tidaknya individu bergaul. makin sering individu bergaul, pada umumnya individu itu makin baik dalam segi hubungan sosialnya. Bagi individu yang mengisolir diri, di mana ia kurang bergaul, hal ini menunjukkan bahwa di dalam pergaulannya kurang baik. 2. Intensitas hubungan, yaitu intim tidaknya individu bergaul. Makinintim/mendalam seseorang dalam hubungan sosialnya dapat dinyatakan bahwa hubungan sosialnya makin baik. Teman intim merupakan teman akrab yang mempunyai intensitas hubungan yang mendalam. 3. Popularitas hubungan, yaitu banyak sedikitnya teman bergaul. Makin banyak teman di dalam pergaulan pada umumnya dapat dinyatakan makin baik dalam hubungan sosialnya. Faktor popularitas tersebut digunakan sebagai ukuran atau kriteria untuk melihat baik tidaknya seseorang dalam hubungan atau kontak sosialnya.

Manfaat Sosiometri:Manfaat Sosiometri dalam Bimbingan. Dengan mempelajari data sosiometri seorang konselor dapat : 1. Menemukan murid mana yang ternyata mempunyai masalah penyesuaian diri dalam kelompoknya. 2. Membantu meningkatkan partisipasi sosial diantara murid-murid dengan penerimaan sosialnya. 3. Membantu meningkatkan pemahaman dan pengertian murid terhadap masalah pergaulan yang sedang dialami oleh individu tertentu. 4. Merencanakan program yang konstruktif untuk menciptakan iklim sosial yang lebih baik dan sekaligus membantu mengatasi masalah penyesuaian di kelas tertentu. Cara untuk menciptakan suasana / iklim sosial yang baik : Membentuk kelompok belajar / kelompok kerja . Mempersatukan kelompok minoritas di dalam satu kelas. Menciptakan hubungan baik dan harmonis. Membangun perasaan berhasil dan berprestasi. Hendaknya ditanamkan rasa bahwa kalau kompak, akan berhasil baik.

RUBRIK2.1. Pengertian Penilaian RubrikRubrik merupakan panduan penilaian yang menggambarkan kriteria yang diinginkan guru dalam menilai atau memberi tingkatan dari hasil pekerjaan siswaRubrik perlu memuat daftar karakteristik yang diinginkanyang perlu ditunjukkan dalam suatu pekerjaan siswadisertai denganpanduan untuk mengevaluasi masing-masing karakteristik tersebut.Rubrik menurut beberapa pandangan para ahli adalah: MenurutArens : Rubrik adalah Deskripsi terperinci tentang tipe kinerja tertentu dan kriteria yang akan digunakan untuk menilainya MenurutBernie Dodge dan Nancy Pickett : Rubrik adalah dalah alat skoring untuk asesmen yang bersifat subjektif, yang didalamnya terdapat satu set kriteria dan standar yang berhubungan dengan tujuan pembelajaran yang akan diases ke anak didik. MenurutNitko : Rubrik adalah suatu alat yang berisi seperangkat aturan yang digunakan untuk mengases kualitas dari performansi/kinerja mahasiswa/ peserta didik . Menurut Heidi Goodrich Andrade : Rubrik adalah suatu alat penskoran yang terdiri dari daftar seperangkat kriteria atau apa yang harus dihitung. Tujuan dari penilaian rubrik yaitu siswa diharapkan secara jelas memahami dasar penilaian yang akan digunakan untuk mengukur suatu kinerja siswa. Kedua pihak (guru dan siswa) akan mempunyai pedoman bersama yang jelas tentang tuntutan kinerja yang diharapkan. Rubrik diharapkan pula dapat menjadi pendorong atau motivator bagi siswa dalam proses pembelajaran.

2.2. Fungsi Penilaian RubrikAdapun fungsiatau kegunaan dari penilaian rubrik adalah sebagai berikut : Rubrik menjelaskan deskripsi tugas Rubrikmemberikan informasi bobot penilaian Siswa memperoleh umpan balik yang cepat dan akurat Penilaian lebih objektif dan konsisten Para peserta didik jadi pembelajar aktif Para peserta didik memperoleh"content knowledge" dan "procedural knowledge". Parapeserta didik dapat menilai kinerja kelompoknya sendiri Baik pendidik maupun peserta didik memperoleh alat refleksi yang efektif tentang proses pembelajaran yang telah berlangsung. Sebagai alat atau pedoman penilaian kinerja atau hasil kerja mahasiswa.

2.3. Berbagai Variasi Penggunaan RubrikRubrik tiga sampai lima level dan rubrik panduan penilaian merupakan jenis rubrik yang sering digunakan dalam penilaian. Akan tetapi ternyata dalam kelas kelas khusus seperti lab, managemen, desain grafis dan studio seni perlu dibuat jenis rubrik yang lain, walaupun secara essensi tidak berbeda dengan rubrik yang baku.Perbedaannya terletak pada proses pengembangan dan isi rubrik dalam menetapkan kegiatan tugas, variasi ini kemudian membutuhkan sedikit format sedikit berbeda, tetapi sebenarnya tidak berbeda dari rubrik yang telah di bahas sebelumnya. Karena semua variasi dari rubrik ini menyertakan komponen dasar dari skala, dimensi, dan deskripsi dimensi yang diatur dalam sebuah table.1. Rubrik BertahapUntuk tugas yang dikerjakan bertahap rubrik ini dipakai untuk menilaia dimanaproses pembuatan tugas sama pentingnya dengan hasil akhir. Rubrik ini bisa digunakan untuk waktu lama, sehingga bisa menjadi alat monitoring siswa. Rubrik ini memberikan pengetahuan penambahan pengetahuan siswa tentang penyelesaian tugas sambil juga memberikan feedback cepat terhadap apa saja yang sudah diperolehnya sejak awal. Kelemahan dari rubrik ini yaitu tidak dapat sespesifik rubrik akhir (yang merupakan rubrik tak bertahap). Namun, rubrik bertahap ini tidak hanya menunjukkan kepada siswa tentang langkah-langkah yang sudah diselesaikan, tetapi juga langah-langkah yang harus dipenuhi.2. Rubrik Makalah RisetDigunakan biasanya untuk proyek yang perlu waktu lama. Rubrik ini memiliki kesamaan dari rubrik bertahap, karena terdapat elemen dari rubrik bertahap yang bisa diambil, akan tetapi rubrik ini juga bisa menjadi panduan siswa untuk memulai penelitian dan juga menjadi bahan refleksi mengenai apa yang harus dilakukan, semacam pengalaman.3. Rubrik RangkapRubrik ini dipakai untuk merencanakan penaksiran atau perkiaraan di bandingkan untuk menilai. Rubrik ini digunakan untuk menilai pada akhirnya dipakai sebagai alat penilan juga tugas yang kompleks. Pendekatan portofolio rangkap menyatukan semua bagian-bagian dasar dari rubrik sederhana, tetapi menciptakan rubrik-rubrik khusus untuk setiap dimensinya.

2.4. Isi Rubrik Dalam setiap komponen terdiri dari satu atau beberapa dimensi. Setiap dimensi harus didevinisikan supaya lebih jelas harus diberi contoh atau ilustrasi. Dimensi-dimensi kinerja inilah yang akan ditentukan mutunya atau diberi peringkat. Setiap kategori mutu sebaiknya diberi contoh-contoh kinerja agar mempermudah guru atau pemberi peringkat. Secara singkat scoring rubrik terdiri dari beberapa elemen, yaitu :1. Dimensi, yang akan dijadikan dasar menilai kinerja anak didik.2. Definisi dan contoh, yang merupakan penjelasan mengenai setiap dimensi3. Skala yang akan digunakan untuk menilai dimensi4. Standar untuk setiap katagori kinerja. Rubrik biasanya dibuat dalam bentuk tabel dua lajur, yaitu baris yang berisi kriteria dan kolom yang berisi mutu. Kriteria dapat dinyatakan secara garis besar. Kemudian dirinci menjadi komponen-komponen penting atau dapat pula komponen-kpmponen ditulis langsung tanpa dikelompokkan dalam garis besar.Rubrik dapat bersifat menyeluruh atau berlaku umum dan dapat juga bersifat khusus atau hanya berlaku untuk suatu topik tertentu. Rubrik yang bersifat menyeluruh dapat disajikan dalam bentukholistic rubrik. Rubrik holistik adalah pedonan untuk menilai berdasarkan kesan keseluruhan atau kombinasi semua kriteria. Serta dapat pula dalam bentukanalytic rubrik, rubrik analitik adalah pedoman untuk menilai berdasarkan beberapa kriteria yang ditentukan. dengan menggunakan rubrik ini dapat dianalisis kelemahan atau kelebihan siswa.Contoh rubrik holistik :SkorDeskripsi

4Respons terhadap tugas sangat spesifik. Informasi yang diberikan akurat dan memperlihatkan pemahaman yang utuh. Respons dikemukakan dalam suatu tulisan yang lancar dan hidup. Jawaban singkat dan langsung pada masalah yang diminta serta kesimpulan dan pendapat mengalir secara logis. Secara menyeluruh, respons lengkap dan memuaskan.

3Respons sudah menjawab tugas yang diberikan. Informasi yang diberikan akurat. Respons dikemukakan dalam tulisan yang lancar tapi uraian cenderung brtele-tele.

2Respons kurang memuaskan. Walaupun informasi yang diberikan akurat tetapi tidak ada kesimpulan dan pendapat serta kurang logis.

1Respons tidak menjawab tugas yang diberikan. Banyak informasi yang hilang dan tidak akurat. Tidak ada kesimpulan atau pendapat.

Contoh rubrik analitik :SkorGrafikSpesifikasiRasional

4Gambar dan pertelaan tentang grafik yang disajikan benarSemua spesifikasi yang diberikan benarRasio yang diberikan jelas.

3Sebagian terbesar gambar dan pertelaan yang diberikan benarSemua spesifikasi yang diberikan benarPenjelasan diberikan, tetapi msih membutuhkan hambatan

2Beberapa gambar dan pertelaan yang disaji benarHanya sebagian spesifikasi yang benarRasional yang diberikan tidak lengkap

1Gambar dan pertelaan yang diberikan sangat terbatas dan hanya sedikit yang benarSpesifikasi yang diberikan salahRasional yang diberikan tidak benar

2.5. Macam-Macam Penilaian Rubrik Jangkar Penampilan : Konsisten dan fokusMenandai salah satu tugas dari sekian tumpukan tugas yang banyak sebagai salah satu cara untuk fokus pada pekerjaannya. Beberapa orang menggunakan trik dengan menempelkan permen karet pada setiap satu tugas yang telah diselesaikan dari sekian jumlah tugas-tugas yang telah disusun (ditumpuk). Melalui rubrik kita bisa memfokuskan perhatian pada tugas yang kita pikirkan sebagai tugas terbaik atau terburuk. Menyokong Feed back yang detail dan formatifDengan rubrik kita bias melakukan pekerjaan lebih cepat karena tidak perlu menuliskan catatan-catatan ekstensif pada setiap makalah tugas. Karena hanya dengan mencentang atau membuat lingkaran pada rubrik, atau menuliskan satu atau dua kata pada rubrik panduan penilaian.Kunci dari penilaian rubrik adalah cek, lingkaran dan kata-kata terpilih, memudahkan dan mempercepat proses penilaian sambil tetap memberikan feedback yang detail dan formatif. Pilahan pilhan itu tergantung jenis rubrik yang dipakai, seperti :a. Rubrik tiga sampai lima level menggunakan kotak untuk dicentengb. Rubrik tiga sampai lima level menggunakan lingkaran pada teks (lingkaran)c. Rubrik panduan penilaian untuk feedback naratif.Rubrik tiga sampai lima level menggunakan kotak untuk dicenteng dalam proses pembuatannya membutuhkan waktu yang banyak, tetapi membutuhkan waktu sedikit dalam penggunaannya.Rubrik tiga sampai lima level menggunakan kotak untuk dicenteng merupakan rubrik yang dianggap paling tepat untuk menilai Sesutu yang membutuhkan feedback detail dan kecepatan presentasi oral. Rubrik tiga sampai lima level sangat menghemat waktu dalam penilaiannya. Feedback yang fleksibel dan individual (rubrik panduan penilaian)Rubrik dengan skala level tiga sampai lima level baik yang dicentang atau dilingkari ketika memberikan penilaian mampu melakukan penghematan waktu dan ketika memberikan feedback kepada siswa dan kaya akan informasi. Rubrik tiga samapai lima level memudahkan penggunaanya tetapi susah pembuatannya. Hal ini berbeda dengan rubrik panduan penilaian. Rubrik panduan penilaian mudah dalam pembuatannya tetapi lebih lama dalam melakukan penilaian aktual terhadap siswa.Akan tetapi rubrik panduan penilaian pada prakteknya ternyata terkadang lebih menghemat waktu, selain itu rubrik panduan penilaian memiliki manfaat ganda, yaitu individualisasi dan fleksibelitas yang lebih besar dalam penilaian.Rubrik panduan penilaian dapat digunakan untuk menilai kegiatan siswa dimana siswa bebas berkreasi dalam melaksanakan tugas-tugasnya. Dalam rubrik panduan penilaian dimungkinkan adanya catatan-catatan terhadap karya siswa pada rubrik. Catatan itu merupakan komentar terhadap kriteria (level) kemampuan siswa dalam berbagai dimensi. Menampilkan feedback sumatif : Menetapkan Nilai.Apabila pada masing masing dimensi pada rubrik telah ditetapkan, maka penyimpulan dapat menjadi latihan matematis. Setiap dimensi dalam rubrik diberi nilai sebagai point, dan siswa dinilai dari seberapa banyak mereka menempuh point-point yang terdapat dalam rubrik. Menilai metode pengajaran sendiriSelain digunakan untuk menilai siswa, rubrik juga bisa digunakan untuk menilai diri sendiri, untuk feedback pribadi. Kita bisa melihat pekerjaan siswa untuk mengukur hasil pekerjaan diri sendiri.

2.6. Langkah Pengembangan RubrikDalam pengembangan rubrik, perlu diperhatikan beberapa langkah. Donna Szpyrka dan Ellyn B. Smith (1995) menyebutkan bahwa langkah-langkah pengembangan rubrik adalah sebagai berikut :1. Menentukan konsep, keterampilan atau kinerja yang akan diasesmen.2. Merumuskan atau mendefinisikan dan menentukan urutankonsep atau keterampilan yang akan diasesmen ke dalam rumusan atau definisi yang menggambarkan aspek kognitif dan aspek kinerja.3. Menentukan konsep atau keterampilan yang terpenting dalam tugas yang harus diasesmen.4. Menentukan skala yang akan diasesmen.5. Mendeskripsikan kinerja mulai dari yang diharapkan sampai dengan kinerja yang tidak diharapkan (secara gradual). Deskripsi konsep atau keterampilan kinerja tersebut dapat diikuti dengan memberikan angka pada setiap gradasi atau member deskripsi gradasi.6. Melakukan uji coba dengan membandingkan kinerja atau hasil kerja dengan rubrik yang telah dikembangkan.7. Berdasarkan hasil penilaian terhadap kinerja atau hasil kerja dari uji coba tersebut kemudian dilakukan revisi terhadap deskripsi kinerja maupunkonsep dan keterampilan yang akan diasesmen.8. Memmikirkan kembali tentang skala yang digunakan.9. Merevisi skala yang digunakan.

Walaupun suatu rubrik telah diupayakan untuk disusun dengan sebaik-baiknya tetapi harus disadari bahwa tidak mungkin rubrik yang tersusun itu merupakan sesuatu yang sempurna atau dianggap sebagai satu-satunya kriteria untuk menialai kinerja siswa dalam satu kegiatan.2.7. Contoh Rubrik PenilaianContoh rubrik penilaian presentasi:Nama kelompok : Newton IWaktu presentasi : Selasa, 15 Mei 2013Materi : Rangkaian Listrik ( Seri dan Paralel)Anggota : Agustina Sukamto, Ghia Sartika, Hadist Hasanah, No. Kriteria penilaianKurang20 39Cukup40 59Baik60 79Sangat baik80 98

1. Penguasaan materi80

2. Alat peraga & power point95

3. Kekompakan/pembagian kerja79

4. Penyampaian92

Kelompok penilai : Newton IIAnggota : Bagas Adhika Putra Fiki AdwantikaHilmi AzizTotal nilai :346Rata-rata : 86, 5 ( sangat baik )

Contoh rubrik penilaian:Standar Kompetensi : Memahami berbagai sifat dalam perubahan fisika dan kimia.Kompetensi Dasar : Menyimpulkan perubahan fisika dan kimia berdasarkan hasil percobaan sederhana.Indikator : 1. Membuat kesimpulan dari hasil percobaan perubahan fisika dan perubahan kimia.2. Membandingkan karakteristik perubahan fisika dan perubahan kimia berdasarkan percobaan.Tujuan Pembelajaran : Peserta didik dapat:1. Menjelaskan sebab-sebab terjadinya perubahan fisika dan kimia.2. Menyebutkan ciri-ciri perubahan fisika dan perubahan kimia.3. Mengamati beberapa peristiwa yang menunjukkan perubahan fisika dan perubahan kimia.4. Menyebutkan perubahan fisika dan kimia dalam kehidupan sehari-hari.

Tugas : 1. Produk Peserta didik dapat menjawab pengertian perubahan fisika dan kimia serta menyebutkan beberapa contohnya. Peserta didik dapat mengetahui sebab-sebab terjadinya perubahan fisika (pelepasan dan pengambilan panas, pencampuran zat; selama zat-zat yang bercampur tidak membentuk zat baru dan di potong atau dibelah) melalui diskusi kelas. Peserta didik dapat mengetahui sebab-sebab terjadinya peruba-han kimia ( pembakaran, pencampuran zat) melalui diskusi kelas.2. Kinerja Peserta didik diminta melakukan percobaan sederhana perubahan fisika dengan menggunakan es batu, air, gelas kimia, gula, teh dan pengaduk. Peserta didik secara berkelompok melakukan eksperimen perubahan fisika dengan menggunakan kertas putih dan korek api.

Rubrik Laporan Percobaan:NoAspekSkorKeterangan

1Judul percobaan0Judul percobaan tidak ditulis.

1Judul percobaan ditulis tetapi tidak tepat/sesuai dengan tema praktikum.

2Judul percobaan ditulis dan tepat.

2Tujuan percobaan2Ditulis seperti pada petunjuk praktikum.

2Tujuan ditulis dalam bentuk ABCD (audience, behaviour, condition, and degree)

3Rumusan masalah0Rumusan masalah tidak ditulis.

2Rumusan masalah ditulis tetapi tidak mengarah pada hubungan variabel manipulasi dan respon.

5Rumusan masalah ditulis dan mengarah pada hubungan variabel manipulasi dan respon.

4Dasar teori5Memuat teori tetapi kurang relevan dengan meteri praktikum asam-basa.

10Memuat secara singkat teori yang relevan dengan meteri praktikum.

15Memuat secara lengkap teori yang relevan dengan meteri praktikum.

5Alat dan bahan2Alat dan bahan ditulis namun tidak disertai dengan jumlah.

5Alat dan bahan ditulis lengkap disertai dengan jumlah dan ukuran.

6Prosedur kerja1Ditulis seperti petunjuk pada praktikum (menggunakan kata perintah).

2Ditulis dengan menggunakan kata kerja bukan kata perintah).

5Ditulis lengkap tanpa alur kerja.

10Ditulis lengkap beserta alur kerja.

7Data pengamatan5Data yang ditulis hanya kondisi sesudah perlakuan (setelah diberi indikator alami).

7Data yang ditulis mencakup kondisi sebelum dan sesudah perlakuan.

8Diskusi dan pembahasan10Membahas hasil pengamatan tanpa menghubungkan dengan dasar teori.

20Mengubungkan hasil pengamatan dengan dasar teori namun tidak lengkap.

25Menghubungkan hasil pengamatan dengan dasar teori dan dilengkapi dengan bagan serta paragraf yang mengarah pada simpulan.

9Simpulan5Simpulan sesuai dengan hasil praktikum tetapi tidak mengarah pada tujuan praktikum.

10Simpulan sesuai dengan hasil praktikum dan mengarah pada tujuan praktikum.

10Daftar pustaka2Tidak semua sumber pustaka ditulis.

3Semua sumber pustaka ditulis namun ada satu atau lebih sumber pustaka yang tata tulisannya kurang benar.

5Semua sumber pustaka ditulis dan susunannya benar.

11Jawaban petanyaan5Semua pertanyaan yang ada dijawab dengan benar.

12Laporan sementara0Laporan sementara tidak dilampirkan.

5Laporan sementara dilampirkan.

13lampiran0Lampiran foto praktikum (sebelum dan sesudah praktikum) tidak dilampirkan.

3Lampiran foto praktikum dilampirkan.

14Ketepatan waktu mengumpulkan laporan0Laporan menyerahkannya lebih dari satu minggu terlambat

1Sampai satu minggu terlambat

3Sampai dengan dua hari terlambat

5Menyerahkan laporan tepat waktu

ANALISIS BUTIR SOAL

2.1 Pengertian Analisis dan Macam- macamnyaAnalisis soal dilakukan untuk mengetahui berfungsi tidaknya soal. Analisis bertujuan untuk mengadakan identifikasi soal- soal yang baik, kurang baik, dan soal yang jelek. Dengan analisis soal, dapat diperoleh informasi tentang kejelekan sebuah soal dan petunjuk untuk mengadakan perbaikan. Analisis pada umumnya dilakukan melalui dua cara, yaitu Analisis Kualitatif (Qualitatif Control) dan Analisis Kuantitatif (Quantitatif Control). Analisis kualitatif sering pula dinamakan sebagai Validitas Logis yang dilakukan sebelum soal, digunakan untuk melihat berfungsi tidaknya sebuah soal. Analisis soal secara kuantitatif sering pula dinamakan sebagai Validitas Empiris yang dilakukn untuk melihat lebih berfungsi tidaknya sebuah soal, setelah itu soal diujicobakan kepada sampel yang representative. 1. Analisis KualitatifAnalisis kualitatif sering juga disebut sebagai validitas logis yaitu berupa penelaahan yang dimaksudkan untuk menganalisis soal ditinjau dari segi teknis, isi, dan editoral. Analisis secara teknis dimaksudkan sebagai penelaahan soal berdasarkan prinsip- prinsip pengukurandan format penulisan soal. Analisis secara isi dimaksudkan sebagai penelaahan khusus yang berkaitan denan kelayakan pengetahuan yang ditanyakan. Analisis secara editoral dimaksudkan sebagai penelaahan yang khususnya berkaitan dengan keseluruhan format dan keajegan editoral dari soal yang satu ke soal yang lainnya. Analisis kulitatif lainnya dapa juga dikategorikan dari segi materi, konstruksi, dan bahasa. Analisis materi berkaitan dengan substansi keilmuan yang ditanyakan dalam soal serta tingkat kemampuan yang sesuai dengan soal. Analisis konstruksi umumnya berkaitan dengan teknik penulisan soal. Analisis bahasa berkaitan dengan pengunaan bahasa yang baik dan benar menurut ejaan yang sesuai. Berikut contoh analisis soal kualitatif: Contoh soal pilihan ganda yang kurang baikSeorang anak melakukan perhitungan bilangan pecahan . berapakah hasilnya?a) 3b) 2c) 1d) Apabila kita telaah secara kualitatif, sepintas dapat kita nyatakan bahwa soal tersebut kurang bak. Ada beberapa hal yang harus diperbaiki. Pertama, pokok soal bertele-tele dan tidak jelas. Kedua, alternative jawaban a, b, dan c bukan merupakan alternative yang baik. Sebab, angka- angka tersebut tidak sepadan dengan pilihan yang lainnya. Contoh soal essay yang kurang baikSeorang pedagang buah- buahan setiap harinya dari pagi, petang, dan sampai malam hari dapat menjual 15kg buah- buahan alpukat, 10kg buah- buahan apel, dan 10kg buah- buahan belimbing. Ia bekarja keras untuk dapat menjual buah- buahan tersebut. Sebutkanlah berapa banyak buah- buahan yang pedagang itu dapat menjualnya selama ia bekerja suntuk selama 30 hari?Sepintas bahasa yang digunakan dalam contoh soal uraian diatas kurang baik, bertele-tele,dan tidak tegas. Siswa akan mengalami kesulitan dalam menyelesaikan soal. Analisis kualitatif dapat dilakukan dengan menghilangkan beberapa kata yang tidak diperlukan. 2. Analisis KuantitatifUntuk memperoleh informasi tentang soal tes, maupun peserta tes, perlu dilakukan analisis kuantitatif. Hasil analisis dimaksudkan untuk mengetahui sejauh mana soal dapat membedakan antara peserta tes yang kemampuannya tinggi dalam hal yang didefinisikan oleh kriteria dengan peserta tes yang kemampuannya rendah. Informasi lainnya adalah bagaimana soal dapat membedakan antara individu maupun antar kelompok. Analisis soal secara kuantitaif menekankan pada analisis karakteristik internal tes melalui data yang diperoleh secara empiris. Karakteristik internal secara kuantitatif dimaksudkan meliputi parameter soal tingkat kesukaran, daya pembeda, dan reliabilitas. Salah satu tujuan dilakukannya analisis adalah untuk meningkatkan kualitas soal, yaitu apakah suatu soal dapat:1) Diterima karena telah didukung oleh data statistic yang memadai2) Diperbaiki, karena terbukti terdapat beberapa kelemahan3) Tidak digunakan sama sekali, karena terbukti secara empiris tidak berfungsi sama sekali

[footnoteRef:2]2.2 Langkah Analisis Butir Soal [2: ]

Dalam analisis butir soal perlu langkah persiapan yang harus dilakukan. Adapun langkah yang dimaksud adalah sebagai berikut :1. Mengurutkan skor pada lembar jawaban peserta didik dari skor yang tertinggi berturut-turut sampai yang terbawah.2. Mengambil sebanyak 27,5% dari jumlah peserta didik dari skor yang tertinggi dan 27,5% dari skor yang terendah. Kelompok pertama disebut kelompok tinggi (kelompok peserta didik yang nilainya tinggi), sedangkan yang kedua disebut kelompok rendah, dan sisanya sebagai kelompok tengah. Pembagian menjadi tiga kelompok tersebut terutama disarankan jika jumlah peserta didik cukup besar sehingga kalau dilakukanseluruhnya akan memakan waktu yang lama. Namun, jika jumlah lembar jawaban pesertadidik relatif sedikit, cukup dibedakan menjadi kelompok tinggi dan kelompok rendah saja.Gambar berikut menjelaskan hal yang dimaksud. 27,5% (kelompok tinggi) 27,5% (kelompok tengah)

27,5% (kelompok rendah)

3. Menganalis jawaban benar atau salah per butir soal per peserta didik. Analisis ini hanya dilakukan terhadap jawaban peseta didik kelomok tinggi dan kelompok rendah, sedangkan kelompok tengah ditinggalkan. Berdasarkan analisis atau identifikasi ini akan dapat dihitung indek masing-masing butir soal. Berikut contoh analisis jawaban yang dimaksud. Ingat, jawaban betul berskor 1 dan salah 0.

Analisis Butir soal kelompok tinggi dan kelompok rendah. Kelompok TinggiNomor Tes Urut PesertaNomor Butir SoalJumlah Skor

12345678...40

111101111...136

211011111...134

311110111...130

410110110...130

501111011...028

611111010...128

Jumlah55534464...5

Kelompok RendahNomor Tes Urut Peserta Nomor Butir SoalJumlah Skor

12345678...40

111010011...120

200111011...019

301100101...119

411100110...018

501001110...016

600011011...115

Jumlah24333354...3

Berdasarkan data anka-angka jumlah jawaban benar kelompok tinggi dan kelompok rendah sebagaimana yang terlihat pada tabel diatas maka dapat dilakukan perhitungan indeks tingkat kesulitan dan indeks daya beda secara manual. Sebenarnya, perhitungan kedua hal tersebut dapat dilakukan cepat, sedang yang memakan waktu adalah analisis jawaban diatas.

2.3 Kreteria Tes yang BaikSebuah tes yang dapat dikatakan baik sebagai alat pengukur harus memenuhi tes, yaitu :a. ValiditasValiditas merupakan sebuah kata benda, sedangkan valid merupakan kata sifat. Sebuah tes dapat dikatakan valid apabilates itu dapat tepat mengukur apa yang hendah di ukur.Jika data yang dihasilkan dari debuah instrumen valid, maka dapat dikatakan bahwainstrumen tersebut valid, karena dapat memberikan gambaran tentang data secara benar sesuai dengan kenyataan atau keadaan sesungguhnya. Dari sedikit uraian dan contoh tersebut dapat di simpulkan bahawa : jika data yang dihasilkan oleh instrumen benar dan valid, sesuai kenyataan, maka instrumen yang digunakan tersebut juga valid.Validitas tes dapat diketahui dari hasil pemikiran (validitas logis) dan dari hasil pengalaman (validitas empiris)

b. ReliabilitasReliabilitas berasal dari kata reliable yang artinya dapat dipercaya. Suatu tes dapat dikatakan mempunyai taraf kepercayaan yang tinggi jika tes tersebut dapat memberikan hasil yang tetap. Maka pengertian reliabilitas tes, berhubungan dengan masalah ketetapan hasil tes. Atau seandainya hasilnya berubah-ubah perubahan yang terjadi dapat dikatakan tidak berarti.Jika validitas terkait dengan ketepatan objek yang tidak lain adlah tidak menyimpangnya data dari kenyataan, artinya bahwa data tersebut benar, maka konsep reliabilitas terkain dengan pemotretan berkali-kali. Instrumen yang baik adalah instrumen yang dapat dengan ajeg memberikan data yang sesuai denagn kenyataan.sehubungan dengan reliabilitas ini, Scarvia B. Anderson dan kawan-kawan menyatakan bahwa persyaratan bagi tes, yaitu validitas dan reliabilitas ini penting. Dalam hal ini validitas itu penting, dan reliabilitas ini perlu karena menyokong terbentuknya validitas.

c. ObjektivitasObjektif berarti tidak adanya unsur pribadi yang mempengaruhi. Sebuah tes dikatakan memiliki objektivitas apabila dalam melaksanakan tes itu tidak ada faktor subjektif yang mempengaruhi. Hal ini terutama terjadi pada sistem skoringnya. Ada 2 faktor ayng mempengaruhi subjektivitas dari sesuatu tes yaitu :1. Bentuk tesTes yang berbentuk uraian, akan memberi banyak kemungkianan kepada si penilai untuk memeberiakn peniliaian menurut caranya sendiri. Untuk menghindarai masuknya subjektivitas dari penilai, maka sistem skoringngnya dapat dilakukan dengan cara sebaik-baiknya, antara lain dengan membuat pedoman skoring terlebih dahuli.

2. PenilaiUntuk menghindari atau mengurangi masuknya unsur subjektivitas dalam pekerjaan penilaian , maka penilaian atau evaluasi ini harus dilaksanakan dengan mengingat pedoman. Pedoman yang dimaksud, terutama menyangkut masalah pengadministrasian yaitu kontinuitas dan komperhensivitas

d. PraktikabilitasSebuah tes dapat dikatakan memiliki praktikabilitas yang tinggi apabila tes tersebut bersifat praktis, mudah pengadministrasiannya.Tes yang praktis adalah tes yang :1. Mudah dilaksanakan, misalnya tidak menuntut peralatan yang banyak dan dan memeberi kebebasan kepada siswa untuk mengerjakan terlebih dahulu bagian yang di anggap mudah bagi siswa.2. Mudah pemeriksaannya, artinya tes itu dilengkapi denagn kunci jawaban maupun pedoman skoringnya. 3. Dilengkapi dengan petunjuk-prtunjuk yang jelas sehingga dapat diberikan/diawali oleh orang lain.

e. EkonomisYang dimaksud dengan ekonomis disini adalah bahwa pelaksanaan tes tersebut tidak membutuhkan ongkos/biaya yang mahal, tenaga yang banyak, dan waktu yang lama.2.4 Langkah-Langkah dalam Penyusunan TesTentu saja setiap guru akan dengan mudah mengatakan bagian pelajaran mana yang akan di cakup dalam sebuah tes jika sudah diketahui tujuanya.Urutan langkah yang dilakukan adalah: Menentukan tujuan mengadakan tes. Mengadakan pembatasan terhadap bahan yang akan diteskan. Merumuskan tujuan intruksional khusus dari tiap bagian bahan. Menderetkan semua TIK dalam tabel persiapan yang memuat pula aspek tingkah laku terkandug dalam TIK itu. Tabel ini digunakan untuk mengadakan identifikasi terhadap tingkah laku yang dikehendaki, agar tidak terlewati.Contoh :Tabel TIK dan aspek tingkah laku yang dicakup

NoTIK Aspek Tingkah LakuIngatanPemahamanAplikasiKeterangan

1Ssiswa dapat menjumlah 2 bilangan bersusun.

2Siswa dapat merangkum hukum komulatif dan seterusnya

Menyusun tabel spesifikasi yang memuat pokok materi, aspek berpikir yang diukur beserta imbangan antara kedua hal tersebut. Menuliskan butir-butir soal, didasarkan atas TIK-TIK yang sudah di tuliskan pada tabel TIK dan aspek tingkah laku yang dicakup.

VALIDITAS

2.1.1 Pengertian Validitas Menurut Gronlund dan Linn (1990): Validitas adalah ketepatan interpretasi yang dibuat dari hasil pengukuran atau evaluasi Menurut Anastasi (1990): Validitas adalah ketepatan mengukur konstruk, menyangkut; What the test measure and how well it does Menurut Arikunto (1995): Validitas adalah keadaan yang menggambarkan tingkat instrumen bersangkutan yang mampu mengukur apa yang akan diukur. Menurut Sukadji (2000): Validitas adalah derajat yang menyatakan suatu tes mengukur apa yang seharusnya diukur. Menurut Azwar (1986):Validitas adalah sejauh mana ketepatan dan kecermatan suatu alat ukur dalam melakukan fungsinya.Validitas adalah suatu ukuran yang menunjukan tingkat kevalidan atau kesahihan suatu instrumen. Prinsif validitas adalah pengukuran atau pengamatan yang berarti prinsif keandalan instrumen dalam mengumpulkan data. Instrumen harus dapat mengukur apa yang seharusnya diukur. Jadi validitas lebih menekankan pada alat pengukuran atau pengamatan.Suatu skala atau instrumen pengukur dapat dikatakan mempunyai validitas yang tinggi apabila instrumen tersebut menjalankan fungsi ukurnya, atau memberikan hasil ukur yang sesuai dengan maksud dilakukannya pengukuran tersebut. Sedangkan tes yang memiliki validitas rendah akan menghasilkan data yang tidak relevan dengan tujuan pengukuran. Terkandung di sini pengertian bahwa ketepatan pada validitas suatu alat ukur tergantung pada kemampuan alat ukur tersebut mencapai tujuan pengukuran yang dikehendaki dengan tepat. Suatu tes yang dimaksudkan untuk mengukur variabel A dan kemudian memberikan hasil pengukuran mengenai variabel A, dikatakan sebagai alat ukur yang memiliki validitas tinggi. Suatu tes yang dimaksudkan mengukur variabel A akan tetapi menghasilkan data mengenai variabel A' atau bahkan B, dikatakan sebagai alat ukur yang memiliki validitas rendah untuk mengukur variabel A dan tinggi validitasnya untuk mengukur variabel A' atau B (Azwar 1986).Sisi lain dari pengertian validitas adalah aspek kecermatan pengukuran. Suatu alat ukur yang valid tidak hanya mampu menghasilkan data yang tepat akan tetapi juga harus memberikan gambaran yang cermat mengenai data tersebut.Cermat berarti bahwa pengukuran itu dapat memberikan gambaran mengenai perbedaan yang sekecil-kecilnya di antara subjek yang satu dengan yang lain. Sebagai contoh, dalam bidang pengukuran aspek fisik, bila kita hendak mengetahui berat sebuah cincin emas maka kita harus menggunakan alat penimbang berat emas agar hasil penimbangannnya valid, yaitu tepat dan cermat. Sebuah alat penimbang badan memang mengukur berat, akan tetapi tidaklah cukup cermat guna menimbang berat cincin emas karena perbedaan berat yang sangat kecil pada berat emas itu tidak akan terlihat pada alat ukur berat badan.Demikian pula kita ingin mengetahui waktu tempuh yang diperlukan dalam perjalanan dari satu kota ke kota lainnya, maka sebuah jam tangan biasa adalah cukup cermat dan karenanya akan menghasikan pengukuran waktu yang valid. Akan tetapi, jam tangan yang sama tentu tidak dapat memberikan hasil ukur yang valid mengenai waktu yang diperlukan seorang atlit pelari cepat dalam menempuh jarak 100 meter dikarenakan dalam hal itu diperlukan alat ukur yang dapat memberikan perbedaan satuan waktu terkecil sampai kepada pecahan detik yaitu stopwatch. Menggunakan alat ukur yang dimaksudkan untuk mengukur suatu aspek tertentu akan tetapi tidak dapat memberikan hasil ukur yang cermat dan teliti akan menimbulkan kesalahan atau eror. Alat ukur yang valid akan memiliki tingkat kesalahan yang kecil sehingga angka yang dihasilkannya dapat dipercaya sebagai angka yang sebenarnya atau angka yang mendekati keadaan sebenarnya (Azwar 1986).Pengertian validitas juga sangat erat berkaitan dengan tujuan pengukuran. Oleh karena itu, tidak ada validitas yang berlaku umum untuk semua tujuan pengukuran. Suatu alat ukur biasanya hanya merupakan ukuran yang valid untuk satu tujuan yang spesifik. Dengan demikian, anggapan valid seperti dinyatakan dalam "alat ukur ini valid" adalah kurang lengkap. Pernyataan valid tersebut harus diikuti oleh keterangan yang menunjuk kepada tujuan (yaitu valid untuk mengukur apa), serta valid bagi kelompok subjek yang mana?2.1.2 Pengertian Uji ValiditasMenurut Sugiyono (2006)Uji validitas adalah suatu langkah pengujian yang dilakukan terhadap isi (content) dari suatu instrumen, dengan tujuan untuk mengukur ketepatan instrumen yang digunakan dalam suatu penelitian2.1.3 Tujuan uji validitasMengetahui sejauh mana ketepatan dan kecermatan suatu instrumen pengukuran dalam melakukan fungsi ukurnya.Agar data yang diperoleh bisa relevan/sesuai dengan tujuan diadakannya pengukuran tersebut.2.1.4 Cara menentukan vadilitas Untuk menguji validitas setiap butir soal maka skor-skor yang ada pada butir yang dimaksud dikorelasikan dengan skor totalnya. Skor tiap butir soal dinyatakan skor X dan skor total dinyatakan sebagai skor Y, dengan diperolehnya indeks validitas setiap butir soal, dapat diketahui butir-butir soal manakah yang memenuhi syarat dilihat dari indeks validitasnya (Arikunto, 1999: 78)Untuk menguji validitas instrumen digunakan rumus korelasi product moment dengan angka kasar, yaitu:

dengan rxy merupakan koefisien korelasi antara variabel X dan variabel Y, N merupakan jumlah siswa uji coba, X adalah skor-skor tiap butir soal untuk setiap individu atau siswa uji coba, dan Y adalah skor total tiap siswa uji coba. Untuk menginterpretasikan tingkat validitas, maka koefisien kolerasi dikategorikan pada kriteria sebagai berikut:

Setelah harga koefisien validitas tiap butir soal diperoleh, perlu dilakukan uji signifikansi untuk mengukur keberartian koefisien korelasi berdasarkan distribusi kurva normal dengan menggunakan statistik uji-t dengan persamaan:

dengan: t merupakan nilai hitung koefisien validitas, rxy adalah nilai koefisien korelasi tiap butir soal, dan N adalah jumlah siswa uji coba.Kemudian hasil diatas dibandingkan dengan nilai t dari tabel pada taraf kepercayaan 95% dan derajat kebebasan (dk) = N2. Jika thitung > ttabel maka koefisien validitas butir soal pada taraf signifikansi yang dipakai.2.1.5 Konsep Pengukuran Validitas Pengukuran validitas sebenarnya dilakukan untuk mengetahui seberapa besar (dalam arti kuantitatif) suatu aspek psikologis terdapat dalam diri seseorang, yang dinyatakan oleh skor pada instrumen pengukur yang bersangkutan.Dalam hal pengukuran ilmu sosial, validitas yang ideal tidaklah mudah untuk dapat dicapai. Pengukuran aspek-aspek psikologis dan sosial mengandung lebih banyak sumber kesalahan (error) daripada pengukuran aspek fisik. Kita tidak pernah dapat yakin bahwa validitas instrinsik telah terpenuhi dikarenakan kita tidak dapat membuktikannya secara empiris dengan langsung.Pengertian validitas alat ukur tidaklah berlaku umum untuk semua tujuan ukur. Suatu alat ukur menghasilkan ukuran yang valid hanya bagi satu tujuan ukur tertentu saja. Tidak ada alat ukur yang dapat menghasilkan ukuran yang valid bagi berbagai tujuan ukur. Oleh karena itu, pernyataan seperti "alat ukur ini valid" belumlah lengkap apabila tidak diikuti oleh keterangan yang menunjukkan kepada tujuannya, yaitu valid untuk apa dan valid bagi siapa. Itulah yang ditekankan oleh Cronbach (dalam Azwar 1986) bahwa dalam proses validasi sebenarnya kita tidak bertujuan untuk melakukan validasi alat ukur akan tetapi melakukan validasi terhadap interpretasi data yang diperoleh oleh prosedur tertentu.Dengan demikian, walaupun kita terbiasa melekatkan predikat valid bagi suatu alat ukur akan tetapi hendaklah selalu kita pahami bahwa sebenarnya validitas menyangkut masalah hasil ukur bukan masalah alat ukurnya sendiri. Sebutan validitas alat ukur hendaklah diartikan sebagi validitas hasil pengukuran yang diperoleh oleh alat ukur tersebut.2.1.6 Macam-macam validitas

Menurut Djaali dan Pudji (2008) validitas dibagi menjadi 3 yaitu:

a. Validitas isi (content validity)Validitas isi suatu tes mempermasalahkan seberapa jauh suatu tes mengukur tingkat penguasaan terhadap isi suatu materi tertentu yang seharusnya dikuasai sesuai dengan tujuan pengajaran. Dengan kata lain, tes yang mempunyai validitas isi yang baik ialah tes yang benar-benar mengukur penguasaan materi yang seharusnya dikuasai sesuai dengan konten pengajaran yang tercantum dalam Garis-Garis Besar Program Pengajaran (GBPP).Menurut Gregory (2000) validitas isi menunjukkan sejauhmana pertanyaan, tugas atau butir dalam suatu tes atau instrumen mampu mewakili secara keseluruhan dan proporsional perilaku sampel yang dikenai tes tersebut. Artinya tes mencerminkan keseluruhan konten atau materi yang diujikan atau yang seharusnya dikuasai secara proporsional.Untuk mengetahui apakah tes itu valid atau tidak harus dilakukan melalui penelaahan kisi-kisi tes untuk memastikan bahwa soal-soal tes itu sudah mewakili atau mencerminkan keseluruhan konten atau materi yang seharusnya dikuasai secara proporsional. Oleh karena itu, validitas isi suatu tes tidak memiliki besaran tertentu yang dihitung secara statistika, tetapi dipahami bahwa tes itu sudah valid berdasarkan telaah kisi-kisi tes. Oleh karena itu, wiersma dan Jurs dalam Djaali dan Pudji (2008) menyatakan bahwa validitas isi sebenarnya mendasarkan pada analisis logika, jadi tidak merupakan suatu koefisien validitas yang dihitung secara statistika.Untuk memperbaiki validitas suatu tes, maka isi suatu tes harus diusahakan agar mencakup semua pokok atau sub-pokok bahasan yang hendak diukur. Kriteria untuk menentukan proporsi masing-masing pokok atau sub pokok bahasan yang tercakup dalam suatu tes ialah berdasarkan banyaknya isi (materi) masing-masing pokok atau sub-pokok bahasan seperti tercantum dalam kurikulum atau Garis-Garis Besar Program Pengajaran(GBPP).Selain itu, penentuan proporsi tersebut dapat pula didasarkan pendapat (judgement) para ahli dalam bidang yang bersangkutan. Jadi situasi tes akan mempunyai validitas isi yang baik jika tes tersebut terdiri dari item-item yang mewakili semua materi yang hendak diukur. Salah satu cara yang biasa digunakan untuk memperbaiki validitas isi suatu tes ialah dengan menggunakan blue-print untuk menentukan kisi-kisi tes.b. Validitas Konstruk (Construct validity)Menurut Djaali dan Pudji (2008) validitas konstruk adalah validitas yang mempermasalahkan seberapa jauh item-item tes mampu mengukur apa-apa yang benar-benar hendak diukur sesuai dengan konsep khusus atau definisi konseptual yang telah ditetapkan.Validitas konstruk biasa digunakan untuk instrumen-instrumen yang dimaksudkan mengukur variabel-variabel konsep, baik yang sifatnya performansi tipikal seperti instrumen untuk mengukur sikap, minat, konsep diri, lokus control, gaya kepemimpinan, motivasi berprestasi, dan lain-lain, maupun yang sifatnya performansi maksimum seperti instrumen untuk mengukur bakat (tes bakat), intelegensi (kecerdasan intelekual), kecerdasan emosional dan lain-lain.Untuk menentukan validitas konstruk suatu instrumen harus dilakukan proses penelaahan teoritis dari suatu konsep dari variabel yang hendak diukur, mulai dari perumusan konstruk, penentuan dimensi dan indikator, sampai kepada penjabaran dan penulisan butir-butir item instrumen. Perumusan konstruk harus dilakukan berdasarkan sintesis dari teori-teori mengenai konsep variabel yang hendak diukur melalui proses analisis dan komparasi yang logik dan cermat.Menyimak proses telaah teoritis seperti telah dikemukakan, maka proses validasi konstruk sebuah instrumen harus dilakukan melalui penelaahan atau justifikasi pakar atau melalui penilaian sekelompok panel yang terdiri dari orang-orang yang menguasai substansi atau konten dari variabel yang hendak diukur.Contoh Format Penelaahan Butir Soal Bentuk UraianMata Pelajaran :..Kelas/Semester :..Penelaah :..Petunjuk pengisian format penelaahan butir soal bentuk uraian:Analisislah setiap butir soal berdasarkan semua kriteria yang tertera di dalam format!Berilah tanda cek ( ) pada kolom ya bila soal yang ditelaah sudah sesuai dengan kriteriaBerilah tanda cek ( ) pada kolom tidak bila soal yang ditelaah tidak sesuai dengan kriteria, kemudian tuliskan alasan pada ruang catatan atau pada teks soal dan perbaikannya.No.Aspek yang DitelaahNomor Soal

123

YaTidakYaTidakYaTidak

A1234B5678C910111213MateriSoal sesuai dengan indikator (menuntut tes tertulis untuk bentuk uraian)Batasan pertanyaan dan jawaban yang diharapkan sudah sesuaiMateri yang ditanyakan sesuai dengan kompetensi (urgensi, relevasi, kontinyuitas, keterpakaian sehari-hari tinggi)Isi materi yang ditanyakan sesuai dengan jenjang jenis sekolah atau tingkat kelasKonstruksiMenggunakan kata tanya atau perintah yang menuntutjawaban uraianAda petunjuk yang jelas tentang cara pengerjaan soal.Ada pedoman penskorannyaTabel, gambar, grafik, peta, atau yang sejenisnya disajikan dengan jelas dan terbacaBahasaRumusan kalimat soal komunikatifButir soal menggunakan bahasa Indonesia yang bakuTidak menggunakan kata/ungkapan yang menimbulkan penafsiran ganda atau salah pengertianTidak menggunakan bahasa yang berlaku setempat/tabuRumusan soal tidak mengandung kata/ungkapan yang dapat menyinggung perasaan siswa

Catatan:Contoh Format Penelaahan Butir Soal Bentuk Pilihan GandaMata Pelajaran :..Kelas/Semester :..Penelaah :..Petunjuk pengisian format penelaahan butir soal bentuk pilihan ganda:Analisislah setiap butir soal berdasarkan semua kriteria yang tertera di dalam format!Berilah tanda cek ( ) pada kolom ya bila soal yang ditelaah sudah sesuai dengan kriteriaBerilah tanda cek ( ) pada kolom tidak bila soal yang ditelaah tidak sesuai dengan kriteria, kemudian tuliskan alasan pada ruang catatan atau pada teks soal dan perbaikannya.

No.Aspek yang DitelaahNomor Soal

123

YaTidakYaTidakYaTidak

A1234B567891011121314C15161718MateriSoal sesuai dengan indikator (menuntut tes tertulis untuk bentuk pilihan ganda)Materi yang ditanyakan sesuai dengan kompetensi (urgensi, relevasi, kontinyuitas, keterpakaian sehari-hari tinggi)Pilihan jawaban homogen dan logisHanya ada satu kunci jawabanKonstruksiPokok soal dirumuskan dengan singkat, jelas dan tegasRumusan pokok soal dan pilihan jawaban merupakan pernyataan yang diperlukan sajaPokok soal tidak memberi petunjuk kunci jawabanPokok soal bebas dari pernyataan yang bersifat negatif gandaPilihan jawaban homogeny dan logis ditinjau dari segi materiGambar, grafik, table, diagram, atau sejenisnya jelas dan berfungsiPanjang pilihan jawaban relatif samaPilihan jawaban tidak menggunakan pernyataan semua jawaban di atas salah/benar dan sejenisnyaPilihan jawaban yang berbentuk angka/waktu disusun berdasarkan urutan besar kecilnya angka atau kronologisnyaButir soal tidak bergantung pada jawaban soal sebelumnyaBahasaMenggunakan bahasa yang sesuai dengan kaidah bahasa IndonesiaMenggunakan bahasa yang komunikatifTidak menggunakan bahasa yang berlaku setempat/tabuPilihan jawaban tidak mengulang kata/kelompok kata yang sama, kecuali merupakan satu kesatuan pengertian

Catatan:c. Validitas empirisValiditas empiris sama dengan validitas kriteria yang berarti bahwa validitas ditentukan berdasarkan kriteria, baik kriteria internal maupun kriteria eksternal. Kriteria internal adalah tes atau instrumen itu sendiri yang menjadi kriteria, sedangkan kriteria eksternal adalah hasil ukur instrumen atau tes lain di luar instrumen itu sendiri yang menjadi kriteria. Ukuran lain yang sudah dianggap baku atau dapat dipercaya dapat pula dijadikan sebagai kriteria eksternal.Validitas yang ditentukan berdasarkan kriteria internal disebut validitas internal, sedangkan validitas yang ditentukan berdasarkan kriteria eksternal disebut validitas eksternal.d. Validitas internalValiditas internal merupakan validitas yang diukur dengan besaran yang menggunakan instrumen sebagai suatu kesatuan (keseluruhan butir) sebagai kriteria untuk menentukan validitas item atau butir dari instrumen itu. Dengan demikian validitas internal mempermasalahkan validitas butir atau item suatu instrumen dengan menggunakan hasil ukur instrumen tersebut sebagai suatu kesatuan dan sebagai kriteria, sehingga biasa disebut juga validitas butir.Pengujian validitas butir instrumen atau soal tes dilakukan dengan menghitung koefesien korelasi antara skor butir instrumen atau soal tes dengan skor total instrumen atau tes. Butir atau soal yang dianggap valid adalah butir instrumen atau soal tes yang skornya mempunyai koefesien korelasi yang signifikan dengan skor total instrumen atau tes.e. Validitas eksternalKriteria eksternal dapat berupa hasil ukur instrumen yang sudah baku atau instrumen yang dianggap baku dapat pula berupa hasil ukur lain yang sudah tersedia dan dapat dipercaya sebagai ukuran dari suatu konsep atau varaibel yang hendak diukur. Validitas eksternal diperlihatkan oleh suatu besaran yang merupakan hasil perhitungan statistika. Jika kita menggunakan hasil ukur instrumen yang sudah baku sebagai kriteria eksternal, maka besaran validitas eksternal dari instrumen yang kita kembangkan didapat dengan jalan mengkorelasikan skor hasil ukur instrumen yang dikembangkan dengan skor hasil ukur instrumen baku yang dijadikan kriteria. Makin tinggi koefesien korelasi yang didapat, maka validitas instrumen yang dikembangkan juga makin baik. Kriteria yang digunakan untuk menguji validitas eksternal adalah nilai table r (r-tabel).Jika koefesien korelasi antara skor hasil ukur instrumen yang dikembangkan dengan skor hasil ukurinstrumen baku lebih besar dari pada r-tabel, maka instrumen yang dikembangkan dapat valid berdasarkan kriteria eksternal yang dipilih (hasil ukur instrumen baku). Jadi keputusan uji validitas dalam hal ini adalah mengenai valid atau tidaknya instrumen sebagai suatu kesatuan, bukan valid atau tidaknya butir instrumen seperti pada validitas internal.Ditinjau dari kriteria eksternal yang dipilih, validitas eksternal dapat dibedakan atas dua macam yaitu:1. Validitas prediktif apabila kriteria eksternal yang digunakan adalah adalah ukuran atau penampilan masa yang akan datang.2. Validitas kongkuren apabila kriteria eksternal yang digunakan adalah ukuran atau penampilan saat ini atau saat yang bersamaan dengan pelaksanaan pengukuran. Menurut Ebel (dalam Nazir 1988) membagi validitas menjadi concurrent validity construct validity face validity factorial validity empirical validity intrinsic validity predictive validity content validity curricular validity.

Concurrent Validity adalah validitas yang berkenaan dengan hubungan antara skor dengan kinerja. Construct Validity adalah validitas yang berkenaan dengan kualitas aspek psikologis apa yang diukur oleh suatu pengukuran serta terdapat evaluasi bahwa suatu konstruk tertentu dapat dapat menyebabkan kinerja yang baik dalam pengukuran. Face Validity adalah validitas yang berhubungan apa yang nampak dalam mengukur sesuatu dan bukan terhadap apa yang seharusnya hendak diukur. Factorial Validity dari sebuah alat ukur adalah korelasi antara alat ukur dengan faktor-faktor yang yang bersamaan dalam suatu kelompok atau ukuran-ukuran perilaku lainnya, dimana validitas ini diperoleh dengan menggunakan teknik analisis faktor. Empirical Validity adalah validitas yang berkenaan dengan hubungan antara skor dengan suatu kriteria. Kriteria tersebut adalah ukuran yang bebas dan langsung dengan apa yang ingin diramalkan oleh pengukuran. Intrinsic Validity adalah validitas yang berkenaan dengan penggunaan teknik uji coba untuk memperoleh bukti kuantitatif dan objektif untuk mendukung bahwa suatu alat ukur benar-benar mengukur apa yang seharusnya diukur. Predictive Validity adalah validitas yang berkenaan dengan hubungan antara skor suatu alat ukur dengan kinerja seseorang di masa mendatang. Content Validity adalah validitas yang berkenaan dengan baik buruknya sampling dari suatu populasi. Curricular Validity adalah validitas yang ditentukan dengan cara menilik isi dari pengukuran dan menilai seberapa jauh pengukuran tersebut merupakan alat ukur yang benar-benar mengukur aspek-aspek sesuai dengan tujuan instruksional.Sementara itu, Kerlinger (1990) membagi validitas menjadi tiga yaitu content validity (validitas isi), construct validity (validitas konstruk), dan criterion-related validity (validitas berdasar kriteria).2.1.7 Koefisien ValiditasBila skor pada tes diberi lambang x dan skor pada kriterianya mempunyai lambang y maka koefisien antara tes dan kriteria itu adalah rxy inilah yang digunakan untuk menyatakan tinggi-rendahnya validitas suatu alat ukur.Koefisien validitas pun hanya punya makna apabila apalagi mempunyai harga yang positif. Walaupun semakin tinggi mendekati angka 1 berarti suatu tes semakin valid hasil ukurnya, namun dalam kenyataanya suatu koefisien validitas tidak akan pernah mencapai angka maksimal atau mendekati angka 1. Bahkan suatu koefisien validitas yang tinggi adalah lebih sulit untuk dicapai daripada koefisien reliabilitas. Tidak semua pendekatan dan estimasi terhadap validitas tes akan menghasilkan suatu koefisien. Koefisien validitas diperoleh hanya dari komputasi statistika secara empiris antara skor tes dengan skor kriteria yang besarnya disimbolkan oleh rxy tersebut. Pada pendekatan-pendekatan tertentu tidak dihasilkan suatu koefisien akan tetapi diperoleh indikasi validitas yang lain.

2.2 RELIABILITAS2.2.1 Pengertian

Kata reliabillitas dalam bahasa Indonesia di ambil dari reliability dalam bahasa inggris, berasal dari kata, reliable yang artinya dapat di percaya. reliabilitas merupakan kata benda, sedangkan reliable merupakan kata sifat atau keadaan.

Reliabilitas merupakan penerjemahan dari kata reliability yang mempunyai asal kata rely dan ability. Pengukuran yang memiliki reliabilitas tinggi disebut sebagai pengukuran yang reliabel (reliable).Walaupun reliabilitas mempunyai berbagai arti seperti kepercayaan, keterandalan, keajegan, kestabilan dan konsistensi, namun ide pokok yang terkandung dalam konsep reliabilitas adalah sejauh mana hasil pengukuran dapat dipercaya.

Menurut Sugiono (2005) Pengertian Reliabilitas adalah serangkaian pengukuran atau serangkaian alat ukur yang memiliki konsistensi bila pengukuran yang dilakukan dengan alat ukur itu dilakukan secara berulang. Reabilitas tes adalah tingkat keajegan (konsitensi) suatu tes, yakni sejauh mana suatu tes dapat dipercaya untuk menghasilkan skor yang ajeg, relatif tidak berubah walaupun diteskan pada situasi yang berbeda-beda. Menurut Sukadji (2000) reliabilitas suatu tes adalah seberapa besar derajat tes mengukur secara konsisten sasaran yang diukur. Reliabilitas dinyatakan dalam bentuk angka, biasanya sebagai koefisien. Koefisien tinggi berarti reliabilitas tinggi. Menurut Nursalam (2003) Reliabilitas adalah kesamaan hasil pengukuran atau pengamatan bila fakta atau kenyataan hidup tadi diukur atau diamati berkali kali dalam waktu yang berlainan. Alat dan cara mengukur atau mengamati sama sama memegang peranan penting dalam waktu yang bersamaan. Menurut Sukardi (2008: 43) relaibelitas adalah karakter lain dari evaluasi. Reliabelitas juga dapat diartikan sama dengan konsistensi atau keajegan. Suatu instrument evaluasi dikatakan mempunyai nilai reliabelitas tinggi, apabila tes yang dibuat mempunyai hasil konsisten dalam mengukur yang hendak diukur.Menurut Sukardi (2008) Ada beberapa tipe reliabelitas yang digunakan dalam kegiatan evaluasi dan masing-masing reliebelitas mempunyai konsistensi yang berbeda-beda. Beberap tipe reliebelitas di antaranya: tes-retes, ekivalen, dan belah dua yang ditentukan melalui korelasi.2.2.2 Tipe-tipe ReliabelitasBerbagai tipe tersebut akan diuraikan sebagai berikut:1) Relibalelitas Dengan Tes-RetesReliabelitas tes-retes tidak lain adalah derajat yang menunjukkan konsistensi hasil sebuah tes dari waktu ke waktu. Tes-Retes menunjukkan variasi skor yang diperoleh dari penyelenggaraan satu tes evaluasi yang dilaksanakan dua kali atau lebih, sebagai akibat kesalahan pengukuran. Dengan kata lain, kita tertarik dalam mencari kejelasan bahwa skor siswa mencapai suatu tes pada waktu tertentu adalah sama hasilnya, ketika siswa itu dites lagi dengan tes yang sama. Dengan melakukan tes-retes tersebut. Seorang guru akan mengetahui seberapa jauh konsistensi suatu tes mengukur apa yang ingin diukur (Sukardi, 2008).Sedangkan Arikunto (1997: 88) Metode tes ulang (tes-retes) dilakukan untuk menghindari dua penyusunan dua seri tes. Dalam menggunakan teknik atau metode ini pengetes hanya memiliki satu seri tes tapi dicobakan dua kali. Oleh karena tesnya satu dan dicobakan dua kali, maka metode ini dapat disebut juga dengan single-test-double-trial-method.Reliebelitas tes retes dapat dilakukan dengan cara seperti berikut:1. Selenggarakan tes pada suatu kelompok yang tepat sesuai dengan rencana.2. Setelah selang waktu tertentu, misalnya satu minggu atau dua minggu, lakukan kembali tes yang sama dengan kelompok yang sama tersebut.3. Korelasikan kedua hasil tes tersebut.Jika hasil koefisien menunjukkan tinggi, berarti reliabilias tes adalah bagus. Sebaliknya, jika korelasi rendah, berarti tes tersebut mempunyai konsistensi rendah (Sukardi, 2008).2) Reliabelitas Dengan Bentuk EkivalensiSesuai dengan namanya yaitu ekivalen, maka tes evaluasi yang hendak diukur reliabelitasnya dibuat identik dengan tes acuan. Setiap tampilannya, kecuali substansi item yang ada, dapat berbeda. Kedua tes tersebut sebaliknya mempunyai karate yang sama. Karakteristik yang dimaksud misalnya mengukur variabel yang sama, mempunyai jumlah item sama, struktur sama, mempunyai tingkat kesulitan dan mempunyai petunjuk, cara penskoran, dan interpretasi yang sama (Sukardi 2008).Pernyataan serupa juga disampaikan oleh Arikunto (1997: 87) tes paralel atau equivalent adalah dua buah tes yang mempunyai kesamaan tujuan, tingkat kesukaran dan susunan, tetapi butir-butirnya berbeda. Dalam istilah bahasa Inggris disebut Alternate-forms method (parallel forms). Tes reliabelitas secara ekivalen dapat dilaksanakan dengan mengikuti langkah-langkah sebagai berikut:1. Tentukan sasaran yang hendak dites2. Lakukan tes yang dimaksud kepada subjek sasaran tersebut.3. Administrasinya hasilnya secara baik.4. Dalam waktu yang tidak terlalu lama, lakukan pengetesan yang kedua kalinya pada kelompok tersebut5. Korelasikan kedua hasil skor tersebut (Sukardi, 2008).Perlu diketahui juga bahwa tes ekivalensi mempunyai kelemahan yaitu bahwa membuat dua buah tes yang secara esensial ekivalen adalah sulit. Akibatnya akan selalu terjadi kesalahan pengukuran (Sukardi, 2008). Pernyataan lain juga disampaikan oleh Arikunto (1997: 88) kelemahan dari metode ini adalah pengetes pekerjaannya berat karena harus menyusun dua seri tes. Lagi pula harus tersedia waktu yang lama untuk mencobakan dua kali tes.3) Reliebilitas Dengan Bentuk Belah DuaMenurut Sukardi (2008: 47) Reliabilitas belah dua ini termasuk reliabilitas yang mengukur konsistensi internal. Yang dimaksud konsistensi internal adalah salah satu tipe reliabilitas yang didasarkan pada keajegan dalam setiap item tes evaluasi. Relibilitas belah dua ini pelaksanaanya hanya satu kali.Cara melakukan reliabilitas belah dua pada dasarnya dapat dilakukan dengan urutan sebagai berikut:1. Lakukan pengetesan item-item yang telah dibuat kepada subjek sasaran.2. Bagi tes yang ada menjadi dua atas dasar dua item, yang paling umum dengan membagi item dengan nomor ganjil dengan item dengan nomor genap pada kelompok tersebut.3. Hitung skor subjek pada kedua belah kelompok penerima item genap dan item ganjil.4. Korelasikan kedua skor tersebut, menggunakan formula korelasi yang relevan dengan teknik pengukuran (Sukardi, 2008).

Untuk mengetahui seluruh tes harus digunakan rumus Spearman-Brown (Arikunto, 1997):3 Faktor-Faktor Yang Mempengaruhi Reliabilitas InstrumenMenurut Sukardi (2008:51-52) koefisien reliabilitas dapat dipengaruhi oleh waktu penyelenggaraan tes-retes. Interval penyelenggaraan yang terlalu dekat atau terlalu jauh, akan mempengaruhi koefisien reliabilitas. Faktor-faktor lain yang juga mempengaruhi reliabilitas instrument evaluasi di antaranya sebagai berikut::1) Panjang tes, semakin panjang suatu tes evaluasi, semakin banyak jumlah item materi pembelajaran diukur.2) Penyebaran skor, koefisien reliabelitas secara langsung dipengaruhi oleh bentuk sebaran skor dalam kelompok siswa yang di ukur. Semakin tinggi sebaran, semakin tinggi estimasi koefisien reliable.3) Kesulitan tes, tes normative yang terlalu mudah atau terlalu sulit untuk siswa, cenderung menghasilkan skor reliabilitas rendah.4) Objektifitas, yang dimaksud dengan objektif yaitu derajat dimana siswa dengan kompetensi sama, mencapai hasil yang sama.

40