makalah psikometri
DESCRIPTION
psikometriTRANSCRIPT
KATA PENGANTAR
Puji syukur saya panjatkan kepada Allah SWT karena berkat rahmat-Nyalah laporan ini selesai
tepat pada waktunya. Tak lupa ucapan terimakasih saya ucapkan kepada:
1. Seluruh dosen mata kuliah Psikometri yang telah memberikan pemahaman terkait topic.
2. Orang tua saya yang telah memberikan dukungan yang bersifat material maupun
immaterial.
3. Semua teman saya yang telah turut memberikan informasi terkait topik, yang tidak dapat
disebutkan satu-persatu.
Akhirnya penulis berharap semoga Allah memberikan imbalan yang setimpal pada mereka yang
telah memberikan bantuan, dan dapat menjadikan semua bantuan ini sebagai ibadah, Amiin Yaa
Robbal ‘Alamiin.
Laporan ini disusun sebagai langkah untuk memahami konsep pembelajaran siswa dalam rangka
untuk mengetahui aplikasi teori skinner terhadap pembelajaran. Dalam Penulisan laporan ini
penulis merasa masih banyak kekurangan-kekurangan baik pada teknis penulisan maupun
materi, mengingat akan kemampuan yang dimiliki penulis. Untuk itu kritik dan saran dari
semua pihak sangat penulis harapkan demi penyempurnaan pembuatan laporan ini. Semoga
materi ini dapat bermanfaat dan menjadi sumbangan pemikiran bagi pihak yang
membutuhkan,khususnya bagi penulis sehingga tujuan yang diharapkan dapat tercapai, Amiin.
DAFTAR ISI
KATA PENGANTAR
........................................................................................................................
1
DAFTAR ISI
........................................................................................................................
2
BAB I PENDAHULUAN
A. LATAR BELAKANG
........................................................................................................................
3
........................................................................................................................
B. TUJUAN PENELITIAN
........................................................................................................................
4
BAB II PEMBAHASAN
A. PENGERTIAN RELIABILITAS...............................................................5
B. KOEFISIEN KORELASI...........................................................................9
C. JENIS-JENIS RELIABILITAS..................................................................
D. RELIABILITAS YANG DIPERCEPAT...................................................
E. KETERGANTUNGAN KOEFISIEN RELIABILITAS..........................
F. KESALAHAN STANDAR PENGUKURAN............................................
G. RELIABILITAS DITERAPKAN PADA TES DAN SKOR....................
BAB III PENUTUP
A. KESIMPULAN
........................................................................................................................
17
B. SARAN
........................................................................................................................
18
DAFTAR PUSTAKA
BAB I PENDAHULUAN
A. LATAR BELAKANG
Salah satu aspek positif kemajuan dari dunia penelitian yang ada di Indonesia, adalah muncul
banyaknya para peneliti-peneliti muda yang kini lebih kritis lagi dalam meneliti objek-objek
yang ada. Di Indonesia, banyak sekali para peneliti ataupun bukan peneliti yang banyak
melakukan sebuah riset guna memenuhi tugas ataupun sebagai pembuktian dari sebuah
kejadian. Yang dimana setiap penelitian tersebut biasanya memerlukan sebuah pengujian
agar nantinya mampu menjadi sebuah hasil ilmiah yang benar-benar valid dan bersifat riel
tanpa adanya kebohongan ataupun ketidaknyataan yang mengesankan data yang diperoleh
bersifat dibuat-buat. Agar kajian kita bisa bersifat riel maka kita sebagai seorang peneliti
harus menguji terlebih dahulu hasil penelitian kita yang disebut dengan uji reabilitas.
Kebanyakan dari kita mengira bahwa jika kita mempunyai kesimpulan dari hasil penelitian
kita terhadap kejadian-kejadian yang terbatas, maka kesimpulan itu berlaku dengan sempurna
untuk seluruh kejadian yang sejenis. Perkiraan semacam itu sama sekali tidak benar dan
sangat menyesatkan (Sutrisno, 1981). Nah untuk menghindari hal-hal yang semacam itu
maka kita harus melakukan reabilitas, yang berguna untuk menunjukkaan kevalidtan dari
hasil sebuah penelitian yang kita lakukan.
Uji reliabilitas mampu menunjukkan tingkat kepercayaan terhadap sekor atau tingkat
kecocokan sekor dengan sekor sesungguhnya. Rebilitas ini bisa dicapai melalui tingkat
kecocokan di antara sekor pada lebih dari sekali pengukuran. Jika makin cocok dengan sekor
sesungguhnya maka makin tinggi tingkat reliabilitasnya. Kalaupun ada ketidakcocokan itu
merupakan kekeliruan yang acak. Jadi kemungkinan munculnya kesalahan masih tetap ada,
namun kemungkinan itu sangatlah kecit sekali dan tidak akan banyak berpengaruh terhadap
hasil akhir dari sebuah pengujian.
B. TUJUAN PENELITIAN
Mengkonsep satu variable dengan jelas. Setiap pengukuran harus merujuk pada satu dan
hanya satu konsep /variable. Sebuah variable harus spesifik agar dapat menguragiintervensi
informasi dari variable lain. Menggunakan level pengukuran yang tepat. Semakin tinggi atau
semakin tepat level pengukuran, maka variable yang dibuat akan semakin reliable karena
informasi yang dimiliki semakin mendetail.
Prinsip dasarnya adalah mencoba melakukan pengukuran pada level paling tepat yang
mungkin diperoleh. Gunakan lebih dari satu indicator. Dengan adanya lebih dari satu
indikatoryang spesifik , peneliti dapat melakikan pengukuran dari range yang lebih luas
terhadapkonten definisi konseptual. Gunakan tes pilot, yakni dengan membuat satu atau lebih
draftatau dalam sebuah pengukuran sebelum menuju ke tahap hipotesis (pretest). Dalam
penggunaan pilot studies, prinsipnya adalah mereplikasi pengukuran yang pernah dilakukan
oleh peneliti terdahulu dari literature-literatur yag berkaitan.
Selanjutnya, pengukuran terdahulu dapat dipergunakan sebagai patokan dari pengukuran
yang dilakukan peneliti saat ini. Kualitas pengukuran dapat ditingkatkan dengan berbagai
cara sejauh definisi dan pemahaman yang digunakan oleh peneliti kemudian tetap sama.
Pada konstruksi alat ukur, perhitungan reliabilitas berguna untuk melakukan perbaikan pada
alat ukur yang dikonstruksi. Dimana perbaikan alat ukur dilakukan melalui analisis butir
untuk mengetahui butir mana yang perlu diperbaiki. Namun pada pengukuran sesungguhnya,
perhitungan reliabilitas dilakukan untuk memberi informasi tentang kualitas sekor hasil ukur
kepada mereka yang memerlukannya. Tentunya perolehan tersebut bisa di jadikan acuan bagi
peneliti untuk menghasilkan penelitian yng bisa dipertanggung jawabkan di kemudian hari.
BAB II PEMBAHASAN
A. Pengertian Reliabilitas
Reliabilitas, atau keandalan merupakan konsistensi dari serangkaian pengukuran atau
serangkaian alat ukur. Hal tersebut bisa berupa pengukuran dari alat ukur yang sama (tes
dengan tes ulang akan memberikan hasil yang sama, atau untuk pengukuran yang lebih
subjektif, apakah dua orang penilai memberikan skor yang mirip (reliabilitas antar penilai).
Pada penelitian reliabilitas tak lepas dari ketergantungan (dependabiliti). Konsep
ketergantungan ini sangat berkaitan erat dengan keterandalan. Hasil dari pengujian awal
diharapkan akan konsisten dangan pengujian-pngujian berikutnya. Hasil selalu berupa
numerik dan tidak boleh berubah-ubah, karena merupakan karakteristik dari proses ukuran.
Reliabilitas selalu menunjukan keandalan instrument penelitian dalam berbagai bentuk,yakni
hasil pengujian yang sama jika dilakukan oleh orang yang berbeda (inter-penilai), hasil
pengujian yang sama jika dilakukan oleh orang yang sama dalam waktu berbeda (pengetesan
ulang),hasil pengujian yang sama jika dilakukan oleh orang yang berbeda dalam waktu yang
bersamaan dengan tes yang berbeda (bentuk pralel), dan hasil pengujian yang sama dengan
menggunakan berbagai pernyatan-pernyataan membangun (konsistensi internal).
Reliabilitas merupakan konsistensi skor yang dicapai oleh orang yang sama ketika mereka
diuji ulang dengan tes yang sama dalam kesempatan berbeda, atau dengan seperangkat item
yang ekuivalen, atau juga dapat berada dalam kondisi pengujian yang berbeda. Dalam
pengertian luas, reliabilitas tes menunjukkan sejauh mana perbedaan-perbedaan individu
dalam skor tes dapat dianggap sebagai penyebab dari perbedaan atau penyebab dari
kesalahan dalam pencarian peluang. Dewasa ini, para psikolog menerima variabilitas sebagai
segi instrinsik semua perilaku dan berusaha menyelidiki serta memilah banyak sumber
variabilitas semacam itu.
Reliabilitas skor bergantung pada definisi varian kesalahan. Faktor-faktor yang dapat
dianggap sebagai varian kesalahan untuk satu tujuan dapat dianggap sebagai varian
kebenaran dalam tujuan lain. Contoh, jika kita ingin mengukur fluktuasi suasana hati, maka
perubahan dari hari ke hari pada skor kegembiraan-depresi akan relevan bagi maksud tes ini
dan karenanya, akan menjadi bagian dari varian kebenaran skor yang ada.
Setiap tes seharusnya didampingi oleh pernyataan reliabilitas. Ketika penguji berusaha
mempertahankan kondisi-kondisi pengetesan dengan mengendalikan lingkungan pengetesan,
instruksi, batas waktu, rapport, dan faktor lainnya, mereka berusaha mengurangi varian
kesalahan dan membuat skor-skor tes lebih dapat dipercaya. Meskipun telah dikondisikan tes
dengan kondisi pengetesan maksimum, tak satu tes pun dapat dipercaya seratus persen.
Karena semua jenis reliabilitas menyangkut derajat konsistensi atau kesepakatan antara dua
perangkat skor yang diturunkan secara independen, semua jenis reliabilitas dapat
diungkapkan dalam istilah koefisien korelasi.
B. KOEFISIEN KORELASI
Koefisien korelasi menyatakan derajat kesesuaian atau hubungan antara dua perangkat skor.
Dengan demikian, jika individu dengan skor tertinggi pada variabel 1 juga mendapatkan skor
tertinggi pada varabel 2. Individu nomor dua terbaik pada variabel 1 juga nomor dua terbaik
pada variabel 2, dan seterusnya, sampai dengan individu yang memiliki skor terendah. Akan
ada korelasi sempurna antara variabel 1 dan 2. Korelasi seperti ini akan memiliki nilai +1,00.
Korelasi nol menunjukkan tidak adanya hubungan sama sekali, sebagaimana hal ini dapat
terjadi karena adanya peluang. Jika setiap sampel diperoleh secara acak untuk menentukan
variabel 1 dan variabel 2, maka korelasi nol atau mendekati- nol akan terjadi. Dalam kondisi
ini, akan mustahil memprediksi posisi relatif individu dakan variabel 2 berdasarkan
pengetahuannya mengenai variabel 1. Orang dengan skor tertinggi pada variabel 1 mungkins
aja memiliki skor yang berbeda dengan variabel 2.
Koefisien korelasi bisa dihitung dengan berbagai cara, tergantung pada hakikat data. Yang
paling umum adalah koefisien korelasi produk-momen Pearson. Koefisien korelasi ini tidak
hanya mempertimbangkan posisi orang dalam kelompok, namun juga besar simpangannya di
atas atau di bawah rata-rata kelompok. Bila posisi tiap orang dinyatakan dalam kaitan-kaitan
skor standar, orang yang ada di atas rata-rata akan menerima skor standar positif, sementara
yang ada di bawah rata-rata akan menerima skor negatif.
Dalam praktik sesungguhnya tidak mutlak perlu adanya konversi setiap raw score ke dalam
skor standar sebelum menemukan hasil silangnyam karena konversi ini bisa dibuat sekali
untuks elamanya setelah hasil silang ditambahkan.
SIGNIFIKANSI STATISTIK
Dalam riset psikologis biasanya kita tertarik untuk melakukan generalisasi di atas sampel
particular individu yang di tes sampai populasi yang diwakili sampel itu. Contoh:
Kita mungkin ingin tahu apakah matematika dan kemampuan membaca punya korelasi
diantara anak-anak sekolah Amerika yang usianya sama seperti anak-anak sekolah yang kita
tes. Yang jelas, 10 kasus misalnya, yang sungguh-sungguh di tes tidak akan merupakan
sampel yang memadai untuk generalisasi bagi populasi seluas itu. Sa,pel berukuran sama
lainnya, yang dapat dibandingkan akan menghasilkan koreasi yang jauh lebih rendah atau
lebih tinggi.
Ada prosedur statistic untuk memperkirakan fluktuasi yang mungkin untuk bisa diharapakan
dari sampel ke sampel dalam ukuran dari korelasi, rata-rata, simpangan baku, dan ukuran-
ukuran kelompok lain manapun. Ketika kita mengatakan bahwa korelasi itu “signifikan pada
tingkat 1% (0,01)”, kita memaksudkan bahwa peluang-peluangnya tidak lebih besar daripada
1 dari 100 sehingga korelasi populasinya 0.
Tingkat signifikansi merujuk pada resiko kesalahan yang hendak kita tanggung dalam
menarik kesimpulan dari data kita. Selama bertahun-tahun, tingkat signifikansi merupakan
cara tradisional untuk mengevaluasi korelasi. Namun, sudah mulai disadari bahwa prosedur
ini memiliki kekurangan dan cacah, korelasi yang tinggipun bahkan gagal memenuhi “tes
signifikansi”.
Pendekatan lain yang semakin mendapat perhatian mempertimbangkan besaran actual
korelasi yang didapatkan dan memperkirakan “interval kepercayaan” di dalam korelasi
populasi kemungkinan jatuh pada tingkat kepercayaan yang spesifik. (lihat, misalnya Carver
1993). Tren terhadap interval kepecayaan sebagai suplemen dan bukan pengganti untuk
pengetesan signifikansi, membayang-bayangi pergeseran penting dalam analisis atas
koefisien korelasi dalam tahun-tahun mendatang.
KOEFISIEN RELIABILITAS
Koefisien korelasi telah digunakan dalam analisis data psikometrik. Pengukuran reliabilitas
tes mewakili satu aplikasi koefisien-koefisien seperti ini. Contoh sebuah koefisien reliabilitas
yang dihitung oleh metode produk momen Pearson, (grafik 4-3 Hal:101). Dalam kasus ini,
skor-skor 104 orang pada bentuk-bentuk ekuivalen dari tes-tes World Fluency2 memiliki
korelasi. Dalam satu bentuk, para peserta tes diberi waktu 5 menit untuk menulis sebanyak
mungkin kata-kata yang dimulai dengan sebuah surat yang ada. Bentuk kedua sama, kecuali
surat lain yang digunakan. Dua surat ini dipilih oleh para penulis tes karena untuk maksud ini
kesulitannya hamper sama. Koralasi antara jumlah kata-kata yang tertulis dalam dua bentuk
tes ini adalah 0,72. Korelasi ini tinggi dan signifikan pada tingkat 0,01.
C. JENIS-JENIS RELIABILITAS
Reliabilitas Tes-Retes
Metode paling jelas untuk menemukan reliabilitas skor tes ialah dengan mengulang tes yang
sama pada kesempatan kedua. Koefisien reliabilitas dalam kasus ini hanyalah korelasi antara
skor-skor yang didapatkan oleh orang yang sama pada dua penyelenggaraan tes. Varian
kesalahan berhubungan dengan fluktuasi acak kinerja dari satu kesempatan tes ke
kesempatan lainnya.
Variasi-variasi ini sebagian diakibatkan dari kondisi pengetesan yang tidak terkontrol seperti
perubahan eksterm pada cuaca, ujung pensil yang patah, dan lain-lain. Di samping itu juga
terdapat variasi-variasi yang muncul dari peserta tes itu sendiri, seperti sakit, letih,
ketegangan emosi, kecemasan, dan lain-lain. Reliabilitas tes ulang menunjukkan sejauh mana
skor pada tes dapat digeneralisasikan untuk berbagai kesempatan yang berbeda, makin tinggi
reliabilitasnya, makin rentanlah skor terhadap perubahan sehari-hari yang acak dalam kondisi
peserta tes atau lingkungan pengetesan.
Meskipun tampak sederhana dan blak - blakan, teknik tes dan tes ulang menampilkan
berbagai kesulitan ketika diterapkan pada kebanyakan tes psikologis. Praktik mungkin akan
menghasilkan kadar perbaikan yang bervariasi dalam skor-skor retes individu yang berbeda.
Akan tetapi, untuk sebagian besar tes-tes psikologis, pengetesan ulang (retes) dengan tes
yang sama bukanlah teknik yang tepat untuk menemukan koefisien reliabilitas.
Reliabilitas Bentuk-Alternatif
Satu cara untuk menghindari kesulitan yang ditemukan dalam reliabilitas tes dan tes ulang
adalah melalui penggunaan bentuk-bentuk tes lainnya. Dengan demikian, orang yang sama
bisa dites dengan satu bentuk pada kesempatan kedua. Korelasi antara skor-skor yang
didapatkan pada dua bentuk itu merupakan keofisien reliabilitas tes. Perlu dicatat bahwa
koefisien reliabilitas semacam itu adalah ukuran stabilitas temporal dan konsistensi respons
terhadap berbagai butir soal contoh (bentuk-bentuk tes). Dengan begitu, koefisien ini
menggabungkan dua jenis reliabilitas. Akan tetapi, karena dua jenis ini penting bagi
kebanyakan maksud pengetesan, reliabilitas bentuk-alternatif memberikan ukuran yang
berguna untuk mengevaluasi banyak tes.
Seperti reliabilitas retes, reliabilitas bentuk-alternatif seharusnya selalu disertai oleh
pernyataan tentang panjang interval antara penyelenggaraan tes, dan juga deskripsi
pengalaman-pengalaman relevan yang memengaruhi. Jika kedua bentuk itu diselenggarakan
langsung berturut-turut, korelasi yang dihasilkan menunjukan reliabilitas antara bentuk-
bentuk saja, bukan antara peristiwa-peristiwa. Varian kesalahan dalam kasus ini
merepresentasikan fluktuasi dalam kinerja dari satu perangkat soal ke perangkat lain, tetapi
tidak merepresentasikan fluktuasi sepanjang waktu.
Dalam pengembangan bentuk-bentuk alternative, tentu saja harus dicurahkan perhatian untuk
memastikan bahwa, bentuk-bentuk itu betul-betul parallel. Secara mendasar, bentuk-bentuk
paralel tes seharusnya merupakan tes-tes yang disusun secara mandiri untuk memenuhi
spesifikasi yang sama. Tes-tes ini seharusnya berisi jumlah soal yang sama dan seharusnya
mencakup jenis isi yang sama. Kisaran dan tingkat kesulitan soal-soal ini seharusnya juga
sama. Instruksi, batas waktu, contoh-contoh ilustratif, format, dan semua aspek tes lain harus
dicek dalam hal ekuivalensinya.
Reliabilitas Belah-Separuh (Split-half Reliability)
Dari penyelenggaraan tunggal atas satu bentuk tes, mungkin untuk mencapai ukuran
reliabilitas lewat berbagai prosedur belah-separuh. Dengan cara ini, dua skor didapatkan
untuk setiap orang dengan membagi tes menjadi paruhan-paruhan yang ekuivalen. Tampak
bahwa reliabilitas belah-separuh merupakan ukuran yang konsisten dalam kaitan dengan
sampling isi. Stabilitas sementara skor-skor tidak masuk dalam reliabilitas semacam itu,
karena hanya ada satu kesempatan tes. Jenis reliabilitas ini kadang kala disebut koefisien
konsistensi internal, karena hanya dibutuhkan penyelenggaraan tunggal atas satu bentuk tes.
Untuk mendapatkan reliabilitas belah-separuh, masalah pertama adalah bagaimana membagi
tes dalam rangka mendapatkan paruhan-paruhan yang paling ekuivalen. Tes apa pun bisa
dibagi dengan berbagai cara. Dalam kebanyakan tes, paruhan yang pertama dan paruhan
kedua tidak akan ekuivalen, tergantung pada perbedaan dan tingkat kesulitan soal, dan juga
efek-efek kumulatif pemanasan, praktik, keletihan, kebosanan, dan banyak factor lain yang
berbeda-beda dari awal sampai akhir tes. Prosedur yang memadai bagi kebanyakan maksud
adalah mendapatkan skor pada soal-soal genap dan ganjil dari tes. Jika soal-soal ini aslinya
diatur menurut tingkat kesulitan yang kurang lebih sama, pembagian seperti itu akan
menghasilkan skor-separuh yang hampir ekuivalen. Satu hal yang perlu diwaspadai dalam
membuat pemisahan ganjil-genap seperti itu berkaitan dengan kelompok-kelompok butir soal
yang berhadapan dengan satu masalah, seperti pertanyaan-pertanyaan yang merujuk pada
diagram mekanis tertentu atau halaman tertentu dalam tes membaca. Dalam kasus ini,
seluruh kelompok soal seharusnya tetap disatukan dengan satu atau separuh lainnya.
Seandainya soal-soal dalam kelompok semacam ini harus ditempatkan dalam paruhan-
paruhan tes yang berbeda dari tes, kesamaan skor-skor paruhan akan dibesar-besarkan,
karena kesalahan tunggal apa pun dalam memahami masalah ini akan memengaruhi soal-soal
dalam kedua paruhan.
Begitu dua skor-paruhan ini didapatkan untuk tiap orang, skor-skor ini bisa dikorelasikan
dengan metode yang biasa. Akan tetapi, seharusnya dicatat bahwa korelasi ini sesungguhnya
memberikan reliabilitas dari separuh-tes saja. Contohnya, jika seluruh tes terdiri dari 100
butir soal, korelasinya dihitung antara dua perangkat skor yang masing-masing didasarkan
pada 50 soal. Di pihak lain, dalam reliabilitas tes-retes dan reliabilitas bentuk alternative, tiap
skor didasarkan pada jumlah soal penuh pada tes.
Jika semuaa hal sama, semakin panjang tes, semakin dapat diandalkan tes itu. Masuk akal
jika kita berekspektasi bahwa, dengan sampel perilaku lebih besar, kita akan sampai pada
ukuran lebih memadai dan lebih konsisten. Efek yang akan dihasilkan pada koefisiennya
dengan memperpanjang atau memperpendek tes, dapat diperkirakan dengan rumus
Spearman-Brown, seperti berikut:
rnm =nrtt
1+ (n−1 ) rtt
dimana rnm adalah koefisien yang diperkirakan , rnm adalah koefisien yang diperoleh, dan n
adalah jumlah waktu tes itu diperpanjang atau diperpendek. Jadi, jika jumlah soal tes
ditingkatkan dari 25 menjadi 100, n adalah 4; jika diturunkan dari 60 ke 30, n adalah ½.
Rumus Spearman-Brown digunakan secara luas dalam menghitung reliabilitas dalam bentuk
ini. Ketika diterapkan pada reliabilitas belah-separuh, rumus ini selalu melibatkan
penggandaan panjang tes. Dalam kondisi ini, rumus itu dapat disederhanakan sebagai
berikut:
rtt = 2 r bb
1+r bb
untuk rbb adalah korelasi dari tes-tes paruhan.
Metode alternatif untuk mendapatkan reliabilitas belah-separuh dikembangkan oleh Rulon
(1939). Hanya dibutuhkan varian dari perbedaan antara skor-skor tiap orang pada dua tes-tes
separuh (SD2d
) dan varian skor total ( SD 2x ) dua nilai ini disubstitusikan dalam rumus
berikut, yang menghasilkan reliabilitas seluruh tes secara langsung :
rtt = 1- SD 2
d
SD 2x
menarik untuk memperhatikan hubungan rumus ini dengan definisi varian kesalahan.
Perbedaan apa pun antara skor-skor seseorang pada dua tes paruhan menampilkan varian
kesalahan atau varian yang tidak relevan. Varian-varian perbedaan-perbedaan ini, dibagi
dengan varian skor-skor total, memberikan proporsi varian kesalahan dalam skor-skor itu.
Ketika varian skor ini dikurangkan dari 1,00, hasilnya adalah proporsi varian “benar” untuk
penggunaan tes tertentu, yang sama dengan koefisien reliabilitas.
Reliabilitas Kuder-Richardson dan Koefisien Alpha
Metode keempat untuk mendapatkan reliabilitas, yang juga menggunakan administrasi
tunggal dari suatu bentuk tunggal, didasarkan pada konsistensi respons terhadap semua butir
soal dalam tes. Konsistensi antarsoal ini dipengaruhi oleh dua sumber varian kesalahan: (1)
pencuplikan isi ( sebagaimana dalam bentuk alternatif dan reliabilitas belah-separuh); (2)
heterogenitas dari domain perilaku yang disampelkan. Semakin homogeny domainnya,
semakin tinggilah konsistensi antarsoal. Contoh , jika suatu tes mencakup soal perkalian saja,
sementara yang lain memuat soal-soal pertambahan, pengurangan, perkalian dan pembagian
tes terdahulu barangkali akan menunjukan lebih banyak konsistensi antarsoal daripada yang
kedua tersebut. Dalam tes kedua, yang lebih heterogen, satu peserta tes bisa menunjukkan
kinerja lebih baik dalam pengurangan daripada dalam operasi aritmetik lainnya, sedangkan
peserta tes lainnya bisa mencapai skor yang relative baik pada tes pembagian, tetapi kurang
baik pada penambahan, pengurangan, dan perkalian, dan seterusnya. Sampel yang lebih
ekstrem akan ditunjukkan oleh tes terdiri dari 40 soal kosakata, yang kontras dengan tes yang
terdiri dari 10 kosakata, 10 hubungan ruang, 10 penalaran aritmetik, dan 10 soal kecepatan
persepsi. Dalam tes kedua, barangkali tidak ada atau ada sedikit hubungan antara kinerja
individu pada berbagai jenis soal.
Tampak bahwa skor tes akan menjadi kurang ambigu bila berasal dari tes-tes yang relatif
homogeny. Andaikan dalam tes 40 soal amat heterogen yang dikutip sebelumnya, baik smith
maupun jones mendapatkan nilai 20. Bisakah kita menyimpulkan bahwa kinerja keduanya
pada tes ini sama? Sama sekali tidak. Smith mungkin telah menyelesaikan 10 soal kosakata
dengan benar, 10 soal kecepatan persepsi dan tidak satupun soal penalaran aritmetik dan
hubungan ruang. Sebaliknya, jones mungkin telah menerima skor 20 dengan menyelesaikan
5 soal kecepatan persepsi, 5 hubungan ruang, 10 penalaran aritmetik, dan tidak satupun soal
kosakata.
Banyak kombinasi lain yang jelas bisa menghasilkan skor total sama 20. Skor ini akan
memiliki arti yang berbeda jika didapatkan lewat kombinasi soal-soal yang tidak sama.
Dalam tes kosakata yang relatif homogeny, di pihak lain, skor 20 barangkali akan berarti
bahwa peserta tes telah berhasil dengan 20 kata pertama, jika soal-soalnya diatur dalam
tingkat kesulitan yang meningkat. Ia bisa gagal pada dua atau tiga kata lebih mudah dan
dengan tepat memberikan respons pada dua atau tiga soal lebih sulit di atas kata ke-20 ,tetapi
variasi individu seperti ini agak berbeda dalam perbandingan dengan variasi yang ditemukan
dalam tes yang lebih heterogen.
Pertanyaan yang amat relevan dalam kaitan ini adalah apakah criteria yang sedang diprediksi
oleh tes itu pada dirinya sendiri relatif homogen atau heterogen. Meskipun tes-tes homogeny
lebih disukai karena skor-skornya memungkinkan interpretasi yang agak tidak ambisius, tes
homogen jelas bukan predictor yang memadai menurut criteria yang amat heterogen. Lagi
pula, dalam prediksi yang punya criteria heterogen, heterogenitas soal-soal tes tidak akan
dengan sendirinya mewakili varian kesalahan. Tes-tes inteligensi tradisional memberikan
contoh yang baik tentang tes-tes heterogen yang dirancang untuk memprediksi criteria
heterogen. Akan tetapi, dalam kasus semacam ini, mungkin lebih baik menyusun berbagai tes
yang relatif homogeny, masing-masing mengukur berbagai fase criteria heterogen. Jadi,
interpretasi tidak ambigu atas skor-skor tes bisa dipadukan dengan cakupan criteria yang
memadai.
D. RELIABILITAS YANG DIPERCEPAT
E. KETERGANTUNGAN KOEFISIEN RELIABILITAS
F. KESALAHAN STANDAR PENGUKURAN
Interpretasi Skor-skor Individu (Standard Error of Measurement)
SEM lebih banyak digunakan dalam pengetesan daripada koefisien reliabilitas. Kesalahan
pengukuran standar bisa dihitung dengan rumus berikut:
SEM = SDt √1−r tt
SDt = simpangan baku skor tes
rtt = koefisien reliabilitas
Misalnya, jika IQ simpangan pada tes inteligensi tertentu memiliki simpangan baku 15 dan
koefisien reliabilitas 0,89, SEM IQ pada tes ini adalah: 15√ t−0,89tt = 15 √0,11 = 15 (0,33) =
5.
Kesalahan standar pengukuran dan koefisien reliabilitas merupakan cara-cara alternatif untuk
mengungkapkan reliabilitas tes. Tidak seperti koefisien reliabilitas, kesalahan pengukuran
bersifat independen terhadap variabilitas kelompok berdasarkan kesalahan pengukuran
dihitung.Untuk menginterpretasikan skor individu, kesalahan standar pengukuran merupakan
alat yang lebih tepat.
Akan tetapi, perbedaan dalam koefisien-koefisien reliabilitas maupun kesalahan-kesalahan
pengukuran tidak bisa diandaikan tetap konstan ketika tingkat kemampuan sangat bervariasi.
SEM memberikan perlindungan terhadap penekanan yang tidak tepat pada skor numerik
tunggal.
Interpretasi Perbedaan Skor
Tiap skor dapat berfluktuasi, yang berfungsi sebagai alat pemeriksa penekanan yang
ebrlebihan pada perbedaan-perbedaan kecil antara skor-skor. Sikap hati-hati seperti ini perlu
ada, baik bila membandingkan skor tes dari orang yang berbeda maupun ketika
membandingkan skor tes dari orang yang berbeda maupun ketika membandingkan skor
individu yang sama dalam kemampuan yang berbeda. Pertanyaan yang sering diajukan
tentang skor-skor tes berhubungan dengan posisi relatif individu pada berbagai area.
Perbedaan yang ada dipengaruhi oleh kesalahan-kesalahan peluang yang ada dalam suatu
skor. Kesalahan standar tentang perbedaan antara dua skor dapat ditemukan dari kesalahan
standar perbedaan antara dua skor dan SEM1 dan SEM2 adalah kesalahan standar dari
pengukuran skor-skor yang terpisah.
SEdiff = SD √2−r11-r22
Dengan mengganti SD√1−r11 untuk SEM1 dan SD√1−r22 untuk SEM2, kita dapat menuliskan
rumus ini kembali secara langsung dalam kaitan dengan koefisien reliabilitas, sebagai
berikut:
Dalam substitusi ini, SD yang sama digunakan untuk tes 1 dan 1, karena skor-skornya harus
diungkapkan dalam kaitan dengan skala yang sama sebelum dibandingkan. Hal ini terdapat
dalam tes WAIS-R.
G. RELIABILITAS DITERAPKAN PADA TES PENGUASAAN DAN SKOR
POTONG
Implikasi utama dari pengetesan penguasaan adalah reduksi dalam variabilitas skor-skor di
kalangan individu. Setiap korelasi yang ada, termasuk koefisien-koefisien reliabilitas,
dipengaruhi oleh variabilitas kelompok tempat koefisien itu dihitung. Bila reliabilitas sampel
menurun, koefisien korelasinya akan turut menurun.
Dalam praktik sesungguhnya, tes-tes ini digunakan untuk membedakan antara orang yang
memiliki dan orang yang tidak memiliki keterampilan dan pengetahuan yang dibutuhkan
untuk aktivitas tertentu. Tujuan khusus pengadaan tes ini dapat sangat bervariasi, dari
memperoleh izin mengemudi atau penugasan pada pekerjaan khusus tertentu sampai maju ke
unit berikut dalam program pengajaran yang dibuat khusus untuk individu atau penerimaan
pada program belajar tertentu.
BAB III
PENUTUP
A. KESIMPULAN
dengan uji reliabilitas maka penelitian yang dihasilkan akan memiliki sebuah mutu yang
berkualitas. Karena penelitian yang sudah melalui uji penelitian sudah dianggap bagus dan
memenuhi standart.
Berikut adalah jenis-jenis uji reliabilitas yang dibagi menjadi 3 jenis yaitu :
1. Reliabilitas Stabil (Stability Reliability)
2. Reliabilitas Terwakili (Representative Reliability)
3. Reliabilitas Seimbang (Equivalence Reliability)
Ada tiga teknik dasar yang dapat diterapkan oleh peneliti dalam menguji Reliabilitas suatu
penelitian yaitu:
1. Teknik pengukuran ulang (test-retest)
2. Teknik belah dua
3. Teknik paralel (equivalent form)
Ada dua Peranan Koefisien Reliabilitas yaitu :
1. Reliabilitas pada Gabungan Sekor (Komposit)
2. Reliabilitas pada Selisih Sekor
Didalam pengujian sebuah hasil penelitian juga diperlukan sebuah rumus-rumus untuk
menunjukkan bahwa hasil penelitian yang kita lakukan valid dan dapat dipertanggung
jawabkan.
B. SARAN
Semoga dengan adanya makalah ini mampu membantu para peneliti dalam pengujian setiap
hasil penelitian yang dilakukannya.
Dan diharapkan dengan adanya makalah ini tidak hanya berguna bagi para peneliti saja,
namun bagi semua khalayak umum yang dimana mampu menunjang dalam hal pendidikan
dan sosial.
DAFTAR PUSTAKA