makalah psikometri

KATA PENGANTAR

Puji syukur saya panjatkan kepada Allah SWT karena berkat rahmat-Nyalah laporan ini selesai

tepat pada waktunya. Tak lupa ucapan terimakasih saya ucapkan kepada:

1. Seluruh dosen mata kuliah Psikometri yang telah memberikan pemahaman terkait topic.

2. Orang tua saya yang telah memberikan dukungan yang bersifat material maupun

immaterial.

3. Semua teman saya yang telah turut memberikan informasi terkait topik, yang tidak dapat

disebutkan satu-persatu.

Akhirnya penulis berharap semoga Allah memberikan imbalan yang setimpal pada mereka yang

telah memberikan bantuan, dan dapat menjadikan semua bantuan ini sebagai ibadah, Amiin Yaa

Robbal ‘Alamiin.

Laporan ini disusun sebagai langkah untuk memahami konsep pembelajaran siswa dalam rangka

untuk mengetahui aplikasi teori skinner terhadap pembelajaran. Dalam Penulisan laporan ini

penulis merasa masih banyak kekurangan-kekurangan baik pada teknis penulisan maupun

materi, mengingat akan kemampuan yang dimiliki penulis. Untuk itu kritik dan saran dari

semua pihak sangat penulis harapkan demi penyempurnaan pembuatan laporan ini. Semoga

materi ini dapat bermanfaat dan menjadi sumbangan pemikiran bagi pihak yang

membutuhkan,khususnya bagi penulis sehingga tujuan yang diharapkan dapat tercapai, Amiin.

DAFTAR ISI

KATA PENGANTAR

........................................................................................................................

1

DAFTAR ISI

........................................................................................................................

2

BAB I PENDAHULUAN

A. LATAR BELAKANG

........................................................................................................................

3

........................................................................................................................

B. TUJUAN PENELITIAN

........................................................................................................................

4

BAB II PEMBAHASAN

A. PENGERTIAN RELIABILITAS...............................................................5

B. KOEFISIEN KORELASI...........................................................................9

C. JENIS-JENIS RELIABILITAS..................................................................

D. RELIABILITAS YANG DIPERCEPAT...................................................

E. KETERGANTUNGAN KOEFISIEN RELIABILITAS..........................

F. KESALAHAN STANDAR PENGUKURAN............................................

G. RELIABILITAS DITERAPKAN PADA TES DAN SKOR....................

BAB III PENUTUP

A. KESIMPULAN

........................................................................................................................

17

B. SARAN

........................................................................................................................

18

DAFTAR PUSTAKA

BAB I PENDAHULUAN

A. LATAR BELAKANG

Salah satu aspek positif kemajuan dari dunia penelitian yang ada di Indonesia, adalah muncul

banyaknya para peneliti-peneliti muda yang kini lebih kritis lagi dalam meneliti objek-objek

yang ada. Di Indonesia, banyak sekali para peneliti ataupun bukan peneliti yang banyak

melakukan sebuah riset guna memenuhi tugas ataupun sebagai pembuktian dari sebuah

kejadian. Yang dimana setiap penelitian tersebut biasanya memerlukan sebuah pengujian

agar nantinya mampu menjadi sebuah hasil ilmiah yang benar-benar valid dan bersifat riel

tanpa adanya kebohongan ataupun ketidaknyataan yang mengesankan data yang diperoleh

bersifat dibuat-buat. Agar kajian kita bisa bersifat riel maka kita sebagai seorang peneliti

harus menguji terlebih dahulu hasil penelitian kita yang disebut dengan uji reabilitas.

Kebanyakan dari kita mengira bahwa jika kita mempunyai kesimpulan dari hasil penelitian

kita terhadap kejadian-kejadian yang terbatas, maka kesimpulan itu berlaku dengan sempurna

untuk seluruh kejadian yang sejenis. Perkiraan semacam itu sama sekali tidak benar dan

sangat menyesatkan (Sutrisno, 1981). Nah untuk menghindari hal-hal yang semacam itu

maka kita harus melakukan reabilitas, yang berguna untuk menunjukkaan kevalidtan dari

hasil sebuah penelitian yang kita lakukan.

Uji reliabilitas mampu menunjukkan tingkat kepercayaan terhadap sekor atau tingkat

kecocokan sekor dengan sekor sesungguhnya. Rebilitas ini bisa dicapai melalui tingkat

kecocokan di antara sekor pada lebih dari sekali pengukuran. Jika makin cocok dengan sekor

sesungguhnya maka makin tinggi tingkat reliabilitasnya. Kalaupun ada ketidakcocokan itu

merupakan kekeliruan yang acak. Jadi kemungkinan munculnya kesalahan masih tetap ada,

namun kemungkinan itu sangatlah kecit sekali dan tidak akan banyak berpengaruh terhadap

hasil akhir dari sebuah pengujian.

B. TUJUAN PENELITIAN

Mengkonsep satu variable dengan jelas. Setiap pengukuran harus merujuk pada satu dan

hanya satu konsep /variable. Sebuah variable harus spesifik agar dapat menguragiintervensi

informasi dari variable lain. Menggunakan level pengukuran yang tepat. Semakin tinggi atau

semakin tepat level pengukuran, maka variable yang dibuat akan semakin reliable karena

informasi yang dimiliki semakin mendetail.

Prinsip dasarnya adalah mencoba melakukan pengukuran pada level paling tepat yang

mungkin diperoleh. Gunakan lebih dari satu indicator. Dengan adanya lebih dari satu

indikatoryang spesifik , peneliti dapat melakikan pengukuran dari range yang lebih luas

terhadapkonten definisi konseptual. Gunakan tes pilot, yakni dengan membuat satu atau lebih

draftatau dalam sebuah pengukuran sebelum menuju ke tahap hipotesis (pretest). Dalam

penggunaan pilot studies, prinsipnya adalah mereplikasi pengukuran yang pernah dilakukan

oleh peneliti terdahulu dari literature-literatur yag berkaitan.

Selanjutnya, pengukuran terdahulu dapat dipergunakan sebagai patokan dari pengukuran

yang dilakukan peneliti saat ini. Kualitas pengukuran dapat ditingkatkan dengan berbagai

cara sejauh definisi dan pemahaman yang digunakan oleh peneliti kemudian tetap sama.

Pada konstruksi alat ukur, perhitungan reliabilitas berguna untuk melakukan perbaikan pada

alat ukur yang dikonstruksi. Dimana perbaikan alat ukur dilakukan melalui analisis butir

untuk mengetahui butir mana yang perlu diperbaiki. Namun pada pengukuran sesungguhnya,

perhitungan reliabilitas dilakukan untuk memberi informasi tentang kualitas sekor hasil ukur

kepada mereka yang memerlukannya. Tentunya perolehan tersebut bisa di jadikan acuan bagi

peneliti untuk menghasilkan penelitian yng bisa dipertanggung jawabkan di kemudian hari.

BAB II PEMBAHASAN

A. Pengertian Reliabilitas

Reliabilitas, atau keandalan merupakan konsistensi dari serangkaian pengukuran atau

serangkaian alat ukur. Hal tersebut bisa berupa pengukuran dari alat ukur yang sama (tes

dengan tes ulang akan memberikan hasil yang sama, atau untuk pengukuran yang lebih

subjektif, apakah dua orang penilai memberikan skor yang mirip (reliabilitas antar penilai).

Pada penelitian reliabilitas tak lepas dari ketergantungan (dependabiliti). Konsep

ketergantungan ini sangat berkaitan erat dengan keterandalan. Hasil dari pengujian awal

diharapkan akan konsisten dangan pengujian-pngujian berikutnya. Hasil selalu berupa

numerik dan tidak boleh berubah-ubah, karena merupakan karakteristik dari proses ukuran.

Reliabilitas selalu menunjukan keandalan instrument penelitian dalam berbagai bentuk,yakni

hasil pengujian yang sama jika dilakukan oleh orang yang berbeda (inter-penilai), hasil

pengujian yang sama jika dilakukan oleh orang yang sama dalam waktu berbeda (pengetesan

ulang),hasil pengujian yang sama jika dilakukan oleh orang yang berbeda dalam waktu yang

bersamaan dengan tes yang berbeda (bentuk pralel), dan hasil pengujian yang sama dengan

menggunakan berbagai pernyatan-pernyataan membangun (konsistensi internal).

Reliabilitas merupakan konsistensi skor yang dicapai oleh orang yang sama ketika mereka

diuji ulang dengan tes yang sama dalam kesempatan berbeda, atau dengan seperangkat item

yang ekuivalen, atau juga dapat berada dalam kondisi pengujian yang berbeda. Dalam

pengertian luas, reliabilitas tes menunjukkan sejauh mana perbedaan-perbedaan individu

dalam skor tes dapat dianggap sebagai penyebab dari perbedaan atau penyebab dari

kesalahan dalam pencarian peluang. Dewasa ini, para psikolog menerima variabilitas sebagai

segi instrinsik semua perilaku dan berusaha menyelidiki serta memilah banyak sumber

variabilitas semacam itu.

Reliabilitas skor bergantung pada definisi varian kesalahan. Faktor-faktor yang dapat

dianggap sebagai varian kesalahan untuk satu tujuan dapat dianggap sebagai varian

kebenaran dalam tujuan lain. Contoh, jika kita ingin mengukur fluktuasi suasana hati, maka

perubahan dari hari ke hari pada skor kegembiraan-depresi akan relevan bagi maksud tes ini

dan karenanya, akan menjadi bagian dari varian kebenaran skor yang ada.

Setiap tes seharusnya didampingi oleh pernyataan reliabilitas. Ketika penguji berusaha

mempertahankan kondisi-kondisi pengetesan dengan mengendalikan lingkungan pengetesan,

instruksi, batas waktu, rapport, dan faktor lainnya, mereka berusaha mengurangi varian

kesalahan dan membuat skor-skor tes lebih dapat dipercaya. Meskipun telah dikondisikan tes

dengan kondisi pengetesan maksimum, tak satu tes pun dapat dipercaya seratus persen.

Karena semua jenis reliabilitas menyangkut derajat konsistensi atau kesepakatan antara dua

perangkat skor yang diturunkan secara independen, semua jenis reliabilitas dapat

diungkapkan dalam istilah koefisien korelasi.

B. KOEFISIEN KORELASI

Koefisien korelasi menyatakan derajat kesesuaian atau hubungan antara dua perangkat skor.

Dengan demikian, jika individu dengan skor tertinggi pada variabel 1 juga mendapatkan skor

tertinggi pada varabel 2. Individu nomor dua terbaik pada variabel 1 juga nomor dua terbaik

pada variabel 2, dan seterusnya, sampai dengan individu yang memiliki skor terendah. Akan

ada korelasi sempurna antara variabel 1 dan 2. Korelasi seperti ini akan memiliki nilai +1,00.

Korelasi nol menunjukkan tidak adanya hubungan sama sekali, sebagaimana hal ini dapat

terjadi karena adanya peluang. Jika setiap sampel diperoleh secara acak untuk menentukan

variabel 1 dan variabel 2, maka korelasi nol atau mendekati- nol akan terjadi. Dalam kondisi

ini, akan mustahil memprediksi posisi relatif individu dakan variabel 2 berdasarkan

pengetahuannya mengenai variabel 1. Orang dengan skor tertinggi pada variabel 1 mungkins

aja memiliki skor yang berbeda dengan variabel 2.

Koefisien korelasi bisa dihitung dengan berbagai cara, tergantung pada hakikat data. Yang

paling umum adalah koefisien korelasi produk-momen Pearson. Koefisien korelasi ini tidak

hanya mempertimbangkan posisi orang dalam kelompok, namun juga besar simpangannya di

atas atau di bawah rata-rata kelompok. Bila posisi tiap orang dinyatakan dalam kaitan-kaitan

skor standar, orang yang ada di atas rata-rata akan menerima skor standar positif, sementara

yang ada di bawah rata-rata akan menerima skor negatif.

Dalam praktik sesungguhnya tidak mutlak perlu adanya konversi setiap raw score ke dalam

skor standar sebelum menemukan hasil silangnyam karena konversi ini bisa dibuat sekali

untuks elamanya setelah hasil silang ditambahkan.

SIGNIFIKANSI STATISTIK

Dalam riset psikologis biasanya kita tertarik untuk melakukan generalisasi di atas sampel

particular individu yang di tes sampai populasi yang diwakili sampel itu. Contoh:

Kita mungkin ingin tahu apakah matematika dan kemampuan membaca punya korelasi

diantara anak-anak sekolah Amerika yang usianya sama seperti anak-anak sekolah yang kita

tes. Yang jelas, 10 kasus misalnya, yang sungguh-sungguh di tes tidak akan merupakan

sampel yang memadai untuk generalisasi bagi populasi seluas itu. Sa,pel berukuran sama

lainnya, yang dapat dibandingkan akan menghasilkan koreasi yang jauh lebih rendah atau

lebih tinggi.

Ada prosedur statistic untuk memperkirakan fluktuasi yang mungkin untuk bisa diharapakan

dari sampel ke sampel dalam ukuran dari korelasi, rata-rata, simpangan baku, dan ukuran-

ukuran kelompok lain manapun. Ketika kita mengatakan bahwa korelasi itu “signifikan pada

tingkat 1% (0,01)”, kita memaksudkan bahwa peluang-peluangnya tidak lebih besar daripada

1 dari 100 sehingga korelasi populasinya 0.

Tingkat signifikansi merujuk pada resiko kesalahan yang hendak kita tanggung dalam

menarik kesimpulan dari data kita. Selama bertahun-tahun, tingkat signifikansi merupakan

cara tradisional untuk mengevaluasi korelasi. Namun, sudah mulai disadari bahwa prosedur

ini memiliki kekurangan dan cacah, korelasi yang tinggipun bahkan gagal memenuhi “tes

signifikansi”.

Pendekatan lain yang semakin mendapat perhatian mempertimbangkan besaran actual

korelasi yang didapatkan dan memperkirakan “interval kepercayaan” di dalam korelasi

populasi kemungkinan jatuh pada tingkat kepercayaan yang spesifik. (lihat, misalnya Carver

1993). Tren terhadap interval kepecayaan sebagai suplemen dan bukan pengganti untuk

pengetesan signifikansi, membayang-bayangi pergeseran penting dalam analisis atas

koefisien korelasi dalam tahun-tahun mendatang.

KOEFISIEN RELIABILITAS

Koefisien korelasi telah digunakan dalam analisis data psikometrik. Pengukuran reliabilitas

tes mewakili satu aplikasi koefisien-koefisien seperti ini. Contoh sebuah koefisien reliabilitas

yang dihitung oleh metode produk momen Pearson, (grafik 4-3 Hal:101). Dalam kasus ini,

skor-skor 104 orang pada bentuk-bentuk ekuivalen dari tes-tes World Fluency2 memiliki

korelasi. Dalam satu bentuk, para peserta tes diberi waktu 5 menit untuk menulis sebanyak

mungkin kata-kata yang dimulai dengan sebuah surat yang ada. Bentuk kedua sama, kecuali

surat lain yang digunakan. Dua surat ini dipilih oleh para penulis tes karena untuk maksud ini

kesulitannya hamper sama. Koralasi antara jumlah kata-kata yang tertulis dalam dua bentuk

tes ini adalah 0,72. Korelasi ini tinggi dan signifikan pada tingkat 0,01.

C. JENIS-JENIS RELIABILITAS

Reliabilitas Tes-Retes

Metode paling jelas untuk menemukan reliabilitas skor tes ialah dengan mengulang tes yang

sama pada kesempatan kedua. Koefisien reliabilitas dalam kasus ini hanyalah korelasi antara

skor-skor yang didapatkan oleh orang yang sama pada dua penyelenggaraan tes. Varian

kesalahan berhubungan dengan fluktuasi acak kinerja dari satu kesempatan tes ke

kesempatan lainnya.

Variasi-variasi ini sebagian diakibatkan dari kondisi pengetesan yang tidak terkontrol seperti

perubahan eksterm pada cuaca, ujung pensil yang patah, dan lain-lain. Di samping itu juga

terdapat variasi-variasi yang muncul dari peserta tes itu sendiri, seperti sakit, letih,

ketegangan emosi, kecemasan, dan lain-lain. Reliabilitas tes ulang menunjukkan sejauh mana

skor pada tes dapat digeneralisasikan untuk berbagai kesempatan yang berbeda, makin tinggi

reliabilitasnya, makin rentanlah skor terhadap perubahan sehari-hari yang acak dalam kondisi

peserta tes atau lingkungan pengetesan.

Meskipun tampak sederhana dan blak - blakan, teknik tes dan tes ulang menampilkan

berbagai kesulitan ketika diterapkan pada kebanyakan tes psikologis. Praktik mungkin akan

menghasilkan kadar perbaikan yang bervariasi dalam skor-skor retes individu yang berbeda.

Akan tetapi, untuk sebagian besar tes-tes psikologis, pengetesan ulang (retes) dengan tes

yang sama bukanlah teknik yang tepat untuk menemukan koefisien reliabilitas.

Reliabilitas Bentuk-Alternatif

Satu cara untuk menghindari kesulitan yang ditemukan dalam reliabilitas tes dan tes ulang

adalah melalui penggunaan bentuk-bentuk tes lainnya. Dengan demikian, orang yang sama

bisa dites dengan satu bentuk pada kesempatan kedua. Korelasi antara skor-skor yang

didapatkan pada dua bentuk itu merupakan keofisien reliabilitas tes. Perlu dicatat bahwa

koefisien reliabilitas semacam itu adalah ukuran stabilitas temporal dan konsistensi respons

terhadap berbagai butir soal contoh (bentuk-bentuk tes). Dengan begitu, koefisien ini

menggabungkan dua jenis reliabilitas. Akan tetapi, karena dua jenis ini penting bagi

kebanyakan maksud pengetesan, reliabilitas bentuk-alternatif memberikan ukuran yang

berguna untuk mengevaluasi banyak tes.

Seperti reliabilitas retes, reliabilitas bentuk-alternatif seharusnya selalu disertai oleh

pernyataan tentang panjang interval antara penyelenggaraan tes, dan juga deskripsi

pengalaman-pengalaman relevan yang memengaruhi. Jika kedua bentuk itu diselenggarakan

langsung berturut-turut, korelasi yang dihasilkan menunjukan reliabilitas antara bentuk-

bentuk saja, bukan antara peristiwa-peristiwa. Varian kesalahan dalam kasus ini

merepresentasikan fluktuasi dalam kinerja dari satu perangkat soal ke perangkat lain, tetapi

tidak merepresentasikan fluktuasi sepanjang waktu.

Dalam pengembangan bentuk-bentuk alternative, tentu saja harus dicurahkan perhatian untuk

memastikan bahwa, bentuk-bentuk itu betul-betul parallel. Secara mendasar, bentuk-bentuk

paralel tes seharusnya merupakan tes-tes yang disusun secara mandiri untuk memenuhi

spesifikasi yang sama. Tes-tes ini seharusnya berisi jumlah soal yang sama dan seharusnya

mencakup jenis isi yang sama. Kisaran dan tingkat kesulitan soal-soal ini seharusnya juga

sama. Instruksi, batas waktu, contoh-contoh ilustratif, format, dan semua aspek tes lain harus

dicek dalam hal ekuivalensinya.

Reliabilitas Belah-Separuh (Split-half Reliability)

Dari penyelenggaraan tunggal atas satu bentuk tes, mungkin untuk mencapai ukuran

reliabilitas lewat berbagai prosedur belah-separuh. Dengan cara ini, dua skor didapatkan

untuk setiap orang dengan membagi tes menjadi paruhan-paruhan yang ekuivalen. Tampak

bahwa reliabilitas belah-separuh merupakan ukuran yang konsisten dalam kaitan dengan

sampling isi. Stabilitas sementara skor-skor tidak masuk dalam reliabilitas semacam itu,

karena hanya ada satu kesempatan tes. Jenis reliabilitas ini kadang kala disebut koefisien

konsistensi internal, karena hanya dibutuhkan penyelenggaraan tunggal atas satu bentuk tes.

Untuk mendapatkan reliabilitas belah-separuh, masalah pertama adalah bagaimana membagi

tes dalam rangka mendapatkan paruhan-paruhan yang paling ekuivalen. Tes apa pun bisa

dibagi dengan berbagai cara. Dalam kebanyakan tes, paruhan yang pertama dan paruhan

kedua tidak akan ekuivalen, tergantung pada perbedaan dan tingkat kesulitan soal, dan juga

efek-efek kumulatif pemanasan, praktik, keletihan, kebosanan, dan banyak factor lain yang

berbeda-beda dari awal sampai akhir tes. Prosedur yang memadai bagi kebanyakan maksud

adalah mendapatkan skor pada soal-soal genap dan ganjil dari tes. Jika soal-soal ini aslinya

diatur menurut tingkat kesulitan yang kurang lebih sama, pembagian seperti itu akan

menghasilkan skor-separuh yang hampir ekuivalen. Satu hal yang perlu diwaspadai dalam

membuat pemisahan ganjil-genap seperti itu berkaitan dengan kelompok-kelompok butir soal

yang berhadapan dengan satu masalah, seperti pertanyaan-pertanyaan yang merujuk pada

diagram mekanis tertentu atau halaman tertentu dalam tes membaca. Dalam kasus ini,

seluruh kelompok soal seharusnya tetap disatukan dengan satu atau separuh lainnya.

Seandainya soal-soal dalam kelompok semacam ini harus ditempatkan dalam paruhan-

paruhan tes yang berbeda dari tes, kesamaan skor-skor paruhan akan dibesar-besarkan,

karena kesalahan tunggal apa pun dalam memahami masalah ini akan memengaruhi soal-soal

dalam kedua paruhan.

Begitu dua skor-paruhan ini didapatkan untuk tiap orang, skor-skor ini bisa dikorelasikan

dengan metode yang biasa. Akan tetapi, seharusnya dicatat bahwa korelasi ini sesungguhnya

memberikan reliabilitas dari separuh-tes saja. Contohnya, jika seluruh tes terdiri dari 100

butir soal, korelasinya dihitung antara dua perangkat skor yang masing-masing didasarkan

pada 50 soal. Di pihak lain, dalam reliabilitas tes-retes dan reliabilitas bentuk alternative, tiap

skor didasarkan pada jumlah soal penuh pada tes.

Jika semuaa hal sama, semakin panjang tes, semakin dapat diandalkan tes itu. Masuk akal

jika kita berekspektasi bahwa, dengan sampel perilaku lebih besar, kita akan sampai pada

ukuran lebih memadai dan lebih konsisten. Efek yang akan dihasilkan pada koefisiennya

dengan memperpanjang atau memperpendek tes, dapat diperkirakan dengan rumus

Spearman-Brown, seperti berikut:

rnm =nrtt

1+ (n−1 ) rtt

dimana rnm adalah koefisien yang diperkirakan , rnm adalah koefisien yang diperoleh, dan n

adalah jumlah waktu tes itu diperpanjang atau diperpendek. Jadi, jika jumlah soal tes

ditingkatkan dari 25 menjadi 100, n adalah 4; jika diturunkan dari 60 ke 30, n adalah ½.

Rumus Spearman-Brown digunakan secara luas dalam menghitung reliabilitas dalam bentuk

ini. Ketika diterapkan pada reliabilitas belah-separuh, rumus ini selalu melibatkan

penggandaan panjang tes. Dalam kondisi ini, rumus itu dapat disederhanakan sebagai

berikut:

rtt = 2 r bb

1+r bb

untuk rbb adalah korelasi dari tes-tes paruhan.

Metode alternatif untuk mendapatkan reliabilitas belah-separuh dikembangkan oleh Rulon

(1939). Hanya dibutuhkan varian dari perbedaan antara skor-skor tiap orang pada dua tes-tes

separuh (SD2d

) dan varian skor total ( SD 2x ) dua nilai ini disubstitusikan dalam rumus

berikut, yang menghasilkan reliabilitas seluruh tes secara langsung :

rtt = 1- SD 2

d

SD 2x

menarik untuk memperhatikan hubungan rumus ini dengan definisi varian kesalahan.

Perbedaan apa pun antara skor-skor seseorang pada dua tes paruhan menampilkan varian

kesalahan atau varian yang tidak relevan. Varian-varian perbedaan-perbedaan ini, dibagi

dengan varian skor-skor total, memberikan proporsi varian kesalahan dalam skor-skor itu.

Ketika varian skor ini dikurangkan dari 1,00, hasilnya adalah proporsi varian “benar” untuk

penggunaan tes tertentu, yang sama dengan koefisien reliabilitas.

Reliabilitas Kuder-Richardson dan Koefisien Alpha

Metode keempat untuk mendapatkan reliabilitas, yang juga menggunakan administrasi

tunggal dari suatu bentuk tunggal, didasarkan pada konsistensi respons terhadap semua butir

soal dalam tes. Konsistensi antarsoal ini dipengaruhi oleh dua sumber varian kesalahan: (1)

pencuplikan isi ( sebagaimana dalam bentuk alternatif dan reliabilitas belah-separuh); (2)

heterogenitas dari domain perilaku yang disampelkan. Semakin homogeny domainnya,

semakin tinggilah konsistensi antarsoal. Contoh , jika suatu tes mencakup soal perkalian saja,

sementara yang lain memuat soal-soal pertambahan, pengurangan, perkalian dan pembagian

tes terdahulu barangkali akan menunjukan lebih banyak konsistensi antarsoal daripada yang

kedua tersebut. Dalam tes kedua, yang lebih heterogen, satu peserta tes bisa menunjukkan

kinerja lebih baik dalam pengurangan daripada dalam operasi aritmetik lainnya, sedangkan

peserta tes lainnya bisa mencapai skor yang relative baik pada tes pembagian, tetapi kurang

baik pada penambahan, pengurangan, dan perkalian, dan seterusnya. Sampel yang lebih

ekstrem akan ditunjukkan oleh tes terdiri dari 40 soal kosakata, yang kontras dengan tes yang

terdiri dari 10 kosakata, 10 hubungan ruang, 10 penalaran aritmetik, dan 10 soal kecepatan

persepsi. Dalam tes kedua, barangkali tidak ada atau ada sedikit hubungan antara kinerja

individu pada berbagai jenis soal.

Tampak bahwa skor tes akan menjadi kurang ambigu bila berasal dari tes-tes yang relatif

homogeny. Andaikan dalam tes 40 soal amat heterogen yang dikutip sebelumnya, baik smith

maupun jones mendapatkan nilai 20. Bisakah kita menyimpulkan bahwa kinerja keduanya

pada tes ini sama? Sama sekali tidak. Smith mungkin telah menyelesaikan 10 soal kosakata

dengan benar, 10 soal kecepatan persepsi dan tidak satupun soal penalaran aritmetik dan

hubungan ruang. Sebaliknya, jones mungkin telah menerima skor 20 dengan menyelesaikan

5 soal kecepatan persepsi, 5 hubungan ruang, 10 penalaran aritmetik, dan tidak satupun soal

kosakata.

Banyak kombinasi lain yang jelas bisa menghasilkan skor total sama 20. Skor ini akan

memiliki arti yang berbeda jika didapatkan lewat kombinasi soal-soal yang tidak sama.

Dalam tes kosakata yang relatif homogeny, di pihak lain, skor 20 barangkali akan berarti

bahwa peserta tes telah berhasil dengan 20 kata pertama, jika soal-soalnya diatur dalam

tingkat kesulitan yang meningkat. Ia bisa gagal pada dua atau tiga kata lebih mudah dan

dengan tepat memberikan respons pada dua atau tiga soal lebih sulit di atas kata ke-20 ,tetapi

variasi individu seperti ini agak berbeda dalam perbandingan dengan variasi yang ditemukan

dalam tes yang lebih heterogen.

Pertanyaan yang amat relevan dalam kaitan ini adalah apakah criteria yang sedang diprediksi

oleh tes itu pada dirinya sendiri relatif homogen atau heterogen. Meskipun tes-tes homogeny

lebih disukai karena skor-skornya memungkinkan interpretasi yang agak tidak ambisius, tes

homogen jelas bukan predictor yang memadai menurut criteria yang amat heterogen. Lagi

pula, dalam prediksi yang punya criteria heterogen, heterogenitas soal-soal tes tidak akan

dengan sendirinya mewakili varian kesalahan. Tes-tes inteligensi tradisional memberikan

contoh yang baik tentang tes-tes heterogen yang dirancang untuk memprediksi criteria

heterogen. Akan tetapi, dalam kasus semacam ini, mungkin lebih baik menyusun berbagai tes

yang relatif homogeny, masing-masing mengukur berbagai fase criteria heterogen. Jadi,

interpretasi tidak ambigu atas skor-skor tes bisa dipadukan dengan cakupan criteria yang

memadai.

D. RELIABILITAS YANG DIPERCEPAT

E. KETERGANTUNGAN KOEFISIEN RELIABILITAS

F. KESALAHAN STANDAR PENGUKURAN

Interpretasi Skor-skor Individu (Standard Error of Measurement)

SEM lebih banyak digunakan dalam pengetesan daripada koefisien reliabilitas. Kesalahan

pengukuran standar bisa dihitung dengan rumus berikut:

SEM = SDt √1−r tt

SDt = simpangan baku skor tes

rtt = koefisien reliabilitas

Misalnya, jika IQ simpangan pada tes inteligensi tertentu memiliki simpangan baku 15 dan

koefisien reliabilitas 0,89, SEM IQ pada tes ini adalah: 15√ t−0,89tt = 15 √0,11 = 15 (0,33) =

5.

Kesalahan standar pengukuran dan koefisien reliabilitas merupakan cara-cara alternatif untuk

mengungkapkan reliabilitas tes. Tidak seperti koefisien reliabilitas, kesalahan pengukuran

bersifat independen terhadap variabilitas kelompok berdasarkan kesalahan pengukuran

dihitung.Untuk menginterpretasikan skor individu, kesalahan standar pengukuran merupakan

alat yang lebih tepat.

Akan tetapi, perbedaan dalam koefisien-koefisien reliabilitas maupun kesalahan-kesalahan

pengukuran tidak bisa diandaikan tetap konstan ketika tingkat kemampuan sangat bervariasi.

SEM memberikan perlindungan terhadap penekanan yang tidak tepat pada skor numerik

tunggal.

Interpretasi Perbedaan Skor

Tiap skor dapat berfluktuasi, yang berfungsi sebagai alat pemeriksa penekanan yang

ebrlebihan pada perbedaan-perbedaan kecil antara skor-skor. Sikap hati-hati seperti ini perlu

ada, baik bila membandingkan skor tes dari orang yang berbeda maupun ketika

membandingkan skor tes dari orang yang berbeda maupun ketika membandingkan skor

individu yang sama dalam kemampuan yang berbeda. Pertanyaan yang sering diajukan

tentang skor-skor tes berhubungan dengan posisi relatif individu pada berbagai area.

Perbedaan yang ada dipengaruhi oleh kesalahan-kesalahan peluang yang ada dalam suatu

skor. Kesalahan standar tentang perbedaan antara dua skor dapat ditemukan dari kesalahan

standar perbedaan antara dua skor dan SEM1 dan SEM2 adalah kesalahan standar dari

pengukuran skor-skor yang terpisah.

SEdiff = SD √2−r11-r22

Dengan mengganti SD√1−r11 untuk SEM1 dan SD√1−r22 untuk SEM2, kita dapat menuliskan

rumus ini kembali secara langsung dalam kaitan dengan koefisien reliabilitas, sebagai

berikut:

Dalam substitusi ini, SD yang sama digunakan untuk tes 1 dan 1, karena skor-skornya harus

diungkapkan dalam kaitan dengan skala yang sama sebelum dibandingkan. Hal ini terdapat

dalam tes WAIS-R.

G. RELIABILITAS DITERAPKAN PADA TES PENGUASAAN DAN SKOR

POTONG

Implikasi utama dari pengetesan penguasaan adalah reduksi dalam variabilitas skor-skor di

kalangan individu. Setiap korelasi yang ada, termasuk koefisien-koefisien reliabilitas,

dipengaruhi oleh variabilitas kelompok tempat koefisien itu dihitung. Bila reliabilitas sampel

menurun, koefisien korelasinya akan turut menurun.

Dalam praktik sesungguhnya, tes-tes ini digunakan untuk membedakan antara orang yang

memiliki dan orang yang tidak memiliki keterampilan dan pengetahuan yang dibutuhkan

untuk aktivitas tertentu. Tujuan khusus pengadaan tes ini dapat sangat bervariasi, dari

memperoleh izin mengemudi atau penugasan pada pekerjaan khusus tertentu sampai maju ke

unit berikut dalam program pengajaran yang dibuat khusus untuk individu atau penerimaan

pada program belajar tertentu.

BAB III

PENUTUP

A. KESIMPULAN

dengan uji reliabilitas maka penelitian yang dihasilkan akan memiliki sebuah mutu yang

berkualitas. Karena penelitian yang sudah melalui uji penelitian sudah dianggap bagus dan

memenuhi standart.

Berikut adalah jenis-jenis uji reliabilitas yang dibagi menjadi 3 jenis yaitu :

1. Reliabilitas Stabil (Stability Reliability)

2. Reliabilitas Terwakili (Representative Reliability)

3. Reliabilitas Seimbang (Equivalence Reliability)

Ada tiga teknik dasar yang dapat diterapkan oleh peneliti dalam menguji Reliabilitas suatu

penelitian yaitu:

1. Teknik pengukuran ulang (test-retest)

2. Teknik belah dua

3. Teknik paralel (equivalent form)

Ada dua Peranan Koefisien Reliabilitas yaitu :

1. Reliabilitas pada Gabungan Sekor (Komposit)

2. Reliabilitas pada Selisih Sekor

Didalam pengujian sebuah hasil penelitian juga diperlukan sebuah rumus-rumus untuk

menunjukkan bahwa hasil penelitian yang kita lakukan valid dan dapat dipertanggung

jawabkan.

B. SARAN

Semoga dengan adanya makalah ini mampu membantu para peneliti dalam pengujian setiap

hasil penelitian yang dilakukannya.

Dan diharapkan dengan adanya makalah ini tidak hanya berguna bagi para peneliti saja,

namun bagi semua khalayak umum yang dimana mampu menunjang dalam hal pendidikan

dan sosial.

DAFTAR PUSTAKA

makalah psikometri

Documents