analisis karakteristik psikometri subtes zahlen
TRANSCRIPT
ANALISIS KARAKTERISTIK PSIKOMETRI SUBTES ZAHLEN
REINHEN (ZR) PADA INTELLIGENZ STRUKTUR TEST (IST)
SKRIPSI
Diajukan untuk Memenuhi Persyaratan
Ujian Sarjana Psikologi
Disusun Oleh:
ANDRIANI BUATON
131301104
FAKULTAS PSIKOLOGI
UNIVERSITAS SUMATERA UTARA
2017
Universitas Sumatera Utara
Universitas Sumatera Utara
Universitas Sumatera Utara
i
Analisis Karakteristik Psikometri Subtes Zahlen Reinhen (ZR) Pada
Intelligenz Struktur Test (IST)
Andriani Buaton1 dan Etti Rahmawati
2
ABSTRAK
Tujuan dari penelitian ini adalah untuk melengkapi kajian karakteristik
psikometri subtes ZR pada Intelligenz Struktur Test (IST). Proses yang dilakukan
dalam penelitian ini meliputi analisis indeks kesukaran aitem, indeks daya
diskriminasi aitem, analisis reliabilitas, dan analisis validitas dengan bukti
konkuren. Penelitian ini menggunakan data primer yang diperoleh dengan
memberikan tes secara klasikal kepada 167 sampel dengan rentang usia 17 sampai
dengan 20 tahun. Berdasarkan hasil analisis indeks kesukaran aitem dan indeks
daya diskriminasi aitem, ditemukan bahwa 15 dari 20 aitem memiliki kualitas
aitem yang baik. Hasil estimasi reliabilitas tes dan validitas berdasarkan bukti
konkuren menunjukkan bahwa subtes ZR masih valid namun tidak reliabel dalam
mengukur tujuan pengukuran subtes ZR pada sampel dengan rentang usia 17
sampai 20 tahun.
Kata Kunci : Karakteristik Psikometri, Bukti Konkuren, Intelligenz Struktur Test
(IST), Subtes ZR 1
1 Mahasiswa Fakultas Psikologi Universitas Sumatera Utara
2 Dosen Departemen Umum dan Eksperimen Fakultas Psikologi Universitas Sumatera Utara
Universitas Sumatera Utara
ii
Psychometric Characteristic Analysis Of Subtest Zahlen Reinhen (ZR) Of
Intelligenz Struktur Test (IST)
Andriani Buaton1 and Etti Rahmawati
2
ABSTRACT
The purpose of this study is to complete the analysis of pyschometric
characteristic of subtes ZR of Intelligenz Struktur Tes (IST). The processes
undertaken in this study includes the analysis of item-difficulty, item
discrimination, analysis of reliability and validity with concurrent evidence. This
study used primary data obtained by giving a classical tes to 167 samples with the
age range from17 to 20 years. Based on the the result of the analysis of item-
difficulty and item discrimination, it was found that 15 of the 20 items had good
item quality. The estimation of test reliability and validity based on concurrent
evidence showed that subtest ZR subtes is valid but not reliable in assessing the
purpose of measuring subtest ZR. But, the result of this study is limited to the
sample with an age range of 17 to 20 years.
Keywords : Psychometric Characteristic, Concurrent Evidence, Intelligenz
Struktur Test (IST), Subtest ZR
2
1 Student of Faculty of Psychology, University of North Sumatera
2 Lecturer of Departement of General and Experimental Psychology, University of North
Sumatera
Universitas Sumatera Utara
iii
KATA PENGANTAR
Puji dan syukur peneliti ucapkan kepada Tuhan Yang Maha Kuasa karena atas
karunia dan berkat rahmat-Nya maka peneliti dapat menyelesaikan penyusunan
skripsi ini dengan baik dan tepat. Penyusunan skripsi yang berjudul “Karakteristik
Psikometri Subtes Zahlen Reinhen (ZR) Pada Intelligenz Struktur Test (IST)”
merupakan salah satu syarat untuk dapat menyelesaikan ujian sarjana Psikologi di
Fakultas Psikologi Universitas Sumatera Utara Medan. Maksud penelitian ini
adalah untuk menggambarkan karakteristik psikomteri subtes ZR.
Peneliti menyadari bahwa dalam menyelesaikan penyusunan skripsi ini,
peneliti menerima banyak bantuan dan bimbingan dari berbagai pihak. Oleh
karena itu, dalam kesempatan ini, peneliti ingin mengucapkan terima kasih
kepada:
1. Bapak Zulkarnain, Ph.D, Psikolog, selaku Dekan Fakultas Psikologi
Universitas Sumatera Utara.
2. Ibu Etti Rahmawati, M. Si. selaku dosen pembimbing yang banyak membantu
peneliti dengan membagi ilmu, memberi masukan dan dorongan, dan
memberikan waktu untuk membimbing peneliti sehingga peneliti dapat
menyelesaikan penyusunan skripsi ini.
3. Ibu Debby Anggareni, M.Psi, psikolog selaku dosen pembimbing akademik
yang senantiasa membimbing peneliti dalam proses perkualiahan.
4. Ibu Ika Sari Dewi, M.Pd, Psikolog, Kak Dina Nazriani, MA dan Kak Amalia
Meutia M.Psi, psikolog yang merupakan dosen di Departemen Umum dan
Eksprimen yang memberikan masukan dan bantuan serta bersedia
Universitas Sumatera Utara
iv
memberikan waktunya untuk membimbing peneliti dalam menyelesaikan
penyusunan skripsi ini.
5. Ibu Yossie, Ibu Rodiatul Hasanah, Pak Ferry Novliadi, dan Kak Dian Ulfasari
yang bersedia membantu peneliti untuk dapat melakukan pengambilan data di
kelas Mahasiswa Psikologi USU Angkatan 2016.
6. Bapak, mama, bang Rio, Yanuari, Rohani, dan Apriani yang senantiasa
mendukung peneliti dan memberikan motivasi serta perhatian bagi peneliti
untuk dapat menyelesaikan skripsi ini.
7. Keluarga Besar Pomparan Op. Rumondang, Op. Melda, dan Op. Sarma yang
juga turut andil dalam memberikan dukungan dan perhatian kepada peneliti
selama proses penyusunan skripsi.
8. Bapa Uskup Keuskupan Sibolga, Mgr. Ludovicus Simanullang, OFM.Cap dan
Romo Blasius Super Yesse, pr yang telah memberikan motivasi rohani dan
mendukung peneliti.
9. KITA (Pebri, Pesta, Ira), ACITAW (Dina, Cia, Iyo, Tari, dan Widiya), dan
Wasti Simanjuntak yang senantiasa menjadi tempat sharing peneliti selama
proses pengerjaan skripsi.
10. Teman-teman satu perjuangan skripsi di Departemen Umum dan Eksperimen
khususnya mahasiswa bimbingan bu Etti (Kak Mida, Sinta, Nurul, dan Lila)
yang turut membantu peneliti dalam menyelesaikan skripsi ini.
11. Ester, Bang Rodho, Kak Dika, Kak Ester yang bersedia menjadi tester untuk
membantu peneliti dalam pengambilan data.
12. Adik-adik Mahasiswa Psikologi USU Angkatan 2016 yang bersedia
membantu peneliti dalam proses pengambilan data.
Universitas Sumatera Utara
v
13. Teman-teman Angkatan 2013 yang telah membantu peneliti dalam
memberikan masukan dan dorongan untuk membantu peneliti menyelesaikan
skripsi ini.
Peneliti menyadari bahwa masih banyak kekurangan dalam skripsi ini.
Oleh karena itu, peneliti mengharapkan segala kritik, saran dan masukan untuk
kesempurnaan skripsi ini. Akhir kata, peneliti mengucapkan terima kasih dan
semoga penelitian ini dapat bermanfaat bagi berbagai pihak.
Medan, 03 Agustus 2017
Andriani Buaton
131301104
Universitas Sumatera Utara
vi
DAFTAR ISI
ABSTRAK ........................................................................................................... i
ABSTRACT ......................................................................................................... ii
KATA PENGANTAR ......................................................................................... iii
DAFTAR ISI ........................................................................................................ vi
DAFTAR TABEL................................................................................................ ix
DAFTAR RUMUS .............................................................................................. x
DAFTAR LAMPIRAN ....................................................................................... xi
BAB I PENDAHULUAN ................................................................................. 1
A. Latar Belakang ....................................................................................... 1
B. Rumusan Masalah .................................................................................. 10
C. Tujuan Penelitian ................................................................................... 11
D. Manfaat Penelitian ................................................................................. 11
1. Manfaat Teoritis ............................................................................... 11
2. Manfaat Praktis ................................................................................ 11
E. Sistematika Penulisan............................................................................. 12
F. Kerangka Berpikir .................................................................................. 13
BAB II TINJAUAN PUSTAKA ....................................................................... 14
A. Intelligenz Struktur Tes (IST) ................................................................ 14
1. Sejarah Intelligenz Struktur Tes (IST) ............................................. 14
2. Subtes-subtes dalam Intelligenz Struktur Tes (IST) ....................... 15
3. Penelitian Terdahulu Subtes ZR...................................................... 15
4. Kriteria Tes Lain yang Relevan dengan Subtes ZR ......................... 17
B. Karakteristik Psikometri ........................................................................ 17
1. Validitas ........................................................................................... 18
a. Definisi validitas ........................................................................... 18
b. Sumber Bukti Validitas ................................................................. 19
c. Faktor-Faktor yang Mempengaruhi Validitas ............................... 23
d. Interpretasi Koefisien Validitas..................................................... 27
2. Reliabilitas........................................................................................ 29
a. Definisi reliabilitas ........................................................................ 29
b. Metode Estimasi Reliabilitas......................................................... 29
Universitas Sumatera Utara
vii
c. Faktor-Faktor yang Mempengaruhi Reliabilitas ........................... 33
d. Interpretasi Koefisien Reliabilitas ................................................. 34
3. Indeks Kesukaran Aitem .................................................................. 35
4. Indeks Daya Diskriminasi Aitem ..................................................... 37
C. Analisis Karakteristik Psikometri Subtes ZR Pada IST ......................... 38
BAB III METODE PENELITIAN .................................................................... 43
A. Jenis Penelitian ....................................................................................... 43
B. Subjek Penelitian .................................................................................... 43
1. Populasi dan sampel penelitian ........................................................ 43
2. Teknik Pengambilan Sampel ........................................................... 44
C. Data Penelitian ....................................................................................... 45
D. . Prosedur Pelaksanaan Penelitian ............................................................ 45
1. Pembuatan Proposal ......................................................................... 45
2. Persiapan Izin Penelitian .................................................................. 45
3. Pelaksanaan Penelitian ..................................................................... 45
4. Analisis Data .................................................................................... 46
E. Metode Pengumpulan Data .................................................................... 46
F. Analisis Data .......................................................................................... 46
1. Analisis Validitas ............................................................................. 46
2. Analisis Reliabilitas ......................................................................... 47
3. Analisis Indeks Kesukaran Aitem .................................................... 48
4. Analisis Indeks Daya Diskriminasi Aitem ....................................... 48
BAB IV HASIL DAN PEMBAHASAN............................................................. 50
A. Deskripsi Umum Data Penelitian............................................................ 50
B. Deskripsi Hasil Penelitian ....................................................................... 51
1. Hasil Analisis Indeks Kesukaran Aitem .......................................... 51
2. Hasil Analisis Indeks Daya Diskriminasi Aitem ............................. 51
3. Seleksi Aitem Berdasarkan Indeks Daya
Diskriminasi Aitem dan Indeks Kesukaran Aitem........................... 53
4. Hasil Analisis Validitas Berdasarkan Bukti Konkuren .................... 54
5. Hasil Analisis Reliabilitas ................................................................ 54
6. Analisis Tambahan TKD 6............................................................... 54
Universitas Sumatera Utara
viii
a. Hasil Analisis Indeks Kesukaran Aitem ..................................... 55
b. Hasil Analisis Indeks Daya Diskriminasi Aitem ........................ 55
c. Seleksi Aitem Berdasarkan Indeks Daya
Diskriminasi Aitem dan Indeks Kesukaran Aitem...................... 56
d. Hasil Analisis Reliabilitas ........................................................... 57
C. Pembahasan............................................................................................. 57
BAB V KESIMPULAN DAN SARAN .............................................................. 66
DAFTAR PUSTAKA .......................................................................................... 68
LAMPIRAN ......................................................................................................... 70
Universitas Sumatera Utara
DAFTAR TABEL
Tabel 1. Kategori Batasan Nilai p ....................................................................... 36
Tabel 2. Evaluasi Indeks Diskriminasi Aitem ...................................................... 38
Tabel 3. Proporsi Sampel Penelitian Berdasarkan Usia ....................................... 50
Tabel 4. Proporsi Sampel Penelitian Berdasarkan Jenis Kelamin ........................ 50
Tabel 5. Hasil Analisis Indeks Kesukaran Aitem Subtes ZR ............................... 51
Tabel 6. Rangkuman Analisis Indeks Kesukaran Aitem Subtes ZR .................... 51
Tabel 7. Hasil Analisis Indeks Daya Diskriminasi Aitem Subtes ZR .................. 52
Tabel 8. Rangkuman Analisis Indeks Daya Diskriminasi Aitem Subtes ZR ....... 52
Tabel 9. Seleksi Aitem Berdasarkan Indeks Kesukaran Aitem dan Indeks Daya
Diskriminasi Aitem Subtes ZR ............................................................... 53
Tabel 10. Rangkuman Analisis Aitem Subtes ZR ................................................ 54
Tabel 11. Hasil Analisis Indeks Kesukaran Aitem TKD 6 .................................. 55
Tabel 12. Rangkuman Analisis Indeks Kesukaran Aitem TKD 6........................ 55
Tabel 13. Hasil Analisis Indeks Daya Diskriminasi Aitem TKD ........................ 55
Tabel 14. Rangkuman Analisis Indeks Daya Diskriminasi Aitem TKD 6........... 56
Tabel 15. Seleksi Aitem Berdasarkan Indeks Kesukaran Aitem dan Indeks Daya
Diskriminasi Aitem TKD 6 .................................................................. 56
Tabel 16. Rangkuman Analisis Aitem TKD 6 ..................................................... 57
Universitas Sumatera Utara
x
DAFTAR RUMUS
Rumus 1. Koefisien korelasi Pearson-Product Moment ...................................... 46
Rumus 2. KR-20 ................................................................................................... 47
Rumus 3. Indeks Kesukaran Aitem ...................................................................... 48
Rumus 4. Indeks Daya Diskriminasi Aitem ......................................................... 48
Universitas Sumatera Utara
xi
DAFTAR LAMPIRAN
Lampiran 1 Output Analisis Korelasi Subtes ZR Dan TKD 6 ........................... 70
Lampiran 2 Hasil Analisis Reliabilitas Subtes ZR Dengan Formula KR-20 ...... 71
Lampiran 3 Hasil Analisis Reliabilitas TKD 6 Dengan Formula KR-20............ 72
Universitas Sumatera Utara
1
BAB I
PENDAHULUAN
A. Latar Belakang
Psikologi adalah ilmu yang mempelajari perilaku dan proses mental
(Lahey, 2012). Pada masa sekarang ini, ilmu psikologi semakin berkembang
dalam masyarakat umum. Penerapan dari ilmu psikologi ini banyak ditemukan
dari banyaknya jasa pelayanan psikologi yang dapat dipergunakan oleh
masyarakat saat ini. Salah satu diantaranya adalah penggunaan tes psikologi. Saat
ini, hampir dalam setiap bidang kehidupan manusia banyak yang menggunakan
tes psikologi. Tes psikologi oleh Urbina (2004) didefinisikan sebagai prosedur
sistematis untuk memperoleh sampel perilaku yang relevan dengan fungsi kognitif
maupun afektif, dan untuk penilaian serta evaluasi sampel yang sesuai dengan
standar yang berlaku.
Tes psikologi digunakan untuk mengukur perbedaan antar individu
maupun mengukur perbedaan reaksi individu yang sama dalam kondisi yang
berbeda (Anastasi & Urbina, 1997). Respon maupun hasil pengukuran individu
tersebut dapat memberikan suatu kesimpulan. Kesimpulan inilah yang menjadi
dasar dalam pengambilan keputusan (Osterlind, 2010). Pengambilan keputusan
biasanya dilakukan dalam proses seleksi, klasifikasi, dan diagnosa baik pada
individu, kelompok, organisasi, maupun program tertentu (Urbina, 2004). Dengan
adanya fungsi tersebut, tes psikologi harus mampu untuk mengungkap aspek-
aspek psikologis dalam diri individu terkait pengambilan keputusan.
Menurut Kaplan & Saccuzzo (2009), tes psikologi terbagi menjadi dua
jenis, yaitu tes kepribadian dan kemampuan. Tes kepribadian digunakan untuk
Universitas Sumatera Utara
2
mengukur trait ataupun temperamen individu. Tes kemampuan digunakan untuk
mengukur keahlian individu dalam hal kecepatan dan ketepatan. Tes kepribadian
terbagi atas dua jenis, yaitu tes objektif dan tes proyektif. Sedangkan tes
kemampuan terbagi menjadi tiga, yaitu tes prestasi, tes bakat, dan tes inteligensi.
Tes kepribadian dan tes kemampuan telah digunakan dalam berbagai
konteks kehidupan manusia seperti pendidikan, pekerjaan, dan klinis. Dalam
konteks pendidikan, digunakan untuk mengidentifikasi kecepatan belajar
seseorang, mengklasifikasi individu berdasarkan kemampuan dalam menyerap
informasi, pemilihan jurusan, dan seleksi masuk sekolah dan perguruan tinggi.
Dalam konteks pekerjaan, digunakan untuk menyeleksi dan mengklasifikasi
sumber daya manusia serta promosi karyawan. Dalam konteks klinis, digunakan
untuk mengidentifikasi individu yang memiliki keterbelakangan mental maupun
gangguan psikologis. Dari ketiga konteks yang telah dijelaskan sebelumnya, yaitu
konteks pendidikan, pekerjaan, dan klinis, tes yang umumnya dipakai adalah tes
inteligensi (Anastasi & Urbina, 1997).
Secara khusus, tes inteligensi sering dipakai dalam proses seleksi pada
konteks pendidikan dan pekerjaan. Tes inteligensi digunakan sebagai penyaringan
tahap awal dalam proses seleksi. Hal ini dibuktikan dengan kutipan wawancara
yang dilakukan peneliti kepada psikolog Industri dan Organisasi yang mengatakan
bahwa dalam proses seleksi, tes inteligensi biasanya diberikan di awal rangkaian
pelaksanaan tes (Komunikasi Personal, 25 November 2016). Dalam proses
seleksi, tes inteligensi umumnya digunakan untuk memprediksi kinerja pekerjaan
individu dan kemampuannya tehadap bidang yang dilamar (Anastasi & Urbina,
1997). Hal ini didukung dengan pernyataan Kaplan & Sacuzzo (2009) bahwa tes
Universitas Sumatera Utara
3
inteligensi mengukur potensi yang dimiliki individu dalam pemecahan masalah,
kemampuan beradaptasi dengan perubahan suatu kondisi dan kemampuan untuk
belajar dari pengalaman. Potensi dan kemampuan yang diukur dengan tes
inteligensi menjadi bagian penting dalam menyeleksi individu. Dengan demikian,
kualitas dari tes inteligensi penting untuk diperhatikan.
Beberapa contoh tes inteligensi yang masih digunakan untuk penyeleksian
ialah Advanced Progressive Matrices, Culture Fair Intelligence Test (CFIT), Tes
Kemampuan Dasar (TKD), dan Intelligenz Struktur Test (IST). Tes-tes inteligensi
ini juga masih dipakai di beberapa biro psikologi di Kota Medan (Biro A, B, C,
dan D). Namun, tes inteligensi yang sering digunakan digunakan perusahaan
maupun beberapa biro psikologi di Kota Medan untuk proses seleksi ialah IST.
IST merupakan tes psikologi yang dikembangkan pertama kali oleh
Rudolf Amthaeur di Jerman pada tahun 1953. Di Indonesia, tes ini diadaptasi oleh
Fakultas Psikologi Universitas Padjajaran (selanjutnya disebut UNPAD) pada
tahun 1973. Selain mengukur inteligensi, tes ini juga dapat digunakan untuk
melihat bakat (Polhaupessy dalam Diktat Kuliah IST UNPAD, 2009). Di
Indonesia, IST digunakan untuk seleksi dan promosi karyawan dalam konteks
pekerjaan. IST disusun berdasarkan teori Thurstone tentang kemampuan mental
dasar (primary mental abilities). Kemampuan mental dasar terdiri dari tujuh
faktor yaitu faktor verbal (V), number (N), perceptual (P), spasial (S), word
fluency (W), memory (M), dan reasoning (R) yang menghasilkan multiple
intelligence. Adapun kecerdasan yang dihasilkan dari penggunaan IST adalah
kecerdasan verbal, angka, figural, dan ingatan (LPSP3 UI, 2012). Dengan
diperolehnya multiple intelligence dari aspek pengukuran IST inilah yang menjadi
Universitas Sumatera Utara
4
alasan mengapa IST saat ini masih banyak dipakai dalam seleksi pekerjaan oleh
perusahaan-perusahaan. Hal ini dapat dibuktikan dengan wawancara yang
dilakukan dengan tester di beberapa biro psikologi di Kota Medan yang
mengatakan bahwa dengan hanya menggunakan IST, dapat diperoleh hasil secara
keseluruhan yang tidak dimiliki tes inteligensi lainnya (Komunikasi Personal, 23
Januari 2017). Selain itu dikatakan juga bahwa untuk seleksi biasanya memang
menggunakan IST karena IST terdiri dari 9 subtes. Kesembilan subtesnya ini
mampu menggambarkan inteligensi lebih lengkap dibandingkan tes inteligensi
lainnya (Komunikasi Personal, 09 September 2017).
Berdasarkan hasil pengamatan oleh peneliti, IST sudah tersebar di internet.
Hal ini dibuktikan peneliti dengan ditemukannya beberapa website yang memuat
aitem dalam IST hanya dengan sekali pencarian. Tentunya kebocoran soal ini
akan berdampak pada penggunaan tes itu sendiri. Masyarakat yang telah
mengetahuinya juga dapat mengalami proses belajar dan proses mengingat
terhadap aitem-aitem, cara penyelesaian beserta jawaban yang ada di dalam IST
tersebut. Hal demikian tentu akan menyebabkan semua aitem menjadi mudah
untuk dikerjakan oleh individu. Murphy & Davidshofer (2005) menyatakan
bahwa ketika suatu aitem dalam sebuah tes tergolong mudah maka
kemampuannya untuk membedakan kelompok yang atributnya diukur menjadi
diragukan, sehingga dapat dikatakan bahwa kualitas aitem tersebut tidak baik.
Kualitas aitem yang tidak baik akan menyebabkan validitas dan reliabilitas suatu
alat tes menjadi terganggu.
IST terdiri atas sembilan subtes, yaitu Satzergaenzung (SE), Wortauswahl
(WA), Analogien (AN), Gemeinsamkeiten (GE), Merkaufgaben (ME),
Universitas Sumatera Utara
5
Rechenaufgaben (RA), Zahlenreinhen (ZR), Figurenauswahl (FA), dan
Wuerfelaufgaben (WU). Kesembilan subtes ini dapat digunakan secara
keseluruhan maupun hanya satu subtes saja (Polhaupessy dalam Diktat Kuliah
IST UNPAD, 2009). Berdasarkan pengamatan peneliti terhadap IST, kesembilan
subtes IST telah dianalisis karakteristik psikometrinya dengan uji validitas bukti
struktur internal dengan pendekatan Item Response Theory (IRT) dan metode
multitrait-multimethod (MTMM). Dari analisis yang telah dilakukan, ditemukan
bahwa IST memiliki karakteristik psikometri yang kurang baik.
Penelitian dengan pendekatan IRT dilakukan oleh Rahmawati (2014). Dari
hasil analisis IRT dengan menggunakan kriteria peluang tebakan, indeks
kesukaran aitem, dan indeks daya diskriminasi, ditemukan bahwa hanya 45,625%
dari 160 aitem IST yang masih memiliki karakteristik psikometri yang dianggap
baik. Penelitian yang menggunakan metode MTMM dilakukan pada tahun 2011.
Dalam penelitian dengan metode ini, peneliti mengkorelasikan antar subtes pada
IST. Hal ini tampak dalam penelitian yang dilakukan oleh Sirait & Garliah (2011),
subtest WA dikorelasikan dengan kedelapan subtest lainnya dengan nilai
korelasinya berada di atas 0.25. Nilai ini menunjukkan bahwa subtes WA sudah
tidak sesuai lagi dengan tujuan awal pengukurannya. Adapun karakteristik dari
IST menurut Polhaupessy (dalam Diktat Kuliah IST UNPAD, 2009) ialah korelasi
antar subtesnya rendah dengan r = 0.25. Koefisien reliabilitas yang diperoleh
dalam penelitian ini sebesar 0.650. Nilai ini menunjukkan bahwa subtes WA
sebagai bagian dari IST tidak reliabel untuk digunakan sebagai tes inteligensi.
Penelitian yang dilakukan oleh Siregar & Rahmawati (2011) juga
menemukan bahwa subtest AN memiliki korelasi yang tinggi dengan subtest
Universitas Sumatera Utara
6
lainnya. Nilai korelasi subtest AN dengan kedelapan subtes lainnya berkisar dari
antara 0.410 sampai dengan 0.676. Hal ini juga menunjukkan bahwa subtest AN
sudah tidak sesuai lagi dengan tujuan awal pengukurannya. Koefisien reliabilitas
yang diperoleh dalam penelitian ini sebesar 0.728. Nilai ini menunjukkan bahwa
subtes AN sebagai bagian dari IST tidak reliabel untuk digunakan sebagai tes
inteligensi.
Penelitian yang dilakukan oleh Sari & Rahmawati (2011) menemukan
bahwa subtest RA memiliki korelasi yang cukup tinggi dengan kedelapan subtes
lainnya yaitu berkisar dari 0,417 sampai dengan yang paling tinggi yaitu 0,999.
Penelitian pada subtes SE dilakukan oleh Elvira & Rahmawati (2011) yang
menemukan bahwa terdapat korelasi yang cukup tinggi antara subtest SE dengan
subtes lainnya dalam IST, dengan kisaran nilai korelasi sebesar 0.379 sampai
0,676. Hal ini juga menunjukkan bahwa subtest RA dan SE sudah tidak sesuai
lagi dengan tujuan awal pengukurannya. Koefisien reliabilitas yang diperoleh
dalam penelitian subtes RA sebesar 0.851 dan subtes SE sebesar 0.73. Nilai ini
menunjukkan bahwa subtes RA dan SE sebagai bagian dari IST tidak reliabel
untuk digunakan sebagai tes inteligensi.
Pada tahun 2011, subtes ZR juga dilakukan uji validitasnya oleh Princen &
Rahmawati. Hasil yang ditemukan ialah koefisien validitas dari uji validitas
konvergen yang dilakukan dengan mengkorelasikan subtest ZR dengan subtes RA
sebesar 0.758. Uji validitas diskriminannya dilakukan dengan mengkorelasikan
subtest ZR dengan subtest WU dan hasil yang diperoleh sebesar 0.372. Hal ini
juga menunjukkan bahwa subtest ZR sudah tidak sesuai lagi dengan tujuan awal
pengukurannya. Koefisien reliabilitas yang diperoleh dalam penelitian ini sebesar
Universitas Sumatera Utara
7
0.882. Nilai ini menunjukkan bahwa subtes ZR sebagai bagian dari IST tidak
reliabel untuk digunakan sebagai tes inteligensi.
Berdasarkan analisis IST yang telah dilakukan, maka penting untuk
dilakukan analisis lebih lanjut pada IST mengingat tes ini masih digunakan hingga
saat ini. Oleh karena itu, peneliti tertarik untuk menganalisis karakteristik
psikometri dari IST namun berfokus kepada satu subtes saja, yaitu subtest ZR.
Peneliti memilih subtes ZR karena dari pengamatan yang dilakukan oleh peneliti,
peneliti menemukan bahwa deret angka (aitem subtes ZR) telah dipelajari sejak
SMP. Aitem-aitem berbentuk deret angka juga dapat ditemukan di berbagai
sumber. Hal tersebut dapat menimbulkan adanya proses belajar yang dilakukan
individu terhadap aitem subtest ZR.
Selain itu, peneliti juga menemukan bahwa subtes ZR pada umumnya
lebih sering digunakan dibandingkan subtes IST lainnya ketika subtes dalam IST
digunakan secara terpisah. Seperti yang dijelaskan oleh Polhaupessy (dalam
Diktat Kuliah IST UNPAD, 2009), kesembilan subtes dalam IST dapat digunakan
secara keseluruhan maupun hanya satu subtes saja. Pada analisis subtest ZR yang
dilakukan dengan pendekatan IRT, ditemukan bahwa keseluruhan aitem tersebut
memiliki kriteria peluang tebakan dibawah 0.35. Dari 20 aitem, hanya 10 aitem
yang indeks daya diskriminasinya berada dibawah 2,00 dan hanya 19 aitem yang
tingkat kesukarannya lebih besar dari -2,00 (Rahmawati, 2014).
Berdasarkan analisis MTMM pada subtest ZR, ditemukan koefisien
validitas konvergennya (dikorelasikan dengan RA) sebesar 0.758 dan validitas
diskriminannya (dikorelasikan dengan WU) sebesar 0.372. Koefisien reliabilitas
dari subtes ini sebesar 0,882. Dari analisis indeks diskriminasi aitemnya, 19 dari
Universitas Sumatera Utara
8
20 aitem dinilai sangat baik dengan nilai indeks diskriminasi aitemnya diatas 0,4.
Dari analisis indeks kesukaran aitem, hanya 6 aitem yang memiliki nilai p
dibawah 0,3. Berdasarkan analisis yang dilakukan, secara keseluruhan aitem
subtes ZR memiliki kualitas aitem yang baik, namun validitas dan reliabilitasnya
sebagai tes inteligensi masih belum cukup baik untuk digunakan (Princen, 2011).
Selain dengan uji validitas konstrak, subtes ZR juga memiliki analisis
karakteristik psikometri yang cukup lengkap dengan dianalisisnya subtes ZR
menggunakan validitas bukti prediktif. Hasil analisisnya menunjukkan bahwa
subtes ZR tidak mampu untuk membedakan kemampuan IPA dan IPS pada siswa
SMA kelas X (Tiarsarani, 2008).
Berdasarkan alasan yang telah dipaparkan sebelumnya, maka peneliti
tertarik untuk melanjutkan menganalisis subtes ZR. Analisis ini penting dilakukan
untuk memberikan informasi apakah subtes ZR masih valid dan reliabel untuk
digunakan. Hal yang membedakan penelitian ini dari penelitian lain sebelumnya
adalah peneliti menganalis validitas subtest ZR menggunakan bukti konkuren
yang dalam hal ini dilakukan dengan mengkorelasikan subtes ZR dengan tes yang
sejenis yaitu TKD 6.
Peneliti memilih untuk menguji validitas kriteria dengan bukti konkuren
karena metode pengujiannya yang praktis dan waktu pelaksanaannya yang singkat
untuk dilakukan (Murphy & Davidshofer, 2005). Selain itu, analisis dalam metode
ini mudah dilakukan karena dengan mengkorelasikan skor subtes ZR dengan skor
TKD 6 sebagai kriteria maka akan diperoleh koefisien validitas dari suatu tes yang
dapat dipercaya.
Universitas Sumatera Utara
9
Selain itu, dengan dilakukannya analisis menggunakan validitas dengan
bukti konkuren dapat memberikan kajian subtes ZR yang lebih komprehensif
setelah dilakukannya berbagai analisis karakteristik psikometri dengan sumber
validitas berdasarkan struktur internal dan validitas dengan bukti prediktif. Hal ini
didukung dengan pernyataan dalam Osterlind (2010) bahwa validitas itu harus
dibuktikan dari berbagai sumber yang ada. Dalam uji validitas dengan bukti
konkuren, setiap hasil ukur yang relevan dengan tujuan tes dapat dijadikan
sebagai kriteria (Azwar, 2012). Maka dalam penelitian ini, uji validitas dilakukan
dengan mengorelasikan subtes ZR dengan tes inteligensi lainnya yang mengukur
atribut yang sama dengan subtes ZR.
Tes inteligensi yang dinilai memiliki tujuan tes yang relevan dengan
subtes ZR ialah Tes Kemampuan Dasar (TKD) 6. TKD 6 dipilih dengan alasan tes
ini mengukur atribut yang sama dengan subtest ZR, yaitu deret angka. TKD 6
sebagai bagian dari TKD juga disusun berdasarkan teori kemampuan mental dasar
Thurstone. Oleh karena itu, dengan adanya kesamaan ini, maka TKD 6 tepat
untuk dijadikan kriteria. Jika ditemukan korelasi yang tinggi antara subtes ZR
dengan TKD 6 maka dapat dikatakan bahwa kedua tes tersebut mengukur hal
yang sama dan subtes ZR memiliki validitas konkuren yang baik.
Selain menganalisis dengan menggunakan sumber validitas yang lain,
perbedaan penelitian yang dilakukan oleh peneliti dengan penelitian yang
dilakukan oleh peneliti-peneliti sebelumnya ialah penelitian ini menggunakan data
primer yang diperoleh langsung dari pelaksanaan tes pada mahasiswa Psikologi
USU 2016. Dengan pengambilan data secara langsung, maka proses pelaksanaan
tes yang dilakukan dalam penelitian ini dapat dikontrol oleh peneliti.
Universitas Sumatera Utara
10
Berdasarkan pemaparan yang telah dijelaskan sebelumnya, peneliti
memilih untuk mengevaluasi karakteristik psikometri subtes ZR pada IST dengan
cara mengestimasi indeks kesukaran aitem dan indeks daya diskriminasi aitem,
mengestimasi koefisien reliabilitas, dan memvalidasi berdasarkan bukti hubungan
dengan variabel lain dan. Hal ini penting dilakukan untuk mengetahui apakah
subtes ZR pada IST masih memiliki kualitas aitem yang baik atau tidak. Azwar
(2012) menyatakan bahwa sebuah tes akan dinilai baik jika aitem dalam tes
tersebut baik dan aitem yang baik akan menghasilkan pengukuran yang baik.
Selain itu, penelitian ini penting dilakukan untuk mengetahui apakah hasil subtes
ZR pada IST masih valid dan reliabel sesuai dengan tujuan pengukurannya,
Dengan demikian, evaluasi karakteristik psikometri subtes ZR pada IST yang
dilakukan dapat memberikan informasi apakah IST masih layak untuk digunakan
atau tidak.
B. Rumusan Masalah
Peneliti melihat perlunya dilakukan pengujian terhadap indeks kesukaran
aitem, indeks daya diskriminasi aitem, reliabilitas, dan validitas meskipun
pengujian ini sudah pernah dilakukan oleh peneliti sebelumnya. Validasi pada
penelitian sebelumnya dilakukan berdasarkan bukti struktur internal. Pengujian
dengan bukti validitas yang lain penting dilakukan untuk memberikan kajian yang
komprehensif mengenai IST apakah tes ini masih baik digunakan hingga saat ini.
Hal tersebut perlu dilakukan dengan pertimbangan tes ini telah bocor namun tes
ini masih digunakan hingga saat ini. Berdasarkan permasalahan tersebut, peneliti
merumuskan empat pertanyaan, yaitu :
Universitas Sumatera Utara
11
1. Berapa indeks kesukaran aitem subtes ZR pada IST?
2. Berapa indeks daya diskriminasi aitem subtes ZR pada IST?
3. Berapa koefisien reliabilitas subtes ZR pada IST?
4. Apakah subtes ZR pada IST terbukti valid digunakan ditinjau berdasarkan
hubungan dengan TKD 6?
C. Tujuan Penelitian
Tujuan penelitian ini ialah untuk mendapatkan informasi apakah IST
khususnya subtes ZR masih berfungsi sesuai dengan tujuan pengukuran subtes ZR
dengan cara mengestimasi indeks kesukaran aitem dan indeks daya diskriminasi
aitem, mengestimasi koefisien reliabilitas, dan memvalidasi berdasarkan bukti
hubungan dengan variabel lain.
D. Manfaat Penelitian
Penelitian ini diharapkan dapat memberikan manfaat teoritis maupun
praktis, sebagai berikut :
1. Manfaat Teoritis
Hasil dari penelitian ini diharapkan dapat bermanfaat bagi ilmu psikologi
mengenai pengkajian alat ukur dan untuk memberikan data empiris mengenai
karakteristik psikometri IST khususnya subtest ZR apakah masih berfungsi sesuai
dengan tujuan awalnya.
2. Manfaat Praktis
Hasil dari penelitian ini diharapkan mampu memberikan informasi yang
menjadi pertimbangan penting bagi para praktisi yang memakai IST khususnya
subtes ZR sebagai alat dalam pengambilan keputusan.
Universitas Sumatera Utara
12
E. Sistematika Penelitian
Sistematika penulisan dalam penelitian ini adalah :
Bab I : Pendahuluan
Bab ini berisikan latar belakang, rumusan masalah, tujuan penelitian, manfaat
penelitian, sistematika penelitian dan kerangka berpikir.
Bab II : Tinjauan Pustaka
Bab ini berisikan teori mengenai IST, Subtes ZR, TKD 6 dan teori mengenai
validitas, reliabilitas, indeks kesukaran aitem dan indeks daya diskriminasi aitem,
serta analisis karakteristik psikometri subtes ZR.
Bab III : Metode Penelitian
Bab ini berisikan mengenai metode penelitian yaitu jenis penelitian, subjek
penelitian, data penelitian, prosedur pelaksanaan penelitian, metode pengumpulan
data dan analisis data.
Bab IV : Hasil dan Pembahasan
Bab ini berisikan gambaran subjek penelitian, deskripsi hasil analisis validitas,
reliabilitas, indeks kesukaran aitem, dan indeks diskriminasi aitem serta
pembahasan mengenai seluruh hasil yang diperoleh dalam penelitian ini.
Bab V : Kesimpulan dan Saran
Bab ini berisikan kesimpulan mengenai hasil yang diperoleh dari analisis data,
saran metodologis untuk penelitian berikutnya dan saran praktis bagi para praktisi
yang mau menggunakan IST.
Universitas Sumatera Utara
13
KERANGKA BERPIKIR
Tes
Prestasi
Tes
Bakat
Tes
Intelegensi
Intelligenz Struktur Test
(IST)
validitas
konstraknya baik
Hasil analisis ITR :
a. peluang tebakan
<0.35
b. tingkat kesukaran
>-2.00
c. indeks daya
diskriminasi <2.00
Hasil analisis MTMM
a. pxix2 <0.9
b. d >0.4
c. p<0.3
ZR RA WA SE
Tes Psikologi
AN
Tes
Kepribadian
GE ME
Tes
Kemampuan
FA WU
Analisis Karakteristik Psikometri
Subtes ZR pada IST
Dilakukan dengan
TKD 6 karena adanya
kesamaan seperti:
- Disusun
berdasarkan teori
kemampuan mental
dasar oleh L.L
Thurstone
- mengukur atribut
yang sama yaitu
kemampuan
berpikir dengan
angka
Pengujian dengan sumber
bukti validitas yang lain,
yaitu bukti validitas
berdasarkan hubungan
dengan variabel yang lain
Pernah dilakukan uji
validitas berdasarkan
struktur internal
Universitas Sumatera Utara
14
BAB II
TINJAUAN PUSTAKA
A. Intelligenz Struktur Test (IST)
Tes yang digunakan dalam penelitian ini adalah IST. Dalam bab ini akan
dijelaskan berbagai hal tentang IST, yaitu sejarah IST dan subtes-subtes dalam
IST. Dalam penelitian ini, peneliti akan berfokus kepada satu subtes saja yaitu
subtes ZR. Penjelasan subtes ZR dalam bab ini meliputi deskripsi dan penelitian
terdahulu subtes ZR. Selain itu, dalam bab ini juga akan dijelaskan tentang kriteria
tes lain yang relevan dengan subtes ZR yaitu TKD 6. TKD 6 merupakan tes yang
akan dikorelasikan dengan subtes ZR dalam pengujian validitas.
1. Sejarah Intelligenz Struktur Test (IST)
IST merupakan salah satu tes inteligensi yang dikembangkan oleh Rudolf
Amthauer pada tahun 1953 di Jerman dengan berlandaskan teori L.L Thurstone
mengenai kemampuan mental dasar (LPSP3UI, 2012). Inteligensi didefinisikan
oleh Amthauer sebagai keseluruhan struktur dari kemampuan-kemampuan jiwa
dan rohani manusia yang memberikan kemampuan bagi manusia untuk bertindak
sebagai pelaksana dalam dunianya. Inteligensi dapat diketahui lebih jelas melalui
prestasi yang dicapai individu atau hasil suatu tes yang mengukur inteligensi
(Polhaupessy dalam Diktat Kuliah IST UNPAD, 2009). Dengan adanya pemikiran
tersebut, Amthauer menyusun sebuah tes yang dapat mengukur inteligensi, yaitu
IST dengan hipotesis kerja sebagai berikut :
“Komponen dalam struktur tersebut tersusun secara hierarkis;
maksudnya bidang yang dominan kurang lebih akan berpengaruh
pada bidang-bidang yang lain; kemampuan yang dominan dalam
struktur inteligensi akan menentukan dan mempengaruhi
kemampuan yang lainnya.”
Universitas Sumatera Utara
15
Amthauer menyusun IST sebagai baterai tes yang terdiri dari 9 subtes
(Polhaupessy dalam Diktat Kuliah IST UNPAD, 2009). Karakteristik dari baterai
tes Amthauer ditunjukkan dengan interkorelasi yang rendah antar subtesnya
(r=0.25) dan korelasi antara satu subtes dengan keseluruhan subtes yang rendah
pula (r=0.60) (Polhaupessy dalam Diktat Kuliah IST UNPAD, 2009).
Di Indonesia, IST yang digunakan adalah IST hasil adaptasi Fakultas
Psikologi UNPAD Bandung. Adaptasi dilakukan kepada IST-70. Tes ini pertama
kali digunakan oleh Psikolog Angkatan Darat Bandung, Jawa Barat (Polhaupessy
dalam Diktat Kuliah IST UNPAD, 2009).
2. Subtes-subtes dalam Intelligenz Struktur Test (IST)
IST terdiri dari sembilan subtes yang memiliki batas waktu yang berbeda-
beda dan diadministrasikan dengan menggunakan buku manual (LPSP3UI, 2012).
Sembilan subtes dalam IST adalah Satzergaenzung (SE), Wortauswahl (WA),
Analogien (AN), Gemeinsamkeiten (GE), Merkaufgaben (ME), Rechenaufgaben
(RA), Zahlenreinhen (ZR), Figurenauswahl (FA), dan Wuerfelaufgaben (WU)
(Polhaupessy dalam Diktat Kuliah IST UNPAD, 2009)
3. Penelitian Terdahulu Subtes ZR
Penelitian tentang subtes ZR pernah dilakukan oleh Tiarsarani (2008) untuk
menguji validitas konstrak dan validitas bukti prediktif serta reliabilitasnya
mengingat tes ini sering dipakai terutama dalam proses seleksi mahasiswa baru.
Hasil yang ditemukan oleh peneliti menunjukkan bahwa ada empat aitem dalam
subtes ZR memiliki indeks daya diskriminasi aitem yang tidak baik, validitas
konstraknya baik namun validitas prediktifnya tidak baik, dan subtes ZR dinilai
reliabel.
Universitas Sumatera Utara
16
Penelitian tentang subtes ZR pernah dilakukan oleh Princen & Rahmawati
(2011) dengan alasan norma yang digunakan dalam IST belum pernah
diperbaharui, belum pernah dilakukannya evaluasi terhadap IST sejak IST
diadaptasi di Indonesia pada tahun 1973, dan kebocoran yang mungkin terjadi
karena IST telah digunakan selama bertahun-tahun tanpa adanya revisi.
Hasil penelitian yang diperoleh oleh Princen & Rahmawati (2011) ialah
indeks kesulitan aitem subtes ZR memuaskan dengan rincian 6 aitem tergolong
sulit, 9 aitem tergolong sedang, dan 5 aitem tergolong mudah. Namun,
penyusunan aitemnya masih belum sesuai dengan urutan penyajian (dari aitem
mudah ke aitem sulit). Berdasarkan analisis indeks diskriminasi aitem, ditemukan
bahwa kualitas aitemnya baik yang ditunjukkan dengan 19 aitemnya memiliki
indeks diskriminasi yang baik (diatas 0.4) dan hanya 1 aitem yang indeks
diskriminasinya kurang baik (dibawah 0.4).
Hasil dari seleksi aitem berdasarkan indeks kesukaran aitem dan indeks
diskriminasi aitem ditemukan bahwa 19 aitemnya layak diterima dan 1 aitem
membutuhkan revisi. Dari analisis reliabilitas yang dilakukan, ditemukan bahwa
subtes ZR tidak reliabel jika digunakan sebagai tes inteligensi dikarenakan nilai
koefisien reliabilitas yang diperoleh sebesar 0.82. Dari analisis MTMM pada
subtest ZR, ditemukan koefisien validitas konvergennya (dikorelasikan dengan
RA) sebesar 0.758 dan validitas diskriminannya (dikorelasikan dengan WU)
sebesar 0.372 (Princen & Rahmawati, 2011).
Penelitian tentang subtes ZR juga dilakukan oleh Rahmawati (2014) untuk
melengkapi analisis IST dengan menggunakan pendekatan Item Response Theory
(IRT). Hasil penelitian yang diperoleh ialah seluruh aitem memiliki kriteria
Universitas Sumatera Utara
17
peluang tebakan dibawah 0.35, 19 aitem memiliki tingkat kesukaran diatas -2.00
dan 10 aitem memiliki indeks daya diskriminasi dibawah 2.00 (Rahmawati,
2014).
4. Kriteria Tes Lain yang Relevan dengan Subtes ZR
Pengujian validitas yang dilakukan dalam penelitian ini adalah uji validitas
berdasarkan hubungan dengan variabel lain. Dalam uji validitas ini diperlukan tes
lain yang menjadi kriteria pengukurannya. Menurut Gregory (2004), karakteristik
dari kriteria yang digunakan adalah kriteria yang dipilih harus reliabel, relevan
(mengukur hal yang mirip atau identik dengan tes yang divalidasi) dan bebas dari
kontaminasi. Tes lain yang dinilai oleh peneliti relevan dengan subtes ZR adalah
Tes Kemampuan Diferensial (TKD) 6. Dikatakan relevan karena baik subtes ZR
maupun TKD 6 mengukur hal yang sama dan aitem yang disajikan juga sama
yaitu deret angka.
TKD 6 merupakan salah satu subtes dari TKD. TKD dikonstrak berdasarkan
teori L.L Thurstone tentang kemampuan mental dasar yang terdiri dari 7 faktor
kemampuan mental primer, yaitu kemampuan verbal, kemampuan kelancaran
kata, kemampuan numerik, kemampuan keruangan, kemampuan ingatan,
kecepatan persepsi, dan kemampuan menalar (LPSP3UI, 2011). Dengan
demikian, adanya kesamaan teori penyusun tes yaitu kedua tes sama-sama
dikonstrak dengan teori L.L Thurstone tentang kemampuan mental dasar maka
dapat dikatakan bahwa TKD 6 relevan menjadi kriteria bagi subtes ZR.
B. Karakteristik Psikometri
Metode psikometri merupakan perhitungan matematis dengan statistika
tentang rancangan alat tes dan pengukuran psikologi. Metode psikometri
Universitas Sumatera Utara
18
dilakukan untuk membuat interpretasi terhadap hasil tes lebih valid. Validitas dari
suatu tes juga terkait dengan reliabilitas suatu tes (Osterlind, 2010). Oleh karena
itu, dalam bagian ini akan disajikan data yang berkaitan dengan validitas dan
reliabilitas.
Metode psikometri juga berlaku untuk mengukur proses mental, maka
konstrak yang diukur dikuantifikasikan melalui variabel dan dinyatakan melalui
aitem dari suatu tes (Osterlind, 2010). Dengan demikan, analisis tentang aitem
dari suatu tes juga akan dibahas dalam bagian ini. Murphy & Davidshofer (2005)
menyatakan bahwa dalam analisis aitem ada tiga informasi yang disajikan, yaitu
analisis indeks kesukaran aitem, indeks daya diskriminasi aitem, dan efektivitas
distraktor. Namun yang akan dibahas dalam penelitian ini hanya dua saja yaitu
analisis indeks kesukaran aitem dan indeks diskriminasi aitem.
1. Validitas
a. Definisi Validitas
Pada tahun 1973, Garret (dalam Osterlind, 2010) menyatakan bahwa
validitas sebuah tes ditunjukkan ketika tes tersebut mampu mengukur apa yang
seharusnya diukur. Namun, definisi validitas yang dikemukakan oleh Garret
dinilai mengabaikan aspek psikologis. Oleh Osterlind (2010), validitas
didefinisikan dengan sejauh mana informasi yang diperoleh dari hasil tes tersebut
tepat, bermakna, dan berguna dalam pengambilan keputusan yang merupakan
tujuan dari suatu pengukuran mental dan didukung dengan berbagai bukti.
Definisi validitas oleh Osterlind didukung dengan pernyataan Azwar (2012)
yang menjelaskan bahwa validitas mengacu kepada ketepatan dan kecermatan alat
tes dalam melakukan fungsi ukurnya. Jadi, validitas yang dikemukakan oleh
Universitas Sumatera Utara
19
Azwar ditentukan oleh ketepatan dan kecermatan hasil pengukuran. Apabila alat
tes tersebut mampu menjalankan fungsi ukurnya atau memberikan hasil tes yang
sesuai dengan maksud dilakukannya pengukuran tersebut, maka tes tersebut
dikatakan valid. Coaley (2010) pun menyatakan hal yang sama, yaitu suatu tes
dikatakan valid apabila tes tersebut mampu mengukur apa yang seharusnya
diukur. Dari definisi yang dikemukakan oleh Coaley, dapat dikatakan juga bahwa
validitas dari suatu tes ditunjukkan ketika tes mampu memberikan hasil sesuai
dengan tujuan dilakukannya suatu pengukuran. Hal ini sesuai dengan pernyataan
Landy (dalam Coaley, 2010) bahwa orientasi validitas ialah hasil dari tes tersebut.
b. Sumber Bukti Validitas
Pengujian validitas dilakukan dengan mengumpulkan bukti-bukti dari
berbagai sumber. Sumber yang dikumpulkan tersebut menyajikan informasi
mengenai tingkat kepercayaan untuk membuat kesimpulan skor yang terdapat
dalam berbagai situasi spesifik (Osterlind, 2010).
1) Bukti validitas berdasarkan konten tes
Evaluasi bukti validitas dilakukan dengan menggunakan informasi terkait
konten pengukuran seperti konten domain (dalam tes berbasis domain) ataupun
konstrak (dalam tes yang mengungkap latent trait). Adanya blueprint tes juga
menjadi hal yang sangat penting dalam melakukan evaluasi bukti validitas
berdasarkan konten tes. Selain itu, adanya penilai yang kompeten, bukti
berdasarkan teori, dan spesifikasi lainnya menjadi sumber penting dalam
pengumpulan informasi yang ada. Validasi dengan bukti berdasarkan konten tes
dilakukan dengan professional judgment mengevaluasi blueprint tes (Osterlind,
2010).
Universitas Sumatera Utara
20
2) mBukti validitas berdasarkan proses respon
Pengujian proses mental atau kognitif penerima tes merupakan salah satu cara
dalam membuktikan validitas. Validasi dengan bukti proses respon penting
dilakukan untuk mengetahui respon subjek terhadap stimulus dalam suatu
pengukuran. Validasi ini juga memberikan informasi apakah peserta tes
memberikan respon sesuai dengan pemahaman yang dimaksudkan oleh tes. Proses
respon dapat diteliti melalui metode sederhana dan kompleks. Ada beberapa
metode yang dapat dipergunakan untuk menganalisis bukti validitas berdasarkan
proses respon seperti Structural Equation Modeling (SEM), Hierarchical Linear
Models (HLM), dan Path Analysis (Osterlind, 2010).
SEM merupakan metode multivariasi yang dapat digunakan untuk mengukur
dan menganalisis dimensi laten dalam data psikologis. Dimensi laten tersebut
yang menyebabkan suatu peristiwa yang diamati terjadi. Selain itu, SEM juga
dapat digunakan untuk menguji keseluruhan struktur tes (Osterlind, 2010).
Selanjutnya, metode HLM merupakan salah satu teknik dalam analisis multilevel.
Maksud dari analisis multilevel ialah analisis dilakukan dengan menggunakan
seluruh data dari berbagai tingkatan dan dengan prosedur estimasi yang berbeda-
beda sehingga standar error yang diperoleh lebih realistis. Metode ini tepat
digunakan untuk mengolah data yang berstruktur atau memiliki hirarki. Metode
yang terakhir, yaitu path analysis dikembangkan untuk mempelajari dan
menjelaskan pengaruh langsung dan tidak langsung dari variabel penyebab
terhadap variabel akibat. Metode ini dapat digunakan apabila secara teori
dihadapkan pada masalah yang berhubungan dengan sebab-akibat (Pedhazur,
1997).
Universitas Sumatera Utara
21
3) Bukti validitas berdasarkan struktur internal
Struktur internal suatu tes terkait dengan pembuatan kesimpulan yang tepat
dan reliabel terhadap konstrak yang dinilai. Hal ini dilakukan dengan menguji
dasar teori yang digunakan (Osterlind, 2010). Dalam Azwar (2012), bukti
validitas berdasarkan struktur internal dikenal dengan istilah validitas konstrak.
Validitas ini menunjukkan sejauh mana tes mengungkap trait yang diukur.
Konsep validitas konstrak berguna pada tes yang trait pengukurannya tidak
memiliki kriteria eksternal.
Validasi berdasarkan struktur internal dapat dilakukan dengan beberapa
metode, salah satunya adalah model faktor umum. Dalam model faktor umum
dijelaskan bahwa aitem-aitem dalam suatu tes memiliki kesamaan dan pengaruh
yang unik. Namun, kesamaan tersebut tidak menyebar secara merata. Dalam
model faktor umum juga dikenal istilah muatan faktor yang menggambarkan
kontribusi varians item terhadap konstrak yang diukur. Penjumlahan dari muatan
faktor individu menunjukkan homogenitas suatu tes. Model faktor umum ini diuji
dengan analisis faktor atau principal components analysis (PCA) (Osterlind,
2010).
Selain model faktor umum, Item Response Theory (IRT) models juga dapat
digunakan untuk memvalidasi berdasarkan struktur internal. IRT models
digunakan dengan melakukan uji asumsi unidimensionalitas, indeks diskriminasi
yang sama, investigasi fenomena tebakan, dan meneliti analisis waktu dengan
membandingkan varians skor antara tes dengan batasan waktu dan tanpa batasan
waktu. Dalam IRT models, model diidentifikasi dengan jumlah karakteristik
stimulus tes yang diestimasi (Osterlind, 2010).
Universitas Sumatera Utara
22
Metode lainnya yang juga dapat digunakan dalam validasi struktur internal
adalah Multitrait-Multimatrix Method (MMTM). Metode ini digunakan untuk
menganalisis hubungan dan menentukan pola antar data dari sebuah tes. Dalam
metode ini akan dicari persamaan dan perbedaan antar data dari dua alat tes, baik
yang mengukur atribut yang sama maupun yang berbeda. Dalam metode ini, suatu
tes dikatakan valid ketika alat tes yang diuji konvergen dengan alat tes lainnya
yang mengukur atribut yang sama. Selain itu, alat tes yang diuji tersebut divergen
dengan alat tes lainnya yang mengukur atribut berbeda (Osterlind, 2010).
4) Bukti validitas berdasarkan hubungan dengan variabel lain
Hubungan antara skor tes dengan variabel lain dapat menjadi sumber bukti
validitas. Variabel lain ini disebut dengan kriteria. Pengujian terhadap hubungan
antara skor tes dengan kriteria dilakukan dengan bukti prediktif atau bukti
konkuren (Osterlind, 2010). Dalam Azwar (2012), validitas dengan bukti prediktif
atau bukti konkuren disebut dengan validitas prediktif atau validitas konkuren.
Kedua bukti ini sama-sama menunjukkan hubungan antara tes dan kriteria
eksternal. Perbedaan kedua bukti tersebut terletak pada rentang waktu
diberikannya tes dan kriteria.
Pada bukti prediktif, validasi dilakukan dengan perbandingan antara tes yang
diuji dengan kriteria administrasi posttestnya (setelah tes diberikan) (Osterlind,
2010). Dapat dikatakan juga bahwa hasil tes berfungsi sebagai prediktor bagi
performansi di masa yang akan datang. Oleh karena itu, pengujian validitasnya
baru bisa dilakukan di masa mendatang setelah skor kriterianya diperoleh (Azwar,
2012). Sedangkan pada bukti konkuren, validasi dilakukan dengan perbandingan
antara tes dengan kriteria kontemporer. Kriteria kontemporer yang dimaksud ialah
Universitas Sumatera Utara
23
tes paralel yang diadministrasikan baik setelah maupun sebelum tes yang diuji
diberikan (Osterlind, 2010). Dapat dikatakan juga bahwa skor tes dan skor kriteria
diperoleh dalam waktu yang bersamaan (Azwar, 2012).
Estimasi koefisien validitas dengan bukti validitas berdasarkan hubungan
dengan variabel lain baik bukti prediktif maupun bukti konkuren dilakukan
dengan mengkorelasikan skor tes dengan skor kriteria. Korelasi yang dapat
digunakan ialah korelasi Pearson Product-Moment (variabel bersifat kontinyu)
dan korelasi point-biserial (variabel bersifat kategorikal atau dikotomi) (Azwar,
2012).
5) Bukti validitas berdasarkan pertimbangan eksternal
Pertimbangan eksternal yang menjadi bukti validitas adalah validitas tampang
(face validity). Namun, validitas tampang ini tidak dapat diukur dengan
menggunakan metode statistik. Dalam hal ini, pengujian validitas dilakukan
dengan menunjukkan alat tes kepada subjek. Selain validitas tampang, validitas
generalisasi (validity generalization) juga menjadi pertimbangan eksternal lainnya
yang dijadikan sebagai bukti validitas. Yang dimaksud dengan validitas
generalisasi adalah sejauh mana bukti validitas berdasarkan kriteria dapat
digeneralisasi pada situasi baru tanpa harus dilakukan pengujian validitas lagi
(Osterlind, 2010).
c. Faktor-faktor yang mempengaruhi validitas
Pengujian validitas terkait dengan pengumpulan bukti-bukti validitas. Ketika
perubahan waktu terjadi, bukti validitas harus berkembang untuk mendukung
perubahan tersebut. Dengan demikian, interpretasi validitas juga menjadi rentan
berubah. Oleh karena itu, pengujian validitas harus tetap dipantau dan
Universitas Sumatera Utara
24
diperbaharui (Osterlind, 2010). Selain perubahan waktu, terdapat juga berbagai
faktor lain yang dapat menjadi sumber kesalahan pada suatu pengukuran dan
dapat mengganggu nilai dari validitas tersebut. Faktor-faktor tersebut adalah
sebagai berikut (Coaley, 2010):
1) Batasan jangkauan data
Keterbatasan jangkauan data disebabkan oleh peserta tes memiliki skor yang
mirip sehingga variasi dari pengukuran tersebut rendah. Variasi yang tidak terlalu
rendah dari suatu pengukuran dapat menghasilkan koefisien validitas yang lebih
tinggi. Jumlah batasan dari berbagai pengujian akan bervariasi sehingga korelasi
yang diperoleh juga akan bervariasi. Batasan jangkauan data ini juga dapat terjadi
ketika suatu kelompok memiliki karakteristik yang lebih homogen seperti usia,
jenis kelamin, dan trait kepribadian. Karakteristik yang homogen ini akan
mempersempit rentang skor yang ada (Coaley, 2010).
2) Pengurangan sampel
Berkurangnya jumlah sampel dalam suatu pengukuran dapat mempersempit
batasan jangkauan data. Namun, suatu formula dan program tertentu dapat
digunakan untuk menghitung koefisien validitas jika batasan jangkauan data
maupun pengurangan sampel terjadi (Coaley, 2010).
3) Ukuran sampel
Jumlah sampel dalam suatu tes mempengaruhi validitas tes tersebut. Semakin
kecil ukuran sampel dalam suatu tes, maka semakin besar kesalahan yang
dihasilkan dalam pengukuran. Semakin besar ukuran sampelnya, maka semakin
kecil pula kesalahan yang terjadi dalam tes tersebut. Selain itu, sampel kecil
Universitas Sumatera Utara
25
dalam statistik dikatakan tidak stabil karena korelasi dua sampel dengan ukuran
sampel yang sama-sama kecil menghasilkan hasil yang berbeda (Coaley, 2010).
4) Atenuasi
Jika reliabilitas dari pengukuran kriteria rendah, hal tersebut dapat
mengurangi koefisien validitas dari sebuah tes. Nilai maksimum dari validitas
dibatasi oleh reliabilitas. Dapat dikatakan juga bahwa koefisien validitas tidak
pernah bisa melebihi koefisien reliabilitas. Hal inilah yang disebut dengan
atenuasi (Coaley, 2010). Efek atenuasi ini dapat menghasilkan underestimasi
terhadap validitas tes (Azwar, 2012).
5) Kontaminasi kriteria
Kontaminasi kriteria ini mencakup bias dalam skor kriteria dan variasi dalam
berbagai tipe pengukuran yang digunakan sebagai kriteria. Hal tersebut dapat
mengurangi koefisien validitas. Ketika pengaruh dari berbagai faktor lainnya tidak
berkaitan ataupun kaitannya dapat diminimalisir, maka validitasnya akan menjadi
lebih tinggi (Coaley, 2010).
6) Keterpenuhan Asumsi
Ada beberapa asumsi yang mempengaruhi koefisien validitas. Asumsi
pertama ialah adanya hubungan linear antara variabel yang digunakan dalam suatu
pengukuran. Asumsi kedua terkait dengan struktur faktor dari suatu tes.
Maksudnya ialah alat tes yang berbeda dapat mengukur hal yang serupa meskipun
atribut pengukuran dari tes tersebut tidak identik. Sedangkan asumsi ketiga
berfokus kepada panjang tes (Coaley, 2010).
Pengujian validitas dalam penelitian ini dilakukan dengan menggunakan data
yang diperoleh dari pelaksanaan tes psikologi. Pelaksanaan tes psikologi dapat
Universitas Sumatera Utara
26
dipengaruhi oleh banyak faktor. Faktor-faktor ini akan mempengaruhi hasil tes
psikologi meskipun penguji telah memastikan agar hasil tes yang diperoleh
mencerminkan secara tepat kemampuan yang diukur (Gregory, 2013). Hal ini juga
dapat mempengaruhi validitas dari hasil tes. Adapun faktor-faktor yang dapat
mempengaruhi hasil tes menurut Gregory (2013) adalah :
1) Prosedur standar dalam pelaksanaan tes
Pengukuran yang dilaksanakan sesuai dengan kondisi standar yang diuraikan
pada panduan tes dari penerbit dapat menghasilkan interpretasi tes psikologi
dengan validitas yang tinggi.
2) Prosedur pelaksanaan tes
Komponen penting yang perlu diperhatikan dalam pelaksanaan tes adalah para
penguji harus familiar dan paham dengan material tes dan petunjuk tes yang ada.
Selain itu, penguji harus memahami prosedur yang tepat untuk dilakukan jika
terjadi situasi yang tidak biasa selama tes berlangsung.
3) Sensitivitas terhadap keterbatasan
Sensitivitas penguji terhadap keterbatasan yang dimiliki peserta tes seperti
kelemahan pendengaran, penglihatan, wicara dan motorik merupakan salah satu
unsur dari pelaksanaan tes yang valid. Peserta tes yang memiliki keterbatasan
membutuhkan tes khusus untuk mendapatkan hasil pengukuran yang valid.
4) Penetapan waktu
Penetapan waktu dalam suatu tes yang menggunakan batas-batas waktu
menjadi hal yang penting untuk diperhatikan. Para penguji harus menetapkan
waktu yang digunakan selama pelaksanaan tes mulai dari persiapan, pembacaan
instruksi hingga pelaksanaan tes yang sesungguhnya. Pengurangan maupun
Universitas Sumatera Utara
27
penambahan waktu dalam suatu tes dapat mengakibatkan norma tes menjadi tidak
valid dan dapat menyebabkan skor sebagian besar subjek dalam kelompok
menjadi turun.
4) Kemampuan penguji
Penguji harus mampu menjelaskan petunjuk tes dengan jelas kepada peserta
tes. Jika ada peserta tes yang belum memahami instruksi tes, penguji dapat
menjelaskan poin-poin dari instruksi tes secara perorangan.
5) Pengaruh penguji
Penguji dalam pelaksanaan tes harus mampu menciptakan lingkungan tes yang
ramah untuk menghasilkan tes yang valid. Kegagalan penguji dalam menjalin
hubungan dapat mendistorsi hasil tes. Selain itu, jenis kelamin, ras, dan
pengalaman penguji juga menjadi unsur yang mempengaruhi peserta tes meskipun
tidak memiliki pengaruh yang begitu signifikan.
6) Pengalaman dan motivasi peserta tes
Pengalaman yang dimiliki oleh peserta tes dapat mempengaruhi hasil tes ketika
tes tersebut sudah pernah diikuti sebelumnya oleh peserta tes. Pengalaman yang
dimiliki oleh peserta tes menyebabkan adanya proses pembelajaran peserta tes
terhadap tes psikologi. Selain pengalaman, peserta tes yang memiliki motivasi
untuk berbohong juga bisa menyebabkan hasil tes menjadi tidak valid. Motivasi
peserta tes untuk berbohong umumnya terjadi ketika peserta tes ingin
mendapatkan hasil yang baik dari pelaksanaan tes yang diadakan suatu institusi.
d. Interpretasi koefisien validitas
Ketika hubungan korelasional antara ukuran dan standar relevansi eksternal
digunakan sebagai bukti kriteria yang terkait pada evaluasi validitas, itu
Universitas Sumatera Utara
28
diasumsikan sebagai validitas. Koefisien validitas umumnya diperoleh dengan
korelasi Pearson. Terdapat juga korelasi lainnya namun jarang digunakan, seperti
Spearman rho (disimbolkan rs), koefisien Phi (ɸ), the tetrachoric correlation,
ataupun koefisien kontigensi (C). Selain itu, korelasi biserial dan point-biserial
juga dapat digunakan untuk memperoleh koefisien validitas meskipun kedua
korelasi ini umumnya digunakan untuk analisis aitem selama konstruksi tes dan
review tes. Namun, kedua korelasi tersebut biasanya tidak digunakan untuk
evaluasi validitas bukti kriteria (Osterlind, 2010).
Interpretasi koefisien validitas bersifat relatif. Maksudnya ialah tidak ada
batasan mutlak mengenai koefisien terendah agar validitas dinyatakan
memuaskan. Suatu validitas dianggap memuaskan tergantung kepada penguji
validitas dan pengguna tes (Azwar, 2012). Dalam estimasi validitas, tidak dapat
dituntut koefisien yang tinggi sekali seperti dalam interpretasi koefisien
reliabilitas (Azwar, 2012).
Estimasi validitas dalam penelitian ini dilakukan dengan validitas bukti
kriteria. Coaley (2010) menyatakan bahwa koefisien validitas untuk validitas
kriteria cenderung lebih rendah jika dibandingkan dengan koefisien validitas
konstrak. Hal ini dapat disebabkan oleh ketidakkonsistenan kriteria ketika
dilakukan evaluasi validitas. Koefisien validitas dikatakan sangat baik ketika
koefisien korelasinya diatas 0.54 dan dikatakan baik ketika koefisien korelasinya
diantara 0.45-0.54 Pernyataan oleh Coaley ini didukung juga dengan pernyataan
dalam Murphy & Davidshofer (2005) bahwa dalam pengujian validitas dengan
bukti kriteria, koefisien validitas yang diperoleh umumnya sekitar 0.3 dan 0.4, dan
koefisien tertinggi yang dapat dicapai sekitar 0.5 dan 0.6.
Universitas Sumatera Utara
29
2. Reliabilitas
a. Definisi reliabilitas
Reliabilitas mengacu kepada ketepatan dalam penilaian mental. Ketepatan ini
ditentukan oleh konsistensi hasil pengukuran paralel yang dilakukan secara
berulang (Osterlind, 2010). Konsistensi tersebut dapat diketahui dengan
membandingkan skor individu ketika diberikan tes dalam waktu yang berbeda.
Konsistensi ini menunjukkan keakuratan tes (Coaley. 2010). Semakin konsisten
hasil pengukurannya, maka semakin besar reliabilitasnya. Semakin reliabel suatu
pengukuran maka semakin sedikit kesalahan yang terdapat dalam hasil
pengukurannya. Hal ini tentu meningkatkan kepercayaan terhadap hasil
pengukuran yang ada (Osterlind, 2010).
Lord & Norvick (dalam Osterlind, 2010) menyatakan bahwa reliabilitas
dalam teori tes klasik didefinisikan sebagai kuadrat korelasi antara skor tampak
dengan skor murni. Dalam Coaley (2010) dijelaskan bahwa rentang antara skor
tampak dan skor murni disebut dengan error. Semakin kecil rentang antara skor
tampak dan skor murni, maka semakin sedikit error dalam pengukuran tersebut
dan reliabilitas pengukurannya semakin besar. Semakin besar rentang antara skor
tampak dan skor murni, maka semakin banyak error dalam pengukuran tersebut
dan reliabilitas pengukurannya semakin kecil.
b. Metode Estimasi Reliabilitas
Reliabilitas suatu pengukuran dapat diketahui dengan melakukan pengukuran
paralel secara berulang. Pada awalnya, pengujian reliabilitas dilakukan dengan
peserta tes diminta untuk berpartisipasi kembali dalam tes yang sama dan
administrasi tesnya identik. Namun, metode tersebut dinilai sulit dilakukan karena
Universitas Sumatera Utara
30
ketiadaan peserta tes ketika dilakukan tes secara berulang. Oleh karena itu, para
ahli psikometri mengemukakan beberapa metode pengukuran paralel yang dapat
dilakukan untuk mengestimasi reliabilitas (Osterlind, 2010). Metode yang
berbeda menghasilkan estimasi yang berbeda karena masing-masing metode
memiliki sensitivitas tehadap sumber error (Coaley, 2010).
1) Metode Tes Ulang (Test-retest)
Metode tes ulang merupakan pengukuran paralel yang dilakukan dengan cara
memberikan tes yang sama dengan administrasi yang sama dan kondisi
pelaksanaan tes yang dibuat serupa namun dalam waktu yang berbeda (Osterlind,
2010). Hasil pengukuran pertama dan pengukuran kedua dikorelasikan dan
menghasilkan koefisien reliabilitas test-retest atau koefisien stabilitas. Jika
interval waktu pelaksanaan tes pertama dengan kedua tidak begitu lama, hasil
korelasinya disebut dengan coefficient of dependability (Coaley, 2010). Korelasi
antara hasil pengukuran pertama dan kedua pada metode ini dilakukan dengan
korelasi Pearson (Osterlind, 2010).
Metode ini tidak dapat digunakan untuk semua pengukuran karena tidak
semua trait benar-benar stabil sepanjang waktu. Reliabilitas semakin rendah jika
interval waktu pelaksanaan tes yang pertama dengan yang kedua semakin lama
(Coaley, 2010). Hal ini dapat disebabkan karena terjadinya perubahan aspek
psikologis yang diukur pada individu yang mendapatkan tes. Selain itu, dapat
disebabkan oleh perubahan suasana hati, motivasi dan sikap subjek ketika
menerima skala untuk pengukuran berulang (Azwar, 2012). Namun, interval
waktu yang singkat juga akan mempengaruhi respon individu ketika diberikan tes
yang sama untuk kedua kalinya. Respon yang terjadi dapat berupa partisipan
Universitas Sumatera Utara
31
menghindar ketika akan diberikan tes lagi maupun individu masih mengingat
jawaban ketika dilakukan pengukuran awal (Coaley, 2010). Ingatan individu
terhadap respon di pengukuran awal disebut dengan efek bawaan (carry-over
effect). Hal ini dapat menyebabkan overestimasi koefisien reliabilitas (Azwar,
2012).
2) Metode Bentuk tes alternatif
Metode bentuk tes alternatif merupakan pengukuran paralel yang tepat
digunakan ketika tes hanya dapat dilakukan sekali saja. Metode ini dilakukan
dengan menggunakan tes yang telah dikembangkan dengan asumsi tes tersebut
memiliki spesifikasi konten tes yang sama dan prosedur konstruksi tes yang
identik (Osterlind, 2010). Metode ini dilakukan dengan membagi satu kelompok
menjadi dua bagian dan administrasi tes dilakukan dalam dua sesi (Coaley, 2010).
Sesi pertama pada metode bentuk tes alternatif dilakukan dengan tes A
diadministrasikan pada kelompok pertama dan tes B diadministrasikan pada
kelompok kedua. Sesi kedua dilakukan dengan tes A diadministrasikan pada
kelompok kedua dan tes B diadministrasikan pada kelompok pertama (Coaley,
2010). Selanjutnya, kedua tes dikorelasikan dengan korelasi Pearson untuk
mengestimasi reliabilitas dan menghasilkan koefisien reliabilitas bentuk alternatif
yang disebut dengan koefisien ekuivalen (Osterlind, 2010).
Metode bentuk tes alternatif dapat mengurangi efek bawaan (subjek
mengingat aitem tes yang diberikan) pada tes berulang dikarenakan aitem tes yang
dihadapi individu di kedua sesi pelaksanaan tes berbeda (Coaley, 2010). Namun,
metode ini juga memiliki kekurangan yaitu tes yang dijadikan sebagai tes
alternatif tidak tersedia (Osterlind, 2010). Hal demikian terjadi dikarenakan
Universitas Sumatera Utara
32
sulitnya untuk membuat aitem dengan konten dan tingkat kesulitan yang sama di
dua tes yang berbeda. Selain itu, metode ini membutuhkan waktu yang lama untuk
pelaksanaannya. Berbagai kekurangan tersebut dapat mengurangi koefisien
reliabilitas (Coaley, 2010).
3) Metode Konsistensi internal
Metode konsistensi internal merupakan metode yang digunakan ketika alat
tes tidak memiliki bentuk alternatif. Dengan metode ini, pengukuran paralel dapat
dilakukan pada tes yang hanya mempunyai satu bentuk saja, yaitu dengan
membagi tes menjadi dua bagian (split-halves) (Osterlind, 2010) atau dengan
membagi tes menjadi tiga bagian maupun membagi sebanyak jumlah aitem
(Azwar, 2012). Pada tes yang dibagi dua, estimasi reliabilitasnya dilakukan
dengan mengkorelasikan hasil pengukuran kedua bagian (Kaplan, 2009). Korelasi
pada metode ini dilakukan dengan korelasi Pearson dan menghasilkan reliabilitas
split-half (Osterlind, 2010).
Pembagian tes dalam metode ini dapat dilakukan dengan mengelompokkan
aitem berangka ganjil ke dalam satu bagian dan aitem berangka genap ke bagian
lainnya. Pembagian tes juga dapat dilakukan secara acak ataupun dengan
menggunakan kriteria lainnya. Namun, pemilihan cara untuk pembagian tes dalam
metode ini penting untuk diperhatikan agar pembagian tesnya ekuivalen sehingga
tidak menganggu estimasi reliabilitas dengan metode ini. Metode ini juga tidak
direkomendasikan untuk tes yang aitemnya sedikit dikarenakan estimasi
reliabilitas umumnya lebih rendah pada tes yang singkat.
Adanya kelemahan yang ditemukan dalam metode ini membuat para ahli
psikometri merumuskan sejumlah formula dalam mengestimasi reliabilitas ketika
Universitas Sumatera Utara
33
akan menggunakan metode konsistensi internal (Osterlind, 2010). Pemilihan
formula dalam metode ini ditentukan oleh jenis pembagian tes yang digunakan
(Azwar, 2012). Salah satu formula yang dapat dipergunakan dalam metode ini
ialah formula Spearman-Brown. Formula ini digunakan untuk tes yang dibagi dua
dengan masing-masing bagian memenuhi asumsi paralel (memiliki distribusi
normal dan standar deviasi yang sama) (Osterlind, 2010).
Selain formula Spearman-Brown, terdapat formula Kuder-Richardson (KR)
yang dapat digunakan ketika pembagian tes dilakukan sebanyak jumlah aitem
dikarenakan jumlah aitem dalam tesnya sedikit (Osterlind, 2010) dan ketika aitem
tesnya diberi skor dikotomi (Azwar, 2012). Dalam penggunaannya, formula KR
terbagi menjadi KR-20 (tingkat kesulitan aitem tes berbeda) dan KR-21 (tingkat
kesulitan aitem tes sama) (Osterlind, 2010). Formula lainnya yang dapat
digunakan dalam metode ini ialah formula Koefisien Aplha, digunakan ketika
dalam pembagian tesnya asumsi paralel tidak terpenuhi namun asumsi π-
equivalent terpenuhi. Ketika tes yang dibagi dua tidak memenuhi asumsi paralel
dan π-equivalent, maka tes dibelah menjadi tiga bagian dan formula yang
digunakan adalah formula Kristof (Azwar, 2012).
c. Faktor-faktor yang mempengaruhi reliabilitas
Ada berbagai faktor yang mempengaruhi reliabilitas menurut Osterlind
(2010), yaitu :
1) Atenuasi
Reliabilitas terbagi atas dua yaitu indeks dan koefisien. Indeks reliabilitas
menggambarkan manifestasi teori reliabilitas. Koefisien reliabilitas merupakan
pengujian statistik terhadap reliabilitas. Pengujian dilakukan dengan
Universitas Sumatera Utara
34
mengkorelasikan skor tampak dari tes paralel. Namun, skor tampak yang
diperoleh dari suatu pengukuran tidak benar-benar utuh dalam menggambarkan
konstrak yang diukur dan terdapat error dalam pengukuran tersebut. Hal tersebut
dapat merendahkan korelasi antar konstrak yang diukur dan inilah yang disebut
dengan atenuasi. Adanya atenuasi inilah yang menyebabkan koefisien reliabilitas
selalu lebih kecil daripada indeks reliabilitas (Osterlind, 2010).
2) Panjang Tes
Panjang tes ialah banyaknya aitem dalam sebuah tes. Semakin banyak aitem
dan semakin panjang tes maka reliabilitasnya juga akan meningkat. Aitem
merupakan sampel informasi tentang konstrak. Oleh karena itu, semakin banyak
sampel informasi maka keseluruhan konstrak dapat digambarkan lebih utuh
(Osterlind, 2010). Azwar (2007) menyatakan bahwa penambahan aitem dalam
suatu tes akan meningkatkan reliabilitas tes jika aitem yang ditambahkan tersebut
memiliki kualitas yang setara dengan aitem yang sudah ada.
3) Heterogenitas kelompok
Variabilitas dalam kelompok menjadi pertimbangan penting dalam estimasi
reliabilitas. Heterogenitas kelompok mempengaruhi variabilitas yang juga
memiliki pengaruh kuat terhadap reliabilitas. Semakin heterogen kelompok maka
koefisien reliabilitasnya semakin tinggi. Semakin homogen kelompok maka
koefisien reliabilitasnya semakin rendah. Hal ini disebabkan oleh adanya
variabilitas dalam kelompok (Osterlind, 2010).
d. Interpretasi koefisien reliabilitas
Interpretasi koefisien reliabilitas bersifat relatif. Tidak ada batasan mutlak
dari nilai terendah koefisien reliabilitas yang harus dicapai agar dapat dikatakan
Universitas Sumatera Utara
35
reliabel. Oleh karena itu, peneliti maupun pengguna teslah yang menentukan
koefisien reliabilitas yang diperoleh sudah memuaskan atau belum, tergantung
kepada tujuan pengukuran atau tujuan tesnya (Azwar, 2012). Jika suatu tes
digunakan untuk mengukur inteligensi, maka koefisien reliabilitas dikatakan baik
jika koefisien yang diperoleh berada diatas 0.9 (Coaley, 2010).
Namun, dalam pengaplikasian tes psikologi secara umum, Murphy &
Davidshofer (2005) menyatakan bahwa suatu tes dikatakan memiliki reliabilitas
yang rendah jika koefisien reliabilitasnya berada dibawah 0.6, sedang jika
koefisien reliabilitasnya berada diantara 0,6-0.7, dan tinggi koefisien
reliabilitasnya berada diatas 0.8. Dalam menginterpretasikan koefisien reliabilitas,
Azwar (2012) menyatakan bahwa ada dua hal yang harus dipahami, yaitu :
1) Besarnya koefisien reliabilitas alat tes dari data skor suatu kelompok subjek
dalam kondisi tertentu, besar kemungkinan koefisien reliabilitasnya tidak
sama dengan data dari skor kelompok subjek lain dalam situasi lain.
2) Koefisien reliabilitas hanya mengindikasikan besarnya inkonsistensi skor hasil
pengukuran dan tidak dapat menjelaskan sebab-sebab dari inkonsistensi
tersebut.
3. Indeks Kesukaran Aitem
Indeks kesukaran aitem (disimbolkan dengan huruf p) merupakan rasio antara
penjawab aitem yang benar dengan banyaknya penjawab aitem. Indeks kesukaran
aitem menyatakan tingkat kesukaran suatu aitem. Dalam menghitung indeks
kesukaran aitem, semua subjek dijadikan satu kelompok tanpa membedakan
antara kelompok yang tinggi maupun kelompok yang rendah (Azwar, 2012).
Universitas Sumatera Utara
36
Nilai p yang diperoleh dari perhitungan indeks kesukaran aitem berkisar
mulai dari 0 sampai dengan 1. Semakin besar nilai p, maka aitem tersebut
semakin mudah. Sebaliknya, semakin kecil nilai p maka aitemnya semakin sulit
(Azwar, 2012). Nilai p yang diperoleh tersebut akan digunakan dalam penyusunan
aitem. Aitem-aitem dalam suatu tes akan disusun dari aitem dengan nilai p yang
paling tinggi (aitem yang paling mudah) hingga aitem dengan nilai p yang paling
rendah (aitem yang paling sulit) (Murphy & Davidshofer, 2005). Ketika suatu
aitem memiliki nilai p sebesar 0 atau 1 dapat dikatakan bahwa aitem tersebut tidak
berguna. Hal itu disebabkan oleh aitem yang taraf kesukarannya terlalu tinggi
ataupun terlalu rendah memiliki daya diskriminasi yang kurang baik (Azwar,
2012).
Secara umum, nilai p yang dianggap baik sebesar 0.5. Nilai p dibawah 0.5
(aitem sulit) terkadang dianggap baik ketika akan digunakan untuk tes yang dalam
prosedur seleksinya hanya memilih sedikit subjek. Dengan demikian, angka p
yang terbaik disesuaikan dengan tujuan tes yang bersangkutan. Nilai p yang
diperoleh juga merujuk kepada taraf kesukaran kelompok, bukan individual
(Azwar, 2012). Crocker & Algina (2008) menyatakan nilai p berkaitan dengan
reliabilitas. Nilai p yang lebih besar dari 0.5 untuk aitem yang skornya berbentuk
dikotomi sudah menunjukkan reliabilitas yang baik (Crocker & Algina, 2008).
Allan & Yen (dalam Lababa, 2008) mengkategorikan nilai p sebagai berikut:
Tabel 1. Kategori Batasan Nilai p
p Kategori
P < 0.3 Sulit
0.3 < p < 0.7 Sedang
P > 0.7 Mudah
Universitas Sumatera Utara
37
4. Indeks Daya Diskriminasi Aitem
Daya diskriminasi aitem (disimbolkan dengan huruf d) adalah kemampuan
aitem dalam membedakan subjek yang memiliki atribut yang diukur dan yang
tidak memiliki (Azwar, 2012). Daya diskriminasi aitem juga didefinisikan sebagai
kemampuan aitem dalam membedakan subjek yang mempunyai kemampuan
tinggi dengan subjek yang mempunyai kemampuan rendah. Aitem yang memiliki
indeks daya diskriminasi aitem yang tinggi akan dijawab dengan benar oleh
semua kelompok yang kemampuannya tinggi dan tidak dapat dijawab oleh
sebagian besar kelompok yang kemampuannya rendah. Daya diskriminasi suatu
aitem semakin besar ketika perbedaan proporsi penjawab benar dari kelompok
tinggi dan kelompok rendah semakin besar pula (Azwar, 2012).
Nilai indeks daya diskriminasi aitem berkisar dari -1 sampai dengan +1.
Indeks daya diksriminasi aitem sebesar 0 apabila nilai indeks diksriminasi
kelompok tinggi sama dengan nilai indeks diksriminasi kelompok rendah. Dalam
analisis aitem, hanya nilai positiflah yang dapat digunakan. Semakin besar indeks
daya diskriminasi suatu aitem maka aitem tersebut semakin mampu membedakan
individu yang atributnya diukur. Semakin kecil indeks daya diskriminasi aitem
maka aitem tersebut semakin tidak jelas fungsinya untuk membedakan individu
yang atributnya diukur (Azwar, 2012).
Daya diskriminasi aitem memiliki kaitan dengan indeks kesukaran aitem.
Daya diskriminasi aitem yang baik terdapat pada aitem yang nilai p nya berkisar
dari 0.4 sampai dengan 0.6 atau dapat dikatakan berada pada aitem yang tidak
terlalu mudah tapi juga tidak terlalu sulit. Dalam seleksi aitem, aitem yang nilai d
lebih besar dari 0.50 dikatakan memiliki daya diskriminasi yang baik. Ketika
Universitas Sumatera Utara
38
aitem memiliki nilai d lebih kecil dari 0.20, maka aitem tersebut bisa dihilangkan
tanpa harus ditelusuri lebih lanjut untuk direvisi (Azwar, 2012). Ebel (dalam
Azwar, 2012) membuat kriteria evaluasi indeks diskriminasi aitem ke dalam
empat kategori yaitu :
Tabel 2. Evaluasi Indeks Diskriminasi Aitem Indeks Diskriminasi (d) Evaluasi
≥ 0.4 Bagus sekali
0.3 – 0.39 Lumayan bagus tapi mungkin masih perlu
peningkatan
0.2 – 0.29 Belum memuaskan, perlu diperbaiki
< 0.2 Jelek dan harus dibuang
C. Analisis Karakteristik Psikometri Subtes Zahlen Reihen (ZR) Pada
Intelligenz Struktur Test (IST)
IST diperkenalkan oleh Rudolf Amtheur di Jerman pada tahun 1953. Pada
tahun 1973, IST diadaptasi dari IST versi 70 Jerman di Indonesia oleh Fakultas
Psikologi UNPAD. Tes ini masih digunakan hingga saat ini terutama dalam
seleksi pekerjaan. IST terdiri dari 9 subtes namun dalam penelitian ini, peneliti
akan berfokus kepada satu subtes saja, yaitu subtes ZR dikarenakan subtes ini
merupakan subtes yang sering disajikan dalam penggunaan IST.
Subtes ZR sebagai subtes yang sering digunakan seharusnya memiliki kajian
psikometri yang komprehensif. Dalam menganalisis karakteristik psikometri suatu
tes umumnya dilakukan dengan cara menguji kualitas aitem, validitas dan
reliabilitas. Untuk pengujian validitasnya, subtes ZR telah dianalisis dengan bukti
prediktif pada tahun 2008 dan bukti validitas berdasarkan struktur internal
menggunakan pendekatan IRT pada tahun 2014 dan metode multitrait-
multimethod (MTMM) pada tahun 2011. Namun, pengujian validitas dengan
Universitas Sumatera Utara
39
menggunakan kedua bukti saja masih belum lengkap dikarenakan suatu tes harus
dikaji secara menyeluruh. Hal ini didukung dengan pernyataan Osterlind (2010)
bahwa validitas dari suatu tes harus dibuktikan dari berbagai sumber yang ada.
Oleh karena itu, peneliti akan menganalisis subtes ZR dengan menggunakan bukti
validitas yang lain untuk melengkapi kajian psikometri subtes ZR. Pengujian
validitasnya akan dilakukan dengan bukti validitas berdasarkan hubungan dengan
variabel lain (bukti konkuren). Selain memvalidasi, peneliti juga akan
mengestimasi indeks kesukaran aitem dan indeks daya diskriminasi aitem serta
mengestimasi koefisien reliabilitas subtes ZR dalam penelitian ini.
Berbagai cara yang akan dilakukan dalam analisis karakteristik psikometri
subtes ZR penting untuk dilakukan karena ada banyak faktor yang dapat
mempengaruhi validitas, reliabilitas dan kualitas aitem dari subtes ZR. Subtes ZR
dengan aitem berupa deret angka sudah dapat ditemukan sejak SMP. Selain itu,
subtes ini sering ditemui dalam pelaksanaan berbagai tes. Hal ini membuat subtes
ZR menjadi familiar bagi subjek. Adanya pengalaman subjek dalam mengerjakan
soal subtes ZR akan menimbulkan proses belajar yang membuat subjek telah
mengetahui cara dalam mengerjakannya dan respon yang diharapkan untuk setiap
aitem. Ketika subjek telah mengetahui bentuk penyelesaian dan jawaban dalam
aitem subtes ZR maka subjek akan dapat menjawab semua aitem dengan benar.
Dengan demikian, dapat dikatakan bahwa aitem dalam tes tersebut terlalu mudah
untuk dikerjakan. Dalam Azwar (2012) dinyatakan bahwa ketika aitem terlalu
mudah maka indeks kesukaran aitemnya rendah.
Indeks kesukaran aitem yang rendah menyebabkan indeks daya diskriminasi
aitemnya menjadi rendah pula. Semakin kecil indeks diskriminasi aitem maka
Universitas Sumatera Utara
40
aitem tersebut semakin tidak jelas fungsinya untuk membedakan individu yang
atributnya diukur. Semakin besar indeks diskriminasi suatu aitem maka aitem
tersebut semakin mampu membedakan individu yang atributnya diukur (Azwar,
2012). Dengan demikian, ketika nilai indeks diskriminasi aitemnya rendah, maka
fungsi tes untuk membedakan antar individu yang biasanya digunakan untuk
seleksi kerja menjadi tidak dapat berfungsi sebagaimana mestinya.
Ketidakmampuan suatu aitem dalam membedakan subjek pada kelompok
tinggi dengan kelompok yang rendah juga menyebabkan variasi pengukurannya
rendah. Variasi pengukuran yang rendah ini terlihat dari skor antar subjek yang
mirip dikarenakan subjek relatif menjawab dengan benar. Dalam Coaley (2010)
dinyatakan bahwa variasi pengukuran yang rendah menyebabkan jangkauan data
terbatas. Keterbatasan jangkauan data ini merupakan salah satu faktor yang dapat
mempengaruhi validitas.
Selain menyebabkan keterbatasan jangkauan data, variasi pengukuran yang
rendah juga menyebabkan subjek berada dalam kelompok yang homogen.
Homogen ataupun heterogen suatu kelompok dinyatakan oleh Osterlind (2010)
sebagai salah satu faktor yang mempengaruhi reliabilitas. Semakin homogen
kelompok, maka koefisien reliabilitasnya semakin rendah. Sebaliknya, semakin
heterogen kelompok, maka koefisien reliabilitasnya semakin tinggi. Dengan
demikian, ketika subjek memiliki variasi pengukuran yang rendah maka koefisien
reliabilitasnya juga akan rendah. Dalam Coaley (2010) dinyatakan bahwa
koefisien reliabilitas yang rendah menyebabkan koefisien validitasnya juga
rendah. Hal ini dikarenakan koefisien validitas tidak pernah bisa melebihi
Universitas Sumatera Utara
41
koefisien reliabilitas dan inilah yang disebut dengan efek atenuasi. Efek atenuasi
ini juga merupakan salah satu faktor yang mempengaruhi koefisien validitas.
Faktor lainnya yang juga dapat mempengaruhi koefisien validitas ialah
kontaminasi kriteria. Penggunaan kriteria dalam uji validitas berdasarkan
hubungan dengan variabel lain menggunakan bukti konkuren menjadi salah satu
hal yang patut untuk dicermati. Ketidaktepatan dalam memilih kriteria menjadi
satu hal yang harus diwaspadai. Dalam Coaley (2010) dikatakan bahwa ketika
kriteria yang dipilih bias maka uji validitas konkuren terhadap subtes ZR juga
menjadi terganggu dan menimbulkan bias. Hal inilah yang disebut dengan
kontaminasi kriteria. Oleh karena itu, penting untuk memilih kriteria yang benar-
benar tepat untuk dijadikan sebagai pembanding dalam sebuah pengukuran agar
tidak bias. Dalam penelitian ini, peneliti memilih TKD 6 sebagai kriteria untuk uji
validitas dengan bukti konkuren dikarenakan TKD 6 mengukur hal yang sama
dengan subtes ZR dan bentuk aitem dalam kedua tes ini juga sama yaitu
berbentuk deret angka.
Pengujian validitas dengan bukti konkuren dalam penelitian ini dilakukan
dengan mengkorelasikan skor subtes ZR dengan skor TKD 6. Komputasi
koefisien validitas subtes ZR akan dilakukan dengan menggunakan rumus
korelasi Pearson Product-Moment. Jika terdapat korelasi yang tinggi antara subtes
ZR dengan TKD 6 maka dapat dikatakan bahwa subtes ZR memiliki validitas
konkuren yang baik. Hasil dari pengujian ini dikatakan memiliki validitas
konkuren yang baik apabila koefisien validitasnya berada di atas 0.45 dan sangat
baik apabila koefisien validitasnya berada di atas 0.45 (Coaley, 2010).
Universitas Sumatera Utara
42
Selain pengujian validitas, analisis karakteristik psikometri subtes ZR juga
dilakukan dengan pengujian reliabilitas. Estimasi koefisien reliabilitas dalam
penelitian ini dilakukan dengan metode konsistensi internal menggunakan formula
Kuder-Richardson. Formula ini digunakan karena aitem dalam subtes ZR tidak
terlalu banyak (berjumlah 20 aitem) dan skor dalam subtes ZR merupakan skor
dikotomi. Penentuan menggunakan formula KR-20 atau KR-21 pada subtes ZR
ditetapkan ketika telah diketahui tingkat kesukaran aitem dalam subtes apakah
bersifat homogen atau tidak. Hasil dari pengujian pada tes inteligensi umumnya
dikatakan memiliki reliabilitas yang tinggi jika koefisien reliabilitasnya berada
diatas 0.90 (Coaley, 2010). Subtes ZR merupakan bagian dari tes inteligensi.
Analisis karakteristik psikometri lainnya yang juga dilakukan dalam
penelitian ini adalah analisis kualitas aitem dengan mengestimasi indeks
kesukaran aitem dan indeks daya diskriminasi aitem. Kedua analisis aitem yang
dilakukan ini akan saling mempengaruhi (Murphy & Davidshofer, 2005). Dalam
Azwar (2012) dinyatakan bahwa secara umum nilai p yang diperoleh dari
perhitungan indeks diskriminasi aitem berkisar mulai dari 0 sampai dengan 1.
Semakin besar nilai p, maka aitem tersebut semakin mudah. Sebaliknya, semakin
kecil nilai p maka aitemnya semakin sulit. Nilai p yang dianggap baik sebesar 0.5.
Namun, karena subtes ZR merupakan salah satu subtes dalam tes inteligensi maka
nilai indeks kesukaran aitem yang diharapkan dalam penelitian ini bervariasi.
Nilai indeks diskriminasi aitem umumnya berkisar dari -1 sampai dengan +1
namun dalam analisis daya diskriminasi aitem, hanya nilai positiflah yang dapat
digunakan. Dalam penelitian ini, nilai indeks diskriminasi yang diharapkan oleh
peneliti ialah di atas 0.4.
Universitas Sumatera Utara
43
BAB III
METODE PENELITIAN
A. Jenis Penelitian
Penelitian terhadap subtes ZR pada IST hasil adaptasi Fakultas Psikologi
UNPAD pada tahun 1970-an menggunakan metode penelitian kuantitatif
deksriptif. Metode ini dipilih karena tujuan penelitian yang dilakukan adalah
untuk mendeksripsikan karakteristik psikometri dari subtes ZR yang meliputi
analisis kualitas aitem (indeks kesukaran aitem dan indeks diskriminasi daya
aitem), analisis validitas dengan bukti konkuren dan analisis reliabilitas.
Analisis karakteristik psikometri subtes ZR dalam penelitian ini dilakukan
dengan menggunakan data dari pemberian subtes ZR kepada subjek. Data mentah
tersebut akan diskoring lalu diolah dengan metode statistika. Hasil pengolahan
data akan disajikan secara sistematis untuk dapat ditarik kesimpulan.
B. Subjek Penelitian
1. Populasi dan Sampel Penelitian
Populasi adalah sekelompok objek maupun subjek yang memiliki kualitas
dan karakteristik tertentu sesuai dengan yang telah ditetapkan oleh peneliti untuk
dipelajari dan ditarik kesimpulan. Sampel adalah bagian dari jumlah dan
karakteristik yang terdapat pada populasi (Sugiyono, 2012).
Populasi dalam penelitian ini disesuaikan berdasarkan norma IST. Norma
yang digunakan dalam IST ada dua yaitu norma usia dan norma pendidikan.
Berdasarkan norma usia, IST diperuntukkan bagi individu yang berusia 12-60
tahun. Berdasarkan norma pendidikan, IST dapat digunakan untuk tingkat
pendidikan SMP, SMA, Akademi/D-III dan perguruan tinggi (Polhaupessy dalam
Universitas Sumatera Utara
44
Diktat Kuliah IST UNPAD, 2009). Namun, dikarenakan teknik pengambilan
sampel yang digunakan adalah sampling insidental maka sampel yang berhasil
dikumpulkan oleh peneliti terbatas pada usia 17-20 tahun dan tingkat pendidikan
perguruan tinggi. Oleh karena itu, hasil penelitian yang terdapat dalam penelitian
ini hanya dapat digeneralisasikan pada individu dengan rentang usia 17-20 tahun
saja dan tingkat pendidikan perguruan tinggi.
2. Teknik Pengambilan Sampel
Teknik pengambilan sampel yang digunakan dalam penelitian ini adalah
sampling insidental. Sampling insidental merupakan teknik pemilihan sampel
yang dilakukan secara insidental atau kebetulan, siapa saja yang bertemu dengan
peneliti dan memenuhi karakteristik yang telah ditetapkan oleh peneliti
sebelumnya maka dapat dijadikan sampel (Sugiyono, 2012). Sampel yang
digunakan dalam penelitian ini adalah individu dengan rentang usia 17-20 tahun
dan tingkat pendidikan perguruan tinggi. Pengambilan data dilakukan peneliti
pada mahasiswa Psikologi USU Angkatan 2016.
Analisis validitas dalam penelitian ini dilakukan dengan menggunakan bukti
kriteria. Dalam Nunnally & Bernstein (1994) dinyatakan bahwa koefisien
validitas yang dapat dicapai dalam uji validitas dengan bukti kriteria umumnya
sekitar 0.3 sampai dengan 0.4 namun bisa juga mencapai 0.5 sampai dengan 0.6
jika kriteria yang digunakan terkait dengan kemampuan kognitif. Untuk sampel
dalam penelitian, Nunnally menyatakan bahwa jumlah sampel sebesar 50
merupakan batas minimal untuk mencapai koefisien validitas sebesar 0.3. Untuk
mencapai koefisien validitas yang lebih tinggi, diperlukan sampel yang lebih
Universitas Sumatera Utara
45
besar. Adapun jumlah sampel yang digunakan dalam penelitian ini berjumlah 167
orang.
C. Data Penelitian
Penelitian ini menggunakan data primer, yaitu data yang diperoleh dari
pelaksanaan tes kelompok dengan memberikan subtes ZR dan TKD 6 kepada
mahasiswa Psikologi USU Angkatan 2016.
D. Prosedur Pelaksanaan Penelitian
1. Pembuatan Proposal
Penelitian ini dilakukan dengan merancang proposal terlebih dahulu.
Proposal terdiri dari Bab I Pendahuluan, Bab II Tinjauan Pustaka, dan Bab III
Metode Penelitian.
2. Persiapan Izin Penelitian
Peneliti mengurus surat izin untuk peminjaman alat tes ke bagian
laboratorium kampus. Peneliti juga menghubungi dosen-dosen yang mengajar di
Angkatan 2016 untuk meminta izin memberikan tes kepada mahasiswa Angkatan
2016 sebelum maupun setelah perkuliahan.
3. Pelaksanaan Penelitian
Penelitian dilaksanakan dengan memberikan subtes ZR dan TKD 6 kepada
mahasiswa S1 Psikologi USU Angkatan 2016 yang terbagi atas tiga kelas, yaitu
kelas A, B, dan C. Pengadministrasian tes dilakukan secara kelompok dan bekerja
sama dengan sarjana psikologi yang terlatih untuk mengadministrasikan subtes
ZR dan TKD 6.
Universitas Sumatera Utara
46
4. Analisis Data
Peneliti menskoring lembar jawaban subtes ZR dan TKD 6 yang telah
dikumpulkan. Selanjutnya, peneliti menyusun data berupa hasil skoring subtes ZR
dan TKD 6 secara sistematis dalam tabel. Selanjutnya, peneliti menganalisis
indeks kesukaran aitem, indeks daya diskriminasi aitem dan realibilitasnya serta
menganalisis validitasnya dengan mengkorelasikan skor total subtes ZR dengan
TKD 6.
E. Metode Pengumpulan Data
Pengumpulan data yang dilakukan dalam penelitian ini dilakukan dengan
memberikan subtes ZR dan TKD dalam tes kelompok. Dari pelaksanaan tes
tersebut, akan diperoleh data primer.
F. Analisis Data
Analisis data yang dilakukan dalam penelitian ini yaitu analisis validitas,
reliabilitas, indeks kesukaran aitem, dan indeks daya diskriminasi aitem
1. Analisis Validitas
Analisis validitas yang dilakukan dalam penelitian ini adalah analisis validitas
dengan bukti konkuren. Analisis ini dilakukan dengan menggunakan korelasi
Pearson Product-Moment untuk mencari hubungan antara skor subtes ZR dengan
skor TKD 6. Adapun rumusan dari koefisien korelasi adalah sebagai berikut :
Rxy = ............................................................ (1)
Universitas Sumatera Utara
47
Keterangan :
X = skor subtest ZR IST
Y = skor TKD 6
n = banyaknya subjek
Koefisien validitas tertinggi yang dapat dicapai dalam pengujian validitas
dengan bukti kriteria sekitar 0.5 dan 0.6 (Murphy & Davidshofer, 2005). Dalam
Coaley (2010) dinyatakan bahwa koefisien validitas untuk bukti konkuren
dianggap baik jika koefisiennya berada di atas 0.45 dan sangat baik jika
koefisiennya berada di atas 0.55.
2. Analisis Reliabilitas
Analisis reliabilitas subtes ZR dalam penelitian ini dilakukan dengan
pendekatan konsistensi internal menggunakan formula Kuder-Richardson (KR)
20. Peneliti menggunakan formula ini dikarenakan tingkat kesukaran dalam aitem
subtes ZR bervariasi, aitem dalam subtes ZR jumlahnya tidak begitu banyak (20
aitem) dan skor tes berbentuk dikotomi. Adapun rumusan dari formula KR-20
adalah sebagai berikut:
................................................................. (2)
Keterangan :
= koefisien reliabilitas
= proporsi populasi yang menjawab aitem benar (atau aitem pertama).
= proporsi populasi yang menjawab aitem salah (atau aitem kedua).
= banyak aitem dalam tes.
= varians skor tes.
Universitas Sumatera Utara
48
Subtes ZR sebagai bagian dari tes inteligensi sering digunakan dalam seleksi
kerja. Reliabilitas dalam tes inteligensi dikatakan baik jika koefisien
reliabilitasnya diatas 0,9 (Coaley, 2010).
3. Analisis Indeks Kesukaran Aitem
Analisis indeks kesukaran aitem dalam penelitian ini dilakukan dengan
menggunakan formula berikut ini :
p = ni / N ............................................................................................. (3)
Keterangan :
p = indeks kesukaran aitem.
ni = banyaknya subjek yang menjawab aitem dengan benar.
N = banyaknya subjek yang menjawab aitem.
Aitem dalam penelitian ini dikatakan memiliki indeks kesukaran aitem yang
rendah dan tergolong ke dalam kategori sulit jika nilai p yang diperoleh berada di
bawah 0.3. Jika nilai p berada di antara 0.3 sampai dengan 0.7 maka aitem berada
dalam kategori sedang. Jika nilai p berada di atas 0.7 maka aitem dikatakan
mudah (Allan & Yen dalam Lababa, 2008). Adapun indeks kesukaran aitem
subtes ZR dalam penelitian ini diharapkan bervariasi dikarenakan subtes ZR
merupakan bagian dari IST yang mengukur inteligensi.
4. Analisis Indeks Daya Diskriminasi Aitem
Analisis indeks diksriminasi aitem dilakukan dengan formula berikut ini :
Ρblx = …………………………………….. (4)
Universitas Sumatera Utara
49
Keterangan :
µ+ = rata – rata skor yang menjawab aitem dengan benar
µ+ = rata – rata skor seluruh kelompok
σx = standar deviasi
p = indeks kesulitan
q = 1 – p
Aitem dalam penelitian ini dikatakan memiliki indeks diskriminasi aitem
yang bagus sekali jika nilai d yang diperoleh berada di atas 0.4. Dikatakan
lumayan bagus jika nilai d berada diantara 0.3 sampai dengan 0.39. Jika nilai d
berada diantara 0.2 sampai dengan 0.29 maka aitem dinilai belum memuaskan dan
jika nilai d dibawah 0,2 maka aitem dikatakan jelek (Ebel dalam Azwar, 2012).
Universitas Sumatera Utara
50
BAB IV
HASIL DAN PEMBAHASAN
Hasil dan pembahasan yang dideskripsikan dalam bab ini adalah hasil analisis
karakteristik psikometri subtes ZR berupa deskripsi umum data penelitian dan
deskripsi hasil serta pembahasan hasil penelitian subtes ZR. Selain itu, hasil
analisis TKD 6 juga akan dipaparkan dalam bab ini.
A. Deskripsi Umum Data Penelitian
Penelitian ini menggunakan data primer, yaitu data yang diperoleh dari
pemberian tes kepada sampel penelitian secara klasikal. Sampel yang digunakan
dalam penelitian ini adalah mahasiswa S1 Psikologi USU Angkatan 2016 dengan
rentang usia 17-20 tahun. Jumlah sampel dalam penelitian ini sebanyak 167
orang. Gambaran sampel penelitian berdasarkan usianya disajikan dalam tabel 3.
Gambaran sampel penelitian berdasarkan jenis kelamin disajikan dalam tabel 4.
Tabel 3. Proporsi Sampel Penelitian Berdasarkan Usia
Usia (Tahun) Frekuensi Persentase (%)
17 4 2.4
18 73 43.7
19 76 45.5
20 14 8.4
Jumlah total 167 100
Tabel 4. Proporsi Sampel Penelitian Berdasarkan Jenis Kelamin
Jenis Kelamin Frekuensi Persentase (%)
Perempuan 130 77.8
Laki-laki 37 22.2
Jumlah total 167 100
Universitas Sumatera Utara
51
B. Deskripsi Hasil Penelitian
1. Hasil Analisis Indeks Kesukaran Aitem
Analisis indeks kesukaran aitem subtes ZR pada IST dilakukan karena tes ini
termasuk ke dalam tes inteligensi yang bertujuan untuk mengukur inteligensi
subjek berdasarkan respon yang diberikan subjek pada setiap aitem dalam subtes
ZR. Berdasarkan Allan & Yen (dalam Lababa, 2008), aitem dikatakan sulit ketika
nilai p dibawah 0.3, dikatakan sedang ketika nilai p berada diantara 0.3 sampai
0.7, dan dikatakan mudah ketika nilai p berada diatas 0.7. Hasil analisis indeks
kesukaran aitem dapat dilihat pada tabel 5.
Tabel 5. Hasil Analisis Indeks Kesukaran Aitem Subtes ZR
Aitem p Keterangan Aitem p Keterangan
97 0.934 Mudah 107 0.587 Sedang
98 0.934 Mudah 108 0.491 Sedang
99 0.910 Mudah 109 0.383 Sedang
100 0.868 Mudah 110 0.246 Sulit
101 0.599 Sedang 111 0.210 Sulit
102 0.820 Mudah 112 0.144 Sulit
103 0.539 Sedang 113 0.180 Sulit
104 0.383 Sedang 114 0.144 Sulit
105 0.467 Sedang 115 0.084 Sulit
106 0.689 Sedang 116 0.096 Sulit
Berdasarkan hasil analisis indeks kesukaran aitem pada tabel 5, maka aitem
dapat dikelompokkan seperti dalam tabel 6 berikut :
Tabel 6. Rangkuman Analisis Indeks Kesukaran Aitem Subtes ZR
p Kategori Nomor Aitem Jumlah Aitem
P < 0.3 Sulit 110, 111, 112, 113,
114, 115, 116
7
0.3 < p < 0.7 Sedang 101, 103, 104, 105,
106, 107, 108, 109
8
P > 0.7 Mudah 97, 98, 99, 100, 102 5
2. Hasil Analisis Indeks Daya Diskriminasi Aitem
Proses yang dilakukan dalam menganalisis indeks daya diskriminasi aitem
subtes ZR pada IST sama dengan analisis indeks kesukaran aitem. Berdasarkan
Universitas Sumatera Utara
52
Ebel (dalam Azwar, 2012), nilai d diatas 0.4 dikatakan bagus sekali, nilai d
diantara 0.3 sampai dengan 0.39 dikatakan lumayan bagus tapi mungkin masih
perlu peningkatan, nilai d diantara 0.2 sampai dengan 0.29 dikatakan belum
memuaskan dan perlu diperbaiki, dan nilai d dibawah 0.2 dikatakan jelek. Hasil
analisis indeks daya diskriminasi aitem dapat dilihat pada tabel 7.
Tabel 7. Hasil Analisis Indeks Daya Diskriminasi Aitem Subtes ZR
Aitem d Keterangan
97 0.385 Lumayan bagus tapi mungkin masih perlu peningkatan
98 0.308 Lumayan bagus tapi mungkin masih perlu peningkatan
99 0.442 Bagus sekali
100 0.526 Bagus sekali
101 0.356 Lumayan bagus tapi mungkin masih perlu peningkatan
102 0.347 Lumayan bagus tapi mungkin masih perlu peningkatan
103 0.564 Bagus sekali
104 0.643 Bagus sekali
105 0.420 Bagus sekali
106 0.570 Bagus sekali
107 0.629 Bagus sekali
108 0.617 Bagus sekali
109 0.634 Bagus sekali
110 0.662 Bagus sekali
111 0.646 Bagus sekali
112 0.484 Bagus sekali
113 0.468 Bagus sekali
114 0.492 Bagus sekali
115 0.432 Bagus sekali
116 0.314 Lumayan bagus tapi mungkin masih perlu peningkatan
Berdasarkan hasil analisis indeks daya diskriminasi aitem pada tabel
sebelumnya, maka aitem dapat dikelompokkan seperti dalam tabel 8 berikut :
Tabel 8. Rangkuman Analisis Indeks Daya Diskriminasi Aitem Subtes ZR Indeks diskriminasi
(d) Evaluasi Nomor aitem Jumlah aitem
≥ 0.4 Bagus sekali 99, 100, 103, 104,
105, 106, 107, 108,
109, 110, 111, 112,
113, 114, 115
15
0.3 – 0.39 Lumayan bagus tapi
mungkin masih perlu
peningkatan
97, 98, 101, 102, 116 5
Universitas Sumatera Utara
53
(Lanjutan) Tabel 8. Rangkuman Hasil Analisis Indeks Daya Diskriminasi Aitem
Subtes ZR Indeks diskriminasi
(d) Evaluasi Nomor aitem Jumlah aitem
0.2 – 0.29 Belum memuaskan,
perlu diperbaiki
- 0
< 0.2 Jelek dan harus
dibuang
- 0
3. Seleksi Aitem Berdasarkan Indeks Kesukaran Aitem dan Indeks Daya
Diskriminasi Aitem
Sebuah tes dinilai baik jika aitem dalam tes tersebut baik dan aitem yang baik
akan menghasilkan pengukuran yang baik. Suatu aitem dikatakan baik ketika
kualitas aitem tersebut baik. Kualitas aitem yang baik ditunjukkan dengan indeks
kesukaran aitem dan indeks diskriminasi daya aitem yang baik pula. Analisis
terhadap kedua kriteria tersebut dapat dilihat dalam tabel 9 berikut.
Tabel 9. Seleksi Aitem Berdasarkan Indeks Kesukaran Aitem dan
Indeks Daya Diskriminasi Aitem Subtes ZR Aitem p d Keterangan
97 0.934 0.385 Diterima
98 0.934 0.308 Diterima
99 0.910 0.442 Diterima
100 0.868 0.526 Diterima
101 0.599 0.356 Diterima
102 0.820 0.347 Diterima
103 0.539 0.564 Diterima
104 0.383 0.643 Diterima
105 0.467 0.420 Diterima
106 0.689 0.570 Diterima
107 0.587 0.629 Diterima
108 0.491 0.617 Diterima
109 0.383 0.634 Diterima
110 0.246 0.662 Diterima
111 0.210 0.646 Diterima
112 0.144 0.484 Diterima
113 0.180 0.468 Diterima
114 0.144 0.492 Diterima
115 0.084 0.432 Diterima
116 0.096 0.314 Diterima
Universitas Sumatera Utara
54
Ket :
d = daya diskriminasi aitem
p = indeks kesukaran aitem
Dari hasil analisis tersebut, dapat dirangkum seperti dalam tabel 10 berikut.
Tabel 10. Rangkuman Analisis Aitem Subtes ZR Keterangan Parameter Nomor Aitem Jumlah Aitem
Diterima d>0.3 97, 98, 99, 100, 101, 102, 103,
104, 105, 106, 107, 108, 109, 110,
111, 112, 113, 114, 115, 116
20
Revisi d<0.3 - 0
4. Hasil Analisis Validitas Berdasarkan Bukti Konkuren
Analisis validitas pada subtes ZR dilakukan dengan menggunakan bukti
konkuren. Dalam analisisnya, skor total subtes ZR dikorelasikan dengan skor total
kriteria lainnya. Kriteria lainnya yang digunakan dalam analisis validitas ini
adalah TKD 6. Skor total dari kedua tes ini dikorelasikan dengan korelasi Pearson
Product Moment. Dari hasil korelasi tersebut diperoleh koefisien validitas subtes
ZR dengan bukti konkuren sebesar 0.67 yang artinya bahwa subtes ZR memiliki
validitas yang sangat baik berdasarkan Coaley (2010).
5. Hasil Analisis Reliabilitas
Analisis reliabilitas pada subtes ZR dilakukan dengan pendekatan konsistensi
internal menggunakan formula KR-20. Formula ini dipilih karena tingkat
kesulitan dalam aitem subtes ZR bervariasi. Koefisien reliabilitas yang diperoleh
dalam analisis reliabilitasnya sebesar 0.842 yang artinya subtes ZR memiliki
reliabilitas yang sangat baik berdasarkan Murphy &Davidshofer (2005).
6. Analisis Tambahan TKD 6
Pengujian karakteristik psikometri subtes ZR dalam penelitian ini
menggunakan alat tes lainnya sebagai kriteria untuk uji validitas, yaitu TKD 6.
Universitas Sumatera Utara
55
Dengan demikian, dalam bagian ini peneliti memaparkan analisis tambahan dari
TKD 6 seperti yang dilakukan pada subtes ZR. Adapun hasil analisis tambahan
yang dipaparkan dalam bagian ini adalah analisis indeks kesukaran aitem, analisis
indeks daya diskriminasi aitem, analisis validitas dan reliabilitas.
a. Hasil Analisis Indeks Kesukaran Aitem
Tabel 11. Hasil Analisis Indeks Kesukaran Aitem TKD 6
Aitem p Keterangan Aitem p Keterangan
1 0.934 Mudah 16 0.467 Sedang
2 0.928 Mudah 17 0.575 Sedang
3 0.832 Mudah 18 0.395 Sedang
4 0.892 Mudah 19 0.335 Sedang
5 0.754 Mudah 20 0.269 Sulit
6 0.916 Mudah 21 0.246 Sulit
7 0.515 Sedang 22 0.335 Sedang
8 0.509 Sedang 23 0.150 Sulit
9 0.000 Sulit 24 0.299 Sulit
10 0.844 Mudah 25 0.186 Sulit
11 0.784 Mudah 26 0.150 Sulit
12 0.862 Mudah 27 0.048 Sulit
13 0.754 Mudah 28 0.024 Sulit
14 0.671 Sedang 29 0.012 Sulit
15 0.689 Sedang 30 0.000 Sulit
Berdasarkan hasil analisis indeks kesukaran aitem pada tabel 11, maka aitem
dapat dikelompokkan seperti dalam tabel 12 berikut.
Tabel 12. Rangkuman Analisis Indeks Kesukaran Aitem TKD 6
p Kategori Nomor Aitem Jumlah Aitem
P < 0.3 Sulit 9, 20, 21, 23, 24, 25, 26,
27, 28, 29, 30
11
0.3 < p < 0.7 Sedang 7, 8, 14, 15, 16, 17, 18, 19,
22
9
P > 0.7 Mudah 1, 2, 3, 4, 5, 6, 10, 11, 12,
13
10
b. Hasil Analisis Indeks Daya Diskriminasi Aitem
Tabel 13. Hasil Analisis Indeks Daya Diskriminasi Aitem TKD 6
Aitem d Keterangan Aitem d Keterangan
1 0.203 Belum memuaskan 16 0.591 Bagus sekali
2 0.336 Lumayan bagus 17 0.623 Bagus sekali
3 0.498 Bagus sekali 18 0.647 Bagus sekali
4 0.379 Bagus sekali 19 0.727 Bagus sekali
5 0.490 Bagus sekali 20 0.614 Bagus sekali
Universitas Sumatera Utara
56
(Lanjutan) Tabel 13. Hasil Analisis Indeks Daya Diskriminasi Aitem TKD 6
Aitem d Keterangan Aitem d Keterangan
6 0.300 Lumayan bagus 21 0.591 Bagus sekali
7 0.516 Bagus sekali 22 0.567 Bagus sekali
8 0.510 Bagus sekali 23 0.405 Bagus sekali
9 -9.000 Jelek 24 0.604 Bagus sekali
10 0.471 Bagus sekali 25 0.604 Bagus sekali
11 0.441 Bagus sekali 26 0.439 Bagus sekali
12 0.401 Bagus sekali 27 0.423 Bagus sekali
13 0.523 Bagus sekali 28 0.289 Belum memuaskan
14 0.491 Bagus sekali 29 0.153 Jelek
15 0.515 Bagus sekali 30 -9.00 Jelek
Berdasarkan hasil analisis indeks diskriminasi daya aitem pada tabel 13,
maka aitem dapat dikelompokkan seperti dalam tabel 14 berikut.
Tabel 14. Rangkuman Analisis Indeks Daya Diskriminasi Aitem TKD 6
Indeks diskriminasi (d) Evaluasi Nomor aitem Jumlah
aitem
≥ 0.4 Bagus sekali 3, 4, 5, 7, 8, 10, 11,
12, 13, 14, 15, 16, 17,
18, 19, 20, 21, 22, 23,
24, 25, 26, 27
23
0.3 – 0.39 Lumayan Bagus 2, 6 2
0.2 – 0.29 Belum
memuaskan
1, 28 2
< 0.2 Jelek dan harus
dibuang
9, 29, 30 3
c. Seleksi Aitem Berdasarkan Indeks Kesukaran Aitem dan Indeks Daya
Diskriminasi Aitem
Tabel 15. Seleksi Aitem Berdasarkan Indeks Kesukaran Aitem dan
Indeks Daya Diskriminasi Aitem TKD 6
Aitem p d Ket Aitem p d Ket
1 0.934 0.203 Direvisi 16 0.467 0.591 Diterima
2 0.928 0.336 Diterima 17 0.575 0.623 Diterima
3 0.832 0.498 Diterima 18 0.395 0.647 Diterima
4 0.892 0.379 Diterima 19 0.335 0.727 Diterima
5 0.754 0.490 Diterima 20 0.269 0.732 Diterima
6 0.916 0.300 Diterima 21 0.246 0.614 Diterima
7 0.515 0.516 Diterima 22 0.335 0.591 Diterima
8 0.509 0.510 Diterima 23 0.150 0.567 Diterima
9 0.000 -9.000 Direvisi 24 0.299 0.405 Diterima
10 0.844 0.471 Diterima 25 0.186 0.604 Diterima
11 0.784 0.441 Diterima 26 0.150 0.439 Diterima
12 0.862 0.401 Diterima 27 0.048 0.423 Diterima
Universitas Sumatera Utara
57
(Lanjutan) Tabel 15. Seleksi Aitem Berdasarkan Indeks Kesukaran Aitem dan
Indeks Daya Diskriminasi Aitem TKD 6
Aitem p d Ket Aitem p d Ket
13 0.754 0.523 Diterima 28 0.024 0.289 Direvisi
14 0.491 0.671 Diterima 29 0.153 0.012 Direvisi
15 0.515 0.689 Diterima 30 -9.00 0.000 Direvisi
Dari hasil analisis tersebut, dapat dirangkum seperti dalam tabel 16 berikut.
Tabel 16. Rangkuman Analisis Aitem TKD 6 Keterangan Parameter Nomor Aitem Jumlah Aitem
Diterima d>0.3 2, 3, 4, 5, 6, 7, 8, 10, 11, 12,
13, 14, 15, 16, 17, 18, 19, 20,
21, 22, 23, 24, 25, 26, 27
25
Revisi d<0.3 1, 9, 28, 29, 30 5
d. Hasil Analisis Realibitas
Analisis reliabilitas pada TKD 6 juga dilakukan dengan pendekatan
konsistensi internal menggunakan formula KR-20 seperti pada subtes ZR.
Formula ini dipilih karena tingkat kesulitan dalam aitem TKD 6 bervariasi.
Koefisien reliabilitas yang diperoleh dalam analisis reliabilitasnya sebesar 0.883
yang artinya TKD 6 memiliki reliabilitas yang sangat baik berdasarkan Murphy &
Davidshofer (2005).
C. Pembahasan
Berdasarkan deskripsi hasil penelitian yang telah dipaparkan sebelumnya,
peneliti akan membahas tentang karakteristik psikometri subtes ZR pada IST
dengan berlandaskan pada teori-teori yang telah dijelaskan pada bagian tinjauan
pustaka. Karakteristik psikometri yang dibahas adalah indeks kesukaran aitem,
indeks daya diskriminasi aitem, reliabilitas dan validitas dengan bukti konkuren.
Berdasarkan hasil analisis indeks kesukaran aitem pada subtes ZR, diketahui
bahwa nilai indeks kesukaran aitem (p) subtes ZR bervariasi. Namun variasi dari
nilai p dalam penelitian ini tidak tersusun sesuai dengan urutan penyajian aitem.
Universitas Sumatera Utara
58
Hal ini belum sesuai dengan pernyataan Murphy & Davidshofer (2005) bahwa
aitem-aitem dalam suatu tes disusun dari aitem yang paling mudah hingga aitem
yang paling sulit. Dalam penelitian ini, ketidaksesuaian ini ditunjukkan dengan
adanya satu aitem yaitu aitem 102 yang termasuk ke dalam aitem dengan tingkat
kesukaran yang mudah namun tersusun berada di antara aitem dengan tingkat
kesukaran yang sedang. Hal serupa juga ditemukan oleh peneliti dalam penelitian
yang dilakukan oleh Princen & Rahmawati (2011). Namun, pada penelitian ini,
ada dua aitem yang belum tersusun dengan tepat, yaitu aitem 102 (sama dengan
yang ditemukan oleh peneliti) dan aitem 110 (aitem sulit namun berada diantara
aitem sedang). Perbedaan hasil ini dapat disebabkan oleh penggunaan sampel
yang lebih sempit dalam penelitian ini yang terbatas pada usia 17-20 tahun dan
tingkat pendidikan perguruan tinggi.
Berdasarkan hasil analisis indeks kesukaran aitem, diketahui bahwa aitem 110
sampai dengan aitem 116 berada pada kategori sulit. Berdasarkan kajian peneliti,
peneliti menemukan bahwa lebih dari 50% total jumlah peserta yang tidak
menjawab ketujuh aitem tersebut. Banyaknya jumlah peserta inilah yang membuat
ketujuh aitem terdeteksi sulit. Kondisi banyaknya peserta yang tidak menjawab
aitem dapat disebabkan oleh ketersediaan waktu yang tidak cukup untuk dapat
menyelesaikan seluruh aitem subtes ZR. Dikatakan demikian karena subtes ZR
tergolong ke dalam speed test.
Berdasarkan hasil analisis indeks kesukaran aitem, peneliti juga menemukan
bahwa ada beberapa aitem yang mendekati angka 0 maupun angka 1. Hal ini
ditemukan pada aitem 97 dan 98 dengan nilai p sebesar 0.934 dan aitem 116
dengan nilai p sebesar 0.096. Dengan nilai p tersebut, maka dapat dikatakan
Universitas Sumatera Utara
59
bahwa aitem 97 dan 98 tergolong ke dalam aitem yang sangat mudah dan aitem
116 tergolong ke dalam aitem yang sangat sulit. Dalam Azwar (2012) dinyatakan
bahwa aitem yang terlalu mudah maupun terlalu sulit mempunyai daya
diskriminasi yang kurang baik. Berdasarkan hasil analisis indeks daya
diskriminasi aitem, peneliti menemukan bahwa nilai d pada aitem 97 sebesar
0.385 dan aitem 98 sebesar 0.308. Pada aitem 116, nilai d yang diperoleh sebesar
0.314. Nilai d yang diperoleh ketiga aitem ini dapat dikategorikan ke dalam aitem
yang lumayan bagus tapi mungkin masih perlu peningkatan. Dengan demikian,
dapat dikatakan bahwa meskipun suatu aitem yang terlalu sulit maupun yang
terlalu mudah memiliki kecenderungan untuk tidak mampu mendiskriminasi
kelompok dengan kemampuan rendah dan tinggi, namun hal ini tidak selalu
terjadi demikian.
Berdasarkan hasil analisis indeks daya diskriminasi aitem, peneliti
menemukan bahwa 15 dari 20 aitem dinilai bagus sekali dan 5 aitem lainnya
dinilai lumayan bagus. Dalam penelitian ini, aitem yang dinilai bagus sekali (d
diatas 0.4) yang dikatakan baik. Dengan demikian, aitem dalam subtes ZR
memiliki daya diskriminasi yang cukup baik namun jika ingin digunakan perlu
untuk dipertimbangkan. Jika dibandingkan pada penelitian Princen & Rahmawati
(2011) yang melakukan analisis dengan cara yang sama seperti peneliti,
ditemukan bahwa 19 dari 20 aitem dinilai bagus sekali dan 1 aitem lainnya dinilai
lumayan bagus. Perbedaan ini dapat disebabkan karena sampel yang digunakan
dalam penelitian ini sempit.
Namun, jika ditelusuri lebih lanjut dan dikaitkan dengan indeks kesukaran
aitem, dari 20 aitem hanya 6 aitemlah yang memiliki daya diskriminasi aitem
Universitas Sumatera Utara
60
yang baik. Hal ini dinyatakan oleh Azwar (2012) bahwa aitem yang memiliki
daya diskriminasi yang baik memiliki nilai p yang berkisar dari 0.4 sampai 0.6.
Keenam aitem yang dimaksud adalah aitem 101, 103, 105, 106, 107, dan 108. Jika
dilihat dari hasil analisis indeks daya diskriminasi aitem, nilai d yang diperoleh
aitem 103, 105, 106, 107, dan 108 berada dalam kategori aitem yang bagus sekali
sedangkan nilai d yang diperoleh aitem 101 berada dalam kategori aitem yang
lumayan bagus tapi mungkin masih perlu peningkatan. Dengan demikian, dapat
dikatakan bahwa aitem dengan nilai p dari 0.4 sampai 0.6 mampu
menggambarkan aitem dengan daya diskriminasi yang baik, namun hal ini juga
tidak selalu terjadi demikian.
Banyaknya aitem subtes ZR yang memiliki daya diskriminasi aitem yang
kurang baik mengindikasikan bahwa aitem tidak mampu membedakan kelompok
dengan kemampuan tinggi dan rendah. Ketidakmampuan ini dapat disebabkan
karena aitem dalam subtes ZR telah bocor dan tersebar di internet. Hal ini
menyebabkan aitem menjadi familiar dan mudah ditemukan sehingga
memberikan kesempatan bagi peserta tes untuk belajar menentukan jawaban yang
tepat agar mendapatkan hasil tes yang baik. Dengan demikian, kemampuan yang
terukur dari setiap peserta tes cenderung sama sehingga fungsi aitem untuk
membedakan kelompok dengan kemampuan tinggi dan rendah menjadi
terganggu.
Selain karena kebocoran tes, indeks daya diskriminasi aitem subtes ZR yang
kurang baik bisa disebabkan oleh pengalaman peserta tes yang sudah pernah
mendapatkan subtes ZR sebelumnya. Pengalaman ini menyebabkan adanya proses
belajar ketika peserta tes mendapatkan tes yang sama dengan tes yang sebelumnya
Universitas Sumatera Utara
61
pernah diikuti. Proses belajar terjadi ketika peserta tes telah mengetahui respon
yang seharusnya diberikan bahkan berusaha untuk memberikan respon yang lebih
baik lagi dari respon yang pernah diberikan sebelumnya. Oleh karena itu,
sesuailah pernyataan yang disebutkan oleh Gregory (2013) bahwa pengalaman
peserta tes yang pernah mengikuti tes sebelumnya dapat mempengaruhi hasil dari
tes psikologi.
Berdasarkan hasil analisis indeks kesukaran aitem dan indeks daya
diskriminasi aitem, peneliti menemukan bahwa 20 aitem dalam subtes ZR masih
bisa digunakan. Namun, dari 20 aitem ada 5 aitem, yaitu aitem 97, 98, 101, 102,
dan 116 jika ingin digunakan sebaiknya dikaji kembali. Dikatakan demikian
karena kelima aitem memiliki kualitas psikometri yang tidak baik. Namun jika
dibandingkan pada penelitian Princen & Rahmawati (2011) yang menggunakan
analisis yang sama dengan peneliti, ada 1 dari 20 aitem yaitu aitem 98 yang jika
ingin digunakan perlu untuk ditinjau kembali. Jika dibandingkan dengan hasil
penelitian Rahmawati (2014) dengan pendekatan IRT, ada 11 aitem yang dapat
digunakan namun diperlukan kajian lebih lanjut, yaitu aitem 97, 100, 104, 107,
109, 110, 111, 112, 114, 115, dan 116. Perbedaan hasil yang ditemukan oleh
peneliti dengan peneliti sebelumnya dapat disebabkan oleh perbedaan keluasan
data yang digunakan dalam penelitian. Seperti yang telah dikatakan sebelumnya,
rentang usia sampel yang digunakan dalam penelitian ini sempit (hanya usia 17-
20 tahun dan tingkat pendidikan perguruan tinggi).
Adanya aitem subtes ZR yang kualitas psikometrinya tidak baik akan
mempengaruhi reliabilitas dan validitas dari subtes ZR. Hal ini dibuktikan dengan
ditemukannya koefisien reliabilitas subtes ZR sebesar 0.842. Dari koefisien
Universitas Sumatera Utara
62
reliabilitas yang diperoleh tersebut menunjukkan bahwa variasi skor tampak
subjek pada subtes ZR mampu menggambarkan 84% variasi yang terjadi pada
skor murni sampel dengan rentang usia 17-20 tahun. Dapat dikatakan juga bahwa
terdapat 16% variasi skor tampak yang disebabkan oleh error. Dari koefisien
reliabilitas yang diperoleh subtes ZR sebesar 0.842 sudah dapat dikatakan tinggi
menurut Murphy & Davidshofer (2005). Namun, Coaley (2010) menyebutkan
bahwa koefisien reliabilitas yang baik untuk tes inteligensi berada di atas 0.9.
Dengan demikian, koefisien reliabilitas yang diperoleh subtes ZR sebagai bagian
dari tes inteligensi dikatakan tidak reliabel karena koefisien reliabilitas yang
diperoleh berada dibawah 0.9.
Hasil yang diperoleh oleh peneliti juga ditemukan pada penelitian Princen &
Rahmawati (2011) yang memperoleh koefisien reliabilitas subtes ZR sebesar
0.882. Namun, perbedaan keluasan data dalam kedua penelitian ini perlu untuk
diperhatikan. Koefisien reliabilitas yang diperoleh dalam penelitian ini hanya
berlaku pada sampel dengan rentang usia 17-20 tahun. Hal ini didukung dengan
pernyataan dalam Azwar (2012) bahwa koefisien reliabilitas yang diperoleh dari
suatu kelompok tertentu kemungkinan tidak akan sama jika diberikan pada
kelompok yang lain dalam situasi yang berbeda.
Berdasarkan hasil analisis validitas subtes ZR, ditemukan bahwa hasil
korelasi Pearson Product-Moment (r) antara subtes ZR dengan TKD 6 sebesar
0.67. Coaley (2010) menyatakan bahwa koefisien validitas untuk validitas
konkuren dikatakan sangat baik jika koefisiennya berada di atas 0.55. Murphy &
Davidshofer (2005) juga menambahkan bahwa dalam uji validitas kriteria,
koefisien validitas yang diperoleh umumnya sekitar 0.3 dan 0.4, dan koefisien
Universitas Sumatera Utara
63
tertinggi yang dapat dicapai sekitar 0.5 dan 0.6. Dengan demikian, tingginya
koefisien korelasi yang diperoleh dalam penelitian ini menunjukkan bahwa
validitas konkuren dari subtes ZR sangat baik dan kedua tes mengukur hal yang
sama. Selain itu juga dapat dikatakan bahwa subtes ZR valid digunakan untuk
mengukur tujuan pengukuran subtes ZR pada sampel dengan rentang usia 17-20
tahun dan tingkat pendidikan perguruan tinggi.
Selanjutnya, peneliti juga menyajikan hasil analisis TKD 6. Analisis ini
dilakukan untuk memberikan informasi tambahan tentang TKD 6 yang digunakan
sebagai kriteria eksternal dalam penelitian ini. Berdasarkan hasil analisis indeks
kesukaran aitem pada TKD 6, diketahui bahwa aitem dalam TKD 6 memiliki
tingkat kesulitan yang bervariasi. Namun, aitem dalam tes ini masih belum
tersusun sesuai dengan urutan penyajian mulai dari aitem yang mudah hingga
aitem yang sulit. Hal ini dapat ditemukan pada aitem 7 dan 8 yang termasuk ke
dalam kategori sedang dan aitem 9 yang termasuk ke dalam kategori sulit namun
tersusun berada diantara aitem yang mudah. Selain itu, dapat ditemukan pada
aitem 22 yang termasuk ke dalam aitem kategori sedang namun tersusun berada di
antara aitem yang sulit.
Berdasarkan hasil analisis indeks kesukaran aitem, peneliti juga menemukan
bahwa ada beberapa aitem yang mendekati angka 1 maupun angka 0. Aitem yang
nilai p nya mendekati angka 1 adalah aitem 1 ,2, dan 6 dengan nilai p sebesar
0.934, 0.928, dan 0.916. Aitem yang nilai p nya mendekati angka 0 adalah aitem
28, dan 29 dengan nilai p sebesar 0.024 dan 0.012. Jika dilihat pada indeks
diskriminasi aitem pada TKD 6, ditemukan bahwa aitem 1 tergolong kedalam
aitem yang belum memuaskan, aitem 2 dan 6 tergolong ke dalam aitem yang
Universitas Sumatera Utara
64
lumayan bagus tapi mungkin masih perlu peningkatan, aitem 28 tergolong ke
dalam aitem yang belum memuaskan dan aitem 29 tergolong ke dalam aitem yang
jelek. Seperti analisis yang dilakukan pada subtes ZR, dapat dikatakan bahwa
aitem yang terlalu sulit maupun yang terlalu mudah dalam suatu tes memiliki
kecenderungan tidak mampu mendiskriminasi kelompok dengan kemampuan
rendah dan tinggi meskipun hal ini tidak selalu terjadi demikian.
Selain aitem yang mendekati nilai 0 maupun 1, peneliti juga menemukan
aitem yang memiliki nilai p sama dengan 0 yaitu aitem 9 dan 30. Pada aitem
dengan nilai p sama dengan 0 (aitem 9 dan 30) diperoleh bahwa nilai d nya
sebesar -9.000 dan aitemnya termasuk ke dalam aitem yang jelek. Berdasarkan
kajian yang dilakukan peneliti pada aitem dengan nilai p sama dengan 0 dan d
sama dengan -9.000, peneliti melihat pada aitem 30 bahwa banyak peserta yang
tidak menjawab aitem ini. Hal ini dapat disebabkan oleh ketersediaan waktu yang
tidak cukup, seperti yang terjadi pada subtes ZR. Berbeda halnya dengan aitem 9.
Aitem ini sebagian besar dijawab oleh peserta namun jawaban yang diberikan
salah. Respon yang diberikan oleh subjek pada aitem ini juga sebagian besar
sama. Dengan ini, peneliti melihat jika aitem ini penting untuk dikaji lebih lanjut.
Berdasarkan hasil indeks daya diskriminasi aitem TKD 6, diketahui bahwa
ada 23 aitem yang masih dapat digunakan sedangkan 7 aitem lainnya jika ingin
digunakan memerlukan pertimbangan-pertimbangan tertentu dan sebaiknya
ketujuh aitem ini dikaji kembali. Berdasarkan hasil analisis reliabilitas TKD 6
ditemukan bahwa koefisien reliabilitas TKD 6 sebesar 0.883. Dari koefisien
reliabilitas yang diperoleh tersebut menunjukkan bahwa variasi skor tampak
subjek pada TKD 6 mampu menggambarkan 88% variasi yang terjadi pada skor
Universitas Sumatera Utara
65
murni subjek tersebut. Dapat dikatakan juga bahwa terdapat 12% variasi skor
tampak yang disebabkan oleh error. Meskipun koefisien reliabilitas yang
diperoleh sebesar 0.883, TKD 6 sebagai tes inteligensi dikatakan tidak reliabel
karena koefisien reliabilitas yang diperoleh dalam penelitian ini belum mencapai
koefisien reliabilitas yang baik untuk tes inteligensi. Dalam Coaley (2010)
disebutkan bahwa koefisien reliabilitas yang baik untuk tes inteligensi berada di
atas 0.9.
Berdasarkan analisis karakteristik psikometri yang telah dilakukan kepada
subtes ZR, maka dapat disimpulkan bahwa aitem dalam subtes ZR jika
dipergunakan perlu untuk dipertimbangkan karena ada beberapa aitem yang
kualitas psikometrinya tidak baik. Subtes ZR merupakan subtes yang valid dalam
mengukur tujuan pengukurannya namun tidak reliabel sesuai dengan fungsinya
sebagai tes inteligensi bahkan jika digunakan untuk penyeleksian. Karena
penelitian ini dilakukan pada sampel yang terbatas dan tidak mencakup seluruh
rentang usia populasi maka hasil penelitian ini tidak dapat digeneralisasikan
secara luas dan terbatas hanya pada individu dengan rentang usia 17-20 tahun dan
tingkat pendidikan perguruan tinggi.
Universitas Sumatera Utara
66
BAB V
KESIMPULAN DAN SARAN
A. Kesimpulan
Berdasarkan hasil penelitian tentang karakteristik psikometri subtes ZR pada
IST, maka dapat ditarik kesimpulan sebagai berikut :
1. Subtes ZR memiliki aitem dengan indeks kesukaran yang bervariasi sesuai
dengan fungsinya sebagai tes inteligensi. Urutan penyajian aitem dalam subtes
ini masih belum tepat. Selain itu, beberapa aitem dalam subtes ZR memiliki
karakteristik psikometri yang tidak baik untuk mendiskriminasikan kelompok
yang memiliki kemampuan yang diukur subtes ZR dengan yang tidak memiliki
pada individu dengan rentang usia 17-20 tahun dan tingkat pendidikan
perguruan tinggi.
2. Subtes ZR merupakan subtes yang masih valid namun tidak reliabel sesuai
dengan fungsinya sebagai tes inteligensi pada individu dengan rentang usia 17-
20 tahun dan tingkat pendidikan perguruan tinggi.
B. Saran
1. Saran Praktis
Bagi para akademisi dan praktisi diharapkan dapat mempertimbangkan
menggunakan subtes ZR yang merupakan bagian dari IST sebagai tes inteligensi
terutama jika digunakan untuk proses seleksi.
2. Saran Metodologis
a. Penelitian ini memiliki keterbatasan karena hanya dilakukan pada rentang usia
yang sempit. Peneliti selanjutnya disarankan untuk menggunakan sampel yang
Universitas Sumatera Utara
67
lebih luas dan lebih representatif yaitu sampel dengan rentang usia 12-60
tahun.
b. Peneliti selanjutnya disarankan untuk memilih kriteria dengan
mempertimbangkan karakteristik psikometri yang dimiliki oleh kriteria
tersebut seperti reliabilitas dan relevansi kriteria terhadap ZR.
c. Peneliti selanjutnya disarankan untuk menggunakan tes lain yang mengukur
kemampuan yang berbeda dengan subtes ZR dalam uji validitas dengan bukti
konkuren. Dilakukan demikian untuk melengkapi kajian psikometri subtes ZR
pada IST.
d. Aitem dalam subtes ZR disusun berdasarkan urutan penyajian aitem yang
seharusnya sesuai dengan fungsinya sebagai tes inteligensi, yaitu dari aitem
yang mudah hingga aitem yang sulit.
Universitas Sumatera Utara
68
DAFTAR PUSTAKA
Anastasi, A. & Urbina, S. (1997). Psychological testing (7th edition). USA:
Prentice Hall.
Azwar, S. (2012). Penyusunan Skala Psikologi. Yogyakarta: Pustaka Pelajar.
----------- . (2012). Reliabilitas & Validitas. (Edisi IV). Yogyakarta: Pustaka Pelajar
----------- . (2012). Tes Prestasi: Fungsi dan Pengembangan Pengukuran Prestasi
Belajar (Edisi II). Yogyakarta: Pustaka Pelajar.
Coaley, K. (2010). An Introduction to Psychological Assessment and Psychometrics. London: Sage Publication Ltd.
Crocker, L. & Algina,J. (2008). Introduction to Classical and Modern Test
Theory. USA: Cengage Learning.
Elvira, R. & Rahmawati, E. (2011). Karakteristik Psikometri Subtes
Santzerganzung (SE) Pada Intelligenz Struktur Test (IST). Skripsi. Medan:
Universitas Sumatera Utara.
Gregory, J.R. (2004). Psychological Testing: History, Principles, and Aplications
(4th
Ed). USA: Pearson Education Group,Inc.
Gregory, Robert J. (2013). Tes Psikologi: Sejarah, Prinsip, Dan Aplikasi (Edisi
Keenam Jilid I). Jakarta: Erlangga
Kaplan, R. M. & Saccuzzo D. P. (2009). Psychological Testing: Principles,
Applications, and Issues (7th
Edition). USA: Wadsworth, Cengage Learning.
Lahey, Benjamin. (2012). Psychology:An Introduction. New York: McGraw Hill
Lalaba, Djunaidi. (2008). Analisis Butir Soal Dengan Teori Tes Klasik: Sebuah
Pengantar. Manado: STAIN
LPSP3 UI. (2011). Buku Petunjuk Tes Kemampuan Diferensial (TKD). Jakarta:
Fakultas Psikologi Universitas Indonesia.
------------ . (2012). IST (Intelligenz Struktur Test): Manual Dan Norma. Jakarta:
Fakultas Psikologi Universitas Indonesia.
Murphy, K. R.& Davidshofer, C. O. (2005). Psychological Testing, Principles
And Applications (6th
edition). New Jersey: Pearson Education,Inc.
Nunnally, Jum C. & Bernstein, Ira H. (1994). Psychometric Theory (3rd
edition).
New York: McGraw Hill
Osterlind. S. J. (2010). Modern Measurement; Theory, Pricinple, and
Applications of Mental Appraisal (2nd
edition). USA: Pearson Education,Inc.
Universitas Sumatera Utara
69
Pedhazur, Elazar. J., (1997). Multiple Regression In Behavioral Research:
Explanation And Prediction (3rd
edition). USA: Thomson Learning, Inc.
Polhaupessy, L. F. (2009). Diktat Kuliah IST Universitas Padjajaran.
Princen & Rahmawati. (2011). Karakteristik Psikometri Subtes ZAHLENREIHEN
(ZR) Pada Intelligenz Structure Test (IST). Skripsi: Fakultas Psikologi
Universitas Sumatera Utara.
Rahmawati, Etti. (2014). Evaluasi Karakteristik Psikometris Intelligenz Struktur
Test (IST). Seminar Nasional Psikometri. Fakultas Psikologi Universitas
Muhammadiyah Surakarta.
Sari, K. F., & Rahmawati, E. (2011). Karakteristik Psikometri Subtes
Rechenaufgaben (RA) pada Intelligenz Struktur Test (IST). Skripsi Fakultas
Psikologi Universitas Sumatera Utara.
Sirait, D., & Garliah, L. (2011). Karakteristik Psikometri Subtes Wortauswahl
(WA) pada Intelligenz Struktur Test (IST). Skripsi Fakultas Psikologi
Universitas Sumatera Utara.
Siregar, F.S., & Rahmawati, E. (2011). Karakteristik Psikometri Subtes Analogien
(AN) pada Intelligenz Struktur Test (IST). Skripsi Fakultas Psikologi
Universitas Sumatera Utara.
Sugiyono. (2012). Statistika untuk Penelitian. Bandung:Alfabeta
Tiarsarani. (2008). Uji Psikometri Pada Intelligenz-Struktur-Test (IST) Subtes
Zahlen Reihen (ZR). Skripsi. Jakarta: Unika Atmajaya.
Urbina, Susana. (2004). Essential of Psychological Testing. Canada : John Wiley
& Sons, Inc., Hoboken, New Jersey
Universitas Sumatera Utara
LAMPIRAN
Universitas Sumatera Utara
LAMPIRAN 1
Analisis Korelasi
Subtes ZR Dan TKD 6
Universitas Sumatera Utara
70
OUTPUT ANALISIS KORELASI SUBTES ZR DAN TKD 6
Correlations
ZR TKD6
ZR Pearson Correlation 1 .670**
Sig. (2-tailed) .000
N 167 167
TKD6 Pearson Correlation .670**
1
Sig. (2-tailed) .000
N 167 167
**. Correlation is significant at the 0.01 level (2-tailed).
Universitas Sumatera Utara
LAMPIRAN 2
Analisis Reliabilitas Subtes ZR
Universitas Sumatera Utara
71
HASIL ANALISIS RELIABILITAS SUBTES ZR
DENGAN FORMULA KR-20
Analisis Aitem
97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116
S001 1 1 1 1 0 1 1 0 0 1 1 0 1 1 0 0 0 0 0 0
S002 1 1 1 1 0 1 0 0 0 1 0 0 0 0 0 0 0 0 0 0
----
----
S167 1 1 1 1 0 0 1 0 1 0 0 0 0 0 0 0 0 0 0 0
Sum 156 156 152 145 100 137 90 64 78 115 98 82 64 41 35 24 30 24 14 16
P 0.93
413
2
0.93
413
2
0.91
018
0.86
826
3
0.59
880
2
0.82
0359
0.53
8922
0.38
3234
0,46
7066
0.68
8623
0.58
6826
0.49
1018
0.38
3234
0.24
5509
0.20
9581
0.14
3713
0.17
9641
0.14
3713
0.08
3832
0.09
580
8
Q 0.06
586
8
0.06
586
8
0.08
982
0.13
173
7
0.40
119
8
0.17
9641
0.46
1078
0.61
6766
0,53
2934
0.31
1377
0.41
3174
0.50
8982
0.61
6766
0.75
4491
0.79
0419
0.85
6287
0.82
0359
0.85
6287
0.91
6168
0.90
419
2
PQ 0.06
153
0.06
153
0.08
175
3
0.11
438
2
0.24
023
8
0.14
737
0.24
8485
0.23
6366
0,24
8915
0.21
4421
0.24
2461
0.24
9919
0.23
6366
0.18
5234
0.16
5657
0.12
3059
0.14
737
0.12
3059
0.07
6804
0.08
662
9
k 20
sigma pq 3.291549
var 16.47079
mean 9.706587
p(KR-20) 0.842272
Universitas Sumatera Utara
LAMPIRAN 3
Analisis Reliabilitas TKD 6
Universitas Sumatera Utara
72
HASIL ANALISIS RELIABILITAS TKD 6 DENGAN FORMULA KR-20
Analisis Aitem
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
S001 1 1 1 0 1 1 1 1 0 1 1 1 1 0 1 1 1 0 0 0
S002 1 1 1 1 1 1 0 0 0 1 1 0 0 1 1 0 0 0 0 0
---
---
S167 1 1 0 1 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0
Sum 156
155 139 149 126 153 86 85 0 141 131 144 126 112 115 78 96 66 56 45
P 0,93
4
0,92
8
0,83
2
0,89
2
0,75
4
0,91
6168
0,51
497
0,50
8982 0
0,84
4311
0,78
4431
0,86
2275
0,75
4491
0,67
0659
0,68
8623
0,46
7066
0,57
485
0,39
521
0,33
5329
0,26
946
1
Q 0,06
5
0,07
1
0,16
7
0,10
7
0,24
550
9
0,08
3832
0,48
503
0,49
1018 1
0,15
5689
0,21
5569
0,13
7725
0,24
5509
0,32
9341
0,31
1377
0,53
2934
0,42
515
0,60
479
0,66
4671
0,73
053
9
PQ 0,06
1
0,06
6
0,13
9
0,09
6
0,18
523
4
0,07
6804
0,24
9776
0,24
9919 0
0,13
145
0,16
9099
0,11
8756
0,18
5234
0,22
0876
0,21
4421
0,24
8915
0,24
4397
0,23
9019
0,22
2884
0,19
685
2
Universitas Sumatera Utara
73
(Lanjutan) HASIL ANALISIS RELIABILITAS TKD 6 DENGAN FORMULA KR-20
Analisis Aitem
21 22 23 24 25 26 27 28 29 30
S001 0 0 0 0 0 0 0 0 0 0
S002 0 0 0 1 1 0 0 0 0 0
---
---
S167 0 0 0 0 0 0 0 0 0 0
Sum 41 56 25 50 31 25 8 4 2 0
P 0,24
550
9
0,33
532
9
0,14
970
1
0,29
940
1
0,18
562
9
0,14
9701
0,04
7904
0,02
3952
0,01
1976 0
Q 0,75
449
1
0,66
467
1
0,85
029
9
0,70
059
9
0,81
437
1
0,85
0299
0,95
2096
0,97
6048
0,98
8024 1
PQ 0,18
523
4
0,22
288
4
0,12
729
0,20
976
0,15
117
1
0,12
729
0,04
5609
0,02
3378
0,01
1833 0
k 20
sigma pq 3.291549
var 16.47079
mean 9.706587
p(KR-20) 0.842272
Universitas Sumatera Utara