analisis karakteristik psikometri subtes zahlen

ANALISIS KARAKTERISTIK PSIKOMETRI SUBTES ZAHLEN

REINHEN (ZR) PADA INTELLIGENZ STRUKTUR TEST (IST)

SKRIPSI

Diajukan untuk Memenuhi Persyaratan

Ujian Sarjana Psikologi

Disusun Oleh:

ANDRIANI BUATON

131301104

FAKULTAS PSIKOLOGI

UNIVERSITAS SUMATERA UTARA

2017

Universitas Sumatera Utara

i

Analisis Karakteristik Psikometri Subtes Zahlen Reinhen (ZR) Pada

Intelligenz Struktur Test (IST)

Andriani Buaton1 dan Etti Rahmawati

2

ABSTRAK

Tujuan dari penelitian ini adalah untuk melengkapi kajian karakteristik

psikometri subtes ZR pada Intelligenz Struktur Test (IST). Proses yang dilakukan

dalam penelitian ini meliputi analisis indeks kesukaran aitem, indeks daya

diskriminasi aitem, analisis reliabilitas, dan analisis validitas dengan bukti

konkuren. Penelitian ini menggunakan data primer yang diperoleh dengan

memberikan tes secara klasikal kepada 167 sampel dengan rentang usia 17 sampai

dengan 20 tahun. Berdasarkan hasil analisis indeks kesukaran aitem dan indeks

daya diskriminasi aitem, ditemukan bahwa 15 dari 20 aitem memiliki kualitas

aitem yang baik. Hasil estimasi reliabilitas tes dan validitas berdasarkan bukti

konkuren menunjukkan bahwa subtes ZR masih valid namun tidak reliabel dalam

mengukur tujuan pengukuran subtes ZR pada sampel dengan rentang usia 17

sampai 20 tahun.

Kata Kunci : Karakteristik Psikometri, Bukti Konkuren, Intelligenz Struktur Test

(IST), Subtes ZR 1

1 Mahasiswa Fakultas Psikologi Universitas Sumatera Utara

2 Dosen Departemen Umum dan Eksperimen Fakultas Psikologi Universitas Sumatera Utara


ii

Psychometric Characteristic Analysis Of Subtest Zahlen Reinhen (ZR) Of


Andriani Buaton1 and Etti Rahmawati

2

ABSTRACT

The purpose of this study is to complete the analysis of pyschometric

characteristic of subtes ZR of Intelligenz Struktur Tes (IST). The processes

undertaken in this study includes the analysis of item-difficulty, item

discrimination, analysis of reliability and validity with concurrent evidence. This

study used primary data obtained by giving a classical tes to 167 samples with the

age range from17 to 20 years. Based on the the result of the analysis of item-

difficulty and item discrimination, it was found that 15 of the 20 items had good

item quality. The estimation of test reliability and validity based on concurrent

evidence showed that subtest ZR subtes is valid but not reliable in assessing the

purpose of measuring subtest ZR. But, the result of this study is limited to the

sample with an age range of 17 to 20 years.

Keywords : Psychometric Characteristic, Concurrent Evidence, Intelligenz

Struktur Test (IST), Subtest ZR

2

1 Student of Faculty of Psychology, University of North Sumatera

2 Lecturer of Departement of General and Experimental Psychology, University of North

Sumatera


iii

KATA PENGANTAR

Puji dan syukur peneliti ucapkan kepada Tuhan Yang Maha Kuasa karena atas

karunia dan berkat rahmat-Nya maka peneliti dapat menyelesaikan penyusunan

skripsi ini dengan baik dan tepat. Penyusunan skripsi yang berjudul “Karakteristik

Psikometri Subtes Zahlen Reinhen (ZR) Pada Intelligenz Struktur Test (IST)”

merupakan salah satu syarat untuk dapat menyelesaikan ujian sarjana Psikologi di

Fakultas Psikologi Universitas Sumatera Utara Medan. Maksud penelitian ini

adalah untuk menggambarkan karakteristik psikomteri subtes ZR.

Peneliti menyadari bahwa dalam menyelesaikan penyusunan skripsi ini,

peneliti menerima banyak bantuan dan bimbingan dari berbagai pihak. Oleh

karena itu, dalam kesempatan ini, peneliti ingin mengucapkan terima kasih

kepada:

1. Bapak Zulkarnain, Ph.D, Psikolog, selaku Dekan Fakultas Psikologi

Universitas Sumatera Utara.

2. Ibu Etti Rahmawati, M. Si. selaku dosen pembimbing yang banyak membantu

peneliti dengan membagi ilmu, memberi masukan dan dorongan, dan

memberikan waktu untuk membimbing peneliti sehingga peneliti dapat

menyelesaikan penyusunan skripsi ini.

3. Ibu Debby Anggareni, M.Psi, psikolog selaku dosen pembimbing akademik

yang senantiasa membimbing peneliti dalam proses perkualiahan.

4. Ibu Ika Sari Dewi, M.Pd, Psikolog, Kak Dina Nazriani, MA dan Kak Amalia

Meutia M.Psi, psikolog yang merupakan dosen di Departemen Umum dan

Eksprimen yang memberikan masukan dan bantuan serta bersedia


iv

memberikan waktunya untuk membimbing peneliti dalam menyelesaikan

penyusunan skripsi ini.

5. Ibu Yossie, Ibu Rodiatul Hasanah, Pak Ferry Novliadi, dan Kak Dian Ulfasari

yang bersedia membantu peneliti untuk dapat melakukan pengambilan data di

kelas Mahasiswa Psikologi USU Angkatan 2016.

6. Bapak, mama, bang Rio, Yanuari, Rohani, dan Apriani yang senantiasa

mendukung peneliti dan memberikan motivasi serta perhatian bagi peneliti

untuk dapat menyelesaikan skripsi ini.

7. Keluarga Besar Pomparan Op. Rumondang, Op. Melda, dan Op. Sarma yang

juga turut andil dalam memberikan dukungan dan perhatian kepada peneliti

selama proses penyusunan skripsi.

8. Bapa Uskup Keuskupan Sibolga, Mgr. Ludovicus Simanullang, OFM.Cap dan

Romo Blasius Super Yesse, pr yang telah memberikan motivasi rohani dan

mendukung peneliti.

9. KITA (Pebri, Pesta, Ira), ACITAW (Dina, Cia, Iyo, Tari, dan Widiya), dan

Wasti Simanjuntak yang senantiasa menjadi tempat sharing peneliti selama

proses pengerjaan skripsi.

10. Teman-teman satu perjuangan skripsi di Departemen Umum dan Eksperimen

khususnya mahasiswa bimbingan bu Etti (Kak Mida, Sinta, Nurul, dan Lila)

yang turut membantu peneliti dalam menyelesaikan skripsi ini.

11. Ester, Bang Rodho, Kak Dika, Kak Ester yang bersedia menjadi tester untuk

membantu peneliti dalam pengambilan data.

12. Adik-adik Mahasiswa Psikologi USU Angkatan 2016 yang bersedia

membantu peneliti dalam proses pengambilan data.


v

13. Teman-teman Angkatan 2013 yang telah membantu peneliti dalam

memberikan masukan dan dorongan untuk membantu peneliti menyelesaikan

skripsi ini.

Peneliti menyadari bahwa masih banyak kekurangan dalam skripsi ini.

Oleh karena itu, peneliti mengharapkan segala kritik, saran dan masukan untuk

kesempurnaan skripsi ini. Akhir kata, peneliti mengucapkan terima kasih dan

semoga penelitian ini dapat bermanfaat bagi berbagai pihak.

Medan, 03 Agustus 2017

Andriani Buaton

131301104


vi

DAFTAR ISI

ABSTRAK ........................................................................................................... i

ABSTRACT ......................................................................................................... ii

KATA PENGANTAR ......................................................................................... iii

DAFTAR ISI ........................................................................................................ vi

DAFTAR TABEL................................................................................................ ix

DAFTAR RUMUS .............................................................................................. x

DAFTAR LAMPIRAN ....................................................................................... xi

BAB I PENDAHULUAN ................................................................................. 1

A. Latar Belakang ....................................................................................... 1

B. Rumusan Masalah .................................................................................. 10

C. Tujuan Penelitian ................................................................................... 11

D. Manfaat Penelitian ................................................................................. 11

1. Manfaat Teoritis ............................................................................... 11

2. Manfaat Praktis ................................................................................ 11

E. Sistematika Penulisan............................................................................. 12

F. Kerangka Berpikir .................................................................................. 13

BAB II TINJAUAN PUSTAKA ....................................................................... 14

A. Intelligenz Struktur Tes (IST) ................................................................ 14

1. Sejarah Intelligenz Struktur Tes (IST) ............................................. 14

2. Subtes-subtes dalam Intelligenz Struktur Tes (IST) ....................... 15

3. Penelitian Terdahulu Subtes ZR...................................................... 15

4. Kriteria Tes Lain yang Relevan dengan Subtes ZR ......................... 17

B. Karakteristik Psikometri ........................................................................ 17

1. Validitas ........................................................................................... 18

a. Definisi validitas ........................................................................... 18

b. Sumber Bukti Validitas ................................................................. 19

c. Faktor-Faktor yang Mempengaruhi Validitas ............................... 23

d. Interpretasi Koefisien Validitas..................................................... 27

2. Reliabilitas........................................................................................ 29

a. Definisi reliabilitas ........................................................................ 29

b. Metode Estimasi Reliabilitas......................................................... 29


vii

c. Faktor-Faktor yang Mempengaruhi Reliabilitas ........................... 33

d. Interpretasi Koefisien Reliabilitas ................................................. 34

3. Indeks Kesukaran Aitem .................................................................. 35

4. Indeks Daya Diskriminasi Aitem ..................................................... 37

C. Analisis Karakteristik Psikometri Subtes ZR Pada IST ......................... 38

BAB III METODE PENELITIAN .................................................................... 43

A. Jenis Penelitian ....................................................................................... 43

B. Subjek Penelitian .................................................................................... 43

1. Populasi dan sampel penelitian ........................................................ 43

2. Teknik Pengambilan Sampel ........................................................... 44

C. Data Penelitian ....................................................................................... 45

D. . Prosedur Pelaksanaan Penelitian ............................................................ 45

1. Pembuatan Proposal ......................................................................... 45

2. Persiapan Izin Penelitian .................................................................. 45

3. Pelaksanaan Penelitian ..................................................................... 45

4. Analisis Data .................................................................................... 46

E. Metode Pengumpulan Data .................................................................... 46

F. Analisis Data .......................................................................................... 46

1. Analisis Validitas ............................................................................. 46

2. Analisis Reliabilitas ......................................................................... 47

3. Analisis Indeks Kesukaran Aitem .................................................... 48

4. Analisis Indeks Daya Diskriminasi Aitem ....................................... 48

BAB IV HASIL DAN PEMBAHASAN............................................................. 50

A. Deskripsi Umum Data Penelitian............................................................ 50

B. Deskripsi Hasil Penelitian ....................................................................... 51

1. Hasil Analisis Indeks Kesukaran Aitem .......................................... 51

2. Hasil Analisis Indeks Daya Diskriminasi Aitem ............................. 51

3. Seleksi Aitem Berdasarkan Indeks Daya

Diskriminasi Aitem dan Indeks Kesukaran Aitem........................... 53

4. Hasil Analisis Validitas Berdasarkan Bukti Konkuren .................... 54

5. Hasil Analisis Reliabilitas ................................................................ 54

6. Analisis Tambahan TKD 6............................................................... 54


viii

a. Hasil Analisis Indeks Kesukaran Aitem ..................................... 55

b. Hasil Analisis Indeks Daya Diskriminasi Aitem ........................ 55

c. Seleksi Aitem Berdasarkan Indeks Daya

Diskriminasi Aitem dan Indeks Kesukaran Aitem...................... 56

d. Hasil Analisis Reliabilitas ........................................................... 57

C. Pembahasan............................................................................................. 57

BAB V KESIMPULAN DAN SARAN .............................................................. 66

DAFTAR PUSTAKA .......................................................................................... 68

LAMPIRAN ......................................................................................................... 70


DAFTAR TABEL

Tabel 1. Kategori Batasan Nilai p ....................................................................... 36

Tabel 2. Evaluasi Indeks Diskriminasi Aitem ...................................................... 38

Tabel 3. Proporsi Sampel Penelitian Berdasarkan Usia ....................................... 50

Tabel 4. Proporsi Sampel Penelitian Berdasarkan Jenis Kelamin ........................ 50

Tabel 5. Hasil Analisis Indeks Kesukaran Aitem Subtes ZR ............................... 51

Tabel 6. Rangkuman Analisis Indeks Kesukaran Aitem Subtes ZR .................... 51

Tabel 7. Hasil Analisis Indeks Daya Diskriminasi Aitem Subtes ZR .................. 52

Tabel 8. Rangkuman Analisis Indeks Daya Diskriminasi Aitem Subtes ZR ....... 52

Tabel 9. Seleksi Aitem Berdasarkan Indeks Kesukaran Aitem dan Indeks Daya

Diskriminasi Aitem Subtes ZR ............................................................... 53

Tabel 10. Rangkuman Analisis Aitem Subtes ZR ................................................ 54

Tabel 11. Hasil Analisis Indeks Kesukaran Aitem TKD 6 .................................. 55

Tabel 12. Rangkuman Analisis Indeks Kesukaran Aitem TKD 6........................ 55

Tabel 13. Hasil Analisis Indeks Daya Diskriminasi Aitem TKD ........................ 55

Tabel 14. Rangkuman Analisis Indeks Daya Diskriminasi Aitem TKD 6........... 56

Tabel 15. Seleksi Aitem Berdasarkan Indeks Kesukaran Aitem dan Indeks Daya

Diskriminasi Aitem TKD 6 .................................................................. 56

Tabel 16. Rangkuman Analisis Aitem TKD 6 ..................................................... 57


x

DAFTAR RUMUS

Rumus 1. Koefisien korelasi Pearson-Product Moment ...................................... 46

Rumus 2. KR-20 ................................................................................................... 47

Rumus 3. Indeks Kesukaran Aitem ...................................................................... 48

Rumus 4. Indeks Daya Diskriminasi Aitem ......................................................... 48


xi

DAFTAR LAMPIRAN

Lampiran 1 Output Analisis Korelasi Subtes ZR Dan TKD 6 ........................... 70

Lampiran 2 Hasil Analisis Reliabilitas Subtes ZR Dengan Formula KR-20 ...... 71

Lampiran 3 Hasil Analisis Reliabilitas TKD 6 Dengan Formula KR-20............ 72


1

BAB I

PENDAHULUAN

A. Latar Belakang

Psikologi adalah ilmu yang mempelajari perilaku dan proses mental

(Lahey, 2012). Pada masa sekarang ini, ilmu psikologi semakin berkembang

dalam masyarakat umum. Penerapan dari ilmu psikologi ini banyak ditemukan

dari banyaknya jasa pelayanan psikologi yang dapat dipergunakan oleh

masyarakat saat ini. Salah satu diantaranya adalah penggunaan tes psikologi. Saat

ini, hampir dalam setiap bidang kehidupan manusia banyak yang menggunakan

tes psikologi. Tes psikologi oleh Urbina (2004) didefinisikan sebagai prosedur

sistematis untuk memperoleh sampel perilaku yang relevan dengan fungsi kognitif

maupun afektif, dan untuk penilaian serta evaluasi sampel yang sesuai dengan

standar yang berlaku.

Tes psikologi digunakan untuk mengukur perbedaan antar individu

maupun mengukur perbedaan reaksi individu yang sama dalam kondisi yang

berbeda (Anastasi & Urbina, 1997). Respon maupun hasil pengukuran individu

tersebut dapat memberikan suatu kesimpulan. Kesimpulan inilah yang menjadi

dasar dalam pengambilan keputusan (Osterlind, 2010). Pengambilan keputusan

biasanya dilakukan dalam proses seleksi, klasifikasi, dan diagnosa baik pada

individu, kelompok, organisasi, maupun program tertentu (Urbina, 2004). Dengan

adanya fungsi tersebut, tes psikologi harus mampu untuk mengungkap aspek-

aspek psikologis dalam diri individu terkait pengambilan keputusan.

Menurut Kaplan & Saccuzzo (2009), tes psikologi terbagi menjadi dua

jenis, yaitu tes kepribadian dan kemampuan. Tes kepribadian digunakan untuk


2

mengukur trait ataupun temperamen individu. Tes kemampuan digunakan untuk

mengukur keahlian individu dalam hal kecepatan dan ketepatan. Tes kepribadian

terbagi atas dua jenis, yaitu tes objektif dan tes proyektif. Sedangkan tes

kemampuan terbagi menjadi tiga, yaitu tes prestasi, tes bakat, dan tes inteligensi.

Tes kepribadian dan tes kemampuan telah digunakan dalam berbagai

konteks kehidupan manusia seperti pendidikan, pekerjaan, dan klinis. Dalam

konteks pendidikan, digunakan untuk mengidentifikasi kecepatan belajar

seseorang, mengklasifikasi individu berdasarkan kemampuan dalam menyerap

informasi, pemilihan jurusan, dan seleksi masuk sekolah dan perguruan tinggi.

Dalam konteks pekerjaan, digunakan untuk menyeleksi dan mengklasifikasi

sumber daya manusia serta promosi karyawan. Dalam konteks klinis, digunakan

untuk mengidentifikasi individu yang memiliki keterbelakangan mental maupun

gangguan psikologis. Dari ketiga konteks yang telah dijelaskan sebelumnya, yaitu

konteks pendidikan, pekerjaan, dan klinis, tes yang umumnya dipakai adalah tes

inteligensi (Anastasi & Urbina, 1997).

Secara khusus, tes inteligensi sering dipakai dalam proses seleksi pada

konteks pendidikan dan pekerjaan. Tes inteligensi digunakan sebagai penyaringan

tahap awal dalam proses seleksi. Hal ini dibuktikan dengan kutipan wawancara

yang dilakukan peneliti kepada psikolog Industri dan Organisasi yang mengatakan

bahwa dalam proses seleksi, tes inteligensi biasanya diberikan di awal rangkaian

pelaksanaan tes (Komunikasi Personal, 25 November 2016). Dalam proses

seleksi, tes inteligensi umumnya digunakan untuk memprediksi kinerja pekerjaan

individu dan kemampuannya tehadap bidang yang dilamar (Anastasi & Urbina,

1997). Hal ini didukung dengan pernyataan Kaplan & Sacuzzo (2009) bahwa tes


3

inteligensi mengukur potensi yang dimiliki individu dalam pemecahan masalah,

kemampuan beradaptasi dengan perubahan suatu kondisi dan kemampuan untuk

belajar dari pengalaman. Potensi dan kemampuan yang diukur dengan tes

inteligensi menjadi bagian penting dalam menyeleksi individu. Dengan demikian,

kualitas dari tes inteligensi penting untuk diperhatikan.

Beberapa contoh tes inteligensi yang masih digunakan untuk penyeleksian

ialah Advanced Progressive Matrices, Culture Fair Intelligence Test (CFIT), Tes

Kemampuan Dasar (TKD), dan Intelligenz Struktur Test (IST). Tes-tes inteligensi

ini juga masih dipakai di beberapa biro psikologi di Kota Medan (Biro A, B, C,

dan D). Namun, tes inteligensi yang sering digunakan digunakan perusahaan

maupun beberapa biro psikologi di Kota Medan untuk proses seleksi ialah IST.

IST merupakan tes psikologi yang dikembangkan pertama kali oleh

Rudolf Amthaeur di Jerman pada tahun 1953. Di Indonesia, tes ini diadaptasi oleh

Fakultas Psikologi Universitas Padjajaran (selanjutnya disebut UNPAD) pada

tahun 1973. Selain mengukur inteligensi, tes ini juga dapat digunakan untuk

melihat bakat (Polhaupessy dalam Diktat Kuliah IST UNPAD, 2009). Di

Indonesia, IST digunakan untuk seleksi dan promosi karyawan dalam konteks

pekerjaan. IST disusun berdasarkan teori Thurstone tentang kemampuan mental

dasar (primary mental abilities). Kemampuan mental dasar terdiri dari tujuh

faktor yaitu faktor verbal (V), number (N), perceptual (P), spasial (S), word

fluency (W), memory (M), dan reasoning (R) yang menghasilkan multiple

intelligence. Adapun kecerdasan yang dihasilkan dari penggunaan IST adalah

kecerdasan verbal, angka, figural, dan ingatan (LPSP3 UI, 2012). Dengan

diperolehnya multiple intelligence dari aspek pengukuran IST inilah yang menjadi


4

alasan mengapa IST saat ini masih banyak dipakai dalam seleksi pekerjaan oleh

perusahaan-perusahaan. Hal ini dapat dibuktikan dengan wawancara yang

dilakukan dengan tester di beberapa biro psikologi di Kota Medan yang

mengatakan bahwa dengan hanya menggunakan IST, dapat diperoleh hasil secara

keseluruhan yang tidak dimiliki tes inteligensi lainnya (Komunikasi Personal, 23

Januari 2017). Selain itu dikatakan juga bahwa untuk seleksi biasanya memang

menggunakan IST karena IST terdiri dari 9 subtes. Kesembilan subtesnya ini

mampu menggambarkan inteligensi lebih lengkap dibandingkan tes inteligensi

lainnya (Komunikasi Personal, 09 September 2017).

Berdasarkan hasil pengamatan oleh peneliti, IST sudah tersebar di internet.

Hal ini dibuktikan peneliti dengan ditemukannya beberapa website yang memuat

aitem dalam IST hanya dengan sekali pencarian. Tentunya kebocoran soal ini

akan berdampak pada penggunaan tes itu sendiri. Masyarakat yang telah

mengetahuinya juga dapat mengalami proses belajar dan proses mengingat

terhadap aitem-aitem, cara penyelesaian beserta jawaban yang ada di dalam IST

tersebut. Hal demikian tentu akan menyebabkan semua aitem menjadi mudah

untuk dikerjakan oleh individu. Murphy & Davidshofer (2005) menyatakan

bahwa ketika suatu aitem dalam sebuah tes tergolong mudah maka

kemampuannya untuk membedakan kelompok yang atributnya diukur menjadi

diragukan, sehingga dapat dikatakan bahwa kualitas aitem tersebut tidak baik.

Kualitas aitem yang tidak baik akan menyebabkan validitas dan reliabilitas suatu

alat tes menjadi terganggu.

IST terdiri atas sembilan subtes, yaitu Satzergaenzung (SE), Wortauswahl

(WA), Analogien (AN), Gemeinsamkeiten (GE), Merkaufgaben (ME),


5

Rechenaufgaben (RA), Zahlenreinhen (ZR), Figurenauswahl (FA), dan

Wuerfelaufgaben (WU). Kesembilan subtes ini dapat digunakan secara

keseluruhan maupun hanya satu subtes saja (Polhaupessy dalam Diktat Kuliah

IST UNPAD, 2009). Berdasarkan pengamatan peneliti terhadap IST, kesembilan

subtes IST telah dianalisis karakteristik psikometrinya dengan uji validitas bukti

struktur internal dengan pendekatan Item Response Theory (IRT) dan metode

multitrait-multimethod (MTMM). Dari analisis yang telah dilakukan, ditemukan

bahwa IST memiliki karakteristik psikometri yang kurang baik.

Penelitian dengan pendekatan IRT dilakukan oleh Rahmawati (2014). Dari

hasil analisis IRT dengan menggunakan kriteria peluang tebakan, indeks

kesukaran aitem, dan indeks daya diskriminasi, ditemukan bahwa hanya 45,625%

dari 160 aitem IST yang masih memiliki karakteristik psikometri yang dianggap

baik. Penelitian yang menggunakan metode MTMM dilakukan pada tahun 2011.

Dalam penelitian dengan metode ini, peneliti mengkorelasikan antar subtes pada

IST. Hal ini tampak dalam penelitian yang dilakukan oleh Sirait & Garliah (2011),

subtest WA dikorelasikan dengan kedelapan subtest lainnya dengan nilai

korelasinya berada di atas 0.25. Nilai ini menunjukkan bahwa subtes WA sudah

tidak sesuai lagi dengan tujuan awal pengukurannya. Adapun karakteristik dari

IST menurut Polhaupessy (dalam Diktat Kuliah IST UNPAD, 2009) ialah korelasi

antar subtesnya rendah dengan r = 0.25. Koefisien reliabilitas yang diperoleh

dalam penelitian ini sebesar 0.650. Nilai ini menunjukkan bahwa subtes WA

sebagai bagian dari IST tidak reliabel untuk digunakan sebagai tes inteligensi.

Penelitian yang dilakukan oleh Siregar & Rahmawati (2011) juga

menemukan bahwa subtest AN memiliki korelasi yang tinggi dengan subtest


6

lainnya. Nilai korelasi subtest AN dengan kedelapan subtes lainnya berkisar dari

antara 0.410 sampai dengan 0.676. Hal ini juga menunjukkan bahwa subtest AN

sudah tidak sesuai lagi dengan tujuan awal pengukurannya. Koefisien reliabilitas

yang diperoleh dalam penelitian ini sebesar 0.728. Nilai ini menunjukkan bahwa

subtes AN sebagai bagian dari IST tidak reliabel untuk digunakan sebagai tes

inteligensi.

Penelitian yang dilakukan oleh Sari & Rahmawati (2011) menemukan

bahwa subtest RA memiliki korelasi yang cukup tinggi dengan kedelapan subtes

lainnya yaitu berkisar dari 0,417 sampai dengan yang paling tinggi yaitu 0,999.

Penelitian pada subtes SE dilakukan oleh Elvira & Rahmawati (2011) yang

menemukan bahwa terdapat korelasi yang cukup tinggi antara subtest SE dengan

subtes lainnya dalam IST, dengan kisaran nilai korelasi sebesar 0.379 sampai

0,676. Hal ini juga menunjukkan bahwa subtest RA dan SE sudah tidak sesuai

lagi dengan tujuan awal pengukurannya. Koefisien reliabilitas yang diperoleh

dalam penelitian subtes RA sebesar 0.851 dan subtes SE sebesar 0.73. Nilai ini

menunjukkan bahwa subtes RA dan SE sebagai bagian dari IST tidak reliabel

untuk digunakan sebagai tes inteligensi.

Pada tahun 2011, subtes ZR juga dilakukan uji validitasnya oleh Princen &

Rahmawati. Hasil yang ditemukan ialah koefisien validitas dari uji validitas

konvergen yang dilakukan dengan mengkorelasikan subtest ZR dengan subtes RA

sebesar 0.758. Uji validitas diskriminannya dilakukan dengan mengkorelasikan

subtest ZR dengan subtest WU dan hasil yang diperoleh sebesar 0.372. Hal ini

juga menunjukkan bahwa subtest ZR sudah tidak sesuai lagi dengan tujuan awal

pengukurannya. Koefisien reliabilitas yang diperoleh dalam penelitian ini sebesar


7

0.882. Nilai ini menunjukkan bahwa subtes ZR sebagai bagian dari IST tidak

reliabel untuk digunakan sebagai tes inteligensi.

Berdasarkan analisis IST yang telah dilakukan, maka penting untuk

dilakukan analisis lebih lanjut pada IST mengingat tes ini masih digunakan hingga

saat ini. Oleh karena itu, peneliti tertarik untuk menganalisis karakteristik

psikometri dari IST namun berfokus kepada satu subtes saja, yaitu subtest ZR.

Peneliti memilih subtes ZR karena dari pengamatan yang dilakukan oleh peneliti,

peneliti menemukan bahwa deret angka (aitem subtes ZR) telah dipelajari sejak

SMP. Aitem-aitem berbentuk deret angka juga dapat ditemukan di berbagai

sumber. Hal tersebut dapat menimbulkan adanya proses belajar yang dilakukan

individu terhadap aitem subtest ZR.

Selain itu, peneliti juga menemukan bahwa subtes ZR pada umumnya

lebih sering digunakan dibandingkan subtes IST lainnya ketika subtes dalam IST

digunakan secara terpisah. Seperti yang dijelaskan oleh Polhaupessy (dalam

Diktat Kuliah IST UNPAD, 2009), kesembilan subtes dalam IST dapat digunakan

secara keseluruhan maupun hanya satu subtes saja. Pada analisis subtest ZR yang

dilakukan dengan pendekatan IRT, ditemukan bahwa keseluruhan aitem tersebut

memiliki kriteria peluang tebakan dibawah 0.35. Dari 20 aitem, hanya 10 aitem

yang indeks daya diskriminasinya berada dibawah 2,00 dan hanya 19 aitem yang

tingkat kesukarannya lebih besar dari -2,00 (Rahmawati, 2014).

Berdasarkan analisis MTMM pada subtest ZR, ditemukan koefisien

validitas konvergennya (dikorelasikan dengan RA) sebesar 0.758 dan validitas

diskriminannya (dikorelasikan dengan WU) sebesar 0.372. Koefisien reliabilitas

dari subtes ini sebesar 0,882. Dari analisis indeks diskriminasi aitemnya, 19 dari


8

20 aitem dinilai sangat baik dengan nilai indeks diskriminasi aitemnya diatas 0,4.

Dari analisis indeks kesukaran aitem, hanya 6 aitem yang memiliki nilai p

dibawah 0,3. Berdasarkan analisis yang dilakukan, secara keseluruhan aitem

subtes ZR memiliki kualitas aitem yang baik, namun validitas dan reliabilitasnya

sebagai tes inteligensi masih belum cukup baik untuk digunakan (Princen, 2011).

Selain dengan uji validitas konstrak, subtes ZR juga memiliki analisis

karakteristik psikometri yang cukup lengkap dengan dianalisisnya subtes ZR

menggunakan validitas bukti prediktif. Hasil analisisnya menunjukkan bahwa

subtes ZR tidak mampu untuk membedakan kemampuan IPA dan IPS pada siswa

SMA kelas X (Tiarsarani, 2008).

Berdasarkan alasan yang telah dipaparkan sebelumnya, maka peneliti

tertarik untuk melanjutkan menganalisis subtes ZR. Analisis ini penting dilakukan

untuk memberikan informasi apakah subtes ZR masih valid dan reliabel untuk

digunakan. Hal yang membedakan penelitian ini dari penelitian lain sebelumnya

adalah peneliti menganalis validitas subtest ZR menggunakan bukti konkuren

yang dalam hal ini dilakukan dengan mengkorelasikan subtes ZR dengan tes yang

sejenis yaitu TKD 6.

Peneliti memilih untuk menguji validitas kriteria dengan bukti konkuren

karena metode pengujiannya yang praktis dan waktu pelaksanaannya yang singkat

untuk dilakukan (Murphy & Davidshofer, 2005). Selain itu, analisis dalam metode

ini mudah dilakukan karena dengan mengkorelasikan skor subtes ZR dengan skor

TKD 6 sebagai kriteria maka akan diperoleh koefisien validitas dari suatu tes yang

dapat dipercaya.


9

Selain itu, dengan dilakukannya analisis menggunakan validitas dengan

bukti konkuren dapat memberikan kajian subtes ZR yang lebih komprehensif

setelah dilakukannya berbagai analisis karakteristik psikometri dengan sumber

validitas berdasarkan struktur internal dan validitas dengan bukti prediktif. Hal ini

didukung dengan pernyataan dalam Osterlind (2010) bahwa validitas itu harus

dibuktikan dari berbagai sumber yang ada. Dalam uji validitas dengan bukti

konkuren, setiap hasil ukur yang relevan dengan tujuan tes dapat dijadikan

sebagai kriteria (Azwar, 2012). Maka dalam penelitian ini, uji validitas dilakukan

dengan mengorelasikan subtes ZR dengan tes inteligensi lainnya yang mengukur

atribut yang sama dengan subtes ZR.

Tes inteligensi yang dinilai memiliki tujuan tes yang relevan dengan

subtes ZR ialah Tes Kemampuan Dasar (TKD) 6. TKD 6 dipilih dengan alasan tes

ini mengukur atribut yang sama dengan subtest ZR, yaitu deret angka. TKD 6

sebagai bagian dari TKD juga disusun berdasarkan teori kemampuan mental dasar

Thurstone. Oleh karena itu, dengan adanya kesamaan ini, maka TKD 6 tepat

untuk dijadikan kriteria. Jika ditemukan korelasi yang tinggi antara subtes ZR

dengan TKD 6 maka dapat dikatakan bahwa kedua tes tersebut mengukur hal

yang sama dan subtes ZR memiliki validitas konkuren yang baik.

Selain menganalisis dengan menggunakan sumber validitas yang lain,

perbedaan penelitian yang dilakukan oleh peneliti dengan penelitian yang

dilakukan oleh peneliti-peneliti sebelumnya ialah penelitian ini menggunakan data

primer yang diperoleh langsung dari pelaksanaan tes pada mahasiswa Psikologi

USU 2016. Dengan pengambilan data secara langsung, maka proses pelaksanaan

tes yang dilakukan dalam penelitian ini dapat dikontrol oleh peneliti.


10

Berdasarkan pemaparan yang telah dijelaskan sebelumnya, peneliti

memilih untuk mengevaluasi karakteristik psikometri subtes ZR pada IST dengan

cara mengestimasi indeks kesukaran aitem dan indeks daya diskriminasi aitem,

mengestimasi koefisien reliabilitas, dan memvalidasi berdasarkan bukti hubungan

dengan variabel lain dan. Hal ini penting dilakukan untuk mengetahui apakah

subtes ZR pada IST masih memiliki kualitas aitem yang baik atau tidak. Azwar

(2012) menyatakan bahwa sebuah tes akan dinilai baik jika aitem dalam tes

tersebut baik dan aitem yang baik akan menghasilkan pengukuran yang baik.

Selain itu, penelitian ini penting dilakukan untuk mengetahui apakah hasil subtes

ZR pada IST masih valid dan reliabel sesuai dengan tujuan pengukurannya,

Dengan demikian, evaluasi karakteristik psikometri subtes ZR pada IST yang

dilakukan dapat memberikan informasi apakah IST masih layak untuk digunakan

atau tidak.

B. Rumusan Masalah

Peneliti melihat perlunya dilakukan pengujian terhadap indeks kesukaran

aitem, indeks daya diskriminasi aitem, reliabilitas, dan validitas meskipun

pengujian ini sudah pernah dilakukan oleh peneliti sebelumnya. Validasi pada

penelitian sebelumnya dilakukan berdasarkan bukti struktur internal. Pengujian

dengan bukti validitas yang lain penting dilakukan untuk memberikan kajian yang

komprehensif mengenai IST apakah tes ini masih baik digunakan hingga saat ini.

Hal tersebut perlu dilakukan dengan pertimbangan tes ini telah bocor namun tes

ini masih digunakan hingga saat ini. Berdasarkan permasalahan tersebut, peneliti

merumuskan empat pertanyaan, yaitu :


11

1. Berapa indeks kesukaran aitem subtes ZR pada IST?

2. Berapa indeks daya diskriminasi aitem subtes ZR pada IST?

3. Berapa koefisien reliabilitas subtes ZR pada IST?

4. Apakah subtes ZR pada IST terbukti valid digunakan ditinjau berdasarkan

hubungan dengan TKD 6?

C. Tujuan Penelitian

Tujuan penelitian ini ialah untuk mendapatkan informasi apakah IST

khususnya subtes ZR masih berfungsi sesuai dengan tujuan pengukuran subtes ZR

dengan cara mengestimasi indeks kesukaran aitem dan indeks daya diskriminasi

aitem, mengestimasi koefisien reliabilitas, dan memvalidasi berdasarkan bukti

hubungan dengan variabel lain.

D. Manfaat Penelitian

Penelitian ini diharapkan dapat memberikan manfaat teoritis maupun

praktis, sebagai berikut :

1. Manfaat Teoritis

Hasil dari penelitian ini diharapkan dapat bermanfaat bagi ilmu psikologi

mengenai pengkajian alat ukur dan untuk memberikan data empiris mengenai

karakteristik psikometri IST khususnya subtest ZR apakah masih berfungsi sesuai

dengan tujuan awalnya.

2. Manfaat Praktis

Hasil dari penelitian ini diharapkan mampu memberikan informasi yang

menjadi pertimbangan penting bagi para praktisi yang memakai IST khususnya

subtes ZR sebagai alat dalam pengambilan keputusan.


12

E. Sistematika Penelitian

Sistematika penulisan dalam penelitian ini adalah :

Bab I : Pendahuluan

Bab ini berisikan latar belakang, rumusan masalah, tujuan penelitian, manfaat

penelitian, sistematika penelitian dan kerangka berpikir.

Bab II : Tinjauan Pustaka

Bab ini berisikan teori mengenai IST, Subtes ZR, TKD 6 dan teori mengenai

validitas, reliabilitas, indeks kesukaran aitem dan indeks daya diskriminasi aitem,

serta analisis karakteristik psikometri subtes ZR.

Bab III : Metode Penelitian

Bab ini berisikan mengenai metode penelitian yaitu jenis penelitian, subjek

penelitian, data penelitian, prosedur pelaksanaan penelitian, metode pengumpulan

data dan analisis data.

Bab IV : Hasil dan Pembahasan

Bab ini berisikan gambaran subjek penelitian, deskripsi hasil analisis validitas,

reliabilitas, indeks kesukaran aitem, dan indeks diskriminasi aitem serta

pembahasan mengenai seluruh hasil yang diperoleh dalam penelitian ini.

Bab V : Kesimpulan dan Saran

Bab ini berisikan kesimpulan mengenai hasil yang diperoleh dari analisis data,

saran metodologis untuk penelitian berikutnya dan saran praktis bagi para praktisi

yang mau menggunakan IST.


13

KERANGKA BERPIKIR

Tes

Prestasi

Tes

Bakat

Tes

Intelegensi

Intelligenz Struktur Test

(IST)

validitas

konstraknya baik

Hasil analisis ITR :

a. peluang tebakan

<0.35

b. tingkat kesukaran

>-2.00

c. indeks daya

diskriminasi <2.00

Hasil analisis MTMM

a. pxix2 <0.9

b. d >0.4

c. p<0.3

ZR RA WA SE

Tes Psikologi

AN

Tes

Kepribadian

GE ME

Tes

Kemampuan

FA WU

Analisis Karakteristik Psikometri

Subtes ZR pada IST

Dilakukan dengan

TKD 6 karena adanya

kesamaan seperti:

- Disusun

berdasarkan teori

kemampuan mental

dasar oleh L.L

Thurstone

- mengukur atribut

yang sama yaitu

kemampuan

berpikir dengan

angka

Pengujian dengan sumber

bukti validitas yang lain,

yaitu bukti validitas

berdasarkan hubungan

dengan variabel yang lain

Pernah dilakukan uji

validitas berdasarkan

struktur internal


14

BAB II

TINJAUAN PUSTAKA

A. Intelligenz Struktur Test (IST)

Tes yang digunakan dalam penelitian ini adalah IST. Dalam bab ini akan

dijelaskan berbagai hal tentang IST, yaitu sejarah IST dan subtes-subtes dalam

IST. Dalam penelitian ini, peneliti akan berfokus kepada satu subtes saja yaitu

subtes ZR. Penjelasan subtes ZR dalam bab ini meliputi deskripsi dan penelitian

terdahulu subtes ZR. Selain itu, dalam bab ini juga akan dijelaskan tentang kriteria

tes lain yang relevan dengan subtes ZR yaitu TKD 6. TKD 6 merupakan tes yang

akan dikorelasikan dengan subtes ZR dalam pengujian validitas.

1. Sejarah Intelligenz Struktur Test (IST)

IST merupakan salah satu tes inteligensi yang dikembangkan oleh Rudolf

Amthauer pada tahun 1953 di Jerman dengan berlandaskan teori L.L Thurstone

mengenai kemampuan mental dasar (LPSP3UI, 2012). Inteligensi didefinisikan

oleh Amthauer sebagai keseluruhan struktur dari kemampuan-kemampuan jiwa

dan rohani manusia yang memberikan kemampuan bagi manusia untuk bertindak

sebagai pelaksana dalam dunianya. Inteligensi dapat diketahui lebih jelas melalui

prestasi yang dicapai individu atau hasil suatu tes yang mengukur inteligensi

(Polhaupessy dalam Diktat Kuliah IST UNPAD, 2009). Dengan adanya pemikiran

tersebut, Amthauer menyusun sebuah tes yang dapat mengukur inteligensi, yaitu

IST dengan hipotesis kerja sebagai berikut :

“Komponen dalam struktur tersebut tersusun secara hierarkis;

maksudnya bidang yang dominan kurang lebih akan berpengaruh

pada bidang-bidang yang lain; kemampuan yang dominan dalam

struktur inteligensi akan menentukan dan mempengaruhi

kemampuan yang lainnya.”


15

Amthauer menyusun IST sebagai baterai tes yang terdiri dari 9 subtes

(Polhaupessy dalam Diktat Kuliah IST UNPAD, 2009). Karakteristik dari baterai

tes Amthauer ditunjukkan dengan interkorelasi yang rendah antar subtesnya

(r=0.25) dan korelasi antara satu subtes dengan keseluruhan subtes yang rendah

pula (r=0.60) (Polhaupessy dalam Diktat Kuliah IST UNPAD, 2009).

Di Indonesia, IST yang digunakan adalah IST hasil adaptasi Fakultas

Psikologi UNPAD Bandung. Adaptasi dilakukan kepada IST-70. Tes ini pertama

kali digunakan oleh Psikolog Angkatan Darat Bandung, Jawa Barat (Polhaupessy

dalam Diktat Kuliah IST UNPAD, 2009).

2. Subtes-subtes dalam Intelligenz Struktur Test (IST)

IST terdiri dari sembilan subtes yang memiliki batas waktu yang berbeda-

beda dan diadministrasikan dengan menggunakan buku manual (LPSP3UI, 2012).

Sembilan subtes dalam IST adalah Satzergaenzung (SE), Wortauswahl (WA),

Analogien (AN), Gemeinsamkeiten (GE), Merkaufgaben (ME), Rechenaufgaben

(RA), Zahlenreinhen (ZR), Figurenauswahl (FA), dan Wuerfelaufgaben (WU)

(Polhaupessy dalam Diktat Kuliah IST UNPAD, 2009)

3. Penelitian Terdahulu Subtes ZR

Penelitian tentang subtes ZR pernah dilakukan oleh Tiarsarani (2008) untuk

menguji validitas konstrak dan validitas bukti prediktif serta reliabilitasnya

mengingat tes ini sering dipakai terutama dalam proses seleksi mahasiswa baru.

Hasil yang ditemukan oleh peneliti menunjukkan bahwa ada empat aitem dalam

subtes ZR memiliki indeks daya diskriminasi aitem yang tidak baik, validitas

konstraknya baik namun validitas prediktifnya tidak baik, dan subtes ZR dinilai

reliabel.


16

Penelitian tentang subtes ZR pernah dilakukan oleh Princen & Rahmawati

(2011) dengan alasan norma yang digunakan dalam IST belum pernah

diperbaharui, belum pernah dilakukannya evaluasi terhadap IST sejak IST

diadaptasi di Indonesia pada tahun 1973, dan kebocoran yang mungkin terjadi

karena IST telah digunakan selama bertahun-tahun tanpa adanya revisi.

Hasil penelitian yang diperoleh oleh Princen & Rahmawati (2011) ialah

indeks kesulitan aitem subtes ZR memuaskan dengan rincian 6 aitem tergolong

sulit, 9 aitem tergolong sedang, dan 5 aitem tergolong mudah. Namun,

penyusunan aitemnya masih belum sesuai dengan urutan penyajian (dari aitem

mudah ke aitem sulit). Berdasarkan analisis indeks diskriminasi aitem, ditemukan

bahwa kualitas aitemnya baik yang ditunjukkan dengan 19 aitemnya memiliki

indeks diskriminasi yang baik (diatas 0.4) dan hanya 1 aitem yang indeks

diskriminasinya kurang baik (dibawah 0.4).

Hasil dari seleksi aitem berdasarkan indeks kesukaran aitem dan indeks

diskriminasi aitem ditemukan bahwa 19 aitemnya layak diterima dan 1 aitem

membutuhkan revisi. Dari analisis reliabilitas yang dilakukan, ditemukan bahwa

subtes ZR tidak reliabel jika digunakan sebagai tes inteligensi dikarenakan nilai

koefisien reliabilitas yang diperoleh sebesar 0.82. Dari analisis MTMM pada

subtest ZR, ditemukan koefisien validitas konvergennya (dikorelasikan dengan

RA) sebesar 0.758 dan validitas diskriminannya (dikorelasikan dengan WU)

sebesar 0.372 (Princen & Rahmawati, 2011).

Penelitian tentang subtes ZR juga dilakukan oleh Rahmawati (2014) untuk

melengkapi analisis IST dengan menggunakan pendekatan Item Response Theory

(IRT). Hasil penelitian yang diperoleh ialah seluruh aitem memiliki kriteria


17

peluang tebakan dibawah 0.35, 19 aitem memiliki tingkat kesukaran diatas -2.00

dan 10 aitem memiliki indeks daya diskriminasi dibawah 2.00 (Rahmawati,

2014).

4. Kriteria Tes Lain yang Relevan dengan Subtes ZR

Pengujian validitas yang dilakukan dalam penelitian ini adalah uji validitas

berdasarkan hubungan dengan variabel lain. Dalam uji validitas ini diperlukan tes

lain yang menjadi kriteria pengukurannya. Menurut Gregory (2004), karakteristik

dari kriteria yang digunakan adalah kriteria yang dipilih harus reliabel, relevan

(mengukur hal yang mirip atau identik dengan tes yang divalidasi) dan bebas dari

kontaminasi. Tes lain yang dinilai oleh peneliti relevan dengan subtes ZR adalah

Tes Kemampuan Diferensial (TKD) 6. Dikatakan relevan karena baik subtes ZR

maupun TKD 6 mengukur hal yang sama dan aitem yang disajikan juga sama

yaitu deret angka.

TKD 6 merupakan salah satu subtes dari TKD. TKD dikonstrak berdasarkan

teori L.L Thurstone tentang kemampuan mental dasar yang terdiri dari 7 faktor

kemampuan mental primer, yaitu kemampuan verbal, kemampuan kelancaran

kata, kemampuan numerik, kemampuan keruangan, kemampuan ingatan,

kecepatan persepsi, dan kemampuan menalar (LPSP3UI, 2011). Dengan

demikian, adanya kesamaan teori penyusun tes yaitu kedua tes sama-sama

dikonstrak dengan teori L.L Thurstone tentang kemampuan mental dasar maka

dapat dikatakan bahwa TKD 6 relevan menjadi kriteria bagi subtes ZR.

B. Karakteristik Psikometri

Metode psikometri merupakan perhitungan matematis dengan statistika

tentang rancangan alat tes dan pengukuran psikologi. Metode psikometri


18

dilakukan untuk membuat interpretasi terhadap hasil tes lebih valid. Validitas dari

suatu tes juga terkait dengan reliabilitas suatu tes (Osterlind, 2010). Oleh karena

itu, dalam bagian ini akan disajikan data yang berkaitan dengan validitas dan

reliabilitas.

Metode psikometri juga berlaku untuk mengukur proses mental, maka

konstrak yang diukur dikuantifikasikan melalui variabel dan dinyatakan melalui

aitem dari suatu tes (Osterlind, 2010). Dengan demikan, analisis tentang aitem

dari suatu tes juga akan dibahas dalam bagian ini. Murphy & Davidshofer (2005)

menyatakan bahwa dalam analisis aitem ada tiga informasi yang disajikan, yaitu

analisis indeks kesukaran aitem, indeks daya diskriminasi aitem, dan efektivitas

distraktor. Namun yang akan dibahas dalam penelitian ini hanya dua saja yaitu

analisis indeks kesukaran aitem dan indeks diskriminasi aitem.

1. Validitas

a. Definisi Validitas

Pada tahun 1973, Garret (dalam Osterlind, 2010) menyatakan bahwa

validitas sebuah tes ditunjukkan ketika tes tersebut mampu mengukur apa yang

seharusnya diukur. Namun, definisi validitas yang dikemukakan oleh Garret

dinilai mengabaikan aspek psikologis. Oleh Osterlind (2010), validitas

didefinisikan dengan sejauh mana informasi yang diperoleh dari hasil tes tersebut

tepat, bermakna, dan berguna dalam pengambilan keputusan yang merupakan

tujuan dari suatu pengukuran mental dan didukung dengan berbagai bukti.

Definisi validitas oleh Osterlind didukung dengan pernyataan Azwar (2012)

yang menjelaskan bahwa validitas mengacu kepada ketepatan dan kecermatan alat

tes dalam melakukan fungsi ukurnya. Jadi, validitas yang dikemukakan oleh


19

Azwar ditentukan oleh ketepatan dan kecermatan hasil pengukuran. Apabila alat

tes tersebut mampu menjalankan fungsi ukurnya atau memberikan hasil tes yang

sesuai dengan maksud dilakukannya pengukuran tersebut, maka tes tersebut

dikatakan valid. Coaley (2010) pun menyatakan hal yang sama, yaitu suatu tes

dikatakan valid apabila tes tersebut mampu mengukur apa yang seharusnya

diukur. Dari definisi yang dikemukakan oleh Coaley, dapat dikatakan juga bahwa

validitas dari suatu tes ditunjukkan ketika tes mampu memberikan hasil sesuai

dengan tujuan dilakukannya suatu pengukuran. Hal ini sesuai dengan pernyataan

Landy (dalam Coaley, 2010) bahwa orientasi validitas ialah hasil dari tes tersebut.

b. Sumber Bukti Validitas

Pengujian validitas dilakukan dengan mengumpulkan bukti-bukti dari

berbagai sumber. Sumber yang dikumpulkan tersebut menyajikan informasi

mengenai tingkat kepercayaan untuk membuat kesimpulan skor yang terdapat

dalam berbagai situasi spesifik (Osterlind, 2010).

1) Bukti validitas berdasarkan konten tes

Evaluasi bukti validitas dilakukan dengan menggunakan informasi terkait

konten pengukuran seperti konten domain (dalam tes berbasis domain) ataupun

konstrak (dalam tes yang mengungkap latent trait). Adanya blueprint tes juga

menjadi hal yang sangat penting dalam melakukan evaluasi bukti validitas

berdasarkan konten tes. Selain itu, adanya penilai yang kompeten, bukti

berdasarkan teori, dan spesifikasi lainnya menjadi sumber penting dalam

pengumpulan informasi yang ada. Validasi dengan bukti berdasarkan konten tes

dilakukan dengan professional judgment mengevaluasi blueprint tes (Osterlind,

2010).


20

2) mBukti validitas berdasarkan proses respon

Pengujian proses mental atau kognitif penerima tes merupakan salah satu cara

dalam membuktikan validitas. Validasi dengan bukti proses respon penting

dilakukan untuk mengetahui respon subjek terhadap stimulus dalam suatu

pengukuran. Validasi ini juga memberikan informasi apakah peserta tes

memberikan respon sesuai dengan pemahaman yang dimaksudkan oleh tes. Proses

respon dapat diteliti melalui metode sederhana dan kompleks. Ada beberapa

metode yang dapat dipergunakan untuk menganalisis bukti validitas berdasarkan

proses respon seperti Structural Equation Modeling (SEM), Hierarchical Linear

Models (HLM), dan Path Analysis (Osterlind, 2010).

SEM merupakan metode multivariasi yang dapat digunakan untuk mengukur

dan menganalisis dimensi laten dalam data psikologis. Dimensi laten tersebut

yang menyebabkan suatu peristiwa yang diamati terjadi. Selain itu, SEM juga

dapat digunakan untuk menguji keseluruhan struktur tes (Osterlind, 2010).

Selanjutnya, metode HLM merupakan salah satu teknik dalam analisis multilevel.

Maksud dari analisis multilevel ialah analisis dilakukan dengan menggunakan

seluruh data dari berbagai tingkatan dan dengan prosedur estimasi yang berbeda-

beda sehingga standar error yang diperoleh lebih realistis. Metode ini tepat

digunakan untuk mengolah data yang berstruktur atau memiliki hirarki. Metode

yang terakhir, yaitu path analysis dikembangkan untuk mempelajari dan

menjelaskan pengaruh langsung dan tidak langsung dari variabel penyebab

terhadap variabel akibat. Metode ini dapat digunakan apabila secara teori

dihadapkan pada masalah yang berhubungan dengan sebab-akibat (Pedhazur,

1997).


21

3) Bukti validitas berdasarkan struktur internal

Struktur internal suatu tes terkait dengan pembuatan kesimpulan yang tepat

dan reliabel terhadap konstrak yang dinilai. Hal ini dilakukan dengan menguji

dasar teori yang digunakan (Osterlind, 2010). Dalam Azwar (2012), bukti

validitas berdasarkan struktur internal dikenal dengan istilah validitas konstrak.

Validitas ini menunjukkan sejauh mana tes mengungkap trait yang diukur.

Konsep validitas konstrak berguna pada tes yang trait pengukurannya tidak

memiliki kriteria eksternal.

Validasi berdasarkan struktur internal dapat dilakukan dengan beberapa

metode, salah satunya adalah model faktor umum. Dalam model faktor umum

dijelaskan bahwa aitem-aitem dalam suatu tes memiliki kesamaan dan pengaruh

yang unik. Namun, kesamaan tersebut tidak menyebar secara merata. Dalam

model faktor umum juga dikenal istilah muatan faktor yang menggambarkan

kontribusi varians item terhadap konstrak yang diukur. Penjumlahan dari muatan

faktor individu menunjukkan homogenitas suatu tes. Model faktor umum ini diuji

dengan analisis faktor atau principal components analysis (PCA) (Osterlind,

2010).

Selain model faktor umum, Item Response Theory (IRT) models juga dapat

digunakan untuk memvalidasi berdasarkan struktur internal. IRT models

digunakan dengan melakukan uji asumsi unidimensionalitas, indeks diskriminasi

yang sama, investigasi fenomena tebakan, dan meneliti analisis waktu dengan

membandingkan varians skor antara tes dengan batasan waktu dan tanpa batasan

waktu. Dalam IRT models, model diidentifikasi dengan jumlah karakteristik

stimulus tes yang diestimasi (Osterlind, 2010).


22

Metode lainnya yang juga dapat digunakan dalam validasi struktur internal

adalah Multitrait-Multimatrix Method (MMTM). Metode ini digunakan untuk

menganalisis hubungan dan menentukan pola antar data dari sebuah tes. Dalam

metode ini akan dicari persamaan dan perbedaan antar data dari dua alat tes, baik

yang mengukur atribut yang sama maupun yang berbeda. Dalam metode ini, suatu

tes dikatakan valid ketika alat tes yang diuji konvergen dengan alat tes lainnya

yang mengukur atribut yang sama. Selain itu, alat tes yang diuji tersebut divergen

dengan alat tes lainnya yang mengukur atribut berbeda (Osterlind, 2010).

4) Bukti validitas berdasarkan hubungan dengan variabel lain

Hubungan antara skor tes dengan variabel lain dapat menjadi sumber bukti

validitas. Variabel lain ini disebut dengan kriteria. Pengujian terhadap hubungan

antara skor tes dengan kriteria dilakukan dengan bukti prediktif atau bukti

konkuren (Osterlind, 2010). Dalam Azwar (2012), validitas dengan bukti prediktif

atau bukti konkuren disebut dengan validitas prediktif atau validitas konkuren.

Kedua bukti ini sama-sama menunjukkan hubungan antara tes dan kriteria

eksternal. Perbedaan kedua bukti tersebut terletak pada rentang waktu

diberikannya tes dan kriteria.

Pada bukti prediktif, validasi dilakukan dengan perbandingan antara tes yang

diuji dengan kriteria administrasi posttestnya (setelah tes diberikan) (Osterlind,

2010). Dapat dikatakan juga bahwa hasil tes berfungsi sebagai prediktor bagi

performansi di masa yang akan datang. Oleh karena itu, pengujian validitasnya

baru bisa dilakukan di masa mendatang setelah skor kriterianya diperoleh (Azwar,

2012). Sedangkan pada bukti konkuren, validasi dilakukan dengan perbandingan

antara tes dengan kriteria kontemporer. Kriteria kontemporer yang dimaksud ialah


23

tes paralel yang diadministrasikan baik setelah maupun sebelum tes yang diuji

diberikan (Osterlind, 2010). Dapat dikatakan juga bahwa skor tes dan skor kriteria

diperoleh dalam waktu yang bersamaan (Azwar, 2012).

Estimasi koefisien validitas dengan bukti validitas berdasarkan hubungan

dengan variabel lain baik bukti prediktif maupun bukti konkuren dilakukan

dengan mengkorelasikan skor tes dengan skor kriteria. Korelasi yang dapat

digunakan ialah korelasi Pearson Product-Moment (variabel bersifat kontinyu)

dan korelasi point-biserial (variabel bersifat kategorikal atau dikotomi) (Azwar,

2012).

5) Bukti validitas berdasarkan pertimbangan eksternal

Pertimbangan eksternal yang menjadi bukti validitas adalah validitas tampang

(face validity). Namun, validitas tampang ini tidak dapat diukur dengan

menggunakan metode statistik. Dalam hal ini, pengujian validitas dilakukan

dengan menunjukkan alat tes kepada subjek. Selain validitas tampang, validitas

generalisasi (validity generalization) juga menjadi pertimbangan eksternal lainnya

yang dijadikan sebagai bukti validitas. Yang dimaksud dengan validitas

generalisasi adalah sejauh mana bukti validitas berdasarkan kriteria dapat

digeneralisasi pada situasi baru tanpa harus dilakukan pengujian validitas lagi

(Osterlind, 2010).

c. Faktor-faktor yang mempengaruhi validitas

Pengujian validitas terkait dengan pengumpulan bukti-bukti validitas. Ketika

perubahan waktu terjadi, bukti validitas harus berkembang untuk mendukung

perubahan tersebut. Dengan demikian, interpretasi validitas juga menjadi rentan

berubah. Oleh karena itu, pengujian validitas harus tetap dipantau dan


24

diperbaharui (Osterlind, 2010). Selain perubahan waktu, terdapat juga berbagai

faktor lain yang dapat menjadi sumber kesalahan pada suatu pengukuran dan

dapat mengganggu nilai dari validitas tersebut. Faktor-faktor tersebut adalah

sebagai berikut (Coaley, 2010):

1) Batasan jangkauan data

Keterbatasan jangkauan data disebabkan oleh peserta tes memiliki skor yang

mirip sehingga variasi dari pengukuran tersebut rendah. Variasi yang tidak terlalu

rendah dari suatu pengukuran dapat menghasilkan koefisien validitas yang lebih

tinggi. Jumlah batasan dari berbagai pengujian akan bervariasi sehingga korelasi

yang diperoleh juga akan bervariasi. Batasan jangkauan data ini juga dapat terjadi

ketika suatu kelompok memiliki karakteristik yang lebih homogen seperti usia,

jenis kelamin, dan trait kepribadian. Karakteristik yang homogen ini akan

mempersempit rentang skor yang ada (Coaley, 2010).

2) Pengurangan sampel

Berkurangnya jumlah sampel dalam suatu pengukuran dapat mempersempit

batasan jangkauan data. Namun, suatu formula dan program tertentu dapat

digunakan untuk menghitung koefisien validitas jika batasan jangkauan data

maupun pengurangan sampel terjadi (Coaley, 2010).

3) Ukuran sampel

Jumlah sampel dalam suatu tes mempengaruhi validitas tes tersebut. Semakin

kecil ukuran sampel dalam suatu tes, maka semakin besar kesalahan yang

dihasilkan dalam pengukuran. Semakin besar ukuran sampelnya, maka semakin

kecil pula kesalahan yang terjadi dalam tes tersebut. Selain itu, sampel kecil


25

dalam statistik dikatakan tidak stabil karena korelasi dua sampel dengan ukuran

sampel yang sama-sama kecil menghasilkan hasil yang berbeda (Coaley, 2010).

4) Atenuasi

Jika reliabilitas dari pengukuran kriteria rendah, hal tersebut dapat

mengurangi koefisien validitas dari sebuah tes. Nilai maksimum dari validitas

dibatasi oleh reliabilitas. Dapat dikatakan juga bahwa koefisien validitas tidak

pernah bisa melebihi koefisien reliabilitas. Hal inilah yang disebut dengan

atenuasi (Coaley, 2010). Efek atenuasi ini dapat menghasilkan underestimasi

terhadap validitas tes (Azwar, 2012).

5) Kontaminasi kriteria

Kontaminasi kriteria ini mencakup bias dalam skor kriteria dan variasi dalam

berbagai tipe pengukuran yang digunakan sebagai kriteria. Hal tersebut dapat

mengurangi koefisien validitas. Ketika pengaruh dari berbagai faktor lainnya tidak

berkaitan ataupun kaitannya dapat diminimalisir, maka validitasnya akan menjadi

lebih tinggi (Coaley, 2010).

6) Keterpenuhan Asumsi

Ada beberapa asumsi yang mempengaruhi koefisien validitas. Asumsi

pertama ialah adanya hubungan linear antara variabel yang digunakan dalam suatu

pengukuran. Asumsi kedua terkait dengan struktur faktor dari suatu tes.

Maksudnya ialah alat tes yang berbeda dapat mengukur hal yang serupa meskipun

atribut pengukuran dari tes tersebut tidak identik. Sedangkan asumsi ketiga

berfokus kepada panjang tes (Coaley, 2010).

Pengujian validitas dalam penelitian ini dilakukan dengan menggunakan data

yang diperoleh dari pelaksanaan tes psikologi. Pelaksanaan tes psikologi dapat


26

dipengaruhi oleh banyak faktor. Faktor-faktor ini akan mempengaruhi hasil tes

psikologi meskipun penguji telah memastikan agar hasil tes yang diperoleh

mencerminkan secara tepat kemampuan yang diukur (Gregory, 2013). Hal ini juga

dapat mempengaruhi validitas dari hasil tes. Adapun faktor-faktor yang dapat

mempengaruhi hasil tes menurut Gregory (2013) adalah :

1) Prosedur standar dalam pelaksanaan tes

Pengukuran yang dilaksanakan sesuai dengan kondisi standar yang diuraikan

pada panduan tes dari penerbit dapat menghasilkan interpretasi tes psikologi

dengan validitas yang tinggi.

2) Prosedur pelaksanaan tes

Komponen penting yang perlu diperhatikan dalam pelaksanaan tes adalah para

penguji harus familiar dan paham dengan material tes dan petunjuk tes yang ada.

Selain itu, penguji harus memahami prosedur yang tepat untuk dilakukan jika

terjadi situasi yang tidak biasa selama tes berlangsung.

3) Sensitivitas terhadap keterbatasan

Sensitivitas penguji terhadap keterbatasan yang dimiliki peserta tes seperti

kelemahan pendengaran, penglihatan, wicara dan motorik merupakan salah satu

unsur dari pelaksanaan tes yang valid. Peserta tes yang memiliki keterbatasan

membutuhkan tes khusus untuk mendapatkan hasil pengukuran yang valid.

4) Penetapan waktu

Penetapan waktu dalam suatu tes yang menggunakan batas-batas waktu

menjadi hal yang penting untuk diperhatikan. Para penguji harus menetapkan

waktu yang digunakan selama pelaksanaan tes mulai dari persiapan, pembacaan

instruksi hingga pelaksanaan tes yang sesungguhnya. Pengurangan maupun


27

penambahan waktu dalam suatu tes dapat mengakibatkan norma tes menjadi tidak

valid dan dapat menyebabkan skor sebagian besar subjek dalam kelompok

menjadi turun.

4) Kemampuan penguji

Penguji harus mampu menjelaskan petunjuk tes dengan jelas kepada peserta

tes. Jika ada peserta tes yang belum memahami instruksi tes, penguji dapat

menjelaskan poin-poin dari instruksi tes secara perorangan.

5) Pengaruh penguji

Penguji dalam pelaksanaan tes harus mampu menciptakan lingkungan tes yang

ramah untuk menghasilkan tes yang valid. Kegagalan penguji dalam menjalin

hubungan dapat mendistorsi hasil tes. Selain itu, jenis kelamin, ras, dan

pengalaman penguji juga menjadi unsur yang mempengaruhi peserta tes meskipun

tidak memiliki pengaruh yang begitu signifikan.

6) Pengalaman dan motivasi peserta tes

Pengalaman yang dimiliki oleh peserta tes dapat mempengaruhi hasil tes ketika

tes tersebut sudah pernah diikuti sebelumnya oleh peserta tes. Pengalaman yang

dimiliki oleh peserta tes menyebabkan adanya proses pembelajaran peserta tes

terhadap tes psikologi. Selain pengalaman, peserta tes yang memiliki motivasi

untuk berbohong juga bisa menyebabkan hasil tes menjadi tidak valid. Motivasi

peserta tes untuk berbohong umumnya terjadi ketika peserta tes ingin

mendapatkan hasil yang baik dari pelaksanaan tes yang diadakan suatu institusi.

d. Interpretasi koefisien validitas

Ketika hubungan korelasional antara ukuran dan standar relevansi eksternal

digunakan sebagai bukti kriteria yang terkait pada evaluasi validitas, itu


28

diasumsikan sebagai validitas. Koefisien validitas umumnya diperoleh dengan

korelasi Pearson. Terdapat juga korelasi lainnya namun jarang digunakan, seperti

Spearman rho (disimbolkan rs), koefisien Phi (ɸ), the tetrachoric correlation,

ataupun koefisien kontigensi (C). Selain itu, korelasi biserial dan point-biserial

juga dapat digunakan untuk memperoleh koefisien validitas meskipun kedua

korelasi ini umumnya digunakan untuk analisis aitem selama konstruksi tes dan

review tes. Namun, kedua korelasi tersebut biasanya tidak digunakan untuk

evaluasi validitas bukti kriteria (Osterlind, 2010).

Interpretasi koefisien validitas bersifat relatif. Maksudnya ialah tidak ada

batasan mutlak mengenai koefisien terendah agar validitas dinyatakan

memuaskan. Suatu validitas dianggap memuaskan tergantung kepada penguji

validitas dan pengguna tes (Azwar, 2012). Dalam estimasi validitas, tidak dapat

dituntut koefisien yang tinggi sekali seperti dalam interpretasi koefisien

reliabilitas (Azwar, 2012).

Estimasi validitas dalam penelitian ini dilakukan dengan validitas bukti

kriteria. Coaley (2010) menyatakan bahwa koefisien validitas untuk validitas

kriteria cenderung lebih rendah jika dibandingkan dengan koefisien validitas

konstrak. Hal ini dapat disebabkan oleh ketidakkonsistenan kriteria ketika

dilakukan evaluasi validitas. Koefisien validitas dikatakan sangat baik ketika

koefisien korelasinya diatas 0.54 dan dikatakan baik ketika koefisien korelasinya

diantara 0.45-0.54 Pernyataan oleh Coaley ini didukung juga dengan pernyataan

dalam Murphy & Davidshofer (2005) bahwa dalam pengujian validitas dengan

bukti kriteria, koefisien validitas yang diperoleh umumnya sekitar 0.3 dan 0.4, dan

koefisien tertinggi yang dapat dicapai sekitar 0.5 dan 0.6.


29

2. Reliabilitas

a. Definisi reliabilitas

Reliabilitas mengacu kepada ketepatan dalam penilaian mental. Ketepatan ini

ditentukan oleh konsistensi hasil pengukuran paralel yang dilakukan secara

berulang (Osterlind, 2010). Konsistensi tersebut dapat diketahui dengan

membandingkan skor individu ketika diberikan tes dalam waktu yang berbeda.

Konsistensi ini menunjukkan keakuratan tes (Coaley. 2010). Semakin konsisten

hasil pengukurannya, maka semakin besar reliabilitasnya. Semakin reliabel suatu

pengukuran maka semakin sedikit kesalahan yang terdapat dalam hasil

pengukurannya. Hal ini tentu meningkatkan kepercayaan terhadap hasil

pengukuran yang ada (Osterlind, 2010).

Lord & Norvick (dalam Osterlind, 2010) menyatakan bahwa reliabilitas

dalam teori tes klasik didefinisikan sebagai kuadrat korelasi antara skor tampak

dengan skor murni. Dalam Coaley (2010) dijelaskan bahwa rentang antara skor

tampak dan skor murni disebut dengan error. Semakin kecil rentang antara skor

tampak dan skor murni, maka semakin sedikit error dalam pengukuran tersebut

dan reliabilitas pengukurannya semakin besar. Semakin besar rentang antara skor

tampak dan skor murni, maka semakin banyak error dalam pengukuran tersebut

dan reliabilitas pengukurannya semakin kecil.

b. Metode Estimasi Reliabilitas

Reliabilitas suatu pengukuran dapat diketahui dengan melakukan pengukuran

paralel secara berulang. Pada awalnya, pengujian reliabilitas dilakukan dengan

peserta tes diminta untuk berpartisipasi kembali dalam tes yang sama dan

administrasi tesnya identik. Namun, metode tersebut dinilai sulit dilakukan karena


30

ketiadaan peserta tes ketika dilakukan tes secara berulang. Oleh karena itu, para

ahli psikometri mengemukakan beberapa metode pengukuran paralel yang dapat

dilakukan untuk mengestimasi reliabilitas (Osterlind, 2010). Metode yang

berbeda menghasilkan estimasi yang berbeda karena masing-masing metode

memiliki sensitivitas tehadap sumber error (Coaley, 2010).

1) Metode Tes Ulang (Test-retest)

Metode tes ulang merupakan pengukuran paralel yang dilakukan dengan cara

memberikan tes yang sama dengan administrasi yang sama dan kondisi

pelaksanaan tes yang dibuat serupa namun dalam waktu yang berbeda (Osterlind,

2010). Hasil pengukuran pertama dan pengukuran kedua dikorelasikan dan

menghasilkan koefisien reliabilitas test-retest atau koefisien stabilitas. Jika

interval waktu pelaksanaan tes pertama dengan kedua tidak begitu lama, hasil

korelasinya disebut dengan coefficient of dependability (Coaley, 2010). Korelasi

antara hasil pengukuran pertama dan kedua pada metode ini dilakukan dengan

korelasi Pearson (Osterlind, 2010).

Metode ini tidak dapat digunakan untuk semua pengukuran karena tidak

semua trait benar-benar stabil sepanjang waktu. Reliabilitas semakin rendah jika

interval waktu pelaksanaan tes yang pertama dengan yang kedua semakin lama

(Coaley, 2010). Hal ini dapat disebabkan karena terjadinya perubahan aspek

psikologis yang diukur pada individu yang mendapatkan tes. Selain itu, dapat

disebabkan oleh perubahan suasana hati, motivasi dan sikap subjek ketika

menerima skala untuk pengukuran berulang (Azwar, 2012). Namun, interval

waktu yang singkat juga akan mempengaruhi respon individu ketika diberikan tes

yang sama untuk kedua kalinya. Respon yang terjadi dapat berupa partisipan


31

menghindar ketika akan diberikan tes lagi maupun individu masih mengingat

jawaban ketika dilakukan pengukuran awal (Coaley, 2010). Ingatan individu

terhadap respon di pengukuran awal disebut dengan efek bawaan (carry-over

effect). Hal ini dapat menyebabkan overestimasi koefisien reliabilitas (Azwar,

2012).

2) Metode Bentuk tes alternatif

Metode bentuk tes alternatif merupakan pengukuran paralel yang tepat

digunakan ketika tes hanya dapat dilakukan sekali saja. Metode ini dilakukan

dengan menggunakan tes yang telah dikembangkan dengan asumsi tes tersebut

memiliki spesifikasi konten tes yang sama dan prosedur konstruksi tes yang

identik (Osterlind, 2010). Metode ini dilakukan dengan membagi satu kelompok

menjadi dua bagian dan administrasi tes dilakukan dalam dua sesi (Coaley, 2010).

Sesi pertama pada metode bentuk tes alternatif dilakukan dengan tes A

diadministrasikan pada kelompok pertama dan tes B diadministrasikan pada

kelompok kedua. Sesi kedua dilakukan dengan tes A diadministrasikan pada

kelompok kedua dan tes B diadministrasikan pada kelompok pertama (Coaley,

2010). Selanjutnya, kedua tes dikorelasikan dengan korelasi Pearson untuk

mengestimasi reliabilitas dan menghasilkan koefisien reliabilitas bentuk alternatif

yang disebut dengan koefisien ekuivalen (Osterlind, 2010).

Metode bentuk tes alternatif dapat mengurangi efek bawaan (subjek

mengingat aitem tes yang diberikan) pada tes berulang dikarenakan aitem tes yang

dihadapi individu di kedua sesi pelaksanaan tes berbeda (Coaley, 2010). Namun,

metode ini juga memiliki kekurangan yaitu tes yang dijadikan sebagai tes

alternatif tidak tersedia (Osterlind, 2010). Hal demikian terjadi dikarenakan


32

sulitnya untuk membuat aitem dengan konten dan tingkat kesulitan yang sama di

dua tes yang berbeda. Selain itu, metode ini membutuhkan waktu yang lama untuk

pelaksanaannya. Berbagai kekurangan tersebut dapat mengurangi koefisien

reliabilitas (Coaley, 2010).

3) Metode Konsistensi internal

Metode konsistensi internal merupakan metode yang digunakan ketika alat

tes tidak memiliki bentuk alternatif. Dengan metode ini, pengukuran paralel dapat

dilakukan pada tes yang hanya mempunyai satu bentuk saja, yaitu dengan

membagi tes menjadi dua bagian (split-halves) (Osterlind, 2010) atau dengan

membagi tes menjadi tiga bagian maupun membagi sebanyak jumlah aitem

(Azwar, 2012). Pada tes yang dibagi dua, estimasi reliabilitasnya dilakukan

dengan mengkorelasikan hasil pengukuran kedua bagian (Kaplan, 2009). Korelasi

pada metode ini dilakukan dengan korelasi Pearson dan menghasilkan reliabilitas

split-half (Osterlind, 2010).

Pembagian tes dalam metode ini dapat dilakukan dengan mengelompokkan

aitem berangka ganjil ke dalam satu bagian dan aitem berangka genap ke bagian

lainnya. Pembagian tes juga dapat dilakukan secara acak ataupun dengan

menggunakan kriteria lainnya. Namun, pemilihan cara untuk pembagian tes dalam

metode ini penting untuk diperhatikan agar pembagian tesnya ekuivalen sehingga

tidak menganggu estimasi reliabilitas dengan metode ini. Metode ini juga tidak

direkomendasikan untuk tes yang aitemnya sedikit dikarenakan estimasi

reliabilitas umumnya lebih rendah pada tes yang singkat.

Adanya kelemahan yang ditemukan dalam metode ini membuat para ahli

psikometri merumuskan sejumlah formula dalam mengestimasi reliabilitas ketika


33

akan menggunakan metode konsistensi internal (Osterlind, 2010). Pemilihan

formula dalam metode ini ditentukan oleh jenis pembagian tes yang digunakan

(Azwar, 2012). Salah satu formula yang dapat dipergunakan dalam metode ini

ialah formula Spearman-Brown. Formula ini digunakan untuk tes yang dibagi dua

dengan masing-masing bagian memenuhi asumsi paralel (memiliki distribusi

normal dan standar deviasi yang sama) (Osterlind, 2010).

Selain formula Spearman-Brown, terdapat formula Kuder-Richardson (KR)

yang dapat digunakan ketika pembagian tes dilakukan sebanyak jumlah aitem

dikarenakan jumlah aitem dalam tesnya sedikit (Osterlind, 2010) dan ketika aitem

tesnya diberi skor dikotomi (Azwar, 2012). Dalam penggunaannya, formula KR

terbagi menjadi KR-20 (tingkat kesulitan aitem tes berbeda) dan KR-21 (tingkat

kesulitan aitem tes sama) (Osterlind, 2010). Formula lainnya yang dapat

digunakan dalam metode ini ialah formula Koefisien Aplha, digunakan ketika

dalam pembagian tesnya asumsi paralel tidak terpenuhi namun asumsi π-

equivalent terpenuhi. Ketika tes yang dibagi dua tidak memenuhi asumsi paralel

dan π-equivalent, maka tes dibelah menjadi tiga bagian dan formula yang

digunakan adalah formula Kristof (Azwar, 2012).

c. Faktor-faktor yang mempengaruhi reliabilitas

Ada berbagai faktor yang mempengaruhi reliabilitas menurut Osterlind

(2010), yaitu :

1) Atenuasi

Reliabilitas terbagi atas dua yaitu indeks dan koefisien. Indeks reliabilitas

menggambarkan manifestasi teori reliabilitas. Koefisien reliabilitas merupakan

pengujian statistik terhadap reliabilitas. Pengujian dilakukan dengan


34

mengkorelasikan skor tampak dari tes paralel. Namun, skor tampak yang

diperoleh dari suatu pengukuran tidak benar-benar utuh dalam menggambarkan

konstrak yang diukur dan terdapat error dalam pengukuran tersebut. Hal tersebut

dapat merendahkan korelasi antar konstrak yang diukur dan inilah yang disebut

dengan atenuasi. Adanya atenuasi inilah yang menyebabkan koefisien reliabilitas

selalu lebih kecil daripada indeks reliabilitas (Osterlind, 2010).

2) Panjang Tes

Panjang tes ialah banyaknya aitem dalam sebuah tes. Semakin banyak aitem

dan semakin panjang tes maka reliabilitasnya juga akan meningkat. Aitem

merupakan sampel informasi tentang konstrak. Oleh karena itu, semakin banyak

sampel informasi maka keseluruhan konstrak dapat digambarkan lebih utuh

(Osterlind, 2010). Azwar (2007) menyatakan bahwa penambahan aitem dalam

suatu tes akan meningkatkan reliabilitas tes jika aitem yang ditambahkan tersebut

memiliki kualitas yang setara dengan aitem yang sudah ada.

3) Heterogenitas kelompok

Variabilitas dalam kelompok menjadi pertimbangan penting dalam estimasi

reliabilitas. Heterogenitas kelompok mempengaruhi variabilitas yang juga

memiliki pengaruh kuat terhadap reliabilitas. Semakin heterogen kelompok maka

koefisien reliabilitasnya semakin tinggi. Semakin homogen kelompok maka

koefisien reliabilitasnya semakin rendah. Hal ini disebabkan oleh adanya

variabilitas dalam kelompok (Osterlind, 2010).

d. Interpretasi koefisien reliabilitas

Interpretasi koefisien reliabilitas bersifat relatif. Tidak ada batasan mutlak

dari nilai terendah koefisien reliabilitas yang harus dicapai agar dapat dikatakan


35

reliabel. Oleh karena itu, peneliti maupun pengguna teslah yang menentukan

koefisien reliabilitas yang diperoleh sudah memuaskan atau belum, tergantung

kepada tujuan pengukuran atau tujuan tesnya (Azwar, 2012). Jika suatu tes

digunakan untuk mengukur inteligensi, maka koefisien reliabilitas dikatakan baik

jika koefisien yang diperoleh berada diatas 0.9 (Coaley, 2010).

Namun, dalam pengaplikasian tes psikologi secara umum, Murphy &

Davidshofer (2005) menyatakan bahwa suatu tes dikatakan memiliki reliabilitas

yang rendah jika koefisien reliabilitasnya berada dibawah 0.6, sedang jika

koefisien reliabilitasnya berada diantara 0,6-0.7, dan tinggi koefisien

reliabilitasnya berada diatas 0.8. Dalam menginterpretasikan koefisien reliabilitas,

Azwar (2012) menyatakan bahwa ada dua hal yang harus dipahami, yaitu :

1) Besarnya koefisien reliabilitas alat tes dari data skor suatu kelompok subjek

dalam kondisi tertentu, besar kemungkinan koefisien reliabilitasnya tidak

sama dengan data dari skor kelompok subjek lain dalam situasi lain.

2) Koefisien reliabilitas hanya mengindikasikan besarnya inkonsistensi skor hasil

pengukuran dan tidak dapat menjelaskan sebab-sebab dari inkonsistensi

tersebut.

3. Indeks Kesukaran Aitem

Indeks kesukaran aitem (disimbolkan dengan huruf p) merupakan rasio antara

penjawab aitem yang benar dengan banyaknya penjawab aitem. Indeks kesukaran

aitem menyatakan tingkat kesukaran suatu aitem. Dalam menghitung indeks

kesukaran aitem, semua subjek dijadikan satu kelompok tanpa membedakan

antara kelompok yang tinggi maupun kelompok yang rendah (Azwar, 2012).


36

Nilai p yang diperoleh dari perhitungan indeks kesukaran aitem berkisar

mulai dari 0 sampai dengan 1. Semakin besar nilai p, maka aitem tersebut

semakin mudah. Sebaliknya, semakin kecil nilai p maka aitemnya semakin sulit

(Azwar, 2012). Nilai p yang diperoleh tersebut akan digunakan dalam penyusunan

aitem. Aitem-aitem dalam suatu tes akan disusun dari aitem dengan nilai p yang

paling tinggi (aitem yang paling mudah) hingga aitem dengan nilai p yang paling

rendah (aitem yang paling sulit) (Murphy & Davidshofer, 2005). Ketika suatu

aitem memiliki nilai p sebesar 0 atau 1 dapat dikatakan bahwa aitem tersebut tidak

berguna. Hal itu disebabkan oleh aitem yang taraf kesukarannya terlalu tinggi

ataupun terlalu rendah memiliki daya diskriminasi yang kurang baik (Azwar,

2012).

Secara umum, nilai p yang dianggap baik sebesar 0.5. Nilai p dibawah 0.5

(aitem sulit) terkadang dianggap baik ketika akan digunakan untuk tes yang dalam

prosedur seleksinya hanya memilih sedikit subjek. Dengan demikian, angka p

yang terbaik disesuaikan dengan tujuan tes yang bersangkutan. Nilai p yang

diperoleh juga merujuk kepada taraf kesukaran kelompok, bukan individual

(Azwar, 2012). Crocker & Algina (2008) menyatakan nilai p berkaitan dengan

reliabilitas. Nilai p yang lebih besar dari 0.5 untuk aitem yang skornya berbentuk

dikotomi sudah menunjukkan reliabilitas yang baik (Crocker & Algina, 2008).

Allan & Yen (dalam Lababa, 2008) mengkategorikan nilai p sebagai berikut:

Tabel 1. Kategori Batasan Nilai p

p Kategori

P < 0.3 Sulit

0.3 < p < 0.7 Sedang

P > 0.7 Mudah


37

4. Indeks Daya Diskriminasi Aitem

Daya diskriminasi aitem (disimbolkan dengan huruf d) adalah kemampuan

aitem dalam membedakan subjek yang memiliki atribut yang diukur dan yang

tidak memiliki (Azwar, 2012). Daya diskriminasi aitem juga didefinisikan sebagai

kemampuan aitem dalam membedakan subjek yang mempunyai kemampuan

tinggi dengan subjek yang mempunyai kemampuan rendah. Aitem yang memiliki

indeks daya diskriminasi aitem yang tinggi akan dijawab dengan benar oleh

semua kelompok yang kemampuannya tinggi dan tidak dapat dijawab oleh

sebagian besar kelompok yang kemampuannya rendah. Daya diskriminasi suatu

aitem semakin besar ketika perbedaan proporsi penjawab benar dari kelompok

tinggi dan kelompok rendah semakin besar pula (Azwar, 2012).

Nilai indeks daya diskriminasi aitem berkisar dari -1 sampai dengan +1.

Indeks daya diksriminasi aitem sebesar 0 apabila nilai indeks diksriminasi

kelompok tinggi sama dengan nilai indeks diksriminasi kelompok rendah. Dalam

analisis aitem, hanya nilai positiflah yang dapat digunakan. Semakin besar indeks

daya diskriminasi suatu aitem maka aitem tersebut semakin mampu membedakan

individu yang atributnya diukur. Semakin kecil indeks daya diskriminasi aitem

maka aitem tersebut semakin tidak jelas fungsinya untuk membedakan individu

yang atributnya diukur (Azwar, 2012).

Daya diskriminasi aitem memiliki kaitan dengan indeks kesukaran aitem.

Daya diskriminasi aitem yang baik terdapat pada aitem yang nilai p nya berkisar

dari 0.4 sampai dengan 0.6 atau dapat dikatakan berada pada aitem yang tidak

terlalu mudah tapi juga tidak terlalu sulit. Dalam seleksi aitem, aitem yang nilai d

lebih besar dari 0.50 dikatakan memiliki daya diskriminasi yang baik. Ketika


38

aitem memiliki nilai d lebih kecil dari 0.20, maka aitem tersebut bisa dihilangkan

tanpa harus ditelusuri lebih lanjut untuk direvisi (Azwar, 2012). Ebel (dalam

Azwar, 2012) membuat kriteria evaluasi indeks diskriminasi aitem ke dalam

empat kategori yaitu :

Tabel 2. Evaluasi Indeks Diskriminasi Aitem Indeks Diskriminasi (d) Evaluasi

≥ 0.4 Bagus sekali

0.3 – 0.39 Lumayan bagus tapi mungkin masih perlu

peningkatan

0.2 – 0.29 Belum memuaskan, perlu diperbaiki

< 0.2 Jelek dan harus dibuang

C. Analisis Karakteristik Psikometri Subtes Zahlen Reihen (ZR) Pada


IST diperkenalkan oleh Rudolf Amtheur di Jerman pada tahun 1953. Pada

tahun 1973, IST diadaptasi dari IST versi 70 Jerman di Indonesia oleh Fakultas

Psikologi UNPAD. Tes ini masih digunakan hingga saat ini terutama dalam

seleksi pekerjaan. IST terdiri dari 9 subtes namun dalam penelitian ini, peneliti

akan berfokus kepada satu subtes saja, yaitu subtes ZR dikarenakan subtes ini

merupakan subtes yang sering disajikan dalam penggunaan IST.

Subtes ZR sebagai subtes yang sering digunakan seharusnya memiliki kajian

psikometri yang komprehensif. Dalam menganalisis karakteristik psikometri suatu

tes umumnya dilakukan dengan cara menguji kualitas aitem, validitas dan

reliabilitas. Untuk pengujian validitasnya, subtes ZR telah dianalisis dengan bukti

prediktif pada tahun 2008 dan bukti validitas berdasarkan struktur internal

menggunakan pendekatan IRT pada tahun 2014 dan metode multitrait-

multimethod (MTMM) pada tahun 2011. Namun, pengujian validitas dengan


39

menggunakan kedua bukti saja masih belum lengkap dikarenakan suatu tes harus

dikaji secara menyeluruh. Hal ini didukung dengan pernyataan Osterlind (2010)

bahwa validitas dari suatu tes harus dibuktikan dari berbagai sumber yang ada.

Oleh karena itu, peneliti akan menganalisis subtes ZR dengan menggunakan bukti

validitas yang lain untuk melengkapi kajian psikometri subtes ZR. Pengujian

validitasnya akan dilakukan dengan bukti validitas berdasarkan hubungan dengan

variabel lain (bukti konkuren). Selain memvalidasi, peneliti juga akan

mengestimasi indeks kesukaran aitem dan indeks daya diskriminasi aitem serta

mengestimasi koefisien reliabilitas subtes ZR dalam penelitian ini.

Berbagai cara yang akan dilakukan dalam analisis karakteristik psikometri

subtes ZR penting untuk dilakukan karena ada banyak faktor yang dapat

mempengaruhi validitas, reliabilitas dan kualitas aitem dari subtes ZR. Subtes ZR

dengan aitem berupa deret angka sudah dapat ditemukan sejak SMP. Selain itu,

subtes ini sering ditemui dalam pelaksanaan berbagai tes. Hal ini membuat subtes

ZR menjadi familiar bagi subjek. Adanya pengalaman subjek dalam mengerjakan

soal subtes ZR akan menimbulkan proses belajar yang membuat subjek telah

mengetahui cara dalam mengerjakannya dan respon yang diharapkan untuk setiap

aitem. Ketika subjek telah mengetahui bentuk penyelesaian dan jawaban dalam

aitem subtes ZR maka subjek akan dapat menjawab semua aitem dengan benar.

Dengan demikian, dapat dikatakan bahwa aitem dalam tes tersebut terlalu mudah

untuk dikerjakan. Dalam Azwar (2012) dinyatakan bahwa ketika aitem terlalu

mudah maka indeks kesukaran aitemnya rendah.

Indeks kesukaran aitem yang rendah menyebabkan indeks daya diskriminasi

aitemnya menjadi rendah pula. Semakin kecil indeks diskriminasi aitem maka


40

aitem tersebut semakin tidak jelas fungsinya untuk membedakan individu yang

atributnya diukur. Semakin besar indeks diskriminasi suatu aitem maka aitem

tersebut semakin mampu membedakan individu yang atributnya diukur (Azwar,

2012). Dengan demikian, ketika nilai indeks diskriminasi aitemnya rendah, maka

fungsi tes untuk membedakan antar individu yang biasanya digunakan untuk

seleksi kerja menjadi tidak dapat berfungsi sebagaimana mestinya.

Ketidakmampuan suatu aitem dalam membedakan subjek pada kelompok

tinggi dengan kelompok yang rendah juga menyebabkan variasi pengukurannya

rendah. Variasi pengukuran yang rendah ini terlihat dari skor antar subjek yang

mirip dikarenakan subjek relatif menjawab dengan benar. Dalam Coaley (2010)

dinyatakan bahwa variasi pengukuran yang rendah menyebabkan jangkauan data

terbatas. Keterbatasan jangkauan data ini merupakan salah satu faktor yang dapat

mempengaruhi validitas.

Selain menyebabkan keterbatasan jangkauan data, variasi pengukuran yang

rendah juga menyebabkan subjek berada dalam kelompok yang homogen.

Homogen ataupun heterogen suatu kelompok dinyatakan oleh Osterlind (2010)

sebagai salah satu faktor yang mempengaruhi reliabilitas. Semakin homogen

kelompok, maka koefisien reliabilitasnya semakin rendah. Sebaliknya, semakin

heterogen kelompok, maka koefisien reliabilitasnya semakin tinggi. Dengan

demikian, ketika subjek memiliki variasi pengukuran yang rendah maka koefisien

reliabilitasnya juga akan rendah. Dalam Coaley (2010) dinyatakan bahwa

koefisien reliabilitas yang rendah menyebabkan koefisien validitasnya juga

rendah. Hal ini dikarenakan koefisien validitas tidak pernah bisa melebihi


41

koefisien reliabilitas dan inilah yang disebut dengan efek atenuasi. Efek atenuasi

ini juga merupakan salah satu faktor yang mempengaruhi koefisien validitas.

Faktor lainnya yang juga dapat mempengaruhi koefisien validitas ialah

kontaminasi kriteria. Penggunaan kriteria dalam uji validitas berdasarkan

hubungan dengan variabel lain menggunakan bukti konkuren menjadi salah satu

hal yang patut untuk dicermati. Ketidaktepatan dalam memilih kriteria menjadi

satu hal yang harus diwaspadai. Dalam Coaley (2010) dikatakan bahwa ketika

kriteria yang dipilih bias maka uji validitas konkuren terhadap subtes ZR juga

menjadi terganggu dan menimbulkan bias. Hal inilah yang disebut dengan

kontaminasi kriteria. Oleh karena itu, penting untuk memilih kriteria yang benar-

benar tepat untuk dijadikan sebagai pembanding dalam sebuah pengukuran agar

tidak bias. Dalam penelitian ini, peneliti memilih TKD 6 sebagai kriteria untuk uji

validitas dengan bukti konkuren dikarenakan TKD 6 mengukur hal yang sama

dengan subtes ZR dan bentuk aitem dalam kedua tes ini juga sama yaitu

berbentuk deret angka.

Pengujian validitas dengan bukti konkuren dalam penelitian ini dilakukan

dengan mengkorelasikan skor subtes ZR dengan skor TKD 6. Komputasi

koefisien validitas subtes ZR akan dilakukan dengan menggunakan rumus

korelasi Pearson Product-Moment. Jika terdapat korelasi yang tinggi antara subtes

ZR dengan TKD 6 maka dapat dikatakan bahwa subtes ZR memiliki validitas

konkuren yang baik. Hasil dari pengujian ini dikatakan memiliki validitas

konkuren yang baik apabila koefisien validitasnya berada di atas 0.45 dan sangat

baik apabila koefisien validitasnya berada di atas 0.45 (Coaley, 2010).


42

Selain pengujian validitas, analisis karakteristik psikometri subtes ZR juga

dilakukan dengan pengujian reliabilitas. Estimasi koefisien reliabilitas dalam

penelitian ini dilakukan dengan metode konsistensi internal menggunakan formula

Kuder-Richardson. Formula ini digunakan karena aitem dalam subtes ZR tidak

terlalu banyak (berjumlah 20 aitem) dan skor dalam subtes ZR merupakan skor

dikotomi. Penentuan menggunakan formula KR-20 atau KR-21 pada subtes ZR

ditetapkan ketika telah diketahui tingkat kesukaran aitem dalam subtes apakah

bersifat homogen atau tidak. Hasil dari pengujian pada tes inteligensi umumnya

dikatakan memiliki reliabilitas yang tinggi jika koefisien reliabilitasnya berada

diatas 0.90 (Coaley, 2010). Subtes ZR merupakan bagian dari tes inteligensi.

Analisis karakteristik psikometri lainnya yang juga dilakukan dalam

penelitian ini adalah analisis kualitas aitem dengan mengestimasi indeks

kesukaran aitem dan indeks daya diskriminasi aitem. Kedua analisis aitem yang

dilakukan ini akan saling mempengaruhi (Murphy & Davidshofer, 2005). Dalam

Azwar (2012) dinyatakan bahwa secara umum nilai p yang diperoleh dari

perhitungan indeks diskriminasi aitem berkisar mulai dari 0 sampai dengan 1.

Semakin besar nilai p, maka aitem tersebut semakin mudah. Sebaliknya, semakin

kecil nilai p maka aitemnya semakin sulit. Nilai p yang dianggap baik sebesar 0.5.

Namun, karena subtes ZR merupakan salah satu subtes dalam tes inteligensi maka

nilai indeks kesukaran aitem yang diharapkan dalam penelitian ini bervariasi.

Nilai indeks diskriminasi aitem umumnya berkisar dari -1 sampai dengan +1

namun dalam analisis daya diskriminasi aitem, hanya nilai positiflah yang dapat

digunakan. Dalam penelitian ini, nilai indeks diskriminasi yang diharapkan oleh

peneliti ialah di atas 0.4.


43

BAB III

METODE PENELITIAN

A. Jenis Penelitian

Penelitian terhadap subtes ZR pada IST hasil adaptasi Fakultas Psikologi

UNPAD pada tahun 1970-an menggunakan metode penelitian kuantitatif

deksriptif. Metode ini dipilih karena tujuan penelitian yang dilakukan adalah

untuk mendeksripsikan karakteristik psikometri dari subtes ZR yang meliputi

analisis kualitas aitem (indeks kesukaran aitem dan indeks diskriminasi daya

aitem), analisis validitas dengan bukti konkuren dan analisis reliabilitas.

Analisis karakteristik psikometri subtes ZR dalam penelitian ini dilakukan

dengan menggunakan data dari pemberian subtes ZR kepada subjek. Data mentah

tersebut akan diskoring lalu diolah dengan metode statistika. Hasil pengolahan

data akan disajikan secara sistematis untuk dapat ditarik kesimpulan.

B. Subjek Penelitian

1. Populasi dan Sampel Penelitian

Populasi adalah sekelompok objek maupun subjek yang memiliki kualitas

dan karakteristik tertentu sesuai dengan yang telah ditetapkan oleh peneliti untuk

dipelajari dan ditarik kesimpulan. Sampel adalah bagian dari jumlah dan

karakteristik yang terdapat pada populasi (Sugiyono, 2012).

Populasi dalam penelitian ini disesuaikan berdasarkan norma IST. Norma

yang digunakan dalam IST ada dua yaitu norma usia dan norma pendidikan.

Berdasarkan norma usia, IST diperuntukkan bagi individu yang berusia 12-60

tahun. Berdasarkan norma pendidikan, IST dapat digunakan untuk tingkat

pendidikan SMP, SMA, Akademi/D-III dan perguruan tinggi (Polhaupessy dalam


44

Diktat Kuliah IST UNPAD, 2009). Namun, dikarenakan teknik pengambilan

sampel yang digunakan adalah sampling insidental maka sampel yang berhasil

dikumpulkan oleh peneliti terbatas pada usia 17-20 tahun dan tingkat pendidikan

perguruan tinggi. Oleh karena itu, hasil penelitian yang terdapat dalam penelitian

ini hanya dapat digeneralisasikan pada individu dengan rentang usia 17-20 tahun

saja dan tingkat pendidikan perguruan tinggi.

2. Teknik Pengambilan Sampel

Teknik pengambilan sampel yang digunakan dalam penelitian ini adalah

sampling insidental. Sampling insidental merupakan teknik pemilihan sampel

yang dilakukan secara insidental atau kebetulan, siapa saja yang bertemu dengan

peneliti dan memenuhi karakteristik yang telah ditetapkan oleh peneliti

sebelumnya maka dapat dijadikan sampel (Sugiyono, 2012). Sampel yang

digunakan dalam penelitian ini adalah individu dengan rentang usia 17-20 tahun

dan tingkat pendidikan perguruan tinggi. Pengambilan data dilakukan peneliti

pada mahasiswa Psikologi USU Angkatan 2016.

Analisis validitas dalam penelitian ini dilakukan dengan menggunakan bukti

kriteria. Dalam Nunnally & Bernstein (1994) dinyatakan bahwa koefisien

validitas yang dapat dicapai dalam uji validitas dengan bukti kriteria umumnya

sekitar 0.3 sampai dengan 0.4 namun bisa juga mencapai 0.5 sampai dengan 0.6

jika kriteria yang digunakan terkait dengan kemampuan kognitif. Untuk sampel

dalam penelitian, Nunnally menyatakan bahwa jumlah sampel sebesar 50

merupakan batas minimal untuk mencapai koefisien validitas sebesar 0.3. Untuk

mencapai koefisien validitas yang lebih tinggi, diperlukan sampel yang lebih


45

besar. Adapun jumlah sampel yang digunakan dalam penelitian ini berjumlah 167

orang.

C. Data Penelitian

Penelitian ini menggunakan data primer, yaitu data yang diperoleh dari

pelaksanaan tes kelompok dengan memberikan subtes ZR dan TKD 6 kepada

mahasiswa Psikologi USU Angkatan 2016.

D. Prosedur Pelaksanaan Penelitian

1. Pembuatan Proposal

Penelitian ini dilakukan dengan merancang proposal terlebih dahulu.

Proposal terdiri dari Bab I Pendahuluan, Bab II Tinjauan Pustaka, dan Bab III

Metode Penelitian.

2. Persiapan Izin Penelitian

Peneliti mengurus surat izin untuk peminjaman alat tes ke bagian

laboratorium kampus. Peneliti juga menghubungi dosen-dosen yang mengajar di

Angkatan 2016 untuk meminta izin memberikan tes kepada mahasiswa Angkatan

2016 sebelum maupun setelah perkuliahan.

3. Pelaksanaan Penelitian

Penelitian dilaksanakan dengan memberikan subtes ZR dan TKD 6 kepada

mahasiswa S1 Psikologi USU Angkatan 2016 yang terbagi atas tiga kelas, yaitu

kelas A, B, dan C. Pengadministrasian tes dilakukan secara kelompok dan bekerja

sama dengan sarjana psikologi yang terlatih untuk mengadministrasikan subtes

ZR dan TKD 6.


46

4. Analisis Data

Peneliti menskoring lembar jawaban subtes ZR dan TKD 6 yang telah

dikumpulkan. Selanjutnya, peneliti menyusun data berupa hasil skoring subtes ZR

dan TKD 6 secara sistematis dalam tabel. Selanjutnya, peneliti menganalisis

indeks kesukaran aitem, indeks daya diskriminasi aitem dan realibilitasnya serta

menganalisis validitasnya dengan mengkorelasikan skor total subtes ZR dengan

TKD 6.

E. Metode Pengumpulan Data

Pengumpulan data yang dilakukan dalam penelitian ini dilakukan dengan

memberikan subtes ZR dan TKD dalam tes kelompok. Dari pelaksanaan tes

tersebut, akan diperoleh data primer.

F. Analisis Data

Analisis data yang dilakukan dalam penelitian ini yaitu analisis validitas,

reliabilitas, indeks kesukaran aitem, dan indeks daya diskriminasi aitem

1. Analisis Validitas

Analisis validitas yang dilakukan dalam penelitian ini adalah analisis validitas

dengan bukti konkuren. Analisis ini dilakukan dengan menggunakan korelasi

Pearson Product-Moment untuk mencari hubungan antara skor subtes ZR dengan

skor TKD 6. Adapun rumusan dari koefisien korelasi adalah sebagai berikut :

Rxy = ............................................................ (1)


47

Keterangan :

X = skor subtest ZR IST

Y = skor TKD 6

n = banyaknya subjek

Koefisien validitas tertinggi yang dapat dicapai dalam pengujian validitas

dengan bukti kriteria sekitar 0.5 dan 0.6 (Murphy & Davidshofer, 2005). Dalam

Coaley (2010) dinyatakan bahwa koefisien validitas untuk bukti konkuren

dianggap baik jika koefisiennya berada di atas 0.45 dan sangat baik jika

koefisiennya berada di atas 0.55.

2. Analisis Reliabilitas

Analisis reliabilitas subtes ZR dalam penelitian ini dilakukan dengan

pendekatan konsistensi internal menggunakan formula Kuder-Richardson (KR)

20. Peneliti menggunakan formula ini dikarenakan tingkat kesukaran dalam aitem

subtes ZR bervariasi, aitem dalam subtes ZR jumlahnya tidak begitu banyak (20

aitem) dan skor tes berbentuk dikotomi. Adapun rumusan dari formula KR-20

adalah sebagai berikut:

................................................................. (2)

Keterangan :

= koefisien reliabilitas

= proporsi populasi yang menjawab aitem benar (atau aitem pertama).

= proporsi populasi yang menjawab aitem salah (atau aitem kedua).

= banyak aitem dalam tes.

= varians skor tes.


48

Subtes ZR sebagai bagian dari tes inteligensi sering digunakan dalam seleksi

kerja. Reliabilitas dalam tes inteligensi dikatakan baik jika koefisien

reliabilitasnya diatas 0,9 (Coaley, 2010).

3. Analisis Indeks Kesukaran Aitem

Analisis indeks kesukaran aitem dalam penelitian ini dilakukan dengan

menggunakan formula berikut ini :

p = ni / N ............................................................................................. (3)

Keterangan :

p = indeks kesukaran aitem.

ni = banyaknya subjek yang menjawab aitem dengan benar.

N = banyaknya subjek yang menjawab aitem.

Aitem dalam penelitian ini dikatakan memiliki indeks kesukaran aitem yang

rendah dan tergolong ke dalam kategori sulit jika nilai p yang diperoleh berada di

bawah 0.3. Jika nilai p berada di antara 0.3 sampai dengan 0.7 maka aitem berada

dalam kategori sedang. Jika nilai p berada di atas 0.7 maka aitem dikatakan

mudah (Allan & Yen dalam Lababa, 2008). Adapun indeks kesukaran aitem

subtes ZR dalam penelitian ini diharapkan bervariasi dikarenakan subtes ZR

merupakan bagian dari IST yang mengukur inteligensi.

4. Analisis Indeks Daya Diskriminasi Aitem

Analisis indeks diksriminasi aitem dilakukan dengan formula berikut ini :

Ρblx = …………………………………….. (4)


49

Keterangan :

µ+ = rata – rata skor yang menjawab aitem dengan benar

µ+ = rata – rata skor seluruh kelompok

σx = standar deviasi

p = indeks kesulitan

q = 1 – p

Aitem dalam penelitian ini dikatakan memiliki indeks diskriminasi aitem

yang bagus sekali jika nilai d yang diperoleh berada di atas 0.4. Dikatakan

lumayan bagus jika nilai d berada diantara 0.3 sampai dengan 0.39. Jika nilai d

berada diantara 0.2 sampai dengan 0.29 maka aitem dinilai belum memuaskan dan

jika nilai d dibawah 0,2 maka aitem dikatakan jelek (Ebel dalam Azwar, 2012).


50

BAB IV

HASIL DAN PEMBAHASAN

Hasil dan pembahasan yang dideskripsikan dalam bab ini adalah hasil analisis

karakteristik psikometri subtes ZR berupa deskripsi umum data penelitian dan

deskripsi hasil serta pembahasan hasil penelitian subtes ZR. Selain itu, hasil

analisis TKD 6 juga akan dipaparkan dalam bab ini.

A. Deskripsi Umum Data Penelitian

Penelitian ini menggunakan data primer, yaitu data yang diperoleh dari

pemberian tes kepada sampel penelitian secara klasikal. Sampel yang digunakan

dalam penelitian ini adalah mahasiswa S1 Psikologi USU Angkatan 2016 dengan

rentang usia 17-20 tahun. Jumlah sampel dalam penelitian ini sebanyak 167

orang. Gambaran sampel penelitian berdasarkan usianya disajikan dalam tabel 3.

Gambaran sampel penelitian berdasarkan jenis kelamin disajikan dalam tabel 4.

Tabel 3. Proporsi Sampel Penelitian Berdasarkan Usia

Usia (Tahun) Frekuensi Persentase (%)

17 4 2.4

18 73 43.7

19 76 45.5

20 14 8.4

Jumlah total 167 100

Tabel 4. Proporsi Sampel Penelitian Berdasarkan Jenis Kelamin

Jenis Kelamin Frekuensi Persentase (%)

Perempuan 130 77.8

Laki-laki 37 22.2

Jumlah total 167 100


51

B. Deskripsi Hasil Penelitian

1. Hasil Analisis Indeks Kesukaran Aitem

Analisis indeks kesukaran aitem subtes ZR pada IST dilakukan karena tes ini

termasuk ke dalam tes inteligensi yang bertujuan untuk mengukur inteligensi

subjek berdasarkan respon yang diberikan subjek pada setiap aitem dalam subtes

ZR. Berdasarkan Allan & Yen (dalam Lababa, 2008), aitem dikatakan sulit ketika

nilai p dibawah 0.3, dikatakan sedang ketika nilai p berada diantara 0.3 sampai

0.7, dan dikatakan mudah ketika nilai p berada diatas 0.7. Hasil analisis indeks

kesukaran aitem dapat dilihat pada tabel 5.

Tabel 5. Hasil Analisis Indeks Kesukaran Aitem Subtes ZR

Aitem p Keterangan Aitem p Keterangan

97 0.934 Mudah 107 0.587 Sedang

98 0.934 Mudah 108 0.491 Sedang

99 0.910 Mudah 109 0.383 Sedang

100 0.868 Mudah 110 0.246 Sulit

101 0.599 Sedang 111 0.210 Sulit

102 0.820 Mudah 112 0.144 Sulit

103 0.539 Sedang 113 0.180 Sulit

104 0.383 Sedang 114 0.144 Sulit

105 0.467 Sedang 115 0.084 Sulit

106 0.689 Sedang 116 0.096 Sulit

Berdasarkan hasil analisis indeks kesukaran aitem pada tabel 5, maka aitem

dapat dikelompokkan seperti dalam tabel 6 berikut :

Tabel 6. Rangkuman Analisis Indeks Kesukaran Aitem Subtes ZR

p Kategori Nomor Aitem Jumlah Aitem

P < 0.3 Sulit 110, 111, 112, 113,

114, 115, 116

7

0.3 < p < 0.7 Sedang 101, 103, 104, 105,

106, 107, 108, 109

8

P > 0.7 Mudah 97, 98, 99, 100, 102 5

2. Hasil Analisis Indeks Daya Diskriminasi Aitem

Proses yang dilakukan dalam menganalisis indeks daya diskriminasi aitem

subtes ZR pada IST sama dengan analisis indeks kesukaran aitem. Berdasarkan


52

Ebel (dalam Azwar, 2012), nilai d diatas 0.4 dikatakan bagus sekali, nilai d

diantara 0.3 sampai dengan 0.39 dikatakan lumayan bagus tapi mungkin masih

perlu peningkatan, nilai d diantara 0.2 sampai dengan 0.29 dikatakan belum

memuaskan dan perlu diperbaiki, dan nilai d dibawah 0.2 dikatakan jelek. Hasil

analisis indeks daya diskriminasi aitem dapat dilihat pada tabel 7.

Tabel 7. Hasil Analisis Indeks Daya Diskriminasi Aitem Subtes ZR

Aitem d Keterangan

97 0.385 Lumayan bagus tapi mungkin masih perlu peningkatan


99 0.442 Bagus sekali


















Berdasarkan hasil analisis indeks daya diskriminasi aitem pada tabel

sebelumnya, maka aitem dapat dikelompokkan seperti dalam tabel 8 berikut :

Tabel 8. Rangkuman Analisis Indeks Daya Diskriminasi Aitem Subtes ZR Indeks diskriminasi

(d) Evaluasi Nomor aitem Jumlah aitem

≥ 0.4 Bagus sekali 99, 100, 103, 104,

105, 106, 107, 108,

109, 110, 111, 112,

113, 114, 115

15

0.3 – 0.39 Lumayan bagus tapi

mungkin masih perlu

peningkatan

97, 98, 101, 102, 116 5


53

(Lanjutan) Tabel 8. Rangkuman Hasil Analisis Indeks Daya Diskriminasi Aitem

Subtes ZR Indeks diskriminasi

(d) Evaluasi Nomor aitem Jumlah aitem

0.2 – 0.29 Belum memuaskan,

perlu diperbaiki

- 0

< 0.2 Jelek dan harus

dibuang

- 0

3. Seleksi Aitem Berdasarkan Indeks Kesukaran Aitem dan Indeks Daya

Diskriminasi Aitem

Sebuah tes dinilai baik jika aitem dalam tes tersebut baik dan aitem yang baik

akan menghasilkan pengukuran yang baik. Suatu aitem dikatakan baik ketika

kualitas aitem tersebut baik. Kualitas aitem yang baik ditunjukkan dengan indeks

kesukaran aitem dan indeks diskriminasi daya aitem yang baik pula. Analisis

terhadap kedua kriteria tersebut dapat dilihat dalam tabel 9 berikut.

Tabel 9. Seleksi Aitem Berdasarkan Indeks Kesukaran Aitem dan

Indeks Daya Diskriminasi Aitem Subtes ZR Aitem p d Keterangan

97 0.934 0.385 Diterima

98 0.934 0.308 Diterima

99 0.910 0.442 Diterima

100 0.868 0.526 Diterima

101 0.599 0.356 Diterima

102 0.820 0.347 Diterima

103 0.539 0.564 Diterima

104 0.383 0.643 Diterima

105 0.467 0.420 Diterima

106 0.689 0.570 Diterima

107 0.587 0.629 Diterima

108 0.491 0.617 Diterima

109 0.383 0.634 Diterima

110 0.246 0.662 Diterima

111 0.210 0.646 Diterima

112 0.144 0.484 Diterima

113 0.180 0.468 Diterima

114 0.144 0.492 Diterima

115 0.084 0.432 Diterima

116 0.096 0.314 Diterima


54

Ket :

d = daya diskriminasi aitem

p = indeks kesukaran aitem

Dari hasil analisis tersebut, dapat dirangkum seperti dalam tabel 10 berikut.

Tabel 10. Rangkuman Analisis Aitem Subtes ZR Keterangan Parameter Nomor Aitem Jumlah Aitem

Diterima d>0.3 97, 98, 99, 100, 101, 102, 103,

104, 105, 106, 107, 108, 109, 110,

111, 112, 113, 114, 115, 116

20

Revisi d<0.3 - 0

4. Hasil Analisis Validitas Berdasarkan Bukti Konkuren

Analisis validitas pada subtes ZR dilakukan dengan menggunakan bukti

konkuren. Dalam analisisnya, skor total subtes ZR dikorelasikan dengan skor total

kriteria lainnya. Kriteria lainnya yang digunakan dalam analisis validitas ini

adalah TKD 6. Skor total dari kedua tes ini dikorelasikan dengan korelasi Pearson

Product Moment. Dari hasil korelasi tersebut diperoleh koefisien validitas subtes

ZR dengan bukti konkuren sebesar 0.67 yang artinya bahwa subtes ZR memiliki

validitas yang sangat baik berdasarkan Coaley (2010).

5. Hasil Analisis Reliabilitas

Analisis reliabilitas pada subtes ZR dilakukan dengan pendekatan konsistensi

internal menggunakan formula KR-20. Formula ini dipilih karena tingkat

kesulitan dalam aitem subtes ZR bervariasi. Koefisien reliabilitas yang diperoleh

dalam analisis reliabilitasnya sebesar 0.842 yang artinya subtes ZR memiliki

reliabilitas yang sangat baik berdasarkan Murphy &Davidshofer (2005).

6. Analisis Tambahan TKD 6

Pengujian karakteristik psikometri subtes ZR dalam penelitian ini

menggunakan alat tes lainnya sebagai kriteria untuk uji validitas, yaitu TKD 6.


55

Dengan demikian, dalam bagian ini peneliti memaparkan analisis tambahan dari

TKD 6 seperti yang dilakukan pada subtes ZR. Adapun hasil analisis tambahan

yang dipaparkan dalam bagian ini adalah analisis indeks kesukaran aitem, analisis

indeks daya diskriminasi aitem, analisis validitas dan reliabilitas.

a. Hasil Analisis Indeks Kesukaran Aitem

Tabel 11. Hasil Analisis Indeks Kesukaran Aitem TKD 6

Aitem p Keterangan Aitem p Keterangan

1 0.934 Mudah 16 0.467 Sedang

2 0.928 Mudah 17 0.575 Sedang

3 0.832 Mudah 18 0.395 Sedang

4 0.892 Mudah 19 0.335 Sedang

5 0.754 Mudah 20 0.269 Sulit

6 0.916 Mudah 21 0.246 Sulit

7 0.515 Sedang 22 0.335 Sedang

8 0.509 Sedang 23 0.150 Sulit

9 0.000 Sulit 24 0.299 Sulit

10 0.844 Mudah 25 0.186 Sulit

11 0.784 Mudah 26 0.150 Sulit

12 0.862 Mudah 27 0.048 Sulit

13 0.754 Mudah 28 0.024 Sulit

14 0.671 Sedang 29 0.012 Sulit

15 0.689 Sedang 30 0.000 Sulit

Berdasarkan hasil analisis indeks kesukaran aitem pada tabel 11, maka aitem

dapat dikelompokkan seperti dalam tabel 12 berikut.

Tabel 12. Rangkuman Analisis Indeks Kesukaran Aitem TKD 6

p Kategori Nomor Aitem Jumlah Aitem

P < 0.3 Sulit 9, 20, 21, 23, 24, 25, 26,

27, 28, 29, 30

11

0.3 < p < 0.7 Sedang 7, 8, 14, 15, 16, 17, 18, 19,

22

9

P > 0.7 Mudah 1, 2, 3, 4, 5, 6, 10, 11, 12,

13

10

b. Hasil Analisis Indeks Daya Diskriminasi Aitem

Tabel 13. Hasil Analisis Indeks Daya Diskriminasi Aitem TKD 6

Aitem d Keterangan Aitem d Keterangan

1 0.203 Belum memuaskan 16 0.591 Bagus sekali

2 0.336 Lumayan bagus 17 0.623 Bagus sekali

3 0.498 Bagus sekali 18 0.647 Bagus sekali




56

(Lanjutan) Tabel 13. Hasil Analisis Indeks Daya Diskriminasi Aitem TKD 6

Aitem d Keterangan Aitem d Keterangan

6 0.300 Lumayan bagus 21 0.591 Bagus sekali



9 -9.000 Jelek 24 0.604 Bagus sekali




13 0.523 Bagus sekali 28 0.289 Belum memuaskan

14 0.491 Bagus sekali 29 0.153 Jelek

15 0.515 Bagus sekali 30 -9.00 Jelek

Berdasarkan hasil analisis indeks diskriminasi daya aitem pada tabel 13,

maka aitem dapat dikelompokkan seperti dalam tabel 14 berikut.

Tabel 14. Rangkuman Analisis Indeks Daya Diskriminasi Aitem TKD 6

Indeks diskriminasi (d) Evaluasi Nomor aitem Jumlah

aitem

≥ 0.4 Bagus sekali 3, 4, 5, 7, 8, 10, 11,

12, 13, 14, 15, 16, 17,

18, 19, 20, 21, 22, 23,

24, 25, 26, 27

23

0.3 – 0.39 Lumayan Bagus 2, 6 2

0.2 – 0.29 Belum

memuaskan

1, 28 2

< 0.2 Jelek dan harus

dibuang

9, 29, 30 3

c. Seleksi Aitem Berdasarkan Indeks Kesukaran Aitem dan Indeks Daya

Diskriminasi Aitem

Tabel 15. Seleksi Aitem Berdasarkan Indeks Kesukaran Aitem dan

Indeks Daya Diskriminasi Aitem TKD 6

Aitem p d Ket Aitem p d Ket

1 0.934 0.203 Direvisi 16 0.467 0.591 Diterima

2 0.928 0.336 Diterima 17 0.575 0.623 Diterima







9 0.000 -9.000 Direvisi 24 0.299 0.405 Diterima





57

(Lanjutan) Tabel 15. Seleksi Aitem Berdasarkan Indeks Kesukaran Aitem dan

Indeks Daya Diskriminasi Aitem TKD 6

Aitem p d Ket Aitem p d Ket

13 0.754 0.523 Diterima 28 0.024 0.289 Direvisi

14 0.491 0.671 Diterima 29 0.153 0.012 Direvisi

15 0.515 0.689 Diterima 30 -9.00 0.000 Direvisi

Dari hasil analisis tersebut, dapat dirangkum seperti dalam tabel 16 berikut.

Tabel 16. Rangkuman Analisis Aitem TKD 6 Keterangan Parameter Nomor Aitem Jumlah Aitem

Diterima d>0.3 2, 3, 4, 5, 6, 7, 8, 10, 11, 12,

13, 14, 15, 16, 17, 18, 19, 20,

21, 22, 23, 24, 25, 26, 27

25

Revisi d<0.3 1, 9, 28, 29, 30 5

d. Hasil Analisis Realibitas

Analisis reliabilitas pada TKD 6 juga dilakukan dengan pendekatan

konsistensi internal menggunakan formula KR-20 seperti pada subtes ZR.

Formula ini dipilih karena tingkat kesulitan dalam aitem TKD 6 bervariasi.

Koefisien reliabilitas yang diperoleh dalam analisis reliabilitasnya sebesar 0.883

yang artinya TKD 6 memiliki reliabilitas yang sangat baik berdasarkan Murphy &

Davidshofer (2005).

C. Pembahasan

Berdasarkan deskripsi hasil penelitian yang telah dipaparkan sebelumnya,

peneliti akan membahas tentang karakteristik psikometri subtes ZR pada IST

dengan berlandaskan pada teori-teori yang telah dijelaskan pada bagian tinjauan

pustaka. Karakteristik psikometri yang dibahas adalah indeks kesukaran aitem,

indeks daya diskriminasi aitem, reliabilitas dan validitas dengan bukti konkuren.

Berdasarkan hasil analisis indeks kesukaran aitem pada subtes ZR, diketahui

bahwa nilai indeks kesukaran aitem (p) subtes ZR bervariasi. Namun variasi dari

nilai p dalam penelitian ini tidak tersusun sesuai dengan urutan penyajian aitem.


58

Hal ini belum sesuai dengan pernyataan Murphy & Davidshofer (2005) bahwa

aitem-aitem dalam suatu tes disusun dari aitem yang paling mudah hingga aitem

yang paling sulit. Dalam penelitian ini, ketidaksesuaian ini ditunjukkan dengan

adanya satu aitem yaitu aitem 102 yang termasuk ke dalam aitem dengan tingkat

kesukaran yang mudah namun tersusun berada di antara aitem dengan tingkat

kesukaran yang sedang. Hal serupa juga ditemukan oleh peneliti dalam penelitian

yang dilakukan oleh Princen & Rahmawati (2011). Namun, pada penelitian ini,

ada dua aitem yang belum tersusun dengan tepat, yaitu aitem 102 (sama dengan

yang ditemukan oleh peneliti) dan aitem 110 (aitem sulit namun berada diantara

aitem sedang). Perbedaan hasil ini dapat disebabkan oleh penggunaan sampel

yang lebih sempit dalam penelitian ini yang terbatas pada usia 17-20 tahun dan

tingkat pendidikan perguruan tinggi.

Berdasarkan hasil analisis indeks kesukaran aitem, diketahui bahwa aitem 110

sampai dengan aitem 116 berada pada kategori sulit. Berdasarkan kajian peneliti,

peneliti menemukan bahwa lebih dari 50% total jumlah peserta yang tidak

menjawab ketujuh aitem tersebut. Banyaknya jumlah peserta inilah yang membuat

ketujuh aitem terdeteksi sulit. Kondisi banyaknya peserta yang tidak menjawab

aitem dapat disebabkan oleh ketersediaan waktu yang tidak cukup untuk dapat

menyelesaikan seluruh aitem subtes ZR. Dikatakan demikian karena subtes ZR

tergolong ke dalam speed test.

Berdasarkan hasil analisis indeks kesukaran aitem, peneliti juga menemukan

bahwa ada beberapa aitem yang mendekati angka 0 maupun angka 1. Hal ini

ditemukan pada aitem 97 dan 98 dengan nilai p sebesar 0.934 dan aitem 116

dengan nilai p sebesar 0.096. Dengan nilai p tersebut, maka dapat dikatakan


59

bahwa aitem 97 dan 98 tergolong ke dalam aitem yang sangat mudah dan aitem

116 tergolong ke dalam aitem yang sangat sulit. Dalam Azwar (2012) dinyatakan

bahwa aitem yang terlalu mudah maupun terlalu sulit mempunyai daya

diskriminasi yang kurang baik. Berdasarkan hasil analisis indeks daya

diskriminasi aitem, peneliti menemukan bahwa nilai d pada aitem 97 sebesar

0.385 dan aitem 98 sebesar 0.308. Pada aitem 116, nilai d yang diperoleh sebesar

0.314. Nilai d yang diperoleh ketiga aitem ini dapat dikategorikan ke dalam aitem

yang lumayan bagus tapi mungkin masih perlu peningkatan. Dengan demikian,

dapat dikatakan bahwa meskipun suatu aitem yang terlalu sulit maupun yang

terlalu mudah memiliki kecenderungan untuk tidak mampu mendiskriminasi

kelompok dengan kemampuan rendah dan tinggi, namun hal ini tidak selalu

terjadi demikian.

Berdasarkan hasil analisis indeks daya diskriminasi aitem, peneliti

menemukan bahwa 15 dari 20 aitem dinilai bagus sekali dan 5 aitem lainnya

dinilai lumayan bagus. Dalam penelitian ini, aitem yang dinilai bagus sekali (d

diatas 0.4) yang dikatakan baik. Dengan demikian, aitem dalam subtes ZR

memiliki daya diskriminasi yang cukup baik namun jika ingin digunakan perlu

untuk dipertimbangkan. Jika dibandingkan pada penelitian Princen & Rahmawati

(2011) yang melakukan analisis dengan cara yang sama seperti peneliti,

ditemukan bahwa 19 dari 20 aitem dinilai bagus sekali dan 1 aitem lainnya dinilai

lumayan bagus. Perbedaan ini dapat disebabkan karena sampel yang digunakan

dalam penelitian ini sempit.

Namun, jika ditelusuri lebih lanjut dan dikaitkan dengan indeks kesukaran

aitem, dari 20 aitem hanya 6 aitemlah yang memiliki daya diskriminasi aitem


60

yang baik. Hal ini dinyatakan oleh Azwar (2012) bahwa aitem yang memiliki

daya diskriminasi yang baik memiliki nilai p yang berkisar dari 0.4 sampai 0.6.

Keenam aitem yang dimaksud adalah aitem 101, 103, 105, 106, 107, dan 108. Jika

dilihat dari hasil analisis indeks daya diskriminasi aitem, nilai d yang diperoleh

aitem 103, 105, 106, 107, dan 108 berada dalam kategori aitem yang bagus sekali

sedangkan nilai d yang diperoleh aitem 101 berada dalam kategori aitem yang

lumayan bagus tapi mungkin masih perlu peningkatan. Dengan demikian, dapat

dikatakan bahwa aitem dengan nilai p dari 0.4 sampai 0.6 mampu

menggambarkan aitem dengan daya diskriminasi yang baik, namun hal ini juga

tidak selalu terjadi demikian.

Banyaknya aitem subtes ZR yang memiliki daya diskriminasi aitem yang

kurang baik mengindikasikan bahwa aitem tidak mampu membedakan kelompok

dengan kemampuan tinggi dan rendah. Ketidakmampuan ini dapat disebabkan

karena aitem dalam subtes ZR telah bocor dan tersebar di internet. Hal ini

menyebabkan aitem menjadi familiar dan mudah ditemukan sehingga

memberikan kesempatan bagi peserta tes untuk belajar menentukan jawaban yang

tepat agar mendapatkan hasil tes yang baik. Dengan demikian, kemampuan yang

terukur dari setiap peserta tes cenderung sama sehingga fungsi aitem untuk

membedakan kelompok dengan kemampuan tinggi dan rendah menjadi

terganggu.

Selain karena kebocoran tes, indeks daya diskriminasi aitem subtes ZR yang

kurang baik bisa disebabkan oleh pengalaman peserta tes yang sudah pernah

mendapatkan subtes ZR sebelumnya. Pengalaman ini menyebabkan adanya proses

belajar ketika peserta tes mendapatkan tes yang sama dengan tes yang sebelumnya


61

pernah diikuti. Proses belajar terjadi ketika peserta tes telah mengetahui respon

yang seharusnya diberikan bahkan berusaha untuk memberikan respon yang lebih

baik lagi dari respon yang pernah diberikan sebelumnya. Oleh karena itu,

sesuailah pernyataan yang disebutkan oleh Gregory (2013) bahwa pengalaman

peserta tes yang pernah mengikuti tes sebelumnya dapat mempengaruhi hasil dari

tes psikologi.

Berdasarkan hasil analisis indeks kesukaran aitem dan indeks daya

diskriminasi aitem, peneliti menemukan bahwa 20 aitem dalam subtes ZR masih

bisa digunakan. Namun, dari 20 aitem ada 5 aitem, yaitu aitem 97, 98, 101, 102,

dan 116 jika ingin digunakan sebaiknya dikaji kembali. Dikatakan demikian

karena kelima aitem memiliki kualitas psikometri yang tidak baik. Namun jika

dibandingkan pada penelitian Princen & Rahmawati (2011) yang menggunakan

analisis yang sama dengan peneliti, ada 1 dari 20 aitem yaitu aitem 98 yang jika

ingin digunakan perlu untuk ditinjau kembali. Jika dibandingkan dengan hasil

penelitian Rahmawati (2014) dengan pendekatan IRT, ada 11 aitem yang dapat

digunakan namun diperlukan kajian lebih lanjut, yaitu aitem 97, 100, 104, 107,

109, 110, 111, 112, 114, 115, dan 116. Perbedaan hasil yang ditemukan oleh

peneliti dengan peneliti sebelumnya dapat disebabkan oleh perbedaan keluasan

data yang digunakan dalam penelitian. Seperti yang telah dikatakan sebelumnya,

rentang usia sampel yang digunakan dalam penelitian ini sempit (hanya usia 17-

20 tahun dan tingkat pendidikan perguruan tinggi).

Adanya aitem subtes ZR yang kualitas psikometrinya tidak baik akan

mempengaruhi reliabilitas dan validitas dari subtes ZR. Hal ini dibuktikan dengan

ditemukannya koefisien reliabilitas subtes ZR sebesar 0.842. Dari koefisien


62

reliabilitas yang diperoleh tersebut menunjukkan bahwa variasi skor tampak

subjek pada subtes ZR mampu menggambarkan 84% variasi yang terjadi pada

skor murni sampel dengan rentang usia 17-20 tahun. Dapat dikatakan juga bahwa

terdapat 16% variasi skor tampak yang disebabkan oleh error. Dari koefisien

reliabilitas yang diperoleh subtes ZR sebesar 0.842 sudah dapat dikatakan tinggi

menurut Murphy & Davidshofer (2005). Namun, Coaley (2010) menyebutkan

bahwa koefisien reliabilitas yang baik untuk tes inteligensi berada di atas 0.9.

Dengan demikian, koefisien reliabilitas yang diperoleh subtes ZR sebagai bagian

dari tes inteligensi dikatakan tidak reliabel karena koefisien reliabilitas yang

diperoleh berada dibawah 0.9.

Hasil yang diperoleh oleh peneliti juga ditemukan pada penelitian Princen &

Rahmawati (2011) yang memperoleh koefisien reliabilitas subtes ZR sebesar

0.882. Namun, perbedaan keluasan data dalam kedua penelitian ini perlu untuk

diperhatikan. Koefisien reliabilitas yang diperoleh dalam penelitian ini hanya

berlaku pada sampel dengan rentang usia 17-20 tahun. Hal ini didukung dengan

pernyataan dalam Azwar (2012) bahwa koefisien reliabilitas yang diperoleh dari

suatu kelompok tertentu kemungkinan tidak akan sama jika diberikan pada

kelompok yang lain dalam situasi yang berbeda.

Berdasarkan hasil analisis validitas subtes ZR, ditemukan bahwa hasil

korelasi Pearson Product-Moment (r) antara subtes ZR dengan TKD 6 sebesar

0.67. Coaley (2010) menyatakan bahwa koefisien validitas untuk validitas

konkuren dikatakan sangat baik jika koefisiennya berada di atas 0.55. Murphy &

Davidshofer (2005) juga menambahkan bahwa dalam uji validitas kriteria,

koefisien validitas yang diperoleh umumnya sekitar 0.3 dan 0.4, dan koefisien


63

tertinggi yang dapat dicapai sekitar 0.5 dan 0.6. Dengan demikian, tingginya

koefisien korelasi yang diperoleh dalam penelitian ini menunjukkan bahwa

validitas konkuren dari subtes ZR sangat baik dan kedua tes mengukur hal yang

sama. Selain itu juga dapat dikatakan bahwa subtes ZR valid digunakan untuk

mengukur tujuan pengukuran subtes ZR pada sampel dengan rentang usia 17-20

tahun dan tingkat pendidikan perguruan tinggi.

Selanjutnya, peneliti juga menyajikan hasil analisis TKD 6. Analisis ini

dilakukan untuk memberikan informasi tambahan tentang TKD 6 yang digunakan

sebagai kriteria eksternal dalam penelitian ini. Berdasarkan hasil analisis indeks

kesukaran aitem pada TKD 6, diketahui bahwa aitem dalam TKD 6 memiliki

tingkat kesulitan yang bervariasi. Namun, aitem dalam tes ini masih belum

tersusun sesuai dengan urutan penyajian mulai dari aitem yang mudah hingga

aitem yang sulit. Hal ini dapat ditemukan pada aitem 7 dan 8 yang termasuk ke

dalam kategori sedang dan aitem 9 yang termasuk ke dalam kategori sulit namun

tersusun berada diantara aitem yang mudah. Selain itu, dapat ditemukan pada

aitem 22 yang termasuk ke dalam aitem kategori sedang namun tersusun berada di

antara aitem yang sulit.

Berdasarkan hasil analisis indeks kesukaran aitem, peneliti juga menemukan

bahwa ada beberapa aitem yang mendekati angka 1 maupun angka 0. Aitem yang

nilai p nya mendekati angka 1 adalah aitem 1 ,2, dan 6 dengan nilai p sebesar

0.934, 0.928, dan 0.916. Aitem yang nilai p nya mendekati angka 0 adalah aitem

28, dan 29 dengan nilai p sebesar 0.024 dan 0.012. Jika dilihat pada indeks

diskriminasi aitem pada TKD 6, ditemukan bahwa aitem 1 tergolong kedalam

aitem yang belum memuaskan, aitem 2 dan 6 tergolong ke dalam aitem yang


64

lumayan bagus tapi mungkin masih perlu peningkatan, aitem 28 tergolong ke

dalam aitem yang belum memuaskan dan aitem 29 tergolong ke dalam aitem yang

jelek. Seperti analisis yang dilakukan pada subtes ZR, dapat dikatakan bahwa

aitem yang terlalu sulit maupun yang terlalu mudah dalam suatu tes memiliki

kecenderungan tidak mampu mendiskriminasi kelompok dengan kemampuan

rendah dan tinggi meskipun hal ini tidak selalu terjadi demikian.

Selain aitem yang mendekati nilai 0 maupun 1, peneliti juga menemukan

aitem yang memiliki nilai p sama dengan 0 yaitu aitem 9 dan 30. Pada aitem

dengan nilai p sama dengan 0 (aitem 9 dan 30) diperoleh bahwa nilai d nya

sebesar -9.000 dan aitemnya termasuk ke dalam aitem yang jelek. Berdasarkan

kajian yang dilakukan peneliti pada aitem dengan nilai p sama dengan 0 dan d

sama dengan -9.000, peneliti melihat pada aitem 30 bahwa banyak peserta yang

tidak menjawab aitem ini. Hal ini dapat disebabkan oleh ketersediaan waktu yang

tidak cukup, seperti yang terjadi pada subtes ZR. Berbeda halnya dengan aitem 9.

Aitem ini sebagian besar dijawab oleh peserta namun jawaban yang diberikan

salah. Respon yang diberikan oleh subjek pada aitem ini juga sebagian besar

sama. Dengan ini, peneliti melihat jika aitem ini penting untuk dikaji lebih lanjut.

Berdasarkan hasil indeks daya diskriminasi aitem TKD 6, diketahui bahwa

ada 23 aitem yang masih dapat digunakan sedangkan 7 aitem lainnya jika ingin

digunakan memerlukan pertimbangan-pertimbangan tertentu dan sebaiknya

ketujuh aitem ini dikaji kembali. Berdasarkan hasil analisis reliabilitas TKD 6

ditemukan bahwa koefisien reliabilitas TKD 6 sebesar 0.883. Dari koefisien

reliabilitas yang diperoleh tersebut menunjukkan bahwa variasi skor tampak

subjek pada TKD 6 mampu menggambarkan 88% variasi yang terjadi pada skor


65

murni subjek tersebut. Dapat dikatakan juga bahwa terdapat 12% variasi skor

tampak yang disebabkan oleh error. Meskipun koefisien reliabilitas yang

diperoleh sebesar 0.883, TKD 6 sebagai tes inteligensi dikatakan tidak reliabel

karena koefisien reliabilitas yang diperoleh dalam penelitian ini belum mencapai

koefisien reliabilitas yang baik untuk tes inteligensi. Dalam Coaley (2010)

disebutkan bahwa koefisien reliabilitas yang baik untuk tes inteligensi berada di

atas 0.9.

Berdasarkan analisis karakteristik psikometri yang telah dilakukan kepada

subtes ZR, maka dapat disimpulkan bahwa aitem dalam subtes ZR jika

dipergunakan perlu untuk dipertimbangkan karena ada beberapa aitem yang

kualitas psikometrinya tidak baik. Subtes ZR merupakan subtes yang valid dalam

mengukur tujuan pengukurannya namun tidak reliabel sesuai dengan fungsinya

sebagai tes inteligensi bahkan jika digunakan untuk penyeleksian. Karena

penelitian ini dilakukan pada sampel yang terbatas dan tidak mencakup seluruh

rentang usia populasi maka hasil penelitian ini tidak dapat digeneralisasikan

secara luas dan terbatas hanya pada individu dengan rentang usia 17-20 tahun dan

tingkat pendidikan perguruan tinggi.


66

BAB V

KESIMPULAN DAN SARAN

A. Kesimpulan

Berdasarkan hasil penelitian tentang karakteristik psikometri subtes ZR pada

IST, maka dapat ditarik kesimpulan sebagai berikut :

1. Subtes ZR memiliki aitem dengan indeks kesukaran yang bervariasi sesuai

dengan fungsinya sebagai tes inteligensi. Urutan penyajian aitem dalam subtes

ini masih belum tepat. Selain itu, beberapa aitem dalam subtes ZR memiliki

karakteristik psikometri yang tidak baik untuk mendiskriminasikan kelompok

yang memiliki kemampuan yang diukur subtes ZR dengan yang tidak memiliki

pada individu dengan rentang usia 17-20 tahun dan tingkat pendidikan

perguruan tinggi.

2. Subtes ZR merupakan subtes yang masih valid namun tidak reliabel sesuai

dengan fungsinya sebagai tes inteligensi pada individu dengan rentang usia 17-

20 tahun dan tingkat pendidikan perguruan tinggi.

B. Saran

1. Saran Praktis

Bagi para akademisi dan praktisi diharapkan dapat mempertimbangkan

menggunakan subtes ZR yang merupakan bagian dari IST sebagai tes inteligensi

terutama jika digunakan untuk proses seleksi.

2. Saran Metodologis

a. Penelitian ini memiliki keterbatasan karena hanya dilakukan pada rentang usia

yang sempit. Peneliti selanjutnya disarankan untuk menggunakan sampel yang


67

lebih luas dan lebih representatif yaitu sampel dengan rentang usia 12-60

tahun.

b. Peneliti selanjutnya disarankan untuk memilih kriteria dengan

mempertimbangkan karakteristik psikometri yang dimiliki oleh kriteria

tersebut seperti reliabilitas dan relevansi kriteria terhadap ZR.

c. Peneliti selanjutnya disarankan untuk menggunakan tes lain yang mengukur

kemampuan yang berbeda dengan subtes ZR dalam uji validitas dengan bukti

konkuren. Dilakukan demikian untuk melengkapi kajian psikometri subtes ZR

pada IST.

d. Aitem dalam subtes ZR disusun berdasarkan urutan penyajian aitem yang

seharusnya sesuai dengan fungsinya sebagai tes inteligensi, yaitu dari aitem

yang mudah hingga aitem yang sulit.


68

DAFTAR PUSTAKA

Anastasi, A. & Urbina, S. (1997). Psychological testing (7th edition). USA:

Prentice Hall.

Azwar, S. (2012). Penyusunan Skala Psikologi. Yogyakarta: Pustaka Pelajar.

----------- . (2012). Reliabilitas & Validitas. (Edisi IV). Yogyakarta: Pustaka Pelajar

----------- . (2012). Tes Prestasi: Fungsi dan Pengembangan Pengukuran Prestasi

Belajar (Edisi II). Yogyakarta: Pustaka Pelajar.

Coaley, K. (2010). An Introduction to Psychological Assessment and Psychometrics. London: Sage Publication Ltd.

Crocker, L. & Algina,J. (2008). Introduction to Classical and Modern Test

Theory. USA: Cengage Learning.

Elvira, R. & Rahmawati, E. (2011). Karakteristik Psikometri Subtes

Santzerganzung (SE) Pada Intelligenz Struktur Test (IST). Skripsi. Medan:


Gregory, J.R. (2004). Psychological Testing: History, Principles, and Aplications

(4th

Ed). USA: Pearson Education Group,Inc.

Gregory, Robert J. (2013). Tes Psikologi: Sejarah, Prinsip, Dan Aplikasi (Edisi

Keenam Jilid I). Jakarta: Erlangga

Kaplan, R. M. & Saccuzzo D. P. (2009). Psychological Testing: Principles,

Applications, and Issues (7th

Edition). USA: Wadsworth, Cengage Learning.

Lahey, Benjamin. (2012). Psychology:An Introduction. New York: McGraw Hill

Lalaba, Djunaidi. (2008). Analisis Butir Soal Dengan Teori Tes Klasik: Sebuah

Pengantar. Manado: STAIN

LPSP3 UI. (2011). Buku Petunjuk Tes Kemampuan Diferensial (TKD). Jakarta:

Fakultas Psikologi Universitas Indonesia.

------------ . (2012). IST (Intelligenz Struktur Test): Manual Dan Norma. Jakarta:

Fakultas Psikologi Universitas Indonesia.

Murphy, K. R.& Davidshofer, C. O. (2005). Psychological Testing, Principles

And Applications (6th

edition). New Jersey: Pearson Education,Inc.

Nunnally, Jum C. & Bernstein, Ira H. (1994). Psychometric Theory (3rd

edition).

New York: McGraw Hill

Osterlind. S. J. (2010). Modern Measurement; Theory, Pricinple, and

Applications of Mental Appraisal (2nd

edition). USA: Pearson Education,Inc.


69

Pedhazur, Elazar. J., (1997). Multiple Regression In Behavioral Research:

Explanation And Prediction (3rd

edition). USA: Thomson Learning, Inc.

Polhaupessy, L. F. (2009). Diktat Kuliah IST Universitas Padjajaran.

Princen & Rahmawati. (2011). Karakteristik Psikometri Subtes ZAHLENREIHEN

(ZR) Pada Intelligenz Structure Test (IST). Skripsi: Fakultas Psikologi


Rahmawati, Etti. (2014). Evaluasi Karakteristik Psikometris Intelligenz Struktur

Test (IST). Seminar Nasional Psikometri. Fakultas Psikologi Universitas

Muhammadiyah Surakarta.

Sari, K. F., & Rahmawati, E. (2011). Karakteristik Psikometri Subtes

Rechenaufgaben (RA) pada Intelligenz Struktur Test (IST). Skripsi Fakultas

Psikologi Universitas Sumatera Utara.

Sirait, D., & Garliah, L. (2011). Karakteristik Psikometri Subtes Wortauswahl

(WA) pada Intelligenz Struktur Test (IST). Skripsi Fakultas Psikologi


Siregar, F.S., & Rahmawati, E. (2011). Karakteristik Psikometri Subtes Analogien

(AN) pada Intelligenz Struktur Test (IST). Skripsi Fakultas Psikologi


Sugiyono. (2012). Statistika untuk Penelitian. Bandung:Alfabeta

Tiarsarani. (2008). Uji Psikometri Pada Intelligenz-Struktur-Test (IST) Subtes

Zahlen Reihen (ZR). Skripsi. Jakarta: Unika Atmajaya.

Urbina, Susana. (2004). Essential of Psychological Testing. Canada : John Wiley

& Sons, Inc., Hoboken, New Jersey


LAMPIRAN


LAMPIRAN 1

Analisis Korelasi

Subtes ZR Dan TKD 6


70

OUTPUT ANALISIS KORELASI SUBTES ZR DAN TKD 6

Correlations

ZR TKD6

ZR Pearson Correlation 1 .670**

Sig. (2-tailed) .000

N 167 167

TKD6 Pearson Correlation .670**

1

Sig. (2-tailed) .000

N 167 167

**. Correlation is significant at the 0.01 level (2-tailed).


LAMPIRAN 2

Analisis Reliabilitas Subtes ZR


71

HASIL ANALISIS RELIABILITAS SUBTES ZR

DENGAN FORMULA KR-20

Analisis Aitem

97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116

S001 1 1 1 1 0 1 1 0 0 1 1 0 1 1 0 0 0 0 0 0

S002 1 1 1 1 0 1 0 0 0 1 0 0 0 0 0 0 0 0 0 0

----

----

S167 1 1 1 1 0 0 1 0 1 0 0 0 0 0 0 0 0 0 0 0

Sum 156 156 152 145 100 137 90 64 78 115 98 82 64 41 35 24 30 24 14 16

P 0.93

413

2

0.93

413

2

0.91

018

0.86

826

3

0.59

880

2

0.82

0359

0.53

8922

0.38

3234

0,46

7066

0.68

8623

0.58

6826

0.49

1018

0.38

3234

0.24

5509

0.20

9581

0.14

3713

0.17

9641

0.14

3713

0.08

3832

0.09

580

8

Q 0.06

586

8

0.06

586

8

0.08

982

0.13

173

7

0.40

119

8

0.17

9641

0.46

1078

0.61

6766

0,53

2934

0.31

1377

0.41

3174

0.50

8982

0.61

6766

0.75

4491

0.79

0419

0.85

6287

0.82

0359

0.85

6287

0.91

6168

0.90

419

2

PQ 0.06

153

0.06

153

0.08

175

3

0.11

438

2

0.24

023

8

0.14

737

0.24

8485

0.23

6366

0,24

8915

0.21

4421

0.24

2461

0.24

9919

0.23

6366

0.18

5234

0.16

5657

0.12

3059

0.14

737

0.12

3059

0.07

6804

0.08

662

9

k 20

sigma pq 3.291549

var 16.47079

mean 9.706587

p(KR-20) 0.842272


LAMPIRAN 3

Analisis Reliabilitas TKD 6


72

HASIL ANALISIS RELIABILITAS TKD 6 DENGAN FORMULA KR-20

Analisis Aitem

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

S001 1 1 1 0 1 1 1 1 0 1 1 1 1 0 1 1 1 0 0 0

S002 1 1 1 1 1 1 0 0 0 1 1 0 0 1 1 0 0 0 0 0

---

---

S167 1 1 0 1 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0

Sum 156

155 139 149 126 153 86 85 0 141 131 144 126 112 115 78 96 66 56 45

P 0,93

4

0,92

8

0,83

2

0,89

2

0,75

4

0,91

6168

0,51

497

0,50

8982 0

0,84

4311

0,78

4431

0,86

2275

0,75

4491

0,67

0659

0,68

8623

0,46

7066

0,57

485

0,39

521

0,33

5329

0,26

946

1

Q 0,06

5

0,07

1

0,16

7

0,10

7

0,24

550

9

0,08

3832

0,48

503

0,49

1018 1

0,15

5689

0,21

5569

0,13

7725

0,24

5509

0,32

9341

0,31

1377

0,53

2934

0,42

515

0,60

479

0,66

4671

0,73

053

9

PQ 0,06

1

0,06

6

0,13

9

0,09

6

0,18

523

4

0,07

6804

0,24

9776

0,24

9919 0

0,13

145

0,16

9099

0,11

8756

0,18

5234

0,22

0876

0,21

4421

0,24

8915

0,24

4397

0,23

9019

0,22

2884

0,19

685

2


73

(Lanjutan) HASIL ANALISIS RELIABILITAS TKD 6 DENGAN FORMULA KR-20

Analisis Aitem

21 22 23 24 25 26 27 28 29 30

S001 0 0 0 0 0 0 0 0 0 0

S002 0 0 0 1 1 0 0 0 0 0

---

---

S167 0 0 0 0 0 0 0 0 0 0

Sum 41 56 25 50 31 25 8 4 2 0

P 0,24

550

9

0,33

532

9

0,14

970

1

0,29

940

1

0,18

562

9

0,14

9701

0,04

7904

0,02

3952

0,01

1976 0

Q 0,75

449

1

0,66

467

1

0,85

029

9

0,70

059

9

0,81

437

1

0,85

0299

0,95

2096

0,97

6048

0,98

8024 1

PQ 0,18

523

4

0,22

288

4

0,12

729

0,20

976

0,15

117

1

0,12

729

0,04

5609

0,02

3378

0,01

1833 0

k 20

sigma pq 3.291549

var 16.47079

mean 9.706587

p(KR-20) 0.842272


analisis karakteristik psikometri subtes zahlen

Documents