validitas dan reliabilitas

VALIDITAS DAN RELIABILITASTujuan utama dari proses penelitian ialah bagaimana peneliti dapat memperoleh kesimpulan dengan dilandasi dan didukung oleh fakta-fakta yang representatif. Untuk dapat memperoleh fakta-fakta yang representatif, diperlukan data dan informasi yang objektif. Tingkat keobjektifan data hasil penelitian tergantung pada seberapa jauh kemampuan instrumen yang digunakan untuk mengumpulkan data. Tinggi rendahnya kemampuan instrumen pengumpul data, tergantung pada tinggi rendahnya tingkat validitas dan reliabilitas instrumen yang digunakan. Oleh karena itu sebelum peneliti terjun ke lapangan untuk mengumpulkan data, dia harus melakukan pembahasan untuk mempertimbangkan mengenai validitas dan reliabilitas instrumen yang akan digunakan dalam proses penelitian.

A. Validitas Instrumen Validitas instrumen adalah kemampuan instrumen untuk mengukur dan menggambarkan keadaan suatu aspek sesuai dengan maksudnya untuk apa instrumen tersebut dibuat, sebagaimana dinyatakan oleh Gay (1983:110) sebagai berikut: the most simplistic definition of validity is that it is the degree to which a test measured what it is supposed to measured. Kerlinger (200:685) juga memberikan rumusan sangat umum mengenai validity, yaitu dengan mengajukan suatu pertanyaan, apakah instrumen yang kita buat mampu mengukur apa yang kita maksudkan, sebagaimana dinyatakan.. does the instrumen measure what it is supposed to measure. Persoalan validitas instrumen berhubungan dengan pertanyaan, apakah suatu instrumen yang dibuat mampu menggambarkan ciri-ciri, sifat-sifat. atau aspek apa saja yang akan diukur, sesuai dengan keadaan yang sebenarnya. Validitas juga dapat dimaknai sebagai ketepatan dalam memberikan interpretasi terhadap hasil pengukurannya. Terdapat dua makna yang terkandung di dalam konsep validitas, yaitu relevans dan accuracy. Relevansi menunjuk pada kemampuan instrumen untuk memerankan fungsi untuk apa instrumen tersebut dimaksudkan (what it is

intended to measure). Accuracy menunjuk ketepatan instrumen untuk mengidentifikasi aspek-aspek yang diukur secara tepat, yang berarti dapat menggambarkan keadaan yang sebenarnya. Dalam memaknai konsep validitas, kita tidak boleh menyatakan bahwa suatu instrumen yang sudah dinyatakan valid, juga akan valid untuk maksud atau tujuan yang lain, serta berlaku untuk kondisi yang berbeda. Pengembalian keputusan mengenai valid tidaknya suatu instrumen tergantung pada tiga hal, yaitu: 1. Valid untuk apa, 2. Valid untuk siapa, dan 3. Valid dalam konteks yang bagaimana. Suatu instrumen mungkin saja valid untuk tujuan tertentu, akan tetapi belum tentu valid untuk suatu tujuan lain. Suatu instrumen dapat saja valid untuk suatu kelompok responden tertentu, akan tetapi belum tentu valid untuk kelompok responden yang lain. Suatu instrumen mungkin saja valid untuk suatu kelompok responden dengan latar belakang budaya tertentu, akan tetapi belum tentu valid untuk kelompok responden yang lain dengan latar belakang budaya yang lain pula. Jadi suatu instrumen yang dirancang untuk suatu tujuan tertentu, keputusan mengenai validitasnya, hanya dapat dievaluasi atau dipertimbangkan bagi tujuan tersebut.

Macam-Macam Validitas Instrumen Pada umumnya para ahli pengukuran, khususnya pengukuran dalam bidang psikologi dan pendidikan, menggolongkan validitas menjadi beberapa tipe, yaitu:. 1. Validitas konstruk (construct validity), 2. Validitas isi (content validity), dan 3. Validitas kriterion (kriterion-related validity). (Kerlinger, 2000:686; Babble, 2004:144-145). Untuk validitas konstruk dan validitas isi, kriteria yang digunakan dalam pengambilan keputusan, dilakukan dengan menggunakan

pertimbangan-pertimbangan logis, konseptual, dan menggunakan dasar-dasar

penalaran tertentu, tanpa harus melakukan uji empiris atau uji lapangan. Sebaliknya, pada validitas kriterion, proses validasinya dilakukan melalui pengujian empiris atau uji lapangan, yaitu dengan jalan mengkorelasikan hasil pengukuran dari instrumen yang kits susun dengan suatu kriterium yang dipandang valid. Bila peneliti memilih tipe validitas korelasional, maka pengambilan keputusan untuk menyatakan apakah instrumen tersebut valid atau tidak, dilakukan dengan menghitung korelasi dengan menggunakan taraf siginifikansi 0,05. Ada dua tipe dari validitas korelasional ini, yaitu validitas konkuren (concurrent validity), dan validitas prediktif (predictive validity). a. Validitas konstruk Validitas konstruk berhubungan dengan pertanyaan: seberapa jauh instrumen yang kita susun mampu menghasilkan butir-butir pertanyaan yang telah dilandasi oleh konsep teoritik tertentu. Validitas konstruk disusun dengan mendasarkan diri pada pertimbangan-pertimbangan rasional dan konseptual yang didukung oleh teori yang sudah mapan. Proses menentukan validitas bukan merupakan pekerjaan yang mudah. Untuk dapat menyusun validitas konstruk, peneliti harus menguasai secara mendalam teori-teori yang relevan, ditambah dengan pengalaman menyusun instrumen, konsultasi dengan ahli di bidangnya, dan diskusi dengan teman sejawat (peers). Oleh karena itu untuk memantapkan validitas konstruk ini, peneliti dianjurkan untuk memperoleh masukan berupa penilaian, pertimbangan dan kritik-kritik dari pars ahli dalam bidang yang terkait. Prosedur seperti itu dikenal dengan apa yang disebut dengan expert judgment. Langkah-langkah yang ditempuh untuk memperoleh suatu

konstruk yang diharapkan, biasanya melalui prosedur sebagai berikut: 1) melakukan analisis logik, dan 2) melakukan analisis hubungan dan atau perbedaan dengan konstruk lain. Analisis logic dilakukan dengan langkah-langkah sebagai berikut: 1) Peneliti membuat definisi operasional mengenai konstruk atau konsep yang dimaksud dengan berlandaskan diri pada teori-teori yang relevan;

2) Peneliti melakukan justifikasi mengenai suatu konstruk yang diperkirakan dapat memberikan gambaran secara jelas mengenai suatu konstruk atau konsep yang dimaksud. Dalam hal ini penyusun instrumen dapat menganut salah satu teori atau melakukan suatu sintesa, atau memodifikasi teori yang ada yang dianggap relevan. 3) Operasionalisasikan konstruk yang secara konseptual telah mantap ke dalam indikator-indikator, bahkan sampai ke dalam sub indikator (prediktoi), sehingga perilaku atau gejalanya dapat diukur dan diamati. 4) Lakukan check-recheck untuk meyakinkan bahwa apa yang telah dirumuskan tersebut benar-benar telah menggambarkan konstruk yang dimaksud. Analisis hubungan dan atau analisis perbedaan dilakukan pertimbangan-pertimbangan sebagai berikut: 1) Kumpulkan konstruk atau konsep-konsep lain yang sama atau serupa dengan konsep yang kita maksudkan. Di samping mengumpulkan konsep-konsep yang sama, juga kumpulkan konsep-konsep lain yang berbeda. Mencari konsep-konsep yang sama atau berbeda tersebut dimaksudkan agar diperoleh keyakinan yang kuat dan mendalam bahwa konsep atau konstruk yang dimaksudkan secara teoritik dan logik benar. 2) Suatu konstruk yang semula telah dianggap benar, akan tetapi apabila dikemudian hari diperoleh informasi baru, baik informasi baru tersebut berasal dari teori dan atau yang berasal dari sejawat atau ahli yang relevan, peneliti harus siap melakukan modifikasi secukupnya-, 3) Kumpulkan bukti-bukti dari sumber lain yang dipandang dapat mendukung konstruk yang dimaksud, misalnya hasil pengukuran dengan instumen yang sejenis mengenai objek, gejala, atau perilaku yang serupa, merupakan sumber yang sangat berharga untuk dipertimbangkan.

b. Validitas Isi Validitas isi berhubungan dengan kemampuan instrumen untuk menggambarkan atau melukiskan secara tepat mengenai domain perilaku yang akan diukur. Misalnya instrumen yang dibuat untuk mengukur kinerja karyawan, maka instrumen tersebut harus dapat melukiskan secara benar mengenai kinerja karyawan sebagaimana diuraikan dalam deskripsi tugas-tugas karyawan. Contoh lain lagi misalnya instrumen yang disiapkan untuk mengukur prestasi belajar siswa, maka instrumen tersebut harus dapat melukiskan dengan benar prestasi belajar siswa sesuai dengan standar prestasi sesuai dengan materi pelajaran yang harus dikuasai oleh siswa. Kalau pada instrumen kinerja peneliti melakukan analisis kinerja sebagaimana yang ditetapkan dalam deskripsi tugas (job description), maka pada instrumen untuk mengukur prestasi belajar, peneliti harus melakukan analisis materi pelajaran, mulai dari pembagian bab per bab, sampai pada uraian setiap pokok bahasan. Ada dua hal penting yang harus diperhatikan dalam memaknai validitas isi, yaitu: 1) Menyangkut validitas butir, dan 2) Menyangkut validitas sampling. Validitas butir berhubungan dengan pertanyaan: seberapa jauh butir-butir instrumen dapat mencerminkan keseluruhan isi dari aspek atau domain yang hendak diukur. Validitas sampling dihadapkan pada pertanyaan: seberapa jauh butir-butir instrumen tersebut merupakan sampel yang representatif dari keseluruhan aspek atau bahan atau domain yang diukur. Dengan memaknai komponen-komponen tersebut (butir dan sampling), penyusun instrumen sebelum menyajikan butir-butir

pertanyaan, terlebih dahulu ia harus menyusun daftar yang memuat keseluruhan isi dari materi atau domain yang dimaksud. Keseluruhan domain tersebut dijabarkan ke dalam aspek-aspek yang yang lebih terperinci. kemudian dideskripsikan indikator-indikatornya, sampai ke sub-sub indikator, sehingga gejalanya dapat diukur dan diamati. Selan-

jutnya untuk lebih meyakinkan diri tentang semua yang telah dilakukan tersebut, penyusun instrumen dapat meminta pertimbangan dari kolegia atau ahli yang kompeten melalui forum diskusi antar ahli. Pertimbanganpertimbangan itu berupa saran, masukan, kritik, dan evaluasi, yang dimaksudkan memperbaiki dan menyempurnakan instrumen yang kita susun. c. Validitas Kriterion Validitas kriterion yang dimaksud di sini ialah validitas instrumen yang diperoleh dengan membandingkan instrumen yang kita susun/buat dengan suatu kriterium eksternal. Kriterion eksternal yang dimaksud di sini adalah berupa hasil pengukuran yang menurut pertimbangan rasional dapat dipertanggungjawabkan. Ada dua kriteria yang sering digunakan oleh para ahli, yaitu: 1) Kriterion konkaren (concurrent criterion), dan 2) Kriterion prediktif (predictive criterion). Apabila peneliti menggunakan kriterion konkaren, peneliti harus mencari hasil-hasil pengukuran lain yang pernah dilakukan orang, mengenai domain yang sama dengan domain yang sedang kita siapkan instrumennya,yang dipandang atau diakui sudah valid. Sebagai contoh misalnya peneliti ingin menyusun instrumen mengenai tes masuk suatu perguruan tinggi. Untuk keperluan ini peneliti mengkomparasikan hasil tes masuk perguruan tinggi dengan nilai rapor akhir kelas III SMU, melalui analisis statistik korelasi.

Uji Validitas Validitas menunjukkan sejauh mana skor/ nilai/ ukuran yang diperoleh benar-benar menyatakan hasil pengukuran/ pengamatan yang ingin diukur (Agung, 1990). Validitas pada umumnya dipermasalahkan berkaitan dengan hasil pengukuran psikologis atau non fisik. Berkaitan dengan karakteristik psikologis, hasil pengukuran yang diperoleh sebenarnya diharapkan dapat menggambarkan atau memberikan skor/ nilai suatu karakteristik lain yang menjadi perhatian utama. Macam validitas umumnya

digolongkan dalam tiga kategori besar, yaitu validitas isi (content validity), validitas berdasarkan kriteria (criterion-related validity) dan validitas konstruk. Pada penelitian ini akan dibahas hal menyangkut validitas untuk menguji apakah pertanyaanpertanyaan itu telah mengukur aspek yang sama. Untuk itu dipergunakanlah validitas konstruk. Uji validitas dilakukan dengan mengukur korelasi antara variabel/ item dengan skor total variabel. Cara mengukur validitas konstruk yaitu dengan mencari korelasi antara masingmasing pertanyaan dengan skor total menggunakan rumus teknik korelasi product moment, sebagai berikut :

dimana r : koefisien korelasi product moment X : skor tiap pertanyaan/ item Y : skor total N : jumlah responden Setelah semua korelasi untuk setiap pertanyaan dengan skor total diperoleh, nilai-nilai tersebut dibandingkan dengan nilai kritik. Selanjutnya, jika nilai koefisien korelasi product moment dari suatu pertanyaan tersebut berada diatas nilai tabel kritik, maka pertanyaan tersebut signifikan.

B. Reliabilitas Instrumen Reliabilits berasal dari kata Reliability yang mempunyai arti konsistensi,kestabilan, keterpercayaan dan sutrisno hadi mengartikan dengan keterandalan. Hasil pengukuran dapat dikatakan reliabel apabila dalam beberapa kali pengukuran padaobyek yang sama akan menghasilkan hasil yang relatif sama. (Azwar,2003) .Pengujian reliabilitas instrumen yang biasa digunakan dalam penelitian menggunakan pendekatan internal. Dalam pendekatan ini seolah-olah instrument dibelah menjadi beberapa bagian sehingga dapat dikorelasikan. Dalam SPSS Rumus digunakan adalah Alfa

Cronbach. Reliabilitas Alpha cronbach tepat apabila digunakan instrumen dengan skala interval atau rasio. Rumus alpha Cronbach adalah sebagai berikut: = k S2 j 1 2 k 1 S x

Keterangan : = koefisien reliabilitas alpha k = jumlah item S2j = varians responden untuk item I S2x = jumlah varians skor total Bila koefisien reliabilitas telah dihitung, maka untuk menentukan keeratan hubungan bisa digunakan kriteria Guilford (1956), yaitu : 1. kurang dari 0,20 : Hubungan yang sangat kecil dan bisa diabaikan 2. 0,20 - < 0,40 : Hubungan yang kecil (tidak erat) 3. 0,40 - < 0,70 : Hubungan yang cukup erat 4. 0,70 - < 0,90 : Hubungan yang erat (reliabel) 5. 0,90 - < 1,00 : Hubungan yang sangat erat (sangat reliabel) 6. 1,00 : Hubungan yang sempurna Untuk objek-objek penelitian yang sifatnya alamiah, persoalan mengenai reliabilitas ini tidak perlu menimbulkan banyak pertimbangan, oleh karena objek-objek alamiah relatif stabil dalam dimensi waktu dan kondisi yang berbeda. Lain hainya bila instrumen penelitian digunakan untuk mengukur gejala-gejala sosial dan perilaku. Objek-objek sosial dan perilaku selalu menunjukkan adanya variasi dalam dimensi waktu dan kondisi. Ambil saja sebagai contoh misainya kayu, batu, pasir, tanah, dan semacamnya, semuanya menunjukkan adanya sifat-sifat yang jauh lebih stabil

dibandingkan dengan aspek-aspek perilaku seperti sikap sikap sosial, aktivitas belajar, prestasi belajar, kinerja pegawai, intensitas berdiskusi, dan sebagainya. Semuanya akan sangat mudah berubah karena waktu dan kondisi pengukurannya berbeda. Hal tersebut menuntut perlunya masalah instrumen untuk mengukur gejala-gejala sosial dan perilaku, perlu disiapkan dengan saksama dan hati-hati sebelum instrumen tersebut digunakan, karena instrumen yang tidak stabil, dipastikan akan memperoleh hasil penelitian

yang tidak baik, dalam arti hasil penelitian yang tidak dapat menggambarkan keadaan gejala yang diukur seperti apa adanya.

Faktor-faktor yang Mempengaruhi Reliabilitas Instrumen Ada beberapa faktor yang mempengaruhi ketidakstabilan hasil penelitian, khususnya untuk gejala-gejala sosial dan perilaku. Bebarapa diantaranya ialah: a. Faktor instrumennya sendiri, b. Faktor gejala yang diukur dan diamati, dan c. Kondisi penyelenggaraan pengukuran. Instrumen yang digunakan untuk mengukur gejala-gejala sosial dan perilaku, selalu berupa pertanyaan yang menggunakan kalimat yang disusun oleh peneliti dalam bentuk kuesioner, interviu, observasi atau mungkin tes instrumen-instrumen yang menggunakan kalimat semacam itu pasti akan direspon secara berbeda oleh responden yang mengisi instrumen. Perbedaan responden dalam merespon kuesioner yang diberikan tersebut bukan karena objek responnya yang berbeda, akan tetapi bisa jadi karena cara memaknai atau menangkap makna yang terkandung dalam instrumen berbeda. Oleh karena itu saran yang selalu disampaikan kepada peneliti yang akan menyusun instrumen semacam itu ialah supaya pertanyaan-pertanyaan yang dibuat tidak memiliki sifat berwajuh arti atau bermakna ganda. Pendek kata pertanyaan-pertanyaan yang diajukan harus diinterpretasi atau dimaknai sama oleh responden yang berbeda. Faktor gejala atau perilaku yang diukur. Gejala-gejala sosial dan perilaku memiliki sifat mudah berubah, baik karena faktor internal maupun faktor eksternal. Sikap seseorang tidak menunjukkan keadaan stabil dalam dimensi waktu, tempat, dan kondisi/situasi. Jarang dijumpai adanya sikap yang relatif tetap/stabil dalam fluktuasi waktu. Sikap terhadap objek yang sama oleh subjek yang sama, belum tentu sama, bila waktu, tempat, dan situasi meresponnya berbeda. Kondisi penyelenggaraan pengukuran juga akan dapat mempengaruhi ketidakstabilan gejala. Suatu instrumen yang diselenggarakan pads kondisi

ramai, suasana hiruk pikuk, dan situasi temperatur tinggi, dipastikan akan memberikan hasil yang berbeda apabila instrumen tersebut diselenggarakan pada kondisi tenang, dan situasi yang sejuk. Demikian juga misalnya tes yang pelaksanaannya diawasi secara ketat, menakutkan, dipastikan akan

memberikan hasil yang berbeda dibandingkan dengan penyelenggaraan tes yang diawasi secara familier dan suasana yang menyenangkan. Dengan memperhatikan faktor-faktor yang mempengaruhi

ketidakstabilan hasil pengukuran terhadap gejala-gejala sosial dan perilaku tersebut, peneliti perlu mengusahakan dengan berbagai cara agar hasil pengukuran dapat menggambarkan keadaan yang sebenarnya. Usaha-usaha tersebut adalah: 1. Memperbanyak kasus atau objek yang diteliti; 2. Melakukan pengukuran atau pengamatan secara berulang-ulang; 3. Membandingkan pengamatan peneliti dengan pengamatan peneliti lain; 4. Menambah jumlah pengamat;

validitas dan reliabilitas

Documents