skala numerikal

15
Skala Numerikal Skala numerikal (numerical scale) mirip dengan skala diferensial semantik, dengan perbedaan dalam hal nomor pada skala 5 titik atau 7 titik disediakan, dengan kata sifat berkutub dua pada ujung keduanya. ini juga merupakan skala interval. Contoh : Seberapa puas Anda dengan agen real estat yang baru? Sangat Sangat Puas 7 6 5 4 3 2 1 Tidak Puas Skala Peringkat Terperinci Pada skala peringkat terperinci (itemized rating scale), skala 5 titik atau 7 titik dengan titik panduan atau jangkar (anchor), sesuai keperluan, disediakan untuk tiap item dan responden menyatakan nomor yang tepat di sebelah masing-masing item, atau melingkari nomor yang relevan untuk tiap item, seperti dalam contoh berikut ini. Respons terhadap item kemudian disajikan. Hal ini menggunakan skala interval. Contoh: Responslah tiap item menggunakan simla di ba.wah ini, kernudian isi dengan nomor yang menurut Anda sesuai di sebelahnya.

Upload: nadia-ayu-hemayantii

Post on 07-Aug-2015

251 views

Category:

Documents


12 download

DESCRIPTION

metodologi penelitian

TRANSCRIPT

Page 1: skala numerikal

Skala Numerikal

Skala numerikal (numerical scale) mirip dengan skala diferensial semantik, dengan perbedaan dalam hal nomor pada skala 5 titik atau 7 titik disediakan, dengan kata sifat berkutub dua pada ujung keduanya. ini juga merupakan skala interval.

Contoh :Seberapa puas Anda dengan agen real estat yang baru?

Sangat Sangat

Puas 7 6 5 4 3 2 1 Tidak Puas

Skala Peringkat Terperinci

Pada skala peringkat terperinci (itemized rating scale), skala 5 titik atau 7 titik dengan titik panduan atau jangkar (anchor), sesuai keperluan, disediakan untuk tiap item dan responden menyatakan nomor yang tepat di sebelah masing-masing item, atau melingkari nomor yang relevan untuk tiap item, seperti dalam contoh berikut ini. Respons terhadap item kemudian disajikan. Hal ini menggunakan skala interval.

Contoh:

Responslah tiap item menggunakan simla di ba.wah ini, kernudian isi dengan nomor yang menurut Anda sesuai di sebelahnya.

Perhatikan bahwa contoh di atas merupakan skalaperin.gkat seimbang (balanced rating scale) dengan sebuah titik netral.

Page 2: skala numerikal

Lingkari nomor yang paling sesuai dengan Anda terhadap item di bawah ini

Contoh di atas merupakan skala peringkat yang tidak seimbang (unbalanced rating scale) yang tidak memiliki titik netral.

Skala peringkat terperinci memberikan fleksibilitas untuk menggunakan sebanyak mungkin titik sesuai keperluan (4, 5, 7, 9, atau berapa pun), dan juga mungkin untuk menggunakan panduan (anchor), misalnya Sangat Tidak Penting hingga Sangat Penting, Sangat Rendah hingga Sangat Tinggi. Bila ada titik netral, hal tersebut disebut skala peringkat seimbang, dan bila tidak, disebut skala peringkat tidak seimbang.

Penelitian menunjukkan bahwa skala 5 titik adalah sama baiknya dengan yang lain, dan bahwa kenaikan dari 5 ke 7 atau 9 titik pada skala peringkat tidak meningkatkan keandalan peringkat (Elmore & Beggs, 1975) .

Skala peringkat terperinci sering dipakai dalam penelitian bisnis, karena hal tersebut menyesuaikan dirinya dengan jumlah titik yang ingin digunakan, serta tata nama dari anchor, sejauh dianggap perlu untuk mengakomodasi kebutuhan peneliti untuk mengungkap variabel.

Skala Jumlah Konstan atau Tetap

Di sini responden dimin ta untuk mendistribusikan sejumlah poin yang diberikan ke berbagai item seperti dalam contoh di bawah. Skala jumlah konstan atau tetap (fixed or constant sum scale) lebih bersifat skala ordinal (ordinal scale).

Contoh :

Dalam memilih sabun mandi, tunjukkan kepentingan yang Anda kaitkan dengan kelima aspek berikut ini dengan memberikan poin untuk masing-masing sehingga totalnya berjumlah 100.

Page 3: skala numerikal

Skala tapel

skala staple (staple scale) secara simultan mengukur arah dan intensitas sikap terhadap item yang dipelajari. Karakteristik minat terhadap studi ditempatkan di bagian tengah dengan jarak skala numerik, katakanlah, dari +3 ke -3, pada tiap sisi item seperti diilustrasikan di bawah. Skala ini memberikan ide mengenai seberapa dekat atau jauh respons individu terhadap stimulus, sebagaimana di tunjukkan dalam contoh berikut. Karena skala ini tidak memiliki titik nol absolut, skala ini adalah skala interval.

Contoh :

Nyatakan bagaimana Anda menilai kemampuan supervisor Anda terkait dengan setiap karakteristik yang disebutkan di bawah ini, dengan melingkari nomor yang tepat.

+3 +3 +3

+2 +2 +2

+1 +1 +1

Mengadopsi Inovasi Keterampilan

Teknologi Modern Produk Antarpribadi

-1 -1 -1

-2 -2 -2

-3 -3 -3

Skala Peringkat Grafik

Gambaran grafis membantu responden untuk menunjukkan pada skala peringkat grafik ( graphic rating scale) jawaban mereka untuk pertanyaa:enen tu dengan menempatka n tanda pada titik yang tepat pada garis, seperti dalam contoh berikut. Ini merupakan skala ordinal, meskipun contoh berikut mungkin membuatnya terlihat seperti skala interval.

Page 4: skala numerikal

Skala ini mudah direspons. Deskripsi singkat mengenai titik skala berguna sebagai pedoman dalam menempatkan peringkat daripada mewakili kategori diskrit. Skala wajah (faces scale) yang melukiskan wajah dari tersenyum hingga sedih (diilustrasikan dalam Bab 10), juga merupakan skala peringkat grafik yang dipakai untuk memperoleh respons yang berkaitan dengan perasaan orang mengenai suatu aspek- katakanlah perasaan tentang pekerjaan.

Skala Konsensus

Skala juga dibuat berdasarkan konsensus, di mana panel juri memilih item tertentu, mengukur konsep yang menurut mereka relevan. Item dipilih terutama berdasarkan ketepatan atau relevansinya dengan konsep Skala konsensus (consensus scale) tersebut dibuat setelah item terpilih diperiksa dan diuji validitas dan keandalannya. Satu contoh skala konsensus adalah Thurstone Equal Appearing Interval Scale, di mana sebuah konsep diukur dengan suatu proses rumit yang melibatkan sebuah panel juri. Menggunakan setumpuk kartu yang mengandung beberapa cleskripsi konsep, panel juri memberikan masukan untuk menunjukkan seberapa dekat pernyataan tertentu dengan konsep yang diteliti. Skala ini kemudian dibuat berdasarkan konsensus yang tercapai. Tetapi, skala ini jarang dipakai untuk mengukur konsep organisasional karena banyaknya waktu yang dibutuhkan untuk membuatnya.

Skala Lainnya

Ada juga beberapa metode penskalaan yang sudah sangat maju atau rumit ( advanced) seperti penskalaan multidimensional (multidimensional scaling) , di mana objek, orang, atau kedua-duanya, diskalakan secara visual, dan dilakukan analisis gabungan (conjoint). Hal tersebut memberikan gambar visual mengenai hubungan yang ada di antara dimensi sebuah konsep (construct).

Perlu dicatat bahwa biasanya skala Likert atau suatu bentuk skala numerical paling sering digunakan untuk mengukur sikap dan perilaku dalam penelitian organisasional.

Skala ranking

Seperti disinggung sebelumnya, skala ranking (ranking scales) digunakan untuk mengungkap preferensi antara dua atau lebih objek atau item (bersifat ordinal). Tetapi, ranking scmacam itu mungkin tidak memberi petunjuk yang pasti mengenai jawaban yang dicari. Misalnya, ada empat lini produk dan manajer mencari informasi yang akan membantu memutuskan lini produk mana yang sebaiknya diberi

Page 5: skala numerikal

perhatian lebih. Mari kita asumsikan bahwa 35% responden memilih produk pertama, 25% kedua, dan masing-masing 20% memilih produk ke tiga dan keempat sebagai hal yang penting bagi mereka. Manajer tersebut kemudian tidak dapat menyimpulkan bahwa produk pertama merupakan produk yang paling disukai karena 65% responden tidak memilih produk tersebut! Metode alternatif yang dipakai adalah perbandingan berpasangan, pilihan yang diharuskan, dan skala komparatif, yang dibahas di bawah ini.

Perbandingan berpasangan

Skala perbandingan berpasangan (paired comparison) digunakan ketika diantara sejumlah kecil objek, responden diminta untuk memilih antara dua objek pada satu waktu. Hal ini membantu untuk menilai preferensi. Jika, misalnya dalam contoh sebelumnya, selama perbandingan berpasangan, responden secara konsisten menunjukkan preferensi terhadap produk pertama lebih dari produk kedua, ketiga, dan keempat, manajer akan memahami lini produk mana yang menuntut perhatian utamanya. Tetapi, saat jumlah objek yang dibandingkan meningkat, demikian pula jumlah perbandingan berpasangan. Pilihan pasangan untuk n objek akan menjadi [(n) (n-1)/2]. Semakin banyak jumlah objek atau stimulus, semakin banyak jumlah perbandingan pasangan diberikan kepada responden, dan semakin tinggi kelelahan responden. Karena itu, perbandingan berpasangan merupakan metode yang baik jika jumlah stimulus yang diberikan sedikit.

Pilihan yang Diharuskan

Pilihan yang diharuskan (forced choice) memungkinkan responden untuk neranking objek secara relatif satu sama lain,di antara alternatif yang disediakan. Hal ini mempermudah responden, khususnya jika jumlah pilihan yang harus diranking terbatas jumlahnya.

Contoh :

Rankingkan majalah berikut ini yang ingin anda langgani berdasarkan preferensi, berikan 1 untuk pilihan yang paling disukai dan 5 untuk yang paling kurang disukai.

FortunePlayboyTimePeoplePrevention

Skala Komparati

Page 6: skala numerikal

Skala komparatif (comparative scale) memberikan standar (benchmark) atau poin referensi untuk menilai sikap terhadap objek, kejadian, atau situasi saat ini yang diteliti. Contoh penggunaan skala komparatif adalah sebagai berikut.

Contoh :

Dalam lingkungan keuangan yang mudah berubah, dibandingkan saham, seberapa bijak atau bergunakah untuk berinvestasi dalam Treasury bond? Silakan melinglcari respons yang tepat.

Singkatnya, data nominal berkaitan dengan skala dikotomi atau kategori, data ordinal dengan semua skala ranking--perbandingan berpasangan, pilihan yang diharuskan, atau skala komparatif; dan data interval atau mirip interval berkaitan dengan skala peringkat lainnya, seperti dilihat dari berbagai contoh di atas. Skala diferensial semantik dan numerikal sebenarnya bukan skala interval, meskipun keduanya sering diperlakukan sebagai skala interval dalam analisis data.

Skala peringkat dipakai untuk mengukur kebanyakan konsep yang berhubungan dengan perilaku. Skala ranking digunakan untuk membuat perbandingan atau meranking variabel yang telah diungkap pada skala nominal.

KETEPATAN PENGUKURAN

Kini setelah kita melihat bagaimana mendefinisikan variabel secara operasional dan menerapkan teknik penskalaan yang berbeda, penting untuk memastikan bahwa instrumen yang kita buat untuk mengukur konsep tertentu benar-benar secara akurat mengukur variabel, dan bahwa pada kenyataannya, kita benar benar mengukur konsep yang ingin kita ukur. Hal tersebut memastikan bahwa dalam mendefinisikan secara operasional variabel yang berhubungan dengan persepsi dan sikap, kita tidak melewatkan dimensi atau elemen penting atau memasukkan yang tidak relevan. Skala yang dibuat sering tidak sempurna, dan kesalahan mudah terjadi dalam pengukuran variabel yang berhubungan dengan sikap. Penggunaan instrumen yang lebih baik akan memastikan akurasi yang Jebih tinggi dalam hasil, yang pada gilirannya, akan meningkatkan kualitas ilmiah penelitian. Karena itu, dengan cara tertentu, kita perlu menilai "ketepatan" dari ukuran yang dibuat. Yaitu, kita perlu secara logis memastikan bahwa instrumen yang kita gunakan dalam penelitian benar-benar mengukur variabel yang seharusnya diukur, dan bahwa instrumen tersebut mengukur variabel secara akurat.

Sekarang mari kita telaah bagaimana dapat memastikan bahwa ukuran yang dibuat adalah baik secara logis. Hal pertama yang dilakukan adalah menganalisis item terhadap respons atas pertanyaan yang

Page 7: skala numerikal

mengungkap variabel, dan kemudian keandalan dan validitas ukuran di lakukan, seperti dijelaskan di bawah ini.

Analisis Item

Analisis item (item analysis) dilakukan untuk melihat apakah item dalam instrumen memang sudah seharusnya berada dalam instrumeh atau tidak. Tiap item diuji kemampuannya untuk membedakan antara subjek yang total skornya tinggi, dan yang rendah. Dalam analisis item, mean (rerata hitung) antara kelompok skor tinggi dan kelompok skor rendah diuji untuk menemukan perbedaan signifikan melalui nilai-t (ihat Modul pacta akhir buku mi untuk penjelasan mengenai uji t). Item dengan nilai t tinggi [uji yang mampu mengidentifikasi item yang sangat berbeda (highly discriminating items) dalam instrumen-t] kemudian dimasukkan dalam instrumen. Setelah itu, dilakukan uji keandalan instrumen dan validitas ukuran ditentukan.

Secara ringkas, keandalan menguji seberapa konsisten suatu instrumen pengukuran mengukur apa pun konsep yang diukurnya. Validitas menguji seberapa baik suatu instrumen yang dibuat mengukur konsep tertentu yang ingin diukur. Dengan kata lain, validitas berkaitan dengan apakah kita mengukur konsep yang tepat, dan keandalan dengan stabilitas dan konsistensi pengukuran. Validitas dan keandalan pengukuran memperlihatkan keketatan ilmiah yang melekat dalam studi penelitian. Kedua kriteria tersebut sekarang akan dibahas. Berbagai bentuk keandalan dan validitas ditampilkan dalam Figur 9.1.

Keandalan

Keandalan (reliability) suatu pengukuran menunjukkan sejauh mana pengukuran tersebut tanpa bias (bebas kesalahan- error free) dan karena itu menjamin pengukuran yang konsisten lintas waktu dan lintas beragam item dalam instrumen. Dengan kata lain, keandalan suatu pengukuran merupakan indikasi mengenai stabilitas dan konsistensi di mana instrument mengukur konsep dan membantu menilai "ketepatan" sebuah pengukuran.

Stabilitas Pengukuran

Kemampuan suatu pengukuran untuk tetap sama sepanjang waktu- meskipun terdapat kondisi pengujian yang tidak dapat dikontrol atau keadaan responden itu sendiri-merupakan indikasi dari stabilitas dan kerentanannya yang rendah untuk berubah dalam situasi. Hal tersebut membuktikan “ketepatan"nya karena konsep benar-benar diukur, tidak peduli kapan pun dilakukan. Dua uji stabilitas adalah keandalan tes ulang dan keandalan bentuk paralel.

Keandalan Tes Ulang

Page 8: skala numerikal

Koefisien keandalan yang diperoleh dengan pengulangan ukuran yang sama pada kesempatan kedua disebut keandalan tes ulang (test-retest reliability) . Yaitu, jika sebuah kuesioner yang mengandung sejumlah item yang diandaikan mengukur suatu konsep diberikan kepada sekumpulan responden saat ini, dan lagi kepada responden yang sama, katakanlah beberapa minggu hingga 6 bulan mendatang, maka korelasi antara skor yang diperoleh pada dua waktu yang berbeda dari sekumpulan responden yang sama disebut koefisien tes ulang. Semakin tinggi koefisien tersebut, semakin baik keandalan tes ulang, dan konsekuensinya, stabilitas ukuran melintasi waktu.

Keandalan Bentuk Paralel

Bila respons terhadap dua tes serupa yang mengungkap ideyang sama menunjukkan korelasi tinggi, kita memperoleh keandalan bentuk paralel (parallel-form reliability). Kedua tes memiliki item yang setara dan format respons.

Contoh :

Menguji Ketepatan Pengkuruan Berbagai Bentuk Keandalan dan Validitas

yang sama, yang berubah hanya susunan kata dan urutan pertanyaan. Apa yang kita coba buktikan di sini adalah kesalahan keandalan berasal dari susunan kata dan urutan pertanyaan. Bila dua tes yang

Page 9: skala numerikal

sebanding menghasilkan skor yang berkorelasi tinggi (katakanlah 0,8 dan lebih tinggi), kita bisa cukup yakin bahwa ukuran tersebut secara logis dapat dipercaya, dengan varians kesalahan minimal yang disebabkan oleh susunan kata, urutan, atau faktor lain.

Konistensi Internal Ukuran

konsistensi internal ukuran (internal consistency of measures) merupakan indikasi homogenitas item dalam ukuran yang mengungkap ide. Dengan kata lain, item harus "bersama-sama sebagai kesatuan," dan mampu secara beban mengukur konsep yang sama sehingga responden menyematkan makna keseluruhan yang sama untuk tiap item. Hal ini dapat dilihat dengan menguji apakah item dan subset item dalam instrumen pengukuran berkorelasi tinggi. Konsistensi dapat diuji melalui keandalan antar-item dan uji keandalan belah dua.

Keandalan Konsistensi Antar-item

Keandalan konsistensi antar-item (interitem consistency reliability) merupakan pengujian konsistensi jawaban responden atas semua item yang diukur. Sampai tingkat di mana item-item merupakan ukuran bebas dari konsep yan sama, mereka akan berkorelasi satu sama lain. Tes keandalan antar-item yang paling populer adalah koefisien alfa Cronbach (alfa Cronbach; Cronbach, I 946), yang digunakan untuk item skala-multipoin, dan formula Kuder-Richardson (Kuder & Richardson, 1937),yang digunakan untuk item. dikotomi. Semakin tinggi kofisien , semakin baik instrumen pengukuran.

Keandalan Belah-Dua

Keandalan belah-dua (split-half reliability) mencerminkan korelasi antara dua bagian instrumen. Estimasi akan berbeda-beda tergantung pada bagaimana item dalam pengukuran dibelah ke dalam dua bagian . Keandalan belah dua bisa lebih tinggi daripada alfa Cronbach hanya dalam keadaan di mana terdapat lebih dari satu dimensi respons mendasar yang diungkap oleh pengukuran dan jika beberapa kond isi lainnya terpenuhi (untuk rincian lengkap, lihat Campbell ,1976). Karena itu, dalam hampir setiap kasus, alfa Cronbach bisa dianggap merupakan indeks yang memadai untuk keandalan konsistensi antar-item.

Perlu dicatat bahwa konsistensi penilaian beberapa penaksir mengenai bagaimana mereka melihat sebuah fenomena atau memaknai sejumlah respons diistilahkan sebagai keandalan antarpenaksir (interrater reliability),dan hendaknya tidak dikacaukan dengan keandalan instrumen pengukuran. Seperti telah kita singgung terdahulu, keandalanan tarperakasi terutama relevan ketika data diperoleh melalui observasi, tes proyektif, atau wawancara tidak terstruktur, yang semuanya memiliki kemungkinan yang besar untuk di maknai secara subjektif.

Page 10: skala numerikal

Penting dicatat bahwa keandalan adalah perlu, namun belum cukup untuk menguji ketepatan ukuran. Misalnya, seseorang bisa dengan sangat terpercaya mengukur sebuah konsep yang memperlihatkan stabilitas dan konsistensi yang tinggi, namun hal tersebut mungkin bukan konsep yang ia tentukan untuk diukur. Validitas ( validity ) memastikan kemampuan sebuah skala untuk mengukur konsep yang dimaksudkan. Sekarang kita akan membahas konsep validitas.

VALIDITAS

Sebelumnya, dalam Bab 7, kita telah mempelajari istilah validitas internal (internal validity) dan validitas eksternal (external validity) dalam konteks desain eksperimen. Yaitu, kita mendalami persoalan otentisitas hubungan sebab dan akibat (validitas internal), dan generalisasinya untuk lingkungan eksternal (validitas eksternal). Sekarang kita akan menelaah validitas dari instrument pengukuran itu sendiri. Jika kita mengajukan sekumpulan pertanyaan (yaitu membuat insti-urnen pengukuran) dengan harapan bahwa kita mengungkap konsep, bagaimana dapat yakin secara logis bahwa kita benar-benar mengukur konsep yang telah direncanakan dan bukan sesuatu yang lain? Hal tersebut dapat ditentukan dengan menerapkan uji validitas tertentu .

ada beberapa jenis uji validitas yang digunakan untuk menguji ketepatanu kuran dan penulis menggunakan istilah yang berbeda untuk menunjukkannya. demi kejelasan, kita bisa mengelompokkan uji validitas ke dalam tiga bagian besar: validitas isi (content validity), validitas berdasar kriteria (criterion-related validity), dan validitas konsep (construct validity).

Validitas lsi

validitas isi (content validity ) memas tikan bahwa pengukuran memasukkan sekumpulan item yang memadai dan mewakili yang mengungkap konsep. Semakin item skala mencerminkan kawasan atau keseluruhan konsep yang diukur, semakin besar validitas isi. Dengan kata lain, validitas isi merupakan fungsi seberapa baik dimensi dan elemen sebuah konsep telah digambarkan.

panel juri dapat menegaskan validitas isi instrumen. Kidder dan Judd {1986) menyebutkan contoh di mana sebuah tes yang didesain untuk mengukur tingkat kerusakan kemampuan berbicara bisa dianggap memiliki validitas oleh sekelompok juri ahli (yaitu terapis bicara profesional).

Validitas muka (face validity ) dianggap oleh sejumlah pihak sebagai indeks validitas isi yang paling dasar dan sangat minimum. Validitas isi menunjukkan bahwa item-item yang dimaksudkan untuk mengukur sebuah konsep ,memberikan kesan mampu mengungkap konsep yang hendak diukur. Beberapa peneliti tidak merasa tidak tepat untuk memberlakukan validitas muka sebagai komponen yang valid dari validitas isi.

Page 11: skala numerikal

Validitas Berdasar Kriteria

validitas berdasar kriteria (criterion-related validity) terpenuhi jika pengukuran membedakan indi vidu menurut suatu kriteria yang d iharapkan diprediksi. Hal tersebut bisa dilakukan dengan menghasilkan validitas konkuren (concurrentvalidity) atau validitas prediktif (predictive validity), seperti dijelaskan di bawah.

Validitas konkuren dihasilkan jika skala membedakan individu yang diketahui berbeda; yaitu, mereka harus menghasilkan skor yang berbeda pada instrumen seperti dalam contoh berikut ini.

Contoh :

Bila suatu ukuran etika kerja disusun dan diberikan kepada sekolompok penerima santunan, skala seharusnya membedakan mereka yang antusias untuk menerima pekerjaan dan senang dengan kesempatan untuk tidak perlu lagi bergantung pada santunan dari mereka yang tidak ingin bekerja meskipun ditawari pekerjaan. Tidak diragukan lagi, mereka dengan nilai etika kerja tinggi tidak ingin bergantung pada santunan dan akan berhasrat untuk memiliki pekerjaan. Di sisi lain, mereka yang nilai etika kerjanya rendah, yang mengeksploitasi kesempatan untuk hidup dengan santunan selama mungkin, menganggap kerja membosankan. Bila kedua jenis orang tersebut memiliki skor skala etika kerja yang sama, maka tes tersebut tidak akan menjadi suatu pengukuran etika kerja, tapi sesuatu yang lain.

Validita.s prediktif menunjukkan kemampuan instrumen pengukuran untuk membedakan orang dengan referensi pada suatu kriteria masa depan. Misalnya, jika suatu tes bakat atau kemampuan diberikan kepada karyawan pada waktu rekrutmen untuk membedakan individu berdasarkan kinerja mereka di masa depan, maka mereka yang memiliki skor rendah pada tes ini akan menjadi pekerja yang buruk dan mereka dengan skor tinggi menjadi pekerja yang baik