analisis statistika dalam penelitian survey
TRANSCRIPT
1 | P a g e S T A T I S T I K A P E N E L I T I A N S U R V E Y - A I S
ANALISIS STATISTIKA DALAM PENELITIAN SURVEY
Oleh : Ali Ilham Sofiyat1
PENDAHULUAN
Dalam analisis data umumnya diperlukan alat analisis yang dikenal dengan statistika. Hasil analisis statistika dari sekelompok data akan memudahkan peneliti menginterpretasikan data atau mengambil kesimpulan dari permasalahan yang dipelajari atau diteliti. Jadi statistika hanya sebagai alat (tools) untuk memudahkan menerjemahkan data. Dengan demikian, seorang peneliti haruslah memahami bidang ilmu statistika karena dengan statistika, peneliti dapat merancang suatu penelitian, merencanakan cara analisis data, dan memudahkan dalam menyimpulkan hasil penelitian. Data dihasilkan dari pengamatan atau pengukuran dari proses penelitian yang dirancang dari awal dengan metode penelitian yang benar.
Berdasarkan sistem pengamatan, penelitian dibedakan menjadi dua kelompok penelitian, yaitu penelitian percobaan (experimental research) dan penelitian survey (survey research). Penelitian percobaan dapat dilakukan di laboratorium maupun di lapangan dengan pengendalian (control) variabel yang ketat. Data yang dihasilkan merupakan data kuantitatif dalam bentuk angka atau data interval hasil dari proses pengukuran. Penelitian survey dilakukan untuk mengukur kondisi suatu sistem secara bebas tanpa kendali peneliti. Data yang dihasilkan masih dalam bentuk data kasar. Sering data tersebut belum sesuai dengan asumsi atau tipe analisis yang digunakan. Dalam melakukan analisis data, data kasar harus diolah terlebih dahulu untuk memperoleh data yang siap untuk dianalisis. Data hasil penelitian dapat dilakukan transformasi untuk dapat dilakukan analisis statistik yang benar. Dengan demikian analisis data menghasilkan informasi yang bermanfaat.
Alur proses pengolahan dan analisis data seperti terlihat dalam gambar berikut ini:
Gambar 1. Alur proses pengolahan dan analisis data
1 Dosen Tetap Jurusan Matematika, Fakultas Sains dan Teknologi, Universitas Islam As-Syafi’iyah, Jakarta
Pengumpulan Data
Editing & Coding
Pengolahan Data
Analisis Data
Interpretasi Data
2 | P a g e S T A T I S T I K A P E N E L I T I A N S U R V E Y - A I S
Pemilihan alat yang digunakan untuk analisis sangat penting dilakukan. Statistika merupakan alat analisis data yang sering digunakan untuk memudahkan dalam menginterpretasikan data hasil penelitian. Salah memilih alat analisis akan memberikan implikasi terhadap kesalahan dalam menginterpretasikan data yang menghasilkan informasi yang salah. Pada akhirnya kesimpulan yang salah juga dihasilkan dari informasi yang salah. Pada akhirnya kesimpulan yang salah juga dihasilkan dari informasi yang salah. Banyak model-model statistika yang dapat dipilih untuk keperluan analisis data, baik statistika deskriptif maupun statistika inferensial, baik statistika parametrik maupun statistika nonparametrik. Ketika kita memutuskan untuk melakukan analisis data menggunakan alat statistika, maka perlu diperhatikan persyaratan yang diperlukan dari model-model statistika yang dipilih. Hal ini perlu dilakukan pada saat melakukan perencanaan penelitian.
KEGUNAAN STATISTIKA
Menyiapkan ringkasan. Jika terlalu banyak angka untuk menginterpretasikan secara individu, maka informasi harus diringkas. Analisis paling sederhana dapat dilakukan adalah dengan menghitung rata-rata (mean) dari sekelompok data. Namun demikian, tujuan penelitian lebih dari sekedar rata-rata, penelitian membutuhkan kesimpulan yang lebih lanjut, sehingga dapat memberikan gambaran yang lebih jelas mengenai data, maka dapat dilakukan analisis yang lebih mendalam.
Memahami pola suatu hubungan. Banyak tujuan dari penelitian menghendaki adanya hubungan antara banyak variabel yang telah diukur. Untuk memecahkan permasalahan ini, banyak model statistika yang sudah dikembangkan untuk digunakan dalam situasi seperti ini.
Memahami sebab-akibat. Statistika dapat membantu kita untuk memahami batasan interpretasi sebab-akibat dari suatu hubungan, dan dapat memperhatikan cara pemahaman yang lebih jelas dari suatu hubungan melalui proses percobaan.
Kuantifikasi ketidakpastian. Semua data dalam penelitian akan mempunyai variasi akibat dari faktor-faktor yang tidak diketahui atau tidak terkontrol. Hasil ringkasan ataupun pola hubungan yang dihasilkan dari data hasil penelitian sering tidak pasti. Interpretasi dari informasi tersebut akan tergantung pada tingkat ketidakpastian yang dapat ditentukan dengan menggunakan statistik.
Merancang pengumpulan data. Efektivitas penggunaan statistika tergantung pada bagaimana data dikumpulkan. Statistika dapat membantu untuk mengoptimalkan hal tersebut. Perencanaan penelitian yang hatihati diperlukan untuk menjamin bahwa kita dapat mengestimasi jumlah yang dibutuhkan dengan ketidakpastiannya.
Memperbaiki kualitas penelitian. Dua dimensi penting dari kualitas penelitian adalah validitas dan efisiensi. Harus diyakini bahwa hasil penelitian valid, yang berarti kesimpulan dari penelitian terlah terjustifikasi. Kita melakukan penelitian secara efisien, berarti informasi yang dihasilkan adalah maksimal dengan biaya penelitian yang ada atau tujuan penelitian tercapai dengan biaya minimal. Statistika dapat membantu untuk tercapainya kedua hal tersebut, yaitu validitas dan efisiensi.
SEKILAS TENTANG PENELITIAN SURVEY
3 | P a g e S T A T I S T I K A P E N E L I T I A N S U R V E Y - A I S
Penelitian Survey adalah penelitian dilakukan dengan mengambil sampel dari
satu populasi dan menggunakan kuesioner sebagai alat pengumpul data.
Ada beberapa pertimbangan yang perlu diperhatikan untuk melakukan penelitian
Survey, antara lain:
1. Penelitian Survey dapat digunakan untuk sampel yang besar. 2. Penggunaan kuesioner dapat menghasilkan data/informasi yang beragam dari
setiap responden/individu dengan variabel penelitian yang banyak. 3. Data yang diperoleh dari sampel dapat digeneralisasikan pada populasi.
Ada beberapa kategori penelitian Survey dilihat dari proses pelaksanaannya dan
perlakuan terhadap sampel. 1. Survey Sekali Waktu (Cross-sectional Survey). Data hanya dikumpulkan untuk
waktu tertentu saja dengan tujuan menggambarkan kondisi populasi. 2. Survey Rentang Waktu (Longitudinal Survey). Survey dilakukan berulang untuk
mengetahui kecenderungan suatu fenomena dari waktu ke waktu. 3. Survey Tracking/Trend. Survey dilakukan pada populasi yang sama namun
dengan sampel berbeda untuk mengetahui kecenderungan suatu fenomena dari waktu ke waktu.
4. Survey Panel. Survey dilakukan terhadap sampel yang sama untuk memahami suatu fenomena dari waktu ke waktu.
5. Survey Cohort. Survey dilakukan pada sekelompok populasi yang spesifik untuk mengetahui perkembangan suatu fenomena dari waktu ke waktu.
TIPE SKALA PENGUKURAN
Ada empat tipe skala pengukuran yang digunakan di dalam statistika, yaitu nominal, ordinal, interval, dan rasio. Keempat skala pengukuran tersebut memiliki tingkat penggunaan yang berbeda dalam pengolahan statistiknya.
Skala nominal hanya bisa membedakan sesuatu yang bersifat kualitatif atau kategoris, misalnya jenis kelamin, agama, dan warna kulit.
Skala ordinal selain membedakan sesuatu juga menunjukkan tingkatan (orde/ranking), misalnya pendidikan dan tingkat kepuasan pengguna.
Skala interval berupa angka kuantitatif namun tidak memiliki nilai nol mutlak sehingga titik nol dapat digeser sesuka orang yang mengukur, misalnya tahun dan suhu dalam Celcius.
Skala rasio berupa angka kuantitatif yang memiliki nilai nol mutlak dan tidak dapat digeser sesukanya, misalnya adalah suhu dalam Kelvin, panjang, dan massa.
TEKNIK-TEKNIK STATISTIKA BERKAITAN DENGAN SKALA
Beberapa pengujian dan prosedur statistika yang digunakan dalam penelitian survey terkait dengan skala pengukuran data adalah:
4 | P a g e S T A T I S T I K A P E N E L I T I A N S U R V E Y - A I S
Skala Data
Bentuk Hipotesis
Deskriptif (1 var)
Comparison (2 sampel) Comparison (>2 smpl)
Asosiatif
Related Independen Related Independen
Nominal *Binomial *Chi-Square (1 sample)
Mc. Nemar * Fisher Exact prob. *Chi-Square (2 sample)
Cochran Q Chi-Square for k sample
*Contingency Coeff. *Cramer’s stat. *Lambda
Ordinal *Kolmogorov Smirnov (1 sample) * Run test
*Sign test *Wilcoxon matched pairs
*Median test *Mann Whitney U-test *Kolmogorov Smirnov *Wald-Wolfowitz
*FriedMann test for two way ANOVA
*Median ext. *Kruskall-Wallis for one way ANOVA
*Spearman
*Kendall *Kendall W
Interval & Rasio
t - test t –test of differences
t - test two-way ANOVA
One-way ANOVA
*Pearson Correlation *Partial & Multiple correlation
Penjabaran Uji Statistik di atas adalah :
1. Skala Nominal a. Deskriptif terdiri dari : 1) Binomial 2) Chi-Square (1 sampel) b. Perbandingan 2 sampel terdiri dari : 1) Related sample : Mc Nemar 2)
Independent : Fisher Exact probability dan Chi-Square 2 sample c. Perbandingan lebih dari 2 sampel, terdiri dari 1) Related sample : Cochran
Q, 2) Independent sample : Chi-Square for k sample d. Asosiatif, terdiri dari : 1) Contingency Coefficient, dan 2) Cramer’s Stat.
Lambda. 2. Skala Ordinal
a. Deskriptif terdiri dari 1) Kolmogorov-Smirnov, 2) Run test b. Perbandingan 2 sampel terdiri dari : 1) Related sample : Sign test dan
Wilcoxon, 2) Independent sample : Median test, Mann Whitney U, Kolmogorov-Smirnov dan Wald-Wolfowitz.
c. Perbandingan lebih dari 2 sampel terdiri dari : 1) Related sample : Friedmann test, 2) Independent sample : Median ext. dan Kruskall Wallis
d. Asosiatif terdiri dari 1) Spearman Rank Test, 2) Kendall Tau, 3) Kendall W. 3. Skala Interval & Rasio
a. Deskriptif : t test (1 sampel) b. Perbandingan 2 sampel terdiri dari 1) Related sample : Uji t berpasangan, 2)
Independent sampel : uji t independen. c. Perbandingan lebih dari 2 sampel, terdiri dari : 1) Related sample : 2 way
Anova, 2) Independent sample : One way Anova. d. Asosiatif terdiri dari : 1) Pearson Correlation (Product Moment), 2) Partial &
Multiple correlation
5 | P a g e S T A T I S T I K A P E N E L I T I A N S U R V E Y - A I S
UJI VALIDITAS DAN RELIABILITAS INSTRUMEN PENELITIAN
Validitas (Validity) :
Sejauh mana ketepatan dan kecermatan suatu alat ukur dalam melakukan fungsinya ukurnya. Mampu mengukur apa yang hendak diukur. Validitas butir (validitas internal) diperlihatkan oleh seberapa jauh hasil ukur butir tersebut konsisten dengan hasil ukur instrumen secara keseluruhan. Oleh karena itu validitas butir tercermin pada besaran koefisien korelasi antara skor butir dengan skor total instrumen. Jika koefisien korelasi antara skor butir dengan skor total instrumen positif dan signifikan maka butir tersebut dapat dianggap valid berdasarkan ukuran validitas internal. Jika skor butir kontinum maka untuk menghitung koefisien korelasi antara skor butir dengan skor total instrumen digunakan koefisien korelasi product moment yang menggunakan rumus:
2222
YYnXXn
YXXYnr
Jika skor butir dikotomi (misalnya 0,1) maka untuk menghitung koefisien korelasi antara skor butir dengan skor total instrumen digunakan koefisien korelasi biserial (rbis) yang menggunakan rumus:
i
i
t
tibis
q
p
S
XXr
Namun sebenar koefisien korelasi di atas, sebenarnya koefisien korelasi product
moment yang digunakan pada butir dikotomi. Hasil penghitungannya sama saja
dengan Product Moment. Kriteria yang digunakan untuk menguji valditas eksternal adalah nilai tabel r (r tabel).
Jika koefisien korelasi antara skor hasil ukur instrument yang dikembangkan dengan
skor hasil ukur instrument baku lebih besar daripada r tabel maka instrument yang
dikembangkan dapat dianggap valid.
Reliabilitas
Reliabilitas berasal dari kata reliability berarti sejauh mana hasil suatu pengukuran dapat dipercaya. Suatu hasil pengukuran hanya dapat dipercaya. Suatu hasil pengukuran hanya dapat dipercaya apabila dalam beberapa kali pelaksanaan pengukuran terhadap kelompok subyek yang sama, diperoleh hasil pengukuran yang relative sama, selama aspek yang diatur dalam diri subyek memang belum berubah.
Reliabilitas konsistensi gabungan item berkaitan dengan kemantapan atau konsistensi antara item-item suatu tes. Hal ini dapat diungkapakan dengan pertanyaan, apakah terhadap obyek ukur yang sama, item yang satu menunjukkan hasil ukur yang sama dengan item yang lainnya? Dengan kata lain
6 | P a g e S T A T I S T I K A P E N E L I T I A N S U R V E Y - A I S
bahawa terhadap bagian obyek ukur yang sama, apakah hasil ukur item yang satu tidak kontradiksi dengan hasil ukur item yang lain. Koefisien reliabilitas konsistensi gabungan item dapat dihitung dengan
menggunakan:
(a) Rumus Kuder-Richardson, yang dikenal dengan nama KR-20 dan KR-21 (Butir
DIKOTOMI)
KR – 20 :
2
11 S
pq
k
kr
KR – 21 :
2.
(1
1 Sk
XkX
k
kr
(b) Rumus koefisien Alpha atau Alpha Cronbach (Butir Kontinum)
2
2
11 t
i
S
S
k
kr
k =banyaknya item yang valid
Si2 = varians butir
St2 = varians total skor
R TABEL R tabel digunakan sebagai patokan kriteria, yang dibandingkan dengan r (koefisien korelasi yang dihitung. Jika r hitung lebih besar dibandingkan dengan r tabel dengan derajat bebas tertentu, maka butir dinyatakan valid, begitu pula sebaliknya.
k =banyaknya item yang valid p = proporsi subjek yang menjawab item dengan benar q = proporsi subjek yang menjawab item dengan salah (q = 1 – p) S2 = varians dari tes (varians total)
k =banyaknya item yang valid
X = Mean (rata-rata total skor)
S2 = varians dari tes (varians total)
7 | P a g e S T A T I S T I K A P E N E L I T I A N S U R V E Y - A I S
8 | P a g e S T A T I S T I K A P E N E L I T I A N S U R V E Y - A I S
CONTOH 1 :
Validitas dan reliabilitas data ordinal pada model skala sikap likert dengan SPSS
RES
BUTIR
TOTAL 1 2 3 4 5 6 7 8 9 10
1 4 4 3 4 3 3 1 1 1 3 27
2 3 3 3 1 3 4 3 3 4 4 31
3 3 3 3 2 3 4 3 2 4 4 31
4 3 3 3 3 2 3 3 3 3 3 29
5 3 3 3 3 2 3 3 3 3 4 30
6 3 3 3 2 3 3 3 3 3 4 30
7 4 4 4 3 3 4 2 2 3 4 33
8 4 4 4 3 3 4 2 4 3 4 35
9 3 4 3 3 3 4 3 4 3 3 33
10 4 4 3 4 3 3 2 4 2 3 32
Data di atas di input di Spreadsheet SPSS, dengan acara sebagai berikut: Buka file SPSS, klik Variable View Ketiklah BUTIR1, BUTIR2, … sampai BUTIR10 dan TOTAL pada kolom Name,
Type, Width dan Decimal seperti isian di bawah ini.
Kemudian klik DATA VIEW dan ketik data di atas.
9 | P a g e S T A T I S T I K A P E N E L I T I A N S U R V E Y - A I S
Simpanlah data uji coba tersebut, dengan nama ujicoba.sav
Uji validitas melalui Koefisien Korelasi Product Moment antara Butir dan
Total. Klik Analyze, Correlate, Bivariate lalu masukkan TOTAL, BUTIR1,
BUTIR2, BUTIR3, BUTIR4 dan BUTIR5 sebagai tahap pertama ke kotak
Variables. Lihat Correlations Coefficient sudah default Pearson.
Pada Test of Significance pilih One-tailed (uji satu pihak positif). Sehingga
nampak tampilan sebagai berikut:
10 | P a g e S T A T I S T I K A P E N E L I T I A N S U R V E Y - A I S
Klik OK, maka akan nampak hasil sebagai berikut:
Ulang kembali operasi yang sama yaitu proses tahap 2, yaitu untuk
memasukkan TOTAL, BUTIR6, BUTIR7, BUTIR8, BUTIR9 dan BUTIR10 ke
kotak variables.
Klik Analyze, Correlate, Bivariate lalu klik Reset. Kemudian masukkan
TOTAL, BUTIR6, BUTIR7, BUTIR8, BUTIR9 dan BUTIR10 sebagai tahap kedua
ke kotak Variables. Lihat Correlations Coefficient sudah default Pearson.
Pada Test of Significance pilih One-tailed (uji satu pihak positif). Sehingga
nampak tampilan sebagai berikut:
11 | P a g e S T A T I S T I K A P E N E L I T I A N S U R V E Y - A I S
Klik OK, maka akan nampak hasil sebagai berikut:
12 | P a g e S T A T I S T I K A P E N E L I T I A N S U R V E Y - A I S
Berdasarkan hasil tahap pertama dan kedua dapat dirangkum Uji Validitas
sebagai berikut :
Butir Pernyataan
R product moment
Nilai p (Sig.(1tailed))
Nilai α
R tabel
Keterangan
Butir1 0,245 0,247 0,05 0,632 Tidak Valid
Butir2 0.416 0,116 0,05 0,632 Tidak Valid
Butir3 0,670 0,017 0,05 0,632 Valid
Butir4 -0,095 0,397 0,05 0,632 Tidak Valid
Butir5 0,369 0,147 0,05 0,632 Tidak Valid
Butir6 0,693 0,013 0,05 0,632 Valid
Butir7 0,103 0,388 0,05 0,632 Tidak Valid
Butir8 0,641 0,023 0,05 0,632 Valid
Butir9 0,395 0,130 0,05 0,632 Tidak Valid
Butir10 0,320 0,183 0,05 0,632 Tidak Valid
Keterangan :
Dinyatakan VALID jika r product moment > r tabel atau
VALID jika Nilai p (Sig.(1 tailed)) < 5% (α)
Dari tabel di atas, hanya ada dua butir pernyataan yang dinyatakan VALID
yaitu Butir 3, Butir 6 dan Butir 8.
Dari 3 butir yang valid akan ditentukan Koefisien Reliabilitasnya dengan
Alpha Cronbach. Jika dilakukan melalui proses SPSS, prosesnya adalah
sebagai berikut:
Klik Analyze
Pilih Scale
Pilih Reliability Analysis
Masukkan BUTIR3, BUTIR6 dan BUTIR8 kedalam kotak Items
13 | P a g e S T A T I S T I K A P E N E L I T I A N S U R V E Y - A I S
Pastikan pilihan Model : Alpha lalu klik OK. Hasilnya sebagai berikut:
Berdasarkan 3 (tiga) butir yang valid diperoleh Koefisien Reliabilitas
Alpha Cronbachnya adalah 0,311 (masih rendah), atau dapat
dikatakan tidak reliabel. Instrumen dikatakan Reliabel jika nilai
Koefisien Alpha Cronbachnya lebih besar dari 0,6.
14 | P a g e S T A T I S T I K A P E N E L I T I A N S U R V E Y - A I S
PEDOMAN INTERPRETASI KOEFISIEN RELIABILITAS (dari Guilford)
Interval Koefisien Tingkat Hubungan
0,00 - 0,199 0,20 - 0,399 0,40 - 0,599 0,60 - 0,799 0,80 - 1,00
Sangat Rendah Rendah Sedang
Kuat Sangat Kuat
CATATAN : 1. Dalam membuat instrumen pada sebuah variabel (menggunakan Skala
Likert), paling sedikit butir pernyataannya yang dibuat adalah 15 butir (atau minimal 15 butir).
2. Untuk menentukan validitas dan reliabilitasnya, responden uji coba paling
tidak 5 sampai dengan 10 kali banyaknya pernyataan.
ANALISIS KORELASI PRODUCT MOMENT Suatu model regresi menentukan hubungan sebab akibat antara variabel
dependen Y dan variabel independen X (satu atau lebih). Hubungan tersebut didasarkan pada teori, tanpa teori kita tidak mungkin menyimpulkan begitu saja bahwa terdapat hubungan sebab akibat antar variabel yang ada, meskipun secara statistik menun-jukkan hasil pengujian yang nyata (signifikan). Berbeda dengan analisis regresi, analisis korelasi dipergunakan mengetahui keeratan hubungan antara dua variabel atau lebih tanpa memperhatikan ada atau tidak adanya hubungan kausal.
Menurut George Ferguson dalam bukunya Statistical Analysis in Psychology and Education” (1971) menjelaskan bahwa :
The study of this type of data has two closely related aspects, correlation dan prediction. Correlation is concerned with describing the degree of relation between variables. Prediction is concerned with estimating one variable from a knowledge of another. Korelasi dapat bersifat linear atau nonlinear. Korelasi dikatakan linier apabila
semua titik (Xi, Yi) pada scatter diagram terlihat mengelompok atau bergerombol di sekitar garis lurus, sedangkan korelasi dikatakan nonlinier apabila titik-titik (Xi,Yi) terletak di sekitar kurva nonlinier. Didalam analisis korelasi sederhana, kemungkinan akan dijumpai bahwa dua variabel berkorelasi positif, negatif, atau tidak berkorelasi.
Dua variabel dikatakan berkorelasi positif jika mereka cenderung berubah secara bersama dalam arah yang sama, dengan kata lain, jika mereka cenderung meningkat atau menurun secara bersama. Sedangkan dua variabel dikatakan berkorelasi negarif jika mereka cenderung berubah dalam arah yang berlawanan, dimana apabila X meningkat Y menurun demikian pula sebaliknya apabila X menurun, Y meningkat. Atau kalau dibuat rangkuman :
X dan Y berkorelasi positif maka : X maka Y atau X maka Y
X dan Y berkorelasi negatif maka : X maka Y atau X maka Y
15 | P a g e S T A T I S T I K A P E N E L I T I A N S U R V E Y - A I S
Nilai koefisien korelasi : -1 r 1 (antara –1 dan +1) Kalau r = 1, hubungan X dan Y sempurna dan positif Kalau r = -1, hubungan X dan Y sempurna dan negatif Kalau r = 0, hubungan X dan Y lemah sekali (tak ada) Korelasi Pearson (Korelasi Product-Moment)
Korelasi Pearson ini berguna untuk menentukan korelasi antara dua variabel yang diukur menggunakan skala interval atau ratio (kontinu). Rumus korelasi Pearson :
dimana : r : koefisien korelasi variabel X dan Y x dan y : deviasi variabel X dan Y (atau x = X – X dan y = Y – Y) Atau gunakan rumus (untuk raw score):
PEDOMAN INTERPRETASI KOEFISIEN KORELASI (Guilford)
Interval Koefisien Tingkat Hubungan
0,00 - 0,199 0,20 - 0,399 0,40 - 0,599 0,60 - 0,799 0,80 - 1,00
Sangat Rendah Rendah Sedang
Kuat Sangat Kuat
Meskipun dari n buah pasang data X dan Y kita dapat menghitung koefisien
korelasi r sebagai penduga (penaksir) untuk koefisien korelasi populasi , namun sebelum kita gunakan untuk membuat kesimpulan-kesimpulan, terlebih dahulu harus dipertanyakan apakah r yang diperoleh itu ada artinya (tidak bisa diabaikan) ataukah tidak. Untuk menjawab keberartian (signifikansi) koefisien korelasi r yang kita peroleh, perlu dilakukan pengujian terhadap hipotesis nol :
H0 : = 0 artinya bahwa koefisien korelasi populasi tidak berarti, melawan
HA atau H1 : 0, untuk yang two side/dua pihak
H1 : > 0 atau H1: < 0 untuk yang one side/satu pihak) Pengujian koefisien korelasi digunakan statistik Student t dengan rumus sebagai berikut :
)2y( )2x(
xy r
2r1
2-nr t
dimana r : koefisien korelasi hasil perhitungan n : jumlah sampel (pengamatan)
})({})({
))((2222 YYnXXn
YXXYnr
16 | P a g e S T A T I S T I K A P E N E L I T I A N S U R V E Y - A I S
yang selanjutnya digunakan distribusi (tabel) Student t dengan derajat kebebasan atau
dk = (n-2), dengan mengambil nilai (resiko kesalahan/kekeliruan) sebesar 5% atau 1% :
Tentukan nilai t/2 (n-2) pada two side,
Atau t (n-2) pada one side.
Kriteria pengujiannya adalah Tolak Hipotesis Nol jika t hitung lebih besar daripada t tabel (dengan tanpa memperhatikan nilai minus).
Atau ada cara yang paling mudah yaitu membandingkan nilai koefisien korelasi tersebut dengan r tabel product moment. Jika r hitung > r tabel maka tolak H0. Contoh : Misalkan seorang peneliti ingin mencari besarnya koefisien korelasi antara motivasi kerja karyawan suatu lembaga pendidikan dengan kinerjanya Dari 10 orang karyawan diperoleh nilai : Motivasi Kerja : 13 12 10 8 10 6 6 5 3 2 Kinerja : 11 14 11 9 7 11 3 7 6 1 Penyelesaian :
X Y x Y x2 y2 xy
13 11 5,5 3 30,25 9 16,5
12 14 4,5 6 20,25 36 27
10 11 2,5 3 6,25 9 7,5
8 9 0,5 1 0,25 1 0,5
10 7 2,5 -1 6,25 1 -2,5
6 11 -1,5 3 2,25 9 -4,5
6 3 -1,5 -5 2,25 25 7,5
5 7 -2,5 -1 6,25 1 2,5
3 6 -4,5 -2 20,25 4 9
2 1 -5,5 -7 30,25 49 38,5
75 80 124,5 144 102
X : 7,5 Y : 8 Jadi berdasarkan hasil di atas :
xy = 102 ; x2 = 124,5 dan y2 = 144 Besarnya koefisien korelasi :
0,76 (144) (124,5)
102 r
17 | P a g e S T A T I S T I K A P E N E L I T I A N S U R V E Y - A I S
Berarti terdapat hubungan yang positif dan erat antara motivasi kerja karyawan dengan kinerjanya. Untuk pengujian keberartian (signifikansi) koefisien korelasi di atas : Di susun hipotesis:
H0 : = 0 dan H1 : > 0 artinya H0 : Tidak terdapat hubungan yang signifikan antara motivasi kerja karyawan dengan
kinerjanya H1: Terdapat hubungan yang positif antara motivasi kerja karyawan dengan kinerjanya Tentukan nilai t (atau t hitung) sebagai berikut : Untuk taraf nyata sebesar 5% (0,05) dan dk = 10-2 =8 dari daftar distribusi t diperoleh :
2,31 atau t5%/2 (8) = 2,31. Ternyata t hitung > ttabel berarti tolak hipotesis nol (H0). Sehingga dapat disimpulkan bahwa terdapat hubungan yang positif dan erat antara motivasi kerja karyawan dengan kinerjanya. Dengan demikian dapat dikatakan bahwa semakin tinggi motivasi kerja karyawan maka akan semakin tinggi pula kinerjanya Pengujian signifikansi dengan menggunakan r tabel product moment: r hitung = 0,76, r tabel dengan dk = 8 diperoleh 0,632. Ternyata r hitung > r tabel berarti tolak H0, kesimpulan sama dengan di atas. Perhitungan koefisien korelasi dengan bantuan software SPSS for Windows akan menghasilkan sebagai berikut:
Correlations
Motivasi Kerja Produktivitas
Motivasi Kerja Pearson Correlation 1.000 .762(*)
Sig. (2-tailed) . .010
N 10 10
Produktivitas Pearson Correlation .762(*) 1.000
Sig. (2-tailed) .010 .
N 10 10
* Correlation is significant at the 0.05 level (2-tailed).
Correlations
Motivasi Kerja Produktivitas
Motivasi Kerja
Pearson Correlation 1.000 .762(**)
Sig. (1-tailed) . .005
N 10 10
Produktivitas
Pearson Correlation .762(**) 1.000
Sig. (1-tailed) .005 .
N 10 10
** Correlation is significant at the 0.01 level (1-tailed).
3,308 0,6499
2,1496
0,5776-1
80,76
276,01
2-10 0,76
2-nr t
2r1
18 | P a g e S T A T I S T I K A P E N E L I T I A N S U R V E Y - A I S
Berdasarkan tabel di atas, ternyata Sig. (2 tailed) dan Sig. (1 tailed) jauh lebih kecil dari
5% maka tolak H0, kesimpulannya sama seperti di atas.
ANALISIS REGRESI
1. Pengertian Dasar
Istilah ―regresi‖ pertama kali diperkenalkan oleh Sir Francis Galton pada tahun 1886. Galton menemukan adanya tendensi bahwa orang tua yang memiliki tubuh tinggi memiliki anak-anak yang tinggi, orang tua yang pendek memiliki anak-anak yang pendek pula. Kendati demikian, ia mengamati bahwa ada kecenderungan tinggi anak cenderung bergerak menuju rata-rata tinggi populasi secara keseluruhan. Dengan kata lain, ketinggian anak yang amat tinggi atau orang tua yang amat pendek cenderung bergerak ke arah rata-rata tinggi populasi. Inilah yang disebut hukum Galton mengenai regresi universal. Dalam bahasa Galton, ia menyebutnya sebagai regresi menuju mediokritas (regression toward mediocrity)(Maddala, 1992:60).
Regresi pada dasarnya adalah studi mengenai ketergantungan satu variabel dependen (terikat) dengan satu atau lebih variabel independen (variabel penjelas/bebas), dengan tujuan untuk mengestimasi dan/atau memprediksi rata-rata populasi atau nilai rata-rata variabel dependen berdasarkan nilai variabel independen yang diketahui.
2. Hubungan Statistik vs Deterministik
Perlu dicatat bahwa analisis regresi menitikberatkan pada hubungan statistik dan bukan hubungan deterministik. Dalam hubungan statistik, kita pada dasarnya menggunakan variabel stokastik (random), yaitu variabel yang memiliki distribusi probabilitas.
PAD = f (jumlah penduduk, PDRB, subsidi pusat)
Di mana PAD adalah Pendapatan Asli Daerah, PDRB adalah Produk
Domestik Regional Bruto.
Q = b0 + b1 Pupuk + b2 TK + e
Di mana Q = jumlah produksi padi; Pupuk = jumlah yang digunakan; TK =
jumlah tenaga kerja yang digunakan; e = residual.
Sedangkan hubungan deterministik bukan merupakan hubungan statistik karena bersifat identitas (eksak).
PAD = pajak daerah + retribusi daerah + laba BUMD + pendapatan lain-lain
Y = C + I + G + X – M
Di mana Y = pendapatan nasional, C = konsumsi, I = investasi, G =
pengeluaran pemerintah, X = ekspor, M = impor.
Analisis regresi tidak meneliti hubungan deterministik. Mengapa demikian?
Karena hubungan deterministik sudah eksak dan tidak perlu dianalisis lebih
lanjut dengan regresi.
19 | P a g e S T A T I S T I K A P E N E L I T I A N S U R V E Y - A I S
3. Regresi vs Korelasi
Analisis korelasi bertujuan untuk mengukur asosiasi (hubungan) linear antara dua variabel. Korelasi juga tidak menunjukkan hubungan fungsional. Dengan kata lain, analisis korelasi tidak membedakan antara variabel dependen dengan variabel independen.
Dalam analisis regresi, selain mengukur kekuatan hubungan antara dua variabel
atau lebih, juga menunjukkan arah hubungan antara variabel dependen dengan
variabel independen. Variabel dependen diasumsikan random/stokastik, yang
berarti mempunyai distribusi probabilistik. Variabel bebas diasumsikan memiliki
nilai tetap (dalam pengambilan sampel yang berulang).
Analisis regresi mendasarkan pada model probabilistik. Secara matematis,
model probabilitas garis lurus dirumuskan:
Y = b0 + b1 X +
Di mana
Y = variabel dependen (respon)
X = variabel independen, yang digunakan sebagai penjelas Y
E(Y) = b0 + b1 X = komponen deterministik
= komponen kesalahan random (random error)
b0 = intercept, titik potong garis regresi dengan sumbu Y
b1 = slope, kemiringan garis regresi, yaitu seberapa jauh kenaikan (penurunan) komponen deterministic dari Y sebagai akibat kenaikan X.
Gambar : Model Regresi Linear
Y
X
b0 = intercept
E(Y) = b0 + b1 X
intercept
B1 = slope
20 | P a g e S T A T I S T I K A P E N E L I T I A N S U R V E Y - A I S
4. Metode OLS (Pangkat Kuadrat Terkecil Biasa)
Tujuan utama regresi adalah mengestimasi fungsi populasi (FRP) berdasarkan fungsi regresi sampel. Misalkan persamaan regresi populasinya adalah:
E(YIXi) = b0 + bi Xi
Karena populasi sering tidak dapat diperolah secara langsung, maka digunakan
fungsi regresi sample (FRS).
kXb...XbbbY k1210i
di mana Yi dibaca ―Y topi‖ atau ―Y yang diestimasi‖, karena iY = penduga
E(YiXi). Metode OLS bertujuan untuk meminimalkan jumlah kuadrat kesalahan
(SSE = Sum of Squares Error):
SEE = 2
ii Y - Y
Asumsi utama yang mendasari model regresi linear klasik dengan menggunakan metode OLS adalah:
a. Model regresi linear, artinya: linear dalam parameter.
b. X diasumsikan nonstokastik, artinya: nilai X dianggap tetap dalam sampel yang berulang.
c. Nilai rata-rata kesalahan adalah nol, atau E(uiIXi)=0.
d. Homoskedastisitas, artinya varians kesalahan sama untuk setiap periode (homo=sama; skedastisitas=sebaran). Dinyatakan dalam bentuk matematis:
var(uiIXi)=2.
e. Tidak ada autokorelasi antar kesalahan (antara ui dan uj tidak ada korelasinya). Dinyatakan dalam bahasa matematis: covarians (ui, uj)=0.
f. Antara u dan X saling bebas, sehingga cov (ui, Xi)=0.
g. Tidak ada multikolinearitas yang sempurna antar variabel bebas.
h. Jumlah observasi, n, harus lebih besar daripada jumlah parameter yang diestimasi (jumlah variabel bebas).
i. Adanya variabilitas dalam nilai X, artinya: nilai X berbeda (tidak boleh sama semua).
j. Model regresi telah dispesifikasikan secara benar. Dengan kata lain tidak ada bias (kesalahan) spesifikasi dalam model yang digunakan dalam analisis empirik.
Uji Signifikansi Parameter Individual (Uji Statistik t)
Uji statistik t pada dasarnya menunjukkan seberapa jauh pengaruh satu variabel penjelas secara individual dalam menerangkan variasi variabel terikat. Hipotesis nol (H0) yang hendak diuji adalah apakah suatu parameter (bi) sama dengan nol, atau :
H0 : bi = 0
21 | P a g e S T A T I S T I K A P E N E L I T I A N S U R V E Y - A I S
Artinya, apakah suatu variabel independen bukan merupakan penjelas yang signifikan terhadap variabel dependen. Hipotesis alternatifnya (Ha), parameter suatu variabel tidak sama dengan nol, atau:
Ha : bi 0
Artinya, variabel tersebut merupakan penjelas yang dignifikan terhadap variabel dependen.
Statistik t dihitung dari formula sebagai berikut:
T = (bi – 0) /S = bi /S
Di mana S = deviasi standar, yang dihitung dari akar varians. Varians (variance), atau S2, diperoleh dari SSE dibagi dengan jumlah derajat kebebasan (degree of freedom). Dengan kata lain:
S2 = k -n
SSE
Membandingkan nilai statistik t dengan titik kritis menurut table: apabila nilai statistik t hasil perhitungan lebih tinggi disbanding nilai t table, kita menerima hipotesis alternatif, yang menyatakan bahwa suatu variabel independen secara individual mempengaruhi variabel dependen
Uji Signifikansi Simultan (Uji Statistik F).
Uji statistik F pada dasarnya menunjukkan apakah semua variabel bebas yang dimasukkan dalam model mempunyai pengaruh secara bersama-sama terhadap variabel terikat. Hipotesis nol (H0) yang hendak diuji adalah apakah semua parameter dalam model sama dengan nol, atau:
H0 : b1 = b2 = … = bk = 0
Artinya, apakah semua variabel independen bukan merupakan penjelas yang signifikan terhadap variabel dependen. Hipotesis alternatifnya (Ha), tidak semua parameter secara simultan sama dengan nol, atau:
Ha : b1 … bk 0
Artinya, semua variabel independen secara simultan merupakan penjelas yang signifikan terhadap variabel dependen.
Untuk menguji kedua hipotesis ini digunakan statistik F. nilai statistik F dihitung dari formula sebagai berikut:
k)-SSE/(n
SSR/k
MSE
MSR F
di mana
SSR = sum of squares due to regression = 2
i yY ;
SSE = sum of squares error = 2
ii YY ;
n = jumlah observasi;
k = jumlah parameter (termasuk intercept) dalam model;
22 | P a g e S T A T I S T I K A P E N E L I T I A N S U R V E Y - A I S
MSR = mean squares due to regression;
MSE = mean of squares due to error;
TSS = total sum of squares.
Membandingkan nilai F hasil perhitungan dengan nilai F menurut tabel: bila nilai F hasil perhitungan lebih besar dari pada nilai F menurut tabel maka hipotesis alternatif, yang menyatakan bahwa semua variabel independen secara serentak dan signifikan mempengaruhi variabel dependen.
5. Koefisien Determinasi
Koefisien determinasi (R2) pada intinya mengukur seberapa jauh kemampuan
model dalam menerangkan variasi variabel terikat. Formula menghitung
koefisien determinasi adalah:
R2 = (TSS-SSE)/TSS = SSR/TSS
Nilai koefisien determinasi adalah di antara nol dan satu. Nilai R2 yang kecil berarti kemampuan variabel-variabel independen dalam menjelaskan variasi variabel dependen amat terbatas.
Kelemahan mendasar penggunaan koefisien determinasi adalah bias terhadap jumlah variabel independen yang dimasukkan ke dalam model. Setiap tambahan satu variabel independen maka R2 pasti meningkat tidak peduli apakah variabel tersebut berpengaruh secara signifikan terhadap variabel dependen (baca: memiliki nilai t yang signifikan atau tidak). Oleh karena itu, banyak peneliti menganjurkan untuk menggunakan nilai Adjusted R2 pada saat mengevaluasi mana model regresi yang terbaik. Adjusted R2 dihitung dari:
Adjusted
kn
1n R11
TSS
S 1n1R 2
22
Korelasi Rank Spearman
Diperkenalkan pertama kali oleh Carl Spearman pada tahun 1904. Korelasi linier yang digunakan jika kedua variabel yang hendak dikorelasikan berupa peringkat (ranking) subjek pada masing-masing variabel (bukan berbentuk skor). Jika kedua variabel X dan Y berupa peringkat (ranking/jenjang) maka D digunakan untuk menyatakan selisih (difference) antara X dan Y atau D = X – Y 1. Rumus koefisien korelasi Spearman untuk n ≤ 30:
D = selisih setiap pasang peringkat (rank) yang berkaitan dengan pasangan
data (Xi, Yi) n = banyaknya pasangan peringkat (rank). Pengujian koefisien korelasi menggunakan statistik t : Untuk menghitung rank :
)1(
61
2
2
nn
Drs
23 | P a g e S T A T I S T I K A P E N E L I T I A N S U R V E Y - A I S
* data asli diurutkan terlebih dahulu dan diberi rank . * jika ada dua data yang bernilai sama, maka rank dari data itu merupakan rata-
rata dari urutan itu.
Tabel Interpretasi Koefisien Korelasi Versi de Vaus
D.A. de Vaus menginterpretasikan koefisien korelasi sebagai berikut:
CONTOH PENERAPAN: Misalkan 10 pasangan suami-isteri Pasangan Usia Subur (PUS) ditanyakan pandangannya tentang program KB. Ingin diketahui apakah ada korelasi antara variabel pandangan suami (X) dan pandangan isteri (Y) mengenai program KB tersebut. Data diukur dengan skala ordinal, seperti yang didefinisikan di atas.
Misalnya pandangan suami dan isteri terhadap program KB yang diukur menggunakan skala ordinal sebagai berikut :
sangat setuju : skor 5 setuju : skor 4 netral : skor 3 tidak setuju : skor 2 sangat tidak setuju : skor 1 Data hasil penelitian adalah sebagai berikut:
Pasangan Pendapat Suami Pendapat Istri
1 Netral Sangat Setuju
2 Setuju Netral
3 Tidak Setuju Setuju
4 Sangat Setuju Sangat Setuju
5 Netral Setuju
6 Tidak Setuju Netral
7 Sangat Tidak Setuju Setuju
8 Tidak Setuju Netral
9 Setuju Sangat Setuju
10 Sangat Setuju Setuju
24 | P a g e S T A T I S T I K A P E N E L I T I A N S U R V E Y - A I S
Penyelesaian : ----------------------------------------------------------- n Xi Yi Rxi Ryi Di
2 = (Rxi – Ryi)2
1 3 5 5.5 9 12.25 2 4 3 7.5 2 30.25 3 2 4 3 5.5 6.25 4 5 5 9.5 9 0.25 5 3 4 5.5 5.5 0.00 6 2 3 3 2 1.00 7 1 4 1 5.5 20.25 8 2 3 3 2 1.00 9 4 5 7.5 9 2.25 10 5 4 9.5 5.5 16.00 -------------------------------------------------------------------------------------------------------
Jumlah 89,5
Dari data di atas diperoleh koefisien korelasi Spearman sebagai berikut:
46,0)110(10
)5,89(61
2
sr
Pengujian koefisien korelasi:
H0 : ρs = 0 (Tidak terdapat hubungan yang signifikan antara X dan Y)
H1 : ρs > 0 (Terdapat hubungan positif yang signifikan antara X dan Y)
Pada = 5% dengan pengujian satu arah untuk n = 10, nilai r tabel → rtabel (5%) atau rtabel (0,05) = 0,564. Karena rs = 0,46 < rtabel = 0,564 maka diputuskan untuk menerima H0. Artinya tidak terdapat hubungan yang signifikan antara X dan Y atau Tidak terdapat hubungan yang signifikan antara pandangan suami dengan pandangan isteri mengenai program KB.
2. Rumus koefisien korelasi Spearman untuk n > 30:
Cara mencari nilai z hitung sebagai berikut:
Di mana:
)1(
61
2
2
nn
Drs
25 | P a g e S T A T I S T I K A P E N E L I T I A N S U R V E Y - A I S
Nilai rs dicari dengan cara yang sama seperti perhitungan terdahulu (di bagian atas).
Dalam contoh sampel yang lebih besar dari 30 ini misalnya sampel menggunakan 50
responden. Maka perhitungannya sebagai berikut:
Nilai z hitung dalam sampel > 30 ini adalah 6,93. Pengambilan keputusan dalam
sampel > 30 ini adalah membandingkan antara z hitung dengan z tabel. Z hitung sudah
diperoleh sekarang tinggal z tabel.
Cara Mencari z Tabel
Nilai z tabel dicari dari tabel Z (lihat buku-buku statistik). Caranya adalah:
1. Tentukan Taraf Keyakinan Penelitian (misalnya 95%). Taraf Keyakinan 95% berarti Interval Keyakinan-nya (alpha) 0,05. Nilai 0,05 ini merupakan bentuk desimal dari 5% yang diperoleh dari pengurangan 100% selaku kebenaran absolut dengan 95% (100% - 95% = 5% atau 0,05).
2. Tentukan Uji yang digunakan. Apakah 1 sisi (One-Tailed) atau 2 sisi (Two-Tailed). Penentuan 1 sisi atau 2 sisi ini didasarkan hipotesis penelitian. Jika hipotesis hanya menyebutkan ―terdapat hubungan‖ maka artinya bentuk hubungan belum ditentukan apakah positif atau negatif dan dengan demikian menggunakan uji 2 sisi. Jika hipotesis menyatakan ―terdapat hubungan positif‖ atau ―terdapat hubungan negatif‖ maka artinya bentuk hubungan sudah ditentukan dan dengan demikian menggunakan uji 1 sisi.
3. Jika Uji 2 Sisi (Two-Tailed) maka lihat Tabel Z. Dalam uji 2 sisi Interval Keyakinan dibagi dua yaitu 0,05 / 2 = 0,025. Cari pada kolom tabel nilai yang paling mendekati 0,025. Dari nilai yang paling dekat tersebut tarik garis ke kiri sehingga bertemu dengan nilai 1,9 + 0,060 = 1,96. Batas kiri pengambilan keputusan dengan kurva adalah –1,96 batas kanannya +1,96. Keputusannya: Tolak H0 dan Terima H1 jika –z hitung < dari –1,96 dan > dari +1,96. Sebaliknya, Terima H0 dan Tolak H1 jika – z hitung > -1,96 dan < dari +1,96.
26 | P a g e S T A T I S T I K A P E N E L I T I A N S U R V E Y - A I S
N = 0,05 = 0,025
5 0,900 -
6 0,829 0,886
7 0,714 0,786
8 0,643 0,738
9 0,600 0,683
10 0,564 0,648
11 0,523 0,623
12 0,497 0,591
13 0,475 0,566
14 0,457 0,545
15 0,441 0,525
16 0,425 0,507
17 0,412 0,490
18 0,399 0,476
19 0,388 0,462
20 0,377 0,450
21 0,368 0,438
22 0,359 0,428
23 0,351 0,418
24 0,343 0,409
25 0,336 0,400
26 0,329 0,392
27 0,323 0,385
28 0,317 0,377
29 0,311 0,370
30 0,305 0,364
KOEFISIEN KONTINGENSI
Digunakan untuk mencari hubungan 2 variabel yang berskala nominal dan atau
ordinal.
Banyak Penelitian Kedokteran dan kesehatan atau penelitian lainnya dilakukan untuk memperoleh jawaban ttg ―Hubungan antara dua variabel‖
Misalnya : ☺ Merokok dan kanker ☺ Pengobatan dan kesembuhan ☺ Kolesterol dan penykit jantung koroner ☺ Berat badan dan diabetes ☺ Nutrisi dan intelegensi dlsb.
Dengan uji ini dapat diketahui ―Apakah dua variabel saling berhubungan (tergantung, mempengaruhi, dependen) atau tidak saling berhubungan‖
Hipotesis nol (H0) menyatakan ―kedua variabel tidak saling berhubungan‖
27 | P a g e S T A T I S T I K A P E N E L I T I A N S U R V E Y - A I S
Dengan uji itu dapat diketahui apakah hubungan yang teramati antara kedua variabel secara statistik bermakna (significant), ataukah peran peluang terlalu besar sehingga keterkaitan yang teramati dapat dikatakan tidak bermakna.
Data yang dianalisis berasal dari sebuah sampel acak dari sebuah populasi Data dianalisis menurut dua variabel :
Variabel I : dibagi menjadi c kategori Variabel II : dibagi menjadi r kategori shg diperoleh tabel r x c
• Karena tabel r x c menunjukkan tingkat ketergantungan antara dua kriteria, maka tabel itu disebut TABEL KONTINGENSI (Contingency table)
ij
ijij
E
EO2
2
Tiap-tiap sel tabel berisi :
Oij : frekuensi pengamatan (observation)
Eij : frekuensi harapan (expectation)
Statistik Uji Chi-Square adalah :
n
nnE
ji
ij
x
Oij : frekuensi pengamatan (observation) pada sel ij
Eij : frekuensi harapan (expectation) pada sel ij
Dengan derajat bebas = (r-1)(c-1)
Khusus untuk tabel 2 x 2 dapat digunakan rumus alternatif :
))()()((
)( 22
dbcadcba
bcadN
Koefisien Kontingensi : N
C
2
2
dibandingkan dengan Cmax dimana √
(m= harga minimm dari baris
dan kolom)
Contoh :
Pengaruh Pemahaman Instruksi Terhadap Kepatuhan Berobat
Pemahaman Instruksi
Kepatuhan Berobat Total
Rendah Tinggi
Rendah 4 6 10
Tinggi 1 59 60
Total 5 65 70
Pada tabel kontingensi di atas menjelaskan bahwa pemahaman instruksi yang diberikan petugas kesehatan kepada pasien pada kategori rendah akan mengakibatkan kepatuhan berobat yang rendah, sebaliknya pada kategori tinggi
28 | P a g e S T A T I S T I K A P E N E L I T I A N S U R V E Y - A I S
akan mengakibatkan kepatuhan berobat yang tinggi pula. Untuk lebih jelasnya dilakukan pengujian statistik Chi Square sebagai berikut: H0 : tidak ada pengaruh pemahaman instruksi terhadap kepatuhan berobat H1 : ada pengaruh pemahaman instruksi terhadap kepatuhan berobat
Chi-Square Pengaruh Pemahaman Instruksi Terhadap Kepatuhan Berobat
Chi-Square Tests
Value Df
Asymp. Sig. (2-sided)
Exact Sig. (2-sided)
Exact Sig. (1-sided)
Pearson Chi-Square 18.990a 1 .000
Continuity Correctionb 13.650 1 .000
Likelihood Ratio 12.392 1 .000
Fisher's Exact Test .001 .001
Linear-by-Linear Association
18.718 1 .000
N of Valid Casesb 70
a. 2 cells (50.0%) have expected count less than 5. The minimum expected count is .71.
b. Computed only for a 2x2 table
Berdasarkan tabel di atas bahwa nilai chi-square (χ2) = 18,990 yang nilai ini lebih besarl dari χ2 tabel (χ2 dengan α = 5% dan derajat bebas = 1 yaitu 3,841) maka hipotesis Ho ditolak. Cara lain yaitu menggunakan nilai p = 0,000 nilai ini lebih besar dari α = 5% maka hipotesis nol diterima. Kesimpulannya adalah terdapat pengaruh pemahaman instruksi terhadap kepatuhan berobat pasien TBC paru di Puskesmas Cikarang. Artinya pemahaman instruksi yang rendah akan mengakibatkan kepatuhan berobat yang rendah atau pemahaman instruksi yang tinggi akan mengakibatkan kepatuhan berobat yang tinggi. Selanjutnya untuk menilai besarnya pengaruh pemahaman instruksi terhadap kepatuhan berobat pasien TBC paru di Puskesmas Cikarang digunakan koefisien kontingensi (C) yang dibandingkan dengan (Cmax). Adapun nilai koefisien kontingensi diperoleh dalam tabel sebagai berikut:
Tabel 4.20. Ukuran Keeratan Pengaruh Pemahaman Instruksi Terhadap Kepatuhan Berobat
Symmetric Measures
Value
Approx. Sig.
Nominal by Nominal
Contingency Coefficient
.462 .000
N of Valid Cases 70
Dari tabel diatas diperoleh cilai C= 0,462 kemudian dibandingkan dengan Cmax ditentukan sebagai berikut:
√
= √
= 0,707 (m= harga minimm dari baris dan kolom)
29 | P a g e S T A T I S T I K A P E N E L I T I A N S U R V E Y - A I S
Perbandingan nilai C dengan Cmax =
maka
= 0,653
Hasil perbandingan nilai (C) dengan (Cmax) diperoleh nilai 0,653. Nilai ini menunjukkan bahwa derajat keeratan pengaruh yang positif dan erat dari pemahaman instruksi terhadap kepatuhan berobat pasien TBC paru di Puskesmas Cikarang. Berdasarkan tabel klasifikasi batas—batas nilai C derajat keeratan sebesar 0,653 dengan demikian hasil penelitian ini dikalsifikasikan pada kategori kuat. Hal ini menunjukkan bahwa makin besar atau makin dekat harga C kepada Cmax
makin besar derajat asosiasi antar faktor. Artinya faktor yang satu makin berkaitan dengan faktor lain atau dengan kata lain derajat keeratannya tinggi. Dengan demikian menunjukkan bahwa pengaruh pemahaman instruksi terhadap kepatuhan berobat pasien TBC paru di Puskesmas Cikarang mempunyai daya keeratan sebesar 0,653 x 100% atau sama dengan 65,3%. Dari hal tersebut dapat ditarik kesimpulan bahwa kontribusi pemahaman instruksi terhadap kepatuhan berobat pasien TBC paru di Puskesmas Cikarang sebesar 65,7% sedangkan sisanya sebesar 34,7% dipengauhi oleh faktor lain, seperti kepuasan pasien terhadap pelayanan Puskesmas Cikarang, faktor dokter, faktor tenaga kesehatan dan lain-lain.
PENELITIAN KOMPARASI (PERBANDINGAN)
29
A. RELATED SAMPLE (SAMPEL BERKORELASI)
22
1
1DDn
n
Dt
D = selisih antara subjek berpasangan
n = ukuran sampel
HIPOTESIS :
1. Dua Pihak (Two Side) 2. Satu Pihak
H0 : sbl = ssd H0 : sbl = ssd
H1 : sbl ssd H1 : sbl < ssd
or H1 : sbl > ssd
Kriteria keputusan :
Jika t > t (n-1) maka Tolak H0 (satu pihak)
Jika t > t /2 (n-1) maka Tolak H0 (dua pihak)
SISWA SEBELUM TRAINING SESUDAH TRAINING
A 35 37
B 30 38
C 35 39
D 36 36
E 41 42
F 40 44
G 30 35
H 40 38
I 41 40
J 31 41
SKOR MOTIVASI
Pertanyaannya :
Apakah skor motivasi meningkat setelah
dilakukan training (AMT = Achievement
Motivation Training)?
30 | P a g e S T A T I S T I K A P E N E L I T I A N S U R V E Y - A I S
Penyelesaian:
H0 : sbl = ssd (Skor motivasi sebelum dan sesudah training sama saja)
H1 : sbl < ssd (Skor motivasi sebelum training lebih rendah sesudah training)
Diperoleh nilai : t = -2,532 (abaikan nilai minus) shg
t = 2,532. Kemudian bandingkan dgn t tabel sebagai
berikut :
Dengan α = 5% (tingkat keyakinan 95%) dan
derajat bebas (db) = n-1 = 10 – 1 = 9, diperoleh
t5%(9) = 1,833. Ternyata t = 2,532 > t tabel ; maka
tolak H0. Kesimpulan : Dengan tingkat keyakinan
95% , ternyata motivasi siswa meningkat setelah
dilakukan training .
Dengan α = 1% (tingkat keyakinan 99%) dan
derajat bebas (db) = n-1 = 10 – 1 = 9, diperoleh
t1%(9) = 2,821. Ternyata t = 2,532 < t tabel ; maka
terima (gagal tolak) H0. Kesimpulan : Dengan
tingkat keyakinan 99% , ternyata motivasi siswa
tidak meningkat setelah dilakukan training atau
motivasi siswa sebelum dan sesudah training AMT,
sama saja
PES X sbl X ssd D D2
A 35 37 -2 4
B 30 38 -8 64
C 35 39 -4 16
D 36 36 0 0
E 41 42 -1 1
F 40 44 -4 16
G 30 35 -5 25
H 40 38 2 4
I 41 40 1 1
J 31 41 -10 100
JUMLAH -31 231
532,2
31)231.(10110
1
31
2
t
B. SAMPEL TAK BERKORELASI (SAMPEL SALING INDEPENDEN)
2
).1().1(
dimana
21
2
22
2
112
2
2
1
2
21
nn
SnSnS
n
S
n
S
XXt
g
gg
HIPOTESIS :
1. Dua Pihak (Two Side) 2. Satu Pihak
H0 : 1= 2 H0 : 1 = 2
H1 : 1 2 H1 : 1< 2
or H1 : 1 > 2
Kriteria keputusan :
Jika t > t (n1 + n2 - 2) maka Tolak H0 (satu pihak)
Jika t > t /2 (n1 + n2 - 2) maka Tolak H0 (dua pihak)
METODE A METODE B
9 6
9 7
5 5
10 8
6 5
8 6
6 7
7 5
9 4
6 7
SKOR TRAINING
Apakah metode A lebih efektif
dibandingkan metode B dalam
meningkatkan skor training
peserta?
31 | P a g e S T A T I S T I K A P E N E L I T I A N S U R V E Y - A I S
Penyelesaian:
H0 : 1= 2 Metode A dan B sama efektifnya dlm meningkatkan motivasi peserta
H1 : 1 > 2 Metode A lebih efektif dibanding metode B dlm meningkatkan motivasi peserta
X1 X2 X12 X2
2
9 6 81 36
9 7 81 49
5 5 25 25
10 8 100 64
6 5 36 25
8 6 64 36
6 7 36 49
7 5 49 25
9 4 81 16
6 7 36 49
75 60 589 374
56,1
)110(10
)60()374.(10
)1(
.
94,2)110(10
)75()589.(10
)1(
.
222
2
2
222
2
1
nn
XXnS
nn
XXnS
25,218
)56,1).(9()94,2).(9(
21010
)56,1).(110()94,2).(110(2
gabS
25,22
)56,1)94,2(
2
2
2
2
12
SS
Sgab
236,2
10
25,2
10
25,2
6- 7,5
2
2
1
2
21
n
S
n
S
XXt
gg
Diperoleh nilai : t = 2,236. Kemudian bandingkan
dgn t tabel sebagai berikut :
Dengan α = 5% (tingkat keyakinan 95%) dan
derajat bebas (db) = n1+n2-2 = 10+10-2 = 18,
diperoleh t5%(18) = 1,734. Ternyata t = 2,236 > t
tabel ; maka tolak H0. Kesimpulan : Dengan tingkat
keyakinan 95% , ternyata metode A lebih efektif
meningkatkan hasil belajar siswa dibandingkan
dengan metode B.
Dengan α = 1% (tingkat keyakinan 99%) dan
derajat bebas (db) = 18, diperoleh t1%(18) = 2,552.
Ternyata t = 2,236 < t tabel ; maka terima (gagal
tolak) H0. Kesimpulan : Dengan tingkat keyakinan
99% , ternyata metode A dan B sama saja
efektifnya dalam meningkatkan hasil belajar siswa
32 | P a g e S T A T I S T I K A P E N E L I T I A N S U R V E Y - A I S
PENGOLAHAN DATA DENGAN SPSS :1. RELATED SAMPLE (YANG BERKORELASI)
Pilihannya : PAIRED SAMPLES STATISTICS, diperoleh :
t df sig
------------------------------------- Terlihat P-Value : 0,032 < 5%
-2,532 9 0,032 Maka TOLAK H0
-------------------------------------
2. INDEPENDENT SAMPLES TEST (TAK BERKORELASI)
t df sig
------------------------------------- Terlihat P-Value : 0,038 < 5%
2,236 18 0,038 Maka TOLAK H0
-------------------------------------
UJI PERBEDAAN (KOMPARASI) LEBIH DARI 2 SAMPEL
Uji Perbedaan Lebih dari 2 Sampel yang INDEPENDEN
Menggunakan ONE-WAY ANOVA (ANOVA satu arah)
Analisis Variansi adalah teknik analisis statistik yang dikembangangkan dan diperkenalkan pertama kali oleh Sir Ronald A. Fisher (Bapak statistika dunia).
Uji perbedaan mean (uji t) dapat dipandang sebagai penyederhanaan dari teknik ANAVA
ANAVA dapat juga dipahami sebagai perluasan dari uji t sehingga penggunaannya tidak terbatas pada pengujian perbedaan dua buah rata-rata populasi, namun dapat juga digunakan untuk 3 buah populasi atau lebih.
Gambaran singkat : misalkan kita hendak menguji perbedaan produktivitas kerja karyawan yang berasal dari golongan A, B, dan C. Disini kita mempunyai tiga skor produktivitas kerja dari karyawan yang tergolong pada kelompok golongan A, B dan C. Dengan uji t tidak dapat digunakan untuk menguji perbedaan rata-rata (mean) ketiga perangkat skor sekaligus. Sebagian orang berfikir bahwa masalah tersebut dapat diatasi dengan uji t secara berulang-ulang (melakukan uji t tiga kali), yaitu uji perbedaan AB, AC dan BC. Dengan demikian ada tidaknya perbedaan rata-rata diantara ketiga populasi tersebut dapat diketahui.
Dengan uji t tiga kali secara independen, besarnya tingkat keyakinan 95%, berarti (0,95%)3 dengan demikian tingkat kekeliruan α = 14%.
33 | P a g e S T A T I S T I K A P E N E L I T I A N S U R V E Y - A I S
DESAIN PENELITIAN DAN ASUMSI
ANOVA satu jalur (one way ANOVA) digunakan dalam suatu penelitian yang memiliki ciri-ciri sebagai berikut:
1. Melibatkan hanya satu variabel bebas (variabel independen) dengan dua kategori atau lebih yang dipilih dan ditentukan oleh peneliti secara tidak acak. Kategori yang dipilih tidak acak karena peneliti tidak bermaksud menggeneralisasikan hasilnya ke kategori lain di luar yang diteliti pada variabel itu.
2. Perbedaan antara kategori atau tingkatan pada variabel bebas dapat bersifat kualitatif (contoh : Pria dan Wanita) atau kuantitatif (contoh : 1 kali, 2 kali, dan 3 kali).
3. Setiap subyek merupakan anggota dari hanya satu kelompok (kategori) pada variabel bebas dan dipilih secara acak dari populasi tertentu.
ASUMSI DASARnya : independent of scores (nilai-nilainya saling independen), datanya berdistribusi normal, dan variansi populasinya homogen.
Rumus ONE WAY ANOVA (ANAVA satu jalur)
N
i
N
i
N
N
1
2
ij2
ijT
2
ij
ij
2
ij
B
1 ij
2
ij2
ijW
YYSS .3
Y
n
YSS .2
n
YYSS 1.
Contoh : ONE WAY ANOVA Misalkan tiga Metode (A, B, dan C) dicobakan untuk menilai Hasil Training . Hasilnya adalah sebagai berikut:
Metode A Metode B Metode C
34 35 28 26 30 22
33 37 24 35 28 29
34 31 27
SSW = Sum Square Within = Jumlah Kuadrat Dalam Kelompok (JKD) SSB = Sum Square Between = Jumlah Kuadrat Antar Kelompok (JKA) SST = Sum Square Total = Jumlah Kuadrat Total (JKT)
34 | P a g e S T A T I S T I K A P E N E L I T I A N S U R V E Y - A I S
33 30 22 Apakah terdapat perbedaan antar metode training (perlakuan) terhadap hasil
training (apakah terdapat pengaruh metode training terhadap hasil training)?
Penyelesaian secara manual :
Metode A Metode B Metode C
34 35 28
26 30 22
33 37 24
35 28 29
34 31 27
33 30 22
Jumlah Jumlah Jumlah
195 191 152
7778,347
18
22...2634)22...2634(
1111,18818
22...2634
6
152
6
191
6
195
6667,1596
152
6
191
6
195)22...2634(
2
222
2222
222222
T
B
W
SS
SS
SS
HIPOTESIS : H0 : μ1 = μ2 = μ3 H1 : paling sedikit ada satu yang berbeda
Tabel Analysis of Variance (ANOVA) :
Sumber Variasi JK Db RJK F
Antar Kelompok 188.1111 2 94.05556 8.836117
Dalam Kelompok 159.6667 15 10.64444
Jumlah 347.7778 17
Dari table ANOVA di atas diperoleh nilai F = 8,836117 ≈ 8,84
35 | P a g e S T A T I S T I K A P E N E L I T I A N S U R V E Y - A I S
Dibandingkan dengan F table → F0,05(2, 15) = 3,68 dan F0,01(2, 15) = 6,36 Ternyata F = 8,84 > F0,01(2, 15) = 6,36, maka Tolak H0 Kesimpulan : Terdapat perbedaan metode training yang sangat signifikan terhadap hasil training atau dengan kata lain metode training sangat berpengaruh terhadap hasil training. CATATAN :
Setelah H0 ditolak (sangat signifikan atau signifikan saja) dilanjutkan dengan uji
perbadingan berganda (multiple comparison) atau uji pasca ANOVA, banyak pilihan
diantaranya :
1. LSD (Least Significance Difference) atau Beda Nyata Terkecil (BNT) 2. HSD (Honestly Significance Difference) atau Beda Nyata Jujur (BNJ) atau juga
dikenal dengan Uji TUKEY. 3. Duncan Range Area, Bonferroni, Uji Scheffe, dll
Penyelesaian melalui SPSS
ANOVA
HASIL
Sum of Squares df Mean Square F Sig.
Between Groups 188.111 2 94.056 8.836 .003
Within Groups 159.667 15 10.644
Total 347.778 17
Uji Pasca Anova dengan Uji BNJ (Beda Nyata Jujur) atau HSD (Honestly Significance
Difference) dari Tukey adalah :
Homogeneous Subsets
HASIL
Tukey HSDa
METODE N
Subset for alpha = 0.05
1 2
METODE C 6 25.33
METODE B 6 31.83
METODE A 6 32.50
Sig. 1.000 .934
Means for groups in homogeneous subsets are displayed.
a. Uses Harmonic Mean Sample Size = 6.000.
36 | P a g e S T A T I S T I K A P E N E L I T I A N S U R V E Y - A I S
37 | P a g e S T A T I S T I K A P E N E L I T I A N S U R V E Y - A I S
Analisis Multivariat
Analisis statistik multivariat merupakan metode statistik yang memungkinkan kita
melakukan penelitian terhadap lebih dari dua variable secara bersamaan. Dengan
menggunakan teknik analisis ini maka kita dapat menganalisis pengaruh beberapa
variable terhadap variabel – (variable) lainnya dalam waktu yang bersamaan.
Contoh kita dapat menganalisis pengaruh variable kualitas produk, harga dan
saluran distribusi terhadap kepuasan pelanggan. Contoh yang lain, misalnya
pengaruh kecepatan layanan, keramahan petugas dan kejelasan memberikan
informasi terhadap kepuasan dan loyalitas pelanggan. Analisis multivariat digunakan
karena pada kenyataannnya masalah yang terjadi tidak dapat diselesaikan dengan
hanya menghubung-hubungkan dua variable atau melihat pengaruh satu variable
terhadap variable lainnya. Sebagaimana contoh di atas, variable kepuasan
pelanggan dipengaruhi tidak hanya oleh kualitas produk tetapi juga oleh harga dan
saluran distribusi produk tersebut.
Klasifikasi Teknik-Teknik Analisis Multivariat
Teknik analisis multivariat secara dasar diklasifikasi menjadi dua, yaitu analisis
dependensi dan analisis interdependensi.
Analisis dependensi berfungsi untuk menerangkan atau memprediski variable
(variable) tergantung dengan menggunakan dua atau lebih variable bebas. Yang
termasuk dalam klasifikasi ini ialah analisis regresi linear berganda, analisis
diskriminan, analisis varian multivariate (MANOVA), dan analisis korelasi kanonikal
Analisis interdependensi berfungsi untuk memberikan makna terhadap
seperangkat variable atau membuat kelompok-kelompok secara bersama-sama.
Yang termasuk dalam klasifikasi ini ialah analIsis faktor, analisis kluster, dan
multidimensional scaling. Contoh membuat klasifikasi terhadap kelompok
pengunjung supermarket tertentu.
Metode interdependensi diklasifikasikan didasarkan pada jenis masukan variable
dengan skala pengukuran bersifat metrik atau non metrik. Jika masukan data
berskala metrik, maka kita dapat menggunakan teknik analisis faktor, analisis
38 | P a g e S T A T I S T I K A P E N E L I T I A N S U R V E Y - A I S
kluster dan multidimensional scaling. Jika masukan data berskala non-metrik,
maka kita hanya dapat menggunakan teknik analisis multidimensional scaling.
1. Analisis Regresi Linear Berganda
Yang dimaksud dengan analisis regresi linear berganda ialah suatu analisis
asosiasi yang digunakan secara bersamaan untuk meneliti pengaruh dua atau lebih
variable bebas terhadap satu variable tergantung dengan skala interval. Pada
dasarnya teknik analisis ini merupakan kepanjangan dari teknik analisis regresi linear
sederhana. Untuk menggunakan teknik analisis ini syarat-syarat yang harus dipenuhi
diantaranya ialah:
Data harus berskala interval.
Variabel bebas terdiri lebih dari dua variable.
Variabel tergantung terdiri dari satu variable.
Hubungan antar variable bersifat linier. Artinya semua variable bebas
mempengaruhi variable tergantung. Pengertian ini secara teknis disebut bersifat
rekursif, maksudnya pengaruh bersifat searah dari variable-variabel X ke Y Tidak
boleh terjadi sebaliknya atau juga saling berpengaruh secara timbal balik
(reciprocal).
Tidak boleh terjadi multikolinieritas. Artinya sesama variable bebas tidak boleh
berkorelasi terlalu tinggi, misalnya 0,9 atau terlalu rendah, misalnya 0,01.
Tidak boleh terjadi otokorelasi. Akan terjadi otokorelasi jika angka Durbin dan
Watson sebesar < 1 atau > 3 dengan skala 1 – 4.
Jika ingin menguji keselarasan model (goodness of fit), maka dipergunakan
simpangan baku kesalahan. Untuk kriterianya digunakan dengan melihat angka
Standard Error of Estimate (SEE) dibandingkan dengan nilai simpangan baku
(Standard Deviation). Jika angka Standard Error of Estimate (SEE) < simpangan
baku (Standard Deviation), maka model dianggap selaras.
Kelayakan model regresi diukur dengan menggunakan nilai signifikansi. Model
regresi layak dan dapat dipergunakan jika angka signifikansi lebih kecil dari 0,05
(dengan presisi 5%) atau 0,01 (dengan presisi 1%)
2. Analisis Diskriminan
Yang dimaksud dengan analisis diskriminan ialah suatu teknik statistik yang yang
digunakan untuk memprediksi probabilitas obyek-obyek yang menjadi milik dua
39 | P a g e S T A T I S T I K A P E N E L I T I A N S U R V E Y - A I S
atau lebih kategori yang benar-benar berbeda yang terdapat dalam satu variable
tergantung didasarkan pada beberapa variable bebas.
Lebih lanjut analisis diskriminan digunakan untuk membuat satu model prediksi
keanggotaan kelompok didasarkan pada karakteristik-karakteristik yang
diobservasi untuk masing-masing kasus. Prosedur ini akan menghasilkan fungsi
diskriminan yang didasarkan pada kombinasi-kombinasi linier yang berasal dari
variabel-variabel prediktor atau bebas yang dapat menghasilkan perbedaan
paling baik antara kelompok-kelompok yang dianalisis. Semua fungsi dibuat dari
sampel semua kasus bagi keanggotaan kelompok yang sudah diketahui. Fungsi-
fungsi tersebut dapat diaplikasikan untuk kasus-kasus baru yang mempunyai
pengukuran untuk semua variabel bebas tetapi mempunyai keanggotaan
kelompok yang belum diketahui.
Tujuan utama menggunakan analisis diskriminan ialah melihat kombinasi linier.
Artinya untuk mempelajari arah perbedaan-perbedaan yang terdapat dalam
suatu kelompok sehingga diketemukan adanya kombinasi linier dalam semua
variable bebas. Kombinasi linier ini terlihat dalam fungsi diskriminan, yaitu
perbedaan-perbedaan dalam rata-rata kelompok. Jika menggunakan teknik ini,
pada praktiknya peneliti mempunyai tugas pokok untuk menurunkan koefesien-
koefesien fungsi diskriminan (garis lurus). Sebagai contoh: Jenis pelanggan
kereta api secara umum dapat dibagi dua, yaitu mereka yang menggunakan jasa
kereta api eksekutif dan bisnis/ekonomi. Untuk membuat klasifikasi ini prosedur
analisis diskriman dapat digunakan sehingga kita dapat mengetahui faktor-faktor
yang berpengaruh terhadap pembuatan klasifikasi tersebut. Tujuan melakukan
klasifikasi tersebut ialah kita dapat mengetahui apakah pengelompokan tersebut
signifikan atau tidak. Artinya kelompok yang menggunakan jasa kereta api
eksekutif memang benar-benar berbeda dengan kelompok yang menggunakan
kelas bisnis / ekonomi.
Untuk menggunakan teknik analisis ini syarat-syarat yang harus dipenuhi
diantaranya ialah:
Variabel tergantung hanya satu dan bersifat non-metrik, artinya data harus
kategorikal dan berskala nominal.
Variabel bebas terdiri lebih dari dua variable dan berskala interval.
Semua kasus harus independent
40 | P a g e S T A T I S T I K A P E N E L I T I A N S U R V E Y - A I S
Semua variabel prediktor sebaiknya mempunyai distribusi normal multivariat,
dan matrices variance-covariance dalam kelompok harus sama untuk semua
kelompok.
Keanggotaan kelompok diasumsikan ekseklusif, maksudnya tidak satupun
kasus yang termasuk dalam kelompok lebih dari satu. dan exhaustive secara
kolektif, maksudnya semua kasus merupakan anggota satu kelompok.
3. Analisis Faktor
Yang dimaksud dengan analisis faktor ialah suatu teknik analisis yang digunakan
untuk memahami yang mendasari dimensi-dimensi atau regularitas suatu gejala.
Tujuan utama teknik ini ialah untuk membuat ringkasan informasi yang
dikandung dalam sejumlah besar variable kedalam suatu kelompok faktor yang
lebih kecil. Secara statistik tujuan pokok teknik ini ialah untuk menentukan
kombinasi linear variable-variabel yang akan membantu dalam penyeledikan
saling keterkaitannya variable-variabel tersebut. Atau dengan kata lain
digunakan untuk mengidentifikasi variabel-variabel atau faktor-faktor yang
menerangkan pola hubungan dalam seperangkat variabel.
Teknik ini bermanfaat untuk mengurangi jumlah data dalam rangka untuk
mengidentifikasi sebagian kecil faktor yang dapat menerangkan varians yang
sedang diteliti secara lebih jelas dalam suatu kelompok variabel yang jumlahnya
lebih besar. Kegunaan utama analisis faktor ialah untuk melakukan pengurangan
data atau dengan kata lain melakukan peringkasan sejumlah variabel menjadi
lebih kecil jumlahnya. Pengurangan dilakukan dengan melihat interdependensi
beberapa variabel yang dapat dijadikan satu yang disebut dengan faktor
sehingga diketemukan variabel-variabel atau faktor-faktor yang dominan atau
penting untuk dianalisa lebih lanjut.
Prosedur analisis faktor juga dapat digunakan untuk membuat hipotesis yang
mempertimbangkan mekanisme sebab akibat atau menyaring sejumlah variabel
untuk kemudian dilakukan analisis selanjutnya, misalnya mengidentifikasi
kolinearitas sebelum melakukan analisis regresi linear.
Sebagai contoh dalam suatu penelitian, kita ingin mengetahui sikap-sikap apa
saja yang mendasari orang mau memberikan jawaban terhadap pertanyaan-
pertanyaan dalam suatu survei politik?
41 | P a g e S T A T I S T I K A P E N E L I T I A N S U R V E Y - A I S
Dari hasil penelitian didapatkan adanya tumpang tindih yang signifikan antara
berbagai sub-kelompok butir-butir pertanyaan, misalnya pertanyaan-pertanyaan
mengenai masalah perpajakan cenderung untuk berkorelasi satu dengan
lainnya, masalah militer saling berkorelasi, masalah ekonomi juga demikian. Jika
terjadi demikian, maka kita sebaiknya menyelesaikan persoalan tersebut dengan
menggunakan analisis faktor.
Dengan teknik ini kita dapat melakukan penyelidikan sejumlah faktor yang
mendasarinya dan dapat mengidentifikasi faktor-faktor apa saja yang
mewakilinya secara konseptual. Tidak hanya itu, kita juga dapat menghitung
nilai-nilai untuk masing-masing responden dan kemudian dipergunakan untuk
analisis selanjutnya. Sebagai contoh kita dapat membuat model regresi logistik
untuk memprediksi perilaku pemberian suara didasarkan pada nilai-nilai faktor.
Untuk menggunakan teknik ini persyaratan yang sebaiknya dipenuhi ialah:
Data yang digunakan ialah data kuantitatif berskala interval atau ratio.
Data harus mempunyai distribusi normal bivariate untuk masing-masing
pasangan variable.
Model ini mengkhususkan bahwa semua variabel ditentukan oleh faktor-faktor
biasa (faktor-faktor yang diestimasikan oleh model) dan faktor-faktor unik
(yang tidak tumpang tindih antara variabel-variabel yang sedang diobservasi).
Estimasi yang dihitung didasarkan pada asumsi bahwa semua faktor unik are
tidak saling berkorelasi satu dengan lainnya dan dengan faktor-faktor biasa.
Persyaratan dasar untuk melakukan penggabungan ialah besarnya korelasi
antar variabel independen setidak-tidaknya 0,5 karena prinsip analisis faktor
ialah adanya korelasi antar variabel.
Analisis Faktor sendiri ada 2 (dua) pendekatan, yakni Analisis Faktor Eksploratori
(Exploratory Factor Analysis) dan Analisis Faktor Konfirmatori (Confirmatory
Factor Analysis). Perbedaan dua pendekatan ini yang utama adalah pada EFA
menganalisis data dengan tidak berdasar pada teori, sedang CFA sebaliknya,
yaitu menganalisis data dengan berdasarkan teori yang kuat. Jika EFA dilakukan
dengan bantuan software SPSS, namun CFA jauh lebih baik menggunakan
software lain, seperti LISREL, AMOS atau Mplus.
42 | P a g e S T A T I S T I K A P E N E L I T I A N S U R V E Y - A I S
KEPUSTAKAAN
Agung, I.G.N. 2006. Statistika: Penerapan Model Rerata Sel Multivariat dan Model
Ekonometri dengan SPSS. Jakarta: Yayasan Sad Satria Bhakti.
Antara, N.S. 2012. Pengolahan dan Analisis Data. Universitas Udayana, Bali.
Gall, M.D, Joyce P. Gall, Walter R. Borg. 2007. Educational Research: An Introduction,
Eighth Edition. New York: Pearson.
Stern, R., Coe, R., Allan, E., and Dale, I., 2004. Good Statistic Practice for Natural
Resources Research, London UK: CABI Publishing.
Sudjana, 2000. Metode Statistika. Bandung: Tarsito.
Weiss, Neil A, 2004. Elementary Staististics, 6 ed. Boston: PWS Kent.