tinjauan praktis dari aplikasi statistika

28
Tinjauan Praktis dari Aplikasi Statistika Nusar Hajarisman Jurusan Statistika, Universitas Islam Bandung Jalan Purnawarman No. 63 Bandung 40116 [email protected] RINGKASAN Selamat datang di dunia statistika, suatu karya seni untuk menggambarkan kesimpulan berdasarkan pada data yang tidak sempurna. Pada makalah ini akan diberikan berbagai contoh untuk menunjukkan bahwa metode statistika memegang peranan penting dalam berbagai bidang penelitian. Dalam makalah ini juga akan dibahas mengenai berbagai ruang lingkup statistika, mulai dari tahap perencanaan sampai dengan hasil akhirnya. Konsep-konsep dasar utama yang perlu dipahami untuk menerapkan pendekatan statistika dalam menyelesaikan berbagai masalah juga akan diberikan pada makalah ini. Kata Kunci: Perancangan penelitian, analisis data eksplorasi, penaksiran, pengujian hipotesis, skala pengukuran, model dan asumsi, populasi dan sampel, ukuran pemusatan, ukuran penyebaran, analisis regresi dan korelasi, statistika multivariat. 1. Pendahuluan Setiap upaya perubahan memberikan kemajuan dan pengalaman. Setiap perubahan- perubahan terencana yang didasarkan pada dunia nyata selalu menimbulkan ketidakpastian. Setiap pengulangan senantiasa menimbulkan keragaman atau variasi. Kemajuan dan pengalaman ini menjadi harapan, cita-cita, dan tujuan dari setiap perkembangan dalam kehidupan. Keinginan untuk mendapatkan kepastian dan ketepatan serta ketelitian menyebabkan berkembangnya ilmu-ilmu yang dapat membuat struktur dan pola dari ketidakpastian dengan menumbuhkan berbagai pengukuran dari setiap informasi. Pola berpikir ini mendorong perkembangan statistika sebagai ilmu dan profesi. Pemakaian statistika makin berperan untuk mendukung perkembangan bidang ilmu lainnya. Kebutuhan akan kemampuan melakukan dan menerapkan analisis secara statistika sudah menyentuh pada berbagai bidang penelitian bukan pada tahapan teorinya saja melainkan sampai pada tahap aplikasinya. Kemudian kita perlu suatu metode untuk mengeksplorasikan informasi yang diperoleh dari data pengamatan atau yang dikumpulkan untuk memperoleh pemahaman yang lebih mendalam mengenai situasi yang dihadapi. Beberapa teknik statistika dan analisis data dapat dengan mudah untuk dipelajari dan digunakan, bahkan ketika dibutuhkan teori-teori matematis yang begitu kompleks. Dalam buku ini, pembahasan akan difokuskan pada ide-ide, konsep, dan metode statiska, peluang, serta analisis data. Bahkan untuk seorang ahli statistika yang paling profesional sekalipun akan mendapatkan kesulitas apabila dihadapkan pada setumpuk data sebagaimana yang ditunjukkan pada Gambar 1. Terdapat banyak metode statistika yang tujuannya adalah

Upload: fanny-tania-safitri

Post on 07-Aug-2015

139 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Tinjauan Praktis Dari Aplikasi Statistika

Tinjauan Praktis dari Aplikasi Statistika

Nusar Hajarisman Jurusan Statistika, Universitas Islam Bandung Jalan Purnawarman No. 63 Bandung 40116 [email protected]

RINGKASAN

Selamat datang di dunia statistika, suatu karya seni untuk menggambarkan kesimpulan berdasarkan pada data yang tidak sempurna. Pada makalah ini akan diberikan berbagai contoh untuk menunjukkan bahwa metode statistika memegang peranan penting dalam berbagai bidang penelitian. Dalam makalah ini juga akan dibahas mengenai berbagai ruang lingkup statistika, mulai dari tahap perencanaan sampai dengan hasil akhirnya. Konsep-konsep dasar utama yang perlu dipahami untuk menerapkan pendekatan statistika dalam menyelesaikan berbagai masalah juga akan diberikan pada makalah ini.

Kata Kunci: Perancangan penelitian, analisis data eksplorasi, penaksiran, pengujian hipotesis, skala pengukuran, model dan asumsi, populasi dan sampel, ukuran pemusatan, ukuran penyebaran, analisis regresi dan korelasi, statistika multivariat.

1. Pendahuluan

Setiap upaya perubahan memberikan kemajuan dan pengalaman. Setiap perubahan-perubahan terencana yang didasarkan pada dunia nyata selalu menimbulkan ketidakpastian. Setiap pengulangan senantiasa menimbulkan keragaman atau variasi. Kemajuan dan pengalaman ini menjadi harapan, cita-cita, dan tujuan dari setiap perkembangan dalam kehidupan. Keinginan untuk mendapatkan kepastian dan ketepatan serta ketelitian menyebabkan berkembangnya ilmu-ilmu yang dapat membuat struktur dan pola dari ketidakpastian dengan menumbuhkan berbagai pengukuran dari setiap informasi.

Pola berpikir ini mendorong perkembangan statistika sebagai ilmu dan profesi. Pemakaian statistika makin berperan untuk mendukung perkembangan bidang ilmu lainnya. Kebutuhan akan kemampuan melakukan dan menerapkan analisis secara statistika sudah menyentuh pada berbagai bidang penelitian bukan pada tahapan teorinya saja melainkan sampai pada tahap aplikasinya.

Kemudian kita perlu suatu metode untuk mengeksplorasikan informasi yang diperoleh dari data pengamatan atau yang dikumpulkan untuk memperoleh pemahaman yang lebih mendalam mengenai situasi yang dihadapi. Beberapa teknik statistika dan analisis data dapat dengan mudah untuk dipelajari dan digunakan, bahkan ketika dibutuhkan teori-teori matematis yang begitu kompleks. Dalam buku ini, pembahasan akan difokuskan pada ide-ide, konsep, dan metode statiska, peluang, serta analisis data.

Bahkan untuk seorang ahli statistika yang paling profesional sekalipun akan mendapatkan kesulitas apabila dihadapkan pada setumpuk data sebagaimana yang ditunjukkan pada Gambar 1. Terdapat banyak metode statistika yang tujuannya adalah

Page 2: Tinjauan Praktis Dari Aplikasi Statistika

JURUSAN STATISTIKA, UNIVERSITAS ISLAM BANDUNG

2 Tinjauan Praktis dari Aplikasi Statistika

untuk membantu dalam memahami data. Salah satu alasan utama mengapa metode statistika itu diperlukan adalah untuk membuat lebih jelas hal-hal yang berkenaan dengan karakteristik dari suatu gugus data.

75 12

544761

3598

12

69 110

2555

46

65

10 33 22515

54

22

70

3

18

115 8

76

39

43

335

Gambar 1. Daftar sejumlah bilangan

Kemudian, bersamaan dengan berkembangnya teknologi yang semakin canggih memungkinkan untuk menghimpun, menyimpan, mengolah, dan menganalisis informasi untuk menghasilkan suatu keputusan maka staitistika merupakan ilmu yang semakin berperan nyata. Peranan dalam kehidupan makin melebar ke berbagai bidang kehidupan dan berbagai jenjang perkembangan ilmu pengetahuan dan teknologi. Tidak hanya angka dan kata saja yang diolah tapi juga semua gejala, nuansa, dan perilaku dinyatakan ukurannya dan dipolakan ketidakpastiannya.

Peranan statistika makin lama semakin bertambah penting dan pemakaiannya semakin meluas dalam berbagai bidang kehidupan, antara lain: industri, asuransi, perbankan, bisnis, lingkungan, kesehatan, pertanian, dan rekayasa. Dalam perkembangannya kegiatan statistika tidak hanya terbatas pada pengumpulan data, tetapi juga sebagai alat untuk merancang, mengelola, menganalisis dan menginterpretasikan data dengan cara sebaik-baiknya. Disamping membuat kesimpulan yang baik, juga harus dapat memperhitungkan resiko pengambilan keputusan tersebut.

Lalu apakah itu statistika? Statistika adalah suatu seni untuk membuat inferensi dan mengambil kesimpulan berdasarkan pada data yang tidak sempurna. Nilai-nilai dari data seringkali tidak sempurna, walaupun data itu sangat bermanfaat tapi tidak dapat menceritakan semua hal. Metode statistika dapat digunakan (dan mungkin seharusnya) dalam seluruh bagian studi, mulai dari tahapan awal sampai dengan akhir penelitian. Sebagai contoh, data dapat diperoleh dengan berbagai cara, mulai dari percobaan di laboratorium sampai dengan masalah survey opini publik. Dalam setiap studi, sebelum data dikumpulkan, maka rancangan studi harus dibentuk secara statistika, sehingga hasil analisisnya memberikan informasi sebanyak mungkin. Akhirnya, suatu pelaporan mengenai data harus dipersiapkan. Grafik, plot, maupun diagram sangat berguna dalam penyusunan laporan akhir ketika hasil-hasil utama penelitian harus dikomunikasikan kepada orang lain.

Page 3: Tinjauan Praktis Dari Aplikasi Statistika

© 2009 - NUSAR HAJARISMAN

3 2. Ruang Lingkup Statistika

Ketidaksempurnaan data dapat muncul dalam berbagai situasi. Penyebab utamanya adalah adanya kekeliruan atau galat pengukuran. Mengukur tinggi badan seorang individu mungkin merupakan persoalan yang mudah. Tetapi dalam banyak aspek melakukan pengukuran untuk objek yang diteliti adalah sulit dilakukan. Sebagai contoh, misalnya dalam penelitian sosial, untuk mengukur tingkat kesejahteraan rakyat bukan merupakan pekerjaan yang mudah. Apabila yang dijadikan kriteria untuk mengukur tingkat kesejahteraan adalah penghasilan yang diperoleh individu tersebut setiap tahunnya, maka seringkali ukuran ini memberikan galat pengukuran yang tinggi yang disebabkan oleh ketidakjujuran responden dalam menjawab pertanyaan. Hal-hal lain yang menyebabkan data itu tidak sempurna adalah ketersediaan data, ketersediaan biaya dan waktu untuk pengumpulan data.

2. Ruang Lingkup Statistika

Untuk memahami bagaimana menggunakan metode statistika, akan sangat berguna untuk memperhatikan berbagai jenis aktivitas yang biasa dilakukan dalam statistika. Ruang lingkup statistika secara umum dibagi ke dalam dua fase, yaitu statistika deskriptif dan statistika inferensi.

Perbedaan antara statistika statistika deskriptif dengan statistika inferensi akan menjadi jelas dengan memperhatikan dua contoh berikut ini.

Contoh 1. Badan Meterologi dan Geofisika (BMG) melaporkan bahwa rata-rata curah hujan pada bulan Desember selama 10 tahun terakhir ini adalah sebesar 3.3 cm. Angka yang dilaporkan oleh BMG ini adalah deskripsi mengenai rata-rata curah hujan yang terjadi pada bulan Desember pada 10 tahun terakhir. Kemudian, berdasarkan informasi yang ada itu, kita mengharapkan bahwa curah hujan untuk bulan Desember pada tahun berikutnya adalah berkisar antara 3.1 sampai dengan 3.5 cm. Dalam hal ini kita telah membuat generalisasi keadaan, dan untuk itu kita telah masuk ke dalam wilayah statistika inferensi.

Contoh 2. Catatan kelulusan selama lima tahun terakhir di suatu perguruan tinggi swasta menunjukkan bahwa 35% di antara mahasiswa baru yang masuk ke perguruan tinggi itu berhasil menyelesaikan studinya lebih dari lima tahun. Nilai numerik 85% tersebut adalah suatu statistika deskriptif. Apabila kemudian kita membuat perkiraan bahwa untuk tahun selanjutnya mahasiswa baru yang berhasil menyelesaikan studinya lebih dari lima tahun itu kurang dari 10%, maka kita telah masuk ke dalam fase statistika inferensi yang tentu saja harus diuji kebenarannya.

Berdasarkan uraian di atas, maka aktivitas atau ruang lingkup statistika dapat diperluas lagi menjadi empat kategori, yaitu: perancangan penelitian, analisis data eksplorasi, penaksiran, dan pengujian hipotesis. Aktivitas dalam perancangan penelitian dan analisis data eksplorasi masuk ke dalam fase statistika deskriptif, sedangkan aktivitas penaksiran dan pengujian hipotesis masuk ke dalam fase statistika inferensi. Berikut uraian dari masing-masing aktivitas tersebut.

2.1 Perancangan Penelitian

Merancang suatu penelitian merupakan aktivitas yang penting dalam memutuskan data seperti apa yang harus dikumpulkan, dimana tujuannya adalah untuk menjamin

Page 4: Tinjauan Praktis Dari Aplikasi Statistika

JURUSAN STATISTIKA, UNIVERSITAS ISLAM BANDUNG

4 Tinjauan Praktis dari Aplikasi Statistika

bahwa data menjadi sangat bermakna. Pengumpulan data memerlukan upaya yang besar, dan konsekuensinya kita perlu memberi perhatian khusus pada saat tahap perencanaan. Suatu rancangan penelitian yang baik akan mudah untuk dianalisis. Sebaliknya rancangan penelitian yang buruk akan sulit untuk dianalisis dan hasil-hasil penelitian mungkin tidak mampu untuk menjawab pertanyaan yang diajukan dalam penelitian.

Tentu saja tidak setiap usaha secara statistik terlibat dalam merancang suatu penelitian. Sebagai contoh misalnya ketika kita mempelajari data historis, kita dibatasi oleh ketersediaan informasi yang tercatat. Tetapi walaupun ketika suatu penelitian tidak secara eksplisit dilakukan, dasar-dasar mengenai suatu perancangan penelitian yang baik akan sangat bermanfaat dalam pemilihan suatu gugus data dari seluruh gugus data yang mungkin yang menghubungkan pada pertanyaan yang diajukan dalam penelitian.

Tahapa pertama yang paling penting dalam perancangan dan perencanaan penelitian adalah mengidentifikasi tujuan penelitian itu sendiri. Akan tetapi hal ini bukanlah suatu pekerjaan yang mudah, khususnya dalam tahap permulaan studi yang tujuan penelitiannya tidak begitu jelas. Sebagai contoh misalnya, tujuan penelitiannya adalah untuk melihat dampak perubahan kebijakan yang diterapkan pemerintah terhadap kesehatan masyarakat. Sebelum penelitian dilakukan, tujuan yang tidak jelas ini ruang lingkupnya harus dipersempit dengan jalan mengidentifikasi jenis penyakit yang ada dalam pertanyaan, populasi, kerangka waktu, dan seterusnya. Tujuan penelitian ini harus dipertimbangkan dengan matang sebelum penelitian itu sendiri dilakukan. Walaupun metode statistika adalah sangat penting, tetapi hendaknya suatu penelitian tidak harus direncanakan hanya berdasarkan aspek statistikanya saja. Berbagai aspek lainnya harus juga diperhitungkan, sepeti biaya, legalitas, etika, serta relevansi dari setiap aktivitas.

Prinsip-prinsip statistika dari suatu perancangan penelitian yang penting lainnya adalah randomisasi atau pengacakan. Konsep keacakan ini sangatlah penting dalam statistika dengan tujuan untuk menghilangkan kemungkinan munculnya faktor-faktor lain yang tidak diharapkan.

2.2 Analisis Data Eksplorasi

Analisis data eksplorasi dilakukan dengan jalan membuat berbagai ringkasan data dan penyajiannya melalui grafik. Ekslorasi semacam itu harus dilakukan pada tahap pertama setelah data tersedia. Hal ini harus dilakukan karena:

1. Beberapa pertanyaan yang diajukan dalam penelitian biasanya dapat dijawab melalui analisis data eksplorasi sederhana.

2. Banyak sekali teknik-teknik statistika yang mengasumsikan bahwa data mempunyai karakteristik tertentu, dan melalui eksplorasi data ini dapat menjawab apakah data yang tersedia memenuhi asumsi tersebut.

3. Eksplorasi data juga dapat digunakan untuk memunculkan ide-ide atau konsep yang nantinya akan diuji.

Analisis eksplorasi data dapat digunakan untuk membantu menampilkan data sedemikian rupa sehingga struktur data terlihat lebih jelas dan mudah dipahami. Ada

Page 5: Tinjauan Praktis Dari Aplikasi Statistika

© 2009 - NUSAR HAJARISMAN

5 2. Ruang Lingkup Statistika

berbagai cara untuk menyusun dan mengolah data untuk menghasilkan tampilan secara grafis (gambar) yang dapat digunakan untuk membantu kita dalam melihat trend data maupun karakteristik suatu data. Cara lain untuk mengeksplorasikan data adalah dengan membuat ringkasan data sehingga dapat memahami suatu gugus data yang besar dengan mudah.

Salah satu tujuan yang paling penting dalam analisis data eksplorasi adalah untuk mengidentifikasi struktur dengan adanya keacakan. Apabila kita pandang bahwa data berisi aspek-aspek terstrukur yang memang sedang kita amati bercampur dengan berbagai komponen acak lain yang bukan menjadi pengamatan kita, maka melalu analisis data eksplorasi akan memisahkan dan memisahkan bagian-bagian penting yang menjadi bagian pengamatan kita, serta meninggalkan komponen acak itu.

2.3 Penaksiran

Penaksiran secara statistik adalah suatu kegiatan untuk menduga suatu besaran yang tidak diketahui nilainya berdasarkan sebagian informasi yang tersedia mengenai besaran itu. Sebagai contoh, misalnya nilai IPK digunakan untuk menaksir kemampuan akademik mahasiswa, jejak pendapat atau poling dilakukan untuk menaksir opini publik tentang sesuatu masalah, Indeks harga konsumen dilakukan untuk menaksir laju inflasi, dan lain sebagainya.

Ada berbagai kondisi mengenai kualitas dari suatu penaksir, mulai dari yang bersifat pendekatan sampai dengan yang eksak. Perbedaan antara nilai sebenarnya dengan nilai yang ditaksirnya dianggap sebagai suatu kekeliruan atau galat. Tentu saja kita akan memilih suatu penaksir yang memiliki galat sekecil mungkin, akan tetapi kita dibatasi suatu kenyataan bahwa di dunia ini tidak ada yang sempurna. Kita harus menerima suatu fakta bahwa nilai penaksir secara statistik akan selalu (atau mendekati) salah, yaitu dalam hal bahwa penaksir ini tidak betul-betul eksak, dan yang paling penting di sini adalah bagaimana galat itu dibuat sekecil mungkin.

2.4 Pengujian Hipotesis

Pengujian hipotesis adalah suatu aktivtas statistik dengan tujuan untuk membuat keputusan diantara dua pilihan. Pengujian hipotesis banyak digunakan dalam berbagai bidang penelitian. Suatu perusahaan farmasi mengeluarkan suatu obat baru dan menguji suatu hipotesis bahwa obat tersebut efektif untuk menyembuhkan penyakit tertentu. Sebuah perusahaan periklanan memutuskan bahwa suatu iklan televisi yang baru memberikan dampak yang kuat terhadap perilaku pembelian konsumen dengan menguji hipotesis bahwa lebih banyak konsumen yang secara positif terpengaruh oleh iklan baru tersebut dibandingkan dengan iklan yang lama. Suatu pabrikan merencanakan menggunakan pengujian hipotesis untuk memutuskan apakah suatu proses kontrol kualitas yang baru memberikan biaya tambahan jika diimplementasikan. Dan masih banyak penelitian lainnya menggunakan pengujian hipotesis untuk menguji ide atau konsep sesuai dengan bidang kajiannya masing-masing.

Page 6: Tinjauan Praktis Dari Aplikasi Statistika

JURUSAN STATISTIKA, UNIVERSITAS ISLAM BANDUNG

6 Tinjauan Praktis dari Aplikasi Statistika

3. Pengukuran (Measurement)

Pengukuran ini sangat penting tidak hanya dalam analisis data tetapi juga dalam pemilihan metoda analisis statistika yang tepat. Berikut ini akan dibahas mengenai konsep-konsep pengukuran dan hubungannya dengan analisis data.

Pengukuran dapat didefinisikan sebagai suatu proses kuantifikasi. Dalam hal ini kita berusaha mencantumkan bilangan (nilai numerik) kepada duatu sistem materi, berdasarkan hukum (aturan) tertentu, dengan tujuan menggambarkan sifat-sifat yang dimiliki sistem materi tersebut.

Ada dua isyarat utama yang bisa kita tangkap dari definisi itu, pertama, setelah dilakukan pengukuran, akan terdapat bilangan yang menggambarkan sifat-sifat materi yang diukur, kedua interpretasi terhadap bilangan yang tercantum pada materi itu ditentukan oleh hukum (aturan) yang dipakai pada saat mencantumkan bilangan.

Berdasarkan aturan yang dipakai pada saat mencantumkan bilangan, maka timbulah apa yang disebut Skala Pengukuran (Scale of Measurement). Ada empat jenis skala pengukuran, yaitu: nominal, ordinal, interval, dan rasio.

Terdapat dua jenis data, yaitu nonmetrik (kualitatif) dan metrik (kuantitatif). Yang termasuk data nonmetrik adalah atribut, karakteristik atau kategorik yang dapat digunakan untuk mengidentifikasi atau menggambarkan subjek. Data nonmetrik berbeda dalam hal tipe atau jenisnya. Data pengukuran metrik dibuat sedemikian rupa sehingga subjek dapat diidentifikasi menurut besar atau derajat perbedaannya. Variabel yang diukur secara metrik mencerminkan kuantitas atau jarak, sedangkan variabel yang diukur secara nonmetrik tidak. Data nonmetrik diukur dengan skala pengukuran nominal atau ordinal dan variabel metrik mempunyai skala pengukuran interval dan rasio.

3.1 Skala Pengukuran Nominal

Pengukuran dengan skala nominal menyangkut penetapan suatu angka yang digunakan untuk memberikan label atau mengidentifikasi subjek atau objek. Skala nominal memberikan presisi pengukuran yang paling kecil, karena data tersebut hanya berisi angka-angka dari munculnya masing-masing kelas atau kategori dari variabel yang diamati. Oleh karena itu, angka atau simbol yang ditetapkan pada objek tidak mempunyai makna kuantitatif, selain menunjukkan ada atau tidaknya atribut atau karakteristik tertentu.

Contoh dari data berskala nominal adalah jenis kelamin, agama, atau partai politik. Untuk bekerja dengan data seperti itu, maka peneliti harus menetapkan suatu angka pada masing-masing kategori, sebagai contoh misalnya angka 1 diberikan untuk mewakili kategori laki-laki dan angka 0 untuk diberikan untuk mewakili kategori wanita. Angka-angka ini hanya mewakili kategori atau kelas dan tidak berarti menunjukkan besarnya suatu atribut atau karakteristik.

3.2 Skala Pengukuran Ordinal

Skala ordinal merupakan skala pengukuran yang presisinya lebih tinggi daripada skala nominal. Variabel dapat diurutkan atau diberi peringkat dengan skala ordinal dalam hubungannya dengan besarnya atribut yang diamati. Setiap subkelas dapat

Page 7: Tinjauan Praktis Dari Aplikasi Statistika

© 2009 - NUSAR HAJARISMAN

7 3. Pengukuran (Measurement)

dibandingkan dengan yang lainnya dalam bentuk hubungan ‘lebih besar’ atau ‘lebih kecil’.

Sebagai contoh, perbedaan dari tingkat kepuasaan konsumen terhadap beberapa produk baru dapat diilustrasikan pada skala ordinal. Skala berikut ini menunjukkan seorang responden dalam memandang tiga buah produk. Responden tersebut lebih puas dengan produk A daripada produk B dan lebih puas dengan produk B daripada produk C.

ProdukA

ProdukB

ProdukC

Sangatpuas

Sangat tidakpuas

Angka-angka yang digunakan dalam skala ordinal seperti itu bersifat nonkuantitatif, karena angka-angka tersebut hanya menunjukkan posisi relatif dalam deret yang terurut. Tidak ada yang mengukur seberapa besar kepuasan konsumen secara mutlak, demikian juga bagaimana peneliti mengetahui dengan pasti perbedaan antara titik-titik pada skala mengenai kepuasan. Kebanyakan skala dalam ilmu-ilmu sosial menggunakan skala ordinal.

Contoh lain: tingkat pendidikan (SD, SMP, SMA, Diploma, Universitas); kelompok umur (balita, anak-anak, remaja, dewasa); status ekonomi/sosial (rendah, sedang, atas), dan lain-lain.

3.3 Skala Pengukuran Interval dan Rasio

Skala inteval dan skala rasio (keduanya metrik) mempunyai tingkat presisi pengukuran yang paling tinggi. Dengan demikian hampir semua operasi matematika dapat dilakukan pada kedua skala pengukuran tersebut. Kedua skala pengukuran ini mempunyai unit pengukuran konstan, sehingga perbedaan antara dua titik awal pada setiap pada bagian dari skala adalah sama. Perbedaan yang nyata diantara skala intetval dan rasio adalah bahwa skala interval mempunyai titik nol yang berbeda-beda sedangkan skala rasio mempunyai titik nol yang mutlak.

Skala interval yang paling dikenal adalah skala suhu antara Fahrenheit dan Celcius. Keduanya mempunyai titik nol yang berbeda, dan keduanya tidak menunjukkan tinggi rendahnya suhu, karena dapat mendaftarkan suhu di bawah titik nol dari masing-masing skala. Oleh karena itu, adalah tidak mungkin untuk menyatakan bahwa setiap nilai pada skala interval merupakan penggandaan dari beberapa titik lainnya pada skala. Sebagai contoh, suhu dengan 800F, tidak dapat dikatakan dua kali lebih panas daripada suhu dengan 400F, sebab dikatakan bahwa suhu 800F dengan menggunakan skala yang berbeda seperti Celcius adalah 26.70C. Demikian juga untuk suhu 400F dengan menggunakan Celcius adalah 4.40C. Walaupun pada kenyataannya 800F dua kali 400F tetapi tidak dapat dinyatakan bahwa panas 800F adalah dua kali panas 400F, karena dengan menggunakan skala yang berbeda, panas tersebut bukanlah kelipatannya, artinya 4.40C × 2 ≠ 26.70C.

Page 8: Tinjauan Praktis Dari Aplikasi Statistika

JURUSAN STATISTIKA, UNIVERSITAS ISLAM BANDUNG

8 Tinjauan Praktis dari Aplikasi Statistika

Skala pengukuran rasio merupakan skala pengukuran yang tingkat presisinya paling tinggi karena mempunyai beberapa keuntungan dari semua skala di bawahnya serta mempunyai titik nol yang absolut. Semua operasi matematika dapat dilakukan dengan skala pengukuran rasio ini. sebagai contoh, berat 100 kg memang dua kali lebih berat dibandingkan dengan berat 50 kg.

4. Konsep-konsep Dasar Statistika

Walaupun terdapat berbagai jenis pendekatan pada masalah statistika dalam situasi yang berbeda, tapi setidaknya ada empat buah konsep dasar yang sangat penting untuk dipahami dengan dalam mempelajari statistika. Konsep-konsep dasar statistika yang harus dipahami itu adalah model dan asumsi, populasi dan sampel, ukuran pemusatan, serta ukuran penyebaran.

4.1 Model dan Asumsi

Model adalah deskripsi sederhana mengenai kenyataan. Oleh karena situasi aktual yang sedang diamati biasanya sangat kompleks dan juga tidak mungkin untuk dipahami secara keseluruhannya, maka kita akan lebih mudah bekerja dengan model yang sederhana. Seorang ahli statistika George Box mengatakan bahwa, ‘Semua model adalah salah, tapi ada beberapa model yang bermanfaat’. Tujuan dari pemilihan model yang baik adalah untuk menemukan atau menangkap karakteristik utama dari struktur data yang kita amati. Berikut ini diberikan beberapa contoh mengenai model:

Contoh 3. Secara rata-rata, untuk setiap rokok yang dihisap seseorang akan mengurangi umur orang tersebut, dimana hal ini akan ditaksir berdasarkan suatu gugus data yang besar.

Model seperti itu mengabaikan banyak faktor, seperti umur, jenis kelamin, gaya hidup, dan lain-lain. Namun demikian model ini cukup memberikan ringkasan yang baik mengenai dampak merokok pada kesehatan.

Contoh 4. Parah tidaknya kecelakaan lalu lintas bagi kendaraan roda empat karena pada umumnya para pengemudi yang mengalami kecelakaan tidak menggunakan sabuk pengaman.

Model ini juga banyak mengabaikan faktor-faktor lain yang dapat menyebabkan tingkat keparahan pada kecelakaan lalu lintas. Faktor-faktor lain seperti kecepatan, kondisi pengemudi, ataupun kondisi kendaraan itu sendiri, apabila diperhitungkan ke dalam model di atas mungkin saja dapat memberikan model yang berbeda. Tetapi apabila diasumsikan bahwa laju setiap kendaraan yang mengalami kecelakaan adalah sama, serta dalam kondisi yang sama pula, maka bisa jadi model tersebut merupakan model yang cukup baik. Tetapi sekali lagi, bahwa semuanya ini serba tidak pasti.

Berbagai prosedur statistika dilakukan berdasarkan model. Model-model itu membuat asumsi mengenai situasi yang dihadapi, seperti sifat-sifat matematis yang menunjukkan bagaiamana data itu dikumpulkan. Pada umumnya, jika dibuat lebih banyak asumsi (dan jika asumsi ini adalah benar), maka kesimpulan yang kita buat menjadi lebih kuat karena lebih banyak informasi yang kita peroleh. Sebaliknya, untuk gugus data yang sama, jika asumsi yang dibuat lebih sedikit, maka kesimpulannya juga menjadi lebih lemah. Membuat asumsi yang tepat merupakan bagian yang penting

Page 9: Tinjauan Praktis Dari Aplikasi Statistika

© 2009 - NUSAR HAJARISMAN

9 4. Konsep-konsep Dasar Statistika

dalam proses pemodelan, karena hal ini dapat mendukung pada penarikan kesimpulan yang lebih valid.

Apabila memang asumsi yang lebih banyak dapat memberikan kesimpulan yang lebih kuat, kenapa kita tidak membuat asumsi sebanyak mungkin? Kita juga tidak dapat melakukan hal itu karena jika ada beberapa asumsi yang keliru atau tidak terpenuhi, maka kesimpulan yang kita buat juga akan keliru. Kesimpulan akan menjadi kuat dan keliru pada saat yang bersamaan. Oleh karena itu akan menjadi suatu tantangan bagi peneliti untuk menggunakan banyak asumsi yang benar dan menghilangkan berbagai asumsi yang keliru. Dalam prakteknya hal ini sulit dilakukan karena pada umumnya kita bekerja dengan suatu gugus data yang tidak sempurna dan tidak lengkap, sehingga kita jarang mengetahui apakah asumsi yang kita buat itu benar atau salah. Pemeriksaan asumsi ini memang perlu diperhatikan dengan seksama ketika kita menginterpretasikan hasil studi. Hal ini perlu dilakukan dengan harapan untuk membantu peneliti dalam memahami ketika melakukan dua buah studi yang sama tetapi memberikan kesimpulan yang berbeda.

4.2 Populasi dan Sampel

Pada umumnya teknik-teknik statistika yang ada dilakukan untuk untuk membuat pernyataan umum mengenai suatu populasi yang besar berdasarkan pada data tertentu dari sampel yang lebih kecil yang dipilih dari populasinya.

Sampel

Hasil dari sampel digunakan untuk

menyimpulkan populasi

Sampel dipilih dari populasi

Populasi

Gambar 2. Hubungan antara populasi dan sampel

Dalam terminologi rancangan penelitian, kelompok yang lebih besar yang menjadi perhatian peneliti disebut populasi, sedangkan kelompok individu yang lebih kecil yang terlibat dalam penelitian disebut sampel. Gambar 2 menggambarkan hubungan antara populasi dan sampel. Pada umumnya, populasi berukuran sangat besar, yang berisi sangat banyak individu untuk diukur dan dipelajari. Sebagai contoh misalnya peneliti tertarik untuk mempelajari karakteristik tertentu pada suatu kota atau propinsi. Dalam kasus seperti ini, populasinya terlalu besar yang memungkinkan seorang peneliti untuk mempelajari seluruh individu. Oleh karena itu, peneliti harus memfokuskan pada kelompok yang lebih kecil, yaitu suatu sampel, untuk

Page 10: Tinjauan Praktis Dari Aplikasi Statistika

JURUSAN STATISTIKA, UNIVERSITAS ISLAM BANDUNG

10 Tinjauan Praktis dari Aplikasi Statistika

mendapatkan informasi mengenai populasinya. Suatu sampel dipilih dari populasi dan diharapkan dapat mewakili populasinya itu. Tujuannya adalah untuk menentukan suatu sampel sedemikian rupa sehingga dapat memberikan kesimpulan mengenai populasinya.

Beberapa hal penting yang perlu diketahui sehubungan dengan istilah populasi ini, diantara adalah

Banyaknya pengamatan atau anggota suatu populasi disebut ukuran populasi, dimana ukuran populasi ini dinotasikan dengan N.

Proses penelitian yang didasarkan pada populasi disebut SENSUS.

Nilai-nilai pengamatan yang diukur dari populasi disebut PARAMETER.

Kemudian, beberapa hal penting yang perlu diketahui sehubungan dengan istilah sampel ini, diantara adalah

Banyaknya pengamatan atau anggota suatu sampel disebut ukuran sampel, dimana ukuran sampel dinotasikan dengan n.

Proses penelitian yang didasarkan pada sampel atau cara pengambilan sampel disebut SAMPLING.

Nilai-nilai pengamatan yang diukur dari sampel disebut STATISTIK.

Sebelum proses pemilihan sampel dilakukan, kita perlu membedakan berbagai jenis populasi. Suatu populasi kadang-kadang disebut sebagai populasi target. Populasi target ini adalah suatu kelompok yang didefinisikan menurut apa yang menjadi perhatian penelitinya. Semua anak dari orangtua yang bercerai, semua anak yang sedang mengikuti pendidikan dasar, semua orang yang mengidap virus HIV di Indonesia merupakan contoh-contoh dari populasi target.

Biasanya populasi target tidak mudah diperoleh. Sebagai contoh, bagi seorang peneliti yang tertarik untuk mempelajari karakteristik orang-orang yang mengidap virus HIV, maka populasi targetnya adalah semua penduduk Indonesia yang memang mengidap virus HIV. Jelas bahwa peneliti akan mendapatkan kesulitan dalam merekrut orang-orang tersebut sebagai subjek penelitian. Akan tetapi, peneliti itu dapat bekerja sama dengan beberapa klinik tertentu, dokter, atau lembaga lainnya untuk mendapatkan individu yang akan dijadikan subjek penelitian. Subjek penelitian yang diperoleh dengan cara seperti ini disebut sebagai populasi yang dapat diakses (accessible population) yang nantinya akan dipilih sebagai sampel.

4.2.1 Sampel Representatif

Telah disebutkan bahwa tujuan dari penelitian adalah menentukan sampel, dan kemudian mengeneralisir hasil-hasil penelitian pada populasi. Seberapa akurat kita dapat mengeneralisir hasil penelitian dari suatu sampel tertentu pada populasinya bergantu pada keterwakilan dari sampel. Derajat keterwakilan sampel ini ditunjukkan oleh seberapa dekat sampel dapat mencerminkan populasinya. Dengan demikian, salah satu masalah yang banyak dihadapi oleh peneliti adalah bagaimana mendapatkan sampel yang dapat mewakili populasinya. Suatu sampel yang dapat mewakili populasinya disebut sampel yang representatif, sedangkan sampel yang tidak

Page 11: Tinjauan Praktis Dari Aplikasi Statistika

© 2009 - NUSAR HAJARISMAN

11 4. Konsep-konsep Dasar Statistika

dapat mewakili populasinya atau berbeda dengan populasinya disebut sampel yang bias. Ketika sampelnya bias, maka kesimpulan mengenai populasinya menjadi keliru.

Sampel representatif adalah suatu sampel yang karakteristiknya sama dengan populasinya. Sebaliknya sampel bias adalah suatu sampel yang mempunyai karakteristik berbeda dengan populasi. Berikut ini diberikan beberapa contoh tentang sampel yang buruk, yaitu suatu sampel bias yang tidak mewakili populasinya:

Contoh 5. Penduduk yang tinggal di suatu kompleks perumahan mewah digunakan sebagai sampel untuk mempelajari tingkat kesejahteraan rakyat di suatu kota atau propinsi tertentu.

Konsekuensi dari penggunaan sampel buruk pada Contoh 5 ini adalah tingkat kesejahteraan rakyat yang tinggal di kota atau propinsi tersebut sangat tidak tergambarkan dengan baik. Penduduk yang tinggal di suatu kompleks perumahan mewah tidak dapat mewakili populasi penduduk yang tinggal di kota tersebut secara umum, karena mereka yang tinggal di kompleks tersebut cenderung mempunyai pendapatan yang secara rata-rata jauh lebih besar dari penduduk pada umumnya. Dengan demikian kesimpulan yang akan diperoleh nantinya jika menggunakan sampel tersebur akan menyatakan bahwa tingkat kesejahteraan rakyat di kota tersebut adalah sangat baik, padahal kenyataan menunjukkan sebaliknya.

Contoh 6. Anggota tim bola basket di suatu sekolah digunakan sebagai sampel untuk mempelajari tinggi badan dari siswa SMA.

Diketahui bahwa pada umumnya siswa sekolah yang tergabung dalam tim bola basket di sekolahnya cenderung mempunyai tinggi badan yang secara rata-rata lebih tinggi daripada siswa-siswa lainnya. Sampel ini akan baik digunakan jika peneliti ingin mempelajari rata-rata tinggi badan siswa anggota tim bola basket sebagai populasinya, bukan untuk siswa sekolah SMA pada umumnya.

Contoh 7. Partisan suatu partai tertentu digunakan sebagai sampel untuk memprediksi pemenang dalam pemilihan umum.

Seorang partisan dari partai tertentu cenderung mempunyai rasa fanatisme dan loyalitas yang tinggi pada partainya itu. Dengan demikian, jika ia diberi pertanyaan tentang prediksi partai mana yang akan memenangkan pemilihan umum, maka ia cenderung untuk menjawab bahwa partainyalah yang akan menang. Jawaban yang bias dari sampel seperti ini juga akan membawa pada suatu kesimpulan yang keliru mengenai siapa yang akan menang dalam pemilihan umum ini.

Ada dua sumber yang menyebabkan peneliti memperoleh sampel bias dalam penelitian survey. Pertama adalah bias pemilihan, dimana dalam hal ini terdapat perbedaan yang sistematik antara populasi dan sampel sebagaimana yang digambarkan dalam contoh sampel buruk di atas.

Sumber yang kedua adalah bias respons, dimana hal ini disebabkan oleh tidak semua orang akan mengembalikan atau menjawab kuesioner yang kita sebarkan. Apabila hanya terdapat 50% dari seluruh kuesioner yang disebarkan, maka sampel yang diperoleh cenderung merupakan sampel yang bias. Bias respons ini juga dapat muncul karena ketidakjujuran responden dalam menjawab kuesioner atau bahkan responden tidak memahami pertanyaan yang diajukan dalam kuesioner tersebut.

Page 12: Tinjauan Praktis Dari Aplikasi Statistika

JURUSAN STATISTIKA, UNIVERSITAS ISLAM BANDUNG

12 Tinjauan Praktis dari Aplikasi Statistika

Dalam kasus seperti ini, maka peneliti harus membuat kuesioner sebaik mungkin, serta tetap menjaga validitas dan reliabilitas kuesionernya itu.

4.2.2 Sampling Peluang dan Non-peluang

Proses pemilihan subjek penelitian untuk dijadikan sampel disebut sampling. Para peneliti telah mengembangkan berbagai metode atau teknik sampling yang berbeda. Metode sampling ini dibagi ke dalam dua kategori, yaitu sampling peluang dan sampling nonpeluang.

Dalam sampling peluang, kemungkinan individu tertentu untuk terpilih menjadi sampel dapat diketahui dan dihitung. Sebagai contoh, misalnya dalam suatu populasi yang berukuran 100 orang, maka masing-masing individu mempunyai peluang untuk terpilih menjadi sampel sebesar 1/100. Setiap individu mempunyai kemungkinan yang sama untuk terpilih. Syarat yang paling penting dalam sampling peluang adalah ukuran pasti dari populasinya harus diketahui dan tersedia daftar individunya. Syarat kedua adalah setiap individu dalam populasi harus mempunyai peluang pemilihan yang spesifik. Akhirnya, peneliti harus menggunakan metode takbias dalam proses pemilihan sampelnya. Hal ini dapat dicapai melalui proses acak (random), artinya setiap keluaran yang mungkin adalah mempunyai kesempatan yang sama untuk terpilih.

Dalam sampling nonpeluang, kesempatan pemilihan individu tertentu tidak dapat diketahui karena peneliti tidak mengetahui ukuran populasinya atau anggota populasinya. Lebih jauh, dalam sampling nonpeluang, para peneliti juga tidak menggunakan metode pemilihan yang takbias. Sebagai contoh, misalnya seorang peneliti ingin mempelajari perilaku remaja yang kecanduan narkoba, kemudian ia datang ke suatu rumah sakit tertentu untuk mendapatkan data sampel. Oleh karena peneliti itu tidak yakin bahwa seluruh remaja itu mempunyai kesempatan yang sama untuk terpilih, maka kemungkinan bahwa peneliti itu memperoleh sampel yang bias akan semakin besar. Sebagai contoh, misalnya remaja pecandu narkoba yang diperiksa rumah sakit tersebut adalah orang-orang berasal dari keluarga status sosial menengah ke atas, maka sampel tersebut tidak mewakili populasi targetnya. Secara umum, sampling non peluang mempunyai resiko yang lebih besar untuk menghasilkan sampel bias daripada sampling peluang.

Akan tetapi perlu dicatat bahwa sampling peluang memerlukan pengetahuan atau informasi yang lebih banyak mengenai populasinya, dimana pada umumnya hal ini tidak dipunyai oleh peneliti. Dengan alasan ini, teknik sampling nonpeluang lebih banyak digunakan.

4.3 Peluang

Dalam kebanyakan kasus, hasil percobaan bergantung pada faktor kebetulan, dan oleh karena itu tidak dapat diramalkan dengan pasti. Bila sekeping mata uang dilemparkan berulang-ulang, kita tidak dapat memastikan bahwa pada pelemparan tertentu pasti akan diperoleh sisi gambar misalnya. Namun demikian, kita masih bisa mengetahui semua kemungkinan hasil untuk setiap pelemparan. Dan untuk itulah kita mempelajari peluang.

Page 13: Tinjauan Praktis Dari Aplikasi Statistika

© 2009 - NUSAR HAJARISMAN

13 4. Konsep-konsep Dasar Statistika

Peluang suatu peristiwa adalah suatu bilangan antara 0 dan 1 yang menyatakan berapa kemungkinan suatu peristiwa akan terjadi ketika dilakukan percobaan acak. Peluang bisa dipandang sebagai gambaran yang akurat mengenai konsep keacakan sebab suatu peristiwa mungkin tidak dapat diprediksi tapi peluang terjadinya peristiwa itu sudah ada, katakan saja sebesar 0.7. Artinya, peristiwa itu akan terjadi selama 70% dari waktu yang diamati jika kita dapat melakukan percobaan acak selamanya.

4.4 Ukuran Pemusatan

Ringkasan statistik yang paling dasar adala ukuran pemusatan, dimana ukuran ini memberikan jawaban atas pertanyaan yang paling mendasar ketika kita mempunyai data, yaitu ‘Sebarapa besar angka itu?’ atau ‘Bilangan atau angka mana yang memberikan gambaran terbaik pada keseluruhan gugus data tersebut?’ Oleh karena beberapa nilai dalam gugus data itu lebih besar dan juga lebih kecil dari nilai ringkasan ini, maka ukuran pemusatan ini memberikan fakta bahwa bilangan ini akan berada di pusat data.

Pada masalah yang lebih rumit, maka tidak menjadi begitu jelas dimana nilai pusat yang ditetapkan dapat mewakili keseluruhan kelompoknya. Oleh karena itu terdapat beberapa metode yang berbeda untuk menghitung ukuran pusat ini. Rata-rata, median, atau modus adalah beberapa contoh untuk mengukur pusat data. Adalah sangat penting untuk memahami sifat-sifat dari masing-masing ukuran ini sehingga ringkasan statistik yang paling tepat dapat dipilih untuk masing-masing masalah. Hal ini perlu dilakukan karena untuk satu gugus data yang sama, untuk masing-masing ukuran pemusatan dapat memberikan hasil yang berbeda.

4.5 Ukuran Penyebaran

Ringkasan statistik yang kedua adalah ukuran penyebaran yang digunakan untuk mengukur keragaman atau variasi yang terjadi di dalam data. Ukuran penyebaran ini mengukur bagaimana perbedaan antara satu bilangan dengan bilangan lainnya. Apabila kita hanya menggunakan ukuran pemusatan saja, maka kita sama sekali tidak tahu seberapa besar bilangan-bilangan itu menyebar di sekitar rata-ratanya. Satu gugus data yang semua bilangannya sama, maka dalam gugus data itu sama sekali tidak ada variasi. Tapi untuk gugus data yang lain, dimana beberapa bilangannya ada yang sangat dan ada juga yang sangat kecil, maka gugus data seperti ini mempunyai variasi yang besar. Untuk memahami pentingnya ukuran penyebaran ini, perhatikan dua gugus data berikut ini:

Gugus data A: 15 15 15 15 15

Gugus data B: 5 10 15 20 25

Ukuran pusat bagi kedua gugus data tersebut adalah sama, yaitu 15, tetapi kedua gugus data itu mempunyai variasi yang berbeda. Gugus data A sama sekali tidak ada variasi, sedangkan gugus data B sangat bervariasi. Misalkan kedua gugus data itu dianggap populasi, kemudian kita ambil sampel berukuran dua. Untuk gugus data A, siapapun yang menjadi sampelnya, maka ukuran pusatnya tetap akan 15, sedangkan untuk gugus data B belum tentu demikian. Harus diingat bahwa hampir selalu ada variasi dalam data, dan untuk mengukur penyebaran data ini ada beberapa ukuran, diantaranya yaitu simpangan baku, varians, atau rentang antar kuartil. Sebagaimana

Page 14: Tinjauan Praktis Dari Aplikasi Statistika

JURUSAN STATISTIKA, UNIVERSITAS ISLAM BANDUNG

14 Tinjauan Praktis dari Aplikasi Statistika

dalam ukuran pemusatan, di sini juga kita perlu memahami sifat-sifat dari masing-masing ukuran itu. Hal ini membantu kita untuk dijadikan petunjuk untuk memilih ukuran yang paling tepat pada situasi tertentu.

5. Pemilihan Metode Statistika Yang Tepat

Biasanya data yang berskala nominal dan ordinal dicatat sebagai banyaknya pengamatan dalam masing-masing kategori. Pencacahan atau frekuensi disebut sebagai variabel diskrit. Untuk data kontinu pengukuran secara individu akan dicatat. Istilah kuantitatif sering digunakan untuk variabel yang diukur pada skala kontinu, sedangkan istilah kualitatif untuk skala nominal dan kadang-kadang juga untuk skala ordinal. Variabel penjelas kualitatif disebut sebagai faktor dan kategorinya disebut sebagai taraf (level) dari faktor. Variabel penjelas kuantitatif disebut sebagai kovariat.

Metoda dari analisis statistika ini bergantung pada skala pengukuran dari variabel respons dan penjelasnya. Dalam prakteknya, untuk data ordinal disebabkan oleh posisinya berada diantara pengamatan nominal dan kontinu, seringkali dianalisis dengan metoda yang dirancang untuk satu dari dua skala lainnya.

Secara umum kita hanya memperhatikan metoda statistika yang relevan pada saat hanya terdapat satu variabel respons dengan beberapa variabel penjelas. Untuk berbagai kombinasi variabel respons dan penjelas, Tabel 1 menunjukkan metoda statistik utama yang biasa digunakan variabel respons dan penjelas pada berbagai macam skala. Kemudian pada bagian berikutnya akan dibahas berbagai metode statistika yang melibatkan banyak variabel atau dikenal dengan analisis statistika multivariat.

Tabel 1. Metoda statistika yang biasa digunakan variabel respons dan

penjelas pada berbagai macam skala

Variabel Penjelas

Variabel Respons

Biner Nominal > 2

kategori Ordinal Interval/Rasio

Biner

Perbandingan Proporsi

Regresi Logistik

Regresi Poisson

Tabel Kontingensi;

Model log-linear

T-test

Nominal > 2 kategori Analisis varians

Ordinal

Interval/Rasio Regresi Multinomial

Regresi Ordinal Analisis Regresi; Analisis Kovarians Campuran

5.1 Analisis Regresi dan Korelasi

Pada bagian ini akan dibahas mengenai pendeskripsian gugus data dengan melibatkan dua buah variabel yang masing-masing diukur pada skala interval atau rasio. Untuk memudahkan pembahasan, kedua variabel ini masing-masing akan diberi label x dan

Page 15: Tinjauan Praktis Dari Aplikasi Statistika

© 2009 - NUSAR HAJARISMAN

15 5. Pemilihan Metode Statistika Yang Tepat

y. Jadi, dua buah pengamatan numerik (x, y) akan dicatat untuk setiap unit sampling. Pengamatan ini dipasangkan dalam pengertian bahwa pasangan (x, y) diperoleh dari unit sampling yang sama. Suatu pengamatan x yang berasal dari satu pasang dan variabel x atau y dari pasangan lainnya adalah saling bebas. Untuk n unit sampling, kita dapat menuliskan hasil pengukuran:

(x1, y1), (x2, y2), …, (xn, yn).

Tujuan utama dari analisis yang berkenan dengan data bivariat adalah untuk menjawab beberapa pertanyaan seperti:

Apakah kedua variabel itu berhubungan?

Apakah bentuk hubungan yang ditunjukkan oleh data?

Dapatkah kita mengkuantifikasi kekuatan hubungan antara kedua variabel itu?

Dapatkah kita meramalkan atau memprediksikan satu variabel berdasarkan variabel lainnya?

Mempelajari pengukuran x maupun y sendiri-sendiri tidak akan mampu menjawab pertanyaan-pertanyaan tersebut.

Tahapan pertama yang paling penting dalam mempelajari hubungan antara dua buah variabel adalah dengan mengeksplorasikan data ke dalam suatu grafik. Untuk membuat grafik ini akan digambarkan variabel x sebagai sumbu mendatar (horizontal) dan variabel y sebagai sumbu tegak (vertikal). Setiap pasangan pengamatan (x, y) kemudian diplotkan sebagai titik-titik ke dalam grafik. Diagram yang dihasilkan ini disebut juga sebagai diagram pencar (scatter diagram). Dengan mengamati diagram pencar, maka tampilan visual dapat dibentuk mengenai hubungan antar variabel. Sebagai contoh, kita dapat mengamati apakah titik-titik yang digambarkan membentuk suatu garis lurus, kurva (melengkung), ataukah titik-titik tersebut membentuk kelompok-kelompok tertentu atau tidak sama sekali.

5.1.1 Koefisien Korelasi: Suatu Ukuran Hubungan Linear

Diagram pencar memberikan tampilan visual mengenai hubungan alamiah antara variabel x dan y dalam gugus data bivariat. Dalam banyak kasus, titik-titik yang muncul dalam plot berada di sekitar garis lurus. Tampilan visual tersebut yang merupakan pencaran terhadap hubungan linear dapat dikuantifikasi dengan cara menghitung suatu ukuran numerik yang disebut dengan koefisien korelasi.

Koefisien korelasi, biasa dinotasikan dengan r, adalah suatu ukuran kekuatan hubungan linear antara variabel x dan y. Sebelum memperkenalkan rumusnya, disini akan disampaikan terlebih dahulu sifat-sifat penting mengenai koefisien korelasi.

1. Nilai r akan selalu berada diantara –1 dan +1, atau –1 r +1. 2. Besar-kecilnya nilai r menunjukkan kekuatan dari hubungan linear itu, sedangkan

tanda dari nilai r menunjukkan arah hubungannya. Lebih khusus lagi dapat dikatakan bahwa

a. Nilai r > 0, jika pola dari nilai-nilai (x, y) akan berada mulai dari sisi kiri bawah menuju ke sisi kanan atas.

Page 16: Tinjauan Praktis Dari Aplikasi Statistika

JURUSAN STATISTIKA, UNIVERSITAS ISLAM BANDUNG

16 Tinjauan Praktis dari Aplikasi Statistika

b. Nilai r < 0, jika pola dari nilai-nilai (x, y) akan berada mulai dari sisi kiri atas menuju ke sisi kanan bawah.

c. Nilai r = +1, jika seluruh nilai (x, y) dengan tepat berada dalam suatu garis lurus dengan slope yang positif (terjadi hubungan linear positif sempurna).

d. Nilai r = –1, jika seluruh nilai (x, y) dengan tepat berada dalam suatu garis lurus dengan slope yang negatif (terjadi hubungan linear negatif sempurna).

e. Nilai r = 0, mempunyai pengertian bahwa tidak ada hubungan linear antara variabel x dan y.

3. Nilai r yang mendekati nol mempunyai pengertian bahwa hubungan linear antara kedua variabel adalah sangat lemah.

Koefisien korelasi yang mendekati nol terjadi pada saat pola hubungannya tidak tampak, artinya bahwa nilai-nilai dari y tidak berubah untuk setiap arah yang terjadi dalam perubahan dalam nilai-nilai x. Suatu nilai r yang mendekati nol juga dapat terjadi jika titik-titik itu membentuk suatu kurva (lengkung) yang jauh dari bentuk yang linear. Singkatnya, r adalah suatu besaran yang digunakan untuk mengukur bentuk hubungan linear, dan titik-titik yang membentuk kurva jauh dari linear.

(a) korelasi positif (b) korelasi negatif

(c) korelasi nol (d) korelasi nol

Gambar 3 Beberapa Bentuk Diagram Pencar untuk Berbagai Nilai r

Gambar 3 menunjukkan diagram pencar untuk berbagai nilai r. Perhatikan bahwa Gambar 3c dan 3d merupakan diagram pencar pada situasi dimana nilai r = 0. Nilai korelasi nol yang ditunjukkan Gambar 3c disebabkan oleh ketidakhadiran hubungan

Page 17: Tinjauan Praktis Dari Aplikasi Statistika

© 2009 - NUSAR HAJARISMAN

17 5. Pemilihan Metode Statistika Yang Tepat

linear antara x dan y, sedangkan dalam Gambar 3d disebabkan oleh titik-titiknya membentuk suatu kurva melengkung.

Perlu diketahui bahwa setidaknya ada dua koefisien korelasi antara pasangan variabel, yaitu koefisien korelasi Pearson dan koefisien korelasi Rank Spearman. Koefisien korelasi Pearson digunakan pada saat kedua variabel yang diamati paling tidak berskala interval (atau rasio) dan masing-masing berdistribusi normal atau keduanya berdistribusi normal bivariat. Akan tetapi Jika data yang diperoleh berasal dari populasi bivariat yang tidak berdistribusi normal, maka koefisien korelasi Pearson tidak dapat diaplikasikan lagi. Untuk kasus tersebut, maka koefisien korelasi yang digunakan adalah koefisien korelasi rank Spearman. Di sini, prosedur dimulai dengan memberikan peringkat atau ranking untuk masing-masing variabel. Untuk n buah pasangan data (x1, y1), (x2, y2), ..., (xn, yn) yang saling bebas, kemudian di dalam variabel x1, x2, ..., xn dibuatkan peringkatnya, demikian juga untuk variabel y1, y2, ..., yn dibuatkan peringkatnya sendiri. Dengan kata lain, peringkat untuk variabel x dan y dibuat secara terpisah.

5.1.2 Analisis Regresi

Suatu studi tentang hubungan antara dua buah variabel seringkali diperlukan untuk memprediksi satu variabel oleh variabel lainnya. Seorang manajer penjualan di suatu perusahaan ingin mempelajari hubungan antara besarnya belanja yang dikeluarkan oleh perusahaan untuk iklan dengan besar nilai penjualan pada bulan tertentu. Seorang ahli pertanian ingin menaksir hasil panen padi yang dihubungkan curah hujan untuk setiap musim panen. Seorang tenaga kesehatan ingin memperkirakan hubungan antara usia ibu dengan berat badan bayi yang dilahirkan.

Dalam beberapa contoh yang disebutkan di atas, variabel penjelas atau input dinotasikan oleh x, dan variabel respons atau output diberi label y. Dalam beberapa buku, variabel penjelas x ini disebut juga sebagai variabel bebas (independent variable), sedangkan variabel respons y disebut juga sebagai variabel takbebas (dependent variable). Tujuannya adalah untuk menemukan hubungan alamiah antara x dan y berdasarkan data percobaan dan menggunakan hubungan itu untuk memprediksi variabel respons y menurut variabel penjelas x.

Secara alamiah, tahapan pertama yang perlu dilakukan dalam studi seperti itu adalah membuat diagram pencar. Apabila terdapat hubungan linear, maka perhitungan koefisien korelasi r akan membantu peneliti untuk menentukan kekuatan hubungan linear itu. Nilai ini dapat digunakan untuk melihat seberapa efektif variabel respons y dapat dipredisksi oleh x dengan jalan mencocokan garis lurus terhadap data pengamatan. Namun perlu diingat oleh setiap peneliti bahwa untuk menetapkan mana variabel respons dan variabel penjelas harus dilakukan secara hati-hati. Walaupun secara ringkas, penetapan variabel ini dapat dilakukan sesuai dengan tujuan penelitian, namun kedua variabel yang diamati haruslah masuk akal. Suatu contoh ekstrim, misalnya ingin diamati hubungan antara banyaknya kokok ayam di pagi hari dengan curah hujan yang terjadi pada waktu tertentu. Walaupun hal ini dapat dilakukan secara numerik, namun hasil dari bentuk hubungan itu menjadi tidak bermakna sama sekali.

Page 18: Tinjauan Praktis Dari Aplikasi Statistika

JURUSAN STATISTIKA, UNIVERSITAS ISLAM BANDUNG

18 Tinjauan Praktis dari Aplikasi Statistika

Sebagaimana yang telah dibahas sebelumnya bahwa variabel penjelas x dapat digunakan untuk keperluan memprediksi variabel respons y. Ketika persamaan regresi sudah diperoleh, maka langkah selanjutnya adalah ingin diketahui seberapa besar kemampuan variabel penjelas x dalam memprediksi variabel respons y dengan baik. Untuk menjawab masalah ini, maka diperlukan suatu besaran yang disebut dengan koefisien determinasi atau dinotasikan oleh r2.

Koefisien determinasi, r2, merupakan proporsi (atau persentase) dari variasi total yang terjadi di dalam variabel y yang dapat dijelaskan atau diperhitungkan oleh persamaan garis regresi. Dengan kata lain, untuk mengukur kekuatan hubungan

antara variabel y dengan persamaan garis regresi y .

Sebagian peneliti seringkali menyederhanakan suatu kesimpulan dengan menganggap koefisien korelasi sebagai bentuk hubungan sebab-akibat. Hal ini tentu saja sesuatu yang keliru. Suatu besaran koefisien korelasi yang tinggi bukan berarti bahwa terdapat hubungan kausal yang nyata diantara kedua variabel tersebut. Suatu contoh klasik seperti dalam hubungan antara tekanan darah dan umur manusia, dimana tekanan darah dapat dipandang sebagai variabel respons, dan umur sebagai variabel penjelasnya. Cukup masuk akal jika kita dapat menyatakan bahwa tinggi atau rendahnya tekanan darah seseorang merupakan fungsi dari umur, tetapi umur tidak ditentukan oleh tekanan darah. Kita tidak dapat begitu saja mengatakan bahwa umur adalah satu-satunya faktor yang mempengaruhi tekanan darah, tetapi kita dapat mempertimbangkan sebagai salah satu faktor penentu. Istilah ’variabel tak bebas’ tidak berari adanya hubungan sebab-akibat (kausal) diantara dua buah variabel.

Akan tetapi, dalam beberapa hal hubungan antara dua buah variabel bukan merupakan bentuk hubungan kausal. Dalam kasus seperti ini, perubahan yang terjadi di dalam satu variabel sebagaimana perubahan yang terjadi dalam variabel yang kedua, tetapi jangan dengan segera menganggap bahwa kedua variabel tersebut sebagai variabel bebas (penjelas) dan variabel takbebas (respons). Dalam kasus seperti ini, maka analisis korelasi lebih tepat digunakan dibandingkan dengan analisis regresi.

Pengamatan pada pasangan dua variabel yang cenderung secara simultan akan bervariasi dalam arah tertentu, namun hal ini tidak berarti bahwa adanya hubungan langsung diantara kedua variabel tersebut. Apabila kita catat banyaknya tindak kriminal untuk setiap bulan (x) dan banyaknya kegiatan pengajian bulanan (y) yang terjadi di beberapa kota, baik di kota besar maupun kota kecil, hasilnya mungkin akan memberikan suatu nilai korelasi positif yang tinggi. Apabila ada variabel lain yang dilibatkan ke dalam analisis (katakan saja variabel itu adalah jumlah penduduk kota tersebut), dimana variabel ini menyebabkan x dan y bervariasi dalam arah yang sama, maka hal ini menunjukkan bahwa x dan y mungkin tidak berhubungan atau bahkan berhubungan negatif. Korelasi yang keliru pada kasus tersebut disebut juga sebagai korelasi spurious. Dengan demikian dapat dikatakan bahwa pada saat menggunakan koefisien korelasi untuk mengukur suatu hubungan, maka kita harus hati-hati terhadap kemungkinan adanya variabel lain yang dapat mempengaruhi kedua variabel yang sedang diamati.

Dalam analisis regresi, ada beberapa asumsi yang harus dipenuhi, diantaranya yaitu: linieritas, homosedastisitas ragam, kebebasan sisaan (non-otokorelasi), normalitas, tidak ada data pencilan dan data berpengaruh, serta tidak terjadi

Page 19: Tinjauan Praktis Dari Aplikasi Statistika

© 2009 - NUSAR HAJARISMAN

19 5. Pemilihan Metode Statistika Yang Tepat

multikolinearitas (khusus analisis regresi multipel). Hal ini perlu dilakukan untuk meyakinkan bahwa hasil analisis yang diperoleh betul-betul merupakan bentuk hubungan yang sebenarnya antara variabel penjelas dengan variabel respons. Yang menjadi dasar ukuran pemeriksaan ini adalah pemeriksaan terhadap sisaannya, yaitu perbedaan antara nilai pengamatan dengan nilai dugaannya.

A. Linearitas. Asumsi yang pertama, linieritas, akan ditentukan melalui analisis sisaan dan plot regresi parsial. Apabila hasil plot menunjukkan pola kurva atau nonlinear, maka kita perlu melakukan transformasi. Transformasi data kadang-kadang memberikan suatu alternatif yang efektif yang menghasilkan model dugaan yang lebih baik. Transformasi data digunakan juga agar asumsi yang dibuat menjadi lebih beralasan. Dari berbagai studi yang telah dilakukan untuk menentukan bentuk model alternatif atau transformasi ternyata terbukti lebih baik daripada model yang biasa (misalnya model linier sederhana).

B. Homoskedastisitas Varians. Kehadiran dari varians yang tidak unik (heterosedastisitas) merupakan pelanggaran asumsi berikutnya dalam analisis regresi linier. Pemeriksaan masalah ini bisa dilakukan melalui plot sisaan. Plot antara studetized residual dengan nilai dugaan dari Yi akan menunjukkan pola yang konsisten atau membentuk suatu pola tertentu apabila ragamnya tidak konsisten. Jika terjadi adanya pelanggaran asumsi ini maka ada dua hal yang bisa dilakukan untuk memperbaikinya. Pertama, jika pelanggaran itu dapat disimbolkan sebagai satu peubah bebas, maka prosedur atau metoda kuadrat terkecil yang diboboti dapat dipakai. Kedua, adalah dengan melakukan transformasi peubah yang dapat menstabilkan ragam.

C. Otokorelasi. Dalam analisis regresi diasumsikan bahwa masing-masing nilai dugaan Yi itu saling bebas. Hal ini berarti bahwa nilai dugaannya tidak berkorelasi dengan setiap nilai dugaannya yang lain. Kita dapat mengidentifikasikan adanya pelanggaran asumsi ini dengan cara membuat plot antara sisaan dengan setiap deret peubah yang mungkin. Jika sisaan ini saling bebas, maka pola dari plot tersebut akan acak dan dekat dengan plot nol. Pelanggaran asumsi ini dapat diidentifikasi melalui pola yang konsisten dalam sisaannya. Untuk mengatasi pelanggran ini dapat dilakukan beberapa cara diantaranya melalui transformasi data ke dalam nilai tertentu, membuat peubah indikator, atau memformulasikan model regresi tertentu.

D. Normalitas. Selanjutnya yang mungkin sering terjadi pelanggaran asumsi adalah pelanggaran terhadap asumsi kenormalan, baik untuk peubah bebas atau peubah tak bebas, atau bahkan keduanya. Pemeriksaan yang paling sederhana terhadap asumsi adalah dengan membuat histogram sisannya. Walaupun hasilnya bisa terlihat langsung namun metoda ini akan sulit dianalisis untuk sampel yang berukuran kecil. Metoda yang lebih baik digunakan adalah dengan menggunakan normal probability plot. Plot ini berbeda dengan plot sisaan, dalam hal bahwa studentized residualnya dbandingkan dengan sebaran normal. Sebaran normal membuat garis lurus, dan sisannya diplot yang dibandingkan diagonalnya. Jika sebarannya normal, maka garis sisaan akan mendekati garis diagonal. Apabila kita menemukan pelanggaran terhadap asumsi ini, seperti biasa ada beberapa hal yang dilakukan untuk mengatasi masalah tersebut. Salah satu diantaranya adalah dengan membuat transformasi data pada suatu nilai tertentu.

Page 20: Tinjauan Praktis Dari Aplikasi Statistika

JURUSAN STATISTIKA, UNIVERSITAS ISLAM BANDUNG

20 Tinjauan Praktis dari Aplikasi Statistika

E. Multikolinearitas. Dalam analisis regresi berganda kita harus hati-hati dengan pengaruh adanya multikolinieritas. Seperti yang telah dibicarakan di atas bahwa adanya hubungan yang sangat erat di antara peubah-peubah bebas tersebut akan mengakibatkan hasil yang kurang baik serta mengakibatkan penduga-penduga bagi koefisien regresinya menjadi tidak stabil. Untuk melihat adanya pengaruh multikolinieritas digunakan statistik VIF (Variance Inflation Factors). Ukuran ini dapat menggambarkan inflasi dari masing-masing koefisien regresi yang ideal. Suatu harga (VIF)i akan besar jika jika peubah bebas ke-i akan mempunyai hubungan linier yang kuat dengan peubah bebas lainnya. Walaupun tidak ada aturan yang jelas untuk mengukur adanya adanya multikolinieritas pada VIF ini, tetapi secara umum apabila (VIF)i lebih besar daripada 10 maka dapat dikatakan terdapat hubungan yang kuat antara peubah bebas ke-i tersebut dengan peubah bebas lainnya (Myers, 1990).

F. Data Pencilan dan Data Berpengaruh. Untuk analsis bagian yang terakhir, maka kita dapat mengidentifikasi pengamatan yang dianggap mempunyai pengaruh yang kuat terhadap persamaan regresi serta kita memutuskan apakah pengamatan tersebut dimasukkan atau dikeluarkan dari analisis. Alat pemeriksaan yang banyak dipakai adalah menyangkut analisis sisaan dan pemeriksaan data pencilan yaitu pengamatan yang mempunyai sisaan yang besar. Sekali lagi yang menjadi dasar pengukurannya adalah “studenzied residual” yang sering juga disebut sebagai R-student.

5.2 Analisis Varians

Untuk menguji kesamaan beberapa rata-rata (means) secara sekaligus diperlukan suatu teknik yang disebut sebagai analisis varians. Analisis varians ini pertama kali dikembangkan oleh Sir Ronald A. Fisher (1890 – 1962), salah seorang statistikawan ulung abad ini.

Analisis varians merupakan suatu metode untuk menguraikan variasi total data menjadi komponen-komponen yang mengukur berbagai sumber variasi. Ada dua komponen yang akan diuraikan, pertama adalah mengukur variasi yang disebabkan oleh galat percobaan, dan yang kedua adalah mengukur variasi yang disebabkan oleh galat percobaan ditambah variasi yang disebabkan oleh perbedaan perlakuan yang diberikan. Klasifikasi pengamatan berdasarkan satu kriteria disebut klasifikasi satu arah.

Dalam makalah ini akan dibahas mengenai analisis varians dengan klasifikasi satu arah atau cukup disingkat dengan analisis varians satu arah. Misalkan kita mempunyai k populasi. Dari masing-masing populasi diambil sampel berukuran n. Misalkan pula

bahwa k populasi itu saling bebas dan berdistribusi normal dengan rata-rata 1, 2,…, k

dengan varians sama 2. Kita akan menguji hipotesis berikut:

H0: 1 = 2 = … = k atau rata-rata untuk k buah perlakuan adalah sama

H1: sekurang-kurangnya dua nilai tengah tidak sama.

Misalkan Yij adalah pengamatan ke-j dari populasi ke-i dan data akan disusun seperti yang disajikan dalam Tabel 2. Di sini Yi. Adalah total semua pengamatan dalam

sampel ke-i, iy adalah rata-rata semua pengamatan dalam sampel ke-i, Y.. adalah total

Page 21: Tinjauan Praktis Dari Aplikasi Statistika

© 2009 - NUSAR HAJARISMAN

21 5. Pemilihan Metode Statistika Yang Tepat

semua nk pengamatan, dan ..y adalah rata-rata semua nk pengamatan. Setiap

pengamatan dapat dituliskan dalam model berikut:

Yij = i + ij … (1)

dimana ij adalah simpangan pengamatan ke-j dalam sampel ke-i dari rata-rata populasi ke-i.

Tabel 2 Struktur Data dari k Sampel Acak

Populasi

1 2 … i … k

y11 y21 … yi1 … yk1

y12 y22 … yi2 … yk2

y1n y2n … yin … ykn

Total Y1o Y2o … Yio … Yko Yoo

Nilai tengah

.1y .2y … .iy …

.ky ..y

Istilah analisis varians sepertinya tidak tepat karena yang akan dibandingkan

adalah rata-ratanya. Akan tetapi apabila kita lihat bagaimana statistik F yang dibentuk untuk menguji hipotesis di atas, maka istilah analisis varians menjadi lebih jelas, yaitu:

F = variasi antar rata-rata sampel

variasi di dalam sampel

Apabila rata-rata tersebut berbeda jauh, dalam hal ini relatif terhadap variasi di dalam masing-masing kelompok, maka besarnya nilai statistik F akan besar dan hipotesis nol akan ditolak. Selanjutnya apabila kita hanya menggunakan dua buah kelompok dalam analisis varians, maka statistik F yang dihasilkan merupakan kuadrat dari statistik t yang berasal dari uji-t dua sampel.

5.2.1 Asumsi-asumsi

Ada beberapa asumsi yang harus dipenuhi dalam penggunaan analisis varians ini. Pemeriksaan asumsi dapat dilakukan dengan dua cara. Pertama, kita dapat mengeksplorasi data atau variabel-variabel yang diamati secara grafis melalui boxplot atau histogram untuk melihat apakah distribusi dalam masing-masing kelompok itu simetris dan bebas dari pencilan atau data-data yang menyimpang lainnya. Juga perlu dilihat apakah penyebaran data antar kelompok tersebut konstan atau tidak. Kedua, pemeriksaan secara formal untuk memerika bahwa:

Populasi-populasi yang diamati berdistribusi normal. Varians dari k populasi adalah sama. Data pengamatan merupakan data yang saling bebas.

Page 22: Tinjauan Praktis Dari Aplikasi Statistika

JURUSAN STATISTIKA, UNIVERSITAS ISLAM BANDUNG

22 Tinjauan Praktis dari Aplikasi Statistika

5.2.2 Uji Perbandingan Ganda

Analisis varians merupakan alat yang ampuh bagi pengujian kesamaan beberapa nilai tengah. Akan tetapi bila H0 ditolak, bahwa nilai tengah itu tidak sama, maka kita tetap tidak mengetahui nilai tengah mana saja yang berbeda. Untuk mengetahui hal tersebut ada beberapa alat yang dapat digunakan, diantaranya yaitu melalui uji perbandingan ganda. Prosedur ANOVA dalam perangkat lunak statistik (seperti SPSS atau Minitab) memberikan berbagai metode untuk menguji seluruh perbedaan rata-rata berpasangan serta uji wilayah berganda untuk mengidentifikasi subset rata-rata yang tidak berbeda dengan yang lainnya.

Kemudian, untuk menguji apakah terdapat hubungan yang lain diantara rata-rata tersebut, prosedur ANOVA dalam perangkat lunak statistik juga memberikan uji mengenai linear, kuadratik, dan polinomial lainnya menurut rata-rata dari kelompok yang terurut. Selain itu, para pengguna dapat menentukan sendiri koefisien untuk kontras yang akan dibentuk untuk menguji hubungan tertentu diantara rata-rata populasi, misalnya perbandingan rata-rata untuk dua buah kelompok perlakuan dengan kelompok kontrol.

5.3 Analisis Multivariat

Penelitian ilmiah merupakan suatu proses pembelajaran secara iteratif. Tujuan mengenai penjelasan fenomena sosial atau fisik harus dispesifikasikan dan kemudian diuji dengan jalan menggabungkan serta menganalisis data. Suatu analisis data yang digabungkan dengan suatu percobaan atau observasi biasanya memerlukan penjelasan yang dimodifikasi mengenai fenomena yang diamati. Selama proses pembelajaran yang bersifat iteratif ini, variabel-variabel yang diamati sering dihilangkan atau ditambahkan, sehingga kompleksitas fenomena seperti ini memerlukan seorang peneliti atau penyelidik untuk mengumpulkan data pada begitu banyak variabel yang berbeda. Di sini akan dibahas sebagian kecil suatu metode statistika yang dirancang untuk memperoleh informasi dari gugus data seperti itu. Oleh karena data yang dikumpulkan menyangkut pengukuran secara simultan pada banyak variabel, maka metodologi itu disebut juga sebagai analisis multivariat.

Salah satu hal yang membuat perkembangan metode multivariat semakin pesat adalah adanya perkembangan yang juga pesat dalam teknologi komputer. Saat ini keunggulan teknologi diikuti oleh pengembangan berbagai perangkat lunak statistik yang memadai. Hal ini membuat tahapan implementasi dalam analisis multivariat menjadi lebih mudah. Berbagai perangkat kunak statistik itu dirancang sedemikian rupa sehingga mudah untuk dioperasikan. Paket program statistika yang mempunyai kapasitas besar diantaranya adalah SPSS (Statistical Package for Social Sciences), SAS (Statistical Analysis System), BMDP, S-PLUS, dan MINITAB. Setiap paket aplikasi statistik yang mempunyai program-program spesialisasi, baik untuk analsisis statistika univariat maupun multivariat. Selain itu telah banyak paket-paket aplikasi statistik yang dirancang untuk menganalisis teknik-teknik multivariat tertentu, seperti INDSCAL dan PREFMAP untuk keperluan penskalaan multidimensi, atau LISREL untuk pemodelan persamaan terstruktur. Paket-paket aplikasi statistik tersebut masing-masing mempunyai kelebihan atau kekurangan.

Page 23: Tinjauan Praktis Dari Aplikasi Statistika

© 2009 - NUSAR HAJARISMAN

23 5. Pemilihan Metode Statistika Yang Tepat

Perlunya memahami hubungan antara banyak variabel ini membuat analisis multivariat menjadi agak sulit untuk dipahami. Ditambah lagi, dasar-dasar matematika yang kuat lebih diperlukan untuk menurunkan teknik statistika multivariat dalam pembentukan inferensi dibandingkan pada analisis statistika univariat. Namun demikian, dengan adanya perkembangan teknologi komputer, sebagaimana yang telaf disebutkan sebelumnya, aspek komputasi dalam analisis multivariat bukan lagi suatu masalah. Yang diperlukan oleh peneliti adalah bagaimana memilih program yang tepat, menggunakannya dengan benar, serta mengetahui bagaimana cara menginterpretasikan hasilnya.

Sebagaimana yang diistilahkan oleh Johnson dan Wichern (1992), analisis multivariat merupakan ‘kantong serba ada’ (mixed bag). Begitu bervariasinya teknik-teknik yang ada dalam analisis multivariat, sehingga sulit untuk menetapkan suatu skema klasifikasi untuk teknik multivariat yang dapat diterima secara umum serta mengindikasikan ketepatan suatu teknik. Salah satu klasifikasi yang membedakan teknik-teknik yang dirancang untuk mempelajari hubungan interdependensi dan untuk mempelajari hubungan depenpensi. Klasifikasi lainnya didasarkan pada besarnya populasi dan banyaknya variabel yang diamati. Namun di luar itu semua, setidaknya ada empat tujuan yang ingin dicapai sehubungan dengan penggunaan metode multivariat. Tujuan-tujuan itu adalah:

1. Reduksi data dan penyederhanaan struktur. Fenomena yang dipelajari diwakili oleh sesederhana mungkin dimensi tanpa banyak kehilangan informasi yang berharga, serta diharapkan dapat membuat interpretasinya menjadi lebih mudah.

2. Klasifikasi dan pengelompokkan. Kelompok-kelompok dari objek atau individu yang ‘mirip’ akan dibuat berdasarkan sejumlah karakteristik tertentu yang diukur. Atau, pembentukan suatu aturan untuk mengklasifikasikan objek atau individu ke dalam kelompok-kelompok tertentu.

3. Penyelidikan keterkaitan antar variabel. Dalam hal ini, sifat-sifat dari hubungan antar variabel merupakan perhatian utama. Beberapa pertanyaan yang harus dijawab dalam hal ini adalah ‘apakah seluruh variabel saling bebas?’ Atau apakah satu atau lebih variabel bergantung pada variabel lainnya? Jika ya, bagaimana bentuk hubungan tersebut?

4. Prediksi. Hubungan antar variabel harus ditentukan untuk keperluan memprediksi suatu nilai dari satu atau lebih variabel berdasarkan pada pengamatan pada variabel lainnya.

5. Pembentukan dan pengujian hipotesis. Menyatakan hipotesis statistik yang dirumuskan dalam bentuk parameter dari populasi multivariat, kemudian dilakukan pengujian hipotesis tersebut.

Berikut ini akan dibahas sedikit mengenai definisi dan tujuan dari berbagai teknik multivariat yang ada, dan secara umum teknik multivariat ini akan dibagi menjadi dua bagian, yaitu teknik dependensi dan teknik interdependensi. Perlu dicatat bahwa metode dependensi merupakan suatu metode untuk menjelaskan atau memprediksi satu atau lebih ukuran kriteria berdasarkan segugus variabel prediktor. Sedangkan metode interdependensi biasanya tidak digunakan untuk keperluan prediksi dan metode ini digunakan untuk memberikan gambaran yang lebih jelas mengenai struktur data dengan jalan menyederhanakan struktur data yang kompleks melalui reduksi data.

Page 24: Tinjauan Praktis Dari Aplikasi Statistika

JURUSAN STATISTIKA, UNIVERSITAS ISLAM BANDUNG

24 Tinjauan Praktis dari Aplikasi Statistika

5.3.1 Teknik Dependensi

Bergantung pada sifat dan banyaknya variabel yang akan diamati oleh peneliti, terdapat beberapa teknik analisis multivariat yang dapat digunakan untuk menganalisis struktur keterkaitan antar variabel. Berikut ini akan diberikan sedikit ringkasan mengenai teknik-teknik analisis multivariat yang digolongkan ke dalam teknik dependensi

A. Regresi Multipel. Regresi multipel merupakan metode analisis yang tepat digunakan pada saat masalah penelitian melibatkan sebuah variabel tak bebas metrik yang diduga mempunyai hubungan dengan satu atau lebih variabel bebas metrik. Tujuan dari analisis regresi multipel ini adalah untuk memprediksi perubahan dalam variabel takbebas untuk merespons perubahan dalam beberapa varibel bebas. Tujuan ini dapat dicapai melalui aturan atau metode kuadrat terkecil.

Pada saat peneliti tertarik untuk memprediksi taraf dari variabel takbebas, maka analisis regresi multipel ini akan sangat bermanfaat. Sebagai contoh, pengeluaran per bulan untuk makan malan di luar (sebagai variabel takbebas) dapat diprediksi dari informasi yang berkenaan dengan pendapatan keluarga, ukuran keluarga, dan umur kepala rumahtangganya (sebagai variabel bebas). Contoh lain, seorang peneliti ingin memprediksi tingkat penjualan berdasarkan informasi mengenai pengeluaran untuk iklan atau promosi, banyaknya tenaga penjual, serta banyaknya outlet untuk penjualan produknya.

B. Analisis Diskriminan Multipel. Apabila suatu variabel takbebas bersifat dikotomus (seperti laki-laki atau wanita) atau multikotomus (seperti tinggi – sedang – rendah), sehingga variabel tersebut bersifat nonmetrik, maka teknik multivariat yang tepat digunakan adalah analisis diskriminan multipel. Analisis diskriminan akan sangat bermanfaat dalam situasi dimana total sampel dapat dibagi menurut kelompok-kelompok berdasarkan variabel takbebasnya yang mempunyai beberapa kelas yang diketahui. Tujuan utama dari analisis diskriminan multipel adalah untuk memahami perbedaan kelompok dan memprediksi kemungkinan bahwa suatu objek atau individu akan diklasifikasikan ke dalam kelompok atau kelas tertentu berdasarkan pada beberapa variabel bebas metrik. Sebagai contoh, analisis diskriminan dapat digunakan untuk membedakan antara konsumen potensial atau bukan potensial menurut sejumlah profil (atau variabel) demografi dan psikografi.

C. Analisis Varians Multivariat. Analisis varians multivariat (multivariate analysis of variance, MANOVA) merupakan teknik statistik yang dapat digunakan untuk mengeksplorasi secara simultan hubungan antara beberapa variabel bebas kategorik (biasanya disebut juga sebagai perlakuan) dengan dua atau lebih variabel takbebas metrik. Analisis ini merupakan perluasan dari analisis varians univariat (ANOVA). Kemudian, analisis kovarians multivariat (MANCOVA) dapat digunakan bersamaan dengan MANOVA untuk menghilangkan (setelah percobaan) efek dari setiap variabel bebas yang tidak terkontrol terhadap variabel takbebasnya. MANOVA akan sangat bermanfaat pada saat peneliti merancang suatu percobaan untuk menguji hipotesis yang berkenaan dengan variasi dalam respons kelompok pada dua atau lebih variabel takbebas metrik.

Page 25: Tinjauan Praktis Dari Aplikasi Statistika

© 2009 - NUSAR HAJARISMAN

25 5. Pemilihan Metode Statistika Yang Tepat

D. Analisis Korelasi Kanonik. Analisis korelasi kanonik dapat dipandang sebagai perluasan dari analisis regresi multipel dalam analisis regresi multipel menyangkut satu variabel takbebas mettrik dengan beberapa variabel bebas metrik. Sedangkan dalam analisis korelasi kanonik, tujuannya adalah untuk mengkorelasikan beberapa variabel takbebas metrik secara simultan dengan beberapa variabel bebas metrik. Jadi, kalau dalam analisis regresi multipel hanya melibatkan satu variabel takbebas, maka dalam analisis korelasi kanonik akan melibatkan beberapa variabel takbebas. Konsep dasar dari analisis korelasi kanonik ini adalah untuk membentuk kombinasi linear dari masing-masing gugus variabel (baik variabel takbebas maupun variabel bebas) sedemikian rupa sehingga akan memaksimumkan korelasi diantara kedua gugus variabel tersebut. Dengan kata lain, prosedur ini adalah untuk mendapatkan segugus bobot (weight) untuk variabel bebas dan takbebas yang dapat memberikan korelasi sederhana yang maksimum diantara segugus variabel tak bebas dengan variabel bebas.

E. Model Peluang Linear. Model peluang linear, sering disebut juga sebagai analisis logit, merupakan kombinasi analisis regresi multipel dan analisis diskriminan. Teknik ini mirip dengan analisis regresi multipel yaitu dalam hal banyaknya variabel bebas (satu atau lebih) yang digunakan untuk memprediksi sebuah variabel takbebas. Yang membedakan model peluang linear dengan analisis regresi multipel adalah bahwa variabel takbebasnya adalah nonmetrik, sebagaimana dalam analisis diskriminan. Skala nonmetrik dari variabel takbebas ini menyebabkan perbedaan dalam metode penaksiran dan asumsi yang berkenaan dengan distribusinya. Jadi, setelah variabel takbebas dispesifikasikan dengan benar dan teknik penaksiran yang digunakan sudah tepat, maka konsep-konsep dasar dalam analisis regresi multipel dapat diterapkan pada model peluang linear. Perbedaan utama antara model peluang linear dengan analisis diskriminan, adalah bahwa model peluang linear dapat mengakomodasi semua jenis variabel bebas (metrik dan nonmetrik), serta tidak memerlukan asumsi mengenai kenormalan multivariat. Akan tetapi, dalam beberapa hal dimana terdapat lebih dari dua taraf dari variabel takbebas, maka analisis diskriminan lebih tepat digunakan.

F. Pemodelan Persamaan Terstruktur. Pemodelan persamaan terstruktur (Structural Equation Modeling), merupakan teknik yang digunakan untuk melihat hubungan secara terpisah untuk masing-masing gugus variabel tak bebas. Dalam bentuk yang paling sederhana, pemodelan persamaan terstruktur dapat memberikan suatu teknik penaksiran yang dapat dan paling efisien bagi sederet persamaan regresi multipel secara simultan. Pemodelan ini dicirikan oleh dua komponen dasar yaitu: (1) model terstruktur, dan (2) model pengukuran.

Model terstruktur adalah model ‘jalur’, yang akan menghubungkan variabel bebas ke variabel takbebas. Dalam keadaan demikian, teori, pengalaman masa lalu atau petunjuk lainnya dapat digunakan peneliti untuk membedakan variabel bebas mana yang mampu memprediksi masing-masing variabel takbebas. Model-model yang dibicarakan sebelumnya yang mengakomodasi variabel takbebas multipel – analisis varians multivariat dan kolerasi kanonik – tidak tepat digunakan dalam situasi ini karena model-model tersebut hanya melihat bentuk hubungan tunggal antara variabel tak bebas dengan variabel bebas.

Page 26: Tinjauan Praktis Dari Aplikasi Statistika

JURUSAN STATISTIKA, UNIVERSITAS ISLAM BANDUNG

26 Tinjauan Praktis dari Aplikasi Statistika

Model pengukuran (measurement model) dapat digunakan peneliti untuk melibatkan beberapa variabel (indikator) untuk sebuah variabel takbebas atau variabel bebas. Sebagai contoh, variabel takbebas ini dapat berupa suatu konsep yang diwakili oleh penjumlahan skala. Dalam model pengukuran, peneliti dapat menetapkan kontribusi dari masing-masing skala item sebagaimana seberapa baik skala tersebut mampu mengukur konsep (atau reliabilitasnya) ke dalam penaksiran hubungan antara variabel bebas dengan variabel takbebas. Prosedur ini mirip dengan pembentukan analisis faktor dari skala item dan menggunakan skor faktor ini dalam regresi.

5.3.2 Teknik Interdependensi

Teknik-teknik yang dibicarakan sejauh ini difokuskan pada metode multivariat yang diterapkan pada data yang berisi baik variabel takbebas maupun variabel bebas. Akan tetapi jika seorang peneliti ingin menyelidiki interdependensi diantara seluruh variabel, tanpa memperhatikan apakah itu variabel bebas atau variabel takbebas, maka diperlukan beberapa metode multivariat lainnya, seperti analisis faktor, analisis klaster, penskalaan multidimensi, dan analisis korespondensi.

A. Analisis Faktor (Factor Analysis). Analisis faktor, termasuk didalamnya analisis komponen utama dan analisis faktor umum, merupakan pendekatan statistik yang dapat digunakan untuk menganalisis hubungan diantara sejumlah besar variabel dan untuk menjelaskan variabel-variabel tersebut ke dalam beberapa dimensi (faktor). Secara umum, analisis ini digunakan untuk menemukan suatu cara untuk meringkas informasi yang berisi sejumlah variabel original ke dalam segugus dimensi (faktor) yang lebih kecil tanpa kehilangan banyak informasi.

B. Analisis Klaster (Cluster Analysis). Analisis klaster merupakan suatu teknik analitik yang dapat digunakan untuk membentuk sub kelompok yang bermakna dari individu atau objek. Lebih khusus lagi, analisis ini bertujuan untuk mengklasifikasikan unsur-unsur sampel (individu atau objek) ke dalam kelompok-kelompok yang saling bebas bedasarkan pada kemiripan atau kedekatan antar objek/individu. Di dalam analisis klaster, tidak seperti dalam analisis diskriminan, kelompok-kelompoknya belum terdefinisikan, justru teknik ini digunakan untuk mengidentifikasikan kelompok.

Setidaknya ada dua tahapan yang harus dilalui dalam analisis klaster. Pertama, adalah mengukur kemiripan atau kedekatan (similaritas) antar objek atau individu untuk menentukan berapa sebenarnya kelompok yang muncul dalam sampel. Tahap kedua adalah membentuk profil variabel untuk menentukan komposisinya. Tahap ini dapat diikuti dengan jalan menerapkan analisis diskriminan pada kelompok-kelompok yang teridentifikasi melalui analisis klaster.

C. Penskalaan Multidimensi (Multidimensional Scaling). Tujuan dari penskalaan multidimensi adalah untuk mentransformasikan penilaian konsumen mengenai similaritas atau preferensi ke dalam ukuran jarak yang diwakili dalam ruang multidimensi. Apabila objek A dan B dinilai oleh respons adalah yang paling mirip dibandingkan seluruh pasangan objek lainnya, maka teknik penskalaan multidimensi akan memposisikan objek A dan B sedemikian rupa sehingga jarak keduanya dalam ruang multidimensi lebih kecil daripada jarak dengan setiap pasangan objek. Hasil peta persepsi ini menunjukkan posisi relatif dari seluruh

Page 27: Tinjauan Praktis Dari Aplikasi Statistika

© 2009 - NUSAR HAJARISMAN

27 Daftar Pustaka

objek, tetapi analisis tambahan diperlukan untuk menetapkan atribut-atribut mana saja yang mampu memprediksi posisi dari setiap objek.

D. Analisis Korespondensi (Correspondence Analysis). Saat ini analisis korespodensi merupakan pengembangan teknik interdependensi yang memfasilitasi baik untuk reduksi dimensi dari rating objek pada segugus variabel maupun pemetaan persepsi dari objek relatif terhadap atribut-atributnya. Pada umumnya, peneliti dihadapkan pada keperluan untuk mengkuantifikasikan data kualitatif yang ditemukan dalam variabel nominal. Analisis korespondensi berbeda dengan teknik interdependensi yang dibahas sebelumnya karena kemampuannya untuk mengakomodasi data nonmetrik maupun hubungan nonlinear. Bentuk dasar dari analisis korespondensi adalah menggunakan tabel kontingensi, yaitu tabulasi-silang dua buah variabel katagorik. Kemudian mentransformasi data nonmetrik ke dalam data metrik serta membentuk reduksi dimensi (seperti dalam analisis faktor) dan pemetaan persepsi (seperti dalam penskalaan multidimensi). Sebagai contoh, preferensi responden pada suatu merek dapat ditabulasi-silangkan pada variabel demografi (seperti umur, kategori pendapatan, pekerjaan). Untuk menunjukkan seberapa banyak responden dalam menyukai masing-masing merek jatuh pada masing-masing kategori dari variabel demografi yang diamati. Melalui analisis korespondensi, asosiasi antara merek dengan perbedaan karakteristik dalam menyukai masing-masing merek ditunjukkan dengan peta berdimensi dua atau tiga. Merek-merek yang dianggap paling mirip dilokasikan dengan jarak yang dekat satu sama lainnya. Sedangkan, karakteristik yang paling berbeda dari preferensi responden pada masing-masing merek juga ditentukan oleh jarak dari variabel demografi terhadap posisi merek tersebut.

Daftar Pustaka

Barnett, V. and T. Lewis (1984). Outliers in Statistical Data, Second Edition. John Wiley & Sons, New York.

Belsley, D.A., E. Kuh, and R.E. Welsch. (1980). Regression Diagnostics: Identifying Influential Data and Sources of Collinearity. New York: John Wiley & Sons.

Box, G.E.P., and D.R. Cox. (1964). An Analysis of Transformations (with Discussion), Journal of the Royal Statistical Society, Series B. 26: 211-246.

Box, G.E.P., and P.W. Tidwell. (1962). Transformation of the Independent Variables, Technometrics 4: 531-550.

Chatterjee, S. and A.S. Hadi. (1988). Sensitivity Analysis in Linear Regression. New York: John Wiley & Sons.

Cook, R.D. and S. Weisberg. (1982). Residuals and Influence in Regression. London: Chapman and Hall.

Draper, N. R., and H. Smith. (1981). Applied Regression Analysis. Second Edition. New York: John Wiley & Sons.

Graybill, F.A. (1976). Theory and Application in Linear Model. Boston, Massachusetts: Duxbury Press.

Page 28: Tinjauan Praktis Dari Aplikasi Statistika

JURUSAN STATISTIKA, UNIVERSITAS ISLAM BANDUNG

28 Tinjauan Praktis dari Aplikasi Statistika

Hair, Anderson R.E., Tatham, and Black, W.C. (1992). Multivariate Data Analysis: With Readings, Third Edition. Macmillan Publishing, New York.

Johnson, R.A., and Wichern, D.W. (1999). Applied Multivariate Statistical Analysis. Second Edition. London: Prentice - Hall

Kerlinger, F.N., (1964). Foundations of Behavioral Research, Second Edition. Holt, Rinehart, and Winston, Inc., New York.

Myers, R.H. (1990). Classical and Modern Regression With Applications, Second Edition. PWS-Kent Publishing, Massachusetts.

Montgomery, D.C. and Peck, E.A. (1992). Introduction To Linear Regression Analysis. John Wiley & Sons, New York.

Neter, J., Wasserman, W., and Kutner, M.H. (1990). Applied Linear Statistical Models, Third Edition. Richard D. Irwin Inc., Illinois.