analisis data i-02 univariate

Upload: deden-istiawan

Post on 11-Oct-2015

28 views

Category:

Documents


0 download

TRANSCRIPT

Metode Penelitian Ilmiah

Analisis Data IAkademi Statistika MuhammadiyahSemarang

Jenis Analisis dataAnalisis Statistik Deskriptifcara mengorganisasi dan menyimpulkan informasi secara numerik, dengan menelaah variabel penelitian satu persatu. Biasanya dengan menggunakan tabel, grafik atau diagram.Analisis Statistik Inferensialadalah cara untuk menarik suatu kesimpulan atau mengetahui suatu keadaan yang terjadi pada suatu populasi dengan menggunakan informasi yang didapatkan dan sampel yang merupakan bagian dari populasi tersebut. Merupakan pengambilan kesimpulan dengan melakukan pengujian hipotesis.Analisis Statistik DeskriptifPenyajian hasil analisis deskriptif biasanya berupa frekuensi dan persentase, tabulasi silang, serta berbagai bentuk grafik dan Chart pada data yang bersifat kategorikal, serta berupa statistik-statistik kelompok (mean dan varians) pada data yang bukan kategorikal RespondenJKJurusanIPAWEKONOMI2,89BWKOMPUTER3,25CLKOMPUTER2,90DLEKONOMI2,77ELKOMPUTER2,55FWEKONOMI2,50GWKOMPUTER2,68HLKOMPUTER3,45IWKOMPUTER2,90JWEKONOMI3,00Contoh sederhana hasil pengumpulan data Penelitian yang melibatkan 3 macam variabel untuk penelitian tentang mahasiswa pengguna Lab komputer di Perguruan Tinggi ABCTabel distribusi frekuensiJenis KelaminDapat disimpulkan bahwa 60 persen pengguna lab komputer adalah Wanita

Jenis KelaminJumlahPersentaseWanita660Laki-laki440Total10100Tabel distribusi frekuensi JurusanDapat disimpulkan bahwa 60 persen pengguna lab komputer adalah mahasiswa jurusan komputerJurusanJumlahPersentaseEkonomi440Komputer660Total10100Tabel distribusi frekuensi silangDapat disimpulkan bahwa pengguna 10% pengguna lab adalah mahasiswa laki-laki jurusan Ekonomi30% pengguna lab adalah mahasiswa laki-laki jurusan komputer Jenis KelaminJurusanEkonomiKomputerTotal Wanita330%330%660%Laki-laki110%330%440%Total440%660%10100%Analisis Statistik InferensialPengolahan data pada tingkat ini dimaksudkan untuk mengambil kesimpulan dengan pengujian hipotesisPada dasarnya pengujian hipotesis statistika terbagi menjadi :Hipotesis deskriptifHipotesis tentang adanya hubungan (korelasi)Hipotesis tentang adanya perbedaan kelompok

Hipotesis deskriptifDugaan tentang nilai suatu variabel mandiri, tidak membuat perbandingan atau hubunganContoh :Berapa kecepatan akses data komputer A?Berapa besar data yang dapat ditampung di media penyimpanan X ?Data yang dapat ditampung di media X = 50 GBSeberapa tinggi produktivitas penjualan karyawan di departemen Marketing?Produktivitas karyawan di departemen marketing = 250 penjualan per bulanHipotesis komparatifPernyataan yang menunjukkan dugaan nilai dalam satu variabel atau lebih pada sampel yang berbedaContoh :Adakah perbedaan kemampuan processor A dengan processor B ?Rumusan Hipotesis :Tidak ada perbedaan kemampuan processor A dgn processor BKemampuan processor B paling kecil sama dengan processor AKemampuan processor B paling tinggi sama dengan processor AApabila dikembangkan :Rumusan Hipotesis :Tidak ada perbedaan kemampuan processor A dgn processor BH0 : 1 = 2Ha : 1 2Kemampuan processor B paling kecil sama dengan processor AHo : 1 > 2Ho : 1 < 2Kemampuan processor B paling tinggi sama dengan processor AHo : 1 < 2Ha : 1 > 2

Hipotesis Hubungan (asosiatif)Suatu pertanyaan yang menunjukkan dugaan tentang hubungan antara dua variabel atau lebihContoh :Adakah hubungan antara keahlian seseorang dengan peluang kerja ?Rumus hipotesis : Tidak ada hubungan antara keahlian seseorang dengan peluang kerja.H0 : = 0Ha : 0Menentukan jenis metode statistik yang dipergunakanKaitan antara jenis hipotesis, jumlah sampel dan skala pengukuran data menentukan jenis metode statistik yang digunakanuntuk Pengujian hipotesis diperlukan pedoman penggunaan teknik statistik yang dikaitkan dengan jumlah sampel dan skala pengukuranPENGUKURAN Pengukuran adalah penunjukan angka-angka pada suatu variable

Pengukuran membutuhkan alat ukur/ instrumen yang standar, baik alat maupun kuesioner

Pengukuran adalah mendapatkan dimensi kuantitas suatu objek, misalnya berat badan, jumlah pasienSyarat pengukuranisomorfisme, yaitu ukuran harus sedekat mungkin dengan benda/ kejadian yang diukur (terkadang yang dapat diukur hanya indikatornya).

exhaustive, yaitu pengukuran harus meliputi seluruh kemungkinan yang ada

mutually exlusive, yaitu pengukuran tidak boleh tumpang tindihSkala pengukuran

Hasil suatu pengukuran untuk analisis data dapat dibagi dalam 4 skala : skala nominal skala ordinal skala interval skala rasioSkala nominal merupakan tingkat pengukuran yg paling sederhana untuk klasifikasi data tidak ada asumsi jarak atau urutan antara angka-2 dasar penggolonganya mutualy exclusive & exhautive kode atau angka tak menunjukan rendah ke tinggi atau sebaliknya

Misalnya variabel jenis kelamin : 1= pria dan 2 = wanita warna, partai, lokasi, dsbSkala ordinal merupakan tingkat pengukuran yang mempunyai urutan dari rendah ke tinggi kode atau angka sekedar menunjukan urutan bukan nilai

misalnya variable sikap : 3 = setuju, 2 = ragu-ragu/ tidak berpendapat, dan 1= tidak setuju pendidikan (SD, SLTP, SLTA, perguruan tinggi)

Skala interval memberikan informasi tentang interval antara satu kode/ angka dengan yang lain merupakan tingkat pengukuran urutan dari rendah ke tinggi

misalnya variable nilai ujian : A = 86-99, B = 76-85, C = 66-75 D = 56-65

Skala ratio merupakan tingkat pengukuran urutan dari rendah ke tinggi memberikan informasi tentang nilai sebenarnya responden/ objek yang diukur menggambarkan interval antara kode/angka dgn nilai 0

Misalnya variable nilai ujian dari 0 - 100 Hubungan antara skala pengukuran

Skala yg lebih tinggi dapat diubah menjadi skala yg lebih rendah, dan tidak sebaliknya.Menentukan jenis metode statistik yang dipergunakanKaitan antara jenis hipotesis, jumlah sampel dan skala pengukuran data menentukan jenis metode statistik yang digunakanuntuk Pengujian hipotesis diperlukan pedoman penggunaan teknik statistik yang dikaitkan dengan jumlah sampel dan skala pengukuran Jenis PenelitianSampelSkala pengukuranAlat statistikDeskriptifSatu sampelNominalBinomial atau Chi kuadratDeskriptifSatu sampelOrdinalRun TestDeskriptifSatu sampelInterval / RasioT-TestKomparatifDua sampel berpasanganNominalMc. NemarKomparatifDua sampel berpasanganOrdinalSign-Test / Wilcoxon Matched PairsKomparatifDua sampel berpasanganInterval / rasioT-TestKomparatifDua sampel independenNominalFisher / Chi kuadratKomparatifDua sampel independenOrdinalMedian-Test, Mann Whitney, U-Test, Kolmogorov Smirnov, Run Wald-WolvowiltzKomparatifDua sampel independenInterval / rasioT-TestJenis PenelitianSampelSkala pengukuranAlat statistikKomparatifK sampel berpasanganNominalCochran QKomparatifK sampel berpasanganOrdinalFriedmanKomparatifK sampel berpasanganInterval / rasioAnovaKomparatifK sampel independenNominalChi KuadratKomparatifK sampel independenOrdinalMedian Extention, Kruskal wallsKomparatifK sampel independenInterval / rasioAnovaAsosiatifNominalKoefisien kontigensiAsosiatifOrdinalKoefisien spearman RankAsosiatifInterval / rasioKorelasi pearson product moment, korelasi parsial, korelasi berganda, regresiAnalisis data berdasar variabel Analisis univariat adalah analisis satu variabel

Analisis bivariat adalah analisis hubungan 2 variabel Analisis multivariat adalah analisis hubungan lebih dari 2 variabel secara bersamaAnalisis univariatAnalisis terhadap satu variabel Biasanya dilakukan analisis untuk mengetahui: Distribusi frekuensiKecenderungan tengah (central tendency)Penyebaran (dispersion)PersentaseIlustrasi

Stem-and-Leaf Display: Volume

Stem-and-leaf of Volume N = 31Leaf Unit = 1.0

10 1 0005688999(9) 2 111224457 12 3 13468 7 4 2 6 5 11558 1 6 1 7 7

27Untuk kebutuhan ekplorasi data, bentuk penyajian data yang paling banyak digunakan adalah diagram dahan daun (stem and leaf), histogram, diagram kotak garis (box-plot), dan plot antar peubah.Diagram dahan daun atau histogram dapat digunakan untuk menelusuri pola sebaran data (simetrik atau menjulur).Box-plot dapat juga digunakan untuk melihat sebaran tetapi penggunaan lebih spesifik adalah untuk mengidentifikasi keanehan-keanehan data.Plot antar peubah digunakan untuk melihat pola hubungan antar variabel (tidak berhubungan, ada hubungan linier atau non linier)

Kegunaan analisis univariatSalah satu cara melihat adanya kesalahan koding atau entry datajawaban di luar area penelitiandata yang sangat ekstrim mengganggu nilai rerata data yang tidak konsisten, misalnya variabel seks pria tetapi variabel kehamilan positifjawaban tdk berlaku diberi kode 9 /0 ikut dianalisisMendeskripsikan suatu fenomena dengan baik.Perincian/ gambaran besarnya suatu fenomenaPetunjuk pemecahan masalahPersiapan analisis bivariat atau multivariat

Distribusi FrekuensiMerupakan himpunan frekuensi dari nilai atau kisaran nilai suatu variabel

Central tendencyMerupakan estimasi pusat distribusi nilai-nilai suatu variabelTiga tipe utama central tendency:MeanMedianModusMean (rata-rata/rataan/rerata)Paling umum digunakanJumlahkan nilai semua pengamatan (observasi) lalu bagi dengan jumlah pengamatan. Misal:15, 20, 21, 20, 36, 15, 25, 15Jumlah 8 nilai tadi adalah 167, maka mean-nya adalah 167/8 = 20.875.MedianNilai yang terdapat persis di tengah-tengah jika nilai semua pengamatan diurutkan dari yang terkecil sampai terbesar.15,15,15,20,20,21,25,36Ada 8 nilai pengamatan dan nilai pengamatan 4 dan pengamatan 5 berada di tengah-tengah, karena nilainya sama-sama 20 maka mediannya adalah 20. Jika kedua pengamatan tsb berbeda nilainya maka median harus dihitung dengan cara interpolasi.

ModusAdalah nilai yang paling tinggi frekuensi kemunculannya.Dalam contoh tadi, modusnya adalah 15Suatu variabel dapat memiliki lebih dari satu modus, misalnya bimodal= dua nilai modus; multimodal= lebih dari 2 nilai modus Perhatikan !Dalam contoh tadi, mean=20,875; median=20; modus=15Jika distribusinya betul-betul normal (bell shape/berbentuk lonceng) maka ketiga ukuran central tendency tersebut nilainya sama.Artinya distribusi nilai variabel contoh tsb tidak betul-betul normal.Dispersi (ukuran penyebaran)Merupakan rentang sebaran nilai-nilai di seputar nilai pusatDua ukuran yang biasa digunakan:Range (kisaran): nilai tertinggi dikurangi nilai terendah (36-15=21)Standard deviation (SD/simpangan baku): lebih akurat dan detail, kisaran dipengaruhi oleh outlier(s)/nilai yang ekstremStandard deviation (1)15,20,21,20,36,15,25,15Mula-mula hitung jarak masing-masing nilai dari mean (20,875):

15 - 20.875 = -5.87520 - 20.875 = -0.875 21 - 20.875 = +0.12520 - 20.875 = -0.87536 - 20.875 = 15.12515 - 20.875 = -5.87525 - 20.875 = +4.12515 - 20.875 = -5.875Standard deviation (2)Masing-masing jarak tadi dikuadratkan:

-5.875 * -5.875 = 34.515625-0.875 * -0.875 = 0.765625+0.125 * +0.125 = 0.015625-0.875 * -0.875 = 0.76562515.125 * 15.125 = 228.765625-5.875 * -5.875 = 34.515625+4.125 * +4.125 = 17.015625-5.875 * -5.875 = 34.515625Standard deviation (3)Hitung Sum of Squares (SS)= jumlahkan seluruh nilai jarak yang telah dikuadratkan tadi = 350,875Hitung variance= SS dibagi dengan (jumlah pengamatan dikurangi 1) = 350.875 / 7 = 50,125 Hitung standard deviation= Akar kuadrat dari variance =7,079901129253.Standard deviation (4)

Standard deviation (5)Standard deviation membantu menyarikan sebaran data secara lebih spesifik. Jika distribusi normal (atau mendekati normal), maka:Kira-kira 69% nilai berada antara mean + 1 SD; kira-kira 95% nilai berada antara mean + 2 SD; 99% nilai berada antara mean + 3 SDMisalnya: mean 20,875 dan SD=7,0799 maka kira-kira 95% nilai-nilai pengamatan berada pada kisaran 20,875-(2x7,0799) sampai 20,875+(2x7,0799) atau antara 6,7152 dan 35,0348. ContohData karakteristik mahasiswaANALISIS BIVARIATAnalisis bivariat adalah analisis hubungan 2 variabel yg dapat bersifat :

(a) simetris tak saling mempengaruhi

(b) saling mempengaruhi

(c) variabel satu mempengaruhi variabel lainKorelasi (1)Koefisien korelasi= angka yang menunjukkan kekuatan hubungan antara 2 variabelContoh: kita ingin mengetahui hubungan antara tinggi badan (height dalam inci) dengan rasa percaya diri (self esteem)Hipotesis: TB mempengaruhi rasa PDKorelasi (2)PersonHeightSelf Esteem1684.12714.63623.84754.45583.26603.17673.88684.19714.310693.711683.512673.213633.714623.315603.416634.017654.118673.819633.420613.6

Korelasi (3)

VariableMeanStDevVarianceSumMinimumMaximumRangeHeight65.44.4057419.41051308587517Self Esteem3.7550.4260900.18155375.13.14.61.5Korelasi (4)

Korelasi (5)

Korelasi (6)PersonHeight (x)Self Esteem (y)x*yx*xy*y1684.1278.8462416.812714.6326.6504121.163623.8235.6384414.444754.4330562519.365583.2185.6336410.246603.118636009.617673.8254.6448914.448684.1278.8462416.819714.3305.3504118.4910693.7255.3476113.6911683.5238462412.2512673.2214.4448910.2413633.7233.1396913.6914623.3204.6384410.8915603.4204360011.561663425239691617654.1266.5422516.8118673.8254.6448914.4419633.4214.2396911.5620613.6219.6372112.96Sum =130875.14937.685912285.45Korelasi (7)

Korelasi (8)

Korelasi (9)Setelah diperoleh koefisien korelasi, dapat ditentukan apakah korelasi tersebut terjadi karena kebetulan (by chance) atau suatu korelasi yang riil.Dalam hal ini, ingin diuji hipotesis berikut:Null Hypothesis: r = 0Alternative Hypothesis: r 0Korelasi (10)Selanjutnya lihat tabel nilai kritis rTetapkan terlebih dahulu:Tingkat signifikansi (), misalnya 0,05 (5%, artinya peluang bahwa korelasi terjadi karena kebetulan adalah tidak lebih dari 5 dari 100.Derajat bebas = N-2 (dalam contoh kita: 20-2=18)Jenis uji: satu ekor atau dua ekor (satu arah atau dwiarah), misal: dwiarahKorelasi (11)Di tabel ditemukan bahwa nilai kritis untuk ketiga parameter tersebut adalah: 0,4438Artinya jika koefisien korelasi kita >0,4438 atau