kul 04 spss_9_11

97
SPSS TATAP MUKA KE IV COMPUTING DESCRIPTIVE STATISTICS COMPARING GROUPS 31-82 EDISI 2013 dosen Prof(Em). Dr. H. Soedito Adjisoedarmo

Upload: stmik-wu-purwokerto

Post on 19-Jun-2015

1.591 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Kul 04 spss_9_11

SPSSTATAP MUKA KE IV

COMPUTINGDESCRIPTIVE STATISTICS

COMPARING GROUPS

31-82

EDISI 2013

dosen Prof(Em). Dr. H. Soedito Adjisoedarmo

SPSSTATAP MUKA KE IV

COMPUTINGDESCRIPTIVE STATISTICS

COMPARING GROUPS

31-82

EDISI 2013

dosen Prof(Em). Dr. H. Soedito Adjisoedarmo

Page 2: Kul 04 spss_9_11

BAGAIMANA CARA ANDA DAPAT MERANGKUMG NILAI SUATU VARIABEL ?

Apa yang dimaksud skala mengukuran ?Mengapa skala mengukuran penting ?Apa bedanya mean dengan mode dan Median?Kapan median lebih baik mengukurCentral tendency dibanding dg mean ?

COMPUTING DESCRIPTIVE STATISTICS

Page 3: Kul 04 spss_9_11

BAGAIMANA CARA ANDA DAPAT MERANGKUMG NILAI SUATU VARIABEL

Apa yang dimaksud skala mengukuran ?Mengapa skala mengukuran penting ?Apa bedanya mean dengan mode dan Median?Kapan median lebih baik mengukurCentral tendency dibanding dg mean ?Apa yang dapatkan dari variance ?Apa yang dapatkan dari coefficient Variation?Apa yang dimaksud score terstandar Dan mengpa penting ?

Page 4: Kul 04 spss_9_11

Pada pokok bahasan ke iii, telah digunakan tabel frekuensi, pie dan bar chart serta histogram untuk mengamati distribusi nilai variabel.

Fasilitas/prosedur tersebut merupakan teknik esensial untuk mengenali data.

Di samping teknik tersebut kita sering membutuhkan untuk merangkum nilai variabel lebih lengkap dengan cara menghitung statistics dari nilai variabel

Page 5: Kul 04 spss_9_11

Atau central tendency, dan mengamati penyebaran data di sekitas nilai tengah, atau yang lebih dikenal sebagai variasi atau kergamanan data.

Pada pokok bahasan iv akan dibahasan penggunaan frekuensi dan prosedur descriptive untuk menghitung statistics yang sering digunakan untuk central tendency dan variability

Page 6: Kul 04 spss_9_11

Sering kalau kita mengumpulkan data, kita ingin menarik kesimpulan mengenai populasi individu atau obyek berdasar individu atau obyek yang kita libatkan dalam penelitian.

ContohDari sampel gss ditarik (ditaksir) simpulan untuk populasi, rakyat amerika.Dari sample umpan balik ditarik simpulan untuk mhs fakultas peternakan. Dst….

WHAT’S A STATISTIC ?

Page 7: Kul 04 spss_9_11

Statistic merupakan karak teristik sampel untuk variabel tertentu. Simpulan yang diambil untuk menaksir karakteristik po pulasi. Karakteristik yang dimili ki populasi disebut parameter.

Kalau kita mempunyai data umur seluruh mahasiswa indonesia, nilai tengah umur tersebut disebut nilai parameter

Page 8: Kul 04 spss_9_11

Pada umumnya untuk semua populasi nilai parameter tidak diketahui. Oleh karena itu ditaksir menggunakan stastic sample yang diperoleh lewat penelitian; menggunakan analisis data yang antara lain dapat menggunakan spss.

Page 9: Kul 04 spss_9_11

Perhatikan data dari tatap muka ke iii; kalau ada akan merangkum lebih lanjut nilai data tersebut, misal ingin mengetahui rataan umur, atau karakteristik status pekerjaan atau kepuasaan terhadap pekerjaan mereka ( di tempat yang berbeda).

Jawaban yang spesifik mungkin tidak dapat diperoleh, karena cara untuk menetapkan jawaban yang spesifik banyak cara.

SUMMARIZING DATA

Page 10: Kul 04 spss_9_11

Anda dapat menjawab mengguna kan mode, median atau nilai tengah data dari sampel.

Untuk memilih mengukuran yang digunakan di atas, anda harus mempertimbangkan sifat data yang anda miliki/peroleh dari survai, dan sifat dari skal mengukuran yang digunakan.

Page 11: Kul 04 spss_9_11

Salah satu karakteristik data yang harus selalu pertimbangkan adalah skala mengukuran yang digunakan untuk memperoleh data tersebut.

Skala mengukuran dikelompok kan menjadi • nominal• Ordinal• Interval dan • ratio (Steven, 1946)

SCALES OF MEASUREMENT (SKALA PENGUKURAN)

Page 12: Kul 04 spss_9_11

Skala nominal digunakan hanya untuk identifikasi. Data yang diukur dengan skala nominal tidak dapat diurutkan dari yang kecil ke yang besar.

ContohStatus pekerjaan diukur dengan skala nominal, meskipun dalam bentuk kode, angka tersebut tidak bermakna, retired, in school dan keeping house tidak dapat diurutkan dan dikatakan yang satu lebih besar dari yang lain

SKALA NOMINAL

Page 13: Kul 04 spss_9_11

Contoh variavel dengan skala nominal

Page 14: Kul 04 spss_9_11

Tempat lahir, dan warna kulit adalah contoh lain variabel yang diukur dengan skala nominal. Digunakan untuk identifikasi.

Page 15: Kul 04 spss_9_11

SKALA PENGUKURANYANG PERLU DIINGAT

WHEN ARE STATISTICS APPLICABLE ?

The data type fall into a sort of hierarchy so that any statistic or procedure that is applicable for the lowest type is also applicable for all higher type.The lowest type of data in the hierarchy is called Nominal data .

Page 16: Kul 04 spss_9_11

Nominal data, is the type of data that we normally call categorical data. In this type of data the values merely substitutes for names of values.An example of nominal data would be Church. This variable could take on values such as (1) Lutheran , (2) Methodist, (3) Catholic, and (4) Jewish, etc.

Page 17: Kul 04 spss_9_11

Alphanumeric data can also be described as nominal data. None of the statistics (mean, variance, range, sum, std err, kurtosis, minimum, std dev, skewness, sum) however Frequencies or Crosstabs are applicable.

Page 18: Kul 04 spss_9_11

Bila anda menggunakan skala nomial, maka anda membuat partisi dalam suatu himpunan ke dalam kelompok-2 yg mutually exclusive (mewakili kajadian yang berbeda) dan collectively exhaustic (dapat menjelaskan semua kejadian yg terjadi dalam kelompok tersebut).

SKALA NOMINAL

Page 19: Kul 04 spss_9_11

VARIABEL NOMINAL

Varibel yang ditetapkan berdasar atas proses penggolongan. Variabel nominal bersifat diskrit dan saling pilah (mutually exclusive) antara kategori yang satu dengan kategori yang lain.

Contoh: jenis kelamin, status perkawinan, dan jenis pekerjaan

Page 20: Kul 04 spss_9_11

The next data types is called Ordinal data

Ordinal dataThis type of data has a particular order to its values. For example a rating on FOOD at a restaurant with values good, fair, dan poor would be ordinal data.

Another example of ordinal data would be an opinion surveywith answers such as strongly agree, agree, neutral, disagree, strongly disagree.

Page 21: Kul 04 spss_9_11

Ordinal data can be ranked from high to low which makes the statistics minimum, maximum, dan minimum, maximum, dan rangerange applicable.

Most statisticians agree that the other statistics and procedures such as mean, Pearson corr and regression should not be used with ordinal data.

Page 22: Kul 04 spss_9_11

SKALA ORDINAL

Mencakup ciri-2 skala nominal ditambah satu yaitu urutan.Skala ordinal dapat dipakai jika postulat mengenai transitivitas dipenuhi. Postulat tsb menyatakan bahwa apabila a lebih besar dari b dan b lebih besar dari c, maka a lebih besar dari c (a>b>c).

Urutan yang dapat dipakai adalah :lebih dari……………….kurang dari…………….di atas ………………….di bawah……………….

Page 23: Kul 04 spss_9_11

SKALA ORDINAL

Contoh skala pendapat, skala preferensi, Statistik yang dapat dipakai: median, persentil (seperseratusan) dan kuartil (seperempatan) menyatakan sebaran nya.Ukuran uji nyata secara statistik menggunakan metode non-para metrik (Steel & Torrie, 19--; hal 533)

Contoh skala pendapat, skala preferensi, Statistik yang dapat dipakai: median, persentil (seperseratusan) dan kuartil (seperempatan) menyatakan sebaran nya.Ukuran uji nyata secara statistik menggunakan metode non-para metrik (Steel & Torrie, 19--; hal 533)

Page 24: Kul 04 spss_9_11

VARIABEL ORDINALVARIABEL ORDINAL

Variabel yang disusun atas jenjang dalam atribut tertentu. Jenjang tertinggi biasanya diberi angka 1, jenjang di bawah nya diberi angka 2, dan seterusnya.

Contoh: ranking hasil lomba

Page 25: Kul 04 spss_9_11

INTERVAL DATA

The third type of data is in interval level data. We frequently call this metric or continues data. In addition to having a order like ordinal data this type of data also as a fixed unit of measurement.

An example of an interval level variable would be temperature. This variable is interval since the distance between 30 and 1 degrees is the same as the distance between any other two consecutive degrees.

Page 26: Kul 04 spss_9_11

INTERVAL DATA

All of the statistics including mean, standard deviation, standard error, variance, kurtosis and skewness are applicable for this kind of data,

The procedures Pearson Corr dan Regression are also applicable

Page 27: Kul 04 spss_9_11

SKALA INTERVALSKALA INTERVAL

Skala interval memiliki keampuhan skala ordinal dan niminal masih ditambah lagi dengan mencakup kesamaan interval (jarak antara 1 dan 2, sama dengan jarak antara 2 dengan 3). Waktu kalender merupakan contoh skala interval. Dapat juga untuk skala sikap. Ukuran sentralnya adalah rata-rata hitung. Prosedur statistik yang dapat dipakai antara lain: korelasi product moment, uji t, dan uji F .

Page 28: Kul 04 spss_9_11

VARIABEL INTERVALVARIABEL INTERVAL

Variabel yang dihasilkan dari pengukuran, yang di dalam pengukuran itu dasumsikan terdapat satuan pengukuran yang sama .

Contoh: prestasi belajar, sikap terhadap……, penghasilan, dsb

Page 29: Kul 04 spss_9_11

RATIO DATA

The forth and highest type of data in the hierarchy is called ratio data.

This type of data has all the properties of ordinal data but has added the additional property of having a zero point in its measurement scheme.

Page 30: Kul 04 spss_9_11

SKALA RASIO

Memiliki semua keampuhan dari skala nominal, ordinal, dan interval, dan ditambah dengan memiliki titik nol.

Skala rasio mencerminkan jumlah yang sebenarnya dari dari suatu variabel.

Page 31: Kul 04 spss_9_11

SKALA RASIO

Contoh: ukuran dimensi fisik seperti berat, tinggi, jarak dan lsb. Dalam penelitian bisnis banyak ditemui /digunakan skala rasio misalnya: nilai uang, jumlah pupulasi, jarak, jumlah waktu dalam periode waktu.

Semua prosedur teknik dapat diterapkan untuk skala rasio.

Page 32: Kul 04 spss_9_11

VARIABEL RASIO

Variabel yang dalam kuantifi kasinya mempunyai nilai nol mutlak. Di dalam penelitian , terlebih-lebih dalam penelitian ilmu sosial, orang jarang menggunakan variabel rasio.

Page 33: Kul 04 spss_9_11

Mode, Median dan Arithmetic Average

Mode, Median dan Arithmetic average merupakan pengukuran central tendency yang paling banyak dipakai.

Mode diperoleh dengan cara mendapat frekuensi yang paling sering muncul. Mode, karena tidak membutuhkan nilai variabel mempunyai makna, maka sering digunakan untuk skala nominal.

Page 34: Kul 04 spss_9_11

Mode jarang dilaporkan sendi rian, biasanya dilengkapi dengan tabel frekuensi dan bar chart. Dengan menggunakan mode kesalahan mudah terjadi apabila digunakan untuk karakteristik variabel.

Mode hanya memberikan infor masi sedikit.

Page 35: Kul 04 spss_9_11

Apabila anda merangkum suatu variabel yang nilainya dapat diurutkan dari yang kecil ke besar, median akan lebih berguna untuk mengukur central tendency.

Urutkan lebih dahulu nilai variabel, kemudian cari nilai yang di tengah.

Page 36: Kul 04 spss_9_11

Kelemahan Median, ialah, tidak memanfaatkan seluruh informasi yang tersedia.

Misal, diperoleh nilai, 28, 29, 30, 31, dan 32 maka mediannya adalah 30. Untuk nilai 28, 29, 30, 98, dan 190 mendian juga 30. Jelas bahwa angka di atas dan di bawah median diabaikan. Angka 98 dan 190 tidak mempengaruhi nilai median.

Page 37: Kul 04 spss_9_11

Ukuran central tendency yang paling sering digunakan adalah arithmetic mean, yang juga disebut sebagai average (rataan, x). Mean meng gunakan semua nilai nyata dari seluruh kasus.

Mean dihitung dengan menggunakan rumus

Mean = 28+29+30+98+190 = 75 5

(4.1)

Page 38: Kul 04 spss_9_11

Can I use the mean for variables that have only two values ?

Banyak variabel, seperti yang menjawab pertanyaa ya/tidak atau setuju/tidak setuju, memiliki dua nilai. Biasanya dikodekan dengan 0 dan 1. Maka arithmetic average memberikan proporsi kasus dengan kode 1. Arithmetic mean=0,5 berarti 50% responden menjawab ya.

Page 39: Kul 04 spss_9_11

Fig 4.1 berisi descriptive statistics dari prosedur Frequency, untuk variabel age dan education.Dapat diperiksa bahwa rataan umur responden GSS adalah 46,23 tahun, Median 43, lebih rendah dari mean. Lama mengikuti pendidikan mempunyai mean 13,04 dan median 12 tahun.

Comparing Mean dan Median

Page 40: Kul 04 spss_9_11

Kedua variable tersebut memiliki mean lebih besar dari median. Penyebabnya adalah karena kedua variabel tersebut memiliki tail menuju ke nilai terbesar.Karena responden yang disertakan berumur 18 tahun ke atas, maka angka di bawah 18 tidak diperoleh, umur di atas 18 tahun tidak ada batasnya. Nilai yang tinggi menaikkan mean umur.

Page 41: Kul 04 spss_9_11

Fig 4.1 Mean, Median and mode for age and education

Page 42: Kul 04 spss_9_11

Apabila distribusi nilai benar-benar simetrik maka mean dan median sama nilainya.

Apabila distribusi nilai memiliki long tail (distribusinya disebut skwed) maka mean akan lebih besar dari median apabila tail menuju nilai yang lebih besar, dan sebaliknya.

Page 43: Kul 04 spss_9_11

Apabila nilai data berbeda yang besar, maka mean bukan merupakan ukuran central tendency yang baik; disebabkan karena mean dipengaruhi oleh nilai ekstrim yang disebut outliers. Pada kasus demikian lebih baik dilengkapi dengan median, dan sebutkan nilai ekstrim tinggi dan rendah.

Page 44: Kul 04 spss_9_11

Ukuran central tendency tidak memberikan informasi mengenai besar perbedaan antar nilai. Misal, mean dan median mempunyai nilai 50; datanya sbb., 50, 50, 50, 50, 50 dan 10, 20, 50, 80, 90. Terlihat bahwa distribusi/ sebaran angka tersebut sangat berbeda.Ukuran variability/keragaman akan memberikan informasi penyebaran angka.

Measures of Variability

Page 45: Kul 04 spss_9_11

Range adalah ukuran paling sederhana untuk keragaman; yaitu perbedaan (selisih) antara nilai tertinggi dan terendah.

Range tidak ada manfaat dihitung untuk variabel nominal; karena nilai/kode untuk varibel nominal tidak dapat diartikan sebagai urutan besar ke kecil dan sebaliknya.

Range

Page 46: Kul 04 spss_9_11

Pada fig 4.2 dapat diperiksa, variabel age memiliki minimal 18 th, maximum 89 dan range 71 (89-18).Nilai range menunjukkan besar kecilnya perbedaan antara nilai terkecil dan terbesar.

Ukuran keragaman yang lebih baik dari range adalah interquartile range.

Page 47: Kul 04 spss_9_11

Fig 4.2 Descriptive statistics for age and education

Page 48: Kul 04 spss_9_11

Interquartile range adalah jarak antara nilai 75th dan 25 th percentile. Nilai ini berbeda dengan range karena, tidak terpengaruh oleh nilai ekstrim.

Page 49: Kul 04 spss_9_11

Ukuran keragamaan yang paling sering adalah variance. Variance berdasar kuadrat jarak antara nilai individu dan mean.

Variance dihitung dengan rumus sbb.

Variance and Standard Deviation

)1N(

)xx(Variance

2

Eq 4.2

Page 50: Kul 04 spss_9_11

5,026 Variance

)15(

2)75190.....(2)7528(Variance

Contoh data : 28,29, 30, 98, dan 190mean = 75

Eq 4.3

Page 51: Kul 04 spss_9_11

er

Kalau variance sama dengan 0, maka berarti data memiliki nilai yang sama, sehingga mean juga sama dengan nilai individu.

Makin besar nilai variance berarti data nilainya makin tersebar. Pada fig 4.2 variance untuk variabel age = 303,392 tahun; untuk variabel education = 9,452 tahun.

Akar variance = standard deviation

Page 52: Kul 04 spss_9_11

Nilai standar deviation tergantung pada unit pengukuran untuk variabel tertentu. Misal, standard deviation untuk umur diukur dalam hari akan lebih besar dibanding kalau diukur dengan bulan.

Coefficient of variation mengeks- presikan standard deviation sebagai persentase dari mean.

The Coefficient of Variation

Page 53: Kul 04 spss_9_11

Coefficient of variation dihitung dengan rumus sbb.

Coefficient satandard dev.of variation = x 100

mean

CV = 100% kalau standard deviasi sama dengan mean

Eq 4.4

Page 54: Kul 04 spss_9_11

CV untuk variabel umur= 37,68%;CV untuk variavel education= 23.54%.

Berdasar nilai mean maka umur lebih bervariasi dibandingkan dengan education.

Page 55: Kul 04 spss_9_11

Anda dapat menentukan posisi suatu kasus pada distribusi nilai pengamatan dengan cara menghitung/menggunakan standard score atau z score, menggunakan rumus sbb.

Standar value - meanscore = standar deviation

Standard Score

Eq 4.5

Page 56: Kul 04 spss_9_11

Standard score memberikan infor masi berapa standard deviasi jarak kasus terhadap mean (di bawah atau di atas).

Kalau kasus memiliki standard score sama dengan 0, maka nilai kasus tersebut sama dengan mean.

Kalau Z score sama dengan 1, berarti, kasus, 1 standar deviasi di atas mean, dst.

Page 57: Kul 04 spss_9_11

Untuk mendapatkan z score anda dapat menggunakan prosedur Descriptive, z score dapat disim pan sebagai variabel baru.

Periksa fig 4.3 dan 4.4

Page 58: Kul 04 spss_9_11

Fig 4.3 Descriptive statistics in the Viewer

Page 59: Kul 04 spss_9_11

Fig 4.4 Data Editor with standar score saved as a new variable

Page 60: Kul 04 spss_9_11

COMPARING GROUPS

How can you determine if the values of the summary statistics for a variable differ for subgroups of cases ?

1. Apa yang dimaksud subgrup kasus ?2. Apa yang dapat anda pelajari dari menghitung rangkuman statistik secara terpisah dari subgrup kasus tersebut ?

Page 61: Kul 04 spss_9_11

3. Bagaimana cara anda dapat membuat grafik mean dari subgrup kasus tersebut ?

Telah dibahas penggunaan pro sedur Frequency dan Descriptive untuk menghitung rangkuman statistics untuk kasus yang telah dipelajari (GSS dan Umpan balik).

Page 62: Kul 04 spss_9_11

Selain yang telah dibahas tersebut, sering dibutuhkan kemampuan kita untuk membandingkan rangkuman statistik untuk subgrup kasus yang berbeda.

Misal 1. Kita ingin membandingkan nilai ujian untuk klas A, B danK.2. Kita ingin membandingakan nilai mahasiswa putri dan putra.3. Kita ingin membandingkan nilai mahasiswa putri dan putra untuk klas A, B dan K. Dst

Page 63: Kul 04 spss_9_11

Masalah tersebut tidak mudah untuk dijawab dengan menggunakan prosedur Frequency dan Descriptive.

Yang dapat membantu adalah prosedur Mean yang dapat diguna kan untuk menghitung rangkuman statistik subgrup.

Menggunakan prosedur Mean anda akan dapat membandingkan rataaan education, dan job satisfaction untuk subgrup yang berbeda.

Page 64: Kul 04 spss_9_11

Case Processing Summary

61 34,5% 116 65,5% 177 100,0%

Nilai ujian

sisipan *

Klas

mahasiswa

N Percent N Percent N Percent

Included Excluded Total

Cases

Page 65: Kul 04 spss_9_11

Report

Nilai ujian sisipan

84,56 26 9,2675

73,75 2 8,8388

78,79 33 9,5631

81,08 61 9,7870

Klas

mahasiswa

A

B

K

Total

Mean N

Std.

Deviati

on

Page 66: Kul 04 spss_9_11

Misal untuk variabel Education, anda dapat membadingkan mean education (dalam tahun) dalam sub grup Very satified, Most satified, A little dissatified dan Very dissatisfied.

Selanjutnya dalam subgrup tersebut dapat dibandingkan mean untuk subsubgrup male dan female (periksa fig 5.1 dan 5.3).

Page 67: Kul 04 spss_9_11
Page 68: Kul 04 spss_9_11
Page 69: Kul 04 spss_9_11
Page 70: Kul 04 spss_9_11
Page 71: Kul 04 spss_9_11
Page 72: Kul 04 spss_9_11
Page 73: Kul 04 spss_9_11

Fig 5.1 Pivoted Means output for education and jsatisfaction

Page 74: Kul 04 spss_9_11
Page 75: Kul 04 spss_9_11
Page 76: Kul 04 spss_9_11
Page 77: Kul 04 spss_9_11

Fig 5.2 Bar chart of education by job satifaction

Page 78: Kul 04 spss_9_11

Layers : Defining subgroups by more than one variable

Page 79: Kul 04 spss_9_11
Page 80: Kul 04 spss_9_11

Fig 5.3 Pivoted means output for job satisfaction and gender subgroups

Page 81: Kul 04 spss_9_11
Page 82: Kul 04 spss_9_11

COMPARING GROUPSMenggunakan Case selection

Menggunakan file gssMembandingkan mean education dalam Kelompok Job satisfictionYang dilibatkan dalam analisis hanya full-time workers

Cara mengerjakan periksa caption berikut

Page 83: Kul 04 spss_9_11

Memilih kasus - full-time workers---

Page 84: Kul 04 spss_9_11

Gunakan select cases

Page 85: Kul 04 spss_9_11

Dialog box Select cases--- pilih if condition

Page 86: Kul 04 spss_9_11

Ketik syarat, wrkstat = 1 …. 1=Working fulltime

Page 87: Kul 04 spss_9_11
Page 88: Kul 04 spss_9_11

Kasus yang tidak memenuhi syarat di coret (/)

Page 89: Kul 04 spss_9_11
Page 90: Kul 04 spss_9_11
Page 91: Kul 04 spss_9_11
Page 92: Kul 04 spss_9_11
Page 93: Kul 04 spss_9_11
Page 94: Kul 04 spss_9_11
Page 95: Kul 04 spss_9_11
Page 96: Kul 04 spss_9_11
Page 97: Kul 04 spss_9_11