metode statistika
DESCRIPTION
METODE STATISTIKA. BAB 6 DISTRIBUSI DATA Oleh M. YAHYA AHMAD. Variabel Kuantitatif. Variabel Kuantitatif dapat memiliki nilai baik negatif maupun positif. Variabel Kuantitatif. Variabel Kuantitatif. Apa yang terjadi jika ukuran sampel lebih besar? Perubahan histogram?. - PowerPoint PPT PresentationTRANSCRIPT
BAB 6
DISTRIBUSI DATA
Oleh
M. YAHYA AHMAD
METODE STATISTIKA
M. Yahya Ahmad
Variabel Kuantitatif
Variabel Kuantitatif dapat memiliki nilai baik negatif maupun positif.
Distribution of glycemia in 500 persons
0
20
40
60
80
100
120
<40 40-69 70-99 100-129 130-159 160-189 190-219 220+
Level of glycemia mg/100 ml
N°
of
pe
rso
ns
M. Yahya Ahmad
Distribution of glucose in blood levels in 500 persons
0
5
10
15
20
25
<40 40-69 70-99 100-129 130-159 160-189 190-219 220+
Level glycemia mg/100 ml
Pe
rce
nta
ge
(%
)Variabel Kuantitatif
M. Yahya Ahmad
Apa yang terjadi jika ukuran sampel lebih besar? Perubahan histogram?
Distribution of glycemia in 3,500 persons
0
200
400
600
800
1000
1200
<40 40-69 70-99 100-129 130-159 160-189 190-219 220+
Level of glycemia mg/100 ml
N°
of
pe
rso
nsVariabel Kuantitatif
M. Yahya Ahmad
Distribusi data dari beberapa variabel dapat berbentuk simetris. Terutama jika ukuran sampel semakin besar.
Stature in meters. n=10
012345
1.5 1.6 1.7 1.8
Stature (mt)
N°
of
per
son
s
Stature in meters. n=1000
0
100
200
300
400
1.5 1.6 1.7 1.8
Stature (mt)
N°
of
per
son
s
Variabel Kuantitatif
M. Yahya Ahmad
Bagaimana Membandingkan Distribusi Bila terdapat dua atau lebih kelompok data maka fokuskan perhatian kepada: Titik tengah (Center). Secara grafis titik tengah dari suatu sebaran data adalah titik dimana kira-kira separuh dari observasi berada di salah satu sisinya. Penyebaran data (Spread). Sebaran menggambarkan variabilitas data. Jika sebaran cukup luas. Maka spread dikatakan besar. Tetapi jika data berkelompok pada sekitar suatu nilai tertentu maka dikatakan sebarannya kecil. Bentuk (Shape). Betuk sebaran data dapat digambarkan dalam kategori kesimetrian (symmetry), kecondongan (kewness), banyaknya puncak, dan sterusnya.Karakter yang tidak biasa (Unusual features). Hal-hal yang biasa seperti adanya kesenjangan (tidak ada data) dan pencilan (outliers).
M. Yahya Ahmad
Sebaran Normal
Sebaran ini digunakan untuk mewakili sebaran dari nilai-nilai yang harus diamati, jika kita melibatkan semua anggota populasi.
Oleh karena itu sumbu Y dari Sebaran Normal disebut probabilitas.
Suatu histogram menunjukkan nilai sebaran yang diamati dalam sebuah sampel.
Suatu pemetaan Normal menunjukkan nilai sebaran yang dianggap bahwa nilai tersebut dapat muncul di dalam populasi dimana sampel diambil.
M. Yahya Ahmad
Kita dapat menggunakan sebaran Normal untuk menjawab pertanyaan seperti: Berapa peluang orang dewasa yang
menderita glycemia pada level < atau = 50 mg/100 ml?
Kita dapat menjawab, dengan mengambil persentase pengamatan terhadap lelaki dewasa, dengan tingkat glycemia < 150 mg/100 ml.
Sebaran Normal
M. Yahya Ahmad
Sebaran Normal Baku
Sebaran Normal digambarkan dengan formula yang cukup rumit, namun sekarang telah dipublikasikan tabel yang dapat menentukan luas area di bawah kurva normal yang dinamakan sebagai Sebaran Normal Baku.
Di dalam sebaran noral baku, nilai tengahnya adalah 0 dan simpangan baku adalah ±1.
Tabel sebaran normal baku biasanya terdapat di dalam lampiran buku-buku statistika.
Dengan berkembangnya perangkat lunak komputer, perhitungan luas area di bawah kurva normal sudah sangat mudah dilakukan,
M. Yahya Ahmad
Bila Z=0.00 maka luas area di bawah kurva normal adalah 0.5 Bila Z = 1.00 maka luas area di bawa kurva normal adalah
0.159 atau 0.841
-1 0 +1
Sebaran Normal Baku
M. Yahya Ahmad
Jika kita buatkan bentangan luas area di bawah kurva. Maka area di luar bentangan tersebut merupakan sisa (complementary) dari seluruh luas area.
-1 0 +1
Range Area dalam bentang
Area di luar bentang
-1, + 1 68.3% 31.7%
-2, +2 95.4% 0.6%
-3, +3 99.7% 0.3%
-4, +4 99.99% 0.01%
Sebaran Normal Baku
M. Yahya Ahmad
Sebaran Bukan Normal
Tidak semua variabel kuntitatif memiliki sebaran yang normal. Jika kita ukur tingkat glycemia dalam 10 orang: maka terlihat
sebarannya memiliki kecondongan. Dengan kondisi ini dapatkah kita sebut sebarannya normal?
Distribution of levels of glucose in blood n=10
01234
Glucose in blood (mg/100 ml)
Nu
mb
er
of
pati
en
t
M. Yahya Ahmad
Sebaran Binom
Variabel acak binom (binomial random variable) merupakan jumlah keberhasilan x di dalam n percobaan yang diulang-ulang dari suatu percobaan binomial. Distribusi Peluang (probability distribution) dari variabel acak binom disebut sebagai binomial distribution (juga dikenal dengan Bernoulli distribution).
M. Yahya Ahmad
Sebaran Binom Menggambarkan peluang (probability) dari suatu kejadian yang memiliki
karakteristik hany dua nilai, misalnya peluang terpilihnya dua warna dalam pengambilan (merah atau putih); peluang orang menjawab pertanyaan “ya: atau “tidak”.
Gambar berikut ini menggambarkan sebaran probalitas dari jumlah lelaki di dalam sekelompok orang yang terdiri dari 10 orang. Ini merupakan variabel binom, karena kemungkinan pemilihannya hanya ada dua, yaitu lelaki atau bukan lelaki.
Binomial distribution of males in a group of ten person.
0
0.05
0.1
0.15
0.2
0.25
0.3
0 1 2 3 4 5 6 7 8 9 10
Number of males
Pro
ba
bili
ty
M. Yahya Ahmad
Sebaran Binom
Sebaran binom memiliki sifat-sifat sebagai berikut:
Nilai tengah (mean) dari distribusi binom (μx) sama dengan n * P .
Ragam atau variance (σ2x) adalah n * P * ( 1 - P ).
Simpangan baku atau standard deviation (σx) adalah akar pangkat dua dari [ n * P * ( 1 - P ) ].
M. Yahya Ahmad
Sebaran Binom
Berapa besar peluang dimana sekurang-kurangnya lahir satu bayi lelaki dalam tiga kelahiran? Kombinasi yang mungkin terjadi:
LPP, PLP, PPL, LLP, LPL, LLP, LLL. Untuk menghitung probabilitas dalam masing-
masing kombinasi akan memakan banyak waktu.
Kombinasi yang mungkin terjadi di dalam kelahiran adalah 8, yaitu: LPP, PLP, PPL, LLP, LPL, LLP, LLL, PPP.
M. Yahya Ahmad
Sebaran Chi-Square
Sebaran chi-square memiliki sifat-sifat sebagai berikut:
Nilai tengah dari sebaran sama dengan jumlah derajat bebasnya: = μ v.
Ragam sama dengan dua kali derajat bebas: σ2 = 2 * v
Ketika derajat bebas lebih besar atau sama dengan 2, maka nilai maksimum untuk Y terjadi manakala Χ2 = v - 2.
Ketika derajat bebas meningkat, kurva chi-square mendekati kurva distribusi normal.
M. Yahya Ahmad
Sebaran Chi-Square
M. Yahya Ahmad
Probabilitas Kumulatif dan Sebaran Chi-Square
Jika dibuatkan suatu kurva sebaran chi-square maka luar areal di bawah kurva sama dengan 1. Luas areal yang berada di bawah kurva antara 0 dan nilai chi-square tertentu merupakan probabilitas kumulatif yang terkait dengan nilai chi-square. Sebagai contoh dalam gambar berikut ini, daerah yang diarsir mewakili peluang kumulatif yang berkaitan dengan nilai chi-square statistik yang sama dengan A; yaitu probablitas dimana nilai nilai chi-square statistik akan berada antara 0 dan A.
M. Yahya Ahmad
Probabilitas Kumulatif dan Sebaran Chi-Square
M. Yahya Ahmad
Contoh Penggunaan Chi-Square
Dengan menggabungkan dalam satu peta kita dapat memahami secara lebih baik hubungan antara dua sebaran. Dalam contoh berikut ini kita gunakan empat kemungkinan dari kombinasi antara curah hujan dan produksi suatu tanaman gandum Low rainfall, low yield Low rainfall, high yield High rainfall, low yield High rainfall, high yield
M. Yahya Ahmad
Contoh Penggunaan Chi-Square
Catat jumah kejadian dalam suatu tabel freksuensi dari observasi yang dilakukan dalam bentuk matriks seperti tercantum di bawah ini
M. Yahya Ahmad
Contoh Penggunaan Chi-Square Buatkan tabel nilai frekuensi yang diharapkan dengan
menggunakan statistik probabilitas (% High rain * # of high yield cells)
Row total * column total / table total
M. Yahya Ahmad
Menterjemahkan Hasil Chi Square
Nol menunjukkan tidak ada hubungan Nilai yang besar menunjukkan hubungan yang kuat Atau, suatu tabel dapat digunakan untuk mengetahu
apakah nilai tertentu secara statistik berbeda nyata atau tidak berbeda nyata
Fakta yang didapatkan dari data di atas menunjukkan adanya korelasi antara kedua variabel, namun TIDAK MENJELASKAN pertanyaan MANGAPA hal itu terjadi
Dalam analisis ini kita hanya mennjelaskan adanya keterkaitan atau tidak adanya keterkaitan antara dua hal. Untuk menjelaskan mengapa hal tersebut terjadi dibutuhkan analisis lainnya yaitu analisis hubungan sebab-akibat
M. Yahya Ahmad
Jika tidak memiliki nilai Chi-Square
Gunakan nilai Yule’s Q Nilai Yule’s Q sra –1 dan +1 Jika nilainya 0 menunjukkan
tidak ada hubungan. Nilai +1 menunjukkan
hubungan yang posiitif Nilai –1 menunjukkan
hubungan negatif
(8*13) (2*5)
(8*13) (2*5)
104 10
104 10
.82
M. Yahya Ahmad