metode statistika

25
BAB 6 DISTRIBUSI DATA Oleh M. YAHYA AHMAD METODE STATISTIKA M. Yahya Ahmad

Upload: paloma-fields

Post on 02-Jan-2016

73 views

Category:

Documents


12 download

DESCRIPTION

METODE STATISTIKA. BAB 6 DISTRIBUSI DATA Oleh M. YAHYA AHMAD. Variabel Kuantitatif. Variabel Kuantitatif dapat memiliki nilai baik negatif maupun positif. Variabel Kuantitatif. Variabel Kuantitatif. Apa yang terjadi jika ukuran sampel lebih besar? Perubahan histogram?. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: METODE STATISTIKA

BAB 6

DISTRIBUSI DATA

Oleh

M. YAHYA AHMAD

METODE STATISTIKA

M. Yahya Ahmad

Page 2: METODE STATISTIKA

Variabel Kuantitatif

Variabel Kuantitatif dapat memiliki nilai baik negatif maupun positif.

Distribution of glycemia in 500 persons

0

20

40

60

80

100

120

<40 40-69 70-99 100-129 130-159 160-189 190-219 220+

Level of glycemia mg/100 ml

of

pe

rso

ns

M. Yahya Ahmad

Page 3: METODE STATISTIKA

Distribution of glucose in blood levels in 500 persons

0

5

10

15

20

25

<40 40-69 70-99 100-129 130-159 160-189 190-219 220+

Level glycemia mg/100 ml

Pe

rce

nta

ge

(%

)Variabel Kuantitatif

M. Yahya Ahmad

Page 4: METODE STATISTIKA

Apa yang terjadi jika ukuran sampel lebih besar? Perubahan histogram?

Distribution of glycemia in 3,500 persons

0

200

400

600

800

1000

1200

<40 40-69 70-99 100-129 130-159 160-189 190-219 220+

Level of glycemia mg/100 ml

of

pe

rso

nsVariabel Kuantitatif

M. Yahya Ahmad

Page 5: METODE STATISTIKA

Distribusi data dari beberapa variabel dapat berbentuk simetris. Terutama jika ukuran sampel semakin besar.

Stature in meters. n=10

012345

1.5 1.6 1.7 1.8

Stature (mt)

of

per

son

s

Stature in meters. n=1000

0

100

200

300

400

1.5 1.6 1.7 1.8

Stature (mt)

of

per

son

s

Variabel Kuantitatif

M. Yahya Ahmad

Page 6: METODE STATISTIKA

Bagaimana Membandingkan Distribusi Bila terdapat dua atau lebih kelompok data maka fokuskan perhatian kepada: Titik tengah (Center). Secara grafis titik tengah dari suatu sebaran data adalah titik dimana kira-kira separuh dari observasi berada di salah satu sisinya. Penyebaran data (Spread). Sebaran menggambarkan variabilitas data. Jika sebaran cukup luas. Maka spread dikatakan besar. Tetapi jika data berkelompok pada sekitar suatu nilai tertentu maka dikatakan sebarannya kecil. Bentuk (Shape). Betuk sebaran data dapat digambarkan dalam kategori kesimetrian (symmetry), kecondongan (kewness), banyaknya puncak, dan sterusnya.Karakter yang tidak biasa (Unusual features). Hal-hal yang biasa seperti adanya kesenjangan (tidak ada data) dan pencilan (outliers).

M. Yahya Ahmad

Page 7: METODE STATISTIKA

Sebaran Normal

Sebaran ini digunakan untuk mewakili sebaran dari nilai-nilai yang harus diamati, jika kita melibatkan semua anggota populasi.

Oleh karena itu sumbu Y dari Sebaran Normal disebut probabilitas.

Suatu histogram menunjukkan nilai sebaran yang diamati dalam sebuah sampel.

Suatu pemetaan Normal menunjukkan nilai sebaran yang dianggap bahwa nilai tersebut dapat muncul di dalam populasi dimana sampel diambil.

M. Yahya Ahmad

Page 8: METODE STATISTIKA

Kita dapat menggunakan sebaran Normal untuk menjawab pertanyaan seperti: Berapa peluang orang dewasa yang

menderita glycemia pada level < atau = 50 mg/100 ml?

Kita dapat menjawab, dengan mengambil persentase pengamatan terhadap lelaki dewasa, dengan tingkat glycemia < 150 mg/100 ml.

Sebaran Normal

M. Yahya Ahmad

Page 9: METODE STATISTIKA

Sebaran Normal Baku

Sebaran Normal digambarkan dengan formula yang cukup rumit, namun sekarang telah dipublikasikan tabel yang dapat menentukan luas area di bawah kurva normal yang dinamakan sebagai Sebaran Normal Baku.

Di dalam sebaran noral baku, nilai tengahnya adalah 0 dan simpangan baku adalah ±1.

Tabel sebaran normal baku biasanya terdapat di dalam lampiran buku-buku statistika.

Dengan berkembangnya perangkat lunak komputer, perhitungan luas area di bawah kurva normal sudah sangat mudah dilakukan,

M. Yahya Ahmad

Page 10: METODE STATISTIKA

Bila Z=0.00 maka luas area di bawah kurva normal adalah 0.5 Bila Z = 1.00 maka luas area di bawa kurva normal adalah

0.159 atau 0.841

-1 0 +1

Sebaran Normal Baku

M. Yahya Ahmad

Page 11: METODE STATISTIKA

Jika kita buatkan bentangan luas area di bawah kurva. Maka area di luar bentangan tersebut merupakan sisa (complementary) dari seluruh luas area.

-1 0 +1

Range Area dalam bentang

Area di luar bentang

-1, + 1 68.3% 31.7%

-2, +2 95.4% 0.6%

-3, +3 99.7% 0.3%

-4, +4 99.99% 0.01%

Sebaran Normal Baku

M. Yahya Ahmad

Page 12: METODE STATISTIKA

Sebaran Bukan Normal

Tidak semua variabel kuntitatif memiliki sebaran yang normal. Jika kita ukur tingkat glycemia dalam 10 orang: maka terlihat

sebarannya memiliki kecondongan. Dengan kondisi ini dapatkah kita sebut sebarannya normal?

Distribution of levels of glucose in blood n=10

01234

Glucose in blood (mg/100 ml)

Nu

mb

er

of

pati

en

t

M. Yahya Ahmad

Page 13: METODE STATISTIKA

Sebaran Binom

Variabel acak binom (binomial random variable) merupakan jumlah keberhasilan x di dalam n percobaan yang diulang-ulang dari suatu percobaan binomial. Distribusi Peluang (probability distribution) dari variabel acak binom disebut sebagai binomial distribution (juga dikenal dengan Bernoulli distribution).

M. Yahya Ahmad

Page 14: METODE STATISTIKA

Sebaran Binom Menggambarkan peluang (probability) dari suatu kejadian yang memiliki

karakteristik hany dua nilai, misalnya peluang terpilihnya dua warna dalam pengambilan (merah atau putih); peluang orang menjawab pertanyaan “ya: atau “tidak”.

Gambar berikut ini menggambarkan sebaran probalitas dari jumlah lelaki di dalam sekelompok orang yang terdiri dari 10 orang. Ini merupakan variabel binom, karena kemungkinan pemilihannya hanya ada dua, yaitu lelaki atau bukan lelaki.

Binomial distribution of males in a group of ten person.

0

0.05

0.1

0.15

0.2

0.25

0.3

0 1 2 3 4 5 6 7 8 9 10

Number of males

Pro

ba

bili

ty

M. Yahya Ahmad

Page 15: METODE STATISTIKA

Sebaran Binom

Sebaran binom memiliki sifat-sifat sebagai berikut:

Nilai tengah (mean) dari distribusi binom (μx) sama dengan n * P .

Ragam atau variance (σ2x) adalah n * P * ( 1 - P ).

Simpangan baku atau standard deviation (σx) adalah akar pangkat dua dari [ n * P * ( 1 - P ) ].

M. Yahya Ahmad

Page 16: METODE STATISTIKA

Sebaran Binom

Berapa besar peluang dimana sekurang-kurangnya lahir satu bayi lelaki dalam tiga kelahiran? Kombinasi yang mungkin terjadi:

LPP, PLP, PPL, LLP, LPL, LLP, LLL. Untuk menghitung probabilitas dalam masing-

masing kombinasi akan memakan banyak waktu.

Kombinasi yang mungkin terjadi di dalam kelahiran adalah 8, yaitu: LPP, PLP, PPL, LLP, LPL, LLP, LLL, PPP.

M. Yahya Ahmad

Page 17: METODE STATISTIKA

Sebaran Chi-Square

Sebaran chi-square memiliki sifat-sifat sebagai berikut:

Nilai tengah dari sebaran sama dengan jumlah derajat bebasnya: = μ v.

Ragam sama dengan dua kali derajat bebas: σ2 = 2 * v

Ketika derajat bebas lebih besar atau sama dengan 2, maka nilai maksimum untuk Y terjadi manakala Χ2 = v - 2.

Ketika derajat bebas meningkat, kurva chi-square mendekati kurva distribusi normal.

M. Yahya Ahmad

Page 18: METODE STATISTIKA

Sebaran Chi-Square

M. Yahya Ahmad

Page 19: METODE STATISTIKA

Probabilitas Kumulatif dan Sebaran Chi-Square

Jika dibuatkan suatu kurva sebaran chi-square maka luar areal di bawah kurva sama dengan 1. Luas areal yang berada di bawah kurva antara 0 dan nilai chi-square tertentu merupakan probabilitas kumulatif yang terkait dengan nilai chi-square. Sebagai contoh dalam gambar berikut ini, daerah yang diarsir mewakili peluang kumulatif yang berkaitan dengan nilai chi-square statistik yang sama dengan A; yaitu probablitas dimana nilai nilai chi-square statistik akan berada antara 0 dan A.

M. Yahya Ahmad

Page 20: METODE STATISTIKA

Probabilitas Kumulatif dan Sebaran Chi-Square

M. Yahya Ahmad

Page 21: METODE STATISTIKA

Contoh Penggunaan Chi-Square

Dengan menggabungkan dalam satu peta kita dapat memahami secara lebih baik hubungan antara dua sebaran. Dalam contoh berikut ini kita gunakan empat kemungkinan dari kombinasi antara curah hujan dan produksi suatu tanaman gandum Low rainfall, low yield Low rainfall, high yield High rainfall, low yield High rainfall, high yield

M. Yahya Ahmad

Page 22: METODE STATISTIKA

Contoh Penggunaan Chi-Square

Catat jumah kejadian dalam suatu tabel freksuensi dari observasi yang dilakukan dalam bentuk matriks seperti tercantum di bawah ini

M. Yahya Ahmad

Page 23: METODE STATISTIKA

Contoh Penggunaan Chi-Square Buatkan tabel nilai frekuensi yang diharapkan dengan

menggunakan statistik probabilitas (% High rain * # of high yield cells)

Row total * column total / table total

M. Yahya Ahmad

Page 24: METODE STATISTIKA

Menterjemahkan Hasil Chi Square

Nol menunjukkan tidak ada hubungan Nilai yang besar menunjukkan hubungan yang kuat Atau, suatu tabel dapat digunakan untuk mengetahu

apakah nilai tertentu secara statistik berbeda nyata atau tidak berbeda nyata

Fakta yang didapatkan dari data di atas menunjukkan adanya korelasi antara kedua variabel, namun TIDAK MENJELASKAN pertanyaan MANGAPA hal itu terjadi

Dalam analisis ini kita hanya mennjelaskan adanya keterkaitan atau tidak adanya keterkaitan antara dua hal. Untuk menjelaskan mengapa hal tersebut terjadi dibutuhkan analisis lainnya yaitu analisis hubungan sebab-akibat

M. Yahya Ahmad

Page 25: METODE STATISTIKA

Jika tidak memiliki nilai Chi-Square

Gunakan nilai Yule’s Q Nilai Yule’s Q sra –1 dan +1 Jika nilainya 0 menunjukkan

tidak ada hubungan. Nilai +1 menunjukkan

hubungan yang posiitif Nilai –1 menunjukkan

hubungan negatif

(8*13) (2*5)

(8*13) (2*5)

104 10

104 10

.82

M. Yahya Ahmad