metode statistika stk211/ 3(2-3) - ipb university fkh... · 2017-09-28 · kelompok data yang...

27
Metode Statistika STK211/ 3(2-3) Pertemuan III Statistika Deskripsi dan Eksplorasi (2) Septian Rahardiantoro - STK IPB 1

Upload: others

Post on 17-Jan-2020

16 views

Category:

Documents


0 download

TRANSCRIPT

Metode Statistika STK211/ 3(2-3)

Pertemuan III

Statistika Deskripsi dan Eksplorasi (2)

Septian Rahardiantoro - STK IPB 1

Septian Rahardiantoro - STK IPB 2

Misalkan diketahui data sebagai berikut

No Jenis Kelamin Tinggi Berat Agama

1 1 167 57 Islam

2 1 172 50 Islam

3 0 161 56 Kristen

4 0 157 44 Hindu

5 1 165 43 Islam

6 0 167 52 Islam

7 1 162 55 Budha

8 0 151 49 Katholik

9 0 158 43 Kristen

10 1 162 43 Islam

11 1 176 49 Islam

12 1 167 55 Islam

13 0 163 58 Kristen

14 0 158 48 Islam

15 1 164 46 Katholik

16 0 161 42 Islam

17 1 159 44 Kristen

18 1 163 48 Islam

19 1 165 40 Islam

20 0 169 40 Islam

21 1 173 42 Islam

Data 1

Peubah JK N Mean Sd Min Med Max

Tinggi P 9 160.6 5.43 151 161 169

L 12 166.3 5.07 159 165 176

Berat P 9 48. 0 6.34 40 48 58

L 12 47. 7 5.66 40 47 57

Dapat disajikan dalam tabel berikut

Lalu bagaimana menghitung ringkasan statistik tersebut?

Statistika Deskripsi dan Eksplorasi

Merupakan teknik penyajian dan peringkasan data sehingga menjadi informasi yang mudah dipahami.

Teknik Penyajian

Tabel

Grafik

Peringkasan Data

Ukuran Pemusatan

Ukuran Penyebaran

Septian Rahardiantoro - STK IPB 3

Peringkasan Data

• Ukuran Pemusatan Suatu gambaran / informasi yang memberikan penjelasan bahwa data memiliki satu / lebih titik dimana dia memusat / terkumpul

• Jenis ukuran pemusatan 1. Modus

2. Median

3. Kuartil

4. Mean (Rataan, Rata-rata)

Septian Rahardiantoro - STK IPB 4

Modus

Nilai data yang paling sering terjadi (frekuensi paling tinggi)

Septian Rahardiantoro - STK IPB 5

• Dalam satu gugus data dapat mengandung lebih dari satu modus • Dapat digunakan untuk semua jenis data, tapi paling banyak digunakan

untuk data kategorik atau data diskret dengan hanya sedikit nilai yang mungkin muncul

Modus

Median

Nilai data yang membagi dua sama banyak kumpulan yang diurutkan

Septian Rahardiantoro - STK IPB 6

• Nama lain : percentil ke-50, kuartil 2 (Q2) • Digunakan untuk menggambarkan lokasi dari data numerik • Kekar terhadap adanya pencilan

Langkah menghitung median 1. Urutkan data dari kecil ke besar 2. Nilai median

• Jika banyak data ganjil, maka Median=X(n+1)/2

• Jika banyak data genap, maka Median=(X(n)/2+ X[(n)/2]+1)/2 (rata-rata dua pengamatan yang berada sebelum dan setelah posisi median)

Septian Rahardiantoro - STK IPB 7

Ilustrasi

Data II: 2 8 3 4 1 8

Data terurut: 1 2 3 4 8 8

Median=(3+4)/2 = 3.5

Data III: 2 3 4 1 8

Data terurut: 1 2 3 4 8

Median= 3

Data IV: 2 3 4 1 100

Data terurut: 1 2 3 4 100

Median= 3

Kuartil

Nilai-nilai yang menyekat gugus data menjadi 4 kelompok data yang masing-masing terdiri dari 25% muatan

Septian Rahardiantoro - STK IPB 8

• Terdiri dari Q1, Q2, Q3 • Q1(dibaca kuartil 1) merupakan nilai yang membagi data 25% data di kiri

dan 75% data di kanan • Q2 (dibaca kuartil 2) merupakan median, membagi data menjadi 50% • Q3 (dibaca kuartil 3) merupakan nilai yang membagi data 75% data di kiri

dan 25% data di sebelah kanan

Q2 Q1 Q3

Septian Rahardiantoro - STK IPB 9

Langkah Teknis memperoleh Kuartil (Quartile)

Metode Belah dua • Urutkan data dari kecil ke besar • Cari posisi kuartil nQ2=(n+1)/2 nQ1=(nQ2

*+1)/2= nQ3, nQ2 * posisi kuartil dua terpangkas (pecahan dibuang) • Nilai kuartil 2 ditentukan sama

seperti mencari nilai median. Kuartil 1 dan 3 prinsipnya sama seperti median tapi kuartil 1 dihitung dari kiri, sedangkan kuartil 3 dihitung dari kanan.

Data II: 2 8 3 4 1 8

Data terurut: 1 2 3 4 8 8

Posisi Q2 = nQ2 = (6+1) / 2 =3.5 Posisi Q1 = Posisi Q3 = (3+1)/2 = 2

1 2 3 4 8 8

Q2

Q1 Q3

Septian Rahardiantoro - STK IPB 10

Langkah Teknis memperoleh Kuartil (Quartile)

Metode Interpolasi • Urutkan data dari kecil ke besar • Cari posisi kuartil ke-i

nQi= i(n+1)/4 = a,b Qi = Xa + 0,b (Xa+1- Xa)

Data II: 2 8 3 4 1 8

Data terurut: 1 2 3 4 8 8

Posisi Q2 = nQ2 = (6+1) / 2 =3.5 Posisi Q1 = ¼(6+1) = 1.75 Posisi Q3 = ¾(6+1) = 5.25

1 2 3 4 8 8

Median

Q1= 1 + 0.75(2-1) = 1.75 Q3=8+ 0.25(8-8)=8

Septian Rahardiantoro - STK IPB 11

Statistik 5 Serangkai

Q2

Q1 Q3

Q0 Q4

Berdasarkan metode Interpolasi

Q0 = nilai minimum data Q1 = nilai maksimum data

3

1.5 6

1 8

3.5

1.75 6

1 8

Data I Data II

Mean (Rata-rata)

Merupakan pusat massa (centroid)

Septian Rahardiantoro - STK IPB 12

• Digunakan untuk tipe data numerik • Tidak bisa digunakan untuk tipe data kategorik dan diskret • Sangat resisten terhadap pencilan

Rata-rata populasi

𝜇 = 𝑥𝑖𝑁𝑖=1

𝑁

Rata-rata contoh

𝑥 = 𝑥𝑖𝑛𝑖=1

𝑛

parameter statistik

Data III (merupakan data contoh): 2 8 3 4 1

6.35

14382

x Jangan dibulatkan!!!!

Septian Rahardiantoro - STK IPB 13

Perhatikan

Data III: 2 3 4 1 8

Data terurut: 1 2 3 4 8

Median= 3

Data IV: 2 3 4 1 100

Data terurut: 1 2 3 4 100

Median= 3

6.35

84321

x

225

1004321

x

Rata-rata tidak kekar terhadap pencilan

Septian Rahardiantoro - STK IPB 14

Kaitan antar bentuk sebaran dengan ukuran pemusatan

Mean = Median = Modus

Simetri

Miring ke kanan Miring ke kiri

Modus < Median < Mean Mean < Median < Modus

• Ukuran Penyebaran Gambaran seberapa besar data menyebar dalam kumpulannya

• Jenis ukuran penyebaran – Wilayah (range)

– Jangkauan Antar Kuartil (interquartile range)

– Ragam (variance)

– Simpangan Baku (standard deviation)

Septian Rahardiantoro - STK IPB 15

Peringkasan Data

Wilayah (range)

Selisih pengamatan terbesar dengan pengamatan terkecil

Septian Rahardiantoro - STK IPB 16

𝑅 = 𝑥𝑚𝑎𝑥 − 𝑥𝑚𝑖𝑛

• Hanya memperhitungkan nilai terkecil dan terbesar, sedangkan sebaran nilai antara dua nilai tersebut tidak diperhitungkan

• Resisten terhadap nilai yang ekstrim

Data III terurut: 1 2 3 4 8

Data IV terurut: 1 2 3 4 100

R = 8-1 = 7

R = 100-1 = 99

Jangkauan Antar Kuartil

Selisih antara kuartil 3 dengan kuartil 1

Septian Rahardiantoro - STK IPB 17

(interquartile range)

𝐽𝐴𝐾 = 𝑄3 − 𝑄1

• Memperhitungkan sebaran antara nilai minimum dan nilai maksimum • Kekar terhadap adanya nilai-nilai yang ekstrim (pencilan)

Statistik 5 serangkai dari data III

(metode belah dua)

3

2 4

1 8

Statistik 5 serangkai dari data IV

(metode belah dua)

3

2 4

1 100

JAK = 4-2 = 2 JAK = 4-2 = 2

Ragam (variance)

Jumlah kuadrat selisih antara pengamatan dengan pusatnya (rata-rata)

Septian Rahardiantoro - STK IPB 18

Data III

Data (X-) (X-)2

1 -2.6 6.76

2 -1.6 2.56

3 -0.6 0.36

4 0.4 0.16

8 4.4 19.36

Rataan 3.6 0 5.84

Deviasi : selisih dari data terhadap rataannya

Ragam : jumlah kuadrat dari deviasi disekitar rataannya

Septian Rahardiantoro - STK IPB 19

Ragam populasi

𝜎2 = 𝑥𝑖 − 𝜇 2𝑁𝑖=1

𝑁

Ragam contoh

𝑠2 = 𝑥𝑖 − 𝑥 2𝑛𝑖=1

𝑛 − 1

parameter statistik

Derajat bebas = db

Untuk menghitung ragam contoh maka perlu dihitung rataan contoh, maka data terakhir tergantung dari data-data sebelumnya. Hanya 1 yang tidak bebas, sedangkan n-1 data lainnya bebas variasinya

84.5

5

2.291

2

2

N

xN

i

i

Data III

3.7

4

2.29

1

1

2

2

n

xx

s

n

i

i

Simpangan Baku

Akar kuadrat dari ragam

Septian Rahardiantoro - STK IPB 20

(standard deviation)

Ragam merupakan ukuran jarak kuadrat, sehingga untuk mendapatkan jarak yang sebenarnya adalah dengan mengakarkan ragam simpangan baku

Ragam populasi

𝜎2 = 𝑥𝑖 − 𝜇 2𝑁𝑖=1

𝑁

Ragam contoh

𝑠2 = 𝑥𝑖 − 𝑥 2𝑛𝑖=1

𝑛 − 1

parameter statistik

Simpangan baku populasi Simpangan baku contoh

𝜎 = 𝜎2 = 𝑥𝑖 − 𝜇 2𝑁𝑖=1

𝑁 𝑠 = 𝑠2 =

𝑥𝑖 − 𝑥 2𝑛𝑖=1

𝑛 − 1

Penyajian data: Boxplot

• Boxplot / Diagram kotak garis, untuk – Melihat ukuran penyebaran dan ukuran pemusatan data

– Melihat adanya data pencilan

– Sebagai alat pembandingan sebaran dua kelompok data atau lebih

Septian Rahardiantoro - STK IPB 21

Ilustrasi

Septian Rahardiantoro - STK IPB 22

Langkah pembuatan boxplot

• Hitung Statistik lima serangkai • Hitung Pagar Dalam Atas (PAD) : Q3 +1.5(Q3-Q1) • Hitung Pagar Dalam Bawah (PBD): Q1-1.5(Q3-Q1) • Identifikasi data. Jika data < PBD atau data > PAD maka data dikatakan

outlier • Gambar kotak dengan batas Q1 dan Q3 • Jika tidak ada pencilan : Tarik garis dari Q1 sampai data terkecil dan • tarik garis dari Q3 sampai data terbesar • Jika ada pencilan : Tarik garis Q1 dan atau Q3 sampai data sebelum

pencilan • Pencilan digambarkan dengan asterik

Septian Rahardiantoro - STK IPB 23

Contoh 1

Q2 = 48

Q1 = 43 Q3 = 55

Min = 40 Max = 59

Misalkan diketahui statistik 5 serangkai dari data sbb:

• PDA = 55 + 1.5 (55 – 43) = 73 • PDB = 43 – 1.5 (55 - 43) = 25 • Tidak ada pencilan

data 1

6055504540

Boxplot of data 1

Sebaran data tidak simetrik, karena nilai median lebih dekat ke Q1 miring ke kanan

Tidak ada pencilan

Septian Rahardiantoro - STK IPB 24

Contoh 2 Stem-and-leaf of data 1 N = 23

Leaf Unit = 1.0

9 4 002233344

(5) 4 68899

9 5 02

7 5 556788

1 6

1 6

1 7

1 7

1 8 0

PDA = 55 + 1.5 (55 – 43) = 73

PDB = 43 – 1.5 (55 - 43) = 25

Pencilan : 80

Q2 = 48

Q1 = 43 Q3 = 55

Min = 40 Max = 80

data 1

8070605040

Boxplot of data 1

Sebaran data tidak simetrik, karena nilai median lebih dekat ke Q1 miring ke kanan

Terdpat nilai pencilan (80)

Septian Rahardiantoro - STK IPB 25

No. Kota/Kab Pert. Pend. No. Kota/Kab Pert. Pend.1 Pandenglang 2.15 1 Cilacap 1.28

2 Lebak 2.48 2 Banyumas 1.78

3 Bogor 4.52 3 Prubalingga 1.42

4 Sukabumi 2.51 4 Banjarnegara 1.49

5 Cianjur 2.33 5 Kebumen 1.09

6 Bandung 3.31 6 Purworejo 0.62

7 Garut 2.35 7 Wonosobo 1.64

8 Tasikmalaya 2.15 8 Magelang 1.31

9 Ciamis 1.21 9 Boyolali 1.08

10 Kuningan 1.97 10 Klaten 1.19

11 Cirebon 2.73 11 Sukoharjo 2.10

12 Majalengka 2.01 12 Wonogiri 0.51

13 Sumedang 1.41 13 Karanganyar 2.07

14 Indramayu 2.53 14 Sragen 1.85

15 Subang 1.89 15 Grobogan 1.52

16 Purwakarta 2.32 16 Blora 1.27

17 Karawang 2.31 17 Rembang 2.08

18 Bekasi 3.57 18 Pati 1.62

19 Tangerang 4.04 19 Kudus 2.03

20 Serang 2.85 20 Jepara 1.87

21 Kota Bogor 2.60 21 Demak 1.38

22 Kota Sukabumi 1.48 22 Semarang 0.46

23 Kota Bandung 2.20 23 Temanggung 1.83

24 Kota Cirebon 2.51 24 Kendal 0.83

25 Batang 1.70

Rata-Rata: 26 Pekalongan 1.80

Jabar 2.48 27 Pemalang 1.79

Jateng 1.68 28 Tegal 2.67

Minimum : 29 Brebes 2.09

Jabar 1.00 30 Kota Magelang 1.25

Jateng 1.00 31 Kota Surakarta 1.39

Maksimum: 32 Kota Slatiga 2.30

Jabar 23.00 33 Kota Semarang 5.21

Jateng 34.00 34 Kota Pekalongan 1.95

35 Kota Tegal 2.44

Jawa Barat Jawa Tengah

Contoh 3

Septian Rahardiantoro - STK IPB 26

prop

pert

umbu

han

pend

d

Jawa TengahJawa Barat

5

4

3

2

1

0

Kota Semarang

Tangerang

Bogor

Boxplot of pertumbuhan pendd vs prop

Pertumbuhan penduduk di Jawa Barat relatif lebih tinggi

dibandingkan dengan pertumbuhan penduduk di Jawa Tengah.

Secara umum, tingkat keragaman pertumbuhan penduduk antar

kabupaten, di Jawa Tengah sedikit lebih besar dibanding dengan

Jawa Barat. Kab Bogor dan Tangerang merupakan daerah yang

tingkat pertumbuhan pendudukya cukup tinggi. Di Jawa Tengah

Kota Semarang yang pertumbuhan penduduknya paling tinggi.

Thank you, see you next week

Septian Rahardiantoro - STK IPB 27