pertemuan ke-2 penanganan data… · ppt file · web view · 2014-04-28diagram dahan daun...

27
Pertemuan Ke-2 Data Berstruktur Tunggal

Upload: doanhanh

Post on 26-Apr-2018

224 views

Category:

Documents


1 download

TRANSCRIPT

Pertemuan Ke-2Data Berstruktur Tunggal

Konsep

Mahasiswa memahami:Penataan data: • Tabel frekuensi (Diskrit dan Kontinu)• Diagram dahan daun• Diagram Kotak dan Garis

3

PEMERIKSAAN POLA- DATA BERSTRUKTUR TUNGGAL -

• Kumpulan data yang berupa hasil pengukuran terhadap peubah tertentu pada umumnya tidak akan memiliki nilai yang persis sama satu dengan lainnya.

• Variasi atau keberagaman nilai-nilai pengamatan ini dapat dilihat dari pola sebarannya. Pola sebaran ini sangat berguna pula dalam penentuan karakteristik data tersebut.

• Penciri numerik yang penting : ukuran pemusatan dan penyebaran data.

• Pemeriksaan bentuk sebaran dapat dilakukan dengan DIAGRAM DAHAN DAUN (STEM-AND-LEAF PLOT)

4

DIAGRAM DAHAN DAUN (STEM-AND-LEAF PLOT)

• Diagram dahan daun disusun baris per baris secara vertikal dan cukup efektif untuk menggambarkan pola sebaran bagi data yang berukuran kecil.

• Contoh sederhana :DATA : 32 95 11 94 36 91 62 62 74 14 63 58 87 41 10 95 99 75 57 75DAHAN DAUN

01 14023 264 15 876 2237 4558 79 54159

• Salah satu keuntungan dari diagram ini adalah selain dapat melihat pola sebaran data kita tetap memiliki nilai asli yang akan memudahkan proses mengurutkan data dari nilai yang paling kecil ke nilai terbesar, yang diperlukan dalam analisis data.

• Kalau kita putar sehingga tersusun secara horisontal maka sebenarnya diagram ini sama dengan diagram titik dan tidak jauh berbeda dengan histogram.

5

• Berikut adalah kumpulan 40 angka yang berasal dari sebaran Normal dengan rata-rata 20 dan ragam 25

16.8 25.7 21.4 22.7 28.1 17.5 14.4 20.9

13.1 15.8 21.7 26.2 18.7 20.2 24.6 24.2

14.6 16.9 14.9 26.7 20.2 21.6 15.1 6.9

22.6 12.9 14.1 25.8 17.9 17.7 18.6 20.3

24.4 16.6 20.5 19.7 17.3 18.0 13.7 17.3

DAHAN DAUN56 9789101112 913 1714 146915 1816 68917 3357918 06719 720 2235921 46722 672324 24625 7826 272728 1

• Berdasarkan hasil di atas kita mengharapkan dapat melihat pola yang simetrik, akan tetapi gambaran dari diagram ini tidak menunjukkan hal tersebut secara jelas.

• Patokan kesimetrisan lebih sederhana dibandingkan dengan pemeriksaan kenormalan data yang membutuhkan pengertian hitung peluang.

• Proses selanjutnya : PENYARIAN DATA

6

HASIL PENYARIAN DATA

DIAGRAM DAHAN DAUN YANG DISEDERHANAKAN

0 .tfs 6*

1 .t 233f 444455s 66677777* 8889

2 . 00000111t 22f 44455s 66* 8

Gambar di samping memberikan kesan adanya kesimetrikan yang lebih jelas dari gambar pertama

Ket :. : 0 dan 1t : 2 dan 3 (two, three)f : 4 dan 5 (four, five)s : 6 dan 7 (six, seven)* : 8 dan 9

Data yang dipakai merupakan hasil pembulatan ke bawah dari data asli.

7

RINGKASAN DATA - BOX PLOT -

• Diagram Kotak Garis (Box Plot) merupakan hasil penyarian data dari ringkasan 5-angka

b = nilai maks

Q3 = Kuartil 3

Q2 = Median

Q1 = Kuartil 1

k = nilai min

Bentuk kotak mencerminkan gambaran dari 50% data yang terletak di bagian tengah sedangkan garis menggambarkan 25% data yang berada di ujung kumpulan data.

8

Penerapan dari data sebelumnya :

DAHAN DAUN FK56 9 1789101112 9 213 17 414 1469 815 18 1016 689 1317 33579 1818 067 2119 7 2220 22359 2721 467 3022 67 322324 246 3525 78 3726 27 392728 1 40

Ringkasan 5 angka :

Me = (18.6+18.7)/2 =18.65

b = 28.1 k = 6.9

Q1 = (15.8+16.6)/2 = 16.2 Q3 = (21.7+22.6)/2 = 22.15

30

20

10

0

28.1

6.9

9

• Pola sebaran yang simetrik : Me = (Q1+Q3)/2 = (k+b)/2

(atau paling tidak relatif sama)

• Note :– Misal d = (Q3 - Q1). Kalau data simetrik maka cukup beralasan untuk

menganggap bahwa Q3 - Me = Me - Q1 = d/2, sehingga kalau ditetapkan dua buah nilai berupa Q1-3d/2 dan Q3+3d/2 akan menyebabkan nilai selang keduanya memiliki bentuk Me ± 2d. Bentuk ini mengingatkan terhadap selang nilai M ± 1.96 s yang biasa ditemukan kalau berhadapan dengan data yang memiliki sebaran normal.

• Dari data diperoleh :d = 5.95 ; BB Q1-3d/2 = 7.28 ; BA Q3+3d/2 = 31.07Terdapat satu pengamatan pencilan yaitu 6.9. Sehingga data ini dikeluarkan dari box plot. Shg boxplot dgn identifikasi pencilan menjadi :

0 10 20 30

28.1

6.912.9

Ringkasan 3-angka :Me = 18.65

(Q1+Q3)/2 = 19.15

(k+b)/2 = 17.5

10

Transformasi untuk kesimetrikan data• Contoh data:

Pulau Nama Luas (km2)

Sumatera

KerinciLaut TawarManinjauRanauSingkarakToba

121.955.398.043.8

110.0114.6

Kalimantan

BelidahJampangLuarPrian

117.5225.0

97.5548.5

Sulawesi

SemayangLinduLakalonaMatanaPosoSidenrengTempeTowuti

236.315.631.2

156.3281.3

31.246.9

578.1

DIAGRAM DAHAN DAUN :0 . 13344

* 5591 . 1112

* 52 . 23

* 83 .

*4 .

*5 . 4

* 7

Ket : . : digit 0, 1, 2, 3, 4* : digit 5, 6, 7, 8, 9Data mengalami penyesuaian. Karena kisaran dari 15.6 - 578.1 maka kisaran diperkecil dari 1 - 57

11

Ringkasan 5-angka Ringkasan 3-angka

Me Me

Q1 Q3 (Q1+Q3)/2

k b (k + b)/2

Ringkasan 5-angka Ringkasan 3-angka

112 112

46 225 135.5

15 578 296.5

Ringkasan 5 angka untuk menggambarkan diagram kotak garis

Ringkasan 3 angka untuk memeriksa pola kesimetrikan

Dari ringkasan 3 angka, ada kenaikan yang cukup mencolok, maka kita ragukan kesimetrikan pola data

0

281.3

200 400 600

Pertanyaan :

Apakah dengan transformasi data akan didapatkan pola yang lebih simetrik ???

12

Transformasi akar-dua

10.58 10.58

6.78 15.00 10.59

3.87 24.00 13.93

Transformasi log

2.05 2.05

1.66 2.35 2.00

1.17 2.76 1.96

0 5 10 15 20 25 1.1 1.7 2.3 2.9

• Gambar di atas masing-masing adalah box plot hasil transformasi akar dua dan logaritma. Transformasi logaritma lebih kuat akibatnya daripada transformasi akar. Akan tetapi karena data ini diukur dalam km2 maka transformasi akar mungkin lebih beralasan untuk dipergunakan karena hasil transformasi ini bisa diartikan pengukur panjang, lebar atau radius.

• Mencari transformasi yang cocok dalam arti berhasil memperbaiki perilaku data dan memberikan pengertian yang logis membutuhkan pertimbangan yang lebih luas dari sekedar mencari kesimetrikan

13

BOX PLOT DAN PEMBANDINGAN DATA

• Salah satu alat pembandingan data adalah boxplot dengan cara menggambarkan boxplot masing-masing kelompok secara berdampingan sehingga perbandingan lokasi pemusatan maupun rentangan penyebaran data antar kelompok dapat dilihat secara sekaligus.

• Secara visual boxplot dapat menggambarkan lokasi pemusatan, rentang penyebaran dan kemiringan pola sebaran data.

• Lokasi pemusatan data diwakili median, rentang penyebaran merupakan jarak antar quartil (d=IQR).

• Posisi median di dalam kotak menunjukkan kemiringan pola sebaran. Letak median yang lebih dekat Q1 mencirikan suatu sebaran dengan kemiringan positif atau memanjang ke arah nilai-nilai yang besar, dan kemiringan negatif terjadi bila posisi median lebih dekat ke Q3.

• Panjangnya garis yang menjulur ke luar dari kotak menjadi petunjuk adanya data yang agak jauh dari kumpulannya dan hal ini tidak selalu berarti pola sebaran tersebut miring. Selama posisi median terhadap Q1 maupun Q3 relatif seimbang, garis yang terlalu panjang hanya menunjukkan bahwa sebaran data itu memiliki ekor atau kemenjuluran yang lebih panjang dari semestinya.

14

Contoh :Laju pertumbuhan penduduk per tahun menurut kabupaten di propinsi Jawa Barat dan

Jawa Tengah

• Diagram dahan daun

Jawa Barat

Dahan Daun

0

1

2

3

4

5

.*.*.*.*.*.

244890112333345556783505

Jawa TengahDahan Daun

0

1

2

3

4

5

.*.*.*.*.*.

4568001222333445667778888900001346

2

JAWA BARAT

2.30 2.30

2.05 2.65 2.35

1.21 4.52 2.86

JAWA TENGAH

1.60 1.60

1.20 1.95 1.57

0.46 5.21 2.83

15

1

0

2

3

4

5

6

JABAR

JATENG

1

0

2

3

4

5

6

JABAR

JATENG

3.31

2.67

• Kehomogenan rentangan penyebaran dari beberapa kelompok data akan menyederhanakan proses pembandingan, karena pusat perhatian ada pada lokasi pemusatan saja dalam hal ini perbandingan median antar kelompok data tersebut.

• Sebelum dilakukan transformasi untuk kehomogenan rentang penyebaran terlebih dahulu memperbaiki data untuk mengeluarkan pencilan

Kesimpulan :• Ada 25% dari kabupaten di Jateng yang

memiliki laju pertumbuhan lebih kecil dari kabupaten Ciamis (nilai terkecil untuk Jabar). Demikian pula dapat dilihat bahwa Q3 Jateng lebih kecil dari Q1 Jabar.

• Daerah yang memencil mungkin disebabkan adanya pusat-pusat pertumbuhan. seperti DKI Jakarta dan wilayah Jabodetabek

16

PEMERIKSAAN ASUMSI SEBARAN DATA

• Pola sebaran teoritis untuk data (Binom, Normal, Eksponensial, Poisson) memegang peranan penting dalam analisis data terutama menyangkut tahap pendugaan parameter, pengujian hipotesis dan penetapan taraf kepercayaan atau taraf nyata atas kesimpulan yang akan diambil.

• Dari populasi Normal karakteristik utama adalah nilai rata-rata dan ragam.

• Pemilihan jenis penduga mana yang dianggap lebih baik sangat dipengaruhi oleh perilaku data dan kriteria yang dipilih.– Untuk pengujian hipotesis bagi data yang berasal dari pola sebaran

Normal, penduga kuadrat terkecil memiliki keunggulan teoritis dan relatif mudah diterapkan karena teknik analisis telah berkembang lanjut.

17

• Hasil analisis data yang didasarkan pada asumsi sebaran tertentu menjadi tidak sah apabila ternyata asumsi tersebut sampai batas-batas tertentu tidak dapat dipenuhi.

• Memeriksa kebenaran asumsi pola sebaran data Apakah betul-betul mengikuti pola sebaran normal, dapat didekati dengan sebaran normal atau apakah dapat diubah menjadi berpola normal?

• Penyimpangan dari asumsi pola sebaran teoritis tidak selalu mempunyai dampak besar terhadap hasil analisis data, kadang-kadang pengaruhnya kecil saja sehingga dapat diabaikan.

18

PEMERIKSAAN DENGAN DIAGRAM KOTAK GARIS YANG DIPERLUAS

• Pemeriksaan kesesuaian pola sebaran data pada umumnya kita lakukan terhadap data yang telah diurutkan menurut besarnya

• Ringkasan 5 angka dapat diperluas lagi menjadi ringkasan 7 angka (dengan menambahkan dua angka “perdelapan”). Atau menjadi ringkasan 9 angka (dengan menambahkan dua buah angka “perenambelas”)– urutan “perdelapan” = ([urutan Kuartil]+1)/2– urutan “perenambelas” = ([urutan “perdelapan”]+1)/2

19

• RINGKASAN 9-ANGKA

• Contoh Data : (dibangkitkan dari sebaran normal dengan nilai tengah 20 dan ragam 25)

Me

K1D1E1k

K3D7E15

b

Merupakan perluasan dari tabel ringkasan 5 - angka

16.8 25.7 21.4 22.7 28.1 17.5 14.4 20.9

13.1 15.8 21.7 26.2 18.7 20.2 24.6 24.2

14.6 16.9 14.9 26.7 20.2 21.6 15.1 6.9

22.6 12.9 14.1 25.8 17.9 17.7 18.6 20.3

24.4 16.6 20.5 19.7 17.3 18.0 13.7 17.3

20

DAHAN DAUN FK56 9 1789101112 9 213 17 414 1469 815 18 1016 689 1317 33579 1818 067 2119 7 2220 22359 2721 467 3022 67 322324 246 3525 78 3726 27 392728 1 40

RINGKASAN 9-ANGKA YANG DIHASILKAN

18.65

16.2014.2513.106.90

22.1025.1526.2028.10

Dengan menggantikan lambang-lambang angka ringkasan dengan persentase atau fraksi banyaknya data yang lebih kecil daripada lambang-lambang tersebut didapatkan :

0.5000

0.25000.12500.06250.000

0.75000.87500.93751.0000

21

• Sehingga setiap lambang kini akan memiliki sepasang nilai yaitu fraksi dan besarannya disajikan di bawah ini:

• Dengan mengambil nilai fraksi sebagai x dan besarannya sebai y maka kesembilan lambang tersebut dapat digambarkan menjadi 9 buah titik dalam plot x dan y seperti gambar berikut:

k E1 D1 K1 Me K3 D7 E15 b0.0000 0.0625 0.1250 0.2500 0.5000 0.7500 0.8750 0.9375 1.0000 x

6.90 13.10 14.25 16.20 18.65 22.10 25.15 26.20 28.10 y

QUANTILE BOX PLOT

KE1 D1 K1

MeK3

D7 E15

b

0

5

10

15

20

25

30

0 0.2 0.4 0.6 0.8 1 1.2

FRAKSI

DATA

22

• “Quantile Box Plot”/plot kotak kuantil merupakan cara sederhana tetapi kasar untuk memeriksa pola sebaran data secara nonparametrik

• Kumpulan data dengan pola simetrik akan memperlihatkan kecenderungan potongan-potongan garis yang membentuk garis lurus

• Adanya potongan garis yang menaik secara tajam di luar kotak E menunjukkan kemungkinan pencilan, sedangkan kenaikan yang tajam di dalam kotak K dapat memberikan petunjuk bahwa data tersebut mungkin berasal dari dua buah populasi yang berbeda.

• Data yang tidak berpola simetrik akan terlihat dari kecenderungan potongan-potongan garis tersebut membentuk kurva melengkung.

23

• SOAL :– DATA A

– DATA B

42.2 4.0 7.4 15.4 0.6 3.6 31.2 67.2 10.6 6.4

7.6 14.6 31.8 10.6 21.4 5.8 4.8 0.6 8.6 4.0

7.0 7.8 8.8 43.0 10.8 10.6 7.0 18.4 7.8 31.8

19.8 1.2 8.8 43.4 14.6 29.8 2.6 3.8 17.8 68.2

0.4 0.1 1.3 2.0 1.5 1.4 2.6 0.1 0.5 2.9

0.8 3.3 2.5 2.5 2.3 0.8 0.9 2.6 2.5 3.1

2.9 0.7 2.6 0.6 2.7 1.5 2.4 2.0 2.8 2.7

2.6 0.2 2.3 2.3 2.2 1.6 2.0 2.2 0.4 0.8

24

DATA A

f DAHAN DAUN

9 0 . 00123344420 * 5677777788820 1 . 00004414 * 578910 2 . 1

9 * 98 3 . 1115 *5 4 . 2332 *2 5 .2 *2 6 .2 * 78

DATA B

f DAHAN DAUN

5 0 . 1124412 0 * 567888914 1 . 3417 1 * 556(9) 2 . 00022333414 2 * 555666677899

2 3 . 13

• A Digit pada daun adalah angka satuan

• B Digit pada daun adalah angka desimal

25

RINGKASAN 9-ANGKA

DATA A

9.50

6.103.701.200.60

20.6037.0043.3068.20

DATA Ak E1 D1 K1 Me K3 D7 E15 b

0.0000 0.0625 0.1250 0.2500 0.5000 0.7500 0.8750 0.9375 1.0000 x

0.60 1.20 3.70 6.10 9.50 20.60 37.00 43.30 68.20 y

RINGKASAN 9-ANGKA

DATA B

2.10

0.800.450.200.10

2.602.752.903.30

DATA Bk E1 D1 K1 Me K3 D7 E15 b

0.0000 0.0625 0.1250 0.2500 0.5000 0.7500 0.8750 0.9375 1.0000 x

0.10 0.20 0.45 0.80 2.10 2.60 2.75 2.90 3.30 y

26

QUANTILE BOX PLOT

b

E15D7

K3MeK1D1E1k0

10

2030

4050

6070

80

0 0.2 0.4 0.6 0.8 1 1.2

FRAKSI

DATA

Plot kotak kuantil untuk masing-masing kumpulan data dapat dilihat pada gambar di samping. Pola sebaran data A yang miring ke kanan sebenarnya sudah dapat dilihat dari diagram dahan daun tetapi pola yang melengkung

ini ikut memperjelas adanya ketidaksimetrikan

27

QUANTILE BOX PLOT

k E1

D1K1

Me

K3 D7 E15

b

0

0.5

1

1.5

2

2.5

3

3.5

0 0.2 0.4 0.6 0.8 1 1.2

FRAKSI

DATA

Perilaku data B sulit kita deteksi karena berdasarkan gambar di samping orang cenderung menyimpulkan bahwa

data tersebut simetrik tetapi pola dalam dahan daun menunjukkan adanya dua puncak