bab 3. ukuran-ukuran numerik statistik deskriptif

29
Ukuran-Ukuran Numerik Statistik Deskriptif BAB 3

Upload: cabii

Post on 07-Jan-2017

440 views

Category:

Data & Analytics


31 download

TRANSCRIPT

Page 1: Bab 3. Ukuran-Ukuran Numerik Statistik Deskriptif

Ukuran-Ukuran Numerik Statistik Deskriptif

BAB 3

Page 2: Bab 3. Ukuran-Ukuran Numerik Statistik Deskriptif

PEMBAHASAN• Ukuran Tendensi sentral (Ukuran Pemusatan)

– Mean, median, modus, geometris Mean, midrange• Kuartil• Mengukur variasi

– Range, kisaran interkuartil, varians dan standar deviasi, koefisien variasi

• Bentuk

– Simetris, miring, menggunakan box danwhisker plots

• Koefisien korelasi • Kesalahan dalam mengukur deskriptif

numerik dan pertimbangan etis

Page 3: Bab 3. Ukuran-Ukuran Numerik Statistik Deskriptif

Mengukur Ringkasan

Tendensi sentral

MeanMedian

Modus

Kuartil

Mean Geometris

Mengukur Ringkasan

Variasi

Variance (varians)

Standar Deviasi

Koefisien variasi

Range (Jarak)

Page 4: Bab 3. Ukuran-Ukuran Numerik Statistik Deskriptif

Ukuran Tendensi Sentral(Ukuran Pemusatan)

Tendensi sentral

Average Median Modus

Mean Geometris1

1

n

ii

N

ii

XX

n

X

N

1/

12n

Gn XXXX

Page 5: Bab 3. Ukuran-Ukuran Numerik Statistik Deskriptif

Tendensi sentral adalah cara untuk mencari nilai tengah dari satu gugus data, yang telah diurutkan dari nilai yang terkecil sampai yang terbesar atau sebaliknya, dari yang terbesar sampai yang terkecil.

-> Arithmetic mean (rata-rata hitung) - jumlah seluruh nilai dibagi jumlah data dalam observasi.-> Median - nilai tengah yang memisahkan data yang tinggi dan yang rendah.-> Mode - nilai yang paling sering muncul dalam observasi.-> Geometric mean - akar pangkat n dari hasil perkalian setiap pengamatan.-> Harmonic mean - rata-rata hitung untuk data yang memiliki rasio yang berbeda.-> Weighted mean - rata-rata hitung yang memberikan bobot tertentu pada data tertentu.-> Truncated mean - rata-rata hitung setelah beberapa proporsi data yang paling tinggi dan paling rendah dibuang. -> Midrange - rata-rata hitung dari nilai maksimum dan nilai minimum dari gugus data. -> Midhinge - rata-rata hitung dari dua kuartil.-> Trimean - rata-rata hitung dari median dan dua kuartil.-> Winsorized mean - rata-rata hitung dimana nilai yang paling extrim diganti oleh nilai yang dekat dengan median.

Tendensi Sentral(Ukuran Pemusatan)

Page 6: Bab 3. Ukuran-Ukuran Numerik Statistik Deskriptif

Rata-Rata Hitung (Aritmatika Mean)• Rata-rata hitung (Mean aritmetik) ini adalah pengukuran nilai

sentral yang paling umum digunakan. Dalam keseharian kita biasanya mengenal hanya dengan istilah rata-rata.

• Rata-rata = jumlah nilai dibagi dengan jumlah nilai Dipengaruhi oleh nilai-nilai ekstrim (outlier)

• Mean (aritmatika mean) dari nilai data– Mean Sampel

– Mean Populasi

1 1 2

n

ii n

XX X XX

n n

1 1 2

N

ii N

XX X X

N N

Ukuran Sampel

Ukuran Populasi

Page 7: Bab 3. Ukuran-Ukuran Numerik Statistik Deskriptif

MEAN (Aritmatika Mean)

0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 12 14

Mean = 5 Mean = 6

(lanjutan)

• Ukuran yang paling umum dari tendensi sentral • Dipengaruhi oleh nilai-nilai ekstrim (outlier)

Page 8: Bab 3. Ukuran-Ukuran Numerik Statistik Deskriptif

MEDIAN

0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 12 14

Median = 5 Median = 5

• Median merupakan ukuran yang kuat (robust) dari nilai sentral. Hal ini dikarenakan nilai median tidak dipengaruhi oleh nilai ekstrim.

• Dalam sebuah array memerintahkan, median adalah nomor

"tengah"– Jika n atau N adalah ganjil, median adalah jumlah menengah– Jika n atau N adalah genap, median adalah rata-rata dari dua angka tengah

*Misalnya kita punya kumpulan data berikut: 5 7 10 13 20 22. Banyaknya data adalah 6, dengan demikian median terletak pada urutan ke (n+1)/2 = (6+1)/2 = 3,5. Ini berarti median terletak ditengah data urutan ketiga (10) dan keempat (13). Dengan demikian, nilai mediannya adalah (10+13)/2 = 11,5.

Me = (n+1)/2

Page 9: Bab 3. Ukuran-Ukuran Numerik Statistik Deskriptif

MODE (MODUS)• Sebuah ukuran tendensi

sentral• Nilai yang paling sering terjadi• Tidak terpengaruh oleh nilai-

nilai ekstrim

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14

Modus = 9

0 1 2 3 4 5 6

Tidak ada Modus

• Digunakan baik untuk data angka atau kategoris

• Mungkin tidak ada modus• Mungkin ada beberapa

modus

Mo =LMo+[d1/(d1+d2)]i

Page 10: Bab 3. Ukuran-Ukuran Numerik Statistik Deskriptif

GEOMETRIS MEAN

• Berguna dalam ukuran laju perubahan variabel dari waktu ke waktu

• Tingkat rata-rata geometris pengembalian – Mengukur status investasi dari waktu

ke waktu

1/1 2

nG nX X X X

1/1 21 1 1 1

nG nR R R R

Page 11: Bab 3. Ukuran-Ukuran Numerik Statistik Deskriptif

CONTOH:Investasi sebesar $ 100.000 turun

menjadi $ 50.000 pada akhir tahun pertama dan mengalami rebound (kembali pulih) $ 100.000 di akhir tahun dua:1 2 3$100,000 $50,000 $100,000X X X

1/ 2

1/ 2 1/ 2

Average rate of return: ( 50%) (100%) 25%

2Geometric rate of return:

1 50% 1 100% 1

0.50 2 1 1 1 0%

G

X

R

Page 12: Bab 3. Ukuran-Ukuran Numerik Statistik Deskriptif

KUARTIL• Memisahkan perintah data menjadi 4 kuartal

• Posisi ke-i Kuartil

• dan Apakah Ukuran bukan pusat lokasi• = Median, A Ukur Tendensi Sentral

25% 25% 25% 25%

1Q 2Q 3Q

Memerintahkan Data di Array : 11 12 13 16 16 17 18 21 22

1 1

1 9 1 12 13Position of 2.5 12.5

4 2Q Q

1Q 3Q

2Q

14i

i nQ

Page 13: Bab 3. Ukuran-Ukuran Numerik Statistik Deskriptif

UKURAN VARIASIVariasi

Varians Standar Deviasi Koefisien variasi

Varians Populasi

Varians Sampel

Populasi Standar Deviasi

Sampel Standar Deviasi

Range

Jarak interkuartil

Pusat yang sama, variasi yang berbeda

Langkah-langkah variasi memberikan informasi tentang penyebaran atau variabilitas nilai data.

Page 14: Bab 3. Ukuran-Ukuran Numerik Statistik Deskriptif

RANGE (Jangkauan Data)

• Merupakan pengukuran yang paling sederhana untuk dispersi data.

• Perbedaan antara terbesar dan pengamatan terkecil: Rumus ;

• Mengabaikan cara di mana data yang didistribusikan

7 8 9 10 11 12

Range = 12 - 7 = 5

7 8 9 10 11 12

Range = 12 - 7 = 5

Range = nilai maksimum – nilai minimum

Page 15: Bab 3. Ukuran-Ukuran Numerik Statistik Deskriptif

Jangkauan Antar Kuartil

Merupakan selisih antara q1 dan q3 yang merupakan titik tengah dari seluruh distribusi

• Dikenal juga sebagai tengah-tersebar– Tersebar di tengah-tengah 50%

• Perbedaan antara kuartil pertama dan ketiga

• Tidak terpengaruh oleh nilai-nilai ekstrim

Memerintahkan Data di Array : 11 12 13 16 16 17 17 18 21

3 1Interquartile Range 17.5 12.5 5Q Q

Page 16: Bab 3. Ukuran-Ukuran Numerik Statistik Deskriptif

Variance (Varians)• Varians adalah suatu ukuran penyebaran data, yang diukur

dalam pangkat dua dari selisih data terhadap rata-ratanya.• Menunjukkan variasi terhadap mean

– Varians sampel : Dimana

= Aritmatika berarti n = ukuran sampel X i = i th nilai variabel X

– Varians Populasi :

2

2 1

1

n

ii

X XS

n

2

2 1

N

ii

X

N

X

Page 17: Bab 3. Ukuran-Ukuran Numerik Statistik Deskriptif

Standar Deviasi• Paling umum digunakan dalam mengukur variasi• Standar deviasi merupakan akar dari varians (ingat, karena pada

varians kita mengkuadratkan selisih data dari rata-ratanya, maka dengan mengakarkannya, kita mendapatkan kembali nilai asalnya).

• Menunjukkan variasi terhadap mean• Memiliki satuan yang sama dengan data asli

– Standar deviasi Sampel :

– Standar deviasi Populasi :

2

1

1

n

ii

X XS

n

2

1

N

ii

X

N

Page 18: Bab 3. Ukuran-Ukuran Numerik Statistik Deskriptif

Membandingkan Standar Deviasi

Mean = 15.5 s = 3.338

11 12 13 14 15 16 17 18 19 20 21

11 12 13 14 15 16 17 18 19 20 21

Data B

Data A

Mean = 15.5

s = .9258

11 12 13 14 15 16 17 18 19 20 21

Mean = 15.5

s = 4.57

Data C

Page 19: Bab 3. Ukuran-Ukuran Numerik Statistik Deskriptif

Koefisien Variasi

• Langkah-langkah yang relatif variasi • Selalu dalam persentase (%) • Menunjukkan variasi relatif Mean • Digunakan untuk membandingkan dua atau lebih

set data diukur dalam satuan yang berbeda

100%SCVX

Page 20: Bab 3. Ukuran-Ukuran Numerik Statistik Deskriptif

Membandingkan Koefisien Variasi• Saham A:

– Harga rata-rata tahun lalu = $ 50– Standar deviasi = $ 5

• Saham B:

– Harga rata-rata tahun lalu = $ 100

– Standar deviasi = $ 5

• Koefisien variasi:

– Saham A:

– Saham B:

$5100% 100% 10%$50

SCVX

$5100% 100% 5%$100

SCVX

Page 21: Bab 3. Ukuran-Ukuran Numerik Statistik Deskriptif

• Menggambarkan bagaimana data didistribusikan• Ukuran bentuk

– Simetris atau miring

Mean = Median =Mode Mode < Median < MeanKanan-MiringKiri-Miring Simetris

Mean < Median < Mode

Bentuk dari Distribusi

Page 22: Bab 3. Ukuran-Ukuran Numerik Statistik Deskriptif

Analisis Data Eksplorasi

• Box dan whisker plots– Tampilan grafis dari data menggunakan

Ringkasan 5-nomor

Median( )

4 6 8 10 12

X terbesarX terkecil 1Q 3Q2Q

Page 23: Bab 3. Ukuran-Ukuran Numerik Statistik Deskriptif

Bentuk Distribusi dan Box dan Whisker Plots

Kanan-MiringKiri-Miring Simetris

1Q 1Q 1Q2Q 2Q 2Q3Q 3Q3Q

Page 24: Bab 3. Ukuran-Ukuran Numerik Statistik Deskriptif

Koefisien Korelasi

Mengukur kekuatan hubungan linear antara dua variabel kuantitatif

1

2 2

1 1

n

i ii

n n

i ii i

X X Y Yr

X X Y Y

Fitur dari Koefisien korelasi

• Unit bebas • Berkisar antara - 1 dan 1• Semakin dekat ke - 1,

semakin kuat hubungan linear negatif

• Semakin dekat ke 1, semakin kuat hubungan linear positif

• Semakin dekat ke 0, lemah hubungan linear positif

Page 25: Bab 3. Ukuran-Ukuran Numerik Statistik Deskriptif

Scatter Plots dari Data denganBerbagai Koefisien Korelasi

Y

X

Y

X

Y

X

Y

X

Y

X

r = -1 r = -.6 r = 0

r = .6 r = 1

Page 26: Bab 3. Ukuran-Ukuran Numerik Statistik Deskriptif

Kesalahan Tindakan Deskriptif Numerik

• Analisis data adalah objektif– Harus melaporkan tindakan ringkasan yang

terbaik memenuhi asumsi tentang kumpulan data

• Interpretasi data adalah subjektif

– Harus dilakukan dengan cara yang adil,netral dan jelas

Page 27: Bab 3. Ukuran-Ukuran Numerik Statistik Deskriptif

Pertimbangan secara Etis

Tindakan deskriptif numerik:

• Harus mendokumentasikan baik hasil yang baik dan buruk

• Harus disajikan dengan cara yang adil, obyektif dan netral

• Sebaiknya tidak menggunakan langkah-langkah Ringkasan Etis untuk mendistorsi fakta-fakta

Page 28: Bab 3. Ukuran-Ukuran Numerik Statistik Deskriptif

Ringkasan Pembahasan

• Langkah-langkah yang dijelaskan tendensi sentral

– Mean, median, modus, geometris Mean, midrange

• Membahas tentang kuartil

• Menggambarkan ukuran variasi– Range, kisaran interkuartil, varians dan standar deviasi, koefisien variasi

• Memberikan penjelasan bentuk distribusi

• Simetris, miring, box dan whisker plots• Membahas Koefisien korelasi• Menunjukan perangkap dalam langkah-langkah deskriptif

numerik dan pertimbangan secara etis

Page 29: Bab 3. Ukuran-Ukuran Numerik Statistik Deskriptif