01 subpokokbahasan 1.3

Post on 16-Jan-2016

9 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Bahasan 1.3

Pengukuran Deskriptif Numerik

Statistik & Probabilitas

Setelah menyelesaikan bahasan ini, mahasiswa akan dapat:

Menghitung dan interpretasi mean, median, dan mode untuk sejumlah data

Mencari range, variance, standard deviation, dan coefficient of variation dan mengetahui arti dari nilai-nilai tersebut

Menerapkan empirical rule dan the Bienaymé-Chebshev rule menggambarkan variasi dari nilai populasi sekitar mean

Membuat dan interpretasi suatu box-and-whiskers plot

Menghitung dan menjelaskan correlation coefficient

Menggunakan ukuran numerik bersama graphs, charts, dan tables untuk menjelaskan data

Tujuan Pembahasan

Topik Bahasan

Mengukur kecenderungan, variasi, dan bentuk Mean, median, mode, geometric mean Quartiles Range, interquartile range, variance dan standard

deviation, coefficient of variation Symmetric dan skewed distributions

Mengukur ringkasan Populasi Mean, variance, dan standard deviation The empirical rule dan Bienaymé-Chebyshev rule

Topik Bahasan

Ringkasan 5 Angka dan box-and-whisker plots Covariance and coefficient of correlation Perangkat-perangkat dalam pengukuran

deskriptif numerik dan pertimbangan-pertimbangan etis.

(lanjutan)

Ringkasan Ukuran

Arithmetic Mean

Median

Mode

Menguraikan Data Numerik

Variance

Standard Deviation

Coefficient of Variation

Range

Interquartile Range

Geometric Mean

Skewness

Central Tendency Variasi BentukQuartiles

Ukuran Central Tendency

Central Tendency

Arithmetic Mean Median Mode Geometric Mean

n

XX

n

ii

1

n/1n21G )XXX(X

Pengantar

Nilai tengah dari rangking nilai

Nilai yang paling sering muncul

Arithmetic Mean

The arithmetic mean (mean) merupakan ukuran yang paling umum dari central tendency (kecenderungan terpusat)

For a sample of size n:

Jumlah Sampel

n

XXX

n

XX n21

n

1ii

Nilai Observasi

Arithmetic Mean

Mean = jumlah nilai dibagi dengan banyaknya nilai Dipengaruhi oleh nilai ekstrim (outliers)

(lanjutan)

0 1 2 3 4 5 6 7 8 9 10

Mean = 3

0 1 2 3 4 5 6 7 8 9 10

Mean = 4

35

15

5

54321

4

5

20

5

104321

Median

Dalam ordered array, median adalah angka tengah (50% atas, 50% bawah)

Tidak dipengaruhi oleh nilai ekstrim

0 1 2 3 4 5 6 7 8 9 10

Median = 3

0 1 2 3 4 5 6 7 8 9 10

Median = 3

Menemukan Median

Lokasi median:

Jika jumlah nilai adalah ganjil, median adalah nilai tengah Jika jumlah nilai adalah genap, median adalah rata-rata 2 nilai

tengah

Catatan : is bukan value dari median, hanya

posisi median dalam tingkatan data

dataordereddalamposisin

posisiMedian2

1

2

1n

Mode

A measure of central tendency Nilai yang paling sering ada/muncul Tidak dipengaruhi oleh nilai ekstrim Dipakai untuk baik data numerik atau kategori Ada kemungkinan tidak ada mode Ada kemungkinan ada beberapa mode

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14

Mode = 9

0 1 2 3 4 5 6

No Mode

Lima rumah di tepi pantai

Contoh

$2,000 K

$500 K

$300 K

$100 K

$100 K

Harga Rumah:

$2,000,000 500,000 300,000 100,000 100,000

Contoh:Ringkasan Statistik

Mean: ($3,000,000/5)

= $600,000

Median: nilai tengah data terangking

= $300,000

Mode: nilai paling sering muncul = $100,000

Harga Rumah:

$2,000,000 500,000 300,000 100,000 100,000

Jum 3,000,000

Geometric Mean

Geometric mean Dipakai untuk mengukur tingkat perubahan sutau

variabel terhadap waktu

Geometric mean rate of return Mengukur status suatu investasi terhadap waktu

Dimana Ri adalah tingkat pengembalian dalam suatu periode waktu i

n/1n21G )XXX(X

1)]R1()R1()R1[(R n/1n21G

Contoh

Suatu investasi bernilai $100,000 merosot menjadi $50,000 pada akhir tahun pertama dan kembali bernilai $100,000 pada akhir tahun kedua:

000,100$X000,50$X000,100$X 321

50% berkurang 100% bertambah

Pengembalian total dalam 2 tahun adalah NOL, dimana nilai investasi pada awal dan akhir periode adalah sama

Contoh

Gunakan nilai pengembalian tahun 1 untuk menghitung arithmetic mean dan geometric mean:

%0111)]2()50[(.

1%))]100(1(%))50(1[(

1)]R1()R1()R1[(R

2/12/1

2/1

n/1n21G

%252

%)100(%)50(X

Arithmetic mean rate of return:

Geometric mean rate of return:

Hasil keliru/salah

Hasil Lebih Akurat

(lanjutan)

Quartil

Quartil membagi data terangking menjadi 4 segmen dengan jumlah nilai yang sama per segmen

25% 25% 25% 25%

Quartil Pertama, Q1, adalah nilai dimana 25% observasi adalah lebih kecil dan 75% adalah lebih besar

Q2 adalah sama dengan median (50% lebih kecil, 50% lebih besar)

Hanya 25% observasi yang bernilai lebih besar daripada Quartil ketiga

Q1 Q2 Q3

Rumus Quartil

Tentukan suatu quartil dengan menentukan nilai dalam posisi yang seharusnya dalam data terangking, dimana

Posisi Quartil Pertama: Q1 = (n+1)/4

Posisi Quartil Kedua: Q2 = (n+1)/2 (the median position)

Posisi Quartil Ketiga: Q3 = 3(n+1)/4

dimana n adalah jumlah nilai observasi

(n = 9)

Q1 = adalah (9+1)/4 = 2.5 posisi dari data

sehingga gunakan nilai setengah antara nilai KEDUA dan

KETIGA,

sehingga Q1 = 12.5

Quartil

Sampel Data teratur: 11 12 13 16 16 17 18 21 22

Contoh: Tentukan Quartil Pertama

Q1 dan Q3 adalah ukuran lokasi tidak terpusat Q2 = median, suatu ukuran kecenderungan terpusat

Center sama, Variasi berbeda

Ukuran Variasi

Variasi

Variance Standard Deviation

Coefficient of Variation

Range Interquartile Range

Ukuran variasi memberi informasi tentang spread (sebaran) atau variasi nilai data.

Range

Ukuran variasi yang paling sederhana Perbedaan nilai terbesar dan terkecil dari

observasi:

Range = Xlargest – Xsmallest

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14

Range = 14 - 1 = 13

Contoh:

Mengabaikan cara bagaimana data dibagi

Sensitif terhadap outliers

7 8 9 10 11 12

Range = 12 - 7 = 5

7 8 9 10 11 12

Range = 12 - 7 = 5

Kelemahan Range

1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,4,5

1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,4,120

Range = 5 - 1 = 4

Range = 120 - 1 = 119

Interquartile Range

Dapat menghilangkan masalah-masalah outliers dengan interquartile range

Menghilangkan beberapa nilai observasi yang tinggi dan rendah, serta menghitung range dari nilai yang tersisa

Interquartile range = 3rd quartile – 1st quartile

= Q3 – Q1

Interquartile Range

Median(Q2)

XmaximumX

minimum Q1 Q3

Contoh:

25% 25% 25% 25%

12 30 45 57 70

Interquartile range = 57 – 30 = 27

Rata-rata (approximately) akar simpangan dari nilai mean

Varian sampel:

Varians

1-n

)X(XS

n

1i

2i

2

Dimana = arithmetic mean

n = ukuran sampel

Xi = i nilai dari variable X

X

Standard Deviasi

Paling umum dipakai untuk mengukur variasi Menunjukkan variasi mean Mempunyai satuan yang sama seperti data asli

Contoh standard deviasi:

1-n

)X(XS

n

1i

2i

Contoh Perhitungan:Contoh Standard Deviasi

Sampel Data (Xi) : 10 12 14 15 17 18 18 24

n = 8 Mean = X = 16

4.24267

126

18

16)(2416)(1416)(1216)(10

1n

)X(24)X(14)X(12)X(10S

2222

2222

Suatu ukuran “rata-rata” sebaran di sekitar mean

Mengukur variasi

standard deviation kecil

standard deviation besar

Membanding Standard Deviasi

Mean = 15.5 S = 3.338 11 12 13 14 15 16 17 18 19 20 21

11 12 13 14 15 16 17 18 19 20 21

Data B

Data A

Mean = 15.5 S = 0.926

11 12 13 14 15 16 17 18 19 20 21

Mean = 15.5 S = 4.570

Data C

Koefisien Variasi

Mengukur variasi relatif Selalu dalam prosentase (%) Menunjukkan variasi relatif terhadap mean Dapat digunakan untuk membandingkan 2 atau

lebih sekumpulan data yang diukur dengan satuan berbeda

100%X

SCV

Membanding Koefisien Variasi Saham A:

Harga rata-rata tahun lalu = $50 Standard deviasi = $5

Stock B: Harga rata-rata tahun lalu = $100 Standard deviasi = $5

Kedua saham mempunyai standar deviasi yang sama, tapi saham B kurang variasi relatif terhadap harganya.

10%100%$50

$5100%

X

SCVA

5%100%$100

$5100%

X

SCVB

Bentuk suatu Distribusi

Menggambarkan bagaimana data terdistribusi Mengukur bentuk:

Simetris atau menceng (tidak simetris)

Mean = Median Mean < Median Median < Mean

Menceng KananMenceng Kiri Simetris

Menggunakan Microsoft Excel

Jika belum, menu “data analysis” harus diaktifkan dengan menginstall add ins “Analysis Toolpak”

Feature tersebut diinstal dengan cara Klik menu Tools Pilih Add Ins Centang Analysis ToolPak Klik OK

Menggunakan Microsoft Excel

Statistik deskriptif dapat diperoleh dengan mudah di Microsoft® Excel

Pilih Menu:

tools / data analysis / descriptive statistics

Masukkan detail dalam kotak dialog

Menggunakan Excel

Pilih Menu:

tools / data analysis /

descriptive statistics

Masukkan detail dalam kotak dialog

Tandai kotak label summary statistics

Klik OK

Menggunakan Excel(continued)

Output Excel

Microsoft Excel:

Output statistik deskriptif,

Dengan data harga rumah:

Harga rumah:

$2,000,000 500,000 300,000 100,000 100,000

Ukuran Ringkasan Populasi

Ukuran ringkasan dari populasi disebut parameters

Mean populasi adalah jumlah nilai dalam populasi

dibagi dengan jumlah/ukuran populasi, N

N

XXX

N

XN21

N

1ii

μ = mean population

N = jumlah/ukuran population

Xi = nilai ke-I dari variable X

Dimana

Rata-rata deviasi kuadrat nilai dari mean

Varians Population:

Varians Populasi

N

μ)(Xσ

N

1i

2i

2

Dimana μ = mean populasi

N = ukuran/sampel populasi

Xi = nilai ke-I dari variable X

Standard Deviasi Populasi

Umumnya dipakai mengukur deviasi Menunjukkan variasi mean Mempunyai satuan yang sama seperti data asli

Standard Deviasi Populasi :

N

μ)(Xσ

N

1i

2i

Jika distribusi data berbentuk lonceng, maka interval:

mengandung 68% dari nilai-nilai dalam populasi atau sample

Aturan Empiris

1σμ

μ

68%

1σμ

mengandung 95% nilai-nilai dalam populasi atau sampel

mengandung 99.7% nilai-nilai dalam populasi atau sampel

Aturan Empiris

2σμ

3σμ

3σμ

99.7%95%

2σμ

Tanpa memperhatikan bagaimana data terdistribusi, setidaknya (1 - 1/k2) dari nilai akan berada dalam standar deviasi k dari mean (for k > 1)

Contoh:

(1 - 1/12) = 0% ……..... k=1 (μ ± 1σ)

(1 - 1/22) = 75% …........ k=2 (μ ± 2σ)

(1 - 1/32) = 89% ………. k=3 (μ ± 3σ)

Aturan Bienaymé-Chebyshev

withinAt least

Analisis Data Explorasi

Box-and-Whisker Plot: Tampilan grafis data menggunakan ringkasan 5-angka:

Minimum -- Q1 -- Median -- Q3 -- Maximum

Contoh:

Minimum 1st Median 3rd Maximum Quartile Quartile

Minimum 1st Median 3rd Maximum Quartile Quartile

25% 25% 25% 25%

Shape of Box-and-Whisker Plots

Kotak dan garis tengah terletak ditengah antara titik-titik ujung jika datanya simetris sekitar median

A Box-and-Whisker plot dapat ditampilkan baik dalam format vertical maupun horizontal

Min Q1 Median Q3 Max

Bentuk Distribusi dan Box-and-Whisker Plot

Menceng KananMenceng Kiri Simetris

Q1 Q2 Q3 Q1 Q2 Q3 Q1 Q2 Q3

Contoh Box-and-Whisker Plot

Berikut adalah Box-and-Whisker plot untuk data-data sebagai berikut:

0 2 2 2 3 3 4 5 5 10 27

Data ini menceng kanan, sebagaimana terplot

0 2 3 5 270 2 3 5 27

Min Q1 Q2 Q3 Max

Covarians Sampel

Covarians sampel mengukur keeratan hubungan linier antara dua variabel (disebut data bivariat)

Varians sampel:

Hanya menyangkut keeratan hubungan

Tidak ada hubungan sebab akibat

1n

)YY)(XX()Y,X(cov

n

1iii

Covarians antar dua variabel acak:

cov(X,Y) > 0 X dan Y cenderung bergerak ke arah yang sama

cov(X,Y) < 0 X dan Y cenderung bergerak ke arah yang berlawanan

cov(X,Y) = 0 X dan Y adalah bebas

Terjemahan Covarians

Koefisien Korelasi

Mengukur kekuatan relatif hubungan linear antara dua variabel

Contoh koefisien korelasi:

YXn

1i

2i

n

1i

2i

n

1iii

SS

)Y,X(cov

)YY()XX(

)YY)(XX(r

Gambaran Koefisien Korelasi, r

Bebas satuan

Rentang antara –1 and 1

Lebih dekat dgn –1, hubungan linear negatif lebih kuat

Lebih dekat dengan 1, hubungan linear positif lebih kuat

Lebih dekat dengan 0, hubungan linear lebih lemah

untuk setiap nilai positif

Plot sebaran data dengan berbagai koefisien korelasi

Y

X

Y

X

Y

X

Y

X

Y

X

r = -1 r = -.6 r = 0

r = +.3r = +1

Y

Xr = 0

Menggunakan Excel untuk mengetahui Koefisien Korelasi

Pilih Tools/Data Analysis

Pilih Correlation dari menu pilihan

Klik OK . . .

Menggunakan Excel untuk mengetahui Koefisien Korelasi

Masukkan rentang data dan ambil pilihan yang benar

Klik OK untuk memperoleh hasil output

(lanjutan)

Menterjemahkan Hasil

r = .733

Terdapat hubungan linier yang positif kuat antara: skor tes #1 dan skor tes #2

Mahasiswa bernilai tinggi pada tes #1 cenderung bernilai tinggi pula pada tes #2

Scatter Plot of Test Scores

70

75

80

85

90

95

100

70 75 80 85 90 95 100

Test #1 ScoreT

est

#2 S

core

Catatan Terhadap Ukuran Deskriptif Numerik

Analisis data adalah obyektif Ukuran ringkas seharusnya dilaporkan dengan baik

yang memenuhi asumsi-asumsi tentang sejumlah data

Interpretasi/terjemahan data adalah subyektif Harusnya dilakukan dengan tata cara yang fair,

netral dan jelas

Pertimbangan

Ukuran deskriptif numerik:

Mendokumentasikan baik hasil yang baik dan buruk

Dipresentasikan dengan cara yang fair, obyektif dan neural

Sebaiknya bukan diringkas dengan tidak benar untuk mendistorsi fakta/kenyataan

Ringkasan Pembahasan

Gambaran ukuran-ukuran terpusat Mean, median, mode, geometric mean

Diskusi quartiles Gambaran ukuran variasi

Range, interquartile range, variance dan standard deviasi, koefisien variasi

Bentuk distribusi data Simetris, menceng, box-and-whisker plots

Ringkasan Pembahasan

Diskusi covarians dan koefisien korelasi

Pertimbangan Kehati-hatian dalam ukuran

deskriptif numerik dan pertimbangan etis

(lanjutan)

top related