Download - 01 Subpokokbahasan 1.3
Bahasan 1.3
Pengukuran Deskriptif Numerik
Statistik & Probabilitas
Setelah menyelesaikan bahasan ini, mahasiswa akan dapat:
Menghitung dan interpretasi mean, median, dan mode untuk sejumlah data
Mencari range, variance, standard deviation, dan coefficient of variation dan mengetahui arti dari nilai-nilai tersebut
Menerapkan empirical rule dan the Bienaymé-Chebshev rule menggambarkan variasi dari nilai populasi sekitar mean
Membuat dan interpretasi suatu box-and-whiskers plot
Menghitung dan menjelaskan correlation coefficient
Menggunakan ukuran numerik bersama graphs, charts, dan tables untuk menjelaskan data
Tujuan Pembahasan
Topik Bahasan
Mengukur kecenderungan, variasi, dan bentuk Mean, median, mode, geometric mean Quartiles Range, interquartile range, variance dan standard
deviation, coefficient of variation Symmetric dan skewed distributions
Mengukur ringkasan Populasi Mean, variance, dan standard deviation The empirical rule dan Bienaymé-Chebyshev rule
Topik Bahasan
Ringkasan 5 Angka dan box-and-whisker plots Covariance and coefficient of correlation Perangkat-perangkat dalam pengukuran
deskriptif numerik dan pertimbangan-pertimbangan etis.
(lanjutan)
Ringkasan Ukuran
Arithmetic Mean
Median
Mode
Menguraikan Data Numerik
Variance
Standard Deviation
Coefficient of Variation
Range
Interquartile Range
Geometric Mean
Skewness
Central Tendency Variasi BentukQuartiles
Ukuran Central Tendency
Central Tendency
Arithmetic Mean Median Mode Geometric Mean
n
XX
n
ii
1
n/1n21G )XXX(X
Pengantar
Nilai tengah dari rangking nilai
Nilai yang paling sering muncul
Arithmetic Mean
The arithmetic mean (mean) merupakan ukuran yang paling umum dari central tendency (kecenderungan terpusat)
For a sample of size n:
Jumlah Sampel
n
XXX
n
XX n21
n
1ii
Nilai Observasi
Arithmetic Mean
Mean = jumlah nilai dibagi dengan banyaknya nilai Dipengaruhi oleh nilai ekstrim (outliers)
(lanjutan)
0 1 2 3 4 5 6 7 8 9 10
Mean = 3
0 1 2 3 4 5 6 7 8 9 10
Mean = 4
35
15
5
54321
4
5
20
5
104321
Median
Dalam ordered array, median adalah angka tengah (50% atas, 50% bawah)
Tidak dipengaruhi oleh nilai ekstrim
0 1 2 3 4 5 6 7 8 9 10
Median = 3
0 1 2 3 4 5 6 7 8 9 10
Median = 3
Menemukan Median
Lokasi median:
Jika jumlah nilai adalah ganjil, median adalah nilai tengah Jika jumlah nilai adalah genap, median adalah rata-rata 2 nilai
tengah
Catatan : is bukan value dari median, hanya
posisi median dalam tingkatan data
dataordereddalamposisin
posisiMedian2
1
2
1n
Mode
A measure of central tendency Nilai yang paling sering ada/muncul Tidak dipengaruhi oleh nilai ekstrim Dipakai untuk baik data numerik atau kategori Ada kemungkinan tidak ada mode Ada kemungkinan ada beberapa mode
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
Mode = 9
0 1 2 3 4 5 6
No Mode
Lima rumah di tepi pantai
Contoh
$2,000 K
$500 K
$300 K
$100 K
$100 K
Harga Rumah:
$2,000,000 500,000 300,000 100,000 100,000
Contoh:Ringkasan Statistik
Mean: ($3,000,000/5)
= $600,000
Median: nilai tengah data terangking
= $300,000
Mode: nilai paling sering muncul = $100,000
Harga Rumah:
$2,000,000 500,000 300,000 100,000 100,000
Jum 3,000,000
Geometric Mean
Geometric mean Dipakai untuk mengukur tingkat perubahan sutau
variabel terhadap waktu
Geometric mean rate of return Mengukur status suatu investasi terhadap waktu
Dimana Ri adalah tingkat pengembalian dalam suatu periode waktu i
n/1n21G )XXX(X
1)]R1()R1()R1[(R n/1n21G
Contoh
Suatu investasi bernilai $100,000 merosot menjadi $50,000 pada akhir tahun pertama dan kembali bernilai $100,000 pada akhir tahun kedua:
000,100$X000,50$X000,100$X 321
50% berkurang 100% bertambah
Pengembalian total dalam 2 tahun adalah NOL, dimana nilai investasi pada awal dan akhir periode adalah sama
Contoh
Gunakan nilai pengembalian tahun 1 untuk menghitung arithmetic mean dan geometric mean:
%0111)]2()50[(.
1%))]100(1(%))50(1[(
1)]R1()R1()R1[(R
2/12/1
2/1
n/1n21G
%252
%)100(%)50(X
Arithmetic mean rate of return:
Geometric mean rate of return:
Hasil keliru/salah
Hasil Lebih Akurat
(lanjutan)
Quartil
Quartil membagi data terangking menjadi 4 segmen dengan jumlah nilai yang sama per segmen
25% 25% 25% 25%
Quartil Pertama, Q1, adalah nilai dimana 25% observasi adalah lebih kecil dan 75% adalah lebih besar
Q2 adalah sama dengan median (50% lebih kecil, 50% lebih besar)
Hanya 25% observasi yang bernilai lebih besar daripada Quartil ketiga
Q1 Q2 Q3
Rumus Quartil
Tentukan suatu quartil dengan menentukan nilai dalam posisi yang seharusnya dalam data terangking, dimana
Posisi Quartil Pertama: Q1 = (n+1)/4
Posisi Quartil Kedua: Q2 = (n+1)/2 (the median position)
Posisi Quartil Ketiga: Q3 = 3(n+1)/4
dimana n adalah jumlah nilai observasi
(n = 9)
Q1 = adalah (9+1)/4 = 2.5 posisi dari data
sehingga gunakan nilai setengah antara nilai KEDUA dan
KETIGA,
sehingga Q1 = 12.5
Quartil
Sampel Data teratur: 11 12 13 16 16 17 18 21 22
Contoh: Tentukan Quartil Pertama
Q1 dan Q3 adalah ukuran lokasi tidak terpusat Q2 = median, suatu ukuran kecenderungan terpusat
Center sama, Variasi berbeda
Ukuran Variasi
Variasi
Variance Standard Deviation
Coefficient of Variation
Range Interquartile Range
Ukuran variasi memberi informasi tentang spread (sebaran) atau variasi nilai data.
Range
Ukuran variasi yang paling sederhana Perbedaan nilai terbesar dan terkecil dari
observasi:
Range = Xlargest – Xsmallest
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
Range = 14 - 1 = 13
Contoh:
Mengabaikan cara bagaimana data dibagi
Sensitif terhadap outliers
7 8 9 10 11 12
Range = 12 - 7 = 5
7 8 9 10 11 12
Range = 12 - 7 = 5
Kelemahan Range
1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,4,5
1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,4,120
Range = 5 - 1 = 4
Range = 120 - 1 = 119
Interquartile Range
Dapat menghilangkan masalah-masalah outliers dengan interquartile range
Menghilangkan beberapa nilai observasi yang tinggi dan rendah, serta menghitung range dari nilai yang tersisa
Interquartile range = 3rd quartile – 1st quartile
= Q3 – Q1
Interquartile Range
Median(Q2)
XmaximumX
minimum Q1 Q3
Contoh:
25% 25% 25% 25%
12 30 45 57 70
Interquartile range = 57 – 30 = 27
Rata-rata (approximately) akar simpangan dari nilai mean
Varian sampel:
Varians
1-n
)X(XS
n
1i
2i
2
Dimana = arithmetic mean
n = ukuran sampel
Xi = i nilai dari variable X
X
Standard Deviasi
Paling umum dipakai untuk mengukur variasi Menunjukkan variasi mean Mempunyai satuan yang sama seperti data asli
Contoh standard deviasi:
1-n
)X(XS
n
1i
2i
Contoh Perhitungan:Contoh Standard Deviasi
Sampel Data (Xi) : 10 12 14 15 17 18 18 24
n = 8 Mean = X = 16
4.24267
126
18
16)(2416)(1416)(1216)(10
1n
)X(24)X(14)X(12)X(10S
2222
2222
Suatu ukuran “rata-rata” sebaran di sekitar mean
Mengukur variasi
standard deviation kecil
standard deviation besar
Membanding Standard Deviasi
Mean = 15.5 S = 3.338 11 12 13 14 15 16 17 18 19 20 21
11 12 13 14 15 16 17 18 19 20 21
Data B
Data A
Mean = 15.5 S = 0.926
11 12 13 14 15 16 17 18 19 20 21
Mean = 15.5 S = 4.570
Data C
Koefisien Variasi
Mengukur variasi relatif Selalu dalam prosentase (%) Menunjukkan variasi relatif terhadap mean Dapat digunakan untuk membandingkan 2 atau
lebih sekumpulan data yang diukur dengan satuan berbeda
100%X
SCV
Membanding Koefisien Variasi Saham A:
Harga rata-rata tahun lalu = $50 Standard deviasi = $5
Stock B: Harga rata-rata tahun lalu = $100 Standard deviasi = $5
Kedua saham mempunyai standar deviasi yang sama, tapi saham B kurang variasi relatif terhadap harganya.
10%100%$50
$5100%
X
SCVA
5%100%$100
$5100%
X
SCVB
Bentuk suatu Distribusi
Menggambarkan bagaimana data terdistribusi Mengukur bentuk:
Simetris atau menceng (tidak simetris)
Mean = Median Mean < Median Median < Mean
Menceng KananMenceng Kiri Simetris
Menggunakan Microsoft Excel
Jika belum, menu “data analysis” harus diaktifkan dengan menginstall add ins “Analysis Toolpak”
Feature tersebut diinstal dengan cara Klik menu Tools Pilih Add Ins Centang Analysis ToolPak Klik OK
Menggunakan Microsoft Excel
Statistik deskriptif dapat diperoleh dengan mudah di Microsoft® Excel
Pilih Menu:
tools / data analysis / descriptive statistics
Masukkan detail dalam kotak dialog
Menggunakan Excel
Pilih Menu:
tools / data analysis /
descriptive statistics
Masukkan detail dalam kotak dialog
Tandai kotak label summary statistics
Klik OK
Menggunakan Excel(continued)
Output Excel
Microsoft Excel:
Output statistik deskriptif,
Dengan data harga rumah:
Harga rumah:
$2,000,000 500,000 300,000 100,000 100,000
Ukuran Ringkasan Populasi
Ukuran ringkasan dari populasi disebut parameters
Mean populasi adalah jumlah nilai dalam populasi
dibagi dengan jumlah/ukuran populasi, N
N
XXX
N
XN21
N
1ii
μ = mean population
N = jumlah/ukuran population
Xi = nilai ke-I dari variable X
Dimana
Rata-rata deviasi kuadrat nilai dari mean
Varians Population:
Varians Populasi
N
μ)(Xσ
N
1i
2i
2
Dimana μ = mean populasi
N = ukuran/sampel populasi
Xi = nilai ke-I dari variable X
Standard Deviasi Populasi
Umumnya dipakai mengukur deviasi Menunjukkan variasi mean Mempunyai satuan yang sama seperti data asli
Standard Deviasi Populasi :
N
μ)(Xσ
N
1i
2i
Jika distribusi data berbentuk lonceng, maka interval:
mengandung 68% dari nilai-nilai dalam populasi atau sample
Aturan Empiris
1σμ
μ
68%
1σμ
mengandung 95% nilai-nilai dalam populasi atau sampel
mengandung 99.7% nilai-nilai dalam populasi atau sampel
Aturan Empiris
2σμ
3σμ
3σμ
99.7%95%
2σμ
Tanpa memperhatikan bagaimana data terdistribusi, setidaknya (1 - 1/k2) dari nilai akan berada dalam standar deviasi k dari mean (for k > 1)
Contoh:
(1 - 1/12) = 0% ……..... k=1 (μ ± 1σ)
(1 - 1/22) = 75% …........ k=2 (μ ± 2σ)
(1 - 1/32) = 89% ………. k=3 (μ ± 3σ)
Aturan Bienaymé-Chebyshev
withinAt least
Analisis Data Explorasi
Box-and-Whisker Plot: Tampilan grafis data menggunakan ringkasan 5-angka:
Minimum -- Q1 -- Median -- Q3 -- Maximum
Contoh:
Minimum 1st Median 3rd Maximum Quartile Quartile
Minimum 1st Median 3rd Maximum Quartile Quartile
25% 25% 25% 25%
Shape of Box-and-Whisker Plots
Kotak dan garis tengah terletak ditengah antara titik-titik ujung jika datanya simetris sekitar median
A Box-and-Whisker plot dapat ditampilkan baik dalam format vertical maupun horizontal
Min Q1 Median Q3 Max
Bentuk Distribusi dan Box-and-Whisker Plot
Menceng KananMenceng Kiri Simetris
Q1 Q2 Q3 Q1 Q2 Q3 Q1 Q2 Q3
Contoh Box-and-Whisker Plot
Berikut adalah Box-and-Whisker plot untuk data-data sebagai berikut:
0 2 2 2 3 3 4 5 5 10 27
Data ini menceng kanan, sebagaimana terplot
0 2 3 5 270 2 3 5 27
Min Q1 Q2 Q3 Max
Covarians Sampel
Covarians sampel mengukur keeratan hubungan linier antara dua variabel (disebut data bivariat)
Varians sampel:
Hanya menyangkut keeratan hubungan
Tidak ada hubungan sebab akibat
1n
)YY)(XX()Y,X(cov
n
1iii
Covarians antar dua variabel acak:
cov(X,Y) > 0 X dan Y cenderung bergerak ke arah yang sama
cov(X,Y) < 0 X dan Y cenderung bergerak ke arah yang berlawanan
cov(X,Y) = 0 X dan Y adalah bebas
Terjemahan Covarians
Koefisien Korelasi
Mengukur kekuatan relatif hubungan linear antara dua variabel
Contoh koefisien korelasi:
YXn
1i
2i
n
1i
2i
n
1iii
SS
)Y,X(cov
)YY()XX(
)YY)(XX(r
Gambaran Koefisien Korelasi, r
Bebas satuan
Rentang antara –1 and 1
Lebih dekat dgn –1, hubungan linear negatif lebih kuat
Lebih dekat dengan 1, hubungan linear positif lebih kuat
Lebih dekat dengan 0, hubungan linear lebih lemah
untuk setiap nilai positif
Plot sebaran data dengan berbagai koefisien korelasi
Y
X
Y
X
Y
X
Y
X
Y
X
r = -1 r = -.6 r = 0
r = +.3r = +1
Y
Xr = 0
Menggunakan Excel untuk mengetahui Koefisien Korelasi
Pilih Tools/Data Analysis
Pilih Correlation dari menu pilihan
Klik OK . . .
Menggunakan Excel untuk mengetahui Koefisien Korelasi
Masukkan rentang data dan ambil pilihan yang benar
Klik OK untuk memperoleh hasil output
(lanjutan)
Menterjemahkan Hasil
r = .733
Terdapat hubungan linier yang positif kuat antara: skor tes #1 dan skor tes #2
Mahasiswa bernilai tinggi pada tes #1 cenderung bernilai tinggi pula pada tes #2
Scatter Plot of Test Scores
70
75
80
85
90
95
100
70 75 80 85 90 95 100
Test #1 ScoreT
est
#2 S
core
Catatan Terhadap Ukuran Deskriptif Numerik
Analisis data adalah obyektif Ukuran ringkas seharusnya dilaporkan dengan baik
yang memenuhi asumsi-asumsi tentang sejumlah data
Interpretasi/terjemahan data adalah subyektif Harusnya dilakukan dengan tata cara yang fair,
netral dan jelas
Pertimbangan
Ukuran deskriptif numerik:
Mendokumentasikan baik hasil yang baik dan buruk
Dipresentasikan dengan cara yang fair, obyektif dan neural
Sebaiknya bukan diringkas dengan tidak benar untuk mendistorsi fakta/kenyataan
Ringkasan Pembahasan
Gambaran ukuran-ukuran terpusat Mean, median, mode, geometric mean
Diskusi quartiles Gambaran ukuran variasi
Range, interquartile range, variance dan standard deviasi, koefisien variasi
Bentuk distribusi data Simetris, menceng, box-and-whisker plots
Ringkasan Pembahasan
Diskusi covarians dan koefisien korelasi
Pertimbangan Kehati-hatian dalam ukuran
deskriptif numerik dan pertimbangan etis
(lanjutan)