bab 1 pendahuluan a. hakikat statistika 1. asal kata · pada abad ke-17 dan ke-18 ada tiga istilah...
TRANSCRIPT
Kuliah 1.
1
BAB 1
PENDAHULUAN
A. Hakikat Statistika
1. Asal Kata
• Kata statistika berasal dari kata “status” atau “statista” yang
berarti negara
• Tulisan Aristoteles “Politeia” menguraikan keadaan dari 158
negara yakni sumber dari kata “statistika”
• Pada awalnya, status atau statista mencatat data dari berbagai
negara
2. Pemantapan Kata Statistika
Pada abad ke-17 dan ke-18 ada tiga istilah yang bersaing
• Political arithmetic (di Inggris abad ke-17)
• Publisistika
• Statistika (oleh Achenwall dari Jerman pada
pertengahan abad ke-18, dan di-turuti oleh Sir John Sinclair di
Inggris)
Yang bertahan adalah kata “statistika”
Pada saat ini kita mengenal statistika yang teoretik serta statistika terapan.
Statistika yang teoretik dikenal juga sebagai statistika matematik
• Statistika Teoretik (Matematik)
• Statistika Terapan
Di sini kita membahas statistika terapan dengan memanfaatkan rumus statistika
yang diperoleh dari statistika teoretik
1)
Kuliah 1.
2
Apa Yang dimaksud Statistik dan Statistika ?
Statistik adalah kumpulan data atau fakta yang umumnya berupa angka, yang
disajikan dalam bentuk tabel, diagram dan atau grafik, yang menggambarkan
suatu persoalan tertentu.
Statistika adalah Ilmu pengetahuan yang mempelajari tentang cara-cara
pengumpulan data, penyajian dan pengolahan data, analisis data sehingga dapat
dibuat kesimpulan dan keputusan yang dapat dipertanggung jawabkan.
3. Ruang Lingkup ” STATISTIKA”
Statistika adalah Ilmu Pengetahuan yang perolehan Informasinya berasal dari
data numerik , definisi di atas mengandung makna bahwa bahan baku statistika
adalah data.
INGAT : STATISTICS IS THE SCIENCE
Pada dasarnya statistika dibagi menjadi dua ruang lingkup seperti pada bagan
berikut :
EXPLORATORY DATA ANALYSIS
(descriptive statistics)
STATISTICS
CONFIRMATORY DATA ANALYSIS
(statistical inference)(inductives statistics)
STEMPLOT
BOX PLOT
Sebagai alat bantu untuk
Mengetahui distribusi data
Estimation
Hypotesis Testing
Kuliah 1.
3
SIFAT- SIFAT DATA NUMERIK
CENTRALTENDENCY
NUMERICAL DATAPROPERTIES
SHAPEVARIATION
BOX-and – WHISKERPLOT
Mean
Mode
Median
Midrange
Midhinge
Range
Interquartile Range
Variance
Standard Deviation
Coefficient of
Variation
Kuliah 1.
4
DALAM STATISTIKA
Data Statistik dibagi dalam empat kelompok besar , yaitu :
1. Data ditinjau dari sudut sifat
a. Data Kualitatif : data yang dinyatakan dalam bentuk kategori
Contoh : data kecelakaan lalu lintas : luka sedang ringan, dll
b. Data Kuantitatif : data yang dinyatakan dalam bentuk bilangan
Contoh : 165 cm, 45 kg, 12 mahasiswa.
2. Data ditinjau dari sudut nilai
a. Data diskrit : data yang diperoleh dari hasil penghitungan
contoh : 12 mahasiswa,
ciri berbentuk bilangan bulat
b. Data Kontinu : data yang diperoleh dari hasil mengukur
contoh : Tinggi badan (165 cm)
ciri dalam bentuk interval
3. Data ditinjau dari sudut sumber
a. Data Intern : data yang diperoleh dari lingkungan sendiri
b. Data ekstern : data yang diperoleh dari luar lingkungan.
Contoh : mahasiswa kimia UNPAD, Mhsw. Kimia ITB.
4. Data ditinjau dari sudut memperoleh
a. Data primer : data yang diperoleh dari hasil penelitian sendiri / data yang
diperoleh responden langsung.
b. Data sekunder : data yang diperoleh dari hasil penelitian orang lain
Populasi Dan Sampel
Populasi : totalitas semua hasil yang mungkin , baik dalam menghitung maupun dalam
mengukur, kuantitatif maupun kualitatif mengenai karakteristik tertentu dari
Kuliah 1.
5
semua anggota kumpulan yang lengkap dan jelas yang ingin dipelajari
sifatnya.
Contoh : Semua masyarakat Kota Bandung dan mempunyai KTP Kota Bandung.
Sampel : Bagian dari populasi yang diambil dengan metode tertentu
Contoh : metode random ,kluster , ciri : diambil secara acak.
Sensus Dan Sampling
Sensus : cara mengumpulkan data yang anggota populasi diteliti
Sampling : cara mengambil sampel
Penyajian Data
a. Diagram / Grafik
- Diagram lingkaran , diagram batang, diagram lambang dsb
S-1
SMU
S-2 dan
S-3
0
10
20
30
40
Januari Maret
sayur
buah
daging
Kuliah 1.
6
b. Daftar/ Tabel
Tabel baris kolom , Tabel kontingensi, Tabel Distribuís Frekuensi.
Tabel 1 Bentuk Umum Tabel Baris-Kolom
Judul
Baris
J u d u l K o l o m
l ... j ... k
A
.
.
.
A
.
.
.
B
Sel (Al)
.
.
.
Sel (Al)
.
.
.
...
...
.
.
.
...
.
.
.
...
Sel (Aj)
.
.
.
Sel (Aj)
.
.
.
Sel (Bj)
...
.
.
.
...
.
.
.
...
Sel (Ak)
.
.
.
Sel (Ak)
.
.
.
Sel (Bk)
Catatan : Sumber Data
Keterangan : Warna atau yang lainnya.
Kuliah 1.
7
Tabel Kontingensi
Adalah Tabel Baris-Kolom dimana, sel tabel merupakan frekuensi irisan antara taraf
baris dengan taraf kolom. Bentuk umum tabel ini adalah seperti berikut.
Tabel 2 Tabel Kontingensi
Taraf Faktor 1
Taraf Faktor 2 Jumlah
Baris l ... j ... k
1
.
.
.
i
.
.
.
b
O1l
.
.
.
Oil
.
.
.
Obl
...
.
.
.
...
.
.
.
...
O1j
.
.
.
Oij
.
.
.
Obj
...
.
.
.
...
.
.
.
...
O1k
.
.
.
Oik
.
.
.
Obk
n10
.
.
.
ni0
.
.
.
nb0
Jumlah Kolom n01 ... n0j ... n0k n00
Daftar distribusi Frekuensi
Adalah Daftar /Tabel Baris-Kolom dengan Bentuk umum sebagai berikut :
Tabel 3 Daftar Distribusi Frekuensi
Kelas Interval Frekuensi
B1 – A1
f 1
.
.
.
.
.
.
Bi – Ai fi
.
.
.
.
.
Bk - Ak fk
J u m l a h n
Kuliah 1.
8
Tabel 4 DDF Untuk Perhitungan
Kelas Interval Batas Kelas Titik Tengah Frekuensi fx
B1 – A1 BB1 – BA1 x1 f1 x1f1
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Bi - Ai Bbi - BAi xi fi xifi
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Bk - Ak BBk - BAk xk fk xkfk
J u m l a h - - n N
Tabel 5 DDF Relatif
B1 – A1 f1
B1 – A1
.
.
.
Bi – Ai
.
.
.
Bk - Ak
f1
.
.
.
fi
.
.
.
fk
.
.
.
.
.
.
J u m l a h n 1.00
1f
n1f
n
1f
n
1f
n
Kuliah 1.
9
Tabel 6
DDF Kumulatif Kurang Dari
Nilai B F kumulatif
< B1
.
.
.
< Bi
.
.
.
< Bk + p
0
.
.
.
fi ; i = 1,2,...i-j
.
.
.
fi ; i = 1,2,... k
Tabel 7
DDF Kumulatif Lebih atau sama
Nilai B F kumulatif
B1
.
.
.
Bi
.
.
.
Bk + p
fi ; i = 1,2,... k
.
.
.
fi ; i = 1,2,...i-1
.
.
.
0
Kuliah 1.
10
Daftar Distribusi Frekuensi , dibuat dengan langkah-langkah berikut :
1. Hitung Range (R) atau jangkauan dari n data yang ada, yaitu selisih antara data
terbesar (xmax) dengan data terkecil (xmin). Jadi , R = xmax - xmin
2. Tentukan banyak kelas interval, yaitu dengan :
3. Aturan Sturges : K = 1 + 3,3 log n
4. Atau dipilih sembarang dalam interval 5 ≤ K ≤ 15
5. Hitung Panjang kelas, yaitu p = {R/K} dan dalam DDF akan tampak sebagai :
– Selisih antara dua ujung bawah / atas yang berdekatan
– Selisih antara dua batas bawah / atas yang berdekatan
– Selisih antara batas atas dengan batas bawah yang berada dalam satu
kelas
– Selisih antara dua titik tengah yang berdekatan.
6. Tentukan ujung bawah kelas pertama, yaitu :
7. B1 = data terkecil atau data terkecil dikurangi sebuah bilangan yang lebih kecil dari
p.
8. Lengkapi DDF dengan bantuan aturan-aturan berikut :
- Selisih antara ujung atas sebuah kelas dengan ujung bawah kelas berikutnya adalah :
9. 1,0 jika data bulat; 0,1 jika data terdiri dari desimal; dan seterusnya.
- Batas bawah adalah ujung bawah dikurangi : 0,5 jika data bulat ; 0,05 jika data
terdiri dari 1 desimal ; dan seterusnya.
- Batas atas adalah ujung atas ditambah : 0,5 jika data bulat ; 0,05 jika data terdisri
dari 1 desimal; dan seterusnya.
Aturan untuk menentukan banyak kelas, tidaklah merupakan aturan yang sangat ketat
karena, ada suatu kesepakatan antara para ahli bahwa banyak kelas yang dibuat harus
menghasilkan kelas-kelas dengan frekuensi tidak nol (kosong).
Ukuran Statistik
Dalam Statistik terdapat 3 kelompok besar
a. Ukuran Central (Pemusatan)
b. Ukuran Letak
c. Ukuran Variasi ( penyebaran)
Kuliah 1.
11
1. Ukuran Central (Ukuran Pemusatan)
Terdiri dari : Rata-rata Hitung, Rata-rata Ukur, Rata-rata Harmonis, dan Modus.
a. Rata-rata Hitung (kalau datanya Stationer)
Misal x1, x2, .... xn adalah n buah data (diskrit atau kontinu) yang belum disajikan
dalam DDF (ungrouped data), yang diambil dari sebuah populasi berukuran N dengan
data x1, x2, ..., xN. Maka rata-rata (µ : populasi , : sampel) dihitung dengan
Mean /Avarage( The Arithmetic Mean)
… (1.1)
… (1.2)
… ( 1.3)
Contoh : Ditentukan data sebagai berikut : 8, 5, 10, 4, 7 hitunglah rata-ratanya ?
Jawab :
8 5 10 4 7
5x
1
1 n
ii
X Xn
i i
i
f xX
f
1
1 N
ii
xN
Kuliah 1.
12
Sedangkan jika data tersebut telah disajikan di dalam DDF (grouped data), rata-rata
hitung dengan rumus (1.4) dan (1.5) berikut.
Cara Panjang, (1.4) ... Dan
Cara Pendek, (1.5) …
Xi : Titik Tengah ; x0 : Xi yang sekelas dengan Ci = 1/p (Xi - x0 ) = 0.
Untuk menghitung µ dengan cara pendek, ganti n pada (1.5) dengan N. Dan, melihat
(1.5) maka tabel (4) harus ditambah kolom C dan fC.
Median
Mode : Y
Midrange
MidHinge
Ukuran-ukuran dalam Statistika Lainnya
Q1 = Q (0.25) : disebut Lower Quartile atau Lower Hinge
Q3 = Q (0.75) : disebut Upper Quartile atau Upper Hinge
X = Mean = Point of Balance
X = Q2 = Q (0.50) = Half Position
X = Peak point
12
2 21
,
1,
2
n
n n
X jika n ganjil
XX X jika n genap
1
2s lX X
1 3
1
2Q Q
N
i
ii xfN 1
1i i
i
f xX
f
0
1
k
i ii
px x f c
n
Kuliah 1.
13
2. Ukuran Dispersi
Yang akan dibahas disini adalah simpangan baku , varians, Koefisien Variasi karena
tiga ukuran dispersi ini yang paling sering digunakan. Hubungan antara simpangan baku
dengan variansi adalah ”Varians = Kuadrat dari Simpangan baku ”. Notasi yang umum
digunakan untuk simpangan bakuadalah : (tou, sigma) untuk simpangan baku populasi
dan s untuk simpangan baku sampel.
Ukuran ini merupakan ukuran statistik yang menunjukkan sampai sejauh mana
variabilitas data yang terkumpul. Makin kecil nilai ukuran ini, menunjukkan variabilitas
data makin rendah atau dapat dikatakan bahwa data relatif seragam, dan sebaliknya.
Misal x1, x2, .... xn adalah n buah data ( diskrit atau kontinu) yang belum
disajikan dalam DDF (ungrouped data). Yang diambil dari sebuah populasi berukuran N
dengan data x1, x2, ..., xN . Maka varians (σ2 : populasi , s
2 : sampel ) dihitung dengan
rumus :
Ukuran Keragaman (Measures of Variation) :
Range Xl - Xs
Interquartile Range Quartiles spread/ MidSpread/H-Spread
IQR = H – SPRAD = Q3 – Q1
Variansi / Ragam (Variance)
2
12 1
1
n
i
X X
Sn
2
12 1
N
i
X
N
Kuliah 1.
14
Dapat dibuktikan bahwa :
Rumus :
Ungrouped Data :
= dan s2 =
Grouped Data : “Cara Panjang “
= dan s2 =
Cara Pendek
= dan s2 =
X : titik tengah, f frekuensi, dan Ci = (xi – x0)
2
12 1
1
n
i
X X
Sn
22 211 in
E S E X n X2
211
.inE X n E X
22 2 211n n
n
2 2 2 211n
n n
2 2 211
( ) nn
E S
2
2
1 1
2
N N
i ii i
N x x
N2
2
2
1 1
( 1)
n n
i ii i
n x x
n n
2
2
2
1 1
2
N N
i i i ii i
N f x f x
N
2
2
1 1
( 1)
n n
i i i ii i
n f x f x
n n
2
2
2
1 12
2
N N
i i i ii i
N f C f C
p xN
2
2
1 12
( 1)
n n
i i i ii i
n f C f C
p xn n
1
p
Kuliah 1.
15
Koefisien Variasi (coefficient of variation)
Simpangan Baku (Deviasi standard)
S =
2
1
ix x
n
3. Bentuk Distribusi (Shape )
Bentuk Distribusi (Shape ) adalah : Suatu Pola, Dimana Data didistribusikan
Distribution
of The Data
Symmetrical
(Zero-Skewed)
Not Symmetrical
(Asymmetrical/Skewed)Right-Skewed
(Positive)
X X
Left – Skewed (Negative)
Pengukuran kadar ion nitrat pada contoh :1 hanya mempunyai nilai diskrit tertentu,
karena dibatasi oleh cara pengukurannya. Namun dalam teori, kadar dapat mempunyai
sebarang nilai, sehingga untuk melukiskan bentuk populasi dari sample diperlukan
kurva kontinu. Model matematika yang biasanya dipakai adalah sebaran normal atau
dikenal sebaran Gauss yang digambarkan oleh :
X X
X X
100%S
CVX
Kuliah 1.
16
2
221
exp2
x
y
Contoh :
Hasil 50 penentuan kadar ion nitrat μg/ ml
0.51 0.51 0.51 0.50 0.51 0.49 0.52 0.53 0.50 0.47
0.51 0.52 0.53 0.48 0.49 0.50 0.52 0.49 0.49 0.50
0.49 0.48 0.46 0.49 0.49 0.48 0.49 0.49 0.51 0.47
0.51 0.51 0.51 0.48 0.50 0.47 0.50 0.51 0.49 0.48
0.51 0.50 0.50 0.53 0.52 0.52 0.50 0.50 0.51 0.51
Sajikan data tersebut ke dalam Daftar Distribuís Frekuensi dan hitunglah :
a. Rata-rata Hitung dengan cara pendek dan cara panjang
b. Hitunglah variansi dan simpangan baku.
c. Hitunglah Koefisien Variasi.
d. Buatlah Histogram , Poligon dan Ogive.
Histogram
Kuliah 1.
17
0.530.520.510.500.490.480.470.46
x
14
12
10
8
6
4
2
0
Fre
qu
ency
Mean = 0.4998Std. Dev. = 0.01647N = 50
Statistics
x
50
0
.4998
.00233
.5000
.51
.01647
.000
.07
.46
.53
24.99
.4900
.5000
.5100
Valid
Missing
N
Mean
Std. Error of Mean
Median
Mode
Std. Deviation
Variance
Range
Minimum
Maximum
Sum
25
50
75
Percentiles
Kuliah 1.
18
x
Frequency Percent Valid Percent Cumulative
Percent
Valid .46 1 2.0 2.0 2.0
.47 3 6.0 6.0 8.0
.48 5 10.0 10.0 18.0
.49 10 20.0 20.0 38.0
.50 10 20.0 20.0 58.0
.51 13 26.0 26.0 84.0
.52 5 10.0 10.0 94.0
.53 3 6.0 6.0 100.0
Total 50 100.0 100.0
.53
.52
.51
.50
.49
.48
.47
.46
x