01 subpokokbahasanstatistik 1.2
TRANSCRIPT
Tujuan PembahasanSetelah menyelesaikan bahasan ini, mahasiswa akan
dapat: Membangun dan menginterpretasi distribusi frekuensi,
polygon, dan ogive
Membuat histogram
Membangun dan menginterpretasi bar charts, pie charts, dan scatter diagrams
Membangun dan menginterpretasi data kategori dalam bar charts and pie charts
Menggambar cara yang seharusnya untuk menampilkan data secara grafis
Organisasi dan Presentasi Data secara Grafis
Data dalam bentuk mentah biasanya tidak mudah digunakan dalam pengambilan keputusan Jenis organisasi data yang diperlukan
Tabel Grafik
Teknik yang ditinjau disini adalah sbb: Ordered Array Distribusi Frekuensi dan Histograms Bar charts and pie charts Tabel Contingency
Tabel dan Gambar untuk Data Numerik
Data Numerik
Ordered Array
Histogram Polygon Ogive
Distribusi Frekuensi danDistribusi Kumulatif
The Ordered Array
Suatu daftar tersortir dari data: Menunjukkan batas jangkauan (min ke max)
Menunjukkan variasi dalam jangkauan
Dapat membangun/mengenali outliers (observasi yang tidak biasanya)
Jika serangkaian data terlalu besar maka ordered array tidak begitu bermanfaat
Data dalam bentuk mentah (sebagaimana terkumpul):
24, 26, 24, 21, 27, 27, 30, 41, 32, 38
Data dalam ordered array dari terkecil sampai terbesar:
21, 24, 24, 26, 27, 27, 30, 32, 38, 41
(continued)
The Ordered Array
Apa yang dimaksud Distribusi Frekuensi?
Suatu distribusi frekuensi adalah suatu daftar atau tabel
mengandung pengelompokan kelas (kategori atau rentang dimana data didalamnya)
dan menghubungkan frekuensi dengan data yang ada dalam setiap pengelompokan atau kategori
Tabulasi Data Numerik: Distribusi Frekuensi
Kenapa Distribusi Frekuensi diperlukan?
Suatu distribusi frekuensi merupakan suatu cara untuk meringkas/menyimpulkan data
Distribusi akan memadatkan data mentah menjadi suatu bentuk yang lebih berguna
Dan memungkinkan untuk interpretasi cepat data secara visual
Interval Kelas dan Batas Kelas
Setiap pengelompokan kelas mempunyai lebar yang sama
Lebar setiap interval ditentukan:
Gunakan minimal 5 tapi tidak lebih 15 kelompok Batas kelas tidak pernah overlap Bulatkan lebar interval untuk mendapatkan
titik / nilai akhir
diinginkan yang kelaskelompok jumlah
rentangintervalLebar
Contoh Distribusi Frekuensi
Contoh: Suatu pabrik insulasi secara acak memilih 20 hari musim dingin dan mencatat suhu tertinggi harian
24, 35, 17, 21, 24, 37, 26, 46, 58, 30,
32, 13, 12, 38, 41, 43, 44, 27, 53, 27
Data mentah disortir dan diurutkan naik:12, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58
Rentang/range: 58 - 12 = 46
Pilih jumlah kelas: 5 (biasanya antara 5 dan 15)
Hitung interval kelas (lebar): 10 (46/5 lalu bulatkan)
Tentukan batas kelas (limit): 10, 20, 30, 40, 50, 60
Hitung nilai/titik tengah: 15, 25, 35, 45, 55
Lakukan perhitungan observasi dan kelaskan
Contoh Distribusi Frekuensi(continued)
Contoh Distribusi Frekuensi
Kelas Frekuensi
10 < 20 3 .15 15
20 < 30 6 .30 30
30 < 40 5 .25 25
40 < 50 4 .20 20
50 < 60 2 .10 10
Total 20 1.00 100
Frekuensi Relatif Prosentase
Data in ordered array:
12, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58
(continued)
Menggambar Data Numerik: Histogram
Gambar suatu data dalam distribusi frekuensi disebut suatu histogram
Batas Kelas (atau nilai tengah) digambar pada Sumbu Horisontal
Sumbu Vertikal; adalah baik frekuensi, frekuensi relatif, atau prosentase
Batang dengan ketinggian tertentu digunakan untuk menggambarkan angka observasi dengan masing-masing kelas
Histogram: Suhu Tinggi Harian
0
3
6
5
4
2
00
1
2
3
4
5
6
7
5 15 25 35 45 55 More
Fre
ku
en
si
Nilai Tengah Kelas
Contoh Histogram
(Tidak ada Gap
antar batang)
Kelas
10 < 20 15 3
20 < 30 25 6
30 < 40 35 5
40 < 50 45 4
50 < 60 55 2
FrekuensiNilaiTengah
Kelas
Pilih Histogram
2
3
Input data range and bin range (bin range rentang sel yang terdiri dari batas kelas atas untuk setiap kelompok kelas)
Pilih Chart Output Dan klik “OK”
Histogram in Excel(continued)
(
Pertanyaan untuk Pengelompokan Data ke dalam Kelas
1. Berapa lebar kelas yang seharusnya?(Berapa banyak kelas yang sebaiknya dipakai?)
2. Bagaimana seharusnya nilai akhir kelas ditentukan? Sering dijawab dengan coba-coba, tergantung
pertimbangan pemakai Tujuannya adalah membuat suatu distribusi yang tidak
terlalu “renggang" maupun terlalu “padat” Tujuannya adalah untuk memperlihatkan secara benar
pola variasi dari data
Berapa Banyak Interval Kelas?
Banyak (Interval Kelas Menyempit) Dapat menghasilkan distribusi yang
sangat renggang dengan ada kesenjangan dari kelas kosong
Dapat menghasilkan indikasi yang tidak tepat bagaimana variasi frekuensi dari keseluruhan kelas
Sedikit (Interval Kelas Melebar) Dapat memadatkan variasi yang
terlalu banyak dan menghasilkan distribusi yang terblok
Dapat mengaburkan pola-pola penting dari variasi
0
2
4
6
8
10
12
0 30 60 More
TemperatureF
req
ue
nc
y
0
0.5
1
1.5
2
2.5
3
3.5
4 8
12 16 20 24 28 32 36 40 44 48 52 56 60
Mor
e
Temperature
Fre
qu
ency
(X axis labels are upper class endpoints)
Frequency Polygon: Daily High Temperature
0
1
2
3
4
5
6
7
5 15 25 35 45 55 More
Freq
uenc
y
Menggambar Data Numerik: Polygon Frekuensi
Nilai Tengah
Kelas
10 < 20 15 3
20 < 30 25 6
30 < 40 35 5
40 < 50 45 4
50 < 60 55 2
FrekuensiNilai
Tengah
(Dalam suatu polygon sumbu vertikal akan menunjukkan prosentase observasi per kelas)
Tabulasi Data Numerik: Frekuensi Kumulatif
Kelas
10 < 20 3 15 3 15
20 < 30 6 30 9 45
30 < 40 5 25 14 70
40 < 50 4 20 18 90
50 < 60 2 10 20 100
Total 20 100
Persentase Persentase Kumulatif
Data in ordered array:
12, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58
FrekuensiFrekuensi Kumulatif
Penggambaran Frekuensi Kumulatif: The Ogive (Cumulative % Polygon)
Ogive: Daily High Temperature
0
20
40
60
80
100
10 20 30 40 50 60
Cu
mu
lati
ve
Pe
rce
nta
ge
Class Boundaries (Not Midpoints)
Kelas
< 10 10 0
10 < 20 20 15
20 < 30 30 45
30 < 40 40 70
40 < 50 50 90
50 < 60 60 100
Perentase Kumulatif
Batas Bawah Kelas
Diagram Scatter (Diagram Sebaran) digunakan untuk data numerik yang bivariat Data Bivariat terdiri atas sepasang observasi
yang diambil dari 2 variabel numerik
Diagram Scatter: Satu variabel diukur pada sumbu vertikal dan
variabel lainnya diukur pada sumbu horisontal
Diagram Scatter
Contoh Diagram Scatter
Cost per Day vs. Production Volume
0
50
100
150
200
250
0 10 20 30 40 50 60 70
Volume per Day
Cos
t per
Day
Volume per hari
Biaya per hari
23 125
26 140
29 146
33 160
38 167
42 170
50 188
55 195
60 200
Diagram Scatter di Excel
Pilih kotak chart wizard1
2Pilih XY(Scatter), lalu klik
“Next”
Ketika jendela muncul, Masukkan data range, legend, dan halaman tujuan diagram diplot
3
Tabel dan Grafik untuk Data Kategori
Data Kategori
Grafik Data
Pie Charts
Pareto Diagram
Bar Charts
Tabulasi Data
Tabel Ringkasan
Tabel Ringkasan
Contoh: Current Investment Portfolio
Tipe Jumlah Persentase investasi (dalam ribu $) (%)
Stocks 46.5 42.27
Bonds 32.0 29.09
CD 15.5 14.09
Savings 16.0 14.55
Total 110.0 100.0
(Variabel dikategorikan)
data diringkas dengan kategori
Bar and Pie Charts
Bar charts (Diagram Batang) dan Pie charts (Gambar Kue) sering digunakan untuk data qualitatif (kategorik)
Tinggi batang atau potongan kue menunjukkan frekuensi atau prosentase dari masing-masing kategori
Contoh Bar Chart
Investor's Portfolio
0 10 20 30 40 50
Stocks
Bonds
CD
Savings
Amount in $1000's
Tipe Jumlah Persentase Investasi (dalam ribu $) (%)
Stocks 46.5 42.27
Bonds 32.0 29.09
CD 15.5 14.09
Savings 16.0 14.55
Total 110.0 100.0
Current Investment Portfolio
Contoh Pie Chart
Current Investment Portfolio
Savings
15%
CD 14%
Bonds 29%
Stocks
42%
Tipe Jumlah Persentase Investasi (dalam ribu $) (%)
Stocks 46.5 42.27
Bonds 32.0 29.09
CD 15.5 14.09
Savings 16.0 14.55
Total 110.0 100.0
Diagram Pareto
Digunakan untuk menggambarkan data
kategorik
Bar chart, kategori ditunjukkan dengan cara
frekuensi menurun
Polygon juga sering menunjukkan hal yg sama
Digunakan untuk memisahkan hal penting yang
sedikit (“vital few”) dari “trivial many” (banyak
yang sepele)
Contoh Pareto Diagramcu
mu
lative % in
vested
(line g
raph
)%
in
vest
ed i
n e
ach
cat
ego
ry
(bar
gra
ph
)
0%
5%
10%
15%
20%
25%
30%
35%
40%
45%
Stocks Bonds Savings CD
0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
Current Investment Portfolio
Tabulasi dan Grafik Data Kategori Multivariat
Tabel Kontijensi Untuk Pilihan Investasi ($1000’s)
Kategori Investor A Investor B Investor C Total Investasi
Stocks 46.5 55 27.5 129
Bonds 32.0 44 19.0 95
CD 15.5 20 13.5 49
Savings 16.0 28 7.0 51
Total 110.0 147 67.0 324
(Masing-masing nilai menggambarkan suatu prosentase dari keseluruhan, prosentase total pada baris, atau pada kolom)
Side by side bar charts
(lanjutan)
Tabulasi dan Grafik Data Kategori Multivariat
Comparing Investors
0 10 20 30 40 50 60
S toc k s
B onds
CD
S avings
Inves tor A Inves tor B Inves tor C
Contoh Side-by-Side Chart Penjualan Catur Wulan dari 3 daerah penjualan:
0
10
20
30
40
50
60
1st Qtr 2nd Qtr 3rd Qtr 4th Qtr
EastWestNorth
1st Qtr 2nd Qtr 3rd Qtr 4th QtrEast 20.4 27.4 59 20.4West 30.6 38.6 34.6 31.6North 45.9 46.9 45 43.9
Kelebihan Penggunaan Gambar/Grafik
Menggambarkan data dengan suatu cara sedemikian rupa dengan unsur-unsur, statistik dan desain
Mengkomunikasikan ide/gagasan yang rumit dengan jelas, akurat dan efisien
Menampilkan sejumlah ide/gagasan dengan cara yang paling efisien
Keunggulan hampir selalu ditunjukkan dalam berbagai dimensi
Memberitahukan kebenaran data
Menggunakan “chart junk”(Gambar sampah)
Gagal menyediakan basisKaitan dalam membandingkan data
antar kelompok/group Kompresi atau distorsi pada sumbu vertikal Tidak ada nilai NOL pada sumbu vertikal
Kesalahan dalam Presentase Data
Chart Junk
Presentase Baik
1960: $1.00
1970: $1.60
1980: $3.10
1990: $3.80
Upah Minimum Upah Minimum
0
2
4
1960 1970 1980 1990
$
Presentase Buruk
Penekanan Sumbu Vertikal
Presentasi Baik
Quarterly Sales Quarterly Sales
Presentase Buruk
0
25
50
Q1 Q2 Q3 Q4
$
0
100
200
Q1 Q2 Q3 Q4
$
Ringkasan Pembahasan
Data mentah biasanya sulit dipakai dalam pengambilan keputusan – Jadi diperlukan organisasi data dalam:
Tabel Grafik/Gambar
Teknik-teknik yang dibahas dalam bab ini:
Tampilan “Ordered array” dan “stem-and-leaf”
Distribusi Frekuensi dan histogram Polygon Prosentase dan “ogives” Diagram Scatter untuk data bivariat Bar charts, pie charts, dan Diagram Pareto Tabel Contingency dan “side-by-side bar charts”