stater-2

38
STATISTIK UNTUK TEKNIK SIPIL Statistik Deskriptif 2.1. Pengolahan Data Sebelum bahasan statistik deskriptif (descriptive statistics) berupa penampilan dan penyajian data perlu dipelajari terlebih dahulu mengenai pengolahan data. Data yang dikumpulkan dapat berupa data menerus (continuous data) atau data yang dapat digunakan angka interpolasinya atau angka antaranya. Dan data terputus atau discrete atau Categorical data merupakan data dengan angka satu sama lain tidak saling berhubungan dan tidak dapat diinterpolasi atau datanya meloncat-loncat. Pengolahan data menerus (continuous data) sebagai bagian dari statistik inferensial dapat dilakukan untuk keperluan point estimate (perkiraan titik) atau interval estimate (perkiraan sebaran). Pada point estimate membutuhkan data Mean, Median, Mode, sedang untuk perkiraan sebaran atau interval estimate atau Dispersion Jurusan Teknik Sipil – FTSP – ITS 6

Upload: ridwanuye

Post on 01-Feb-2016

222 views

Category:

Documents


0 download

DESCRIPTION

jj

TRANSCRIPT

Page 1: STATER-2

STATISTIK UNTUK TEKNIK SIPIL

Statistik

Deskriptif

2.1. Pengolahan Data

Sebelum bahasan statistik deskriptif (descriptive statistics) berupa penampilan dan

penyajian data perlu dipelajari terlebih dahulu mengenai pengolahan data.

Data yang dikumpulkan dapat berupa data menerus (continuous data) atau data yang

dapat digunakan angka interpolasinya atau angka antaranya.

Dan data terputus atau discrete atau Categorical data merupakan data dengan angka

satu sama lain tidak saling berhubungan dan tidak dapat diinterpolasi atau datanya

meloncat-loncat.

Pengolahan data menerus (continuous data) sebagai bagian dari statistik inferensial

dapat dilakukan untuk keperluan point estimate (perkiraan titik) atau interval estimate

(perkiraan sebaran). Pada point estimate membutuhkan data Mean, Median, Mode,

sedang untuk perkiraan sebaran atau interval estimate atau Dispersion Range

dibutuhkan Standard deviasi, Coefficient of variation (covariance) dan Percentile.

Untuk estimasi momen dibutuhkan Variance, Semivariance, Skewness, dan Kurtosis.

Pada data categorical dibutuhkan besaran frequensi dan tabel contingency.

Klasifikasi data akan mempermudah pengerjaan statistik, dengan urutan kerja:

Data diurut dari kecil ke besar, dan menentukan nilai minimum dan

maksimumnya.

Dicari jumlah kelas (k) berdasar patok: k = √n, dimana n = jumlah data

Interval antar klas = (nilai maksimum – minimum) dibagi k, dibulatkan ke

bawah

Menghitung frekuensi data berdasar jumlah data yang memenuhi interval klas.

Jurusan Teknik Sipil – FTSP – ITS 6

Page 2: STATER-2

STATISTIK UNTUK TEKNIK SIPIL

Mean atau rata-rata

Mean atau arithmatic mean atau average berupa nilai rata-rata aritmatis dari data atau

dituliskan sebagai :

x = = =

Dimana :

Min (x1, ....., xn) ≤ ≤ max (x1, ....., xn)

xi = besaran data ke i sampai dengan data ke n yaitu xn

n = jumlah data

Bila data tidak membentuk kurva probabilitas yang sederhana maka besaran mean

dapat digunakan secara variatif sebagaimana tabel 2.1.

Tabel 2.1. – Nilai mean

Mean Nilai Contoh Hasil

Harmonic mean (H) 2*(3*4) /(3+4) 3.43

Geometric mean (G) (3*4)^0,5 3.46

Arithmetic mean (A) (3+4)/2 3.50

Root-mean-square (RMS) ((3^2+4^2)/2)^0,5 3.54

Jadi H ≤ G ≤ A ≤ RMS khususnya untuk jumlah data = 2 sebagaimana contoh

diatas dan tidak cocok untuk jumlah data lebih dari itu.

Jurusan Teknik Sipil – FTSP – ITS 7

Page 3: STATER-2

STATISTIK UNTUK TEKNIK SIPIL

Median

Merupakan nilai dari x pada saat P(X≤x) = 0,5 atau data/sampel yang memisahkan

separuh bagian populasi yang lebih tinggi terhadap yang lebih rendah.

Median diperoleh dengan mengambil data yang berada di tengah setelah seluruh data

diurut dari terkecil ke terbesar, bila jumlah data genap dipakai besaran data rata-rata

yang terdekat diatasnya.

Contoh:

a) Jumlah data ganjil

Data asli : 1, 5, 2, 8, 7.

Data terurut: 1, 2, 5, 7, 8.

Median = 5 sebagai nilai tengah setelah data diurut.

b) Jumlah data genap

Data asli : 1, 5, 2, 8, 7, 2.

Data terurut: 1, 2, 2, 5, 7, 8.

Median = (2 + 5)/2 = 3.5 sebagai nilai rata-rata dari data tengah setelah data diurut.

Mode

Merupakan nilai x pada posisi P(X≤x) maksimum atau berupa nilai x yang paling

sering muncul.

Bila mean dan mode berimpitan menghasilkan bentuk kurva simetris dikenal sebagai

“ Distribusi normal Gaussian “

Contoh : data asli random 1, 2, 2, 3, 4, 7, 9 maka besaran mode = 2

Ske wness ( = X)

Merupakan ukuran dari derajat ketidak simetrian bentuk distribusi dibanding bentuk

distribusi normal, atau dapat diartikan sebagai perbedaan posisi Mean dan Mode.

Atau X =

Bila X = 0 berarti distribusinya simestris (Gaussian), bila X > 0 (positive skew)

berarti distribusinya memiliki puncak (menceng) ke kiri atau mode < mean, dan

sebaliknya (negative skew), lihat gambar 2.1.

Jurusan Teknik Sipil – FTSP – ITS 8

Page 4: STATER-2

STATISTIK UNTUK TEKNIK SIPIL

Besaran nilai skewness akan berbeda-beda antara bentuk fungsi probabilitas satu

dengan yang lain, lihat Tabel 2.2.

Gambar 2.1. – Posisi skewness dari suatu distribusi

Tabel 2.2. – Kurtosis dan Skewness untuk berbagi bentuk distribusi

Distribution Kurtosis excess Skewness

Bernoulli distribution

beta distribution

binomial distribution

chi-squared distribution

exponential distribution 6 2

Fisher-Tippett distribution

gamma distribution

geometric distribution

half-normal distribution

Laplace distribution 3

log normal distribution

Maxwell distribution 0

negative binomial distribution

normal distribution 0

Poisson distribution

Jurusan Teknik Sipil – FTSP – ITS 9

Page 5: STATER-2

STATISTIK UNTUK TEKNIK SIPIL

Rayleigh distribution 0

Student's t-distribution

continuous uniform distribution

discrete uniform distribution

Kurtosis

Merupakan derajat kelancipan dari bentuk puncak kurva terhadap kurva normal.

Kurtosis berdasar software SPSS, Excel dan beberapa software lain atau berdasar

Sheskin (2000) disajikan dalam rumus x, bila x = 0 berarti distribusi normal, bila x >

0 kurva berbentuk lancip bila hasilnya negatif berarti puncak kurva lebih rendah atau

datar dibanding Normal.

X =

Besarannya akan dibahas bersama pembahasan masing-masing fungsi distribusi, lihat

gambar 2.2..

Gambar 2.2. – Besaran Kurtosis untuk beberapa bentuk distribusi dengan penjelasan

sebagai berikut:

D: Laplace distribution = double exponential distribution, kurva merah, excess kurtosis = 3

Jurusan Teknik Sipil – FTSP – ITS 10

Page 6: STATER-2

STATISTIK UNTUK TEKNIK SIPIL

S: hyperbolic secant distribution, kurva oranye, excess kurtosis = 2

L: logistic distribution, kurva hijau, excess kurtosis = 1.2

N: normal distribution, kurva hitam, excess kurtosis = 0

C: raised cosine distribution, kurva biru hijau, excess kurtosis = −0.593762...

W: Wigner semicircle distribution, kurva biru, excess kurtosis = −1

U: uniform distribution, kurva ungu magenta, excess kurtosis = −1.2.

Momen

Merupakan besaran selisih antara posisi data dengan mean data, jadi pada data ke n

besaran central momen dari distribusi probabilitas random dengan variabel X sebesar:

dalam hal ini nilainya = 0.

Variance

Merupakan nilai yang menunjukkan penyebaran dari kurva probabilitas, juga

menunjukkan lebar atau sempitnya kurva. Disimbolkan sebagai X2 atau besaran

standard deviasi dikuadratkan.

Covariance (coefficient of variation) = Cv

Merupakan ukuran mean dan variance untuk mendiskripsikan keterkaitan antara satu

kurva dengan lainnya. Jadi covariance digunakan untuk membandingkan 2 kurva

probabilitas yang menghasilkan juga suatu angka korelasi koefisien dan merupakan

bilangan tanpa satuan.

Coefficient of variation sangat umum digunakan dalam renewal theory (poisson

distribution), queueing theory, dan reliability theory. Dalam teori-teori ini umumnya

digunakan distribusi exponential distribution dimana standard deviasinya = mean,

covariance = 1. Distribusi dengan CV < 1 (misal Erlang distribution) dikategorikan

low-variance, sementara bila CV > 1 (misal hyper-exponential distribution)

dikelompokkan high-variance.

Standard Deviasi

Jurusan Teknik Sipil – FTSP – ITS 11

Page 7: STATER-2

STATISTIK UNTUK TEKNIK SIPIL

Merupakan nilai penyebaran yang lain terkait variance berupa akar kuadrat dari

variance yang positiv atau jarak (selisih) rata-rata data terhadap mean = X

X =

Percentile

Menunjukkan data atau nilai dari kelompok yang kurang dari prosentase pada

percentile tersebut.

Quartile = Q1 = nilai atau angka data yang jatuh dibawah 25% dari total populasi,

setelah data diolah atau diurut dan dicari prosentase kumulatifnya. Median =

Percentile untuk 50% data prosentase kumulatif, tenth percentile = P10 = D1, P20 =

D2, P25 = Q1, P30 = D3, P40 = D4, P50 = D5 = Q2 = median, P60 = D6, P70 = D7,

P75 = Q3, P80 = D8, P90 = D9, P100 = D10 = Q4.

Jadi untuk mendapatkan besaran ke p-percentile dari N nilai data terurut maka

pertama dihitung posisi rangkingnya yaitu lalu dibulatkan ke

bilangan terdekat dan ambil besaran yang terkait dengan rangking tersebut.

Atau cara lain dengan mengurut nilai N data v1, v2, v3,...,vN , dari kecil ke besar lalu

tentukan percentile terkait nilai ke n sebesar

Contoh : N = 5 nilai terkait percentile ketiga sebesar

artinya p3 adalah median dari data atau setara 50 percentile = Q2.

Proses perhitungan : susun data terurut, hitung data kumulatifnya, dan tentukan

percentile berdasar interpolasi dari klas data yang digunakan.

Contingency table

Digunakan untuk mencatat dan menganalisa hubungan antara 2 variabel data

categorical (discrete) meskipun keduanya kadang tidak saling berhubungan.

Contoh dalam tabel dibawah. menunjukkan antar variabel dalam tabel yang tidak

dapat diinterpolasi.

Tangan Kanan Tangan Kidal Total

Laki-laki 43 9 52

Perempuan 44 4 48

Total 87 13 100

Jurusan Teknik Sipil – FTSP – ITS 12

Page 8: STATER-2

STATISTIK UNTUK TEKNIK SIPIL

CONTOH SOAL

I. Terdapat data hasil pengukuran pada test “Penetrasi Aspal” dari sampel sebanyak 20

unit.

60 68 75 77 80 74 64 65 67 68 72 76 82 87 63 82 65 70 73 68

a). Hitunglah Mean, Median, dan Mode serta standard deviasinya!

b). Hitunglah Skewness dan bagaimana distribusinya berdasar nilai skewness ini?

c). Hitunglah Kurtosis dan jelaskan distribusinya berdasar nilai Kurtosis ini?

Jawaban :

a) Mean = 71.8, Median = 71, dan Mode = 68 , standard deviasi = X = 7,3.

Standard Deviasi X = = 7,3

n X - (X - (X - (X -

1 60 (11.8) 139.2 (1,643.0) 19,387.782 68 (3.8) 14.4 (54.9) 208.513 75 3.2 10.2 32.8 104.864 77 5.2 27.0 140.6 731.165 80 8.2 67.2 551.4 4,521.226 74 2.2 4.8 10.6 23.437 64 (7.8) 60.8 (474.6) 3,701.518 65 (6.8) 46.2 (314.4) 2,138.149 67 (4.8) 23.0 (110.6) 530.84

10 68 (3.8) 14.4 (54.9) 208.5111 72 0.2 0.0 0.0 0.0012 76 4.2 17.6 74.1 311.1713 82 10.2 104.0 1,061.2 10,824.3214 87 15.2 231.0 3,511.8 53,379.4815 63 (8.8) 77.4 (681.5) 5,996.9516 82 10.2 104.0 1,061.2 10,824.3217 65 (6.8) 46.2 (314.4) 2,138.1418 70 (1.8) 3.2 (5.8) 10.5019 73 1.2 1.4 1.7 2.0720 68 (3.8) 14.4 (54.9) 208.51 71.8 1,007.2 2,736.5 115,251.4

b) Skewness

X = = 0.41 Puncak menceng kiri

c) Kurtosis = X =

= - 0,58 , puncak kurva lebih lancip dari kurva Normal.

Jurusan Teknik Sipil – FTSP – ITS 13

3

13 )(

*)2(*)1(X

n

ii

X

Xnn

n

Page 9: STATER-2

STATISTIK UNTUK TEKNIK SIPIL

II. Terdapat data hasil pengukuran CBR di berbagai ruas jalan dan di Jawa Timur,

sebagai berikut:

Row 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25

CBRJATIM

8 7 12 18 20 22 27 28 30 31 33 36 37 44 44 45 42 46 48 44 55 62 61 64 63

CBR 7 7 12 15 20 27 27 30 30 35 33 36 37 47 45 45 42 46 47 44 49 62 65 64 64

Row 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50

CBRJATIM

65 66 68 65 65 70 71 72 73 77 74 75 75 76 77 82 88 84 91 92 99 99 89 84 77

CBR 65 66 68 65 65 70 73 73 73 77 74 74 75 76 78 82 80 85 90 92 99 97 92 88 84

a) Pengolahan Data CBR

Perhitungan Manual Data CBR

minmum 7maximum 99

Jumlah Klas 7Range 13.14 Jumlah Frekuensi KumulatifKlas 7 20 5 10% 10%

21 34 5 10% 20%35 48 11 22% 42%49 62 2 4% 46%63 76 16 32% 78%77 90 8 16% 94%91 104 3 6% 100%

50 100%P10 20.0 P25 37.2P90 87.5 P75 74.7

P50 = Median

63.8

Mean 57.9

b) Perbandingan histogram Data CBR dan CBR JATIM

Jurusan Teknik Sipil – FTSP – ITS 14

Page 10: STATER-2

STATISTIK UNTUK TEKNIK SIPIL

Jurusan Teknik Sipil – FTSP – ITS 15

Page 11: STATER-2

STATISTIK UNTUK TEKNIK SIPIL

2.2. Kegunaan penyajian dan tampilan data

Penyajian dan tampilan data, baik data asli maupun terolah, yang dilakukan secara

tepat akan mampu secara langsung menjelaskan kondisi data yang ada, dan

memudahkan penelaahan lebih lanjut dari data tersebut. Metode statistik harus dapat

digunakan untuk menampilkan, menjelaskan, dan memahami pola atau perilaku yang

beragam dari data. Jadi pemilihan tampilan yang tepat menentukan kualitas sajian,

akurasi dan kebenaran analisis serta kesimpulan yang diambil.

2.3. Bentuk sajian dan tampilan data

Data asli umumnya ditampilkan dalam bentuk tabel yang terdiri dari kolom dan baris.

Bentuk tabel ini disajikan bila kondisi asli data lebih dipentingkan atau bila bentuk

analisis terhadap data tersebut belum dapat ditentukan.

Sajian dan tampilan lain berupa gambar atau grafik yang dapat digunakan untuk

menunjukkan berbagai hubungan antar data, hasil analisis keseluruhan data maupun

masing-masing individu data.

Tampilan data dalam bentuk grafis meliputi:

1. Scatter plot : Menunjukkan hubungan antara dua variabel yang dapat

digunakan untuk mencari kesimpulan ada atau tidaknya hubungan antara

kedua variabel tersebut.

Berdasar gambar atau grafik ini dapat diinterpretasikan atau dilakukan analisis

lebih lanjut misalnya dengan menambah reference line, atau regression line

dan perhitungan statistik lain.

Grafik ini dapat dibuat menggunakan beberapa software diantaranya:

MSEXCEL, MINITAB, dan SPSS.

Contoh : berdasar data hasil penelitian sebagaimana Tabel 2.3. hubungan

antara CBR dengan umur perkerasan dapat disajikan dalam grafik scatter plot

gambar 2.3. Menggunakan Minitab dapat ditambah garis bantu untuk

menerjemahkan hubungan antara kedua variabel dibantu regresi yang harus

dicek lebih dulu kebenarannya.

Jurusan Teknik Sipil – FTSP – ITS 16

Page 12: STATER-2

STATISTIK UNTUK TEKNIK SIPIL

Tabel 2.3. – Hasil survey kondisi Jalan

Gambar 2.3. – Hubungan CBR dengan umur perkerasan

2. Matrix Plot : Menunjukkan hubungan antara beberapa pasang variable

sekaligus. Grafik ini digunakan untuk menampilkan tambahan variabel yang

ingin ditampilkan dalam satu grafik, tetapi jangan sampai membuat sulit untuk

menarik kesimpulan atau mempelajari pola data yang ada.

Software yang dapat menyajikannya hanya : MINITAB.

Terdapat 2 bentuk tampilan bila menggunakan MINITAB, bandingkan dan

pilih yang paling baik.

Mengacu pada Tabel 2.3 seluruh data dapat ditampilkan dalam 1 grafik seperti

dalam contoh gambar 2.4, dan grafik sebelah kanan tampak lebih jelas dan

lebih tepat untuk ditampilkan.

Jurusan Teknik Sipil – FTSP – ITS 17

Row

Lalu lintas

CBR

Umur

Prksn

 Row

Lalu lintas

CBR

Umur

Prksn

1 8 7 2   26 65 65 352 7 7 5   27 66 66 363 12 12 6   28 68 68 384 18 15 6   29 65 65 355 20 20 10   30 65 65 406 22 27 12   31 70 70 407 27 27 12   32 71 73 408 28 30 15   33 72 73 419 30 30 13   34 73 73 4210 31 35 15   35 77 77 4311 33 33 14   36 74 74 4412 36 36 16   37 75 74 4313 37 37 16   38 75 75 4514 44 47 20   39 76 76 4615 44 45 20   40 77 78 4816 45 45 17   41 82 82 5017 42 42 12   42 88 80 5318 46 46 15   43 84 85 5419 48 47 20   44 91 90 5620 44 44 18   45 92 92 5421 55 49 25   46 99 99 6022 62 62 36   47 99 97 6023 61 65 38   48 89 92 5524 64 64 32   49 84 88 4825 63 64 34   50 77 84 54

Umur (bulan)

CBR (

%)

6050403020100

100

80

60

40

20

0

36

80

Hubungan CBR dengan Umur Perkerasann = 50

Page 13: STATER-2

STATISTIK UNTUK TEKNIK SIPIL

Gambar2.4. – Hubungan CBR, umur perkerasan dan lalu lintas (=angka 1,2,3)

3. Marginal Plot : Sama dengan scatterplot, tetapi ditambah histogram, dotplot,

atau boxplot pada setiap variablenya diletakkan pada sela-sela gambar atau

grafik. Penambahan grafik yang menempel dapat dipilih sesuai keperluan dari

masing-masing kajian statistik. Software MINITAB menyediakan aplikasi ini

sebagai contoh gambar 2.3. dapat dirubah menjadi tampilan gambar 2.5

dengan tambahan histogram.

Gambar 2.5. – Hubungan CBR dengan umur perkerasan dan lalu lintas

4. Histogram Menampilkan bentuk kurva (probabilitas) kejadian. Sumbu x

berupa variabel data yang ingin ditampilkan dan sumbu y berupa jumlah data

asli atau hitungan prosentase frekuensi. Pada SPSS dan Minitab tersedia

hitungan frekuensi dan pembagian kelas data serta tampilan histogram secara

Jurusan Teknik Sipil – FTSP – ITS 18

Umur

CBR

6050403020100

100

80

60

40

20

0

Marginal Plot of CBR vs Umur

CBR

100

50

0

Umur

angka

321

50250

50

25

0

100500

3

2

1

Matrix Plot of CBR; Umur; Kondisi Lalulintas

Angka = kondisi lalu lintas Ringan (1), Sedang (2) , Berat (3) Umur

CBR

604530150

100

80

60

40

20

0

angka

321

Matrix Plot of CBR vs Umur; angka

Page 14: STATER-2

STATISTIK UNTUK TEKNIK SIPIL

otomatis. Histogram ini dapat berupa balok atau berupa garis outline batas

baloknya saja ditambah dengan informasi tambahan lain yang diinginkan.

Hitungan hhistogram ini berguna untuk analisis probabilitas.

Contoh : data dalam tabel 2.3 dapat disajikan dalam beberapa bentuk

histogram disajikan dalam gambar 2.6.

Gambar 2.6. – Histogram dari data CBR dengan kurva probabilitasnya

5. Dotplot : menampilkan gambar yang sederhana (gambar 2.7), tampilan

menarik yang menunjukkan spread (sebaran), extremes (nilai maksimal),

centering(nilai tengah), dan voids atau gap dalam data. Hal ini penting untuk

evaluasi awal kecukupan data dalam mewakili kondisi yang sesungguhnya di

seluruh dunia.

*

***

*****

****

***

** * * *

0 1 2 3 4 5 6 7 8

Gambar 2.7. – Dotplot dari data CBR

Jurusan Teknik Sipil – FTSP – ITS 19

CBR

Frequency

100806040200

12

10

8

6

4

2

0

Mean 57.94StDev 24.95N 50

Histogram of CBRNormal

CBR (%)

Jum

lah d

ata

98847056422814

Dotplot of CBR

Page 15: STATER-2

STATISTIK UNTUK TEKNIK SIPIL

6. Stem-and-Leaf Menampilkan nilai data actual dalam format grafik tabel

terhadap data yang dipilih dan langsung dapat digunakan untuk

memperkirakan nilai statistik yang tidak terlihat dari data aslinya, terutama

median (atau nilai tengah dari data), percentile, dan quartile serta

menunjukkan perkiraan bentuk kurvanya. Pada data yang genap bisa diambil

dari data 1 angka diatas atau dibawah ranking data tengah. Stem berupa digit

pertama atau kedua dan seterusnya sedang leaf adalah digit terakhir dibelakang

koma. Dalam gambar 2.8 median adalah (65 + 65)/2 = 65 berasal dari data ke

25 dan 26. Lef unit =1, Stem unit = 10. Angka juga boleh dibulatkan, dan

memuat angka negatif.

Data outlier : nilai data yang extreme atau berbeda jauh dari data lainnya.

Outlier dapat diplot dengan meletakkan beda baris, atau mengabaikan data

tersebut.

Gambar 2.8. – Stem-and-Leaf Display: CBR

7. Probability Plot Menampilkan kebenaran dan kesesuaian data dalam

mengikuti bentuk distribusi tertentu (dalam software dalam dipilih diantara

sekitar 20 bentuk distribusi) dilengkapi confidence interval = CI (95%). Dari

sini dapat terlihat kesesuaian garis trend atau simplifikasinya dengan meninjau

banyaknya data yang ada dalam batas CI tersebut. Lihat skala pada sumbu Y

tidak selalu linier, dan nilainya merupakan cumulatif dari frekuensi kejadian

dalam persen, lihat gambar 2.9.

Jurusan Teknik Sipil – FTSP – ITS 20

JumlahData

2 0 7 72 1 2 53 2 0 7 76 3 0 0 3 5 6 78 4 2 4 5 5 6 7 7 99 6 2 4 4 5 5 5 5 6 8

10 7 0 3 3 3 4 4 5 6 7 85 8 0 2 4 5 85 9 0 2 2 7 9

50

Stem Leaf

Page 16: STATER-2

STATISTIK UNTUK TEKNIK SIPIL

Gambar 2.9. – Probability Plot dari data CBR

8. Empirical CDF – Sama dengan probability plot dengan skala Y selalu linear.

Pemilihan bentuk distribusi dapat dilakukan dengan coba-coba sedemikian

hingga sebagian besar indikatornya memenuhi syarat. Contoh gambar 2.10

menunjukkan bahwa penggunaan distribusi normal menghasilkan kesesuaian

lebih besar baik dari exponential.

Gambar 2.10. – Probability Plot dari data CBR

9. Boxplot – Membandingkan karakter sample distribusi misalnya median,

range, dan symetry, serta identifikasi lainnya. Jadi Boxplot diperlukan untuk

lebih dari satu set data, pada contoh gambar 2.11 merupakan gambaran dari

data sebelumnya ditambah satu set data lagi.

Jurusan Teknik Sipil – FTSP – ITS 21

CBR

Perc

ent

1251007550250

99

95

90

80

70

605040

30

20

10

5

1

Mean

0.037

57.94StDev 24.95N 50AD 0.795P-Value

Probability Plot of CBRNormal - 95% CI

CBR (%)

Pers

enta

se K

um

ula

tif (%

)

120100806040200

100

80

60

40

20

0

Mean 57.94StDev 24.95N 50

Empirical CDF of CBRNormal

CBR (%)

Pers

enta

se K

um

ula

tif (%

)

9585756555453525155

100

80

60

40

20

0

Mean 57.94N 50

Empirical CDF of CBRExponential

Page 17: STATER-2

STATISTIK UNTUK TEKNIK SIPIL

Gambar 2.11. – Box Plot dari data CBR 2 lokasi di Jawa

10. Interval Plot – Membandingkan nilai mean dan confidence intervalnya,

sebagai simplifikasi dari boxplot dengan meninjau data yang paling sering

muncul saja. Meskipun demikian tampilan harus berasal minimal dari 2

kelompok data, tampilan ini sangat sesuai untuk jumlah kelompok data yang

sangat besar misal pada evaluasi hasil produksi pada pabrikasi barang dengan

membandingkan data dari hari ke hari atau minggu ke minggu dan sebagainya,

lihat gambar 2.12.

Gambar 2.12. – Interval Plot dari data CBR 2 lokasi di Jawa

Jurusan Teknik Sipil – FTSP – ITS 22

100

80

60

40

20

0

CBR CBRJATIM

65 64.5

Boxplot of CBR SURABAYA (CBR); CBR JAWA TIMUR (CBRJATIM)

Data

CBRCBRJATIM

66

64

62

60

58

56

54

52

50

57.6257.94

Interval Plot of CBRJATIM; CBR95% CI for the Mean

Page 18: STATER-2

STATISTIK UNTUK TEKNIK SIPIL

11. Individual Value Plot – Mempelajari dan membandingkan nilai tiap data.

Dengan menggunakan tampilan ini dapat dipelajari akurasi hasil pengamatan,

dan pola data secara umum, lihat gambar 2.13.

Gambar 2.13. – Box Plot dari data CBR 2 lokasi di Jawa

12. Bar Chart – Membandingkan ringkasan statistic, misalnya mean dari semua

kelompok data. Tampilan ini cocok untuk data dengan kelas data atau

kelompok data banyak, terutama data sosial, contoh gambar 2.14.

Gambar 2.14. – Contoh Bar chart dari data kependudukan

13. Pie Chart – Menunjukkan kombinasi relative dari setiap grup terhadap

keseluruhan data. Jadi dapat digunakan untuk menunjukkan unit terbanyak

pada satu populasi data. Bentuk pie chart ini ada beberapa macam sesuai

keindahan tampilan yang diinginkan, lihat gambar 2.15.

Jurusan Teknik Sipil – FTSP – ITS 23

Data

CBRCBRJATIM

100

80

60

40

20

0

57.6257.62 57.9457.94

64.564.5 6565

Individual Value Plot of CBRJATIM; CBR

Kelompok

Pere

mpuan

> 75

th70

-74

65-6

960

-64

55-5

950

-54

45-4

940

-44

35-3

930

-34

25-2

920

-24

15-1

910

-14

5-9

0-4

2000

1500

1000

500

0

Chart of Perempuan vs Kelompok UmurKecamatan Benowo, Surabaya, 2003

Page 19: STATER-2

STATISTIK UNTUK TEKNIK SIPIL

Gambar 2.15. – Contoh 2 jenis tampilan Pie chart dari data yang sama

14. Time Series Plot – untuk data yang dikumpulkan dengan interval waktu yang

sama dan dalam urutan kronologis atau sejarah kejadian, contoh gambar 2.16

menunjukkan produksi tangkapan ikan laut yang didaratkan di Surabaya.

Beberapa variable dengan nilai salah satu sumbu sama dapat ditampilkan

dalam 1 grafik.

Gambar 2.16. – Contoh Produksi tangkapan ikan di Surabaya

15. Area Graph – menunjukkan komposisi dari jumlahan hitungan yang berubah

sesuai waktu dengan data yang disusun berurut. Grafik ini sesuai untuk

tampilan data histori lebih dari satu, atau untuk membandingkan antara agregat

data dengan data total. Lihat gambar 2.17 menunjukkan aplikasi penggunaan

software tertentu menghasilkan tampilan berbeda.

Jurusan Teknik Sipil – FTSP – ITS 24

Category

20-2425-2930-3435-3940-4445-4950-5455-5960-6465-69

0-4

70-74> 75 th

5-910-1415-19

Pie Chart of Lakilaki vs Kelompok

Lakilaki 0-4

5-9

10-14

15-19

20-24

25-29

30-34

35-39

40-44

45-49

50-54

55-59

60-64

65-69

Year

Pro

duks

i Ika

n Sura

baya [

ton]

20052004200320022001

9400

9200

9000

8800

8600

8400

8200

8000

7800

Time Series Plot of Produksi Ikan

Page 20: STATER-2

STATISTIK UNTUK TEKNIK SIPIL

Gambar 2.17. – Perbandingan tampilan area graph pada data Produksi tangkapan ikan

di Surabaya

16. Contour Plot – Memetakan nilai pengukuran sebagai fungsi dari dua

variables lain yang dapat ditampilkan dalam beberapa bentuk tampilan grafis.

Variabel yang dapat ditampilkan minimal 3 jenis, tidak harus berupa data

historis, contoh gambar 2.18.

Gambar 2.18. – Perbandingan tampilan contour plot pada data Produksi tangkapan

ikan di Surabaya

17. 3D Scatterplot – Memplotkan hasil tiap hasi observasi individual dalam 3

dimensi yang didefinisikan oleh variabel yang tertuang dalam sumbu x-, y-,

dan z. Pemakaian grafik ini kurangcocok untuk data serie menjadikan kurang

jelas (contoh gambar 2.19 kiri), sedang pada contoh data CBR (non data serie)

tampak lebih cocok dan mudah ditinjau (contoh gambar 2.19 kanan).

Jurusan Teknik Sipil – FTSP – ITS 25

Year

Data

20052004200320022001

12000

10000

8000

6000

4000

2000

0

VariableProduksi IkanKerang

Area Graph of Produksi Ikan; Kerang

20012002

20032004

2005

Ikan

Kerang0

500

1000

1500

2000

Ikan

Kerang

Tahun

Kera

ng

20052004200320022001

1500

1450

1400

1350

1300

1250

Produksi Ikan

8200 - 84008400 - 86008600 - 88008800 - 90009000 - 9200

<

> 9200

80008000 - 8200

Contour Plot of Produksi Ikan vs Kerang; Tahun

2001

2003

2005

0

500

1000

1500

2000

2500

3000

3500

Kerang

Ikan

Page 21: STATER-2

STATISTIK UNTUK TEKNIK SIPIL

Gambar 2.19. – 3 D Scatterplot pada data seri (kiri) dan non seri.

18. 3D Surface Plot – Seperti untuk 3D scatterplot tetapi menampilkan

permukaan yang menerus atau grid disamping titik pada tiap individu data,

dan tampilan ini juga lebih sesuai untuk non data serie, lihat gambar 2.20.

Gambar 2.20. – 3 D Surface plot pada contoh data CBR

2.4. Pemilihan Bentuk tampilan data yang terbaik

Mengacu pada banyaknya grafik yang bisa dipilih maka pemakaian perlu

menyesuaikan pada kegunaan data, dan tabel 2.4 sampai dengan 2.6. dibawah.

Jurusan Teknik Sipil – FTSP – ITS 26

15001400

Produksi Ikan

8000

8400

8800

9200

Kerang13002001.02002.5 12002004.0 2005.5Tahun

3D Scatterplot of Produksi Ikan vs Kerang vs Tahun

60400

CBR 50

Umur

100

2012 03angka

3D Scatterplot of CBR vs Umur vs angka

60400

CBR 50

Umur

100

2012 03angka

Surface Plot of CBR vs Umur; angka

Page 22: STATER-2

STATISTIK UNTUK TEKNIK SIPIL

Tabel 2.4. - Jenis grafik disesuaikan kegunaan tampilan

Kegunaan tampilan Pilihan

Mencari hubungan antara sepasang variable

   Scatterplot – Menunjukkan hubungan antara dua variabel.

   Matrix Plot – Menunjukkan hubungan antara beberapa pasang variable sekaligus.

   Marginal Plot – Sama dengan scatterplot, tetapi ditambah histogram, dotplot, atau boxplot pada setiap variablenya diletakkan pada sela-sela gambar atau grafik.

Mencari bentuk distribusi    Histogram – Menampilkan bentuk dan nilai tengah dari data.

   Dotplot – Sama dengan histogram, tetapi lebih bermanfaat untuk data yang jumlahnya kecil.

   Stem-and-Leaf – Menampilkan nilai data actual dalam format tabung.

   Probability Plot – Menampilkan kebenaran dan kesesuaian data dalam mengikuti bentuk distribusi tertentu.

   Empirical CDF – Sama dengan probability plot, tetapi skalanya selalu linear.

   Boxplot – Membandingkan karakter sample distribusi misalnya median, range, dan symetry, serta identifikasi lainnya.

Jurusan Teknik Sipil – FTSP – ITS 27

Page 23: STATER-2

STATISTIK UNTUK TEKNIK SIPIL

Tabel 2.5. - Lanjutan Jenis grafik disesuaikan kegunaan tampilan

Kegunaan tampilan Pilihan

Membandingkan ringkasan atau masing-masing variable nilai individual

   Boxplot – Membandingkan sample dari karakteristik dan cirri terpilih lainnya pada distribusi.

   Interval Plot – Membandingkan rata-rata dan confidence intervalnya.

   Individual Value Plot – Mempelajari dan membandingkan nilai tiap data.

   Bar Chart – Membandingkan ringkasan statistic, misalnya mean dari semua kelompok data.

   Pie Chart – Menunjukkan kombinasi relative dari setiap grup terhadap keseluruhan data.

Menunjukkan distribusi hasil olahan data.

   Bar Chart – Membandingkan distribusi hasil dari pendataan.

   Pie Chart – Membandingkan proporsi dari tiap kelompok data terhadap keseluruhan.

Menggambarkan suatu uratan data terhadap waktu

   Time Series Plot – untuk data yang dikumpulkan dengan interval waktu yang sama dan dalam urutan kronologis atau sejarah kejadian.

   Area Graph – menunjukkan komposisi dari jumlahan hitungan yang berubah sesuai waktu dengan data yang disusun berurut.

   Scatterplot – untuk data yang dikumpulkan dengan interval tidak teratur atau irregular atau tidak dalam urutan kronologis tertentu saat memasukkan dalam worksheet.

Jurusan Teknik Sipil – FTSP – ITS 28

Page 24: STATER-2

STATISTIK UNTUK TEKNIK SIPIL

Tabel 2.6. - lanjutan Jenis grafik disesuaikan kegunaan tampilan

Kegunaan tampilan Pilihan

Menunjukkan hubungan antara tiga variabel

   Contour Plot – Memetakan nilai pengukuran sebagai fungsi dari dua variables lain.

   3D Scatterplot – Memplotkan hasil tiap hasi observasi individual dalam 3 dimensi yang didefinisikan oleh variabel yang tertuang dalam sumbu x-, y-, dan z.

   3D Surface Plot – Seperti untuk 3D scatterplot tetapi menampilkan permukaan yang menerus atau grid disamping titik pada tiap individu data.

Jurusan Teknik Sipil – FTSP – ITS 29