metode statistika i(penataan data)
DESCRIPTION
Penataan dataTRANSCRIPT
METODE STATISTIKA I
“ PENATAAN DATA”
Kelompok 1 :
1. Deasi Rahmawati 115090500111041
2. Erfa Karunia Maulana 115090507111014
3. Fiqih Ramadhani 0910950039
4. Maria
5. Fajar
PROGRAM STUDI STATISTIKA
JURUSAN MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS BRAWIJAYA
2013
BAB I
PENDAHULUAN
1.1 PENATAAN DATA
A. TABEL FREKUENSI
Hasil pengukuran yang kita peroleh disebut dengan data mentah. Besarnya
hasil pengukuran yang kita peroleh biasanya bervariasi. Apabila kita perhatikan data
mentah tersebut, sangatlah sulit bagi kita untuk menarik kesimpulan yang berarti.
Untuk memperoleh gambaran yang baik mengenai data tersebut, data mentah tersebut
perlu di olah terlebih dahulu.
Pada saat dihadapkan pada sekumpulan data yang banyak, seringkali untuk
membantu mengatur dan merangkum data tersebut dengan membuat tabel yang berisi
daftar nilai data yang mungkin berbeda (baik secara individu atau berdasarkan
pengelompokkan) bersama dengan frekuensi yang sesuai, yang mewakili berapa kali
nilai-nilai tersebut terjadi. Daftar sebaran nilai data tersebut dinamakan dengan Daftar
Frekuensi atau Sebaran Frekuensi (Distribusi Frekuensi).
Distribusi frekuensi dibuat dengan alasan berikut:
a. kumpulan data yang besar dapat diringkas
b. untuk memperoleh beberapa gambaran mengenai karakteristik data, dan
c. merupakan dasar dalam pembuatan grafik penting (seperti histogram).
Distribusi frekuensi dibagi menjadi tiga yaitu :
1. Distribusi frekuensi standar
Distribusi frekuensi standar adalah daftar nilai data (bisa nilai individual atau
nilai data yang sudah dikelompokkan ke dalam selang interval tertentu) yang
disertai dengan nilai frekuensi yang sesuai yaitu frekuensi absolut.
Pengelompokkan data ke dalam beberapa kelas dimaksudkan agar ciri-ciri penting
data tersebut dapat segera terlihat. Daftar frekuensi ini akan memberikan
gambaran yang khas tentang bagaimana keragaman data. Sifat keragaman data
sangat penting untuk diketahui, karena dalam pengujian-pengujian statistik
selanjutnya kita harus selalu memperhatikan sifat dari keragaman data. Tanpa
memperhatikan sifat keragaman data, penarikan suatu kesimpulan pada umumnya
tidaklah sah.
(Anonymous.http://smartstat.wordpress.com/2010/03/29/distribusi-frekuensi/.
Diakses tanggal 2 Juli 2013).
2. Distribusi Frekuensi Relatif
Biasanya frekuensi dinyatakan dengan banyak data yang terdapat dalam tiap
kelas, frekuensi ini disebut frekuensi absolut atau frekuensi biasa. Jika frekuensi
absolut dinyatakan dalam bentuk persen, maka akan diperoleh distribusi frekuensi
relatif.
3. Distribusi Frekuensi Kumulatif
Distribusi frekuensi kumulatifive dibentuk dengan cara menjumlahkan
frekuensi demi frekuensi kelas sebelumnya.
B. Langkah-langkah untuk membuat tabel distribusi frekuensi dengan panjang
kelas yang sama :
a. Tentukan rentang(range) ialah data terbesar dikurangi data terkecil.
b. Tentukan banyak kelas interval yang diperlukan. Biasanya untuk
menentukan kelas interval digunakan aturan Sturges.
c. Tentukan panjang kelas interval (p).
d. Tentukan nilai ujung bawah kelas interval pertama. Ujung bawah kelas
diambil dari sama dengan data terkecil atau nilai data yang lebih kecil dari
data terkecil tetapi selisihnya harus kurang dari panjang kelas yang telah
ditentukan.
( Sudjana, 1996)
C. SEBARAN FREKUENSI DALAM BENTUK GAMBAR
Terdapat beberapa teknik untuk meringkas dan mempelajari karakteristik dan
distribusi data di mana data dapat digambarkan secara grafis. Diantaranya adalah
histogram, dotplot, stem-and-leaf plot, density trace, box plot, dan probability plot.
Untuk menyajikan data yang telah disusun dalam daftar ditribusi frekuensi
menjadi diagram, seperti biasa dipakai sumbu mendatar untuk menyatakan kelas
interval, dan sumbu tegak untuk menyatakan frekuensi baik absolut maupun
relative. Yang dituliskan pada sumbu datar adalah batas-batas kelas interval.
a. Histogram
Histogram adalah merupakan bagian dari grafik batang di mana skala
horisontal mewakili nilai-nilai data kelas dan skala vertikal mewakili nilai
frekuensinya. Tinggi batang sesuai dengan nilai frekuensinya, dan batang
satu dengan lainnya saling berdempetan, tidak ada jarak/ gap diantara
batang. Kita dapat membuat histogram setelah tabel distribusi frekuensi
data pengamatan dibuat.
b. Poligon Frekuensi
Poligon Frekuensi menggunakan segmen garis yang terhubung ke titik
yang terletak tepat di atas nilai-nilai titik tengah kelas. Ketinggian dari
titik-titik sesuai dengan frekuensi kelas, dan segmen garis diperluas ke
kanan dan kiri sehingga grafik dimulai dan berakhir pada sumbu
horisontal.
( Anonymous. http://smartstat.wordpress.com/2010/03/29/ distribusi-
frekuensi/. Diakses tanggal 2 Juli 2013).
c. Boxplot
Penyajian grafis lainnya yang bisa merangkum informasi lebih detail
mengenai distribusi nilai-nilai data pengamatan adalah Box and Whisker
Plots atau lebih sering disebut dengan BoxPlot atau Box-Plot (kotak-plot)
saja. Seperti namanya, Box and Whisker, bentuknya terdiri dari Box
(kotak) dan whisker. Pada gambar di bawah, Box adalah kotak berwarna
hijau dan whisker garis berwarna biru.
Boxplot merupakan ringkasan distribusi sampel yang disajikan secara
grafis yang bisa menggambarkan bentuk distribusi data (skewness), ukuran
tendensi sentral dan ukuran penyebaran (keragaman) data pengamatan.
Terdapat 5 ukuran statistik yang bisa kita baca dari boxplot, yaitu:
nilai minimum: nilai observasi terkecil
Q1: kuartil terendah atau kuartil pertama
Q2: median atau nilai pertengahan
Q3: kuartil tertinggi atau kuartil ketiga
nilai maksimum: nilai observasi terbesar.
Selain itu, boxplot juga dapat menunjukkan ada tidaknya nilai outlier
dan nilai ekstrim dari data pengamatan.
d. Steamplot ( Stem-and-LesfPlot)
Penyajian lain yang mirip dengan histogram adalah Stemplot. Stemplot
juga dikenal sebagai stem-and-leaf plot atau apabila diterjemahkan ke
dalam bahasa indonesia berarti plot batang dan daun. Di dalam statistik,
stemplot merupakan alat untuk menyajikan data kuantitatif dalam format
grafis, mirip dengan histogram, yaitu untuk membantu dalam
memvisualisasikan bentuk distribusi data yang sering digunakan dalam
analisis eksplorasi. Stemplot diperkenalkan oleh Arthur Bowley di awal
tahun 1900-an. Namun penggunaannya secara umum baru dimulai pada
tahun 1980 setelah John Tukey’s mempublikasikan Exploratory Data
Analysis pada tahun 1977.
Stem-and-leaf plot memberikan informasi lebih banyak tentang nilai
yang sebenarnya dibanding histogram. Seperti dalam histogram, panjang
setiap batang sesuai dengan jumlah kejadian yang jatuh ke dalam interval
tertentu. Pada Histogram. kita hanya bisa melihat nilai frekuensi dari data
namun kita tidak tahu berapa nilai angka sebenarnya. Berbeda dengan
histogram, pada SLP selain kita bisa mengetahui nilai frekuensinya, kita
pun bisa tau berapa nilai data sebenarnya. Hal ini dilakukan dengan
membagi nilai-nilai yang diamati menjadi dua komponen, stem dan leaf.
Stem-and-leaf plot menggambarkan/menyajikan data dengan cara
memisahkan setiap nilai menjadi dua bagian: bagian batang (stem) yaitu
digit angka paling kiri dan diikuti dengan angka berikutnya, yaitu daun
(leaf), digit angka paling kanan.
Tujuan utama Stem-and-leaf plot adalah untuk hal berikut ini:
Apakah pola pengamatan simetris.
Penyebaran atau variasi dari data pengamatan.
Apakah terdapat pencilan (outlier, nilai-nilai yang berada jauh dari
yang lainnya).
Titik pemusatan data.
Ada Lokasi yang merupakan gap (kesenjangan dalam data)
Stem-and-leaf of Nilai Ujian N = 80Leaf Unit = 1.0 2 3 58 5 4 389 8 5 169 19 6 00133356778(24) 7 000011122233444455667899 37 8 0000111223334566788889 15 9 000111223335789 ^ ^ ^ f stem | leaf
( Anonymous. http://smartstat.wordpress.com/2010/03/29/ distribusi-
frekuensi/. Diakses tanggal 2 Juli 2013).
1.2 NILAI TENGAH ( MEDIAN )
Median adalah nilai pengamatan yang terletak di tengah-tengah bila data yang
dipunya terurut dari terkecil ke terbesar atau sebaliknya(Suntoyo
Yitnosumarto,1994). Jika nilai median sama dengan Me, maka 50% dari data
harga-harganya paling tinggi sama dengan Me sedangkan 50% lagi harga-
harganya paling rendah sama dengan Me.
Jika banyak data ganjil, maka median terdapat pada data yang paling tengah
setelah diurutkan. Dan untuk data genap, median terdapat pada rata-rata hitung dua
data yang terletak di tengah setelah data diurutkan. ( Sudjana, 1996)
Sifat nilai median:
Median mudah dihitung dan mudah dimengerti
Dipengaruhi jumlah observasi
Tidak dipengaruhi oleh nilai observasi
Sering dipakai pada distribusi frekuensi yang miring
Digunakan pada data yang bersifat kuantitatif maupun kualitatif berskala
ratio, interval maupun ordinal
Untuk menentukan nilai median harus terlebih dahulu diurutkan dan
ditentukan posisi dengan cara:
Bila seri pengamatan genap, maka posisi median n/2
Bila seri pengamatan ganjil, maka posisi median n+1 / 2
1.3 KERAGAMAN ( VARIANSI )
Varians adalah salah satu ukuran dispersi atau ukuran variasi. Varians dapat
menggambarkan bagaimana berpencarnya suatu data kuantitatif. Ukuran
penyebaran yang terpenting dan sangat memegang peranan di dalam setiap
pengujian statistik parametric adalah ragam atau variance yang diberi lambang
untuk populasi berukuran besar dan contoh. Ragam ini juga berdasarkan atas
simpangan terhadap nilai tengah, sebagaimana penggunaan dasar harga mutlak
simpangan tetapi untuk ragam dasarnya kuadrat
simpangan atau . Nilai tengah kuadrat simpangan inilah yang
kita sebut dengan ragam yang disimbolkan atau .
Dalam hubungannya dalam ragam ini, dapat diturunkan menjadi 2 ukuran
penyebaran lain yang disebut simpangan baku (standard deviation) dengan symbol
s yang merupakan akar pangkat dua dari dan koefisien keragaman (coefficient
of variation) yang merupakan ukuran penyebaran relative.
Untuk data berkelompok, perhitungan ragam mempergunakan atau
memasukkan factor penimbang yaitu frekuensi tiap-tiap kelas.
( Hatta. http://hatta2stat.wordpress.com/2011/05/19/varians/. Diakses tanggal 2 Juli 2013)
BAB II
ISI
2.1 TABEL FREKUENSI
a. Distribusi Frekuensi Standar
Interval
Data(Kelas
Data)
Frekuensi(
fi)
Nilai
Tengah(mid-
point)
a-c
d-f
g-i
…dst… … …
Jumlah S = n S
b. Distribusi Frekuensi Relatif
Interval
Data(Kelas
Data)
Frekuensi(
fi)
Nilai
Tengah(mid-
point)
Frekuensi
Relatif
a-c
d-f
g-i
…dst… … … …
Jumlah S = n S
c. Distribusi Frekuensi Kumulatif
Interval
Data(Kelas
Frekuensi(
fi)
Nilai
Tengah(mid-
Frekuensi
Relatif
Frekuensi
Kumulatif
Data) point)
a-c
d-f
g-i
…dst… … … … …
Jumlah S = n S
d. Range
R =
e. Aturan Sturges
f. Panjang Kelas (p)
P =
2.2 MEDIAN
a. Data tunggal
Ganjil (n)
Genap (n)
b. Data kelompok
2.3 VARIANCE
a. Data tunggal
b. Data kelompok
BAB III
SOAL DAN PENYELESAIAN
1. Berikut adalah nilai ujian yang sudah diurutkan:
35 38 43 48 49 51 56 59 60 60
61 63 63 63 65 66 67 67 68 70
70 70 70 71 71 71 72 72 72 73
73 74 74 74 74 75 75 76 76 77
78 79 79 80 80 80 80 81 81 81
82 82 83 83 83 84 85 86 86 87
88 88 88 88 89 90 90 90 91 91
91 92 92 93 93 93 95 97 98 99
Buatlah Distribusi Frekuensi Standar
Buatlah Distribusi Frekuensi Relatif
Buatlah Distribusi Frekuensi Kumulatif
Grafik Histogram dan poligon
Jawab :
Range = 99 – 35 = 64
Banyak Kelas = 1 + 3.3 x log(n)
= 1 + 3.3 x log(80)
= 7.28 ≈ 7
Panjang Kelas = [range]/[banyak kelas]
= 64/7
= 9.14 ≈ 10
a. Distribusi Frekuensi Standar
b. Distribusi Frekuensi Relatif
c. Distribusi Frekuensi Kumulatif
d. Histogram
e. Polygon
2.
Selang Kelas Batas Kelas Titik Tengah Kelas Frekuensi ƒ
7 – 9
10 – 12
13 – 15
16 – 18
19 – 21
6.5 – 9.5
9.5 – 12.5
12.5 – 15.5
15.5 – 18.5
18.5 – 21.5
8
11
14
17
20
2
8
14
19
7
Gunakan sebaran frekuensi tabel di atas untuk menentukan Q3 bagi sebaran bobot 50
koper!
Jawab :
Kita memerlukan sebuah nilai yang di bawahnya terdapat (75/100) X 50 = 3.75
pengamatan. Ada 24 pengamatan yang terdapat di bawah 15.5 kilogram. Kita masih
memerlukan 13.5 diantara 19 pengamatan berikutnya, oleh karena itu kita masih harus
melangkah sejauh (13.5/19) X 3 = 2.1 setelah 15.5. Jadi
Q3 = 15.5 + 2.1
= 17.6 kilogram
Jadi kita menyimpulkan bahwa 75% dari 50 koper itu bobotnya kurang dari 17.6
kilogram.
3. Banyaknya pegawai di lima apotik adalah 3, 5, 6, 4 dan 6. Dengan memandang data itu
sebagai populasi, hitung nilaitengah banyaknya pegawai bagi lima apotik itu!
Jawab :
µ =
4. Kadar nikotin yang berasal dari sebuah contoh acak enam batang rokok cap tertentu
adalah 2.3, 2.7, 2.5, 2.9, 3.1 dan 1.9 miligram. Tentukan mediannya!
Jawab:
Bila data di atas kita urutkan dari kecil ke besar menjadi 1.9, 2.3, 2.5, 2.7, 2.9, 3.1.
Maka mediannya adalah rata-rata dari 2.5 dan 2.7.
Xbar =
5. Nilai-nilai berikut diberikan oleh enam juri dalam suatu pertandingan senam: 7, 5, 9, 7, 8
dan 6. Hitung simpangan baku bagi populasi ini!
Jawab :
µ =
σ2 =
=
=
=
σ = 1.29
6. Carilah ragam bagi data 3, 4, 5, 6, 6 dan 7, yang merupakan banyaknya ikan trout yang
tertangkap oleh enam nelayan yang diambil secara acak pada tanggal 19 Juni 1981 di
Danau Muskoka.
Jawab :
xi
3
4
5
6
6
7
9
16
25
36
36
49
31 171 n = 6
S2 =
=
BAB IV
SOAL
1. Tentukan batas kelas, titik tengah kelas dan lebar kelas untuk selang-selang berikut ini :
a. 7-13
b. (-5)-(-1)
c. 10.4 – 18.7
d. 0.346 – 0.418
e. (-2.75) – 1.35
f. 78.49 – 86.72
2.
Selang Kelas Batas Kelas Titik Tengah Kelas Frekuensi ƒ
1.5 – 1.9
2.0 – 2.4
2.5 – 2.9
3.0 – 3.4
3.5 – 3.9
4.0 – 4.4
4.5 – 4.9
1.45 – 1.95
1.95 – 2.45
2.45 – 2.95
2.95 – 3.45
3.45 – 3.95
3.95 – 4.45
4.45 – 4.95
1.7
2.2
2.7
3.2
3.7
4.2
4.7
2
1
4
15
10
5
3
Dari tabel di atas buatlah :
a. Histogram frekuensi
b. Poligon frekuensi
c. Ogif frekuensi
3. Banyaknya jawaban yang salah pada suatu kuis dengan soal benar-salah dari lima belas
siswa yang dipilih secara acak adalah : 2, 1, 3, 0, 3, 6, 0, 3, 3, 5, 2, 1, 4 dan 2. Tentukan :
a. Median
b. Nilai tengah
4. IQ rata-rata sepuluh mahasiswa yang mengambil kuliah matematika adalah 114. Bila
Sembilan mahasiswa diantaranya memiliki IQ 101, 125, 118, 128, 106, 115, 99, 118 dan
109. Berapa IQ mahasiswa yang satu lagi?
5. Banyaknya gol yang dibuat oleh suatu tim lacrosse selama musim kompetisi yang lalu
adalah 4, 9, 0, 1, 3, 24, 12, 3, 30, 12, 7, 13, 18, 4, 5 dan 15. Dengan menganggap data itu
sebagai populasi, hitunglah simpangan bakunya!
6. Nilai mutu rata-rata 20 mahasiswa tingkat akhir yang diambil secara acak adalah sebagai
berikut :
3.2 1.9 2.7 2.4
2.8 2.9 3.8 3.0
2.5 3.3 1.8 2.5
3.7 2.8 2.0 3.2
2.3 2.1 2.5 1.9
Hitunglah simpangan bakunya!
DAFTAR PUSTAKA
Anonymous. Distribusi Frekuensi. http://smartstat.wordpress.com/2010/03/29/ distribusi-
frekuensi/. Diakses tanggal 2 Juli 2013
Sudjana, 1996.Metode Statistika,edisi keenam.PT. TARSITO : BANDUNG
Yitnosumarto, Suntoyo. 1994.Dasar-dasar Statistika. PT. Raja Grafindo Persada:Jakarta
Wulan, Uchi.2013. Penataan Data. http://uchiwulans.blogspot.com/p/penataan-data.html .
Diakses tanggal 2 Juli 2013
Winkonadi.2013.Statistika Deskriptif. http://winkonadi.wordpress.com/statistik-deskriptif/ .
Diakses tanggal 2 Juli 2013
Hatta. 2013. Varians.http://hatta2stat.wordpress.com/2011/05/19/varians/. Diakses tanggal 2 Juli 2013