metode statistika i(penataan data)

METODE STATISTIKA I

“ PENATAAN DATA”

Kelompok 1 :

1. Deasi Rahmawati 115090500111041

2. Erfa Karunia Maulana 115090507111014

3. Fiqih Ramadhani 0910950039

4. Maria

5. Fajar

PROGRAM STUDI STATISTIKA

JURUSAN MATEMATIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

UNIVERSITAS BRAWIJAYA

2013

BAB I

PENDAHULUAN

1.1 PENATAAN DATA

A. TABEL FREKUENSI

Hasil pengukuran yang kita peroleh disebut dengan data mentah. Besarnya

hasil pengukuran yang kita peroleh biasanya bervariasi. Apabila kita perhatikan data

mentah tersebut, sangatlah sulit bagi kita untuk menarik kesimpulan yang berarti.

Untuk memperoleh gambaran yang baik mengenai data tersebut, data mentah tersebut

perlu di olah terlebih dahulu.

Pada saat dihadapkan pada sekumpulan data yang banyak, seringkali untuk

membantu mengatur dan merangkum data tersebut dengan membuat tabel yang berisi

daftar nilai data yang mungkin berbeda (baik secara individu atau berdasarkan

pengelompokkan) bersama dengan frekuensi yang sesuai, yang mewakili berapa kali

nilai-nilai tersebut terjadi. Daftar sebaran nilai data tersebut dinamakan dengan Daftar

Frekuensi atau Sebaran Frekuensi (Distribusi Frekuensi).

Distribusi frekuensi dibuat dengan alasan berikut:

a. kumpulan data yang besar dapat diringkas

b. untuk memperoleh beberapa gambaran mengenai karakteristik data, dan

c. merupakan dasar dalam pembuatan grafik penting (seperti histogram).

Distribusi frekuensi dibagi menjadi tiga yaitu :

1. Distribusi frekuensi standar

Distribusi frekuensi standar adalah daftar nilai data (bisa nilai individual atau

nilai data yang sudah dikelompokkan ke dalam selang interval tertentu) yang

disertai dengan nilai frekuensi yang sesuai yaitu frekuensi absolut.

Pengelompokkan data ke dalam beberapa kelas dimaksudkan agar ciri-ciri penting

data tersebut dapat segera terlihat. Daftar frekuensi ini akan memberikan

gambaran yang khas tentang bagaimana keragaman data. Sifat keragaman data

sangat penting untuk diketahui, karena dalam pengujian-pengujian statistik

selanjutnya kita harus selalu memperhatikan sifat dari keragaman data. Tanpa

memperhatikan sifat keragaman data, penarikan suatu kesimpulan pada umumnya

tidaklah sah.

(Anonymous.http://smartstat.wordpress.com/2010/03/29/distribusi-frekuensi/.

Diakses tanggal 2 Juli 2013).

http://smartstat.wordpress.com/2010/03/29/distribusi-frekuensi/

2. Distribusi Frekuensi Relatif

Biasanya frekuensi dinyatakan dengan banyak data yang terdapat dalam tiap

kelas, frekuensi ini disebut frekuensi absolut atau frekuensi biasa. Jika frekuensi

absolut dinyatakan dalam bentuk persen, maka akan diperoleh distribusi frekuensi

relatif.

3. Distribusi Frekuensi Kumulatif

Distribusi frekuensi kumulatifive dibentuk dengan cara menjumlahkan

frekuensi demi frekuensi kelas sebelumnya.

B. Langkah-langkah untuk membuat tabel distribusi frekuensi dengan panjang

kelas yang sama :

a. Tentukan rentang(range) ialah data terbesar dikurangi data terkecil.

b. Tentukan banyak kelas interval yang diperlukan. Biasanya untuk

menentukan kelas interval digunakan aturan Sturges.

c. Tentukan panjang kelas interval (p).

d. Tentukan nilai ujung bawah kelas interval pertama. Ujung bawah kelas

diambil dari sama dengan data terkecil atau nilai data yang lebih kecil dari

data terkecil tetapi selisihnya harus kurang dari panjang kelas yang telah

ditentukan.

( Sudjana, 1996)

C. SEBARAN FREKUENSI DALAM BENTUK GAMBAR

Terdapat beberapa teknik untuk meringkas dan mempelajari karakteristik dan

distribusi data di mana data dapat digambarkan secara grafis. Diantaranya adalah

histogram, dotplot, stem-and-leaf plot, density trace, box plot, dan probability plot.

Untuk menyajikan data yang telah disusun dalam daftar ditribusi frekuensi

menjadi diagram, seperti biasa dipakai sumbu mendatar untuk menyatakan kelas

interval, dan sumbu tegak untuk menyatakan frekuensi baik absolut maupun

relative. Yang dituliskan pada sumbu datar adalah batas-batas kelas interval.

a. Histogram

Histogram adalah merupakan bagian dari grafik batang di mana skala

horisontal mewakili nilai-nilai data kelas dan skala vertikal mewakili nilai

frekuensinya. Tinggi batang sesuai dengan nilai frekuensinya, dan batang

satu dengan lainnya saling berdempetan, tidak ada jarak/ gap diantara

batang. Kita dapat membuat histogram setelah tabel distribusi frekuensi

data pengamatan dibuat.

b. Poligon Frekuensi

Poligon Frekuensi menggunakan segmen garis yang terhubung ke titik

yang terletak tepat di atas nilai-nilai titik tengah kelas. Ketinggian dari

titik-titik sesuai dengan frekuensi kelas, dan segmen garis diperluas ke

kanan dan kiri sehingga grafik dimulai dan berakhir pada sumbu

horisontal.

( Anonymous. http://smartstat.wordpress.com/2010/03/29/ distribusi-

frekuensi/. Diakses tanggal 2 Juli 2013).

c. Boxplot

Penyajian grafis lainnya yang bisa merangkum informasi lebih detail

mengenai distribusi nilai-nilai data pengamatan adalah Box and Whisker

Plots atau lebih sering disebut dengan BoxPlot atau Box-Plot (kotak-plot)

saja. Seperti namanya, Box and Whisker, bentuknya terdiri dari Box

(kotak) dan whisker. Pada gambar di bawah, Box adalah kotak berwarna

hijau dan whisker garis berwarna biru.

http://smartstat.wordpress.com/2010/03/29/%20distribusi-frekuensi/


Boxplot merupakan ringkasan distribusi sampel yang disajikan secara

grafis yang bisa menggambarkan bentuk distribusi data (skewness), ukuran

tendensi sentral dan ukuran penyebaran (keragaman) data pengamatan.

Terdapat 5 ukuran statistik yang bisa kita baca dari boxplot, yaitu:

nilai minimum: nilai observasi terkecil

Q1: kuartil terendah atau kuartil pertama

Q2: median atau nilai pertengahan

Q3: kuartil tertinggi atau kuartil ketiga

nilai maksimum: nilai observasi terbesar.

Selain itu, boxplot juga dapat menunjukkan ada tidaknya nilai outlier

dan nilai ekstrim dari data pengamatan.

d. Steamplot ( Stem-and-LesfPlot)

Penyajian lain yang mirip dengan histogram adalah Stemplot. Stemplot

juga dikenal sebagai stem-and-leaf plot atau apabila diterjemahkan ke

dalam bahasa indonesia berarti plot batang dan daun. Di dalam statistik,

stemplot merupakan alat untuk menyajikan data kuantitatif dalam format

grafis, mirip dengan histogram, yaitu untuk membantu dalam

memvisualisasikan bentuk distribusi data yang sering digunakan dalam

analisis eksplorasi. Stemplot diperkenalkan oleh Arthur Bowley di awal

tahun 1900-an. Namun penggunaannya secara umum baru dimulai pada

tahun 1980 setelah John Tukey’s mempublikasikan Exploratory Data

Analysis pada tahun 1977.

Stem-and-leaf plot memberikan informasi lebih banyak tentang nilai

yang sebenarnya dibanding histogram. Seperti dalam histogram, panjang

setiap batang sesuai dengan jumlah kejadian yang jatuh ke dalam interval

tertentu. Pada Histogram. kita hanya bisa melihat nilai frekuensi dari data

namun kita tidak tahu berapa nilai angka sebenarnya. Berbeda dengan

histogram, pada SLP selain kita bisa mengetahui nilai frekuensinya, kita

pun bisa tau berapa nilai data sebenarnya. Hal ini dilakukan dengan

membagi nilai-nilai yang diamati menjadi dua komponen, stem dan leaf.

Stem-and-leaf plot menggambarkan/menyajikan data dengan cara

memisahkan setiap nilai menjadi dua bagian: bagian batang (stem) yaitu

digit angka paling kiri dan diikuti dengan angka berikutnya, yaitu daun

(leaf), digit angka paling kanan.

Tujuan utama Stem-and-leaf plot adalah untuk hal berikut ini:

Apakah pola pengamatan simetris.

Penyebaran atau variasi dari data pengamatan.

Apakah terdapat pencilan (outlier, nilai-nilai yang berada jauh dari

yang lainnya).

Titik pemusatan data.

Ada Lokasi yang merupakan gap (kesenjangan dalam data)

Stem-and-leaf of Nilai Ujian N = 80Leaf Unit = 1.0 2 3 58 5 4 389 8 5 169 19 6 00133356778(24) 7 000011122233444455667899 37 8 0000111223334566788889 15 9 000111223335789 ^ ^ ^ f stem | leaf

( Anonymous. http://smartstat.wordpress.com/2010/03/29/ distribusi-

frekuensi/. Diakses tanggal 2 Juli 2013).

1.2 NILAI TENGAH ( MEDIAN )

Median adalah nilai pengamatan yang terletak di tengah-tengah bila data yang

dipunya terurut dari terkecil ke terbesar atau sebaliknya(Suntoyo

Yitnosumarto,1994). Jika nilai median sama dengan Me, maka 50% dari data

harga-harganya paling tinggi sama dengan Me sedangkan 50% lagi harga-

harganya paling rendah sama dengan Me.



Jika banyak data ganjil, maka median terdapat pada data yang paling tengah

setelah diurutkan. Dan untuk data genap, median terdapat pada rata-rata hitung dua

data yang terletak di tengah setelah data diurutkan. ( Sudjana, 1996)

Sifat nilai median:

Median mudah dihitung dan mudah dimengerti

Dipengaruhi jumlah observasi

Tidak dipengaruhi oleh nilai observasi

Sering dipakai pada distribusi frekuensi yang miring

Digunakan pada data yang bersifat kuantitatif maupun kualitatif berskala

ratio, interval maupun ordinal

Untuk menentukan nilai median harus terlebih dahulu diurutkan dan

ditentukan posisi dengan cara:

Bila seri pengamatan genap, maka posisi median n/2

Bila seri pengamatan ganjil, maka posisi median n+1 / 2

1.3 KERAGAMAN ( VARIANSI )

Varians adalah salah satu ukuran dispersi atau ukuran variasi. Varians dapat

menggambarkan bagaimana berpencarnya suatu data kuantitatif. Ukuran

penyebaran yang terpenting dan sangat memegang peranan di dalam setiap

pengujian statistik parametric adalah ragam atau variance yang diberi lambang

untuk populasi berukuran besar dan contoh. Ragam ini juga berdasarkan atas

simpangan terhadap nilai tengah, sebagaimana penggunaan dasar harga mutlak

simpangan tetapi untuk ragam dasarnya kuadrat

simpangan atau . Nilai tengah kuadrat simpangan inilah yang

kita sebut dengan ragam yang disimbolkan atau .

Dalam hubungannya dalam ragam ini, dapat diturunkan menjadi 2 ukuran

penyebaran lain yang disebut simpangan baku (standard deviation) dengan symbol

s yang merupakan akar pangkat dua dari dan koefisien keragaman (coefficient

of variation) yang merupakan ukuran penyebaran relative.

Untuk data berkelompok, perhitungan ragam mempergunakan atau

memasukkan factor penimbang yaitu frekuensi tiap-tiap kelas.

( Hatta. http://hatta2stat.wordpress.com/2011/05/19/varians/. Diakses tanggal 2 Juli 2013)

http://hatta2stat.wordpress.com/2011/05/19/varians/

BAB II

ISI

2.1 TABEL FREKUENSI

a. Distribusi Frekuensi Standar

Interval

Data(Kelas

Data)

Frekuensi(

fi)

Nilai

Tengah(mid-

point)

a-c

d-f

g-i

…dst… … …

Jumlah S = n S

b. Distribusi Frekuensi Relatif

Interval

Data(Kelas

Data)

Frekuensi(

fi)

Nilai

Tengah(mid-

point)

Frekuensi

Relatif

a-c

d-f

g-i

…dst… … … …

Jumlah S = n S

c. Distribusi Frekuensi Kumulatif

Interval

Data(Kelas

Frekuensi(

fi)

Nilai

Tengah(mid-

Frekuensi

Relatif

Frekuensi

Kumulatif

Data) point)

a-c

d-f

g-i

…dst… … … … …

Jumlah S = n S

d. Range

R =

e. Aturan Sturges

f. Panjang Kelas (p)

P =

2.2 MEDIAN

a. Data tunggal

Ganjil (n)

Genap (n)

b. Data kelompok

2.3 VARIANCE

a. Data tunggal

b. Data kelompok

BAB III

SOAL DAN PENYELESAIAN

1. Berikut adalah nilai ujian yang sudah diurutkan:

35 38 43 48 49 51 56 59 60 60

61 63 63 63 65 66 67 67 68 70

70 70 70 71 71 71 72 72 72 73

73 74 74 74 74 75 75 76 76 77

78 79 79 80 80 80 80 81 81 81

82 82 83 83 83 84 85 86 86 87

88 88 88 88 89 90 90 90 91 91

91 92 92 93 93 93 95 97 98 99

Buatlah Distribusi Frekuensi Standar

Buatlah Distribusi Frekuensi Relatif

Buatlah Distribusi Frekuensi Kumulatif

Grafik Histogram dan poligon

Jawab :

Range = 99 – 35 = 64

Banyak Kelas = 1 + 3.3 x log(n)

= 1 + 3.3 x log(80)

= 7.28 ≈ 7

Panjang Kelas = [range]/[banyak kelas]

= 64/7

= 9.14 ≈ 10

a. Distribusi Frekuensi Standar

b. Distribusi Frekuensi Relatif

c. Distribusi Frekuensi Kumulatif

d. Histogram

e. Polygon

2.

Selang Kelas Batas Kelas Titik Tengah Kelas Frekuensi ƒ

7 – 9

10 – 12

13 – 15

16 – 18

19 – 21

6.5 – 9.5

9.5 – 12.5

12.5 – 15.5

15.5 – 18.5

18.5 – 21.5

8

11

14

17

20

2

8

14

19

7

Gunakan sebaran frekuensi tabel di atas untuk menentukan Q3 bagi sebaran bobot 50

koper!

Jawab :

Kita memerlukan sebuah nilai yang di bawahnya terdapat (75/100) X 50 = 3.75

pengamatan. Ada 24 pengamatan yang terdapat di bawah 15.5 kilogram. Kita masih

memerlukan 13.5 diantara 19 pengamatan berikutnya, oleh karena itu kita masih harus

melangkah sejauh (13.5/19) X 3 = 2.1 setelah 15.5. Jadi

Q3 = 15.5 + 2.1

= 17.6 kilogram

Jadi kita menyimpulkan bahwa 75% dari 50 koper itu bobotnya kurang dari 17.6

kilogram.

3. Banyaknya pegawai di lima apotik adalah 3, 5, 6, 4 dan 6. Dengan memandang data itu

sebagai populasi, hitung nilaitengah banyaknya pegawai bagi lima apotik itu!

Jawab :

µ =

4. Kadar nikotin yang berasal dari sebuah contoh acak enam batang rokok cap tertentu

adalah 2.3, 2.7, 2.5, 2.9, 3.1 dan 1.9 miligram. Tentukan mediannya!

Jawab:

Bila data di atas kita urutkan dari kecil ke besar menjadi 1.9, 2.3, 2.5, 2.7, 2.9, 3.1.

Maka mediannya adalah rata-rata dari 2.5 dan 2.7.

Xbar =

5. Nilai-nilai berikut diberikan oleh enam juri dalam suatu pertandingan senam: 7, 5, 9, 7, 8

dan 6. Hitung simpangan baku bagi populasi ini!

Jawab :

µ =

σ2 =

=

=

=

σ = 1.29

6. Carilah ragam bagi data 3, 4, 5, 6, 6 dan 7, yang merupakan banyaknya ikan trout yang

tertangkap oleh enam nelayan yang diambil secara acak pada tanggal 19 Juni 1981 di

Danau Muskoka.

Jawab :

xi

3

4

5

6

6

7

9

16

25

36

36

49

31 171 n = 6

S2 =

=

BAB IV

SOAL

1. Tentukan batas kelas, titik tengah kelas dan lebar kelas untuk selang-selang berikut ini :

a. 7-13

b. (-5)-(-1)

c. 10.4 – 18.7

d. 0.346 – 0.418

e. (-2.75) – 1.35

f. 78.49 – 86.72

2.

Selang Kelas Batas Kelas Titik Tengah Kelas Frekuensi ƒ

1.5 – 1.9

2.0 – 2.4

2.5 – 2.9

3.0 – 3.4

3.5 – 3.9

4.0 – 4.4

4.5 – 4.9

1.45 – 1.95

1.95 – 2.45

2.45 – 2.95

2.95 – 3.45

3.45 – 3.95

3.95 – 4.45

4.45 – 4.95

1.7

2.2

2.7

3.2

3.7

4.2

4.7

2

1

4

15

10

5

3

Dari tabel di atas buatlah :

a. Histogram frekuensi

b. Poligon frekuensi

c. Ogif frekuensi

3. Banyaknya jawaban yang salah pada suatu kuis dengan soal benar-salah dari lima belas

siswa yang dipilih secara acak adalah : 2, 1, 3, 0, 3, 6, 0, 3, 3, 5, 2, 1, 4 dan 2. Tentukan :

a. Median

b. Nilai tengah

4. IQ rata-rata sepuluh mahasiswa yang mengambil kuliah matematika adalah 114. Bila

Sembilan mahasiswa diantaranya memiliki IQ 101, 125, 118, 128, 106, 115, 99, 118 dan

109. Berapa IQ mahasiswa yang satu lagi?

5. Banyaknya gol yang dibuat oleh suatu tim lacrosse selama musim kompetisi yang lalu

adalah 4, 9, 0, 1, 3, 24, 12, 3, 30, 12, 7, 13, 18, 4, 5 dan 15. Dengan menganggap data itu

sebagai populasi, hitunglah simpangan bakunya!

6. Nilai mutu rata-rata 20 mahasiswa tingkat akhir yang diambil secara acak adalah sebagai

berikut :

3.2 1.9 2.7 2.4

2.8 2.9 3.8 3.0

2.5 3.3 1.8 2.5

3.7 2.8 2.0 3.2

2.3 2.1 2.5 1.9

Hitunglah simpangan bakunya!

DAFTAR PUSTAKA

Anonymous. Distribusi Frekuensi. http://smartstat.wordpress.com/2010/03/29/ distribusi-

frekuensi/. Diakses tanggal 2 Juli 2013

Sudjana, 1996.Metode Statistika,edisi keenam.PT. TARSITO : BANDUNG

Yitnosumarto, Suntoyo. 1994.Dasar-dasar Statistika. PT. Raja Grafindo Persada:Jakarta

Wulan, Uchi.2013. Penataan Data. http://uchiwulans.blogspot.com/p/penataan-data.html .

Diakses tanggal 2 Juli 2013

Winkonadi.2013.Statistika Deskriptif. http://winkonadi.wordpress.com/statistik-deskriptif/ .

Diakses tanggal 2 Juli 2013

Hatta. 2013. Varians.http://hatta2stat.wordpress.com/2011/05/19/varians/. Diakses tanggal 2 Juli 2013

http://hatta2stat.wordpress.com/2011/05/19/varians/

http://winkonadi.wordpress.com/statistik-deskriptif/

http://uchiwulans.blogspot.com/p/penataan-data.html



metode statistika i(penataan data)

Documents