2 stat deskriptif

37
10 2 2 2 2 2 2  S S t t at t i i s t t i i k k d d e es k k r r i i p p t t i i f f  2.1 Pendahuluan Seperti telah dikemukakan dalam bab 1, statistik deskriptif adalah cabang ilmu statistik yang berkaitan dengan prosedur-prosedur yang digunakan untuk menjelaskan karakteristik data secara umum. Setiap set da ta hampir dapat dipas- tikan mempunyai keragaman atau variasi, artinya nilai-nilai pengamatan dalam data tersebut tidak semuanya bernilai sama. Akan tetapi, keragaman nilai-nilai pengamatan tersebut seringkali mengikuti suatu pola atau bentuk tertentu yang khas, yang merupakan ciri atau karakteristik data tersebut. Berbagai prosedur yang biasa digunakan untuk menjelaskan karakteristik data akan dibahas dalam bab ini. Pada dasarnya p rosedur-prosedur tersebut merupakan teknik-teknik dasar dari statistik deskriptif yang digunakan untuk mengelompokkan, menyederhanakan dan menyajikan data ke dalam bentuk y ang mudah dimengerti. Kemudahan dalam memahami data memungkinkan pengguna data untuk dapat menggali lebih banyak informasi tentang karakteristik data, yang mungkin tidak kelihatan dalam tampilan data mentahnya. Pada umumnya, terdapat tiga metode yang biasa digunakan untuk menjelaskan karakteristik suatu set data, yaitu: 1. Tabel: penyajian data dalam bentuk tabel bertujuan untuk mengelompokkan nilai-nilai pengamatan ke dalam beberapa kelompok yang masing-masing mempunyai karakteristik yang sama. Bentuk tabel yang sering digunakan adalah tabel distribusi frekuensi dan tabel distribusi frekuensi relatif. Kedua  jenis tabel ini dibahas secara khusus dalam bagian 2.2. 2. Grafik atau diagram: penyajian data dalam bentuk grafik atau diagram bertujuan untuk memvisualisasikan data secara keseluruhan dengan menon-  jolkan karakteristik tertentu dari data tersebut. Beberapa jenis grafik atau diagram yang biasa digunakan untuk tujuan tersebut diantaranya adalah histogram, diagram batang dan daun, diagram batang, diagram lingkaran dan diagram kotak. Penyajian data dalam bentuk grafik akan dibahas dalam bagian 2.3, 2.4, 2.5, 2.6 dan bagian 2.10 3. Statistik sample: statistik sampel digunakan untuk menjelaskan pemusatan dan penyebaran nilai-nilai pengamatan dari suatu set data. Ukuran pemu- satan yang biasa digunakan adalah nilai rata-rata ( mean), median dan modus, sedangkan ukuran penyebaran yang umum digunakan adalah kisaran data (range), simpangan baku ( standard deviation) dan varians (variance).

Upload: feri-prasetio

Post on 10-Feb-2018

262 views

Category:

Documents


6 download

TRANSCRIPT

Page 1: 2 Stat Deskriptif

7/22/2019 2 Stat Deskriptif

http://slidepdf.com/reader/full/2-stat-deskriptif 1/37

10

22222222  SSttaatt iisstt iikk ddeesskkr r iipptt ii f f  

2.1 Pendahuluan

Seperti telah dikemukakan dalam bab 1, statistik deskriptif adalah cabang ilmustatistik yang berkaitan dengan prosedur-prosedur yang digunakan untukmenjelaskan karakteristik data secara umum. Setiap set data hampir dapat dipas-tikan mempunyai keragaman atau variasi, artinya nilai-nilai pengamatan dalamdata tersebut tidak semuanya bernilai sama. Akan tetapi, keragaman nilai-nilaipengamatan tersebut seringkali mengikuti suatu pola atau bentuk tertentu yangkhas, yang merupakan ciri atau karakteristik data tersebut. Berbagai prosedur yang biasa digunakan untuk menjelaskan karakteristik data akan dibahas dalambab ini. Pada dasarnya prosedur-prosedur tersebut merupakan teknik-teknik dasar 

dari statistik deskriptif yang digunakan untuk mengelompokkan, menyederhanakandan menyajikan data ke dalam bentuk yang mudah dimengerti. Kemudahan dalammemahami data memungkinkan pengguna data untuk dapat menggali lebihbanyak informasi tentang karakteristik data, yang mungkin tidak kelihatan dalamtampilan data mentahnya.

Pada umumnya, terdapat tiga metode yang biasa digunakan untuk menjelaskankarakteristik suatu set data, yaitu:

1. Tabel: penyajian data dalam bentuk tabel bertujuan untuk mengelompokkannilai-nilai pengamatan ke dalam beberapa kelompok yang masing-masingmempunyai karakteristik yang sama. Bentuk tabel yang sering digunakanadalah tabel distribusi frekuensi dan tabel distribusi frekuensi relatif. Kedua

 jenis tabel ini dibahas secara khusus dalam bagian 2.2.

2. Grafik atau diagram: penyajian data dalam bentuk grafik atau diagrambertujuan untuk memvisualisasikan data secara keseluruhan dengan menon-

 jolkan karakteristik tertentu dari data tersebut. Beberapa jenis grafik ataudiagram yang biasa digunakan untuk tujuan tersebut diantaranya adalahhistogram, diagram batang dan daun, diagram batang, diagram lingkaran dandiagram kotak. Penyajian data dalam bentuk grafik akan dibahas dalambagian 2.3, 2.4, 2.5, 2.6 dan bagian 2.10

3. Statistik sample: statistik sampel digunakan untuk menjelaskan pemusatandan penyebaran nilai-nilai pengamatan dari suatu set data. Ukuran pemu-satan yang biasa digunakan adalah nilai rata-rata (mean), median danmodus, sedangkan ukuran penyebaran yang umum digunakan adalah kisarandata (range), simpangan baku (standard deviation) dan varians (variance).

Page 2: 2 Stat Deskriptif

7/22/2019 2 Stat Deskriptif

http://slidepdf.com/reader/full/2-stat-deskriptif 2/37

11

Berbagai ukuran pemusatan akan dibahas dalam bagian 2.7 sedangkanbagian 2.8 akan membahas berbagai ukuran penyebaran data. Penggunaanprogram statistik MINITAB dan program spreadsheet Excel untuk menghitungukuran pemusatan dan penyebaran data juga dibahas dalam bagian 2.9.

2.2 Distribusi frekuensi dan distribusi frekuensi relatif 

Penyajian data ke dalam bentuk distribusi frekuensi merupakan salah satu langkahawal yang biasa dilakukan dalam menganalisis suatu set data. Penginterpretasiandata biasanya dapat dibuat lebih mudah jika data tersebut ditata dan diseder-hanakan lebih dulu. Distribusi frekuensi merupakan suatu tabel, dimana data dike-lompokkan ke dalam beberapa interval numerik yang disebut interval kelas.Bentuk tabel ini sangat sederhana karena hanya menyajikan jumlah pengamatanatau frekuensi dalam setiap interval kelas.

Proses penyusunan data ke dalam distribusi frekuensi sangatlah sederhana tetapicukup membosankan dan menyita waktu jika dilakukan secara manual. Prosedur penyusunan distribusi frekuensi dilakukan dengan urutan sebagai berikut.Pertama-tama tentukan jumlah interval kelas yang akan digunakan, kemudian

tentukan interval kelasnya. Setelah itu, hitung jumlah data yang termasuk kedalam tiap interval kelas tersebut.

Penyusunan data ke dalam bentuk distribusi frekuensi sangat fleksibel dan tidakada aturan yang baku, artinya, suatu set data dapat saja disusun ke dalamberbagai bentuk distribusi yang berbeda. Namun demikian, ada beberapa halyang perlu diperhatikan, diantaranya adalah:

1. Penentuan jumlah interval kelas.Jumlah interval kelas yang digunakan sangat tergantung pada jumlahpengamatan dalam data: makin besar jumlah datanya maka akan makin ba-nyak jumlah kelas yang diperlukan. Namun demikian, biasanya jumlah in-terval kelas yang digunakan disarankan berkisar antara 5 sampai 15 kelas.Jika jumlah interval kelas yang digunakan terlalu sedikit, maka tidak banyak

informasi tambahan yang diperoleh dari pengelompokkan tersebut. Demikian juga jika jumlah kelasnya terlalu banyak, maka pengelompokkan data kedalam interval kelas tidak memberikan manfaat yang maksimal.

2. Penentuan interval kelasInterval kelas dalam tabel distribusi frekuensi dianjurkan agar mempunyailebar interval yang sama. Penentuan lebar interval dilakukan dengan menen-tukan lebih dulu kisaran datanya, yaitu selisih antara nilai data terbesar dengan data terkecil, kemudian membaginya dengan jumlah interval yangdiinginkan:

diinginkanyanginterval jumlah

terkecildataterbesar dataintervallebar 

−=  

Page 3: 2 Stat Deskriptif

7/22/2019 2 Stat Deskriptif

http://slidepdf.com/reader/full/2-stat-deskriptif 3/37

12

3. Penentuan batas interval kelasBatas antar interval kelas harus ditentukan dengan jelas dan tidak ber-tumpang tindih sehingga nilai-nilai pengamatan dapat dengan tepat dike-lompokkan ke dalam setiap kelas. Kecuali untuk interval kelas terbuka, setiapkelas harus mempunyai batas bawah dan batas atas  kelas. Batas bawahinterval kelas yang pertama biasanya adalah nilai minimum dari data tersebut,

atau nilai yang sedikit lebih kecil dari nilai minimum tersebut. Sedangkanbatas atas interval kelas yang terakhir ditentukan sedemikian rupa sehingganilai maksimum dari data tersebut terletak pada interval kelas yang terakhir.

Suatu interval kelas disebut interval kelas terbuka jika kelas tersebut tidakmempunyai batas bawah atau batas atas kelas. Interval kelas terbukabiasanya digunakan jika data yang dianalisis mempunyai keragaman yangsangat besar dan sebagian besar pengamatan terkonsentrasi dalam suatukisaran yang relatif kecil.

Titik tengah kelas adalah nilai rata-rata dari batas bawah dan batas ataskelas.

Distribusi frekuensi relatif adalah suatu bentuk lain dari tabel distribusi frekuensi.Jika distribusi frekuensi menyajikan jumlah pengamatan atau frekuensi dalamsetiap interval kelasnya, maka distribusi frekuensi relatif menyajikan proporsi ataufrekuensi relatif, yang dihitung dengan cara membagi frekuensi setiap kelasdengan jumlah seluruh data. Untuk kasus-kasus tertentu, penyajian data dalambentuk distribusi frekuensi relatif kadang-kadang lebih bermanfaat daripadadistribusi frekuensi.

Contoh 2.1

Data berikut ini merupakan bagian dari hasil penelitian tentang uji keturunan( progeny trial) tanaman Pinus pinaster Ait. yang dilakukan oleh Dr Trevor Butcher,dari Conservation and Land Management, Western Australia.

Tabel 2.1 Hasil pengukuran diameter pohon Pinus pinaster Ait. padausia 9 tahun (diukur dalam satuan cm)

5,25 8,95 9,80 10,65 5,45 10,45 11,05 8,60 12,40 11,20

12,25 12,00 8,90 8,25 8,05 9,30 4,60 11,05 8,85 8,55

8,55 4,40 14,25 12,65 7,95 12,40 8,90 10,35 9,65 10,25

9,95 9,20 9,75 7,55 12,15 4,85 6,45 9,75 10,84 10,65

8,15 8,85 8,55 10,25 10,65 7,55 8,35 11,05 10,15 13,90

6,15 11,05 10,00 7,70 7,25 9,40 8,70 6,00 13,15 10,05

7,60 5,55 10,10 9,35 5,30 8,55 6,10 11,05 7,20 12,15

8,25 6,55 10,60 10,00 9,30 2,95 6,85 11,25 9,40 11,15

4,50 12,40 9,20 10,85 4,35 8,85 8,45 9,50 7,35 9,85

Page 4: 2 Stat Deskriptif

7/22/2019 2 Stat Deskriptif

http://slidepdf.com/reader/full/2-stat-deskriptif 4/37

13

 

Jika data hasil penelitian tersebut disajikan dalam bentuk data mentah sepertidalam tabel 2.1, maka akan sedikit sekali informasi yang dapat kita peroleh daripenyajian data seperti itu. Untuk itu, kita akan menyederhanakan data di atas kedalam bentuk tabel distribusi frekuensi dengan jumlah interval kelas = 8 kelas.Langkah pertama adalah menentukan nilai maksimum dan nilai minimum dari data

tersebut, dalam hal ini masing-masing adalah 14,25 dan 2,95. Kedua nilai tersebutakan digunakan untuk menentukan lebar interval:

4125,18

95,22514 intervallebar  =

−=

Untuk memudahkan penyusunan interval kelas kita gunakan lebar interval = 1,5cm. Informasi ini kemudian kita gunakan untuk menentukan batas-batas intervalkelas. Misalkan untuk batas bawah interval kelas yang pertama kita gunakan nilai2,9 cm, maka selanjutnya, interval kelas bagi tabel distribusi frekuensi dapat kitasusun sebagai berikut: 2,9 – 4,4; 4,4 – 5,9; ...; 13,4 – 14,9. Interval kelas pertamaterdiri atas pengamatan yang mempunyai nilai lebih besar dari 2,9 tetapi lebih kecilatau sama dengan 4,4; interval kelas kedua terdiri atas pengamatan yang

mempunyai nilai lebih besar dari 4,4 tetapi lebih kecil atau sama dengan 5,9;demikian seterusnya. Setelah interval kelas ditentukan, pekerjaan yang harusdilakukan adalah menghitung jumlah pengamatan yang termasuk ke dalam kelas-kelas tersebut. Salah satu cara yang mudah adalah dengan menggunakan turus(tally ), seperti ketika kita menghitung suara dalam suatu pemungutan suara. Hasilpenghitungan tersebut disajikan dalam kolom ke tiga dalam tabel 2.2.

Tabel 2.2 Distribusi frekuensi dan distribusi frekuensi relatif bagi datadalam tabel 2.1

Diameter pohon (cm) Titik tengah kelas Frekuensi Frekuensi relatif 

2,9 sampai 4,4 3,65 3 0,03

4,4 sampai 5,9 5,15 7 0,08

5,9 sampai 7,4 6,65 9 0,10

7,4 sampai 8,9 8,15 22 0,24

8,9 sampai 10,4 9,65 23 0,26

10,4 sampai 11,9 11,15 15 0,17

11,9 sampai 13,4 12,65 9 0,10

13,4 sampai 14,9 14,15 2 0,02

Total 90 1,00

Page 5: 2 Stat Deskriptif

7/22/2019 2 Stat Deskriptif

http://slidepdf.com/reader/full/2-stat-deskriptif 5/37

14

Frekuensi relatif bagi tiap interval kelas dihitung dengan membagi frekuensi kelastersebut dengan keseluruhan data, dalam hal ini 90.

Perhatikan bahwa data tersebut sekarang disajikan dalam bentuk yang lebihsederhana dalam tabel 2.2. Dari tabel tersebut kita dapat dengan mudahmengamati bahwa sebagian besar nilai pengamatan terkonsentrasi pada intervalkelas ke-4, 5 dan 6, yaitu pada kisaran 7,4 cm sampai dengan 11,9 cm. Salah

satu kelemahan dari penyajian data dalam bentuk tabel distribusi frekuensi adalahbahwa nilai pengamatan secara individu tidak lagi kita ketahui. Kelemahan inidapat diatasi jika kita sajikan data tersebut dalam diagram batang dan daun yangakan kita bahas pada bagian 2.5.

2.3 Histogram

Histogram digunakan untuk menyajikan data yang telah tersusun dalam bentuktabel distribusi frekuensi ke dalam bentuk grafik. Kegunaan utama histogramadalah untuk menunjukkan bentuk umum dari distribusi data dan untukmemberikan kesan visual tentang konsentrasi dari sebagian besar pengamatan.Penyajian data dalam bentuk grafik seringkali lebih efektif daripada penyajian

dalam bentuk tabel. Misalnya, nilai-nilai data yang ekstrim atau data pencilan,dapat dengan mudah kita ketahui jika data tersebut disajikan dalam bentuk grafik.Selain itu, lokasi pemusatan data dan penyebaran data di sekitar lokasi pemusatantersebut dapat juga kita amati secara visual.

0

5

10

15

20

25

3,65 5,15 6,65 8,15 9,65 11,15 12,65 14,15

Diameter pohon (cm)

   F  r  e   k  u  e  n  s   i

0.00

0.05

0.10

0.15

0.20

0.25

0.30

3,65 5,15 6,65 8,15 9,65 11,15 12,65 14,15

Diameter pohon (cm)

   F  r  e   k  u  e  n  s   i  r  e   l  a   t   i   f

(a) His togram frekuens i (b) His togram frekuens i relatif   

Gambar 2.1 Histogram frekuensi dan histogram frekuensi relatif bagi datadalam tabel 2.2

Sumbu mendatar sebuah histogram menunjukkan interval kelas dari distribusifrekuensi, data yang biasa dicantumkan pada sumbu mendatar adalah titik tengah

Page 6: 2 Stat Deskriptif

7/22/2019 2 Stat Deskriptif

http://slidepdf.com/reader/full/2-stat-deskriptif 6/37

15

interval kelas (kadang-kadang juga batas interval kelas). Sedangkan frekuensisetiap kelas disajikan pada sumbu tegaknya dalam bentuk batang persegi panjangyang luasnya proporsional dengan frekuensi kelas yang bersangkutan. Histogrambagi data dalam tabel 2.2 disajikan dalam gambar 2.1.a.

Perhatikan bahwa bentuk umum distribusi data menjadi lebih jelas terlihat jikadisajikan dalam histogram: sebagian besar nilai pengamatan terkonsentrasi pada

interval kelas ke-4, 5 dan 6; dan tidak ada indikasi bahwa data tersebut mengan-dung nilai-nilai yang ekstrim.

Histogram frekuensi relatif pada dasarnya hampir sama dengan histogramfrekuensi kecuali bahwa persegi panjang yang digambarkan merupakan frekuensirelatif bagi setiap inteval kelas. Bentuk kedua jenis histogram ini pada umumnyasama. Histogram frekuensi relatif bagi data dalam tabel 2.2 disajikan dalamgambar 2.1.b.

2.4 Penyusunan distribusi frekuensi dan histogram dengan bantuankomputer 

Penyusunan tabel distribusi frekuensi dapat dilakukan dengan menggunakanprogram paket Excel (lihat gambar 2.3). Dalam Excel perintah untuk membuatdistribusi frekuensi terdapat dalam menu

Tools  Data Analysis

Jika dalam komputer anda menu Data Analysis tidak aktif, aktifkan lebih dulu

dengan cara memilih menu

Tools   Add-Ins 

Gambar 2.2. Tampilan jendela Add–Ins dalam Excel

Page 7: 2 Stat Deskriptif

7/22/2019 2 Stat Deskriptif

http://slidepdf.com/reader/full/2-stat-deskriptif 7/37

16

kemudian klik pada kotak di samping pilihan Analysis ToolPak dan Analysis

ToolPak - VBA , sehingga kedua kotak tersebut ditandai dengan a , kemudian

klik OK (lihat gambar 2.2).

Untuk membuat distribusi frekuensi dengan program Excel, langkah pertamaadalah menentukan batas-batas atas setiap interval kelas dan simpan nilainya

dalam salah satu kolom (misalnya dalam gambar 2.3 diberi nama bin dandisimpan dalam sel C1 – C9). Pilih

Tools  Data Analysis 

kemudian pilih Histogram dalam kotak pilihan Analysis Tools.

Gambar 2.3 Prosedur pembuatan tabel distribusi frekuensi denganprogram Excel

Page 8: 2 Stat Deskriptif

7/22/2019 2 Stat Deskriptif

http://slidepdf.com/reader/full/2-stat-deskriptif 8/37

17

Pilihan tersebut akan mengaktifkan jendela Histogram .

Isikan address dari data yang akan dianalisis ke dalam

kotak Input Range dan data tentang batas kelas ke

dalam kotak Bin Range lalu klik OK . Output dari rang-

kaian perintah tersebut menghasilkan suatu distribusifrekuensi bagi data yang bersangkutan (nilia-nilai dalam

kolom Bin adalah batas atas masing-masing kelas).

Dengan program GenStat penyusunan data ke dalam ta-bel distribusi frekuensi cukup dilakukan dengan menu-liskan satu baris perintah berikut:

histogram [ngroup=8] D9

D9 adalah nama variabel dimana data tersebut disimpan dalam GenStat Data.Output dari perintah tersebut adalah sebagai berikut:

Histogram of D9

- 3.2 1 *3.2 - 4.8 4 ****4.8 - 6.4 8 ********6.4 - 8.0 11 ***********

8.0 - 9.6 26 **************************9.6 - 11.2 28 ****************************

11.2 - 12.8 9 *********

12.8 - 3 ***

Scale: 1 asterisk represents 1 unit.

Perhatikan bahwa tabel distribusi frekuensi yang dihasilkan tidak sama dengan

tabel 2.2. Hal ini terjadi karena batas kelas dan lebar interval yang digunakan tidaksama, walaupun jumlah kelas yang digunakan sama-sama delapan. Keadaan inidimungkinkan karena memang tidak ada aturan yang baku dalam menyusun tabeldistribusi frekuensi. Namun demikian, keduanya menunjukkan bentuk umumdistribusi data dan konsentrasi pemusatan data yang hampir sama.

2.5 Diagram batang dan daun

Diagram batang dan daun (the stem-and-leaf diagram) merupakan salah satu

alternatif lain yang dapat digunakan untuk menyajikan dan menyederhanakandata. Outputnya hampir sama dengan histogram dan distribusi frekuensi, bedanyaadalah bahwa dalam diagram batang dan daun data yang divisualisasikan adalah

Bin Frequency 

4.4 3

5.9 7

7.4 9

8.9 22

10.4 2311.9 15

13.4 9

14.9 2

More 0

Page 9: 2 Stat Deskriptif

7/22/2019 2 Stat Deskriptif

http://slidepdf.com/reader/full/2-stat-deskriptif 9/37

18

nilai data yang sebenarnya (bukan data yang telah dikelompokkan ke dalaminterval kelas).

Beberapa kegunaan diagram batang dan daun diantaranya adalah sebagai berikut:

1. untuk menunjukkan kisaran data, yaitu selisih antara data terbesar dengan data terkecil,

2. untuk menunjukkan bagaimana bentuk distribusi data,

3. untuk secara umum menunjukkan lokasi pemusatan data,

4. untuk secara umum menunjukkan penyebaran data, dan

5. untuk menunjukkan apakah ada atau tidaknya data pencilan, yaitu datayang ekstrim yang nilainya sangat besar atau sangat kecil.

Dengan diagram batang dan daun, setiap nilai pengamatan dipisahkan menjadidigit kepala dan digit ekor . Digit kepala akan menjadi batang dan digit berikutnyaakan menjadi daun dari diagram ini. Sebagai ilustrasi, data dalam tabel 2.3 akankita gunakan untuk menyusun diagram batang dan daun.

Tabel 2.3 Data hipotetis tentang nilai ujian akhir mata kuliah MetodeStatistik dari 50 orang mahasiswa

77 61 59 60 79 71 92 73 35 61

88 59 58 57 60 56 56 58 65 62

48 73 42 45 73 56 40 71 71 78

58 85 73 66 59 49 47 68 80 78

70 87 67 55 74 68 60 53 53 69

Nilai-nilai pengamatan dari data dalam tabel 2.3 semuanya bernilai puluhan.Dalam hal ini angka-angka puluhan dapat dijadikan digit kepala dan angka satuan

dijadikan digit ekor. Karena nilai pengamatan berkisar antara 35 dan 92, maka kitaakan mempunyai tujuh buah batang (digit kepala) yang mencerminkan angka-angka puluhan, yaitu 3, 4, 5, ..., 9. Ke tujuh batang ini berfungsi sama sepertiinterval kelas dalam tabel distribusi frekuensi, dalam hal ini menentukan posisibaris dimana nilai pengamatan diletakkan. Digit ekor dari nilai pengamatantersebut kemudian dituliskan pada baris yang bersangkutan. Pengamatan perta-ma bernilai 77 maka angka 7 (digit ekor) dituliskan pada daun pertama dekatbatang bernilai 7 (digit kepala). Berikutnya, data kedua bernilai 61 maka angka 1(digit ekor) dituliskan pada daun pertama dekat batang bernilai 6 (digit kepala).Demikian seterusnya sampai semua nilai pengamatan terdaftarkan dalam diagrambatang dan daun. Untuk sepuluh data pertama, bentuk diagram batang dan daunakan terlihat sebagai berikut:

3 5

Page 10: 2 Stat Deskriptif

7/22/2019 2 Stat Deskriptif

http://slidepdf.com/reader/full/2-stat-deskriptif 10/37

19

4

5 9

6 101

7 7913

8

9 2

Setelah semua nilai pengamatan didaftarkan, diagram batang dan daun kemudiandirapikan dengan cara menyusun nilai-nilai dalam setiap baris kedalam urutan darikecil ke besar. Diagram batang dan daun bagi data dalam tabel 2.3 disajikandalam gambar 2.4

3 5

4 025789

5 33566678889996 000112567889

7 0111333347889

8 0578

9 2

Gambar 2.4 Diagram batang dan daun bagi data dalam tabel 2.3

Beberapa informasi yang dapat kita peroleh dari sajian gambar 2.3 diantaranya

adalah bahwa1. bentuk distribusi datanya hampir simetris

2. nilai pengamatan terkecil adalah 35 dan nilai maksimumnya adalah 92

3. lokasi pemusatan data terletak pada nilai 60-an

4. sebagian besar pengamatan terkonsentrasi pada nilai 50-an sampai 70-an

5. tidak terdapat indikasi adanya data pencilan

Jika dilakukan secara manual, penyusunan data ke dalam bentuk diagram batangdan daun akan sangat menyita waktu dan cukup membosankan, apalagi jika

 jumlah datanya sangat besar. Dengan bantuan komputer penyusunan diagram

Page 11: 2 Stat Deskriptif

7/22/2019 2 Stat Deskriptif

http://slidepdf.com/reader/full/2-stat-deskriptif 11/37

20

batang dan daun menjadi jauh lebih mudah dan lebih cepat. Perintah dan outputdari program statistik GenStat untuk hal ini adalah sebagai berikut:

34 STEM nilai_ujian; NDIGITS=1

Stem-and-leaf display for nilai_ujianNumber of observations: 50 Minimum: 35 Maximum: 92

Stem units: 10, leaf digits: 1 (the value 35 is represented by 3|5)

1 3|56 4|025789

13 5|335666788899912 6|000112567889

13 7|01113333478894 8|05781 9|2

Pernyataan dalam baris no 34 di atas (STEM) adalah perintah dalam GenStat yangdigunakan untuk menyusun diagram batang dan daun bagi variable nilai_ujian 

dengan satu digit ekor (NDIGITS=1). Nilai-nilai dalam kolom pertama adalah

frekuensi (jumlah pengamatan) dalam setiap batang dalam diagram tersebut.Misalnya, baris ke enam menunjukkan bahwa dalam data tersebut terdapat empatpengamatan yang bernilai delapan puluhan, yaitu 80, 85, 87 dan 88. Selain itubentuk distribusi data dapat juga dilihat langsung dari susunan angka-angka yangmerupakan ‘daun’ dari diagram tersebut.

Perintah untuk membuat diagram batang dan daun dalam MINITAB terdapatdalam menu

Stat  EDA  Stem-and-Leaf...  

Perintah tersebut mengaktifkan jendela Stem-and-Leaf seperti terlihat dalamgambar 2.5. Kotak Increment dalam jendela tersebut digunakan untuk

menentukan besaran bagi digit kepala dalam diagram batang dan daun (dalam halini kita gunakan nilai10 untuk menyatakan puluhan).

Page 12: 2 Stat Deskriptif

7/22/2019 2 Stat Deskriptif

http://slidepdf.com/reader/full/2-stat-deskriptif 12/37

21

 

Gambar 2.5 Tampilan jendela Stem-and-leaf dalam MINITAB

Perhatikan bahwa output yang dihasilkan oleh program MINITAB sama seperti

yang dihasilkan oleh program GenStat.

MTB > Stem-and-Leaf 'nilai';SUBC> Increment 10.

Character Stem-and-Leaf Display

Stem-and-leaf of nilai N = 50Leaf Unit = 1.0

1 3 57 4 025789

20 5 3356667888999

(12) 6 00011256788918 7 0111333347889

5 8 05781 9 2

2.6 Metode penyajian bagi data kualitatif 

Ketika data yang dikumpulkan adalah data kualitatif, yang ingin kita ketahuibiasanya adalah berapa banyak pengamatan yang mempunyai karakteristiktertentu. Setiap kategori dalam data kualitatif dapat digunakan sebagai kelas, atau

beberapa kategori dapat digabungkan menjadi satu kelas. Dengan demikian, kita

Page 13: 2 Stat Deskriptif

7/22/2019 2 Stat Deskriptif

http://slidepdf.com/reader/full/2-stat-deskriptif 13/37

22

dapat menyusun suatu tabel distribusi frekuensi bagi data kualitatif untukmenunjukkan berapa banyak nilai pengamatan yang tergolong dalam setiap kelas.

Tabel 2.4 menyajikan suatu tabel distribusi frekuensi bagi jumlah karyawan padasuatu perusahaan yang bergerak dalam bidang industri plywood dikelompokkanberdasarkan tingkat pendidikan tertinggi. Dalam hal ini data yang dikumpulkanadalah data kualitatif tentang tingkat pendidikan karyawan. Data dalam kolom

kedua dalam tabel 2.4 adalah jumlah karyawan sesuai dengan tingkatpendidikannya, sedangkan data dalam kolom ketiga adalah proporsi jumlahkaryawan pada tingkat pendidikan yang bersangkutan.

Tabel 2.4 Distribusi frekuensi jumlah karyawan PT X

Tingkat pendidikan Frekuensi Frekuensi relatif 

SD 1631 0,241

SLTP 2968 0,438

SLTA 2086 0,308

Sarjana muda 65 0,009Sarjana 29 0,004

Total 6779 1,000

Data kualitatif biasa disajikan secara grafis dalam bentuk diagram batang (bar chart ) atau diagram lingkaran ( pie chart ). Diagram batang umumnya digunakanuntuk menampilkan frekuensi dari data kualitatif, sedangkan diagram lingkarandigunakan untuk data proporsi atau frekuensi relatif. Tampilan kedua diagramtersebut untuk data dalam tabel 2.4 disajikan dalam gambar 2.6. Karyawan yangberpendidikan sarjana sangat sedikit jumlahnya jika dibandingkan dengan karya-wan pada tingkat pendidikan lainnya, sehingga tidak mungkin ditampilkan secaragrafis (karena tidak akan kelihatan). Oleh karena itu, dalam gambar 2.6, karyawan

yang berpendidikan sarjana digabungkan dengan kelompok karyawan yang ber-pendidikan sarjana muda. Sehingga kategori ‘sarjana’ dalam kedua gambar tersebut sebenarnya adalah gabungan antara kategori sarjana dengan sarjanamuda.

Untuk menunjukkan bahwa sumbu mendatar dalam diagram batang adalahkategori dari data kualitatif, batang-batang dalam diagram tersebut tidak digam-barkan secara rapat, tetapi ada jarak diantaranya. Sumbu mendatar dalam diag-ram batang tidak selalu mencerminkan urutan, sehingga posisi setiap batangdalam sumbu mendatar dapat bertukar tempat. Hal ini berbeda dengan histogramdimana sumbu mendatar merupakan pengelompokkan dari data kuantitatif yangnilai-nilainya diurutkan dari kecil ke besar, atau sebaliknya. Untuk menunjukkan

Page 14: 2 Stat Deskriptif

7/22/2019 2 Stat Deskriptif

http://slidepdf.com/reader/full/2-stat-deskriptif 14/37

23

hal tersebut setiap batang dalam histogram digambarkan secara rapat satu samalainnya.

16.31

29.68

20.86

0.94

0

10

20

30

SD SLTP SLTA Sarjana

Tingkat pendidikan

   J  u  m   l  a   h   k  a  r  y  a  w  a  n   (   ×   1

   0   0   )

SD

24%

SLTP

44%

SLTA

31%

Sarjana

1%

 

Gambar 2.6 Diagram batang dan diagram lingkaran untuk data dalamTabel 2.3

Luas setiap juring dalam diagram lingkaran menggambarkan persentase penga-matan dari setiap kategori secara proporsional. Untuk membuat diagram lingkaransecara manual dibutuhkan busur derajat untuk mengukur besar sudut dari setiap

 juring. Karena satu lingkaran besarnya adalah 360º maka setiap 1% nilai penga-matan digambarkan dengan sudut sebesar (0.01)(360º) = 3,6º. Sebagai contoh,sudut juring bagi kategori SD besarnya adalah (24)(3,6º) = 86,4º.

Selain diagram batang dan diagram lingkaran, diagram garis (line chart ) jugasering digunakan untuk menampilkan data kualitatif secara visual. Diagram garissering digunakan pada keadaan dimana kategori data tersebut merupakan satuanwaktu kalender misalnya tahun, semester atau bulan. Jika diagram batang diguna-

kan untuk memvisualisasikan besaran atau jumlah, maka diagram garis digunakanuntuk menonjolkan bentuk trend  atau pola perkembangan dari waktu ke waktu,oleh karena itu sering juga disebut sebagai diagram atau grafik time-series.

Contoh 2.2

Data di bawah ini adalah data hipotetis tentang volume penjualan per bulan (dalam jutaan rupiah) suatu toko/pasar swalayan pada tahun 2001.

Page 15: 2 Stat Deskriptif

7/22/2019 2 Stat Deskriptif

http://slidepdf.com/reader/full/2-stat-deskriptif 15/37

24

 

Bulan Penjualan Bulan Penjualan

Januari 948 Juli 709

Pebruari 826 Agustus 685

Maret 802 September 717

 April 850 Oktober 635

Mei 723 Nopember 666

Juni 623 Desember 776

Data tersebut disajikan dalam bentuk diagram garis dalam gambar 2.7. Perhatikanbahwa kecenderungan fluktuasi penjualan per bulan toko swalayan tersebut dapatterlihat dengan jelas dalam diagram tersebut. Jumlah penjualan per bulan dapat

 juga ditampilkan dalam diagram garis dengan mencantumkan angka penjualanpada setiap titik dalam diagram tersebut.

Diagram batang, diagram lingkaran dan diagram garis banyak digunakan dalam

laporan-laporan pemerintah, dunia bisnis dan media massa. Terdapat banyaksekali variasi dari ketiga diagram tersebut. Namun demikian, tujuan dari semuadiagram tersebut adalah untuk menyajikan dan menyederhanakan data secara

 jelas dan dalam bentuk yang menarik serta mudah dipahami.

500

600

700

800

900

1000

Jan Peb Mar Apr Mei Jun Jul Ags Sep Okt Nop Des

   P  e  n   j  u  a   l  a  n   (   j  u   t  a  r  u  p   i  a   h   )

 

Gambar 2.7 Diagram garis dari data penjualan suatu toko swalayan

Page 16: 2 Stat Deskriptif

7/22/2019 2 Stat Deskriptif

http://slidepdf.com/reader/full/2-stat-deskriptif 16/37

25

Program spreadsheet Excel mempunyai fasilitas pembuatan berbagai grafik yangcanggih dan mudah digunakan. Fasilitas tersebut dapat diaktifkan dengan memilihmenu

Insert  Chart

atau dengan mengklik tanda pada toolbar. Perintah tersebut akan

mengaktif jendela Chart Wizard seperti terlihat dalam gambar 2.7. Pilih jenis

grafik yang anda ingin, lalu klik tombol Next. Setelah itu akan muncul jendela-

 jendela berikutnya yang meminta berbagai informasi tentang tampilan grafik yanganda inginkan. Setiap kali anda selesai memberikan informasi yang diminta klik

 Next untuk mengisi informasi selanjutnya dalam jendela berikutnya, demikian

seterusnya sampai semua informasi yang diperlukan terisi, lalu klik tombolFinish.

Gambar 2.8 Jendela Chart Wizard dalam program Excel

Page 17: 2 Stat Deskriptif

7/22/2019 2 Stat Deskriptif

http://slidepdf.com/reader/full/2-stat-deskriptif 17/37

26

2.7 Ukuran pemusatan data

Ukuran deskriptif berupa angka atau nilai numerik sering digunakan untuk menje-laskan karakteristik data. Dikenal dua jenis ukuran deskriptif yang umum diguna-kan, yaitu ukuran pemusatan dan ukuran penyebaran. Ukuran pemusatandigunakan untuk menjelaskan lokasi pusat distribusi dari nilai-nilai pengamatan,sedangkan ukuran penyebaran digunakan untuk menunjukkan bagaimana

variasi/keragaman nilai-nilai pengamatan tersebut terhadap pusat distribusinya.Dalam bagian ini akan dibahas beberapa jenis ukuran pemusatan yang seringdigunakan, sedangkan ukuran penyebaran akan dibahas pada bagian 2.8.

Salah satu ukuran pemusatan yang umum digunakan adalah modus. Modusbiasanya digunakan sebagai ukuran popularitas. Misalnya jenis makanan yangpaling disukai, merek sepeda motor yang paling banyak digunakan, dan seba-gainya. Secara formal, modus didefinisikan sebagai berikut:

Definisi Modus dari suatu set data didefinisikan sebagai nilai pengamatan yang

paling sering terjadi (frekuensinya paling tinggi)

Contoh 2.3

Data berikut ini adalah suatu sampel dari pengamatan terhadap jumlah bunga per tangkai dari tanaman Anggrek hitam (Coelogyne pandurata Lindl) hasil penelitianSdr. Akbar Sidik Q.M, Fakultas Pertanian, Universitas Tanjungpura (2002)

8 7 8 8 10 9 7 7 7 9 8 10 3 7 9

Modus dari data tersebut adalah 7, karena nilai ini paling sering terjadi diban-dingkan nilai pengamatan lain.

 

Ukuran pemusatan yang kedua adalah median. Ukuran pemusatan ini sering

digunakan untuk menentukan ‘titik tengah’ dari suatu set data.

Definisi Median dari suatu set data didefinisikan nilai pengamatan yang terletak ditengah-tengah ketika data diurutkan berdasarkan besarannya.

Untuk suatu set data yang kecil, median adalah data yang terletak di tengahurutan, jika jumlah datanya ganjil; sedangkan jika jumlah datanya genap mediandihitung sebagai rata-rata dari dua data yang terletak di tengah urutan.

Contoh 2.4

Untuk menentukan median dari data dalam contoh 2.3, kita harus mengurutkandulu data tersebut, sebagai berikut:

1.1 3 7 7 7 7 7 8 8 8 8 9 9 9 10 10

Page 18: 2 Stat Deskriptif

7/22/2019 2 Stat Deskriptif

http://slidepdf.com/reader/full/2-stat-deskriptif 18/37

27

Berdasarkan urutan tersebut, dapat dengan mudah kita tentukan bahwa mediandari data tersebut adalah 8.

 

Untuk menentukan median dari data yang sudah disusun dalam bentuk tabeldistribusi frekuensi, pertama-tama tentukan kelas median lebih dulu. Kelas

median adalah interval kelas yang mengandung median. Median kemudian didugadengan rumus berikut:

 

  

 −+= b

m

cf n

w Lmedian

2.............................................................. [2.1]

dimanaL = batas bawah dari interval kelas medianw = lebar intervalf m = frekuensi kelas mediann = jumlah pengamatancf b = jumlah frekuensi dari semua kelas (frekuensi kumulatif) sebelum kelas

median

Contoh berikut ini memberikan ilustrasi tentang bagaimana menentukan medianpada data yang sudah disusun dalam tabel distribusi frekuensi.

Contoh 2.5

Tabel di bawah ini adalah data diameter pohon dalam tabel 2.2. Nilai-nilai padakolom kumulatif frekuensi dan kumulatif frekuensi relatif diperoleh denganmenjumlahkan frekuensi (frekuensi relatif) dari kelas-kelas sebelumnya.

Diameter pohon Frekuensi Frekuensikumulatif 

Frekuensirelatif 

Frekuensi relatif kumulatif 

2,9 sampai 4,4 3 3 0,03 0,03

4,4 sampai 5,9 7 10 0,08 0,11

5,9 sampai 7,4 9 19 0,10 0,21

7,4 sampai 8,9 22 41 0,24 0,45

8,9 sampai 10,4 23 64 0,26 0,71

10,4 sampai 11,9 15 79 0,17 0,88

11,9 sampai 13,4 9 88 0,10 0,98

13,4 sampai 14,9 2 90 0,02 1,00

Total 90 1,00

Page 19: 2 Stat Deskriptif

7/22/2019 2 Stat Deskriptif

http://slidepdf.com/reader/full/2-stat-deskriptif 19/37

28

Karena jumlah data keseluruhan adalah 90, maka median adalah pengamatanyang ke 46 pada urutan data. Oleh karena itu, kelas median adalah interval kelaspertama yang frekuensi kumulatifnya lebih besar dari 46. Kelas interval ini akanmengandung nilai median di dalamnya, dalam hal ini kelas median adalah intervalkelas yang ke 5. Maka

L = 8,9 w = 1,5 f m = 23 n = 90 dan cf b = 41

oleh karena itu nilai dugaan bagi median dari data tersebut adalah:

16,9412

90

23

5,19,8 =

 

  

 −+=median  

Perhatikan bahwa jika dihitung dengan menggunakan data mentahnya, maka nilaimedian dari data tersebut adalah 9,3.

 

Ukuran pemusatan yang terakhir yang akan kita bahas dalam buku ini adalah rata-rata. Ukuran pemusatan ini mungkin yang paling sering kita dapati dalamkehidupan sehari-hari.

Definisi Rata-rata dari suatu set data didefinisikan sebagai jumlah dari semua nilai

pengamatan dibagi dengan jumlah data.

Nilai rata-rata mempunyai peranan yang sangat penting dalam pembahasan padabab-bab berikutnya, oleh karena itu, rata-rata sering dilambangkan secara khusus.

Rata-rata populasi biasa dilambangkan dengan Huruf Yunani µ  (dibaca myu),

sedangkan rata-rata sampel dilambangkan dengan  x y   atau (dibaca y-bar atau x-

bar).

Misalkan y 1, y 

2, ..., y 

nadalah nilai-nilai pengamatan dari suatu sampel berukuran n.

Nilai rata-rata sampel ( y ) dinyatakan sebagai

∑==

n

i y n

y 1

1 ..................................................................................... [2.2]

dimana ∑=

n

i y 1

adalah notasi penjumlahan dari n buah nilai pengamatan, yaitu:

n

n

i  y y y y  +++=∑=

L21

1

 

Contoh 2.6

Rata-rata jumlah bunga per tangkai dalam contoh 2.3 adalah

Page 20: 2 Stat Deskriptif

7/22/2019 2 Stat Deskriptif

http://slidepdf.com/reader/full/2-stat-deskriptif 20/37

29

8,715

117

15

9878==

++++=

L

y   

 

Bagi data yang sudah disusun ke dalam tabel distribusi frekuensi, nilai rata-ratanyadapat diduga dengan rumus berikut:

∑∑

=

i i 

mf 

y  ..................................................................................... [2.3]

dimanaf i = frekuensi dari interval kelas ke-i mi = titik tengah kelas ke-i  

Rumus di atas hanya merupakan nilai dugaan (pendekatan) bagi rata-rata, karenadalam distribusi frekuensi kita tidak lagi mengetahui nilai pengamatan yangsebenarnya. Oleh karena itu, jika data mentahnya (nilai pengamatan yang belumdikelompokkan ke dalam interval kelas) tersedia, nilai rata-rata sebaiknya dihitung

dari nilai data mentah tersebut.

Contoh 2.7

Sebagai ilustrasi kita akan melakukan pendugaan nilai rata-rata bagi data diameter pohon dalam tabel 2.2

Diameter pohon Titik tengah kelas(mi )

Frekuensi(f i )

f i mi  

2,9 sampai 4,4 3,65 3 10,95

4,4 sampai 5,9 5,15 7 36,05

5,9 sampai 7,4 6,65 9 59,85

7,4 sampai 8,9 8,15 22 179,30

8,9 sampai 10,4 9,65 23 221,95

10,4 sampai 11,9 11,15 15 167,25

11,9 sampai 13,4 12,65 9 113,85

13,4 sampai 14,9 14,15 2 28,30

Total 90 817,50

Nilai-nilai dalam kolom terakhir adalah hasil kali dari nilai-nilai dalam kolom keduadan kolom ketiga. Sehingga nilai rata-rata dihitung dengan cara membagi totalkolom ketiga dengan total kolom kedua, yaitu

Page 21: 2 Stat Deskriptif

7/22/2019 2 Stat Deskriptif

http://slidepdf.com/reader/full/2-stat-deskriptif 21/37

30

0833,990

50,817==y   

Perhatikan bahwa jika dihitung dengan menggunakan data mentahnya, maka rata-rata dari data tersebut adalah 9,084.

 

Tabel 2.5 Beberapa karakteristik penting dari ukuran pemusatan

Modus Median Rata-rata

o Merupakan pengamatanyang paling sering terjadi

o Satu data set mungkinmempunyai lebih dari sa-tu modus

o Tidak terpengaruhi nilaiekstrim

o Modus dari beberapasampel tidak dapat diga-bungkan untuk menen-tukan modus seluruhsampel

o Untuk data yang dikelom-pokkan nilai modus dapatberubah tergantung padakategori yang digunakan

o Dapat digunakan baik un-tuk data kualitatif maupunkuantitatif 

o Merupakan titik tengahnilai pengamatan

o Hanya satu nilai medi-an untuk tiap data set

o Tidak dipengaruhi nilaiekstrim

o Median dari beberapasampel tidak dapat di-gabungkan untuk me-nentukan median selu-ruh sampel

o Nilai median dari datayang dikelompokkan re-latif stabil

o Hanya digunakan untukdata kuantitatif 

o Merupakan rata-ratanilai pengamatan

o Hanya ada satu nilairata-rata bagi setiapdata set

o Sangat dipengaruhinilai ekstrim

o Rata-rata dari bebe-rapa sampel dapat di-gabungkan untuk me-nentukan rata-rata se-luruh sampel

o Hanya digunakan un-tuk data kuantitatif 

Ketiga ukuran pemusatan yang telah dibahas dalam bagian ini masing-masingmempunyai kelebihan dan kekurangan tersendiri. Misalnya, nilai rata-rata merupa-kan nilai statistik yang penting dalam statistik inferensial karena nilai rata-ratauntuk data sampel dianggap memberikan nilai dugaan yang baik bagi rata-ratapopulasinya. Modus digunakan ketika kita ingin mengetahui nilai pengamatandengan frekuensi tertinggi. Oleh karena itu, modus sering digunakan untuk meng-ukur popularitas dan merupakan salah satu ukuran pemusatan bagi data kualitatif.Sebaliknya, pada keadaan tertentu median dapat memberikan informasi yang lebihbaik tentang pusat distribusi daripada rata-rata. Sebagai contoh, jika kita menga-mati distribusi gaji karyawan dalam suatu perusahaan besar, akan kita temukanbahwa sebagian besar gaji karyawan berkisar antara 1 – 2 juta rupiah, tetapi akan

Page 22: 2 Stat Deskriptif

7/22/2019 2 Stat Deskriptif

http://slidepdf.com/reader/full/2-stat-deskriptif 22/37

31

terdapat beberapa karyawan, terutama para eksekutif, dengan gaji yang jauh lebihbesar. Dalam hal ini, median mungkin merupakan ukuran pemusatan yang lebihbaik dari rata-rata karena median tidak dipengaruhi oleh nilai-nilai yang ekstrim.Jika kita gunakan nilai rata-rata, maka gaji para eksekutif tersebut akan membuatnilai rata-rata menjadi jauh lebih tinggi. Tabel 2.5 menyajikan karakteristik pentingdari berbagai ukuran pemusatan tersebut.

Bagi data dengan distribusi yang simetris, maka rata-rata, median dan modus akanmempunyai nilai yang sama (gambar 2.8.a). Jika distribusi datanya condong kekiri  (skew to the left ) maka rata-rata akan merupakan nilai yang paling kecil,

sedangkan modus merupakan nilai yang terbesar diantara ketiganya (gambar 2.8.b). Sebaliknya jika distribusinya condong ke kanan (skew to the right ) makarata-ratalah yang merupakan nilai terbesar dan modus adalah nilai terkecil(gambar 2.8.c). Perhatikan bahwa dari ketiga kasus distribusi tersebut, medianselalu merupakan nilai yang di tengah.

   F  r  e   k  u  e  n  s   i  r  e

   l  a   t   i   f

µ = Md = Mo

(a) Distribusi simetris

   F  r  e   k  u  e  n  s   i  r  e   l  a   t   i   f

Mo Md µ

(c) Distribusi condong ke kanan

   F  r  e   k  u  e  n  s   i  r  e

   l  a   t   i   f

 µ Md Mo

(b) Distribusi condong ke kiri

 

Gambar 2.9 Hubungan antara rata-rata (µµµµ), median (Md) dan modus (Mo)

2.8 Ukuran penyebaran data

Untuk dapat menjelaskan distribusi frekuensi suatu set data secara lebih rinci,ukuran pemusatan harus dilengkapi dengan suatu ukuran penyebaran atau ukurankeragaman data, karena ukuran pemusatan sama sekali tidak mencerminkan

Page 23: 2 Stat Deskriptif

7/22/2019 2 Stat Deskriptif

http://slidepdf.com/reader/full/2-stat-deskriptif 23/37

32

bentuk distribusi datanya. Sebagai ilustrasi, dalam gambar 2.9 disajikan tiga data

set yang mempu-nyai ukuran pemusatan (µ ) yang sama tetapi dengan keragamandata yang berbeda. Perhatikan bahwa ketiga set data tersebut sama-sama

terpusat di titik µ , tetapi bentuk distribusi ketiga set data tersebut berbeda satusama lainnya.

   F  r  e   k  u  e  n  s   i  r  e   l  a   t   i   f

µ

a

b

c

 

Gambar 2.10 Tiga bentuk distribusi dengan keragaman yang berbeda tetapimempunyai rata-rata yang sama

Ukuran penyebaran/keragaman data yang paling sederhana adalah kisaran (range). Kisaran didefinisikan sebagai selisih antara nilai pengamatan terbesar dengan nilai pengamatan terkecil dalam suatu set data. Untuk data yang sudahdikelompokkan ke dalam tabel distribusi frekuensi nilai kisaran data adalah selisihantara batas atas interval kelas terakhir dikurangi dengan batas bawah intervalkelas pertama.

   F  r  e   k  u  e  n  s   i  r  e   l  a   t   i   f

Persentil ke-30

70%30%

 

Gambar 2.11 Persentil ke-30 dari suatu data set

Page 24: 2 Stat Deskriptif

7/22/2019 2 Stat Deskriptif

http://slidepdf.com/reader/full/2-stat-deskriptif 24/37

33

 

Walaupun sangat mudah dihitung, kisaran hanya memberikan informasi yangsangat terbatas tentang penyebaran data terhadap rata-ratanya. Perhatikanbahwa grafik distribusi b) dan c) pada gambar 2.9 mempunyai rata-rata dankisaran yang sama, tetapi nampak jelas bahwa keragaman data dari keduadistribusi tersebut berbeda satu sama lainnya.

Definisi Nilai persentil ke- p dari suatu set data yang telah diurutkan besarannyaadalah suatu nilai yang membagi dua urutan data tersebut sedemikian rupasehingga sebanyak  p% dari data terletak dibawah nilai tersebut dan(100 – p)% nya terletak di atas nilai tersebut.

Gambar 2.10 memberikan ilustrasi tentang persentil yang ke-30 dari suatu setdata.

Persentil sering digunakan untuk menjelaskan tingkat keberhasilan dan peringkatseseorang dalam suatu ujian dibandingkan dengan peserta ujian lainnya. Nilai-nilai persentil yang sering digunakan adalah persentil ke-25, ke-50, dan ke-75,yang masing-masing biasa disebut sebagai kuartil bawah, kuartil tengah 

(median) dan kuartil atas (lihat gambar 2.11).

median

   F  r  e   k  u  e  n  s   i  r  e   l  a   t   i   f

kuartil bawah kuartil atas

25% 25% 25% 25%

IQR 

 

Gambar 2.12 Kuartil-kuartil suatu distribusi

Untuk menentukan nilai-nilai kuartil tersebut, pertama-tama urutkan nilai-nilai datamenurut besarnya, misalnya dari nilai terkecil ke nilai terbesar. Kuartil bawah (Q1)

adalah nilai pengamatan yang terletak pada urutan ke4

1+n; kuartil tengah

Page 25: 2 Stat Deskriptif

7/22/2019 2 Stat Deskriptif

http://slidepdf.com/reader/full/2-stat-deskriptif 25/37

34

(median) adalah nilai pengamatan yang ke2

1+n; dan kuartil atas (Q3) adalah nilai

pengamatan yang ke( )

4

13 +ndalam urutan tersebut. Jika posisi lokasi kuartil-

kuartil tersebut bukan merupakan bilangan bulat, maka nilainya ditentukan denganinterpolasi.

Misalnya untuk n = 10, maka Q1 adalah data yang ke (10 + 1)/4 = 2,75. Maka nilaiQ1 terletak antara data kedua (y2) dan ketiga (y3) dalam urutan, dengan jarak 0,75

dari y2, sehingga ( )2321 75,0Q y y y  −+= . Median (kuartil tengah) adalah data

yang ke (10 + 1)/2 = 5,5 sehingga nilai median adalah ( )565 5,0 y y y  −+ atau sa-

ma dengan 65 5,05,0 y y  + , yaitu rata-rata dari y5 dan y6. Dengan cara yang sama,

Q3 adalah data yang ke 3(10 + 1)/4 = 8,25 sehingga ( )8983 25,0Q y y y  −+= .

Ukuran penyebaran data yang lainnya adalah kisaran antar kuartil yang dide-finisikan sebagai berikut:

Definisi Kisaran antar kuartil (interquartile range = IQR ) dari suatu set data

didefinisikan sebagai selisih antara kuartil atas dengan kuartil bawah (lihatgambar 2.10).

Kisaran antar kuartil (IQR) dapat digunakan untuk membandingkan keragamanatau variasi antar dua data set, akan tetapi IQR ada kalanya kurang memberikaninformasi yang bermanfaat tentang keragaman suatu set data. Untuk itu kita perlumenentukan suatu ukuran keragaman yang lebih sensitif yang dapat digunakanbaik untuk membandingkan keragaman antar dua set data maupun untuk mengin-terpretasikan keragaman dalam suatu set data. Salah satu ukuran keragamanyang sampai saat ini dianggap paling penting dan paling sering digunakan adalahvarians (variance) dan simpangan baku (standard deviation).

Definisi Varians (variance) didefinisikan sebagai ‘rata-rata’ dari kuadrat simpangannilai-nilai pengamatan terhadap nilai rata-ratanya

Untuk data populasi, y1, y2, ..., yn, varians populasi biasa dilambangkan dengan

Huruf Yunani σ2(dibaca sigma kuadrat), dihitung sebagai berikut:

( )

n

y i ∑ −=

2

2µ 

σ   ............................................................................. [2.4]

sedangkan untuk data sampel, varians sampel biasa dilambangkan dengan s2,

dihitung sebagai berikut:

( )

1

2

2

−= ∑

n

y y s

i ............................................................................ [2.5]

Page 26: 2 Stat Deskriptif

7/22/2019 2 Stat Deskriptif

http://slidepdf.com/reader/full/2-stat-deskriptif 26/37

35

Simpangan baku dihitung sebagai akar dari varians, oleh karena itu, simpangan

baku populasi (σ) dihitung dengan

( )

n

y i ∑ −=

2µ 

σ   ........................................................................... [2.6]

dan simpangan baku sampel (s) dihitung dengan

( )

1

2

−= ∑

n

y y s

i ........................................................................... [2.7]

Dapat ditunjukkan bahwa ( )( )

∑ ∑∑ −=−n

y y y y 

i i 

2

22, oleh karena itu varians

sampel dapat dihitung dengan rumus berikut:

( )

−=

∑∑n

y y 

ns

2

22

1

1.......................................................... [2.8]

Rumus (2.5) lebih merupakan rumus teoritis bagi varians sampel, sedangkan untuk

perhitungan, rumus (2.8) lebih mudah diimplementasikan.

Contoh 2.8

Hitung rata-rata dan varians dari sampel berikut ini:

5,5 6,6 8,2 13,4 13,0 15,7 3,9 5,8 12,5 5,7

Rata-rata dari ke 10 pengamatan tersebut adalah

03,910

3,90

10

7,52,86,65,5==

++++== ∑ L

n

y y 

i  

Untuk mengitung varians sampel kita perlu menghitung ∑ 2i y  lebih dulu,

69,9737,52,86,65,5 22222 =+++=∑ Li y   

Sehingga varians sampel dari data tersebut adalah

( ) ( )59,1758678,17

10

3,9069,973

9

1

1

12

2

22 ≈=

−=

−=

∑∑n

y y 

ns

i  .

 

Untuk data yang telah disusun ke dalam tabel distribusi frekuensi, varians populasididuga dengan rumus berikut:

Page 27: 2 Stat Deskriptif

7/22/2019 2 Stat Deskriptif

http://slidepdf.com/reader/full/2-stat-deskriptif 27/37

36

( )

n

f mi 

i i ∑ ⋅−

=

2

2

µ 

σ   ....................................................................... [2.9]

sedangkan varians sampel diduga dengan

( )

1

2

2

⋅−

= ∑n

f y m

s i  i i ...................................................................... [2.10]

dimana

mi  = titik tengah kelas ke – i  

f i  = frekuensi kelas ke – i  

Simpangan baku populasi diduga dengan rumus berikut:

( )

n

f mi 

i i ∑ ⋅−

=

2µ 

σ   .................................................................... [2.11]

dan simpangan baku sampel diduga dengan

( )

1

2

⋅−

=∑

n

f y m

s i 

i i 

..................................................................... [2.12]

Contoh 2.9

Dalam contoh 2.7 telah kita hitung bahwa rata-rata diameter pohon dalam tabel 2.2adalah 9,083 cm. Varians untuk data tersebut dapat dihitung dengan bantuantabel berikut:

Diameter pohon Titik tengah

kelas (mi )

Frekuensi

(f i )

y mi  −   ( )2y mi  −   ( ) i i  f y m ⋅− 2 

2,9 sampai 4,4 3,65 3 -5,433 29,5175 88,5525

4,4 sampai 5,9 5,15 7 -3,933 15,4685 108,2795

5,9 sampai 7,4 6,65 9 -2,433 5,9195 53,2755

7,4 sampai 8,9 8,15 22 -0,933 0,8705 19,1510

8,9 sampai 10,4 9,65 23 0,567 0,3215 7,3945

10,4 sampai 11,9 11,15 15 2,067 4,2725 64,0875

11,9 sampai 13,4 12,65 9 3,567 12,7235 114,5115

13,4 sampai 14,9 14,15 2 5,067 25,6745 51,3490

Total 90 506,6010

Page 28: 2 Stat Deskriptif

7/22/2019 2 Stat Deskriptif

http://slidepdf.com/reader/full/2-stat-deskriptif 28/37

37

Nilai-nilai dalam kolom ke empat adalah selisih antara titik tengah setiap kelasdengan nilai rata-ratanya; kolom ke lima merupakan kuadrat dari nilai-nilai dalamkolom ke empat; dan nilai-nilai dalam kolom terakhir adalah hasil kali antara nilai-nilai dalam kolom ke lima dengan frekuensi masing-masing kelas. Dengan demi-kian, varians sampel bagi data tersebut dapat dihitung dengan membagi jumlahnilai dalam kolom terakhir dengan n – 1 = 89:

6921,589

601,5062 ==s  

Jika dihitung dengan menggunakan data mentahnya, varians dari data tersebutadalah 5,3914.

 

Data yang terkonsentrasi di sekitar nilai rata-ratanya akan mempunyai varians dansimpangan baku yang lebih kecil daripada data yang menyebar dari nilai rata-ratanya. Oleh karena itu, simpangan baku (dan varians) merupakan salah satukarateristik penting bagi setiap distribusi.

Definisi: Aturan empirisBagi suatu set data yang mempunyai distribusi berbentuk seperti gundukanyang simetris (berbentuk seperti genta/lonceng), maka interval

sy ± akan mengandung sekitar 68% dari semua nilai pengamatan,

sy  2± akan mengandung sekitar 95% dari semua nilai pengamatan,

sy  3± akan mengandung sekitar 99% dari semua nilai pengamatan.

2.9 Penggunaan komputer untuk menghitung ukuran pemusatan danpenyebaran data

Ukuran pemusatan dan ukuran penyebaran data yang dibahas di atas merupakanbagian dari langkah awal dalam menganalisis data yang bersangkutan. Olehkarena itu, setiap Program Statistik menyediakan fasilitas untuk menghitungberbagai ukuran pemusatan maupun ukuran penyebaran data tersebut. Perintahyang berkaitan dengan hal ini umumnya tercantum dalam suatu sub menu yangbiasa disebut sebagai Descriptive Statistics atau Basic Statistics.

2.9.1 MINITAB

Dalam Program MINITAB beberapa ukuran pemusatan dan penyebaran datadapat dihitung sekaligus dengan perintah Describe. Perintah tersebut diaktifkan

dengan memilih menu

Page 29: 2 Stat Deskriptif

7/22/2019 2 Stat Deskriptif

http://slidepdf.com/reader/full/2-stat-deskriptif 29/37

38

Stat  Basic Statistics  Descriptive Statistics 

Gambar 2.13. Tampilan jendela Descriptive Statistics MINITAB

Sebagai contoh, misalkan data dalam Tabel 2.1 disimpan dalam kolom C1 dalamData Program MINITAB dan kolom tersebut diberi nama ‘Diameter’. Pilih menu

Stat  Basic Statistics  Descriptive Statistics 

perintah tersebut akan mengaktifkan jendela Descriptive Statistics (lihat

gambar 2.13). Kemudian isikan C1 atau ‘Diameter’ ke dalam kotak Variabel 

dalam jendela tersebut dan klik OK  

Output dari Program MINITAB adalah sebagai berikut:

MTB > Describe 'Diameter'.

Descriptive Statistics

Variable N Mean Median Tr Mean StDev SE MeanDiameter 90 9.084 9.300 9.130 2.322 0.245

Variable Min Max Q1 Q3Diameter 2.950 14.250 7.675 10.650

MTB >

Penjelasan:

Page 30: 2 Stat Deskriptif

7/22/2019 2 Stat Deskriptif

http://slidepdf.com/reader/full/2-stat-deskriptif 30/37

39

N adalah jumlah data dalam variabel ‘Diameter’

Mean adalah rata-rata variabel tersebut

Median adalah median variabel tersebut

Tr Mean adalah rata-rata variabel tersebut tanpa mengikut sertakan 5% data

terkecil dan 5% data terbesar dalam perhitungannyaStDev adalah simpangan baku sampel dari variabel tersebut

SE Mean adalah galat baku dari rata-rata (standard error of the mean) yang

dihitung dengan cara membagi nilai StDev dengan akar N  ( )NStDev .

Statistik ini akan dibahas lebih lanjut dalam bab 4

Min adalah nilai minimum

Max adalah nilai maksimum

Q1 dan Q3 masing-masing adalah nilai kuartil pertama dan ketiga

2.9.2 Excel

Untuk ilustrasi, misalkan data dalam tabel 2.1 disimpan dalam spreadsheet Excelpada kolom A, baris ke 2 sampai 91, sedangkan baris pertama berisi ‘Diameter’,sebagai label bagi data tersebut. Dalam Excel, perintah untuk menghitung ukuranpemusatan dan penyebaran data dilakukan dengan memilih menu

Tools  Data Analysis

Gambar 2.14 Jendela Descriptive Statistics Excel

lalu pilih Descriptive Statistics dalam jendela Data Analysis. Pilihan

ini akan mengaktifkan jendela Descriptive Statistics. Lengkapi jendela

Page 31: 2 Stat Deskriptif

7/22/2019 2 Stat Deskriptif

http://slidepdf.com/reader/full/2-stat-deskriptif 31/37

40

tersebut seperti terlihat dalam gambar 2.14 lalu klik OK . Output dari rangkaian

perintah tersebut akan disimpan dalam sel B1 sampai dengan C15 (gambar 2.15).

Gambar 2.15 Output Descriptive Statistics Program Excel

2.10 Diagram kotak (Box plot )

Diagram kotak merupakan salah satu teknik penyajian data dalam bentuk grafis.Diagram ini digunakan untuk mempelajari keragaman dari data dan keadaan datapada ujung-ujung distribusinya dengan mengaitkannya dengan nilai numerik dari

ukuran pemusatan. Diagram kotak juga dapat digunakan untuk mendeteksi ke-mungkinan adanya nilai-nilai pencilan (outlier ), yaitu nilai-nilai pengamatan yangterletak sangat jauh dari pusat distribusinya.

Untuk menyajikan data dalam bentuk diagram kotak, pertama-tama tentukan lebihdulu nilai median, kuartil bawah (Q1) dan kuartil atas (Q3). Kemudian, hitung nilai-nilai berikut:

batas dalam bawah (lower inner fence) = Q1 – 1,5 × IQR

batas dalam atas (upper inner fence) = Q3 + 1,5 × IQR

batas luar bawah (lower outer fence) = Q1 – 3 × IQR

batas luar atas (upper outer fence) = Q3 + 3 × IQR

Page 32: 2 Stat Deskriptif

7/22/2019 2 Stat Deskriptif

http://slidepdf.com/reader/full/2-stat-deskriptif 32/37

41

nilai rendah terdekat : nilai pengamatan terkecil yang terletak antara Q1 dengan nilai batas dalam bawah

nilai atas terdekat : nilai pengamatan terbesar yang terletak antara Q3 

dengan nilai batas dalam atas

Setiap nilai pengamatan yang terletak di luar  batas dalam (bawah maupun atas)

disebut pencilan ringan (mild outlier ), sedangkan nilai pengamatan yang terletakdi luar  batas luar  (bawah maupun atas) disebut pencilan ekstrim (extremeoutlier ).

Langkah-langkah untuk membuat diagram kotak adalah sebagai berikut:

(i) Buat kotak atau persegi panjang yang panjangnya mulai dari Q1 sampai Q3 (ii) Buat garis melintang di dalam kotak untuk menunjukkan posisi median(iii) Hubungkan nilai Q1 dan nilai rendah terdekat dengan garis, demikian juga

untuk nilai Q3 dan nilai atas terdekat  (iv) Tandai nilai pencilan ringan dengan ‘×’ dan pencilan ekstrim dengan ‘o’.

Diagram kotak akan lebih mudah dibuat jika data tersebut telah diurutkan lebihdulu (dari kecil ke besar, atau sebaliknya), misalnya dalam bentuk diagram batang

dan daun.

Contoh 2.10

Data di bawah ini adalah hasil pengukuran berat basah dari 78 ring sampel tanah(data hasil penelitian Dr G.Z. Anshari, dkk, 2002 (belum dipublikasikan):

85 120 89 119 98 119 120 126 131 114 104 101 118121 122 123 129 114 121 88 101 34 132 124 97 92102 107 102 101 110 136 118 119 115 93 111 107 113110 134 120 117 112 110 70 142 106 107 65 114 104105 124 107 130 84 129 100 72 111 132 117 83 96115 94 108 132 113 135 94 91 117 94 133 86 102

Untuk memudahkan dalam membuatdiagram kotak, data tersebut dapatdisusun lebih dulu ke dalam bentukdiagram batang dan daun. Untukkasus ini, diagram tersebut adalahsebagai berikut:

1 3 41 41 52 6 54 7 0210 8 34568919 9 12344467835 10 0111222445677778

(21) 11 00011233444557778899922 12 00011234469910 13 0122234561 14 2

Page 33: 2 Stat Deskriptif

7/22/2019 2 Stat Deskriptif

http://slidepdf.com/reader/full/2-stat-deskriptif 33/37

42

Karena n = 78, makamedian adalah data yang ke (78 + 1)/2 = 39,5 atau rata-rata dari data yang ke-39 dan ke-40, yaitu 111Q1 adalah data yang ke (78 + 1)/4 = 19,75 sehinggaQ1 = 98 + 0,75(100 – 98) = 99,5Q3 adalah data yang ke 3(78 + 1)/4 = 59,25 sehingga

Q3 = 120 + 0,25(121 – 120) = 120,25Kisaran antar kuartil (IQR) = Q3 – Q1 = 120,25 – 99,5 = 20,75batas dalam bawah (lower inner fence) = Q1 – 1,5 × IQR = 68,375batas dalam atas (upper inner fence) = Q3 + 1,5 × IQR = 151,375batas luar bawah (lower outer fence) = Q1 – 3 × IQR = 37,25batas luar atas (upper outer fence) = Q3 + 3 × IQR = 182,5nilai rendah terdekat : 70nilai atas terdekat : 142 (= nilai maksimum)Oleh karena itu, dalam data ini terdapat dua buah nilai pencilan, yaitu 65 yangmerupakan pencilan ringan dan 34 yang merupakan pencilan ekstrim.

Diagram kotak dari data tersebut disajikan dalam gambar 2.16.

142.00

120.25

111.00

99.50

70.00

34.00

   b  e  r  a   t_   b  a  s  a   h

Q1

Md

Q3

 

Gambar 2.16 Diagram kotak dari berat basah sampel tanah

 

Beberapa informasi yang dapat kita peroleh dari tampilan suatu diagram kotakdiantaranya adalah sebagai berikut:

1. Pusat distribusi data ditunjukkan oleh garis median di dalam kotak

2. Panjang kotak menunjukkan ukuran penyebaran/keragaman data, dalam halini adalah kisaran antar kuartil

Page 34: 2 Stat Deskriptif

7/22/2019 2 Stat Deskriptif

http://slidepdf.com/reader/full/2-stat-deskriptif 34/37

43

3. Posisi garis median dalam kotak juga dapat digunakan sebagai suatu indikasike-simetri-an data di sekitar pusat distribusinya.

4. Panjang garis yang menghubungkan nilai kuartil (ujung kotak) dengan nilai-nilai terdekatnya dapat digunakan sebagai tambahan informasi tentangkecondongan (skewness) di ujung-ujung distribusi data

5. Kemungkinan adanya nilai pencilan dalam data

Soal-soal latihan

2.1 Sebutkan tiga metode yang biasa digunakan untuk menjelaskan karakteristikdata. Jelaskan tujuan penggunaannya.

2.2 Jelaskan perbedaan antara tabel distribusi frekuensi dan tabel distribusifrekuensi relatif.

2.3 Suatu penelitian dirancang untuk mengamati sifat-sifat fisik lahan gambut.Dari sampel tanah yang diambil diperoleh hasil pengukuran kadar air sampelsebagai berikut (dalam %):

41 56 54 54 63 46 69 45 65 49 65 49 51

39 66 42 68 66 71 60 62 69 54 54 56 61

40 68 34 66 28 77 68 50 58 59 61 52 56

42 64 37 63 54 59 42 63 65 65 60 63 73

39 67 34 73 25 70 46 60 56 54 72 45 63

59 42 45 75 35 77 51 56 53 60 50 48

Sumber: Data hasil penelitian Dr Gusti Zakaria Anshari, dkk. 2002 (belumdipublikasikan)

a. Buatlah tabel distribusi frekuensi dari data tersebut dengan menggunakan6 interval kelas, dan gambarkanlah histogram frekuensinya

b. Hitung distribusi frekuensi relatifnya dan gambarkan pula histogramfrekuensi relatifnya.

2.4 Data berikut ini adalah nilai rata-rata tugas Matematika dari 63 orangmahasiswa Fakultas Pertanian pada suatu perguruan tinggi.

80.00 75.00 63.33 76.00 46.67 83.33 75.00 75.00 47.67

45.00 75.00 86.67 71.67 83.33 73.33 66.67 74.33 75.00

74.00 85.00 45.00 76.67 85.00 74.33 71.67 73.33 73.33

74.33 73.33 71.67 76.67 85.00 73.33 71.67 73.33 70.00

76.67 85.00 75.00 53.33 70.00 71.67 81.67 78.33 82.67

78.33 73.33 50.00 73.33 88.33 82.67 89.00 78.33 75.00

85.00 49.33 48.33 71.67 71.67 46.67 71.67 85.00 71.00

Page 35: 2 Stat Deskriptif

7/22/2019 2 Stat Deskriptif

http://slidepdf.com/reader/full/2-stat-deskriptif 35/37

44

 c. Buatlah tabel distribusi frekuensi dari data tersebut dengan menggunakan

7 interval kelas, dan gambarkanlah histogram frekuensinyad. Hitung distribusi frekuensi relatifnya dan gambarkan pula histogram

frekuensi relatifnya.

2.5 Jelaskan kelebihan penyajian data dalam bentuk diagram batang dan daun

dibandingkan dengan distribusi frekuensi

2.6 Buat diagram batang dan daun dengan menggunakan data dalam soal 2.3 diatas. Bandingkan hasilnya dengan histogram yang telah anda buat.

2.7 Buat diagram batang dan daun dengan menggunakan data dalam soal 2.4 diatas. Bandingkan hasilnya dengan histogram yang telah anda buat.

2.8 Tenaga pengajar di sebuah fakultas pada suatu perguruan tinggi terdiri atas15 orang berpendidikan S3, 45 orang S2 dan 30 orang S1. Sajikanlah datatersebut dalam bentuk diagram batang dan diagram lingkaran

2.9 Data berikut ini adalah persentase kontribusi berbagai sektor usaha terhadapProduk Domestik Regional Bruto Propinsi Kalimantan Barat pada tahun 2000

Sektor usaha Kontribusi terhadap PDRB

Pertanian 25,8Pertambangan 1,4Industri 23,6Listrik, gas dan air 0,8Bangunan 5,7Perdagangan 21,3

 Angkutan dan komunikasi 7,0Keuangan 5,5Jasa 8,9

Sumber: BPS 2001. Kalimantan Barat dalam angka 2000. BadanPusat Statistik Propinsi Kalimantan Barat

a. Layakkah jika data tersebut disajikan dalam bentuk diagram garis?Jelaskan

b. Buatlah diagram lingkaran yang efisien dari data tersebut (Petunjuk:beberapa sektor usaha tertentu dapat digabungkan untuk menghindarkanadanya juring lingkaran yang terlalu kecil).

2.10 Ukuran pemusatan data yang manakah (modus, median, rata-rata) yangsangat sensitif terhadap nilai-nilai yang ekstrim?

2.11 Ukuran pemusatan data apakah yang digunakan untuk menunjukkan nilaidengan frekuensi tertinggi?

Page 36: 2 Stat Deskriptif

7/22/2019 2 Stat Deskriptif

http://slidepdf.com/reader/full/2-stat-deskriptif 36/37

45

2.12 Jika di dalam data terdapat nilai-nilai yang ekstrim, ukuran pemusatanmanakah yang sebaiknya digunakan?

2.13 Ukuran pemusatan yang manakah yang memperhitungkan semua nilai dalamdata dalam perhitungannya?

2.14 Jika dalam suatu set data, sebuah nilai yang agak lebih besar dari nilai rata-

rata data tersebut diganti dengan nilai yang jauh lebih besar, bagaimanakahpengaruhnya terhadap nilai rata-ratanya, apakah menjadi lebih besar, lebihkecil ataukah tetap sama saja? Bagaimana pula pengaruhnya terhadapmedian?

2.15 Data berikut ini adalah hasil pengukuran kandungan Carbon-organik dalamtanah (%) dari 48 sampel tanah (hasil penelitian Sdr. Sonny Cahyono RosoSaputro, Fakultas Pertanian, Untan, 2002)

0.61 1.47 2.67 1.81 0.94 1.78 0.24 1.57

1.41 1.19 2.84 1.06 1.35 0.58 0.58 0.58

1.03 0.45 2.01 2.07 0.96 0.08 1.36 0.24

1.02 0.94 3.22 1.34 1.24 0.49 0.24 0.08

1.19 1.08 1.35 1.82 1.45 2.01 1.94 1.20

1.16 0.54 1.49 1.91 1.05 0.95 1.48 1.16

Tentukan median, modus dan rata-rata sampel tersebut. Buatlah diagrambatang dan daun dari data tersebut

2.16 Apakah perbedaan antara ukuran pemusatan dan ukuran penyebaran data?

2.17 Apakah fungsi dari ukuran penyebaran data?

2.18 Tentukan kisaran antar kuartil (IQR) dari data dalam soal 2.15

2.19 Apakah perbedaan antara simpangan baku dan varians?

2.20 Tentukan simpangan baku dan varians dari data dalam soal 2.15 di atas

2.21 Daftar distribusi frekuensi berikut ini adalah gaji per bulan (dalam ratusan riburupiah) dari 80 orang sarjana baru yang baru mulai bekerja

Gaji per bulan (×100.000 Rp.) Frekuensi

8 sampai 10 610 sampai 12 1312 sampai 14 1714 sampai 16 2016 sampai 18 918 sampai 20 620 sampai 22 522 sampai 24 4

Tentukan rata-rata, median dan varians dari data tersebut.

Page 37: 2 Stat Deskriptif

7/22/2019 2 Stat Deskriptif

http://slidepdf.com/reader/full/2-stat-deskriptif 37/37

46

2.22 Suatu survey dilakukan terhadap sejumlah penginapan dan hotel di sebuahkota. Salah satu variabel pengamatan dalam survey tersebut adalah tarif kelas ekonomi di penginapan/ hotel tersebut. Dari hasil survey tersebutdiperoleh data sebagai berikut:

Tarif menginap per malam(× Rp. 10.000,-) Frekuensi

20 sam ai 40 140 sampai 60 760 sampai 80 1480 sampai 100 6100 sampai 120 3120 sampai 140 4140 sampai 160 1

Tentukan rata-rata, median dan varians dari data tersebut

2.23 Buatlah diagram kotak dari data dalam soal 2.15

2.24 Sajikanlah data dalam soal 2.3 dan 2.4 dalam bentuk diagram kotak