statdesk resume

56
UKURAN DISPERSI Ukuran yang menyatakan atau memberikan gambaran tentang penyebaran data. Kelompok A Kelompok B 65 73 42 77 66 74 54 77 67 77 58 85 68 77 62 93 71 77 67 100 Dari data nilai ujian statistik diatas dapat diperoleh informasi sebagai berikut : Kelompok A Kelompok B Mean 71,5 71,5 Median 72 72 Modus 77 77 Dengan melihat mean, median dan modus kedua kelompok tersebut dapat disimpulkan bahwa kelompok A dan kelompok B memiliki performance yang sama dalam test statistik, tetapi jika dilihat data sebenarnya hasilnya tidaklah demikian. Pengamatan hasil tes sebenarnya menunjukkan bahwa nilai tes kelompok A cenderung lebih menggerombol dibanding nilai kelompok B, dengan kata lain nilai kelompok B lebih menyebar dibanding kelompok A. Agar informasi yang diperoleh lebih baik, dalam hal ini diperlukan ukuran penyebaran atau keragaman data (dispersi). Ukuran dispersi yang sering digunakan dalam statistik, diantaranya adalah : range, varians dan simpangan baku. Range (Rentang)

Upload: nurhidayati-septian

Post on 26-Jun-2015

422 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Statdesk Resume

UKURAN DISPERSI

Ukuran yang menyatakan atau memberikan gambaran tentang

penyebaran data.

Kelompok A Kelompok B

65 73 42 77

66 74 54 77

67 77 58 85

68 77 62 93

71 77 67 100

Dari data nilai ujian statistik diatas dapat diperoleh informasi sebagai

berikut :

Kelompok A Kelompok B

Mean 71,5 71,5

Median 72 72

Modus 77 77

Dengan melihat mean, median dan modus kedua kelompok

tersebut dapat disimpulkan bahwa kelompok A dan kelompok B

memiliki performance yang sama dalam test statistik, tetapi jika dilihat

data sebenarnya hasilnya tidaklah demikian. Pengamatan hasil tes

sebenarnya menunjukkan bahwa nilai tes kelompok A cenderung lebih

menggerombol dibanding nilai kelompok B, dengan kata lain nilai

kelompok B lebih menyebar dibanding kelompok A. Agar informasi

yang diperoleh lebih baik, dalam hal ini diperlukan ukuran penyebaran

atau keragaman data (dispersi).

Ukuran dispersi yang sering digunakan dalam statistik, diantaranya

adalah : range, varians dan simpangan baku.

Range (Rentang)

Range (R) adalah perbedaan (selisih) antara nilai tertinggi

dengan nilai terendah data. Range merupakan ukuran paling

sederhana untuk mengukur keragaman data. Kelemahan utama dari

range yaitu tidak dilibatkannya seluruh nilai observasi

Data belum dielompokkan

Contoh : data 10, 11, 12,  13,  15, 16, 18, dan 19

Page 2: Statdesk Resume

Sehingga R = 19 - 10 = 9.

Data yang dikelompokkan (distribusi frekuensi)

Untuk data berkelompok, range dapat ditentukan dengan :

H = tepi atas kelas terakhir

L = tepi bawah kelas pertama

Contoh: Distribusi frekuensi nilai ujian calon pegawai :

Nilai Ujian Frekuensi

50 - 54

55 - 59

60 - 64

65 - 69

70 - 74

75 - 79

80 - 84

85 - 89

30

70

80

120

70

10

8

7

R = H - L

R = 89,5 - 50,5 = 39

Varians ( σ 2 )

Dari definisi diatas dapat disimpulkan bahwa varians melibatkan

seluruh nilai pengamatan, sehingga relatif lebih baik dari range

sebagai ukuran dispersi.

Varians merupakan ukuran dispersi yang paling memenuhi

kriteria statistik, namun satuan yang diperoleh tidak sama dengan

satuan data aslinya, sehingga akan mengalami kesulitan dalam

interpretasi data.

Untuk data belum dikelompokkan

σ 2=Σ(X i−μ)2

NS2=

Σ( x i− x )2

n−1

Untuk data berkelompok

R = H - L

DefinisiVarians adalah rata-rata dari kuadrat deviasi ( simpangan ) seluruh nilai pengamatan terhadap men data

Page 3: Statdesk Resume

σ 2=Σf i .(mi−μ )2

Σf i

Standar deviasi ( simpangan baku )

Standar deviasi merupakan akar dari varians. Ukuran ini sering

digunakan dalam statistik karena memiliki satuan yang sama dengan

data aslinya.

Formula standar deviasai adalah :

Data belum dikelompokkan

Data yang dikelompokkan

mi= nilai tangah kelas ke i

fi= frekuensi kelas ke i

Koefisien Variasi ( KV )

Koefisien variasi mengukur keragaman data relatif terhadap rata-

rata data tersebut. Koefisien ini digunakan untuk membandingkan

keragaman beberapa kelompok (data) yang memiliki rata-rata

berbeda.

KV=σμ

. 100 %

Data A dikatakan lebih homogin / seragam dari data B jika dan hanya

jika koefisien variasi data A lebih kecil dari koefisien variasi data B.

Contoh :

Informasi mengenai volume penjualan dua kelompok salesman

sauatu perusahaan adalah sebagai berikut :

Kelompok A B

σ=√ Σ(X i−μ )2

N

σ=√ Σf .i (mi−μ )2

Σf i

Page 4: Statdesk Resume

Rata-rata (mean) 160 120

Simpangan baku 25 20

Jika dilihat simpangan baku, maka dapat disimpulkan bahwa

volume penjualan kelompok B lebih seragam (homogin) dibanding

kelompok A, namun hal itu tidak dapat dijadikan dasar penarikan

kesimpulan karena rata-rata kedua kelompok berbeda. Ukuran yang

paling tepat untuk penarikan kesimpulan mengenai perbedaan

keragaman adalah koefisien variasi, sehingga :

KV=σμ

. 100 % =

25160 = 16 %

KV=σ

μ. 100 %

=

20120 = 17 %

Kesimpulan : Karena koefisien variasi kelompok A (KV A) lebih kecil dari

KVB maka volume penjualan kelompok salesman A lebih seragam

dibanding kelompok B.

Standar score ( angka baku ) : Z

Standar score merupakan kelipatan dari simpangan baku dimana

suatu nilai terletak dibawah atau diatas rata-rata (mean). Kegunaan

angka baku diantaranya untuk menentukan posisi suatu nilai apakah

secara relatif lebih baik dibandingkan nilai-nilai lain.

X = nilai yang akan dibandingkan

μ = rata-rata

σ = simpangan baku

Contoh :

Informasi mengenai volume penjualan dua kelompok salesman

sauatu perusahaan adalah sebagai berikut :

Kelompok A B

Z= X−μσ

Page 5: Statdesk Resume

Rata-rata (mean) 160 120

Simpangan baku 25 20

Misal Andi adalah salesman dari kelompok A dengan volume penjualan

170 unit dan Budi adalah saleman dari kelompok B dengan volume

penjualan 130 unit, jika ingin dibandingkan siapa yang lebih

berprestasi Andi atau Budi, maka dapat digunakan angka baku, yaitu :

Z Andi=170−16025 = 0,40

ZBudii=130−12020 = 0,50

Dari perhitungan diatas, dapat disimpulkan karena angka baku Budi (Z

Budi) lebih besar dari Z Andi maka secara relatif Budi lebih berprestasi

dari Andi.

UKURAN PEMUSATAN DATA

Cara menyajikan data dengan metode numerik yang biasa dilakukan adalah menentukan ukuran pusat dan ukuran posisi data.

Ukuran pusat yang dipelajari meliputi : rata-rata hitung (arithmetic mean), median dan modus, sedangkan ukuran posisi meliputi : kuartil, desil dan persentil.

UKURAN PEMUSATANKumpulan nilai (data) biasanya memiliki kecenderungan untuk

memusat pada satu nilai tertentu yang disebut dengan ukuran pusat. Nilai tersebut cukup representatif untuk menggambarkan keseluruhan nilai (data). Disebut ukuran pusat karena pada umumnya nilai tersebut memiliki lokasi dibagian tengah atau pusat dari distribusi data.

Rata-rata hitung atau mean ( μ )Sifat keberadaan rata-rata hitung adalah tunggal, artinya dalam

sekelompok nilai observasi (data) hanya ada satu rata-rata hitung. Rata-rata hitung ini menunjukkan bahwa penyebaran data cenderung berpusat pada nilai tersebut.Notasi yang sering digunakan untuk menyatakan rata-rata hitung populasi adalah μ dan rata-rata sampel adalah x .

Cara menentukan rata-rata hitung : Untuk data mentah (atau belum dikelompokkan)Mean dihitung dengan menjumlahkan seluruh nilai observasi dibagi dengan frekuensi observasi.

μ=ΣX i

n

Page 6: Statdesk Resume

Xi = nilai observasi ke – in= jumlah observasi

Untuk data yang disusun dalam distribusi frekuensi

fi= frekuensi kelas ke – i

mi = nilai tengah (mid point) kelas ke – in = jumlah observasi

Contoh:Tabel : Distribusi frekuensi upah per-minggu 260 buruh pabrik

Klas Interval(ribuan Rp)

Jumlah buruh(fi)

Nilai Tengah(mi)

fi . mi

2,0 - 3,94,0 - 5,96,0 - 7,98,0 - 9,910,0 - 11,912,0 - 13,914,0 - 15,916,0 - 17,918,0 - 19,9

12193970522421158

2,954,956,958,9510,9512,9514,9516,9518,95

35,4094,05271,05626,50569,40310,80313,95254,25151,60

Total 260 - 2.627,00

Keterangan :

Pada tabel diatas sejumlah 12  orang buruh  pada klas pertama memiliki upah per minggunya  berkisar 2,0 s/d 3,9 (ribu rupiah), walaupun untuk tiap-tiap  buruh tidak diketahui besar upah per minggunya, oleh  karena itu dianggap bahwa 12 buruh yang memiliki upah  per-minggu  2,0 s/d 3,9 memiliki upah rata-rata 2,95  (ribu rupiah). Perkalian 12 dengan 2,95 (=35,40) adalah merupakan taksiran  jumlah upah perminggu  dari  12 buruh tersebut, demikian juga untuk kelas-kelas lain. Total kolom fi.mi (2.627,00) adalah taksiran total upah per minggu 260 buruh pabrik tersebut.Jadi  rata-rata upah per-minggu buruh parik tersebut sebesar :per minggunya adalah 10,10  (ribu rupiah).

μ=Σf imi

Σf i

=262 . 700260

= 10,10 (ribu rupiah) Atau dengan menggunakan rata-rata sementara:

μ=Σf imi

Σf i

Page 7: Statdesk Resume

x= x0+∑ fi. uin

.cDimana:X0 = rata-rata sementarafi = frekuensi kelas ke iui = simpangan kelas ke i terhadap    kelas rata-rata sementaran = banyaknya datac = interval kelas

Median ( Md )Sifat keberadaan median dari data adalah tunggal, median

merupakan nilai yang terletak ditengah-tengah serangkaian nilai yang telah diurutkan (dari terkecil sampai terbesar atau sebaliknya)

Median membagi nilai-nilai observasi (data) menjadi dua bagian sama besar sehingga 50% terletak dibawah median dan 50% lainnya diatas median. Kelebihan median adalah tidak dipengaruhi adanya data ekstrim. Median dapat digunakan bila skala pengukuran datanya minimal skala ordinal. Karena median belum banyak dikembangkan untuk keperluan inferensia, maka penggunaannya tidak sepopuler rata-rata hitung.

Cara menentukan median : Untuk data mentah (data belum dikelompokkan)Median dari data yang belum dikelompokkan adalah nilai yang terletak pada posisi :

Untuk data yang disusun dalam distribusi frekuensiUntuk data yang telah dikelompokkan, pertama kali ditentukan kelas median, yaitu kelas yang memuat median dengan rumus : (n+1) / 2Setelah itu nilai median ditentukan dengan pendekatan :

Keterangan :TB = tepi bawah kelas medianFk = frekuensi kumulatif sebelum kelas medianf = frekuensi kelas medianc = interval kelas

DefinisiMedian adalah nilai yang berada tepat ditengah serangkaian nilai observasi (data) yang berurutan

n+12

Md=TB+{ n2−Fk

f }.c

Page 8: Statdesk Resume

Contoh : Tabel-: Distribusi frekuensi dan frekuensi kumulatif ‘kurang dari’ upah per-minggu 260 Buruh pabrik

Interval Kelas(ribuan Rp)

Jumlah buruh (fi)

Frek. Kumulatif

2,0 - 3,94,0 - 5,96,0 - 7,98,0 - 9,910,0 - 11,912,0 - 13,914,0 - 15,916,0 - 17,918,0 - 19,9

12193970522421158

<1,95 <3,95 <5,95 <7,95<9,95<11,95<13,95<15,95<17,95<19,95

0123170140192216237252260

T o t a l n = 260

Median terletak pada kelas ke- 4, karena nilai ke (260 +1 ) / 2 = 130,5 ( terletak pada kelas ke-5), sehingga:

Md=9 ,95+{2602

−70

52 }. 2=9 ,95+2 ,31=12 ,26

Kesimpulan : 50 % buruh mendapat upah per-minggu kurang dari Rp 12.260,- dan 50 % sisanya mendapat upah per-minggu lebih besar dari Rp 12.260,-.

Modus (Mo)Sifat keberadaan modus adalah tidak tunggal, jika data memiliki

satu modus disebut unimodal, dua modus disebut bimodal dan lebih dari dua modus disebut multimodal. Data dapat juga tidak memiliki modus.

Untuk mencari modus data belum dikelompokkan dapat dilakukan dengan cara menghitung frekuensi tertinggi dari nilai-nilai observasi. Jika data sudah dikelompokkan dalam distribusi frekuensi, untuk mencari modus digunakan langkah-langkah sebagai berikut :

a. menentukan kelas modus, yaitu kelas yang memiliki frekuensi tertinggi

b. menentukan modus dengan rumus :

DefinisiModus adalah nilai – nilai yang memiliki frekuensi tertinggi

Page 9: Statdesk Resume

Keterangan :TB = tepi bawah kelas modusa = selisih frekuensi kelas modus dengan frekuensi kelas sebelum kelas modusb = selisih frekuensi kelas modus dengan frekuensi kelas setelah kelas modusc = interval kelas

Contoh :Data belum dikelompokkan :Jumlah anggota keluarga dari 10 keluarga yang diobservasi adalah sebagai berikut :7, 4, 4, 6, 5, 6, 6, 9,  5 dan 6.

Dari data diatas diperoleh bahwa nilai yang memiliki frekuensi kemunculan lebih banyak dibanding yang lain yaitu 6 dengan frekuensi sebanyak 3 (tiga) kali. Jadi modus data tersebut adalah 6.Data dalam bentuk distribusi frekuensi :

Tabel : Distribusi frekuensi upah per-minggu 260 buruh pabrik

Klas Interval(ribuan Rp)

Jumlah buruh(fi)

2,0 - 3,94,0 - 5,96,0 - 7,98,0 - 9,910,0 - 11,912,0 - 13,914,0 - 15,916,0 - 17,918,0 - 19,9

12193970522421158

Total 260

Kelas modus adalah kelas ke-4, karena memiliki frekuensi tertinggi yaitu 70, sehinggaa = 70 – 39 = 31b = 70 – 52 = 18

Mo=7 ,95+{3131+18 }.2=7 ,95+1 ,26=9 ,22

artinya sebagian besar buruh pabrik tersebut mendapat upah per-minggu sebesar Rp 9.220,-   

Hubungan Antara Mean, Median dan Modus

Bila sebuah distribusi data bermodus satu digambarkan dalam sebuah histogram, ordinat mediannya membagi sebuah histogram dalam 2 bagian yang sama. Sehingga bila distribusi tersebut simetris, maka rata-rata hitung= median= modus.

Mo=TB+{ aa+b }.c

Page 10: Statdesk Resume

Menurut Karl Pearson, bila distribusi dari variabel yang kontinyu memiliki modus tunggal serta menceng secara moderat, maka mediannya akan terletak kira-kira 2/3 dari seluruh jarak yang dihitung dari modus ke arah rata-rata hitungnya. Dan secara umum hubungan ketiga ukuran tsb dirumuskan sebagai:

mo= x−3 ( x−md )Kemudian jika:

mo>med>x , maka distribusi data tersebut menceng ke kanan

mo<med<x , maka distribuis data tersebut menceng ke kiri

KUARTIL ( q)

Kuartil membagi data (n) yang berurutan atas 4 bagian yang sama banyak.

------|------|-------|-------        Q1       Q2       Q3

Q1 = kuartil bawah (1/4n )Q2 = kuartil tengah/median (1/2n)Q3 = kuartil atas (1/4n )

Untuk data yang tidak dikelompokkan terlebih dahulu dicari mediannya, kemudian kuartil bawah dan kuartil atas.Untuk data yang dikelompokkan rumusan kuartil identik dengan rumusan mencari median.Q1 = L1 + [(1/4n - f1)/fQ1] . cQ3 = L3 + [(3/4n - f3)/fQ3] . c

DESIL ( D) Desil membagi data (n) yang berurutan atas 10 bagian yang sama besar. (D,, D2, D3, . . . . . . , D9)Di = Li + ((i/10)n - fi)/fDi . c

PERSENTIL ( P) Persentil membagi data (n) yang berurutan atas 100 bagian yang sama besar. (P1, P2, P3, . . . . . . ,P99)Pi = Li +( i/100 n - fi)/fPi . cCara mencari Desil dan Persentil identik dengan cara mencari kuartil.

BAB 1

PENGERTIAN STATISTIK DESKRIPTIF

1.1 Arti dan Kegunaan Data

Statistik Deskriptif adalah ilmu yang mempelajari tentang cara:

a. mengumpulkan data/informasi;

b. mengolah data hasil pengumpulan;

c. menyajikan data hasil pengolahan;

d. menganalisis data.

1.2 Tipe Skala Pengukuran Data

Page 11: Statdesk Resume

a. Skala Nominal

Contoh:

Laki-laki ; Perempuan (level laki-laki = level

perempuan)

b. Skala Ordinal

Data yang diukur mempunyai urutan kualitas/level

Contoh:

ranking 1 ; ranking 2 ; ranking 3

c. vcc Skala Interval

Contoh:

ukuran temperatur udara 00 Fahrenheit = - 180 Celcius, dan 00

Fahrenheit bukan berarti tidak ada temperatur

d. Skala Ratio

Contoh: mengukur panjang, lebar, berat, tinggi, isi, dan

sebagainya.

1.3 Pengumpulan dan Pengolahan Data

1.3.1Pengumpulan Data

a. Sensus

b. Survei

c. Eksperimen (Biasanya dilakukan di laboratorium)

d. Studi Kasus (Penelitian yang lebih mendalam)

Perbedaan Sensus dan Survei:

Sensus Populasi (Seluruh unit

yang diteliti)

1.- Waktu

- Biaya Besar

- Tenaga

2.Menyeluruh

3.Tingkat kesalahan (error)

nya kecil

4.Kurang rinci

Rata-rata (=)

Variance (=2)

Parameter

Proporsi (=P)

μ=∑i=1

N

X i

N=∑

i=1

N

X i= X1+X2+. ..+XN

Survei Sampel (yang diteliti

adalah sebagian dari populasi)

1. – Waktu

- Biaya Kecil

- Tenaga

2. Tidak menyeluruh

3. Errornya bisa besar

4. Rinci

Rata-rata (=X )

Variance (=S2) Statistik

Proporsi (=p)

X=∑i=1

n

X i

n=∑

i=1

n

X i= X1+X2+. . .+Xn

Xi = Sebagian dari variabel

yang diambil secara random

Page 12: Statdesk Resume

Xi = Variabel yang diteliti

(seluruhnya)

N = Jumlah seluruh variabel

tersebut dalam populasi

Ragam/variance (X)= 2=

(X1−μ )2N

+(X2−μ)2

N+ .. .+

(X N−μ )2N

=∑i=1

N

( X i−μ )2

N

Simpangan baku=standard

deviasi= √σ2=σ

n = Jumlah sampel yang

diambil dari populasi

Ragam/variance (X)= S2=

(X1−X )2n

+(X2−X )2

n+. ..+

( Xn−X )2n

=∑i=1

n

(X i−X )2

n

Simpangan baku=standard

deviasi= √s2=s

1.3.2Cara Pengumpulan Data

Wawancara langsung dengan responden

Kuesioner/daftar pertanyaan diberikan kepada responden

untuk kemudian diisi oleh responden

1.3.3Sumber data:

Primer, adalah data yang diperoleh langsung dari responden

Contoh: mengumpulkan data produksi kecap. Data diperoleh

dari perusahaan industri kecap

Sekunder, adalah data yang diperoleh dari pihak kedua

Contoh: mengumpulkan data produksi kecap yang datanya

diperoleh dari Departemen Perindustrian

Pengolahan Data

Cara mengolah data:

a. Manual, dengan langkah-langkah sebagai berikut:

b. Memakai paket program di komputer: SPPS, Minitab, microsoft

Excel, dan sebagainya

Data menurut sifatnya:

a. Kuantitatif contoh: tinggi badan: 160 cm; 169 cm

b. Kualitatif, contoh: jenis kelamin: peserta; laki-laki dan peserta

perempuan

Syarat data yang baik: - obyektif

- representatif

- reliabilitas

- tepat waktu (up to date)

- relevan

1.4 Penyajian Data

a. Tabel:

Page 13: Statdesk Resume

Tabel frekuensi

Tabel distribusi frekuensi

b. Grafik:

Grafik Batang

Grafik Lingkaran

Grafik Garis

Grafik Gambar

1.4.1 Tabel Frekuensi dan Grafik

a. Struktur tabel:

1. Nama (judul) tabel menunjukkan: mengenai apa, dimana, dan

kapan.

2. Badan tabel: terdiri dari beberapa kolom. Setiap kolom mepunyai

judul (dilengkapi dengan unit/satuannya) dan berisikan data.

3. Sumber data, dicantumkan dibagian bawah tabel.

b. Tabel:

Tabel ikhtisar, biasanya singkat, mudah dimengerti, bisa

diperoleh dari tabel referensi

Tabel referensi, merupakan tabel umum yang rinci untuk

kepentingan referensi

c. Jenis tabel frekuensi:

Tabel 1 arah

Tabel 2 arah

Tabel 3 arah atau lebih

DIAGRAM/GRAFIK:

a. Grafik garis (line chart)

b. Grafik gambar (Pictograf)

c. Grafik batang (bar chart)

d. Peta Statsitik (Statistical Map)

e. Grafik/digram lingkaran (Pie chart)

1.4.2. Tabel Distribusi Frekuensi dan Grafik

Jenis Tabel:

Page 14: Statdesk Resume

Tabel Distribusi Frekuensi

Tabel Distribusi Frekuensi Relatif

Tabel Distribusi Frekuensi Kumulatif

Tabel Distribusi Frekuensi Kumulatif “kurang dari”

Tebel Distribusi Frekuensi Kumulatif “lebih dari”

Cara membuat tabel distribusi frekuensi

Contoh: n = 67

Dengan nilai data adalah sebagai berikut:

1. Menentukan jumlah kelas (k)

a. Dengan menggunakan rumus Sturges:

k = 1 + 3,3 log n

= 1 + 3,3 log 67 = 7,04 7

b. Cara lain: 2k = n

2. Menentukan interval kelas (I)

I=nilai terbesar−nilai terkecilk

=54−237

=4 ,43≈5

3. Menentukan batas bawah dan batas atas kelas

1. Tabel Distribusi Frekuensi Relatif:

Untuk keperluan analisis, selain dari tabel frekuensi bisa juga

dari tabel frekuensi relatif dan kumulatif.

Tabel 7: Distribusi Frekuensi Relatif Pegawai STIS (Staf)

menurut Golongan Umur Tahun 2004

Umur (Tahun) Frekuensi

(f)

F Relatif

(1) (2) (3)23-27 5 5/67 =

7,463%28-32 11 11/67 = …%33-37 21 21/67 = …%38-42 17 17/67 = …%43-47 6 6/67 = …%48-52 5 5/67 =

7,463%53-57 2 2/67 = …%Jumlah 67 100

Sumber: Bagian Administrasi Umum STIS

Page 15: Statdesk Resume

Dari tabel 7 ini dapat dibaca bahwa ada 7,46 % pegawai yang

hampir pensiun.

3. Tabel Distribusi Frekuensi Kumulatif:

Tabel 8: Distribusi Frekuensi Kumulatif Pegawai STIS

menurut Golongan Umur Tahun 2004

Umur (Tahun) Frekuensi

(f)

F Kumulatif

(1) (2) (3)23-27 5 5

28-32 11 16

33-37 21 37

38-42 17 54

43-47 6 60

48-52 5 65

53-57 2 67

Jumlah 67

Sumber: Data Tabel 7

Dari tabel 8 ini dapat diketahui bahwa sebagian besar pegawai

STIS masih berumur muda (atau kurang dari 43 tahun)

4. Tabel Distribusi Kumulatif ‘kurang dari’:

Tabel 9: Distribusi Frekuensi Kumulatif “kurang dari”

Pegawai STIS menurut Golongan Umur Tahun 2004

Umur (Tahun) F kurang dari

Kurang dari 22,5 0

Kurang dari 26,5 5

Kurang dari 32,5 16

Kurang dari 36,5 37

Kurang dari 42,5 54

Kurang dari 46,5 60

Kurang dari 52,5 65

Kurang dari 56,5 67

Sumber: Data Tabel 7

5. Tabel Distribusi Kumulatif ‘lebih dari’:

Tabel 10: Distribusi Frekuensi Kumulatif “lebih dari”

Page 16: Statdesk Resume

Pegawai STIS menurut Golongan Umur Tahun 2004

Umur (Tahun) F lebih dari

Lebih dari 22,5/

22,5 atau lebih 67

26,5 atau lebih 62

32,5 atau lebih 51

36,5 atau lebih 30

42,5 atau lebih 13

46,5 atau lebih 7

52,5 atau lebih 2

56,5 atau lebih 0

Sumber: Data Tabel 7

Dari tabel distribusi kumulatif ‘kurang dari ‘dan ‘lebih dari’ dapat

dibuat gambar/grafik yaitu kurva ogive.

KURVA OGIVE

05

16

37

5460

65 676762

51

30

13

027

0

10

20

30

40

50

60

70

80

22,5 26,5 32,5 36,5 42,5 46,5 52,5 56,5

Tepi Bawah Kelas Umur

Fre

ku

en

si

Ku

mu

lati

f

Dari kurva ogive akan diperoleh frekuensi kumulatif pada kelas

interval data tertentu. Sebagai contohnya, misalnya jumlah pegawai

yang umurnya lebih dari 33 tapi kurang dari 47 tahun sebanyak 62−7

atau 55 orang.

1.5 Analisis Data

Kurang dari

Lebih dari

Page 17: Statdesk Resume

1. Data hasil sensus dapat dianalisis dengan cara deskriptif yaitu

menginterpretasikan data hasil pengolahan

2. Data hasil survey dapat dianalisis dengan cara:

a Deskriptif

b Inferensia, yaitu dengan cara melakukan uji statistik

Dari hasil uji statistik dapat diambil kesimpulan tentang

parameter (populasi).

BAB 2

PENGUKURAN LOKASI DAN DISPERSI

Ukuran-ukuran statistik yang akan dipelajari antara lain:

Uraian Ukuran Data tidak berkelompok Data berkelompok

Ukuran

pemusatan

Rata-rata hitung

(tertimbang/tidak

tertimbang)

Rata-rata hitungRata- rata ukur

(tertimbang/tidak

tertimbang)

Rata- rata harmonis

Nilai tengah/MedianNilai

tengah/Median

Modus Modus

Ukuran lokasi

Kuartil Kuartil

Desil Desil

Persentil Persentil

Ukuran

Dispersi

Rentang/range Rentang/range

Ragam/variance Ragam/variance

Standart Deviasi Standart Deviasi

Koefisien Variasi Koefisien Variasi

2.1. Penghitungan untuk Data yang belum

Dikelompokkan/Data Tunggal

1. Rata-rata Hitung

a. Rata-rata hitung sederhana

Rata-rata hitung ini menunjukkan bahwa penyebaran data

cenderung berpusat pada nilai tersebut.

Page 18: Statdesk Resume

Notasi yang sering digunakan untuk menyatakan rata-rata hitung

populasi adalah μ dan rata-rata sampel adalah x .

Cara menentukan rata-rata hitung :

Rata-rata hitung dihitung dengan menjumlahkan seluruh nilai

observasi dibagi dengan frekuensi observasi.

Nilai rata-rata hitung untuk populasi adalah:μ=

ΣX i

N

Nilai rata-rata hitung untuk sampel adalah: x=

ΣXi

n

Xi = nilai observasi ke – i

N = jumlah observasi populasi

n= jumlah observasi dari sampel

Contoh:

Produksi barang A (x) mulai dari bulan Januari sampai dengan

Desember 2002 (dalam ton) sebagai berikut: 3,5 ; 3 ; 4 ; 4 ; 3 ; 4 ; 4 ; 5

; 4,5 ; 5 ; 3 ; 4 ; 5.; n = 12

Jadi rata-rata produksi barang A per bulan (x ) pada tahun 2002

adalah 3,96 ton.

b. Rata-rata hitung tertimbang ( x )

Penimbang (wi) adalah suatu angka pembanding suatu nilai agar

lebih berarti.

Pemilihan angka penimbang (timbangan) adalah angka atau

ukuran yang relatif (ada hubungannya dengan data yang dihitung).

Contoh:

Tabel 11. Jumlah Produksi Barang A menurut Jumlah Hari Kerja per

Bulan

Tahun 2002

Bulan Produksi Hari Kerja (wi- (xi wi)

x=∑i=1

n

X i

n=3,5+3+4+4+3+4+4,5+4,5+5+3+4+5

12=47 ,5

12=3 ,96

Page 19: Statdesk Resume

(xi) )

Januari 3,5 20 70

Februari 3 18 54

Maret 4 22 88

April 4 21 84

Mei 3 19 57

Juni 4 21 84

Juli 4,5 22 99

Agustus 4,5 21 94,5

September 5 21 105

Oktober 3 17 51

November 4 21 84

Desember 5 23 115

Jumlah 246 985,5

Jadi rata-rata produksi barang A per bulan ( x )adalah 4

ton,dengan penimbang yang digunakan adalah jumlah hari kerja per

bulan.

2. Rata-rata Ukur (Geometric Mean)

Digunakan untuk mengukur rata-rata persentase tingkat

perubahan dalam suatu rentang waktu (average percentage rates of

change over time). Misalnya rata-rata persentase tingkat perubahan

hasil penjualan, produksi, harga dan pendapatan selama beberapa

tahun tertentu. Rumus untuk menghitung rata-rata ukur (Gm) adalah

sbb:

Dimana:

n = Jumlah rentang waktu untuk penghitungan

Xi = Nilai perubahan persentase per satuan waktu

x=∑i=1

n

x iwi

∑ wi

=985246

=4 ,00

Gm=n√x1 .x2 . .. xn=( x1 .x2 . .. xn )

1n

LogGm=log ( x1 . x2 .. . .xn )1/n=1

nlog ( x1 . x2 . . .. xn )=

1n

( log x1+ log x2+.. .+log xn )

LogGm=1n∑i=1

n

log xi

Gm=anti log1n∑i=1

n

log x i

Page 20: Statdesk Resume

Contoh: Untuk mengukur tingkat perubahan pinjaman

pertahun

Diketahui:

Jumlah pinjaman tahun 2000 = 1,086 milyar, tahun 2001 =

2,041 milyar, tahun 2002 = 24,669 milyar

Perubahan dari tahun 2000 – 2001 = 1,879

Perubahan dari tahun 2001 – 2002 = 12,086

Sehingga:

n=2 dan X1= 1,879 ; X2= 12,086

Rata-rata perubahan = Gm =

Artinya rata-rata tingkat perubahan pinjaman per tahun untuk tahun

2000-2002 adalah 4,765 milyar.

Rata-Rata Ukur Tingkat Bunga Majemuk (Compound Interest)

Rata-rata ukur yang digunakan untuk menghitung tingkat

perubahan relatif (average relative) suatu nilai. Misalkan untuk

menghitung hasil tabungan dengan suku bunga tertentu. Rumus untuk

menghitungnya adalah sbb:

r=n√ pn

po

−n

Dimana:

r = persentase tingkat perubahan

po = jumlah tabungan/investasi awal tahun

pn = jumlah tabungan/investasi akhir tahun

n = banyaknya waktu (tahun)

3. Median (Me)/ Nilai Tengah

Penggunaan Me akan praktis dan efisien bila n cukup besar. Me

biasanya sangat umum digunakan pada data kualitatif. Pada data

kuantitatif, nilai Me tidak dipengaruhi oleh data yang ekstrim. Data sel

diurutkan dari terkecil ke terbesar.

- Jumlah data genap: x1, x2, x3, x4, x5, x6, x7, x8 n = 8

Letak nilai median = (n+1)/2 = 9/2 = 4,5 atau letak nilai median

adalah nilai ke-4,5, sehingga median = (xk + xk+1)/2 = (x4 +x5)/2

- Jumlah data ganjil: x1, x2, x3, x4, x5, x6, x7, x8, x9 n = 9

√(1 ,879)(12 ,086 )=4 ,765

Page 21: Statdesk Resume

Letak nilai median = (k+1)/2=5 atau letak nilai median adalah nilai ke-

5, sehingga median adalah = X5.

4. Modus

Nilai yang mempunyai frekuensi terbanyak

5. Kuartil. Desil dan Persentil

Merupakan ukuran untuk mengetahui nilai data pada urutan

sekelompok data tersebut

Kuartil (Q i)

Kuartil membagi data (n) yang berurutan atas 4 bagian yang

sama banyak.

------|------|-------|-------

        Q1       Q2       Q3

Dimana:

Q1= kuartil bawah (1/4n )

Q2 = kuartil tengah/median (1/2n)

Q3 = kuartil atas (1/4n )

Untuk mendapatkan kuartil ke-i (qi)caranya adalah dengan membagi

data yang telah diurutkan dari kecil ke besar menjadi 4 bagian yang

sama.

x1 x2 x3 x4 x5 x6 x7 x8

Letak Qi = urutan

i( n+1)4 ; i = 1,2,3

2 5 8 10 11 14 17 20

Letak Q1 = urutan ke

1(n+1)4 = urutan ke

1(8+1)4 =

94 = 2¼

Nilai yang ke 2¼ terletak antara x2 dan x3.

Jadi Q1 = 5 +

(8−5)4 = 5,75

Letak Q2 = urutan ke

2(n+1)4 = urutan ke

2(8+1)4 =

184 = 4½

Jadi Q2 = 10 + ½ (11 – 10) = 10,5 = median

Desil (Di)

Untuk mendapatkan desil ke-i (Di) caranya adalah dengan

membagi data yang sudah diurutkan dari kecil ke besar menjadi 10

bagian.

- Letak nilai Di = urutan ke

i( n+1)10 , i = 1, 2, 3, …, 9

Page 22: Statdesk Resume

Contoh: x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x11 x12 x13 x14 x15

- Letak nilai D2 = urutan ke

2(15−1 )10

=3210

=32

10

Jadi D2 = x3+

210

( x4−x3 )

- Letak nilai D9 urutan ke

9(15+1 )10

=14410

=144

10

Jadi D9 = x14+

410

( x15−x14)

Persentil (Pi)

Untuk mendapatkan persentil ke-i (Pi) caranya adalah dengan

membagi data yang sudah diurutkan dari kecil ke besar menjadi 100

bagian.

Letak Pi = urutan ke

i( n+1)100 ; i = 1, 2, 3, 4, 5, …, 99

Letak P77 = urutan ke

77(150+1 )100

=16627100

Jadi P77 = x166+

27100

( x117−x116)

6. Rentang, simpangan rata-rata, ragam dan simpangan baku

Rentang ( Range ) :

Adalah jenis pengukuran penyebaran/dispersi secara kasar,

cepat dan sederhana, yaitu dengan cara menghitung selisih dari 2 nilai

ekstrim besar dan ekstrim kecil.

Rentang antar kuartil = Q3 – Q1

Simpangan rata-rata (d x )

Merupakan pengukuran dispersi yang lebih baik dibanding range

karena pengukurannya dengan cara menghitung dispersi setiap nilai

observasi dari rata-ratanya.

d x=1n∑|x i− x|

dimana: xi = nilai hasil observasi

x = rata-rata hitung

Contoh:

Pengamatan kelompok 1 : x1i = 10 ; 5 ; 3 ; 6 x1 = 6

Page 23: Statdesk Resume

Pengamatan kelompok 2 : x2i = 6 ; 5 ; 7 ; 6 x2 = 6

Rata-rata hitung masing-masing kelompok sama yaitu sebesar 6,

namun untuk rata-rata hitung yang lebih representative atau mewakili

hasil observasinya dapat dilihat dari tingkat dispersinya.

Dari hasil pengamatan kelompok 1 : d x=

14 (4+1+3+0 )=2

Dari hasil pengamatan kelompok 2 : d x=

14 (0+1+1+0 )=1

2

Dengan demikian hasil observasi ke 2 lebih baik dibanding hasil

observasi ke 1 karena nilai d x observasi ke 2 lebih kecil dari nilai d x

observasi ke 1. Fluktuasi/deviasi hasil pengamatan kelompok 2 hanya

½ besarnya dari rata-ratanya.

Variasi dari data hasil observasi penting diperhatikan untuk

melihat seberapa jauh/besar deviasi nilai-nilai hasil observasi dari rata-

ratanya. Misalnya mengenai nilai ujian mahasiswa pada mata kuliah

tertentu, hasil produksi suatu komoditas di beberapa kota, dan

sebagainya.

Ragam( Variance)

Varians merupakan ukuran dispersi yang paling memenuhi

kriteria statistik, namun satuan yang diperoleh tidak sama dengan

satuan data aslinya, sehingga akan mengalami kesulitan dalam

interpretasi data.

Ragam populasi disimbolkan dengan σ2dan ragam sampel

disimbolkan dengan s2.

Nilai ragam bagi populasi adalah:σ 2=

Σ(X i−μ)2

N

Nilai ragam bagi populasi adalah:

Untuk nilai ragam sampel, dipergunakan pembagi n – 1 bila

sampel (n) diambil dalam jumlah yang kecil agar estimasi 2 tidak bias.

Namun apabila sampel yang diambil dalam jumlah yang besar

pembagi yang digunakan adalah n.

Simpangan baku ( standar d devia t i on )

s2=∑ ( xi− x )2

n−1=∑ x

i2−

(∑ x i )2

nn−1

Page 24: Statdesk Resume

Simpangan baku merupakan akar dari varians. Ukuran ini sering

digunakan dalam statistik karena memiliki satuan yang sama dengan

data aslinya. Simpangan baku populasi disimbolkan dengan , dan

simpangan baku sampel disimbolkan dengan s.

Nilai simpangan baku bagi populasi adalah:σ=√σ2

Nilai simpangan baku bagi sampel adalah:

2.2. Penghitungan untuk Data yang Dikelompokkan

1. Rata-rata Hitung

Dimana:

fi = frekuensi kelas ke i

xi = nilai tengah kelas ke i

i = 1, 2, 3, …, k

2. Rata-rata ukur (Gm)

Dimana:

xi = nilai tengah kelas ke i

fi = frekuensi kelas ke i

3. Median

Dimana:

Be = tepi bawah kelas Mc;

kelas Me = kelas yang nilai kumulatifnya mencakup nilai

n/2

Ie = interval kelas Me

F(e-1) = frekuensi kumulatif sebelum kelas Me

Fe = frekuensi kumulatif di kelas median

s=√s2

x=∑ f ix i

∑ f i

Gm=( x1f 1

x2f2

. .. xkfk)

1n =[πx i

fi]

1n

LogGm=1n∑ log x

if i=1

n∑( log x i ) f i

M e=Be+ I e [ n2−F (e−1 )

Fe−F(e−1)]

Page 25: Statdesk Resume

4. Modus (Mo)

Dimana:

Bo = tepi bawah kelas yang memuat Mo;

kelas yang memuat Mo = kelas yang frekuensinya terbanyak

Io = interval kelas Mo

fo = frekuensi kelas yang memuat Mo

fo-1 = frekuensi kelas sebelum kelas Mo

fo+1 = frekuensi kelas sesudah kelas Mo

5. Kuartil (Qi), Desil (Di), dan Persentil (Pi)

a. Quartil (Qi)

Dimana;

Bqi = tepi bawah kelas kuartil ke-i

Kelas kuartil ke-i = kelas yang nilai kumulatifnya mencakup nilai

in4

Iqi = interval

Fqi-1 = frekuensi kumulatif sebelum kelas kuartil

Fqi = frekuensi kumulatif kelas kuartil ke-i

b. Desil (Di)

Di=Bdi+ I di [ in10

−Fdi−1

Fdi−Fdi−1]

c. Persentil (Pi)

Pi=B pi+ I pi [ in100

−F pi−1

F pi−Fpi−1]

M o=Bo+ I o[ f o−f o−1

( f o−f o−1 )+( f o−f o+1 ) ]

Qi=Bqi+ I q

i[ in4

−Fqi−1

Fqi−Fq

i−1 ]

Page 26: Statdesk Resume

6. Rentang, simpangan rata-rata, ragam dan simpangan baku

a. Rentang ( Range )

R = X1 – Xk

Dimana:

X1 = nilai tengah kelas ke-1

Xk = nilai tengah kelas terakhir

b. Simpangan rata-rata

d x=1n∑ f i|xi− x|

dimana:

fi = frekuensi kelas ke i

xi = nilai tengah kelas ke i

x= rata-rata hitung data berkelompok

c. Ragam ( Variance ) Sampel ( s 2 )

dimana:

xi = nilai tengah kelas ke i

x = rata-rata hitung

fi = frekuensi kelas ke i

2.3 Koefisien Keragaman (Koefisien Variasi)

Koefisien Variasi (KV) adalah suatu nilai untuk pengukuran

dispersi atas dasar pengertian relatif, bukan absolut. Ukuran ini dipakai

untuk membandingkan tingkat keragaman/variasi beberapa distribusi

data yang unit pengukurannya berbeda (baik ukuran sampel yang

digunakan sama atau berbeda).

Contohnya:

Untuk membandingkan keragaman harga ayam (Rp/ekor atau Rp/kg)

dan harga minyak tanah (Rp/liter) dalam beberapa hari di suatu pasar.

Karena unit harga ayam adalah per ekor atau per kilogram

sedangkan unit harga minyak tanah adalah per liter maka untuk

s2=∑i−1

k

f i (x i−x )2

∑ f i

Page 27: Statdesk Resume

membandingkan jenis barang mana yang harganya bervariasi dipakai

cara pengukuran koefisien variasi.

Jika KVAyam lebih kecil daripada KVMinyak Tanah maka yang lebih

bervariasi adalah harga komoditas minyak tanah.

BAB 3

PENGUKURAN KEMENCENGAN DAN KERUNCINGAN

Selain dari ukuran pemusatan dan penyebaran data, secara

deskriptif kita juga dapat menganalisis persebaran data dari ukuran

kemencengan dan keruncingan data. Pengukuran kemencengan dan

keruncingan digunakan untuk mengetahui kesimetrisan distribusi data.

3.1 Pengukuran Kemencengan(Skewness)

Pengukuran kemencengan suatu distribusi data dapat diketahui

dengan beberapa cara, antara lain:

a. Memperhatikan hubungan antara rata-rata hitung, median dan

modus

Jika dari suatu hasil observasi frekuensi/kemunculan nilai yang

lebih kecil dari rata-rata hitungnya lebih banyak daripada dari nilai

yang lebih besar dari rata-rata hitung, maka bentuk distribusinya

menceng ke kanan. Hal ini menunjukkan nilai Mo<Me< X , dan

diilutrasikan seperti gambar berikut:

Mo MeX X

Sebaliknya jika frekuensi/kemunculan nilai-nilai yang lebih kecil

dari rata-rata hitungnya lebih sedikit dari nilai-nilai yang lebih besar,

rata-rata hitungnya maka bentuk distribusinya menceng ke kiri atau

nilai X <Me<Mo.

KV= sxx100 %

Page 28: Statdesk Resume

X Me Mo X

Namun apabila nilai X = Me = Mo, maka bentuk distribusi nilai

hasil observasi simetris atau setangkup. Hal tersebut menunjukkan

frekuensi nilai yang lebih besar dari nilai Me atau X atau Mo sama

dengan banyaknya nilai yang kurang dari nilai Me atau X atau Mo.

X = Me = Mo

b. Menggunakan koefisien Pearson,

Koefisien Pearson (Karl Pearson’s Coefficient).

Sk=3( X−Me )

s

Apabila diperoleh nilai Sk = + (positif), maka distribusi data

menceng ke kanan (skewness positif) atau ekor sebelah kanan

distribusi lebih menjulur dibandingkan ekor sebelah kirinya. Dan

sebaliknya jika Sk bernilai negatif, maka data berdistribusi menceng ke

kiri.

c. Menggunakan moment ketiga

Ukuran kemencengan dengan moment ketiga biasanya

disimbolkan dengan 3, dimana pada umumnya nilai ini berkisar antara

-3 sampai dengan 3 kemudian apabila data berdistribusi normal maka

3=0. Nilai 3 yang positif menunjukkan bahwa kurva distribusi

menceng ke kanan dan jika 3 bernilai negatif maka kurva menceng ke

kiri. Makin besar nilai 3, kurva suatu distribusi semakin meceng atau

miring,

Cara menghitung nilai moment ketiga (3) adalah sebagai berikut:

Data tidak berkelompok:

α 3=

1n∑i=1

n

(X i−X )3

s3

Dimana:

Xi = data hasil observasi

Data berkelompok:

α 3=

1n∑i=1

k

(X i−X )3 f i

s3

Dimana:

Xi = nilai tengah kelas ke-i

Page 29: Statdesk Resume

X = rata-rata hitung

s = simpangan baku

X = rata-rata hitung

fi = frekuensi kelas ke-i

s = simpangan baku

d. Menggunakan Diagram Kotak-Garis (Box plot Diagram)

Penggambaran kemencengan distribusi melalui diagram kotak

garis, untuk distribusi yang menceng ke kiri ditunjukkan dengan letak

garis penunjuk median berada di sebelah atas diagram kotak. Atau

diilustrasikan seperti berikut:

Nilai Observasi

Untuk distribusi yang menceng ke kanan ditunjukkan dengan

letak garis penunjuk median berada di sebelah bawah diagram kotak.

Atau diilustrasikan seperti berikut:

Nilai Observasi

Q2=Me

Q2=Me

Page 30: Statdesk Resume

Sedangkan untuk penggambaran distribusi data yang simetris, garis

penunjuk nilai median akan tepat berada di tengah diagram kotak,

atau dengan ilustrasi sebagai berikut:

Nilai observasi

3.2 Pengukuran Keruncingan (Kurtosis)

Dari hasil suatu observasi, distribusi nilai-nilai variabel yang

diperoleh dapat digambarkan kurvanya,seperti yang diuraikan diatas.

Sedangkan bentuk kurva normal menurut keruncingannya adalah

sebagai berikut:

Distribusi normal leptokurtik

Puncaknya tinggi/runcing artinya frekuensi yang terbanyak ada

pada/ terkonsentrasi pada bagian tengah distribusi.

Contoh:

Kelas Frekuensi1 32 43 164 545 166 47 3Jumlah 100

Kalau digambarkan kurvanya adalah sebagai berikut:

Q2=Me

Page 31: Statdesk Resume

Jika frekuensi terbanyak terdapat pada 3 kelas bagian tengah

distribusi disebut normal platikurtik.

Contoh:

Kelas Frekuensi1 12 73 264 325 266 77 1Jumlah 100

Gambar kurvanya sebagai berikut:

Distribusi normal (mesokurtik) adalah distribusi yang puncaknya

tidak runcing juga tidak mendatar.

Pengukuran keruncingan suatu distribusi data dihitung melalui

nilai 4 dengan cara sebagai berikut:

Data tidak berkelompok:

α 4=

1n ∑i=1

n

( X i− X )4

s4

Dimana:

Xi = data hasil observasi

X = rata-rata hitung

s = simpangan baku

Data berkelompok:

α 4=

1n ∑i=1

k

( X i− X )4 f i

s4

Dimana:

Xi = nilai tengah kelas ke-i

X = rata-rata hitung

fi = frekuensi kelas ke-i

s = simpangan baku

Interpretasi:

Jika 4>3 kurva berbentuk leptokurtik

Jika 4<3 kurva berbentuk platikurtik

Jika 4=3 kurva berbentuk mesokurtik (normal)

BAB 4

ANGKA INDEKS

Page 32: Statdesk Resume

4.1 Kegunaan Angka Indeks

Angka indeks merupakan angka yang dapat digunakan untuk

melakukan perbandingan suatu kegiatan yang sama dalam 2 waktu

yang berbeda. Dengan angka indeks akan dapat diketahui

maju/mundurnya suatu kegiatan seperti maju atau mundurnya

kegiatan produksi, ekspor, penjualan, jumlah uang yang beredar dan

lain sebagainya.

Beberapa indeks:

a. Indeks Bahan Pokok

b. Indeks Biaya Hidup dan Harga Konsumen

c. Indeks Perdagangan Besar.

d. Indeks Harga Yang Dibayar Petani dan Indeks Harga Yang Diterima

Petani

e. Indeks Ekspor/Impor

f. Indeks Pendapatan Nasional

g. Indeks Bursa Efek

h. Indeks Pembangunan Manusia (IPM)

i. Indeks Pembangunan Jender (IPJ)

Sama seperti IPM tetapi IPJ dirinci menurut jenis kelamin.

j. Indeks Pemberdayaan Jender (IPJ)

k. Indeks Kemiskinan Manusia (IKM)

4.2. Teknik Penyusunan Angka Indeks

4.2.1 Indeks Sederhana

Indeks sederhana adalah indeks yang membandingkan suatu hal

dalam suatu periode waktu (harga suatu jenis barang), misalnya

indeks harga dan indeks kuantitas suatu jenis barang.

Indeks Harga tahun t dengan

Periode Dasar 0:

I p=Pt

P0

x 100%

Dimana:

Pt = harga pada periode

tertentu

Po = harga pada periode

Indeks Kuantitas tahun t dengan

Periode Dasar 0:

IQ=Qt

Q0

x 100 %

Dimana:

Qt = kuantitas pada periode

tertentu

Qo = kuantitas pada

Page 33: Statdesk Resume

dasar periode dasar

4.2.2. Indeks Agregatif Sederhana (Tak Tertimbang)

Indeks agregatif adalah indeks dari beberapa jenis barang (2 atau

lebih).

I p=∑ p t

∑ po

x100 %

Kelemahan indeks agregatif sederhana yaitu sangat dipengaruhi

komoditas yang bernilai tinggi.

4.2.3. Indeks Agregatif Tertimbang

Jenis Indeks Harga Indeks Kuantitas

Laspeyres ILp=∑ pt qo

∑ po qo

x 100 % ILq=∑ q t p0

∑ qo p0

x100 %

Paasche IP p=∑ pt q t

∑ poq t

x 100% IPq=∑ qt p t

∑ qo p t

x100%

Fisher IF P=√ILP . IPP IFq=√ ILq . IPq

Catatan:

1. Indeks Laspeyres menggunakan penimbang keadaan tahun dasar.

Indeks ini hanya baik bila fluktuasi penimbang relatif rendah seperti

pola konsumsi masyarakat yang lambat pertumbuhannya.

2. Indeks Paasche menggunakan penimbang keadaan tahun yang

sedang berjalan. Sangat baik untuk perhitungan indeks yang

penimbangnya berubah-ubah cukup drastis. Sayangnya biaya

pengumpulan data ’penimbang’ cukup mahal.

3. Indeks lainnya merupakan modifikasi dari Laspeyres dan Paasche,

hanya Fisher yang sering dipakai.

Indeks yang baik adalah

a. Yang tertimbang, sehingga setiap komoditas sesuai dengan

peranannya.

b. Tergantung dari fluktuasi penimbang, bila relatif konstan pakailah

indeks tertimbang Laspeyres, dan bila erratic pakailah Paasche.

c. Secara teori, indeks tertimbang Fisher yang terbaik.

Menguji Indeks:

Factor reversal test

Iv = indeks nilaiIp X Iq = Iv

Page 34: Statdesk Resume

Laspeyres:

∑ p tqo

∑ poqo

x∑ q t po

∑ qo po ≠

∑ p tq t

∑ poqo

Laspeyres tidak memenuhi syarat.

Paasche:

∑ p tq t

∑ poq t

x∑ q t pt

∑ qo pt ≠

∑ p tq t

∑ poqo

Paasche tidak memenuhi syarat.

Fisher: √∑ p tqo

∑ poqo

x∑ q t pt

∑ q t po

x∑ po qt

∑ po qo

x∑ qt p t

∑ qo p t

=∑ pt qt

∑ po qo

Fisher memenuhi syarat factor reversal test.

Time reversal test

Ito = Indeks dengan tahun dasarnya t

Iot = Indeks dengan tahun dasarnya o

Laspeyres:

∑ p tqo

∑ poqo

x∑ po qt

∑ pt qt ≠ 1

Laspeyres tidak memenuhi syarat.

Paasche:

∑ p tq t

∑ poq t

x∑ po qo

∑ pt qo ≠ 1

Fisher √∑ p tqo

∑ poqo

x∑ q t pt

∑ q t po

x∑ po qt

∑ pt qt

x∑ qo po

∑ qo p t

=1 Konsisten

Fisher memenuhi syarat time reversal test.

Indeks Berantai

Tahun dasar dibuat berurutan, artinya tahun dasar berubah-

ubah. Cara ini mempermudah menilai perkembangan dari tahun ke

tahun, tetapi karena tahun dasar yang berubah-ubah mengakibatkan

ada kemungkinan tahun dasar tidak terletak pada keadaan ‘normal’;

juga disebut perhitungan indeks komposit (composite indices).

Contoh:

Jenis

barang

1998

po

1999

p1

2000

p2

1998

qo

1999

q1

2000

q2

A 5 6 9 4 4 3

B 7 8 12 4 5 4

Jumlah 12 14 21 8 9 7

Indeks ‘agregatif sederhana untuk harga’:

I to xI ot=1

Page 35: Statdesk Resume

I1999 = (14/12)x100=116,67 tahun dasar 1998

I2000 = (21/14)x100=150 tahun dasar 1999

(Harga-harga tahun 1999 naik sebesar 16,67% dari tahun 1998 dan

harga-harga tahun 2000 naik 50% dari tahun 1999).

Indeks Laspeyres

Biasa Berantai

IL1=∑ p

1qo

∑ poqo

xILo

= (56/48)X100%

= 116,67%

IL1=∑ p

1qo

∑ poqo

xILo

IL1 = 116,67%

IL2=∑ p2qo

∑ poqo

xILo

= (84/48)x100%

= 175%

IL2=∑ p2qo

∑ p1qo

xIL1

= (84/56)x116,67%

= 175%

(Indeks berantai Laspeyres ternyata tidak ‘bias’ bila dibandingkan

dengan indeks biasa).

Catatan:

a. Perhitungan dengan cara biasa lebih lengkap lebih baik, asalkan

barang dalam basket belum banyak berubah.

b. Perhitungan menggunakan ‘berantai’ lebih baik, terutama bila ratio

senantiasa dapat digantikan dengan komoditas yang gerakannya

searah/semacam.

Penggantian Tahun Dasar

Penggantian tahun dasar dapat dilakukan karena beberapa sebab:

- sudah terlalu lama (>10 tahun)

- penimbang sudah out-of-date

- tersedia data penimbang baru

- keadaan pada periode baru juga stabil/normal

Contoh: Bila data aslinya masih ada

Macam

barang

1998

po

1998

qo

1999

p1

1999

q1

2000

p2

2000

q2

A 10 5 15 4 20 3

B 8 4 10 4 15 4

Page 36: Statdesk Resume

Bila 1998=100

IL1999=∑ p

99q

98

∑ p98q

98

x 100 %

=15 . 5+10 . 4

10 . 5+8 .4x 100=140 ,24 %

IL2000=∑ p

2000q

98

∑ p98q

98

x 100%

=20 .5+15 .4

10 .5+8 .4x 100=195 ,12 %

Bila kemudian digeser tahun 2000=100

IL1998=10 . 3+8 . 420 . 3+15 . 4

x 100 %=51 ,67 %

IL1999=15 .3+10 . 420 .3+15 . 4

x 100 %=70 ,83 %

BAB 5

ANALISIS KORELASI DAN REGRESI SEDERHANA

5.1. Pengertian tentang Hubungan antara Dua Variabel

Analisis korelasi adalah suatu cara untuk mengukur dan

mengetahui ada atau tidak adanya hubungan linier antara dua atau

lebih variabel. Apabila dari dua atau lebih variabel tersebut terdapat

hubungan linier maka perubahan-perubahan yang terjadi pada salah

satu variabel (X) akan mengakibatkan terjadinya perubahan pada

variabel lainnya (Y). Bentuk hubungan korelasi yang terjadi antara dua

variabel dapat berupa korelasi positif, korelasi negatif, atau tidak ada

korelasi.

1. Korelasi positif

Korelasi ini terjadi apabila variabel X meningkat maka variabel Y

cenderung untuk meningkat pula.

2. Korelasi negatif

Korelasi ini terjadi apabila variabel X meningkat maka variabel Y

cenderung menurun.

3. Tidak ada korelasi

Korelasi ini terjadi apabila kedua variabel (X dan Y) tidak

menunjukkan adanya hubungan

4. Korelasi sempurna

Korelasi ini terjadi apabila kenaikan/penurunan variabel X selalu

sebanding dengan kenaikan/penurunan variabel Y (berada pada

satu garis lurus).

Page 37: Statdesk Resume

Nilai korelasi antara dua variabel tersebut maksimal 1 dan

minimal -1 (-1 r 1).

Teknik untuk mengetahui ada tidaknya korelasi antara 2 variabel

dapat dilakukan melalui beberapa cara, yaitu membuat diagram

pencar, dan menghitung koefisien korelasinya.

▪ Diagram Pencar

Untuk menunjukkan ada tidaknya korelasi (hubungan) antara

dua variabel (X dan Y) dapat menggunakan diagram pencar yaitu

tebaran nilai-nilai dari variabel-variabel tersebut pada sumbu x dan y.

Tujuan dari diagram pencar adalah untuk mengetahui apakah

titik-titik kordinat pada sumbu x dan y tersebut membentuk pola

tertentu. Dari diagram pencar tersebut, dapat dibuat sebuah garis

yang kira-kira membagi dua titik-titik koordinat pada kedua sisi garis.

Dari garis tersebut dapat diketahui korelasi antara kedua variabel

tersebut. Jika garis naik berarti korelasi positif, jika arah garis menurun

berarti korelasi negatif, jika tidak dapat dibuat sebuah garis berarti

tidak ada korelasi, dan jika titik-titik tepat melalui garis berarti

korelasinya sempurna.

Diagram pencar dari beberapa jenis korelasi:

Y …. Y . ... …. .. …

. …. …. .. …. ….. …. . ….. …..

Korelasi Positif X Korelasi Negatif

X

Y Y

Page 38: Statdesk Resume

Tidak ada korelasi X Korelasi sempurna X

▪ Koefisien Korelasi

Untuk mengetahui ada/tidak adanya hubungan antara kedua

variabel (X dan Y) dan seberapa erat hubungan kedua variabel

tersebut, dapat diketahui dengan menghitung koefisien korelasi dari

kedua variabel. Jika koefisien korelasi bertanda positif (+) maka dapat

disimpulkan hubungan kedua variabel positif dan begitu juga halnya

bila koefisien korelasi bertanda negatif (-).

Berdasarkan nilainya koefisien korelasi dapat dikategorikan

menjadi sebagai berikut:

a. r = 1, jika korelasi positif sempurna

b. r = -1, jika korelasi negatif sempurna

c. 0,8 r < 1, berarti korelasi sangat kuat positif

d. 0,6 r < 0,8, berarti korelasi cukup kuat positif

e. 0 r < 0,6, berarti korelasi lemah positif

5.2. Koefisien Korelasi Pearson

Apabila antara dua variabel ( X dan Y) yang masing-masing

mempunyai skala pengukuran interval atau rasio dan hubungannya

merupakan hubungan linier, maka keeratan hubungan antara kedua

variabel itu dapat dihitung dengan menggunakan formula korelasi

pearson yang diberi simbol dengan ryx atau rxy untuk sampel dan ρyx

atau ρxy untuk populasi.

Koefisien korelasi Pearson antara dua variabel yang datanya

tidak berkelompok:

ryx atau rxy =

∑i=1

n

(X i−X )(Y i−Y )

√∑i=1

n

(X i−X )2∑i=1

n

(Y i−Y )2

=n∑ XY−∑ X∑Y

√ (N∑ X2− (X )2) (N∑ Y 2− (Y )2)

Koefisien korelasi Pearson antara dua variabel yang datanya

berkelompok:

ryx atau rxy =

n (∑ uvf )−(∑ uf u ) (∑ vf v )

√n(∑ u2 f u)−(∑ uf u)2√n (∑ v2 f v )−(∑ vf v )2

Dimana:

u = skala baru dari X

Page 39: Statdesk Resume

v = skala baru dari Y

5.3. Koefisien Korelasi Spearman

Untuk mengukur keeratan hubungan antara dua variabel X dan Y

yang kedua-duanya mempunyai skala pengukuran sekurang-

kurangnya ordinal dapat dihitung dengan menggunakan formula

korelasi Spearman.

Koefisien korelasi Spearman antara Y dan X atau X dan Y:

a) Jika tidak ada data kembar

r xy=1−6∑

i=1

n

d i2

n3−n

Dimana:

di = selisih ranking variabel X dengan ranking variabel Y

n = banyaknya data

b) Jika ada data kembar

r xy=(n3−n )−6∑

i=1

n

di2−

Tx+T y

2

√(n3−n )2−(T x+T y )(n3−n )+T xT y (Siegel dan Castellan, 1988)

Penafsiran Koefisien Korelasi

Untuk menentukan keeratan hubungan bisa digunakan kriteria Guilford

(1956), jika:

1. 0 rxy /ryx < 0,1 Hubungan antara X dan Y sangat kecil

dan bisa diabaikan

2. 0,1 rxy /ryx < 0,4 Hubungan antara X dan Y kecil (tidak erat)

3. 0,4 rxy /ryx < 0,7 Hubungan antara X dan Y moderat

4. 0,7 rxy /ryx < 0,9 Hubungan antara X dan Y erat

5. 0,9 rxy /ryx < 1 Hubungan antara X dan Y sangat erat

5.4. Hubungan Linier antara Dua Variabel

Sebuah variable hasil observasi besaran data yang diperoleh

sangat mungkin dipengaruhi oleh variabel lainnya. Misalnya tinggi dan

berat badan seseorang. Untuk suatu tinggi tertentu ada besaran berat

badan yang mempengaruhi atau sebaliknya. Contoh lain misalnya

produksi padi yang dipengaruhi oleh luas lahan yang ditanami, jenis

Page 40: Statdesk Resume

pupuk yang dipakai, banyaknya pupuk yang dipakai dsb. Seberapa

erat hubungan antara jumlah produksi padi dengan jumlah pupuk yang

dipakai (hubungan 2 variabel) dapat diketahui dengan menghitung

koefisien korelasi dari 2 variabel tersebut. Jika hubungan 2 variabel

tersebut merupakan hubungan yang linier (positip/negatip) maka dua

variabel tersebut dapat dianalisis selanjutnya dengan analisis regresi.

5.5. Regresi Linier Sederhana

Analisis regresi linier sederhana adalah analisis regresi yang

hanya menggunakan 1 variabel independen dan mempunyai hubungan

linier dengan variabel dependennya.

Pada contoh produksi padi dan jumlah pupuk yang dipakai,

variabel independennya adalah jumlah pupuk (X), dan variabel

dependennya adalah produksi padi (Y). Dengan demikian produksi padi

merupakan fungsi dari jumlah pupuk yaitu y=f(x), dimana y=produksi

padi dan x = jumlah pupuk.

Dalam regresi linier sederhana hubungan variabel tersebut dapat

dituliskan dalam bentuk model persamaan linier:

Untuk populasi:

Y = 0+1X+i

dimana:

Y = variabel dependen/variable respon

X = variabel independen / variabel penjelas

0 = koefisien intercept = titik potong garis regresi dengan sumbu y

1 = koefisien regresi (slope)

= error / kekeliruan

Untuk sampel:

y = b0 + b1x

dimana:

y = nilai ramalan y untuk sejumlah x tertentu

b0 = koefisien intercept

b1 = slope

x = variabel independen/variabel penjelas

Nilai 0, 1 dalam model regresi linier tersebut dapat diestimasi/

diperkirakan melalui b0, b1 melalui Metode Kuadrat Terkecil.

5.6. Langkah-langkah membuat Regresi Linier Sederhana

Page 41: Statdesk Resume

1. Tentukan terlebih dahulu variabel independen (x) dan variabel

dependennya (y)

2. Membuat diagram pencar dari data x dan y

3. Dari diagram pencar tersebut akan diperoleh gambaran pola

tebaran x dan y, apakah membentuk hubungan yang linier? Jika ya,

maka model regresinya adalah regresi linier sederhana.

4. Menghitung koefisien intercept (b0)

b0= y−b . x

b1=∑ X iY i−

(∑ X i ) (∑Y i)n

∑ X i2−

(∑ X i)2

n

=n∑ XY−∑ X∑Y

n∑ X2−(∑ X )2

dimana:

Y = variabel dependen ke-i

X = variable independen ke-i

i = 1, 2, ,3, .., n

n = banyaknya observasi

Diperoleh persamaan garis y=b0+b1 x

5. Menghitung y=b0+b1 x

y = estimasi harga y jika x disubtitusikan kedalam persamaan

regresi

6. Membuat garis y=b0+b1 xpada sumbu x dan y.

Contoh:

Hasil observasi di desa A diperoleh data jumlah pupuk yang dipakai

dan jumlah produksi padi yang dihasilkan pada 8 petak sawah sebagai

berikut:

No. Petak

Sawah

Jumlah pupuk yang

dipakai

Produksi padi

(Ton) (1) (2) (3)1 1 22 2 43 4 54 5 75 7 86 9 107 10 128 12 14

Page 42: Statdesk Resume

0

2

4

6

8

10

12

14

16

0 5 10 15

x

y

Pencilan=outlier

Jumlah 50 62

Diagram pencar:

Cara menghitung garis regresi:

No. Petak Sawah

Jumlah pupuk yang dipakai (kwintal)=Xi

Produksi padi (ton)=Yi

Xi2 XiYi y

(1) (2) (3) (4) (5) (6)1 1 2 1 2 2,292 2 4 4 8 3,333 4 5 16 20 5,414 5 7 25 35 6,455 7 8 49 56 8,536 9 10 81 90 10,617 10 12 100 120 11,658 12 14 144 168 13,73Jumlah 50 62 420 499

x=508

=6 ,25;y=62

8=7 ,75

b1=∑ X iY i−

(∑ X i ) (∑Y i )n

∑ X i2−

(∑ X i )2

n

=499−

(50)(62 )8

420−502

8

=1 ,04

b0= y−b x=7 ,75−(1 ,04 )(6 ,25 )=1 ,25

y =1,25+1,04x

Page 43: Statdesk Resume

Y

e ------- b -------- b

a X

0

2

4

6

8

10

12

1 2 3 4 5 6 7 8

Dimana:

x = 0, artinya: jika tidak diberi pupuk maka produksi = 1,25 ton

x =1, artinya: jika diberi pupuk 1 kwintal maka produksi akan

bertambah sebanyak 1,04 kwintal

Diagram pencar:

BAB 6

ANALISIS DERET WAKTU

6.1. Pengertian tentang Data Deret Waktu

Data deret waktu adalah serangkaian data hasil observasi

dengan menggunakan runtun waktu (t) sebagai variabel. Fluktuasi

data ini dipengaruhi oleh perpaduan komponen-komponen trend

sekuler, variasi musim, gerakan sikli dan variasi random.

Y = T x S x C x I atau Y = T + S + C + I atau Y=f (T;S;C;I)

Dimana:

T = Trend sekuler

S = Variasi musim

C = Variasi sikli

I = Variasi random

Y = Garis trend

6.2. Cara Menentukan Trend dari Komponen Trend Sekuler,

antara lain:

1) Metode rata-rata bergerak

2) Metode kuadrat terkecil

1. Metode rata-rata bergerak

Penggunaan rata-rata bergerak bertujuan untuk mengisolir

fluktuasi musim, sikli, dan random yang ada dalam data asal.

y

Page 44: Statdesk Resume

a. Sederhana

TahunHarga

Rata-rata

Jumlah

Bergerak

Selama 3

Tahun

Rata-rata

Bergerak

Per 3 tahun

(1) (2) (3) (4)1995 30001996 9000 26000 8666,671997 14000 36000 12000,001998 13000 40500 13500,001999 13500 40250 13416,672000 13750 41250 13750,002001 14000 41750 13916,672002 14000

Diagram Pencar:

0

2000

4000

6000

8000

10000

12000

14000

16000

1994 1996 1998 2000 2002 2004

Tahun

Nil

ai

b. Tertimbang

Sebagai penimbangnya adalah koefisien Binomial. Koefisien

Binomial digunakan sebagai pengali untuk menghitung jumlah

bergerak 3 tahun dan jumlah koefisien digunakan sebagai pembagi

untuk menghitung rata-rata bergerak tertimbang per 3 tahun.

Koefisien pengali untuk 3 tahunan adalah: 1, 2, dan 1 dan jumlah

koefisiennya = 1+2+1 = 4.

Tahun HargaRata-

Jumlah Bergerak 3

Rata-rata BergerakTertimbang Per 3

Page 45: Statdesk Resume

rata Tahun tahun1995 30001996 9000 35000 87501997 14000 50000 125001998 13000 53500 133751999 13500 53750 13437,52000 13750 55000 137502001 14000 55750 13937,52002 14000

Diagram Pencar:

0

2000

4000

6000

8000

10000

12000

14000

16000

1994 1996 1998 2000 2002 2004

Tahun

Nil

ai

2 Metode Kuadrat Terkecil

Bentuk umum model: y’=a+bx

a= y−b x

b=∑ X iY i−

(∑ X i) (∑Y i)n

∑ X i2−

(∑ X i)2

n

=∑ (X−X ) (Y−Y )

∑ (X−X )2

Untuk mempermudah perhitungan, maka waktu (tahun) diberi skala

baru (x) sedemikian sehingga xi=0 dan X=0 .

Contoh untuk n genap:

Tahun xiHarga Rata-rata (yi)

xiyi xi2 y’

1995 -7 3000 -21000 49 9358,65

Page 46: Statdesk Resume

1996 -5 9000 -45000 25 9964,30

1997 -3 14000 -42000 9 10569,95

1998 -1 13000 -13000 1 11175,60

1999 1 13500 13500 1 12386,90

2000 3 13750 41250 9 12992,55

2001 5 14000 70000 25 13598,20

2002 7 14000 98000 49 14203,85

Jumlah0 94250 10175

0

168

a=942508

=11781 ,25= nilai trend periode dasar (akhir tahun

1998 (31 Desember) atau awal tahun 1999 (1 januari1999 ))

b=101750168

=605 ,65=pertambahan per setengah tahun ; Xi = unit ½

tahun

y’=11781,25+85,23xi dengan tahun dasar 1998 – 1999 = 0 (31

Des;98 atau 1 Jan ’99).

y’1999=11781,25+85,23(1)=12386.90, merupakan trend tahun

1999.

Setelah nilai Y’ diperoleh untuk tahun 1995 s.d. tahun 2002,

kemudian dibuat garis trendnya.

Diagram garis untuk menggambarkan nilai trend:

Trend harga

9358.659964.30

10569.9511175.60

12386.9012992.55

13598.2014203.85

0.00

2000.00

4000.00

6000.00

8000.00

10000.00

12000.00

14000.00

16000.00

1995 1996 1997 1998 1999 2000 2001 2002

Tahun

Har

ga

Page 47: Statdesk Resume

Contoh untuk n ganjil:

Tahun xiHarga Rata-rata (yi)

xiyi xi2 y’

1995 -4 3000 -12000 16 8013.321996 -3 9000 -27000 9 9022.491997 -2 14000 -28000 4 10031.661998 -1 13000 -13000 1 11040.831999 0 13500 0 0 12050.002000 1 13750 13750 1 13059.172001 2 14000 28000 4 14068.342002 3 14000 42000 9 15077.512003 4 14200 56800 16 16086.68Jumlah 0 108450 60550 60

a=1084509

=12050= nilai trend periode dasar (pertengahan tahun

1999 (Juni-Juli 1999))

b=6055060

=1009 ,17=pertambahan per tahun ; Xi = unit 1 tahun

y’=12050+1009,17xi dengan tahun dasar 1999 = 0.

Setelah nilai Y’ diperoleh untuk tahun 1995 s.d. tahun 2002, kemudian

dibuat garis trendnya.