statdesk resume
TRANSCRIPT
UKURAN DISPERSI
Ukuran yang menyatakan atau memberikan gambaran tentang
penyebaran data.
Kelompok A Kelompok B
65 73 42 77
66 74 54 77
67 77 58 85
68 77 62 93
71 77 67 100
Dari data nilai ujian statistik diatas dapat diperoleh informasi sebagai
berikut :
Kelompok A Kelompok B
Mean 71,5 71,5
Median 72 72
Modus 77 77
Dengan melihat mean, median dan modus kedua kelompok
tersebut dapat disimpulkan bahwa kelompok A dan kelompok B
memiliki performance yang sama dalam test statistik, tetapi jika dilihat
data sebenarnya hasilnya tidaklah demikian. Pengamatan hasil tes
sebenarnya menunjukkan bahwa nilai tes kelompok A cenderung lebih
menggerombol dibanding nilai kelompok B, dengan kata lain nilai
kelompok B lebih menyebar dibanding kelompok A. Agar informasi
yang diperoleh lebih baik, dalam hal ini diperlukan ukuran penyebaran
atau keragaman data (dispersi).
Ukuran dispersi yang sering digunakan dalam statistik, diantaranya
adalah : range, varians dan simpangan baku.
Range (Rentang)
Range (R) adalah perbedaan (selisih) antara nilai tertinggi
dengan nilai terendah data. Range merupakan ukuran paling
sederhana untuk mengukur keragaman data. Kelemahan utama dari
range yaitu tidak dilibatkannya seluruh nilai observasi
Data belum dielompokkan
Contoh : data 10, 11, 12, 13, 15, 16, 18, dan 19
Sehingga R = 19 - 10 = 9.
Data yang dikelompokkan (distribusi frekuensi)
Untuk data berkelompok, range dapat ditentukan dengan :
H = tepi atas kelas terakhir
L = tepi bawah kelas pertama
Contoh: Distribusi frekuensi nilai ujian calon pegawai :
Nilai Ujian Frekuensi
50 - 54
55 - 59
60 - 64
65 - 69
70 - 74
75 - 79
80 - 84
85 - 89
30
70
80
120
70
10
8
7
R = H - L
R = 89,5 - 50,5 = 39
Varians ( σ 2 )
Dari definisi diatas dapat disimpulkan bahwa varians melibatkan
seluruh nilai pengamatan, sehingga relatif lebih baik dari range
sebagai ukuran dispersi.
Varians merupakan ukuran dispersi yang paling memenuhi
kriteria statistik, namun satuan yang diperoleh tidak sama dengan
satuan data aslinya, sehingga akan mengalami kesulitan dalam
interpretasi data.
Untuk data belum dikelompokkan
σ 2=Σ(X i−μ)2
NS2=
Σ( x i− x )2
n−1
Untuk data berkelompok
R = H - L
DefinisiVarians adalah rata-rata dari kuadrat deviasi ( simpangan ) seluruh nilai pengamatan terhadap men data
σ 2=Σf i .(mi−μ )2
Σf i
Standar deviasi ( simpangan baku )
Standar deviasi merupakan akar dari varians. Ukuran ini sering
digunakan dalam statistik karena memiliki satuan yang sama dengan
data aslinya.
Formula standar deviasai adalah :
Data belum dikelompokkan
Data yang dikelompokkan
mi= nilai tangah kelas ke i
fi= frekuensi kelas ke i
Koefisien Variasi ( KV )
Koefisien variasi mengukur keragaman data relatif terhadap rata-
rata data tersebut. Koefisien ini digunakan untuk membandingkan
keragaman beberapa kelompok (data) yang memiliki rata-rata
berbeda.
KV=σμ
. 100 %
Data A dikatakan lebih homogin / seragam dari data B jika dan hanya
jika koefisien variasi data A lebih kecil dari koefisien variasi data B.
Contoh :
Informasi mengenai volume penjualan dua kelompok salesman
sauatu perusahaan adalah sebagai berikut :
Kelompok A B
σ=√ Σ(X i−μ )2
N
σ=√ Σf .i (mi−μ )2
Σf i
Rata-rata (mean) 160 120
Simpangan baku 25 20
Jika dilihat simpangan baku, maka dapat disimpulkan bahwa
volume penjualan kelompok B lebih seragam (homogin) dibanding
kelompok A, namun hal itu tidak dapat dijadikan dasar penarikan
kesimpulan karena rata-rata kedua kelompok berbeda. Ukuran yang
paling tepat untuk penarikan kesimpulan mengenai perbedaan
keragaman adalah koefisien variasi, sehingga :
KV=σμ
. 100 % =
25160 = 16 %
KV=σ
μ. 100 %
=
20120 = 17 %
Kesimpulan : Karena koefisien variasi kelompok A (KV A) lebih kecil dari
KVB maka volume penjualan kelompok salesman A lebih seragam
dibanding kelompok B.
Standar score ( angka baku ) : Z
Standar score merupakan kelipatan dari simpangan baku dimana
suatu nilai terletak dibawah atau diatas rata-rata (mean). Kegunaan
angka baku diantaranya untuk menentukan posisi suatu nilai apakah
secara relatif lebih baik dibandingkan nilai-nilai lain.
X = nilai yang akan dibandingkan
μ = rata-rata
σ = simpangan baku
Contoh :
Informasi mengenai volume penjualan dua kelompok salesman
sauatu perusahaan adalah sebagai berikut :
Kelompok A B
Z= X−μσ
Rata-rata (mean) 160 120
Simpangan baku 25 20
Misal Andi adalah salesman dari kelompok A dengan volume penjualan
170 unit dan Budi adalah saleman dari kelompok B dengan volume
penjualan 130 unit, jika ingin dibandingkan siapa yang lebih
berprestasi Andi atau Budi, maka dapat digunakan angka baku, yaitu :
Z Andi=170−16025 = 0,40
ZBudii=130−12020 = 0,50
Dari perhitungan diatas, dapat disimpulkan karena angka baku Budi (Z
Budi) lebih besar dari Z Andi maka secara relatif Budi lebih berprestasi
dari Andi.
UKURAN PEMUSATAN DATA
Cara menyajikan data dengan metode numerik yang biasa dilakukan adalah menentukan ukuran pusat dan ukuran posisi data.
Ukuran pusat yang dipelajari meliputi : rata-rata hitung (arithmetic mean), median dan modus, sedangkan ukuran posisi meliputi : kuartil, desil dan persentil.
UKURAN PEMUSATANKumpulan nilai (data) biasanya memiliki kecenderungan untuk
memusat pada satu nilai tertentu yang disebut dengan ukuran pusat. Nilai tersebut cukup representatif untuk menggambarkan keseluruhan nilai (data). Disebut ukuran pusat karena pada umumnya nilai tersebut memiliki lokasi dibagian tengah atau pusat dari distribusi data.
Rata-rata hitung atau mean ( μ )Sifat keberadaan rata-rata hitung adalah tunggal, artinya dalam
sekelompok nilai observasi (data) hanya ada satu rata-rata hitung. Rata-rata hitung ini menunjukkan bahwa penyebaran data cenderung berpusat pada nilai tersebut.Notasi yang sering digunakan untuk menyatakan rata-rata hitung populasi adalah μ dan rata-rata sampel adalah x .
Cara menentukan rata-rata hitung : Untuk data mentah (atau belum dikelompokkan)Mean dihitung dengan menjumlahkan seluruh nilai observasi dibagi dengan frekuensi observasi.
μ=ΣX i
n
Xi = nilai observasi ke – in= jumlah observasi
Untuk data yang disusun dalam distribusi frekuensi
fi= frekuensi kelas ke – i
mi = nilai tengah (mid point) kelas ke – in = jumlah observasi
Contoh:Tabel : Distribusi frekuensi upah per-minggu 260 buruh pabrik
Klas Interval(ribuan Rp)
Jumlah buruh(fi)
Nilai Tengah(mi)
fi . mi
2,0 - 3,94,0 - 5,96,0 - 7,98,0 - 9,910,0 - 11,912,0 - 13,914,0 - 15,916,0 - 17,918,0 - 19,9
12193970522421158
2,954,956,958,9510,9512,9514,9516,9518,95
35,4094,05271,05626,50569,40310,80313,95254,25151,60
Total 260 - 2.627,00
Keterangan :
Pada tabel diatas sejumlah 12 orang buruh pada klas pertama memiliki upah per minggunya berkisar 2,0 s/d 3,9 (ribu rupiah), walaupun untuk tiap-tiap buruh tidak diketahui besar upah per minggunya, oleh karena itu dianggap bahwa 12 buruh yang memiliki upah per-minggu 2,0 s/d 3,9 memiliki upah rata-rata 2,95 (ribu rupiah). Perkalian 12 dengan 2,95 (=35,40) adalah merupakan taksiran jumlah upah perminggu dari 12 buruh tersebut, demikian juga untuk kelas-kelas lain. Total kolom fi.mi (2.627,00) adalah taksiran total upah per minggu 260 buruh pabrik tersebut.Jadi rata-rata upah per-minggu buruh parik tersebut sebesar :per minggunya adalah 10,10 (ribu rupiah).
μ=Σf imi
Σf i
=262 . 700260
= 10,10 (ribu rupiah) Atau dengan menggunakan rata-rata sementara:
μ=Σf imi
Σf i
x= x0+∑ fi. uin
.cDimana:X0 = rata-rata sementarafi = frekuensi kelas ke iui = simpangan kelas ke i terhadap kelas rata-rata sementaran = banyaknya datac = interval kelas
Median ( Md )Sifat keberadaan median dari data adalah tunggal, median
merupakan nilai yang terletak ditengah-tengah serangkaian nilai yang telah diurutkan (dari terkecil sampai terbesar atau sebaliknya)
Median membagi nilai-nilai observasi (data) menjadi dua bagian sama besar sehingga 50% terletak dibawah median dan 50% lainnya diatas median. Kelebihan median adalah tidak dipengaruhi adanya data ekstrim. Median dapat digunakan bila skala pengukuran datanya minimal skala ordinal. Karena median belum banyak dikembangkan untuk keperluan inferensia, maka penggunaannya tidak sepopuler rata-rata hitung.
Cara menentukan median : Untuk data mentah (data belum dikelompokkan)Median dari data yang belum dikelompokkan adalah nilai yang terletak pada posisi :
Untuk data yang disusun dalam distribusi frekuensiUntuk data yang telah dikelompokkan, pertama kali ditentukan kelas median, yaitu kelas yang memuat median dengan rumus : (n+1) / 2Setelah itu nilai median ditentukan dengan pendekatan :
Keterangan :TB = tepi bawah kelas medianFk = frekuensi kumulatif sebelum kelas medianf = frekuensi kelas medianc = interval kelas
DefinisiMedian adalah nilai yang berada tepat ditengah serangkaian nilai observasi (data) yang berurutan
n+12
Md=TB+{ n2−Fk
f }.c
Contoh : Tabel-: Distribusi frekuensi dan frekuensi kumulatif ‘kurang dari’ upah per-minggu 260 Buruh pabrik
Interval Kelas(ribuan Rp)
Jumlah buruh (fi)
Frek. Kumulatif
2,0 - 3,94,0 - 5,96,0 - 7,98,0 - 9,910,0 - 11,912,0 - 13,914,0 - 15,916,0 - 17,918,0 - 19,9
12193970522421158
<1,95 <3,95 <5,95 <7,95<9,95<11,95<13,95<15,95<17,95<19,95
0123170140192216237252260
T o t a l n = 260
Median terletak pada kelas ke- 4, karena nilai ke (260 +1 ) / 2 = 130,5 ( terletak pada kelas ke-5), sehingga:
Md=9 ,95+{2602
−70
52 }. 2=9 ,95+2 ,31=12 ,26
Kesimpulan : 50 % buruh mendapat upah per-minggu kurang dari Rp 12.260,- dan 50 % sisanya mendapat upah per-minggu lebih besar dari Rp 12.260,-.
Modus (Mo)Sifat keberadaan modus adalah tidak tunggal, jika data memiliki
satu modus disebut unimodal, dua modus disebut bimodal dan lebih dari dua modus disebut multimodal. Data dapat juga tidak memiliki modus.
Untuk mencari modus data belum dikelompokkan dapat dilakukan dengan cara menghitung frekuensi tertinggi dari nilai-nilai observasi. Jika data sudah dikelompokkan dalam distribusi frekuensi, untuk mencari modus digunakan langkah-langkah sebagai berikut :
a. menentukan kelas modus, yaitu kelas yang memiliki frekuensi tertinggi
b. menentukan modus dengan rumus :
DefinisiModus adalah nilai – nilai yang memiliki frekuensi tertinggi
Keterangan :TB = tepi bawah kelas modusa = selisih frekuensi kelas modus dengan frekuensi kelas sebelum kelas modusb = selisih frekuensi kelas modus dengan frekuensi kelas setelah kelas modusc = interval kelas
Contoh :Data belum dikelompokkan :Jumlah anggota keluarga dari 10 keluarga yang diobservasi adalah sebagai berikut :7, 4, 4, 6, 5, 6, 6, 9, 5 dan 6.
Dari data diatas diperoleh bahwa nilai yang memiliki frekuensi kemunculan lebih banyak dibanding yang lain yaitu 6 dengan frekuensi sebanyak 3 (tiga) kali. Jadi modus data tersebut adalah 6.Data dalam bentuk distribusi frekuensi :
Tabel : Distribusi frekuensi upah per-minggu 260 buruh pabrik
Klas Interval(ribuan Rp)
Jumlah buruh(fi)
2,0 - 3,94,0 - 5,96,0 - 7,98,0 - 9,910,0 - 11,912,0 - 13,914,0 - 15,916,0 - 17,918,0 - 19,9
12193970522421158
Total 260
Kelas modus adalah kelas ke-4, karena memiliki frekuensi tertinggi yaitu 70, sehinggaa = 70 – 39 = 31b = 70 – 52 = 18
Mo=7 ,95+{3131+18 }.2=7 ,95+1 ,26=9 ,22
artinya sebagian besar buruh pabrik tersebut mendapat upah per-minggu sebesar Rp 9.220,-
Hubungan Antara Mean, Median dan Modus
Bila sebuah distribusi data bermodus satu digambarkan dalam sebuah histogram, ordinat mediannya membagi sebuah histogram dalam 2 bagian yang sama. Sehingga bila distribusi tersebut simetris, maka rata-rata hitung= median= modus.
Mo=TB+{ aa+b }.c
Menurut Karl Pearson, bila distribusi dari variabel yang kontinyu memiliki modus tunggal serta menceng secara moderat, maka mediannya akan terletak kira-kira 2/3 dari seluruh jarak yang dihitung dari modus ke arah rata-rata hitungnya. Dan secara umum hubungan ketiga ukuran tsb dirumuskan sebagai:
mo= x−3 ( x−md )Kemudian jika:
mo>med>x , maka distribusi data tersebut menceng ke kanan
mo<med<x , maka distribuis data tersebut menceng ke kiri
KUARTIL ( q)
Kuartil membagi data (n) yang berurutan atas 4 bagian yang sama banyak.
------|------|-------|------- Q1 Q2 Q3
Q1 = kuartil bawah (1/4n )Q2 = kuartil tengah/median (1/2n)Q3 = kuartil atas (1/4n )
Untuk data yang tidak dikelompokkan terlebih dahulu dicari mediannya, kemudian kuartil bawah dan kuartil atas.Untuk data yang dikelompokkan rumusan kuartil identik dengan rumusan mencari median.Q1 = L1 + [(1/4n - f1)/fQ1] . cQ3 = L3 + [(3/4n - f3)/fQ3] . c
DESIL ( D) Desil membagi data (n) yang berurutan atas 10 bagian yang sama besar. (D,, D2, D3, . . . . . . , D9)Di = Li + ((i/10)n - fi)/fDi . c
PERSENTIL ( P) Persentil membagi data (n) yang berurutan atas 100 bagian yang sama besar. (P1, P2, P3, . . . . . . ,P99)Pi = Li +( i/100 n - fi)/fPi . cCara mencari Desil dan Persentil identik dengan cara mencari kuartil.
BAB 1
PENGERTIAN STATISTIK DESKRIPTIF
1.1 Arti dan Kegunaan Data
Statistik Deskriptif adalah ilmu yang mempelajari tentang cara:
a. mengumpulkan data/informasi;
b. mengolah data hasil pengumpulan;
c. menyajikan data hasil pengolahan;
d. menganalisis data.
1.2 Tipe Skala Pengukuran Data
a. Skala Nominal
Contoh:
Laki-laki ; Perempuan (level laki-laki = level
perempuan)
b. Skala Ordinal
Data yang diukur mempunyai urutan kualitas/level
Contoh:
ranking 1 ; ranking 2 ; ranking 3
c. vcc Skala Interval
Contoh:
ukuran temperatur udara 00 Fahrenheit = - 180 Celcius, dan 00
Fahrenheit bukan berarti tidak ada temperatur
d. Skala Ratio
Contoh: mengukur panjang, lebar, berat, tinggi, isi, dan
sebagainya.
1.3 Pengumpulan dan Pengolahan Data
1.3.1Pengumpulan Data
a. Sensus
b. Survei
c. Eksperimen (Biasanya dilakukan di laboratorium)
d. Studi Kasus (Penelitian yang lebih mendalam)
Perbedaan Sensus dan Survei:
Sensus Populasi (Seluruh unit
yang diteliti)
1.- Waktu
- Biaya Besar
- Tenaga
2.Menyeluruh
3.Tingkat kesalahan (error)
nya kecil
4.Kurang rinci
Rata-rata (=)
Variance (=2)
Parameter
Proporsi (=P)
μ=∑i=1
N
X i
N=∑
i=1
N
X i= X1+X2+. ..+XN
Survei Sampel (yang diteliti
adalah sebagian dari populasi)
1. – Waktu
- Biaya Kecil
- Tenaga
2. Tidak menyeluruh
3. Errornya bisa besar
4. Rinci
Rata-rata (=X )
Variance (=S2) Statistik
Proporsi (=p)
X=∑i=1
n
X i
n=∑
i=1
n
X i= X1+X2+. . .+Xn
Xi = Sebagian dari variabel
yang diambil secara random
Xi = Variabel yang diteliti
(seluruhnya)
N = Jumlah seluruh variabel
tersebut dalam populasi
Ragam/variance (X)= 2=
(X1−μ )2N
+(X2−μ)2
N+ .. .+
(X N−μ )2N
=∑i=1
N
( X i−μ )2
N
Simpangan baku=standard
deviasi= √σ2=σ
n = Jumlah sampel yang
diambil dari populasi
Ragam/variance (X)= S2=
(X1−X )2n
+(X2−X )2
n+. ..+
( Xn−X )2n
=∑i=1
n
(X i−X )2
n
Simpangan baku=standard
deviasi= √s2=s
1.3.2Cara Pengumpulan Data
Wawancara langsung dengan responden
Kuesioner/daftar pertanyaan diberikan kepada responden
untuk kemudian diisi oleh responden
1.3.3Sumber data:
Primer, adalah data yang diperoleh langsung dari responden
Contoh: mengumpulkan data produksi kecap. Data diperoleh
dari perusahaan industri kecap
Sekunder, adalah data yang diperoleh dari pihak kedua
Contoh: mengumpulkan data produksi kecap yang datanya
diperoleh dari Departemen Perindustrian
Pengolahan Data
Cara mengolah data:
a. Manual, dengan langkah-langkah sebagai berikut:
b. Memakai paket program di komputer: SPPS, Minitab, microsoft
Excel, dan sebagainya
Data menurut sifatnya:
a. Kuantitatif contoh: tinggi badan: 160 cm; 169 cm
b. Kualitatif, contoh: jenis kelamin: peserta; laki-laki dan peserta
perempuan
Syarat data yang baik: - obyektif
- representatif
- reliabilitas
- tepat waktu (up to date)
- relevan
1.4 Penyajian Data
a. Tabel:
Tabel frekuensi
Tabel distribusi frekuensi
b. Grafik:
Grafik Batang
Grafik Lingkaran
Grafik Garis
Grafik Gambar
1.4.1 Tabel Frekuensi dan Grafik
a. Struktur tabel:
1. Nama (judul) tabel menunjukkan: mengenai apa, dimana, dan
kapan.
2. Badan tabel: terdiri dari beberapa kolom. Setiap kolom mepunyai
judul (dilengkapi dengan unit/satuannya) dan berisikan data.
3. Sumber data, dicantumkan dibagian bawah tabel.
b. Tabel:
Tabel ikhtisar, biasanya singkat, mudah dimengerti, bisa
diperoleh dari tabel referensi
Tabel referensi, merupakan tabel umum yang rinci untuk
kepentingan referensi
c. Jenis tabel frekuensi:
Tabel 1 arah
Tabel 2 arah
Tabel 3 arah atau lebih
DIAGRAM/GRAFIK:
a. Grafik garis (line chart)
b. Grafik gambar (Pictograf)
c. Grafik batang (bar chart)
d. Peta Statsitik (Statistical Map)
e. Grafik/digram lingkaran (Pie chart)
1.4.2. Tabel Distribusi Frekuensi dan Grafik
Jenis Tabel:
Tabel Distribusi Frekuensi
Tabel Distribusi Frekuensi Relatif
Tabel Distribusi Frekuensi Kumulatif
Tabel Distribusi Frekuensi Kumulatif “kurang dari”
Tebel Distribusi Frekuensi Kumulatif “lebih dari”
Cara membuat tabel distribusi frekuensi
Contoh: n = 67
Dengan nilai data adalah sebagai berikut:
1. Menentukan jumlah kelas (k)
a. Dengan menggunakan rumus Sturges:
k = 1 + 3,3 log n
= 1 + 3,3 log 67 = 7,04 7
b. Cara lain: 2k = n
2. Menentukan interval kelas (I)
I=nilai terbesar−nilai terkecilk
=54−237
=4 ,43≈5
3. Menentukan batas bawah dan batas atas kelas
1. Tabel Distribusi Frekuensi Relatif:
Untuk keperluan analisis, selain dari tabel frekuensi bisa juga
dari tabel frekuensi relatif dan kumulatif.
Tabel 7: Distribusi Frekuensi Relatif Pegawai STIS (Staf)
menurut Golongan Umur Tahun 2004
Umur (Tahun) Frekuensi
(f)
F Relatif
(1) (2) (3)23-27 5 5/67 =
7,463%28-32 11 11/67 = …%33-37 21 21/67 = …%38-42 17 17/67 = …%43-47 6 6/67 = …%48-52 5 5/67 =
7,463%53-57 2 2/67 = …%Jumlah 67 100
Sumber: Bagian Administrasi Umum STIS
Dari tabel 7 ini dapat dibaca bahwa ada 7,46 % pegawai yang
hampir pensiun.
3. Tabel Distribusi Frekuensi Kumulatif:
Tabel 8: Distribusi Frekuensi Kumulatif Pegawai STIS
menurut Golongan Umur Tahun 2004
Umur (Tahun) Frekuensi
(f)
F Kumulatif
(1) (2) (3)23-27 5 5
28-32 11 16
33-37 21 37
38-42 17 54
43-47 6 60
48-52 5 65
53-57 2 67
Jumlah 67
Sumber: Data Tabel 7
Dari tabel 8 ini dapat diketahui bahwa sebagian besar pegawai
STIS masih berumur muda (atau kurang dari 43 tahun)
4. Tabel Distribusi Kumulatif ‘kurang dari’:
Tabel 9: Distribusi Frekuensi Kumulatif “kurang dari”
Pegawai STIS menurut Golongan Umur Tahun 2004
Umur (Tahun) F kurang dari
Kurang dari 22,5 0
Kurang dari 26,5 5
Kurang dari 32,5 16
Kurang dari 36,5 37
Kurang dari 42,5 54
Kurang dari 46,5 60
Kurang dari 52,5 65
Kurang dari 56,5 67
Sumber: Data Tabel 7
5. Tabel Distribusi Kumulatif ‘lebih dari’:
Tabel 10: Distribusi Frekuensi Kumulatif “lebih dari”
Pegawai STIS menurut Golongan Umur Tahun 2004
Umur (Tahun) F lebih dari
Lebih dari 22,5/
22,5 atau lebih 67
26,5 atau lebih 62
32,5 atau lebih 51
36,5 atau lebih 30
42,5 atau lebih 13
46,5 atau lebih 7
52,5 atau lebih 2
56,5 atau lebih 0
Sumber: Data Tabel 7
Dari tabel distribusi kumulatif ‘kurang dari ‘dan ‘lebih dari’ dapat
dibuat gambar/grafik yaitu kurva ogive.
KURVA OGIVE
05
16
37
5460
65 676762
51
30
13
027
0
10
20
30
40
50
60
70
80
22,5 26,5 32,5 36,5 42,5 46,5 52,5 56,5
Tepi Bawah Kelas Umur
Fre
ku
en
si
Ku
mu
lati
f
Dari kurva ogive akan diperoleh frekuensi kumulatif pada kelas
interval data tertentu. Sebagai contohnya, misalnya jumlah pegawai
yang umurnya lebih dari 33 tapi kurang dari 47 tahun sebanyak 62−7
atau 55 orang.
1.5 Analisis Data
Kurang dari
Lebih dari
1. Data hasil sensus dapat dianalisis dengan cara deskriptif yaitu
menginterpretasikan data hasil pengolahan
2. Data hasil survey dapat dianalisis dengan cara:
a Deskriptif
b Inferensia, yaitu dengan cara melakukan uji statistik
Dari hasil uji statistik dapat diambil kesimpulan tentang
parameter (populasi).
BAB 2
PENGUKURAN LOKASI DAN DISPERSI
Ukuran-ukuran statistik yang akan dipelajari antara lain:
Uraian Ukuran Data tidak berkelompok Data berkelompok
Ukuran
pemusatan
Rata-rata hitung
(tertimbang/tidak
tertimbang)
Rata-rata hitungRata- rata ukur
(tertimbang/tidak
tertimbang)
Rata- rata harmonis
Nilai tengah/MedianNilai
tengah/Median
Modus Modus
Ukuran lokasi
Kuartil Kuartil
Desil Desil
Persentil Persentil
Ukuran
Dispersi
Rentang/range Rentang/range
Ragam/variance Ragam/variance
Standart Deviasi Standart Deviasi
Koefisien Variasi Koefisien Variasi
2.1. Penghitungan untuk Data yang belum
Dikelompokkan/Data Tunggal
1. Rata-rata Hitung
a. Rata-rata hitung sederhana
Rata-rata hitung ini menunjukkan bahwa penyebaran data
cenderung berpusat pada nilai tersebut.
Notasi yang sering digunakan untuk menyatakan rata-rata hitung
populasi adalah μ dan rata-rata sampel adalah x .
Cara menentukan rata-rata hitung :
Rata-rata hitung dihitung dengan menjumlahkan seluruh nilai
observasi dibagi dengan frekuensi observasi.
Nilai rata-rata hitung untuk populasi adalah:μ=
ΣX i
N
Nilai rata-rata hitung untuk sampel adalah: x=
ΣXi
n
Xi = nilai observasi ke – i
N = jumlah observasi populasi
n= jumlah observasi dari sampel
Contoh:
Produksi barang A (x) mulai dari bulan Januari sampai dengan
Desember 2002 (dalam ton) sebagai berikut: 3,5 ; 3 ; 4 ; 4 ; 3 ; 4 ; 4 ; 5
; 4,5 ; 5 ; 3 ; 4 ; 5.; n = 12
Jadi rata-rata produksi barang A per bulan (x ) pada tahun 2002
adalah 3,96 ton.
b. Rata-rata hitung tertimbang ( x )
Penimbang (wi) adalah suatu angka pembanding suatu nilai agar
lebih berarti.
Pemilihan angka penimbang (timbangan) adalah angka atau
ukuran yang relatif (ada hubungannya dengan data yang dihitung).
Contoh:
Tabel 11. Jumlah Produksi Barang A menurut Jumlah Hari Kerja per
Bulan
Tahun 2002
Bulan Produksi Hari Kerja (wi- (xi wi)
x=∑i=1
n
X i
n=3,5+3+4+4+3+4+4,5+4,5+5+3+4+5
12=47 ,5
12=3 ,96
(xi) )
Januari 3,5 20 70
Februari 3 18 54
Maret 4 22 88
April 4 21 84
Mei 3 19 57
Juni 4 21 84
Juli 4,5 22 99
Agustus 4,5 21 94,5
September 5 21 105
Oktober 3 17 51
November 4 21 84
Desember 5 23 115
Jumlah 246 985,5
Jadi rata-rata produksi barang A per bulan ( x )adalah 4
ton,dengan penimbang yang digunakan adalah jumlah hari kerja per
bulan.
2. Rata-rata Ukur (Geometric Mean)
Digunakan untuk mengukur rata-rata persentase tingkat
perubahan dalam suatu rentang waktu (average percentage rates of
change over time). Misalnya rata-rata persentase tingkat perubahan
hasil penjualan, produksi, harga dan pendapatan selama beberapa
tahun tertentu. Rumus untuk menghitung rata-rata ukur (Gm) adalah
sbb:
Dimana:
n = Jumlah rentang waktu untuk penghitungan
Xi = Nilai perubahan persentase per satuan waktu
x=∑i=1
n
x iwi
∑ wi
=985246
=4 ,00
Gm=n√x1 .x2 . .. xn=( x1 .x2 . .. xn )
1n
LogGm=log ( x1 . x2 .. . .xn )1/n=1
nlog ( x1 . x2 . . .. xn )=
1n
( log x1+ log x2+.. .+log xn )
LogGm=1n∑i=1
n
log xi
Gm=anti log1n∑i=1
n
log x i
Contoh: Untuk mengukur tingkat perubahan pinjaman
pertahun
Diketahui:
Jumlah pinjaman tahun 2000 = 1,086 milyar, tahun 2001 =
2,041 milyar, tahun 2002 = 24,669 milyar
Perubahan dari tahun 2000 – 2001 = 1,879
Perubahan dari tahun 2001 – 2002 = 12,086
Sehingga:
n=2 dan X1= 1,879 ; X2= 12,086
Rata-rata perubahan = Gm =
Artinya rata-rata tingkat perubahan pinjaman per tahun untuk tahun
2000-2002 adalah 4,765 milyar.
Rata-Rata Ukur Tingkat Bunga Majemuk (Compound Interest)
Rata-rata ukur yang digunakan untuk menghitung tingkat
perubahan relatif (average relative) suatu nilai. Misalkan untuk
menghitung hasil tabungan dengan suku bunga tertentu. Rumus untuk
menghitungnya adalah sbb:
r=n√ pn
po
−n
Dimana:
r = persentase tingkat perubahan
po = jumlah tabungan/investasi awal tahun
pn = jumlah tabungan/investasi akhir tahun
n = banyaknya waktu (tahun)
3. Median (Me)/ Nilai Tengah
Penggunaan Me akan praktis dan efisien bila n cukup besar. Me
biasanya sangat umum digunakan pada data kualitatif. Pada data
kuantitatif, nilai Me tidak dipengaruhi oleh data yang ekstrim. Data sel
diurutkan dari terkecil ke terbesar.
- Jumlah data genap: x1, x2, x3, x4, x5, x6, x7, x8 n = 8
Letak nilai median = (n+1)/2 = 9/2 = 4,5 atau letak nilai median
adalah nilai ke-4,5, sehingga median = (xk + xk+1)/2 = (x4 +x5)/2
- Jumlah data ganjil: x1, x2, x3, x4, x5, x6, x7, x8, x9 n = 9
√(1 ,879)(12 ,086 )=4 ,765
Letak nilai median = (k+1)/2=5 atau letak nilai median adalah nilai ke-
5, sehingga median adalah = X5.
4. Modus
Nilai yang mempunyai frekuensi terbanyak
5. Kuartil. Desil dan Persentil
Merupakan ukuran untuk mengetahui nilai data pada urutan
sekelompok data tersebut
Kuartil (Q i)
Kuartil membagi data (n) yang berurutan atas 4 bagian yang
sama banyak.
------|------|-------|-------
Q1 Q2 Q3
Dimana:
Q1= kuartil bawah (1/4n )
Q2 = kuartil tengah/median (1/2n)
Q3 = kuartil atas (1/4n )
Untuk mendapatkan kuartil ke-i (qi)caranya adalah dengan membagi
data yang telah diurutkan dari kecil ke besar menjadi 4 bagian yang
sama.
x1 x2 x3 x4 x5 x6 x7 x8
Letak Qi = urutan
i( n+1)4 ; i = 1,2,3
2 5 8 10 11 14 17 20
Letak Q1 = urutan ke
1(n+1)4 = urutan ke
1(8+1)4 =
94 = 2¼
Nilai yang ke 2¼ terletak antara x2 dan x3.
Jadi Q1 = 5 +
(8−5)4 = 5,75
Letak Q2 = urutan ke
2(n+1)4 = urutan ke
2(8+1)4 =
184 = 4½
Jadi Q2 = 10 + ½ (11 – 10) = 10,5 = median
Desil (Di)
Untuk mendapatkan desil ke-i (Di) caranya adalah dengan
membagi data yang sudah diurutkan dari kecil ke besar menjadi 10
bagian.
- Letak nilai Di = urutan ke
i( n+1)10 , i = 1, 2, 3, …, 9
Contoh: x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x11 x12 x13 x14 x15
- Letak nilai D2 = urutan ke
2(15−1 )10
=3210
=32
10
Jadi D2 = x3+
210
( x4−x3 )
- Letak nilai D9 urutan ke
9(15+1 )10
=14410
=144
10
Jadi D9 = x14+
410
( x15−x14)
Persentil (Pi)
Untuk mendapatkan persentil ke-i (Pi) caranya adalah dengan
membagi data yang sudah diurutkan dari kecil ke besar menjadi 100
bagian.
Letak Pi = urutan ke
i( n+1)100 ; i = 1, 2, 3, 4, 5, …, 99
Letak P77 = urutan ke
77(150+1 )100
=16627100
Jadi P77 = x166+
27100
( x117−x116)
6. Rentang, simpangan rata-rata, ragam dan simpangan baku
Rentang ( Range ) :
Adalah jenis pengukuran penyebaran/dispersi secara kasar,
cepat dan sederhana, yaitu dengan cara menghitung selisih dari 2 nilai
ekstrim besar dan ekstrim kecil.
Rentang antar kuartil = Q3 – Q1
Simpangan rata-rata (d x )
Merupakan pengukuran dispersi yang lebih baik dibanding range
karena pengukurannya dengan cara menghitung dispersi setiap nilai
observasi dari rata-ratanya.
d x=1n∑|x i− x|
dimana: xi = nilai hasil observasi
x = rata-rata hitung
Contoh:
Pengamatan kelompok 1 : x1i = 10 ; 5 ; 3 ; 6 x1 = 6
Pengamatan kelompok 2 : x2i = 6 ; 5 ; 7 ; 6 x2 = 6
Rata-rata hitung masing-masing kelompok sama yaitu sebesar 6,
namun untuk rata-rata hitung yang lebih representative atau mewakili
hasil observasinya dapat dilihat dari tingkat dispersinya.
Dari hasil pengamatan kelompok 1 : d x=
14 (4+1+3+0 )=2
Dari hasil pengamatan kelompok 2 : d x=
14 (0+1+1+0 )=1
2
Dengan demikian hasil observasi ke 2 lebih baik dibanding hasil
observasi ke 1 karena nilai d x observasi ke 2 lebih kecil dari nilai d x
observasi ke 1. Fluktuasi/deviasi hasil pengamatan kelompok 2 hanya
½ besarnya dari rata-ratanya.
Variasi dari data hasil observasi penting diperhatikan untuk
melihat seberapa jauh/besar deviasi nilai-nilai hasil observasi dari rata-
ratanya. Misalnya mengenai nilai ujian mahasiswa pada mata kuliah
tertentu, hasil produksi suatu komoditas di beberapa kota, dan
sebagainya.
Ragam( Variance)
Varians merupakan ukuran dispersi yang paling memenuhi
kriteria statistik, namun satuan yang diperoleh tidak sama dengan
satuan data aslinya, sehingga akan mengalami kesulitan dalam
interpretasi data.
Ragam populasi disimbolkan dengan σ2dan ragam sampel
disimbolkan dengan s2.
Nilai ragam bagi populasi adalah:σ 2=
Σ(X i−μ)2
N
Nilai ragam bagi populasi adalah:
Untuk nilai ragam sampel, dipergunakan pembagi n – 1 bila
sampel (n) diambil dalam jumlah yang kecil agar estimasi 2 tidak bias.
Namun apabila sampel yang diambil dalam jumlah yang besar
pembagi yang digunakan adalah n.
Simpangan baku ( standar d devia t i on )
s2=∑ ( xi− x )2
n−1=∑ x
i2−
(∑ x i )2
nn−1
Simpangan baku merupakan akar dari varians. Ukuran ini sering
digunakan dalam statistik karena memiliki satuan yang sama dengan
data aslinya. Simpangan baku populasi disimbolkan dengan , dan
simpangan baku sampel disimbolkan dengan s.
Nilai simpangan baku bagi populasi adalah:σ=√σ2
Nilai simpangan baku bagi sampel adalah:
2.2. Penghitungan untuk Data yang Dikelompokkan
1. Rata-rata Hitung
Dimana:
fi = frekuensi kelas ke i
xi = nilai tengah kelas ke i
i = 1, 2, 3, …, k
2. Rata-rata ukur (Gm)
Dimana:
xi = nilai tengah kelas ke i
fi = frekuensi kelas ke i
3. Median
Dimana:
Be = tepi bawah kelas Mc;
kelas Me = kelas yang nilai kumulatifnya mencakup nilai
n/2
Ie = interval kelas Me
F(e-1) = frekuensi kumulatif sebelum kelas Me
Fe = frekuensi kumulatif di kelas median
s=√s2
x=∑ f ix i
∑ f i
Gm=( x1f 1
x2f2
. .. xkfk)
1n =[πx i
fi]
1n
LogGm=1n∑ log x
if i=1
n∑( log x i ) f i
M e=Be+ I e [ n2−F (e−1 )
Fe−F(e−1)]
4. Modus (Mo)
Dimana:
Bo = tepi bawah kelas yang memuat Mo;
kelas yang memuat Mo = kelas yang frekuensinya terbanyak
Io = interval kelas Mo
fo = frekuensi kelas yang memuat Mo
fo-1 = frekuensi kelas sebelum kelas Mo
fo+1 = frekuensi kelas sesudah kelas Mo
5. Kuartil (Qi), Desil (Di), dan Persentil (Pi)
a. Quartil (Qi)
Dimana;
Bqi = tepi bawah kelas kuartil ke-i
Kelas kuartil ke-i = kelas yang nilai kumulatifnya mencakup nilai
in4
Iqi = interval
Fqi-1 = frekuensi kumulatif sebelum kelas kuartil
Fqi = frekuensi kumulatif kelas kuartil ke-i
b. Desil (Di)
Di=Bdi+ I di [ in10
−Fdi−1
Fdi−Fdi−1]
c. Persentil (Pi)
Pi=B pi+ I pi [ in100
−F pi−1
F pi−Fpi−1]
M o=Bo+ I o[ f o−f o−1
( f o−f o−1 )+( f o−f o+1 ) ]
Qi=Bqi+ I q
i[ in4
−Fqi−1
Fqi−Fq
i−1 ]
6. Rentang, simpangan rata-rata, ragam dan simpangan baku
a. Rentang ( Range )
R = X1 – Xk
Dimana:
X1 = nilai tengah kelas ke-1
Xk = nilai tengah kelas terakhir
b. Simpangan rata-rata
d x=1n∑ f i|xi− x|
dimana:
fi = frekuensi kelas ke i
xi = nilai tengah kelas ke i
x= rata-rata hitung data berkelompok
c. Ragam ( Variance ) Sampel ( s 2 )
dimana:
xi = nilai tengah kelas ke i
x = rata-rata hitung
fi = frekuensi kelas ke i
2.3 Koefisien Keragaman (Koefisien Variasi)
Koefisien Variasi (KV) adalah suatu nilai untuk pengukuran
dispersi atas dasar pengertian relatif, bukan absolut. Ukuran ini dipakai
untuk membandingkan tingkat keragaman/variasi beberapa distribusi
data yang unit pengukurannya berbeda (baik ukuran sampel yang
digunakan sama atau berbeda).
Contohnya:
Untuk membandingkan keragaman harga ayam (Rp/ekor atau Rp/kg)
dan harga minyak tanah (Rp/liter) dalam beberapa hari di suatu pasar.
Karena unit harga ayam adalah per ekor atau per kilogram
sedangkan unit harga minyak tanah adalah per liter maka untuk
s2=∑i−1
k
f i (x i−x )2
∑ f i
membandingkan jenis barang mana yang harganya bervariasi dipakai
cara pengukuran koefisien variasi.
Jika KVAyam lebih kecil daripada KVMinyak Tanah maka yang lebih
bervariasi adalah harga komoditas minyak tanah.
BAB 3
PENGUKURAN KEMENCENGAN DAN KERUNCINGAN
Selain dari ukuran pemusatan dan penyebaran data, secara
deskriptif kita juga dapat menganalisis persebaran data dari ukuran
kemencengan dan keruncingan data. Pengukuran kemencengan dan
keruncingan digunakan untuk mengetahui kesimetrisan distribusi data.
3.1 Pengukuran Kemencengan(Skewness)
Pengukuran kemencengan suatu distribusi data dapat diketahui
dengan beberapa cara, antara lain:
a. Memperhatikan hubungan antara rata-rata hitung, median dan
modus
Jika dari suatu hasil observasi frekuensi/kemunculan nilai yang
lebih kecil dari rata-rata hitungnya lebih banyak daripada dari nilai
yang lebih besar dari rata-rata hitung, maka bentuk distribusinya
menceng ke kanan. Hal ini menunjukkan nilai Mo<Me< X , dan
diilutrasikan seperti gambar berikut:
Mo MeX X
Sebaliknya jika frekuensi/kemunculan nilai-nilai yang lebih kecil
dari rata-rata hitungnya lebih sedikit dari nilai-nilai yang lebih besar,
rata-rata hitungnya maka bentuk distribusinya menceng ke kiri atau
nilai X <Me<Mo.
KV= sxx100 %
X Me Mo X
Namun apabila nilai X = Me = Mo, maka bentuk distribusi nilai
hasil observasi simetris atau setangkup. Hal tersebut menunjukkan
frekuensi nilai yang lebih besar dari nilai Me atau X atau Mo sama
dengan banyaknya nilai yang kurang dari nilai Me atau X atau Mo.
X = Me = Mo
b. Menggunakan koefisien Pearson,
Koefisien Pearson (Karl Pearson’s Coefficient).
Sk=3( X−Me )
s
Apabila diperoleh nilai Sk = + (positif), maka distribusi data
menceng ke kanan (skewness positif) atau ekor sebelah kanan
distribusi lebih menjulur dibandingkan ekor sebelah kirinya. Dan
sebaliknya jika Sk bernilai negatif, maka data berdistribusi menceng ke
kiri.
c. Menggunakan moment ketiga
Ukuran kemencengan dengan moment ketiga biasanya
disimbolkan dengan 3, dimana pada umumnya nilai ini berkisar antara
-3 sampai dengan 3 kemudian apabila data berdistribusi normal maka
3=0. Nilai 3 yang positif menunjukkan bahwa kurva distribusi
menceng ke kanan dan jika 3 bernilai negatif maka kurva menceng ke
kiri. Makin besar nilai 3, kurva suatu distribusi semakin meceng atau
miring,
Cara menghitung nilai moment ketiga (3) adalah sebagai berikut:
Data tidak berkelompok:
α 3=
1n∑i=1
n
(X i−X )3
s3
Dimana:
Xi = data hasil observasi
Data berkelompok:
α 3=
1n∑i=1
k
(X i−X )3 f i
s3
Dimana:
Xi = nilai tengah kelas ke-i
X = rata-rata hitung
s = simpangan baku
X = rata-rata hitung
fi = frekuensi kelas ke-i
s = simpangan baku
d. Menggunakan Diagram Kotak-Garis (Box plot Diagram)
Penggambaran kemencengan distribusi melalui diagram kotak
garis, untuk distribusi yang menceng ke kiri ditunjukkan dengan letak
garis penunjuk median berada di sebelah atas diagram kotak. Atau
diilustrasikan seperti berikut:
Nilai Observasi
Untuk distribusi yang menceng ke kanan ditunjukkan dengan
letak garis penunjuk median berada di sebelah bawah diagram kotak.
Atau diilustrasikan seperti berikut:
Nilai Observasi
Q2=Me
Q2=Me
Sedangkan untuk penggambaran distribusi data yang simetris, garis
penunjuk nilai median akan tepat berada di tengah diagram kotak,
atau dengan ilustrasi sebagai berikut:
Nilai observasi
3.2 Pengukuran Keruncingan (Kurtosis)
Dari hasil suatu observasi, distribusi nilai-nilai variabel yang
diperoleh dapat digambarkan kurvanya,seperti yang diuraikan diatas.
Sedangkan bentuk kurva normal menurut keruncingannya adalah
sebagai berikut:
Distribusi normal leptokurtik
Puncaknya tinggi/runcing artinya frekuensi yang terbanyak ada
pada/ terkonsentrasi pada bagian tengah distribusi.
Contoh:
Kelas Frekuensi1 32 43 164 545 166 47 3Jumlah 100
Kalau digambarkan kurvanya adalah sebagai berikut:
Q2=Me
Jika frekuensi terbanyak terdapat pada 3 kelas bagian tengah
distribusi disebut normal platikurtik.
Contoh:
Kelas Frekuensi1 12 73 264 325 266 77 1Jumlah 100
Gambar kurvanya sebagai berikut:
Distribusi normal (mesokurtik) adalah distribusi yang puncaknya
tidak runcing juga tidak mendatar.
Pengukuran keruncingan suatu distribusi data dihitung melalui
nilai 4 dengan cara sebagai berikut:
Data tidak berkelompok:
α 4=
1n ∑i=1
n
( X i− X )4
s4
Dimana:
Xi = data hasil observasi
X = rata-rata hitung
s = simpangan baku
Data berkelompok:
α 4=
1n ∑i=1
k
( X i− X )4 f i
s4
Dimana:
Xi = nilai tengah kelas ke-i
X = rata-rata hitung
fi = frekuensi kelas ke-i
s = simpangan baku
Interpretasi:
Jika 4>3 kurva berbentuk leptokurtik
Jika 4<3 kurva berbentuk platikurtik
Jika 4=3 kurva berbentuk mesokurtik (normal)
BAB 4
ANGKA INDEKS
4.1 Kegunaan Angka Indeks
Angka indeks merupakan angka yang dapat digunakan untuk
melakukan perbandingan suatu kegiatan yang sama dalam 2 waktu
yang berbeda. Dengan angka indeks akan dapat diketahui
maju/mundurnya suatu kegiatan seperti maju atau mundurnya
kegiatan produksi, ekspor, penjualan, jumlah uang yang beredar dan
lain sebagainya.
Beberapa indeks:
a. Indeks Bahan Pokok
b. Indeks Biaya Hidup dan Harga Konsumen
c. Indeks Perdagangan Besar.
d. Indeks Harga Yang Dibayar Petani dan Indeks Harga Yang Diterima
Petani
e. Indeks Ekspor/Impor
f. Indeks Pendapatan Nasional
g. Indeks Bursa Efek
h. Indeks Pembangunan Manusia (IPM)
i. Indeks Pembangunan Jender (IPJ)
Sama seperti IPM tetapi IPJ dirinci menurut jenis kelamin.
j. Indeks Pemberdayaan Jender (IPJ)
k. Indeks Kemiskinan Manusia (IKM)
4.2. Teknik Penyusunan Angka Indeks
4.2.1 Indeks Sederhana
Indeks sederhana adalah indeks yang membandingkan suatu hal
dalam suatu periode waktu (harga suatu jenis barang), misalnya
indeks harga dan indeks kuantitas suatu jenis barang.
Indeks Harga tahun t dengan
Periode Dasar 0:
I p=Pt
P0
x 100%
Dimana:
Pt = harga pada periode
tertentu
Po = harga pada periode
Indeks Kuantitas tahun t dengan
Periode Dasar 0:
IQ=Qt
Q0
x 100 %
Dimana:
Qt = kuantitas pada periode
tertentu
Qo = kuantitas pada
dasar periode dasar
4.2.2. Indeks Agregatif Sederhana (Tak Tertimbang)
Indeks agregatif adalah indeks dari beberapa jenis barang (2 atau
lebih).
I p=∑ p t
∑ po
x100 %
Kelemahan indeks agregatif sederhana yaitu sangat dipengaruhi
komoditas yang bernilai tinggi.
4.2.3. Indeks Agregatif Tertimbang
Jenis Indeks Harga Indeks Kuantitas
Laspeyres ILp=∑ pt qo
∑ po qo
x 100 % ILq=∑ q t p0
∑ qo p0
x100 %
Paasche IP p=∑ pt q t
∑ poq t
x 100% IPq=∑ qt p t
∑ qo p t
x100%
Fisher IF P=√ILP . IPP IFq=√ ILq . IPq
Catatan:
1. Indeks Laspeyres menggunakan penimbang keadaan tahun dasar.
Indeks ini hanya baik bila fluktuasi penimbang relatif rendah seperti
pola konsumsi masyarakat yang lambat pertumbuhannya.
2. Indeks Paasche menggunakan penimbang keadaan tahun yang
sedang berjalan. Sangat baik untuk perhitungan indeks yang
penimbangnya berubah-ubah cukup drastis. Sayangnya biaya
pengumpulan data ’penimbang’ cukup mahal.
3. Indeks lainnya merupakan modifikasi dari Laspeyres dan Paasche,
hanya Fisher yang sering dipakai.
Indeks yang baik adalah
a. Yang tertimbang, sehingga setiap komoditas sesuai dengan
peranannya.
b. Tergantung dari fluktuasi penimbang, bila relatif konstan pakailah
indeks tertimbang Laspeyres, dan bila erratic pakailah Paasche.
c. Secara teori, indeks tertimbang Fisher yang terbaik.
Menguji Indeks:
Factor reversal test
Iv = indeks nilaiIp X Iq = Iv
Laspeyres:
∑ p tqo
∑ poqo
x∑ q t po
∑ qo po ≠
∑ p tq t
∑ poqo
Laspeyres tidak memenuhi syarat.
Paasche:
∑ p tq t
∑ poq t
x∑ q t pt
∑ qo pt ≠
∑ p tq t
∑ poqo
Paasche tidak memenuhi syarat.
Fisher: √∑ p tqo
∑ poqo
x∑ q t pt
∑ q t po
x∑ po qt
∑ po qo
x∑ qt p t
∑ qo p t
=∑ pt qt
∑ po qo
Fisher memenuhi syarat factor reversal test.
Time reversal test
Ito = Indeks dengan tahun dasarnya t
Iot = Indeks dengan tahun dasarnya o
Laspeyres:
∑ p tqo
∑ poqo
x∑ po qt
∑ pt qt ≠ 1
Laspeyres tidak memenuhi syarat.
Paasche:
∑ p tq t
∑ poq t
x∑ po qo
∑ pt qo ≠ 1
Fisher √∑ p tqo
∑ poqo
x∑ q t pt
∑ q t po
x∑ po qt
∑ pt qt
x∑ qo po
∑ qo p t
=1 Konsisten
Fisher memenuhi syarat time reversal test.
Indeks Berantai
Tahun dasar dibuat berurutan, artinya tahun dasar berubah-
ubah. Cara ini mempermudah menilai perkembangan dari tahun ke
tahun, tetapi karena tahun dasar yang berubah-ubah mengakibatkan
ada kemungkinan tahun dasar tidak terletak pada keadaan ‘normal’;
juga disebut perhitungan indeks komposit (composite indices).
Contoh:
Jenis
barang
1998
po
1999
p1
2000
p2
1998
qo
1999
q1
2000
q2
A 5 6 9 4 4 3
B 7 8 12 4 5 4
Jumlah 12 14 21 8 9 7
Indeks ‘agregatif sederhana untuk harga’:
I to xI ot=1
I1999 = (14/12)x100=116,67 tahun dasar 1998
I2000 = (21/14)x100=150 tahun dasar 1999
(Harga-harga tahun 1999 naik sebesar 16,67% dari tahun 1998 dan
harga-harga tahun 2000 naik 50% dari tahun 1999).
Indeks Laspeyres
Biasa Berantai
IL1=∑ p
1qo
∑ poqo
xILo
= (56/48)X100%
= 116,67%
IL1=∑ p
1qo
∑ poqo
xILo
IL1 = 116,67%
IL2=∑ p2qo
∑ poqo
xILo
= (84/48)x100%
= 175%
IL2=∑ p2qo
∑ p1qo
xIL1
= (84/56)x116,67%
= 175%
(Indeks berantai Laspeyres ternyata tidak ‘bias’ bila dibandingkan
dengan indeks biasa).
Catatan:
a. Perhitungan dengan cara biasa lebih lengkap lebih baik, asalkan
barang dalam basket belum banyak berubah.
b. Perhitungan menggunakan ‘berantai’ lebih baik, terutama bila ratio
senantiasa dapat digantikan dengan komoditas yang gerakannya
searah/semacam.
Penggantian Tahun Dasar
Penggantian tahun dasar dapat dilakukan karena beberapa sebab:
- sudah terlalu lama (>10 tahun)
- penimbang sudah out-of-date
- tersedia data penimbang baru
- keadaan pada periode baru juga stabil/normal
Contoh: Bila data aslinya masih ada
Macam
barang
1998
po
1998
qo
1999
p1
1999
q1
2000
p2
2000
q2
A 10 5 15 4 20 3
B 8 4 10 4 15 4
Bila 1998=100
IL1999=∑ p
99q
98
∑ p98q
98
x 100 %
=15 . 5+10 . 4
10 . 5+8 .4x 100=140 ,24 %
IL2000=∑ p
2000q
98
∑ p98q
98
x 100%
=20 .5+15 .4
10 .5+8 .4x 100=195 ,12 %
Bila kemudian digeser tahun 2000=100
IL1998=10 . 3+8 . 420 . 3+15 . 4
x 100 %=51 ,67 %
IL1999=15 .3+10 . 420 .3+15 . 4
x 100 %=70 ,83 %
BAB 5
ANALISIS KORELASI DAN REGRESI SEDERHANA
5.1. Pengertian tentang Hubungan antara Dua Variabel
Analisis korelasi adalah suatu cara untuk mengukur dan
mengetahui ada atau tidak adanya hubungan linier antara dua atau
lebih variabel. Apabila dari dua atau lebih variabel tersebut terdapat
hubungan linier maka perubahan-perubahan yang terjadi pada salah
satu variabel (X) akan mengakibatkan terjadinya perubahan pada
variabel lainnya (Y). Bentuk hubungan korelasi yang terjadi antara dua
variabel dapat berupa korelasi positif, korelasi negatif, atau tidak ada
korelasi.
1. Korelasi positif
Korelasi ini terjadi apabila variabel X meningkat maka variabel Y
cenderung untuk meningkat pula.
2. Korelasi negatif
Korelasi ini terjadi apabila variabel X meningkat maka variabel Y
cenderung menurun.
3. Tidak ada korelasi
Korelasi ini terjadi apabila kedua variabel (X dan Y) tidak
menunjukkan adanya hubungan
4. Korelasi sempurna
Korelasi ini terjadi apabila kenaikan/penurunan variabel X selalu
sebanding dengan kenaikan/penurunan variabel Y (berada pada
satu garis lurus).
Nilai korelasi antara dua variabel tersebut maksimal 1 dan
minimal -1 (-1 r 1).
Teknik untuk mengetahui ada tidaknya korelasi antara 2 variabel
dapat dilakukan melalui beberapa cara, yaitu membuat diagram
pencar, dan menghitung koefisien korelasinya.
▪ Diagram Pencar
Untuk menunjukkan ada tidaknya korelasi (hubungan) antara
dua variabel (X dan Y) dapat menggunakan diagram pencar yaitu
tebaran nilai-nilai dari variabel-variabel tersebut pada sumbu x dan y.
Tujuan dari diagram pencar adalah untuk mengetahui apakah
titik-titik kordinat pada sumbu x dan y tersebut membentuk pola
tertentu. Dari diagram pencar tersebut, dapat dibuat sebuah garis
yang kira-kira membagi dua titik-titik koordinat pada kedua sisi garis.
Dari garis tersebut dapat diketahui korelasi antara kedua variabel
tersebut. Jika garis naik berarti korelasi positif, jika arah garis menurun
berarti korelasi negatif, jika tidak dapat dibuat sebuah garis berarti
tidak ada korelasi, dan jika titik-titik tepat melalui garis berarti
korelasinya sempurna.
Diagram pencar dari beberapa jenis korelasi:
Y …. Y . ... …. .. …
. …. …. .. …. ….. …. . ….. …..
Korelasi Positif X Korelasi Negatif
X
Y Y
Tidak ada korelasi X Korelasi sempurna X
▪ Koefisien Korelasi
Untuk mengetahui ada/tidak adanya hubungan antara kedua
variabel (X dan Y) dan seberapa erat hubungan kedua variabel
tersebut, dapat diketahui dengan menghitung koefisien korelasi dari
kedua variabel. Jika koefisien korelasi bertanda positif (+) maka dapat
disimpulkan hubungan kedua variabel positif dan begitu juga halnya
bila koefisien korelasi bertanda negatif (-).
Berdasarkan nilainya koefisien korelasi dapat dikategorikan
menjadi sebagai berikut:
a. r = 1, jika korelasi positif sempurna
b. r = -1, jika korelasi negatif sempurna
c. 0,8 r < 1, berarti korelasi sangat kuat positif
d. 0,6 r < 0,8, berarti korelasi cukup kuat positif
e. 0 r < 0,6, berarti korelasi lemah positif
5.2. Koefisien Korelasi Pearson
Apabila antara dua variabel ( X dan Y) yang masing-masing
mempunyai skala pengukuran interval atau rasio dan hubungannya
merupakan hubungan linier, maka keeratan hubungan antara kedua
variabel itu dapat dihitung dengan menggunakan formula korelasi
pearson yang diberi simbol dengan ryx atau rxy untuk sampel dan ρyx
atau ρxy untuk populasi.
Koefisien korelasi Pearson antara dua variabel yang datanya
tidak berkelompok:
ryx atau rxy =
∑i=1
n
(X i−X )(Y i−Y )
√∑i=1
n
(X i−X )2∑i=1
n
(Y i−Y )2
=n∑ XY−∑ X∑Y
√ (N∑ X2− (X )2) (N∑ Y 2− (Y )2)
Koefisien korelasi Pearson antara dua variabel yang datanya
berkelompok:
ryx atau rxy =
n (∑ uvf )−(∑ uf u ) (∑ vf v )
√n(∑ u2 f u)−(∑ uf u)2√n (∑ v2 f v )−(∑ vf v )2
Dimana:
u = skala baru dari X
v = skala baru dari Y
5.3. Koefisien Korelasi Spearman
Untuk mengukur keeratan hubungan antara dua variabel X dan Y
yang kedua-duanya mempunyai skala pengukuran sekurang-
kurangnya ordinal dapat dihitung dengan menggunakan formula
korelasi Spearman.
Koefisien korelasi Spearman antara Y dan X atau X dan Y:
a) Jika tidak ada data kembar
r xy=1−6∑
i=1
n
d i2
n3−n
Dimana:
di = selisih ranking variabel X dengan ranking variabel Y
n = banyaknya data
b) Jika ada data kembar
r xy=(n3−n )−6∑
i=1
n
di2−
Tx+T y
2
√(n3−n )2−(T x+T y )(n3−n )+T xT y (Siegel dan Castellan, 1988)
Penafsiran Koefisien Korelasi
Untuk menentukan keeratan hubungan bisa digunakan kriteria Guilford
(1956), jika:
1. 0 rxy /ryx < 0,1 Hubungan antara X dan Y sangat kecil
dan bisa diabaikan
2. 0,1 rxy /ryx < 0,4 Hubungan antara X dan Y kecil (tidak erat)
3. 0,4 rxy /ryx < 0,7 Hubungan antara X dan Y moderat
4. 0,7 rxy /ryx < 0,9 Hubungan antara X dan Y erat
5. 0,9 rxy /ryx < 1 Hubungan antara X dan Y sangat erat
5.4. Hubungan Linier antara Dua Variabel
Sebuah variable hasil observasi besaran data yang diperoleh
sangat mungkin dipengaruhi oleh variabel lainnya. Misalnya tinggi dan
berat badan seseorang. Untuk suatu tinggi tertentu ada besaran berat
badan yang mempengaruhi atau sebaliknya. Contoh lain misalnya
produksi padi yang dipengaruhi oleh luas lahan yang ditanami, jenis
pupuk yang dipakai, banyaknya pupuk yang dipakai dsb. Seberapa
erat hubungan antara jumlah produksi padi dengan jumlah pupuk yang
dipakai (hubungan 2 variabel) dapat diketahui dengan menghitung
koefisien korelasi dari 2 variabel tersebut. Jika hubungan 2 variabel
tersebut merupakan hubungan yang linier (positip/negatip) maka dua
variabel tersebut dapat dianalisis selanjutnya dengan analisis regresi.
5.5. Regresi Linier Sederhana
Analisis regresi linier sederhana adalah analisis regresi yang
hanya menggunakan 1 variabel independen dan mempunyai hubungan
linier dengan variabel dependennya.
Pada contoh produksi padi dan jumlah pupuk yang dipakai,
variabel independennya adalah jumlah pupuk (X), dan variabel
dependennya adalah produksi padi (Y). Dengan demikian produksi padi
merupakan fungsi dari jumlah pupuk yaitu y=f(x), dimana y=produksi
padi dan x = jumlah pupuk.
Dalam regresi linier sederhana hubungan variabel tersebut dapat
dituliskan dalam bentuk model persamaan linier:
Untuk populasi:
Y = 0+1X+i
dimana:
Y = variabel dependen/variable respon
X = variabel independen / variabel penjelas
0 = koefisien intercept = titik potong garis regresi dengan sumbu y
1 = koefisien regresi (slope)
= error / kekeliruan
Untuk sampel:
y = b0 + b1x
dimana:
y = nilai ramalan y untuk sejumlah x tertentu
b0 = koefisien intercept
b1 = slope
x = variabel independen/variabel penjelas
Nilai 0, 1 dalam model regresi linier tersebut dapat diestimasi/
diperkirakan melalui b0, b1 melalui Metode Kuadrat Terkecil.
5.6. Langkah-langkah membuat Regresi Linier Sederhana
1. Tentukan terlebih dahulu variabel independen (x) dan variabel
dependennya (y)
2. Membuat diagram pencar dari data x dan y
3. Dari diagram pencar tersebut akan diperoleh gambaran pola
tebaran x dan y, apakah membentuk hubungan yang linier? Jika ya,
maka model regresinya adalah regresi linier sederhana.
4. Menghitung koefisien intercept (b0)
b0= y−b . x
b1=∑ X iY i−
(∑ X i ) (∑Y i)n
∑ X i2−
(∑ X i)2
n
=n∑ XY−∑ X∑Y
n∑ X2−(∑ X )2
dimana:
Y = variabel dependen ke-i
X = variable independen ke-i
i = 1, 2, ,3, .., n
n = banyaknya observasi
Diperoleh persamaan garis y=b0+b1 x
5. Menghitung y=b0+b1 x
y = estimasi harga y jika x disubtitusikan kedalam persamaan
regresi
6. Membuat garis y=b0+b1 xpada sumbu x dan y.
Contoh:
Hasil observasi di desa A diperoleh data jumlah pupuk yang dipakai
dan jumlah produksi padi yang dihasilkan pada 8 petak sawah sebagai
berikut:
No. Petak
Sawah
Jumlah pupuk yang
dipakai
Produksi padi
(Ton) (1) (2) (3)1 1 22 2 43 4 54 5 75 7 86 9 107 10 128 12 14
0
2
4
6
8
10
12
14
16
0 5 10 15
x
y
Pencilan=outlier
Jumlah 50 62
Diagram pencar:
Cara menghitung garis regresi:
No. Petak Sawah
Jumlah pupuk yang dipakai (kwintal)=Xi
Produksi padi (ton)=Yi
Xi2 XiYi y
(1) (2) (3) (4) (5) (6)1 1 2 1 2 2,292 2 4 4 8 3,333 4 5 16 20 5,414 5 7 25 35 6,455 7 8 49 56 8,536 9 10 81 90 10,617 10 12 100 120 11,658 12 14 144 168 13,73Jumlah 50 62 420 499
x=508
=6 ,25;y=62
8=7 ,75
b1=∑ X iY i−
(∑ X i ) (∑Y i )n
∑ X i2−
(∑ X i )2
n
=499−
(50)(62 )8
420−502
8
=1 ,04
b0= y−b x=7 ,75−(1 ,04 )(6 ,25 )=1 ,25
y =1,25+1,04x
Y
e ------- b -------- b
a X
0
2
4
6
8
10
12
1 2 3 4 5 6 7 8
Dimana:
x = 0, artinya: jika tidak diberi pupuk maka produksi = 1,25 ton
x =1, artinya: jika diberi pupuk 1 kwintal maka produksi akan
bertambah sebanyak 1,04 kwintal
Diagram pencar:
BAB 6
ANALISIS DERET WAKTU
6.1. Pengertian tentang Data Deret Waktu
Data deret waktu adalah serangkaian data hasil observasi
dengan menggunakan runtun waktu (t) sebagai variabel. Fluktuasi
data ini dipengaruhi oleh perpaduan komponen-komponen trend
sekuler, variasi musim, gerakan sikli dan variasi random.
Y = T x S x C x I atau Y = T + S + C + I atau Y=f (T;S;C;I)
Dimana:
T = Trend sekuler
S = Variasi musim
C = Variasi sikli
I = Variasi random
Y = Garis trend
6.2. Cara Menentukan Trend dari Komponen Trend Sekuler,
antara lain:
1) Metode rata-rata bergerak
2) Metode kuadrat terkecil
1. Metode rata-rata bergerak
Penggunaan rata-rata bergerak bertujuan untuk mengisolir
fluktuasi musim, sikli, dan random yang ada dalam data asal.
y
a. Sederhana
TahunHarga
Rata-rata
Jumlah
Bergerak
Selama 3
Tahun
Rata-rata
Bergerak
Per 3 tahun
(1) (2) (3) (4)1995 30001996 9000 26000 8666,671997 14000 36000 12000,001998 13000 40500 13500,001999 13500 40250 13416,672000 13750 41250 13750,002001 14000 41750 13916,672002 14000
Diagram Pencar:
0
2000
4000
6000
8000
10000
12000
14000
16000
1994 1996 1998 2000 2002 2004
Tahun
Nil
ai
b. Tertimbang
Sebagai penimbangnya adalah koefisien Binomial. Koefisien
Binomial digunakan sebagai pengali untuk menghitung jumlah
bergerak 3 tahun dan jumlah koefisien digunakan sebagai pembagi
untuk menghitung rata-rata bergerak tertimbang per 3 tahun.
Koefisien pengali untuk 3 tahunan adalah: 1, 2, dan 1 dan jumlah
koefisiennya = 1+2+1 = 4.
Tahun HargaRata-
Jumlah Bergerak 3
Rata-rata BergerakTertimbang Per 3
rata Tahun tahun1995 30001996 9000 35000 87501997 14000 50000 125001998 13000 53500 133751999 13500 53750 13437,52000 13750 55000 137502001 14000 55750 13937,52002 14000
Diagram Pencar:
0
2000
4000
6000
8000
10000
12000
14000
16000
1994 1996 1998 2000 2002 2004
Tahun
Nil
ai
2 Metode Kuadrat Terkecil
Bentuk umum model: y’=a+bx
a= y−b x
b=∑ X iY i−
(∑ X i) (∑Y i)n
∑ X i2−
(∑ X i)2
n
=∑ (X−X ) (Y−Y )
∑ (X−X )2
Untuk mempermudah perhitungan, maka waktu (tahun) diberi skala
baru (x) sedemikian sehingga xi=0 dan X=0 .
Contoh untuk n genap:
Tahun xiHarga Rata-rata (yi)
xiyi xi2 y’
1995 -7 3000 -21000 49 9358,65
1996 -5 9000 -45000 25 9964,30
1997 -3 14000 -42000 9 10569,95
1998 -1 13000 -13000 1 11175,60
1999 1 13500 13500 1 12386,90
2000 3 13750 41250 9 12992,55
2001 5 14000 70000 25 13598,20
2002 7 14000 98000 49 14203,85
Jumlah0 94250 10175
0
168
a=942508
=11781 ,25= nilai trend periode dasar (akhir tahun
1998 (31 Desember) atau awal tahun 1999 (1 januari1999 ))
b=101750168
=605 ,65=pertambahan per setengah tahun ; Xi = unit ½
tahun
y’=11781,25+85,23xi dengan tahun dasar 1998 – 1999 = 0 (31
Des;98 atau 1 Jan ’99).
y’1999=11781,25+85,23(1)=12386.90, merupakan trend tahun
1999.
Setelah nilai Y’ diperoleh untuk tahun 1995 s.d. tahun 2002,
kemudian dibuat garis trendnya.
Diagram garis untuk menggambarkan nilai trend:
Trend harga
9358.659964.30
10569.9511175.60
12386.9012992.55
13598.2014203.85
0.00
2000.00
4000.00
6000.00
8000.00
10000.00
12000.00
14000.00
16000.00
1995 1996 1997 1998 1999 2000 2001 2002
Tahun
Har
ga
Contoh untuk n ganjil:
Tahun xiHarga Rata-rata (yi)
xiyi xi2 y’
1995 -4 3000 -12000 16 8013.321996 -3 9000 -27000 9 9022.491997 -2 14000 -28000 4 10031.661998 -1 13000 -13000 1 11040.831999 0 13500 0 0 12050.002000 1 13750 13750 1 13059.172001 2 14000 28000 4 14068.342002 3 14000 42000 9 15077.512003 4 14200 56800 16 16086.68Jumlah 0 108450 60550 60
a=1084509
=12050= nilai trend periode dasar (pertengahan tahun
1999 (Juni-Juli 1999))
b=6055060
=1009 ,17=pertambahan per tahun ; Xi = unit 1 tahun
y’=12050+1009,17xi dengan tahun dasar 1999 = 0.
Setelah nilai Y’ diperoleh untuk tahun 1995 s.d. tahun 2002, kemudian
dibuat garis trendnya.