paper metode statistika
TRANSCRIPT
A. Statistika
Statistika : ilmu mengumpulkan, mengolah, meringkas, menyajikan dan interpretasi data
untuk dasar pengambilan keputusan.
Statistika adalah sekumpulan konsep dan metode yang digunakan untuk mengumpulkan
data, menyajikan data,analisis data dan menginterpretasikan data tentang bidang tertentu
dan mengambil kesimpulan dalam situasi dimana ada ketidakpastian dan variasi.
Menurut sejarah kata statistika diambil dari bahasa latin, Status yang berarti Negara. Untuk
beberapa decade statistic semata-mata hanya dikaitkan denagn penyajian angka-angka
tentang situasi perekonomian, kependudukan dan politik yang terjadi di suatu Negara.
Statistik dalam perkembangannya telah membuat lompatan yang jauh lebih maju daripada
hanya sekitar kompilasi grafik-grafik dan table-tabel angka. Sebagai suatu disiplen ilmu saat
ini statistika meliputi berbagai metode dan konsep yang sangat penting dalam semua
penelitian yang melibatkan pengumpulan data dengan cara eksperimental dan observasi
dan mengambil inferensi atau kesimpulan dengan jalan menganalisis data.
Statistika terdiri dari seni dan ilmu tentang pengumpulan penyajian, analisis dan
interprestasi data maupun mengambil kesimpulan (generalisasi) yang masuk akal
sehubungan dengan fenomena yang dipelajari/diselidiki.
B. Peranan statistika
Statistika mempunyai peranan yang sangat penting dalam langkah-langkah pokok metode
ilmiah pad atingkat pengumpulan informasi misalnya statistika memberi petunjuk kepada
para peneliti bagaimana cara yang wajar dan baik untuk mengumpulan data yang
informative termasuk penentuan macam dan banyak data/sample sedemikian hingga
kesimpulan yang ditarik dari analisis data dapat dinyatakan denagn tingkat ketepatan
(presisi) yang diinginkan.
Sedangkan kegunaan statistika yakni untuk:
· Membantu penelitian dalam menggunakan sampel sehingga penelitian dapat bekerja
efisien dengan hasil yang sesuai dengan obyek yang ingin diteliti
· Membantu penelitian untuk membaca data yang telah terkumpul sehingga peneliti dapat
mengambil keputusan yang tepat
Di dalam penelitian, statistika berperan untuk:
· Memberikan informasi tentang karakteristik distribusi suatu populasi tertentu, baik diskrit
maupun kontinyu. Pengetahuan ini berguna dalam menghayati perilaku populasi yang
sedang diamati.
Sementara menurut Sugiyono (2003:12), statistika berperan untuk:
· Alat untuk menghitung besarnya anggota sampel yang diambil dari suatu populasi,
sehingga jumlah sampel yang dibutuhkan akan lebih dapat dipertanggungjawabkan
· Alat untuk menguji validitas dan reliabilitas instrumen sebelum instrumen tersebut
digunakan dalam penelitian
· Sebagai teknik untuk menyajikan data, sehingga data lebih komunikatif, misalnya melalui
tabel, grafik, atau diagram
· Alat untuk menganalisis data seperti menguji hipotesis yang diajukan dalam penelitian
C. Penyajian dan Pengolahan data
Untuk memperoleh data statistika, maka data yang telah dikumpulkan dari elemen-elemen
yang diselidiki harus diolah.
Arti mengolah data adalah merubah data mentah untuk memperoleh keterangan-
keterangan ringkasan yang berupa angka-angka ringkasan. Pengolahan data dapat
dilakukan dengan manual, maupun dengan alat-alat elektronik (kalkulator,
komputer)
1. Range
Range hanya memperhitungkan dua nilai, yaitu nilai maksimum dan nilai minimum dan tidak
memperhitungkan semua nilai, sehingga sangat tidak stabil atau tidak dapat diandalkan
sebagai indikator dari ukuran penyebaran. Rentang (range) atau kisaran data adalah deviasi
yang paling sederhana didefinisinkan sebagai perbedaan harga yang tertinggi dengan yang
terendah dari sekumpulan data. Jadi rentang adalah data terbesar dikurangi data terkecil.
Rentang memberikan gambaran seberapa jauh data itu memencar (merentang) tetapi tidak
menunjukkan tentang keragaman datanya. Dua kumpulan data yang mempunyai rentang
yang sama belum tentu keadaannya sama.
Dalam menentukan rang, tidak semua data digunakan, hanya data terbesar dan data
terkecil saja.
Contoh
Data kelompok I : 45, 50,50,55,60,70, dan 80
Range = 80-45 =35
Data kelompok II : 45,60,72,70,75,76 dan 80
Range = 80-45 =35
2. Banyaknya Kelas
Interval kelas yang akankita buat jangan terlalu sedikit supaya tidak banyak informasi yang
hilang dan jangan terlalu banyak (tidk efisien) serat diusahakan ganjil (tidak genap). Interval
kelas yang paling efisien biasanya antara 5-20 kelas, tergantung pada banyaknya data.
Berdasarkan banyaknya data, Struges memberikan formula sebagai berikut : k= 1 +3,322
log n disini k= banyaknya interval kelas dan n=banyaknya data , misalnya banyaknya data
(n=126) maka banyaknya interval kelas yang digunakan adalah k1 +3,322 log 126 =7,98,
supaya ganjil dibulatkan menjadi 7 interval kelas.
3. Perkiraan Interval Kelas
Sebelum menentukan Interval kelas, perkiraan interval kelas harus ditentukan terlebih
dahulu. Dalam menentukan perkiraan interval kelas tidak melibatkan semua data, hanya
rentang data dibagi banyaknya kelas.
Rumus : I RK
.
Contoh : I RK
= 83620
7 = 11945,71
(dengan 83620 adalah rentang nya (range) dan 7 banyaknya kelas).
4. Interval Kelas
Interval kelas ditentukan denagn menggunakan rumus :
I= (nilai terbesar-nilai terkecil) = R
Banyaknya interval kelas k
Misalnya data sebanyak (n = 126) data terbesar nilainya 100 dan terkecil 30, maka R=100-30
=70 jadi lebar interval kelasnya adalah I = 70/7 =10
5. Pengurutan data
Pengurutan data di lakukan supaya lebih mudah dalam melakukan perhitungan atau
pengaplikasian dalam tabel. Pengurutan data dari data terkecil ke data terbesar.
6. Tabel Distribusi Frekuensi
Definisi : Adalah metode statistik untuk menyusun data dengan cara membagi nilai-nilai
observasi data ke dalam kelas-kelas-kelas dengan interval tertentu.
Tabel Merupakan kumpulan angka yang disusun menurut kategori-kategori atau
karakteristik-karakteristik data sehingga memudahkan dalam analisis data.
Bisa dipergunakan untuk menyajikan cross section data dan time series data
Untuk mendapatkan gambaran dan kesimpulan tentang data tersebut, dapat dibuat tabel
frekuensi atau distribusi frekuensi. Distribusi frekuensi adalah susunan angka menurut
besarnya (kuantitas) yang disebut frekuensi distribusi kuantitatif atau menurut katagorinya
(kualitasnya) yang disebut distribusi frekuensi kualitatif (katagori).
Tabel frekuensi atau distribusi frekuensi berarti mendistribusikan data kedalam beberapa
kelas atau kategori, kemudian menentukan banyaknya individu yang termasuk kelas
tertentu, yang disebut frekuensi kelas.
Format data berupa table frekuensi berisikan kolom-kolom nomor urut kelas, interval kelas,
nilai tengah kelas dan frekuensi data. Nilai tengah kelas adalah sebuah nilai sebagai wakil
dari interval kelas yaitu (batas bawah-batas asat)/2. frekuensi kelas diperoleh denagn
membilang banyaknya data yang tergolong kedalam suatu interval kelas. Total seluruh
frekuensi kelas harus sama denagn banyaknya data jadi n= nΣ fi bil atidak berarti salah
setiap data hanya boleh mesuk kedalam salah satu interval kelas jadi setiap data idak boleh
menjadi anggota yan lebih kecil.asal secara konsisten berlaku untuk semua data maka tidak
boleh dimasukkan kedalam kelas yang lebih besar untuk data yang lain.
Distribusi frekuensi atau table frekuensi dapat pula dilengkapi denagn kolom-kolom
frekuensi komulatif(frekuensi komulatif kurang dari) frekuensi nisbi atau frekuensi
persentase. Frekuensi komulatif lebih dari batas atas adalah banyaknya data yang tercakup
dalam kisaran mulai dari batas atas sampai batas bawah terkecil.
Frekuensi nisbi (relative) merupakan frekuensi dari setiap kelas yang dinyatakan dalam
suatu proporsi dihitung dengan rumus f.n.i = fi/n. apabila dinyatakan dalam presentase
maka dikalikan 100 %
Penyusunan distribusi frekuensi yang hanya merupakan pedoman umum,karena setiap
peneliti dapat menentukan ketentuan-ketentuan lain sesuai denagn masalah tujuan dan
pengalamannya.
Istilah-Istilah :
30 - 39 …….. disebut kelas interval
30 ………… disebut nilai batas kelas bawah
39 ………… disebut nilai batas kelas atas
29,5 ………... disebut nilai limit kelas bawah
39,5 ………... disebut nilai limit kelas atas
c = limit kelas atas - limit kelas bawah
……..…….. disebut panjang kelas
Xi = (batas kelas bawah + batas kelas atas)/2
…………… disebut nilai tengah
7. Mean
Simpangan rata-rata merupakan penyimpangan nilai-nilai individu dari nilai rata-ratanya.
Rata-rata bisa berupa mean atau median. Untuk data mentah simpangan rata-rata dari
median cukup kecil sehingga simpangan ini dianggap paling sesuai untuk data mentah.
Namun pada umumnya, simpangan rata-rata yang dihitung dari mean yang sering
digunakan untuk nilai simpangan rata-rata.
Dalam statistika, rata-rata atau rataan (Bahasa Inggris: mean) memiliki dua arti:
rata-rata dalam pengertian sehari-hari, lebih tepatnya disebut rataan aritmetik, untuk
membedakan dengan rataan geometrik atau rataan harmonik. Rata-rata juga disebut
dengan rataan sampel.
nilai ekspektasi dari sebuah peubah acak, yang juga disebut dengan rataan populasi. Selain
dalam statistika, rata-rata juga dipakai dalam geometri dan analisis, dan rata-rata memiliki
berbagai konsep dan definisi untuk keperluan tertentu.
Rataan sampel seringkali digunakan sebagai pengestimasi tendensi pusat seperti pada rata-
rata populasi. Selain itu, digunakan pula pengestimasi lain seperti median.
Sesuai untuk data bertaraf interval dan ratio
Tidak sesuai untuk data bertaraf nominal atau ordinal
Dalam perhitungan mean, dapat melibatkan seluruh data yang ada.Mean dapat dipengaruhi
oleh seluruh angka pada data, termasuk data yang terbesar dan data yang terkecil.
Perhitungan mean ada dua cara, yaitu :
Mean yang belum dikelompokkan
Dengan cara menjumlahkan setiap data dan dibagi dengan jumlah data.
Rumus :
Ƹ XiN
.
Mean yang sudah dikelompokkan
Dengan cara mengkalikan frekuensi dan data kemudian dibagi dengan jumlah
data.
Rumus : Ƹ fi . xiN
= ,,,,
8. Median
Median adalah nilai data yang terletak di tengah-tengah apabila data disusun menurut
besarnya. Jika sekumpulan data banyaknya genap maka median adalah rata-rata dua harga
yang ditengah-tengah.
Dengan pengertian diatas median sekumpulan data dapat dicari denagn cara menyusun
data menurut besarnya yaitu dari kecil ke besar. Kita periksa harga yang ditengah-tenagh
urutan tadi dan harga itu adalah median untuk data yang banyaknya ganjil. Jika banyaknya
data genap maka kita ambil dua harga yang ditenagh dan selanjutnya hitung rata-rata
dengan demikian diperoleh harga median.
9. Modus
Modus adalah data yang paling sering muncul atau data yang frekuensinya tertinggi. Bisa
digunakan untuk semua jenis pengukuran data (nominal, ordinal, interval dan ratio). Jika kita
tertarik pada data frekuensi, jumlah dari suatu nilai dari kumpulan data, maka kita
menggunakan modus. Modus sangat baik bila digunakan untuk data yang memiliki sekala
kategorik yaitu nominal atau ordinal.
10. Mean Absolute Deviation
MAD digunakan untuk mengukur ketepatan nilai dugaan model yang dinyatakan dalam
bentuk rata-rata absolute kesalahan. MAD diperoleh dari perkalian frekuensi dengan data-
data yang telah dikurangi data rata-rata. Rumusnya :
MAD = Ƹfi [xi−x]N
11. Standar Deviasi
Standar deviasi merupakan ukuran penyebaran yang paling banyak digunakan. Semua gugus
data dipertimbangkan sehingga lebih stabil dibandingkan dengan ukuran lainnya. Namun,
apabila dalam gugus data tersebut terdapat nilai ekstrem, standar deviasi menjadi tidak
sensitif lagi, sama halnya seperti mean.
Standar Deviasi memiliki beberapa karakteristik khusus lainnya. SD tidak berubah apabila
setiap unsur pada gugus datanya di tambahkan atau dikurangkan dengan nilai konstan
tertentu. SD berubah apabila setiap unsur pada gugus datanya dikali/dibagi dengan nilai
konstan tertentu. Bila dikalikan dengan nilai konstan, standar deviasi yang dihasilkan akan
setara dengan hasilkali dari nilai standar deviasi aktual dengan konstan.
Dalam statistika dan probabilitas, simpangan baku atau deviasi standar adalah ukuran
sebaran statistik yang paling lazim. Singkatnya, ia mengukur bagaimana nilai-nilai data
tersebar. Bisa juga didefinisikan sebagai, rata-rata jarak penyimpangan titik-titik data diukur
dari nilai rata-rata data tersebut.
Simpangan baku didefinisikan sebagai akar kuadrat varians. Simpangan baku merupakan
bilangan tak-negatif, dan memiliki satuan yang sama dengan data. Misalnya jika suatu data
diukur dalam satuan meter, maka simpangan baku juga diukur dalam meter pula.
Istilah simpangan baku pertama kali diperkenakan oleh Karl Pearson pada tahun 1894,
dalam bukunya On the dissection of asymmetrical frequency curves.
12. Kuartil, desil dan Persentil
Jika median adalah harga yang membagi distribusi data menjadi dua bagian yang sama,
maka kuarti (K) adalah harga yang membagi distribusi data menjadi 4 bagian yang sama,
sehingga terdapat tiga harga kuartil I,II, dan III. Kuartil II berimpit/ sama dengan menghitung
median, kuartil I dan III adalah mediab dari bsgian data pertama dan kedua setelah median
seluruh ditentukan.
Desil (D) adalah harga-harga yang membagi data menjadi 10 bagian maka ada 9 harga desil.
Letak/harga desil yang ke 5 sama dengan median prinsip cara harga desil yang lain
menghitungnya sama dengan menghitung median.
Persentil (P) adalah harga-harga yang membagi distribusi data menjadi 100 bagian maka ada
99 harga persentil.
Nilai D2 berimpit/sama dengan P20 nilai tersebut menunjukkan bahwa data yang lebih kecil
dari D2 atau P20 sebanyak 2/10 atau 20/100 yaitu 20 %
Nilai tengah kisaran (NTK) dapat dihitung denagn rumus
NTK = P25 + P75 = KI + KIII
2 2