diktat statistik for bio

74
Bab I PENDAHULUAN Definisi Beberapa definisi mengenai ilmu statistik: Statistik adalah ilmu pengetahuan yang murni dan membuat mengembangkan dan mengaplikasikan teknik!teknik seperti ketidakpastian darigangguan!gangguan induktif yang mungkin di e"aluasi# Statistik adalah ilmu pengetahuan dengan $alan mana kesimpu kesimpulan dibuattentang fen%menaa&ak yang spesifik berdasarkan atas relatifitas materi sampel terbatas# Statistik adalah membuat inferensi mengenai p%pulas inf%rmasi yang terkandung dalam sampel# Statistika adalah ilmu yang mempela$ari bagaimana meren&anakan mengumpulkan menganalisis menginterpretasi dan mempresentasikan data Bidang ilmu statistik dapat dibagi men$adi dua bagia yaitu statistik matematis ' mathemati&al statisti& ( dan statistik terapan ' applied statisti& (# Statistik matematis memperhatikan perkembangan met%de baru dari kesimpulan statistik dan m pengetahuan yang detail tentang matematik abstrak untuk implementasinya# Statistik terapan memperhatikan aplikasi dari met%destatistik matematis pada bidang yangspesifik seperti ek%n%mi psik%l%gi kesehatan masyarakat dan lainn adalah &abang dari statistik terapan yang memperha met%de statistik untuk masalah!masalah medis dan bi%l%gi 1

Upload: rivay-orin-sianipar

Post on 07-Oct-2015

21 views

Category:

Documents


0 download

DESCRIPTION

j

TRANSCRIPT

Statistik adalah ilmu pengetahuan yang murni dan beraplikasi untuk membuat, mengembangkan dan mengaplikasikan teknik-teknik se

Bab I PENDAHULUAN

Definisi

Beberapa definisi mengenai ilmu statistik:

Statistik adalah ilmu pengetahuan yang murni dan beraplikasi untuk membuat, mengembangkan dan mengaplikasikan teknik-teknik seperti ketidakpastian dari gangguan-gangguan induktif yang mungkin di evaluasi.Statistik adalah ilmu pengetahuan dengan jalan mana kesimpulan-kesimpulan dibuat tentang fenomena acak yang spesifik berdasarkan atas relatifitas materi sampel terbatas.

Statistik adalah membuat inferensi mengenai populasi berdasarkan informasi yang terkandung dalam sampel.

Statistika adalah ilmu yang mempelajari bagaimana merencanakan, mengumpulkan, menganalisis, menginterpretasi, dan mempresentasikan data

Bidang ilmu statistik dapat dibagi menjadi dua bagian utama, yaitu statistik matematis (mathematical statistic) dan statistik terapan (applied statistic). Statistik matematis memperhatikan perkembangan metode baru dari kesimpulan statistik dan memerlukan pengetahuan yang detail tentang matematik abstrak untuk implementasinya. Statistik terapan memperhatikan aplikasi dari metode statistik matematis pada bidang yang spesifik, seperti ekonomi, psikologi, kesehatan masyarakat, dan lainnya. Biostatistik adalah cabang dari statistik terapan yang memperhatikan aplikasi metode statistik untuk masalah-masalah medis dan biologis. Berikut ini adalah beberapa terminologi yang perlu diketahui sebagai dasar untuk mengerti tentang statistik.1. Observasi

Observasi merupakan materi dasar dengan mana para pekerja penelitian bekerja. Statistik yang memiliki aplikasi untuk observasi tersebut harus berbentuk angka. Dalam penelitian di bidang medis, angka-angka tersebut dapat berarti beberapa kali penyembuhan terjadi dari berbagai variasi perlakuan. Di bidang industri, angka-angka tersebut dapat berarti banyaknya kerusakan pada berbagai barang produksi yang dihasilkan oleh perusahaan perakitan (assembling).2. Variabel

Variabel didefinisikan sebagai simbol atau karakter yang menunjukkan variability ataupun variasi. Variabel dapat bersifat kuantitatif maupun kualitatif.

Variabel kuantitatif adalah variabel yang mana hasil observasinya dapat dihitung, sebab mempunyai urutan alamiah atau ranking, contohnya berat, tinggi, jumlah anak, dll. Observasi pada variabel-variabel kuantitatif selanjutnya dapat diklasifikasikan menjadi kontinyu dan diskret.

Variabel kontinyu adalah variabel yang mana keseluruhan nilai dalam suatu jarak (range) adalah mungkin. Variabel diskret atau diskontinyu adalah variabel jika nilainya tidak dapat diobservasi pada skala kontinyu sebab terdapat penghalang (gap) antara setiap nilai yang mungkin. Contohnya, jumlah anak dalam keluarga adalah 0; 1; 2; 3; dan seterusnya, tetapi tidak pernah 2,5 atau 3,842, variabel ini disebut variabel diskret. Pada contoh yang lain, umur A adalah 62, atau 63,8 ataupun 65,8341 tahun, variabel ini disebut variabel kontinyu.

Variabel kualitatif adalah variabel yang mana perhitungan numerik adalah tidak mungkin. Hasil observasi tidak dapat diurut atau dihitung, tetapi hanya diklasifikasi dan kemudian dijumlahkan. Contohnya adalah variabel warna (merah, kuning, hijau, dst) tetapi dapat diberi nomor (misalnya: merah=1, kuning=2, hijau=3, dst), setelah itu dijumlahkan berapa banyak masing-masing warna tersebut.

3. Distribusi

Data mentah (raw data)

Data mentah adalah data yang dikumpulkan namun belum disusun secara numerik. Contohnya adalah kumpulan dari berat 100 mahasiswa laki-laki yang diambil dari urutan menurut abjad.

Susunan/aturan (array)

Array adalah pengaturan dari data numerik mentah secara naik (ascending) ataupun secara turun (descending). Perbedaan antara angka terbesar dan terkecil disebut jarak data (range of the data). Contohnya, jika laki-laki terberat dari 100 mahasiswa laki-laki adalah 74 kg, dan yang teringan adalah 60 kg, maka jarak datanya adalah 74-60=14 kg.Distribusi frekuensiDistribusi adalah nilai dari variabel yang memberikan gambaran atau klasifikasi secara individu atau membedakan diantara mereka. Namun demikian, banyak yang melakukan lebih dari sekedar menjabarkan, mengklasifikasi atau membedakan, sebab kita memiliki pendapat-pendapat tentang frekuensi relatif dari nilai-nilai suatu variabel.Contoh: Berat dari 100 mahasiswa laki-laki pada universitas XYZBerat (kg)Jumlah mahasiswa

60-62

63-65

66-68

69-71

72-745

18

42

27

8

Total = 100

Data yang diorganisasi dan dirangkumkan seperti distribusi frekuensi diatas sering disebut data berkelompok (grouped data). Interval kelas dan batas (limit) kelas

Pembagian dari 60-62 kg, 63-65 kg, dan seterusnya disebut dengan jarak kelas (ataupun katagori). Angka ujung, yaitu 60 dan 62 pada kelas 60-62 disebut batas kelas, dengan batas kelas bawah (lower) adalah 60 dan batas kelas (upper) atas adalah 62. Pada pembagian dimana tidak terdapat salah satu ataupun kedua batas disebut sebagai interval kelas terbuka. Contohnya umur 65 tahun keatas, batas bawah adalah 65 tahun dan tidak ada batas atas.4. Populasi dan Sampel

Populasi adalah kumpulan dari semua objek yang dipelajari. Sampel adalah porsi atau bagian dari populasi yang merefensikan seluruh populasi.

Populasi atau semesta (universe) terdiri dari semua kemungkinan nilai dari suatu variabel. Sampel adalah suatu bagian dari populasi, dalam beberapa situasi, suatu sampel dapat termasuk dari seluruh bagian dari populasi. Suatu sampel harus menggambarkan kehadiran dari populasi jika dibawa untuk menunjukkan kesimpulan yang benar. Untuk itu, pengambilan sampel harus mengikuti aturan acak (randomness). Keacakan adalah hasil dari proses mekanis yang dimaksudkan untuk memastikan kemiringan/berat sebelah (bias) individu, baik itu pada suasana yang dikenal atau tidak, tidak mempengaruhi pemilihan observasi sampel. Sebagai akibatnya, hukum kemungkinan (probability) dapat digunakan untuk menggambarkan kesimpulan. Secara keseluruhan, pengertian sampel dalam statistik adalah suatu sampel acak (random sample).5. Presentasi, Penyimpulan dan Karakterisasi Data

Terdapat berbagai cara untuk mempresentasikan data, termasuk penggunaan tabel, grafik dan gambar. Untuk data kualitatif, menghitung satu persatu (menjumlahkan) adalah cara yang umum untuk menyimpulkan dan mempresentasikan hasil yang dituangkan dalam bentuk grafik (chart). Grafik dapat dijabarkan dalam angka yang aktual ataupun dalam bentuk persen.

Berikut ini adalah beberapa contoh bentuk grafik yang umum digunakan:

Grafik batang (bar)

Grafik pia (pie)

Grafik histogram

Grafik garis (line)

Tabel dan grafik berikut ini menunjukkan penampilan serupa, namun dalam bentuk kumulatif, data pada kolom yang paling kiri dijumlahkan baris per baris, dan ditunjukkan pada data kumulatif, yang dipresentasikan dalam bentuk grafik.

Data

20.4

27.4

90

20.4

Data kumulatif

20.4

47.8

137.8

158.2

Persentase

(%)

12.90

17.32

56.89

12.90

Grafik kumulatif

Bab II PERHITUNGAN TENDENSI PUSAT (CENTRAL TENDENCY)1. Indeks dan Notasi

Suatu variabel dinyatakan dalam bentuk simbol, misalnya Xj (baca: X sub j). Huruf j dalam Xj dapat menyatakan angka 1,2,3,,N (1 sampai dengan N) yang disebut subscript, atau indeks, menjadi dari X1, X2, X3,, XN dan huruf j dapat digantikan dengan huruf-huruf yang lainnya.

2. Penjumlahan (Summation)

Simbol digunakan untuk menunjukkan jumlah (sum) dari semua Xj dari j=1 sampai j=N, dengan definisi sebagai berikut: (simbol ( adalah huruf kapital yunani Sigma)

= X1 + X2 + X3 + + XN

yang terkadang dituliskan juga sebagai (X, (Xj ataupun (jXj.

3. Rata-rata (Average)

Rata-rata adalah suatu nilai yang merupakan gambaran dari serangkaian data, terkadang disebut juga perhitungan dari tendensi pusat. Beberapa tipe dari rata-rata antara lain: rata-rata aritmatik (arithmetic mean atau arithmetic average), median, modus (mode), rata-rata geometri (geometric mean) dan rata-rata harmoni (harmonic mean).Rata-rata aritmatik ()

Contoh: 2, 4, 8 memiliki rata-rata

Rata-rata aritmatik terbeban

Median

Median dari serangkaian angka yang telah terurut adalah nilai tengah atau rata-rata aritmatik dari kedua nilai tengah.Contoh:

3, 4, 4, 5, 6, 8, 8, 8, 10, memiliki median 6. 3, 4, 4, 5, 6, 8, memiliki median (4+5)=4.5.ModusModus dari serangkaian angka adalah nilai yang paling sering hadir (frekuensi terbesar). Modus dapat saja tidak ada.

Contoh:

2, 2, 5, 7, 9, 9, 9, 10, memiliki modus 9, dan disebut dengan unimodal. 2, 2, 5, 7, 9, 9, 10, memiliki modus 2 dan 9, dan disebut dengan bimodal.

2, 5, 7, 9, 10, 13, tidak memiliki modus.

Rata-rata Geometri (G)

EMBED Equation.3 atau

Contoh:

2, 4, 8 memiliki rata-rata

tabel berikut merupakan data yang menunjukkan konsentrasi penghambatan minimal (minimal inhibitory concentration, MIC) dari penisilin G dalam urine untuk N. gonorrhoeae dari 74 pasien.

(g/mL) KonsentrasiFrekuensi

0.03125=20(0.03125)

0.0625=21(0.03125)

0.125=22(0.03125)

0.25=23(0.03125)

0.5=24(0.03125)

1.0=25(0.03125)21

6

8

19

17

3

[21xlog(0.03125)+6xlog(0.0625)+8xlog(0.125)+19xlog(0.250)+17xlog(0.50)+3xlog(1.0)]=-0.846G=antilog (-0.846)=0.143

Rata-rata Harmoni (H)

atau

Contoh:

2, 4, 8 memiliki rata-rata

dari ketiga rata-rata diatas (aritmatik, geometri dan harmoni) terdapat hubungan: , dari contoh kelompok 2, 4, 8, memiliki rata-rata aritmatik 4.67, rata-rata geometri 4, dan rata-rata harmoni 3.43.

Kuadrat Rata-rata Akar (Root Mean Square, RMS)

Kuadrat rata-rata akar didefinisikan dengan:

4. Skewness

Skewness adalah derajat kemiringan atau asimetri, atau awal dari simetri suatu distribusi. Jika kurva frekuensi dari distribusi memiliki ekor yang lebih panjang kekanan daripada kekiri dari maksimum pusat, distribusi tersebut dikatakan miring kekanan (skewed to the right), atau memiliki skewness positif, sebaliknya, jika lebih panjang kekiri, maka disebut miring kekiri (skewed to the left), atau skewness negatif.

Skewness=

Quartile coefficient of skewness=

10-90 percentile coefficient of skewness=

Moment coefficient of skewness=

Derajat kemiringan dapat digambarkan dalam tiga bentuk distribusi, yaitu positif, simetris dan negatif, yang dapat dilihat dari contoh berikut ini:

Skew negatif

Distribusi dari kelembaban relatif (relative humidity) yang diobservasi dari iklim lembab (humid climate) pada waktu yang sama setiap hari untuk beberapa hari lamanya. Dalam kasus ini, kebanyakan kelembaban berada pada atau mendekati 100%, dengan sangat sedikit kelembaban rendah atau hari yang kering.

Skew positif

Distribusi dari sejumlah tahun penggunaan kontrasepsi oral (oral contraceptive, OC) yang digunakan oleh satu grup wanita usia 20-29 tahun yang berpartisipasi dalam suatu rencana grup kesehatan prabayar.

Simetris

Distribusi dari tekanan darah sistolik yang diambil dari seluruh pekerja pabrik usia 30-39 tahun pada suatu tempat kerja.

5. Kurtosis

Kurtosis adalah derajat dari puncak suatu distribusi, umumnya diambil untuk distribusi normal. Suatu distribusi yang memiliki puncak relatif tinggi disebut leptokurtic, yang memiliki puncak rata disebut platykurtic, dan jika berada diantaranya disebut mesokurtic.

Kurtosis=

SHAPE \* MERGEFORMAT

SHAPE \* MERGEFORMAT

SHAPE \* MERGEFORMAT

Bab III PENYIMPANGAN (Deviasi) BAKU DAN PERHITUNGAN DISPERSI LAINNYA

Derajat (degree) yang mana data numerik cenderung untuk menyebar disekitar nilai rata-rata disebut dispersi atau variasi dari data. Terdapat berbagai jenis perhitungan dari dispersi ini, yang paling sering adalah jarak (range), deviasi rata-rata (mean deviation), jarak semi-interkuartil, 10-90 jarak persentil, dan penyimpangan baku (standard deviation).1. Jarak (Range)

Jarak dari suatu rangkaian angka adalah perbedaan antara angka yang terbesar dan yang terkecil.

Contoh:

jika laki-laki terberat dari 100 mahasiswa laki-laki adalah 74 kg, dan yang teringan adalah 60 kg, maka jarak datanya adalah 74-60=14 kg. Gambar berikut ini menunjukkan dua sampel pengukuran kolesterol yang dilakukan pada orang yang sama, tetapi menggunakan teknik pengukuran yang berbeda.

Jarak untuk metode autoanalyzer adalah:

226-117 = 49 mg%/mL

Jarak untuk metode microenzymatic adalah: 209-192 = 17 mg%/mL

2. Kuartil, Desil, dan Persentil

Jika kelompok data dibagi dua, yang telah diurut dibagi dua sama rata, maka akan didapat nilai median. Dan jika masing-masing kelompok dibagi dua lagi dengan cara yang sama, maka akan terdapat empat kelompok (setiap kelompok disebut kuartil, Q) dengan tiga angka yang merupakan pembatasnya, yaitu Q1, Q2, dan Q3, dimana Q2 sama dengan mediannya.

Dengan cara yang sama, jika kelompok data tersebut dibagi 10 bagian (setiap bagian disebut desil, D), maka terdapat 9 pembatas, yaitu D1,D2,D3,,D8, dan D9. Saat kelompok tersebut dibagi 100 bagian (setiap bagian disebut persentil, P), terdapat 99 pembatas, yaitu P1, P2,, P98, dan P99. Desil kelima dan persentil ke-50 adalah mediannya.

3. Deviasi (Penyimpangan) Rata-rata (Mean/Average Deviation, MD)Deviasi (penyimpangan) rata-rata dari serangkaian N data X1,X2,,XN didefinisikan sebagai berikut:

dimana adalah rata-rata aritmatik, adalah nilai absolut deviasi Xj dari .Contoh:

deviasi rata-rata dari 2, 3, 6, 8, 11, adalah

Jumlah Deviasi (Penyimpangan) (Sum of Deviation)Jumlah deviasi atau penyimpangan didapatkan dari:

Contoh:

Untuk masalah pengukuran kolesterol diatas, rata-rata untuk kedua metode tersebut adalah 200 mg%/mL, jumlah deviasinya adalah sebagai berikutUntuk metode autoanalyzer:

d = (177-200)+(193-200)+(195-200)+(209-200)+(226-200)=-23-7-5+9+26=0

Untuk metode microanalyzer:

d = (192-200)+(197-200)+(200-200)+(202-200)+(209-200)=-8-3+0+2+9=0

Jarak semi-interkuartil (semi-interquartile range)Jarak semi-interkuartil atau penyimpangan kuartil dari serangkaian data ditunjukkan oleh Q, dan didefinisikan dengan:

Jarak interkuartil (Q3 Q1) seringkali digunakan, tetapi jarak semi-interkuartil lebih sering digunakan sebagai suatu perhitungan dari dispersi (penyebaran).4. Penyimpangan baku (standard deviation)

Penyimpangan baku dari serangkaian N data yaitu X1,X2,,XN didefinisikan sebagai berikut:

dimana x menggambarkan penyimpangan setiap angka Xj dari rata-rata . Jadi s adalah kuadrat rata-rata akar penyimpangan dari rata-rata, atau kadang-kadang disebut penyimpangan kuadrat rata-rata akar.Kadang-kadang simpangan baku dari data sampel didefinisikan dengan (N-1) menggantikan N sebagai penyebut, sebab menghasilkan nilai yang menggambarkan estimasi (perkiraan) yang lebih baik dari simpangan baku suatu populasi dari tempat sampel. Untuk nilai N yang besar (N>30), secara praktis tidak ada perbedaan antara keduanya. Saat perkiraan yang lebih baik diperlukan, dapat mengalikan simpangan baku (standard deviation) yang telah dihitung dengan menggunakan faktor (N-1), dikalikan dengan , sehingga kembali didapat persamaan seperti diatas.Metode cepat untuk menghitung simpangan baku:

dimana jika bekerja dengan N yang kecil (N