pengolahan data statistik

Upload: nurifathurohman

Post on 02-Mar-2016

46 views

Category:

Documents


2 download

TRANSCRIPT

  • 1/4/2013

    1

    Pengolahan data

    Endang Lestari

    Kompetensi biostatistik yang harus dimiliki oleh

    seorang peneliti

    Kemampuan peneliti untuk memilih uji statistik

    yang paling tepat sesuai dengan data yang akan

    dianalisis

    Pemahaman peneliti mengenai potensi dan

    keterbatasan uji statistik yang digunakan

    Kemampuan peneliti untuk menafsirkan hasil uji

    statistik yang dilakukan, termasuk didalamnya

    kemampuan memedakan pengertian kemaknaan

    statistik dan kemaknaan aplikatif

  • 1/4/2013

    2

    Macam statistik

    STATISTIK DESKRIPTIF, yang berkaitan dengan pencatatan dan peringkasan data, dengan tujuan menggambarkan hal-hal penting pada sekelompok data, seperti berapa rata-ratanya, variasi data dan sebagainya.

    Statistik yang digunakan untuk menggambarkan atau menganalisa karakteristik data hasil penelitian, tetapi tidak digunakan untuk membuat kesimpulan yang lebih luas (generalisasi/inferensi).

    Statistik deskriptif harus selalu mendahului statistik inferensial

    STATISTIK INFERENSIAL, Suatu proses atau

    prosedur penarikan kesimpulan terhadap

    karakter populasi yang didasarkan pada data

    yang diperoleh dari observasi pada sampel

  • 1/4/2013

    3

    ANALISIS DESKRIPTIF

    Biasa disebut dengan analisis univariat

    Tujuannya adalah untuk menjelaskan ataumendeskripsikan karakteristik masing-masingvariabel yang diteliti

    Fungsinya adalah untuk menyedrhanakan ataumeringkas kumpulan data sedemikian rupa sehinggakumpulan tersebut dapat berubah menjadi informasisederhana yang dapat dibaca dengan cepat

    Peringkasan tersebut dapat berupa ukuran-ukuranstatistik, tabel dab grafik

    Hal-hal yang perlu diperhatikan

    Jenis peringkasan yang dikehendaki:

    a. ukuran tengah (central tendency)

    b. ukuran variasi

    Jenis data:

    a. numerik

    b. atau kategorik

    Bentuk tampilan yang dikehendaki: tabel, grafik, dll.

  • 1/4/2013

    4

    Peringkasan untuk data numerik dengan

    ukuran tengah

    Mean

    mean atau average adalah ukuran rata-rata yang merupakan hasil bagi dari jumlah semua nilai pengukuran dibagi oleh banyaknya pengukuran

    keuntungan:

    a. mudah menghitungnya

    b. sudah melibatkan seluruh data dalam

    penghitungannya

    kelemahannya:

    nilai mean sangat dipengaruhi oleh nilai

    ekstrim, baik ekstrim tinggi maupun ekstrim

    rendah. Kelompok data yang memiliki nilai

    ekstrim (sering dikenal dengan distribusi data

    yang menceng ke kiri atau ke kanan) mean

    tidak dapat mewakili rata-rata kumpulan nilai

    pengamatan.

  • 1/4/2013

    5

    Contoh histogram menceng kanan

    Median

    median adalah nilai tengah. Setengah

    banyaknya pengamatan mempunyai nilai di

    bawahnya dan setengah nilai pengamatan

    berada di atasnya.

    penghitungan median hanya didasarkan pada

    urutan nilai hasil pengukuran, besar beda nilai

    diabaikan.

  • 1/4/2013

    6

    Mode/modus

    mode atau modus adalah data yang memiliki

    frekuensi terbanyak.

    contoh:

    data umur mahasiswa:

    18 th, 22 th, 21 th, 20 th, 23 th, 20 th

    maka modusnya adalah 20 th.

    Hubungan mean, median dan modus

    Hubungan mean, median dan modus akan menentukan sebaran atau distribusi data

    Jika mean, median dan modus sama, maka bentuk distribusi data adalah normal

    Jika mean > median>modus, maka bentuk distribusi menceng /miring kanan

    Jika mean

  • 1/4/2013

    7

    Hitung mean, median, modus data berikut,

    dan tentukan bentuk histogramnya

    Berikut adalah 30 data usia mahasiswa FK

    Unissula angkatan 2007

    19,19,20,20,19,20,20,18,20,20,21,22,25,24,

    20, 19,20,20,19,19,18, 20,19,19, 19,20,18,

    18,24,23

    Contoh hasil uji statistik:

    Tentukan bentuk sebarannya (miring ke kiri atau

    ke kanan?????

  • 1/4/2013

    8

    Miring ke kanan, Data lebih banyak di sebelah kiri

  • 1/4/2013

    9

    Ukuran-ukuran variasi

    Untuk mengetahui seberapa jauh data

    bervariasi digunakan ukuran penyebaran atau

    ukuran variasi.

    Ukuran penyebaran atara lain:

    - range

    - jarak inter kuartil

    - standar deviasi

    Range

    merupakan ukuran variasi paling dasar,

    dihitung dari selisih nilai terbesar di kurangi

    nilai terkecil.

    keuntungan:

    penghitungan dapat dilakukan dengan cepat

    kelemahan:

    range sangat dipengaruhi oleh nilai ekstrim

    baik bawah maupun atas

  • 1/4/2013

    10

    Jarak inter kuartil

    nilai observasi disusun berurutan dari nilai kecil ke nilai besar, kemudian ditentukan kuartil bawah dan kuartil atas. Kuartil merupakan pembagian data menjadi 4, yang dibatasi oleh tiga kuartil.

    - Kuartil I mencakup 25% data berada di bawahnya dan 75% berada di atasnya

    - kuartil II (median) mencakup 50% data berada di atasnya dan 50% berada di bawahnya

    - kuartil III mencakup 75% data berada di bawahnya dan 25% data berada di atasnya.

    Jarak interkuartil adalah selisih antara kuartil III dan kuartil I.

  • 1/4/2013

    11

    Statistics

    sistolik

    50

    0

    78.4000

    70.0000

    70.00

    70.0000

    70.0000

    80.0000

    Valid

    Missing

    N

    Mean

    Median

    Mode

    25

    50

    75

    Percentiles

    120.00110.00100.0090.0080.0070.0060.00

    sistolik

    30

    25

    20

    15

    10

    5

    0

    Frequency

    Mean = 78.40Std. Dev. = 12.0136N = 50

    Histogram

    Standar deviasi

    adalah variasi data yang diukur melalui penyimpangan/ deviasi dari nilai-nilai pengamatan terhadap nilai mean-nya.

    SD dihitung dengan rumus:

    semakin besar SD semakin besar variasinya.

    n

    xxSD

    2)1( =

  • 1/4/2013

    12

    simpulan

    Statistik deskriptif untuk data numerik digunakan:

    mean, median, setandar deviasi dan interquartil range.

    Bila data yang terkumpul tidak menunjukkan adanya nilai ekstrim (distribusi normal) maka analisis univariat (deskriptif) yang baik adalah dengan menggunakan nilai mean dan standar deviasi.

    Bila data yang terkumpul menunjukkan adanya nilai ekstrim (distribusi tidak normal) maka gunakan nilai median dan interquartil range (IQR) minimal-maksimal.

    Peringkasan data kategorik

    Hanya menggunakan distribusi frekuensi

    dengan ukuran persentase dan proporsi

    Contoh:

    Distribusi responden menurut tingkat pendidikan

    pendidikan jumlah persentase

    SD 60 60.0

  • 1/4/2013

    13

    Analisis sebaran dataparameter Kreteria normal

    Koefisien varians Jika >30%

    Rasio skweenes Dihitung dari nilai skweenes/standard error skweenes

    = -2 sd 2

    Rasio kurtosis Dihitung dari nilai kurtosis/standard error kurtosis =

    -2 sd 2

    histogram Simetris, tidak miring ke kiri maupun ke kanan

    Box plot Simetris, median tepat di tengah, tidak ada outlier

    dan nilai ekstrim

    Normal Q-Q plots Data menyebar sekitar garis

    Detrended QQ plots Data menyebar sekitar garis pada nilai 0

    Kolmogorov smirnov

    Shapiro-wilk

    > 0.05

    STATISTIK INFERENSIAL

    Suatu proses atau prosedur penarikan

    kesimpulan terhadap karakter populasi yang

    didasarkan pada data yang diperoleh dari

    observasi pada sampel

    Digunakan untuk:

    Penaksiran parameter populasi apakah suatu

    kelompok termasuk dalam populasi tertentu

    Pengujian kebenaran hipotesis

  • 1/4/2013

    14

    Jenis uji statistik inferensial

    Parametrik : Didasarkan pada asumsi parameter

    Memiliki persyaratan2 uji

    Lebih powerful

    Hasil uji statistiknya dapat digeneralisasi untukkeseluruhan populasi

    Non parametrik: Tidak didasarkan pada asumsi parameter

    hasil uji statistiknya hanya berlaku bagi sampel yang diuji, tidak bisa digeneralisasi

    Persyaratan uji statistik parametrik

    Sampel harus diambil secara bebas (random)

    Data yang diolah mempunyai skala interval atau

    ratio

    Populasi berdistribusi (atau mendekati) normal

    Variasi data homogen

    Mean populasi merupakan kombinasi liniar

    (khusus untuk analisis varians)

  • 1/4/2013

    15

    Random?

    Normal

    Ada 2 cara untuk menguji set data mempunyai

    sebaran normal atau tidak

    Metode deskriptif yaitu menghitung koefisien

    varians, ratio skewness, ratio kurtoris,

    histogram dan plot)

    Metode analitik : uji Kolmogorov-Smirnov atau

    Shapiro-Wilk

  • 1/4/2013

    16

    Jika nilai kolmogorov-smorniv (untuk sampel

    besar) atau nilai Shapiro-Wilk (untuk sampel

    kecil) > 0.05, maka sebaran data dinyatakan

    normal

    Tests of Normality

    ,171 9 ,200* ,927 9 ,458

    ,143 9 ,200* ,979 9 ,957

    ,214 9 ,200* ,939 9 ,542

    ,222 9 ,200* ,899 9 ,313

    DOSIS

    kontrol

    20%

    30%

    40%

    JUMLAH

    Statistic df Sig. Statistic df Sig.

    Kolmogorov-Smirnova

    Shapiro-Wilk

    This is a lower bound of the true significance.*.

    Lilliefors Significance Correctiona.

    Jika nilai sig. pada levene satatistik > 0.05 maka

    varian data dinyatakan homogen

    Test of Homogeneity of Variances

    JUMLAH

    1,256 3 32 ,306

    Levene

    Statistic df1 df2 Sig.

  • 1/4/2013

    17

    Hal-hal yang harus diperhatikan dalam

    memilih uji statistik

    Apakah Skala variabel

    uji hipotesis yang dikehendaki peneliti (korelasi, asosiasi atau perbedaan)

    berapakah kelompok observasi ( satu, dua, tiga atau lebih)

    adakah dalam rancangan penelitian ada pengamatan ulang terhadap suatu variabel

    apakah pada uji yang dikehendaki dilakukan pengendalian terhadap variabel tertentu (berapa variabel)

  • 1/4/2013

    18

    contoh soal

    Seorang peneliti ingin membuktikan hipotesis

    bahwa pemberian ekstrak meniran dapat

    memperbaiki hepar tikus yang dirusak dengan

    CCl4. Jika data sebagai berikut, tentukan

    apakah hipotesis bahwa meniran efektif

    menurunkan kadar SGPT terbukti? Gunakan

    uji statstik yang tepat untuk menguji data

    tersebut.

    Rusak

    (ccl4) +

    aqua

    SGPT Rusak (CCl4)

    + meniran1

    SGPT

    1 33.99 1 29.23

    2 33.79 2 28.16

    3 33.5 3 28.35

    4 34.28 4 29.13

    5 33.6 5 28.45

    6 33.69 6 30.59

    7 34.47 7 28.06

  • 1/4/2013

    19

    Peneliti ingin mengetahui efek proteksi ekstrak

    meniran pada tikus jantan galur wistar yang

    diinduksi CCl4. desain penelitian adalah pre

    post test desaign. Hasil uji kadar SGPT tikus

    sebelum dan sesudah perlakuan adalah

    sebagai berikut. Tentukan apakah terdapat

    perbedaan kadar SGPT sebelum dan sesudah

    perlakuan?

    No.

    Tikus

    SGPT

    sebelum

    SGPT

    sesudah

    1 33.99 31.07

    2 33.79 31.36

    3 33.5 30.97

    4 34.28 30.78

    5 33.6 31.27

    6 33.69 30.88

  • 1/4/2013

    20

    Pengolahan data

    penelitian observasional Cross sectional

    Studi cross sectional merupakan salah satu studi epidemiologi untuk menemukan hubungan antara factor risiko dan penyakit

    Untuk rancangan cross sectional, risiko relatif dicerminkandengan angka rasio prevalensi (prevalence ratio, RP)

    Rasio prevalensi adalah jumlah subjek dengan efek positif(prevalensi penyakit) pada semua subjek dengan faktorrisiko positif dibagi jumlah subjek dengan efek positif padasemua subjek dengan faktor risiko negatif. Dengandemikian risiko relative adalah angka yang menggambarkan prevalensi penyakit dalam populasiterkait dengan factor risiko yang dipelajari, atau prevalensipenyakit yang timbul akibat factor risiko tertentu

    RP = A : C IK=

    A+B C+D

    Atau gunakan SPSS

    Faktor risiko

    efek

    ya tidak jumlah

    YaA B A+B

    tidak C D C+D

    Jumlah A+C B+D A+B+C+D

    )()(96.1ln

    dbb

    b

    caa

    aRP

    EXP+

    ++

  • 1/4/2013

    21

    Interpretasi hasil: Bila nilai Rasio prevalensi = 1 berarti variabel yang diduga sebagai faktor

    risiko tidak ada pengaruhnya terhadap terjadinya efek, atau dengan kata lain, dia bersifat netral.

    Bila rasio prevalensi > 1, dan rentang interval kepercayaan tidak mencakup angka 1, maka berarti variabel tersebut merupakan faktor risiko timbulnya penyakit. Akan tetapi jika interval kepercayaannya mencakup angka 1, maka nilai rasio prevalensi tidak diperhitungkan.

    apabila rasio prevalensi < 1, dan rentang kepercayaannya tidak mencakup angka 1, maka berarti faktor yang diteliti justru menjadi faktor yang mengurangi terjadinya penyakit, dan menjadi faktor protektif. Jika interval kepercayaan lebih dari 1, maka nilai RP tidak diperhitungkan.

    Bila nilai interval kepercayaan mencakup angka 1, maka berarti pada populasi yang diwakili oleh sampel tersebut mungkin terdapat nilai prevalen yang sama dengan 1, sehingga belum dapat disimpulkan bahwa faktor yang dikaji tersebut merupakan faktor risiko atau faktor proteksi, karena interval kepercayaan pada dalam konteks ini adalah nilai IK adalah rentang nilai RP pada populasi yang mungkin ditemukan. Jadi jika dalam rentang tersebut terdapat nilai 1, maka dalam populasi kemungkinan terdapat nilai RP = 1, sehingga ada anggota populasi yang memiliki variabel yang diduga sebagai faktor risiko tidak berpengaruh pada efek.

    CASE CONTROL

    Penelitian case control atau case-comparison study merupakan penelitian epidemiologis yang menelaah hubungan antara efek (penyakit) tertentu dengan factor risiko tertentu.

    Pada penelitian case control, kelompok kasus (pasien yang menderita efek) dibandingkan dengan kelompok control (mereka yang tidak menderita penyakit atau efek).

    Dalam desain penelitian ini ingin diketahui apakah suatu factor risiko tertentu benar berpengaruh terhadap terjadinya efek dengan membandingkan kekerapan pejanan factor risiko tersebut pada kelompok kasus dan kelompok control.

    Risiko relative dinyatakan dalam rasio Odds (OR).

  • 1/4/2013

    22

    RUMUS OR

    IK=

    BxC

    AxDOR =

    dcbaOR

    EXP

    111196.1ln +++

    COHORT

    penelitian epidemiologi yang mempelajari hubungan antara faktor risiko dan efek atau penyakit.

    Pada penelitian kohort, kausa atau faktor risiko diidentifikasi terlebih dahulu, kemudian subjek diikuti sampai periode tertentu untuk melihat terjadinya efek atau penyakit yang diteliti pada kelompok subjek dengan faktor risiko dan subjek tanpa faktor risiko.

    Perbandingan insiden penyakit antara kelompok dengan faktor risiko dan kelompok tanpa faktor risiko disebut dengan risiko relatif atau rasio risiko (RR)

  • 1/4/2013

    23

    RUMUS RR

    RR=

    IK =

    DC

    C

    BA

    A

    ++:

    )()(96.1ln

    dbb

    b

    caa

    aRP

    EXP+

    ++

    Seorang peneliti ingin mengetahui anemi ibu

    hamil sebagai factor risiko kejadian BBLR di RSI

    Sultan Agung. Berikut adalah data yang dia

    kumpulkan dari rekam medis. Jika desain

    penelitian yang dia pergunakan adalah Cross

    sectional, maka hitunglah factor risikonya, dan

    tentukan apakah nilai tersebut bermakna atau

    tidak. Hitunglah dengan menggunakan SPSS.

  • 1/4/2013

    24

    No. ibu hamil berat bayi

    1 anemi BBLR

    2 anemi BBLR

    3 tdk anemi Normal

    4 tdk anemi Normal

    5 tdk anemi Normal

    6 tdk anemi Normal

    7 tdk anemi Normal

    8 anemi BBLR

    9 anemi BBLR

    10 anemi BBLR

    11 anemi BBLR

    12 anemi BBLR

    13 anemi BBLR

    14 tdk anemi Normal

    15 tdk anemi Normal

    15 tdk anemi Normal

    16 tdk anemi Normal

    17 anemi Normal

    18 anemi Normal

    19 anemi BBLR

    20 anemi BBLR

    21 tdk anemi BBLR

    22 anemi BBLR

    23 tdk anemi Normal

    24 tdk anemi Normal

    25 tdk anemi Normal

    26 tdk anemi Normal

    27 anemi BBLR

    28 anemi BBLR

    29 anemi BBLR

    30 anemi Normal

    JIKA PENELITIAN TERSEBUT DILAKUKAN

    DENGAN DESAIN CASE CONTROL, HITUNG

    NILAI OR NYA