03 deskripsi data (2) · 2019. 8. 26. · bentuk sebaran data •grafik suatu data menggambarkan...

20
03 DESKRIPSI DATA (2) Cici Suhaeni – Dept. Statistika IPB – 2019 Referensi : Agresti (2017), Mendenhall (2012), Slide KAN (2017)

Upload: others

Post on 24-Oct-2020

4 views

Category:

Documents


0 download

TRANSCRIPT

  • 03DESKRIPSI DATA (2)

    Cici Suhaeni – Dept. Statistika IPB – 2019

    Referensi : Agresti (2017), Mendenhall (2012), Slide KAN

    (2017)

  • Bentuk Sebaran Data

    • Grafik suatu data menggambarkan sebaran dari

    data bisa juga oleh tabel frekuensi

    Yang perlu dicermati:1. Apakah data mengumpul atau

    berpencar, atau ada pengamatan

    yang memencil?

    2. Apakah ada satu puncak

    (unimodal) atau ada dua puncak (bimodal)?

    3. Bentuk sebaran data simetrik atau menjulur (skewed)

  • Bentuk Sebaran Data

  • Bentuk Sebaran Data

    Perhatikan

    Apakah ada satu atau dua puncak?

    Apakah simetris atau menjulur?

    Apakah ada pengamatan yg memencil?

  • Ukuran Pusat Data

    1. Nilaitengah (Mean)

    2. Median

    Titik tengah

    atau titik

    kesetimbangan

    Titik yang

    membelah

    pengamatan shg

    jumlah pengamatandi sebelah kiri samadengan disebelah

    Data setelah kanannya

    diurutkan

    Median = (180+180)/2

  • Ukuran Pusat Data

    Mari perhatikan lagi nilaitengah

    Baca: “Rataan X sama dengan jumlah X dibagi dg banyaknyapengamatan

  • Ukuran Pusat Data

    Catatan:

    1. Jika sebaran menjulur (ke kiri atau ke kanan), maka rataan

    ke arah ekor panjang

    2. Rataan gampang terpengaruh oleh pencilan, sedangkan

    median kekar terhadap pencilan.

    3. Pencilan (outliers) adalah pengamatan yang terletak jauhdari pengamatan lainnya

    4. Pencilan memerlukan perhatian khusus

    5. Contoh: data emisi CO2 per jumlah penduduk

  • Kekekaran terhadap pencilan

    Ayo jawab..!

  • Nilaitengah vs Median

    Bandingkan nilaitengah dengan median:

    • Sebaran data simetrik

    • Sebaran menjulur ke kanan

    • Sebaran menjulur ke kiri

    nilaitengah = median

    nilaitengah > median

    nilaitengah < median

    •Median lebih resisten ketimbang nilaitengah

  • Ukuran Keragaman Data

    1. Kisaran (Range) Selisih (Min – Maks)

    • Denmark:

    $45.000-$35.000

    • AS :

    $60.000-$20.000

    Nilai kisaran sangat dipengaruhi oleh nilai ekstrem

    (maksimum atau minimum)

    Data Pendapatan guru musik :

  • Ukuran Keragaman Data

    2. Simpangan baku (Standard deviation) Akardari ragam(variance) : Rataan jumlah kuadrat simpangan data thd rataannya).

    Setiap pengamatan menyimpang dari rataannya

    Simpangan tsb bisa positif tetapi bisa pula negatif

    Variance

  • Ukuran Keragaman Data

    ILUSTRASI

    Berapa jumlah anak yg ideal dalam satu keluarga???

    Mahasiswa : 0, 0, 0, 2, 4, 4, 4 (n1 = 7)

    Mahasiswi : 0, 2, 2, 2, 2, 2, 4 (n2 = 7)

    Mahasiswa

    Mahasiswi

  • Ukuran Keragaman Data

    Catatan untuk s :

    1. Makin berpencar data makin besar

    simpangan baku (s).

    2. Nilai s sama dengan nol jika pengamatanseragam. Ini mrp nilai s terkecil.

    3. Nilai s sangat terpengaruh oleh pencilan, karena pencilan bisa membuat

    pengamatan lain jauh dari rataannya.

  • Ukuran Keragaman Data

    σ

    s

    s dinamakan simpangan baku contoh, karenadihitung dari contoh

    Jika dihitung dari populasi maka kita dapatkan σ yaitu

    simpangan baku populasi

    Statistik: sσ

    Parameter: σ

    s diketahui

    tapi σ tidak

    diketahui

  • Ukuran Posisi

    Persentil ke p :

    MedianKuartil

    Kuartil

    ketiga

    Median

    pertama

    Kuartil

    Kuartil membagi satu gugusdata menjadi empat bagianyang sama besar.

  • IQR dan Box-plot

    Kisaran antar-kuartil (IQR):

    Kisaran antar-kuartil (IQR) ukuran keragaman data

    Statistik Lima Serangkai:1. Minimum

    2. Kuartil pertama

    3. Median

    4. Kuartil ketiga

    5. Maksimum

    Diagram kotak-garis (box-plot)

  • Box-plot

  • Box-plot

    BentukvertikalBoxplot

  • Cara membuat box plot

    1) Hitung Statistik lima serangkai

    2) Hitung Pagar Dalam Atas (PDA) : Q3 +1.5(Q3-Q1)

    3) Hitung Pagar Dalam Bawah (PDB): Q1-1.5(Q3-Q1)

    4) Identifikasi data. Jika data < PDB atau data > PDA makadata dikatakan outlier

    5) Gambar kotak dengan batas Q1 dan Q3

    6) Jika tidak ada pencilan : Tarik garis dari Q1 sampai data terkecil dan tarik garis dari Q3 sampai data terbesar

    7) Jika ada pencilan : Tarik garis Q1 dan atau Q3 sampai data sebelum pencilan

    8) Pencilan digambarkan dengan asterik

    Me

    Q1 Q3

    Min Max