bahan ajar (materi pelengkap modul) statistik deskriptif program... · dikarenakan 0,134/2 > 0.025...

19
Bahan Ajar (Materi Pelengkap Modul) Statistik Deskriptif Oleh : Budiyanto Widyaiswara Ahli Madya Diklat Fungsional Statistisi Tingkat Ahli BPS Angkatan XXI Jakarta, Februari 2020

Upload: others

Post on 20-Oct-2020

3 views

Category:

Documents


0 download

TRANSCRIPT

  • Bahan Ajar (Materi Pelengkap Modul)

    Statistik Deskriptif

    Oleh : Budiyanto

    Widyaiswara Ahli Madya

    Diklat Fungsional Statistisi Tingkat Ahli – BPS Angkatan XXI

    Jakarta, Februari 2020

  • Statistik Inferensia

    Jika dalam statistik deskriptif dilakukan deskripsi pada data, maka

    pada statistik inferensia, pada data dilakukan berbagai analisis yang

    mengarah pada sebuah pengambilan kesimpulan.

    Tahapan yang digunakan dalam statistik inferensia :

    Menentukan H0 dan H1, hal ini berkaitan dengan masalah penelitian yang kemudian dirinci dalam berbagai hipotesisi yang

    akan diuji.

    Menentukan statistik hitung dan statistik tabel, atau dapat juga langsung menentukan nilai/tingkat signifikansinya.

    Mengambil keputusan sesuai dengan nilai signifikansi yang digunakan.

    5.1 Uji Perbedaan

    Yang dimaksud dengan uji perbedaan adalah sebuah pengujian yang

    bertujuan untuk melihat apakah sebuah sampel mempunyai perbedaan

    yang nyata dengan sampel yang lain. Seperti apakah jumlah penduduk

    di kota Jakarta dan Bandung berbeda secara nyata ataukah tidak? Alat

    uji yang digunakan adalah uji t dan Anova.

    5.1.1 Uji t Untuk Satu Sampel

    Pada intinya, pengujian satu sampel ini akan menguji apakah suatu

    nilai tertentu (yang diberikan sebagai pembanding) berbeda secara

    nyata ataukah tidak dengan rata-rata sebuah sampel.

    Contoh:

    Suatu perusahaan menciptakan produk untuk mengurangi berat badan

    wanita (diet). Untuk membuktikan apakah produk tersebut berhasil

    atau tidak mengurangi berat badan wanita yang berat badannya di atas

    70 kg. Maka dilakukan survei dengan jumlah sampel sebesar 20. Pada

    tahap awal, berat badan wanita yang menjadi sampel diukur.

    Kemudian diberikan perlakuan diet. Tiga bulan berikutnya (setelah

    diet) maka berat badan orang-orang tersebut diukur kembali.

    Perusahaan obat tersebut meyakini bahwa rata-rata berat badan sampel

    setelah mengonsumsi obat diet tersebut adalah 60kg.

    Ho: Rata-rata berat badan sampel setelah mengonsumsi obat diet

    adalah 60kg

    H1: Rata-rata berat badan sampel setelah mengonsumsi obat diet

    bukan 60kg

  • Langkah-Langkahnya:

    Buka lembar kerja

    Dari menu utama pilih menu Analyze-Compare Means – Independent Sample T seperti gambar di bawah ini:

    Gambar 41.Tampilan Menu Compare Means

    Lalu akan muncul kotak dialog sebagai berikut:

    Gambar 42.Kotak Dialog One-Sample T Test

    Pada kolom Test Variable, masukkan variabel yang ingin diuji. Dalam kasus ini adalah variabel SESUDAH yang mewakili berat badan sampel setelah

    mengonsumsi obat diet.

  • Klik tombol Option untuk menentukan selang kepercayaan untuk uji t. Dalam kasus ini adalah 95%. Kemudian klik Continue untuk kembali ke

    kotak dialog awal.

    Gambar 43.Kotak Dialog One-Sample T Test: Option

    Klik OK. Maka akan keluar output seperti di bawah ini.

    Gambar 44. Output Analisis Uji-t Satu Sampel

    Dari output diketahui nilai statistik uji t = 7,999, derajat bebas df = 24, nilai

    signfikansi sig. (2-tailed)=.000. Apabila tingkat signifikansi yang digunakan pada

    pengujian ini =5% (0.05), maka untuk uji dua sisi menjadi 2,5%. Hipotesis nol

    di atas ditolak karena sig.(2 tailed)/2

  • Ho: Rata-rata frekuensi menonton TV G di kota Jakarta dan Bekasi adalah sama

    H1: Rata-rata frekuensi menonton TV G di kota Jakarta dan Bekasi adalah

    berbeda

    Langkah-langkah pengolahan dengan SPSS :

    Buka lembar kerja

    Dari menu utama pilih menu Analyze-Compare Means – Independent Sample T.

    Lalu akan muncul kotak dialog sebagai berikut

    Gambar 45.Kotak Dialog Independent-Samples T Test

    Untuk Test Variable(s), isilah variabel yang akan diuji. Dalam contoh di atas,

    isilah variabel Frekuensi. Sedangkan untuk Grouping Variable, isikanlah variabel

    kualitatif atau kategorik. Kemudian variabel tersebut harus didefinisikan. Klik

    pada Define Group, maka pada layar akan tampak:

    Gambar 46.Tampilan Menu Compare Means

    Pada contoh di atas, Ketiklah Jakarta sebagai isian Group 1 dan Bekasi sebagai

    Group 2. Kemudian klik Continue.

    Untuk kolom Option, biarkan tingkat kepercayaan 95%, demikian juga perlakuan

    terhadap missing values, tetap pada pilihan exclude cases analysis by analysis.

    Klik Continue, kemudian tekan OK. SPSS akan menampilkan Output

    Viewerseperti di bawah ini:

  • Gambar 47.Output Analisis Uji-t Dua Sampel Bebas

    Analisis Output:

    Tabel pertama menggambarkan statistik deskriptif rata-rata dan standar deviasi

    dari kedua kelompok kota. Tabel kedua menerangkan penggunaan statistik uji t

    untuk uji perbandingan kedua kelompok.Uji ini dilakukan dengan 2 tahapan;

    pertama uji apakah varians kedua kelompok bisadianggap sama; kedua uji

    apakah ada perbedaan rata-rata di kedua kelompok tersebut.

    Uji Kesamaan Varians:

    Ho: Kedua varians kelompok adalah identik.

    H1: Kedua varians kelompok adalah tidak identik.

    Karena p-value dari Levene Test of Equality for Variances< 5%, maka Ho

    ditolak.Sehingga bisa disimpulkan kedua varians benar-benar berbeda.

    Uji Rata-Rata:

    Untuk uji dua sisi, p-value statistik uji t menjadi 0.009/2 = 0.0045. Oleh karena

    p-value dua sisi < alpha/2 (0.0045

  • Langkah-langkah pengolahan dengan SPSS :

    Buka lembar kerja

    Dari menu utama pilih menu Analyze-Compare Means – Paired Sample Test. Lalu akan muncul kotak dialog sebagai berikut:

    Gambar 48.Kotak Dialog Uji-t Sampel Berpasangan

    Pada Paired Variable(s), pilih variabel yang akan diuji. Harus ada dua variabel

    yang dipilih bersamaan, jika tidak SPSS tidak akan bisa memasukan ke dalam

    kolom Paired Variables. Dalam contoh ini, variabel SEBELUM dimasukkan

    sebagai variabel1, dan variabel SESUDAH sebagai variabel2.

    Biarkan kolom Option dengan confidence interval 95%.

    Klik OK. Selanjutnya SPSS akan menampilkan Output Viewerseperti di bawah ini:

    Gambar 49. Output Analisis Uji-t Dua Sampel Bebas

    Analisis Output:

    Paired Samples Statistics menunjukkan rata-rata dan standar deviasi berat badan

    konsumen sebelum dan sesudah meminum obat. Sebelum meminum obat, rata-

    rata berat badan konsumen adalah 84,5100 dengan standar deviasi 6,63931.

    Sesudah meminum obat tersebut, rata-rata berat badan konsumen menjadi

    83,3090 dan 5,58235.

  • Paired Samples Correlations menunjukkan korelasi antara dua variabel yang

    menunjukkan nilai 0.943 dengan nilai probabilitas di bawah 0.05 (nilai

    sidnifikansi outpun adalah 0.000). Hal ini menyatakan bahwa korelasi antara

    berat sebelum dan sesudah minum obat adalah sangat erat dan benar-benar

    berhubungan secara nyata.

    Paired Samples Test menunjukkan p-value dan statistik uji t. Terlihat bahwa t

    hitung adalah 1,646 dengan probabilitas 0,134.Taraf nyata yang digunakan adalah

    5%, sehingga untuk uji duasisi seperti contoh soal di atas menjadi 2,5%.

    Dikarenakan 0,134/2 > 0.025 maka tidak tolak Ho. Sehingga dapat disimpulkan

    bahwa berat badan sebelum dan sesudah minum obat relatif sama. Atau, obat diet

    tersebut tidak efektif dalam menurunkan berat badan secara nyata.

    5.1.4 Uji Perbedaan Lebih dari Dua Sampel

    Uji perbedaan lebih dari dua sampel yang biasa disebut dengan Analysis of

    Variance (ANOVA), dapat digunakan untuk :

    1. Menguji apakah rata-rata dua sampel atau lebih berbeda secara signifikan ataukah tidak.

    2. Menguji apakah dua buah sampel atau lebih mempunyai varians populasi yang sama atau tidak.

    Contoh Kasus :

    Sebuah pabrik selama ini mempekerjakan karyawannya dalam 4 shift (satu shift

    terdiri atas sekelompok pekerja yang berlainan). Manajer pabrik tersebut ingin

    mengetahui apakah ada perbedaan produktivitas yang nyata antara 4 kelompok

    shift kerja yang ada selama ini. Untuk itu, manajer memerintahkan seorang

    supervisor untuk mengamati produktivitas kerja keempat kelompok tersebut

    melalui keseluruhan unit barang yang dihasilkan selama 12 hari terakhir.

    H0: Rata-rata produksi keempat kelompok shift kerja tersebut adalah sama

    H1: Rata-rata produksi keempat kelompok shift kerja tersebut memang berbeda

    Langkah-langkah pengolahan dengan SPSS:

    Buka lembar kerja

    Dari menu utama pilih menu Analyze – Compare Means – One-Way Anova.

  • Gambar 50.Tampilan Menu Compare Means

    maka akan muncul kotak dialog seperti di bawah ini:

    Gambar 39.Kotak Dialog ANOVA

    Pengisian :

    Dependent List atau variabel dependent yang akan diuji perbedaannya, misalnya dalam kasus ini PRODUK.

    Factor atau grup yang akan diuji, misalnya dalam kasus ini SHIFT. Factor/variabel independent seharusnya sebuah data kualitatif (kategori).

    Apabila menekan tombol option, di layar akan muncul:

  • Gambar 51.Tampilan Option ANOVA

    Untuk statistics yang akan dilakukan, pilih Descriptive untuk melihat ringkasan

    statistik dari grup dan Homogeneity-of-variance untuk mengetahui apakah

    varians di ketiga grup sama ataukah berbeda. Jika varians berbeda, maka akan

    dilakukan transformasi. Klik Continue.

    Apabila rata-rata dari semua grup tersebut memang berbeda (dilihat dari hasil ANOVA), maka bagian post-Hoc akan relevan untuk dianalisis. Klik tombol

    Post-Hoc, maka akan tampak di layar :

    Gambar 52.Kotak Dialog Post-Hocpada ANOVA

    Untuk analisis lanjutan, klik Bonferroni dan Tukey pada check box.

    Klik OK. Selanjutnya SPSS akan menampilkan Output Viewerseperti di bawah ini:

  • Gambar 53.Output ANOVA

    Analisis Output:

    Descriptives. Pada tabel pertama ini, terdapat ringkasan statistik dari keempat

    sampel.Contoh, untuk Shift 1:

    o Rata-rata produktivitas adalah 35,58 unit. o Produk minimum adalah 32 unit dan maksimum 39 unit.

    Dengan tingkat kepercayaan 95% atau signifikansi 5%, rata-rata produk ada pada

    rentang 33,88 unit sampai 37,29.

    Test of Homegeneity of Variances. Analisis ini bertujuan untuk menguji berlaku

    tidaknya asumsi untuk ANOVA, yaitu sampel mempunyai varians yang sama.

    Pada kasus ini, Levene Test hitung adalah 1,173 dengan nilai probabilitas 0,331.

    Oleh karena probabilitas > 0,05, maka Ho diterima, atau keempat varians adalah

    sama. Dengan demikian, asumsi kesamaan varians untuk uji ANOVA sudah

    terpenuhi.

    ANOVA. Terlihat bahwa F hitung adalah 44.861 dengan probabilitas 0,000. Oleh

    karena probabilitas(p-value) > 0.05, maka Ho ditolak, atau rata-rata produksi

    keempat kelompok shift tersebut memang berbeda.

    Multiple Comparisons. Setelah diketahui adanya perbedaan yang signifikan di

    antara kelompok (dalam kasus ini SHIFT), mana saja kelompok shift yang

    berbeda dan mana yang tidak berbeda akan terjawab dengan hasil pengujian di

    tabel ini.

    Apabila p-value (Sig.) > 0.05, maka Ho diterima, artinya tidak ada perbedaan

    rata-rata yang nyata antar shift. Cara lain adalah memperhatikan ada tidaknya

    tanda “*” pada kolom Mean Difference. Apabila ada, artinya kelompok shift

    tersebut berbeda signifikan.Dalam kasus ini terlihat rata-rata/Mean dari shift 1

    berbeda signifikan/nyata dengan Shift 2,3, dan 4 (lihat pada shift I dengan 3 shift

    dari j).Rata-rata Shift 2 berbeda nyata dengan shift 1 dan 4. Rata-rata Shift 3

    berbeda nyata dengan shift 1 dan 4. Rata-rata Shift 4 berbeda nyata dengan shift

    1, 2 dan 3.

    Homogeneous Subsets. Jika test Tukey dan Bonferroni untuk menguji kelompok

    mana saja yang memiliki perbedaan nyata, maka dalam Homogenoeus Subset

    justru akan dicari grup/subset mana saja yang mempunyai perbedaan rata-rata

    yang tidak berbeda secara signifikan. Output di atas menunjukkan bahwa

    kelompok shift 2 dan 3 tidak memiliki perbedaan produktivitas yang signifikan

  • (hasil dari Tukey dan Bonferroni dengan Homogeneous Subset selalu saling

    melengkapi).

    5.2 Uji Asosisasi

    Analisis yang sering dipakai dalam uji asosiasi adalah analis korelasi dan regresi

    (baik sederhana maupun berganda).

    5.2.1 Korelasi

    Pada prinsipnya, prosedur korelasi bertujuan untuk mengetahui dua hal pada

    hubungan antar dua variabel:

    1. Apakah kedua variabel tersebut memang mempunyai hubungan yang signifikan

    2. Jika terbukti hubungan adalah signifikan, bagaimana arah hubungan dan seberapa kuat hubungan tersebut.

    Sesuai dengan jenis data yang ada, yaitu nominal, ordinal interval dan rasio, maka

    SPSS menyediakan menu-menu untuk mengukur korelasi antar variabel yang

    mempunyai jenis data berbeda-beda.

    Korelasi Dua Variabel Untuk Data Skala Nominal (Kategori)

    Langkah yang harus dilakukan :

    Membuka lembar kerja

    Dari menu utama, pilih menu Analyze – Descriptive Statistics – Crosstab…

    Akan tampak di layar sebuah window :

    Gambar 54.Tampilan Kotak Dialog Crosstabs

    Variabel yang diisikan pada Row(s) maupun Column(s) tidak ditentukan, bisa

    bebas.

    o Kemudian klik tombol Statistics, sehingga akan muncul di layar :

  • Gambar 55.Kotak Dialog Crosstabs: Statistics

    Pengisian :

    o Beri tanda cek pada Chi Square, pilihan ini digunakan untuk mengetahui apakah ada hubungan di antara kedua variabel.

    o Pada frame Nominal beri tanda cek pada Contingency Coeficient. Pilihan ini untuk mengetahui korelasi kedua variabel secara directional measures.

    Pilihan ini akan relevan jika pada proses Chi-Square sebelumnya memang

    ada hubungan antar dua variabel. Jika ternyata tidak ada hubungan, tentu

    pilihan ini tidak perlu diinterpretasikan.

    o Klik mouse pada tombol Cells dan kemudian pilih Column pada bagian Percentages. Dengan aktifnya kotak ini, maka akan dilakukan perhitungan

    persentase berdasar kolom pada crosstab yang dihasilkan.

  • Gambar 56.Kotak Dialog Crosstabs: Cell Display

    Secara umum,

    Pilihan Count untuk menampilkan hitungan chi-square, apakah perlu

    disertakan nilai Expected (nilai yang diharapkan) selain nilai Observed.

    Pilihan Percentage untuk menampilkan penghitungan angka pada baris dan

    kolom dalam persen.

    Pilihan Noninteger Weight bisa digunakan untuk membulatkan angka

    (round )jika terjadi desimal.

    Pilihan Residual untuk menampilkan jenis residual (selisih angka

    harapan/expected dan angka observasi/observed), baik residual apa

    adanya/unstandardized, standardized, maupun adjusted standardized.

    o Tekan OKuntuk mengakhiri pengisian prosedur analisis, tunggu sampai kemudian SPSS akan menampilkan dalam Output Editor

    Korelasi Dua Variabel Untuk Data Skala Ordinal

    Jika kedua jenis data yang akan dianalisis adalah ordinal, yaitu yang memiliki

    tingkatan/urutan tertentu seperti „tidak suka‟, „suka‟, „sangat tidak suka‟ dan

    lainnya, maka SPSS menyediakan alat pengukur korelasi yang berbeda dengan

    jenis data nominal.

    Langkah yang harus dilakukan :

    1. Membuka lembar kerja 2. Dari menu utama, pilih Analyze – Correlate – Bivariate…, akan tampil di

    layar :

  • Gambar 57.Tampilan Kotak Dialog Korelasi Dua Variabel

    Pengisian :

    o Variables, pilih variabel (minimal 2 buah) o Correlation Coefficients, pilih Spearman dan Kendall’s tau-b. Jangan lupa

    untuk menonaktifkan pilihan Pearson, karena korelasi Pearson digunakan

    untuk penggunaan data jenis interval dan rasio.

    o Test of Significance, pilih Two-tailed untuk uji dua arah, aktifkan pilihan Flag significant correlation.

    o Kemudian tekan tombol OK, dan tunggu sampai SPSS menampilkan Output Editor.

    Korelasi Dua Variabel Untuk Data Interval dan Rasio

    Pada prinsipnya tujuan analisis ini sama dengan pengukuran dengan

    menggunakan data nominal atau ordinal yaitu mengetahui apakah ada hubungan,

    dan jika ada, bagaiaman arah hubungan dan sebesar berapa hubungan tersebut.

    Alat ukur korelasi yang digunakan untuk data interval/rasio adalah Pearson.

    Langkah-langkahnya sama dengan pengujian untuk data skala ordinal yaitu dari

    menu utama pilih Analyze – Correlate – Bivariate…. Hanya saja pada pilihan

    Correlation Coefficients, pilih Pearson.

    Korelasi Parsial untuk data Interval dan Rasio

    Jika pembahasan sebelumnya hanya menggunakan dua variabel saja, maka pada

    korelasi parsial dimasukkan satu variabel tambahan yang berfungsi sebagai

    pengontrol dari dua variabel yang berkorelasi terdahulu. Penambahan variabel ini

    dalam praktek sering dipakai, karena kebanyakan tidak hanya dua variabel yang

    berkorelasi satu sama lain, namun kehadiran variabel ketiga juga diperkirakan

    akan mem pengaruhi kekuatan korelasi.

    Langkah-langkah pengolahan dengan SPSS :

    1. Buka lembar kerja 2. Dari menu utama, pilih menu Analyze – Correlate – Partial…, maka akan

    tampak di layar :

  • Gambar 58.Tampilan Kotak Dialog Korelasi Parsial

    Pengisian :

    o Variables, pilih variabel dengan jenis data interval atau rasio. o Controlling for, pilih variabel yang menjadi pengontrol dari dua variabel di

    atas.

    o Test of Significance, pilih Two-tailed untuk uji dua arah o Kemudian tekan tombol OK, dan tunggu sampai SPSS menampilkan Output

    Editor

    5.2.2 Analisis Regresi

    Jika pada analisis korelasi, akan dianalisis apakah ada hubungan antara dua

    variabel dan seberapa kuat hubungan tersebut, maka pada analisis regresi, akan

    dicari seberapa besar pengaruh sebuah variabel terhadap variabel yang lain.

    Pada materi ini hanya akan dibahas regresi linier baik sederhana maupun

    berganda. Untuk regresi linier hanya dibutuhkan satu buah variabel dependent

    (tidak bebas) dan satu buah variabel independent (bebas). Sedangkan pada regresi

    berganda, dibutuhkan satu buah variabel dependent (tidak bebas) dan lebih dari

    satu variabel independent (bebas).

    Langkah-langkah pengolahan data dengan SPSS :

    1. Buka lembar kerja

    2. Dari menu utama, pilih menu Analyze – Regression – Linear.

  • Gambar 59.Tampilan Submenu Regression

    Maka akan muncul di layar

    Gambar 60. Kotak Dialog Regresi Linier

    Pengisian :

    o Dependent atau variabel tidak bebas, disebut juga variabel respon.

    o Independent(s), pilih variabel bebas yang akan dianalisis. Jika akan menganalisis regresi linier sederhana, maka variabel bebas yang dipilih hanya

    satu variabel. Sedangkan jika berganda, silahkan masukkan lebih dari satu

    variable.

    o Method, adalah cara memasukkan/seleksi variabel. Metode ini terdiri dari : a. Stepwise, prosedur pemilihan variabel dimana satu per satu variabel

    dimasukkan ke dalam model sampai kemudian seluruhnya/semua

    variabel dalam blok dimasukkan dalam model.

    b. Remove, prosedur pemilihan variabel dimana seluruhnya/semua variabel dalam blok dimasukkan dalam model, setelah itu

    mengeluarkan seluruh variabel dari model.

    c. Backward, prosedur pemilihan variabel dimana semua variabel dalam blok dimasukkan dalam penghitungan, kemudian mengeluarkan satu

    per satu variabel yang memiliki koefisien regresi yang tidak signifikan.

    d. Forward (Stepwise), prosedur pemilihan variabel dimana satu per atu variabel dimasukkan ke dalam model sampai kemudian hanya ariabel

  • yang memiliki koefisien regresi yang signifikan yang imasukkan

    dimasukkan dalam model.

    e. Enter, prosedur pemilihan variabel dimana semua variabel dalam blok dimasukkan dalam penghitungan

    „single step

    ‟ (pembentukan model).

    3. Pilih kolom Statistics, maka aka tampil sebuah window di layar :

    Gambar 61. Kotak Dialog Linear Regression: Statistics

    Pilihan ini terkait dengan penghitungan statistik regresi yang akan digunakan.

    Beri tanda cek pada pilihan Descriptives untuk menampilkan nilai mean, standar

    deviasi dan jumlah pengamatan dari variabel. Klik continue dan kemudian tekan

    tombol OK untuk melihat hasil pada Output editor.