analisis regresi dengan

Upload: vahmi-brian-owen-dsullivansevenfoldimerz

Post on 14-Apr-2018

235 views

Category:

Documents


0 download

TRANSCRIPT

  • 7/27/2019 Analisis Regresi dengan

    1/12

    Analisis Regresi denganSPSS

    ByEris Kusnadi

    Awalnya, tulisan ini dibuat untuk menunjang modulMata Kuliah Praktikum Statistik Industri diProgram Studi Teknik Industri, Universitas Mercu Buana Jakarta. Namun belakangan,

    permintaan tidak hanya datang dari peserta praktikum, tapi juga dari teman-teman yang sedang

    mengerjakan Tugas Akhir/ Skripsi. Saya berpikir: mungkin di luar sana, ada banyak orang yangmembutuhkan tulisan ini.

    Oleh karena itu, saya mencoba untuk berbagi tulisan ini. Tulisan ini tidak 100%

    sempurna dan penulisnya juga bukanlah seorang ahli atau dosen; hanya seseorang yang juga

    sedang belajar, tulisan ini pun dibagikan dalam rangka pembelajaran diri sendiri karenadengan berbagi merupakan jalan terbaik untuk belajar, ceuk urang sunda mah: the best way in

    learning is by sharing. . .

    Adapun beberapa hal yang dibutuhkan untuk analisis regresi dalam tulisan ini adalah:

    Seperangkat komputer + sistem operasi + software SPSS. Dalam tulisan ini, sayamenggunakan SPSS 14.0 for Windows Evaluation Version (keluaran: 5 September 2005)

    Pengetahuan entry data pada SPSS, artikelnya bisa diunduh dihttp://inparametric.com.

    Tabel distribusi F (di buku-buku statistik) untuk F-test.

    Sebelum masuk aplikasi SPSS, ada baiknya kita memahami analisis regresi. Selanjutnyaakan diberikan contoh ilustrasi sederhana dan nyata untuk memahami analisis regresi.

    A. Memahami Analisis Regresi

    Ketika saya menanyakan harga-harga harddisk (HDD) di toko komputer WTC Serpong, ternyata

    harga HDD sekarang (November 2008) jauh lebih mahal dari bulan-bulan lalu, tanpa sayamenanyakan kenapa harganya naik, sang penjaga toko langsung bilang (curhat^^): dollarsekarang naik, Mas!. Di sini saya mengambil kesimpulan bahwa naik-turun harga HDDdependent(bergantung) pada kurs dollar.

    Dalam analisis regresi, variabel dependent (harga HDD) dinotasikan dengan Y, sedang

    variabel independent (kurs dollar) dinotasikan dengan X.

    Jika benar naik-turun harga HDD (Y) hanya bergantung pada kurs dollar (jumlah X = 1)maka hubungannya dalam istilah statistik disebut: Linear Regression (regresi linear sederhana).

    Artinya harga HDD berjalanberiringan (linear) dengan kurs dollar.

    Namun, jika harga HDD (Y) tidak saja bergantung pada kurs dollar (X1) tapi juga dengan

    variabel lain, misal: harga BBM (X2 , atau jumlah X = lebih dari 1) maka hubungannya dalam

    istilah statistik disebut: Multiple Linear Regression (regresi linear berganda). Artinya hargaHDD berjalanberiringan (linear) dengan kurs dollar dan harga BBM.

    http://eriskusnadi.wordpress.com/author/eriskusnadi/http://eriskusnadi.wordpress.com/author/eriskusnadi/http://eriskusnadi.wordpress.com/author/eriskusnadi/http://inparametric.com/http://inparametric.com/http://inparametric.com/http://inparametric.com/http://eriskusnadi.wordpress.com/author/eriskusnadi/
  • 7/27/2019 Analisis Regresi dengan

    2/12

    Yang menjadi pertanyaan sekarang, apakah benar harga HDD linear dengan kurs dollar?

    (jangan-jangan itu hanya alasan sang penjaga toko). Untuk membuktikannya, kita harus

    mengumpulkan harga-harga HDD dan nilai-nilai kurs dollar pada bulan-bulan lalu. Kemudian,kita melakukan Uji Keberartian dan Uji Signifikansi.

    Uji Keberartian dapat dengan dua cara, yaitu:

    Scatterplotdiagram pencar, di mana secara kasat mata akan tampak kecenderunganhubungan linear antara nilai-nilai statistik tersebut.

    Correlation Coefficient (R) dalam istilah SPSS, di mana kemungkinan kecenderunganhubungan tidak linear didefinisikan apabila hasil R sama dengan nol, atau mendekatinol.

    Uji Signifikansi adalah dengan t-Test, di mana nilai t hitung dibandingkan dengan nilait tabel. Untukpengujian terhadap Multiple Linear Regression dapat digunakan F-test.

    Nah, apabila harga-harga HDD bulan lalu (Y) dinyatakan linear dengan nilai-nilai kursdollar bulan lalu (X), maka benarlah apa yang dibilang oleh si penjaga toko.

    Dan apabila kita mengetahui (atau dapat meramalkan) nilai-nilai kurs dollar di bulan-

    bulan depan, maka kita dapat meramalkan harga-harga HDD di bulan-bulan depan ( atau Y-circumflex untuk membedakan dengan Y-biasa) dengan menggunakan persamaan:

    Koefisien a adalah nilai penaksir regresi (Y-intercept) dan koefisien b adalah nilai kemiringan

    (slope) garis regresi. Koefisien-koefisien ini merupakan bilangan-bilangan tetap yang harus kitacari dengan (n = jumlah observasi):

    dan

    Sedangkan untuk persamaan Multiple Linear Regression adalah sebagai berikut:

  • 7/27/2019 Analisis Regresi dengan

    3/12

    Analisis regresi bermanfaat untuk menghitung: (a) linear regression dan multiple linear

    regression, (b) asosiasi statistik beserta scatterplot, (c) diagnosa kolinearitas, (d) harga prediksi,

    dan (e) residual.

    Jenis data yang cocok untuk analisis regresi adalah data rasio (baik untuk variabeldependent maupun independent). Namun dapat juga dengan data berbentuk kualitatif (kategori),

    tetapi harus dibantu dengan variabel boneka (dummy variable). Contoh variabel bonekaadalah seperti pendefinisian value untuk variabel Gender, yang mana Laki-laki diberi kode angka1 dan Perempuan diberi kode angka 2.

    Selanjutnya akan diberikan contoh aplikasi analisis regresi dalam SPSS, di mana yang

    menjadi penekanan pembahasan adalah pada saat Uji Keberartian dan Uji Signifikansi.

    B. Contoh Aplikasi dalam SPSS

    Contoh yang akan ditampilkan adalah analisis Multiple Linear Regression menggunakan SPSS,

    adapun kasusnya adalah sebagai berikut:

    Harga suatu produk pada beberapa minggu mengalami fluktuasi, diperkirakan kondisi inimempengaruhi tingkat penjualan/ tingkat daya beli konsumen. Di sisi lain banyaknya iklan telah

    mendongkrak tingkat penjualan. Bagaimana pengaruh harga produk dan iklan terhadap penjualan

    suatu produk?

    Dari kondisi ini, penjualan dapat diartikan sebagai variabel dependentyang dinotasikan denganYterhadap variabel independent berupa harga dan iklanyang dinotasikan dengan X.

    Pengamatan akan dilakukan dengan mengambil secara random data 10 minggu penjualan, data

    berupa: (a) jumlah unit penjualan mingguan, (b) harga rupiah produk pada minggu bersangkutan,

    dan (c) banyaknya iklan yang ditandai dengan besarnya rupiah biaya iklan yang dikeluarkanpada minggu bersangkutan.

    Dari kasus di atas, didapatkan Data Jumlah Penjualan (Y), Data Harga Produk (X1), dan Data

    Biaya Iklan (X2) sebagai berikut:

  • 7/27/2019 Analisis Regresi dengan

    4/12

    Setelah kita mengisi data pada SPSS Data Editor, ikuti langkah berikut:

    Langkah ke-1:Klik menu Analyze> Regression> Linear

    Langkah ke-2:Muncul dialog boxLinear Regression.

    form Dependent, isi: variabel Y

    form Independent(s), isi: variabel X1 dan variabel X2

  • 7/27/2019 Analisis Regresi dengan

    5/12

    Langkah ke-3:KlikStatistics, muncul dialog box Linear Regression: Statistics, dalam halini dicentang: Estimates, Model fit, Descriptives, dan Durbin-Watson.

    Kemudian klikContinue, untuk kembali ke dialog box Linear Regression.

    CATATAN: Dialog box Linear Regression: Statistics digunakan untuk menampilkan berbagai nilai statistik yang diinginkan, antaralain Regression Coefficient dan nilai statistik lainnya.

  • 7/27/2019 Analisis Regresi dengan

    6/12

    Pada Regression Coefficient terdapat pilihan Estimates, Confidence intervals, dan Covariance matrix.

    Sedang untuk nilai statistik lainnya terdapat pilihan, seperti: Model fit, R Square change (untuk mengukur persentase besarnyapengaruh variabel independent terhadap variabel dependent), Descriptive, Part and partial correlation, dan Colinearity diagnostics.

    Pada form Residuals, terdapat pilihan Durbin-Watson (digunakan untuk menentukan ada tidaknya korelasi residual atauautokorelasi dari model regresi yang dihasilkan) dan Casewise diagnostics dengan pilihan Standard Deviations.

    Langkah ke-4: Pada dialog box Linear Regression, klikPlots, muncul dialog boxLinearRegression: Plots

    form Y axis, masukkan:DEPENDNT, artinya mendaftarkan variable dependent sebagai

    sumbu Y.

    form X axis, masukkan:ADJPRED, artinya mendaftarkan harga prediktoryangdisesuaikan sebagai sumbu X.

    Centang juga: Histogram dan Normal probability plot.

    Kemudian klikContinue, untuk kembali ke dialog box Linear Regression.

    CATATAN: Pada dialog box Linear Regression: Plots terdapat beberapa pilihan yang disediakan, yaitu:

    DEPENDNT (the dependent variable).

    ZPRED (standardized predicted values). Merupakan nilai-nilai prediksi yang terstandarisasi.

    ZRESID (standardized residual). Merupakan nilai residual yang terstandarisasi.

    DRESID (deleted residual).

    ADJPRED (adjusted predicted values). Merupakan harga prediktor yang disesuaikan.

    SRESID (studentized residuals). Merupakan residual student.

    SDRESID (studentized deleted residuals). Merupakan residual student yang dihilangkan.Pada form Standardized Residual Plots terdapat dua pilihan plot, yakni:Histogram, berguna untuk menampilkan distribusi

    dari residual yang terstandarisasi.Normal probability plot, berguna untuk membandingkan distribusi residual yang terstandarisasidengan distribusi normal.

    Untuk check box Produce all partial plots digunakan untuk menghasilkan diagram-diagram pencar dari residual padamasing-masing variabel independent dengan residual variabel dependent.

    Langkah ke-5:Pada dialog box Linear Regression, klikSave.

  • 7/27/2019 Analisis Regresi dengan

    7/12

    Muncul dialog box Linear Regression: Save, pilihUnstandardized pada form

    Predicted Values dan formResiduals.

    Kemudian klikContinue, untuk kembali ke dialog box Linear Regression.

    CATATAN: Pilihan Save digunakan untuk menyimpan dan membuat file baru dari nilai-nilai prediksi, residual, dan statistik lainnya.

    Pada dialog Save terdapat banyak pilihan statistik yang dapat disimpan pada file kerja (data editor), yaitu: Predicted values,Residuals, Distances, Influence statistics, dan Prediction intervals. Kita tinggal memilih yang dikehendaki.

    Langkah ke-6: Pada dialog box Linear Regression, klikOptions.Muncul dialog box Linear Regression: Option, lalu klik saja Continue (berarti memilihsetting default), dan kembali ke dialog box Linear Regression.

  • 7/27/2019 Analisis Regresi dengan

    8/12

    CATATAN: Pilihan Option berguna untuk menampilkan analisis statistik dengan menggunakan kriteria metode Stepwise,Backward, dan Forward.

    Pada bagian Stepping Method Criteria terdapat dua pilihan, yaitu:

    Use Probability of F. Jika memilih pilihan ini, kita harus memasukkan harga Entry dan harga Removal pada form yangdisediakan. Harga Entry selalu lebih rendah dari harga Removal. Melalui pilihan ini, suatu variabel akan dimasukkan jikatingkat signifikansi dari F lebih kecil dari harga Entry, dan akan dikeluarkan jika tingkat signifikansinya lebih besar dariharga Removal.

    Use F value. Jika memilih pilihan ini, kita harus memasukkan harga Entry dan harga Removal. Harga Entry selalu lebihbesar dari harga Removal. Melalui pilihan ini, suatu variabel akan dimasukkan jika tingkat signifikansi dari F lebih besardari harga Entry, dan akan dikeluarkan jika tingkat signifikansinya lebih kecil dari harga Removal.

    Pilihan Include constant in equation berfungsi untuk menampilkan nilai kostanta dalam persamaan regresi. Dalam keadaandefault, pilihan ini diaktifkan. Jika kita tidak mengaktifkan pilihan ini, berarti kita akan mendapatkan regresi orisinil tanpa konstantaregresi. Namun, R kuadrat yang dihasilkan tidak dapat digunakan untuk memprediksi pengaruh variabel independent terhadapvariabel dependent.

    Pada form Missing Values terdapat tiga pilihan, yakni:

    Exclude cases listwise. Menganalisis cases-case yang hanya memiliki harga valid dari semua variabel.

    Exclude cases pairwise. Menganalisis koefisien korelasi dari seluruh cases yang berharga valid dari dua variabel yangdikorelasikan.

    Replace with mean. Menggantikan missing value dengan mean variabel.

    Pada keadaan default, yang diaktifkan adalah pilihan Exclude cases listwise.

    Langkah ke-7: Terakhir pada dialog box Linear Regression, klikOK.

    Hasil lengkap SPSS dijadikan dalam satu file output dengan tersusun rapi sesuai dengan

    ketentuan yang dikehendaki di atas.

    C. Hasil Analisis Regresi

    1. Descriptive Statistics, hasil analisis data deskriptif di bawah merupakan hasil dari pemilihan

    check box Descriptive pada dialog box Statistics. Didapatkan nilai rata-rata serta standar

    deviasi untuk semua variabel, baik independent maupun dependent.

  • 7/27/2019 Analisis Regresi dengan

    9/12

    2. Matriks Koefisien Korelasi, matriks Koefisien Korelasi (Pearson Correlations) juga didapatdari pilihan Descriptive pada dialog box Statistics. Kita dapat melihat koefisien korelasi

    antar semua variabel.

    Pada matriks korelasi tersebut, didapatkan angka signifikansi untuk hubungan antarseluruh variabel independent dengan variabel dependent bernilai di bawah 0,05 (

  • 7/27/2019 Analisis Regresi dengan

    10/12

    5. Anova, pada bagian ini ditampilkan tabel analisis varian (Anova). Dari tabel di bawah didapat

    nilai F = 47,917 yang dapat digunakan untuk melakukan uji hipotesis atau F-test dalam

    memprediksi kontribusi variabel-variabel independent (X1 dan X2) terhadap variabeldependent (Y).

    Hypothesis:H0: 1 = 2 = 0H1: Minimal satu dari dua variabel tidak sama dengan nol

    Dengan menentukan level of significant = 5% (0,05) dan degree of freedom untukdf1 =2 dan df2 = 7, maka didapat dari tabel (dalam buku statistik) F-tabel = 4,74.

    Oleh karena F-hitung = 47,917 > F-tabel (0,05) = 4,74, maka H0 ditolak dan H1 diterima.Kesimpulannya, bahwa variabel independent (X1 dan X2) dengan signifikan memberikan

    kontribusi terhadap variabel dependent.

    6. Coefficients, pada bagian ini ditampilkan nilai koefisien regresi (lihat: nilai-nilai pada kolom

    B pada Unstandardized Coefficients di bawah ini) sehingga terbentuk persamaan regresi:

    = a + bX1 + cX2 = 16406,3658,248X1 + 0,001X2

    Pada bagian Unstandardized Coefficients ini ditampilkan juga Standard Error dari

    masing-masing variabel. Nilai pada kolom Beta, ditampilkan Z-score. Pada kolom

    berikutnya ditampilkan nilai t dari masing-masing variabel, yang dapat dimanfaatkan

    untuk menguji keberartian (t-Test) koefisien regresi yang didapatkan. Prosespengujiannya menyerupai F-test, yaitu t hitung dibandingkan dengan nilai t tabel.

    7. Residual Statistics, pada bagian ini ditampilkan daftar hasil-hasil dari Residual Statistics.

  • 7/27/2019 Analisis Regresi dengan

    11/12

    8. Histogram

    9. Normal Plot

    10. Scatter Plot

    Analisis regresi sangat membantu untuk mendapatkan bukti ilmiah dari suatu hubungan

    antara variabel-variabel sekaligus meramalkannya. Dalam ilmu eksakta hubungan antaravariabel-variabel mudah dibuktikan karena sudah tegas dan diketahui, akan tetapi dalam kajianilmu sosial, hubungan antara variabel-variabel pada umumnya masih belum tegas dan sering

    tidak diketahui. Oleh karena itu, SPSS (Statistical Product and Service Solution) pada awal

    berdirinya memiliki kepanjangan Statistical Package for the Social Science untuk menegaskan

    bahwa SPSS dapat membantu segala kesulitan dalam kajian ilmu sosial.

  • 7/27/2019 Analisis Regresi dengan

    12/12

    Rujukan:

    Pasaribu, Amudi. (1983).Pengantar statistik(6th ed.). Jakarta: Ghalia Indonesia.

    SPSS. (2005). SPSS(Version 14.0) [Computer software]. Chicago-Illinois: SPSS, Inc.

    www.inparametric.com

    http://www.inparametric.com/http://www.inparametric.com/http://www.inparametric.com/