dasar-dasaranalisaregresitjipto.net/doc/wp-content/uploads/2018/12/regresi.pdf · 2018. 12. 21. ·...

31
Dasar-dasar Analisa Regresi Tjipto Juwono, Ph.D. May 2018 TJ (SU) Dasar-dasar Analisa Regresi May 2018 1 / 31

Upload: others

Post on 01-Sep-2021

10 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Dasar-dasarAnalisaRegresitjipto.net/doc/wp-content/uploads/2018/12/Regresi.pdf · 2018. 12. 21. · atau genetika). TJ (SU) Dasar-dasar Analisa Regresi May 2018 17 / 31. RegresivsKorelasi

Dasar-dasar Analisa Regresi

Tjipto Juwono, Ph.D.

May 2018

TJ (SU) Dasar-dasar Analisa Regresi May 2018 1 / 31

Page 2: Dasar-dasarAnalisaRegresitjipto.net/doc/wp-content/uploads/2018/12/Regresi.pdf · 2018. 12. 21. · atau genetika). TJ (SU) Dasar-dasar Analisa Regresi May 2018 17 / 31. RegresivsKorelasi

Sejarah Analisa Regresi

Istilah regresi pertama kali diperkenalkan oleh Francis Galton dalamsalah satu papernya. Galton menemukan bahwa walaupun adakecenderungan bahwa anak dari orang tua yang jangkung jugajangkung, dan anak dari orang tua yang pendek juga pendek, namuntinggi rata− rata dari anak yang lahir dari orang tua dengan tinggitertentu akan bergerak ke-arah (regress) tinggi rata-rata daripopulasi 1.

1Francis Galton, Proceedings of Royal Society, London, vol. 40, 1886, pp. 4272.

TJ (SU) Dasar-dasar Analisa Regresi May 2018 2 / 31

Page 3: Dasar-dasarAnalisaRegresitjipto.net/doc/wp-content/uploads/2018/12/Regresi.pdf · 2018. 12. 21. · atau genetika). TJ (SU) Dasar-dasar Analisa Regresi May 2018 17 / 31. RegresivsKorelasi

Sejarah Analisa Regresi

Temuan Galton dikonfirmasi oleh Karl Pearson. Ia mengumpulkandata tinggi badan dari ribuan keluarga 2. Ia menemukan bahwa tinggirata-rata anak-anak dari kelompok orang tua yang jangkung lebihpendek dari tinggi orang tua mereka. Sementara tinggi rata-rata darianak-anak dari orang tua yang pendek lebih tinggi dari orang tuamereka. Jadi tinggi rata-rata dari anak-anak itu bergerak ke arah(regress) tinggi rata-rata dari populasi.2K. Pearson and A. Lee, Biometrika, vol. 2, Nov. 1903, pp. 357462.

TJ (SU) Dasar-dasar Analisa Regresi May 2018 3 / 31

Page 4: Dasar-dasarAnalisaRegresitjipto.net/doc/wp-content/uploads/2018/12/Regresi.pdf · 2018. 12. 21. · atau genetika). TJ (SU) Dasar-dasar Analisa Regresi May 2018 17 / 31. RegresivsKorelasi

Pengertian Analisa Regresi

Analisa Regresi:

Mempelajari ketergantungan satu variabel (yaitu variabel dependent)terhadap satu atau lebih variabel lainnya (yaitu variabel independenceatau explanatory). Ketergantungan ini dipelajari dengan mengestimasidan/atau memprediksi nilai mean/average dari populasi pada variabeldependent sebagai fungsi dari variabel(-variabel) independent yangdiketahui, atau di-tetapkan (dalam hal sampling yang berulang).

TJ (SU) Dasar-dasar Analisa Regresi May 2018 4 / 31

Page 5: Dasar-dasarAnalisaRegresitjipto.net/doc/wp-content/uploads/2018/12/Regresi.pdf · 2018. 12. 21. · atau genetika). TJ (SU) Dasar-dasar Analisa Regresi May 2018 17 / 31. RegresivsKorelasi

Contoh Analisa Regresi

1 Dalam riset yang dilakukan oleh Galton (dan Pearson), ia inginmengetahui bagaimana tinggi rata-rata anak berubah, jika tinggiorang tua (ayah) diberikan.

TJ (SU) Dasar-dasar Analisa Regresi May 2018 5 / 31

Page 6: Dasar-dasarAnalisaRegresitjipto.net/doc/wp-content/uploads/2018/12/Regresi.pdf · 2018. 12. 21. · atau genetika). TJ (SU) Dasar-dasar Analisa Regresi May 2018 17 / 31. RegresivsKorelasi

Contoh Analisa Regresi

Gbr. 1: Hubungan antara tinggi anak dengan tinggi ayahnya

TJ (SU) Dasar-dasar Analisa Regresi May 2018 6 / 31

Page 7: Dasar-dasarAnalisaRegresitjipto.net/doc/wp-content/uploads/2018/12/Regresi.pdf · 2018. 12. 21. · atau genetika). TJ (SU) Dasar-dasar Analisa Regresi May 2018 17 / 31. RegresivsKorelasi

Contoh Analisa Regresi

2 Misalkan kita ingin mempelajari hubungan antara tinggi seoranganak dengan usianya.

TJ (SU) Dasar-dasar Analisa Regresi May 2018 7 / 31

Page 8: Dasar-dasarAnalisaRegresitjipto.net/doc/wp-content/uploads/2018/12/Regresi.pdf · 2018. 12. 21. · atau genetika). TJ (SU) Dasar-dasar Analisa Regresi May 2018 17 / 31. RegresivsKorelasi

Contoh Analisa Regresi

Gbr. 2: Hubungan antara tinggi anak dengan usianya

TJ (SU) Dasar-dasar Analisa Regresi May 2018 8 / 31

Page 9: Dasar-dasarAnalisaRegresitjipto.net/doc/wp-content/uploads/2018/12/Regresi.pdf · 2018. 12. 21. · atau genetika). TJ (SU) Dasar-dasar Analisa Regresi May 2018 17 / 31. RegresivsKorelasi

Contoh Analisa Regresi

3 Mempelajari hubungan antara PCE (Personal ConsumptionExpenditure) dengan Income. Analisa ini berguna untukmengestimasi MPC.

4 Monopolist dapat menetapkan harga atau output (tetapi tidakkedua-duanya). Untuk menentukan harga yang paling profitablemaka perlu memperoleh bagaimana response dari demandterhadap perubahan harga.

TJ (SU) Dasar-dasar Analisa Regresi May 2018 9 / 31

Page 10: Dasar-dasarAnalisaRegresitjipto.net/doc/wp-content/uploads/2018/12/Regresi.pdf · 2018. 12. 21. · atau genetika). TJ (SU) Dasar-dasar Analisa Regresi May 2018 17 / 31. RegresivsKorelasi

Variabel Random vs Variabel Tetap

Variabel Random: Adalah variabel yang mempunyai distribusiprobabilitas. Variabel Random disebut juga variabelstokastik.

Variabel Tetap: Tidak mempunyai distribusi probabilitas.

TJ (SU) Dasar-dasar Analisa Regresi May 2018 10 / 31

Page 11: Dasar-dasarAnalisaRegresitjipto.net/doc/wp-content/uploads/2018/12/Regresi.pdf · 2018. 12. 21. · atau genetika). TJ (SU) Dasar-dasar Analisa Regresi May 2018 17 / 31. RegresivsKorelasi

Hubungan Statistik vs Hubungan Deterministik

Hubungan deterministik: Dalam hubungan deterministik, semuavariabel (baik itu dependen maupun independen) adalahvariabel non-stokastik

Hubungan statistik: Dalam hubungan statistik, salah satu atau lebih(atau semua) variabelnya adalah variabel stokastik.

TJ (SU) Dasar-dasar Analisa Regresi May 2018 11 / 31

Page 12: Dasar-dasarAnalisaRegresitjipto.net/doc/wp-content/uploads/2018/12/Regresi.pdf · 2018. 12. 21. · atau genetika). TJ (SU) Dasar-dasar Analisa Regresi May 2018 17 / 31. RegresivsKorelasi

Hubungan Statistik vs Hubungan Deterministik

Contoh hubungan deterministik: Jika hambatan suatu kabel diketahui,maka untuk suatu besar tegangan antara kedua ujungkabel, hanya ada satu angka arus listrik. Hubunganantara tegangan dan arus listrik adalah hubungan yangdeterministik.

Contoh hubungan statistik: Untuk setiap tinggi orang tua tertentu,ada banyak kemungkinan tinggi anaknya. Tinggi anakuntuk satu tinggi orang tua tertentu, merupakan suatudistribusi (Lihat Gbr. (1)). Variabel tinggi anak tersebutdisebut variabel random atau stokastik.

TJ (SU) Dasar-dasar Analisa Regresi May 2018 12 / 31

Page 13: Dasar-dasarAnalisaRegresitjipto.net/doc/wp-content/uploads/2018/12/Regresi.pdf · 2018. 12. 21. · atau genetika). TJ (SU) Dasar-dasar Analisa Regresi May 2018 17 / 31. RegresivsKorelasi

Hubungan Statistik vs Hubungan Deterministik

Hubungan di Dalam Ekonometrika

Di dalam Ekonometrika, hubungan yang kita pelajari adalah hubunganstatistik.

TJ (SU) Dasar-dasar Analisa Regresi May 2018 13 / 31

Page 14: Dasar-dasarAnalisaRegresitjipto.net/doc/wp-content/uploads/2018/12/Regresi.pdf · 2018. 12. 21. · atau genetika). TJ (SU) Dasar-dasar Analisa Regresi May 2018 17 / 31. RegresivsKorelasi

Hubungan Statistik vs Hubungan Deterministik

Perhatikan kembali Gbr. (1). Untuk setiap tinggi orang tua yangtertentu, ada banyak kemungkinan tinggi anak yang membentuk suatudistribusi. Tinggi anak merupakan variabel random atau stokastik.Ingat definisi variabel random, yaitu: variabel yang mempunyaidistribusi probabilitas. Dalam pembahasan kita, variabel non-random(atau non-stokastik) disebut variabel tetap atau variabel fix (fixedvariables).

TJ (SU) Dasar-dasar Analisa Regresi May 2018 14 / 31

Page 15: Dasar-dasarAnalisaRegresitjipto.net/doc/wp-content/uploads/2018/12/Regresi.pdf · 2018. 12. 21. · atau genetika). TJ (SU) Dasar-dasar Analisa Regresi May 2018 17 / 31. RegresivsKorelasi

Regresi vs Hubungan Sebab-Akibat

Regresi tidak berarti kausalitas

Misalkan kita menganalisa hubungan antara curah hujan dengan hasilpanen. Secara statistik tidak ada alasan untuk mengatakan bahwahasil panen ditentukan oleh curah hujan. Jika kita mengatakan yangsebaliknya, yaitu bahwa curah hujan ditentukan oleh hasil panen, makaitu sah-sah saja secara statistik. Jika kita mengatakan bahwa hasilpanen ditentukan oleh curah hujan (dan bukan sebaliknya) maka ituberdasarkan pertimbangan non-statistik. (Misalnya: Kita tahu bahwakita tidak dapat mengendalikan curah hujan dengan caramengubah-ubah hasil panen).

TJ (SU) Dasar-dasar Analisa Regresi May 2018 15 / 31

Page 16: Dasar-dasarAnalisaRegresitjipto.net/doc/wp-content/uploads/2018/12/Regresi.pdf · 2018. 12. 21. · atau genetika). TJ (SU) Dasar-dasar Analisa Regresi May 2018 17 / 31. RegresivsKorelasi

Regresi vs Hubungan Sebab-Akibat

Regresi tidak berarti kausalitas

Hubungan statistik di dalam dirinya tidak dapat secara logismenunjukkan hubungan sebab-akibat. Untuk mengetahui hubungansebab-akibat, seseorang harus mencarinya dari sumber di luar analisastatistik.

TJ (SU) Dasar-dasar Analisa Regresi May 2018 16 / 31

Page 17: Dasar-dasarAnalisaRegresitjipto.net/doc/wp-content/uploads/2018/12/Regresi.pdf · 2018. 12. 21. · atau genetika). TJ (SU) Dasar-dasar Analisa Regresi May 2018 17 / 31. RegresivsKorelasi

Regresi vs Hubungan Sebab-Akibat

Dalam hal hubungan antara tinggi orang tua dengan tinggi anak, kitabisa saja membuat analisa di mana kita menetapkan tinggi anaksebagai variabel independen, dan menjadikan tinggi orang tua sebagaivariabel dependen yang merupakan variabel stokastik. Pengetahuanbahwa tinggi anak dikendalikan oleh tinggi orang tua bukan berasaldari analisa statistik melainkan dari sumber lain (umpamanya biologiatau genetika).

TJ (SU) Dasar-dasar Analisa Regresi May 2018 17 / 31

Page 18: Dasar-dasarAnalisaRegresitjipto.net/doc/wp-content/uploads/2018/12/Regresi.pdf · 2018. 12. 21. · atau genetika). TJ (SU) Dasar-dasar Analisa Regresi May 2018 17 / 31. RegresivsKorelasi

Regresi vs Korelasi

Apa perbedaan antara Korelasi dan Regresi?

Korelasi: Dalam korelasi, kita ingin mengetahui seberapa kuathubungan linear antara dua variabel.

Regresi: Dalam regresi, kita ingin mengestimasi atau memprediksinilai rata-rata dari suatu variabel (variabel dependen)berdasarkan nilai yang ditetapkan dari variabel yang lain(variabel independen).

TJ (SU) Dasar-dasar Analisa Regresi May 2018 18 / 31

Page 19: Dasar-dasarAnalisaRegresitjipto.net/doc/wp-content/uploads/2018/12/Regresi.pdf · 2018. 12. 21. · atau genetika). TJ (SU) Dasar-dasar Analisa Regresi May 2018 17 / 31. RegresivsKorelasi

Regresi vs Korelasi

Apa perbedaan antara Korelasi dan Regresi?

Korelasi: Hubungan antara kedua variabel bersifat simetris, kitatidak membeda-bedakan antara kedua variabel. Selain itukedua-duanya diperlakukan sebagai variabel random(stokastik)

Regresi: Hubungan antara kedua variabel bersifat a-simetris. Kitamembedakan antara variabel independen dan variabeldependen. Selain itu, hanya variabel dependen yangdiperlakukan sebagai variabel random (stokastik).Variabel independen diperlakukan sebagai variabel yangtetap (fixed, atau non-stokastik).

TJ (SU) Dasar-dasar Analisa Regresi May 2018 19 / 31

Page 20: Dasar-dasarAnalisaRegresitjipto.net/doc/wp-content/uploads/2018/12/Regresi.pdf · 2018. 12. 21. · atau genetika). TJ (SU) Dasar-dasar Analisa Regresi May 2018 17 / 31. RegresivsKorelasi

Istilah Dan Notasi

Dependent Variable

Explained variable

Predictand

Regressand

Response

Endogeneous

Outcome

Controlled variable

Independent variable

Explanatory Variable

Predictor

Regressor

Stimulus

Exogeneous

Covariate

Control variable

TJ (SU) Dasar-dasar Analisa Regresi May 2018 20 / 31

Page 21: Dasar-dasarAnalisaRegresitjipto.net/doc/wp-content/uploads/2018/12/Regresi.pdf · 2018. 12. 21. · atau genetika). TJ (SU) Dasar-dasar Analisa Regresi May 2018 17 / 31. RegresivsKorelasi

Jenis-jenis Data Dalam Ekonometrik

Ada tiga macam data dalam ekonometrik

1 Time Series

2 Cross Section

3 Pooled Data (Kombinasi dari dua jenis data di atas).

TJ (SU) Dasar-dasar Analisa Regresi May 2018 21 / 31

Page 22: Dasar-dasarAnalisaRegresitjipto.net/doc/wp-content/uploads/2018/12/Regresi.pdf · 2018. 12. 21. · atau genetika). TJ (SU) Dasar-dasar Analisa Regresi May 2018 17 / 31. RegresivsKorelasi

Jenis-jenis Data Dalam Ekonometrik

1 Time SeriesSatu set hasil observasi terhadap nilai-nilai dari suatu variabel,yang diperoleh pada berbagai waktu yang berbeda. Time seriesbiasanya diambil pada interval waktu yang teratur, misalnya:harian, mingguan, bulanan, dst.

TJ (SU) Dasar-dasar Analisa Regresi May 2018 22 / 31

Page 23: Dasar-dasarAnalisaRegresitjipto.net/doc/wp-content/uploads/2018/12/Regresi.pdf · 2018. 12. 21. · atau genetika). TJ (SU) Dasar-dasar Analisa Regresi May 2018 17 / 31. RegresivsKorelasi

Jenis-jenis Data Dalam Ekonometrik

Gbr. 3: Contoh data time series. Money supply, tahun 1950 - 1993

TJ (SU) Dasar-dasar Analisa Regresi May 2018 23 / 31

Page 24: Dasar-dasarAnalisaRegresitjipto.net/doc/wp-content/uploads/2018/12/Regresi.pdf · 2018. 12. 21. · atau genetika). TJ (SU) Dasar-dasar Analisa Regresi May 2018 17 / 31. RegresivsKorelasi

Jenis-jenis Data Dalam Ekonometrik

2 Cross SectionData cross-section adalah data dari satu atau lebih variabel yangdiperoleh pada satu waktu tertentu. Dengan kata lain, semua dataitu diperoleh pada waktu yang sama.

TJ (SU) Dasar-dasar Analisa Regresi May 2018 24 / 31

Page 25: Dasar-dasarAnalisaRegresitjipto.net/doc/wp-content/uploads/2018/12/Regresi.pdf · 2018. 12. 21. · atau genetika). TJ (SU) Dasar-dasar Analisa Regresi May 2018 17 / 31. RegresivsKorelasi

Jenis-jenis Data Dalam Ekonometrik

3 Pooled Data (Kombinasi dari dua jenis data di atas).Di dalam data jenis ini, baik time series maupun cross section adadi dalamnya.

Panel Data: adalah contoh dari Pooled Data di mana unitcross-section yang sama (misalnya sebuah keluarga atau suatuperusahaan) diobservasi dalam satu jangka waktu tertentu.

TJ (SU) Dasar-dasar Analisa Regresi May 2018 25 / 31

Page 26: Dasar-dasarAnalisaRegresitjipto.net/doc/wp-content/uploads/2018/12/Regresi.pdf · 2018. 12. 21. · atau genetika). TJ (SU) Dasar-dasar Analisa Regresi May 2018 17 / 31. RegresivsKorelasi

Jenis-jenis Data Dalam Ekonometrik

Gbr. 4: Pooled Data. Produksi Telur di Amerika tahun 1990 dan 1991

TJ (SU) Dasar-dasar Analisa Regresi May 2018 26 / 31

Page 27: Dasar-dasarAnalisaRegresitjipto.net/doc/wp-content/uploads/2018/12/Regresi.pdf · 2018. 12. 21. · atau genetika). TJ (SU) Dasar-dasar Analisa Regresi May 2018 17 / 31. RegresivsKorelasi

Jenis-jenis Data Dalam Ekonometrik

Gbr. 5: Data Cross Section. Harga Telur vs Produksi Telur di Amerika tahun1990

TJ (SU) Dasar-dasar Analisa Regresi May 2018 27 / 31

Page 28: Dasar-dasarAnalisaRegresitjipto.net/doc/wp-content/uploads/2018/12/Regresi.pdf · 2018. 12. 21. · atau genetika). TJ (SU) Dasar-dasar Analisa Regresi May 2018 17 / 31. RegresivsKorelasi

Akurasi Data

Seringkali kualitas data-data yang diperoleh kurang bagus, alasannyaantara lain:

Kebanyakan data dalam ilmu sosial adalah noneksperimental.Karena itu, dapat terjadi error dalam observasi.

Pada data-data yang diperoleh dari eksperimen, error dapatterjadi pada pengukuran, akibat pembulatan dan pendekatan.

Pada data yang diperoleh dari questionnaire, dapat terjadiproblem dari kurangnya response. Jika beruntung, seorang penelitidapat memperoleh 40% response.

Metode-metode sampling yang digunakan untuk memperoleh databisa saja bervariasi dari satu sample ke sample lainnya, sehinggasulit untuk membandingkan satu sample dengan sample lainnya.

Data ekonomi seringkali sangat teragregat, terutama dalamdata-data makro.

Seorang peneliti harus selalu ingat bahwa kualitas hasil riset sangatbergantung pada kualitas data-nya.

TJ (SU) Dasar-dasar Analisa Regresi May 2018 28 / 31

Page 29: Dasar-dasarAnalisaRegresitjipto.net/doc/wp-content/uploads/2018/12/Regresi.pdf · 2018. 12. 21. · atau genetika). TJ (SU) Dasar-dasar Analisa Regresi May 2018 17 / 31. RegresivsKorelasi

Jenis-jenis Variabel

Skala Rasio: Ada urut-urutan, jarak antar satu variabel denganvariabel lain mempunyai makna, begitu pula rasio antarsatu variabel dengan variabel lain.

Skala Interval: Ada urut-urutan, jarak antar satu variabel denganvariabel lain penting, tetapi rasio tidak berarti.

Skala Ordinal: Ada urut-urutan, tetapi jarak maupun rasio tidakbermakna. Memberi label pada kategori, di mana adaurut-urutan pada kategori-kategori. Kategori yang satulebih tinggi dari yang lain.

Skala Nominal: Hanya digunakan memberi label pada kategori. Tidakada urut-urutan, jarak, atau rasio.

TJ (SU) Dasar-dasar Analisa Regresi May 2018 29 / 31

Page 30: Dasar-dasarAnalisaRegresitjipto.net/doc/wp-content/uploads/2018/12/Regresi.pdf · 2018. 12. 21. · atau genetika). TJ (SU) Dasar-dasar Analisa Regresi May 2018 17 / 31. RegresivsKorelasi

Tugas Kelas

Page 31: Dasar-dasarAnalisaRegresitjipto.net/doc/wp-content/uploads/2018/12/Regresi.pdf · 2018. 12. 21. · atau genetika). TJ (SU) Dasar-dasar Analisa Regresi May 2018 17 / 31. RegresivsKorelasi

Tugas Kelas

1 Berikan contoh untuk skala rasio, skala interval, skala ordinal,skala nominal.

2 Dapatkah kita melakukan analisa regresi jika variabelindependen-nya berupa variabel dengan skala nominal? Mengapa?

3 Berikan contoh dari kehidupan nyata data yang berupa datacross-section. Jelaskan!

4 Berikan contoh dari kehidupan nyata data yang berupa data timeseries. Jelaskan!

5 Berikan contoh variabel stokastik. Jelaskan!

6 Berikan contoh variabel tetap/non-stokastik. Jelaskan!

7 Berikan contoh analisa korelasi, berikan pula contoh analisaregresi. Jelaskan apa perbedaan antara kedua analisa itu.

TJ (SU) Dasar-dasar Analisa Regresi May 2018 31 / 31