anreg best subset

14
PENYELESAIAN KASUS MULTIKOLINEARITAS PADA DATA PENJUALAN PERALATAN ELEKTRONIK DENGAN METODE BEST SUBSET REGRESSION MAKALAH Disusun untuk memenuhi tugas mata kuliah Analisis Regresi yang dibina oleh Ir. Hendro Permadi, M.Si Oleh Anita Hermaningtyas 408312408019 Rina Uktafiya 408312409119 Umi Qoiriah 408312409125 Dwi Rahmawati Utami 40831240913 UNIVERSITAS NEGERI MALANG FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM PROGRAM STUDI MATEMATIKA Desember 2010

Upload: aldila-sakinah-putri

Post on 26-Jul-2015

342 views

Category:

Documents


21 download

DESCRIPTION

Offering GG 2008 - Matematika - Universitas Negeri Malang

TRANSCRIPT

Page 1: ANREG Best Subset

PENYELESAIAN KASUS MULTIKOLINEARITAS

PADA DATA PENJUALAN PERALATAN ELEKTRONIK DENGAN

METODE BEST SUBSET REGRESSION

MAKALAH

Disusun untuk memenuhi tugas mata kuliah Analisis Regresi

yang dibina oleh Ir. Hendro Permadi, M.Si

Oleh

Anita Hermaningtyas 408312408019

Rina Uktafiya 408312409119

Umi Qoiriah 408312409125

Dwi Rahmawati Utami 40831240913

UNIVERSITAS NEGERI MALANG

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

PROGRAM STUDI MATEMATIKA

Desember 2010

Page 2: ANREG Best Subset

BAB 1

PENDAHULUAN

A. Latar Belakang

Regresi dalam statistika adalah salah satu metode untuk menentukan

hubungan suatu variabel terhadap variabel yang lain. Variabel yang pertama

disebut dengan variabel bebas atau variabel karena seringkali digambarkan

dalam grafik sebagai absis. Variabel yang kedua adalah variabel terikat atau

variabel , dalam grafik digambarkan sebagai ordinat. Kedua variabel ini

biasanya merupakan variabel acak (random).

Apabila kita menggunakan model regresi

, dalam hal ini kita mempunyai asumsi bahwa , , , …, sebagai

variable-variabel bebas tidak berkorelasi satu sama lain. Seandainya variable-

variabel bebas tersebut berkorelasi satu sama lain, maka dikatakan terjadi

kolinearitas berganda (multicollinearity). Ada kemungkinan terjadi 2 variabel atau

lebih mempunyai hubungan yang sangat kuat sehingga pengaruh masing-masing

variable tersebut terhadap sukar untuk dibedakan (Supranto, 2001).

Multikolinearitas adalah kondisi terdapatnya hubungan linier atau korelasi

yang tinggi antara masing-masing variabel independen dalam model regresi.

Multikolinearitas biasanya terjadi ketika sebagian besar variabel yang digunakan

saling terkait dalam suatu model regresi. Oleh karena itu masalah

multikolinearitas tidak terjadi pada regresi linier sederhana yang hanya

melibatkan satu variabel independen.

Best subset adalah suatu metode pemilihan variable X yang memuat

hubungan terbaik dengan variable Y. Menaksir persamaan regresi semua

kemungkinan menggunakan semua kemungkinan kombinasi dari variabel

independen. Pilih terbaik sesuai dengan mencari disesuaikan tertinggi di R2 dan

standart error terendah.

Page 3: ANREG Best Subset

B. Rumusan Masalah

1. Bagaimana mengidentifikasi multikolinearitas?

2. Bagaimana cara mengatasi multikolinearitas?

3. Bagaimana aplikasi dari metode best subset?

C. Tujuan

1. Untuk mengetahui mengidentifikasi multikolinearitas.

2. Untuk mengetahui cara mengatasi multikolinearitas.

3. Untuk mengetahui aplikasi dari metode best subset.

Page 4: ANREG Best Subset

BAB II

PEMBAHASAN

Dalam suatu penelitian ilmiah biasanya yang diteliti adalah hubungan

antara peubah, dimana perubah itu sebut saja hubungan antara peubah, dimana

peubah itu sebut saja peubah bebas dan peubah tak bebas . Hubungan tersebut

dapat pula berupa hubungan fungsional antar peubah yang satu dengan peubah

yang lain. Tetapi masing-masing peubah merupakan bilangan random, sehingga

bilamana peubah dipengaruhi atau ditentukan besarnya oleh peubah maka

dapat dikatakan bahwa permasalahan tersebut dapat diselesaikan dengan

menggunakan teknik analisis regresi (Nugroho, 1990b).

Dalam penelitian ini analisis yang dipergunakan adalah Analisis Regresi

Berganda. Menurut Nugroho (1990b) ada beberapa alas an dipergunakan Regresi

Berganda :

a. Membuat persamaan di dalam yang memberikan prediksi yang terbaik

terhadap . Dengan adanya banyak peubah , mungkin juga termasuk di

dalamnya pemilihan subset yang terbaik untuk memprediksi .

b. Dengan mengetahuinya peubah-peubah yang berpengaruh terhadap ,

mungkin perlu membuat rangking yang didasarkan pada besarnya

pengaruh terhadap .

Analisis Regresi Linier Berganda merupakan bentuk umum sedangkan

Regresi Linier Sederhana merupakan bentuk khusus dari Regresi Linier Berganda

yaitu apabila satu peubah bebas yang dilibatkannya (Yitnosumartono, 1988)

Dalam regresi linier berganda terdapat satu peubah tak bebas yang akan

dilihat hubungannya dengan dua atau lebih peubah bebasnya, umpakan bahwa

pengamatan-pengamatan dapat dinyatakan dengan fungsi-fungsi linier dari

beberapa , , , ..., yang diketahui dan faktor sisa. Model populasinya

adalah sebagai berikut:

................................... 5.8

Page 5: ANREG Best Subset

I = 1, 2, 3, ...,

Dimana = Nilai pengamatan yang ke-

, ..., = peubah bebas yang menentukan nilai pengamatan ke-

, ..., = koefisien-koefisien regresi sebagian (parsial) untuk

peubah , ..., , secara berturut-turut.

= titik potong sumbu

= faktor sisaan yang ke-

= banyaknya pengamatan

Berdasarkan dari matriks korelasi kita dapat mengetahui gambaran

kolinearitas ganda antara peubah bebas secara kasar dengan jalan menggunakan

metode membanding koefisien korelasi dalam matriks korelasi dengan nilai kritis

pada taraf nyata . Dari koefisien yang terpilih lalu dihitung korelasi parsialnya

setelah itu langsung dilakukan pengujian hipotesis dimana :

Adapun statistik uji yang digunakan adalah :

dimana :

= banyaknya pengamatan

= banyaknya peubah bebas

Bila mana benar maka mengikuti distribusi dengan derajat bebas

pada taraf nyata , jika ( ) maka ditolak yang berarti

kolinearitas ganda disebabkan karena dan terjadi secara bersama-sama

dalam regresi.

Multikolinieritas (kolinearitas ganda) ditemukan oleh Ragner Frisch yang

berarti adanya hubungan linier yang sempurna atau pasti diantara beberapa atau

semua variabel yang menjelaskan ( , , ..., ) dari model regresi.

Beberapa cara mengetahui apakah suatu model regresi itu mempunyai

kolinearitas ganda atau tidak adalah sebagai berikut:

Page 6: ANREG Best Subset

a. Suatu model yang variable-variabel penjelasnya bersifat kolinearitas

memperlhatkan tanda-tanda sebagai berikut:

1. Koefisien determinasi ganda tinggi

2. Koefisien korelasi sederhananya tinggi

3. VIF (Variance Inflation Factor )

Jika nilai VIF lebih besar atau sama dengan 10, menandakan adanya

multikolinieritas pada variabel bebas.

4. Tak satupun (sedikit sekali diantaranya) variable-variabel bebas

memiliki uji- yang signifikan, walaupun keadaan 1, 2 dan 3 terpenuhi.

b. Jika hanya ada dua variable bebas yang ternyata korelasi antara kedua

variable itu tinggi, maka dapat merupakan indikasi bahwa dalam model

tersebut terjadi kolinearitas. Akan tetapi apabila model itu mempunyai

lebih dari dua variable bebas, walaupun korelasi antara dua variable

rendah, tidak dapat menjadi jaminan bahwa model tersebut tida bersifat

multikollinearitas.

c. Apabila model yang akan diuji adalah: ( ) dengan

koefisien determinasi gandanya adalah tinggi yakni:

mendekati 1,

akan tetapi ,

, mempunyai nilai yang sangat rendah

dibandingkan nilai kofisien determinasi ganda antara dengan , , dan

berarti ada kolinearitas ganda.

d. Mengadakan uji antara variable-variabel bebasnya. Jika hitung

dibandingkan dengan tabel dan ternyata signifikan maka dapat dianggap

bahwa ada multikolinearitas (Awat, 1995).

Akibat Adanya Kolinearitas Ganda

Jika hubungan antar variable bebasnya sempurna, maka koefisien

regresi parsial tak akan dapat diestimasi.

Kalau hubungan tersebut tidak sempurna, maka koefisien regresi

parsial masih bisa diestimasi, tetapi kesalahan baku dari penduga

koefisien regresi parsial sangat besar. Hal ini menyebabkan

pendugaan/peramalan nilai kurang teliti.

Page 7: ANREG Best Subset

Cara Mengatasi Masalah Kolinearitas Ganda

Memeriksa secara teoritis untuk mengetahui apakah antara variable

bebas memang ada hubungannya.

Mengadakan penggabungan antara data cross-section dan time series,

yang akan disebut sebagai polling data.

Mengeluarkan salah satu variable bebasnya dari model tersebut.

Mentransformasi variable yang ada dalam model.

Menambah data baru, yakni menambah jumlah observasi atau .

Dengan semakin besarnya , maka ada kemungkinan bahwa standard

error akan semakin kecil pula.

Best Subset Regression

Regresi terbaik(best subsets regression) digunakan untuk meregresikan

satu peubah respon pada semua kemungkinan kombinasi subset peubah-peubah

prediktor dan kemudian memilih subset terbaik untuk setiap ukuran (size)

informasi model terbaik ini dipilih berdasarkan nilai R-square terbesar. Pada

setiap regresi subset terbaik ditampilkan statistik, yaitu : R-sq, adj R-sq, S dan C-

p. Jika model di fit tanpa konstanta, R-sq dan adj R-sq tidak ditampilkan.

Page 8: ANREG Best Subset

APLIKASI

P.T. Cemerlang dalam beberapa bulan gencar mempromosikan sejumlah peralatan

elektronik dengan membuka outlet-outlet di berbagai daerah. Berikut adalah data

mengenai kenaikan penjualan, biaya promosi, jumlah outlet, laju penduduk,

jumlah pesaing dan income masyarakat pada bulan Mei 2010.

Kenaikan

Penjualan

(%)

Income

Masyarakat

(%)

Banyaknya

Sales

Biaya

Promosi

Outlet Pesaing Laju

Penduduk

(%)

10

12

30

25

8

38

21

14

9

17

24

48

55

35

60

5,46

2,43

2,56

3,55

4,35

3,65

3,44

2,55

4,79

2,53

2,75

2,53

3,51

2,81

3,01

205

206

254

246

201

291

234

209

204

216

245

286

312

265

322

26

28

35

31

21

49

30

30

24

31

32

47

54

40

42

159

164

198

184

150

208

184

154

149

175

192

201

248

166

287

15,00

16,00

19,00

17,00

11,00

24,00

16,00

10,00

1,35

2,13

2,64

1,63

2,53

2,54

1,53

2,00

1,50

1,75

1,64

2,65

1,45

1,67

2,74

14,00

14,00

11,00

19,00

21,00

18,00

18,00

Page 9: ANREG Best Subset

Keterangan :

= Kenaikan penjualan

= Income masyarakat

= Banyaknya sales

= Biaya Promosi

= Outlet

= Pesaing

= Laju penduduk

Dari hasil minitab yang didapat untuk mencari best subset dicari C-P

dengan nilai terkecil, S terkecil, dan R-Sq (Adj) terbesar.

Page 10: ANREG Best Subset

Sedangkan,

Dari data di atas dapat dilihat bahwa pada regresi dan korelasinya ada

perubahan tanda sehingga menunjukkan bahwa data tersebut multikolinearitas.

Lalu kita mulai menggunakan metode best subset yaitu dicari C-P dengan

nilai terkecil, S terkecil, dan R-Sq (Adj) terbesar.

Page 11: ANREG Best Subset

Dari keterangan di atas dapat dilihat R-sq yang besar dengan C-p dan S

terkecil adalah persamaan dengan variable , , , , , .

Menganalisis dengan melihat nilai C-p bukan terkecil, Sterkecil, dan R-Sq

(Adj)

Page 12: ANREG Best Subset

Dapat dilihat bahwa pada persamaan regresi tersebut masih terdapat

perubahan tanda sehingga masih terdapat kasus multikolinieritas sehingga

persamaan regresi tersebut juga masih mengandung kasus multikolinieritas.

Oleh karena itu, kita cari persamaan regresi yang lebih baik dengan C-p

terkecil selanjutnya dan beda R-sq yang tidak jauh dari R-sq yang terbesar sehigga

diperoleh persamaan regresi terbaik.

Selanjutnya dipilih variable , , dan karena memiliki C-p dan s terkecil

dan R-Sq (Adj ) terbesar.

Berdasarkan hasil regresi di atas dapat dilihat bahwa masih terjadi perubahan

tanda pada persaman regresinya..Sehingga masih terjadi kasus

multikolineariatas.Oleh karena itu perlu dipilih kemungkinan variable yang lain

dengan 2 variabel yang merupakan variable terbaik.

Berikut ini analisis regresi dari dengan variabel bebas dan dengan C-

p terkecil namun bukan terkecil dan R-Sq(Adj) bukan terbesar.

Lalu diregresikan :

Page 13: ANREG Best Subset

Dari analisis di atas, nampak bahwa pada persamaan regresi sudah tidak terjadi

perubahan tanda lagi. Serta VIF dari kedua variabel tersebut keduanya kurang dari

5. Sehingga dapat disimpulkan bahwa variabel yang paling berpengaruh terhadap

yaitu dan sehingga model regresi yang terbaik yaitu

dengan R-sq = dan R-sq(adj) = yang

selisihnya tidak jauh dari R-sq yang terbesar.

Page 14: ANREG Best Subset

BAB III

KESIMPULAN

Berdasarkan pembahasan data di atas dapat disimpulkan bahwa:

1. Dari data penelitian kenaikan penjualan peralatan elektronik pada PT

Cemerlang, ternyata terjadi kasus multikolinieritas. Maka untuk mengatasinya

digunakan metode best subset regression.

2. Dari hasil analis menggunakan metode best subset regression diperoleh 2

variable yang paling mempengaruhi kenaikan penjualan peralatan elektronik,

yaitu banyaknya sales dan benyaknya pesaing.

3. Dengan menggunakan metode best subset regression diperoleh model regresi

terbaik yaitu dengan nilai C-P = 1,6 merupakan nilai paling kecil, nilai

bukan terkecil, nilai R-Sq (Adj) = , dengan persamaan

regresi

4. Dari kesimpulan 1, 2, 3 dapat disimpulkan bahwa semakin banyak sales dan

sedikit pesainga, semakin tinggi kenaikan penjualan peralatan elektronik.

DAFTAR PUSTAKA

Permadi, Hendro. 1999. Teknik Analisis Regresi. UM Press: Jakarta.

http://myunanto.staff.gunadarma.ac.id/Downloads/files/19417/BAB+15+REGRE

SI+TIP+TRIK+BERBAGAI+METODE+REGRESI+BERGANDA.pdf