makalah tugas kelompok - multiple regression 230710

Upload: lintang-widayanto

Post on 20-Jul-2015

264 views

Category:

Documents


9 download

TRANSCRIPT

TUGAS KELOMPOKMata Kuliah : Statistics for Business Decision Dosen : Amirullah Setya Hardi MSc.

2010

Anggota Kelompok : Leknor Joni Lintang Widayanto Meita Indriasari Rina Faqih Setio Candrawati N.

PRA-MM EKSEKUTIF 19A24-Juli-2010

TUGAS SBD 2010Daftar Isi

Daftar Isi .................................................................................................................................... 0 Bab I Pendahuluan .................................................................................................................. 2 1.2 Latar Belakang ............................................................................................................ 2

2. Permasalahan .................................................................................................................. 2 3. Tujuan ............................................................................................................................. 3 4. Alat yang digunakan ....................................................................................................... 3 Bab II Penyajian Data ............................................................................................................. 6 Bab III Analisis ....................................................................................................................... 8 Bab IV - Kesimpulan ............................................................................................................... 18

1

TUGAS SBD 2010Bab I Pendahuluan

1.1

Latar Belakang

Perkembangan Teknologi Informasi tidak dapat dipungkiri sangat cepat dan telah digunakan secara luas termasuk dalam dunia bisnis. Dunia bisnis saat ini tidak dapat dilepaskan dari Teknologi Informasi baik dalam pencatatan transaksi sehari-hari maupun dalam proses pengambilan keputusan penting dalam suatu perusahaan. Ada berbagai jenis alat Teknologi Informasi yang digunakan dalam dunia bisnis yang disesuaikan dengan kebutuhannya.

Peluang ini ditangkap oleh beberapa perusahaan Teknologi Informasi dengan menyediakan jasa konsultasi dan implementasi penggunaan alat-alat Teknologi Informasi ini. Beberapa alat teknologi informasi yang telah banyak digunakan saat ini antara lain : Aplikasi ERP (Enterprise Resources Planning) Aplikasi untuk Rumah Sakit Aplikasi untuk Simulasi dan Perencanaan Aplikasi untuk manajemen strategi dst

Data yang kami sajikan di sini merupakan data sample yang diambil dari salah satu perusahaan Teknologi Informasi terkemuka di Indonesia.

1.2

Permasalahan

Pertanyaan yang paling sering diajukan oleh pelanggan adalah berapa yang harus kami investasikan untuk suatu proyek implementasi suatu aplikasi bisnis ? Dan berdasarkan hasil analisa, didapatkan ada 4 buah variabel yang berhubungan dengan investasi suatu proyek implementasi suatu aplikasi bisnis, yaitu : Durasi proyek Jumlah modul aplikasi yang diimplementasikan Jumlah konsultan yang terlibat dalam proyek Lokasi proyek

2

TUGAS SBD 2010Dari uraian di atas maka kita dapat tuliskan bahwa variabel dependen dalam penelitian ini adalah Nilai investasi suatu proyek implementasi suatu aplikasi bisnis dan variabel independennya adalah durasi proyek, jumlah modul aplikasi bisnis, jumlah konsultan yang terlibat, dan lokasi proyek.

1.3

Tujuan

Tujuan dari penelitian ini adalah untuk membuktikan adanya hubungan antara durasi proyek, jumlah modul aplikasi, jumlah konsultan yang terlibat, dan lokasi proyek sebagai variebel independen terhadap nilai proyek sebagai variabel dependen. Untuk menganalisanya, maka kami mengambil sample secara sistematik random 16 buah proyek yang berjalan di suatu perusahaan Teknologi Informasi selama tahun 2009.

1.4

Alat yang digunakana. Analisa Regresi Berganda Untuk menggambarkan hubungan antara variabel dependen dan variabel independen, digunakan formula analisa regresi berganda (Multiple Regression Analysis) sebagai berikut: Y = a + b1X1 + b2X2 + b3X3 + + bkXk Dimana: a merupakan angka dari Y apabila semua X adalah nol b adalah jumlah perubahan Y ketika X naik 1 unit

b. Pengukuran efektivitas formula regresi diatas dapat dilakukan dengan: 1. Multiple Standard Error of Estimate Rumus:

Dimana: Y adalah pengamatan actual Y adalah nilai perkiraan dari perhitungan regresi n adalah jumlah observasi dalam sampel k adalah jumlah variabel independen

3

TUGAS SBD 20102. Coefficient of Multiple Determination Persentase variasi pada variabel dependen Y, yang dijelaskan oleh sekumpulan variabel independen. Karakteristik: a. b. c. d. Disimbolkan dengan R2 Angka berkisar antara 0 sampai 1 Tidak dapat mengasumsikan nilai negatif. Mudah untuk diterjemahkan

Perhitungan Koefisien Determinasi Berganda (Coefficient of Multiple Regression) dapat menggunakan data yang diperoleh dari tabel ANOVA, sebagai berikut:

c. Tabel ANOVA digunakan untuk merangkum analisa regresi berganda. Tabel ANOVA adalah jumlah perhitungan yang didapat dari perhitungan pada program excel. Hasil pada tabel ANOVA: Source Regression Residual or Error Total df k n (k + 1) n-1 SS SSR SSE SS Total MS MSR = SSR / k MSE = SSE / (n (k + 1)) F MSR / MSE

d. Pengujian Analisa Regresi Berganda 1. Global Test Global test digunakan untuk menyelidiki apakah ada dari independent variable yang memiliki koefisien regresi yang signifikan. Formula yang digunakan untuk menghitung nilai tes statistic global test:

4

TUGAS SBD 20102. Evaluasi Koefiesien Regresi Individu Evaluasi ini dilakukan untuk mengetahui apakah ada variabel independenyang memiliki regresi koefisien nol. Variabel yang memiliki koefisien regresi nol biasanya dikeluarkan dari analisa.

Formula :

5

TUGAS SBD 2010Bab II Penyajian Data

Seperti telah disebutkan pada Bab I Pendahuluan bahwa data ini diambil dari salah satu perusahaan Teknologi Informasi terkemuka di Indonesia. Data yang digunakan di sini adalah data nilai proyek implementasi aplikasi ERP yang dilaksanakan pada tahun 2009.

Sample yang digunakan di sini berjumlah 16 proyek yang mewakili keseluruhan proyek aplikasi ERP yang bersangkutan pada tahun 2009. Jumlah sample ini kami rasa cukup karena populasi dari nilai proyek sudah terdistribusi normal. Angka yang tercantum dalam makalah ini, khususnya nilai proyek diambil dari data yang sesungguhnya dan kemudian dilakukan beberapa kalkulasi untuk menyamarkan nilai yang sesungguhnya. Kalkulasi yang dilakukan tidak mengubah arti dari nilai proyek dan hubungannya terhadap kolom-kolom yang lain dalam table ini. Untuk lokasi proyek nilai 1 kami berikan untuk yang berada di Jakarta, sedangkan nilai 2 untuk yang berada diluar Jakarta. Nilai di luar Jakarta kami beri lebih karena headquarter dari perusahaan IT ini berada di Jakarta sehingga jika ada proyek diluar Jakarta diperkirakan membutuhkan biaya yang lebih besar.

Nama Proyek Proyek 1 Proyek 2 Proyek 3 Proyek 4 Proyek 5 Proyek 6 Proyek 7 Proyek 8 Proyek 9 Proyek 10 Proyek 11 Proyek 12 Proyek 13 Proyek 14 Proyek 15 Proyek 16

Nilai Proyek (dalam Juta Rupiah) 140.0 2.0 2.0 264.0 122.0 250.0 12.5 13.5 625.0 55.0 420.0 195.0 588.0 504.0 388.0 500.0

Durasi (Bulan) 5.00 0.25 0.25 6.00 3.00 6.00 1.25 1.25 7.00 3.00 8.00 8.00 9.50 8.00 6.00 9.00

Jumlah Modul 2.5 1.0 1.0 5.0 2.0 6.0 1.0 1.5 13.0 3.0 5.0 3.5 8.0 8.0 8.0 10.0

Jumlah Konsultan 7 1 1 8 6 10 1 2 13 3 9 4 15 15 12 14

Lokasi Proyek 1 1 1 1 1 1 1 1 2 1 2 1 1 2 2 1

6

TUGAS SBD 2010Keterangan : Nilai Proyek (dalam Juta Rupiah) = nilai proyek yang dituliskan dalam Juta Rupiah Angka yang tercantum di sini diambil dari data yang Durasi (Bulan) = durasi dalam bulan yang diperlukan untuk menyelesaikan proyek yang bersangkutan Jumlah Modul = jumlah modul yang diimplementasikan dalam proyek yang bersangkutan Jumlah Konsultan = jumlah konsultan yang terlibat dalam proyek yang bersangkutan Lokasi Proyek : 1 = Jakarta ; 2 = Di luar Jakarta

Dari hasil kalkulasi Microsoft Excel dengan menggunakan fungsi Regresi, didapatkan hasil sebagai berikut :

7

TUGAS SBD 2010Bab III Analisis

Dari hasil tersebut, persamaan regresi bergandanya adalah sbb :Nilai Proyek = -127.22 + 19.13 Durasi (Bulan) + 23.18 Jumlah Modul + 13.11 Jumlah Konsultan + 57.58 Lokasi Proyek

Berdasarkan table Regresi pada bab sebelumnya diketahui bahwa kooefisien multiple of determination R2 (R square) sebesar 0.94646 dan adjusted R square sebesar 0.951711 atau mendekati 1 (value nearly 1) yang mengindikasikan bahwa hubungan antara varialbel Y (Nilai Proyek) dengan X1 (Durasi/bulan), X2 (Jumlah Modul), X3 (Jumlah Konsultan) dan X4 (Lokasi proyek) sangat kuat (a strong association).

Dan dari persamaan di atas juga diketahui bahwa antara Y dan X semuanya memiliki hubungan searah (slope positif) dapat dilihat bahwa : Pada koefisien mean dari Duration (Month) bernilai 19.13 yang menunjukkan hubungan searah dengan Proyek Size. Hal ini berarti, makin panjang durasi suatu proyek, maka Nilai Proyeknya akan makin besar. Apabila diasumsikan bahwa variable yang lain tetap, makan penambahan 1 bulan pada durasi proyek akan meningkatkan Nilai Proyek sebesar Rp 19,130,000. Pada koefisien mean dari Jumlah modul bernilai 23.18 yang menunjukkan hubungan searah dengan Nilai Proyek. Hal ini berarti, semakin banyak modul yang digunakan dalam suatu proyek, maka Nilai Proyekya akan makin besar. Apabila diasumsikan bahwa variable yang lain tetap, maka penambahan 1 Module pada proyek akan meningkatkan Nilai Proyek sebesar Rp 23,180,000. Pada koefisien mean dari Jumlah konsultan bernilai 13.11 yang menunjukkan hubungan searah dengan Nilai Proyek. Hal ini berarti, semakin banyak jumlah konsultan yang terlibat dalam suatu proyek, maka Nilai Proyeknya akan makin besar. Apabila diasumsikan bahwa variable yang lain tetap, maka penambahan 1 orang konsultan pada proyek akan meningkatkan Nilai Proyek sebesar Rp 13,110,000. Pada koefisien mean dari Lokasi Proyek bernilai 57.58 yang menunjukkan hubungan searah dengan Nilai Proyek. Hal ini berarti, untuk proyek-proyek yang berada di luar Jakarata, maka Nilai Proyeknya akan makin besar. Apabila diasumsikan bahwa variable yang lain tetap,

8

TUGAS SBD 2010maka untuk setiap proyek yang berada di luar Jakarta akan meningkatkan Nilai Proyek sebesar Rp 57,580,000.

Untuk menguji hubungan antara Y (dependent variabel) dengan variabel X (independent variabel) maka akan digunakan 3 tahapan test yaitu: 1. Global test untuk menguji apakah ada hubungan antara dependent variabel dengan salah satu independent variabel 2. Menguji hubungan antara masing-masing independent variabel dengan dependent variabel 3. Menguji apakah ada hubungan antara masing-masing variabel independent Setelah persamaan tersebut sudah melewati tiga tahapan test diatas, baru kita hitung hitung standar errornya.

Global Test Global test berfungsi untuk menguji tingkat korelasi antara dependent variabel dengan semua independent variabelnya. Berikut langkah-langkahnya : 1. Null Hypothesis :

Alternate Hypothesis :

2. Significance level sebesar 0.05 3. Tes statistk yang digunakan adalah distribusi F dengan degree of freedom numerator sebesar 3 dan degree of freedom denominator adalah 11 4. Berdasarkan Buku Lind Appendix B4 (0.05 significance level) nilai untuk F critical adalah : F = 3.36 (batas nilai H 0 ditolak)

9

TUGAS SBD 20105. Sedangkan nilai F hitungnya adalah :

Berdasarkan hasil perhitungan diatas maka nilai F berada di area di mana H 0 ditolak. Berarti ada independen variabel (durasi, no. of modules, dll) yang memiliki pengaruh terhadap dependen variabel (Nilai Proyek).

Menguji tiap koefisien regresi Pada bagian sebelumnya telah diuji bahwa, paling tidak ada satu koefisien regresi yang memiliki pengaruh terhadap independent variabel. Langkah selanjutnya adalah menguji masing-masing koefisien regresi apakah berpengaruh ke independen variabel. Untuk itu kita akan menguji masing-masing independen variabelnya : 1. Menentukan H 0

H 0 : 1 0; H 0 : 2 0; H 0 : 3 0; H 0 : 4 0 H1 : 1 0; H1 : 2 0; H1 : 3 0; H1 : 4 0Dimana :

1 koefisien untuk durasi proyek

2 koefisien untuk jumlah modul 3 koefisien untuk no. of consultant

4 koefisien untuk lokasi proyek2. Significance level : 0.1, dengan menggunakan two tailed test 3. Test statistik yang digunakan adalah distribusi t dengan degree of freedom :

df 16 (5 1) 104. Berdasarkan Appendix B.2. Buku Lind nilai critical untuk two tailed test dengan degree of freedom senilai 10 dan significance level 0.05 adalah -2.28 dan 2.28

10

TUGAS SBD 2010

5. Membandingkan

t hitung

dengan

t critical

Untuk Durasi Proyek

t hitung = 2.44 H 0 kita tolak Untuk No. of modules

t hitung =2.83 H 0 kita tolak Untuk No. of consultants

t hitung =1.91 H 0 kita terima Untuk lokasi proyek

t hitung =1.64 H 0 kita terima

Berdasarkan hasil perhitungan diatas maka dapat kita simpulkan bahwa lokasi proyek dan Jumlah Konsultan tidak memiliki pengaruh yang kuat terhadap dependen variabel yaitu nilai proyek.

Untuk itu mari kita coba untuk menghilangkan varibel lokasi proyek dan Jumlah Konsultan, sehingga mendapatkan persamaan seperti berikut : Proyek Size = -73.04 + 26.99 Duration (Month) + 38.86 No of Modules

11

TUGAS SBD 2010Dari hasil kalkulasi excel diperoleh hasil seperti berikut : SUMMARY OUTPUT Regression Statistics Multiple R 0.9704331 R Square 0.9417405 Adjusted R Square 0.9327775 Standard Error 57.372847 Observations 16 ANOVA df Regression Residual Total SS MS 2 691704.07 345852 13 42791.367 3291.64 15 734495.44 F 105.07 Significance F 9.43813E-09

Coefficients Intercept Durasi (Bulan) Jumlah Modul -73.0452797 26.9865987 38.8575374

Standard Error 27.86058164 7.370532662 6.434334958

t Stat -2.621815 3.6614177 6.0390915

P-value 0.021113 0.002874 4.17E-05

Lower 95% -133.2344069 11.06353095 24.95700184

Upper 95% -12.856153 42.9096664 52.7580729

Lower 95.0% -133.234407 11.06353095 24.95700184

Upper 95.0% -12.8561525 42.90966638 52.75807292

Berdasarkan hasil perhitungan diatas diketahui bahwa kooefisien multiple of determination R2 (R square) sebesar 0.9704 dan adjusted R square sebesar 0.9417 yang mengindikasikan bahwa hubungan antara varialbel Y (Nilai Proyek) dengan X1 (Durasi/bulan) dan X2 (Jumlah Modul) masih sangat kuat.

Untuk menguji hubungan antara Y (dependent variabel) dengan variabel X (independent variabel) maka kita ulang tahapan-tahapan test seperti yang sudah disebutkan sebelumnya.

Global test 1. Null Hypothesis :

Alternate Hypothesis :

2. Significance level sebesar 0.05

12

TUGAS SBD 20103. Tes statistik yang digunakan adalah distribusi F dengan degree of freedom numerator sebesar 3 dan degree of freedom denominator adalah 11 4. Berdasarkan Buku Lind Appendix B4 (0.05 significance level) nilai untuk F critical adalah : F = 3.36 (batas nilai H 0 ditolak)

5. Sedangkan nilai Fhitung berdasarkan excel adalah 105.07, yang berada di daerah dimana

H 0 kita tolak.

Jadi, paling tidak ada satu independen variabel (durasi dan no. of modules) yang memiliki pengaruh terhadap dependen variabel (Nilai Proyek).

Menguji tiap koefisien regresi 1. Menentukan H 0

H 0 : 1 0; H 0 : 2 0 H 1 : 1 0; H 1 : 2 0Dimana :

1 koefisien untuk durasi proyek

2 koefisien untuk jumlah modul2. Significance level : 0.1, dengan menggunakan two tailed test 3. Test statistik yang digunakan adalah distribusi t dengan degree of freedom :

df 16 (5 1) 104. Berdasarkan Appendix B.2. Buku Lind nilai critical untuk two tailed test dengan degree of freedom senilai 10 dan significance level 0.05 adalah -2.228 dan 2.228

13

TUGAS SBD 2010

5. Membandingkan t hitung dengan t critical Untuk Durasi Proyek

t hitung = 3.66 H 0 kita tolak Untuk No. of modules

t hitung =6.04 H 0 kita tolakBerarti variable duration dan variable No. of modules memiliki pengaruh yang kuat terhadap dependen variabel Project size.

Multicollinearity test Multicollinearity timbul jika masing-masing independent variable memiliki ketergantungan. Hubungan antara independent variable menyulitkan kita untuk membuat kesimpulan tentang masing-masing koefisien regresi dan pengaruhnya ke independent variable. Dalam prakteknya sangat sulit untuk mendapatkan independent variable yang benar-benar tidak berhubungan, tetapi berdasarkan teori jika nilai Variance Inflation Factor (VIF) masing-masing independent variabel kurang dari 10 maka bisa dikatakan bahwa hubungan antara independent variable tidaklah kuat. Pada makalah ini jumlah independent variable yang tersisa tinggal dua sehingga kita hanya perlu menghitung VIF satu kali saja. Berikut langkah-langkahnya: 1. Menentukan independent variable mana yang akan dijadikan sebagai dependent variable, dalam hal ini kami memilih durasi proyek sebagai dependent variabel dan jumlah modul sebagai independent variabel

14

TUGAS SBD 2010Durasi (Bulan) 5.00 0.25 0.25 6.00 3.00 6.00 1.25 1.25 7.00 3.00 8.00 8.00 9.50 8.00 6.00 9.00 Jumlah Modul 2.5 1.0 1.0 5.0 2.0 6.0 1.0 1.5 13.0 3.0 5.0 3.5 8.0 8.0 8.0 10.0

Nama Proyek Proyek 1 Proyek 2 Proyek 3 Proyek 4 Proyek 5 Proyek 6 Proyek 7 Proyek 8 Proyek 9 Proyek 10 Proyek 11 Proyek 12 Proyek 13 Proyek 14 Proyek 15 Proyek 16

2. Menghitung nilai R square, dengan Microsoft excel didapat hasil berikut : SUMMARY OUTPUT Regression Statistics Multiple R R Square Adjusted R Square Standard Error Observations 0.571087253 2.080384023 16 0.77439101 0.599681436

3. Berdasarkan tabel diatas maka dapat dihitung VIF-nya :

VIF

1 1 2.49 2 1 R1 1 0.599

15

TUGAS SBD 2010Nilai VIF tersebut berada dibawah 10 yang berarti tidak ada hubungan antara independent variabel (Duration & No.of modules).

Dari ketiga test diatas maka dapat kita simpulkan bahwa pada persamaan : Proyek Size = -73.04 + 26.99 Duration (Month) + 38.86 No of Modules independent variabelnya memiliki pengaruh yang cukup kuat ke dependent variable dan tidak saling berhubungan satu sama lain.

Selanjutnya kita menghitung nilai dari Multiple standard error dan koefisien dari multiple determination untuk mengetahui bagaimana tingkat kecocokan persamaan tersebut dengan data.

Perhitungan Multiple Standard Error

SY ,12 MSE 3291.64 51.94

Dari hasil perhitungan ini kita ingin mengetahui apakah nilai residual terdistribusi secara normal atau tidak. Berdasarkan teori, sekitar 68% nilai residual akan berada di 51.94 sedangkan sekitar sebanyak 95% nilai residual akan berada di 2(51.94) 103.88 . Berikut hasil perhitungannya : Nilai Proyek (Juta Rupia) (Y) 140.0 2.0 2.0 264.0 122.0 250.0 12.5 13.5 625.0 55.0 420.0 195.0 588.0 504.0 388.0 500.0 Durasi (Bulan) 5.00 0.25 0.25 6.00 3.00 6.00 1.25 1.25 7.00 3.00 8.00 8.00 9.50 8.00 6.00 9.00 Jumlah Modul 2.5 1.0 1.0 5.0 2.0 6.0 1.0 1.5 13.0 3.0 5.0 3.5 8.0 8.0 8.0 10.0 Nilai Proyek hitung (Yhitung) 159.06 -27.4325 -27.4325 283.2 85.65 322.06 -0.4425 18.9875 621.07 124.51 337.18 278.89 494.245 453.76 399.78 558.47

Nama Proyek Proyek 1 Proyek 2 Proyek 3 Proyek 4 Proyek 5 Proyek 6 Proyek 7 Proyek 8 Proyek 9 Proyek 10 Proyek 11 Proyek 12 Proyek 13 Proyek 14 Proyek 15 Proyek 16

Y Yhitung-19.06 29.4325 29.4325 -19.2 36.35 -72.06 12.9425 -5.4875 3.93 -69.51 82.82 -83.89 93.755 50.24 -11.78 -58.47

16

TUGAS SBD 2010Berdasarkan table diatas bisa kita lihat bahwa ada 10 data residual atau sekitar 62.5% yang berada di

51.94 (Proyek1, 2, 3, 4, 5, 7, 8, 9, 14, dan 15), berarti hal ini sudah mendekati teori. Berdasarkandata diatas pula bahwa semua data atau 100% berada di 103.88 , hal ini juga sudah mendekati teori. Jadi dapat kita simpulkan bahwa nilai residual terdistribusi secara normal.

Koefisen multiple determination

R2

SSR 691704.07 0.9417 SStotal 734495.44

Maksud dari nilai diatas adalah bahwa independent variable (durasi proyek dan jumlah modul) 94.17% bertanggung jawab terhadap variasi nilai proyek. Sedangkan sebanyak 5.83% variasi nilai proyek dipengaruhi oleh faktor-faktor lainnya.

17

TUGAS SBD 2010Bab IV Kesimpulan

Dari hasil pengujian statistik yang telah dilakukan pada data yang ada, maka dapat disimpulkan beberapa hal sebagai berikut : Nilai Proyek dipengaruhi oleh dua variable yaitu durasi proyek dan jumlah module Variabel lokasi proyek dan jumlah konsultan tidak terlalu berpengaruh terhadap nilai proyek Hubungan antara nilai proyek dengan durasi proyek dan jumlah modul dapat digambarkan dengan persamaan berikut : Proyek Size = -73.04 + 26.99 Duration (Month) + 38.86 No of Modules Durasi proyek dan jumlah modul 94.17% bertanggung jawab terhadap variasi nilai proyek. Sebanyak 5.83% variasi nilai proyek dipengaruhi oleh faktor-faktor selain durasi proyek dan jumlah modul.

18