tugas kelompok1.docx

11
TUGAS KELOMPOK ANALISIS REGRESI DAN KORELASI “Membangun Model Regresi II: Diagnosa” Disusun Oleh: Kelompok 1 Sinta Purnama Sari (F1A009079) Reti Engga Sari (F1A011001) Bella Haryati (F1A011002) Degi Suanto (F1A011035) Fajria Mustika Ayu W (F1A012006) Dosen Pengampuh:Fachri Faisal, S.Si, M.Si Diah Setyo Rini, S.Si, M.Sc LABORATORIUM MATEMATIKA

Upload: wina-ayu-lestari

Post on 18-Dec-2015

214 views

Category:

Documents


0 download

TRANSCRIPT

TUGAS KELOMPOKANALISIS REGRESI DAN KORELASIMembangun Model Regresi II: Diagnosa

Disusun Oleh:Kelompok 1

Sinta Purnama Sari(F1A009079)Reti Engga Sari(F1A011001)Bella Haryati(F1A011002)Degi Suanto(F1A011035)Fajria Mustika Ayu W(F1A012006)

Dosen Pengampuh:Fachri Faisal, S.Si, M.SiDiah Setyo Rini, S.Si, M.Sc

LABORATORIUM MATEMATIKAFAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAMUNIVERSITAS BENGKULU201410.2 Mengidentifikasi pengamatan Y terpencil-Studentized Deleted ResidualKasus PencilanMengidentifikasi pengamatan Y terpencil-Studentized Deleted Residual. Bila hanya ada 1 prediktor variable, mengidentifikasi outlier tidak terlalu sulit. Titik terpencil sehubungan dengan nilai Y-nya. Tidak mungkin sangat berpengaruh terhadap model regresi fit karena ada nilai X yang sama.Titik terpencil sehubungan dengan X dan Y nilai. Tidak mungkin sangat berpengaruh terhadap model regresi fit karena nilai Y konsisten dengan yang lain. Titik terpencil sehubungan dengan nilai X-nya. Mungkin berpengaruh karena nilai X terpencil dan tidak konsisten terhadap nilai-nilai X lainnya.

Dalam regresi berganda, kita umumnya tidak dapat melihat plot seperti yang ditunjukkan di atas (terlalu banyak dimensi). Oleh karena itu, kita perlu memeriksa langkah-langkah numerik yang memberikan informasi tentang pengamatan tertentu yang terpencil atau tidak.

Residual dan Semistudentized ResidualsMendeteksi pencilan atau ekstrim observasi berdasarkan pengujian dari residual

atau semistudentized residuals

Hat MatrixDefinisi hat Matrix

Nilai fitted dapat dituliskan sebagai kombinasi dari observasi melalui hat matrix

Residual juga dapat diekspresikan sebagai kombinasi linier dari observasi dengan hat matrix:

Matriks Varian-kovarian dari residuals melibatkan hat matrix

sehingga varian dari residual dinotasikan oleh , adalah:

dimana adalah elemen ke-i pada diagonal dari hat matrix, dan kovarian antara residual dan adalah:

dimana adalah elemen baris ke-i dan kolom ke-j dari hat matrix,Varian dan kovarian ini diperkirakandengan menggunakan sebagai estimator dari varian eror

Contoh :Sebuah data himpunan yang didasarkan pada kasus untuk pengujian hubungan regresi antara variable respon dan dua variabel prediktor dan ditunjukkan pada tabel 10.2, kolom 1-3. Model fitted first order dan error nilai tengah :

nilai fitted dan residu untuk 4 kasus ditunjukkan pada kolom 4 dan 5 dari tabel 10.2a.hat matriks untuk data ini ditunjukkan pada tabel 10.2b. hal tersebut dapat diperoleh dari makna (10.10) untuk matriks :

Catatan dari (10.10) bahwa hat matriks adalah semata-mata fungsi dari variabel prediktor (s). Juga catatan dari tabel (10.2b) bahwa hat matriks adalah simetrik. Elemen diagonal dari hat matriks diulang pada kolom 6 dari tabel 10.2a.Kita ilustrasikan bahwa nilai fitted adalah kombinasi linier dari nilai oleh perhitungan dari makna (10.11). :

Hal ini adalah hasil yang sama, kecuali untuk effek pembulatan yang mungkin, seperti dari fungsi fitted regresi (10.17) :

Hal ini adalah hasil yang sama, kecuali untuk effek pembulatan yang mungkin, seperti dari fungsi fitted regresi (10.17) :

Varian-covarian matriks yang diperkirakan dari residual, , ditunjukkan pada tabel 10.2c. hal tersebut diperoleh dengan menggunakan . varian yang diperkirakan dari residual ditunjukkan pada diagonal utama dai varian-kovarian matriks pada tabel 10.2c dan diulang pada kolom 7 dari tabel 10.2a, kita ilustrasikan dengan mengarahkan perhitungan untuk kasus 1 dengan menggunakan (10.16a):

Kita lihat dari tabel 10.2a, kolom 7, bahwa residual tidak mempunyai variabel yang konstan. Faktanya, varian yang sangat berbeda karena data himpunan adalah kecil. Seperti catatan pada bagian 10.3, residual untuk kasus-kasus tersebut adalah terpencil dengan variabel yang mempunyai varian terkecil.Catatan juga bahwa kovarian matriks pada tabel 10.2c adalah tidak nol, karenanya pasangan dari residual dihubungkan, positif dan negatif.

Residu StudentizedPenyempurnaan pertama dalam residu nlaking lebih efektif untuk mendeteksi pengamatan Y terpencilmelibatkan pengakuan fakta bahwa residual mungkin substansial berbeda varians . Oleh karena itu tepat untuk mempertimbangkan besarnya masing-masing relatif terhadap yang diperkirakan standar deviasi untuk memberikan pengakuan terhadap perbedaan dalam residual. Kita melihat dari (10.16a) bahwa estimator dari deviasi standar adalah:

Rasio dari { } disebut studentized sisa dan akan dilambangkan dengan ri :

Sementara residual akan memiliki variasi sampel secara substansial berbeda jika standar penyimpangan sangat berbeda, residual studentized memiliki varians yang konstan (ketika model yang tepat). Residual studentized sering disebut residual studentized internal.

Residu dihapusPenyempurnaan kedua untuk membuat residu lebih efektif untuk mendeteksi pengamatan Y terpencil adalah untuk mengukur sisa = ketika regresi dipasang didasarkan pada semuakasus kecuali i satu. Alasan untuk perbaikan ini adalah bahwa jika jauh terpencil, setidaknya fungsi regresi kuadrat yang dipasang berdasarkan semua kasus termasuk engan satu mungkin dipengaruhi untuk mendekati .Perbedaan antara nilai aktual yang diamati dan estimasi nilai yang diharapkan dan akan ditandai dengan ditunjukkan akan ada pada persamaan :

Studentized Dihapus ResidualMenggabungkan atas dua perbaikan , kami memanfaatkan untuk diagnosis terpencil atau ekstrimY pengamatan di sisa dihapus ( I0,21 ) dan studentize dengan membaginya dengan yangDiperkirakan standar deviasi yang diberikan oleh ( l0.22 ) . The studentized residual dihapus , dinotasikanoleh , karena itu(10.24)

Inimengikutidari( 10.21 ) dan ( I 0.22a ) yang ekspresialjabarsamauntukadalah :(10.24a)The studentizeddihapussisa ; di ( 10,24 ) disebut juga eksternal studentizedresidual ,berbedadengan studentized internal sisa dalam ( 10.20 ) . Kita tahudari (10,23 )bahwasetiapstudentizeddihapussisa ; mengikuti distribusi t dengan 11 - P - I derajatkebebasan ., namun , tidak independen .Untungnya , yang studentized residual dihapus , di ( l0.24 ) dapatdihitungtanpaharussesuaidenganfungsiregresibarusetiap kali kasus yang berbedadihilangkan . sederhanahubunganadaantaraMSE dan:(10.25)

Menggunakanhubunganini( l0.24a ) menghasilkanekspresisetaraberikutuntuk;(10.26)

Dengandemikian,studentized residual dihapus;dapatdihitungdari residual, kesalahanjumlahkuadrat SSE , dantopinilaimatriks h,Semuauntukregresidipasangdidasarkanpada11 kasus .TesuntukOutliers . Kami mengidentifikasiYobservationssebagaiterpencilkasus-kasus yang studentizedresidual dihapusbesardalamnilaiabsolut .Selainitu, kitadapatmelakukantesresmimelaluiprosedurujiBonferroniapakahkasustersebutdenganmutlakterbesarstudentized residual dihapusadalahoutlier .Karenakitatidaktahusebelumnyahalakanmemilikinilaiabsolutterbesaritu, Kami mempertimbangkankeluargatesuntukmemasukkan 11 tes ,satuuntuksetiapkasus . Jika model regresi yang sesuai ,sehinggatidakadakasusterpencilkarenaperubahandalam model , makasetiapstudentized residual dihapusakanmengikutidistribusi tdengan 11 - P - I derajatkebebasan .