pendeteksian pengamatan yang berpengaruh pad a …

8
SEMINAR NASIONAL II SDM TEKNOLOGI NUKLIR YOGY AKARTA, 21-22 DESEMBER 2006 ISSN 1978-0176 PENDETEKSIAN PENGAMATAN YANG BERPENGARUH PAD A REGRESI LINEAR KARIYAM, NANANG TAUFIKURRAHMAN Jurusan Statistika FMIPA-U/L Kampus Terpadu V/L Jl. Kaliurang KM 14, Yogyakarta E-mail: [email protected] Abstrak PENDETEKSIAN PENGAMATAN YANG BERPENGARUH PADA REGRESI LINIER. Metode pengukuran barn berdasarkan elipsoid konfidensi dikembangkan untuk menentukan kontribusi tiap-tiap data observasi terhadap penentuan penduga kuadrat terkecil model regresi linear. Pengukuran ini menggabungkan informasi dari studentized residuals, variansi residual dan nilai pendugaan. Kata Kunci : kontribusi data, elipsoid konfidensi, studentized residuals, variansi residual, Abstract INFLUENTIAL OBSERVATIONS THAT INFLUECE TO REGRESION LINEAR. A new measure based on confidence ellipsoids is developed for judging the contribution of each data point to the determination of the least squares estimate of the parameter vector in fUll rank linear regression models. It is shown that the measure combines information from the studentized residuals and the variances of the residuals and predicted values. Key Words : Influential Observations, Confidence Ellipsoids, studentized residuals, variances of the residuals, PENDAHULUAN Mungkin sudah menjadi Opllll masyarakat bahwa rekapitulasi statistik (seperti R2 dan p) yang muncul dari analisis data yang berdasar pada matriks model regresi linear bisa memberikan gambaran yang salah dan keliru. Kekeliruan ini memunculkan saran untuk menggunakan sejumlah prosedur yang bisa memisahkan data yang tidak wajar, yaitu plot of residual (Ri) dan pengujian standardized residuals ialah dua metode yang mungkin paling sering digunakan. Dalam hal ini, disarankan menggunakan studentized residuals, ti (sisaan yang dibagi oleh standar error) karena lebih tepat daripada standardized residuals (sisaan dibagi dengan akar kuadrat rata-rata kuadrat error) untuk mencari penyimpangan. Selain itu, perkiraan nilai kritis untuk hasil maksimum studentized residuaf.I] juga bisa diketahui. Estimasi variansi nilai yang diramalkan (atau estimasi variansi residual, V (Ri» berisi informasi yang terkait dengan yang terdapat pada sebagian hasil yang dilengkapi dengan plot residual atau studentized residuals. Dengan lebih mendalam, mereka menyatakan "sebuah variasi yang beraneka ragam pada (variansi residual) mencerminkan ketidakwajaran matriks X yaitu jarak hasil pengamatan yang tidak homogen dan akan menandakan kurangnya data". Telah dikembangkan kriteria desain yang bisa berfungsi dengan baik berdasarkan jumlah kuadrat variansi nilai yang di prediksi. Jika observasi kritis telah dicari menggunakan satu atau lebih metode Kariyam dkk 199 Sekolah Tinggi Teknologi Nuklir - BATAN

Upload: others

Post on 04-May-2022

7 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: PENDETEKSIAN PENGAMATAN YANG BERPENGARUH PAD A …

SEMINAR NASIONAL IISDM TEKNOLOGI NUKLIR

YOGY AKARTA, 21-22 DESEMBER 2006ISSN 1978-0176

PENDETEKSIAN PENGAMATAN YANG BERPENGARUHPAD A REGRESI LINEAR

KARIYAM, NANANG TAUFIKURRAHMAN

Jurusan Statistika FMIPA-U/LKampus Terpadu V/L Jl. Kaliurang KM 14, Yogyakarta

E-mail: [email protected]

Abstrak

PENDETEKSIAN PENGAMATAN YANG BERPENGARUH PADA REGRESI LINIER. Metode

pengukuran barn berdasarkan elipsoid konfidensi dikembangkan untuk menentukan kontribusi tiap-tiap dataobservasi terhadap penentuan penduga kuadrat terkecil model regresi linear. Pengukuran inimenggabungkan informasi dari studentized residuals, variansi residual dan nilai pendugaan.

Kata Kunci : kontribusi data, elipsoid konfidensi, studentized residuals, variansi residual,

Abstract

INFLUENTIAL OBSERVATIONS THAT INFLUECE TO REGRESION LINEAR. A new measure based

on confidence ellipsoids is developed for judging the contribution of each data point to the determination ofthe least squares estimate of the parameter vector in fUll rank linear regression models. It is shown that themeasure combines information from the studentized residuals and the variances of the residuals andpredicted values.

Key Words : Influential Observations, Confidence Ellipsoids, studentized residuals, variances of theresiduals,

PENDAHULUAN

Mungkin sudah menjadi Opllllmasyarakat bahwa rekapitulasi statistik (sepertiR2 dan p) yang muncul dari analisis data yangberdasar pada matriks model regresi linear bisamemberikan gambaran yang salah dan keliru.Kekeliruan ini memunculkan saran untuk

menggunakan sejumlah prosedur yang bisamemisahkan data yang tidak wajar, yaitu plot ofresidual (Ri) dan pengujian standardizedresiduals ialah dua metode yang mungkinpaling sering digunakan. Dalam hal ini,disarankan menggunakan studentized residuals,ti (sisaan yang dibagi oleh standar error) karenalebih tepat daripada standardized residuals(sisaan dibagi dengan akar kuadrat rata-ratakuadrat error) untuk mencari penyimpangan.

Selain itu, perkiraan nilai kritis untuk hasilmaksimum studentized residuaf.I] juga bisadiketahui.

Estimasi variansi nilai yang diramalkan(atau estimasi variansi residual, V (Ri» berisiinformasi yang terkait dengan yang terdapatpada sebagian hasil yang dilengkapi denganplot residual atau studentized residuals. Denganlebih mendalam, mereka menyatakan "sebuahvariasi yang beraneka ragam pada (variansiresidual) mencerminkan ketidakwajaranmatriks X yaitu jarak hasil pengamatan yangtidak homogen dan akan menandakankurangnya data". Telah dikembangkan kriteriadesain yang bisa berfungsi dengan baikberdasarkan jumlah kuadrat variansi nilai yangdi prediksi. Jika observasi kritis telah dicarimenggunakan satu atau lebih metode

Kariyam dkk 199 Sekolah Tinggi Teknologi Nuklir - BATAN

Page 2: PENDETEKSIAN PENGAMATAN YANG BERPENGARUH PAD A …

pengukuran di atas, langkah selanjutnya yaitumelakukan pengujian dengan menghapussebagian observasi. Tetapi permasalahanmengenai data mana yang akan dihilangkanbisa menyebabkan proses ini semakin sulit,khususnya dengan jumlah data yang besarkarena setiap data memiliki dua ukuran yangberhubungan (ti, V (Ri)) yang harus dihitungbersama-sama. 1tulah yang menjadi tujuanpenulisan ini, yaitu memberikan pengukuranyang mudah di pahami yang menggabungkaninformasi dari ti, dan V (Ri), untuk memeriksaapakah pembuangan satu atau dua amatan kritismengubah seeara berarti persamaan regresinyaserta kesimpulan-kesimpulanya.

Berdasarkan latar belakang diatas makadapat ditulis rumusan masalah yang diangkatdalam tulisan ini adalah bagaimanakahkontribusi (pengaruh) tiap-tiap data observasiterhadap penentuan penduga kuadrat terkeeildalam model regresi linear.

Tujuan dari penelitian ini adalah untukmenentukan kontribusi (pengaruh) tiap-tiapdata observasi terhadap penentuan pendugakuadrat terkeeil model regresi linear denganmenggunakan pengukuran yangmenggabungkan informasi dari ti, dan V (Ri)dalam bentuk teori dan aplikasi seearakomputasi.

KAJIAN TEOR!

Pendeteksian Amatan yang Berpengaruh

Kenyataan bahwa suatu amatanmerupakan pencilan jelas tidak baik, namun itutidak berarti bahwa amatan itu berpengaruhbesar dalam pendugaan koefisien regresi.Misalnya dapat dilihat bahwa terdapat satuamatan yang merupakan peneilan. Kenyataanbahwa pengamatan ini menyendiri terpisah,menimbulkan pikiran bahwa hal itu akanberpengaruh besar pada posisi garis regresi disekitar titik tersebut. Amatan ini mungkin sajamempunyai sisaan yang besar, namun mungkinpula tidak, bergantung pada model yangdigunakan dan data lainnya. Dalam situasi yangpendugaan terhadap parametemya sangatbergantung pada sejumlah keeil amatan,kesulitan mungkin saja timbul. Salah satu earamengatasi masalah ini adalah denganmemeriksa apakah pembuangan satu atau dua

SEMINAR NASIONAL IISDM TEKNOLOGI NUKLIR

YOGYAKARTA, 21-22 DES EMBER 2006ISSN 1978-0176

pengamatan kritis mengubah seeara berartipersamaan regresinya serta kesimpulan­kesimpulannya. Bi1a demikian halnya, makakesimpulan-kesimpulan itu berarti tidak kokoholeh karena itu lebih banyak data yangdiperlukan.

Pengembangan Rumus

Perhatikan persamaan berikut iniy = X~ + ey ialah perkalian n x 1 yang

menunjukkan informasi, X ialah perkalian n x pmelambangkan matriks dan konstanta yangdiketahui, ~ ialah perkalian n x 1melambangkan variabel bebas dan e perkalian nx 1 melambangkan ditribusi error seeara aeaksehingga E(e) = 0 dan V(e) = 10-2.Perlu diingatbahwa nilai kuadrat terkeeil untuk ~ [2,3] ialah :

pY= (X'Xr1X'YMaka rumus yang sesuai ialah

R = (Ri) = Y- Y = Y - Xp = (I - X(X'Xr1X')YMatriks kovariansi Y dan R ialah

V (Y) = X(X'Xr1 X' if (1)dan

V (R) = (I - X(X'XrIX') if (2)Maka teori (1 - a) x 100% kurva normal

untuk variabe1 yang diketahui, ~, didapatdengan menggantikan ~* yang memenuhiPersamaan [2,3]

~* -J3),x'x(~* -P) ::; F (p, n - p, 1- a) (3)2

ps

s2 = R'R!(n - p) dan F (p, n - p, 1- a)merupakan I - a peluang data berdistribusi Fdengan p dan n - p adalah derajat bebas.

Untuk menentukan tingkat pengaruhpada data ke-i pada perkiraan p, langkah

pertama yang dilakukan ialah denganmenghitung kuadrat terkeeil ~ dengan data yang

dihapus. Jadi, p - p (-i) meneari ni1ai kuadratterkeeil dari ~ dengan data ke-i yang dihapus.

Sungguh suatu jarak antara ~ (-i) dan p yangmudah di tebak. Jadi, nilai eiri kritis darimasing-masing data dirumuskan menjadi

D. '" (~(-i) -~)'x'X(~(_i)-~) i= 1,2, ...n (4)1- pS2

Dalam hal ini X berukuran n x p, p

adalah penduga kuadrat terkeeil biasa, dan p n)adalah penduga kuadrat terkeeil setelah titikdata ke-i dikeluarkan. Selanjutnya Didibandingkan dengan F (p, n - p, 1- a) untuk a

Sekolah Tinggi Teknologi Nuklir - BATAN 200 Kariyam dkk

Page 3: PENDETEKSIAN PENGAMATAN YANG BERPENGARUH PAD A …

(7)

SEMINAR NASldNAL IISDM TEKNOLOGI NUKLIRYOGY AKARTA, 21-22 DESEMBER 2006ISSN 1978-0176

yang ditentukan; Di yang besar menandakanbahwa amatan ke-i berpengaruh. Persamaan inimemberi jarak antara ~(-i) dan ~ dalamdeskriptif tingkat signifikansi. Umpamanya,kita anggap bahwa Di := F(p, n - p, 0.5),kemudian pengurangan data ke-i mengubahestimasi kuadrat terkecil ke daerah kepercayaansebesar 50% untuk ~ berdasarkan pada ~. Halsemacam inilah yang mungkin penyebab untukdiperhatikan. Untuk analisis yang tidak rumit

tiap-tiap ~ (-i) dibiarkan tetap dalam daerahkepercayaan 10%.

Pada permukaannya, nampak kekuatansifat kesukaan pengukuran ini akan dialihkanoleh perhitungan untuk menentukan regresi n +1. Tetapi, mudah dipahami mengungkapkanbahwa:

~-~(-i) = (X'(_i)X(_i)f1XJYi -xj] (5)

X(_i) bisa diperoleh nilainya dengan

mengurangi baris ke-i, Xi' didapat dari X dan

Yi merupakan hasil pengamatan ke-i. dan juga,

Vi = Xi'(X'X)-IX; dan menganggap Vi < 1, dan

X(_i) memiliki pangkat tertinggi p,

(X'(_i)X(_i»-l = (X'X)-I + (X'X)-IXjXi '(X' X)-I /(1- Vi)'

kemudian

(X'XfIXi = (X' . X . )-IX' (6)(-1) (-1) 1I-Vi

Subtitusi Persamaan (6) ke dalamPersamaan (5) menghasilkan

R_R _ (X'Xr1Xi [Y _ fR]I' f'(-i) - i Xi I'I-ViMaka

[ "]2

D.= Yi-xi'~ ~1 s.Jl-Vi p(l-v;)

Perlu diperhatikan bahwa nilai Dibergantung pada faktor yang terkait dengandata secara keseluruhan yaitu jumlah parameter,p, dan studentized residual ke-i,

[y -x'~]t. = I 1

I s.JI- Vi

Perbandingan nilai variansi prediksi ke-i,

V(yJ=xi'(X'X)-lxicr2 (lihat Persamaan (1»,dengan variansi residual ke-i,

V(RJ = cr2 (1- vJ (lihat Persamaan (2». Maka

Di bisa dituliskan secara sederhana sebagaiberikut :

2 "

D. = ti V(Yi) (8)I pV(RJ

Secara jelas, 1:;2 adalah suatu rumus(ukuran) menyangkut derajat dimana observasititik ke-i dapat di anggap sebagai outlier darimodel yang di asumsikan.

Kemudian, secara mudah dapatdidemontrasikan bahwa jika kehadiran yangmungkin dari sebuah outlier dapat dimodelkandengan menambah sebuah parameter vektor 8'= (0.0, ... ,0.8.0 ... 0) ( baik 8 dan posisinyadiantara 8' tidak di ketahui ) dari model,kemudian nilai maksimum t? adalah fungsimonotonik dari teori normal di antara tes rasio

dari hipotesa bahwa 8 = O.Perbandingan vcY.)/V(R.) mengukurI I

relative sensitivity dari estimasi, ~, ke nilaipotensial outlying pada tiap poin data. Ada jugafungsi-fungsi monotonik dari Vi yangmerupakan jumlah yang digunakan untukmengembangkan criteria desai robust mereka(misalnya, insensitive pada outlier). Sebuahnilai besar dari perbandingan menunjukkanbahwa nilai yang dimaksud mempunyaiperanan penting dalam determinasi ~. Duarumus kombinasi dalam Persamaan (8) yangdigunakan untuk menghasilkan sebuahpengukuran pengaruh secara menyeluruhterhadap semua point mempunyai nilai kuadratterkecil.

Kehati-hatian ketika menggunakan

persamaan Di dari hasil ~(-i) pada dasarnya

tidak jelas pada kasus yang menonjol, yaituketika menggunakan V(R.) = 0 semisal ketikaI

X(_i) bernilai lebih kecil daripada p.

Dalam setiap analisis, data tambahan bisa

bertambah dengan menguji ti dan vcY.)/v(R.)I Isecara terpisah. Hasil yang terdiri dari tigakolom 1:;, vcY.)/v(R.) dan Di nampaknyaI Imenjadi pilihan yang diinginkan dalam programmultiple regression.

Perluasan

Dengan mudah dilihat bahwa Dimerupakan invariant di bawah perubahan skala.Jika skala masing-masing variabel dipikirkanuntuk menjadi suatu pertimbangan penting itumungkin lebih diinginkan untuk menghitung

Kariyam dkk 201 Sekolah Tinggi Teknologi Nuklir - BATAN

Page 4: PENDETEKSIAN PENGAMATAN YANG BERPENGARUH PAD A …

(9)

akar panjang dari (P(-i) - P). ltu mudah

ditunjukkan bahwa

(~(_j)- ~)'(~(_j) - ~) _ ti2Xj'(X'Xr2xj

pS2 - p(1- Vi)

Rumus yang tertera telah di kembangkandalam perkiraan yang lengkap bahwa ~ adalahparameter yang menarik. Hal tersebut tidakselalu menjadi persoalan.

Jika yang menarik adalah q, kombinasi­kombinasi yang berhubungan secara bebas darielemen-elemen ~, bisa lebih mudah untukmenghitung keterkaitan masing-masing poindata yang dimiliki dalam menentukan kuadratterkecil dari kombinasi-kombinasi seperti ini.Misal A menunjukkan sebuah q x p pangkat qmatriks dan misal 'I'=A~ menunjukkankombinasi-kombinasi yang menarik. Ukuransecara umum dari poin ke-i dapat di definisikansebagai berikut :

Dj(A) = (o/H) -0/)'B-1(0/(_j) -0/)qs2

Dengan

B = A(X'Xr1 A' dan o/(-i) = A~(_i)

Karena

\jI- \jI(-i) = A(P - P(-i»

Menunjukkan bahwat2x. '(X'xr1 A'B-1A(X'Xr'x.

D.(A)= 1 1 11 q(1-vJ

Untuk menjabarkan tingkatan deskriptifdari nilai signifikansi dalam ukuran secaraumum, seharusnya, dapat dibandingkan denganprobabilitas dari distribusi F dengan q dan n - padalah derajat bebas.

Jika q = 1, dan A diubah menjadi 1 x pvektor z', memberikan nilai pasti maka dariPersamaan (9) secara mudah ditunjukkan padaPersamaan (10).

Dj(z')=pDjp2(Xj'~'z'~) (10)

Di = Di (I) dan p.(oo,oo)menunjukkanhubungan koefisien. Jika z' merupakan nilaivariabel bebas dan D/ menentukan jarak antara

SEMINAR NASIONAL IISDM TEKNOLOGI NUKLIR

YOGYAKARTA, 21-22 DESEMBER 2006ISSN 1978-0176

nilai rata-rata Y pada z dengan menggunakan

data ke-i (z'~) dan nilai pada z tampa data ke-i

(z'~(_i))' Perhatikan juga bahwa ketika z' di

ubah menjadi ke dalam bentuk (0, ... ,1,0, ... ,0),

Di(z') menentukan besamya jarak antara ~ dan

~(-i).Nilai maksimum Di(z') untuk nilai i yang

konstan bisa di peroleh dengan menganggapz'=x.' 1 ,

Di(z')::; Dj (Xi') = pDj

Untuk semua nilai z yang ada. Jadi ketikanilai prediksi rata-rata ~ merupakan parametermenarik, Persamaan(10) tidak perlu di gunakan.Jika Dj (Xi ') menunjukkan perbedaan yang

boleh di abaikan antara xi~ dan Xi'~(-i) maka

perbedaan antara z'~ dan Z'~(_i) juga bisadiabaikan untuk semua nilai z. [I]

ANALISIS DAN PEMBAHASAN

Data untuk contoh ini sebelumnyadipublikasikan oleh Hald (Draper and Smith1966, halaman 165). Data ini mempunyai 4variabel independen (XI, X2, X3, dan Xt yaitupengukuran persentase berat kerak besi daripembuatan semen) dan 13 titik observasiooDaftar Tabel 2 terdiri dari R/s,ti,V0'JN(RJdan Di. Berikut datanya [2]:

XI = tricalcium aluminate, 3CaO-A1203

X2 = tricalcium silicate, 3 CaO- Si02

X3 = tetracalcium alumino ferrite, 4CaO - A1203 - Fe203

Xt = dicalcium silicate, 2 CaO - Si02

Xs = Y (Response)Y = Peningkatan panas dalam kalori per

gram dari semen

Sekolah Tinggi Teknologi Nuklir- BATAN 202 Kariyam dkk

Page 5: PENDETEKSIAN PENGAMATAN YANG BERPENGARUH PAD A …

SEMINAR NASIONAL IISDM TEKNOLOGI NUKLIRYOGYAKARTA, 21-22 DESEMBER 2006ISSN 1978-0176

Tabell. Data Percobaan RaIdObservasi

X1X2X3X4X5=Y

172666078.5

2129155274.3

31156820104.3

4113184787.6

575263395.9

61155922109.2

7371176102.7

8131224472.5

9254182293.1

102147426115.9

11140233483.8

121166912113.3

131068812109.4

Se1anjutnya untuk mendeteksi pengamatanyang berpengaruh da1am regresi 1iniersederhana, maka terlebih dahu1u dibuatkanprogram dengan menggunakan softwareMINITAB, dengan a1ur seperti pada Gambar1.[4]. Program dibuat da1am dua bagian, yaitu

program utama dan anak program, dan rincianprogram se1engkapnya dapat dilihat pada1ampiran.Dengan menggunakan program yangte1ah dibuat, maka dari data pada Tabel.,memberikan ringkasan hasi1 Tabe1 2.

M.mb.ntuk ""trib IiP = (X'Xr'X'Y

:&Ie"ghihmg nilai l{V'S

Ri=Y-XP

" = R'R'v' -pI} ~.m

t'tama

!vlffi;..£;hituag nihi Vj

V, = X/(X,X)-1Xj'~i =_'ttt. x';',, ••. ~Xj;

Xi : mlai vaIi.roel mdspmden kej ob5ernsik1! -i••J.16JJghittmg nilat 1,;

_[~-d]!f- ~F'"

Menghirlmg mini VrTiV Hili![/(1:) = vr.r~r(R.I)_~~(1_1~)•••.Venghirw-Jg Hilar DiD _ti'v(i;)• pV(R,}

Sub-Progrnm

Gambar 1. Flow chart Pembuatan Program Pendeteksian Amatan yang Berpengaruh Dalam Regresi Linier

Kariyam dkk 203 Sekolah Tinggi Teknologi Nuklir - BATAN

Page 6: PENDETEKSIAN PENGAMATAN YANG BERPENGARUH PAD A …

SEMINAR NASIONAL IISDM TEKNOLOGI NUKLIRYOGYAKARTA, 21-22 DESEMBER 2006ISSN 1978-0176

Tabel 2. Hasil Percobaan HaldObservasi

Ri/SItilV(Yi)V(Ri)V(Yi)N(Ri)Di

1

0.0020.0033.292.691.220.00

2

0.620.761.993.990.500.06

3

-0.681.053.452.531.360.30

4

-0.710.841.774.220.420.06

5

0.100.132.143.840.560.00

6

1.601.710.745.240.140.08

7

-0.590.742.203.790.580.06

8

-1.301.692.443.540.690.39

9

0.560.671.764.220.420.04

10

0.120.214.191.792.340.02

11

0.811.072.553.440.740.17

12

0.400.461.574.410.360.02

13

-0.941.121.824.170.440.11

of InfluentialRegression",

ABI/INFORM

Berdasarkan Tabel 2. diatas dapat dilihatbahwa dari 13 jumlah observasi, observasi ke-8memiliki nilai Dj yang besar yaitu sebesar 0.39.berdasarkan teon diatas, Di yang besarmenandakan bahwa amatan ke-i berpengaruhdalam pendugaan koefisien regresi, tetapipenge1uaran pengamatan ini hanya hanyamengubah estimasi kuadrat terkecil p ke daerahkepercayaan sebesar 10%. Ini didapat denganmembandingkan nilai Dj :::; F(5, 8, 0.1) =2.726447.

Observasi yang memi1iki ni1aistudentized residual (ti) terbesar adalahobservasi ke-6 sebesar 1.71. namun, efek titik

ini pada p re1atif tidak penting dibandingkanefek pada observasi ke-8. Dari observasi ke-8,diperoleh nilai ti sebesar 1.69 yang menandakanbahwa observasi data ke-8 dapat dianggapsebagai outlier (penyimpangan) dan modelyang diasumsikan. Tabel 2. juga menunjukkannilai perbandingan V(Yi)N(Ri). Observasiyang menunjukkan nilai perbandinganV(Yi)N(Ri) terbesar adalah observasi ke-10sebesar 2.34 namun, efek titik ini pada p re1atif

tidak penting dibandingkan efek pada observasike-8.

Dan observasi ke-8 diperoleh nilaiV(Yi)N(Ri) sebesar 0.69. ni1ai ini merupakannilai yang mengukur relatif sensitivity danperkiraan p , ke nilai kemungkinan

penyimpangan tiap data. Jadi dapatdisimpulakan bahwa identifikasi titik dengannilai Itil maksima1 dan V(Yi)N(Ri) (atau ni1aivi maksima1) tidak jauh dan observasi ke-8.

KESIMPULAN

Berdasarkan pembahasan diatas makadapat diambil kesimpulan

Identifikasi titik atau observasi yangberpengaruh dapat dideteksi dengan baik darini1ai Di, yang diturunkan dan nilai Itil danV(Yi)N(Ri)

Observasi (pengamatan) yangberpengaruh da1am pendugaan koefisien regresiuntuk contoh data Hald ada1ah pengamatan ke­8 karena mempunyai nilai Di (0.39) yang palingtinggi dibandingkan dengan 12 pengamatan1ainnya.

DAFTARPUSTAKA

1. ANTON, H., 1994, Elementary Linear Algebra7tl1 ed, John Wiley and Sons, New York

2. COOK, R.D.,2000, "DetectionObservations in LinearTechnometrics, 42, 1, 65,Global.

3. DRAPER, N.R., and Smith, H. 1966, AppliedRegression Analysis, New York: Wiley.

4. KARIY AM. 2004. Modul Praktikum Analisis

Multivariat. Yogyakarta: Fakultas MIP AUniversitas Islam Indonesia.

TANYAJAWAB

Pertanyaan :

1. Software apa yang dipakai ? (Wijiyono)

Sekolah Tinggi Teknologi Nuklir - BATAN 204 Kariyam dkk

Page 7: PENDETEKSIAN PENGAMATAN YANG BERPENGARUH PAD A …

SEMINAR NASIONAL IISDM TEKNOLOGI NUKLIRYOGY AKARTA, 21-22 DESEMBER 2006ISSN 1978-0176

2. Apakah dalam regresi linear terlalu berbedarumusnya ? (Bangun Wasito)

Jawaban :

1. Program MiniLab2. Sarna, yang berbeda modelnya

LAMPlRAN

#-m10:nilai_R transpose#-m11:hasil kali m10&m9

transpose matriks_x-->x'hasil Cx'~x)hasil CX'~X)-l-->invershasil CX'~X)-l~X'nilai beta

#- m3#- m4#- m5#- m6#- m7

BETA'#-mS:hasil X~Beta#-m9:nilai_Ri

p=

x

#-harga n

#-variabel ¥#-m1 :matrlks_y

#-m2 :matri ks_x

#-k5 :harga l/Cn-p)#-m12:nilai variansi_SA2

#-c90:nilai pemindahan nilai

#-c91:nilai standar deviasi 5#-c92:nilai pemindahan matr1ks Ri#-c93:nilai Ri/s

#-pem ndahan x' ke kolom#-m13 matrix y'#-pem ndahan y' kekolom

etet

NAMEcount c2

NAME k2=' Besar sampel : n=let k30= 1set ck30k 2 (1)endlet k3 ~ k1+2

copy ck3 m1NAME m1 ='matrix y'copy ck30-ck31 m2NAME m2 ='matrix x'trans m2 m3

multy m3 m2 m4invert m4 m5

multy m5 m3 m6multy m6 m1 m7NAME m7 ='nilai koefisien regresi,multy m2 m7 mSsubtr mS m1 m9NAME m9 ='Ni 1aiR i 'trans m9 m10multy m10 m9 m11NAME m11 ='nilai RiCT)~Ri'let k5 = 1/Ck2-k31)multy m11 k5 m12NAME m12 ='nilai variansi'

cop¥ m12 c90varlansi-->nilaisA2let c91 = SQRTCc90)copy m9 c92let c93 = c92/c91NAME c93 ='Nilai Ri/s'copy m3 c101-cl13trans m1 m13

copy m13 c201-c2131et k10 = 01et kn ~ 1001et k12 = 200let k13 = 3001et k14 = 400let k16 ~ 500let k17 = 600let k1S = 700let k20 = k13+1let k21 = k13+k21et k22 = k16+1let k23 = k16+k2let k24 = k17+1let k25 = k17+k21et k26 = k1S+1let k27 = k1S+k2

exec 'D:\coba_TA\anak program_2.txt' k2

Kariyam dkk 205 Sekolah Tinggi Teknologi Nuklir - BATAN

Page 8: PENDETEKSIAN PENGAMATAN YANG BERPENGARUH PAD A …

SEMINAR NASIONAL IISDM TEKNOLOGI NUKLIR

YOGYAKARTA, 21-22 DESEMBER 2006ISSN 1978-0176

#ck~8:hasil Di

#ck~4:hasil(yi-(xi'''Beea))-->beneuk

#mZ4 :maerix Yi#mZ5:hasil(xi'''Beea)#mZ6:hasil(yi-(xi'''Beea))

#ck~6: asi ei#c~OO~ has 1 v(yi)#c~OOZ has 1 veRi)#c~003 has 1 v(Yi)/V(Ri)

matrix xi, i=1,2,a .. ,nmatrix xi'xi'''(x'''x)-~nilai vi:nilai vi-->beneuk kolom

#mzo#mz~#mzz#mZ3#ck~

~'et'k~O--;;'-k~O+~ee k~~ ~ k~~+~1ee k~3 = k~3+~copy ck~~ mZOerans mZO mZ~muley mZ~ m5 mZZmuley mZZ mZO mZ3copy mZ3 ck~31ee k~Z ~ k~Z+~

copy ck~Z mZ4muley mZ~ m7 mZ5suber mZ5 mZ4 mZ61ee k~4 = k~4+~

copy mZ6 ck~4kolomNAME ck~4 ~'hasi1 :Yi-(xi(T)"BETA)~'lee k~5 = (c9~"(SQRT(~-ck~3))) #k~5:hasil(s"SQRT(~-vi))lee c~OOO ~ ck~4/k~5 #c~OOO:nilai ei1ee k~6 = k~6+~copy c~OOO ck~6lee c~OO~ ~ ck~3"c90lee c~OOZ = c90"(~-ck~3)lee c~003 ~ c~OO~/c~OOZlee k~7 ~ k~7+~copy c~003 ck~7lee c~004 = ((c~OOO""Z)"c~003)/k3~1ee k~8 = k~8+~copy c~004 ck~8seack ckZO-ckZ~ cZ99see cZ98~: kzendNAME cZ98 ='observasi'NAME cZ99 ='Nilai vi'seack ckZZ-ckZ3 c499NAME c499 ='Nilai leiI ,seack ckZ4-ckZ5 c599NAME c599 ~'Nilai V(Yi)/V(Ri),seack ckZ6-ckZ7 c699

NOTE ===========================================================NOTE PENENTUAN PENGAMATAN YANG BERPENGARUH

NOTE DALAM REGRESI LINEARNOTE ===========================================================NOTE

print k2 k1

print m11-m12NOTE ================================================

NOTE Menghitung nilai penduga Kuadrat Terkecil, BETA.NOTE ================================================

NOTE

print m2 m1 m7NOTENOTE ===========================

NOTE Menghitung nilai RijsNOTE ===========================NOTE

print m9 c91 c93NOTENOTE============================

NOTE Menghitung Nilai viNOTE============================

NOTE

print c298-c299NOTE

NOTE================================================

NOTE TABEL PENDETEKSIAN PENGAMATAN YANG BERPENGARUHNOTE PADA REGRESI LINEARNOTE================================================

NOTE

print c298 c10 c499 c599 c699end

Gambar 2. Program Utama Untuk Mendeteksi PengamatanYang Berpengaruh Dalam Regresi Linie

Sekolah Tinggi Teknologi Nuklir - BATAN 206 Kariyam dkk