korelasi & regresi
DESCRIPTION
Korelasi & Regresi. Oleh: Bambang Widjanarko Otok. Klasifikasi Pemodelan Regresi. Model Regresi: Satu variabel independent Regresi Linear Sederhana Lebih dari satu variabel independent Regresi Linear Berganda. Tujuan: - PowerPoint PPT PresentationTRANSCRIPT
Korelasi & Regresi
Oleh:Bambang Widjanarko Otok
Klasifikasi Pemodelan Regresi
© 1999 Prentice-Hall, Inc. Chap. 13 - 6
Simple Linear Regression Model
iii XY 10
Y intercept
Slope
• The Straight Line that Best Fit the Data
• Relationship Between Variables Is a Linear Function
Random Error
Dependent (Response) Variable
Independent (Explanatory) Variable
© 1999 Prentice-Hall, Inc. Chap. 13 - 1
i = Random Error
Y
X
Population Linear Regression Model
Observed Value
Observed Value
YX iX 0 1
Y Xi i i 0 1
Model Regresi: Satu variabel independent Regresi Linear Sederhana Lebih dari satu variabel independent Regresi Linear Berganda.
Tujuan:• mendapatkan pola hubungan secara
matematis antara variabel X dan Y• mengetahui besarnya perubahan variabel X
terhadap Y• memprediksi Y jika nilai X diketahui
Tahap-Tahap dalam Analisis Regresi
1. Plot data identifikasi bentuk hubungan secara grafik
2. Koefisien Korelasi identifikasi hubungan linear dengan suatu angka
3. Pendugaan (estimasi) model regresi4. Evaluasi (diagnostic check) kesesuain model regresi5. Prediksi (forecast) suatu nilai Y pada suatu X tertentu
n
ii
n
ii
n
iii
xy
yyxx
yyxxr
1
2
1
2
1
)()(
))(( , -1 rxy
1
Korelasi : . Hubungan antara dua variabel (misal X dengan Y)
Nilai Korelasi:• Bila r = 0, atau mendekati 0,
Berarti hubungan antara variabel independen dengan variabel dependen sangat lemah atau tidak terdapat hubungan sama sekali.
• Bila r = 1, atau mendekati 1, Berarti terdapat hubungan positif antara variabel independen dengan variabel dependen yang sangat kuat.
• Bila r = –1, atau mendekati – 1, Berarti terdapat hubungan negatif antara variabel independen dengan variabel dependen yang sangat kuat.
n
ii
n
ii
n
iii
yx
xyxy
YnYXnX
YXnYX
SSS
r
1
22
1
22
1
Pengujian Koefisien Korelasi ( r ) HipotesisHo : = 0 H1 : 0 Statistik Uji
tr n
ro
2
1 2
dimana : r = koefisien korelasi n = jumlah sampel
Daerah PenolakanMencari nilai t tabel untuk tingkat signifikansi () dan derajat bebas sebesar n-2. Sehingga | t0 | > t (/2, n-2)
Kesimpulan: Ho ditolak jika t0 > t (/2, n-2) atau t0 < t (/2,n-2)
Ho diterima jika t0 > t (/2,n-2) atau t0 < t (/2,n-2)
Korelasi
n
ii
n
ii
n
iii
yx
xyxy
YnYXnX
YXnYX
SSS
r
1
22
1
22
1
0 10 200
20
40
[start Matlab demo lecture2.m]
Plot antara X dengan Y
Korelasi
tr n
ro
2
1 2
Uji Korelasi
iiXiY
dimana:Yi = variabel dependent/respon/outputXi = variabel independent/prediktor/input/fixed = intercepti = slope/gradien/koefisien regresii = unsur gangguan yang diasumsikan identik, independen dan berdistribusi normal atau i ~ IIDN(0,2)
REGRESI LINIER SEDERHANA
DENGAN Ordinary Least Squares (OLS):
Persamaan Regresi:
ii Xy ˆˆˆ
PENGUJIAN KOEFISIEN REGRESI SECARA SERENTAKHO : model tidak signifikanH1 : model signifikan
Statistik Uji:
Tolak Ho, jika F-Rasio > F(1,n-
2;)
Pengujian Koefisien Regresi untuk
14
Problem: Regresi Linear Sederhana
Process (Model Regresi)Input
(X)Output
(Y)
Z1, Z2, …, Zq
F1, F2, …, Fq
Uncontrollable Factors
Controllable Factors
Harga Produk
Biaya Iklan, Jumlah Outlet,
Area Pema-saran dan faktor lain yang
dapat dikontrol dalam kondisi
TETAP
Sales Produk
Bagaimana pengaruh harga terhadap sales suatu produk ? Dapatkah meramal sales suatu produk berdasarkan harganya ?
Harga Pesaing, Selera Konsumen, Kondisi Ekonomi Nasional (inflasi dll) dan faktor lain yang tidak dapat dikontrol
dalam kondisi TETAP
Regresi Linier
010
2030
40
0
10
20
30
20
22
24
26
Tem
pera
ture
0 10 200
20
40
[start Matlab demo lecture2.m]
Given examples
Predict given a new point
0 200
20
40
010
2030
40
0
10
20
30
20
22
24
26
Tem
pera
ture
Prediction
Ordinary Least Squares (OLS)
0 200
Error or “residual”
Prediction
Observation
Sum squared error
Probabilistic interpretation
0 200
Likelihood
Minimize the sum squared error
Sum squared error
Linear equation
Linear system
Problem : Data hasil pengamatan … (continued)
MingguSales
(ribu unit)Harga
(ribu rupiah)
1. 10 1.32. 6 2.03. 5 1.74. 12 1.55. 10 1.66. 15 1.27. 5 1.68. 12 1.49. 17 1.010. 20 1.1
Pengamatan dilakukan dengan mengambil secara random data 10
minggu penjualan
Plot antara Harga dan Sales
Problem : MINITAB output … (continued)
MTB > Correlation 'Harga' 'Sales'.
Pearson correlation of Harga and Sales = -0.863P-Value = 0.001
MTB > Regress 'Sales' 1 'Harga'
The regression equation isSales = 32.1 – 14.5 HargaPredictor Coef SE Coef T PConstant 32.136 4.409 7.29 0.000Harga -14.539 3.002 -4.84 0.001
S = 2.725 R-Sq = 74.6% R-Sq(adj) = 71.4%
Analysis of VarianceSource DF SS MS F PRegression 1 174.18 174.18 23.45 0.001Residual Error 8 59.42 7.43Total 9 233.60
Model Regresi Linier Berganda
)X,...,X,X(fY)X(fY
n21
ikiki22i110i XXXY ...
dimana:Yi = variabel dependent/respon/outputXi = variabel independent/prediktor/input/fixedi = parameter/koefisien regresii = unsur gangguan yang diasumsikan identik, independen dan berdistribusi normal atau i ~ IIDN(0,2)
DENGAN Ordinary Least Squares (OLS):
PENGUJIAN KOEFISIEN REGRESI SECARA SERENTAK
PENGUJIAN KOEFISIEN REGRESI SECARA INDIVIDU
R SSRSST
x2 100%
%)( 100xR11R 1kn1n22
KEGUNAAN:• Mengukur ketepatan atau kecocokan suatu garis regresi
yang diterapkan terhadap suatu kelompok data hasil observasi. Makin besar nilai R2 dikatakan model regresi semakin tepat atau cocok, sebaliknya makin kecil nilai R2 dikatakan model regresi tidak tepat untuk mewakili data hasil observasi.
• Mengukur proporsi atau prosentase dari jumlah variasi Y yang dapat diterangkan oleh model regresi.
KOEFISIEN DETERMINASI
Korelasi parsial merupakan ukuran hubungan linier antara variabel Y dengan X1 dan X2 dibuat tetap atau sebaliknya. Nilai koefisien korelasi parsial ry1,2 artinya korelasi Y dengan X1 dikontrol dengan X2.
ryr r r
r r
y y
y1 2
1 1
1 2 12
22
122,
( )( )
ryr r r
r r
y y
y2 1
1 1
2 1 12
12
122,
( )( )
KOEFISIEN KORELASI PARSIAL
IDENTIK INDEPENDEN
RESIDUAL
iii YYe
DISTRIBUSI NORMAL
• Penerapan metode kuadrat terkecil (Ordinary Least Squares/OLS) tidak memerlukan / membuat asumsi apapun mengenai distribusi pada residualnya. Asumsi pada residual yang diperoleh diharapkan mempunyai nilai (rata-rata) nol, tak berkorelasi dan mempunyai varians konstan. Dengan adanya asumsi ini, penaksir OLS memenuhi beberapa sifat statistik yang diinginkan, seperti ketidakbiasan (unbiased) dan varians minimum.
• Karena hal tersebut di atas dan tujuan penarikan kesimpulan mengenai persamaan regresi populasi, dalam konteks regresi biasanya resudal diasumsikan mengikuti distribusi normal.
• Pengujian ini dilakukan untuk mengetahui apakah residual dari model berdistribusi normal dengan mean nol dan varians 2.
DISTRIBUSI NORMAL
),(~ 2i 0N
PEMERIKSAAN DISTRIBUSI NORMAL
1. Tentukan residual ei dari persamaan regresi2. Sortir ei dari urutan yang terkecil sampai yang besar3. Hitung Pi yang sesuai dengan ei yang telah disortir
%),(
100n
50iPi
4. Plot Pi dengan ei
Jika pola tersebut membentuk sudut mendekati 450, maka asumsi normal terpenuhi.
PEMERIKSAAN IDENTIK (HOMOSKEDASTISITAS)
HETEROSKEDASTISITAS
HOMOSKEDASTISITAS
Descriptive Statistics
1.19808 2.998614 104.29611 .299745 104.12470 .094526 104.96362 .407539 104
.16785 .157325 104
Perubahan Laba BankGross Profit MarginInterest Margin on LoansOperating Efficiency RatioRatio Non PerformingLoans to Total Loans
Mean Std. Deviation N
Apakah Y=Perubahan Laba Bank dipengaruhi Oleh:X1 = Gross Profit Margin X2 = Interest Margin on Loans X3 = Operating Efficiency Ratio X4 = Ratio Non Performing Loans to Total Loans
Correlations
1.000 .915 .873 .972 .854.915 1.000 .984 .951 .967.873 .984 1.000 .915 .990.972 .951 .915 1.000 .881
.854 .967 .990 .881 1.000
. .000 .000 .000 .000.000 . .000 .000 .000.000 .000 . .000 .000.000 .000 .000 . .000
.000 .000 .000 .000 .
104 104 104 104 104104 104 104 104 104104 104 104 104 104104 104 104 104 104
104 104 104 104 104
Perubahan Laba BankGross Profit MarginInterest Margin on LoansOperating Efficiency RatioRatio Non PerformingLoans to Total LoansPerubahan Laba BankGross Profit MarginInterest Margin on LoansOperating Efficiency RatioRatio Non PerformingLoans to Total LoansPerubahan Laba BankGross Profit MarginInterest Margin on LoansOperating Efficiency RatioRatio Non PerformingLoans to Total Loans
Pearson Correlation
Sig. (1-tailed)
N
PerubahanLaba Bank
Gross ProfitMargin
InterestMargin on
Loans
OperatingEfficiency
Ratio
Ratio NonPerformingLoans to
Total Loans
ANOVAb
889.232 4 222.308 596.244 .000a
36.912 99 .373926.144 103
RegressionResidualTotal
Model1
Sum ofSquares df Mean Square F Sig.
Predictors: (Constant), Ratio Non Performing Loans to Total Loans, OperatingEfficiency Ratio, Gross Profit Margin, Interest Margin on Loans
a.
Dependent Variable: Perubahan Laba Bankb.
Model Summaryb
.980a .960 .959 .610612 .960 596.244 4 99 .000 2.120Model1
R R SquareAdjustedR Square
Std. Error ofthe Estimate
R SquareChange F Change df1 df2 Sig. F Change
Change StatisticsDurbin-Watson
Predictors: (Constant), Ratio Non Performing Loans to Total Loans, Operating Efficiency Ratio, Gross Profit Margin, Interest Margin on Loansa.
Dependent Variable: Perubahan Laba Bankb.
Coefficientsa
-5.633 .373 -15.094 .000 -6.373 -4.892.637 1.574 .064 .405 .687 -2.486 3.759 .915 .041 .008 .016 61.470
-37.410 6.611 -1.179 -5.659 .000 -50.527 -24.293 .873 -.494 -.114 .009 107.8718.680 .549 1.180 15.816 .000 7.591 9.769 .972 .846 .317 .072 13.820
17.531 2.990 .920 5.864 .000 11.599 23.463 .854 .508 .118 .016 61.114
(Constant)Gross Profit MarginInterest Margin on LoansOperating Efficiency RatioRatio Non PerformingLoans to Total Loans
Model1
B Std. Error
UnstandardizedCoefficients
Beta
StandardizedCoefficients
t Sig. Lower Bound Upper Bound95% Confidence Interval for B
Zero-order Partial PartCorrelations
Tolerance VIFCollinearity Statistics
Dependent Variable: Perubahan Laba Banka.
Persamaan Regresi:Y=-5,633 + 0,637X1 – 37,41X2 + 8,680 X3 + 17,531X4
6420-2-4
Regression Standardized Residual
40
30
20
10
0
Freq
uenc
y
Mean = 8E-15Std. Dev. = 0.98N = 104
Dependent Variable: Perubahan Laba Bank
Histogram
1.00.80.60.40.20.0
Observed Cum Prob
1.0
0.8
0.6
0.4
0.2
0.0
Expe
cted
Cum
Pro
b
Dependent Variable: Perubahan Laba Bank
Normal P-P Plot of Regression Standardized Residual
20.00015.00010.0005.0000.000-5.000
Perubahan Laba Bank
6
4
2
0
-2
-4
Reg
ress
ion
Stud
entiz
ed R
esid
ual
Dependent Variable: Perubahan Laba Bank
Scatterplot
PemeriksaanASUMSI pada Error
DAFTAR PUSTAKAMason Robert D, 1996, Teknik Statistika untuk BISNIS & EKONOMI, Jilid I dan II, PT Gelora Aksara Pratama
Spiegel, M.R., 1961, Theory and Problem of Statistics, McGraw-Hill. Company.
William Mendenhall dan James E.R., 1993, Statistik untuk Manajemen dan Ekonomi, penerbit Erlangga, Jilid I dan II.
Suharyadi & Purwanto, S.K.2000. Statistika Untuk Ekonomi & Keuangan Modern, Salemba Empat.
T E R I M A K A S I H