analisis regresi dan korelasi...
TRANSCRIPT
ANALISIS REGRESI DAN KORELASI
SEDERHANASEDERHANA
LATAR BELAKANG
• Analisis regresi dan korelasi � mengkaji dan mengukur keterkaitan secara statistik antara dua atau lebih variabel.
• Keterkaitan antara dua variabel � regresi dan korelasi sederhana.
• Keterkaitan tiga atau lebih variabel � regresi dan korelasi • Keterkaitan tiga atau lebih variabel � regresi dan korelasi multipel.
• Variabel yang mempengaruhi perubahan � variabel bebas sumbu-X.
• Variabel yang akan ditaksir � variabel tak bebas �sumbu-Y.
ANALISIS REGRESI
DIAGRAM PENCAR
• Kegunaan diagram pencar:
� melihat kaitan antar variabel secara visual
� membantu untuk menentukan jenis
persamaan regresi yang akan digunakanpersamaan regresi yang akan digunakan
ANALISIS REGRESI
DIAGRAM PENCAR
• Gambaran kaitan yang cukup kuat antara variabel X dan variabel Y
� hubungan yang bersifat langsung � bila variabel X meningkat,
maka variabel Y juga meningkat � hubungan linier positif.
ANALISIS REGRESI
DIAGRAM PENCAR
• Hubungan linier positif dengan pencarn yang lebih besar
� korelasi mengecil.
ANALISIS REGRESI
DIAGRAM PENCAR
• Hubungan linier negatif (berlawanan)
ANALISIS REGRESI
DIAGRAM PENCAR
• Keterkaitan dua variabel yang bersifat tidak linier dan
mempunyai pola hubungan kurvilinier positif
ANALISIS REGRESI
DIAGRAM PENCAR
• Hubungan kurvilinier negatif
ANALISIS REGRESI
DIAGRAM PENCAR
• Hubungan kurvilinier
ANALISIS REGRESI
DIAGRAM PENCAR
• Secara visual tidak terdapat hubungan
ANALISIS REGRESI
PERSAMAAN REGRESI LINIER
• Persamaan umum regresi untuk populasi:
( )kkXXXfY θθθ ,...,,,...,, 2121=
θ : parameter yang terdapat dalam regresi dan
perlu ditaksir untuk mendapatkan persamaan
regresi dari sampel
ANALISIS REGRESI
PERSAMAAN REGRESI LINIER
• Model regresi yang paling sederhana:
α dan β ditaksir dengan a dan b � regresi berdasarkan sampel acak:
XY βα +=
bXaY +=a = intersepsi Yc bila X = 0
b = slope garis regresi
X = nilai variabel bebas
Yc = nilai variabel tak bebas yang dihitung dari persamaan regresi
bXaYc +=
ANALISIS REGRESI
PERSAMAAN REGRESI LINIER
• Metoda pencarian persamaan regresi yang paling sering digunakan � metode kuadrat terkecil (least square).
• Garis regresi least square:
( )YY c∑ =− 0
� mengupayakan agar simpangan positif dari titik sebaran diatas garis, dihilangkan oleh simpangan negatif di bawah garis � jumlah = 0
( ) imumYY c
c
∑∑
=− min2
ANALISIS REGRESI
PERSAMAAN REGRESI LINIER
ANALISIS REGRESI
PERSAMAAN REGRESI LINIER
• Nilai a dan b sebagai penaksir α dan β dihitung dengan:
( ) ( )( )[ ]( ) ( )[ ] n
YY
XXn
YXXYnb m
∑∑∑
∑∑∑ =−
−=
22
n = jumlah pasangan observasi
( )( ) ( )( )[ ]( ) ( ) n
XX
XXn
XYXXYa
bXYa
m
mm
∑∑∑
∑∑∑∑ =−
−=
−=
22
2
ANALISIS REGRESI
GALAT BAKU DARI PENDUGA
• Asumsi yang diambil:
(1) Model regresi mengalami koreksi � terdapat galat
(ε) � model regresi:
Kekeliruan � berbentuk variabel acak yang mengikuti
distribusi normal dengan varian σx2
εβα ++= XY
ANALISIS REGRESI
GALAT BAKU DARI PENDUGA
ANALISIS REGRESI
GALAT BAKU DARI PENDUGA
ANALISIS REGRESI
GALAT BAKU DARI PENDUGA
(2) Untuk setiap harga X yang diberikan � variabel
tak-bebas Y adalah bebas dan terdistribusi normal
dengan:
rerata = α + βX
varian= σy.x2 � varian-galat-baku
Varian-galat-baku sama untuk setiap harga X � σε2
(varian-galat-taksiran)
� ditaksir rerata-kuadrat-residu (sε2)
ANALISIS REGRESI
GALAT BAKU DARI PENDUGA
• Akar dari kuadrat residu � galat-baku-taksiran:
( )2
2
. −
−== ∑
n
YYss
c
xy ε
( ) ( ) ( )2
2
2
−
−−=
−
∑ ∑∑n
XYbYaY
n
PENGUJIAN MODEL REGRESI
• Bisa terdapat hubungan dengan slope = 0 � tidak ada
korelasi
PENGUJIAN MODEL REGRESI
• Dapat pula terjadi pasangan data yang memberikan garis regresi
yang baik � analisis regresi menggambarkan keterkaitan antar
variabel bebas dan tak-bebasnya.
PENGUJIAN MODEL REGRESI
• Asumsi yang digunakan:
(1) nilai a dan b dalam persamaan adalah berasal dari
sampel yang merupakan estimasi dari α dan βsampel yang merupakan estimasi dari α dan β
(2) untuk setiap nilai X � ada distribusi nilai-nilai Y
dalam populasi � nilai-nilai tsb terpencar secara
vertikal dari garis regresinya dan berdistribusi
normal.
PENGUJIAN MODEL REGRESI
PENGUJIAN MODEL REGRESI
(3) Setiap distribusi-distribusi nilai-nilai Y
tsb. mempunyai simpangan baku yang
sama.
(4) Setiap nilai-nilai dalam distribusi-
distribusi tersebut adalah bebas satu
sama lain.
PENGUJIAN MODEL REGRESI
• Uji terdapatnya hubungan yang sebenarnya antara
variabel X dan variabel Y � uji slope :
H0: β = 0
H1: β ≠ 0H1: β ≠ 0
Rasio kritis : ( )
∑=
−=
−==
n
i
xy
b
b
H
xxi
ss
s
btRK
1
2
.
)(
0β
PENGUJIAN MODEL REGRESI
• Simpangan baku � ukuran penyebaran dari rerata.
• Galat-baku-taksiran � ukuran penyebaran terhadap garis
regresinya.
• Pada sampel yang banyak serta nilai-nilai Y berdistribusi
normal � didapat garis-garis batas rentang � ± 1 sy.x, ± 2
sy.x, dan ± 3 sy.x.
PENGUJIAN MODEL REGRESI
PENGUJIAN MODEL REGRESI
• Jumlah sampel cukup besar untuk sebuah harga X �
rentang taksiran (n > 30):
( )xyc sZY .±
• Jumlah sampel kecil
� rentang rata-rata output:
( ) ( )
−
−+±
∑=
− n
i
xync
XXi
XXi
nstY
1
2
2
.2
)(
1
PENGUJIAN MODEL REGRESI
• Rentang output:
( ) ( ) ( )
−++±+
XXi
nstbXa
2
11α( ) ( ) ( )
−
++±+
∑=
n
i
xy
XXin
stbXa
1
2.2
)(
11α
ANALISIS KORELASI
KOEFISIEN DETERMINASI (r2)
• Bila garis regresi digunakan sebagai dasar estimasi:
• Secara umum:
( ) ( ) ( )cmcm YYYYYY −+−=− **
� total simpangan = simpangan dapat dijelaskan + simpangan tak
terjelaskan
( ) ( ) ( )cmcm YYYYYY −+−=−
ANALISIS KORELASI
KOEFISIEN KORELASI (r)
ANALISIS KORELASI
KOEFISIEN DETERMINASI (r2)
• Bila seluruh titik sebaran yang diperhatikan:
( ) ( ) ( )∑ ∑ ∑ −+−=− 222
cmcm YYYYYY
� total variasi = variasi dapat dijelaskan +
variasi tak terjelaskan
SST = SSR + SSE
ANALISIS KORELASI
KOEFISIEN DETERMINASI (r2)
• Koefisien r2 � koefisien determinasi � ukuran banyaknya “total
variasi” variabel Y yang dapat dijelaskan secara regresi, yang
berpasangan dengan variabel X:
=2 SSR
( )( )
( ) ( ) ( )[ ]( ) ( )[ ]∑
∑∑
∑∑
−−+
=
−−
=
=
22
2
2
2
2
2
2
m
m
m
mc
YnY
YnXYbXar
YY
YYr
SSTSSRr
ANALISIS KORELASI
KOEFISIEN KORELASI (r)
• Koefisien korelasi � akar dari koefisien determinasi �
menyatakan skala kedekatan hubungan antara X dan Y.
• Bila r = 0 � tidak ada hubungan.• Bila r = 0 � tidak ada hubungan.
• Bila r = +1 atau r = -1 � terdapat hubungan yang
sempurna.
KOEFISIEN DETERMINASI DAN KORELASI
KOEFISIEN DETERMINASI DAN KORELASI
KOEFISIEN DETERMINASI DAN KORELASI
KOEFISIEN DETERMINASI DAN KORELASI
KOEFISIEN DETERMINASI DAN KORELASI
REKAPITULASI
ANALISIS REGRESI
REGRESI NONLINIER (KURVILINIER)
• Beberapa persamaan regresi nonlinier:
(1) Persamaan parabola kuadratik:
dengan metode kuadrat terkecil � a,b dan c dapat dihitung
2cXbXaYc ++=
dengan metode kuadrat terkecil � a,b dan c dapat dihitung
dengan substitusi:
∑ ∑ ∑ ∑
∑ ∑ ∑ ∑
∑ ∑ ∑
++=
++=
++=
4322
32
2
XcXbXaYX
XcXbXaXY
XcXbnaY
ANALISIS REGRESI
REGRESI NONLINIER (KURVILINIER)
(2) Persamaan kubik:
untuk menentukan a,b dan c:
32 dXcXbXaYc +++=
∑ ∑ ∑∑ +++= 32 XdXcXbnaY
∑ ∑∑∑∑
∑∑∑∑∑
∑ ∑∑∑∑
∑ ∑ ∑∑
+++=
+++=
+++=
+++=
65433
54322
432
32
XdXcXbXaYX
XdXcXbXaYX
XdXcXbXaXY
XdXcXbnaY
ANALISIS REGRESI
REGRESI NONLINIER (KURVILINIER)
(3) Persamaan eksponensial:
dengan menganggap:
( )XbaY
abY
c
x
c
logloglog +=
=
YY log' =dengan menganggap:
maka
bb
aa
YY cc
log'
log'
log'
=
=
=
XbaY c ''' +=
ANALISIS REGRESI
REGRESI NONLINIER (KURVILINIER)
Model eksponensial � model pertumbuhan � diubah
menjadi:
aeY bx
c =
bXaY
aeY
c
c
+=
=
lnln
ANALISIS REGRESI
REGRESI NONLINIER (KURVILINIER)
(4) Persamaan geometris:
XbaY
aXY
c
b
c
logloglog +=
=
(5) Persamaan hiperbola:
c
( )
bXaY
atau
bXaY
c
c
+=
+=
1
1