penerapan model arima - home | .: department of statistics ...stat.ipb.ac.id/en/uploads/ks/s2 -...

Post on 28-May-2019

234 Views

Category:

Documents

1 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Penerapan Model ARIMA

(Bagian I)

Dr. Kusman Sadik, M.Si

Departemen Statistika IPB, 2016

1

2

Ada tiga tahapan iterasi dalam pemodelan data deret waktu,

yaitu:

1. Penentuan model tentatif (spesifikasi model) berdasarkan

data contoh untuk mengidentifikasi nilai p, d, dan q.

2. Pendugaan parameter model ARIMA(p, d, q) yang

diidentifikasi, yaitu penduga nilai , , dan σ𝑒2.

3. Analisis diagnostik untuk melihat kelayakan model.

3

Prosedur iterasi ini sering disebut ”Metode Box-

Jenkins”.

Untuk model ARIMA(p, d, q), spesifikasi dilakukan

untuk menentukan nilai p, d, dan q.

Alat yang digunakan pada tahap identifikasi ini adalah

fungsi autokorelasi.

Fungsi autokorelasi ini diduga dari data contoh atau

disebut fungsi autokorelasi contoh (sample of

autocorrelation function atau SACF atau ACF saja).

Disamping itu ada pula fungsi autokorelasi parsial

(sample of partial autocorrelation function atau SPACF

atau PACF saja)

4

a. ACF

.... ,2 ,1 ,

)(

))((

1

2

1

k

YY

YYYY

rn

t

t

kn

t

ktt

k

n

Y

Y

n

t

t 1

rk merupakan penduga bagi k

5

a. PACF

PACF : kk = Corr(Yt, Yt-k | Yt-1, Yt-2, …, Yt-k+1)

Berdasarkan persamaan Yule-Walker:

j = k1j-1 + k2j-2 + ... + kkj-k

j = 1, 2, ..., k; Catatan: j = -j dan 0 = 1

k ACF; kk PACF

kk̂ penduga bagi kk

6

Contoh:

Misal diketahui data : 4, 2, 5, 1. Tentukan ACF (r1, r2) dan

PACF (𝜙 11 ,𝜙 22)

Melalui persamaan .... ,2 ,1 ,

)(

))((

1

2

1

k

YY

YYYY

rn

t

t

kn

t

ktt

k

Dapat diperoleh penduga ACF : r1 = -0.7 dan r2 = 0.4

7

Berdasarkan persamaan Yule-Walker dapat diperoleh

penduga PACF kk:

j = k1j-1 + k2j-2 + ... + kkj-k

Untuk k =1 j = 1

1 = 110 1 = 11(1) r1 = 𝜙 11 = -0.7

Untuk k = 2 j = 1, 2

1 = 210 + 221 1 = 21 + 221

2 = 211 + 220 2 = 211 + 22

8

1 = 210 + 221 1 = 21 + 221

2 = 211 + 220 2 = 211 + 22

(1)2 = 211 + 22(1)

2 ...... Pers(1)

2 = 211 + 22 …….. Pers(2)

Berdasarkan Pers(1) dan Pers(2) diperoleh:

(1)2 - 2 = 22(1)

2 - 22

22 = {(1)2 - 2}/{(1)

2 - 1}

𝜙 22= {(r1)2 - r2}/{(r1)

2 - 1} = 0.09/(-0.51) = -0.176

9

0.0

0.2

0.4

0.6

0.8

1.0

1 2 3 4 5

ACF

0.0

0.2

0.4

0.6

0.8

1.0

1 2 3 4 5 6

Sample of ACF

kkr

k k

Pengidentifikasian Model

Model MA: Misal MA(1) : Yt = et - et-1

ACF :

1 ; 0

1 ;1 2

k

k

k

10

Karena rk berasal dari data contoh maka diperlukan galat

baku bagi rk yaitu Srk.

Sebagai nilai pendekatan : Srk = n/1 , dimana n adalah

banyaknya data.

Sehingga hipotesis H0 : k = 0 ditolak jika | rk | > 2Srk

atau | rk | > n/2 .

Misalnya, jika | r1 | > n/2 dan | rk | < n/2 untuk k =

2, 3, …, maka model tentatifnya adalah MA(1).

11

Model AR : Misalkan AR(1) : Yt = Yt-1 + et

ACF : k = k ; k = 1, 2, …

Untuk model AR, ACF merupakan fungsi eksponensial

sehingga ACF tidak dapat digunakan untuk menentukan

nilai p dalam AR(p).

PACF : untuk k = 1 1 = 11

untuk k = 2 1 = 21 + 221 .... (1)

2 = 211 + 22 .... (2)

12

0.0

0.2

0.4

0.6

0.8

1.0

1 2 3 4 5

PACF

0.0

0.2

0.4

0.6

0.8

1.0

1 2 3 4 5 6

Sample of PACF

kkkk̂

Berdasarkan persamaan (1) dan (2) 22 = 0.

Demikian juga 33 = 44 = ... = 0.

Sehingga PACF AR(1):

1 ; 0

1 ; 1

k

k

kk

Dengan demikian PACF dapat digunakan sebagai

penentu nilai p dalam model AR(p).

Hipotesis H0 : kk = 0 ditolak jika nkk /2 |ˆ| .

13

0.0

0.2

0.4

0.6

0.8

1.0

1 2 3 4 5 6 7 8 9

Sample of ACF

off tails

0.0

0.2

0.4

0.6

0.8

1.0

1 2 3 4 5 6 7 8 9

Sample of ACF

q lagafter off cuts

Pengidentifikasian nilai p dan q

14

15

Contoh (1)

16

Contoh (2)

17

Contoh (3)

d = 1

d = 1

18

Pendugaan Parameter Model

Apabila nilai p, d, dan q sudah dapat diidentifikasi, maka

selanjutnya dilakukan pendugaan terhadap parameter model,

yaitu 1, 2, ..., p untuk model AR(p) dan 1, 2, ..., q untuk

model MA(q) berdasarkan data terobservasi Y1, Y2, ..., Yn.

Metode pendugaan parameter :

Metode momen,

Metode kuadrat terkecil (least-square),

Metode kemungkinan maksimum (maximum likelihood).

19

1. Metode Momen

Metode ini didasarkan pada persamaan momen contoh dan

momen teoritis, kemudian memecahkan persamaan-persamaan

tersebut untuk mendapatkan penduga bagi parameter model.

Misalnya, menduga rataan populasi (teoritis) dengan rataan

contoh Y .

Model AR

a. AR(1) : Yt = Yt-1 + et

k = k ; k = 1, 2, …

1 = ˆˆ1 r1 = ̂

Jadi pada AR(1) penduga bagi parameter model, ,

adalah r1 yang dapat dihitung dari data.

20

b. AR(1) : Yt = + Yt-1 + et

Bagaimana menduga ?

Perhatikan model : (Yt - 𝑌 )= (Yt-1 - 𝑌 ) + et

↔ (Yt - 𝑌 )= (Yt-1 - 𝑌 ) + et

↔ Yt = (1 - )𝑌 + Yt-1 + et

↔ Yt = + Yt-1 + et

Sehingga : = (1 - )𝑌

21

c. AR(2) : Yt = 1Yt-1 + 2Yt-2 + et

Berdasarkan persamaan Yule-Walker :

k = 1k-1 + 2k-2 + ... + pk-p

maka diperoleh

1 = 1 + 21 dan 2 = 11 + 2

dengan metode momen diperoleh:

r1 = 1̂ +

2̂ r1 dan r2 = r1 1̂ + 2̂

penyelesaian terhadap dua persamaan ini diperoleh:

2

1

211

1

)1(ˆr

rr

dan

2

1

2

122

r

rr

22

Model MA

MA(1) : Yt = et - et-1

211

21 ˆ1

ˆ

r

sehingga diperoleh : 1

2

1

2

411ˆr

r

Sebagai catatan untuk persamaan ini, apabila | r1 | > 0.5

maka metode momen gagal untuk menduga parameter .

Untuk MA(2), MA(3), dst, metode momen menjadi

sangat kompleks, sehingga harus menggunakan metode

pendugaan lainnya.

23

Model ARMA

ARMA(1, 1) : Yt = Yt-1 - et-1 + et

1

221

))(1(

k

k

1

2 sehingga penduga bagi adalah : 1

2ˆr

r

Untuk menduga dapat digunakan persamaan pertama

dengan cara mengganti 1 dengan r1 dan dengan ̂ , yaitu

21 ˆˆˆ21

)ˆˆ)(ˆˆ1(

r

24

Contoh Kasus (Latihan):

Misalnya diketahui model AR(2) : Yt = + 1Yt-1 + 2Yt-2 + et.

Berdasarkan data diketahui bahwa r1 = 0.75, r2 = 0.61, dan

Y = 4.5. Tentukan ̂ , 1̂ , dan

2̂ dengan metode momen.

25

2. Metode Kuadrat Terkecil

Metode ini dilakukan dengan cara meminimumkan komponen

pada galat, yaitu

n

t

te1

2.

AR(1) : Yt = Yt-1 + et et = Yt - Yt-1

S() =

n

t

te1

2=

n

t

tt YY1

2

1)(

Penduga bagi parameter model, , dapat diperoleh

dengan cara meminimumkan S().

26

MA(1) : Yt = et - et-1 et = Yt + et-1

et = Yt + ( Yt-1 + et-2)

et = Yt + Yt-1 + 2Yt-2 +

3Yt-3 + ….

S() =

n

t

te1

2

Meminimumkan S() tidak dapat dilakukan secara

analitik / kalkulus karena bersifat non-linear, sehingga

harus diselesaikan secara numerik / iteratif, salah

satunya melalui algoritma Gauss-Newton.

27

3. Metode Kemungkinan Maksimum

Metode ini dilakukan dengan cara memaksimumkan fungsi

kemungkinan (likelihood), berdasarkan fungsi sebaran galat (et).

AR(1) : Yt = Yt-1 + et, misal et bsi

~ N(0, e2)

f(e1, e2, …., en) = )2

1exp(.)2(

1

2

2

2/)1(2

n

t

t

e

n

e e

L(, e2) = ))(

2

1exp(.)2( 2

12

2/)1(2

n

t

tt

e

n

e YY

Penduga dan e2 dapat diperoleh dengan cara

memaksimumkan fungsi kemungkinan L(, e2).

28

MA(1) : Yt = et - et-1

Fungsi kemungkinannya, L(, e2), bersifat non-linear

sehingga pemaksimumannya harus dilakukan secara

numerik / iteratif.

Catatan : SAS dan Minitab menggunakan metode iterasi

Gauss-Newton untuk menduga parameter AR(p),

MA(q), dan ARIMA(p, d, q).

29

-10

0

10

10 20 30 40

Zt

Index

Studi Kasus :

Tentukan model terbaik untuk data bulanan penjualan suatu

produk (Zt) sebagai berikut:

Zt : Data Asal

30

2

1

0

-1

-2

-3

40302010

Zt(

lag1)

Index

Zt(lag1) : Data Zt setelah differencing ordo-1

31

3

2

1

0

-1

-2

40302010

Zt(

lag2)

Index

Zt(lag2) : Data Zt setelah differencing ordo-2

32

1110987654321

1.0

0.8

0.6

0.4

0.2

0.0

-0.2

-0.4

-0.6

-0.8

-1.0

Lag

Au

toco

rre

lati

on

Autocorrelation Function for Zt(with 5% significance limits for the autocorrelations)

Ada indikasi tidak stasioner. Mengapa?

33

1110987654321

1.0

0.8

0.6

0.4

0.2

0.0

-0.2

-0.4

-0.6

-0.8

-1.0

Lag

Au

toco

rre

lati

on

Autocorrelation Function for Zt(lag1)(with 5% significance limits for the autocorrelations)

Ada indikasi tidak stasioner. Mengapa?

34

1110987654321

1.0

0.8

0.6

0.4

0.2

0.0

-0.2

-0.4

-0.6

-0.8

-1.0

Lag

Au

toco

rre

lati

on

Autocorrelation Function for Zt(lag2)(with 5% significance limits for the autocorrelations)

Ada indikasi sudah stasioner. Mengapa?

ACF

35

1110987654321

1.0

0.8

0.6

0.4

0.2

0.0

-0.2

-0.4

-0.6

-0.8

-1.0

Lag

Pa

rtia

l A

uto

co

rre

lati

on

Partial Autocorrelation Function for Zt(lag2)(with 5% significance limits for the partial autocorrelations)

PACF

36

Kandidat Model : ARIMA(0,2,1)dan ARIMA(1,2,0)

1110987654321

1.0

0.8

0.6

0.4

0.2

0.0

-0.2

-0.4

-0.6

-0.8

-1.0

Lag

Au

toco

rre

lati

on

Autocorrelation Function for Zt(lag2)(with 5% significance limits for the autocorrelations)

1110987654321

1.0

0.8

0.6

0.4

0.2

0.0

-0.2

-0.4

-0.6

-0.8

-1.0

Lag

Pa

rtia

l A

uto

co

rre

lati

on

Partial Autocorrelation Function for Zt(lag2)(with 5% significance limits for the partial autocorrelations)

37

Relative change in each estimate less than 0.0010

Final Estimates of Parameters

Type Coef SE Coef T P

MA 1 -0.4393 0.1371 -3.20 0.003

Constant -0.0995 0.1581 -0.63 0.533

Differencing: 2 regular differences

Number of observations: Original series 47, after

differencing 45

Residuals: SS = 48.3592

(backforecasts excluded)

MSE = 1.1246 DF = 43

ARIMA(0,2,1)

ARIMA model for Yt

Estimates at each iteration

Iteration SSE Parameters

0 66.1073 0.100 0.031

1 57.5810 -0.050 -0.011

2 51.8387 -0.200 -0.048

3 48.8500 -0.350 -0.083

4 48.3704 -0.435 -0.099

5 48.3691 -0.439 -0.099

6 48.3691 -0.439 -0.099

38

ARIMA(1,2,0)

ARIMA model for Yt

Estimates at each iteration

Iteration SSE Parameters

0 55.9021 0.100 0.035

1 50.7183 0.250 -0.022

2 47.5927 0.400 -0.056

3 46.1186 0.543 -0.069

4 45.9902 0.582 -0.067

5 45.9806 0.592 -0.067

6 45.9799 0.595 -0.067

7 45.9799 0.596 -0.067

8 45.9799 0.596 -0.067

Relative change in each estimate less than 0.0010

Final Estimates of Parameters

Type Coef SE Coef T P

AR 1 0.5958 0.1225 4.86 0.000

Constant -0.06673 0.06299 -1.06 0.295

Differencing: 2 regular differences

Number of observations: Original series 47, after

differencing 45

Residuals: SS = 45.9799

(backforecasts excluded)

MSE = 1.0693 DF = 43

39

Pemilihan Model Terbaik Berdasarkan MSE Terkecil

Berdasarkan hasil di atas:

ARIMA(0, 2, 1) MSE : 1.1246

ARIMA(1, 2, 0) MSE : 1.0693

Sehingga model terbaik berdasarkan nilai MSE terkecil adalah

ARIMA(1, 2, 0).

Model terbaik yang diperoleh dapat digunakan untuk melakukan

peramalan.

1. Melalui Minitab, bangkitkan data yt, (n = 225), berupa

model ARIMA(1, 2, 0) dengan = 0.5, Φ = 0.8 serta

et ~ Normal(0,1). Gunakan 200 data terakhir dan lakukan

proses berikut:

a. Berdasarkan ACF dan PACF untuk data yt tersebut,

identifikasilah kandidat model yang sesuai.

b. Berdasarkan kandidat model tersebut, tentukan model

terbaik berdasarkan nilai MSE-nya.

c. Bandingkan penduga parameter yang diperoleh untuk

model terbaik pada poin (b) tersebut dengan nilai

parameter yang sesungguhnya. Apa kesimpulan Anda?

40

2. Melalui Minitab, bangkitkan data yt, (n = 225), berupa

model ARIMA(1, 1, 2) dengan = 1.0, Φ = 0.8, θ1 = - 0.9,

dan θ2 = 0.7 serta et ~ Normal(0,1). Gunakan 200 data

terakhir dan lakukan proses berikut:

a. Berdasarkan ACF dan PACF untuk data yt tersebut,

identifikasilah kandidat model yang sesuai.

b. Berdasarkan kandidat model tersebut, tentukan model

terbaik berdasarkan nilai MSE-nya.

c. Bandingkan penduga parameter yang diperoleh untuk

model terbaik pada poin (b) tersebut dengan nilai

parameter yang sesungguhnya. Apa kesimpulan Anda?

41

42

Lihat Montgomery : Exercise 5.11, hlm. 290

Cryer, J.D. and Chan, K.S. 2008. Time Series Analysis with

Application in R. Springer.

Montgomery, D.C., et.al. 2008. Forecasting Time Series Analysis

2nd. John Wiley.

Wei, William, W.S. 1990. Time Series Analysis, Univariate and

Multivariate Methods. Adison-Wesley Publishing Company Inc,

Canada.

Abraham, B. and Ledolter, J. 2005. Statistical Methods for

Forecasting. John Wiley.

43

44

Bisa di-download di

http://www.stat.ipb.ac.id/en/index.php?page=dr-kusman-sadik

45

top related