13.-analisis-deret-waktu-statdas-27.11.12.pdf

24
P l Pengenalan Analisis Deret Waktu (Time Series Analysis) MA 2081 Statistika Dasar 29 November 2012 29 November 2012 Utriweni Mukhaiyar

Upload: ekasafitri02

Post on 02-Oct-2015

4 views

Category:

Documents


0 download

TRANSCRIPT

  • P lPengenalanAnalisis Deret Waktu (Time Series Analysis)

    MA 2081 Statistika Dasar29 November 201229 November 2012

    Utriweni Mukhaiyar

  • Ilustrasi

    2

    Ilustrasi Berikut adalah data rata-rata curah hujan bulanan yang diamati dari Stasiun Padaherang bulanan yang diamati dari Stasiun Padaherang pada tahun 2001 2004.

    Sumber : Modul 3 Praktikum Mekanika Medium Kontinu Medan Gravitasi

    Tahun Jan Feb Mar Apr Mei Jun Jul Agust Sep Okt Nop Des

    2001 278.59 279.78 355.29 241.34 115.9 176.9 55.32 29.08 43.82 313.68 508.49 267.82

    2002 299.78 245.88 266.64 185.27 122.22 133.1 76.78 32.4 26.09 169.05 461.62 415.73

    2003 425.21 370.8 300.23 157.43 184.96 69.93 23.28 14.39 17.86 275.23 433.23 456.02

    2004 547.8 308.2 388 93 297 128 47 5 87 105 389 371.6

    A bil il i h h j t i i di Apabila nilai curah hujan saat ini dianggap dipengaruhi oleh rata-rata curah hujan kemarin dst, maka data rata-rata curah hujan di atas dapat dikategorikan sebagai suatu deret waktu (time series)dikategorikan sebagai suatu deret waktu (time series).

  • Plot Data @ UM

    3

    Plot Data berdasarkan waktu

    Rata-rata curah hujan bulanan 2001 - 2004 di Stasiun

    500

    600

    Padaherang

    300

    400

    5

    a

    h

    h

    u

    j

    a

    n

    200

    300

    n

    i

    l

    a

    i

    c

    u

    r

    0

    100

    0 5 10 15 20 25 30 35 40 45

    waktu (bulan ke-)

  • P St k tik

    4

    Proses Stokastik Proses stokastik adalah barisan peubah acak {Yt , t T } Setiap proses stokastik memuat ruang keadaan S dan

    indeks parameterTS : semua nilai yang mungkin dari YtS d T d t b il i di k it t k tiS danT dapat bernilai diskrit atau kontinu

    Contoh proses stokastik:a. Cuaca harian kota Bandung gb. Banyaknya trombosit/hari pasien demam berdarah

    sejak ia terinfeksi c. Laju pertumbuhan populasi orang utan (% per tahun)d Waktu antara mekarnya bunga bangkai yang ke nd. Waktu antara mekarnya bunga bangkai yang ke-n

    dengan bunga bangkai yang ke n+1

    Misal yt nilai dari Yt maka barisan nilai {yt , t T } disebutyt t {yt }realisasi dari {Yt , t T }

  • Ti S i

    5

    Time Series Jika T : waktu, maka {Yt , t T } disebut time series Realisasinya disebut data TS Realisasinya disebut data TS Studi berkaitan dengan TS disebut analisis TS Permasalahan dalam analisis TS :

    Bagaimana menentukan model Yt sehingga model Bagaimana menentukan model Yt sehingga model tersebut dapat digunakan untuk forecasting (prakiraan di waktu mendatang)??

    Secara umum, model TS dapat ditulisYt = f (.) + et (1)

    Asumsi galat: et ~ N (0, 2) dan tidak berkorelasi Jika f linier dalam parameter-parameternya maka

    persamaan (1) disebut model linier TS Koleksi semua model linier TS dinamakan model Koleksi semua model linier TS dinamakan model

    ARIMA(p,d,q) (Box-Jenkins, 1976)

  • C t h Ti S i

    6

    Contoh Time Series

    9

    Tingkat Pengangguran di AS Produksi Tembakau di ASP

    e

    r

    s

    e

    n

    5

    6

    7

    8

    M

    i

    l

    i

    a

    r

    p

    o

    u

    n

    d

    s

    0

    0

    0

    1

    5

    0

    0

    2

    0

    0

    0

    Kuartal

    0 20 40 60 80 100 120

    3

    4

    Tahun

    M

    1880 1900 1920 1940 1960 1980

    5

    0

    0

    1

    0

    Kuartal Tahun

    0

    0

    8

    0

    0

    0

    0

    Data Penjualan lynx pelts di Canada

    1

    1

    8

    Ukuran partikel setelahpenyemprotan pengharum ruangan

    0

    0

    0

    0

    4

    0

    0

    0

    0

    6

    0

    0

    0

    1

    1

    2

    1

    1

    4

    1

    1

    6

    Tahun

    1850 1860 1870 1880 1890 1900

    2

    0

    Menit

    0 100 200 300 400 500

    1

    1

    0

  • 7Manfaat dan Tujuan TS

    d lk d hi d dilih Memodelkan data TS sehingga dapat dilihat perilaku data lebih lanjutMelakukan prediksi ke depan atau prakiraan Melakukan prediksi ke depan atau prakiraan jangka pendek (short-time forecasting)

  • 8Beberapa Konsep Dasar dalam TSKestasioneranKestasioneran

    TS {Y t T } t i jik t k ti t TS {Yt , t T } stasioner jika untuk setiap t,1. E[Yt] = (konstan) 2 kov(Y Y ) = (tidak tergantung t )2. kov(Yt , Yt k) = k (tidak tergantung t )

    Secara visual data TS {Y t T } stasioner Secara visual, data TS {Yt , t T } stasionerjika data TS berfluktuasi di sekitar rataannyadengan variansi konstang

  • 9Beberapa Konsep Dasar dalam TSACF fungsi autokorelasiACF, fungsi autokorelasi ACF (fungsi autokorelasi) : fungsi antara lag

    k dan dengan = corr (Y Y )k dan k dengan, k = corr (Yt ,Yt k).ACF sampel:

    1( )( )

    n t t k

    t kY Y Y Y

    1

    2

    1( )

    t kk n

    tt

    rY Y

    rk = 0 (secara signifikan) jika1 11 96 1 96 1,96 1,96krn n

  • 10

    Beberapa Konsep Dasar dalam TSPACF fungsi parsial autokorelasiPACF, fungsi parsial autokorelasi PACF (fs. autokorelasi parsial) : fungsi antara lag k

    dengan kk di mana kk = corr (Yt , Yt k) setelah pengaruhg kk kk ( t , t k) p gY1 , Y2, , Yk-1 ditiadakan.

    PACF dapat didefinisikan juga sebagai koefiesien suku PACF dapat didefinisikan juga sebagai koefiesien sukuterakhir dari regresi Yt dengan Y1 , Y2, , Yk.

    Artinya jika Y = + Y + Y + + kY k maka PACF Artinya, jika Yt = +1Yt-1 + 2Yt-2 + + kYt-k maka PACF sampel untuk lag k = taksiran dari k.atau

    0 ( i ifik ) jik kk k 1 11 96 1 96= 0 (secara signifikan) jikakk 1,96 1,96kkn n

  • C t h ACF d PACF d g SPSS

    11

    Contoh ACF dan PACF dengan SPSS8000

    number of blowfly

    6000

    b

    e

    r

    o

    f

    b

    l

    o

    w

    f

    l

    y

    1.0

    0.5

    0.0

    A

    C

    F

    Lower ConfidenceLimit

    Upper Confidence LimitCoefficient

    4000

    2000

    n

    u

    m

    b

    16151413121110987654321

    Lag Number

    -0.5

    -1.0

    81

    79

    77

    75

    73

    71

    69

    67

    65

    63

    61

    59

    57

    55

    53

    51

    49

    47

    45

    43

    41

    39

    37

    35

    33

    31

    29

    27

    25

    23

    21

    19

    17

    15

    13

    11

    97531

    Sequence number1.0

    0.5

    Lower ConfidenceLimit

    Upper Confidence LimitCoefficient

    number of blowfly

    Dari menu SPSS, pilihGraphs

    0.0

    -0.5

    P

    a

    r

    t

    i

    a

    l

    A

    C

    F

    pTime Series

    Autocorrelations...pilih variabel yang akandihit ACF d PACF

    16151413121110987654321

    Lag Number

    -1.0dihitung ACF dan PACF-nya

    OK

  • Model-model Time Series

    12

    Model model Time SeriesUntuk TS Stasioner

    1. Autoregresi (AR) : regresi terhadap TS yg lalu & galatsekarangsekarang

    AR(1): Yt = +1Yt-1 +et , di mana 1

  • 13

    Model-model Time SeriesUntuk TS StasionerUntuk TS Stasioner3. Autoregresi-Moving Average (ARMA)

    regresi terhadap TS yang lalu dan semua galatg p y g gARMA(1,1): Yt = +1 Yt-1 +et 1et -1ARMA(p,q): Z = +( Y + + Y ) +(e e e )Zt = +(1 Yt-1 + + p Yt-p ) +(et 1et -1 qet -q )

    Catatan: AR(p) = ARMA(p,0), MA(q) = ARMA(0,q)

  • 14

    Model-model Time SeriesUntuk TS tidak StasionerUntuk TS tidak Stasioner Misal TS {Yt } tidak stasioner.

    Buat TS baru yg stasioner sebut {Z } dengan caraBuat TS baru yg stasioner, sebut {Zt } dengan caradiferensi, yaitu Zt = Yt Yt-1, untuk setiap t.

    MakaARMA(p,q) untuk {Zt} disebut ARIMA (p,1,q) untuk{Zt }

    Jika diferensi dilakukan d kali, ditulis ARIMA(p,d,q) Catatan: ARMA(p,q) = ARIMA (p,0,q)

  • 15

    Metode Box JenkinsTahap awal:Pemeriksaan kestasioneran:- Plot TS- Jika stasioner, lanjutkan ke tiga tahap iteratif.

    Jika tidak lakukan transformasi atau diferensiTiga tahap iteratif :1. Identifikasi2 Penaksiran parameter2. Penaksiran parameter3. Uji diagnostik (pemeriksaan asumsi sisa)Jika pada uji diagnostik, ada asumsi yang dilanggar

    l i l i 3 t h it tifulangi lagi 3 tahap iteratif

  • Id tifik i

    16

    IdentifikasiModel ACF PACFAR(p) Menurun secara

    eksponensial atau membentuk gelombang sinus

    Cut off setelah lag p

    teredamMA(q) Cut off setelah lag q Menurun secara

    eksponensial ataueksponensial ataumembentuk gelombang sinus teredam

    Mengidentifikasi orde (p,q) model ARMA melalui kriteriaAkaike (AIC)

    AIC n log + 2m , m = # parameter Hitung nilai AIC untuk setiap (p,q). Orde yang dipilih adalah

    (p,q) dengan nilai AIC yang paling kecil

  • P k i P t

    17

    Penaksiran Parameter Metode: - Kuadrat terkecil (untuk model AR)

    M k i lik lih d- Maksimum likelihood- Melard (digunakan SPSS)

    C h k i l l i SPSS Contoh penaksiran parameter melalui SPSSDari menu, pilih Analyze Forecasting Create Models ... Pilih nama TS sebagai Dependent variable Masukkan orde model ARIMA

  • Uji Di g i

    18

    Uji DiagnosisIngat asumsi galat: et ~ N (0,2) dan tidak berkorelasiPengujian asumsi:Pengujian asumsi:Cara 1: Plot sisaan

    berfluktuasi di sekitar 0 E[et ] = 0berfluktuasi di sekitar 0 E[et ] 0nilai sisaan di sekitar 1,96 Var(et) = 2

    plot ACF serta plot PACF-nyark dan signifikan 0 sisaan tidak berkorelasi

    2kkk g

    Cara 2: Uji Ljung-Box Uji H0: korelasi antar sisaan = 0 dengan statistik Ljung-Box

    2*

    h r

    kk

    Jika Q * > 2, dengan = h m dan m = # parameter, maka H0

    *

    1( 2) k

    k

    rQ n nn k

    ditolak

  • 19

    Contoh

    Hasil produksi bulanan perkebunan teh di lokasi PAL tahun 1992 2009 (T = 216)PAL tahun 1992-2009 (T = 216)

    Produksi teh "PAL" 1992-2009

    Produksi teh "PAL" 1992-2009

    150000

    200000

    250000

    300000

    u

    k

    s

    i

    t

    e

    h

    100000

    150000

    e

    h

    diferensi 1 kali

    0

    50000

    100000

    150000

    0 50 100 150 200

    p

    r

    o

    d

    u

    -50000

    0

    50000

    0 50 100 150 200

    p

    r

    o

    d

    u

    k

    s

    i

    t

    e

    0 50 100 150 200

    bulan ke--100000

    bulan ke-

  • Contoh

    20

    Contoh Sari Numerik Data

    DataperkebunantehPAL Data perkebunan teh PAL (diff 1 kali)

    Mean 133793.6StandardError 2488.531Median 136781

    DataperkebunantehPAL(diff1kali)

    Mean 455.7023StandardError 2407.674

    Median 136781Mode #N/AStandardDeviation 36573.79SampleVariance 1.34E+09

    Median 1515Mode 15033StandardDeviation 35303.43Sample Variance 1.25E+09p

    Kurtosis 0.222436Skewness 0.07241Range 218458Mi i 36305

    SampleVariance 1.25E 09Kurtosis 1.855309Skewness 0.701741Range 216395Mi i 81536Minimum 36305

    Maximum 254763Sum 28899412Count 216

    Minimum 81536Maximum 134859Sum 97976Count 215Count 216

  • 21

    ContohIdentifikasi ACF menurun Identifikasi ACF menurun

    seperti gelombang sinus teredam sedangkan PACF cut off setelah lag-1.

    Model yang Model yang mungkin adalah AR(1)

    ACF cut off setelah lag-1 sedangkanPACF juga seperti cut off setelah lag 1 cut off setelah lag-1.

    Ada beberapa model yang mungkin, seperti ARIMA(1,1,1)( , , )

  • ContohPenaksiran dan Uji DiagnostikPenaksiran dan Uji Diagnostik

    A

    R

    (

    1

    )

    1134113,420 0,535 t t tY Y eDiperoleh AR(1) :

    1

    ,

    1

    ,

    1

    )

    A

    R

    I

    M

    A

    (

    1

    22 1 119,205 0,434 0,934 t t t tZ Z e eDiperoleh ARIMA(1,1,1) :

  • Contoh23

    Kesimpulan Berdasarkan hasil Ljung-Box, dimana pada model

    AR(1) H ditolak (sisaan berkorelasi) untuk semua AR(1) H0 ditolak (sisaan berkorelasi) untuk semua 1% 10%, sedangkan ARIMA(1,1,1) tidak ditolak untuk

  • Referensi B G E P d J ki G M ( ) Ti S i Box, G. E. P. dan Jenkins, G. M. (1976): Time Series Analysis: Forecasting & Control, Holden-Day Inc., San Fransisco

    Cryer, J. D. dan Chan, K. S. (2008): Time Series Analysis with Applications in R, Springer, New York.

    24