estimasi parameter pada regresi semiparametrik untuk data longitudinal (2)

Upload: wilan-dita-nesyia-wirana

Post on 31-Oct-2015

31 views

Category:

Documents


0 download

TRANSCRIPT

  • ESTIMASI PARAMETER PADA REGRESI SEMIPARAMETRIK UNTUK DATA LONGITUDINAL

    Lilis Laome1

    1Jurusan Matematika FMIPA Universitas Haluoleo Kendari 93232

    e-mail : [email protected]

    Abstrak Misal

    iy merupakan variabel respon,

    iX adalah variabel prediktor yang berhubungan linier dengan

    iy

    dan i

    t adalah variabel prediktor lain yang berhubungan secara tidak linier dengan i

    y , model tersebut dikatakan model semiparametrik dan dapat ditulis dengan :

    ( ) , 1, 2, ...,Ti i i i

    y X f t i n

    dimana, ( )i

    f t adalah fungsi yang tidak diketahui. Suatu model semiparametrik untuk data longitudinal dapat ditulis dengan :

    ( ) , 1, 2, ..., ; 1, 2, ...,Tij ij ij ij i

    y X f t i n j n Dengan menggunakan metode Penalized Likelihood diperoleh estimator komponen parametrik

    T T

    -1

    = X PX X Py dan estimator komponen nonparametrik

    1 1 1 ( )T T T -1f V K V I - X X PX X P y , dimana 1 1 1 1 1( )T P = V V V K V Kata kunci : regresi semiparametrik, data longitudinal, dan penalized likelihood. Abstract Let

    iy is response variable,

    iX is predictor variable which linear relation with

    iy and

    it is another

    predictor which nonlinear relation with i

    y , the model is semiparametric,

    ( ) , 1, 2, ...,Ti i i i

    y X f t i n

    where, ( )if t is unknown function. The semiparametriic model for longitudinal data is : ( ) , 1, 2, ..., ; 1, 2, ...,T

    ij ij ij ij iy X f t i n j n

    With using Penalized Likelihood method are obtained parametric component estimator

    T T

    -1

    = X PX X Py And nonparametric component estimator

    1 1 1 ( )T T T -1f V K V I - X X PX X P y , where 1 1 1 1 1( )T P = V V V K V Keywords: semiparametric regression, longitudinal data, and penalized likelihood

    I. LATAR BELAKANG

    Analisis regresi adalah salah satu alat statistik yang banyak digunakan untuk mengetahui

    hubungan antara dua atau lebih variabel. Misalkan y adalah variabel respon dan t adalah variabel

    prediktor, maka untuk n pengamatan hubungan variabel tersebut dapat dinyatakan dengan :

    ( ) , 1, 2, ...,i i i

    y f t i n

  • JIMT, Vol 5 No. 2, Nopember 2008 : 60-64:

    2

    dengan ( )i

    f t adalah fungsi regresi dan i

    adalah error random yang diasumsikan independen dan

    identik dengan mean 0 dan variansi 2 .

    Ada dua pendekatan yang dapat digunakan untuk mengestimasi ( )i

    f t yaitu pendekatan

    parametrik dan nonparametrik. Pendekatan parametrik digunakan bila bentuk fungsi ( )i

    f t diketahui

    berdasarkan pada teori dan pengalaman masa lalu. Sedangkan pendekatan nonparametrik digunakan

    bila tidak adanya informasi tentang bentuk hubungan variabel respon dan variabel prediktor. Namun

    dalam perkembangan analisis regresi, untuk mengatasi permasalahan bila variabel prediktornya tidak

    dapat diestimasi dengan pendekatan parametrik maupun nonparametrik, maka diperkenalkan regresi

    yang merupakan gabungan dari regresi parametrik dan regresi nonparametrik, yaitu regresi

    semiparametrik [1].

    Penelitian tentang regresi semiparametrik telah banyak dilakukan. [2] tentang estimator

    spline pada model semiparametrik. [3] tentang pendekatan kernel dalam regresi semiparametrik dan

    pemilihan bandwidth optimal. Dan [4] tentang model linier parsial pada hilangnya data komponen

    parametrik. Namun penelitian-penelitian tersebut hanya pada data cross section atau data yang

    diamati pada suatu waktu tertentu. Untuk kasus khusus, regresi semiparametrik dapat digunakan pada

    data longitudinal.

    II. TINJAUAN PUSTAKA

    II.1 Data Longitudinal

    Studi longitudinal didefinisikan sebagai suatu studi terhadap unit eksperimen dengan respon

    yang diamati dalam dua atau lebih interval. Data longitudinal adalah pengamatan berulang pada unit

    eksperimen, berbeda dengan data cross section yaitu data dari masing-masing individu diamati

    dalam sekali waktu [5]. Ada beberapa keuntungan dari studi mengenai data longitudinal

    dibandingkan dengan data cross section. Pertama, studi longitudinal lebih powerful dari studi cross

    section untuk sejumlah subjek yang tetap. Dengan kata lain, untuk memperoleh kekuatan uji statistik

    yang sama, studi longitudinal membutuhkan subjek yang lebih sedikit. Kedua, dengan jumlah subjek

    yang sama, hasil pengukuran error menghasilkan penaksir efek perlakuan yang lebih efisien dari data

    cross section. Ketiga, data longitudinal mampu menyediakan informasi tentang perubahan individu,

    sedangkan data cross section tidak [5].

  • Estimasi Parameter pada Regresi Semiparametrik untuk Data Longitudinal

    3

    II.2 Model Semiparametrik Untuk Data Longitudinal

    Regresi semiparametrik adalah gabungan antara regresi parametrik dan regresi

    nonparametrik. Model regresi semiparametrik dapat ditulis sebagai berikut :

    ( ) , 1, 2, ...,Ti i i i

    y X f t i n (1)

    dimana i

    y adalah variabel respon ke -i , iX adalah komponen parametrik, ( )if t adalah fungsi regresi

    dan i

    adalah error random, dimana 2(0, )i

    N . Regresi semiparametrik untuk data longitudinal

    dapat ditulis dengan :

    ( ) , 1, 2,..., ; 1, 2,...,Tij ij ij ij i

    y X f t i n j n (2)

    dimana terdapat n subjek dengan subjek ke-i mempunyai ni observasi menurut waktu. yij , i = 1,...,n,

    j = 1,...,ni merupakan respon untuk subjek ke-i pada waktu ke-j. 1 2( , , ..., )T

    p adalah vektor

    1p pada koefisien regresi parametrik i

    X , dengan Tij

    X diasumsikan tidak mempunyai intersep,

    ( )ij

    f t adalah fungsi yang terdeferensiabel dua kali dengan panjang periode sama dengan P dan ij

    adalah eror random yang saling bebas dengan mean 0 dan variansi 2 R .

    III. PEMBAHASAN

    Asumsi data mengikuti model pada persamaan (2) dengan 2m

    Wf dan 20N ( , R) .

    Estimasi parameter pada model regresi semiparametrik untuk data longitudinal, diperoleh dengan

    cara memaksimumkan Penalized Log Likelihood (PLL). Misalkan 1

    n

    i

    i

    N n

    dan 2V R maka

    fungsi distribusi dari adalah

    12

    1 1( ) exp

    2(2 )

    T

    Nf

    V

    V

    (3)

    selanjutnya akan dicari distribusi dari y = X + f + dengan metode Moment Generate Function

    (MGF) diperoleh :

  • JIMT, Vol 5 No. 2, Nopember 2008 : 60-64:

    4

    2

    ( ) [exp( )]

    [exp{ ( )}]

    exp( ( )) [exp( )]1

    exp( ( )) exp( )2

    1exp( ( ) )

    2

    T

    y

    T

    T T

    T T

    T T

    M E

    E

    E

    2

    t t y

    t X + f +

    t X + f t

    t X + f t Rt

    t X + f t Rt

    sehingga dari metode MGF diatas diperoleh 2( , )N y X + f R . Berikut diberikan fungsi likelihood

    dari y adalah:

    12 1( , , ) (2 ) exp 2N

    T

    f y V V (4)

    dengan y X f . Selanjutnya, untuk estimasi parameter dan fungsi f didapat dari

    memaksimumkan PLL. Diketahui fungsi log likelihood ( , , ) f y dari model semiparametrik tersebut

    adalah :

    11

    log ( ) log(2 ) log ( ) ( )2 2 2

    TN N , f, y ( V ) y X f V y X f (5)

    Selanjutnya, fungsi PLL untuk model (2) dapat ditulis dengan :

    2( , ) [ ]2

    b

    a

    PLL dt

    '' f, y f (t) (6)

    dimana ( , ) f, y merupakan fungsi likelihood, 0 merupakan parameter smoothing dan 2[ ]b

    a

    dt ''f (t)

    merupakan fungsi penalti. Persamaan (6) dapat disederhanakan dengan :

    1 1 1

    1 1 1

    1log(2 ) log( ) ( 2 2

    2 2 2

    2 )2

    T T T

    T T T T T T

    N NPLL

    V y V y y V X y V f

    X V X X V f + f V f f Kf

    (7)

    Dengan membuat 0PLL

    akan diperoleh :

  • Estimasi Parameter pada Regresi Semiparametrik untuk Data Longitudinal

    5

    1 1 1

    1 1 1

    12 2 2 0

    2

    0 (8)

    T T T

    T T T

    y V X X V X X V f

    X V y X V X X V f

    Selanjutnya dengan membuat 0PLL

    f

    akan diperoleh :

    1 1 11 1 1

    1 1

    1 1 1

    12 2 2 0

    20

    ( ) ( )

    ( ) ( ) (9)

    T T T T T

    T T T T

    T

    T

    y V X V f V f K

    y V X V V f K f

    V K f V y X

    f V K V y X

    Untuk memperoleh estimator , substitusi (9) ke (8) :

    1 1 1 1 1

    1 1 1 1 1 1 1 1

    1 1 1 1 1 1 1 1

    ( ) ( )

    ( ) ( )

    ( ) ( )

    (10)

    T T T T

    T T T T T T

    T T T T T T

    T T

    -1

    -1

    X V y X V X-X V K V y X = 0

    X V X X V K V X = X V X V K V y

    = X V X X V K V X XV X V K V y

    = X PX X Py

    dimana 1 1 1 1( )T P = V V K V

    Substitusi (10) ke (9), diperoleh :

    1 1 1

    1 1 1

    ( )

    ( ) (11)

    T T T

    T T T

    -1

    -1

    f = V K V y - X X PX X Py

    f V K V I - X X PX X P y

    Untuk mendapatkan matrik ( )A , substitusi (10) dan (11) ke :

    1 1 1

    1 1 1

    1 1 1 1 1 1

    ( )

    ( )

    ( ) ( )

    ( )

    T T T T T

    T T T T T

    T T T T

    -1 -1

    -1 -1

    -1

    y X f

    X X PX XPy V K V I-X X PX X P y

    X XPX X P V K V I-X X PX XP y

    I V K V X XPX X P V K V y

    A y

    dimana 1 1 1( ) ( )T T T -1A I V K V X X PX X P

  • JIMT, Vol 5 No. 2, Nopember 2008 : 60-64:

    6

    IV. KESIMPULAN

    Diberikan model ( )ij i ij ij

    y f t X dimana 1, 2, ..., , 1, 2, ...,i

    i n j n . Error random

    berdistribusi normal dengan mean nol dan variansi V . Berdasarkan analisis yang dilakukan dapat

    disimpulkan dalam estimasi model semiparametrik yaitu estimasi parameter untuk komponen

    parametrik diperoleh :

    1 T T

    X PX X Py

    dan estimasi komponen nonparametrik diperoleh :

    1 1 1 ( )T T T -1f V K V I - X X PX X P y dimana 1 1 1 1 1( )T P = V V V K V

    V. DAFTAR PUSTAKA

    [1] Engle, R. F., Granger, C. W. J., Rice, J., dan Weiss, A. 1986. Semiparametric Estimates of The

    Relation Between Weather and Electricity Sales, Journal of the American Statistical

    Association. Vol. 81, hal 310-320.

    [2] Srinadi, I.A.M. 2002. Estimator Spline pada Model Semiparametrik. Tesis. Surabaya: Institut

    Teknologi Sepuluh Nopember.

    [3] Mulianah. 2006. Pendekatan Kernel dalam Regresi Semiparametrik dan Pemilihan Bandwith

    Optimal. Tesis. Surabaya : Institut Teknologi Sepuluh Nopember.

    [4] Ampa, A. T. 2006. Model Linier Parsial Pada Hilangnya Data Komponen Parametri. Tesis.

    Surabaya : Institut Teknologi Sepuluh Nopember.

    [5] Kuswanto, H. 2005. Model Gamma-Frailty Untuk Data Longitudinal dan Pendugaan Korelasi

    Serial dengan Metode Composite Likelihood, Tesis. Surabaya : Institut Teknologi Sepuluh

    Nopember.