s_mat_0800266_chapter2

Upload: azhar-hr

Post on 05-Apr-2018

224 views

Category:

Documents


1 download

TRANSCRIPT

  • 7/31/2019 s_mat_0800266_chapter2

    1/29

    Pujia Siti Balkist, 2012Aplikasi Algoritma bBaum-Welch ....Universitas Pendidikan Indonesia | repository.upi.edu

    BAB II

    LANDASAN TEORI

    Pada bab ini akan dipaparkan teori-teori yang mendukung pembahasan

    dalam penelitian DNA menggunakan HMM. Teori-teori tersebut di antaranya

    teori peluang, peluang bersyarat, aturan Bayes, peubah acak, rantai Markov,

    HMM dan DNA.

    2.1 Teori Peluang

    Definisi 2.1:

    Misalkan S adalah suatu ruang sampel dari suatu eksperimen acak dan

    adalah kumpulan semua peristiwa yang bisa dibentuk dari S. Peluang pada S

    adalah fungsi P dengan domain A ke [0,1] yang memenuhi sifat-sifat sebagai

    berikut:

    1. 0, 2. = 1

    3. Jika

    1 ,

    2 ,

    ,

    adalah m buah peristiwa yang saling lepas dalam

    ,

    (artinya =, , , = , 2,, ) maka =1 = ( )=1 ,

    (Nar Herrhyanto dan Tuti Gantini, 2009).

  • 7/31/2019 s_mat_0800266_chapter2

    2/29

    9

    Teorema 2.1 :

    Misalkan A adalah sebuah peristiwa yang merupakan bagian dari ruang

    sampel diskrit (dapat terhitung) S. Bila suatu percobaan dapat menghasilkan

    macam hasil yang mungkin dan bila tepat sebanyak menunjukan banyaknya

    peristiwa A, maka peluang peristiwa A adalah

    =

    (Nar Herrhyanto dan Tuti Gantini, 2009).

    2.2 Peluang Bersyarat

    Peluang bersyarat adalah peluang terjadinya peristiwa B bila diketahui A

    terjadi, biasa dinyatakan dengan (Nar Herrhyanto dan Tuti Gantini, 2009). Definisi 2.2:Jika A dan B adalah dua buah peristiwa dalam ruang sampel S, maka

    peluang bersyarat dari B bila diketahui A terjadi didefinisikan dengan :

    =

    (

    )

    (

    )

    , (

    ) > 0

    (Nar Herrhyanto dan Tuti Gantini, 2009).

    Dari definisi tersebut, bila rumus dikalikan dengan ( ) , maka diperolehteorema perkalian yang penting.

    Teorema 2.2:

    Bila kejadian A dan B dapat terjadi pada suatu percobaan, maka

  • 7/31/2019 s_mat_0800266_chapter2

    3/29

    10

    = . ( | ) (Nar Herrhyanto dan Tuti Gantini, 2009).

    Teorema 2.3 :

    Bila dalam suatu percobaan, kejadian 1 , 2 , 3 ,dapat terjadi, maka 1 2 3 = 1 2 1 3 1 2 . (Nar Herrhyanto dan Tuti Gantini, 2009).

    2.3 Aturan Bayes

    Definisi 2.3:

    Peristiwa-peristiwa 1 , 2 ,, dikatakan partisi dari ruang sampel S, jika:

    a.

    =

    , untuk semua

    b. =1 =

    c. > 0 , untuk semua = 1,2, , (Nar Herrhyanto dan Tuti Gantini, 2009).

    Teorema 2.4:

    Jika peristiwa 1 , 2 ,

    , merupakan partisi dari ruang sampel S, maka

    peluang dari peristiwa A yang sembarang dari S adalah:

    = . ( | )=1 (Nar Herrhyanto dan Tuti Gantini, 2009).

  • 7/31/2019 s_mat_0800266_chapter2

    4/29

    11

    Teorema 2.5:

    Misalkan 1 , 2 ,

    , suatu himpunan kejadian yang merupakan suatu

    sekatan ruang sampel dengan ( ) > 0 untuk = 1,2, , . Misalkan A suatukejadian sembarang dalam S dengan > 0 . Maka untuk = 1,2, , ,

    = ( )( )=1 = ( | )( | )=1 (Nar Herrhyanto dan Tuti Gantini, 2009).

    2.4 Peubah Acak

    Definisi 2.4:

    Misal E adalah sebuah eksperimen dengan ruang sampelnya S. Sebuah

    fungsi X yang memetakan setiap anggota dengan sebuah bilangan real ( ) dinamakan peubah acak (Nar Herrhyanto dan Tuti Gantini, 2009).

    Definisi 2.5:

    Jika suatu ruang sampel mengandung titik yang berhingga banyaknya atau

    suatu deretan anggota yang banyaknya sama dengan banyaknya bilangan bulat

    (terhitung), maka peubah acak yang didefinisikan pada ruang sampel tersebut

    adalah peubah acak diskrit (Nar Herrhyanto, 1993).

    Definisi 2.6:

    Bila ruang sampel mengandung titik sampel yang tak berhingga

    banyaknya dan sama banyaknya dengan banyak titik pada suatu garis (tak

    terhitung), maka ruang sampel itu disebut ruang sampel kontinu dan peubah acak

  • 7/31/2019 s_mat_0800266_chapter2

    5/29

    12

    yang didefinisikan pada ruang sampel tersebut disebut peubah acak kontinu (Nar

    Herrhyanto, 1993) .

    Definisi 2.7:

    Fungsi ( ) adalah fungsi densitas peluang atau distribusi peluang suatupeubah acak diskrit bila,berlaku:

    1. 0 2.

    = 1

    3. = = ( ) (Nar Herrhyanto, 1993).

    Definisi 2.8:

    Distribusi kumulatif ( ) suatu peubah acak diskrit dengan distribusipeluang

    ( ) dinyatakan oleh: =

    =

    ( )(Nar Herrhyantodan Tuti Gantini, 2009).

    2.5 Proses Stokastik

    Definisi 2.9:

    Didefinisikan set indeks menyatakan 1 , 2 , 1 > 2 atau 1 = 2 .T dinamakan ruang parameter atau ruang indeks

    , dimana t merupakan

    parameter (Sheldon M. Ross, 1997).

    Secara umum (dalam terapannya), t menyatakan waktu.

    Definisi 2.10:

    Untuk setiap

    maka

    dinamakan peubah acak pada saat t

    (Sheldon M. Ross, 1997).

  • 7/31/2019 s_mat_0800266_chapter2

    6/29

    13

    Definisi 2.11:

    Koleksi atau barisan peubah acak

    =

    ( )

    dinamakan proses

    stokastik (Sheldon M. Ross, 1997).

    Definisi 2.12:

    Misalkan diketahui ruang parameter T dan barisan peubah acak merupakan suatu proses stokastik, sehingga:

    1. Jika T terbilang, maka barisan peubah acak

    disebut proses stokastik

    dengan ruang parameter diskrit

    2. Jika T tak terbilang, maka barisan peubah acak disebut proses stokastik dengan ruang parameter kontinu

    (Sheldon M. Ross, 1997).

    Definisi 2.13:

    Untuk setiap maka menyatakan peubah acak pada keadaan t,dengan range (himpunan hasil) ( ) atau ( ) yang dinamakan ruang keadaandari suatu proses stokastik.

    1. Jika ( ) diskrit dan ( ) diskrit, maka ini dinamakan proses stokastik dengan ruang keadaan diskrit

    2. Jika ( ) kontinu dan ( ) kontinu, maka ini dinamakan proses stokastik dengan ruang keadaan kontinu

    (Sheldon M. Ross, 1997).

  • 7/31/2019 s_mat_0800266_chapter2

    7/29

    14

    2.6 Rantai Markov

    Rantai Markov adalah sebuah proses Markov dengan ruang parameter

    yang diskrit yang berada pada suatu ruang keadaan yang diskrit (Sheldon M.

    Ross, 1997) . Analisis rantai Markov merupakan suatu teknik peluang yang

    menganalisis pergerakan peluang dari satu keadaan ke keadaan lainnya. Rantai

    Markov dikenalkan oleh Andrey Markov, ahli matematika dari Rusia yang lahir

    tahun 1856.

    Dalam analisis rantai Markov ini, ( = ) menyatakan peluang dariproses pada saat ke berada pada keadaan . Selain itu dianalisis pula pergerakanprobabilitas dari satu keadaan ke keadaan lainnya.

    Ada beberapa syarat yang harus dipenuhi agar suatu kasus dapat

    diterapkan dalam analisis rantai Markov (O. C. Ibe, 2009), yaitu sebagai berikut:

    1. Jumlah probabilitas transisi untuk suatu keadaan awal dari sistem bernilai

    1.

    2. Probabilitas-probabilitas tersebut berlaku untuk semua keadaan yang

    disertakan dalam sistem.

    3. Probabilitas transisi konstan sepanjang waktu.

    4. Keadaan merupakan keadaan yang independen sepanjang waktu.

    Misalkan terdapat n keadaan yang mungkin dalam suatu kasus rantai

    Markov yaitu 1 , 2 , , dengan barisan keadaan dalam suatu kasus yaitu1 , 2, 1 , = , sehingga 1 = 1 , 2 = 2 , = . Terdapat sifat dari

    rantai Markov yang harus selalu digunakan, yaitu keadaan sekarang tidak

    dipengaruhi oleh keadaan pada masa lampau, namun hanya dipengaruhi oleh

  • 7/31/2019 s_mat_0800266_chapter2

    8/29

    15

    keadaaan terdekat sebelumnya (Sheldon M. Ross, 1997), dirumuskan sebagai

    berikut:

    +1 = = , 1 = 1 ,, 2 = 2 , 1 = 1 = +1 = = =

    untuk semua keadaan 1 , 2 ,, 1 , , dan > 0 , dimana nilai yangmemungkinkan dari i adalah suatu himpunan terbatas yang sering disebut sebagai

    ruang keadaan. Probabilitas di atas umumnya disebut dengan nama peluang

    keadaan transisi yang sering dilambangkan dengan simbol yang memenuhi:

    1. 0 1 .2. = 1, = 1,2, =0 , .

    (Sheldon M. Ross, 1997)

    2.6.1 Matriks Peluang Transisi

    Matriks peluang transisi adalah matriks dimana elemen-elemennya

    menyatakan peluang suatu keadaan bergerak atau berpindah ke keadaan lainnya

    yang berukuran , dimana (menyatakan peluang transisi dari keadaaan

    ke keadaan ) merupakan elemen matriks pada baris ke- i dan kolom ke- j (SheldonM. Ross, 1997).

    =

    11 12

    21 22 12 1 2 Contoh 2.1:

    Misalkan Viola seorang gadis yang sangat gemar bermain suatu permainan

    komputer. Dalam sekali bermain, Viola dapat memainkan permainan komputer

  • 7/31/2019 s_mat_0800266_chapter2

    9/29

    16

    tersebut berkali-kali. Seorang peneliti melakukan serangkaian penelitian dalam

    suatu periode permainan Viola. Ternyata suasana hati Viola saat bermain

    permainan komputer saat ini dipengaruhi oleh suasana hati Viola saat bermain

    permainan komputer tersebut dalam permainan sebelumnya dalam periode waktu

    permainan yang sama. Suasana hatinya terdiri dari senang, sedih dan kesal.

    Jika dalam permainan sebelumnya suasana hati Viola senang, maka

    peluang suasana hati Viola dalam permainan selanjutnya senang, sedih, dan kesal

    adalah 0,5, 0,23 dan 0,27. Adapun jika dalam permainan sebelumnya Viola

    merasa sedih, maka peluang dalam permainan selanjutnya Viola merasa senang,

    sedih dan kesal adalah 0,35, 0,35 dan 0,3. Sedangkan jika dalam permainan

    sebelumnya Viola merasa kesal, maka peluang dalam permainan selanjutnya

    Viola merasa senang, sedih dan kesal adalah 0,42, 0,35 dan 0,23.

    Jika peristiwa muncul suasana hati senang dinyatakan sebagai keadaan 1,

    peristiwa muncul suasana hati kesal dinyatakan sebagai keadaan 2 dan peristiwa

    muncul suasana hati kesal dinyatakan sebagai keadaan 3, maka permasalahan

    tersebut dapat dinyatakan dalam matriks peluang transisi dengan ordo 3x3 sebagai

    berikut:

    = 0,5 0,23 0,270,35 0,35 0,30,42 0,35 0,23

    Analisis permasalahan tersebut juga dapat dinyatakan dalam diagram

    keadaan transisi sebagai berikut:

  • 7/31/2019 s_mat_0800266_chapter2

    10/29

    17

    Gambar 2.1 Diagram Transisi Contoh 2.1

    Probabilitas Transisi -Langkah

    Misalkan menyatakan peluang bahwa jika suatu proses dimulai

    pada keadaan -i, maka suatu saat proses akan berpindah ke keadaan -j setelah

    melalui tepat langkah. Nilai dapat dihitung dengan persamaan Chapman-

    Kolmogorov (Sheldon M. Ross, 1997):

    =

    ,

    0 < <

    Sehingga dapat dinyatakan sebagai entri pada baris ke- i dan kolom

    ke- j pada matriks . Sehingga untuk suatu rantai Markov dengan keadaan ,

    adalah matriks:

    senang kesal

    sedih

    0,5 0,27

    0,23

    0,42

    0,23

    0,3 50,35

    0,3

    0,35

  • 7/31/2019 s_mat_0800266_chapter2

    11/29

    18

    =

    11 12 13

    21 22 23

    31 32 33

    1

    2

    3

    1 2 3

    2.6.2 Klasifikasi keadaan

    Keadaan -j dikatakan dapat dicapai dari keadaan -i jika, suatu proses

    dimulai pada keadaan -i maka suatu saat proses tersebut akan berada pada

    keadaan -j. Hal ini mengakibatkan bahwa > 0 untuk suatu > 0 . Sehingga

    dari probabilitas n-langkah bisa diperoleh informasi ketercapaian dari sebarang

    keadaan (Sheldon M. Ross, 1997) .

    Dua buah keadaan yang saling dapat dicapai satu sama lain dikatakan

    terhubung satu sama lain. Konsep keterhubungan membagi keadaan ke dalam

    beberapa kelas. Dua buah keadaan yang saling terhubung dikatakan berada dalam

    sebuah kelas yang sama. Semua anggota dari suatu kelas saling terhubung satu

    sama lain. Jika suatu kelas tidak terhubung dari keadaan lain yang ada di luar

    kelas tersebut, maka kelas tersebut dikatakan kelas yang tertutup dari

    keterhubungan (Sheldon M. Ross, 1997).

    Klasifikasi keadaan ini untuk memudahkan peneliti rantai Markov

    memahami keterhubungan dari masing-masing keadaan. Sehingga peneliti lebih

    teliti dalam mengaplikasikan rantai Markov pada suatu kasus.

    Sebuah rantai Markov yang semua keadaan -nya terhubung atau hanya

    terdiri dari satu kelas dinamakan rantai Markov yang irreducible (Sheldon M.

    Ross, 1997) . Contoh rantai Markov irreducible ditunjukkan pada Gambar 2.1.

  • 7/31/2019 s_mat_0800266_chapter2

    12/29

    19

    2.7 Hidden Markov Models (HMM)

    Dalam rantai Markov dianalisis pergerakan probabilitas keadaan yang

    diteliti. Muncul permasalahan baru jika terdapat suatu keadaan dalam penelitian

    yang dipengaruhi oleh keadaan lain namun keadaan lain tersebut tidak dapat

    diobservasi. Sehingga para ahli mengembangkan teori yang lebih baik dari rantai

    Markov untuk menyelesaikan permasalahan tersebut.

    Sehingga pada tahun 1970 ahli Matematika yaitu Baum dan Petrie

    memperkenalkan suatu teori pengembangan dari rantai Markov yang dipaparkan

    oleh Andrei A. Markov pada tahun 1856 yaitu Model Markov Tersembunyi atau

    Hidden Markov Model yang disingkat HMM untuk menyelesaikan suatu kasus

    dimana suatu keadaan dalam kasus tersebut dipengaruhi oleh keadaan lain yang

    tidak terobservasi, selanjutnya keadaan yang tidak terobservasi ini disebut

    keadaan tersembunyi.

    HMM adalah gabungan dari dua proses stokastik yang salah satu nya tidak

    dapat diobservasi secara langsung, namun tetap dapat diobservasi dengan cara

    menganalisis peluang dari salah satu proses stokastik yang dapat diobservasi (Nisa

    Pandu, 2011).

    Jika = 1 , 2 ,adalah sebuah rantai Markov, dan = 1 , 2 , adalah sebuah fungsi dari , dimana dan merupakan proses stokastik, maka adalah sebuah HMM yang dapat diobservasi melalui , atau dapat ditulis

    = ( ) untuk suatu fungsi . Parameter menyatakan proses keadaan yang

  • 7/31/2019 s_mat_0800266_chapter2

    13/29

    20

    tersembunyi, sementara parameter menyatakan proses keadaan yang dapat

    diobservasi. Untuk ilustrasi HMM dapat dilihat gambar 2.2 berikut:

    Gambar 2.2 Ilustrasi HMM

    2.7.1 Parameter-parameter dalam HMM

    Pada rantai Markov dikenal 3 parameter yaitu banyaknya keadaan serta

    himpunan dari keadaan tersebut, barisan keadaan dan matriks transisi yang

    menyatakan peluang pergerakan/ perpindahan dari satu keadaan ke keadaan

    lainnya. Namun dalam HMM dikenal 5 parameter yaitu sebagai berikut:

    1. N menyatakan jumlah keadaan yang tersembunyi (tidak terobservasi,

    namun dapat diobservasi melalui keadaan yang terobservasi).

    2. M menyatakan jumlah keadaan yang terobservasi.

    3. Matriks peluang transisi A , berukuran , dimana elemen-elemen

    ( ) dari matriks ini menyatakan peluang transisi (pergerakan/

    perpindahan) dari keadaan tersembunyi ke- ke keadaan tersembunyi ke- ( 1

    , 1

    ), dimana untuk

    dan 1

    dipenuhi

    =1 = 1 , yaitu sebagai berikut:

  • 7/31/2019 s_mat_0800266_chapter2

    14/29

    21

    =

    11 12

    21 22

    1

    2

    1 2

    4. Matriks peluang emisi B , berukuran , dimana elemen-elemen ( )

    dari matriks ini menyatakan peluang keadaan tersembunyi ke- berada

    pada keadaan terobservasi ke- (1 , 1 ), dimana untuk dan 1

    dipenuhi =1 = 1 , yaitu sebagai berikut:

    =

    11 12

    21 22

    1

    2

    1 2

    5. Matriks peluang keadaan awal , berukuran 1 , dimana elemen-

    elemen ( ) menyatakan peluang awal dari keadaan tersembunyi ke-

    (1

    ), dimana =1 yaitu sebagai berikut:

    =12

    Penentuan matriks keadaan awal tidak secara sembarang. Jika peluang

    awal untuk setiap keadaan tersembunyi tidak diketahui dan masing-masing

    keadaan tersembunyi memiliki kesempatan muncul yang sama, maka peluang

    awal dari masing-masing keadaan tersembunyi sama. Namun jika suatu barisan

    keadaan tersembunyi sebelumnya pada suatu kasus dapat diketahui maka matriks

    peluang keadaan awal dapat ditentukan dengan menghitung jumlah dari suatu

    keadaan tersembunyi tertentu yang muncul dalam suatu barisan keadaan

    tersembunyi dan membaginya dengan jumlah seluruh barisan keadaan

  • 7/31/2019 s_mat_0800266_chapter2

    15/29

    22

    tersembunyi. Sehingga HMM dinyatakan sebagai Model dengan N keadaan

    tersembunyi, M keadaan terobservasi, dan parameter = (

    , , ) .

    2.7.2 Asumsi-asumsi pada HMM

    Ada tiga asumsi pokok yang dibutuhkan dalam HMM (Nisa Pandu, 2011),

    yaitu:

    1. Asumsi Markov

    Asumsi ini menyatakan bahwa keadaan (tersembunyi dan terobservasi)

    berikutnya hanya dipengaruhi oleh keadaan (tersembunyi dan terobservasi)

    saat ini. Model yang dihasilkan adalah HMM orde pertama. Pada beberapa

    kasus di kehidupan nyata, keadaan (tersembunyi dan terobservasi)

    selanjutnya mungkin dipengaruhi oleh k keadaan (tersembunyi dan

    terobservasi) sebelumnya, yang akan menghasilkan HMM orde ke- k yang

    lebih sulit untuk dianalisis dari pada HMM orde pertama.

    2. Asumsi stasioneritas

    Asumsi ini menyatakan bahwa pada dua buah rentang waktu tertentu yang

    panjangnya sama, peluang transisi dari suatu keadaan tersembunyi ke

    keadaan tersembunyi lainnya adalah sama. Sehingga untuk sembarang 1

    dan 2 berlaku :

    1 +1 = 1 = = 2 +1 = 2 = = (2.1)

  • 7/31/2019 s_mat_0800266_chapter2

    16/29

    23

    3. Asumsi independensi/kebebasan

    Jika diketahui suatu barisan observasi dengan T menunjukkan panjang

    barisan observasi, yaitu = 1 , 2 ,, dan suatu barisan keadaantersembunyi = 1 , 2 ,, . Maka pengamatan saat ini bersifatindependen secara statistik dengan pengamatan sebelumnya, atau dapat

    dinyatakan:

    , = ( |

    , )=1 (2.2)

    Contoh 2.2

    Viola yang sangat gemar bermain suatu permainan komputer. Dalam satu

    periode permainan, Viola dapat memainkan permainan komputer tersebut berkali-

    kali. Dalam periode permainan tersebut Viola bisa menang dan kalah. Sehingga

    menang dan kalah ini merupakan suatu barisan observasi. Namun terdapat suatu

    hal yang sangat mempengaruhi dia menang atau kalah yaitu suasana hatinya yang

    tidak terobservasi sehingga disebut keadaan tersembunyi yang terdiri dari senang,

    sedih, dan kesal. Suasana hati tersebut muncul dan berubah-ubah sesuai dengan

    status permainan sebelumnya (menang atau kalah).

    Jika saat ini Viola senang maka peluang suasana hatinya dalam permainan

    selanjutnya akan senang, sedih, dan kesal adalah 0,5, 0,23 dan 0,27. Jika saat ini

    Viola sedih maka peluang suasana hatinya dalam permainan selanjutnya akan

    senang, sedih dan kesal adalah 0,35, 0,35 dan 0,3. Sedangkan jika saat ini Viola

    kesal maka peluang suasana hatinya dalam permainan selanjutnya akan senang,

    sedih dan kesal adalah 0,42, 0,35 dan 0,23. Selain itu peluang Viola menang

  • 7/31/2019 s_mat_0800266_chapter2

    17/29

    24

    dalam keadaan hatinya senang, sedih dan kesal adalah 0,8, 0,55 dan 0,35. Peluang

    Viola kalah dalam keadaan hatinya senang, sedih dan kesal adalah 0,2, 0,45 dan

    0,65.

    Kasus tersebut memenuhi asumsi HMM yaitu:

    1. Asumsi Markov terpenuhi, artinya keadaan terobservasi (menang atau

    kalah) saat ini hanya dipengaruhi oleh keadaan terobservasi terdekat

    sebelumnya dan keadaan tersembunyi (senang, sedih atau kesal) saat ini

    hanya dipengaruhi oleh keadaan tersembunyi terdekat sebelumnya.

    2. Asumsi stasioneritas terpenuhi, artinya pada dua buah rentang waktu

    tertentu yang panjangnya sama, peluang transisi dari suatu keadaan

    tersembunyi (senang, sedih atau kesal) ke keadaan tersembunyi lainnya

    adalah sama.

    3. Asumsi independensi/kebebasan terpenuhi, artinya pengamatan pada kasus

    Viola ini tidak dipengaruhi oleh pengamatan pada kasus Viola dalam

    periode waktu lain sebelumnya.

    Sehingga contoh kasus tersebut dapat diselesaikan menggunakan HMM,

    dengan N, M , matriks transisi A, matriks emisi B , dan matriks prior sebagai

    berikut:

    1. Keadaan tersembunyi yaitu suasana hati yang terdiri dari senang, sedih,

    dan kesal. Maka jumlah keadaan tersembunyi yaitu = 3 .

    2. Keadaan terobservasi yaitu status permainan yang terdiri dari menang dan

    kalah. Maka jumlah keadaan terobservasi yaitu = 2 .

  • 7/31/2019 s_mat_0800266_chapter2

    18/29

    25

    3. Matriks peluang transisi dari keadaan tersembunyi A (berordo 3 3 ),

    yaitu:

    = 0,5 0,23 0,270,35 0,35 0,30,42 0,35 0,23 4. Matriks peluang emisi B (berordo 3 2 ), yaitu :

    =0,8 0,2

    0,55 0,450,35 0,65

    5. Matriks prior (berordo 3 1 ), yaitu:

    =

    13

    13

    13

    2.7.3 Masalah-masalah Utama dalam HMM dan Metode Penyelesaiannya

    Dalam HMM terdapat beberapa permasalahan yang utama, yaitu

    menghitung peluang observasi dengan algoritma Maju dan Mundur, menentukan

    barisan keadaan tersembunyi dengan algoritma Viterbi dan mengestimasi

    parameter-parameter dalam HMM dengan algoritma Baum Welch.

    2.7.3.1 Menghitung Peluang Observasi dengan Penyelesaian Algoritma Maju

    dan Algoritma Mundur

    A. Algoritma Maju

    Algoritma maju adalah proses iterasi yang didasarkan pada perhitungan

    peluang bersyarat melalui sifat-sifat pada peluang. Dengan menggunakan definisi

    peluang bersyarat ( | ) dapat dihitung, namun operasi perhitungan yang

  • 7/31/2019 s_mat_0800266_chapter2

    19/29

    26

    dibutuhkan akan bertambah banyak karena operasinya akan naik secara

    eksponensial, seiring dengan bertambah panjangnya barisan observasi yang ada

    (Nisa Pandu, 2011). Algoritma ini menyimpan nilai yang telah dihitung pada

    iterasi sebelumnya, sehingga mereduksi 2 . menjadi 2 operasi. Algoritma

    ini akan sangat efisien ketika panjang barisan observasinya cukup besar.

    Didefinisikan sebagai variabel maju, dimana:

    = ( 1 , 2 ,

    , ,

    = | ) (2.3)

    dengan menyatakan total peluang observasi yang berakhir pada keadaan

    tersembunyi i pada saat dimana = 1,2, , jika diketahui suatu barisanobservasi 1 , 2 ,, . Menurut Rabiner (1989), secara umum algoritma majuterdiri atas tiga bagian, yaitu:

    1. Tahap inisialisasi

    1 = 1 dimana 1 (2.4)2. Tahap induksi+1 = =1 ( +1 ) = 1, , , = 1, , 1 (2.5)

    3. Tahap terminasi

    Pada tahap ini adalah menjumlahkan semua peluang gabungan dari

    observasi dan keadaan tersembunyi bila diketahui sebuah model sehingga

    diketahui peluang marjinal dari observasi tersebut atau ditulis:

    = ( )=1 (2.6)

  • 7/31/2019 s_mat_0800266_chapter2

    20/29

    27

    B. Algoritma Mundur

    Langkah algoritma mundur hampir sama dengan algoritma maju. Namun

    bedanya, pada algoritma mundur inisialisasi didasarkan pada seluruh observasi

    yang ada. Jadi algoritma mundur mengganti 1 , 2 ,, menjadi+1 , +2 ,, .

    = ( +1 , +2 ,, | = , ) (2.7)Tahap-tahap algoritma mundur dijelaskan sebagai berikut:

    1. Tahap inisialisasi

    = 1 untuk = 1,2, , (2.8)Pada tahap ini, dinyatakan = 1 karena diasumsikan adalah keadaan

    terobservasi akhir, dan bernilai nol untuk yang lainnya.

    2. Tahap induksi

    = +1 =1 +1 (2.9)Untuk = 1, 2,,1 dan = 1,2, ,

    3. Tahap Terminasi

    = =1 1 1 ( ) (2.10)

    Algoritma maju maupun algoritma mundur akan menghasilkan peluang

    observasi yang bernilai sama.

    Contoh 2.3

    Pandang kembali kasus permainan komputer Viola. Dalam suatu periode

    permainan misalkan Viola memainkan 4 kali permainan, jika ingin diketahui

  • 7/31/2019 s_mat_0800266_chapter2

    21/29

    28

    peluang barisan status permainan yang dimainkan misalnya menang, kalah,

    menang dan menang menggunakan Algoritma Maju dan Algoritma Mundur.

    Sehingga akan dihitung peluang bahwa model = , , menghasilkanbarisan observasi = , , , , jika diketahui:

    = 0,5 0,23 0,270,35 0,35 0,30,42 0,35 0,23 , = 0,8 0,20,55 0,450,35 0,65 =

    1313

    13

    Penyelesaian:

    Permasalahan tersebut akan diselesaikan dengan menggunakan algoritma

    maju dan mundur dimana panjang barisan observasi = 4 .

    Algoritma Maju

    Tabel 2.1 Hasil perhitungan

    1 2 3 41 0,267 0,049 0,0742 0,04774 2 0,183 0,075 0,0399 0,021 3 0,1167 0,1 0,0205 0,0128

    = , , , ==1

    = 0,08154

    Algoritma Mundur

    Tabel 2.2 Hasil perhitungan

    4 3 2 11 1 0,621 0,379 0,139 2 1 0,5775 0,349 0,153 3 1 0,609 0,369 0,142

  • 7/31/2019 s_mat_0800266_chapter2

    22/29

    29

    = 1=1

    1 = 0,08154

    Sehingga peluang Viola menang, kalah, menang dan menang dalam

    periode permainan tersebut adalah 0,08154.

    2.7.3.2 Menentukan Barisan Keadaan Tersembunyi dengan Penyelesaian

    Algoritma Viterbi

    Didefinisikan ( ) dimana = ( = | , ) . Jika ( ) dijumlahkan terhadap , karena = merupakan partisi dari X maka menurutaturan Bayes mengenai partisi, hasilnya menjadi

    = ( = | , )=1 = 1 (2.11)

    Algoritma Viterbi diperkenalkan oleh Andrew J. Viterbi pada tahun 1967.

    Algoritma ini pertama kali digunakan untuk menyelesaikan masalah pengkodean

    yang rumit, namun akhir-akhir ini algoritma Viterbi telah banyak digunakan untuk

    mempermudah penyelesaian masalah pada bidang-bidang lain. Salah satunya,

    algoritma Viterbi digunakan dalam HMM untuk mencari barisan keadaan

    tersembunyi yang paling optimal dari suatu barisan observasi (Nisa Pandu, 2011).

    Didefinisikan,

    arg max (2.12)

    yaitu argumen y yang bersesuaian dengan nilai maksimum dari z. Algoritma

    Viterbi memaksimalkan ( , ) dan probabilitas bersyarat ( | ) secarabersamaan berdasarkan fakta bahwa

    max , = argmax

    (

    , | )

    ( | )

  • 7/31/2019 s_mat_0800266_chapter2

    23/29

    30

    Algoritma Viterbi mendefinisikan:

    = max 1,

    2,

    ,

    1 (1 , 2 ,

    , ,

    1 ,

    2 ,

    ,

    1 ,

    = (2.13)

    dan

    = max 1 1 (2.14)Variabel menyatakan peluang terbesar sepanjang t observasi pertama

    dan berakhir pada keadaan tersembunyi i. Sehingga merupakan peluang dari

    barisan keadaan tersembunyi yang paling optimal untuk barisan observasi secara

    parsial. Sementara menyimpan keadaan tersembunyi sebelumnya yang akanmembentuk barisan keadaan tersembunyi yang paling optimal.

    Algoritma Viterbi terdiri atas empat tahap:

    1. Tahap inisialisasi

    Pada saat t=1,

    1 = ( 1 = , 1 ) = 1 | 1 = ( 1 = ) Dengan mensubstitusi asumsi awal pada HMM yaitu

    = = = dan = = Diperoleh:

    1 = 1

    Pada tahap ini

    1 = 0

    2. Tahap rekursi

    Pada tahap rekursi,

    = max 1

    ,

    2,

    ,

    1 (1 , 2 ,

    ,

    1 , ,

    1 ,

    2 ,

    ,

    1 ,

    =

  • 7/31/2019 s_mat_0800266_chapter2

    24/29

    31

    = max 1 , 2 ,, 1 {( | 1 , 2 ,, , 1 , 2 ,, 1 , = , ) ( 1 , 2 ,

    , 1 ,

    1 ,

    2 ,

    ,

    1 ,

    =

    , )}

    = max1 ( = | 1 = ) 1 = max1 1

    3. Tahap terminasi

    = max1 (2.15)

    = max 1 (2.16)4. Tahap backtracking

    = +1 +1, = 1, 2,,1 (2.17)Tahap backtracking memungkinkan barisan keadaan tersembunyi yang

    paling optimal ditemukan dari titik terakhir yang disimpan pada tahap rekursi.

    Contoh 2.4

    Perhatikan kembali kasus permainan komputer Viola dengan barisan

    observasi = , , , . Setelah diketahui peluang

    observasinya adalah 0,08154, maka permasalahan selanjutnya adalah menentukan

    barisan keadaan tersembunyi yang optimal pada kasus ini yaitu suasana hati

    Viola.

    Penyelesaian:

    Hasil perhitungan adalah sebagai berikut:

  • 7/31/2019 s_mat_0800266_chapter2

    25/29

    32

    Tabel 2.3 Hasil perhitungan

    1 2 3 41 0,267 0,0267 0,0157 0,00628 2 0,183 0,0288 0,00902 0,001985 3 0,1167 0,04686 0,00377 0,00147

    Hasil perhitungan adalah sebagai berikut:

    Tabel 2.4 Hasil perhitungan

    1 2 3 41 0 1( ) 3( ) 1( ) 2 0 2( ) 3( ) 1( ) 3 0 1( ) 3( ) 1( )

    = 0,00628 4= 1( )

    = +1 (

    +1)

    3= 4 4= 4 1 = 1 2= 3 3= 3 1 = 3( ) 1= 2 2= 2 3 = 1( ) Jadi saat status permainan komputer Viola menang, kalah, menang,

    menang, maka barisan keadaan tersembunyi (suasana hati Viola) yang paling

    optimal adalah = {1 , 3 , 1 , 1( )}.2.7.3.3 Penaksiran Parameter-parameter HMM dengan Algoritma Baum

    Welch

    Permasalahan ketiga berkaitan dengan bagaimana menentukan estimasi 3

    parameter HMM yaitu

    , , dan sehingga terbentuk model baru = (

    , , )

  • 7/31/2019 s_mat_0800266_chapter2

    26/29

    33

    dimana . Dengan kata lain, permasalahan ketiga adalah masalahoptimasi, dan permasalahan yang harus dipecahkan adalah mengestimasi model

    terbaik yang dapat menjelaskan suatu barisan observasi.

    Untuk menyelesaikan permasalahan terakhir pada HMM ini, biasanya

    digunakan algoritma Baum-Welch yang akan dibahas lebih lanjut pada bab III.

    2.8 Deoxyribonulcleic Acid (DNA)

    DNA pertama kali berhasil dimurnikan pada tahun 1868 oleh ilmuwan

    Swiss Friedrich Miescher di Tubingen, Jerman, yang menamainya nuclein

    berdasarkan lokasinya di dalam inti sel. Perkembangan penelitian mengenai DNA

    berkembang terutama setelah Gregory Mendell mengemukakan teori genetika

    dalam penelitiannya dengan menggunakan kacang ercis (Wikipedia).

    Genetika adalah ilmu yang mempelajari sifat atau karakter yang

    diturunkan dari satu generasi ke generasi berikutnya secara turun-temurun. Bagian

    yang diturunkan bukanlah sifat itu sendiri melainkan suatu faktor yang disebut

    gen. Gen terletak pada tempat khusus yang disebut locus pada kromosom (bagian

    dari suatu sel) yang terdapat dalam inti sel. Bahan dasar inti sel adalah protein

    yang khas yang disebut protein inti atau nukleoprotein . Nukleoprotein dibangun

    oleh senyawa protein dan asam nukleat. Menurut Thomas Hunt Morgan, di dalam

    inti sel terdapat bermacam-macam asam nukleat, tetapi asam nukleat yang

    berhubungan dengan hereditas (penurunan sifat) diantaranya adalah DNA

    (deoxyribonucleic acid ) (Ida Herlina, 2006).

    http://id.wikipedia.org/w/index.php?title=Friedrich_Miescher&action=edit&redlink=1http://id.wikipedia.org/wiki/Tubingenhttp://id.wikipedia.org/wiki/Jermanhttp://id.wikipedia.org/wiki/Jermanhttp://id.wikipedia.org/wiki/Tubingenhttp://id.wikipedia.org/w/index.php?title=Friedrich_Miescher&action=edit&redlink=1
  • 7/31/2019 s_mat_0800266_chapter2

    27/29

    34

    DNA ( deoxyribonucleic acid ) adalah sejenis asam nukleat (hasil susunan

    protein) yang tergolong biomolekul (molekul yang hidup) utama penyusun setiap

    organisme (makhluk hidup). Di dalam sel, DNA umumnya terletak di dalam inti

    sel sehingga memiliki peran yang sangat penting bagi setiap makhluk hidup

    (Wikipedia).

    Peran DNA dalam sebuah sel adalah sebagai materi genetik, artinya materi

    yang bertugas menurunkan sifat pada keturunannya. Sebagai contoh sepasang

    suami istri yang memiliki seorang anak, maka anak itu akan mewarisi fisik dari

    ibu maupun ayahnya.

    Berdasarkan karakteristik kimia, DNA merupakan polimer (gabungan dari

    beberapa monomer, monomer: rantai protein) yang terdiri dari tiga komponen

    utama (Ida Herlina, 2005) yaitu:

    1. Gugus fosfat

    2. Gula deoksiribosa

    3. Basa nitrogen (gugus protein penyusun DNA) yang terdiri dari Adenine

    (A) , Guanine (G) , Cytosine (C), dan Thymine (T) (1953, James Watson

    dan Francis Crick).

    Keempat macam basa nitrogen/gugus protein (A,G,T,C) akan membentuk

    kode-kode genetik pada DNA. Kode-kode genetik tersebut terdiri atas 3 buah basa

    nitrogen yang dapat mengkodekan 1 asam amino.

    Suatu kenyataan bahwa keanekaragaman merupakan fenomena penting

    dalam dunia kehidupan. Keanekaragaman berasal dari proses evolusi yang

    didasari oleh perubahan-perubahan genetis. Perubahan dalam materi genetik yang

  • 7/31/2019 s_mat_0800266_chapter2

    28/29

    35

    dapat diproduksi dan diwariskan pada generasi berikutnya disebut mutasi (Ida

    Herlina, 2006) .

    Mutasi terdiri dari 2 macam yaitu mutasi somatik (terjadi pada sel-sel

    tubuh) dan mutasi germinal (terjadi pada sel-sel kelamin). Contoh mutasi di

    antaranya sindroma Turner (keterbelakangan mental) yang ditemukan oleh H.H.

    turner pada tahun 1938, sindroma klinefelter, sindroma Patau dan sindroma

    Down (Ida Herlina, 2006).

    Namun mutasi tidak seluruhnya merugikan bagi kehidupan manusia,

    karena para ahli menerapkan mutasi untuk mengembangkan teknologi pangan

    maupun ternak dan menelaah lebih lanjut mengenai penyakit yang diturunkan

    beserta usaha untuk menanggulanginya.

    Usaha tersebut yaitu rekayasa genetika yaitu rekombinasi DNA.

    Rekombinasi DNA adalah teknik menyusun DNA asing ke dalam molekul DNA

    suatu organisme. Tujuannya adalah agar organisme yang disisipi DNA asing

    memiliki kemampuan untuk mengekspresikan gen baru.

    Dalam penelitian DNA terdapat metode DNA sequence allignment atau

    penyejajaran DNA yang dilakukan untuk meneliti kecocokan DNA baru dengan

    DNA sebelumnya (Wikipedia). Penyejajaran DNA ini juga dilakukan untuk

    melihat kecocokan DNA dari beberapa spesies yang berbeda, misalnya antara

    manusia dan tikus atau lainnya. Dalam penyejajaran DNA ini jika suatu basa

    nitrogen penyusun DNA suatu spesies sama dengan basa nitrogen penyusun DNA

    dari spesies lain sama maka dikatakan cocok, jika tidak sama maka dikatakan

  • 7/31/2019 s_mat_0800266_chapter2

    29/29

    36

    sebagai sisipan dan jika terdapat suatu basa nitrogen yang hilang maka dikatakan

    sebagai hapusan (Wikipedia).

    Salah satu peran matematika dalam proses rekayasa genetika ini adalah

    Hidden Markov Model (HMM) yang digunakan dalam meneliti barisan basa

    nitrogen yang terdapat dalam DNA. Terutama dalam DNA sequence allignment,

    yaitu proses pencocokan DNA yang diteliti dengan DNA lain yang terarsip

    sebelumnya (wikipedia.org). Sehingga akan dipaparkan lebih lanjut mengenai

    aplikasi dari HMM dalam suatu DNA terutama aplikasi algoritma Baum-Welch

    untuk menentukan parameter-parameter pada HMM pada bab III dan IV.

    Salah satu hal yang erat kaitannya dengan DNA adalah taksonomi yaitu

    ilmu yang mempelajari urutan kekerabatan makhluk hidup. Sehingga dalam

    penelitian berikutnya mengenai DNA akan digunakan penyejajaran suatu DNA

    dengan DNA lain yang memiliki urutan taksonomi (urutan kekerabatan) cukup

    dekat. Sehingga dalam penelitian mutasi suatu spesies, harus ditentukan terlebih

    dahulu sampel DNA spesies lain yang mirip sehingga dapat dijadikan sampel

    pambanding untuk meneliti mutasi pada spesies tersebut. Penelitian tingkat

    kecocokan dalam menentukan sampel tersebut dapat menggunakan HMM yang

    akan dibahas lebih lanjut dalam bab IV.