dna sidik jari

1

BAB 1

PENDAHULUAN

1.1 Latar Belakang

Saat ini perkembangan bioteknologi molekuler cukup pesat. Besarnya

database sequence biologi seperti DNA, RNA dan rangkaian protein tentu

memerlukan sistem penggalian data yang tepat dan terotomasi sehingga dapat

mengurangi biaya penelitian. Hal ini kemudian melatarbelakangi pentingnya teknik

analisis sequence. Dasar analisis sequence adalah untuk mengetahui hubungan dua

sequence. Proses ini dilakukan dengan cara mensejajarkan kedua sequence kemudian

menentukan bahwa dari hasil pensejajaran keduanya mempunyai keterkaitan atau

tidak. Beberapa permasalahan dalam analisis sequence yaitu pemilihan tipe

pensejajaran, penentuan sistem scoring dan penentuan algoritma yang tepat untuk

memperoleh hasil scoring pensejajaran yang optimal. Selain itu, metode statistik juga

digunakan untuk mengevalusi signifikasi dari skor pensejajaran (Durbin, 1998).

Pada kajian ilmu biologi molekuler modern dijelaskan bahwa sequence

DNA/RNA dan sequence protein merupakan unit dasar yang terlibat dalam fungsi

biologis khusus sehingga bisa dikatakan bahwa sequence biologis hanyalah

kombinasi dari unit-unit dasar. Karakteristik fungsional dari sequence tersebut tidak

hanya melibatkan struktur utamanya, tetapi juga bentuk tiga dimensinya.

Asam deoksiribonukleat (deoxyribonucleic acid) atau biasa disebut DNA, adalah

biomolekul yang berupa rangkaian asam nukleat yang terdapat dalam inti sel

(nucleus) pada sel eukariotik sedangkan pada sel prokariotik DNA tersebut berada di

sitoplasma. Basa nitrogen terdiri dua jenis yaitu basa purin dan pirimidin. Basa purin

terdiri dari adenin (A) dan guanin (G) sedangkan pirimidin terdiri dari sitosin (C) dan

timin (T). Satu asam nukleat terdiri dari satu molekul gula ribosa, satu basa nitrogen

dan fosfat. Satu asam nukleat dengan asam nukleat yang lain dirangkai dengan ikatan

2

fosfodiester. DNA berfungsi untuk menyimpan informasi genetik pada suatu

organisme (Yuwono,2008)

DNA pada setiap spesies akan berbeda satu sama lainnya. Adanya perbedaan

genetik diantara individu atau organism ini, kemudian melahirkan berbagai sistem

identifikasi berbasis DNA, yang disebut sebagai ‘pencocokan sidikjari DNA’ (DNA

fingerprinting). Teknik tersebut berfokus pada penelusuran perbedaan genetik sekecil

mungkin yang dapat terjadi diantara dua deretan DNA (yang mengandung kompisis 4

macam basa nukleotida A,T,C dan G). teknik sidik jari DNA dapat diterapkan pada

penentuan spesies asal.

Pada permasalahan mutasi sequence, solusi untuk pensejajaran sequence dapat

menggunakan program dinamik. Algoritma alignment berbasis program dinamik

merupakan suatu algoritma yang seringkali digunakan untuk menyelesaikan

permasalahan optimalisasi pada berbagai macam bidang. Validitas algoritma ini

bergantung pada ada atau tidaknya substruktur optimal pada permasalahan tersebut,

dengan kata lain apakah permasalahan tersebut telah memenuhi prinsip

pengoptimalan atau tidak (Shen, 2007). Beberapa algoritma program dinamis antara

lain Needleman-Wunsch, Smith-Watherman. Kedua algoritma tersebut merupakan

algoritma klasik dalam analisis sequence.

Berdasarkan hasil penelitian Shen dkk (2002), kedua metode tersebut memiliki

beberapa kelemahan salah satunya adalah tingkat kecepatan komputasinya. Dari hasil

penelitiannya, Shen, et all (2002) menemukan metode baru yaitu Super Pairwise

Alignment. Metode ini menggabungkan metode analisis kombinatorial dan

probabilitas. Berdasarkan hasil ini penelitian ini cukup menarik untuk dikaji lebih

jauh dengan tinjauan aspek matematis, biologi maupun dari segi komputasionalnya.

Hal ini kemudian menjadi acuan bagi penulis untuk mengkaji lebih dalam metode

superpairwise alignment dengan mengambil contoh kasus mutasi struktur sequence

DNA virus H1N1 (virus flu burung) dengan menggunakan metode superpairwise

alignment.

3

Kasus H1N1 merupakan salah satu contoh kasus mutasi. Mutasi terjadi pada

Hemagglutinin dimana salah satu protein penyusunnya yaitu protein aspartic acid (D)

berubah menjadi protein G pada sequence protein ke 222 (Puzelli, et all 2009). Pada

perubahan protein ini terjadi perubahan kodon DNA yang menjadi protein tersebut.

Pada penelitian proses pensejajaran sequence menggunakan Lasergene package, versi

4.0 DNASTAR,Madison,WI,USA). Bioedit software versi 4.0 dari paket Mega

Software digunakan untuk mengestimasi filogenetik dari barisan nukleotida dan

membentuk pohon filogenetik dengan menggunakan algoritma neighborjoining dan

metode maximum likelihood.

1.2 Rumusan Masalah

Pada permasalahan identifikasi penyakit, DNA virus bermutasi sehingga dapat

menyebabkan strain virus baru. Penangan virus baru tersebut dapat dianalisa tingkat

homolognya. Salah satu cara untuk mengetahui tingkat homolog kedua virus dengan

menggunakan metode Super Pairwise Alignment. Perumusan masalah dalam

penelitian ini sebagai berikut :

a. Bagaimana tingkat homolog sequence DNA virus H1N1

b. Berapakah jumlah gap dari pensejajaran sequence DNA mutasi virus

H1N1

1.3 Tujuan Penelitian

Dari perumusan masalah dapat dirumuskan tujuan penelitian ini sebagai berikut:

a. Menerapkan metode probabilitas dan kombinatorik dalam metode Super

Pairwise Alignment

b. Menerapkan Super Pairwaise Alignment dalam pensejajaran sequence-

sequence virus DNA H1N1 dan dengan proses komputasi menggunakan

software Matlab 7.8

4

1.4 Manfaat Penelitian

Manfaat penelitian ini antara lain:

a. Sebagai kajian untuk penerapan matematika dalam bioinformatika

b. Sebagai kajian dalam pengembangan algoritma pensejajaran sequence

1.5 Batasan Masalah

a. Pada penelitian ini pensejajaran sequence hanya melibatkan sequence virus

H1N1

b. Kode sequence virus H1N1 diperoleh dari database National Center for

Biotechnology Information (NCBI)

dna sidik jari

Documents