dna sidik jari
DESCRIPTION
DNA SIDIK JARITRANSCRIPT
1
BAB 1
PENDAHULUAN
1.1 Latar Belakang
Saat ini perkembangan bioteknologi molekuler cukup pesat. Besarnya
database sequence biologi seperti DNA, RNA dan rangkaian protein tentu
memerlukan sistem penggalian data yang tepat dan terotomasi sehingga dapat
mengurangi biaya penelitian. Hal ini kemudian melatarbelakangi pentingnya teknik
analisis sequence. Dasar analisis sequence adalah untuk mengetahui hubungan dua
sequence. Proses ini dilakukan dengan cara mensejajarkan kedua sequence kemudian
menentukan bahwa dari hasil pensejajaran keduanya mempunyai keterkaitan atau
tidak. Beberapa permasalahan dalam analisis sequence yaitu pemilihan tipe
pensejajaran, penentuan sistem scoring dan penentuan algoritma yang tepat untuk
memperoleh hasil scoring pensejajaran yang optimal. Selain itu, metode statistik juga
digunakan untuk mengevalusi signifikasi dari skor pensejajaran (Durbin, 1998).
Pada kajian ilmu biologi molekuler modern dijelaskan bahwa sequence
DNA/RNA dan sequence protein merupakan unit dasar yang terlibat dalam fungsi
biologis khusus sehingga bisa dikatakan bahwa sequence biologis hanyalah
kombinasi dari unit-unit dasar. Karakteristik fungsional dari sequence tersebut tidak
hanya melibatkan struktur utamanya, tetapi juga bentuk tiga dimensinya.
Asam deoksiribonukleat (deoxyribonucleic acid) atau biasa disebut DNA, adalah
biomolekul yang berupa rangkaian asam nukleat yang terdapat dalam inti sel
(nucleus) pada sel eukariotik sedangkan pada sel prokariotik DNA tersebut berada di
sitoplasma. Basa nitrogen terdiri dua jenis yaitu basa purin dan pirimidin. Basa purin
terdiri dari adenin (A) dan guanin (G) sedangkan pirimidin terdiri dari sitosin (C) dan
timin (T). Satu asam nukleat terdiri dari satu molekul gula ribosa, satu basa nitrogen
dan fosfat. Satu asam nukleat dengan asam nukleat yang lain dirangkai dengan ikatan
2
fosfodiester. DNA berfungsi untuk menyimpan informasi genetik pada suatu
organisme (Yuwono,2008)
DNA pada setiap spesies akan berbeda satu sama lainnya. Adanya perbedaan
genetik diantara individu atau organism ini, kemudian melahirkan berbagai sistem
identifikasi berbasis DNA, yang disebut sebagai ‘pencocokan sidikjari DNA’ (DNA
fingerprinting). Teknik tersebut berfokus pada penelusuran perbedaan genetik sekecil
mungkin yang dapat terjadi diantara dua deretan DNA (yang mengandung kompisis 4
macam basa nukleotida A,T,C dan G). teknik sidik jari DNA dapat diterapkan pada
penentuan spesies asal.
Pada permasalahan mutasi sequence, solusi untuk pensejajaran sequence dapat
menggunakan program dinamik. Algoritma alignment berbasis program dinamik
merupakan suatu algoritma yang seringkali digunakan untuk menyelesaikan
permasalahan optimalisasi pada berbagai macam bidang. Validitas algoritma ini
bergantung pada ada atau tidaknya substruktur optimal pada permasalahan tersebut,
dengan kata lain apakah permasalahan tersebut telah memenuhi prinsip
pengoptimalan atau tidak (Shen, 2007). Beberapa algoritma program dinamis antara
lain Needleman-Wunsch, Smith-Watherman. Kedua algoritma tersebut merupakan
algoritma klasik dalam analisis sequence.
Berdasarkan hasil penelitian Shen dkk (2002), kedua metode tersebut memiliki
beberapa kelemahan salah satunya adalah tingkat kecepatan komputasinya. Dari hasil
penelitiannya, Shen, et all (2002) menemukan metode baru yaitu Super Pairwise
Alignment. Metode ini menggabungkan metode analisis kombinatorial dan
probabilitas. Berdasarkan hasil ini penelitian ini cukup menarik untuk dikaji lebih
jauh dengan tinjauan aspek matematis, biologi maupun dari segi komputasionalnya.
Hal ini kemudian menjadi acuan bagi penulis untuk mengkaji lebih dalam metode
superpairwise alignment dengan mengambil contoh kasus mutasi struktur sequence
DNA virus H1N1 (virus flu burung) dengan menggunakan metode superpairwise
alignment.
3
Kasus H1N1 merupakan salah satu contoh kasus mutasi. Mutasi terjadi pada
Hemagglutinin dimana salah satu protein penyusunnya yaitu protein aspartic acid (D)
berubah menjadi protein G pada sequence protein ke 222 (Puzelli, et all 2009). Pada
perubahan protein ini terjadi perubahan kodon DNA yang menjadi protein tersebut.
Pada penelitian proses pensejajaran sequence menggunakan Lasergene package, versi
4.0 DNASTAR,Madison,WI,USA). Bioedit software versi 4.0 dari paket Mega
Software digunakan untuk mengestimasi filogenetik dari barisan nukleotida dan
membentuk pohon filogenetik dengan menggunakan algoritma neighborjoining dan
metode maximum likelihood.
1.2 Rumusan Masalah
Pada permasalahan identifikasi penyakit, DNA virus bermutasi sehingga dapat
menyebabkan strain virus baru. Penangan virus baru tersebut dapat dianalisa tingkat
homolognya. Salah satu cara untuk mengetahui tingkat homolog kedua virus dengan
menggunakan metode Super Pairwise Alignment. Perumusan masalah dalam
penelitian ini sebagai berikut :
a. Bagaimana tingkat homolog sequence DNA virus H1N1
b. Berapakah jumlah gap dari pensejajaran sequence DNA mutasi virus
H1N1
1.3 Tujuan Penelitian
Dari perumusan masalah dapat dirumuskan tujuan penelitian ini sebagai berikut:
a. Menerapkan metode probabilitas dan kombinatorik dalam metode Super
Pairwise Alignment
b. Menerapkan Super Pairwaise Alignment dalam pensejajaran sequence-
sequence virus DNA H1N1 dan dengan proses komputasi menggunakan
software Matlab 7.8
4
1.4 Manfaat Penelitian
Manfaat penelitian ini antara lain:
a. Sebagai kajian untuk penerapan matematika dalam bioinformatika
b. Sebagai kajian dalam pengembangan algoritma pensejajaran sequence
1.5 Batasan Masalah
a. Pada penelitian ini pensejajaran sequence hanya melibatkan sequence virus
H1N1
b. Kode sequence virus H1N1 diperoleh dari database National Center for
Biotechnology Information (NCBI)
5