bab 6
DESCRIPTION
bahan ajar biologiTRANSCRIPT
Bab VI
BAB VI. BIOINFORMATIKA
Bioinformatika (bahasa Inggris: bioinformatics) adalah (ilmu yang mempelajari)
penerapan teknik komputasional untuk mengelola dan menganalisis informasi biologis.
Bidang ini mencakup penerapan metode-metode matematika, statistika, dan informatika
untuk memecahkan masalah-masalah biologis, terutama dengan menggunakan sekuens DNA
dan asam amino serta informasi yang berkaitan dengannya. Contoh topik utama bidang ini
meliputi basis data untuk mengelola informasi biologis, penyejajaran sekuens (sequence
alignment), prediksi struktur untuk meramalkan bentuk struktur protein maupun struktur
sekunder RNA, analisis filogenetik, dan analisis ekspresi gen.
Istilah bioinformatics awal dikemukakan di era 1980-an untuk mengolah data analisis
biologi dengan menggunakan computer. Bioinformatika sering diterapkan dalam bidang –
bidang sekuen DNA, pembuatan basis data pada tahun 1960-an. Paulien Hogeweg
merupakan tokoh yang menciptakan istilah bioinformatika pada tahun 1970. Komputer
menjadi penting dalam ilmu biologi molekuler seiring penemuan urutan insulin di awal tahun
1950an oleh Frederick Sanger. Pelopor Bioinformatika di lapangan adalah Margaret Oakley
Daydoff, yang dipuji oleh David Lipman (National Center for Biotechnology Information).
Daydof berhasil menyusun salah satu database urutan protein pertama. Pelopor lain, Elvin A
Kabat, berhasil memelopori analisis urutan biologis pada tahun 1970.
Paulien Hogeweg
Kemajuan teknik biologi molekular dalam mengungkap sekuens biologis dari protein
(sejak awal 1950-an) dan asam nukleat (sejak 1960-an) mengawali perkembangan basis data
dan teknik analisis sekuens biologis. Basis data sekuens protein mulai dikembangkan pada
tahun 1960-an di Amerika Serikat, sementara basis data sekuens DNA dikembangkan pada
Bionformatika
akhir 1970-an di Amerika Serikat dan Jerman (pada European Molecular Biology
Laboratory, Laboratorium Biologi Molekular Eropa). Penemuan teknik sekuensing DNA
yang lebih cepat pada pertengahan 1970-an menjadi landasan terjadinya ledakan jumlah
sekuens DNA yang berhasil diungkapkan pada 1980-an dan 1990-an, menjadi salah satu
pembuka jalan bagi proyek-proyek pengungkapan genom, meningkatkan kebutuhan akan
pengelolaan dan analisis sekuens, dan pada akhirnya menyebabkan lahirnya bioinformatika.
Perkembangan internet juga mendukung berkembangnya bioinformatika. Basis data
bioinformatika yang terhubung melalui internet memudahkan ilmuwan mengumpulkan hasil
sekuensing ke dalam basis data tersebut maupun memperoleh sekuens biologis sebagai bahan
analisis. Selain itu, penyebaran program-program aplikasi bioinformatika melalui internet
memudahkan ilmuwan mengakses program-program tersebut dan kemudian memudahkan
pengembangannya.
A. Bioinformatika "klasik"
Sebagian besar ahli Biologi mengistilahkan ‘mereka sedang melakukan Bioinformatika’
ketika mereka sedang menggunakan komputer untuk menyimpan, melihat atau mengambil
data, menganalisa atau memprediksi komposisi atau struktur dari biomolekul. Ketika
kemampuan komputer menjadi semakin tinggi maka proses yang dilakukan dalam
Bioinformatika dapat ditambah dengan melakukan simulasi. Yang termasuk biomolekul
diantaranya adalah materi genetik dari manusia --asam nukleat-- dan produk dari gen
manusia, yaitu protein. Hal-hal diataslah yang merupakan bahasan utama dari Bioinformatika
"klasik", terutama berurusan dengan analisis sekuen (sequence analysis).
Definisi Bioinformatika menurut Fredj Tekaia dari Institut Pasteur
Bioinformatika adalah: "metode matematika, statistik dan komputasi yang bertujuan untuk
menyelesaikan masalah-masalah biologi dengan menggunakan sekuen DNA dan asam amino
dan informasi-informasi yang terkait dengannya." Dari sudut pandang Matematika, sebagian
besar molekul biologi mempunyai sifat yang menarik, yaitu molekul-molekul tersebut adalah
polymer; rantai-rantai yang tersusun rapi dari modul-modul molekul yang lebih sederhana,
yang disebut monomer. Monomer dapat dianalogikan sebagai bagian dari bangunan, dimana
meskipun bagianbagian tersebut berbeda warna dan bentuk, namun semua memiliki
ketebalan yang sama dan cara yang sama untuk dihubungkan antara yang satu dengan yang
lain. Monomer yang dapat dikombinasi dalam satu rantai ada dalam satu kelas umum yang
sama, namun tiap jenis monomer dalam kelas tersebut mempunyai karakteristik masing-
Bionformatika
masing yang terdefinisi dengan baik. Beberapa molekul-molekul monomer dapat
digabungkan bersama membentuk sebuah entitas yang berukuran lebih besar, yang disebut
macromolecule. Macromolecule dapat mempunyai informasi isi tertentu yang menarik dan
sifat-sifat kimia tertentu.
B. Bioinformatika "baru"
Salah satu pencapaian besar dalam metode Bioinformatika adalah selesainya proyek
pemetaan genom manusia (Human Genome Project). Selesainya proyek raksasa tersebut
menyebabkan bentuk dan prioritas dari riset dan penerapan Bioinformatika berubah. Secara
umum dapat dikatakan bahwa proyek tersebut membawa perubahan besar pada sistem hidup
kita, sehingga sering disebutkan --terutama oleh ahli biologi--bahwa kita saat ini berada di
masa pascagenom. Selesainya proyek pemetaan genom manusia ini membawa beberapa
perubahan bagi Bioinformatika, diantaranya: Setelah memiliki beberapa genom yang utuh
maka kita dapat mencari perbedaan dan persamaan di antara gen-gen dari spesies yang
berbeda. Dari studi perbandingan antara gen-gen tersebut dapat ditarik kesimpulan tertentu
mengenai spesies-spesies dan secara umum mengenai evolusi. Jenis cabang ilmu ini sering
disebut sebagai perbandingan genom (comparative genomics). Sekarang ada teknologi yang
didisain untuk mengukur jumlah relatif dari kopi/cetakan sebuah pesan genetik (level dari
ekspresi genetik) pada beberapa tingkatan yang berbeda pada perkembangan atau penyakit
atau pada jaringan yang berbeda.
Teknologi tersebut, contohnya seperti DNA microarrays akan semakin penting. Akibat
yang lain, secara langsung, adalah cara dalam skala besar untuk mengidentifikasi fungsi-
fungsi dan keterkaitan dari gen (contohnya metode two hybrid) akan semakin tumbuh secara
signifikan dan bersamanya akan mengikuti Bioinformatika yang berkaitan langsung dengan
kerja fungsi genom (functional genomics).
Akan ada perubahan besar dalam penekanan dari gen itu sendiri ke hasil-hasil dari gen.
Yang pada akhirnya akan menuntun ke usaha untuk mengkatalogkan semua aktivitas dan
karakteristik interaksi antara semua hasil-hasil dari gen (pada manusia) yang disebut
proteomics; usaha untuk mengkristalisasi dan memprediksikan struktur-struktur dari semua
protein (pada manusia) yang disebut structural genomics. Apa yang disebut orang sebagai
research informatics atau medical informatics, manajemen dari semua data eksperimen
biomedik yang berkaitan dengan molekul atau pasien tertentu --mulai dari spektroskop
massal, hingga ke efek samping klinis—akan berubah dari semula hanya merupakan
kepentingan bagi mereka yang bekerja di perusahaan obat-obatan dan bagian TI Rumah Sakit
Bionformatika
akan menjadi jalur utama dari biologi molekul dan biologi sel, dan berubah jalur dari
komersial dan klinikal ke arah akademis.
Dari uraian di atas terlihat bahwa Bioinformatika sangat mempengaruhi kehidupan
manusia, terutama untuk mencapai kehidupan yang lebih baik. Penggunaan komputer yang
notabene merupakan salah satu keahlian utama dari orang yang bergerak dalam TI
merupakan salah satu unsur utama dalam Bioinformatika, baik dalam Bioinformatika "klasik"
maupun Bioinformatika "baru".
C. Cabang – Cabang Terkait Dengan Bioinformatika
Bioinformatika merupakan penerapan kecanggihan teknologi computer pada ilmu biologi.
Selain pada ilmu biologi, bioinformatika juga berpengaruh atau terkait pada cabang –
cabang ilmu lain, terutama ilmu – ilmu yang terkait dengan dunia SAINS. Beberapa ilmu
yang terkait adalah biophysics (biofisika), Computational Biology, Medical Informatics,
Cheminformatics, Mathematical Biology, Proteomics, dan Pharmacogenomics, yang akan
dibahas satu persatu dibawah ini, antara lain :
Biophysics
Biofisika merupakan cabang ilmu yang menerapkan beberapa ilmu atau teknik fisika untuk
menerapakan ilmu biologi. Bioinformatika juga tercipta berdasarkan analisis dan teknik yang
ada di ilmu fisika. Maka dari itu ilmu fisika juga diperlukan dalam biologi, termasuk pada
bioinformatika.
Computational Biology
Komputasi biologi ini hubungannya dengan ilmu bioinformatika dekat, karena computasi
biologi ini lebih dekat dengan biologi umum klasik. Computational biology diantara
memfokuskan pada populasi, biologi teorotis, dan gerak evolusi, dari pada dalam biomedis
dalam biologi molekuler dan biologi sel. Biologi molekuler penting dalam computational
biology. Diartikan bahwa data – data yang disajikan lebih pada gaya statistika daripada model
yang sebenarnya. Tidak semua nya pada computasi biologi merupakan biologi, namun
computasi lebih condong pada ilmu matematika.
Medical Informatics
Bidang medis memerlukan ilmu dan penerapannya bioinformatika. Pengguannkan pada
medical inforamatics, diterapakan seperti analisis atau diagnosa suatu penyakit. Memprediksi
berapa tingkat kecepatan pertumbuhan penyakit. Informasi medis juga dikodekan atau
ditampilkan dalam bentuk algoritma. Dengan demikian maka akan membantu dan
memudahkan ilmu medis dalam perkembangan dan kemajuan bidang ilmu medis. Biologi
memegang peranan yang besar dan keterkaitannya besar dengan ilmu medis.
Bionformatika
Cheminformatics
Cheminformatics adalah bidang dalam kimia, yang juga menggunakan cara dalam biologi,
sedangkan cara dalam kimia seperti kombinasi dari sintesis kimia. Pada intinya digunakan
dalam penemuan dan pembuatan obat. Penemuan obat–obat ini dapat membawa manfaat
manusia. seperti peneman obat penisilin yang dapat menggambarkan bagaimana cara untuk
menemukan dan mengembangkan obat–obatan hingga sekarang. Keberhasilan dalam
penemuan ini pun didasakan atas usaha dan waktu yang lama. Dibutuhkan tahap–tahap
penting dan ketelitian hingga berhasil pembuatan obat. Keadaan yang lambat salah satu factor
penghambat dalam pembuatan obat, namun ketersediaan obat dibutuhkan, maka
diterapkanlah IT untuk membantu proses pengerjaan pembuatan obat–obatan. Yaitu dengan
mengotomatiskan proses–proses yang terkait dengan sintesis kimiawi yang dilakukan oleh
ahli kimia, maupun para ahli biokimia. Kecepatan pengerjaan dalam sintesis obat seperti
inilah yang menjadi target dari Cheminformatics. Beberapa bidang yang dikaji dalam
Cheminformatics antara lain : Visualisation Tools, Synthesis Planning, Reaction and
Structure Retrieval, 3-D,Structure Retrieval, Modelling, Computational Chemistry, and
Utilities.
Mathematical Biology
Mathematical Biology merupakan penerapan bidang ilmu biologi di matematika. Pada
matematika biologi sering menggunakan ilmu biologi yang dianalisis secara matematika, baik
mengggunakan algoritma, menggunakan statistic, menggunakan grafik, yang tujuannya
adalah untuk mempermudah pembacaan data. Mathematical Biology sering digunakan untuk
aplikasi software. Dengan Mathematical Biology, sebagai missal menggunakan software
dengan analisis matematika dan diterapkannya pada biologi. Missal seperti pembuatan
software klasifikasi tumbuhan ataupun klasifikasi hewan pada taksonomi tumbuhan dan
taksonomi hewan. Dengan menggunakan prinsip matematika yaitu teori permutasi.
Proteomics
Merupakan studi biologi yang lebih mendalami pada struktur dan fungsi dari protein. Protein
merupakan senyawa organic yang penting untuk metabolisme sel. Protein memiliki peranan
penting, dan dapat dikatakan senyawa terbanyak yang dibutuhkan oleh makluk hidup.
Misalnya protein yang berupa asam nukleat sebagai bahan pennyusun DNA, DNA
merupakan materi genetic pada suatu makluk hidup.
Penerapannya adalah dengan cara mengguankan teknologi untuk menganalisisnya. Sehingga
didapatkan hasil yang akurat, cepat, dan maksimal dalam analisisnya. Diamping itu pula
dikarenakan pengerjaan secara manual akan memakan waktu yang lama. Dan membutuhkan
Bionformatika
teknologi yang tinggi dalam pengerjaannya. Namun dengan adanya teknologi maka akan
mempermudah dalam pengerjaannya. Berhubungan dengan bioinformatika dikarenakan
protein merupakan bagian dari studi biologi dan teknologi yang digunakan menerapkan
prinsip teknologi informasi. Dua studi biologi dan teknologi informasi merupakan pengertian
dari Bioinformatika.
Gambar diatas merupakan robot yang bernama MALDI mass spectrometry. Teknologi yang
menerapkan bioinformatika.
Pharmacogenomics
Pharmacogenomics merupakan bidang studi yang menganalisis bagaimana respon atau efek
obat – obatan terhadap seseorang. Pharmacogenomics merupakan kombinasi dari bidang
ilmu farmakologi dan genomic. Ini semua juga diguakan teknik sekuen DNA dan sekuen
DNA sendiri digunakan untuk analisis DNA.
BASIS DATA SEKUENS BIOLOGIS
Sesuai dengan jenis informasi biologis yang disimpannya, basis data sekuens biologis
dapat berupa basis data primer untuk menyimpan sekuens primer asam nukleat maupun
protein, basis data sekunder untuk menyimpan motif sekuens protein, dan basis data struktur
untuk menyimpan data struktur protein maupun asam nukleat.
Basis data utama untuk sekuens asam nukleat saat ini adalah GenBank (Amerika
Serikat), EMBL (Eropa), dan DDBJ(en) (DNA Data Bank of Japan, Jepang). Ketiga basis
data tersebut bekerja sama dan bertukar data secara harian untuk menjaga keluasan cakupan
masing-masing basis data. Sumber utama data sekuens asam nukleat adalah submisi langsung
dari periset individual, proyek sekuensing genom, dan pendaftaran paten. Selain berisi
Bionformatika
sekuens asam nukleat, entri dalam basis data sekuens asam nukleat umumnya mengandung
informasi tentang jenis asam nukleat (DNA atau RNA), nama organisme sumber asam
nukleat tersebut, dan pustaka yang berkaitan dengan sekuens asam nukleat tersebut.
Sementara itu, contoh beberapa basis data penting yang menyimpan sekuens primer
protein adalah PIR (Protein Information Resource, Amerika Serikat), Swiss-Prot (Eropa), dan
TrEMBL (Eropa). Ketiga basis data tersebut telah digabungkan dalam UniProt (yang didanai
terutama oleh Amerika Serikat). Entri dalam UniProt mengandung informasi tentang sekuens
protein, nama organisme sumber protein, pustaka yang berkaitan, dan komentar yang
umumnya berisi penjelasan mengenai fungsi protein tersebut.
BLAST (Basic Local Alignment Search Tool) merupakan perkakas bioinformatika yang
berkaitan erat dengan penggunaan basis data sekuens biologis. Penelusuran BLAST (BLAST
search) pada basis data sekuens memungkinkan ilmuwan untuk mencari sekuens asam
nukleat maupun protein yang mirip dengan sekuens tertentu yang dimilikinya. Hal ini berguna
misalnya untuk menemukan gen sejenis pada beberapa organisme atau untuk memeriksa
keabsahan hasil sekuensing maupun untuk memeriksa fungsi gen hasil sekuensing. Algoritma
yang mendasari kerja BLAST adalah penyejajaran sekuens.
PDB (Protein Data Bank, Bank Data Protein) adalah basis data tunggal yang menyimpan
model struktural tiga dimensi protein dan asam nukleat hasil penentuan eksperimental
(dengan kristalografi sinar-X, spektroskopi NMR dan mikroskopi elektron). PDB menyimpan
data struktur sebagai koordinat tiga dimensi yang menggambarkan posisi atom-atom dalam
protein ataupun asam nukleat.
Elemen bioinformatika mencakup database, analisis, dan prediksi. Database yang tersedia
meliputi database sequence DNA, protein, dan hasil transkripsi RNA. Analisis yang bisa
dikerjakan dengan bioinformatik meliputi analisis homologi sequence dan pencarian pola
(pattern). Sementara prediksi yang mungkin adalah mengenai fungsi suatu gen atau protein,
juga prediksi struktur 3-D protein.
JENIS DATA BIOLOGI DI BIOINFORMATIKA
1. Manajemen Data
Manajemen Data Termasuk pemeliharaan database dan pemrosesan data, merupakan tugas
paling dasar dan yang paling utama. Sejumlah besar data yang bisa digunakan bersama dibuat
oleh berbagai lembaga penelitian yang dibiayai publik, dan diletakkan di dalam bank data
publik. Anotasi data mentah, yang artinya menambahkan berbagai deskripsi dan fungsi,
merupakan bagian yang sangat penting dari pekerjaan ini, dan sebagian besar didanai oleh
lembaga penelitian pemerintah.
Bionformatika
2. Struktur dan Sekuens Protein dan Gen
Struktur dan sekuens protein dan gen. Sekuens digunakan untuk merepresentasikan molekul
makro. Struktur gen yang mengkodifikasi sekuens asam amino di dalam protein dibuat
menggunakan proyek sekuensial genom. Data genomik akan diterjemahkan menggunakan
komputer menjadi sekuens protein.
3. Struktur Molekuler 3D.
Struktur Molekular 3D. Pemodelan komputer bisa menggambarkan struktur ini menggunakan
pengukuran fisik menggunakan sinar X atau resonansi magnetik nuklir.
4. Fungsi dan Struktur Genom
Fungsi dan Struktur Genom. Genom dari suatu organisme (mahluk hidup) terdiri dari materi
genetik keseluruhan. Informasi fungsi dan struktur genom adalah informasi detail dasar yang
selalu diperbaharui dengan berbagai informasi baru termasuk tautan ke berbagai database
yang lain.
5. Data Bibliografik
Data Bibliografik, seperti abstrak dari suatu artikel sains. Jumlah data yang meningkat secara
eksponensial, terutama yang berhubungan dengan proyek genom, seperti proyek sekuensial
genom manusia. Data yang saat ini bisa diakses publik melalui internet merupakan susunan
data dalam bentuk kecil.
TEKNOLOGI DI DALAM BIOINFORMATIKA
Bioinformatika menggabungkan berbagai bidang ilmu komputer, matematika, dan
engineering untuk memproses data biologi. Supercomputer digunakan untuk membaca dan
memproses data biologi supaya hasilnya semakin cepat didapatkan. Berbagai sistem
informasi dan database digunakan untuk menyimpan dan menyusun data biologi. Dalam
menganalisa data biologi, juga diperlukan berbagai algoritma Artificial Intelligence, Machine
Learning, Soft Computing, Data Mining, Image Processing, dan Simulation.
Teknologi dan Inovasi Microsoft di bidang Bioinformatika
a. Microsoft Bioinformatics Initiative
Program “Microsoft Bioinformatics Initiative” yang terdiri dari tiga komponen utama :
1). NET BIO
NET Bio merupakan suatu tool yang bisa ditambahkan ke framework pemrograman netral
bahasa .NET yang awalnya ditujukan untuk mendukung penelitian di bidang genomik.
Bionformatika
Sekarang ini .NET Bio mendukung berbagai formal file bioinformatika; berbagai algoritma
untuk manipulasi sekuens protein, RNA, dan DNA; dan pasangan konektor untuk terhubung
ke layanan web biologi seperti NCBI BLAST. .NET Bio menggunakan lisensi sumber
terbuka, dan semua dokumentasi, aplikasi demo, kode sumber, dan executable file bisa
didownload dari situs Codeplex.
2). Microsoft Biology Tools (MBT)
The Microsoft Biology Tools (MBT) merupakan kumpulan tool yang bisa digunakan para
peneliti bioinformatika dan biologi supaya lebih produktif dalam menemukan berbagai
penemuan sains. Tool di dalam katalog MBT bebas digunakan, dan juga termasuk
didalamnya kode sumber terbuka dan berbagai proyek kolaborasi sumber terbuka. Contoh
tool-tool di dalam katalog MBT bisa dilihat di sini :
http://research.microsoft.com/en-us/projects/bio/mbt.aspx.
3). BioHPC
BioHPC merupakan implementasi HPC untuk para peneliti biologi. HPC adalah High
Performance Computing, yang memanfaatkan sebanyak mungkin sumber daya komputer
yang ada untuk menyelesaikan satu tugas berat dengan lebih singkat. HPC merevolusi ilmu
biologi dengan cara memberi para ahli biologi kemampuan proses dan analisa data yang
sangat besar yang tidak terbayangkan beberapa dekade lalu. Namun sayangnya kebanyakan
ahli biologi tidak memiliki keahlian komputer ataupun sarana komputer yang memadai.
Microsoft bekerjasama dengan Unit Layanan Biologi Komputasi Universitas Cornell untuk
menyediakan kekuatan HPC bagi ribuan peneliti di seluruh dunia. BioHPC khusus ditujukan
pada peneliti bioinformatika, sehingga bersifat sangat powerful tetapi mudah sekali
digunakan dan tidak perlu ahli komputer dengan keahlian khusus untuk mengoperasikannya.
b. Windows Azure Bioinformatics
Windows Azure merupakan satu layanan komputasi awan Microsoft yang bisa digunakan
untuk menyelesaikan berbagai tugas bioinformatika dengan cepat.
Bionformatika
Dengan adanya ledakan data genom beberapa tahun terakhir, maka kita memerlukan
kekuatan komputasi yang luar biasa untuk memproses semua data yang ada. Windows Azure
dikombinasikan dengan Microsoft Excel untuk analisa, memberikan para peneliti
kemampuan yang luar biasa untuk mendapatkan berbagai wawasan baru dan kemampuan
eksplorasi di area-area yang sebelumnya tidak terjamah. Salah satu aplikasi killer untuk
Windows Azure di bidang bioinformatika ini adalah NCBI BLAST untuk Windows Azure.
NCBI Blast merupakan implementasi Basic Local Alignment Search Tool (BLAST) dari
National Center for Biotechnology Information (NCBI). BLAST merupakan sekumpulan
program yang dirancang untuk mencari semua kemiripan antara sebuah protein atau DNA
dan sekuensnya yang sudah diketahui dari seluruh database kemungkinan yang ada. Peneliti
memerlukan kemampuan ini untuk mengetahui fungsi dan manfaat dari sebuah produk
genetik. Windows Azure memungkinkan komputasi yang sangat rumit dilakukan dengan
sangat cepat dan dengan biaya yang murah. Misalnya dengan Windows Azure mampu
menyingkat pengoperasian BLAST dari enam tahun menjadi satu minggu saja. Microsoft
XCG (Extreme Computing Group) merupakan satu tim di Microsoft yang berhasil melakukan
hal ini dengan cara membagi beban BLAST ke beberapa data center Microsoft yang tersebar
di Amerika dan Eropa.
Bionformatika
Gambar di atas menunjukkan gambar bakteri Rhodopseudomonas palustris yang digunakan
untuk memproduksi hidrogen sebagai bahan bakar.
Bionformatika