bab 6

16
Bab VI BAB VI. BIOINFORMATIKA Bioinformatika (bahasa Inggris: bioinformatics) adalah (ilmu yang mempelajari) penerapan teknik komputasional untuk mengelola dan menganalisis informasi biologis. Bidang ini mencakup penerapan metode-metode matematika, statistika, dan informatika untuk memecahkan masalah-masalah biologis, terutama dengan menggunakan sekuens DNA dan asam amino serta informasi yang berkaitan dengannya. Contoh topik utama bidang ini meliputi basis data untuk mengelola informasi biologis, penyejajaran sekuens (sequence alignment), prediksi struktur untuk meramalkan bentuk struktur protein maupun struktur sekunder RNA, analisis filogenetik, dan analisis ekspresi gen. Istilah bioinformatics awal dikemukakan di era 1980-an untuk mengolah data analisis biologi dengan menggunakan computer. Bioinformatika sering diterapkan dalam bidang – bidang sekuen DNA, pembuatan basis data pada tahun 1960-an. Paulien Hogeweg merupakan tokoh yang menciptakan istilah bioinformatika pada tahun 1970. Komputer menjadi penting dalam ilmu biologi molekuler seiring penemuan urutan insulin di awal tahun 1950an oleh Frederick Sanger. Pelopor Bioinformatika di lapangan adalah Margaret Oakley Daydoff, yang dipuji oleh David Lipman (National Center for Biotechnology Information). Daydof berhasil menyusun salah satu database urutan protein pertama. Pelopor lain, Elvin A Kabat, berhasil memelopori analisis urutan biologis pada tahun 1970. Bionformatika

Upload: deny-kurniawan

Post on 15-Dec-2015

216 views

Category:

Documents


1 download

DESCRIPTION

bahan ajar biologi

TRANSCRIPT

Page 1: Bab 6

Bab VI

BAB VI. BIOINFORMATIKA

Bioinformatika (bahasa Inggris: bioinformatics) adalah (ilmu yang mempelajari)

penerapan teknik komputasional untuk mengelola dan menganalisis informasi biologis.

Bidang ini mencakup penerapan metode-metode matematika, statistika, dan informatika

untuk memecahkan masalah-masalah biologis, terutama dengan menggunakan sekuens DNA

dan asam amino serta informasi yang berkaitan dengannya. Contoh topik utama bidang ini

meliputi basis data untuk mengelola informasi biologis, penyejajaran sekuens (sequence

alignment), prediksi struktur untuk meramalkan bentuk struktur protein maupun struktur

sekunder RNA, analisis filogenetik, dan analisis ekspresi gen.

Istilah bioinformatics awal dikemukakan di era 1980-an untuk mengolah data analisis

biologi dengan menggunakan computer. Bioinformatika sering diterapkan dalam bidang –

bidang sekuen DNA, pembuatan basis data pada tahun 1960-an. Paulien Hogeweg

merupakan tokoh yang menciptakan istilah bioinformatika pada tahun 1970. Komputer

menjadi penting dalam ilmu biologi molekuler seiring penemuan urutan insulin di awal tahun

1950an oleh Frederick Sanger. Pelopor Bioinformatika di lapangan adalah Margaret Oakley

Daydoff, yang dipuji oleh David Lipman (National Center for Biotechnology Information).

Daydof berhasil menyusun salah satu database urutan protein pertama. Pelopor lain, Elvin A

Kabat, berhasil memelopori analisis urutan biologis pada tahun 1970.

Paulien Hogeweg

Kemajuan teknik biologi molekular dalam mengungkap sekuens biologis dari protein

(sejak awal 1950-an) dan asam nukleat (sejak 1960-an) mengawali perkembangan basis data

dan teknik analisis sekuens biologis. Basis data sekuens protein mulai dikembangkan pada

tahun 1960-an di Amerika Serikat, sementara basis data sekuens DNA dikembangkan pada

Bionformatika

Page 2: Bab 6

akhir 1970-an di Amerika Serikat dan Jerman (pada European Molecular Biology

Laboratory, Laboratorium Biologi Molekular Eropa). Penemuan teknik sekuensing DNA

yang lebih cepat pada pertengahan 1970-an menjadi landasan terjadinya ledakan jumlah

sekuens DNA yang berhasil diungkapkan pada 1980-an dan 1990-an, menjadi salah satu

pembuka jalan bagi proyek-proyek pengungkapan genom, meningkatkan kebutuhan akan

pengelolaan dan analisis sekuens, dan pada akhirnya menyebabkan lahirnya bioinformatika.

Perkembangan internet juga mendukung berkembangnya bioinformatika. Basis data

bioinformatika yang terhubung melalui internet memudahkan ilmuwan mengumpulkan hasil

sekuensing ke dalam basis data tersebut maupun memperoleh sekuens biologis sebagai bahan

analisis. Selain itu, penyebaran program-program aplikasi bioinformatika melalui internet

memudahkan ilmuwan mengakses program-program tersebut dan kemudian memudahkan

pengembangannya.

A. Bioinformatika "klasik"

Sebagian besar ahli Biologi mengistilahkan ‘mereka sedang melakukan Bioinformatika’

ketika mereka sedang menggunakan komputer untuk menyimpan, melihat atau mengambil

data, menganalisa atau memprediksi komposisi atau struktur dari biomolekul. Ketika

kemampuan komputer menjadi semakin tinggi maka proses yang dilakukan dalam

Bioinformatika dapat ditambah dengan melakukan simulasi. Yang termasuk biomolekul

diantaranya adalah materi genetik dari manusia --asam nukleat-- dan produk dari gen

manusia, yaitu protein. Hal-hal diataslah yang merupakan bahasan utama dari Bioinformatika

"klasik", terutama berurusan dengan analisis sekuen (sequence analysis).

Definisi Bioinformatika menurut Fredj Tekaia dari Institut Pasteur

Bioinformatika adalah: "metode matematika, statistik dan komputasi yang bertujuan untuk

menyelesaikan masalah-masalah biologi dengan menggunakan sekuen DNA dan asam amino

dan informasi-informasi yang terkait dengannya." Dari sudut pandang Matematika, sebagian

besar molekul biologi mempunyai sifat yang menarik, yaitu molekul-molekul tersebut adalah

polymer; rantai-rantai yang tersusun rapi dari modul-modul molekul yang lebih sederhana,

yang disebut monomer. Monomer dapat dianalogikan sebagai bagian dari bangunan, dimana

meskipun bagianbagian tersebut berbeda warna dan bentuk, namun semua memiliki

ketebalan yang sama dan cara yang sama untuk dihubungkan antara yang satu dengan yang

lain. Monomer yang dapat dikombinasi dalam satu rantai ada dalam satu kelas umum yang

sama, namun tiap jenis monomer dalam kelas tersebut mempunyai karakteristik masing-

Bionformatika

Page 3: Bab 6

masing yang terdefinisi dengan baik. Beberapa molekul-molekul monomer dapat

digabungkan bersama membentuk sebuah entitas yang berukuran lebih besar, yang disebut

macromolecule. Macromolecule dapat mempunyai informasi isi tertentu yang menarik dan

sifat-sifat kimia tertentu.

B. Bioinformatika "baru"

Salah satu pencapaian besar dalam metode Bioinformatika adalah selesainya proyek

pemetaan genom manusia (Human Genome Project). Selesainya proyek raksasa tersebut

menyebabkan bentuk dan prioritas dari riset dan penerapan Bioinformatika berubah. Secara

umum dapat dikatakan bahwa proyek tersebut membawa perubahan besar pada sistem hidup

kita, sehingga sering disebutkan --terutama oleh ahli biologi--bahwa kita saat ini berada di

masa pascagenom. Selesainya proyek pemetaan genom manusia ini membawa beberapa

perubahan bagi Bioinformatika, diantaranya: Setelah memiliki beberapa genom yang utuh

maka kita dapat mencari perbedaan dan persamaan di antara gen-gen dari spesies yang

berbeda. Dari studi perbandingan antara gen-gen tersebut dapat ditarik kesimpulan tertentu

mengenai spesies-spesies dan secara umum mengenai evolusi. Jenis cabang ilmu ini sering

disebut sebagai perbandingan genom (comparative genomics). Sekarang ada teknologi yang

didisain untuk mengukur jumlah relatif dari kopi/cetakan sebuah pesan genetik (level dari

ekspresi genetik) pada beberapa tingkatan yang berbeda pada perkembangan atau penyakit

atau pada jaringan yang berbeda.

Teknologi tersebut, contohnya seperti DNA microarrays akan semakin penting. Akibat

yang lain, secara langsung, adalah cara dalam skala besar untuk mengidentifikasi fungsi-

fungsi dan keterkaitan dari gen (contohnya metode two hybrid) akan semakin tumbuh secara

signifikan dan bersamanya akan mengikuti Bioinformatika yang berkaitan langsung dengan

kerja fungsi genom (functional genomics).

Akan ada perubahan besar dalam penekanan dari gen itu sendiri ke hasil-hasil dari gen.

Yang pada akhirnya akan menuntun ke usaha untuk mengkatalogkan semua aktivitas dan

karakteristik interaksi antara semua hasil-hasil dari gen (pada manusia) yang disebut

proteomics; usaha untuk mengkristalisasi dan memprediksikan struktur-struktur dari semua

protein (pada manusia) yang disebut structural genomics. Apa yang disebut orang sebagai

research informatics atau medical informatics, manajemen dari semua data eksperimen

biomedik yang berkaitan dengan molekul atau pasien tertentu --mulai dari spektroskop

massal, hingga ke efek samping klinis—akan berubah dari semula hanya merupakan

kepentingan bagi mereka yang bekerja di perusahaan obat-obatan dan bagian TI Rumah Sakit

Bionformatika

Page 4: Bab 6

akan menjadi jalur utama dari biologi molekul dan biologi sel, dan berubah jalur dari

komersial dan klinikal ke arah akademis.

Dari uraian di atas terlihat bahwa Bioinformatika sangat mempengaruhi kehidupan

manusia, terutama untuk mencapai kehidupan yang lebih baik. Penggunaan komputer yang

notabene merupakan salah satu keahlian utama dari orang yang bergerak dalam TI

merupakan salah satu unsur utama dalam Bioinformatika, baik dalam Bioinformatika "klasik"

maupun Bioinformatika "baru".

C. Cabang – Cabang Terkait Dengan Bioinformatika

Bioinformatika merupakan penerapan kecanggihan teknologi computer pada ilmu biologi.

Selain pada ilmu biologi, bioinformatika juga berpengaruh atau terkait pada cabang –

cabang ilmu lain, terutama ilmu – ilmu yang terkait dengan dunia SAINS. Beberapa ilmu

yang terkait adalah biophysics (biofisika), Computational Biology, Medical Informatics,

Cheminformatics, Mathematical Biology, Proteomics, dan Pharmacogenomics, yang akan

dibahas satu persatu dibawah ini, antara lain :

Biophysics

Biofisika merupakan cabang ilmu yang menerapkan beberapa ilmu atau teknik fisika untuk

menerapakan ilmu biologi. Bioinformatika juga tercipta berdasarkan analisis dan teknik yang

ada di ilmu fisika. Maka dari itu ilmu fisika juga diperlukan dalam biologi, termasuk pada

bioinformatika.

Computational Biology

Komputasi biologi ini hubungannya dengan ilmu bioinformatika dekat, karena computasi

biologi ini lebih dekat dengan biologi umum klasik. Computational biology diantara

memfokuskan pada populasi, biologi teorotis, dan gerak evolusi, dari pada dalam biomedis

dalam biologi molekuler dan biologi sel. Biologi molekuler penting dalam computational

biology. Diartikan bahwa data – data yang disajikan lebih pada gaya statistika daripada model

yang sebenarnya. Tidak semua nya pada computasi biologi merupakan biologi, namun

computasi lebih condong pada ilmu matematika.

Medical Informatics

Bidang medis memerlukan ilmu dan penerapannya bioinformatika. Pengguannkan pada

medical inforamatics, diterapakan seperti analisis atau diagnosa suatu penyakit. Memprediksi

berapa tingkat kecepatan pertumbuhan penyakit. Informasi medis juga dikodekan atau

ditampilkan dalam bentuk algoritma. Dengan demikian maka akan membantu dan

memudahkan ilmu medis dalam perkembangan dan kemajuan bidang ilmu medis. Biologi

memegang peranan yang besar dan keterkaitannya besar dengan ilmu medis.

Bionformatika

Page 5: Bab 6

Cheminformatics

Cheminformatics adalah bidang dalam kimia, yang juga menggunakan cara dalam biologi,

sedangkan cara dalam kimia seperti kombinasi dari sintesis kimia. Pada intinya digunakan

dalam penemuan dan pembuatan obat. Penemuan obat–obat ini dapat membawa manfaat

manusia. seperti peneman obat penisilin yang dapat menggambarkan bagaimana cara untuk

menemukan dan mengembangkan obat–obatan hingga sekarang. Keberhasilan dalam

penemuan ini pun didasakan atas usaha dan waktu yang lama. Dibutuhkan tahap–tahap

penting dan ketelitian hingga berhasil pembuatan obat. Keadaan yang lambat salah satu factor

penghambat dalam pembuatan obat, namun ketersediaan obat dibutuhkan, maka

diterapkanlah IT untuk membantu proses pengerjaan pembuatan obat–obatan. Yaitu dengan

mengotomatiskan proses–proses yang terkait dengan sintesis kimiawi yang dilakukan oleh

ahli kimia, maupun para ahli biokimia. Kecepatan pengerjaan dalam sintesis obat seperti

inilah yang menjadi target dari Cheminformatics. Beberapa bidang yang dikaji dalam

Cheminformatics antara lain : Visualisation Tools, Synthesis Planning, Reaction and

Structure Retrieval, 3-D,Structure Retrieval, Modelling, Computational Chemistry, and

Utilities.

Mathematical Biology

Mathematical Biology merupakan penerapan bidang ilmu biologi di matematika. Pada

matematika biologi sering menggunakan ilmu biologi yang dianalisis secara matematika, baik

mengggunakan algoritma, menggunakan statistic, menggunakan grafik, yang tujuannya

adalah untuk mempermudah pembacaan data. Mathematical Biology sering digunakan untuk

aplikasi software. Dengan Mathematical Biology, sebagai missal menggunakan software

dengan analisis matematika dan diterapkannya pada biologi. Missal seperti pembuatan

software klasifikasi tumbuhan ataupun klasifikasi hewan pada taksonomi tumbuhan dan

taksonomi hewan. Dengan menggunakan prinsip matematika yaitu teori permutasi.

Proteomics

Merupakan studi biologi yang lebih mendalami pada struktur dan fungsi dari protein. Protein

merupakan senyawa organic yang penting untuk metabolisme sel. Protein memiliki peranan

penting, dan dapat dikatakan senyawa terbanyak yang dibutuhkan oleh makluk hidup.

Misalnya protein yang berupa asam nukleat sebagai bahan pennyusun DNA, DNA

merupakan materi genetic pada suatu makluk hidup.

Penerapannya adalah dengan cara mengguankan teknologi untuk menganalisisnya. Sehingga

didapatkan hasil yang akurat, cepat, dan maksimal dalam analisisnya. Diamping itu pula

dikarenakan pengerjaan secara manual akan memakan waktu yang lama. Dan membutuhkan

Bionformatika

Page 6: Bab 6

teknologi yang tinggi dalam pengerjaannya. Namun dengan adanya teknologi maka akan

mempermudah dalam pengerjaannya. Berhubungan dengan bioinformatika dikarenakan

protein merupakan bagian dari studi biologi dan teknologi yang digunakan menerapkan

prinsip teknologi informasi. Dua studi biologi dan teknologi informasi merupakan pengertian

dari Bioinformatika.

Gambar diatas merupakan robot yang bernama MALDI mass spectrometry. Teknologi yang

menerapkan bioinformatika.

Pharmacogenomics

Pharmacogenomics merupakan bidang studi yang menganalisis bagaimana respon atau efek

obat – obatan terhadap seseorang. Pharmacogenomics merupakan kombinasi dari bidang

ilmu farmakologi dan genomic. Ini semua juga diguakan teknik sekuen DNA dan sekuen

DNA sendiri digunakan untuk analisis DNA.

BASIS DATA SEKUENS BIOLOGIS

Sesuai dengan jenis informasi biologis yang disimpannya, basis data sekuens biologis

dapat berupa basis data primer untuk menyimpan sekuens primer asam nukleat maupun

protein, basis data sekunder untuk menyimpan motif sekuens protein, dan basis data struktur

untuk menyimpan data struktur protein maupun asam nukleat.

Basis data utama untuk sekuens asam nukleat saat ini adalah GenBank (Amerika

Serikat), EMBL (Eropa), dan DDBJ(en) (DNA Data Bank of Japan, Jepang). Ketiga basis

data tersebut bekerja sama dan bertukar data secara harian untuk menjaga keluasan cakupan

masing-masing basis data. Sumber utama data sekuens asam nukleat adalah submisi langsung

dari periset individual, proyek sekuensing genom, dan pendaftaran paten. Selain berisi

Bionformatika

Page 7: Bab 6

sekuens asam nukleat, entri dalam basis data sekuens asam nukleat umumnya mengandung

informasi tentang jenis asam nukleat (DNA atau RNA), nama organisme sumber asam

nukleat tersebut, dan pustaka yang berkaitan dengan sekuens asam nukleat tersebut.

Sementara itu, contoh beberapa basis data penting yang menyimpan sekuens primer

protein adalah PIR (Protein Information Resource, Amerika Serikat), Swiss-Prot (Eropa), dan

TrEMBL (Eropa). Ketiga basis data tersebut telah digabungkan dalam UniProt (yang didanai

terutama oleh Amerika Serikat). Entri dalam UniProt mengandung informasi tentang sekuens

protein, nama organisme sumber protein, pustaka yang berkaitan, dan komentar yang

umumnya berisi penjelasan mengenai fungsi protein tersebut.

BLAST (Basic Local Alignment Search Tool) merupakan perkakas bioinformatika yang

berkaitan erat dengan penggunaan basis data sekuens biologis. Penelusuran BLAST (BLAST

search) pada basis data sekuens memungkinkan ilmuwan untuk mencari sekuens asam

nukleat maupun protein yang mirip dengan sekuens tertentu yang dimilikinya. Hal ini berguna

misalnya untuk menemukan gen sejenis pada beberapa organisme atau untuk memeriksa

keabsahan hasil sekuensing maupun untuk memeriksa fungsi gen hasil sekuensing. Algoritma

yang mendasari kerja BLAST adalah penyejajaran sekuens.

PDB (Protein Data Bank, Bank Data Protein) adalah basis data tunggal yang menyimpan

model struktural tiga dimensi protein dan asam nukleat hasil penentuan eksperimental

(dengan kristalografi sinar-X, spektroskopi NMR dan mikroskopi elektron). PDB menyimpan

data struktur sebagai koordinat tiga dimensi yang menggambarkan posisi atom-atom dalam

protein ataupun asam nukleat.

Elemen bioinformatika mencakup database, analisis, dan prediksi. Database yang tersedia

meliputi database sequence DNA, protein, dan hasil transkripsi RNA. Analisis yang bisa

dikerjakan dengan bioinformatik meliputi analisis homologi sequence dan pencarian pola

(pattern). Sementara prediksi yang mungkin adalah mengenai fungsi suatu gen atau protein,

juga prediksi struktur 3-D protein.

JENIS DATA BIOLOGI DI BIOINFORMATIKA

1. Manajemen Data

Manajemen Data Termasuk pemeliharaan database dan pemrosesan data, merupakan tugas

paling dasar dan yang paling utama. Sejumlah besar data yang bisa digunakan bersama dibuat

oleh berbagai lembaga penelitian yang dibiayai publik, dan diletakkan di dalam bank data

publik. Anotasi data mentah, yang artinya menambahkan berbagai deskripsi dan fungsi,

merupakan bagian yang sangat penting dari pekerjaan ini, dan sebagian besar didanai oleh

lembaga penelitian pemerintah.

Bionformatika

Page 8: Bab 6

2. Struktur dan Sekuens Protein dan Gen

Struktur dan sekuens protein dan gen. Sekuens digunakan untuk merepresentasikan molekul

makro. Struktur gen yang mengkodifikasi sekuens asam amino di dalam protein dibuat

menggunakan proyek sekuensial genom. Data genomik akan diterjemahkan menggunakan

komputer menjadi sekuens protein.

3. Struktur Molekuler 3D.

Struktur Molekular 3D. Pemodelan komputer bisa menggambarkan struktur ini menggunakan

pengukuran fisik menggunakan sinar X atau resonansi magnetik nuklir.

4. Fungsi dan Struktur Genom

Fungsi dan Struktur Genom. Genom dari suatu organisme (mahluk hidup) terdiri dari materi

genetik keseluruhan. Informasi fungsi dan struktur genom adalah informasi detail dasar yang

selalu diperbaharui dengan berbagai informasi baru termasuk tautan ke berbagai database

yang lain.

5. Data Bibliografik

Data Bibliografik, seperti abstrak dari suatu artikel sains. Jumlah data yang meningkat secara

eksponensial, terutama yang berhubungan dengan proyek genom, seperti proyek sekuensial

genom manusia. Data yang saat ini bisa diakses publik melalui internet merupakan susunan

data dalam bentuk kecil.

TEKNOLOGI DI DALAM BIOINFORMATIKA

Bioinformatika menggabungkan berbagai bidang ilmu komputer, matematika, dan

engineering untuk memproses data biologi. Supercomputer digunakan untuk membaca dan

memproses data biologi supaya hasilnya semakin cepat didapatkan. Berbagai sistem

informasi dan database digunakan untuk menyimpan dan menyusun data biologi. Dalam

menganalisa data biologi, juga diperlukan berbagai algoritma Artificial Intelligence, Machine

Learning, Soft Computing, Data Mining, Image Processing, dan Simulation.

Teknologi dan Inovasi Microsoft di bidang Bioinformatika

a. Microsoft Bioinformatics Initiative

Program “Microsoft Bioinformatics Initiative” yang terdiri dari tiga komponen utama :

1). NET BIO

NET Bio merupakan suatu tool yang bisa ditambahkan ke framework pemrograman netral

bahasa .NET yang awalnya ditujukan untuk mendukung penelitian di bidang genomik.

Bionformatika

Page 9: Bab 6

Sekarang ini .NET Bio mendukung berbagai formal file bioinformatika; berbagai algoritma

untuk manipulasi sekuens protein, RNA, dan DNA; dan pasangan konektor untuk terhubung

ke layanan web biologi seperti NCBI BLAST. .NET Bio menggunakan lisensi sumber

terbuka, dan semua dokumentasi, aplikasi demo, kode sumber, dan executable file bisa

didownload dari situs Codeplex.

2). Microsoft Biology Tools (MBT)

The Microsoft Biology Tools (MBT) merupakan kumpulan tool yang bisa digunakan para

peneliti bioinformatika dan biologi supaya lebih produktif dalam menemukan berbagai

penemuan sains. Tool di dalam katalog MBT bebas digunakan, dan juga termasuk

didalamnya kode sumber terbuka dan berbagai proyek kolaborasi sumber terbuka. Contoh

tool-tool di dalam katalog MBT bisa dilihat di sini :

http://research.microsoft.com/en-us/projects/bio/mbt.aspx.

3). BioHPC

BioHPC merupakan implementasi HPC untuk para peneliti biologi. HPC adalah High

Performance Computing, yang memanfaatkan sebanyak mungkin sumber daya komputer

yang ada untuk menyelesaikan satu tugas berat dengan lebih singkat. HPC merevolusi ilmu

biologi dengan cara memberi para ahli biologi kemampuan proses dan analisa data yang

sangat besar yang tidak terbayangkan beberapa dekade lalu. Namun sayangnya kebanyakan

ahli biologi tidak memiliki keahlian komputer ataupun sarana komputer yang memadai.

Microsoft bekerjasama dengan Unit Layanan Biologi Komputasi Universitas Cornell untuk

menyediakan kekuatan HPC bagi ribuan peneliti di seluruh dunia. BioHPC khusus ditujukan

pada peneliti bioinformatika, sehingga bersifat sangat powerful tetapi mudah sekali

digunakan dan tidak perlu ahli komputer dengan keahlian khusus untuk mengoperasikannya.

b. Windows Azure Bioinformatics

Windows Azure merupakan satu layanan komputasi awan Microsoft yang bisa digunakan

untuk menyelesaikan berbagai tugas bioinformatika dengan cepat.

Bionformatika

Page 10: Bab 6

Dengan adanya ledakan data genom beberapa tahun terakhir, maka kita memerlukan

kekuatan komputasi yang luar biasa untuk memproses semua data yang ada. Windows Azure

dikombinasikan dengan Microsoft Excel untuk analisa, memberikan para peneliti

kemampuan yang luar biasa untuk mendapatkan berbagai wawasan baru dan kemampuan

eksplorasi di area-area yang sebelumnya tidak terjamah. Salah satu aplikasi killer untuk

Windows Azure di bidang bioinformatika ini adalah NCBI BLAST untuk Windows Azure.

NCBI Blast merupakan implementasi Basic Local Alignment Search Tool (BLAST) dari

National Center for Biotechnology Information (NCBI). BLAST merupakan sekumpulan

program yang dirancang untuk mencari semua kemiripan antara sebuah protein atau DNA

dan sekuensnya yang sudah diketahui dari seluruh database kemungkinan yang ada. Peneliti

memerlukan kemampuan ini untuk mengetahui fungsi dan manfaat dari sebuah produk

genetik. Windows Azure memungkinkan komputasi yang sangat rumit dilakukan dengan

sangat cepat dan dengan biaya yang murah. Misalnya dengan Windows Azure mampu

menyingkat pengoperasian BLAST dari enam tahun menjadi satu minggu saja. Microsoft

XCG (Extreme Computing Group) merupakan satu tim di Microsoft yang berhasil melakukan

hal ini dengan cara membagi beban BLAST ke beberapa data center Microsoft yang tersebar

di Amerika dan Eropa.

Bionformatika

Page 11: Bab 6

Gambar di atas menunjukkan gambar bakteri Rhodopseudomonas palustris yang digunakan

untuk memproduksi hidrogen sebagai bahan bakar.

Bionformatika