Important Announcement
PubHTML5 Scheduled Server Maintenance on (GMT) Sunday, June 26th, 2:00 am - 8:00 am.
PubHTML5 site will be inoperative during the times indicated!

Home Explore Bab 10. Bioinformatika & Biologi Komputasional

Bab 10. Bioinformatika & Biologi Komputasional

Published by haryahutamas, 2016-04-01 23:39:00

Description: Bab 10. Bioinformatika & Biologi Komputasional

Search

Read the Text Version

il ::i.nr'lilj'iiiifl'ili PhD & Victor W. Rodwell,PERAN BIOMEDIS penyakit atau disfungsi, berada di luar kemampuan pikiran manusia untuk mengkaji dan mengulasnya. Jadi, paraModel ilmiah pertama tentang patogenesis, misalnya teori ilmuwan biomedis memanfaatkan perangkat komputasionalkuman pada penyakit oleh Louis Pasteut bersifat biner: canggih untuk mengumpulkan dan mengevaluasi informasisetiap penyakit memiliki satu kausayang dapat didefinisikan. biologis dalam skala besar.Malaria disebabkan oleh amuba Plasmodium falciparum'tuberkulosis olehbakteri My co b acterium tu b e rculos is, penyaktt APA YANG DIMAKSUDsel sabit oleh mutasi di gen yang menyandi salah satu subunit DENGAN BIOINFORMATIKAhemoglobin, poliomielitis oleh poliovirus, dan skorbut oleh DAN BIOTOGI KOMPUTASIONAI?defisiensi asam askorbat.'Oleh sebab itu, strategi untuk Bioinformatika mengeksploitasi kemampuan luar biasa komputer dalam mengolah dan menyimpan informasi untukmengobati atau mencegah penyakit dapat disederhanakanmeniadi suatu proses langsung berupa penelusuran agen mengembangkan alat gunamengumpulkan, membandingkan,penyebab lalu merancang suatu cara untuk melenyapkannya, mengambil kembali, dan menganalisis data biologik dalammenetralkan efeknya, atau menghambat rute penularannya. skala besar. Banyak sumber bioinformatika (lihat bawah) dapat diakses melalui internet, yang menyebabkan sumber-Pendekatan dasar ini telah berhasil diterapkan untuk sumber tersebut memiliki jangkauan dan dampak globai' Tirjuan sentral suatu proyek bioinformatika biasanya adalahmemahami dan mengobati berbagai penyakit infeksi dan menyusun semua informasi yang ada dan relevan dengangenetik. Namun, kini semakin jelas disadari bahwa penentubanyak penyakit-termasuk kanker, penyakit jantung topik tertentu di suatu lokasi yang sering disebut sebagaikoroner, diabetes tipe II, dan penyakit Alzheimer-bersifatmultifaktor. Kemunculan dan perkembangan penyakit- perpustakaan atau pangkalan data (database), dalam suarupenyakit yang disebutkan tadi yang tidak memiliki agen iorrr-r\", seragam yang menyebabkan data dapat dimanipulasi(-agen) spesifik yang keberadaannya diperlukan dan me-madai, mencerminkan hubungan timbal-balik kompleks dan dianalisis oleh algoritme komputer.antara susunan genetik, makanan, dan gaya hidup masing- Ukuran dan kemampuan database bioinformatika dapatmasing pasien, serta beragam faktor lingkungan lain, seperti sangat bervariasi bergantung pada cakupan dan sifat tujuan- adanya toksin, virus, atau bakteri. nya. Database PubMed, contohnya, mengumpulkan kutipan Tantangan yang ditimbulkan oleh penyakit multifaktor untuk semua artikel yang diterbitkan dalam jurnal riset bio- medis dan biologis. Jumlah jurnal yang dilacak oleh PubMedtersebut mengharuskan adanya peningkatan tajam dalam luas berada dalam kisaran ratusan, masing-masing biasanyadan kedaiaman pengetahuan kita tentang makhluk hidup yang menerbitkan beberapa ratus sampai beberapa ribu makalahmampu menyamai kecanggihan dan kompleksitas makhluk per tahun. Sebaliknya, Cytochrome P450 Homepage (http://hidup itu sendiri. Kita masih harus mengidentifikasi banyak drnelson.utmem.edu/CytochromeP450.html) membatasi dirinya sampai sekitar 2000 anggota famili enzim sitokromprotein yang hingga kini beium kita ketahui yang disandi P450 yangterlibat dalam metabolisme sejumlah besar obatdi dalam genom manusia dan organisme yang berinteraksi dan xenobiotika (lihat Bab 52).dengannya, hubungan antara protein-protein tersebut, dan Pembuatan database yang lengkap dan mudah diaksesdampak faktor makanan, genetik, dan iingkungan terhadap jelas tidak mudah. Pertama-tama, informasi biomedis datang protein-protein tersebut. Banyaknya informasi yang harus dalam berbagai bentuk. Contohnya, informasi penyandiandioiah untuk dipahami, selengkap dan seterpadu mungkin, dalam suatu genom, meskipun sangat banyak, terdiri atas mekanisme molekular yang mendasari perilaku makhluk hidup, serta cara bagaimana gangguan dapat menyebabkan 88

/BAB 10: BIOINFORMATIKA & BIOLOGI KOMPUTASIONAL 89 rangkaian linier sederhana empat basa nukleotida. Sementara PROYEK GENOM MANUSIA jumlah residu asam amino yang menentukan struktur primer suatu'protein jauh iebih sedikit daripada jumlah pasangan Kesuksesan penuntasan Human Genome Project merupakan basa dalam genom, namun deskripsi struktur sinar-X puncak dari lebih enam dekade pencapaian penting di protein memerlukan spesifikasi lokasi masing-masing atom bidang biologi molekular, genetika, dan biokimia. Kronologi komponennya dalam ruang tiga-dimensi. Beragam kriteria di bawah menjabarkan beberapa tahapan penting yang dapat diterapkan dalam menjabarkan subjek studi biomedis: tinggi badan; berat badan; usia; jenis kelamin; indeks massa berujung pada keberhasilan penentuan keseluruhan sekuens tubuh; diet; etnis; riwayat medis; profesi; pemakaian obat, genom manusia. alkohol atau produk tembakau; aktivitas 6sik; tekanan 1944-DNA dibuktikan merupakan bahan herediter darah; tempat tinggal; status perkawinan; golongan darah; 1 953-Konsep heliks ganda dikemukakan 1 966-Kode genetik berhasil dipecahkan kadar kolesterol serum; dsb. 197 2-Teknologi DNA rekombinan dikembangkan 1977-Mtncul teknologi penenruan sekuens DNA yang Kedua, mengantisipasi cara bagaimana pemakai ingin mencari arau menganalisis informasi dalam suaru database prakris dan merancang algoritme untuk mengarasi berbagai variabel 1983-Gen untuk penyakit Huntington berhasil tersebut dapat merupakan tantangan berat. Contohnya, bahkan tugas sederhana seperri mencari database gen sering dipetakan menggunakan (secara tersendiri atau berkombinasi) berbagai kriteria beragam, misalnya nama gen, nama protein yang 1985-Reaksi berantai polimerase Qtolymerase chain disandinya, fungsi biologis produk gen, sekuens nukleotidadi dalam gen, sekuens asam amino di dalam protein yang reaction, PCR) diciptakan disandinya, organisme yang mengandung gen tersebur, ataunama ilmuwan yang meneliti gen tersebut. Para peneliti 1986-Penentuan sekuens DNA dapat dilakukan secarayang ingin menenrukan apakah dampak suatu polimorfisme otomatisgenetik pada usia dipengaruhi oleh sifat cuaca tempat orangyang bersangkutan tinggal mungkin perlu membandingkan 1986-Gen untuk distrofi otot Duchenne berhasildata dari berbagai database, diidentifikasi 1989-Gen untuk fibrosis kistik berhasil diidentifikasi Tirjuan utama biologi komputasional adalah menciptakan 7990-Human Genome Project diluncurkan di Amerikaalgoritme kompurer yang memungkinkan ilmuwan membuat Serikatmodel yang mirip dengan perilaku berbagai molekul L994-Peragenetik manusia berhasil diselesaikandan proses biologik baru melalui aplikasi prinsip-prinsip 1996-Peta gen manusia yang perrama berhasilfisika, kimia, dan biologi. Bila fokus utama bioinformarikaadalah pengumpulan dan evaluasi data yang ada, biologi dituntaskankomputasional bersifat eksperimental dan eksploratif. Tirjuan 1999-Single Nucleotide PoQmorphism Initiatiue dimulaiutama para ahli biologi komputasional adalah menggunakan 1999-Sekuens pertama sebuah kromosom manusia,pengetahuan tenrang sekuens dan struktur protein yang nomor 22, berhasil diselesaikantelah diteliti dengan baik untuk menciptakan berbagai 2000-\" Drafi pertamd' genom manusia selesai 2003-Penentuan sekuens genom manusia perramaalgoritme komputer yang mampu memperkirakan strukturtiga-dimensi dan kemungkinan-kemungkinan fungsi suatu selesaiprotein baru berdasarkan sekuens primernya. Perancangan Bersamaan dengan kemajuan-kemajuan ini, penentuanobat dengan menggunakan komputer memanfaatkan strukturtiga dimensi protein sebagai model molekul untuk ligan sekuens genom ratusan organisme lain term asukHaemophilusyang prospektif. Para ahli biologi kompurasional yang lainkini sedang mengembangkan algoritme yang menerangkan influenzae (1995), ragi (1996), Escherichia coli (1997),keseluruhan aktivitas metabolik yang berlangsung dalam Caenorhabditis elegans (1998), Mycobacterium tuberculosissebuah sel pada tingkat sisrem arau global. Sel \"maya\" ini (1998), beras (2000), Listeria monoqttogenes (2001), versi drafi genom mencit dan tikus (2002), dan koronaviruskemudian dapat digunakan untuk memperkirakan efektoksin, parogen, atau bahan farmakologik lain terhadap SARS (2003).fungsi sel. Dengan memungkinkan para ilmuwan melakukan Dua kelompok berperan dalam penenruan sekuens genom manusia. Human Genome Sequencing Consortiumeksperimen canggih \" in silico\" , biologi komputasional menerapkan penentuan sekuens shotgun hierarkis. Keseluruhan genom dipecah-pecah menjadi poronganmemberi harapan untuk mempercepar laju riset biomedis kira-kira sepanjang 100-200 kb dan disisipkan ke dalamdan pengembangan terapi baru bagi patologi manusia. kromosom artifisial bakteri (bacterial artif.cial chromosome, BAC). BAC kemudian diposisikan pada masing-masing krornosom dengan menciri sekuens-sekuens penanda yang dikenal sebagai sequence-tagged sirer (lokus-lokus genomik pendek unik dengan pemeriksaaan PCR yang

90 / BAGIAN l: STRUKTUR & FUNGSI PROTEIN & ENZIMtersedia) yang lokasinya diketahui. Klon BAC kemudian perkembangbihkan yang singkat serta mudah direkayasadipecah menjadi fragmen kecll (shotgunning), ditentukan secara genetik dengan menggunakan teknologi \"transgenik\"'sekuensnya, dan dianalisis dengan algoritme komputeruntuk mengidentifikasi informasi sekuens yang cocok dari TANTANGAN BAGI DUNIA KEDOKTERANfragmen-fragmen yang bertumpang tindih sehingga sekuenslengkap dapat diketahui' Tim dari Celera menggunakan Potensi dan tantangan pada riset genomika disajikanpendekatan shotgun genom menyeluruh. Fragmen-fragmen secara gamblang dalam suatu ulasan baru-baru ini oleh FSkecil disusun pada perancah, rangkaian contigs (rangkaianDNAyang memiliki sekuens tumpang-tindih) dalam urutan Collins dan rekan-rekannya dalam makalah berjudul '7yang benar, tetapi tidak harus berkaitan dalam satu sekuens uision for the future of genomic research. A blueprint for theyang kontinu. Posisi yang tePat dari perancah-perancahini kemudian ditentukan dengan menggunakan sequence' geno *i'ic era\" (Nature 2003 ;422;6934) yang mengidentifi kasitagged sites. Alat penentu sekuens high+hroughput, program tantangan yang akan dihadapi oleh para dokter, ilmuwan,komputer yang kuat, dan elemen kompetisi masing- dan pembuat kebijakan seiring dengan kemajuan revolusimasing ikut berperan menghasilkan kemajuan pesat yang genomik. Meskipun pentingnya dampak pada masyarakatdicapai oleh kedua kelompok peneliti yang berujung padapenyelesaian Human Genome Project secara tepat. Penielasan ,..\".\" ,r-t- tidak diragukan lagi, namun bab ini hanyayang lebih terperinci mengenai kedua pendekatan ini dapat berfokus pada tantangan bagi dunia kedokteran dan biologiditemukan di www.genomenewsnetwork.org/articles/06- yang diajukan dalam makalah di atas:00/sequence-primer.shtml. ' Mengembangkan strategi ampuh untuk mengidentifikasiREVOIUSI GENOMIK peran faktor genedk dalam penyakit dan respons obat'Beberapa dekade awal abad ke-21 akan menjadi saksi . Mengidentifikasi varian-varian gen yang ikut berperansuatu \"Revolusi Genomik\" seiring dengan eksploitasi yangdilakukan para ilmuwan dan dokter atas informasi genetik daiam kesehatan dan resistensi terhadap penyakit.yang tersirat dalam Human Genome Project dan genomberbagai organisme yang mengolonisasi, menginfeksi, dan ' Mengembangkan pendekatan berbasis-genom untukmengambil makanan dari Homo sdpiens. Dalam era baruini, tugas mengidentifikasi gen yang bertanggung jawab memperkirakan kerentanan terhadap penyakit dan untuk penyakit genedk manusia telah jauh dipermudah oleh respons obat, deteksi dini penyakit, dan mengungkapkanketersediaan informasi genetik terperinci melalui Internetdan kemampuan memPeroleh dan menganalisis DNA taksonomi molekular keadaan sakit. dengan menggunakan teknik-teknik cepat yang sangat sensitif, seperti PCR dan pen€ntuan sekuens DNA otomatis. ' Mengei<sploitasi pemahaman baru tentang gen dan jalur Besarnya ukuran genom menyebabkan bioinformatika dan untuk mengembangkan pendekatan teraPeutik yang biologi komputasional menjadi bidangyang tidak tergantikan lebih efektif dalam mengatasi penyakit. untuk menilai faktor-faktor yang mendasari kerentanan . Menentukan bagaimana informasi risiko genedk penyakit, penuaan, dan masalah terkait-kesehatan lainnya' Telah meniadi jelas bahwa bahkan perbedaan genedk diterapkan dalam situasi klinis dan bagaimana informasi tersebut menuntun strategi dan perilaku hidup sehat' yang ringan dan tampak minor dapat sangat signifikan' Contohnya, sementara gen manusia dan simpanse 98,87o Kemajuan saat ini dan di masa mendatang dalam identik, primata selain manusia tidak rentan terhadap AIDS atau malaria. Jadi, genomika perbandingan seyogianya pemahaman kita tentang genom dan fungsi elemen-elemen memberikan petunjuk tentang perbedaan dalam kerentanan yang disandinya akan sangat mempercepat kemajuan dalam ini. Mencit meiupakan mamalia model lain yang bermanfaat ilmu kedokteran dan biologis. Tujuan jangka-pendek adalah karena ketersediaannya dan kemudahannya untuk ditelusuri kompilasi suatu \"ensiklopedia' yang mencakuP semua secara eksperimental. Meskipun secara filogenetik dan protein yang disandi oleh genom manusia. Thntangan fenotipe lebih menyimpang dari manusia dibandingkan jangka-panjang adalah mengungkapkan cara protein-protein dengan primata, namun 90o/o gen pada mencit memiliki homolog pada manusia. Selain itu' mencit memiliki waktu ini terintegrasi untuk melaksanakan tugas fisiologis dan memahami mekanisme perubahan genom dan cara genom memperoleh fungsi baru. Sementara sekuens DNA pada g.ro- manusia telah diketahui, arsitektur fungsionalnya sangatlah rumit dan umumnya belum teridentifika'si' Karena ukurannya yang sangat besar, hanya l-2% DNA manusia dikhususkan untuk menyimpan sekuens asarn amino dari 30.000 protein yang disandinya. Namun, 1-2olo DNA noncoding lainnya mengalami selelsi aktif dan tampaknya esensial. Di luar segmen-segmen kecil yang berfungsi sebagai elemen regulatorik atau gen untuk mengontrol ekspresi dan replikasi gen, fungsi sebagian besar genom manusia masih perlu ditentukan.

IBAB l0: BIOINFORMATIKA & BlOtOGl KOMPUTASIONAL 9l Pengetahuan tentang sekuens genom dari berbagai sekuens-sekuens asam amino dengan menggunakan programorganisme lain sangat penting untuk memahami fungsi komputer untuk mengidentifikasi residu-residu asam aminogenom manusia. Kemampuan untuk menyandingkandan membandingkan sekuens-sekuens genom dari yang terkonservasi (tidak berubah selama evolusi) dan penting secara fungsional atau struktural (lihat Thbel 7-1),beragam organisme yang berbeda akan membantu kita serta untuk memberikan petunjuk mengenai kemampuan mengatalisis, mengatur, dan kemampuan lainnya yangmengidentifikasi gen dan produk gen yang saat ini tidak dimiliki protein atau produk gen baru (lihat Bab 42).diketahui. Penerapan perangkat komputasi yang semakin Seperti diajukan oleh artikel yang dikutip sebelumnya,canggih akan memungkinkan ilmuwan merekonstruksi tantangan bagi dunia biologi adalah sebagai berikut:perkembangan genom manusia sehingga arsitektur . Untukberagammengidentifikasikomponen-komponenfungsional genom manusia dapat dipahami. struktural dan fungsional yang tersandi dalam organisme Kemajuan revolusi genomik menimbulkan tantangan yang secara biologis dan komprehensif,,bagi masyarakat melebihi bidang kesehatan manusia. . lJntuk mengetahui susunan jaringan genetik dan jalurPertanda awal dari tantangan ini dapat dilihat dalam protein serta memastikan bagaimana keduanya berperan menentukan fenotipe sel dan organisme.silang-pendapat tentang makanan yang direkayasa secara . Untuk memperoleh pengetahuan terperinci tentanggenedk, pengklonan hewan utuh, dan pemakaian seltunas mudigah manusia dalam riset. Pemahaman baru variasi herediter dalam genom.tentang peran genetik dan molekul dalam sifat dan perilaku . Untuk memahami variasi evolusioner di antara spesiesmanusia, serta kesehatan fisik atau penyakit, mengharuskandikembangkannya kebijakan baru baik di tingkat nasional serta mekanisme yang mendasari variasi ini.maupun internasional yang berkaitan dengan hukum, ilmukedokteran, agrikultur, dsb. . lJntuk mengembangkan pilihan kebijakan yangTANTANGAN BAGI BIOLOGI mempermudah penyebarluasan penggunaan genomika baik untuk kepentingan riset maupun klinis.Dampak pada ilmu kedokteran hanyalah salah satu aspekdari revolusi genomik. Pengetahuan tentang sekuens genom SUMBER BIOINFORMATIKAdari berbagai organisme sangat pendng brgi kita unnrk DAN GENOMIKmemahami peran fungsional semua genom. Kemajuandalam bioinformatika, biologi komputasional, genomika Single Nucleotide Polymorphismsperbandingan, dan biokimia high+hroughpzrtelah memperluas Meskipun sekuens genomik dari dua orang99,9o/o identik,dan memperkuat perangkat riset yang tersedia bagi para ahli namun DNA manusia mengandung sekitar l0 juta tempatbiologi untukmeneliti dan menganalisis kesehatan dan penyakit yang masing-masing berbeda hanya di satu basa nukleotida.pada tingkat molekular yang sebelumnya mustahil dilakukar. Tempat-tempat ini disebut s ingle nuclcotide polynorpbirmsKemajuan dalam bidang biokimia kini memungkinkan kita (SNP). Salah satu pendekatan untuk mendeteksi SNPsecara bersamaan meneliti pola ekspresi ribuan mRNA dan adaiah Tiansgenomic'Wave Denaturing High Performanceprotein yang disandinya dengan menggunakan teknologi Liquid Chromatography (DHPLC, atau WAVE/DHPLC), suatu varian HPLC yang dapat mendeteksi perbedaan satumicroanay dan proteomika. pasangan-basa di antara fragmen-fragmen DNA 750 pb Kemudahan akses melalui internet untuk sekuens yang nyaris identik.genom organisme dari ketiga domain filogenetik, Archaea, Jika rangkaian SNP yang terletak di kromosomBacteria, dan Eukarya, disertai akses untuk algoritme gunamemanipulasi dan memindahkan data yang berasal dari yang sama diwariskan bersama-sama dalam blok, polasekuens-sekuens ini, telah menyebabkan transformasi besar SNP di masing-masing blok disebut haplotipe. Dengandalam bidang biologi dan biokimia. Seperti disinggung di membandingkan distribusi haplotipe dalam kelompokatas untuk genom manusia, pembandingan sekuens genom individu dengan atau tanpa penyakit atau respons tertentu,dari spesies yang secara evolusi sangat berbeda telah menjadi para ilmuwan biomedis dapat mengidentifikasi SNP yangalat yang sangat berguna untuk mengidentifikasi elemen- berkaitan dengan sifat fenotipe tertentu. Proses ini dapatelemen genom yang secara fungsional penting dalamsemua bentuk kehidupan. Penelitian mengenai aspek-aspek dipermudah dengan berfokus pada Thg Stry'P, suatu subsetmolekular biokimia komparatif menghasilkan pemahaman SNP di suatu blok yang dapat memberi tanda khusus untuk haplotipe tertentu. Studi terperinci tentang masing-masingbaru tentang berbagai proses metabolik. Penerapan regio seyogianya mengungkapkan varian-varian gen yang berperan dalam penyakit atau respons tertentu. Identifikasibioinformatika tahap awal adalah penggunaan susunan

92 / BAGIAN l: STRUKTUR & FUNGSI PROTEIN & ENZIMgen-gen semacam ini diharapkan akan memungkinkan kita berawal dari upaya para ahli biologi molekular terdahulumenegakkan diagnosis secara lebih dini, serta memperbaikipencegahan penyakit dan penanganan pasien. Pengetahuan untuk menentukan apakah kemiripan yang dijumpai di antaratentang profil genetik seseorang juga akan digunakan untuk berbagai protein yang melakukan fungsi metabolik umummengarahkan pemilihan obat atau vaksin yang aman danefektif, yakni suatu proses yang disebut farmakogenomika. menunjukkan adanya perubahan progresif dari asal yang sama. Pertanyaan evolusioner utama yang diajukan adalah Sebagai badan utama yang bertanggung jawab terhadapriset kesehatan manusia di Amerika Serikat, IVational Institute apakah kemiripan tersebut mencerminkan (a) pewarisan dari protein nenek-moyang yang sama (evolusi divergen), atau (b)of Heahh, melalui National Center for Biotecbnology seleksi independen suatu mekanisme umum untuk memenuhi sebagian kebutuhan sel spesifik (evolusi konvergen), sepertiInforznation (NCBD, memberikan akses gratis dan mudah yang akan diantisipasi jika salah satu solusi tertentu ternyatake database molekular, genomik, struktural, dan literatur,dan akses ke algoritme untuk analisisnya melalui situs jauh lebih baik daripada alternatif yang lain. DenganEntrez (http://www.ncbi.nlm.nih.gov/gquery/gquery.fcgi).Selain berfokus utama adalah pada biokedokteran, Entrez membandingkan sekuens-sekuens untuk menghitung j umlahjuga bermanfaat untuk penelitian sistematik aspek-aspek minimal perubahan nukleotida yang diperlukan untukmolekular bioiogi dan biokimia. Di bawah ini dibahas mengubah bentuk-iso suatu protein ke bentuk iso lainnya,beberapa co ntoh narasumber yang dapar. digunakan. dapatiah ditentukan apakah kemiripan dan perbedaanProyek ENCODE memperlihatkan suatu pola yang menunjukkan perubahanIdentifikasi semua elemen fungsional genom akan sangat progresif dari titik awal yang sama.meningkatkan pemahaman kita tentang proses-proses BIAST telah berkembang menjadi sekelompok programmolekular yang mendasari perkembangan, kesehatan, dan yang dioptimalkan untuk menjawab rangkaian data danpenyakit manusia. Untuk mencapai tujuan ini, pada akhir kebutuhan tertentu. blastp membandingkan sekuens asamtahun 2003 National Human Genome Research Institute amino yang ingin diketahui dengan suau databasr sekuens protein, blastn membandingkan sekuens nukleotida yang(NHGzu) memulai ENCODE Project. ENCODE ingin diketahui dengan data b as e sekuens nu k leotida, blasrr' membandingkan sekuens nukleotida yang ingin diketahui(Eruyclopedia Qf DNA Elements) memadukan pendekatan dan ditranslasikan di semta reading frame dengan databaselaboratorium dan komputasional, dalam suatu upaya berbasiskonsorsium terbuka, untuk mengidentifikasi setiaP elemen sektenspro tein untuk mengetahui produk-produkyang dapatfungsional dalam genom manusia secara komprehensif. Parapeneliti konsorsium dengan berbagai latar belakang dan ditranslasikan, tblastn membandingkan sekuens proteinkeahlian akan bekerja sama dalam mengembangkan dan yang ingin diketahui dengan database sekuens nukleotidamengevalusi berbagai teknik, teknologi, dan suategt high- throughput baru yang akan mengatasi kekurangan kita saat yang secara dinamis ditranslasikan di keenam readingfame,ini dalam mengidentifikasi elemen-elemen fungsional. dan tblasu membandingkan translasi enam-ftame statu Selama fase percobaannya, ENCODE akan membidik database sekuens nukleotida yang ingin diketahui dengan translasi enam-fame sratu databass sekuens nukleotida-sekitar 1olo (30 Mb) genom manusia untuk dianalisis Tidak seperti program-program penyambungan sekuens yang mengandalkan susunan global, algoritme BIAST secara eksperimental dan komputasional. Tantangan yang menekankan regio-regio susunan loleal untuk mendeteksi dihadapi oleh konsorsium tidaklah sedikit. Selain ukuran genom manusia yang sangat besar dan sifat tersembunyi dari hubungan di antara berbagai sekuens dengan hanya sebagian sebagian besar sekuensnya, para ilmuwan harus menghadapi regio yang serupa, dan karenanya deteksi tersebut menjadi variasi fungsi genom yang menandai berbagai tipe dan tahap lebih cepat dan sensitif. Sekuens input atau \"yang ingin diketahui\" dipecah-pecah menjadi \"kata' (ukuran defaultperkembangan sel. Karena rumitnya masalah ini, jelaslah untuk nukleotida 11, untuk asam amino 3). Pengaksesan bahwa tidak ada satu pendekatan eksperimental atau tipe kata dari database kemudian diperluas dalam dua arah. sel yang dapat memberikan pandangan menyeiuruh tentang Enlrez Gene hubungan timbal-balik antara sekuens, arsitektur' dan fungsi Entrez Gene menyediakan beragam informasi mengenai genom. gen-gen manusia. Informasi ini mencakup sekuens genom di dalam atau sekitar gen, struktur gen (batas ekson-intron), BIAST sekuens mRNA (-mRNA) yang dihasilkan dari gen, dan semua fenotipe yang berkaitan dengan mutasi tertentu' BI-AST (Basic Local Alignment Search Tool) dan Entrez Gene juga mencantumkan, jika diketahui, fungsi algoritme penyusunan/perbandingan sekuens lainnya protein yang disandi dan dampak polimorfisme nukleotida tunggal di regio penyandi.

/e3BAB 10: BIOINFORMATIKA & BIOLOGI KOMPUTASIONALHapffiap Proiect Bahasa Kata PenjajaranHap\4ap Project adalah suatu upaya kerja sama oleh para lnggris PHYSIOLOGICAL ffr{ys ur}r:ilst-#AL Perancis PHYSIOLOGIQUE fl [:l Y $ f $ ],{)i} I -,,: UEilmuwan dari Amerika Serikat, Kanada, Cina, Jepang, Jerman .PHYSIOLOGISCH lii,u :{ $i r fi 1; il si r s fl HNigeria, dan Inggris untuk mengidentifikasi gen-gen yang Belanda FySloLoGlScH -y$IilL#tr]:s*H Spanyol FYSIOLOGICO -y$it():Lo{ir-f;oberkaitan dengan penyakit manusia dan perbedaan respons Polandia FIZJOLOGICZNY - sfiftsir-flzNYterhadap obat. Peta haplotipe (haplotylte map, HapM.ap)genom manusia yang dihasilkan akan menjadi sumber Gambar 10-1. Contoh penyusunan sekuens multipel. Bahasapenting untuk mengungkapkan faktor-faktor genetik yang berkembang melalui cara yang mirip dengan yang terjadi padaberperan dalam variasi sensitivitas manusia terhadap faktor gen dan protein. Di sini diperlihatkan kata lnggris \"physiological\"lingkungan, kerentanan terhadap infeksi, dan responsivitas. dalam beberapa bahasa. penyusunan ini memperlihatkan fitur-fiturbaik yang menguntungkan maupun merugikan, terhadapobat dan vaksin. yang terkonservasi. Keidentikan dengan kata dalam bahasa lnggris diperlihatkan dalam warna gelap; kemiripan bahasa diperlihatkanCDD dalam warna terang. Algoritme penyusunan sekuens multipelLayaknya beberapa kata yang dibentuk dari penggabungan ini mengidentif ikasi huruf asam amino dan nukleotida yangkata akar atau suku kata-misalnya laluJintas, kristalografi,pancaroba-banyak protein mengandung berbagai domain terkonservasi dalam DNA, RNA, dan polipeptida secara analog.yang masing-masing memiliki fungsi dan asal evolusionertersendiri. Para ahli biologi komputasional mengklasifi kasikan Molecular Modeling Dqto,bo,se & Cn3Ddomain-domain yang terkonservasi (conserued domains, CD)tersebut berdasarkan pengulangan motif atau pola sekuens. Struktur tiga-dimensi lebih dari 28.000 protein dan polinukleotida tersimpan dalam Molecular ModelingMotif-motif yang terkonservasi ini dapat diidentifikasi dan Database (MMDB). Berkas untuk setiap struktur dikaitkan dengan kutipan bibliografi yang relevan, klasifikasididefinisikan dengan membandingkan dan menyandingkan taksonomik, serta sekuens dan struktur sekitar di databasesekuens berbagai protein yang diperkirakan memiliki suatudomain yang sama, suatu proses yang disebut muhiple NCBI yang lain. Struktur dapat diperoleh dengan kata kunci,sequence alignment (penyusunan sekuens multipel, Gambar misalnya nama enzim; dengan sehuens protein, ata:u dengan sekuens nukleotida. Struktur kemudian dapat dilihat, diputar,10-1). CDD (Conserved Domain Database) NCBI berisi dan dimanipulasi dengan menggunakan Cn3D, yakni suatusuatu perpustakaan mubiple sequence alignment baik untuk perangkat lunak gratis untuk melihat struktur tiga-dimensi yang dapat diakses dari Entrez melalui dotunload. Cn3Ddomain individual maupun protein lengkap. secara bersamaan memperlihatkan struktut sekuens, dan penyusunan, serta memiliki fitur untuk mengedit pencatatanCDART dan penyusunan.Conserved Domain Architecture Retrieval Tool (CDART) VASTmenggunakan definisi domain dan catatan dari databaseCDD untuk mencari protein-protein yang memperlihatkan Algoritme komputer VAST Uector Alignment Searcharsitektur domain serupa-urutan sekuens domain-domain fool) mengidentifikasi \"tetangga' struktural suatu protein1s1k6n5s1v35i-yang mengisyaratkan fungsi dan asal evolusi seperti ditentukan oleh serangkaian koordinat tiga-dimensiserupa. CDART menggunakan RPS-BU.ST (Reverse- yang diberikan oleh pemakai. Karena \"tetangga' strukturalPosition-Specific BLAST), yakni suatu algoritme cepat prakomputasi untuk protein yang sudah ada di MMDByang mendeteksi letak kemiripan melalui jarak evoiusi yang dapat diakses melalui Entrez, VAST digunakan untuksignifikan dengan menggunakan profil domain protein mengidentifikasi \"tetangga' struktur protein yang belum terdapat di MMDB.sensitif dan bukan menggunakan perbandingan iangsungsekuens, residu terhadap residu. Arsitektur domain kemudian KESIMPULANdigunakan untuk mencari CDD untuk protein dengan Bidang bioinformatika dan biologi komputasional yangsusunan domain serupa. Karena mengandalkan profil domain berkembang pesat memberi harapan besar bagi masa depandan domain fungsional yang tercatat, CDART bekerja cepatdan bersifat informatif. Profil domain mencakup catatan ilmu kedokteran dan biologi dasar. Sebagian harapan saatfungsional dan berkaitan dengan struktur tiga-dimensi. ini sudah dapat dilihat dengan jelas, sementara yang lainPencarian dapat disempurnakan dengan taksonomi dan masih samar-samar, dan yang lain lagi belum terbayangkan.dengan memilih domain yang berkaitan.

94 / BAGIAN l: STRUKTUR & FUNGSI PROTEIN & ENZIM . CDART, MMDB, dan VAST digunakan untukNamun, agaknya terdapat sedikit keraguan bahwa dampak menganalisis arsitektur domain dan struktur tiga-pada praktik kedokteran di abad ke-21 akan menyamai ataumengalahkan dampak penemuan patogenesis bakteri pada dimensi protein.abad ke-l9. REFERENSIRINGKASAN Altschul, SF et al: Basic local alignment search tool. J Mol Biol. Bioinformatika menggunakan komputer untuk me- 1990;215:403. ngumpulkan, menata, dan menganalisis data biomedis. Butcher SC, Berg EL, Kunkel EJ: Systems biology in drug discovery.. Biologi komputasional menggunakan algoritme kom- Nature Biotech nol 2004l'22:125 3. puter untuk melakukan simulasi yang berfungsi sebagai Carroll SB: Genetics and the making of Horno sapiens. Nature eksperimen \"maya'. 2003;422:849.. Kemampuan komputer menyimpan dan mengolah Collins FS et al: A vision for the future of genomics research. A informasi memungkinkan para ilmuwan menganalisis data dalam jumlah sangat besar, misalnya sekuens genom blueprint for the genomic era. Nature 2003;422:835. dan struktur protein. Debes JD, Urrutia R: Bioinformatics tools to understand human. Kemampuan melakukan pembandingan komplels diseases. Surgery 2004; I 35:579. Doolitde RF: Similar amino acid sequences; Chance or common berbagai kelompok data menjadikan bioinformatika suatu alat penting untuk mengidentifikasi domain- ancestry? Science l98l;214:149. domain protein dan mengungkapkan penyebab penyakit Kim JH: Bioinformatics and genomic medicine. Genet Med multifaktor. 2002;4:625.. BLAST digunakan unruk membandingkan sekuens- Koonin EV Galperin MY Sequence-Euol4si6v-ft1n6i6n. sekuens pendek pada protein dan asam nukleat. Computational Approachei to Comparatiue Genomics. Kfiwer. Entrez Gene dan HapMap digunakan untuk Academic Publishers, 2003. mengidentifikasi polimorfisme nukleotida tunggal yang mungkin berperan dalam penyakit. Slepchencko BM et d: Quantitative cell biology with the Virtual Cell. Tiends Cell Biol 2003:13:570.


Like this book? You can publish your book online for free in a few minutes!
Create your own flipbook