Na Obr. 7.1 je znázornený postup stiahnutia DNA sekvencie vo formáte FASTA z databázy GenBank (https://www.ncbi.nlm.nih.gov/genbank/). 7.2.2 Detekcia faktorov patogenity a virulencie s využitím Basic Local Alignment Search Tool – BLAST Sekvenciu, kódujúcu faktor patogenity, je možné porovnávať s inými sekvenciami z hľadiska jej identity, podobnosti alebo homológie. Tzv. similarity searching je analytická metóda založená na porovnávaní sekvencií a hľadaní podobných regiónov v rámci rôznych sekvencií. Pre tento účel je široko využívaný bioinformatický nástroj BLAST (Basic Local Alignment Search Tool) (https://blast.ncbi.nlm.nih.gov/Blast.cgi)6, ktorý bol vyvinutý spoločnosťou NCBI. V súčasnosti sú dostupné rôzne programy založené na princípe BLAST. Prehľad jednotlivých programov je zhrnutý v Tab. 7.1. Tab. 7.1 Prehľad dostupných programov BLAST (Pertsemlidis a Fondon 2001)7 Program Sledovaná sekvencia Cieľová sekvencia Popis BLASTN Nukleotidová Nukleotidová Porovnáva sledovanú nukleotidovú sekvenciu s databázou nukleotidových sekvencií. BLASTP Proteínová Proteínová Porovnáva sledovanú sekvenciu aminokyselín s databázou proteínových sekvencií. BLASTX Translatovaných Proteínová Porovnáva sledovanú nukleotidovú nukleotidov sekvenciu translatovanú vo všetkých čítacích rámcoch s databázou proteínových sekvencií. TBLASTX Translatovaných Translatovaných Porovnáva 6 rámcové transláty sledovanej nukleotidov nukleotidov sekvencie nukleotidov so 6 rámcovými translátmi nukleotidových sekvencií uverejnených v databáze. TBLASN Proteínová Translatovaných Porovnáva sledovanú sekvenciu proteínov s nukleotidov databázou nukleotidových sekvencií dynamicky translatovaných vo všetkých čítacích rámcoch. 7.2.2.1 Homológny BLAST V prípade, že je potrebné mapovať homológiu v sekvenciách kódujúcich faktory patogenity u rovnakého druhu, je možné použiť tzv. homológny BLAST. Pojem homológia sekvencie vyjadruje nielen vysokú totožnosť dvoch sekvencií, ale aj to, že porovnávané organizmy vychádzajú zo spoločného predka. Metóda homológneho BLAST je založená na vyhľadávaní sekvencie z databáz prostredníctvom zarovnania (Alignment) so sledovanou sekvenciou, 501
pričom výsledkom je štatistické hodnotenie zhody. Nukleotid-nukleotidový BLAST je častejšie preferovaný nakoľko pri tomto type nedochádza k strate informácií. Počas translácie kodónu z nukleotidovej do aminokyselinovej sekvencie nastáva strata komplexnosti približne o 69 % (64 možných nukleotidových kombinácií mapuje 20 aminokyselín)5. Ďalšou výhodou BLASTN je fakt, že prehľadávanie nukleotidových sekvencií prebieha len v štyroch možných znakoch, zatiaľ čo repertoár aminokyselín zastupuje až 20 znakov. Z toho vyplýva, že možnosť identifikácie homológnej zhody a spoločného predka je vyššia pri prehľadávaní nukleotidových sekvencií. Na druhej strane mapovanie fyzikálnych vlastností faktorov patogenity a virulencie je najvhodnejšie zachytiť u translatovaných sekvencií pomocou BLASTP. Pre efektívny BLAST je nevyhnutná selekcia správnej databázy, oproti ktorej bude vykonávané porovnanie sledovanej sekvencie. Zoznam hlavných databáz aj s popisom je prezentovaný v Tab. 7.2. Tab. 7.2 Vybraný zoznam databáz DNA sekvencií využívaný v BLASTN (https://www.ncbi.nlm.nih.gov/) Databáza Popis Nucleotide collection (nt) Pozostáva zo sekvencií GenBank, EMBL, DDBJ, PDB, RefSeq, ale nezahŕňa EST, STS, GSS, WGS, TSA, patentové sekvencie, ako aj sekvencie HTGS fázy 0, 1 a 2 a sekvencie dlhšie ako 100 Mb. Databáza nie je redundantná. Identické sekvencie boli zlúčené do jednej položky, pričom sa pre každú položku zachovali informácie o vstupe, GI, názve a taxonómii. RefSeq Select RNA sequences Databáza obsahuje NCBI RefSeq sekvencie transkriptov získané z človeka a myši, obmedzené na súbor RefSeq Select s jediným reprezentatívnym transkriptom na gén kódujúci proteín. RefSeq Representative Genome (https://www.ncbi.nlm.nih.gov/refseq/refseq_select/). Database Databáza obsahuje referenčné a reprezentatívne genómy vybrané z databázy NCBI Refseq Genomes. Genómy v tejto databáze patria medzi najkvalitnejšie genómy dostupné z NCBI. Databáza je konštruovaná s minimálnou redundanciou v reprezentácii genómu. V prípade bakteriálnych organizmov môžu byť zahrnuté viaceré genómy z rôznych izolátov toho istého druhu (napr. E. coli), zatiaľ čo u eukaryotov je na organizmus vytýčený iba jeden genóm. RefSeq Genome Database Databáza obsahuje genómy NCBI RefSeq naprieč všetkými taxonomickými skupinami. Obsahuje iba sekvencie najvyššej úrovne. Human RefSeqGene sequences Zahrnuté sú iba najdlhšie sekvencie reprezentujúce akúkoľvek danú časť genómov. Whole-Genome-Shotgun contigs Databáza obsahuje NCBI RefSeq genómy ľudí. (WGS) Databáza pozostáva z kontigov Whole Genome Shotgun (WGS), ale Transcriptome Shotgun nezahŕňa chromozómy spojené s projektmi WGS. Assembly (TSA) sequences TSA je archív výpočtovo zostavených sekvencií mRNA z primárnych dát, ako sú EST a čítaní nespracovaných sekvencií. Podrobnosti na stránke: PDB nucleotide database http://www.ncbi.nlm.nih.gov/genbank/TSA.html. Databáza pozostáva zo sekvencií získaných z PDB, ktorá obsahuje informácie o experimentálne určených štruktúrach proteínov, nukleových kyselín a komplexných zostáv. V rámci hlavnej stránky BLAST (https://blast.ncbi.nlm.nih.gov/Blast.cgi?PROGRAM = blastn&PAGE_TYPE = BlastSearch&LINK_LOC = blasthome) je vytvorené pole Organism 502
(Obr. 7.2) umožňujúce vyhľadávanie zadaného génu u konkrétneho druhu, rodu alebo čeľade patogénu. Okrem toho stránka ponúka funkciu Exclude, ktorá umožňuje vylúčiť určitý organizmus z prehľadávacieho procesu. Možnosť selekcie organizmu nie je dostupná pre všetky databázy. Postup homológneho BLAST uvedieme na príklade adhézneho proteínu MafA exprimovaného u N. meningitidis. Požiadavkou je, že prítomnosť tohto faktora patogenity potrebujeme detegovať u druhov rodu Neisseria iných ako N. meningitidis (Obr. 7.2). Obr. 7.2 Postup nukleotidového BLAST Zvolíme program BLAST. Pri prehľadávaní nukleotidových sekvencií vyberieme BLASTN (1). Do vyhľadávacieho poľa zadáme sekvenciu porovnávaného génu (Query sekvencia; 2). Zvolíme typ štandardnej databázy. V našom prípade sme zvolili databázu Nucleotide collection (3). Nakoľko máme záujem sledovať homológne sekvencie u iných druhov ako N. meningitidis, v poli Organism sme zvolili vylúčenie tohto druhu z prehľadávania (4). Program optimalizujeme na vyhľadávanie čo najpodobnejších sekvencií (5) a potvrdíme BLAST (6). (https://blast.ncbi.nlm.nih.gov/Blast.cgi?PROGRAM=blastn&PAGE_TYPE=BlastSearch&LINK_LOC=blastho me) 503
V rámci vyhodnotenia výsledkov BLAST generuje zoznam 100 výstupov (Hits) majúcich najvyššie skóre zhody. Zoznam obsahuje taxonomický názov organizmu, jeho popis a štatistické údaje zhody (Obr. 7.3). Obr. 7.3 Vyhodnotenie homológneho BLAST Výsledkom homológneho BLAST je zoznam sekvencií vyskytujúcich sa u iných druhov ako N. meningitidis. (https://blast.ncbi.nlm.nih.gov/Blast.cgi?PROGRAM=blastn&PAGE_TYPE=BlastSearch&LINK_LOC=blastho me) Prístupové číslo (Accession) obsahuje odkaz na konkrétnu generovanú sekvenciu aj so všetkými dostupnými údajmi o sekvencii spolu s FASTA súborom sekvencie. Popis (Description) udáva informácie o druhu, kmeni poprípade pôvode sekvencie (gén, genóm a iné), zatiaľ čo taxonomické meno (Scientific name) presne definuje druh generovaného organizmu. Maximálne skóre (Max score) poskytuje metrické údaje o tom, aké kvalitné je porovnanie základného lokusu. Celkové skóre (Total score) indikuje mieru podobnosti vyhľadanej sekvencie s porovnávanou sekvenciou (Query). Ak je maximálne skóre vyššie ako celkové skóre, v tom prípade bolo medzi sekvenciami nájdených viac ako jeden lokálny alignment. Výška skóre koreluje s mierou podobností porovnávaných sekvencií. Očakávaná hodnota 504
(Expectation value; E-value) poskytuje odhad o tom, aká je pravdepodobnosť, že k alignment- u došlo náhodne. Čím nižšia je hodnota E-, tým významnejšie skóre. Pole percento identity predstavuje percentuálny podiel zhody sledovanej sekvencie (Query) s generovanými sekvenciami databázy. 7.2.2.2 Ortológny BLAST Inou skupinou génov, kódujúcich faktory patogenity, sú ortológne gény (ortológy). Ortológy sú definované, ako osobitná trieda homológnych génov vyskytujúcich sa u rôznych druhov, pričom majú svoj pôvod u rovnakého predka. Obr. 7.4 Postup indentifikácie možných ortológnych sekvencií Na príklade sekvencie mafA uvádzame postup mapovania možných ortológnych sekvencií. Po zadaní sekvencie do vyhľadávacieho poľa a výberu databázy zvolíme v poli Organism vylúčenie čeľade Neisseriaceae z vyhľadávania. Algoritmus programu optimalizujeme na vyhľadávanie podobných sekvencií a potvrdíme BLAST. Výsledkom BLAST je generovanie sekvencií vykazujúcich signifikantnú zhodu medzi sledovanou sekvenciou a sekvenciami databázy. (https://blast.ncbi.nlm.nih.gov/Blast.cgi?PROGRAM=blastn&PAGE_TYPE=BlastSearch&LINK_LOC=blastho me) 505
Ortológmi sa stávajú v momente, keď nastane rozdelenie potomkov do rôznych druhov. Nakoľko sú gény evolučne príbuzné, proteíny kódované týmito génmi majú často rovnakú alebo podobnú funkciu8. Mapovanie ortológov je jednou z často využívaných funkcií bioinformatických nástrojov, nakoľko identifikácia ortológa známeho faktora patogenity môže predikovať mieru patogenity vyhľadanej baktérie exprimujúcej daný ortológny proteín. Pri identifikácii príbuzných sekvencií môžeme využiť BLAST, kde v poli Organism vyberieme alebo vylúčime z prehľadávania konkrétny druh, čeľaď a iné. Program následne optimalizujeme podľa požiadavky (Obr. 7.4). Generované sekvencie môžeme následne využiť v ďalších analýzach pri mapovaní podobných lokusov, a iných. Obdobným spôsobom, aký je spomenutý v predchádzajúcej časti, je možné prehľadávať aminokyselinové sekvencie proteínov prostredníctvom NCBI – BLASTP (https://blast.ncbi.nlm.nih.gov/Blast.cgi?PAGE = Proteins). Nástoj BLASTP ponúka výber databáz (Tab. 7.3), možnosť zvolenia/vylúčenia organizmu, ako aj algoritmus prehľadávania. Výstupom BLASTP je zoznam generovaných aminokyselinových sekvencií vykazujúcich signifikantnú zhodu so sledovanou sekvenciou. Tab. 7.3 Zoznam štandardných databáz aminokyselinových sekvencií pre BLASTP (https://blast.ncbi.nlm.nih.gov/Blast.cgi?PAGE=Proteins) Databáza Popis Non-redundant protein sequences (nr) Obsahuje všetky dostupné neredundantné translatované sekvencie z GenBank CDS, PDB, SwissProt, PIR, PRF s výnimkou environmentálnych vzoriek získaných z projektov Whole Genome RefSeq Select proteins Shotgun. Databáza obsahuje NCBI RefSeq proteínové sekvencie získané z ľudí, myší a prokaryotických organizmov obmedzené na súbor proteínov RefSeq Select. Táto databáza obsahuje jedinú reprezentatívnu sekvenciu proteínu na gén kódujúci proteín pre ľudí a myši, zatiaľ čo v prípade prokaryotov databáza obsahuje proteíny anotované u referenčných a reprezentatívnych genómov týchto organizmov. (https://www.ncbi.nlm.nih.gov/refseq/refseq_select/) Model organisms (landmark) Databáza orientačných bodov obsahujúca celkové proteómy z 27 genómov pokrývajúcich široký taxonomický rozsah. UniProtKB/SwissProt sequences. Databáza ponúkajúca voľne dostupný prístup k vysoko kvalitným Protein Data Bank proteins sekvenciám proteínov a k informáciám o ich funkcii. Databáza obsahujúca sekvencie proteínov z Protein Data Bank (PDB). PDB obsahuje experimentálne determinované informácie o štruktúrach proteínov, nukleových kyselín a komplexných zostáv. Metagenomic proteins (env nr) Databáza proteínov získaných z metagenomických projektov WGS. Transcriptome Shotgun Assembly TSA proteins sú produkované z CDS mRNA sekvencií v TSA (TSA) proteins sekvenciách. Podrobnosti na stránke: http://www.ncbi.nlm.nih.gov/genbank/TSA.html for details. 506
7.2.3 Anotácia génovej ontológie pre určenie faktorov patogenity a virulencie Rozvoj celogenómového sekvenovania viedol k identifikácii obrovského množstva génov a dát, pričom súčasným trendom v mikrobiológii je štúdium týchto génov z hľadiska ich potenciálu kódovať faktory patogenity a virulencie, respektíve ich príslušnosti ku genómovým ostrovom (genomic islands), ktoré sú často horizontálne prenášané medzi baktériami9,10. Aj keď sekvencie identifikovaných génov sú vložené do biologických databáz, ich biologická funkcia ostávala často neznáma. Z toho dôvodu bol vytvorený projekt génovej ontológie (Gene Ontology resource [GO]; http://www.geneontology.org/), ktorý poskytuje štruktúrovanú platformu pre určenie molekulárnej funkcie, subcelulárnej lokalizácie a biologických procesov, pričom jednotlivým génom respektíve produktom týchto génov priraďuje anotácie11. GO konzorcium na dennej báze prehľadáva vedecké publikácie, hodnotí výsledky experimentov, vyvodzuje funkcie na základe homológie génových produktov, a tým vytvára robustnú vedeckú bázu pre GO anotácie. V súčasnosti obsahuje platforma GO viac ako 7 miliónov rôznych anotácií pre gény/produkty génov z viac ako 3 200 rôznych druhov (http://amigo.geneontology.org/amigo/search/annotation). Hlavným cieľom projektu GO je: 1.) Vytvorenie súboru kontrolovaných a štruktúrovaných slovných hesiel známych pod všeobecným pojmom ontológy. Účelom ontológov je popísať kľúčové oblasti molekulárnej biológie vrátane atribútov génových produktov a biologických sekvencií. 2.) Aplikovať GO heslá pri anotácii sekvencií, génov alebo génových produktov do biologických databáz. 3.) Poskytnúť centralizovaný voľne dostupný zdroj umožňujúci univerzálny prístup k ontológiám, súborom anotovaných dát a bioinformatickým softvérom vyvinutých a určených na prácu/analýzu údajov GO. Štruktúra vedomostnej základne GO je založená na definovaní tried, tzv. termínov GO (GO terms), určujúcich rôzne funkcie génov. Termíny GO sú vyhotovené na základe logickej definície alebo axiómoch ekvivalencie, ktoré určujú jednotlivé vzťahy medzi GO termínmi navzájom. Vo väčšine prípadov sú termíny GO vyvodené na základe experimentálne zistenej anotácie, ktorá je následne aplikovaná aj u homológnych génových produktov11. Nakoľko je platforma GO pravidelne spravovaná a je schopná podávať anotované informácie o génoch, stala sa základným nástrojom využívaným v biomedicínskom výskume. Na vzájomné prepojenie viacerých anotácií génov (ako aj dodatočných kontextových informácií) do rozsiahleho modelu biologických procesov a dráh bol nedávno vyvinutý rámec Gene Ontology- 507
Causal Activity Modeling (GO-CAM)12. GO-CAM dokáže zobraziť, akým spôsobom dokážu produkty jednotlivých génov navzájom spolupracovať v rámci jednotlivej biologickej dráhy alebo celého biologického procesu. Navyše GO-CAM vie spájať rôzne útržky informácií o funkcii génového produktu (spájať rôzne anotácie toho istého génového produktu), poprípade dokáže prepájať funkcie rôznych génových produktov tým, že špecifikuje, ako môže aktivita jedného génového produktu ovplyvňovať aktivitu iného génového produktu. Všetky prepojenia v rámci modelu GO-CAM sú vytvorené pomocou jasne definovaných sémantických vzťahov z ontológie vzťahov (Relations Ontology)13. Najzrejmejším praktickým príkladom využitia platformy GO je v analýze obohatenej o GO (GO enrichment analysis), známej aj ako pathway analysis (analýza biologických dráh)14. 7.2.4 Analýza biologických dráh (Pathway analysis) Využitie pathway analysis našlo svoje uplatnenie pri vyhodnotení zmien expresie génov (zmeny transkriptómu) v bunkách ovplyvnených účinkom patogénu respektíve pri sledovaní vplyvov faktorov patogenity na signálne procesy v hostiteľských bunkách15-19. Konkrétnym príkladom je štúdia zaoberajúca sa sledovaním účinku baktérie N. meningitidis a jej adhezívneho ligandu MafA na ľudské endotelové bunky mozgu (BMEC = Brain Microvascular Endothelial Cells)15. V rámci tejto štúdie boli BMEC indukované mikroorganizmom a jeho ligandom (faktor patogenity), pričom bola pomocou NGS metódy RNA sekvenovania sledovaná signifikantná zmena v expresii génov v bunkách (identifikovaných 800 DEG (Differentially Expressed Genes – diferenciálne exprimovaných génov). Pre určenie a zobrazenie celkového obrazu zmien v indukovanej vzorke je nevyhnutné ku DEG produktom priradenie funkcie, definovanie signálnych a metabolických molekúl a ich grafické zobrazenie organizované do jednotlivých biologických dráh. Nakoľko je manuálna analýza takéhoto množstva dát veľmi obťažná, boli pre tento účel skonštruované rôzne bioinformatické nástroje využívajúce platformu GO, u ktorých je každý vložený gén anotovaný a na základe priradenej molekulovej funkcie a subcelulárnej lokalizácie je automaticky združený do skupín určujúcich biologické procesy. Známym bioinformatickým nástrojom takéhoto druhu je Reactome (https://reactome.org/). Reactome obsahuje voľne dostupnú, manuálne spravovanú a recenzovanú databázu biologických dráh. Tento nástroj poskytuje intuitívne bioinformatické nástroje určené na vizualizáciu, interpretáciu a analýzu poznatkov o biologických dráhach, pričom je určený na 508
analýzy genómu, určovanie systémovej biológie, modelovanie a podporu základného a klinického výskumu20. Reactome obsahuje analytické nástroje umožňujúce: a) analýzu zoznamu génov (Analyse gene list); b) analýzu génovej expresie (Analyse gene expression); c) porovnanie ľudských signálnych dráh so signálnymi dráhami akéhokoľvek iného druhu odvodeného z Reactome, a to na základe ortológie (Species comparison); d) zobraziť dráhy v rôznych ľudských tkanivách na základe expresie RNA alebo proteínu (Tissue distribution). V rámci základnej analýzy súboru DEG sú tieto gény po vložení do poľa automaticky rozdelené do skupín určujúcich alterované biologické procesy (Obr. 7.5 bod 1). Po rozkliknutí generovaných hlavných biologických procesov sa zobrazí ponuka ďalších descendentných procesov, pričom každý biologický proces obsahuje zoznam roztriedených génov. Takýmto spôsobom je možné určiť hlavné aktivované alebo utlmené signálne dráhy aj so skupinou participujúcich génov. Súčasťou analýzy je grafické zobrazenie pozície a spoločných vzťahov jednotlivých aktivovaných dráh v rámci celkového obrazu biologických procesov (Obr. 7.5 bod 2). Obr. 7.5 Zobrazovacia plocha Reactome servera (https://reactome.org/PathwayBrowser/#/) 509
Súčasná verzia platformy Reactome reaguje taktiež aj na objavenie sa nových infekcií v ľudskej populácii. Predovšetkým výskyt infekcie SARS-Cov-2 a jeho celosvetové rozšírenie viedol vedcov k vyhotoveniu anotácií molekulárnych procesov, ktoré umožňujú vírusu vstúpiť do buniek a replikovať sa. Ďalej boli začlenené do analýz procesy interakcií medzi hostiteľskými bunkami a vírusom vedúce k spusteniu patogénom podmienených imunitných reakcií u hostiteľa, ako aj možnosti, ako môžu byť tieto procesy modulované účinkom potencionálnych novo-objavených liečiv. Hlavnou doménou tejto práce bolo vyhotovenie protokolu určeného na zefektívnenie procesu anotácie nových vírusových infekcií. V tomto prípade vedci vychádzali zo šablón odvodených od kvalitne mapovaných vírusom podmienených infekčných procesov21, pričom využili 82 % podobnosť medzi SARS-CoV-2 a SARS-CoV-122. Výstupom platformy Reactome je bioinformatické spracovanie/roztriedenie génov so signifikantnou zmenou expresie do GO biologických procesov s poskytnutím informácií o funkčných vzťahoch medzi signálnymi dráhami. V súčasnosti celosvetovo prebieha intenzívny výskum zameraný na RNA sekvenovanie buniek, tkanív, organizmov indukovaných rôznymi mikroorganizmami alebo ich produktmi15-19,23,24, pričom výsledky takýchto výskumov sú pravidelne uverejňované vo vedeckých publikáciách. Nakoľko je manuálne prehľadávanie dát a výstupov z publikácií časovo náročné, Európsky bioinformatický inštitút (EMBL-EBI = EMBLś-European Bioinformatics Institute) vytvoril Expression Atlas25 (https://www.ebi.ac.uk/gxa/home) ako voľne dostupný vedecký zdroj poskytujúci užívateľom možnosť vyhľadávať voľne dostupné informácie o expresii génov/proteínov a lokalizácii RNA. Expression Atlas zhromažďuje výsledky génovej expresie z viac ako 3 000 experimentov odvodených z rôznorodých biologických podmienok u 40 rôznych druhov organizmov. Tisíce obsiahnutých dátových súborov z microarray a RNA sekvenovania uverejnených vo vedeckých publikáciách a nahratých v databázach (ArrayExpress26, NCBI´s GEO = NCBI’s Gene Expression Omnibus GEO26, ENA = European Nucleotide Archive27) sú pravidelne manuálne spracovávané a kontrolované špecialistami z odboru biológie za účelom združenia rozsiahleho repertoáru dát o expresii génov28. Úvodná stránka Expression Atlas ponúka možnosť prehľadávania génov, výber z preddefinovaných druhov organizmov a biologických podmienok. Príklad: V rámci transkriptómovej štúdie15 bol identifikovaný zoznam DEG, z ktorých sme vybrali 15 génov s najvyššou mierou expresie. Zoznam génov vložíme do poľa Gene, špecifikujeme organizmus (napr. Homo sapiens) a v poli biologické podmienky zadáme požadované heslo, podľa ktorého selektujeme typ experimentov (napr. Infect; Obr. 7.6 A). Výsledkom prehľadávania je generovaný zoznam vykonaných experimentov (Experiment 510
name), u ktorých bola zaznamenaná podobnosť diferenciálnej expresie identifikovaných génov s nami vloženým súborom génov (Log2-fold change; Gene name, Obr. 7.6 B). Pomocou Expression Atlas je možné rýchlo a efektívne prehľadávať stovky experimentov a selektovať tie, u ktorých je možná podobnosť s nami sledovaným druhom experimentu. Týmto je možné identifikovať/predikovať podobnosti v účinku mikroorganizmov resp. rôznych faktorov patogenity na hostiteľských organizmoch, bunkách atď. Nakoľko platforma obsahuje zozbierané abundantné dáta zo širokej škály rôznych druhov experimentov, vytvára možnosti pre štatistické, komparatívne a predikčné analýzy. Obr 7.6 Zobrazenie domovskej stránky Expression Atlas A) Domovská stránka Expression Atlas ponúka vyhľadávacie pole pre vloženie súboru sledovaných génov, výber z predvolených druhov organizmov a určenie biologických podmienok. B) Výsledkom prehľadávania je generovaný zoznam nahratých experimentov vykazujúcich podobnosť v expresii génov (https://www.ebi.ac.uk/gxa/home). 511
Iným typom databázy je databáza DualSeqDB (http://www.tartaglialab.com/dualseq) zhromažďujúca dáta po RNA sekvenovaní z experimentov, študujúcich duálne vzťahy hostiteľ-patogén. Databáza DualSeqDB aktuálne zhromažďuje približne 300 000 vstupov z viacerých štúdií prepojených s informáciami o zmenách génovej expresie potvrdených in vivo a in vitro experimentami. Databáza obsahuje informácie o duálnych vzťahoch siedmich rôznych kmeňov patogénnych druhov baktérií a rôznych typoch buniek a tkanív izolovaných z organizmov, akými sú Homo sapiens, Mus musculus a Macaca fascicularis. 7.2.5 Analýza mikrobiálneho genómu a odhalenie génov rezistencie 7.2.5.1 Databázy génov rezistencie voči antibiotikám Sekvenovanie novej generácie (NGS) ponúka možnosti rýchleho a efektívneho sekvenovania celých genómov mikroorganizmov a metagenómov. Server Rapid Annotations using Subsystems Technology (RAST; https://rast.nmpdr.org/) bol vyvinutý pre potreby anotovania bakteriálnych a archeálnych genómov. Server pracuje na princípe identifikácie génov kódujúcich proteíny, rRNA a tRNA, kde v iniciálnom štádiu predikuje otvorený čítací rámec (ORF = Open Reading Frame). Následne génu priradí funkčnú anotáciu, predikuje subsystémy, ktoré sú reprezentované v konkrétnom genóme a následne využíva tieto informácie pri spracovávaní metabolických interakcií. Výstupy servera môžu byť užívateľom jednoducho stiahnuté. Pridanou hodnotou RAST je možnosť jeho využitia v komparatívnych analýzach u stoviek anotovaných genómov29. Aj keď RAST je často využívaný bioinformatický nástoj a našiel svoje uplatnenie pri anotovaní mnohých novoobjavených bakteriálnych proteínov, ponúka taktiež aj informácie, aj keď v obmedzenej miere, o génoch kódujúcich rezistenciu voči antibiotikám (ARG = Antibiotic Resistance Genes). Server umožňuje vyhľadanie informácií o ARG pri anotovaných genómoch v sekcii virulence, poprípade je možné si stiahnuť tieto údaje manuálne z generovaného súboru Excel pri zadaní špecifických kľúčových slov30,31. Avšak nevýhodou je, že celý tento proces je časovo náročný a vyčerpávajúci. Špeciálne pre potreby určenia ARG bol vytvorený bioinformatický nástroj ARG-ANNOT (Antibiotic Resistance Gene-ANNOTation; https://ifr48.timone.univ-mrs.fr/blast/arg- annot_v6.html). Tento server dokáže detegovať existujúce alebo potencionálne možné ARG nachádzajúce sa v genómoch mikroorganizmov. Pri dizajne ARG-ANNOT databázy ARG bol získaný prístup k sekvenciám už identifikovaných ARG a proteínov z publikovaných experimentálnych prác a internetových zdrojov (NCBI GenBank, EMBL sequence retrieval 512
system a ARDB databázy). ARG-ANNOT databáza pracujúca s FASTA formátmi bola použitá pre vytvorenie lokálnej databázy pre BLAST s využitím BioEdit (Biological sequence alignment Editor). Nástoj dokáže v rámci BLAST analyzovať jednotlivo alebo aj skupinu sekvencií, pričom vyhodnocuje podobnosť sekvencií s databázou. Výstupom tohto nástroja je identifikácia potencionálnych ARG z genómov mikroorganizmov vykazujúcich vysokú mieru podobnosti s už identifikovanými ARG31. Ďalším zdrojom databázy ARG je Comprehensive Antibiotic Research Database (CARD; http://arpcard.mcmaster.ca), ktorá spracováva rôzne údaje o sekvenciách a molekulárnych funkciách, a to vo forme ontológie o antibiotickej rezistencii. Databáza dokáže rýchlo spracovať informácie o neznámych génoch odvodených z novozískaných, neanotovaných bakteriálnych genómových sekvencií. Príkladom môže byť izolácia neznámych genómov z klinických vzoriek pacienta (infikovaného bakteriálnou infekciou), u ktorých bolo vykonané celogenómové sekvenovanie. Takéto sekvencie sú po vložení do CARD platformy prehľadávané databázou, pričom výstupom je zoznam identifikovaných potenciálnych ARG. Poznanie ARG prítomných vo vyšetrovaných vzorkách je nesmierne dôležité z hľadiska následnej terapie ale aj prevencie horizontálneho transferu týchto génov medzi mikroorganizmami. 7.2.5.2 Databáza génov rezistencie voči biocídom a kovom V rámci svojej evolúcie sa makroorganizmy adaptovali na vytvorenie rezistencie nielen voči antibiotikám, ale taktiež aj voči iným druhom antibakteriálnych látok, akými sú biocídy a rôzne typy kovov (Ag, Cu, Hg, Au a iné )32,33. S narastajúcim trendom využívania kovov a biocídov ako konzervačných a dezinfekčných prostriedkov je nesmierne dôležité poznať mechanizmus vzniku bakteriálnej tolerancie pre tieto látky. Databáza BacMet (http://bacmet.biomedicine.gu.se) vznikla za účelom zhromaždenia sekvencií a informácií o známych antibakteriálno biocíd- a metal-rezistentných génoch. Databáza bola vyhotovená na základe rozsiahleho skúmania uverejnených vedeckých publikácií a následne bola manuálne spracovaná, pričom jej hlavnou doménou je poskytnúť nástroj na identifikáciu génov rezistencie na biocídy a na kovy v rámci úplných genómov respektíve sekvencií bakteriálnej DNA34,35. V súčasnosti databáza zhromažďuje informácie o 753 experimentálne verifikovaných génoch rezistencie rozdelených podľa lokalizácie na chromozómoch respektíve na plazmidoch. Taktiež presne definuje gény z hľadiska účinku ich produktov (gény rezistencie na biocídy, gény rezistencie na kovy a gény s účinkom oboch typov rezistencie). Nakoľko sa 513
gény rezistencie môžu navzájom líšiť u rôznych druhov baktérií, poprípade sa môžu vyskytovať v rôznych formách, ktoré doposiaľ neboli experimentálne preskúmané, BacMet ponúka taktiež databázu viac ako 155 000 predpokladaných génov rezistencie35. Databáza predikovaných génov je vytváraná prostredníctvom prehľadávania podobností v rámci sekvencií uverejnených vo verejných databázach. V prípade génov lokalizovaných na plazmidoch sa využíva jednotná hranica (cut-off), zatiaľ čo pre chromozomálne gény sú hranice nastavené individuálne. Gény v databázach sú pre užívateľa prístupné buď prostredníctvom možnosti prehľadávania na základe zlúčenín indukujúcich rezistenciu alebo podľa názvu génu. Inou alternatívou prehľadávania databázy je možnosť použiť funkciu vyhľadávania akéhokoľvek zadaného hesla (napr. názov génu, biocídu, triedy kovov, chemikálií). Pomocou možnosti rozšíreného vyhľadávania je možné špecificky identifikovať lokalizáciu sledovaných génov (plazmid/chromozóm). Výhodou tohto nástroja je možnosť vykonať BLAST, kde po vložení nami sledovanej sekvencie vo FASTA formáte, databáza vykoná prehľadávanie a určí podobné gény. Celá databáza je taktiež prístupná aj pre off-line analýzu dát väčšieho rozsahu (sekcia Download)35. 7.2.5.3 Mapovanie toxín-antitoxín systému Významným faktorom patogenity určitých prokaryotických organizmov je toxín-antitoxín systém (TAS = Toxin-Antitoxin System), ktorý predstavuje súbor úzko prepojených génov kódujúcich ako toxický proteín, tak aj jemu zodpovedajúci antitoxín. Na základe mechanizmu inaktivácie toxického proteínu je TAS klasifikovaný do šiestich rôznych typov36,37. Na identifikáciu toxín-antitoxín lokusov (TAL = Toxin-Antitoxin Locus) bol dizajnovaný in silico nástroj TASmania (https://shiny.bioinformatics.unibe.ch/apps/tasmania/), ktorý ponúka rozsiahle anotovanie TAL nachádzajúcich sa v genómoch baktérií. TASmania umožňuje: a) objavenie nových skupín TAL; b) návrh robustnej experimentálnej stratégie s prihliadnutím na možné interferencie v trans formách; c) komparatívnu analýzu medzi obsahom TAL, fylogenézou a fenotypmi (patogenita, perzistencia, odolnosť voči stresu a pod.), a to poskytnutím rozsiahleho repertoáru anotovaných zostáv38. Veľkým benefitom databázy TASmania je poskytnutie anotácií TAL nachádzajúcich sa nielen v genóme patogénu, ale taktiež aj na jeho plazmidoch. Napriek tomu, že je tento bioinformatický nástoj založený na existujúcich popisoch proteínových domén, umožňuje taktiež odhalenie úplne nových skupín toxínov resp. antitoxínov, ako aj potenciálnych 514
kombinácií toxín-antitoxín párov. Funkčnosť nástroja TASmania, najmä z hľadiska predikcie TAS, bola úspešne potvrdená pomocou experimentálnych in vivo testov38. TASmania v rámci svojej domovskej stránky ponúka možnosť výberu organizmu. Napríklad pri selekcii druhu Neisseria meningitidis a určení požadovaných parametrov vyhľadávania (HMM E hodnota, TAS info, atď.) získame zoznam filtrovaných génov s príslušnou anotáciou (Obr. 7.7). Obr. 7.7 Postup prehľadávania bakteriálneho genómu pre identifikáciu TAS prostredníctvom TASmania Demonštrácia vyhľadávania TAL u druhu N. meningitidis. Panel A: Zvolíme začiatočné písmeno názvu baktérie – n (1) a konkretizujeme druh z ponuky databázy genómov (2). Zvolíme zoznam vyhľadávaných údajov (3). Databáza ponúka taktiež funkciu nastavenia E-hodnoty pre vyhľadávanie potenciálnych zásahov. Výstupom vyhľadávania je zoznam generovaných génov s príslušnými anotáciami určujúcimi príslušnosť v rámci TAS (4). Pre potreby špecifického prehľadávania konkrétneho génu zadáme názov do vyhľadávacieho poľa (5). Panel B: Mapovanie TAS v genóme baktérie N. meningitidis. Genóm vložíme do poľa vo FASTA formáte. Zvolíme predikčnú metódu a typ genetického kódu (1). Po potvrdení mapovania nástroj generuje zoznam výstupov TAS (2). Dáta sú dostupné pre stiahnutie užívateľom (https://shiny.bioinformatics.unibe.ch/apps/tasmania/). 515
Benefitom je možnosť zvoliť si ukážku sekvencie proteínov u generovaných výstupov. V prípade, že užívateľ má záujem vyhľadať údaje o konkrétnom géne/produkte, môže do poľa Search zadať názov génu. Pri takto špecifickom vyhľadávaní TASmania generuje údaje iba o vybranom géne (Obr. 7.7 A). Platforma TASmania ponúka taktiež aj nástoj TASer, ktorý slúži pre identifikáciu toxínov a antitoxínov z nahrávaných genómov ľubovoľných prokaryotov. Pre spustenie prehľadávania je nevyhnutné nahratie konkrétneho genómu vo FASTA formáte, ktorý je možné získať z databázy NCBI (viď kapitola 7.2.1). Po zvolení predikčnej metódy prebieha mapovanie s využitím vysokovýkonnej počítačovej databázy TASmania. Konečným výstupom je zoznam generovaných génov TAS (Obr. 7.7 B). 7.2.5.4 Mapovanie bakteriálnych toxínov Progres pri sekvenovaní bakteriálnych genómov a techník určujúcich štruktúry biomolekúl viedol k identifikácii a objasneniu funkcií mnohých proteínových produktov. Pravidelný príliv informácií o identifikovaných bakteriálnych toxínoch bol podnetom pre vyhotovenie databázy DBETH (DBETH = Database of Bacterial ExoToxins for Human; http://www.hpppi.iicb.res.in/btox/index.html). DBETH je databázou sekvencií, štruktúr, interakčných sietí a analytických výsupov 229 exotoxínov získaných z 26 rôznych druhov baktérií patogénnych pre ľudí. Všetky toxíny združené v DBETH sú rozdelené podľa mechanizmu účinku a typu aktivity toxínu do 24 rôznych tried. Táto databáza ponúka taktiež predikčný server, ktorý na základe homológie medzi sledovanou sekvenciou/doménou a známymi sekvenciami toxínov dokáže predikovať potenciálny bakteriálny toxín39. Konštrukcia databázy je založená na zbere informácií z vedeckej literatúry a prehľadov sekvencií toxínov uverejnených v databáze GenBank39,40, pričom všetky mapované sekvencie toxínov sú anotované podľa GO terms. DBETH pri výbere súboru 229 toxínov kládol dôraz na výber sekvencií asociovaných s GO: pathogenesis, GO: toxicity a ďalších GO spojených s termínmi virulencie/patogenézy. Dizajn DBETH je okrem iného aj praktickou ukážkou implementácie anotácií GO (viď kapitola 7.2.3). Postup používania databázy je popísaný na Obr. 7.8. 516
Obr. 7.8 Postup pri vyhľadávaní toxínov pomocou DBETH Panel A: Na hlavnej stránke je zobrazená ponuka databázy umožňujúca vyhľadávanie súborov toxínov (1). DBETH ponúka vyhľadávanie na základe zvoleného patogéna – Pathogens (2). Po selekcii druhu baktérie, napr. Esherichia coli (3), server generuje zoznam produkovaných toxínov (4) aj s príslušnými anotáciami o mechanizme účinku a aktivite (5). Ďalšími funkciami sú vyhľadávanie toxínov – Browse Toxin – podľa 517
mechanizmu ich účinku a toxickej aktivity. V tomto prípade databáza ponúka zoznam GO biologických procesov obsahujúci kategórie anotovaných toxínov (6). DBETH server umožňuje prehľadávanie domén, sekvencií a štruktúr jednotlivých toxínov. Jednou z jeho funkcií je aj predikcia toxínu (7). Funkcia Download umožňuje stiahnutie sekvencií z databáz vo FASTA formátoch (8). Panel B: Predikcia domény toxínu. Pri využití funkcie DBETH Server → Search Toxin Domain (1) a zadaní potrebnej sekvencie vo FASTA formáte, v tomto prípade sme zadali botulinum neurotoxin type A (2) server generuje z vybraných databáz možné typy toxínov na základe profilu domén toxínu (3). (http://www.hpppi.iicb.res.in/btox/index.html). Pre ďalšiu predikciu bakteriálnych toxínov boli vyhotovené aj iné predikčné nástroje využívajúce údaje o sekvenciách a anotácie z voľne dostupných databáz (Tab.7.4). Tab. 7.4 Zoznam databáz a prediktorov bakteriálnych toxínov Databáza Popis Zdroj https://www.uniprot.org/ UniProtKB/Swiss- Databáza obsahuje tisíce popisov proteínov, https://webs.iiitd.edu.in/raghava/btxpred/ Prot41 vrátane funkcie, štruktúry domény, https://webs.iiitd.edu.in/raghava/ntxpred/ subcelulárneho umiestnenia, posttranslačných https://webs.iiitd.edu.in/raghava/toxinpred/ modifikácií a funkčne charakterizovaných variantov. Zahŕňa skupinu proteínov anotovaných ako toxín. BTXpred42 Server dokáže predikovať s 96% presnsťou bakteriálne toxíny z primárnej sekvencie aminokyselín. Klasifikuje toxíny do skupín endo- a exotoxínov. Rozdeľuje toxíny na základe ich toxickej aktivity. NTXpred43 Server predikuje neurotoxíny z primárnej sekvencie aminokyselín (97% presnosť). Klasifikuje neurotoxíny na základe zdroja – hlavne eubaktérie a toxickej aktivity. ToxinPred Nástroj na predikciu toxicity peptidov a domén proteínov. Dokáže identifikovať toxické oblasti proteínov. 7.2.6 Predikcia subcelulárnej lokalizácie proteínov Proteíny prezentované na povrchu baktérií sú predmetom intenzívneho záujmu, nakoľko sú kľúčovými molekulami zabezpečujúcimi adaptáciu patogénov na hostiteľské prostredie. Vonkajšie membránové proteíny (VMP) sú významnými aktérmi pri invazívnych procesoch. Pomocou ligand receptorových interakcií sprostredkovávajú bakteriálnu adhéziu na povrch buniek, indukujú signálne zmeny v hostiteľských bunkách, čo vedie k následnej penetrácii patogénov cez prirodzené bariéry do cieľových orgánov. Okrem adhezívnej schopnosti dokážu VMP indukovať imunitný systém, vychytávať ióny železa a iných dôležitých nutrientov, mimikovať hostiteľské proteíny a mnoho iných javov. Značná časť vedeckých výskumov sa zaoberá štúdiom interaktómu baktérií na hostiteľských bunkách, a to za účelom identifikovať nové/neobjasnené adhezívne molekul44-47 a ich vplyv na invazivitu a patogenézu15,19,48. Súčasné techniky celogenómového sekvenovana a hmotnostnej spektrometrie dokážu identifikovať celý 518
repertoár proteín kódujúcich nukleotidových sekvencií respektíve aminokyselinových sekvencií. Na širokospektrálnu analýzu bakteriálneho proteómu/interaktómu je esenciálne využitie automatizovaných predikčných nástrojov schopných predpovedať subcelulárne umiestnenie jednotlivých proteínov, prítomnosť signálnych peptidov alebo transmembránových domén. Taktiež určenie funkčnej anotácie proteínov pomocou génovej ontológie prispieva k zvýšeniu špecifickosti predikcie. V procese bioinformatickej analýzy bakteriáleho genómu/proteómu a identifikácie adhezínov, ako významných faktorov patogenity, je dôležité selektovať povrchovo exponované proteíny. Prostredníctvom analýzy sekvencií DNA/proteínov je možné identifikovať respektíve predikovať povrchovo exponované proteíny s využitím počítačových algoritmov vyvinutých pre tento typ analýz. Dizajn bioinformatických nástrojov je založený na aplikácii overených poznatkov a experimentálnych údajov o sekvenciách, doménach, štruktúrach a lokalizácii proteínov združených vo voľne dostupných databázach bakteriálnych proteínov (Tab. 7.5). Jednou zo široko používaných aplikácií bioinformatiky je identifikácia trojrozmerných proteínových štruktúr, molekulárne modelovanie a skladanie s cieľom predikovať možnú funkciu proteínov a modelovať „správanie sa“ proteínov a ich molekulárnu skladbu v biologicky funkčnom trojrozmernom dizajne. Tab. 7.5 Zoznam vybraných databáz povrchových proteínov baktérií a iných faktorov patogenity Databáza Popis Zdroj UniProt Obšírna databáza sekvencií proteínov a informácií o ich https://www.uniprot.org/ biologickej funkcii. Obsahuje podskupiny databáz manuálne alebo počítačovo anotovaných sekvencií proteínov. DOLOP Kompletná databáza bakteriálnych lipoproteínov združujúca https://www.mrc- adhezíny, väzbové proteíny, antigény, toxíny a iné. lmb.cam.ac.uk/genomes/dolop / PDB Databáza troj-rozmerných štruktúr širokého množstva https://www.rcsb.org/ biologicky aktívnych molekúl. Databáza je využívaná pri štúdiu štruktúrnej biológie a pri dizajne predikčných nástrojov. PiSITE Databáza proteínových interakčných miest. Umožňuje predikciu https://pisite.sb.ecei.tohoku.ac. väzby bakteriálneho ligandu na receptory buniek. Využíva dáta jp/cgi-bin/about.cgi z PDB. HPIDB Databáza interakcií medzi hostiteľom a patogénom. https://hpidb.igbb.msstate.edu/ Väčšina bioinformatických prediktorov využíva algoritmy prehľadávajúce datatabázy a vyhľadávajúce zhody so sledovanou sekvenciou, pričom pracuje na základe naprogramovaných štatistických údajov. Následne prediktor vyhodnocuje mieru pravdepodobnosti subcelulárnej lokalizácie (SCL) u sledovaného proteínu. V rámci bioinformatického mapovania SCL je kladený dôraz na: 519
1.) Sledovanie podobnosti DNA/proteín sekvencií – similarity search (viď kapitola 7.2.2). Cieľom sledovania podobnosti je určenie ortológov pre sledovanú sekvenciu. Prediktory porovnávajú sledované sekvencie v rámci databáz známych adhezívnych proteínov na náklade algoritmu BLAST6. 2.) Prehľadávanie motívov – Motívom sa rozumie určité usporiadanie vzoru aminokyselín/nukleotidov v rámci proteínovej/DNA sekvencie, ktoré je charakteristické špecifickou biochemickou funkciou49. Väčšina motívov proteínových sekvencií poskytuje jedinečne detegovateľné znaky sekvencie v rámci súboru určitých skupín proteínov, čím sa stávajú jedinečným určovateľom príslušnosti proteínu k danej skupine. Na základe detegovaných motívov je možné predikovať funkciu neznámeho proteínu. Tab. 7.6 predstavuje motívy vyskytujúce sa u adhezívnych proteínov baktérií, ktoré môžu byť využívané algoritmami bioinformatických predikčných nástrojov. Tab. 7.6 Príklady základných motívov bakteriálnych adhezínov Motív Popis β-barel Výskyt na vonkajšej membráne G- baktérií. Proteíny s motívom β-barelu majú funkcie v životne dôležité procesoch membránovej biogenézy a pôsobia ako faktoryy virulencie a poríny50. β-helix Pravotočivé paralelné β-helixy sa nachádzajú v sekvenciách adhezínov, toxínov, povrchovo exponovaných proteínov iných faktorov virulencie u rôznych druhov baktérií51. RGD a SGxG Motív arginín-glycín-kyselina asparágová (RGD) a motív miesta viažuceho glykozaminoglykán (SGxG) sú prezentované v súbore bakteriálnych proteínov – autotransportérov. V prípade Bordetella pertussis sa motív nacháda u proteínu Bordetella resistance to killing (BrkA) a Bordetella autotransporter protein-C (BapC). Zoskupenie motívu koreluje s adhezívnymi vlastnosťami väzbových miest na makrofágoch a epitelových bunkách52. FxxN, GGA(I,L,V) Motív tetrapeptidov prezentovaný na skupine peptidov polymorfickej membrány (Pmp) u Chlamydia pneumoniae. Motívy sú potrebné pre adhéziu k hostiteľským bunkám53. PARF motív Aminokyselinová sekvencia motívu (A/T/E)xYLxx(LYF)N patriaca k PARF (A/T/E)xYLxx(LYF)N (Peptide Associated with Rheumatic Fever) je umiestnená na kolagén viažucom proteíne M určitých streptokokov54. HExxH Sekvencia tohto motívu viaže zinok a je prezentovaná na určitých bakteriálnych adhezínoch viažucich sa na extracelulárnu matrix55. 3.) Vyhľadávanie signálnych peptidov – SP je krátky úsek aminokyselinovej sekvencie nachádzajúci sa na N-konci proteínu. Vo všeobecnosti je SP tvotený konzervatívnym motívom o dĺžke 16 – 30 aminokyselín. Úlohou SP je zabezpečenie transportu proteínu prostredníctvom sekrečného mechanizmu do miesta určenia. Adhezívne molekuly sú typické prítomnosťou SP, ktorý zabezpečuje ich transport z cytoplazmy a ukotvenie v membráne bakteriálnej bunky. Každý signálny peptid je na základe svojej povahy štiepený buď pomocou signálpeptidázy I (SPI – štiepi sekretované proteíny), alebo signalpeptidázy II (SPII – štiepi lipoproteíny). Tzv. 520
skrytý Markov model (HMM = Hidden Markov model) je schopný rozlíšiť lipoproteíny (štiepené SPII) od proteínov štiepených SPI, cytoplazmatických a transmembránových proteínov. Detekcia motívov SP v štruktúrach proteínov pomocou výpočtových algoritmov je jednou zo základných operácií predikčných nástrojov pri odhalení SCL proteínov56,57. Tab. 7.7 Zoznam nástrojov predikujúcich subcelulárnu lokalizáciu bakteriálnych proteínov Názov Popis Zdroj Prediktory subcelulárnej lokalizácie (SCL) proteínov a transmembránových domém (TMD) CELLO v.2.5. Predikcia SCL proteínov G- a G+ baktérií. http://cello.life.nctu.edu.tw/ PSORTb v3.0.3 Predikcia SCL proteínov G- a G+ baktérií. https://www.psort.org/psortb/ Gram-LocEN Predikcia SCL proteínov G- a G+ baktérií. http://bioinfo.eie.polyu.edu.hk/Gr Target – 2.0 Predikcia SCL proteínov a prítomnosť SP. am-LocEN/ https://services.healthtech.dtu.dk/ EffectiveDB Predikcia sekretovaných proteínov baktérií. service.php?TargetP-2.0 HMMTOP v.2.0 http://effectivedb.org Predikcia SCL proteínov a transmembránových http://www.enzim.hu/hmmtop/ind TMHMM - 2.0 hélixov. ex.php https://services.healthtech.dtu.dk/ BetAware Predikcia SCL proteínov a transmembránových service.php?TMHMM-2.0 hélixov. https://betaware.biocomp.unibo.it/ BOCTOPUS welcome/default/index Detekcia a predikcia topológie β-barelov vonkajšej http://boctopus.cbr.su.se/ membrány u G- prokaryotov. Predikcia topológie transmembránových β-barelov membrány G- baktérií. CD-search Nástroj na identifikáciu konzervatívnych domén https://www.ncbi.nlm.nih.gov/Str alebo funkčných jednotiek v sledovanej sekvencii ucture/cdd/wrpsb.cgi proteínu. Prediktory výskytu signálnych peptidov (SP) Phobius Prediktor kombinovanej transmembránovej topológie https://phobius.sbc.su.se/ DeepSig a signálnych peptidov. SignalP – 6.0 https://deepsig.biocomp.unibo.it/ Predikcia SP a jeho štiepiaceho miesta. Spracovanie welcome/default/index proteínov G-, G+ baktérií a eukaryotov. https://services.healthtech.dtu.dk/ service.php?SignalP Predikcia SP a lokalizácia ich štiepiaceho miesta u prokaryotov a eukaryotov. Prediktor dokáže rozlišovať medzi piatimi typmi signálnych peptidov. LipoP – 1.0 Predikuje prítomnosť SP I a II typu u G- baktérií. https://services.healthtech.dtu.dk/ service.php?LipoP-1.0 Rozlišuje medzi SP lipoproteínov, inými SP a N- terminálnymi membránovými hélixmi u G- baktérií. Nástroje generujúce GO anotácie pre SCL bakteriálnych proteínov CELLO2GO Predikcia SCL a funkčnej anotácie GO bakteriálnych http://cello.life.nctu.edu.tw/cello2 BUSCA proteínov. go/ http://busca.biocomp.unibo.it/ Určenie SCL proteínov na základe anotácií GO (Anotátor GO). Určenie signálneho peptidu HybridGO-Loc v sekvencii. http://bioinfo.eie.polyu.edu.hk/Hy bridGoServer/ Priradenie funkčnej anotácie GO pre proteíny vírusov. 4.) Identifikáciu transmembránových domén – TMD sú oblasti proteínov prechádzajúce v niekoľkých slučkách skrz membrány bakteriálnych bunkových stien. TMD sú charakteristickou zložkou integrálnych membránových proteínov. Nakoľko adhezíny patria do skupiny membránových proteínov, identifikácia TMB v sledovanom proteíne môže indikovať 521
jeho príslušnosť k adhezínom. V predikciách založených na algoritmoch detegujúcich TMD je potrebné vziať do úvahy, že nie všetky adhezíny obsahujú TMD. 5.) Identifikáciu domén proteínov – Pre definovanie vlastností proteínov je možné vykonať in silico mapovanie domén. Domény sú konzervatívne a autonómne skladané funkčné jednotky proteínov. Mapovaním domén proteínov, postrádajúcich anotácie, je možné predikovať ich funkciu. V súčasnosti je pre vedecké využitie voľne dostupných viacero nástrojov predikujúcich subcelulárnu lokalizáciu (SCL) proteínov (Tab.7.7). Príklad predikcie SCL proteínu je uvedený na Obr. 7.9 a 7.10. Obr. 7.9 Postup predikcie SCL bakteriálneho proteínu pomocou CELLO Obrázok zobrazuje hlavnú stránku bioinformatického prediktora CELLO, ktorý bol použitý pri predikcii SCL proteínu MafA exprimovaného u G- baktérie N. meningitidis. V procese predikcie je potrebné zvoliť typ organizmu, z ktorého pochádza sledovaný proteín (1) a formát vkladanej sekvencie (2). Do vyhľadávacieho poľa vkladáme FASTA formát proteínovej sekvencie MafA (3) a potvrdíme operáciu (4). Následne prediktor generuje výsledky (5). Nástroj zobrazí analýzu správy (6) a konečný výsledok predikcie (7). V tomto prípade je výsledkom umiestnenie proteínu MafA na vonkajšej membráne (http://cello.life.nctu.edu.tw/). 522
Obr. 7.10 Postup predikcie SCL bakteriálneho proteínu pomocou TMHMM Nástroj TMHMM slúži na predikciu transmembránových domén u sledovaného proteínu. Do vyhľadávacieho poľa zadáme aminokyselinovú sekvenciu vo FASTA formáte (1) a zvolíme formát výstupu (2). Potvrdíme Analýzu (3). Nástroj generuje výsledky predikcie (4). U sledovaného proteínu predikoval TMHMM SCL MafA ako proteín exprimovaný na povrchu (5), pričom vytvoril grafické zobrazenie, kde je predikovaná 1 TMD (6). (https://services.healthtech.dtu.dk/service.php?TMHMM-2.0) 523
ZOZNAM SKRATIEK AMR Antimicrobial Resistance ARDB Antibiotic Resistance Genes Database ARG Antibiotic resistance genes ARG-ANNOT Antibiotic Resistance Gene-ANNOTation BacMet Antibacterial Biocide and Metal Resistance Genes Database BioEdit Biological sequence alignment Editor BLAST Basic Local Alignment Search Tool BMEC Brain Microvascular Endothelial Cells BTXpred Bacterial Toxins prediction database CARD Comprehensive Antibiotic Research Database CDS CoDing Sequence DBETH Database of Bacterial ExoToxins for Human DDBJ DNA Data Bank of Japan DEGs Differentially Expressed Genes DNA Deoxyribonukleová kyselina DOLOP Database Of bacterial LipOProteins DualSeqDB Dual Sequencing Database EMBL European Molecular Biology Laboratory EMBL-EBI EMBLś-European Bioinformatics Institute ENA European Nucleotide Archive EST Expressed Sequence Tag databases GEO Gene Expression Omnibus GO Gene Ontology GO-CAM Gene Ontology-Causal Activity Modeling GSS Genome Survey Sequences HMM Hidden Markov Model (Štatistický model) mRNA Poslíčková (messenger) RNA HPIDB Host-Pathogen Interaction Database INSDC International Nucleotide Sequence Database Collaboration NGS Next Generation Sequencing (Sekvenovania novej generácie) NCBI National Center for Biotechnology Information NTXpred Neurotoxins prediction (Metóda na predikciu neurotoxínov) PDB Protein Data Bank Pfam Protein families database PIR Protein Information Resource PiSITE Protein-protein interaction SITE PRF Protein Research Foundation RAST Rapid Annotations using Subsystems Technology server RBS Ribosom Binding Side RefSeq Reference Sequence database RNA Ribonukleová kyselina rRNA Ribozómová RNA rep_origin Replication origin alebo Origin of replication (Začiatok replikácie) SCL Subcelulárna lokalizácia SP Signálny peptid STS Sequence-Tagged Site SwissProt Swiss Protein sequence database TAL Toxin-Antitoxin Locus 524
TAS Toxin-Antitoxin System TASmania TMD A bacterial Toxin-Antitoxin Systems database ToxinPred Transmembrane Domain tRNA Toxin Prediction method (in silico metóda na predikciu toxicity TSA peptidov/proteínov) UniProt Transferová RNA UniProtKB VMP Transcriptome Shotgun Assembly WGS Universal Protein database(s) Universal Protein Knowledgebase Vonkajšie membránové proteíny Whole Genome Shotgun 525
LITERATÚRA 1. NCBI. https://www.ncbi.nlm.nih.gov/genbank/statistics/, (2022) 2. Fleischmann, R. D. et al. Science 269, 496-512, (1995) 3. Shendure, J. & Ji, H. Nat Biotechnol 26, 1135-45, (2008) 4. NCBI. https://www.ncbi.nlm.nih.gov/genome, (2022) 5. Menlove, K. J. et al. Methods Mol Biol 537, 1-22, (2009) 6. Altschul, S. F. et al. J Mol Biol 215, 403-10, (1990) 7. Pertsemlidis, A. & Fondon, J. W. Genome Biol 2, (2001) 8. Wu, H. J. et al. Curr Opin Chem Biol 12, 93-101, (2008) 9. Juhas, M. et al. FEMS Microbiol Rev 33, 376-93, (2009) 10. Dobrindt, U. et al. Nat Rev Microbiol 2, 414-24, (2004) 11. The Gene Ontology, C. Nucleic Acids Res 47, D330-D38, (2019) 12. Thomas, P. D. et al. Nat Genet 51, 1429-33, (2019) 13. GeneOntology. http://geneontology.org/docs/gocam-overview/ 14. Khatri, P. et al. PLoS Comput Biol 8, e1002375, (2012) 15. Kanova, E. et al. Sci Rep 9, 18763, (2019) 16. Bhide, K. et al. Sci Rep 12, 8863, (2022) 17. Jimenez-Munguia, I. et al. Sci Rep-Uk 11, (2021) 18. Tkacikova, L. et al. Vet Res 51, 49, (2020) 19. Tkacova, Z. et al. Front Microbiol 12, 760627, (2021) 20. Reactome. https://reactome.org/, (2022) 21. Gillespie, M. et al. Nucleic Acids Res 50, D687-D92, (2022) 22. Kaur, N. et al. Infect Genet Evol 89, (2021) 23. Ding, Z. et al. Front Neurosci 13, 651, (2019) 24. Mandlik, A. et al. Cell Host Microbe 10, 165-74, (2011) 25. Petryszak, R. et al. Nucleic Acids Research 44, D746-D52, (2016) 26. Kolesnikov, N. et al. Nucleic Acids Research 43, D1113-D16, (2015) 27. Toribio, A. L. et al. Nucleic Acids Research 45, D32-D36, (2017) 28. Expression Atlas. https://www.ebi.ac.uk/gxa/about.html, (2022) 29. Aziz, R. K. et al. Bmc Genomics 9, (2008) 30. RAST. https://rast.nmpdr.org/ 31. Gupta, S. K. et al. Antimicrob Agents Ch 58, 212-20, (2014) 32. Turner, R. J. et al. Genes (Basel) 11, (2020) 33. Brown, N. L. et al. Biochem Soc Trans 26, 662-5, (1998) 34. Pal, C. et al. Nucleic Acids Research 42, D737-D43, (2014) 35. BacMet. http://bacmet.biomedicine.gu.se/ 36. Fozo, E. M. et al. Nucleic Acids Res 38, 3743-59, (2010) 37. Ghafourian, S. et al. Curr Issues Mol Biol 16, 9-14, (2014) 38. Akarsu, H. et al. Plos Computational Biology 15, (2019) 39. Chakraborty, A. et al. Nucleic Acids Research 40, D615-D20, (2012) 40. Benson, D. A. et al. Nucleic Acids Research 36, D25-D30, (2008) 41. Boutet, E. et al. Plant Bioinformatics: Methods and Protocols, 2nd Edition 1374, 23-54, (2016) 42. Saha, S. & Raghava, G. P. In Silico Biol 7, 405-12, (2007) 43. Saha, S. & Raghava, G. P. In Silico Biol 7, 369-87, (2007) 44. Kanova, E. et al. Front Microbiol 9, 2294, (2018) 45. Tkacova, Z. et al. Ticks Tick-Borne Dis 11, (2020) 46. Jimenez-Munguia, I. et al. Sci Rep 8, 5231, (2018) 47. Li, H. et al. Int J Biochem Cell Biol 78, 260-67, (2016) 48. Jimenez-Munguia, I. et al. Sci Rep 11, 7970, (2021) 49. D'haeseleer, P. Nature Biotechnology 24, 423-25, (2006) 50. Fairman, J. W. et al. Curr Opin Struct Biol 21, 523-31, (2011) 51. Bradley, P. et al. P Natl Acad Sci USA 98, 14819-24, (2001) 52. Bokhari, H. et al. J Basic Microb 52, 390-96, (2012) 53. Molleken, K. et al. Mol Microbiol 78, 1004-17, (2010) 54. Reissmann, S. et al. PLoS One 7, e30122, (2012) 55. Houston, S. et al. Infect Immun 79, 1386-98, (2011) 56. Juncker, A. S. et al. Protein Sci 12, 1652-62, (2003) 57. Nielsen, H. & Krogh, A. Proc Int Conf Intell Syst Mol Biol 6, 122-30, (1998) 526
VIII. SÚČASNÉ POKROKY PRI DIAGNOSTIKE FAKTOROV PATOGENITY A VIRULENCIE Ľudmila Tkáčiková, Tomáš Csank, Ján Király 8.1 IN VITRO DIAGNOSTIKA FAKTOROV PATOGENITY 528 A VIRULENCIE BAKTÉRIÍ ............................................................ 530 8.1.1 Identifikácia patogénnych baktérií na základe fenotypových 530 vlastností ............................................................................................ 531 533 8.1.1.1 Kultivačné vyšetrenie ........................................................................ 534 8.1.1.1.1 Chromogénne médiá ....................................................................... 538 8.1.1.2 Biochemické vyšetrenie ..................................................................... 539 8.1.1.3 Biotypizácia ....................................................................................... 539 8.1.1.4 Sérologické vyšetrenie ....................................................................... 540 8.1.1.4.1 Latexová aglutinácia ....................................................................... 541 8.1.1.4.2 Imunoenzymatická detekcia baktérií (ELISA) ............................... 543 8.1.2. Genetická identifikácia patogénnych baktérií .................................... 543 8.1.2.1 Hybridizačné metódy ......................................................................... 548 8.1.2.2 Amplifikačné metódy ......................................................................... 550 8.1.2.2.1 Kvantitatívna polymerázová reťazová reakcia ............................... 552 8.1.2.2.2 Slučkami sprostredkovaná izotermálna amplifikácia (LAMP) ...... 552 8.1.2.3 DNA mikročipy (DNA microarray) .................................................. 554 8.1.2.4 Využitie sekvenovacích technológií v klinickej mikrobiológii ......... 558 8.1.2.4.1 Sekvenovanie podľa Sangera .......................................................... 8.1.2.4.2 Sekvenovanie novej generácie ........................................................ 8.1.2.4.3 Sekvenovanie tretej generácie ......................................................... 8.2 IN VIVO DIAGNOSTIKA FAKTOROV PATOGENITY 562 A VIRULENCIE BAKTÉRIÍ ............................................................ 563 564 8.2.1 Identifikácia hostiteľských faktorov potrebných na infekciu ............ 564 8.2.1.1 Transgénne zvieracie modely ............................................................ 565 8.2.1.1.1 Imunodeficientné transgénne zvieratá ............................................ 565 8.2.1.1.2 Humanizované transgénne zvieratá ................................................ 566 8.2.2 In vivo zobrazovacie techniky zvierat počas infekcie ........................ 8.2.3 Komparatívna genomika hostiteľskej odpovede ................................ 566 8.2.3.1 Jednonukleotidový polymorfizmus 567 (SNP – Single Nucleotide Polymorphism) ......................................... 567 8.2.3.2 Celogenómové asociačné štúdie 568 569 (GWAS – Genome-Wide Association Studies) ................................. 8.2.4 Celogenómová analýza bakteriálnych genómov ................................ 8.2.4.1 Stíšenie génov prostredníctvom interferencie RNA (RNAi) ............. 8.2.4.2 Úprava génov ..................................................................................... 527
8.1 IN VITRO DIAGNOSTIKA FAKTOROV PATOGENITY A VIRULENCIE BAKTÉRIÍ Klasické metódy detekcie patogénnych baktérií vo vyšetrovaných vzorkách sú založené na ich kultivácii a následnej identifikácii na základe ich fenotypu, napr. na základe unikátnych biochemických alebo sérologických charakteristík. Patria sem kultivačné, farbiace a biochemické metódy a metódy určenia antigénnych charakteristík, resp. proteínových profilov izolovaných baktérií (biotypizácia) (Obr. 8.1). Obr. 8.1 Schéma znázorňujúca postup pri identifikácii patogénnych baktérií vo vyšetrovaných vzorkách (Tkáčiková a Mydlárová Blaščáková 2015)8 Tieto postupy sú časovo náročné a k výsledku sa dostávame najskôr po 48 hodinách. Priama detekcia a identifikácia patogénnych baktérií vo vyšetrovaných vzorkách je možná aj na základe ich antigénneho vybavenia pomocou sérologických metód (napr. ELISA). Metódy molekulovej biológie predstavujú oveľa rýchlejšiu alternatívu priamej identifikácie a detekcie patogénnych baktérií v komplexných vzorkách, ktoré často obsahujú milióny 528
hostiteľských buniek, alebo veľké množstvo komenzálnych baktérií (napr. tkanivo, alebo féces). Je to obzvlášť dôležité pri detekcii ťažko kultivovateľných, resp. nekultivovateľných baktérií. Princíp týchto metód je založený na amplifikácii špecifických úsekov nukleových kyselín pomocou polymerázovej reťazovej reakcie (PCR = Polymerase Chain Reaction). PCR metódy umožňujú okrem identifikácie mikroorganizmov na základe konzervatívnych častí genómu aj kvantifikáciu expresie génov kódujúcich faktory virulencie. PCR amplikóny sa môžu analyzovať sekvenčnou analýzou, alebo hybridizačnými metódami, napríklad fluorescenčnou in situ hybridizáciou (FISH = Fluorescence In Situ Hybridization). V priamej detekcii patogénnych mikroorganizmov predstavuje slučkami sprostredkovaná izotermálna amplifikačná metóda – LAMP (LAMP = Loop-Mediated Isothermal Amplificatoin) veľmi účinný, ekonomicky a časovo výhodný spôsob. Mikročipy sú definované ako súbory mikroskopických bodov obsahujúcich na pevný povrch prichytené sondy, ktoré umožňujú vyhľadávanie chemicky označených cieľových molekúl za účelom získania kvalitatívnych ako aj kvantitatívnych údajov1. DNA mikročipová technológia umožňuje simultánnu identifikáciu a charakterizáciu veľkého počtu DNA molekúl, a preto sú mikročipy úspešne využívané aj na identifikáciu mikroorganizmov. Sekvenčná analýza špecifických úsekov alebo celého bakteriálneho genómu sa okrem diagnostiky využíva aj pri epidemiologicko/epizootologickej kontrole infekčných chorôb ľudí a zvierat. Z pohľadu množstva získaných informácií o izolovaných baktériách celogenómové sekvenovanie výrazne prispieva k poznaniu patogénnych baktérií. V tejto oblasti došlo v posledných dekádach k obrovskému technologickému pokroku. V roku 1977 boli Sangerom a spolupracovníkmi na Cambridgeskej univerzite a Maxamom a Gilbertom s kolektívom na Harvardovej univerzite vyvinuté prvé sekvenovacie technológie2,3. Za tento objav bola Fredrickovi Sangerovi a Walterovi Gilbertovi v roku 1980 udelená Nobelova cena v oblasti chémie. V roku 1986 Smith a spolupracovníci publikovali automatizovanú fluorescenčnú sekvenovaciu technológiu na princípe Sangerovej metódy4. Tieto metódy umožnili štúdium genetických kódov živých organizmov a viedli k vývoju rýchlejších a výkonnejších sekvenovacích technológií. Sangerove sekvenovanie patrí aj v súčasnej dobe medzi najpoužívanejšie sekvenovacie technológie. Po dokončení projektu ľudského genómu nebola výkonnosť tradičných sekvenovacích metód schopná spĺňať potreby celogenómového sekvenovania. V polovici a na konci 90. rokov 20. storočia sa objavilo sekvenovanie novej generácie (NGS = Next Generation Sequencing), tiež nazývané ako sekvenovanie „druhej generácie“. V rokoch 2008 až 2009 bola opísaná sekvenovacia technológia ako sekvenovanie „tretej generácie“5. Na rozdiel od NGS, 529
sekvenátory tretej generácie ako napríklad PacBio6 a Nanopore7 čítajú nukleotidové sekvencie na úrovni jednej molekuly v reálnom čase. Pomocou týchto technológií sme schopní generovať dlhé čítania genetickej informácie, vďaka čomu je identifikácia patogénnych baktérií a ich faktorov virulencie možná za relatívne krátky čas. Na nasledujúcich stranách budú opísané metódy využívané v bežnej klinickej mikrobiológii. V rámci kapitol budú spomenuté aj technológie, ktoré majú potenciál byť v blízkej budúcnosti rutinne využívané v diagnostike infekčných chorôb ľudí a zvierat. 8.1.1 Identifikácia patogénnych baktérií na základe fenotypových vlastností Mnohé proteíny, vrátane enzýmov sú bežne produkované rôznymi druhmi baktérií patriacich do rôznych rodov. Vo všeobecnosti je bakteriálny rod charakterizovaný určitým profilom expresie proteínov a/alebo enzýmov, pričom existujú medzidruhové rozdiely. Tieto rozdiely sú spôsobené vplyvmi odlišných prostredí, v ktorých bakteriálne druhy určitého rodu žijú a v ktorom majú výhodu voči ostatným mikroorganizmom. Variabilné profily proteínovej expresie sa môžu využiť v testovaní baktérií za účelom ich identifikácie – diagnostiky. 8.1.1.1 Kultivačné vyšetrenie V mikrobiologickej diagnostike predstavujú kultivačné metódy zlatý štandard. Tieto metódy sú cenovo výhodné, postupy sú pre rutinnú prax štandardizované a z pohľadu testovania antibiotickej rezistencie sú konkluzívne. Hlavným nedostatkom je kultivácia náročných baktérií, ktorá v prípade niektorých významných patogénov (mykobaktérie) môže trvať aj niekoľko týždňov9. Okrem toho, predchádzajúca antibiotická terapia môže viesť k falošne negatívnym výsledkom. Za účelom izolácie čistej bakteriálnej kultúry sa vzorka naočkuje na živnú pôdu, ktorá podporuje rast mnohých druhov baktérií (napr. krvný agar). Prvotná identifikácia patogénnych baktérií sa robí na základe ich morfologických vlastností solitárnych kolónií (veľkosť, sfarbenie, tvar a pod.). Na detekciu mnohých bakteriálnych patogénov sa používajú diferenciačné kultivačné médiá, ktoré využívajú na identifikáciu hľadaných patogénov biochemický indikátor (nutričná zložka, napr. konkrétny cukor) a pH indikátor (detekcia utilizácie cukru). Pomocou týchto indikátorov je možné zaznamenať rozdiely v metabolickej aktivite baktérií. Selektívne médiá obsahujú antimikrobiálne zložky, ktoré inhibujú rast komenzálnej bakteriálnej mikroflóry a umožňujú rýchlu kultivačnú diagnostiku bakteriálnych 530
patogénov. Napríklad, pri izolácii salmonel zo vzorky stolice, ktorá obsahuje mnoho ďalších komenzálnych druhov, je nevyhnutné použiť diferenciačné selektívne médiá. Selektivita je zabezpečená pridaním antimikrobiálnych látok (napr. novobiocin) a diferenciácia salmonel môže byť založená na detekcii sulfánu alebo na základe aktivity špecifických enzýmov (napríklad C8-esteráza alebo α-galaktozidáza)10-13. 8.1.1.1.1 Chromogénne médiá Chromogénne médiá sú pri identifikácii baktérií vďaka jednoduchému použitiu a relatívne nízkej finančnej náročnosti v klinických laboratóriách často využívané. Používajú sa na izoláciu a identifikáciu patogénnych baktérií v jednom kroku z malého množstva vzorky. Princípom je utilizácia chromogénneho, alebo fluorescenčného substrátu pridaného do živnej pôdy špecifickými enzýmami, ktoré sú exprimované hľadanými baktériami (Obr. 8.2). Obr. 8.2 Schematické znázornenie princípu chromogénnych, alebo fluorogénnych médií (Váradi a kol. 2017 upravené)14 Väzba chromogénu, alebo fluorogénu so substrátom „vypína“ farebný signál chromofóru, alebo fluorochrómu. (A) Ak je táto väzba štiepená špecifickým bakteriálnym enzýmom, chromofór, alebo fluorochróm sa uvoľnia a farebný signál môže byť zaznamenaný. (B) C8-esteráza, produkovaná salmonelami, hydrolyzuje chromogénny substrát 5-bromo-chloro-3-indolyl kaprylát. Uvoľnený indoxyl (chromofór) oxiduje (purpurová farba), stáva sa nerozpustný a jeho akumulácia v bakteriálnych kolóniách spôsobí ich purpurové sfarbenie. Ak sa vo vyšetrovanej vzorke nachádzajú baktérie produkujúce daný enzým, dochádza k štiepeniu substrátu a k jeho štruktúrnym zmenám, čo vedie k uvoľneniu chromofóru, alebo fluorochrómu. Táto biochemická reakcia sa následne prejaví farebnou zmenou, alebo fluorescenciou. 531
Chromogénne médiá často obsahujú aj selektívne antimikrobiálne látky potláčajúce rast nežiaducej mikrobioty. Kombinácia niekoľkých chromogénnych substrátov a selektívnych aditív zabezpečuje vysokú špecificitu a rýchlu identifikáciu bakteriálnych patogénov na základe farebnej zmeny solitárnych kolónií. Cieľovými bakteriálnymi enzýmami chromogénnych substrátov môžu byť hydrolázy – najčastejšie glykozidázy (napríklad β- galaktozidáza alebo β-glukozidáza13. Odštiepenie cukrového zvyšku z chromogénneho substrátu prostredníctvom bakteriálnej glykozidázy vedie k uvoľneniu nerozpustného chromofóru lokalizovaného na povrchu bakteriálnych kolónií. Vďaka tomu je možné rýchlo a presne odlíšiť baktérie exprimujúce cieľový enzým od ostatných baktérií (Obr. 8.3). Obr. 8.3 Princíp chromogénneho média ChromID® CARBA (Váradi a kol. 2017 upravené)14 Chromogénne médium ChromID® CARBA využíva dva chromogénne substráty, ktoré umožňujú detekciu karbapenemázu produkujúcich Enterobacteriacae. Solitárne kolónie E. coli produkujúce β-glukuronidázu a β- galaktozidázu sú na tomto médiu červeno zafarbené a kolónie K. pneumoniae produkujúce β-glukozidázu sú modro-zeleno zafarbené. Väčšina komerčných chromogénnych médií určených na identifikáciu a diferenciáciu zástupcov rodu Salmonella z čeľade Enterobacteriacae je založená na detekcii bakteriálnej C8- esterázy. Tento enzým hydrolyzuje chromogénny substrát 5-bromo-chloro-3-indolyl kaprylát. Uvoľnený chromofór oxiduje, stáva sa nerozpustný, a preto sú kolónie salmonel purpurovo sfarbené. Chromogénne médium na identifikáciu Pseudomonas aeruginosa (ChromID® P. aeruginosa) je založené na aktivite bakteriálnej β-alanylaminopeptidázy. Chromogénny substrát β-alanyl- pentyl-resorufamín žltooranžovej farby je v tomto médiu hydrolyzovaný bakteriálnou β- alanylaminopeptidázou za vzniku purpurovo sfarbeného chromofóru resorufamínu. Akumulácia chromofóru spôsobuje purpurové sfarbenie solitárnych kolónií P. aruginosa na 532
tomto agare. Tento enzým bol okrem P. aerugonosa zaznamenaný aj u iných Gram- negatívnych baktérií rodu Serratia a Burkholderia cepacia. Kultivačná diagnostika bakteriálnych patogénov na chromogénnych médiách si našla uplatnenie v mnohých klinických laboratóriách. Urýchľuje a uľahčuje selekciu hľadaných patogénov predovšetkým z klinických vzoriek obsahujúcich niekoľko bakteriálnych druhov s podobnými morfologickými vlastnosťami solitárnych kolónií. Skríning pacientov kolonizovaných meticilín-rezistentným Staphylococcus aureus (MRSA), vankomycín- rezistentnými enterokokmi (VRE) a Enterobacteriacae s rozšíreným spektrom β-laktamáz alebo karbapenemáz je tiež založený na použití chromogénnych médií13. Napriek vysokej špecificite chromogénnych médií, získané výsledky nie sú konkluzívne, a preto pre identifikáciu na úrovni druhu je nevyhnutné použiť ďalšiu metódu, ako napríklad MALDI-TOF (Matrix Assisted Laser Desorption Ionization-Time Of Flight) hmotnostná spektrometria (MS = Mass Spectrometry). Rovnako ako pri ostatných kultivačných metódach, hlavným nedostatkom chromogénnej detekcie je časová náročnosť (16 – 48 hodín). Rozvoj farebnej zmeny závisí od množstva akumulovaného chromofóru, čo súvisí s množstvom porastených baktérií na platni. Riešenie tohto nedostatku by mohli predstavovať fluorescenčné farbivá. Ingham a spolupracovníci (2012) vyvinuli fluorescenčnú kultivačnú metódu na analýzu rastu mikrokolónií Candida albicans15. Toto kultivačné médium obsahuje fluorochróm Syto9 viažuci sa na nukleovú kyselinu, metabolické farbivo Fun-1 a Calcofluor White viažuci sa na bunkovú stenu. Týmto spôsobom môžu byť mikrokolónie C. albicans zaznamenané už v priebehu dvoch hodín inkubácie. 8.1.1.2 Biochemické vyšetrenie Po izolácii čistej bakteriálnej kultúry sa identifikácia na úrovni rodu, resp. druhu robí pomocou panelov rôznych biochemických testov, napr. na základe utilizácie cukrov (oxidáciou alebo fermentáciou) a detekcie kyslých koncových produktov pomocou pH indikátorov; na základe metabolizmu aminokyselín (detekcia dekarboxylázy, deaminázy, alebo tryptofanázy), alebo na základe produkcie hydrolytických enzýmov (ureáza, β-galaktozidáza). Inokulácia a hodnotenie komerčných panelových testov sa môže robiť manuálne, ako je to v prípade tzv. API (Analytical Profile Index) testov. V niektorých laboratóriách sa na biochemické testovanie baktérií využívajú prístroje, ako napr. BD Phoenix, ktoré zabezpečia plne automatizovanú inokuláciu ako aj hodnotenie vyšetrovaných vzoriek, vďaka čomu trvá 533
identifikácia baktérií spoločne so stanovením antimikrobiálnej citlivosti približne 2 až 3 hodiny16. 8.1.1.3 Biotypizácia Biotypizácia sa využíva pri identifikácii baktérií na základe analýzy ich proteínových profilov. Proteíny sú základnou zložkou bunkových systémov a tvoria asi 50 % bakteriálnych buniek. V súčasnosti sa na identifikáciu baktérií na základe ich proteínových profilov využíva najčastejšie metóda MALDI-TOF MS . Princípom MALDI je desorpčná fotoionizácia, pri ktorej je pomocou laseru zmes matrice a vzorky (napríklad proteíny, peptidy a iné biopolyméry) sublimáciou privedená do stavu plynných iónov. Matrice sú nasýtené roztoky organických zlúčenín o nízkej molekulovej hmotnosti (napríklad kyselina -cyano-hydroxyškoricová (CHCA = -Cyano-HydroxyCinnamic acid) alebo kyselina 2,5-dihydroxybenzoová (DHB = 2,5-DiHydroxyBenzoic acid), ktoré poskytujú vhodné prostredie a protóny pre ionizáciu molekúl vzorky. Roztok matrice je v zmesi so vzorkou v nadbytku. Po ich zmiešaní na nosičovej nerezovej platni dochádza na vzduchu k ich kokryštalizácii (Obr. 8.4). Obr. 8.4 Schematické znázornenie prípravy vzorky pre MALDI-TOF MS (Clark a kol. 2013 upravené)17 534
Kultúra mikroorganizmu je priamo na nosičovej platni zmiešaná s nadbytkom matrice. Počas sušenia dochádza ku kokryštalizácii molekúl vzorky a matrice. Kryštály zmesi matrice a vzorky sú ožiarené pulzujúcim UV laserom (napríklad dusíkový laser o vlnovej dĺžke 337 nm) (Obr. 8.5). Laserový lúč je smerovaný len na malú časť (o priemere okolo 0,05 až 0,5 mm) kryštálu. V tomto kroku dochádza k sublimácii a ionizácii molekúl kryštálu, ktoré získavajú protonáciou náboj (z) +1. Uvoľnené ióny zo vzorky sú následne analyzované TOF (Time of Flight) hmotnostným spektrometrom. Základným princípom TOF analýzy je, že ióny s odlišným pomerom hmotnosti a náboja (m/z) sú počas letu v neutrálnej oblasti analyzátora o známej dĺžke separované na základe ich m/z. Keďže z sa rovná +1, pomer m/z analyzovaných iónov zodpovedá relatívnej molekulovej hmotnosti. Ľahšie ióny dopadnú na detektor za kratší čas ako ťažšie. Detailný opis princípu MALDI-TOF MS nájde čitateľ v prehľadových publikáciách17-23. Obr. 8.5 Schematické znázornenie priamej identifikácie intaktných buniek mikroorganizmov pomocou MALDI-TOF MS (Clark a kol. 2013 upravené)17 Ióny fotoionizáciou sublimujú zo zmesi matrice a vzorky na povrchu MALDI platne. Elektrickým poľom o známom napätí sú urýchľované do neutrálnej driftovej oblasti TOF hmotnostného spektrometra. Zastúpenie iónov vo vzorke je analyzované a vyjadrené kompatibilným softwérom. Identifikácia analyzovaného mikroorganizmu vo vzorke sa robí na základe porovnania získaného spektrogramu s on-line databázou MS spektier. MALDI-TOF MS si našla široké uplatnenie v klinickej mikrobiológii, keďže táto analýza významnou mierou urýchľuje presnú identifikáciu mikroorganizmov na úrovni druhu v priebehu niekoľkých minút. Vo vysokovýkonnom (angl. High throughput) formáte sa jedná o ekonomický spôsob identifikácie niekoľkých desiatok bakteriálnych izolátov denne14. K jej 535
použitiu stačí, aby tieto organizmy vytvorili na pevných pôdach viditeľné kolónie. Na analýzu stačí aj jedna bakteriálna kolónia. Identifikačný proces prebieha v reálnom čase, tak ako je vzorka analyzovaná v spektrometri. Získaný proteínový profil neznámej vzorky mikroorganizmov je následne porovnaný s referenčnými spektrami mikroorganizmov uloženými v databáze napríklad Bruker Daltonics pre Microflex LT spektrometer, alebo Vitek MS pre bioMérieux spektrometer (Shimadzu-Biotech Corp.)22. Za pomoci algoritmov je stanovená úroveň podobnosti medzi spektrom neznámej vzorky a spektrami v databáze. Výsledkom je skóre, ktoré umožňuje identifikovať neznáme baktérie až na úroveň druhu23. Medzi nevýhody tejto technológie patrí to, že na analýzu môžu byť použité iba kultivovateľné organizmy, pričom výsledok môže ovplyvniť vek kultúry21. Presnosť identifikácie je závislá aj na počte dostupných spektier baktérií v databáze. Preto je dôležité, aby boli tieto databázy priebežne aktualizované. Taktiež je problematické odlíšenie niektorých príbuzných organizmov napríklad zástupcov rodu Shigella spp., E. coli a enteroinvazívnych E. coli24. Rovnako nebolo možné pomocou MALDI-TOF MS spoľahlivo diferencovať Streptococcus pneumoniae od ostatných druhov alfa hemolytických streptokokov skupiny mitis25,26. Implementácia MALD-TOF MS do klinickej praxe umožnila okrem druhovej identifikácie aj detekciu faktorov virulencie a antibiotickej rezistencie. Kuo a spolupracovníci (2015) odlíšili na základe MS profilov 2 genotypy Clostridioides difficile (cdtA+ a cdtB+). Presnosť diferenciácie v porovnaní s multiplexnou PCR dosiahla 100 %27. V iných štúdiách autori detegovali pomocou MALDI-TOF MS napríklad botulotoxín produkovaný Clostridium botulinum28, alebo letálny faktor tripartitného antraxového toxínu produkovaného Bacillus anthracis29. Podobným spôsobom bol detegovaný delta toxín Staphylococcus aureus, ktorý je indikátorom pomocného génového regulačného (agr = accessory gene regulator) systému. Agr systém reguluje expresiu faktorov virulencie Staphylococcus aureus, napríklad niektorých exotoxínov a proteínov zodpovedných za adherenciu a tvorbu biofilmu30. Jedným z najvýznamnejších typov rezistencie Gram-negatívnych baktérií je produkcia karbapenemáz. Karbapenemázy sú bakteriálne enzýmy hydrolyzujúce amidovú väzbu β- laktámového kruhu. Tieto enzýmy sa často vyskytujú u Gram-negatívnych nefermentujúcich tyčinkovitých baktérií (rody Pseudomonas a Acinetobacter) a zástupcov čeľade Enterobacteriacae31,32. Základné fenotypové metódy na detekciu karbapenemáz sú založené na princípe ich inhibície, avšak tieto postupy nie sú dostatočne špecifické (napríklad karbapenemázy typu OXA nimi nie sú detegovateľné)33. Molekulárne-genetické metódy sú obmedzené na známe β-laktamázy a pozitívne PCR výsledky by mali byť overené 536
sekvenovaním. Okrem toho, negatívne výsledky molekulárne-genetických metód nevylučujú prítomnosť karbapenemáz, a preto by nemali byť považované za konkluzívne34. Obr. 8.6 Spektrogram MALDI-TOF MS detekcie NDM-1 karbapenemázu produkujúcej E. coli (Hrabák a kol. 2012)34 V prípade kmeňa produkujúceho karbapenemázu sú v MALDI-TOF MS spektrograme prítomné píky degradačných produktov meropenému. V prípade, že analyzovaný kmeň nie je producentom karbapenemázy, v spektrograme je zaznamenaný ión meropenému, respektíve ióny jeho sodných solí (A a B). Karbapenemázová aktivita sa prejaví prítomnosťou píkov iónov degradačných produktov meropenému a absenciou iónov meropenému a jeho sodných solí. A – roztok meropenému. B – negatívna kontrola. C – E. coli NDM-1. [Meropeném+H]+ – ión meropenému (m/z 384,5); [Meropeném+Na]+ a [Meropeném+2Na]+ – sodná (m/z 406,5) a disodná (m/z 428,5) soľ meropenému; [Meropenémhydr+2Na]+ a [Meropenémhydr+3Na]+ – disodná (m/z 446,5) a trisodná (m/z 468,5) soľ hydrolyzovaného degradačného produktu meropenému; [Meropenémdekarbox+H]+ a [Meropenémdekarbox+Na]+ – ión (m/z 358,5) a sodná (m/z 380,5) soľ dekarboxylovaného degradačného produktu meropenému. MALDI-TOF MS umožňuje aj detekciu molekúl s malou molekulovou hmotnosťou, a preto môže byť využitá aj na detekciu aktivity β-laktamáz35-37. Hmotnostná spektrometria preto, na rozdiel od molekulárno-genetických metód, poskytuje výsledky o aktivite karbapenemáz. Tento prístup je založený na priamej detekcii karbapenémov, ich variantov a ich degradačných produktov (Tab. 8.1). 537
Karbapenemázová aktivita E. coli produkujúcej New Delhi metalo-β-laktamázu 1 (NDM-1) bola pomocou MALDI-TOF detegovaná na základe štiepenia meropenému (Obr. 8.6). Relatívna molekulová hmotnosť meropenému je 383,5. V MALDI-TOF MS má ión meropenému m/z 384,5 a jeho sodná a disodná soľ m/z 406,5 a 428,5 v poradí34. Tab. 8.1 Hodnoty m/z meropenému, jeho sodných solí a najčastejšie detegovaných degradačných produktov detegovateľných pomocou MALDI-TOF MS (Hrabák a kol. 2012) 34 Molekula m/z [Meropeném+H]+ 384,5 [Meropeném+Na]+ 406,5 [Meropeném+2Na]+ 428,5 [Meropenémhydr+H]+ 402,5 [Meropenémhydr+Na]+ 424,5 [Meropenémhydr+2Na]+ 446,5 [Meropenémhydr+3Na]+ 468,5 [Meropenémdekarbox+H]+ 358,5 [Meropenémdekarbox+Na]+ 380,5 [Meropenémdekarbox+2Na]+ 402,5 Legenda: degradačné produkty meropenému: meropenémhydr – hydrolyzovaná molekula; meropenémdekarbox – dekarboxylovaná molekula. 8.1.1.4 Sérologické vyšetrenie Patogénne baktérie a bakteriálne toxíny môžu byť detegované okrem mnohých iných spôsobov aj sérologickými reakciami. Tieto reakcie sú založené na in vitro kvalitatívnom alebo kvantitatívnom vyhodnotení interakcie medzi antigénom a špecifickou protilátkou za vzniku komplexu antigén-protilátka. Z chemického pohľadu môžu byť antigény bielkoviny, polysacharidy, alebo komplexy lipidov s cukrami. Baktérie majú niekoľko typov antigénov, ktoré môžu byť detegované rôznymi serologickými reakciami. Korpuskulárne antigény sú súčasťou bakteriálnej bunky: somatický O antigén, je súčasťou bunkovej steny (je to termostabilný polysacharid); polysacharidový kapsulárny K antigén; proteínový bičíkový H antigén a fimbriálny F antigén, ktorý je taktiež proteínovej povahy. Okrem korpuskulárnych antigénov môžu byť sérologickými reakciami detegované aj solubilné antigény, napríklad bakteriálne toxíny. V klinickej mikrobiológii sa na rýchle určenie patogénnych baktérií často využíva latexová aglutinácia alebo imunoenzymatický ELISA test (Enzyme-Linked ImmunoSorbent Assay). 538
8.1.1.4.1 Latexová aglutinácia Latexová aglutinácia je rýchla a jednoduchá metóda pre dôkaz baktérií. Pomocou latexovej aglutinácie môžu byť detegované tzv. korpuskulárne antigény. Princípom tohto testu je to, že na povrch latexových mikročastíc sú kovalentne naviazané špecifické protilátky voči danému druhu, alebo sérotypu baktérií. Po zmiešaní suspenzie latexových častíc so solitárnou kolóniou je možné v pozitívnom prípade vidieť okom viditeľné zhluky, tzv. aglutinát (Obr. 8.7). V súčasnej dobe sú k dispozícii komerčne vyrábané latexové aglutinačné testy. Obr. 8.7 Výsledok latexovej aglutinácie (www.microbenotes.com upravené)38 8.1.1.4.2 Imunoenzymatická detekcia baktérií (ELISA) ELISA je často používanou sérologickou metódou pre detekciu baktérií a bakteriálnych toxínov. Jedná sa o vysoko špecifickú a citlivú metódu, ktorá môže byť použitá na vyšetrenie vzoriek rôzneho charakteru (potraviny, synoviálna tekutina, sérum, cerebrospinálny mok, moč, stolica). Test sa robí v 96 jamkových polystyrénových mikrotitračných platničkách. ELISA je, okrem diagnostiky, často využívanou metódou aj v epidemiologických, alebo epizootologických štúdiách39-41. Princíp testu je založený na reakcii dvoch protilátok špecifických voči hľadanému antigénu (Obr. 8.8). Kontaminácia potravín a vody patogénnymi baktériami alebo ich toxínmi predstavuje aj v dnešnej dobe významné riziko infekcií ľudí a zvierat. Napríklad enterotoxíny produkované Staphylococcus aureus sú termostabilné a ostávajú aktívne aj po účinku tráviacich proteáz. Enterotoxíny A a B môžu spôsobiť otravu z jedla39,42,43. Na detekciu prítomnosti týchto, ale aj ďalších stafylokokových enterotoxínov sú v súčasnosti dostupné komerčne vyrábané sendvičové ELISA44-46. Kuang H. a spolupracovníci (2013)40 pripravili monoklónové protilátky za účelom detekcie stafylokokového enterotoxínu A pomocou sendvičovej ELISA. 539
Po selekcii vhodnej dvojice protilátok a po optimalizácii reakčných podmienok dosiahla nimi vyvinutá ELISA limit detekcie 0,028 ng/ml a lineárne dynamické rozhranie reakcie bolo 0,06 – 2 ng/ml40. Obr. 8.8 Schematické znázornenie princípu sendvičového ELISA testu pre detekciu antigénov (vlastný obrázok). Vyšetrovaná vzorka obsahuje okrem hľadaného antigénu aj mnoho ďalších. Po pridaní vzorky do jamky ELISA platničky, primárna protilátka (zelená) imobilizovaná na dne jamky „vychytá“ hľadaný antigén (žltý). Po niekoľkonásobnom premytí sú nenaviazané antigény odstránené z jamiek a komplex antigén-protilátka je vizualizovaný pridaním konjugátu. Konjugát je sekundárna protilátka (modrá) špecifická voči hľadanému antigénu, ktorá je kovalentne spojená s enzýmom (často peroxidáza; hnedý). Ak vzorka obsahuje hľadaný antigén (baktériu, alebo toxín), po pridaní chromogénneho substrátu (bezfarebné krúžky) dôjde prostredníctvom enzymatickej reakcie k farebnej zmene roztoku (oranžové krúžky). Výsledok je hodnotený na základe absorbancie, ktorá je priamo úmerná intenzite zafarbenia. 8.1.2 Genetická identifikácia patogénnych baktérií Baktérie sú taxonomicky a fylogeneticky klasifikované na základe analýz sekvencií konzervatívnych génov, predovšetkým ribozomálnej RNA (rRNA). Ribozomálne RNA sú ubikvitárne sa vyskytujúce molekuly nukleových kyselín obsahujúce oblasti s rôznou frekvenciou mutácií47. Molekulárne diagnostické metódy sa zakladajú na detekcii a analýze bakteriálnych markerových sekvencií. Umožňujú profilovanie a charakteristiku mikroorganizmov a poskytujú klinicky významné informácie (napríklad identifikácia detegovanej baktérie, prítomnosť génov zodpovedných za rezistenciu voči antibiotikám, alebo génu kódujúceho toxín). Tieto informácie je možné získať priamou charakterizáciou rRNA, amplifikáciou génov a následnou analýzou amplikónov, respektíve sekvenčnou analýzou parciálneho alebo celého bakteriálneho genómu. 540
8.1.2.1 Hybridizačné metódy Hybridizácia je proces, pri ktorom dochádza k vytváraniu vodíkových väzieb medzi komplementárnymi nukleotidmi jednovláknových DNA (ssDNA = single stranded DNA ) alebo ssRNA molekúl (Obr. 8.9). Obr. 8.9 Schematické znázornenie princípu fluorescenčnej in situ hybridizácie (Maďar a kol. 2015)48 Vzorky sú po fixácii a permeabilizácii inkubované s hybridizačným roztokom obsahujúcim špecifickú sondu pre detegovanú DNA alebo rRNA sekvenciu. Výsledok hybridizácie sa hodnotí fluorescenčnou mikroskopiou. Obrázok znázorňuje detekciu baktérií z rodov Lactobacillus spp. (číslo 1) a Bifidobacterium (číslo 3) na základe 16S rRNA. Pre detekciu laktobacilov bola použitá DNA sonda značená flurofórom 6-karboxyfluoresceín (FAM6). Bifidobaktérie boli detegované sondou značenou sulforodamínom (texas Red). Čísla 2 a 4 sú autofluorescenčné signály vzorky a číslo 5 znázorňuje farbenie DNA farbivom DAPI všetkých baktérií vo vzorke. Hybridizačné sondy sú krátke 18 – 30-bázové ssDNA alebo ssRNA značené oligonukleotidy, komplementárne k detegovaným sekvenciám v cieľových génoch14. Fluorochrómami značené sondy sa využívajú na fluorescenčnú in situ hybridizáciu (FISH = Fluorescence In Situ Hybridization). Ich sekvencie sú unikátne iba pre hľadaný mikroorganizmus alebo skupinu mikroorganizmov, vďaka čomu ich je možné využiť na identifikáciu, sledovanie prítomnosti alebo absencie génov determinujúcich virulenciu. Touto metódou bolo napr. možné v 115 prípadoch bakteriémie v priebehu 2,5 hodiny taxonomicky klasifikovať na úrovni čeľade, rodu a druhu 96,5% mikroorganizmov s limitom 541
detekcie na úrovni 103 KTZ/ml krvi49. Napriek relatívne nízkej citlivosti v porovnaní s kultivačnými metódami, patrí FISH metóda medzi rýchle techniky identifikácie patogénov. Na podobnom princípe ako DNA sondy pracujú aj syntetické DNA mimikujúce PNA (Peptide Nucleic Acid) sondy. Kostra PNA sond je zložená z opakujúcich sa jednotiek 2- aminoetylglycínu spojených peptidovými väzbami (Obr. 8.10). Vďaka flexibilite a neutrálnemu elektrickému náboju polyamidovej kostry PNA sondy hybridizujú s komplementárnymi úsekmi DNA alebo RNA s vysokou špecificitou a vyššou afinitou než pri DNA/DNA hybridizácii. Vďaka unikátnym fyzikálno-chemickým vlastnostiam boli tieto sondy využité pri vývoji viacerých molekulárno-biologických a diagnostických metód50. Obr. 8.10 Porovnanie chemickej štruktúry PNA sondy so štruktúrou DNA a proteínu (Pellestor a Paulasova 2004 upravené)50 Kostra DNA je tvorená opakujúcimi sa jednotkami deoxyribózy a fosfátu spojenými fosfodiesterovou väzbou. Kostra PNA sond je zložená z opakujúcich sa jednotiek 2-aminoetylglycínu, ktoré sú rovnako ako aminokyseliny v proteínoch spojené peptidovými väzbami (v rámčeku). Bázy (A, C, G a T) sú s kostrou sondy spojené prostredníctvom metylénových a karboxylových skupín. PNA sondy hybridizujú s komplementárnymi úsekmi cieľových DNA a RNA molekúl. Vodíkové väzby sú znázornené ´....´. Søgaard a spolupracovníci (2007) použili PNA sondu pri vývoji FISH na detekciu 23S rRNA Klebsiella pneumoniae. Analytické parametre metódy boli testované na 39 kmeňoch Klebsiella spp. a Enterobacter aerogenes. Navrhnutá PNA sonda bola špecifická pre zástupcov K. pneumoniae komplex (K. pneumoniae, K. ozaenae a K. variicola). Presnosť bola testovaná na 264 vzorkách, v ktorých boli diagnostikované Gram-negatívne tyčinky. V porovnaní s kultivačnými a biochemickými identifikačnými metódami dosiahla PNA-FISH metóda 98,8 542
% senzitivitu, 99,5 % špecificitu, 98,8 % pozitívnu a 99,5 % negatívnu prediktívnu hodnotu51. Vzhľadom na dosiahnuté analytické parametre a na potrebný čas pre dosiahnutie výsledkov (3 hodiny) sa jedná o účinný spôsob, ktorý rozširuje repertoár metód určených na identifikáciu Gram-negatívnych bakteriálnych patogénov. 8.1.2.2 Amplifikačné metódy Amplifikačné metódy boli vyvinuté za účelom in vitro dôkazu prítomnosti sekvencie nukleovej kyseliny cieľového mikroorganizmu v komplexných vzorkách obsahujúcich milióny buniek hostiteľského organizmu. Pomocou týchto metód je možné detegovať ťažko kultivovateľné aj nekultivovateľné baktérie52. Vďaka rýchlosti, špecificite a citlivosti sú v súčasnej dobe najpopulárnejšími metódami v klinickej diagnostike kvantitatívna PCR v reálnom čase (qPCR) a reverzne transkripčná qPCR (RT-qPCR), ako aj izotermálne amplifikačné metódy, napríklad LAMP (Loop-Mediated Isothermal Amplificatoin). 8.1.2.2.1 Kvantitatívna polymerázová reťazová reakcia Polymerázová reťazová reakcia (PCR = Polymerase Chain Reaction) je založená na cyklickej zmene teploty reakčnej zmesi. Počas každého PCR cyklu je dvojvláknová DNA (dsDNA = double stranded DNA) tepelne denaturovaná na dve templátové jednovláknové ssDNA molekuly. Prostredníctvom primerov a DNA polymerázy sú v reakčnej zmesi syntetizované PCR amplikóny. Primery sú oligonukleotidy o dĺžke 18 – 23 bázových párov (bp), ktoré na základe komplementarity hybridizujú s templátovou ssDNA. Slúžia na ohraničenie cieľového úseku, napríklad úseku v géne kódujúcom enterotoxín, ktorý je potrebné detegovať. Následne DNA polymeráza na základe komplementarity pripája k primerom nukleotidy, čím sa syntetizuje PCR amplikón. Opakovaním (35 – 40 ×) cyklov sa množstvo amplikónov v reakčnej zmesi exponenciálne zvyšuje (niekoľko milión-násobne). Celkový čas potrebný na vyšetrenie sa v závislosti od spôsobu spracovania vzorky, extrakcie nukleovej kyseliny, reakčných parametrov a spôsobu hodnotenia výsledku pohybuje do 24 hodín. Kvantitatívna PCR v reálnom čase (qPCR) je založená na meraní zvyšujúcej sa koncentrácie amplikónov v reakčnej zmesi ich fluorescenčným značením. Pre tieto účely sa môžu použiť interkalačné farbivá, alebo modifikované oligonukleotidy – hybridizačné sondy. Intenzita fluorescencie sa meria pomocou real-time PCR termocykléru na konci každého PCR cyklu. 543
Interkalačné farbivá (napríklad SYBR® Green, alebo EVAGreen®), sa nešpecificky viažu na novo vznikajúce dsDNA amplikóny počas extenzie PCR cyklu (Obr. 8.11). Tieto farbivá naviazané na dsDNA po ožiarení emitujú svetlo53. Na konci každého cyklu sa v reakčnej zmesi meria intenzita fluorescencie. Množstvo novo vzniknutých amplikónov je priamo úmerné intenzite fluorescencie. Výhodou tejto techniky je nízka cena a relatívne jednoduchá optimalizácia reakčných podmienok. Avšak fluorescencia je zaznamenaná v prítomnosti akejkoľvek dsDNA, a preto špecificita reakcie je negatívne ovplyvnená amplifikáciou nešpecifických amplikónov alebo vznikom dimérov z použitých primerov. Špecificita reakcie sa preto hodnotí analýzou krivky topenia vzniknutých amplikónov, čo je grafické zobrazenie fluorescencie ako funkcie teploty. Špecifický amplikón má charakteristický tvar krivky topenia pri určitej teplote. Nešpecifické dsDNA molekuly majú odlišnú teplotu topenia a tvar krivky54,55. Obr. 8.11 Schematické znázornenie jedného cyklu qPCR pomocou interkalačného farbiva (vlastný obrázok) (A) Voľné molekuly interkalátora (zelené) v roztoku reakčnej zmesi. (B) Primery hybridizujú na cieľový úsek templátovej DNA na základe komplementarity. (C) Počas extenzie sa interkalátor viaže na novo vzniknuté dsDNA amplikóny. (D) Na konci každého qPCR cyklu sa rekčná zmes ožiari a viazané molekuly interkalátora emitujú fluorescenčné svetlo, ktoré je zaznamenané detektorom qPCR zariadenia. Zvyšujúcim sa počtom cyklov sa zvyšuje množstvo amplikónov, čo je priamo úmerné intenzite fluorescencie. Vývojom fluorescenčne modifikovaných hybridizačných DNA sond sa dosiahla vyššia špecificita a citlivosť, ako aj možnosť simultánnej detekcie patogénov. Sondy sú DNA oligonukleotidy, ktoré majú na 5´-konci naviazaný fluorescenčný reportér a na 3´-konci 544
zhasínač (angl. quencher). Zhasínanie fluorescencie je založené na spektroskopickom procese prenosu energie medzi reportérom a zhasínačom nazývanom FRET (Fluorescence Resonance Energy Transfer). Ide o fenomén, kedy sú molekuly reportéra a zhasínača v malej vzdialenosti a ich absorpčné a emisné spektrá sa prekrývajú. Na tomto princípe sú založené napríklad TaqMan hydrolyzačné sondy (Obr. 8.12). Počas qPCR sonda hybridizuje s cieľovou sekvenciou amplikónu. V kroku extenzie je 5´-exonukleázovou aktivitou DNA polymerázy sonda hydrolyzovaná a molekula reportéra sa uvoľní do reakčnej zmesi, čím sa vzdiali od zhasínača. Na konci qPCR cyklu sa meria intenzita fluorescencie reakčnej zmesi a uvoľnený reportér emituje svetlo. Ak je vo vzorke prítomná cieľová bakteriálna DNA, so zvyšujúcim sa počtom cyklov sa v reakčnej zmesi akumuluje viac reportéra, čím sa zvyšuje intenzita fluorescencie56. Obr. 8.12 Detekcia amplikónov vytvorených v qPCR pomocou TaqMan sond (vlastný obrázok) (A) Na 5’-konci má sonda molekulu reportéra – fluorochrómu (napríklad FAM) a na 3‘-konci molekulu zhasínača (napríklad Black Hole Quencher). V nehybridizovanom stave je zhasínač v blízkosti fluorochrómu, a preto k fluorescencii nedochádza. (B) Počas PCR sonda hybridizuje s komplementárnym úsekom amplikónu. (C) Počas extenzie je 5‘-exonukleázovou aktivitou DNA polymerázy sonda hydrolyzovaná a reportér sa uvoľní do reakčnej zmesi – vzdiali sa od zhasínača. (D) Po ožiarení reakčnej zmesi detektor termocykléra zaznamená emitované svetlo reportéra. Pri opakovaní jednotlivých cyklov dochádza k postupnému zvyšovaniu fluorescenčného signálu. Okrem bakteriálnej DNA sa v diagnostike využíva aj detekcia bakteriálnej mRNA. Pomocou takéhoto prístupu je možné získať cenné informácie o aktívnej produkcii určitých faktorov virulencie alebo enzýmov degradujúcich antibiotiká. Za takýmto účelom sa používa reverzná transkripcia (reverse transcription) s následnou qPCR (RT-qPCR). Je to najcitlivejší spôsob 545
detekcie nízkych množstiev mRNA vo vzorke. Kvantifikácia je založená na rovnakom princípe ako to je opísané vyššie, avšak samotnej qPCR predchádza reverzná transkripcia. V tomto procese sa zo vzorky extrahuje RNA alebo mRNA. Pomocou reverznej transkriptázy a primerov sa následne syntetizuje komplementárna DNA (cDNA = complementary DNA), ktorá je použitá v qPCR (Obr. 8.13). Obr. 8.13 Schematické znázornenie RT-qPCR (vlastný obrázok) V reverznej transkripcii sa môžu použiť rôzne typy primerov. Oligo-dT je 12 – 18 báz dlhý primer, ktorý nasadá na polyA koniec mRNA. Random primery sú hexanukleotidy s náhodnou sekvenciou a hybridizujú na rôzne miesta RNA molekuly. Špecifické primery sa používajú na reverznú transkripciu vybraného úseku mRNA, napríklad faktoru virulencie. Získaná cDNA je následne použitá na qPCR. Výsledkom qPCR je amplifikačná krivka znázorňujúca vzťah počtu PCR cyklov reakcie a intenzity fluorescencie detegovanej v reakčnej zmesi (Obr. 8.14). 546
Obr. 8.14 Amplifikačná krivka qPCR (vlastný obrázok) Na začiatku reakcie je fluorescencia pod prahovou líniou detegovateľnosti. Počas exponenciálnej fázy sa množstvo PCR amplikónu v každom cykle zdvojnásobí. Postupne sú jednotlivé reakčné zložky spotrebované, dochádza k spomaleniu nárastu PCR amplikónu a reakcia vstupuje do fázy plató. Cyklus, v ktorom intenzita fluorescencie zaznamenaná detektorom termocykléra prekročí prahovú líniu, sa nazýva kvantifikačný cyklus (Cq = quantification cycle)57. Ak vzorka obsahuje vysoké množstvo cieľovej DNA, fluorescencia bude zaznamenaná v nižšom Cq. Naopak, ak je vo vzorke málo cieľovej DNA, fluorescencia sa objaví vo vyššom Cq. V mikrobiologických laboratóriách sa qPCR využíva na stanovenie počtu infekčných agensov, respektíve kópií ich DNA vo vyšetrovanej vzorke, na tzv. absolútnu kvantifikáciu. Pre tieto účely sa používajú štandardy, ktoré sú vyšetrené simultánne so vzorkou. Štandardy sú roztoky o známej koncentrácii cieľovej DNA sekvencie. Kvantitatívne výsledky z vyšetrenia sa použijú na vytvorenie štandardnej krivky (Obr. 8.15). Vynesením Cq vzorky na štandardnú krivku je možné určiť množstvo kópií cieľovej DNA vo vzorke8. 547
Obr. 8.15 Štandardná krivka qPCR reakcie a kvantifikácia cieľovej DNA sekvencie v neznámej vzorke (vlastný obrázok) Krivka vyjadruje vzťah medzi koncentráciou PCR amplikónu v roztoku štandard (prázdne kruhy) a kvantifikačným cyklom (Cq). Na základe tohto vzťahu je možné stanoviť množstvo PCR amplikónov v neznámej vzorke (krížiky). Na krivke znázorňuje čierne písmo koncentráciu PCR amplikónu v štandardách a červené písmo v neznámej vzorke. Limitujúcim faktorom qPCR v multiplexnej detekcii patogénov je obmedzený výber neinterferujúcich fluorescenčných modifikácií. Zvyšovaním počtu cieľových patogénov v multiplexnej PCR sa kvôli amplifikácii nešpecifických sekvencií a tvorbe dimérov z primerov, znižuje citlivosť a špecificita reakcie. Preto návrh multiplexných qPCR reakcií si vyžaduje značnú expertízu pri dizajnovaní primerov a DNA sond, ako aj pri optimalizácii reakčných podmienok58-60. 8.1.2.2.2 Slučkami sprostredkovaná izotermálna amplifikácia (LAMP) V klinickej mikrobiológii si našla široké uplatnenie slučkami sprostredkovaná izotermálna amplifikácia (LAMP = Loop Mediated Isothermal Amplification). LAMP je vysoko špecifická metóda, ktorá umožňuje detekciu cieľovej DNA molekuly v komplexných vzorkách za krátky čas (15 – 60 minút). Reakcia prebieha v jednom kroku za stálej teploty (60 – 65 °C) pomocou Bst DNA polymerázy s tzv. strand-displacement aktivitou a štyroch primerov, vďaka čomu je reakcia vysoko špecifická61. 548
Obr. 8.16 Schematické znázornenie LAMP metódy (Notomi a kol. 2015 upravené)62 Primery použité pri LAMP: vnútorný predný primer (FIP = Forward Inner Primer ) nesie sekvencie F2 na 3´- konci a F1c na 5´-konci; vnútorný spätný primer (BIP =Backward Inner Primer) nesie sekvencie B2 na 3´-konci a B1c na 5´-konci; vonkajšie primery F3 a B3 sú navrhnuté vo vonkajšej oblasti. V LAMP reakcii sa vytvorí ssDNA molekula so stopkovými slučkami na oboch koncoch pripomínajúca činku (angl. dumbell). Z tejto DNA štruktúry sú iniciované cykly amplifikačných reakcií. Amplifikované DNA produkty prechádzajú opakovanými elongačnými reakciami, z ktorých vznikajú DNA produkty s rôzne dlhými stopkovými slučkami a viacerými kópiami cieľovej DNA sekvencie. LAMP reakcia je založená na opakovaní slučkami sprostredkovaných (angl. loop mediated) amplifikačných a elongačných reakcií DNA molekúl. Proces začína od stopkovej slučky na 3´- konci a následnou hybridizáciou nových primerov v slučkovej oblasti (Obr. 8.16). V reakcii sú použité dva páry primerov, vonkajšie (B3 a F3) a vnútorné (BIP a FIP). Každý z vnútorných primerov nesie na svojom 3´-konci sekvenciu komplementárnu k amplifikačnej oblasti lokalizovanej na antiparalelnom vlákne orientovanom v smere 3´-5´. Na 5´-konci nesú vnútorné primery sekvenciu identickú s vnútornou oblasťou paralelného vlákna, ktoré je orientované v smere 5´-3. Elongačné reakcie pomocou Bst DNA polymerázy sa opakujú a koncovými produktmi je zmes DNA molekúl so stopkovými slučkami o rôznej dĺžke, ktoré sú 549
poskladané do štruktúry obsahujúcej viacero slučiek (pripomínajúcej karfiol) a kópií cieľovej DNA sekvencie. Amplifikovaný produkt môže byť vizualizovaný bez špeciálneho zariadenia na základe turbidity alebo na základe fluorescencie62. Detailný opis princípu LAMP metódy nájde čitateľ v Notomi a kol. (2000)61 a na odkaze https://loopamp.eiken.co.jp/en/lamp/. Zhang a spolupracovníci (2011) porovnali qPCR, RT-qPCR a LAMP navrhnuté na detekciu salmonel s kultivačnou metódou odporúčanou Správou potravín a liečiv (Food and Drug Administration) v potravinárskych komoditách63. Amplifikačné metódy detegovali úsek invA génu, ktorý kóduje faktor virulencie salmonel. Syntéza invA mRNA je závislá od aktuálneho fyziologického stavu salmonel, preto detekcia tohto génu v baktériách, nachádzajúcich sa mimo hostiteľa, nemusí byť úspešná. Z toho dôvodu boli testované vzorky salmonel pred testovaním po dobu 24 hodín kultivované v univerzálnom obohacujúcom médiu. Pomocou všetkých štyroch porovnaných metód bolo možné detegovať už 2 KTZ v 25 gramoch potraviny. Z výsledkov vyplýva, že amplifikačné metódy sú rýchlejšie a rovnako citlivé pri detekcii salmonel vo vybraných potravinách ako konvenčná kultivačná metóda. Pri vhodnom výbere cieľových sekvencií sa zvyšuje špecificita amplifikačnej reakcie a výrazne sa skracuje čas potrebný pre diagnostiku. MRSA môžu byť pomocou qPCR detegované v nazálnom výtere v priebehu 90 minút bez predbežnej kultivácie64. Metóda je založená na detekcii stafylokokovej kazety obsahujúcej mecA gén (SSCmec)65 a vysoko konzervatívneho otvoreného čítacieho rámca orfX, ktorý je integračnou oblasťou SSCmec v genóme S. aureus66. 8.1.2.3 DNA mikročipy (DNA microarray) DNA mikročipy umožňujú simultánnu multiplexnú detekciu širokej škály mikroorganizmov v jednej vzorke, spoločne s ich faktormi virulencie a génmi kódujúcimi antibiotickú rezistenciu (Obr. 8.17). Cieľové gény alebo skupiny génov môžu byť detegované pomocou univerzálnych, respektíve konsenzusových sond. V ostatnej dobe bolo vyvinutých niekoľko takýchto panelov na diagnostiku prítomnosti patogénov v rôznych typoch vzoriek (napr. krvi alebo tráviacom trakte). Jedná sa o kompaktné automatizované systémy, ktoré umožňujú extrakciu nukleových kyselín, amplifikáciu, hybridizáciu a v niektorých prípadoch aj analýzu krivky topenia v jednom zariadení. FilmArray® Blood Culture (Biomérieux) panel je navrhnutý pre detekciu 25 patogénov a 4 génov antibiotickej rezistencie vo vzorkách krvi v priebehu 1 hodiny67. Huang a spolupracovníci (2016) porovnali Verigene® enteric pathogens, Biofire FilmArray® gastrointestinal a Luminex xTAG® multiplexné DNA mikročipové systémy určené na detekciu 550
Search
Read the Text Version
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 19
- 20
- 21
- 22
- 23
- 24
- 25
- 26
- 27
- 28
- 29
- 30
- 31
- 32
- 33
- 34
- 35
- 36
- 37
- 38
- 39
- 40
- 41
- 42
- 43
- 44
- 45
- 46
- 47
- 48
- 49
- 50
- 51
- 52
- 53
- 54
- 55
- 56
- 57
- 58
- 59
- 60
- 61
- 62
- 63
- 64
- 65
- 66
- 67
- 68
- 69
- 70
- 71
- 72
- 73
- 74
- 75
- 76
- 77
- 78
- 79
- 80
- 81
- 82
- 83
- 84
- 85
- 86
- 87
- 88
- 89
- 90
- 91
- 92
- 93
- 94
- 95
- 96
- 97
- 98
- 99
- 100
- 101
- 102
- 103
- 104
- 105
- 106
- 107
- 108
- 109
- 110
- 111
- 112
- 113
- 114
- 115
- 116
- 117
- 118
- 119
- 120
- 121
- 122
- 123
- 124
- 125
- 126
- 127
- 128
- 129
- 130
- 131
- 132
- 133
- 134
- 135
- 136
- 137
- 138
- 139
- 140
- 141
- 142
- 143
- 144
- 145
- 146
- 147
- 148
- 149
- 150
- 151
- 152
- 153
- 154
- 155
- 156
- 157
- 158
- 159
- 160
- 161
- 162
- 163
- 164
- 165
- 166
- 167
- 168
- 169
- 170
- 171
- 172
- 173
- 174
- 175
- 176
- 177
- 178
- 179
- 180
- 181
- 182
- 183
- 184
- 185
- 186
- 187
- 188
- 189
- 190
- 191
- 192
- 193
- 194
- 195
- 196
- 197
- 198
- 199
- 200
- 201
- 202
- 203
- 204
- 205
- 206
- 207
- 208
- 209
- 210
- 211
- 212
- 213
- 214
- 215
- 216
- 217
- 218
- 219
- 220
- 221
- 222
- 223
- 224
- 225
- 226
- 227
- 228
- 229
- 230
- 231
- 232
- 233
- 234
- 235
- 236
- 237
- 238
- 239
- 240
- 241
- 242
- 243
- 244
- 245
- 246
- 247
- 248
- 249
- 250
- 251
- 252
- 253
- 254
- 255
- 256
- 257
- 258
- 259
- 260
- 261
- 262
- 263
- 264
- 265
- 266
- 267
- 268
- 269
- 270
- 271
- 272
- 273
- 274
- 275
- 276
- 277
- 278
- 279
- 280
- 281
- 282
- 283
- 284
- 285
- 286
- 287
- 288
- 289
- 290
- 291
- 292
- 293
- 294
- 295
- 296
- 297
- 298
- 299
- 300
- 301
- 302
- 303
- 304
- 305
- 306
- 307
- 308
- 309
- 310
- 311
- 312
- 313
- 314
- 315
- 316
- 317
- 318
- 319
- 320
- 321
- 322
- 323
- 324
- 325
- 326
- 327
- 328
- 329
- 330
- 331
- 332
- 333
- 334
- 335
- 336
- 337
- 338
- 339
- 340
- 341
- 342
- 343
- 344
- 345
- 346
- 347
- 348
- 349
- 350
- 351
- 352
- 353
- 354
- 355
- 356
- 357
- 358
- 359
- 360
- 361
- 362
- 363
- 364
- 365
- 366
- 367
- 368
- 369
- 370
- 371
- 372
- 373
- 374
- 375
- 376
- 377
- 378
- 379
- 380
- 381
- 382
- 383
- 384
- 385
- 386
- 387
- 388
- 389
- 390
- 391
- 392
- 393
- 394
- 395
- 396
- 397
- 398
- 399
- 400
- 401
- 402
- 403
- 404
- 405
- 406
- 407
- 408
- 409
- 410
- 411
- 412
- 413
- 414
- 415
- 416
- 417
- 418
- 419
- 420
- 421
- 422
- 423
- 424
- 425
- 426
- 427
- 428
- 429
- 430
- 431
- 432
- 433
- 434
- 435
- 436
- 437
- 438
- 439
- 440
- 441
- 442
- 443
- 444
- 445
- 446
- 447
- 448
- 449
- 450
- 451
- 452
- 453
- 454
- 455
- 456
- 457
- 458
- 459
- 460
- 461
- 462
- 463
- 464
- 465
- 466
- 467
- 468
- 469
- 470
- 471
- 472
- 473
- 474
- 475
- 476
- 477
- 478
- 479
- 480
- 481
- 482
- 483
- 484
- 485
- 486
- 487
- 488
- 489
- 490
- 491
- 492
- 493
- 494
- 495
- 496
- 497
- 498
- 499
- 500
- 501
- 502
- 503
- 504
- 505
- 506
- 507
- 508
- 509
- 510
- 511
- 512
- 513
- 514
- 515
- 516
- 517
- 518
- 519
- 520
- 521
- 522
- 523
- 524
- 525
- 526
- 527
- 528
- 529
- 530
- 531
- 532
- 533
- 534
- 535
- 536
- 537
- 538
- 539
- 540
- 541
- 542
- 543
- 544
- 545
- 546
- 547
- 548
- 549
- 550
- 551
- 552
- 553
- 554
- 555
- 556
- 557
- 558
- 559
- 560
- 561
- 562
- 563
- 564
- 565
- 566
- 567
- 568
- 569
- 570
- 571
- 572
- 573
- 574
- 575
- 576
- 577
- 578
- 579
- 580
- 581
- 582
- 583
- 584
- 585
- 1 - 50
- 51 - 100
- 101 - 150
- 151 - 200
- 201 - 250
- 251 - 300
- 301 - 350
- 351 - 400
- 401 - 450
- 451 - 500
- 501 - 550
- 551 - 585
Pages: