§inh §oµn Long viÖc s¾p xÕp l¹i c¸c ph©n ®o¹n ADN trong tÕ bµo soma cïng víi qu¸ tr×nh biÖt hãa c¸c tÕ bµo T tõ c¸c tÕ bµo gèc, còng gièng nh− c¸ch c¸c gen m· hãa kh¸ng thÓ h×nh thµnh trong qu¸ tr×nh biÖt hãa c¸c tÕ bµo lympho B. C¸c chuçi polypeptide thô thÓ kiÓu α vµ β ®−îc m· hãa bëi c¸c ph©n ®o¹n gen ®−îc s¾p xÕp trong c¸c côm locut gièng nh− c¸c ph©n ®o¹n ADN m· hãa cho c¸c chuçi nÆng vµ nhÑ cña kh¸ng thÓ. ë ng−êi, côm locut gen m· hãa cho c¸c chuçi α vµ β cña thô thÓ tÕ bµo T n»m t−¬ng øng trªn c¸c NST sè 14 vµ 7. 9.9. §iÒu hßa sù biÓu hiÖn cña c¸c gen m· hãa kh¸ng thÓ Trong tÕ bµo gèc m¸u, th«ng th−êng c¸c ph©n ®o¹n gen m· hãa kh¸ng thÓ chØ ®−îc phiªn m· ë møc rÊt thÊp, thËm chÝ kh«ng ®−îc phiªn m·. Trong khi ë c¸c t−¬ng bµo, 10 - 20% tæng sè mARN lµ b¶n phiªn m· cña gen m· hãa kh¸ng thÓ. YÕu tè nµo ®· ho¹t hãa c¸c gen m· hãa kh¸ng thÓ trong qu¸ tr×nh biÖt hãa c¸c tÕ bµo lympho? T¹i sao mçi lo¹i t−¬ng bµo chØ s¶n sinh mét lo¹i kh¸ng thÓ ®Æc tr−ng cho kh¸ng nguyªn duy nhÊt? 9.9.1. Lo¹i bá alen lµ c¬ chÕ ®Ó mçi tÕ bµo chØ biÓu hiÖn mét b¶n sao cña gen T¹i sao mçi t−¬ng bµo chØ t¹o ra mét lo¹i kh¸ng thÓ? Chóng ta biÕt r»ng, c¸c tÕ bµo soma ë ®éng vËt cã vó th−êng ë d¹ng l−ìng béi. Chóng mang hai b¶n sao kh¸c nhau cña gen m· hãa c¸c chuçi polypeptide kh¸ng thÓ. Tuy vËy, sau qu¸ tr×nh biÖt hãa c¸c tÕ bµo B, chØ cã mét chuçi nhÑ duy nhÊt vµ chuçi nÆng duy nhÊt ®−îc t¹o ra. HiÖn t−îng nµy ®−îc gäi lµ sù lo¹i bá alen (v× mét trong hai b¶n sao kh«ng biÓu hiÖn). §iÒu nµy x¶y ra nh− thÕ nµo? C¬ chÕ chi tiÕt liªn quan ®Õn hiÖn t−îng nµy ®Õn nay ch−a râ. Nh−ng, mét sè b»ng chøng cho thÊy, ë phÇn lín tr−êng hîp sù t¸i tæ hîp tr×nh tù ADN x¶y ra trªn c¶ hai alen trong mét tÕ bµo (theo c¬ chÕ m« t¶ ë trªn), tuy vËy chØ cã mét kiÓu t¸i tæ hîp (mét alen) ®−îc biÓu hiÖn. C¸c alen kh«ng biÓu hiÖn th−êng chØ ®−îc r¸p nèi mét phÇn hoÆc bÞ c¾t bá ®i mét sè tr×nh tù quan träng. HËu qu¶ cña sù lo¹i bá alen lµ nguyªn lý c¬ b¶n cña viÖc cã thÓ t¹o ra mét l−îng lín kh¸ng thÓ nhÊt ®Þnh cã kh¶ n¨ng g¾n kÕt ®Æc thï víi mét lo¹i epitop nµo ®ã. Kh¸ng thÓ ®−îc t¹o ra nh− vËy ®−îc gäi lµ c¸c kh¸ng thÓ ®¬n dßng. 9.9.2. Sù t¨ng c−êng biÓu hiÖn c¸c gen m· hãa chuçi nÆng ë c¸c m« B»ng c¬ chÕ nµo c¸c gen m· hãa kh¸ng thÓ ®−îc ho¹t hãa (biÓu hiÖn m¹nh) sau qu¸ tr×nh r¸p nèi c¸c ph©n ®o¹n gen? Trong c¶ hai tr−êng hîp c¸c gen m· hãa chuçi nÆng vµ nhÑ, c©u tr¶ lêi lµ sù r¸p nèi c¸c ph©n ®o¹n gen m· hãa kh¸ng thÓ ®· ®−a c¸c promoter n»m ng−îc dßng ph©n ®o¹n LV ®Õn gÇn mét tr×nh tù enhancer (®−îc kÝ hiÖu lµ E trªn c¸c h×nh 9.8 vµ 9.9) ho¹t ®éng m¹nh trong vïng intron gi÷a hai ph©n ®o¹n J vµ C. Mçi ph©n ®o¹n LV chøa mét promoter (kÝ hiÖu P trªn h×nh). Tr−íc khi x¶y ra c¸c qu¸ tr×nh t¸i tæ hîp hÖ gen, c¸c promoter n»m c¸ch xa c¸c enhancer (kÝ hiÖu E trªn h×nh) hµng tr¨m ngµn baz¬ nit¬; lóc nµy, c¸c enhancer kh«ng thÓ ho¹t hãa ®−îc c¸c promoter, nªn c¸c kh¸ng thÓ kh«ng ®−îc tæng hîp. Trong qu¸ tr×nh biÖt hãa tÕ bµo B, sù ghÐp nèi c¸c ph©n ®o¹n gen ®· ®−a c¸c promoter ®Õn gÇn c¸c enhancer (kho¶ng c¸ch < 2 Kb). Lóc nµy, enhancer ho¹t hãa m¹nh c¸c promoter nªn sù tæng hîp c¸c kh¸ng thÓ diÔn ra m¹nh mÏ. §iÓm ®¸ng chó ý lµ ho¹t ®éng cña enhancer th−êng cã tÝnh ®Æc tr−ng m«; nghÜa lµ, nã chØ “ho¹t ®éng” ë c¸c tÕ bµo B vµ t−¬ng bµo, mµ kh«ng ho¹t ®éng ë c¸c tÕ bµo kh¸c. Cã thÓ dù ®o¸n sù ho¹t hãa nµy cÇn mét hoÆc mét sè c¸c yÕu tè phiªn m· chØ ®−îc tæng hîp trong c¸c tÕ bµo cña hÖ miÔn dÞch. 284
Ch−¬ng 10 di truyÒn häc ph©n tö vµ tiÕn hãa N¨m 1859, Charles Darwin c«ng bè t¸c phÈm “Nguån gèc c¸c loµi” vµ ®−îc coi lµ thuyÕt tiÕn hãa quan träng bËc nhÊt ®Õn nay. Trong 6 n¨m (1931 - 1936), Darwin ®· ®i cïng ®oµn th¸m hiÓm cña Beagle vµ thu thËp ®−îc nhiÒu sè liÖu, h×nh ¶nh, mÉu hãa th¹ch cña c¸c loµi ®éng, thùc vËt tõ nhiÒu vïng ®Þa lý kh¸c nhau trªn Tr¸i ®Êt. Sau nµy, «ng sö dông nhiÒu n¨m ®Ó so s¸nh, ph©n tÝch c¸c sè liÖu vµ mÉu vËt. Trªn c¬ së c¸c nghiªn cøu cña m×nh, Darwin lµ ng−êi ®Çu tiªn ®−a ra nhËn ®Þnh r»ng “tÊt c¶ c¸c d¹ng sèng ®· vµ ®ang tån t¹i trªn Tr¸i ®Êt cã lÏ ®Òu xuÊt ph¸t tõ mét tæ tiªn nguyªn thñy nµo ®ã” vµ “mçi loµi sinh vËt kh«ng bÊt biÕn mµ c¸c quÇn thÓ cña chóng biÕn ®æi dÇn dµ liªn tôc qua thêi gian lµ nguyªn nh©n dÉn ®Õn sù h×nh thµnh c¸c loµi míi d−íi t¸c ®éng cña chän läc tù nhiªn”. §ã còng chÝnh lµ nh÷ng néi dung c¬ b¶n cña ThuyÕt tiÕn hãa Darwin. Dï ngay trong ngµy ®Çu c«ng bè, t¸c phÈm cña «ng víi 1250 b¶n in ®· ®−îc b¸n hÕt, nh−ng thùc tÕ lý thuyÕt mµ Darwin ®−a ra lóc ®ã ®· g©y nªn nhiÒu hoµi nghi. §Õn nay, dï ®· trßn 150 n¨m kÓ tõ ngµy t¸c phÈm “Nguån gèc c¸c loµi” ®−îc c«ng bè, thuyÕt tiÕn hãa Darwin vÉn ®−îc xem lµ mét lý thuyÕt c¬ b¶n cña sinh häc hiÖn ®¹i. Tuy vËy, tõ n¨m 1953 khi Watson vµ Crick lµm s¸ng tá cÊu tróc cña vËt chÊt di truyÒn (ADN), c¸c nghiªn cøu di truyÒn häc ph©n tö ®· “bïng næ” vµ bæ sung ngµy cµng ®Çy ®ñ h¬n c¸c c¬ së khoa häc cho thÊy sù tiÕn hãa thùc chÊt b¾t ®Çu tõ cÊp ph©n tö, mµ cô thÓ lµ tõ bªn trong c¸c chuçi xo¾n kÐp ADN (ë hÇu hÕt sinh vËt) vµ ARN (ë mét sè virut). Trong ch−¬ng nµy, chóng ta sÏ ®Ò cËp ®Õn mét sè néi dung c¬ b¶n cña TiÕn hãa ph©n tö. 10.1. Sù gièng nhau trong hÖ gen hÇu hÕt c¸c loµi ®éng vËt ViÖc so s¸nh hÖ gen gi÷a c¸c loµi ®éng vËt trong thêi gian gÇn ®©y ®−a ®Õn mét nhËn ®Þnh chung næi bËt lµ c¸c loµi ®éng vËt cã phÇn lín gen gièng nhau. C¶ ba hÖ gen ®éng vËt cã x−¬ng sèng (§VCXS) ®· ®−îc gi¶i tr×nh tù hoµn chØnh, gåm c¸ nãc (Fugu rubripes), chuét (Mus musculus) vµ ng−êi (Homo sapiens) ®Òu chøa kho¶ng 20.000 – 25.000 gen. Trõ mét vµi ngo¹i lÖ, hÇu hÕt c¸c gen ®−îc t×m thÊy ë ng−êi ®Òu cã “b¶n sao” t−¬ng øng ë chuét. Nãi c¸ch kh¸c, hÇu nh− kh«ng cã mét “ph¸t minh” nµo míi trong kho¶ng 50 triÖu n¨m kÓ tõ khi chuét vµ ng−êi t¸ch li tiÕn hãa tõ tæ tiªn chung. T−¬ng tù nh− vËy, hÖ gen ng−êi vµ c¸ nãc cïng së h÷u mét l−îng lín c¸c gen gièng nhau ®−îc h×nh thµnh tõ kho¶ng 400 triÖu n¨m tr−íc. Mét ®iÒu ng¹c nhiªn lµ sè gen trong hÖ gen ng−êi vµ c¸ nãc gÇn t−¬ng ®−¬ng nhau, trong ®ã 3/4 sè gen cña hai loµi t−¬ng ®ång víi nhau. Sù b¶o thñ trong hÖ gen c¸c loµi §VCXS thËm chÝ cßn më réng ®Õn mét sè loµi kh¸c thuéc ngµnh d©y sèng, nh− søa biÓn Ciona intestinalis. Mét nöa sè gen trong hÖ gen loµi søa nµy ®−îc t×m thÊy ë c¸c loµi §VCXS vµ tæ tiªn chung cña chóng ph©n li kho¶ng 500 triÖu n¨m tr−íc. C¸c nghiªn cøu di truyÒn gÇn ®©y cho thÊy, viÖc t¨ng sè l−îng c¸c gen ë §VCXS chñ yÕu lµ do sù lÆp l¹i cña c¸c gen vèn ®· cã s½n tõ thêi kú xuÊt hiÖn tæ tiªn chung cña §VCXS vµ søa biÓn. Ch¼ng h¹n, søa biÓn cã 6 gen m· hãa yÕu tè t¨ng tr−ëng nguyªn bµo sîi FGF. Mçi gen nµy ®−îc lÆp l¹i trung b×nh kho¶ng 4 lÇn ë c¸c hÖ gen ®éng vËt cã vó nãi chung; trong ®ã, c¸c hÖ gen chuét vµ ng−êi chøa Ýt nhÊt 22 gen FGF. Sù b¶o thñ trong hÖ gen c¸c loµi thuéc ngµnh d©y sèng cßn më réng tíi c¸c ngµnh kh¸c. HÖ gen cña ba loµi ®éng vËt thuéc liªn ngµnh ®éng vËt lét x¸c (Ecdysozoa) lµ giun trßn, ruåi giÊm vµ muçi, ®· ®−îc gi¶i tr×nh tù hoµn chØnh. KÕt qu¶ so s¸nh hÖ gen cña chóng cho thÊy: hÖ gen mçi loµi ®Òu chøa kho¶ng 15.000 gen, t−¬ng ®−¬ng víi hÖ gen cña søa biÓn. 285
§inh §oµn Long Sù t¨ng lªn vÒ sè l−îng gen ë §VCXS t−¬ng ®ång víi c¸c loµi ®éng vËt lét x¸c nªu trªn còng chñ yÕu lµ do sù lÆp l¹i cña c¸c gen chø kh«ng ph¶i do sù h×nh thµnh c¸c gen míi. Mét c©u hái ®Æt ra lµ: b»ng c¸ch nµo sù lÆp l¹i cña c¸c gen l¹i t¹o ®−îc sù ®a d¹ng phong phó ë ®éng vËt nh− chóng ta thÊy hiÖn nay? Cã hai c¸ch gi¶i thÝch ®iÒu nµy: - Theo c¸ch thø nhÊt, gen nguyªn thñy qua nhiÒu lÇn nh©n ®«i (lÆp l¹i) t¹o nªn nhiÒu b¶n sao kh¸c nhau. Sau ®ã, vïng m· hãa cña c¸c b¶n sao nµy bÞ ®ét biÕn, dÉn ®Õn sù thay ®æi ho¹t tÝnh hoÆc ®«i chót vÒ chøc n¨ng gen. Trong nhiÒu tr−êng hîp, kiÓu thay ®æi nµy kh«ng nhÊt thiÕt dÉn ®Õn sù h×nh thµnh c¸c gen cã chøc n¨ng hoµn toµn míi. Thay vµo ®ã, nã th−êng t¹o nªn c¸c lo¹i protein cã chøc n¨ng liªn quan tíi nhau, chØ kh¸c nhau chñ yÕu vÒ ho¹t tÝnh hoÆc ho¹t lùc. - Theo c¸ch thø hai, c¸c gen sau khi ®−îc lÆp l¹i còng bÞ ®ét biÕn nh−ng kh«ng liªn quan ®Õn vïng m· hãa. Thay vµo ®ã, nã ®−îc tæ hîp víi c¸c tr×nh tù ADN ®iÒu hßa míi (hoÆc tr×nh tù ®iÒu hßa cò bÞ biÕn ®æi ®i). Qua ®ã, c¸c b¶n sao kh¸c nhau cña gen ®−îc biÓu hiÖn theo c¸ch míi trong qu¸ tr×nh ph¸t triÓn c¸ thÓ ë mçi loµi. VÝ dô ë gen FGF cña §VCXS nªu trªn, víi 22 b¶n sao cã trong tÕ bµo, c¸ch biÓu hiÖn cña gen nµy ë c¸c loµi §VCXS ®a d¹ng h¬n nhiÒu so víi khi nã chØ cã mét b¶n sao duy nhÊt ë ruåi Drosophila. NÕu nh− ë c¬ quan h« hÊp trong qu¸ tr×nh ph¸t triÓn ph«i cña c¶ ruåi giÊm vµ §VCXS, gen FGF ®Òu ®−îc biÓu hiÖn; th× ë §VCXS, gen nµy cßn ®−îc biÓu hiÖn ë ch©n, trong khi ë ruåi giÊm th× kh«ng. Nh− vËy, ë ®©y, sù “tiÕn hãa” cña c¸c tr×nh tù ®iÒu hßa cã vai trß quyÕt ®Þnh vµ lµm thay ®æi c¸ch biÓu hiÖn cña c¸c b¶n sao kh¸c nhau cña cïng mét gen ë c¸c m«, c¬ quan kh¸c nhau; còng nh− lµ kh¸c nhau ë c¸c loµi kh¸c nhau. Víi hai c¸ch tiÕn hãa nªu trªn, chóng ta thÊy: sù ®a d¹ng sinh häc cã thÓ ®−îc t¹o ra tõ sù lÆp l¹i cña c¸c gen. Theo c¸ch thø nhÊt, chøc n¨ng cña gen ®−îc c¶i biÕn ®«i chót bëi c¸c ®ét biÕn trong vïng m· hãa gen. Cßn theo c¸ch thø hai, c¸c b¶n sao kh¸c nhau cña gen ®−îc biÓu hiÖn theo c¸ch kh¸c nhau ë c¸c c¬ quan kh¸c nhau trªn cïng c¬ thÓ. Víi mét sè gen, ng−êi ta thÊy c¶ hai c¬ chÕ nµy cïng ho¹t ®éng. VÝ dô nh− ë côm gen m· hãa globin cña ng−êi, sù lÆp l¹i cña c¸c gen kh«ng chØ t¹o nªn sù ®a d¹ng vÒ chøc n¨ng cña c¸c lo¹i globin kh¸c nhau, mµ c¸ch biÓu hiÖn cña chóng còng kh¸c nhau. TÊt c¶ c¸c protein do c¸c gen globin m· hãa ®Òu cã chøc n¨ng (trong hemoglobin) liªn kÕt vµ vËn chuyÓn oxy. Tuy nhiªn, mçi lo¹i globin kh¸c nhau vÒ ¸i lùc liªn kÕt víi oxy vµ chóng ®−îc biÓu hiÖn vµo c¸c giai ®o¹n kh¸c nhau cña qu¸ tr×nh ph¸t triÓn c¬ thÓ. H×nh 10.1 minh Gen β C¸c loµi c¸ mËp L−ìng c− vµ chim β (c¸ mËp) §éng vËt cã x−¬ng sèng Thó ®¬n huyÖt β (gµ) gen ε gen γ β (r¸i c¸) ε (ng−êi) §éng vËt Thó cã gen “γ” γ (ng−êi) cã vó guèc \"γ\" (bß) β (bß) Thó cã Linh tr−ëng gen δ-globin δ (ng−êi) nhau thai β (ng−êi) β (khØ rezut) H×nh 10.1. Sù lÆp l¹i c¸c gen thuéc hä gen β-globin trong qu¸ tr×nh tiÕn hãa ë ®éng vËt cã x−¬ng sèng (theo Griffiths et al, 2000, An Introduction to genetic analysis, tr.787) 286
Ch−¬ng 10. Di truyÒn häc ph©n tö vµ tiÕn ho¸ häa sù tiÕn hãa c¸c gen β-globin. ë ng−êi, bèn gen cã liªn quan ®Õn β-globin ®−îc h×nh thµnh theo c¬ chÕ lÆp l¹i, gåm ε-, γ-, δ- vµ β-globin. Bèn gen nµy kh¸c nhau ®«i chót vÒ c¸ch biÓu hiÖn vµ cÊu tróc cña protein mµ chóng m· hãa. C¸c chuçi ε- vµ γ-globin cã ¸i lùc víi oxy lín h¬n δ vµ β. Nh÷ng chuçi nµy ®−îc tæng hîp vµ sö dông trong giai ®o¹n bµo thai (lµ lóc mµ chøc n¨ng phæi ch−a ®Çy ®ñ vµ sù hÊp thu khÝ oxy cña bµo thai chñ yÕu qua m¸u cña mÑ). C¸c chuçi δ- vµ β-globin liªn kÕt víi oxy víi ¸i lùc thÊp h¬n, ®−îc tæng hîp ë giai ®o¹n s¬ sinh vµ tr−ëng thµnh. Nh− vËy, víi c¸c gen m· hãa globin, sù “tiÕn hãa” trong tr×nh tù m· hãa còng nh− trong tr×nh tù ®iÒu hßa cña c¸c gen ®Òu gãp phÇn vµo sù chuyªn hãa cña c¸c lo¹i chuçi globin kh¸c nhau ®−îc t¹o ra ë §VCXS. Nh−ng, cÇn kh¼ng ®Þnh r»ng sù tiÕn hãa cña c¸c sinh vËt nãi chung ®Ó cã ®−îc sù ®a d¹ng nh− ngµy nay kh«ng nhÊt thiÕt ph¶i th«ng qua sù lÆp l¹i cña c¸c gen. Cô thÓ lµ, trong tÊt c¶ c¸c c¬ thÓ sèng, vi khuÈn cã hÖ gen ®a d¹ng nhÊt vµ chóng cã kh¶ n¨ng sèng trong nh÷ng ®iÒu kiÖn m«i tr−êng rÊt kh¸c nhau. C¸c vi khuÈn ®¬n gi¶n nhÊt h×nh thµnh c¸ch ®©y kho¶ng 3 tØ n¨m, trong khi c¸c loµi ®éng vËt cæ x−a nhÊt h×nh thµnh c¸ch ®©y kho¶ng trªn d−íi 500 triÖu n¨m. §Æc ®iÓm tiÕn hãa nhanh cña hÖ gen vi khuÈn, cïng víi lÞch sö tiÕn hãa l©u dµi cña chóng ®· gióp chóng cã ®−îc nhiÒu c¬ chÕ trao ®æi chÊt kh¸c nhau. Nhê vËy, chóng sèng ®−îc ë nhiÒu m«i tr−êng sèng rÊt kh¸c nhau. Mét sè vi khuÈn cã kh¶ sèng ®−îc trong m«i tr−êng nhiÖt ®é cao ë gÇn c¸c miÖng nói löa n»m s©u d−íi ®¸y biÓn, mét sè kh¸c cã thÓ sèng ë c¸c suèi n−íc nãng cã hµm l−îng l−u huúnh (S) cao. Sè l−îng gen vµ lo¹i gen (chuyªn hãa vÒ chøc n¨ng) trong hÖ gen cña c¸c loµi vi khuÈn kh¸c nhau lµ rÊt kh¸c nhau. C¸c vi khuÈn ®¬n gi¶n nhÊt (mycoplasma) chØ cã kho¶ng 500 gen, trong khi nh÷ng vi khuÈn phøc t¹p nhÊt (nh− Streptomyces) cã trªn 7000 gen. Nh− vËy, sù kh¸c biÖt vÒ sè l−îng gen trong hÖ gen c¸c loµi vi khuÈn lªn ®Õn hµng chôc lÇn. §iÒu nµy lµ kh¸c víi c¸c hÖ gen ®éng vËt vèn cã sè gen kh¸c biÖt tèi ®a chØ kho¶ng 2 lÇn. ë vi khuÈn, thËm chÝ c¸c loµi cã quan hÖ gÇn còng cã møc ®é kh¸c biÖt lín vÒ hÖ gen. Ch¼ng h¹n, vi khuÈn Staphococcus vµ E. coli t¸ch ra tõ tæ tiªn chung c¸ch ®©y kho¶ng 50 triÖu n¨m, tøc lµ t−¬ng ®−¬ng víi thêi gian ph©n li gi÷a tæ tiªn cña ng−êi vµ chuét. Nh−ng, c¸c gen m· hãa protein cña hai vi khuÈn nµy chØ gièng nhau 75%, cßn 25% sè gen cßn l¹i cña chóng lµ ®Æc thï vµ kh«ng cã ë loµi kia. Nh− vËy, nÕu nh− ®éng vËt vèn cã m«i tr−êng sèng h¹n chÕ vµ c¸c con ®−êng trao ®æi chÊt gièng nhau vµ sù ®a d¹ng kiÓu h×nh cña chóng cã xu h−íng phô thuéc vµo sù lÆp l¹i vµ thay ®æi ho¹t tÝnh (chø kh«ng ph¶i chøc n¨ng) cña c¸c “tæ hîp” gen vèn cã; th×, ng−îc l¹i, hÖ gen cña c¸c loµi vi khuÈn cã møc ®é t−¬ng ®ång rÊt thÊp. D−êng nh− ®Ó tån t¹i vµ ph¸t triÓn ®−îc trong c¸c m«i tr−êng sèng kh¸c nhau, sù h×nh thµnh c¸c gen míi (vÒ chøc n¨ng) gi÷ vai trß quyÕt ®Þnh. 10.2. C¸c con ®−êng thay ®æi sù biÓu hiÖn cña gen trong tiÕn hãa C¸c gen ®−îc thay ®æi c¸ch ®iÒu hßa biÓu hiÖn trong qu¸ tr×nh tiÕn hãa nh− thÕ nµo? ë ch−¬ng 5, chóng ta ®· biÕt, hÖ gen cña mäi sinh vËt ®Òu chøa c¸c gen m· hãa protein cã vai trß ®iÒu khiÓn sù biÓu hiÖn cña c¸c gen kh¸c trong hÖ gen, gäi lµ c¸c gen ®iÒu hßa. PhÇn lín c¸c protein do c¸c gen nµy m· hãa lµ c¸c yÕu tè ®iÒu hßa phiªn m·, nh−ng còng cã mét sè protein t¸c ®éng vµo c¸c b−íc kh¸c cña qu¸ tr×nh biÓu hiÖn gen (tõ phiªn m· ®Õn sau dÞch m·). Mét nhãm gen ®iÒu hßa ®−îc t×m thÊy gÇn ®©y ®−îc gäi lµ “c¸c gen quy ®Þnh kiÓu biÓu hiÖn”. Sù thay ®æi vÒ ho¹t tÝnh còng nh− kiÓu biÓu hiÖn cña nh÷ng gen nµy trong qu¸ tr×nh tiÕn hãa ®· dÉn ®Õn sù thay ®æi c¸c ®Æc ®iÓm ph¸t sinh h×nh th¸i vµ ph¸t triÓn ë ®éng vËt. Chøc n¨ng ®Æc thï cña nh÷ng gen thuéc nhãm nµy lµ ®iÒu khiÓn sù h×nh thµnh chÝnh x¸c c¸c cÊu tróc trong qu¸ tr×nh ph¸t triÓn c¬ thÓ. Nªn, nÕu nh÷ng gen nµy ho¹t ®éng kh«ng chÝnh x¸c, th× c¸c cÊu tróc c¬ thÓ cã thÓ ®−îc h×nh thµnh sai vÞ trÝ. VÝ dô nh− ë ruåi giÊm, mét gen quy ®Þnh kiÓu biÓu hiÖn kÝ hiÖu lµ Pax6 287
§inh §oµn Long khi kh«ng biÓu hiÖn ®óng, dÉn ®Õn “®ét biÕn” h×nh thµnh m¾t ë ch©n. Trong phÇn sau, chóng ta sÏ thÊy mét sè vÝ dô kh¸c n÷a. Mét hÖ gen ®éng vËt trung b×nh chøa kho¶ng 1000 gen m· hãa c¸c protein ®iÒu hßa kh¸c nhau. §Õn nay, ch−a cã sè liÖu vÒ sè l−îng c¸c “gen x¸c ®Þnh kiÓu biÓu hiÖn” cã mÆt trong mçi hÖ gen. Nh−ng, chóng ®−îc xÕp lµ mét nhãm nhá cña c¸c gen ®iÒu hßa. §Ó x¸c ®Þnh ®−îc sè l−îng c¸c “gen quy ®Þnh kiÓu biÓu hiÖn”, cã lÏ ph¶i t¹o ra c¸c ®ét biÕn mang c¸c gen ®iÒu hßa biÓu hiÖn sai, råi theo dâi c¸c bÊt th−êng xuÊt hiÖn trong qu¸ tr×nh ph¸t sinh h×nh th¸i cña ®éng vËt. HiÖn nay, ng−êi ta −íc ®o¸n cã kho¶ng 10% gen ®iÒu hßa ë ®éng vËt cã thÓ lµ c¸c “gen quy ®Þnh kiÓu biÓu hiÖn”. NghÜa lµ, mét hÖ gen ®éng vËt trung b×nh sÏ cã kho¶ng 100 gen cã chøc n¨ng quy ®Þnh kiÓu biÓu hiÖn cña nh÷ng gen kh¸c trong hÖ gen. ë phÇn tiÕp theo, chóng ta sÏ thÊy b»ng c¸ch nµo sù thay ®æi ho¹t tÝnh vµ c¸ch huy ®éng c¸c “gen quy ®Þnh kiÓu biÓu hiÖn” l¹i cã thÓ t¹o ra sù ®a d¹ng sinh häc trong qu¸ tr×nh tiÕn hãa. Nh×n chung, cã ba c¸ch c¬ b¶n lµm thay ®æi ho¹t tÝnh cña gen quy ®Þnh kiÓu biÓu hiÖn: 1) B¶n th©n mét “gen quy ®Þnh kiÓu biÓu hiÖn” cã thÓ ®−îc biÓu hiÖn theo mét c¸ch míi. Sù thay ®æi nµy dÉn ®Õn viÖc nh÷ng gen kh¸c mµ nã ®iÒu khiÓn (gäi lµ c¸c gen ®Ých) còng sÏ biÓu hiÖn theo c¸c c¸ch míi. 2) C¸c protein ®iÒu hßa ®−îc c¸c “gen quy ®Þnh kiÓu biÓu hiÖn” m· hãa cã thÓ cã chøc n¨ng míi. Ch¼ng h¹n, miÒn ho¹t hãa phiªn m· cña mét yÕu tè phiªn m· trë thµnh mét miÒn øc chÕ phiªn m·. V× vËy, mét protein ®iÒu hßa vèn lµ yÕu tè ho¹t hãa phiªn m· cña mét nhãm gen trë thµnh yÕu tè øc chÕ phiªn m· cña chÝnh nhãm gen ®ã. Mét ®iÓm ®¸ng chó ý lµ sù thay ®æi ë ®©y liªn quan ®Õn chøc n¨ng cña protein ®iÒu hßa, nh−ng hËu qu¶ g©y ra ®èi víi qu¸ tr×nh tiÕn hãa l¹i lµ sù thay ®æi kiÓu biÓu hiÖn cña c¸c gen ®Ých. 3) C¸c gen ®Ých cña mét “gen quy ®Þnh kiÓu biÓu hiÖn” cã thÓ “nhËn” mét tr×nh tù (ADN) ®iÒu hßa míi, dÉn ®Õn viÖc nã ®−îc ®iÒu khiÓn bëi mét gen ®iÒu hßa míi. B»ng c¸ch nµy, kiÓu biÓu hiÖn cña gen ®Ých còng thay ®æi. 10.2.1. §ét biÕn “gen quy ®Þnh kiÓu biÓu hiÖn” lµm thay ®æi h×nh th¸i ®éng vËt 10.2.1.1. Sù thay ®æi kiÓu biÓu hiÖn cña gen Pax6 g©y nªn sù h×nh thµnh m¾t sai vÞ trÝ “Gen quy ®Þnh kiÓu biÓu hiÖn” ®−îc biÕt ®Õn réng r·i nhÊt cã lÏ lµ gen Pax6. Gen nµy ®iÒu khiÓn sù h×nh thµnh vµ ph¸t triÓn cña m¾t ë phÇn lín (còng cã thÓ lµ tÊt c¶) c¸c loµi ®éng vËt. Sù thay ®æi vÒ kiÓu biÓu hiÖn cña gen Pax6 cã thÓ lµ nguyªn nh©n c¬ b¶n dÉn ®Õn sù ®a d¹ng vÒ kiÓu h×nh m¾t gi÷a c¸c loµi ®éng vËt kh¸c nhau. Th«ng th−êng gen Pax6 chØ ®−îc biÓu hiÖn trong m« m¾t trong qu¸ tr×nh ph¸t triÓn cña ph«i. Nh−ng, khi ®−îc biÓu hiÖn ë mét m« kh¸c, gen Pax6 cã thÓ lµm h×nh thµnh “m¾t phô” ë vÞ trÝ m« bÊt th−êng (h×nh 10.2). Thùc nghiÖm ë ruåi giÊm cho thÊy sù thay ®æi biÓu hiÖn gen Pax6 cã thÓ dÉn ®Õn sù h×nh thµnh “m¾t” ë c¸nh vµ ch©n. §iÒu nµy chØ ra r»ng, cã thÓ sù thay ®æi biÓu hiÖn cña gen Pax6 ®· dÉn ®Õn viÖc m¾t ®−îc h×nh thµnh t¹i c¸c vÞ trÝ kh¸c nhau ë c¸c ®éng vËt kh¸c nhau. HÇu hÕt c¸c ®éng vËt ®Òu cã mét cÆp m¾t n»m trong hép sä. Nh−ng sù thay ®æi biÓu hiÖn gen Pax6 cã thÓ lµ nguyªn nh©n dÉn ®Õn sù h×nh thµnh “®iÓm m¾t” ë phÇn ch©n ®Çu cña èc. Sù thay ®æi kiÓu biÓu hiÖn cña gen Pax6 d−êng nh− kh«ng lµm thay ®æi chøc n¨ng cña protein Pax6, mµ chñ yÕu t¹o nªn sù ®a d¹ng vÒ vÞ trÝ h×nh thµnh m¾t ë c¸c loµi kh¸c nhau. §iÒu nµy ®−îc chøng minh bëi nghiªn cøu chuyÓn gen Pax6 tõ mùc èng vµo ruåi giÊm ®· t¹o nªn c¸ thÓ ruåi giÊm cã “m¾t phô” ë c¸nh vµ ch©n gièng víi c¸ thÓ ruåi giÊm 288
Ch−¬ng 10. Di truyÒn häc ph©n tö vµ tiÕn ho¸ cã gen Pax6 cña chÝnh nã ®−îc biÓu hiÖn bÊt th−êng ë nh÷ng m« nµy, dï r»ng hai protein Pax6 cña mùc èng vµ ruåi giÊm chØ cã 30% tr×nh tù axit amin gièng nhau. (a) §Üa mÇm m¾t §Üa mÇm ch©n (b) Êu trïng Drosophila Drosophila tr−ëng thµnh C¸ thÓ b×nh th−êng (kiÓu d¹i) C¸ thÓ mang gen \"h×nh thµnh m¾t\" Pax6 ®−îc biÓu hiÖn ë tÕ bµo tiÒn ph«i h×nh thµnh ch©n TÕ bµo tiÒn ph«i m¾t TÕ bµo tiÒn ph«i ch©n TÕ bµo tiÒn ph«i ch©n cã gen Pax6 ®−îc biÓu hiÖn “bÊt th−êng” H×nh 10.2. Sù biÓu hiÖn gen Pax6 (cßn gäi lµ gen ey) vµ h×nh thµnh “m¾t phô” ë ruåi giÊm. (a) Sù h×nh thµnh m¾t ë ruåi kiÓu d¹i (b×nh th−êng); (b) \"M¾t phô\" bÊt th−êng h×nh thµnh ë ch©n do sù biÓu hiÖn sai vÞ trÞ cña gen Pax6 (theo Albert B. et al, 2002, Molecular Biology of the Cell, tr.426) 10.2.1.2. Sù thay ®æi kiÓu biÓu hiÖn cña gen Antp lµm \"¨ngten\" chuyÓn thµnh \"ch©n\" Mét gen quy ®Þnh kiÓu biÓu hiÖn thø hai ®−îc t×m thÊy ë ruåi giÊm lµ gen Antp. Gen nµy ®iÒu khiÓn sù ph¸t triÓn phÇn th©n gi÷a cña c«n trïng trong qu¸ tr×nh ph¸t triÓn ph«i. Tõ phÇn th©n gi÷a nµy h×nh thµnh nªn mét cÆp ch©n cã h×nh th¸i kh¸c biÖt víi c¸c ch©n tr−íc vµ ch©n sau. Gen Antp m· hãa mét protein ®iÒu hßa b×nh th−êng chØ ®−îc biÓu hiÖn ë phÇn th©n gi÷a, nh−ng kh«ng ®−îc biÓu hiÖn ë phÇn ®Çu. Nh−ng nÕu mét ®ét biÕn tréi g©y ra bëi ®¶o ®o¹n NST ®−a tr×nh tù m· hãa protein Antp tíi gÇn mét tr×nh tù ADN ®iÒu hßa míi vèn cã vai trß ®iÒu hßa biÓu hiÖn c¸c gen ë phÇn ®Çu (bao gåm c¶ ¨ngten) th× ch©n sÏ h×nh thµnh thay cho ¨ng ten t¹i vÞ trÝ ¨ngten. 10.2.1.3. ChuyÓn ®o¹n t−¬ng hç gi÷a hai gen ftz vµ Antp cho thÊy vai trß quan träng vÒ chøc n¨ng cña protein ®iÒu hßa §Ó t¹o ra sù ®a d¹ng h×nh th¸i, c¸c “gen quy ®Þnh kiÓu biÓu hiÖn” kh«ng nhÊt thiÕt ph¶i ho¹t ®éng t¹i c¸c vÞ trÝ kh¸c nhau trong c¬ thÓ. Mét c¬ chÕ thø hai t¹o nªn sù ®a d¹ng trong qu¸ tr×nh tiÕn hãa lµ nh÷ng thay ®æi vÒ tr×nh tù axit amin vµ chøc n¨ng cña c¸c protein ®iÒu hßa do nh÷ng gen nµy m· hãa. ë ®©y, chóng ta sÏ xem vÝ dô vÒ hai “gen quy ®Þnh kiÓu biÓu hiÖn” cã liªn quan víi nhau ë ruåi giÊm lµ ftz (®iÒu khiÓn sù ph©n ®èt) vµ Antp (®iÒu khiÓn sù h×nh thµnh c¸c c¬ quan phÇn th©n gi÷a). Hai gen nµy h×nh thµnh vµ ph©n li xuÊt ph¸t tõ mét sù kiÖn “nh©n ®«i” gen tæ tiªn x¶y ra tr−íc khi cã sù t¸ch li tiÕn hãa gi÷a c¸c loµi gi¸p x¸c vµ c«n trïng kho¶ng 400 triÖu n¨m tr−íc. Hai protein t−¬ng øng ®−îc c¸c gen nµy m· hãa (lµ 289
§inh §oµn Long Ftz vµ Antp) cã liªn quan víi nhau vµ miÒn liªn kÕt ADN cña chóng rÊt gièng nhau. Tuy vËy, Ftz vµ Antp l¹i nhËn ra c¸c ®o¹n tr×nh tù ADN kh¸c nhau trong hÖ gen, v× khi ho¹t ®éng, chóng t¹o “dÞ phøc kÐp” víi hai lo¹i protein kh¸c nhau. Mèi t−¬ng t¸c protein – protein ®−îc quy ®Þnh bëi mét mÉu h×nh (motif) peptide ng¾n n»m ngoµi miÒn liªn kÕt ADN cña hai protein. Antp chøa motif gåm 4 axit amin lµ YPWM quyÕt ®Þnh sù t¹o “dÞ phøc kÐp” cña protein nµy víi mét protein ®iÒu hßa phæ biÕn gäi lµ Exd. Ng−îc l¹i, Ftz mang mét motif gåm 5 axit amin lµ LRALL quyÕt ®Þnh sù t−¬ng t¸c cña protein nµy víi mét protein ®iÒu hßa phæ biÕn kh¸c cã tªn lµ FtzF1. DÞ phøc kÐp Ftz-FtzF1 nhËn ra tr×nh tù ADN kh¸c víi Antp-Exd. V× vËy, Ftz vµ Antp ®iÓu khiÓn sù biÓu hiÖn cña c¸c gen ®Ých kh¸c nhau. Cã mét ®iÒu thó vÞ lµ gen ftz ë mét sè loµi c«n trïng cæ x−a (nh− loµi mät ngò cèc Tribolium castaneum) cã ®ång thêi hai motif LRALL vµ YPWM. §iÒu nµy cho thÊy Ftz cña Tribolium cã ®Æc ®iÓm “lai”. Trong thùc tÕ, khi ng−êi ta chuyÓn gen Ftz cña Tribolium vµo ruåi giÊm, th× c¸ thÓ biÕn ®æi gen ®ång thêi bÞ háng c¶ qu¸ tr×nh ph©n ®èt lÉn sù ph¸t triÓn phÇn th©n gi÷a. 10.2.1.4. BiÕn ®æi nhá trong tr×nh tù t¨ng c−êng cã thÓ t¹o ra kiÓu biÓu hiÖn gen míi Mét c¬ chÕ thø ba t¹o nªn sù ®a d¹ng trong qu¸ tr×nh tiÕn hãa lµ nh÷ng thay ®æi trong c¸c enhancer (tr×nh tù t¨ng c−êng) cña c¸c gen ®Ých ®−îc ®iÒu khiÓn bëi c¸c “gen quy ®Þnh kiÓu biÓu hiÖn”. Trong tr−êng hîp nµy, hoÆc lµ gen ®Ých kh«ng ®−îc biÓu hiÖn b×nh th−êng, hoÆc lµ chøc n¨ng (hoÆc ho¹t tÝnh) cña protein ®iÒu hßa bÞ thay ®æi. C¸c nghiªn cøu trªn mét “gen quy ®Þnh kiÓu biÓu hiÖn” ë ruåi giÊm lµ Ubx ®ång thêi minh häa cho ba c¬ chÕ tiÕn hãa: c¸c gen ®Ých cã kiÓu biÓu hiÖn míi khi gen Ubx cã sù thay ®æi kiÓu biÓu hiÖn, hoÆc s¶n phÈm protein mµ gen nµy m· hãa thay ®æi, hoÆc cã sù thay ®æi trong tr×nh tù enhancer cña nã. Gen Ubx b×nh th−êng m· hãa cho mét protein ®iÒu hßa ®iÒu khiÓn sù ph¸t triÓn ®èt th©n thø ba trong qu¸ tr×nh ph¸t triÓn ph«i cña ruåi giÊm. Gen nµy øc chÕ ®Æc hiÖu sù biÓu hiÖn cña c¸c gen cÇn cho sù ph¸t triÓn ®èt th©n thø hai (trong ®ã cã Antp). §Ó biÖt hãa ®èt th©n thø ba, Ubx øc chÕ sù biÓu hiÖn cña Antp ë ®èt th©n nµy. §ét biÕn thiÕu protein øc chÕ Ubx lµm gen Antp ®−îc biÓu hiÖn m¹nh ë c¶ ®èt th©n thø hai vµ ®èt th©n (a) (b) thø ba, dÉn ®Õn sù h×nh thµnh hai ®èt th©n gièng nhau. 10.2.1.5. Sù biÓu hiÖn bÊt th−êng cña gen H×nh 10.3. ThÓ ®ét biÕn Ubx cã ®èt th©n thø hai (T2) Ubx lµm thay ®æi h×nh th¸i ë ruåi giÊm ph¸t triÓn gièng ®èt th©n thø ba (T3). (a) Ruåi kiÓu d¹i cã mét ®«i c¸nh thËt (®èt T2) vµ mét ®«i c¸nh phô ë phÝa ë ruåi giÊm tr−ëng thµnh b×nh sau (®èt T3); (b) Ruåi cã gen Ubx kh«ng biÓu hiÖn ë ®èt th−êng, ®èt th©n thø hai (T2) mang mét T3 h×nh thµnh hai ®«i c¸nh thËt (ë c¶ hai ®èt T2,T3). ®«i ch©n vµ mét ®«i c¸nh, trong khi ®èt th©n thø ba (T3) chØ mang mét ®«i ch©n (a) (b) vµ mét ®«i c¸nh phô. C¸nh phô cã kÝch th−íc nhá h¬n nhiÒu so víi c¸nh thËt vµ H×nh 10.4. BiÓu hiÖn sai vÞ trÝ cña gen Ubx dÉn ®Õn chØ cã vai trß gi÷ th¨ng b»ng khi bay thÓ ®ét biÕn mÊt c¸nh thËt ë ruåi giÊm. (a) C¸ thÓ kiÓu (h×nh 10.3). §ét biÕn gen Ubx dÉn ®Õn d¹i cã gen Ubx chØ biÓu hiÖn ë ®èt T3; (b) C¸ thÓ mang thÓ ®ét biÕn cã kiÓu h×nh gåm 4 c¸nh ®ét biÕn Cbx \"ph¸ háng\" vïng ®iÒu hßa cña gen Ubx, thËt. KiÓu h×nh ®ét biÕn nµy mét phÇn do lµm gen nµy biÓu hiÖn sai vÞ trÝ (ë c¶ hai ®èt T2 vµ T3), sù biÓu hiÖn bÊt th−êng cña gen Antp. dÉn ®Õn sù h×nh thµnh nªn hai ®«i c¸nh phô. Gen Ubx ®iÒu khiÓn sù h×nh thµnh c¸nh phô th«ng qua øc chÕ mét sè gen ®Ých thiÕt yÕu cho sù ph¸t triÓn cña c¸nh thËt, bao gåm gen Antp. 290
Ch−¬ng 10. Di truyÒn häc ph©n tö vµ tiÕn ho¸ Sù biÓu hiÖn cña gen Ubx ë ®èt th©n T3 phô thuéc vµo mét tr×nh tù ®iÒu hßa cã kÝch th−íc kho¶ng 80 kb. Cã mét ®ét biÕn gäi lµ Cbx lµm háng tr×nh tù ®iÒu hßa nµy cña gen Ubx nh−ng kh«ng lµm thay ®æi vïng m· hãa protein Ubx. §ét biÕn Cbx lµm gen Ubx biÓu hiÖn sai vÞ trÝ ë ®èt th©n T2, ngoµi vÞ trÝ biÓu hiÖn b×nh th−êng cña nã lµ ë ®èt th©n T3 (h×nh 10.4). Lóc nµy, gen Ubx sÏ øc chÕ sù biÓu hiÖn cña gen Antp còng nh− c¸c gen kh¸c cÇn cho sù ph¸t triÓn b×nh th−êng cña ®èt th©n T2. KÕt qu¶ lµ ®èt th©n T2 trë thµnh mét “b¶n sao” cña ®èt th©n T3. ThÓ ®ét biÕn nµy gåm tÊt c¶ c¸c c¸nh ®Òu lµ c¸nh phô. 10.2.1.6. Sù thay ®æi chøc n¨ng protein Ubx ¶nh h−ëng ®Õn h×nh th¸i ph«i ruåi giÊm Trªn ®©y, chóng ta ®· nãi ®Õn chøc n¨ng cña protein Ubx nh− yÕu tè phiªn m· øc chÕ sù biÓu hiÖn cña gen Antp vµ c¸c “gen ®èt th©n thø hai” trong qu¸ tr×nh ph¸t triÓn cña ®èt th©n thø ba. Nh−ng theo mét c¬ chÕ kh¸c, mét ®ét biÕn chuyÓn hãa Ubx thµnh mét yÕu tè ho¹t hãa phiªn m· nh÷ng “gen ®èt th©n thø hai” ®· lµm gen nµy cã chøc n¨ng gièng gen Antp lµ thóc ®Èy sù ph¸t triÓn cña ®èt th©n thø hai. VÝ dô nµy cho thÊy, sù thay ®æi chøc n¨ng protein ®iÒu hßa cã thÓ trùc tiÕp lµm thay ®æi kiÓu h×nh. Protein øc chÕ Ubx ®−îc chuyÓn thµnh protein ho¹t hãa b»ng c¸ch kÕt hîp miÒn liªn kÕt ADN cña gen Ubx víi miÒn ho¹t hãa cña protein virut VP16. §o¹n gen m· hãa protein øc chÕ Ubx b×nh th−êng n»m ngoµi miÒn liªn kÕt ADN cña Ubx vµ kh«ng n»m trong ®o¹n kÕt hîp Ubx-VP16. Sù biÓu hiÖn bÊt th−êng cña protein “dung hîp” Ubx- VP16 lµm cho tÊt c¶ c¸c ®èt th©n ®Òu ph¸t triÓn gièng ®èt th©n thø hai, chø kh«ng gièng ®èt th©n thø ba nh− trong tr−êng hîp gen Ubx biÓu hiÖn bÊt th−êng. Nh− vËy, chøc n¨ng cña protein dung hîp Ubx-VP16 gièng protein Antp, chø kh«ng gièng Ubx. 10.2.1.7. Sù thay ®æi tr×nh tù t¨ng c−êng cña gen Ubx lµm thay ®æi kiÓu biÓu hiÖn gen Gièng víi protein Antp (môc 10.2.1.3), (a) VÞ trÝ liªn kÕt VÞ trÝ liªn kÕt Ubx chøa mét motif gåm 4 axit amin YPMM protein Exd protein HOX lµ vÞ trÝ t−¬ng t¸c víi Exd. Protein Antp liªn kÕt víi ADN d−íi d¹ng dÞ phøc kÐp Antp- TGAT NNATKR Exd. T−¬ng tù nh− vËy, Ubx liªn kÕt ADN ë ADN d¹ng dÞ phøc kÐp Ubx-Exd. NhiÒu protein ®iÒu hßa liªn kÕt ADN th«ng qua sù t¹o phøc (b) kÐp víi protein Exd. Phøc hÖ nµy (gäi t¾t lµ Exd Ubx Exd-HOX) liªn kÕt vµo mét tr×nh tù nhËn biÕt “lai ghÐp”, nghÜa lµ Exd liªn kÕt vµo mét TGAT TT ATKR bªn cña tr×nh tù nhËn biÕt (TGAT), cßn c¸c protein HOX (nh− Ubx) liªn kÕt vµo bªn liÒn ADN kÒ cßn l¹i cña tr×nh tù nhËn biÕt (cã tr×nh tù A-T-T/G-A/G, xem h×nh 10.5). Hai nöa cña (c) Exd Labial tr×nh tù nhËn biÕt (cßn gäi lµ tr×nh tù liªn T G A T GG A T K R øng) th−êng t¸ch biÖt nhau bëi 2 nucleotide. Hai nucleotide nµy cã vai trß x¸c ®Þnh phøc ADN hÖ Exd-HOX nµo ®−îc −u tiªn liªn kÕt. VÝ dô, phøc hÖ Exd-Ubx −u tiªn tr×nh tù liªn H×nh 10.5. Sù ho¸n ®æi vÞ trÝ liªn kÕt cña c¸c øng cã vÞ trÝ trung t©m T-T, cßn phøc hÖ protein Ubx vµ Labial. HÇu hÕt cña protein HOX Exd-Labial −u tiªn vÞ trÝ trung t©m lµ G-G. ®Òu chøa mét miÒn motif YPWM t−¬ng t¸c víi Exd. §iÒu nµy cho thÊy sù thay ®æi trong tr×nh tù Mçi tiÓu phÇn cña \"dÞ phøc kÐp\" Exd-HOX nhËn biÕt t¨ng c−êng vèn ®−îc ®iÒu khiÓn bëi mét mét bªn cña tr×nh tù liªn øng. Trong ®ã, Exd liªn kÕt protein HOX nµy cã thÓ trë thµnh tr×nh tù vµo tr×nh tù TGAT, cßn protein HOX liªn kÕt vµo ®iÒu hßa ®−îc ®iÒu khiÓn bëi mét protein ATKR (K = T/G; R = A/G). HOX ®ång thêi cã liªn kÕt thø cÊp vµo 2 nucleotide trung t©m (NN). Hai nucleotide nµy x¸c ®Þnh tÝnh ®Æc tr−ng cña protein HOX thuéc \"dÞ phøc kÐp\". VÝ dô: Exd-Ubx liªn kÕt khi tr×nh tù liªn øng cã hai nucleotide trung t©m lµ TT, cßn Exd-Labial liªn kÕt khi hai nucleotide nµy lµ GG. 291
§inh §oµn Long HOX kh¸c. Nguyªn lý nµy gióp gi¶i thÝch sù ®a d¹ng vÒ h×nh th¸i c¸nh ë ruåi giÊm vµ c¸c loµi b−ím (®−îc nªu ë môc d−íi ®©y). Nh÷ng vÝ dô trªn còng cho thÊy sù thay ®æi chøc n¨ng, hay sù biÓu hiÖn cña protein Ubx, hoÆc tr×nh tù enhancer ®Ých cña nã ®Òu cã thÓ trùc tiÕp dÉn ®Õn nh÷ng thay ®æi lín vÒ h×nh th¸i ph¸t triÓn ph«i ë ruåi giÊm. 10.2.2. Sù biÕn ®æi h×nh th¸i ë c¸c loµi gi¸p x¸c vµ c«n trïng 10.2.2.1. Sù ®a d¹ng h×nh th¸i ë ®éng vËt ch©n ®èt C¸c ®éng vËt ch©n ®èt gåm 5 nhãm chÝnh: bä ba thïy (®· tuyÖt chñng), bä s¸u ch©n (c«n trïng), gi¸p x¸c (t«m, cua,...), bä nhiÒu ch©n (nh− rÕt) vµ c¸c loµi ch©n k×m (nh− cua mãng ngùa, nhÖn, bä c¹p,...). C¸c loµi ch©n ®èt ®· thÝch nghi “thµnh c«ng” trong suèt qu¸ tr×nh tiÕn hãa l©u dµi mét phÇn lµ nhê cÊu tróc kiÓu m«®un cña chóng. C¬ thÓ cña chóng ®−îc cÊu tróc tõ c¸c ®èt th©n lÆp l¹i nh−ng cã sù biÕn ®æi d−êng nh− kh«ng giíi h¹n. Mét sè ®èt th©n mang c¸nh, trong khi c¸c ®èt th©n kh¸c mang ¨ngten, ch©n, hµm, hay c¬ quan giao phèi. §Õn nay, hiÓu biÕt vÒ sù tiÕn hãa dÉn ®Õn sù ®a d¹ng cña c¸c ®éng vËt ch©n ®èt lµ râ h¬n bÊt cø nhãm ®éng vËt nµo kh¸c. 10.2.2.2. Thay ®æi biÓu hiÖn gen Ubx dÉn ®Õn sù ®a d¹ng h×nh th¸i ch©n ë gi¸p x¸c Gi¸p x¸c bao gåm hÇu hÕt (nh−ng kh«ng ph¶i tÊt c¶) c¸c loµi ®éng vËt ch©n ®èt cã thÓ b¬i trong n−íc. Mét sè sèng ë biÓn, mét sè sèng trong m«i tr−êng n−íc ngät (phæ biÕn nhÊt lµ t«m vµ cua). Mét trong nh÷ng nhãm gi¸p x¸c ®−îc nghiªn cøu kü nhÊt ®Õn nay lµ Artemia. Ph«i cña chóng ngõng ph¸t triÓn ë d¹ng bµo tö cøng, nh−ng nÕu ®−a c¸c bµo tö nµy vµo n−íc muèi, chóng sÏ ph¸t triÓn trë l¹i. PhÇn ®Çu cña c¸c loµi t«m nµy chøa c¸c phÇn phô miÖng. §èt th©n gÇn ®Çu nhÊt (T1) cã phÇn phô b¬i (ch©n b¬i) còng gièng nh− c¸c ®èt th©n kh¸c tõ thø hai ®Õn m−êi mét (T2 – T11). Artemia thuéc bé branchiopod (ch©n mang) vµ ®−îc ph©n biÖt víi bé isopod (®¼ng tóc). Isopod kh¸c biÖt branchiopod ë PhÇn ®Çu PhÇn th©n chç chóng chØ cã ch©n b¬i gièng branchiopod ë c¸c ®èt th©n tõ T2 ®Õn T8; cßn ë ®èt T1, ch©n nµy cã kÝch th−íc nhá vµ cã chøc n¨ng b¾t thøc ¨n, nªn ®−îc gäi lµ “ch©n miÖng” Blanchiopod T1 T2 T3 T4 T5 hay “ch©n hµm” (h×nh 10.6). Ch©n miÖng (Bé ch©n mang) nµy gièng víi phÇn phô miÖng ë ®Çu (kh«ng vÏ trªn h×nh). Lý do dÉn ®Õn sù h×nh thµnh c¸c lo¹i T1 T2 T3 T4 T5 “ch©n” kh¸c nhau ë ®èt th©n thø nhÊt (T1) gi÷a isopod vµ branchipod lµ do sù biÓu hiÖn Isopod (Bé ®¼ng tóc) kh¸c nhau cña gen Ubx ë hai bé gi¸p x¸c nµy. Cã lÏ, tæ tiªn chung cña chóng cã ch©n b¬i ë Ch©n hµm C¸c ch©n b¬i tÊt c¶ c¸c ®èt th©n (gièng branchipod). Trong qu¸ tr×nh tiÕn hãa ph©n li cña isopod vµ C¸c ®èt biÓu hiÖn Scr C¸c ®èt biÓu hiÖn Ubx branchipod, tr×nh tù ®iÒu hßa cña gen Ubx ®· H×nh 10.6. Sù thay ®æi h×nh th¸i ë gi¸p x¸c. biÕn ®æi ë c¸c loµi isopod. KÕt qu¶ cña sù ë blanchiopod, protein Scr chØ ®−îc biÓu hiÖn ë phÇn thay ®æi nµy lµ gen Ubx kh«ng ®−îc biÓu ®Çu (protein Scr cã vai trß thóc ®Èy sù ph¸t triÓn cña hiÖn ë ®èt T1, mµ chØ ®−îc biÓu hiÖn ë c¸c ®èt c¸c phÇn phô miÖng); cßn protein Ubx ®−îc biÓu hiÖn ë c¸c ®èt th©n (thóc ®Èy sù ph¸t triÓn cña c¸c T2 - T8. Còng cã thÓ gi¶i thÝch lµ, gen Ubx cã t¸c ®éng øc chÕ lªn c¸c “gen quy ®Þnh kiÓu \"ch©n b¬i\"). ë isopod, protein Scr ®−îc biÓu hiÖn ë biÓu hiÖn” ë phÇn ®Çu. ThÕ nªn, ë c¸c loµi c¶ phÇn ®Çu vµ ®èt th©n thø nhÊt (T1), dÉn ®Õn \"ch©n b¬i\" ë T1 chuyÓn thµnh \"ch©n hµm\" cã chøc Artemia, nh÷ng gen phÇn ®Çu nµy bÞ øc chÕ ë n¨ng nh− mét phÇn phô miÖng bæ sung. Sù biÓu hiÖn tÊt c¶ 11 ®èt th©n (T1-T11); trong khi ë c¸c cña Scr ë ®©y lµ do ®ét biÕn bÊt ho¹t Ubx (Ubx lµ loµi isopod, c¸c gen phÇn ®Çu kh«ng bÞ øc chÕ protein øc chÕ ho¹t ®éng cña Scr). 292
Ch−¬ng 10. Di truyÒn häc ph©n tö vµ tiÕn ho¸ ë ®èt T1 do thiÕu protein øc chÕ Ubx. Trong thùc tÕ, ë isopod, ng−êi ta ®· x¸c ®Þnh ®−îc protein Src ho¹t ®éng c¶ ë phÇn ®Çu vµ ®èt th©n T1 dÉn ®Õn sù h×nh thµnh ch©n hµm ë ®èt th©n nµy. C¬ chÕ ph©n tö nµo dÉn ®Õn sù biÓu hiÖn cña gen Ubx kh¸c nhau ë isopod vµ branchipod? Cã mét sè gi¶ thiÕt, nh−ng gi¶ thiÕt ®−îc chÊp nhËn réng r·i h¬n cho r»ng ®ét biÕn ®· x¶y ra trong tr×nh tù ®iÒu hßa cña gen Ubx ë c¸c loµi isopod. Theo gi¶ thiÕt nµy, tr×nh tù t¨ng c−êng cña gen Ubx kh«ng cßn ®iÒu khiÓn ®−îc sù biÓu hiÖn cña gen nµy ë ®èt T1. Tõ thùc tÕ, ng−êi ta thÊy cã mèi t−¬ng quan chÆt gi÷a sù bÊt ho¹t gen Ubx víi sù ph¸t triÓn c¸c d¹ng cÊu tróc ch©n hµm ë c¸c loµi gi¸p x¸c. Ch¼ng h¹n, ph«i cña t«m hïm thiÕu sù biÓu hiÖn gen Ubx ë hai ®èt th©n ®Çu tiªn dÉn ®Õn sù h×nh thµnh hai ®«i ch©n hµm. T−¬ng tù nh− vËy, mét sè loµi t«m thiÕu sù biÓu hiÖn cña gen Ubx ë ba ®èt th©n ®Çu tiªn, nªn cã ®Õn ba ®«i ch©n hµm. 10.2.2.3. T¹i sao c«n trïng thiÕu ch©n bông ? TÊt c¶ c«n trïng ®Òu cã 6 ch©n; mçi ®èt th©n trong ba ®èt th©n cña chóng ®Òu mang mét ®«i ch©n. TÊt c¶ c¸c loµi c«n trïng (−íc l−îng trªn 1 triÖu loµi) ®Òu cã ®Æc ®iÓm chung nµy. §iÒu ng¹c nhiªn lµ ë c¸c loµi ch©n ®èt kh¸c (nh− gi¸p x¸c), sè l−îng ch©n l¹i rÊt biÕn ®éng. Trong ®ã, mét sè loµi gi¸p x¸c cã ch©n ë mäi ®èt th©n vµ ®èt bông. Sù tiÕn hãa dÉn ®Õn sù thiÕu ch©n ë bông cña c¸c loµi c«n trïng kh«ng ph¶i do sù thay ®æi biÓu hiÖn cña c¸c “gen quy ®Þnh kiÓu biÓu hiÖn” nh− tr−êng hîp h×nh thµnh ch©n miÖng ë c¸c loµi isopod nªu trªn. Thay vµo ®ã, sù thiÕu ch©n bông ë c«n trïng lµ kÕt qu¶ cña sù thay ®æi chøc n¨ng protein ®iÒu hßa Ubx. ë c«n trïng, hai gen Ubx vµ abd-A øc chÕ sù biÓu hiÖn cña mét gen quy ®Þnh sù ph¸t triÓn cña c¸c ch©n ë mçi ®èt th©n, gäi lµ gen Dll. Trong qu¸ tr×nh ph¸t triÓn ph«i ruåi giÊm, gen Ubx ®−îc biÓu hiÖn ë møc cao t¹i ®èt th©n thø ba vµ c¸c ®èt bông phÝa tr−íc; riªng sù biÓu hiÖn cña gen abd-A cßn më réng tiÕp ®Õn c¸c ®èt bông phÝa sau. KÕt hîp víi nhau, c¸c gen Ubx vµ abd-A øc chÕ sù biÓu hiÖn cña gen Dll t¹i 7 ®èt bông ®Çu tiªn. MÆc dï gen Ubx còng biÓu hiÖn ë ®èt th©n T3, nh−ng nã kh«ng øc chÕ sù biÓu hiÖn cña gen Dll còng nh− sù h×nh thµnh ch©n ë ®èt th©n nµy; bëi v×, ë ®©y trong qu¸ tr×nh ph¸t triÓn ph«i, gen Dll ®−îc ho¹t hãa tr−íc khi gen Ubx ®−îc biÓu hiÖn. ë c¸c loµi gi¸p x¸c, ch¼ng h¹n nh− bé branchiopod, c¶ hai gen Ubx vµ Dll ®Òu ®−îc biÓu hiÖn ë møc cao t¹i tÊt c¶ 11 ®èt th©n. Sù biÓu hiÖn m¹nh cña gen Dll thóc ®Èy sù h×nh thµnh ch©n b¬i ë c¶ 11 ®èt th©n nµy. VËy, t¹i sao gen Ubx kh«ng øc chÕ ®−îc sù biÓu hiÖn cña gen Dll ë c¸c ®èt bông cña gi¸p x¸c? C©u tr¶ lêi thùc thÕ lµ ®· cã sù tiÕn hãa ph©n li (vÒ cÊu tróc vµ chøc n¨ng) cña protein Ubx ë c«n trïng vµ gi¸p x¸c. C¸c thÝ nghiÖm ho¹t hãa vµ bÊt ho¹t gen ë ruåi giÊm cho thÊy: nÕu gen Ubx cña ruåi giÊm ®−îc biÓu hiÖn ë tÊt c¶ c¸c m« thuéc phÇn bông th× ch©n kh«ng h×nh thµnh ®−îc do gen Dll bÞ øc chÕ. Nh−ng nÕu gen Ubx nµy cã nguån gèc tõ gi¸p x¸c th× nã kh«ng øc chÕ sù biÓu hiÖn cña gen Dll vµ tÊt c¶ c¸c ch©n ®Òu h×nh thµnh b×nh th−êng. §iÒu nµy chøng tá “chøc n¨ng” cña protein Ubx cña ruåi giÊm vµ gi¸p x¸c lµ kh¸c nhau. Protein cña ruåi giÊm øc chÕ biÓu hiÖn gen Dll, nh−ng protein cña gi¸p x¸c th× kh«ng. Nguyªn nh©n nµo lµm chøc n¨ng cña protein Ubx ë ruåi giÊm vµ gi¸p x¸c biÓu hiÖn kh¸c nhau? Ph©n tÝch tr×nh tù axit amin cña hai protein nµy cho thÊy, chóng chØ gièng nhau 32%, nh−ng 59/60 axit amin thuéc vïng liªn kÕt ADN lµ gièng nhau hoµn toµn. Protein Ubx ë gi¸p x¸c cã mét motif ng¾n gåm 29 axit amin cã vai trß “ph¶n øc chÕ”. Khi motif nµy bÞ lo¹i bá, protein Ubx cña gi¸p x¸c biÓu hiÖn chøc n¨ng gièng nh− cña ruåi giÊm vµ g©y øc chÕ biÓu hiÖn gen Dll. Protein Ubx cña c¶ ruåi giÊm vµ gi¸p x¸c ®Òu chøa nhiÒu miÒn øc chÕ kh¸c nhau. Nh÷ng miÒn nµy cã kh¶ n¨ng t−¬ng t¸c víi mét hoÆc nhiÒu phøc hÖ øc chÕ phiªn m·. 293
§inh §oµn Long §o¹n peptide “ph¶n øc chÕ” cã mÆt trong cÊu tróc protein Ubx cña gi¸p x¸c ng¨n c¶n sù huy ®éng phøc hÖ øc chÕ cña protein nµy. Khi chuçi peptide “ph¶n øc chÕ” nµy ®−îc g¾n vµo protein Ubx cña ruåi giÊm, th× ph©n tö protein lai biÓu hiÖn chøc n¨ng gièng protein Ubx cña gi¸p x¸c (tøc lµ mÊt kh¶ n¨ng øc chÕ gen Dll). 10.2.2.4. KiÓu h×nh c¸nh ®a d¹ng ë c¸c loµi ch©n ®èt do biÕn ®æi c¸c tr×nh tù ®iÒu hßa ë c¸c môc trªn, chóng ta ®· ®Ò cËp ®Õn vai trß cña gen Ubx trong viÖc t¹o ra sù ®a d¹ng c¸c kiÓu h×nh ch©n bông vµ ch©n miÖng ë c¸c loµi gi¸p x¸c vµ c«n trïng. Trong thùc tÕ, sù thay ®æi tr×nh tù ®iÒu hßa cña gen nµy cßn gióp gi¶i thÝch tÝnh ®a d¹ng kiÓu h×nh c¸nh (“ch©n bay”) ë ruåi giÊm vµ c¸c loµi b−ím (h×nh 10.7). ë ruåi giÊm, Ubx cã vai trß lµ protein øc chÕ sù h×nh thµnh c¸nh thËt (c¸nh ®Çy ®ñ). Trong qu¸ tr×nh nµy, Ubx øc chÕ kho¶ng tõ 5 ®Õn 10 gen ®Ých kh¸c nhau. Nh÷ng gen nµy m· hãa c¸c protein thiÕt yÕu thóc ®Èy sù h×nh thµnh vµ ph¸t triÓn c¸nh thËt. ë c¸nh phô (®èt T3), nh÷ng gen nµy bÞ øc chÕ bëi Ubx. Nh−ng khi gen Ubx bÞ ®ét biÕn, “c¸nh phô” ph¸t triÓn thµnh “c¸nh thËt”, dÉn ®Õn thÓ ®ét biÕn cã bèn c¸nh thËt. Ruåi giÊm thuéc bé c«n trïng hai c¸nh - Dipteran. C¸c loµi thuéc bé nµy cã ®Æc ®iÓm chung lµ chØ cã mét ®«i c¸nh thËt duy nhÊt bªn c¹nh mét hoÆc mét sè ®«i c¸nh phô. Protein Ubx ho¹t ®éng víi vai trß lµ protein øc chÕ h×nh thµnh c¸nh thËt ë Dipteran. C¸c loµi b−ím thuéc mét bé c«n trïng kh¸c, gäi lµ bé c¸nh v¶y (hay c¸nh phÊn) - Lepidopteran. C¸c loµi Lepidopteran ®Òu cã hai ®«i c¸nh thËt vµ mét hoÆc mét sè ®«i c¸nh phô. Nguyªn nh©n nµo dÉn ®Õn kh¸c biÖt nµy? Trong lÞch sö, hai bé c«n trïng nµy tiÕn hãa t¸ch li khái nhau kho¶ng trªn 250 triÖu n¨m tr−íc. §ã còng lµ kho¶ng thêi gian c¸c loµi ®éng vËt cã x−¬ng sèng (bao gåm ng−êi) vµ kh«ng x−¬ng sèng (nh− Õch) t¸ch li khái nhau. Trong thêi kú nµy, d−êng nh− gen Ubx tÝch lòy ®ñ c¸c ®ét biÕn (cã thÓ theo mét hoÆc c¶ ba c¬ chÕ tiÕn hãa) ®Õn møc chøc n¨ng cña nã thay ®æi. Gi¶ thiÕt ®¬n gi¶n nhÊt ®−îc ®−a ra lµ sù thay ®æi kiÓu biÓu hiÖn cña gen Ubx (lµm gen nµy kh«ng biÓu hiÖn ë c¸c c«n trïng c¸nh v¶y) dÉn ®Õn sù h×nh thµnh ®«i c¸nh thø hai. HiÖn t−îng “ch©n b¬i” biÕn thµnh “ch©n miÖng” ë bé ®¼ng tóc (isopod) ®· tõng ®−îc gi¶i thÝch bëi c¬ chÕ nµy. (a) Tuy vËy, trong thùc tÕ ®· kh«ng t×m thÊy sù kh¸c biÖt râ rÖt vÒ kiÓu biÓu hiÖn cña gen Ubx gi÷a ruåi giÊm vµ c¸c loµi b−ím. Cô thÓ, lµ C«n trïng hai c¸nh C«n trïng c¸nh phÊn (Dipteran) (Lepidopteran) gen Ubx ®−îc biÓu hiÖn ë møc cao trong suèt qu¸ (b) tr×nh ph¸t triÓn ®«i c¸nh thø hai ë c¸c loµi b−ím. §iÒu nµy cho thÊy cã hai wg Ubx \"T¾t\" \"BËt\" kh¶ n¨ng. Kh¶ n¨ng thø +1 +1 nhÊt lµ sù biÓu hiÖn chøc DSRF Ubx \"T¾t\" \"BËt\" n¨ng cña protein Ubx +1 +1 kh«ng gièng nhau ë ruåi giÊm vµ ë b−ím. Kh¶ n¨ng H×nh 10.7. Sù thay ®æi tr×nh tù ®iÒu hßa cña c¸c gen ®Ých lµ môc tiªu thø hai lµ c¸c gen ®Ých t¸c ®éng cña protein Ubx. (a) Protein øc chÕ Ubx ®−îc biÓu hiÖn ë ®«i thiÕt yÕu cho sù ph¸t triÓn \"c¸nh phô\" cña c«n trïng hai c¸nh, vµ ë ®«i c¸nh sau (mµu sÉm) cña c«n c¸nh thËt vèn bÞ øc chÕ bëi trïng c¸nh phÊn. (b) ë c«n trïng hai c¸nh, c¸c gen ®Ých mang c¸c tr×nh tù protein Ubx (ë c«n trïng) ®iÒu hßa lµ vÞ trÝ g¾n cña protein Ubx (h×nh tr¸i); trong khi, ë c«n trïng cã tr×nh tù ®iÒu hßa bÞ biÕn c¸nh phÊn (b−ím, h×nh ph¶i), c¸c tr×nh tù g¾n protein Ubx bÞ mÊt, dÉn ®Õn c¸c gen ph¸t triÓn c¸nh thËt ®−îc biÓu hiÖn (theo Watson, 2004). 294
Ch−¬ng 10. Di truyÒn häc ph©n tö vµ tiÕn ho¸ ®æi khi c¸c loµi b−ím tiÕn hãa ph©n li, dÉn ®Õn viÖc c¸c gen ®Ých nµy ë b−ím kh«ng cßn bÞ øc chÕ bëi protein Ubx n÷a. Cã lÏ phÇn lín chóng ta ®Òu cho r»ng kh¶ n¨ng thø nhÊt dÔ x¶y ra h¬n, bëi kh¶ n¨ng thø hai chØ x¶y ra khi ®ång thêi cã tõ 5 ®Õn 10 gen ®Ých (thiÕt yÕu cho sù ph¸t triÓn c¸nh ë b−ím) ®Òu cã sù biÕn ®æi trong tr×nh tù ®iÒu hßa cña chóng. Nh−ng thËt ng¹c nhiªn, sù biÕn ®æi tr×nh tù ®iÒu hßa cña c¸c gen ®Ých cña protein Ubx l¹i ®−îc t×m thÊy lµ nguyªn nh©n chÝnh dÉn ®Õn sù ®a h×nh kiÓu c¸nh ë b−ím, cßn protein Ubx biÓu hiÖn sù duy tr× chøc n¨ng gièng nhau ë ruåi giÊm vµ ë b−ím. 10.2.3. Xu h−íng ®ét biÕn thay thÕ trong c¸c tr×nh tù ADN vµ protein Mét c©u hái ®−îc ®Æt ra tõ l©u trong c¸c nghiªn cøu tiÕn hãa lµ: kiÓu ®ét biÕn vµ tÇn sè ®ét biÕn cã gièng nhau ë c¸c phÇn kh¸c nhau cña gen kh«ng? Ngay tõ nh÷ng n¨m 70 cña thÕ kû tr−íc, ®· cã nh÷ng nghiªn cøu so s¸nh tr×nh tù axit amin trong c¸c ph©n tö protein cã chøc n¨ng gièng nhau. C¸c nghiªn cøu nµy ®· chØ ra r»ng, cã mét sè kiÓu thay ®æi vÒ axit amin gi÷a c¸c protein t−¬ng ®ång th−êng x¶y ra h¬n so víi c¸c kiÓu thay ®æi kh¸c. §Æc biÖt, c¸c axit amin thay thÕ nhau th−êng cã tÝnh chÊt hãa häc gièng nhau vµ thuéc cïng nhãm ph©n lo¹i (xem b¶ng 1.5, ch−¬ng 1). Xu h−íng thay thÕ axit amin nh− vËy cñng cè hai nguyªn t¾c tiÕn hãa quan träng, ®ã lµ: 1) c¸c ®ét biÕn chØ xuÊt hiÖn ë tÇn sè thÊp, vµ 2) hÇu hÕt c¸c ®ét biÕn thay ®æi lín (ch¼ng h¹n, do thay thÕ c¸c axit amin thuéc c¸c nhãm kh¸c nhau) ®Òu bÞ chän läc tù nhiªn ®µo th¶i. C¸c axit amin cã tÝnh chÊt hãa häc gièng nhau cßn cã xu h−íng ®−îc m· hãa bëi c¸c m· bé ba gièng nhau (xem b¶ng 4.5, ch−¬ng 4). Nhê vËy, sù xuÊt hiÖn c¸c ®ét biÕn thay thÕ gi÷a c¸c axit amin cïng lo¹i dÔ x¶y ra h¬n. Ch¼ng h¹n nh− ®Ó xuÊt hiÖn ®ét biÕn Leu ↔ Ile chØ cÇn mét nucleotide trong gen ®−îc thay thÕ (CUU ↔ AUU); nh−ng ®Ó x¶y ra ®ét biÕn Leu ↔ Arg, cÇn ®Õn sù thay thÕ cña hai nucleotide trong gen (CUU ↔ AAU). C¸c enzym ADN polymerase cã lçi sao chÐp vµo kho¶ng 10-9 – 10-6. NghÜa lµ, cø kho¶ng 1 triÖu ®Õn 1 tØ nucleotide, chóng míi sao chÐp sai mét lÇn. Do vËy, kh¶ n¨ng xuÊt hiÖn c¸c ®ét biÕn thay thÕ hai hay nhiÒu nucleotide t¹i cïng mét vÞ trÝ trong qu¸ tr×nh sao chÐp lµ rÊt thÊp. H¬n n÷a, chän läc tù nhiªn ®· t¸c ®éng trªn c¸c hÖ thèng sinh häc qua hµng triÖu n¨m tiÕn hãa, nªn phÇn lín c¸c protein hiÖn cã (kiÓu d¹i) ë c¸c sinh vËt lµ d¹ng cã biÓu hiÖn chøc n¨ng thÝch nghi cao víi m«i tr−êng sèng hiÖn t¹i. Nªn, phÇn lín c¸c thay ®æi râ rÖt trong cÊu tróc bËc 1 cña ph©n tö protein ®Òu lµm gi¶m sù biÓu hiÖn chøc n¨ng cña nã vµ g©y h¹i cho sinh vËt. KÕt qu¶ lµ chóng th−êng bÞ chän läc tù nhiªn ®µo th¶i nhanh chãng. 10.3. C¸c h−íng nghiªn cøu tiÕn hãa ph©n tö 10.3.1. So s¸nh c¸c tr×nh tù ADN 10.3.1.1. Sù thay thÕ c¸c nucleotide vµ m« h×nh Jukes - Cantor Trong qu¸ tr×nh tiÕn hãa, sau khi hai tr×nh tù nucleotide t¸ch li khái nhau (ch¼ng h¹n, 2 gen t−¬ng ®ång ë 2 loµi cïng t¸ch li tõ tæ tiªn chung), chóng b¾t ®Çu tÝch lòy c¸c ®ét biÕn ®éc lËp víi nhau. Trong c¸c nghiªn cøu tiÕn hãa dïng phÐp so s¸nh tr×nh tù ADN, sè nucleotide thay thÕ (K) th−êng lµ th«ng sè c¬ b¶n ®Ó nhËn ®Þnh sù kh¸c biÖt gi÷a c¸c gen cña c¸c loµi hoÆc c¸ thÓ kh¸c nhau. Theo ®ã, c¸c gen cã Ýt nucleotide thay thÕ ®−îc xem lµ cã quan hÖ gÇn, vµ ng−îc l¹i. Tuy vËy, ngay tõ n¨m 1969, T. Jukes vµ C. Cantor ®· nhËn ®Þnh r»ng “viÖc so s¸nh c¸c tr×nh tù chØ dùa trªn c¸c ®¬n ph©n ®¬n lÎ cã thÓ dÉn ®Õn viÖc ®¸nh gi¸ sai vÒ quan hÖ di truyÒn gi÷a chóng”. Cô thÓ trong ph©n tö ADN, ë vÞ trÝ dÔ x¶y ra sù thay thÕ nucleotide, th× rÊt cã thÓ t¹i vÞ trÝ ®ã ®· x¶y ra mét hoÆc nhiÒu lÇn c¸c ®ét biÕn thuËn vµ ®ét biÕn ng−îc (h×nh 10.8). §Ó ph¶n ¸nh kh¶ n¨ng ®ã, Jukes vµ Cantor ®· gi¶ thiÕt r»ng: mçi lo¹i nucleotide ®Òu cã thÓ ®−îc thay thÕ bëi 3 lo¹i nucleotide kh¸c víi kh¶ n¨ng nh− nhau; trong ®ã, qui −íc tØ lÖ thay thÕ mét 295
§inh §oµn Long nucleotide thµnh mét trong 3 lo¹i nucleotide cßn t=0 T×nh huèng 1 T×nh huèng 2 l¹i lµ α. Khi ®ã, tØ lÖ thay thÕ mét nucleotide nãi C C chung lµ 3α. Theo m« h×nh nµy, nÕu mét vÞ trÝ nucleotide trªn gen t¹i thêi ®iÓm 0 (t = 0) lµ C, t=1 A T th× x¸c suÊt (P) t¹i thêi ®iÓm 1 (t = 1) vÞ trÝ nucleotide ®ã vÉn lµ C sÏ lµ PC(1) = 1 – 3α. Vµo t=2 T C c¸c thêi ®iÓm sau ®ã (vÝ dô: t = 2), ph¶i tÝnh ®Õn kh¶ n¨ng ®ét biÕn “ng−îc” (®ét biÕn “phôc håi”). H×nh 10.8. Hai t×nh huèng thay thÕ NÕu nucleotide gèc lµ C chuyÓn thµnh mét nucleotide x¶y ra t¹i cïng mét vÞ trÝ cã thÓ nucleotide kh¸c (vÝ dô lµ A) t¹i t = 1, th× t¹i t = dÉn ®Õn viÖc −íc l−îng sai sè lÇn ®ét biÕn 2, gi¸ trÞ PC(2) sÏ b»ng (1 - 3α)PC(1) + α[1 – PA(1)]. thay thÕ nucleotide ® x¶y ra ë mét gen (t lµ TiÕp tôc më réng c«ng thøc nµy, vµo thêi ®iÓm thêi gian). bÊt kú trong t−¬ng lai (t), kh¶ n¨ng mét vÞ trÝ trªn m¹ch ADN mang nucleotide C sÏ lµ: PC(t) = 1/4 = (3/4)e-4α (ph−¬ng tr×nh 10.1) C«ng thøc nµy cã thÓ dïng ®Ó tÝnh gi¸ trÞ cña α, qua ®ã ph¶n ¸nh tÇn sè (tèc ®é) thay thÕ nucleotide t¹i mét vÞ trÝ trªn ph©n tö ADN. Tuy vËy, so víi thùc tÕ, c«ng thøc Jukes - Cantor lµ mét c«ng thøc qu¸ gi¶n l−îc. Ch¼ng h¹n, c¸c ®ét biÕn ®ång ho¸n (thay thÕ purine nµy b»ng purine kh¸c, hoÆc pyrimidine nµy b»ng pyrimidine kh¸c) trong thùc tÕ th−êng dÔ x¶y ra h¬n so víi c¸c ®ét biÕn dÞ ho¸n (thay thÕ mét purine b»ng mét pyrimidine hoÆc ng−îc l¹i). Dï vËy, tõ viÖc më réng c«ng thøc Jukes – Cantor cã thÓ x¸c ®Þnh ®−îc sè lÇn thay thÕ nucleotide thùc sù ®· x¶y ra (K) t¹i mét vÞ trÝ nucleotide trªn m¹ch ADN dùa theo ph−¬ng tr×nh sau: K = -3/4 ln [1 – (4/3)p] (ph−¬ng tr×nh 10.2) trong ®ã, p lµ tØ sè c¸c nucleotide kh¸c nhau gi÷a hai tr×nh tù ADN ®−îc so s¸nh sau mét lÇn ®Õm ®éc lËp. C«ng thøc nµy phï hîp víi quan ®iÓm cho r»ng nÕu hai tr×nh tù ADN chØ cã Ýt vÞ trÝ kh¸c biÖt, th× gi¸ trÞ p nhá vµ kh¶ n¨ng thay thÕ nhiÒu lÇn t¹i mét vÞ trÝ lµ thÊp (vÝ dô: trªn m¹ch ADN cã 100 nucleotide, nÕu p = 0,02 th× K = 0,02). §ång thêi c«ng thøc nµy cho thÊy: nÕu sè nucleotide kh¸c nhau gi÷a hai tr×nh tù ADN cµng lín, th× tÇn sè nucleotide thay thÕ thËt cµng lín h¬n tÇn sè quan s¸t (vÝ dô: trªn m¹ch ADN cã 100 nucleotide, nÕu p = 0,50 th× K = 0,82). 10.3.1.2. Tèc ®é thay thÕ c¸c nucleotide Sè lÇn thay thÕ nucleotide mµ hai tr×nh tù ADN ®· tr¶i qua tõ khi chóng t¸ch li khái tr×nh tù tæ tiªn ®−îc xem lµ th«ng sè quan träng nhÊt trong nghiªn cøu tiÕn hãa sö dông phÐp so s¸nh ADN. Khi kÕt hîp sè lÇn thay thÕ nucleotide (K) víi kho¶ng thêi gian tiÕn hãa (T) th× x¸c ®Þnh ®−îc tÇn sè thay thÕ nucleotide (r). V×, sù thay thÕ nucleotide x¶y ra ®ång thêi vµ ®éc lËp ë c¶ hai tr×nh tù, nªn r ®−îc tÝnh b»ng c«ng thøc: r = K/(2T) (ph−¬ng tr×nh 10.3) §iÒu cÇn l−u ý lµ ®Ó −íc tÝnh ®−îc gi¸ trÞ K, ph¶i thu thËp ®−îc d÷ liÖu vÒ tr×nh tù ADN tõ Ýt nhÊt 2 loµi trë lªn. ViÖc so s¸nh tÇn sè thay thÕ nucleotide trong ph¹m vi mét gen hay gi÷a c¸c gen kh¸c nhau cho phÐp dù ®o¸n c¬ chÕ ph©n tö dÉn ®Õn sù thay thÕ nucleotide trong c¸c tr×nh tù ADN. NÕu tèc ®é tiÕn hãa trong mét nhãm loµi lµ æn ®Þnh th× tÇn sè thay thÕ nucleotide cã thÓ gióp dù ®o¸n thêi gian x¶y ra mét sù kiÖn tiÕn hãa. 296
Ch−¬ng 10. Di truyÒn häc ph©n tö vµ tiÕn ho¸ 10.3.1.3. Tèc ®é tiÕn hãa cña c¸c phÇn kh¸c nhau trong gen KÕt qu¶ so s¸nh tr×nh tù ADN ë nhiÒu gen kh¸c nhau ®· x¸c nhËn r»ng: c¸c phÇn kh¸c nhau trong gen cã tÇn sè biÕn ®æi kh¸c nhau. Nãi c¸ch kh¸c, chän läc tù nhiªn t¸c ®éng víi møc ®é kh¸c nhau lªn c¸c phÇn kh¸c nhau cña gen. Chóng ta biÕt r»ng, mét gen sinh vËt nh©n thËt ®iÓn h×nh bao gåm c¸c tr×nh tù m· hãa (quy ®Þnh c¸c axit amin trong ph©n tö protein) vµ c¸c tr×nh tù kh«ng m· hãa. C¸c tr×nh tù kh«ng m· hãa bao gåm c¸c intron, c¸c ®o¹n dÉn ®Çu vµ theo sau vïng m· hãa (®−îc phiªn m·, nh−ng kh«ng ®−îc dÞch m·) vµ c¸c ®o¹n vïng biªn kh«ng ®−îc phiªn m· n»m ng−îc dßng (®Çu 5’) vµ xu«i dßng (®Çu 3’) cña gen (dï chóng cÇn thiÕt cho sù phiªn m·). Ngoµi ra, trong hÖ gen cßn cã c¸c gen gi¶ (cïng lµ tr×nh tù kh«ng m· hãa) vèn kh«ng cßn kh¶ n¨ng biÓu hiÖn vµ cho ra c¸c s¶n phÈm ho¹t ®éng chøc n¨ng b×nh th−êng bëi chóng ®· tÝch lòy nhiÒu ®ét biÕn lµm mÊt chøc n¨ng trong qu¸ tr×nh tiÕn hãa. Ngay trong tr×nh tù m· hãa cña gen, kh«ng ph¶i mäi thay thÕ nucleotide ®Òu dÉn ®Õn thay ®æi axit amin trong ph©n tö protein. NhÊt lµ, sù thay thÕ nucleotide t¹i vÞ trÝ thø ba trong mét m· bé ba (codon) nhiÒu khi kh«ng lµm ¶nh h−ëng ®Õn thµnh phÇn vµ tr×nh tù axit amin trªn ph©n tö protein do hiÖn t−îng “tho¸i hãa” cña m· bé ba (xem thªm ch−¬ng 4). 10.3.1.4. C¸c vÞ trÝ ®ång nghÜa vµ kh¸c nghÜa trong gen B¶ng 10.1 cho thÊy tèc ®é thay ®æi t−¬ng ®èi ë c¸c phÇn kh¸c nhau cña c¸c gen ®éng vËt cã vó. §iÓm ®¸ng chó ý ë c¸c gen biÓu hiÖn chøc n¨ng lµ tÇn sè thay thÕ nucleotide cao nhÊt t¹i c¸c vÞ trÝ ®ång nghÜa trong vïng m· hãa cña gen. TÇn sè thay thÕ nucleotide ®ång nghÜa cao gÊp 5 lÇn so víi tÇn sè thay thÕ nucleotide kh¸c nghÜa quan s¸t ®−îc. C¸c ®ét biÕn thay thÕ nucleotide ®ång nghÜa lµ c¸c ®ét biÕn kh«ng lµm thay ®æi tr×nh tù axit amin trªn ph©n tö protein; do vËy, kh«ng lµm thay ®æi sù biÓu hiÖn chøc n¨ng cña protein. §Õn ®©y, chóng ta nhí l¹i: c¸c biÕn ®æi trong tr×nh tù nucleotide cã thÓ xuÊt hiÖn nh− thÕ nµo? VÒ tæng thÓ, cã thÓ nãi tÊt c¶ nh÷ng thay ®æi nucleotide trong tr×nh tù ADN lµ do sai sãt cña qu¸ tr×nh sao chÐp hoÆc söa ch÷a ADN. TÊt c¶ c¸c enzym tham gia sao chÐp vµ söa ch÷a ADN ®Òu kh«ng cã kh¶ n¨ng ph©n biÖt B¶ng 10.1. Tèc ®é thay thÕ nucleotide trung b×nh trong c¸c mét ®ét biÕn lµ ®ång nghÜa hay vïng tr×nh tù ADN kh¸c nhau thuéc gen ë ®éng vËt cã vó kh¸c nghÜa. Do vËy, cã thÓ suy ®o¸n Tr×nh tù ADN Sè nucleotide trung b×nh r»ng: kh¶ n¨ng xuÊt hiÖn cña c¸c thay thÕ t¹i mçi vÞ trÝ ®ét biÕn thay thÕ nucleotide ®ång hµng n¨m (x 10-9) nghÜa vµ kh¸c nghÜa lµ nh− nhau. Nh−ng, c¸c ®ét biÕn kh¸c nghÜa C¸c gen biÓu hiÖn chøc n¨ng 2,36 th−êng g©y h¹i nªn cã xu h−íng bÞ Vïng biªn ®Çu 5’ cña gen 1,74 chän läc tù nhiªn ®µo th¶i; trong khi §o¹n tr×nh tù dÉn ®Çu gen 4,65 ®ã, c¸c ®ét biÕn ®ång nghÜa v−ît qua Tr×nh tù m· hãa, ®ång nghÜa ®−îc c¸c “hµng rµo” chän läc, nªn Tr×nh tù m· hãa, kh¸c nghÜa 0,88 ®−îc duy tr×. Nhê vËy, chÝnh c¸c ®ét C¸c tr×nh tù intron 3,70 biÕn ®ång nghÜa cã ý nghÜa ph¶n ¸nh §o¹n tr×nh tù theo sau gen 1,88 tèc ®é ®ét biÕn x¶y ra ë mét hÖ gen, Vïng biªn ®Çu 3’ cña gen 4,46 trong khi c¸c ®ét biÕn kh¸c nghÜa th× C¸c gen gi¶ 4,85 kh«ng. 10.3.1.5. Sù biÕn ®æi ë c¸c vïng biªn cña gen B¶ng 10.1 cho thÊy møc ®é biÕn ®æi ë vïng biªn ®Çu 3’ cña c¸c gen còng rÊt cao. Gièng nh− c¸c ®ét biÕn ®ång nghÜa, c¸c tr×nh tù vïng biªn ®Çu 3’ kh«ng ¶nh h−ëng ®Õn tr×nh tù axit amin cña protein vµ Ýt ¶nh h−ëng ®Õn qu¸ tr×nh biÓu hiÖn cña gen. KÕt qu¶ lµ, phÇn lín c¸c ®ét biÕn thay thÕ ë vïng nµy ®−îc duy tr× qua chän läc tù nhiªn. TÇn sè thay thÕ nucleotide trong vïng intron cña gen còng cao, nh−ng thÊp h¬n ®ét biÕn ®ång 297
§inh §oµn Long nghÜa vµ ®ét biÕn thay thÕ ë vïng biªn ®Çu 3’. MÆc dï c¸c tr×nh tù intron kh«ng ph¶i tr×nh tù m· hãa c¸c axit amin trong protein, nh−ng vïng tiÕp gi¸p gi÷a chóng víi c¸c exon liÒn kÒ cã vai trß ®¶m b¶o cho qu¸ tr×nh c¾t intron vµ kÕt nèi exon diÔn ra chÝnh x¸c. Mét sè tr×nh tù bªn trong intron, nh− tr×nh tù ph©n nh¸nh, lµ thiÕt yÕu cho qu¸ tr×nh c¾t intron. Mét sè intron bÞ c¾t bá t¹i m« nµy, nh−ng l¹i ®−îc dïng ®Ó m· hãa axit amin t¹i m« kh¸c trong m« h×nh “c¸c c¸ch c¾t intron kh¸c nhau” (xem thªm ch−¬ng 5). Ngoµi ra, ë mét sè gen, intron cßn lµ vÞ trÝ liªn kÕt cña mét sè yÕu tè phiªn m· nªn cã ¶nh h−ëng ®Õn kh¶ n¨ng vµ tèc ®é phiªn m· cña gen. Do vËy, kh«ng ph¶i mäi thay ®æi trong tr×nh tù intron cña tÊt c¶ c¸c gen ®Òu v−ît qua ®−îc “hµng rµo” chän läc tù nhiªn. Nh−ng, nh×n chung tÇn sè thay ®æi cña chóng chØ thÊp h¬n ®«i chót so víi c¸c ®ét biÕn ®ång nghÜa vµ ®ét biÕn thay thÕ ë vïng biªn ®Çu 3’ cña gen. So víi vïng biªn ®Çu 3’ cña gen, vïng biªn ®Çu 5’ cã møc ®é thay ®æi thÊp h¬n. MÆc dï vïng nµy còng kh«ng ®−îc phiªn m· vµ dÞch m·, nh−ng nã mang tr×nh tù khëi ®Çu phiªn m· (promoter) bªn c¹nh c¸c tr×nh tù ®iÒu hßa phiªn m· kh¸c cña gen; v× vËy, vïng nµy rÊt quan träng cho sù biÓu hiÖn cña gen. ThËm chÝ, nh÷ng thay ®æi nhá trong promoter, nh− hép TATA, cã thÓ ng¨n c¶n sù phiªn m· cña gen vµ th−êng cã h¹i cho thÓ ®ét biÕn. Chän läc tù nhiªn th−êng ®µo th¶i nh÷ng ®ét biÕn nµy vµ gi¶m thiÓu tèi ®a nh÷ng thay ®æi trong c¸c vïng quan träng cña hÖ gen, trong ®ã cã c¸c promoter. Trong c¸c gen, tÇn sè biÕn ®æi thÊp h¬n n÷a thuéc vÒ c¸c vïng dÉn ®Çu vµ theo sau vïng m· hãa cña gen. MÆc dï nh÷ng vïng nµy kh«ng ®−îc dÞch m· nh−ng chóng ®−îc phiªn m·, vµ tr×nh tù cña chóng th−êng cã vai trß mang tÝn hiÖu ®iÒu khiÓn hoÆc qu¸ tr×nh hoµn thiÖn mARN (trong nh©n tÕ bµo) hoÆc qu¸ tr×nh dÞch m· tæng hîp protein (ë tÕ bµo chÊt). Do vËy, c¸c ®ét biÕn thay thÕ nucleotide ë c¸c vïng tr×nh tù nµy Ýt ®−îc duy tr× còng lµ ®iÒu dÔ hiÓu. Trong ph¹m vi mét gen, tÇn sè c¸c ®ét biÕn thay thÕ thÊp nhÊt lµ c¸c ®ét biÕn kh¸c nghÜa x¶y ra trong vïng m· hãa cña gen. Nh− chóng ta ®· biÕt, phÇn lín c¸c protein kiÓu d¹i cña sinh vËt cã tr×nh tù axit amin ®· ®−îc chän läc tù nhiªn sµng läc nªn th−êng ë d¹ng thÝch nghi nhÊt víi m«i tr−êng sèng hiÖn t¹i; thÕ nªn, phÇn lín c¸c thay ®æi tr×nh tù axit amin ®Òu dÉn ®Õn sù kÐm thÝch nghi h¬n vµ bÞ chän läc tù nhiªn ®µo th¶i. TÊt nhiªn møc ®é t¸c ®éng cña chän läc tù nhiªn lµ kh«ng gièng nhau ë c¸c axit amin kh¸c nhau trong ph©n tö protein, còng nh− cßn phô thuéc vµo viÖc axit amin thay thÕ cã tÝnh chÊt hãa häc gièng hay kh¸c axit amin gèc. 10.3.1.6. Gen gi¶ TÇn sè ®ét biÕn ®−îc t×m thÊy cao nhÊt ë c¸c gen gi¶. VÝ dô, ë c¸c gen gi¶ globin cña ng−êi, tÇn sè thay ®æi nucleotide cao gÊp 5 lÇn so víi tÇn sè thay thÕ nucleotide kh¸c nghÜa ë vïng m· hãa cña gen globin thËt. Së dÜ c¸c gen gi¶ cã tÇn sè thay thÕ nucleotide cao, v× chóng kh«ng cßn ®−îc dïng ®Ó tæng hîp protein. ThÕ nªn, nh÷ng thay ®æi trong gen gi¶ hÇu nh− kh«ng bÞ t¸c ®éng bëi chän läc tù nhiªn. Nãi tãm l¹i, mét xu h−íng dÔ nhËn thÊy trong qu¸ tr×nh tiÕn hãa lµ: c¸c vïng tr×nh tù (nucleotide hoÆc axit amin) cµng cã vai trß quan träng trong biÓu hiÖn chøc n¨ng cña c¸c ®¹i ph©n tö sinh häc (ADN, ARN vµ protein) cµng cã tèc ®é tiÕn hãa chËm. 10.3.1.7. Xu h−íng chän läc c¸c m· bé ba ®ång nghÜa Xu h−íng chän läc c¸c m· bé ba ®ång nghÜa lµ vÝ dô cho thÊy nh÷ng thay ®æi dï rÊt nhá vÒ kh¶ n¨ng thÝch nghi ë sinh vËt ®Òu ®−îc chän läc tù nhiªn t¸c ®éng qua hµng ngh×n, hµng triÖu thÕ hÖ. B¶ng 10.1 cho thÊy, tèc ®é tiÕn hãa cña c¸c ®ét biÕn ®ång nghÜa chØ chËm h¬n chót Ýt so víi tèc ®é biÕn ®æi cña c¸c gen gi¶. §iÒu nµy còng ph¶n ¸nh r»ng, c¸c ®ét biÕn ®ång nghÜa kh«ng ph¶i lóc nµo còng lµ trung tÝnh; cô thÓ, mét sè m· bé ba ®−îc chän läc tù nhiªn d−êng nh− “−u tiªn” chän lùa h¬n nh÷ng m· bé ba ®ång nghÜa kh¸c. Gi¶ thiÕt nµy ®−îc cñng cè b»ng hiÖn t−îng c¸c m· bé ba ®ång nghÜa ®−îc sö 298
Ch−¬ng 10. Di truyÒn häc ph©n tö vµ tiÕn ho¸ dông víi tÇn sè kh¸c nhau trong vïng m· hãa cña hÖ gen nhiÒu loµi sinh vËt. Ch¼ng h¹n, tÝnh tho¸i hãa cña m· bé ba biÓu hiÖn ë 6 m· bé ba cïng m· hãa axit amin Leu lµ UUA, UUG, CUU, CUC, CUA vµ CUG. Nh−ng trong thùc tÕ, 60% m· bé ba ®−îc dïng ®Ó m· hãa Leu ë E. coli lµ CUG, vµ 80% m· bé ba ®−îc dïng m· hãa axit amin nµy ë nÊm men lµ UUG. §Õn ®©y, chóng ta nhí r»ng: thùc tÕ c¸c m· bé ba ®ång nghÜa “kÕt cÆp” víi bé ba ®èi m· cña c¸c ph©n tö tARN kh¸c nhau nh−ng cïng vËn chuyÓn mét lo¹i axit amin (nãi c¸ch kh¸c, së dÜ cã tÝnh tho¸i hãa cña m· bé ba lµ do cã nhiÒu lo¹i tARN tuy kh¸c nhau ë c¸c bé ba ®èi m· nh−ng cïng vËn chuyÓn mét lo¹i axit amin). V× vËy, cã thÓ c¸c m· bé ba ®ång nghÜa kh«ng lµm thay ®æi c¸c axit amin trong ph©n tö protein, nh−ng chóng lµm thay ®æi lo¹i tARN mµ ribosome sö dông trong qu¸ tr×nh dÞch m·. C¸c nghiªn cøu nh×n chung cho thÊy: sè l−îng c¸c lo¹i tARN ®ång ®¼ng (cïng vËn chuyÓn mét lo¹i axit amin) kh«ng gièng nhau; vµ lo¹i tARN phæ biÕn nhÊt còng chÝnh lµ lo¹i mang bé ba ®èi m· t−¬ng øng víi m· bé ba ®ång nghÜa ®−îc dïng phæ biÕn nhÊt. Chän läc tù nhiªn cã lÏ ®· “−u tiªn” lùa chän mét sè m· bé ba ®ång nghÜa nµy so víi c¸c m· bé ba ®ång nghÜa kh¸c v× lo¹i tARN t−¬ng øng víi m· bé ba ®−îc lùa chän lµ phæ biÕn h¬n. Ngoµi ra, n¨ng l−îng liªn kÕt gi÷a c¸c m· bé ba trªn mARN víi bé ba ®èi m· trªn tARN lµ kh«ng gièng nhau do thµnh phÇn cña c¸c baz¬ nit¬. Sù kh¸c biÖt vÒ n¨ng l−îng liªn kÕt trong qu¸ tr×nh dÞch m· cã thÓ lµ ®èi t−îng chÞu t¸c ®éng cña chän läc tù nhiªn. §iÒu nµy ®Æc biÖt ®óng ë nh÷ng gen ®−îc biÓu hiÖn m¹nh vµ ë c¸c loµi cã vßng ®êi ng¾n, kÝch th−íc quÇn thÓ lín (nh− vi khuÈn, nÊm men vµ ruåi dÊm). Xu h−íng chän läc c¸c m· bé ba ®ång nghÜa nh− vËy lµ mét b»ng chøng cho thÊy “søc m¹nh” cña chän läc tù nhiªn trong tiÕn hãa. Ch¼ng h¹n, ngay gi÷a hai chñng vi khuÈn gièng nhau hoµn toµn vÒ mäi ho¹t ®éng sèng, ngoµi mét kh¸c biÖt duy nhÊt ë mét bé ba m· ®ång nghÜa, th× kh¸c biÖt nhá ®ã còng ®ñ dÉn ®Õn viÖc chØ mét trong hai chñng tÕ bµo ®−îc duy tr× qua hµng triÖu thÕ hÖ tiÕn hãa d−íi t¸c ®éng cña chän läc tù nhiªn. Chóng ta cã thÓ liªn t−ëng ®iÒu nµy qua h×nh ¶nh: mét c«ng ty A ph¶i tr¶ gi¸ cao 1% cho mét mÆt hµng mµ mçi n¨m hä ph¶i mua hµng ngµn lÇn, víi mét c«ng ty B ph¶i tr¶ gi¸ cao 30% cho mét mÆt hµng hä chØ ph¶i mua mét vµi lÇn, th× “lîi nhuËn” ®Çu t− cña c«ng ty B vÉn cao h¬n c«ng ty A vµ søc c¹nh tranh cña c«ng ty B lµ lín h¬n. B¶ng 10.2 cho thÊy, c¸c gen biÓu hiÖn m¹nh cã xu h−íng “−u tiªn” sö dông c¸c axit amin cã chi phÝ n¨ng l−îng tæng hîp thÊp nÕu chóng cã cïng tÝnh chÊt hãa häc vµ cã thÓ thay thÕ ®−îc. Trong tÕ bµo, n¨ng l−îng tiªu hao cho sù tæng hîp 20 lo¹i axit amin kh¸c nhau lµ kh¸c nhau. VÝ dô, ®Ó tæng hîp mét ph©n tö Gly cÇn n¨ng l−îng t−¬ng ®−¬ng lµ 11,7 ph©n tö ATP; cßn ®Ó tæng hîp mét ph©n tö Trp cÇn n¨ng l−îng t−¬ng ®−¬ng lµ 78,3 ph©n tö ATP. Trong cÊu tróc cña c¸c protein, cã nh÷ng vÞ trÝ kh«ng thÓ thay thÕ ®−îc axit amin Trp, nh−ng ë bÊt cø vÞ trÝ Trp nµo cã thÓ thay thÕ ®−îc b»ng Gly (hoÆc thËm chÝ xãa bá hoµn toµn) th× chän läc tù nhiªn cã xu h−íng “−u tiªn” cho sù thay ®æi nh− vËy. ë c¸c gen ®−îc biÓu hiÖn m¹nh, sù thay ®æi nµy t¹o ra hiÖu qu¶ tiÕt kiÖm n¨ng l−îng cao nhÊt. ViÖc gi¶i tr×nh tù hoµn chØnh hµng tr¨m hÖ gen vi khuÈn gÇn ®©y ®· x¸c nhËn nhËn ®Þnh nµy. 10.3.1.8. Trong hÖ gen, c¸c gen cã tèc ®é tiÕn hãa kh¸c nhau Tèc ®é tiÕn hãa gi÷a c¸c gen trong hÖ gen, thËm chÝ gi÷a c¸c vïng kh¸c nhau trong mét gen, lµ kh«ng gièng nhau. Sù kh¸c nhau nµy phô thuéc vµo hai yÕu tè: 1) sù kh¸c nhau trong tÇn sè ®ét biÕn ë mçi gen, vµ 2) møc ®é t¸c ®éng cña chän läc tù nhiªn lªn mçi locut. §Ó x¸c ®Þnh mét thay ®æi nucleotide trong hÖ gen lµ do tÝnh thÝch nghi hay chØ lµ sù kiÖn ngÉu nhiªn, McDonald-Kreitman (1991) ®−a ra m« h×nh so s¸nh sù ®a h×nh di truyÒn trong ph¹m vi mét loµi víi sù ph©n li gi÷a c¸c loµi kh¸c nhau t¹i c¸c vÞ trÝ ®ét biÕn ®ång nghÜa vµ kh¸c nghÜa trong vïng m· hãa cña gen. NÕu ë mét gen, tØ sè gi÷a ®ét biÕn kh¸c nghÜa so víi ®ét biÕn ®ång nghÜa trong ph¹m vi mét loµi t−¬ng ®−¬ng víi gi÷a 299
§inh §oµn Long B¶ng 10.2. TÇn sè sö dông axit amin trong 10% c¸c s¶n phÈm cña gen cã møc biÓu hiÖn cao nhÊt vµ 10% c¸c s¶n phÈm cña gen cã møc biÓu hiÖn ë møc thÊp nhÊt ë 3 loµi sinh vËt nh©n s¬ Chi phÝ n¨ng §é lÖch tõ Escherichia coli K12 Streptococcus Bacillus subtilis subsp. l−îng tæng chi phÝ pneumonia R6 subtilis str. 168 Axit hîp (sè ATP) amin(*) n¨ng l−îng ThÊp Cao §é lÖch ThÊp Cao §é lÖch ThÊp Cao §é lÖch trung b×nh tÇn sè tÇn sè tÇn sè sö dông sö dông sö dông Gly (G) 11,7 - 15,66 6,40 8,16 1,76 6,01 8,30 2,29 6,12 8,11 1,99 Ser (S) 11,7 - 15,66 6,65 4,99 - 1,67 6,47 4,96 - 1,51 6,24 5,84 - 0,40 Ala (A) 11,7 - 15,66 8,48 9,76 1,27 5,85 9,80 3,95 7,40 8,70 1,30 Asp (D) 12,7 - 14,66 4,81 5,95 1,15 4,85 6,04 1,19 5,06 5,42 0,36 Asn (N) 14,7 - 12,66 4,45 3,92 - 0,52 3,64 4,60 0,96 3,32 4,24 0,92 Glu (E) 15,3 - 12,06 5,23 7,10 1,87 6,54 7,91 1,37 6,71 8,11 1,40 Gln (Q) 16,3 - 11,06 4,48 3,83 - 0,66 4,43 3,33 - 1,10 3,98 3,46 - 0,52 Thr (T) 18,7 - 8,66 5,41 5,22 - 0,19 4,78 5,97 1,19 4,92 5,82 0,89 Pro (P) 20,3 - 7,06 4,22 4,08 - 0,15 3,17 3,72 0,55 3,87 3,62 - 0,25 Val (V) 23,3 - 4,06 6,24 7,64 1,39 6,54 8,13 1,59 6,59 7,94 1,35 Cys (C) 24,7 - 2,66 1,50 0,92 - 0,57 0,88 0,33 - 0,55 1,02 0,52 - 0,50 Arg (R) 27,3 - 0,06 5,38 5,45 0,07 4,61 4,21 - 0,40 4,71 3,99 - 0,72 Leu (L) 27,3 - 0,06 11,56 8,96 - 2,59 12,70 7,97 - 4,73 10,85 8,40 - 2,45 Lys (K) 30,3 + 2,94 4,34 5,66 1,32 5,96 7,16 1,19 6,25 7,55 1,30 Ile (I) 32,3 + 4,94 6,72 6,03 - 0,69 7,74 6,41 - 1,33 6,79 7,14 0,35 Met (M) 34,3 + 6,94 2,39 2,70 0,31 2,29 2,07 - 0,22 2,65 2,28 - 0,37 His (H) 38,3 + 10,94 2,50 2,05 - 0,45 2,21 1,61 - 0,60 2,74 1,80 - 0,93 Tyr (Y) 50,0 + 22,64 3,15 2,82 - 0,34 4,44 2,96 - 1,48 3,94 2,85 - 1,09 Phe (F) 52,0 + 24,64 4,35 3,71 - 0,64 5,76 3,69 - 2,07 5,56 3,53 - 2,04 Trp (W) 74,3 + 46,94 1,73 1,05 - 0,69 1,13 0,81 - 0,32 1,27 0,67 - 0,60 (*) C¸c axit amin ®−îc xÕp theo thø tù møc chi phÝ n¨ng l−îng cÇn ®Ó tæng hîp nªn mét ph©n tö axit amin t¨ng dÇn (tÝnh t−¬ng ®−¬ng víi sè liªn kÕt pyrophosphate cÇn “®øt g·y” tõ ATP ®Ó gi¶i phãng n¨ng l−îng tù do cÇn cho qu¸ tr×nh tæng hîp)(theo Akashi vµ Gojobori, 2002) c¸c loµi kh¸c nhau, th× hÇu hÕt c¸c ®ét B¶ng 10.3. Tèc ®é thay thÕ nucleotide trung b×nh biÕn ë gen nµy lµ trung tÝnh; tøc lµ, sù trong tr×nh tù ADN cña c¸c gen ®éng vËt cã vó thay thÕ nucleotide cã khuynh h−íng C¸c gen Tèc ®é ®ét biÕn(*) Tèc ®é ®ét biÕn ngÉu nhiªn. Nh−ng nÕu nh÷ng tØ sè nµy kh¸c nghÜa ®ång nghÜa kh¸c nhau, th× cã sù t¸c ®éng cña chän Histone H4 läc tù nhiªn lªn locut. Nãi c¸ch kh¸c, sù Insulin 0,004 1,43 thay thÕ nucleotide ë ®©y cã khuynh Prolactin 0,16 5,41 h−íng lµm t¨ng tÝnh thÝch nghi cña sinh α-Globin 1,29 5,59 vËt. β-Globin 0,56 3,94 0,87 2,96 ë ®éng vËt cã vó, tØ sè gi÷a ®ét Albumin 0,92 6,72 biÕn thay thÕ kh¸c nghÜa víi ®ång nghÜa lµ kh¸c nhau râ rÖt ë c¸c locut kh¸c α-Fetoprotein 1,21 4,90 nhau (b¶ng 10.3). §iÒu nµy ph¶n ¸nh, MHC 5,10 2,40 chän läc tù nhiªn t¸c ®éng víi “c−êng ®é” Apolipoprotein E 0,98 4,04 kh¸c nhau lªn mçi locut. VÝ dô vÒ hai (*) Tèc ®é ®ét biÕn ë ®©y lµ sè lÇn thay ®æi nucleotide t¹i mçi vÞ trÝ nucleotide trªn gen x¶y ra trung b×nh hµng n¨m (x 10-9) nhãm gen m· hãa cho protein lµ histone vµ apolipoprotein minh häa cho thÊy hiÖu qu¶ t¸c ®éng cña chän läc tù nhiªn cßn tïy thuéc vµo chøc n¨ng cña protein. Cô thÓ, histone lµ c¸c protein tÝch ®iÖn d−¬ng, cã chøc n¨ng liªn kÕt ADN vµ lµ thµnh phÇn thiÕt yÕu cña 300
Ch−¬ng 10. Di truyÒn häc ph©n tö vµ tiÕn ho¸ chÊt nhiÔm s¾c ë tÊt c¶ c¸c sinh vËt nh©n thËt. HÇu nh− tÊt c¶ c¸c axit amin cã trong ph©n tö histone (vÝ dô H4) ®Òu t−¬ng t¸c víi c¸c gèc hãa häc kh¸c nhau trªn ph©n tö ADN tÝch ®iÖn ©m. V× vËy, gÇn nh− tÊt c¶ mäi sù thay ®æi trªn ph©n tö histone H4 ®Òu ¶nh h−ëng ®Õn kh¶ n¨ng t−¬ng t¸c cña protein nµy víi ADN. Nh− vËy, histone lµ mét trong nh÷ng nhãm protein cã tèc ®é tiÕn hãa chËm nhÊt. ThËm chÝ, cã thÓ thay thÕ histone H4 cña ng−êi b»ng histone H4 cña nÊm men mµ kh«ng lµm thay ®æi hiÖu qu¶ kiÓu h×nh (dï r»ng nÊm men vµ ng−êi ®· t¸ch li tiÕn hãa tõ hµng tr¨m triÖu n¨m). §iÒu nµy ng−îc víi c¸c apolipoprotein phæ biÕn trong hÖ miÔn dÞch ë §VCXS, vèn cã chøc n¨ng t−¬ng t¸c vµ vËn chuyÓn kh«ng ®Æc hiÖu nhiÒu hîp chÊt lipide kh¸c nhau. MiÒn liªn kÕt lipide cña protein nµy gåm thµnh phÇn chñ yÕu lµ c¸c axit amin kÞ n−íc. C¸c axit amin cã tÝnh kÞ n−íc (vÝ dô: Leu, Ile vµ Val) ®Òu cã thÓ thay thÕ nhau trong miÒn liªn kÕt nµy mµ kh«ng lµm thay ®æi chøc n¨ng cña protein. KÕt qu¶ lµ, nÕu nh− histone H4 chØ thÊy cã mét d¹ng duy nhÊt ë ng−êi, th× apolipoprotein cã hµng chôc d¹ng kh¸c nhau. MÆc dï phÇn lín nh÷ng thay ®æi axit amin ë hÇu hÕt protein th−êng lµ cã h¹i vµ bÞ chän läc tù nhiªn ®µo th¶i, nh−ng còng cã mét sè locut gen chän läc tù nhiªn l¹i “−u tiªn” t¨ng sù biÕn ®æi. VÝ dô ®iÓn h×nh vÒ xu h−íng nµy lµ c¸c nhãm gen cña hÖ thèng miÔn dÞch, bao gåm phøc hÖ t−¬ng hîp m«, c¸c côm gen m· hãa kh¸ng thÓ hoÆc thô thÓ tÕ bµo T (xem ch−¬ng 9). Ch¼ng h¹n, c¸c gen m· hãa phøc hÖ t−¬ng hîp m« MHC lu«n kh¸c nhau gi÷a mçi c¸ thÓ (trõ tr−êng hîp ®a sinh cïng trøng). V× vËy, tØ lÖ ®é biÕn kh¸c nghÜa trong c¸c gen MHC lín h¬n nhiÒu so víi tØ lÖ ®ét biÕn ®ång nghÜa (b¶ng 10.3). MHC lµ mét hä lín cña nhiÒu gen mµ s¶n phÈm do chóng m· hãa quyÕt ®Þnh kh¶ n¨ng nhËn biÕt c¸c kh¸ng nguyªn l¹ cña hÖ thèng miÔn dÞch. Trong c¸c quÇn thÓ ng−êi, kho¶ng 90% c¸c c¸ thÓ nhËn c¸c nhãm gen MHC kh¸c nhau tõ bè vµ mÑ. Khi ph©n tÝch mét nhãm bÊt kú gåm kho¶ng 200 c¸ thÓ, sè alen kh¸c biÖt cña locut MHC dao ®éng tõ 15 ®Õn 30 alen. Møc ®é ®a d¹ng cao cña nh÷ng vïng gen nµy ®−îc chän läc tù nhiªn duy tr×. Bëi v× sè lo¹i virut vµ c¸c thÓ g©y nhiÔm lµ rÊt lín, nªn viÖc duy tr×nh tÝnh ®a h×nh cao sÏ gióp t¨ng sè c¸ thÓ (trong quÇn thÓ) cã kh¶ n¨ng kh¸ng víi nhiÒu lo¹i virut (thùc chÊt lµ ph¸t hiÖn ®−îc kh¸ng nguyªn cña virut ®ã). Nh−ng, trong qu¸ tr×nh tiÕn hãa, song song víi viÖc c¸c quÇn thÓ vËt chñ duy tr× tÝnh ®a d¹ng cao cña hÖ thèng miÔn dÞch th× c¸c virut còng cã tèc ®é tiÕn hãa rÊt nhanh. C¸c gen virut cóm cã tèc ®é thay thÕ nucleotide ®¹t 1,9x10-3 nucleotide mçi n¨m, tøc lµ gÊp 1 triÖu lÇn tèc ®é ®ét biÕn ®ång nghÜa ë vïng m· hãa cña c¸c gen ®éng vËt cã vó. 10.3.2. So s¸nh c¸c hÖ gen 10.3.2.1. So s¸nh hÖ gen lµ c«ng cô nghiªn cøu tiÕn hãa vµ x¸c ®Þnh chøc n¨ng gen Xu h−íng tiÕn hãa chËm cña c¸c tr×nh tù ADN lµ c¬ së cña lÜnh vùc nghiªn cøu hÖ gen häc so s¸nh (comparative genomics). Trong ®ã, toµn bé hÖ gen cña c¸c loµi kh¸c nhau ®−îc so s¸nh víi nhau. Mét trong nh÷ng môc tiªu cña c¸c dù ¸n gi¶i tr×nh tù hÖ gen ë mçi loµi sinh vËt lµ lËp b¶n ®å ®Çy ®ñ cña c¸c gen, nghÜa lµ x¸c ®Þnh vÞ trÝ cña chóng trªn mçi NST. ViÖc lËp b¶n ®å c¸c gen trong hÖ gen ng−êi ®−îc coi lµ nÒn t¶ng cho tiÒm n¨ng øng dông kü thuËt thuËt di truyÒn vµ liÖu ph¸p gen trong viÖc ch÷a trÞ c¸c gen sai háng ë c¸c bÖnh do ®ét biÕn g©y ra, nh− bÖnh hãa x¬ nang hay c¸c bÖnh ung th−. Nh−ng trong thùc tÕ, nÕu chØ x¸c ®Þnh ®−îc vÞ trÝ mét gen nµo ®ã trªn NST th× kh«ng ®ñ ®Ó chØ ra chøc n¨ng cña gen ®ã, còng nh− kh«ng râ gen ®ã t−¬ng t¸c thÕ nµo víi c¸c gen vµ c¸c tr×nh tù kh¸c trong hÖ gen. Cã ®Õn 95% tr×nh tù ADN thuéc c¸c hÖ gen sinh vËt bËc cao lµ c¸c tr×nh tù kh«ng m· hãa. V× vËy, ngay c¶ khi toµn bé tr×nh tù mét hÖ gen ®· ®−îc gi¶i m·, th× viÖc x¸c ®Þnh ph©n ®o¹n nµo lµ vïng m· hãa vµ chøc n¨ng cña s¶n phÈm do chóng m· hãa th−êng kh«ng dÔ dµng. Trong bèi c¶nh ®ã, viÖc so s¸nh c¸c tr×nh 301
§inh §oµn Long tù hÖ gen lµ mét trong nh÷ng c¸ch tèt nhÊt ®Ó dù ®o¸n chøc n¨ng cña mét tr×nh tù nhÊt ®Þnh trong hÖ gen. Cô thÓ lµ, viÖc ph¸t hiÖn ra c¸c tr×nh tù gièng nhau ë hai loµi kh¸c xa nhau lµ dÊu hiÖu cho thÊy vai trß rÊt quan träng cña nh÷ng tr×nh tù nµy. VÝ dô, ng−êi vµ chuét cã tæ tiªn chung c¸ch ®©y kho¶ng 80 – 100 triÖu n¨m. NÕu c¸c gen gi¶ cã tèc ®é thay thÕ nucleotide lµ 5x10-9 t¹i mçi nucleotide mçi n¨m, th× gÇn 1/2 tæng sè nucleotide cña nh÷ng gen nµy (kh«ng bÞ chän läc tù nhiªn ®µo th¶i) sÏ biÕn ®æi Ýt nhÊt mét lÇn kÓ tõ khi tæ tiªn cña ng−êi vµ chuét b¾t ®Çu t¸ch li. Trªn c¬ së ®ã, khi so s¸nh c¸c hÖ gen, cã thÓ nhËn biÕt c¸c vïng cã vai trß quan träng, nh− c¸c ®o¹n m· hãa hay c¸c tr×nh tù liªn kÕt protein ®iÒu hßa t¹i promoter,... Ph−¬ng ph¸p so s¸nh hÖ gen lµ mét c«ng cô kh«ng chØ h÷u hiÖu trong viÖc x¸c ®Þnh vai trß c¸c tr×nh tù trong hÖ gen mµ cßn trong c¸c nghiªn cøu tiÕn hãa. Tuy vËy, ph−¬ng ph¸p so s¸nh hÖ gen còng cã mét sè h¹n chÕ. Ch¼ng h¹n, mét sè gen ë ng−êi kh«ng t×m thÊy gen “®èi t¸c” ë mét sè ®éng vËt bËc thÊp nªn kh«ng thÓ so s¸nh. Ngoµi ra, mét sè protein cã vai trß ®a chøc n¨ng nh−ng sù biÓu hiÖn chøc n¨ng cña nh÷ng protein ®ã kh«ng gièng nhau ë tÊt c¶ c¸c loµi. 10.3.2.2. Tèc ®é tiÕn hãa cña hÖ gen ti thÓ So víi hÖ gen nh©n, hÖ gen ti thÓ cã ph−¬ng thøc sao chÐp vµ di truyÒn kh¸c biÖt. Do vËy, hËu qu¶ cña c¸c ®ét biÕn thay thÕ trong hÖ gen ti thÓ vÒ c¨n b¶n còng kh¸c hÖ gen nh©n. HÖ gen ti thÓ ®éng vËt cã vó chøa mét ph©n tö ADN (kÝ hiÖu lµ mtADN) cã d¹ng sîi kÐp, m¹ch vßng, dµi kho¶ng 15.000 bp. Ph©n tö mtARN cña ng−êi kh¸ ®Æc tr−ng víi kÝch th−íc b»ng kho¶ng 1/10.000 hÖ gen nh©n; m· hãa cho 2 lo¹i rARN, 22 lo¹i tARN vµ 13 lo¹i protein. Víi kÝch th−íc nhá vµ tØ lÖ ®ét biÕn thay thÕ nucleotide ®Æc biÖt cao, hÖ gen ti thÓ lµ mét ®èi t−îng nghiªn cøu tiÕn hãa phï hîp. TØ lÖ ®ét biÕn thay thÕ nucleotide ®ång nghÜa ë c¸c gen ti thÓ ng−êi vµo kho¶ng 5,7x10-8 nucleotide mçi n¨m, gÊp 10 lÇn tØ lÖ ®ét biÕn ®ång nghÜa trung b×nh trong vïng m· hãa cña hÖ gen nh©n. TØ lÖ ®ét biÕn kh¸c nghÜa ë c¸c gen m· hãa protein thuéc hÖ gen ti thÓ rÊt kh¸c nhau. Nh−ng, trong mäi tr−êng hîp, tØ lÖ nµy ®Òu cao h¬n nhiÒu tØ lÖ ®ét biÕn kh¸c nghÜa ë c¸c gen thuéc hÖ gen nh©n. C¬ chÕ nµo dÉn ®Õn viÖc mtADN cã tèc ®é thay ®æi nucleotide lín h¬n nhiÒu so víi ADN hÖ gen nh©n ®Õn nay ch−a râ, nh−ng cã thÓ liªn quan ®Õn tÇn sè sai sãt cao trong qu¸ tr×nh sao chÐp vµ söa ch÷a mtADN (ti thÓ kh«ng cã nhiÒu c¬ chÕ söa ch÷a ADN nh− hÖ gen nh©n). Ngoµi ra, nång ®é cao h¬n cña c¸c chÊt g©y ®ét biÕn, bao gåm c¸c gèc tù do chøa oxy (nh− O2-) vèn lµ s¶n phÈm cña qu¸ tr×nh trao ®æi chÊt diÔn ra trong ti thÓ còng cã thÓ lµ mét nguyªn nh©n dÉn ®Õn tÇn sè ®ét biÕn trong c¸c gen ti thÓ cao h¬n. Mét nguyªn nh©n kh¸c còng cã thÓ lµ do ¸p lùc thÊp h¬n cña chän läc tù nhiªn ®èi víi hÖ gen ti thÓ v× trong mçi tÕ bµo cã hµng chôc ti thÓ kh¸c nhau, trong ®ã trung b×nh mçi ti thÓ chøa 2 b¶n sao mtADN. §ã lµ ch−a kÓ ®Õn c¸c thay ®æi x¶y ra trong phÇn lín c¸c protein, tARN vµ rARN ®−îc hÖ gen ti thÓ m· hãa Ýt g©y ¶nh h−ëng tíi søc sèng cña c¬ thÓ sinh vËt h¬n so víi nh÷ng thay ®æi t−¬ng tù trong hÖ gen nh©n (®Æc biÖt ë c¸c sinh vËt ®a bµo). Mét kh¸c biÖt n÷a gi÷a hÖ gen ti thÓ vµ hÖ gen nh©n lµ hÖ gen ti thÓ chñ yÕu ®−îc di truyÒn theo dßng mÑ. Ti thÓ n»m trong tÕ bµo chÊt, mµ hÇu nh− chØ cã tÕ bµo chÊt tõ trøng (cña mÑ) ®ãng gãp vµo tÕ bµo chÊt hîp tö. KÕt qu¶ lµ, mtADN kh«ng tr¶i qua gi¶m ph©n mµ cã kiÓu gen gièng mÑ. ViÖc hÖ gen ti thÓ tån t¹i ë tr¹ng th¸i ®¬n béi vµ kh«ng tr¶i qua gi¶m ph©n (nghÜa lµ kh«ng cã t¸i tæ hîp do trao ®æi chÐo nh− cÆp NST t−¬ng ®ång trong hÖ gen nh©n) dÉn ®Õn quan ®iÓm cho r»ng hÇu hÕt c¸c ®ét biÕn thay thÕ nucleotide trong hÖ gen ti thÓ lµ do ®ét biÕn (chø kh«ng ph¶i do t¸i tæ hîp di truyÒn) sinh ra. KiÓu di truyÒn nµy cïng víi tèc ®é thay ®æi nhanh cña hÖ gen ti thÓ cung cÊp mét c«ng cô hiÖu qu¶ cho nghiªn cøu tiÕn hãa vµ so s¸nh hÖ gen gi÷a c¸c loµi; hoÆc gi÷a c¸c dßng, gièng, chñng téc … cña cïng mét loµi. 302
Ch−¬ng 10. Di truyÒn häc ph©n tö vµ tiÕn ho¸ 10.3.3. So s¸nh nhiÔm s¾c thÓ ViÖc so s¸nh kiÓu h×nh NST gi÷a c¸c loµi, ®Æc biÖt ë sinh vËt nh©n thËt, lµ mét ph−¬ng ph¸p nghiªn cøu c¬ b¶n ®· cung cÊp nhiÒu th«ng tin quan träng vÒ qu¸ tr×nh h×nh thµnh c¸c loµi. C¸c ®o¹n NST, c¸c gen (hoÆc c¸c ph©n ®o¹n gen) vµ protein (hoÆc c¸c ®o¹n tr×nh tù axit amin) gièng nhau ë nhiÒu loµi kh¸c nhau ®−îc gäi lµ c¸c ®o¹n tr×nh tù b¶o thñ cao. KiÓu h×nh nhuém b¨ng NST (cßn gäi lµ “kiÓu nh©n”) cña ng−êi gièng víi tinh tinh h¬n c¶, sau ®ã lµ víi khØ Gorilla vµ ®−êi −¬i (h×nh 10.9). KiÓu nh©n cña ng−êi, tinh tinh vµ c¸c loµi v−în ng−êi chñ yÕu kh¸c nhau do mét sè ®ét biÕn ®¶o ®o¹n NST (x¶y ra trªn cïng NST). Cßn sù kh¸c biÖt chñ yÕu gi÷a kiÓu nh©n cña ng−êi vµ ba loµi v−în ng−êi nµy víi c¸c loµi linh tr−ëng l©u ®êi h¬n chñ yÕu lµ do c¸c ®ét biÕn chuyÓn ®o¹n NST (x¶y ra gi÷a c¸c NST). NÕu c¶ hai b¶n sao NST sè 2 cña ng−êi bÞ “®øt” lµm ®«i th× kiÓu nh©n cña ng−êi sÏ cã 48 NST vµ lóc ®ã sÏ gièng víi kiÓu nh©n cña c¸c loµi v−în ng−êi. KiÓu h×nh nhuém b¨ng NST sè 1 cña ng−êi, tinh tinh, khØ Gorilla vµ ®−êi −¬i gièng víi kiÓu h×nh nhuém b¨ng cña hai NST nhá t×m thÊy ë mét loµi khØ ®u«i xanh Ch©u Phi. §iÒu nµy cho thÊy, loµi khØ nµy cã quan hÖ di truyÒn, hoÆc thËm chÝ lµ tæ tiªn cña c¸c loµi linh tr−ëng kh¸c. Khi so s¸nh kiÓu h×nh nhuém b¨ng NST cña c¸c loµi cã quan hÖ xa h¬n, ng−êi ta nhËn thÊy kiÓu h×nh nhuém b¨ng cña NST X gièng nhau ë tÊt c¶ c¸c loµi ®éng vËt cã vó. KiÓu h×nh nhuém b¨ng NST gièng nhau ë nhiÒu loµi ®éng vËt rÊt kh¸c nhau vÒ h×nh th¸i lµ mét b»ng chøng cho thÊy nguån gèc chung cña c¸c sinh vËt trªn Tr¸i ®Êt. Nh−ng, v× c¸c ®o¹n NST cã kiÓu h×nh nhuém b¨ng gièng nhau nh−ng ch−a ch¾c mang c¸c gen cã tr×nh tù hoµn toµn gièng nhau nªn viÖc so s¸nh NST kh«ng ph¶i lµ ph−¬ng ph¸p lý t−ëng ®Ó x¸c ®Þnh kho¶ng c¸ch di truyÒn gi÷a c¸c loµi. Kü thuËt nhuém b¨ng NST theo nguyªn t¾c lai huúnh quang t¹i chç - FISH (xem ch−¬ng 11), sö dông c¸c mÉu dß ADN ®¸nh dÊu huúnh quang, cho phÐp so s¸nh c¸c NST t¹i c¸c vÞ trÝ gen ®Æc thï. Sù t−¬ng quan vÒ trËt tù c¸c gen trªn NST gi÷a c¸c loµi lµ c¬ së x¸c ®Þnh mèi quan hÖ tiÕn hãa gi÷a chóng. Ch¼ng h¹n, mét nhãm gåm 11 gen liªn kÕt ®−îc t×m thÊy ®ång thêi trªn vai dµi NST sè 11 cña ng−êi, trªn NST sè 16 cña chuét vµ NST U10 ë bß. Tuy vËy, mét sè gen liªn kÕt trªn NST sè 3 vµ NST sè 21 cña ng−êi ®−îc t×m thÊy cïng n»m p q N T G§ NT G § NTG§ NTG§ NTG§ NTG§ NST sè 1 NST sè 2 NST sè 3 NST sè 4 NST sè 5 NST sè 6 H×nh 10.9. Sù gièng nhau vÒ kiÓu h×nh nhuém b¨ng NST gi÷a ng−êi vµ c¸c loµi linh tr−ëng. NST c¸c loµi ®−îc xÕp theo thø tù tõ tr¸i qua ph¶i gåm ng−êi (N), tinh tinh (T), khØ Gorilla (G) vµ ®−êi −¬i (§). §©y lµ c¸c NST t−¬ng øng víi c¸c NST tõ 1 ®Õn 6 cña ng−êi. C¸c NST kh¸c gi÷a c¸c loµi nµy còng cã sù t−¬ng ®ång cao. NÕu NST sè 2 cña ng−êi “®øt” lµm ®«i th× ng−êi còng cã kiÓu nh©n gåm 48 NST nh− c¸c loµi linh tr−ëng kh¸c. 303
§inh §oµn Long trªn mét NST ë chuét vµ bß. §iÒu nµy ®−a ®Õn gi¶ thiÕt lµ: loµi ®éng vËt cã vó vèn lµ tæ tiªn chung cña ba loµi nªu trªn cïng cã c¸c gen nµy liªn kÕt víi nhau trªn mét NST; sau ®ã, chóng “ph¸t t¸n” ®Õn c¸c NST kh¸c trong qu¸ tr×nh tiÕn hãa. 10.3.4. So s¸nh c¸c tr×nh tù protein Sù kiÖn tÊt c¶ mäi d¹ng sèng trªn Tr¸i ®Êt ®Òu sö dông mét m· di truyÒn chung ®Ó tæng hîp nªn c¸c lo¹i protein lµ b»ng chøng cho thÊy tÊt c¶ mäi d¹ng sèng trªn Tr¸i ®Êt cã chung mét tæ tiªn. ViÖc so s¸nh c¸c tr×nh tù protein gi÷a c¸c loµi sinh vËt kh¸c nhau còng bæ sung thªm d÷ liÖu ñng hé gi¶ thiÕt nµy. VÝ dô, c¸c gen m· hãa keratin tæng hîp protein l«ng cõu cã ®o¹n t−¬ng ®ång n»m trªn NST sè 11 cña ng−êi. Sù gièng nhau vÒ thµnh phÇn vµ tr×nh tù axit amin trong c¸c lo¹i protein t−¬ng øng ë ng−êi vµ tinh tinh lµ ®¸ng ng¹c nhiªn (kho¶ng 99%). Mét sè protein cña hai loµi gièng nhau hoµn toµn. Trªn c¬ së ®ã, khi ph©n tÝch chøc n¨ng cña mét gen míi, c¸c nhµ nghiªn cøu cã thÓ tham kh¶o c¸c d÷ liÖu cã s½n vÒ nh÷ng gen ®· biÕt ë c¸c sinh vËt kh¸c. Hai vÝ dô d−íi ®©y lµ vÒ hai trong sè nh÷ng lo¹i protein cã tÝnh b¶o thñ nhÊt 10.3.4.1. Cytochrome C B¶ng 10.4. Sù tiÕn hãa trong tr×nh tù axit amin cña protein cytochrom C Cã lÏ, cytochrome C lµ mét protein ®−îc nghiªn cøu kü nhÊt ®Õn nay vÒ khÝa c¹nh tiÕn Loµi Sè axit amin kh¸c biÖt víi hãa. Protein nµy cã vai trß “b¾t gi÷” n¨ng l−îng cytochrom C cña ng−êi tõ c¸c chÊt dinh d−ìng trong qu¸ tr×nh h« hÊp tÕ bµo ë ti thÓ. 20 trong tæng sè 104 axit amin cña Tinh tinh 0 protein nµy cã vÞ trÝ gièng hÖt nhau ë tÊt c¶ c¸c loµi eukaryote. Hai loµi cµng cã quan hÖ gÇn, th× KhØ Rhesus 1 cã møc ®é gièng nhau vÒ tr×nh tù axit amin trªn ph©n tö cytochrome C cµng cao. VÝ dô, Thá 9 cytochrome C cña ng−êi kh¸c cña ngùa lµ 12 axit amin, kh¸c víi cytochrome C cña k¨ng¬ru lµ 8 Bß 10 axit amin, nh−ng gièng hÖt cytochrome C cña tinh tinh (b¶ng 10.4). Chim bå c©u 12 Õch 20 Ruåi giÊm 24 Lóa m× 37 NÊm men 42 10.3.4.2. C¸c protein homeobox Mét nhãm gen kh¸c còng thay ®æi rÊt Ýt trong suèt qu¸ tr×nh tiÕn hãa ®−îc gäi lµ c¸c gen homeobox, gäi t¾t lµ HOX. C¸c gen nµy m· hãa cho c¸c yÕu tè phiªn m· ®iÒu khiÓn thø tù “bËt” vµ “t¾t” c¸c gen trong qu¸ tr×nh ph¸t triÓn ph«i. Sù phèi hîp gi÷a c¸c yÕu tè phiªn m· nµy víi c¸c yÕu tè phiªn m· kh¸c quy ®Þnh vÞ trÝ vµ thêi ®iÓm ph¸t sinh c¸c c¬ quan ë ph«i. C¸c protein homeobox cã mét ®o¹n tr×nh tù b¶o thñ cao gåm 60 axit amin, gäi lµ miÒn homeo (hay cßn gäi lµ miÒn ®ång h×nh, homeodomain), ®−îc m· hãa bëi mét ®o¹n tr×nh tù 180 nucleotide trªn ADN (còng ®−îc gäi lµ homeobox). TÊt c¶ c¸c gen mang ®o¹n tr×nh tù homeobox ®−îc gäi lµ c¸c gen kiÓu homeo. C¸c gen kiÓu homeo ®−îc t×m thÊy ë c¶ ®éng bËc thÊp (cã cÊu t¹o c¬ thÓ ®¬n gi¶n nh− søa) còng nh− ë ®éng vËt bËc cao (cã cÊu t¹o c¬ thÓ phøc t¹p nh− con ng−êi). ë tÊt c¶ c¸c loµi mµ c¸c gen HOX ®· ®−îc gi¶i tr×nh tù, c¸c gen nµy ®Òu cã vai trß “bè trÝ cÊu tróc c¬ thÓ”. HÖ gen ng−êi vµ c¸c loµi ®éng vËt cã x−¬ng sèng cã 39 gen HOX, ®−îc tæ chøc thµnh 4 côm gen, kÝ hiÖu lµ A, B, C vµ D. C¸c gen nµy ®Òu chøa rÊt Ýt intron. §iÓm ®¸ng l−u ý ë c¸c côm gen HOX lµ mçi gen chØ ®−îc biÓu hiÖn vµo mét thêi ®iÓm nhÊt ®Þnh vµ theo mét trËt tù nhÊt ®Þnh ®−îc ®iÒu khiÓn nghiªm ngÆt trong qu¸ tr×nh ph¸t triÓn ph«i. Thø tù biÓu hiÖn c¸c gen t−¬ng øng ®óng víi thø tù vÞ trÝ cña chóng trªn NST. C¸c thuËt ng÷ 304
Ch−¬ng 10. Di truyÒn häc ph©n tö vµ tiÕn ho¸ “homeobox” vµ “homeodomain” cã xuÊt xø tõ “homeotic” nghÜa lµ “thuéc phÇn ®ét biÕn”. Së dÜ nh− vËy, v× nh÷ng gen homeobox ®Çu tiªn ®−îc t×m thÊy liªn quan ®Õn c¸c ®ét biÕn g©y rèi lo¹n cÊu tróc th©n ë ruåi giÊm. Vai trß trong tiÕn hãa cña mét sè gen homeobox ®· ®−îc nªu ë môc 10.2. C¸c ®ét biÕn ë c¸c gen homeobox g©y nªn mét sè bÖnh di truyÒn ë ng−êi. ë mét d¹ng bÖnh “m¸u tr¾ng”, mét ®ét biÕn gen homeobox lµm cho mét sè tÕ bµo b¹ch cÇu ch−a thµnh thôc (ch−a chÝn) chuyÓn sang con ®−êng ph¸t triÓn c¬ quan bÊt th−êng. TÕ bµo bÊt th−êng nµy duy tr× tèc ®é ph©n chia nhanh vèn cã cña tÕ bµo b¹ch cÇu ch−a chÝn dÉn ®Õn bÖnh ung th−. Mét bÖnh kh¸c còng cã nguyªn nh©n tõ ®ét biÕn gen homeobox ®−îc gäi lµ Héi chøng §i-Gioãcd¬ (DiGeorge). MÆc dï c¸c c¸ thÓ bÞ bÖnh nµy kh«ng cã kiÓu h×nh “ch©n mäc tõ ®Çu” nh− ë c«n trïng (xem môc 10.2) nh−ng kiÓu biÓu hiÖn th× t−¬ng tù. Nh÷ng c¸ thÓ m¾c héi chøng nµy th−êng thiÕu tuyÕn øc vµ tuyÕn cËn gi¸p; c¸c c¬ quan nh− tai, mòi, miÖng, cæ ... ph¸t triÓn bÊt th−êng. Nh− vËy, vÞ trÝ cña c¸c c¬ quan bÊt th−êng nµy còng t−¬ng quan víi c¸c ®èt th©n phÝa tr−íc ë c«n trïng. Mét sè thÝ nghiÖm chuyÓn gen homeobox tõ loµi nµy sang loµi kh¸c cho thÊy vai trß thiÕt yÕu vµ chøc n¨ng gièng nhau cña c¸c gen homeobox cã nguån gèc tõ c¸c loµi kh¸c nhau. Khi ruåi giÊm ®−îc chuyÓn gen homeobox tõ chuét, kiÓu h×nh ®ét biÕn xuÊt hiÖn còng gièng hÖt nh− khi gen homeobox cña chÝnh ruåi giÊm biÓu hiÖn bÊt th−êng. T−¬ng tù nh− vËy, khi gen homeobox cña ng−êi ®−îc chuyÓn vµo chuét, sù biÓu hiÖn chøc n¨ng cña nã gièng víi gen “®èi t¸c” cña chuét. Nh− vËy, ho¹t ®éng cña c¸c gen homeobox cã lÏ lµ c¬ chÕ c¬ b¶n ®iÒu khiÓn qu¸ tr×nh ph¸t triÓn ë mäi sinh vËt ®a bµo. 10.4. §ång hå ph©n tö vµ x©y dùng c©y chñng lo¹i ph¸t sinh 10.4.1. ThuyÕt ®ång hå ph©n tö 10.4.1.1. C¬ së h×nh thµnh thuyÕt ®ång hå ph©n tö Nh− nªu ë trªn, møc ®é thay thÕ nucleotide t¹i mçi vïng ADN cña hÖ gen còng nh− sù thay thÕ axit amin trong c¸c ph©n tö protein ®−îc c¸c gen m· hãa lµ kh¸c nhau, vµ phô thuéc vµo ¸p lùc cña chän läc tù nhiªn lªn mçi locut vµ chøc n¨ng cña c¸c s¶n phÈm gen. Tuy vËy, ë c¸c locut cã ¸p lùc chän läc t−¬ng ®−¬ng th× tèc ®é thay ®æi trong c¸c tr×nh tù ADN lµ æn ®Þnh, khi xÐt trong qu·ng thêi gian tiÕn hãa l©u dµi. Vµo nh÷ng n¨m 1960, Zuckerkandl vµ Linus Pauling lµ nh÷ng ng−êi ®Çu tiªn tiÕn hµnh so s¸nh tr×nh tù c¸c protein vµ rót ra nhËn xÐt r»ng: tèc ®é thay thÕ c¸c axit amin trong cïng ph©n tö protein vÒ c¬ b¶n lµ æn ®Þnh qua hµng triÖu n¨m tiÕn hãa. Trªn c¬ së nhËn ®Þnh nµy, hä ®· vÝ sù tÝch lòy c¸c ®ét biÕn thay thÕ axit amin nh− nhÞp ®Õm cña ®ång hå tiÕn hãa vµ gäi lµ thuyÕt ®ång hå ph©n tö. §ång hå ph©n tö cã thÓ ch¹y víi tèc ®é kh¸c nhau khi xÐt ë c¸c protein kh¸c nhau, nh−ng sù kh¸c nhau gi÷a hai protein t−¬ng ®ång th× t−¬ng quan chÆt víi kho¶ng thêi gian kÓ tõ khi hai loµi (mang hai lo¹i protein t−¬ng ®ång) t¸ch li tiÕn hãa tõ tæ tiªn chung (h×nh 10.10). ThuyÕt ®ång hå ph©n tö ngay lËp tøc ®· thóc ®Èy c¸c nghiªn cøu tiÕn hãa. Tèc ®é thay ®æi æn ®Þnh gi÷a c¸c tr×nh tù t−¬ng ®ång kh«ng chØ gióp x¸c ®Þnh ®−îc mèi quan hÖ di truyÒn gi÷a c¸c loµi, mµ cßn gióp −íc tÝnh qu·ng thêi gian mµ chóng ph©n li khái nhau (gièng nh− c¸ch ®ång vÞ phãng x¹ ®−îc dïng ®Ó x¸c ®Þnh tuæi hãa th¹ch). Dï vËy, trong thùc tÕ thuyÕt ®ång hå ph©n tö còng nhËn ®−îc nh÷ng ý kiÕn kh«ng ®ång t×nh. Ch¼ng h¹n, c¸c nhµ tiÕn hãa kinh ®iÓn cho r»ng nhÞp ®iÖu tiÕn hãa thÊt th−êng cña nhiÒu ®Æc ®iÓm h×nh th¸i kh«ng t−¬ng ®ång víi tèc ®é thay ®æi æn ®Þnh ë møc ph©n tö. Trong mét sè tr−êng hîp, kÕt qu¶ −íc tÝnh thêi gian ph©n li tiÕn hãa dùa trªn c¸c ph−¬ng ph¸p kinh ®iÓn vµ ph©n tö kh«ng thèng nhÊt víi nhau. 305
§inh §oµn Long Sè axit amin thay ®æi trong 100 axit amin Sù t¸ch li tæ tiªn Ph©n li tiÕn hãa cña c¸c thùc vËt vµ ®éng loµi ®éng vËt cã vó vËt (1,2 tû n¨m) Chim/ bß s¸t (240 triÖu n¨m)C¸c Hemoglobin §éng vËt cã vó / bß s¸tfibrinopeptide (5,8 triÖu n¨m) (300 triÖu n¨m)(1,1 triÖu n¨m) Bß s¸t / c¸ (400 triÖu n¨m) Cytochrome C C¸ x−¬ng / c¸ miÖng trßn (20 triÖu n¨m) (500 triÖu n¨m) §éng vËt cã x−¬ng sèng / c«n trïng (600 triÖu n¨m) TriÖu n¨m tiÕn hãa H×nh 10.10. Tèc ®é tiÕn hãa kh¸c nhau cña c¸c protein. C¸c protein Fibrinogen chÞu ¸p lùc chän läc tù nhiªn thÊp h¬n vµ cã tÇn sè ®ét biÕn trung tÝnh thay thÕ nucleotide cao, cßn cytochrom C chÞu ¸p lùc chän läc tù nhiªn cao h¬n vµ cã tÇn sè ®ét biÕn trung tÝnh thÊp. Sè liÖu tÝnh trung b×nh tõ nhiÒu sinh vËt kh¸c nhau. 10.4.1.2. C¸ch tÝnh tèc ®é tiÕn hãa t−¬ng ®èi PhÇn lín kho¶ng thêi gian tiÕn hãa ph©n li (biÕn sè T trong ph−¬ng tr×nh 10.3) gi÷a c¸c loµi hoÆc nhãm loµi sinh vËt trong c¸c nghiªn cøu tiÕn hãa ®−îc tÝnh to¸n dùa trªn c¸c mÉu hãa th¹ch kh«ng hoµn chØnh ®· cã tuæi hµng ngh×n thËm chÝ hµng triÖu n¨m. Do ®ã, gi¸ trÞ T x¸c ®Þnh ®−îc th−êng chØ lµ gi¸ trÞ t−¬ng ®èi vµ ®«i khi cã sai sè lín. §Ó gi¶m thiÓu sai sè nµy, Sarich vµ Wilson (1973) ®· ®Ò ra mét c¸ch tÝnh ®¬n gi¶n gäi lµ c¸ch tÝnh tèc ®é tiÕn hãa t−¬ng ®èi. Theo m« h×nh nµy, ®Ó x¸c ®Þnh tèc ®é thay thÕ nucleotide t−¬ng ®èi ë hai loµi (1) vµ (2) thuéc cïng mét dßng tiÕn hãa, ng−êi ta sö dông mét loµi thø (3) cã quan hÖ xa h¬n hai loµi (1) vµ (2), ®−îc gäi lµ loµi ngoµi nhãm (h×nh 10.11). Ch¼ng h¹n, nÕu loµi (1) vµ (2) lÇn l−ît lµ ng−êi vµ khØ Gorilla, th× loµi thø (3) cã thÓ lµ mét loµi linh tr−ëng nµo ®ã, ch¼ng h¹n nh− khØ ®Çu chã - Papio. NÕu thêi ®iÓm trong qu¸ tr×nh tiÕn hãa mµ loµi (1) vµ (2) t¸ch li khái nhau ®−îc kÝ hiÖu lµ A, th× sè nucleotide kh¸c biÖt (d) cã thÓ cã gi÷a hai loµi sÏ b»ng tæng sè nucleotide thay ®æi xuÊt hiÖn ë mçi loµi kÓ tõ thêi ®iÓm A, v× vËy: d13 = dA1 + dA3 (ph−¬ng tr×nh 10.4) d23 = dA2 + dA3 (ph−¬ng tr×nh 10.5) d12 = dA1 + dA2 (ph−¬ng tr×nh 10.6) trong ®ã, sè nucleotide kh¸c biÖt gi÷a c¸c loµi (1), (2) vµ (3) (tøc lµ d13, d23 vµ d12) cã thÓ x¸c ®Þnh ®−îc tõ thùc nghiÖm. Khai triÓn c¸c ph−¬ng tr×nh ®¹i sè ®¬n gi¶n trªn, ta sÏ thu 306
Ch−¬ng 10. Di truyÒn häc ph©n tö vµ tiÕn ho¸ ®−îc sè nucleotide thay ®æi t−¬ng ®èi ë mçi loµi (1) vµ (2) kÓ tõ thêi ®iÓm A (tøc lµ tõ khi chóng b¾t ®Çu ph©n li tõ tæ tiªn chung) lµ: dA1 = (d12 + d13 – d23)/2 (ph−¬ng tr×nh 10.7) dA2 = (d12 + d23 – d13)/2 (ph−¬ng tr×nh 10.8) Theo thuyÕt ®ång hå ph©n tö, kho¶ng thêi gian tÝnh tõ thêi ®iÓm A cña hai loµi (1) vµ (2) lµ nh− nhau, nªn dA1 = dA2. Khi d÷ liÖu vÒ tr×nh tù hÖ gen cña c¸c loµi còng nh− sè l−îng loµi ®−îc gi¶i m· tr×nh tù hÖ gen ngµy cµng t¨ng vµ ®Çy ®ñ th× tiÒn ®Ò cña thuyÕt ®ång hå ph©n tö cho r»ng tèc ®é tiÕn hãa cña mçi gen nhÊt ®Þnh sÏ æn ®Þnh qua thêi gian ë tÊt c¶ c¸c dßng tiÕn hãa. Thùc nghiÖm thùc tÕ cho thÊy tèc ®é thay thÕ nucleotide trong c¸c gen ë chuét ®ång vµ chuét nh¾t nh×n chung lµ t−¬ng ®−¬ng nhau. Nh−ng ng−îc l¹i, ë nhãm loµi linh tr−ëng, ng−êi vµ c¸c loµi v−în ng−êi cã møc ®é thay thÕ nucleotide chØ b»ng mét nöa so víi c¸c loµi khØ kÓ tõ khi cã sù ph©n li tiÕn hãa tõ tæ tiªn chung. T−¬ng tù nh− vËy, khi sö dông c¸ch tÝnh tèc ®é tiÕn hãa t−¬ng ®èi dùa trªn so s¸nh c¸c gen t−¬ng ®ång gi÷a ng−êi vµ chuét ®ång, th× tèc ®é thay thÕ nucleotide cña c¸c loµi linh tr−ëng d−êng nh− chØ 1 2 3 b»ng mét nöa so víi c¸c loµi gÆm nhÊm kÓ tõ khi cã sù ph©n li tiÕn hãa cña c¸c ®éng vËt cã vó (c¸ch ®©y tõ 80 ®Õn 100 triÖu n¨m). Nh− vËy, cã sù kh¸c nhau vÒ tèc ®é cña ®ång hå ph©n tö ë c¸c nhãm loµi kh¸c nhau. V× A lý do ®ã, ®é lÖch thùc tÕ tõ tèc ®é tiÕn hãa trung b×nh ë mçi nhãm ph©n lo¹i (cña c¸c loµi ®ang tån t¹i) lµ mét khã kh¨n ®Ó cã thÓ x¸c ®Þnh chÝnh x¸c thêi ®iÓm xuÊt hiÖn vµ qu·ng thêi gian tån t¹i cña c¸c loµi tæ tiªn, tõ ®ã tiÕn hãa ph©n li thµnh c¸c loµi sinh vËt ngµy nay. §Ó cã thÓ tÝnh to¸n ®−îc ®óng, cÇn x¸c ®Þnh c¸c loµi H×nh 10.11. X©y dùng c©y tiÕn hãa ®−îc ®em so s¸nh vµ ®èi chiÕu víi nhau cã dïng dïng loµi ®èi chøng ngoµi nhãm. Loµi 3 lµ loµi ®èi chøng ngoµi nhãm (tiÕn hãa “chung” mét ®ång hå ph©n tö (nh− c¸c loµi chuét nªu ®éc lËp tr−íc khi cã sù ph©n li cña hai loµi 1 trªn) hay kh«ng? vµ 2). A lµ tæ tiªn chung cña hai loµi 1 vµ 2. 10.4.1.3. T¹i sao tèc ®é tiÕn hãa l¹i kh¸c nhau gi÷a c¸c nhãm loµi? Cã mét sè nguyªn nh©n cã thÓ gióp gi¶i thÝch hiÖn t−îng nµy. Ch¼ng h¹n, yÕu tè vßng ®êi vµ chu tr×nh sinh s¶n ng¾n cña c¸c loµi khØ vµ chuét so víi ng−êi cã thÓ lµ nguyªn nh©n lµm tèc ®é tiÕn hãa t−¬ng ®èi cña chóng nhanh h¬n. Trong mçi thÕ hÖ, cã thÓ sè lÇn sao chÐp ADN cña c¸c dßng tÕ bµo ph¸t sinh giao tö (vèn kh¸c biÖt lín gi÷a c¸c nhãm loµi) míi thùc sù cã t−¬ng quan chÆt víi tÇn sè thay thÕ nucleotide cña c¸c gen, chø kh«ng ph¶i lµ kho¶ng thêi gian tiÕn hãa ph©n li. Mét nguyªn nh©n kh¸c lµ: kÓ tõ khi tiÕn hãa ph©n li, c¸c nhãm loµi (thËm chÝ c¸c loµi trong cïng nhãm) ngµy cµng cã nhiÒu kh¸c biÖt trong c¸c c¬ chÕ di truyÒn vµ sinh s¶n, bao gåm hiÖu qu¶ cña c¸c c¬ chÕ söa ch÷a ADN, tèc ®é vµ qui m« sinh s¶n, møc ph¬i nhiÔm víi c¸c t¸c nh©n ®ét biÕn vµ kh¶ n¨ng thÝch nghi víi c¸c æ sinh th¸i trong m«i tr−êng sèng cña chóng, v.v... 10.4.2. X©y dùng c©y tiÕn hãa dùa trªn c¸c dÊu hiÖu ph©n tö 10.4.2.1. C¸c dÊu hiÖu ®−îc dïng ®Ó x©y dùng c©y ph¸t sinh chñng lo¹i Trªn c¬ së thuyÕt ®ång hå ph©n tö, mèi quan hÖ di truyÒn gi÷a tÊt c¶ c¸c d¹ng sèng ®Òu cã thÓ ®−îc x¸c ®Þnh dùa trªn viÖc so s¸nh c¸c dÊu hiÖu ph©n tö gi÷a chóng víi nhau. Theo ®ã, c¸c loµi cµng cã nhiÒu dÊu hiÖu gièng nhau, cµng cã quan hÖ gÇn. 307
§inh §oµn Long Tr−íc ®©y, khi ch−a cã c¸c c«ng cô sinh häc ph©n tö, mèi quan hÖ di truyÒn gi÷a c¸c loµi ®−îc x¸c ®Þnh chñ yÕu dùa trªn viÖc so s¸nh c¸c dÊu hiÖu h×nh th¸i. NÒn t¶ng cña viÖc sö dông c¸c dÊu hiÖu h×nh th¸i lµ quan ®iÓm cho r»ng: nÕu c¸c dÊu hiÖu h×nh th¸i gièng nhau th× c¸c gen chi phèi c¸c ®Æc ®iÓm h×nh th¸i ®ã còng gièng nhau, vµ ng−îc l¹i. Bªn c¹nh c¸c dÊu hiÖu h×nh th¸i, mét sè dÊu hiÖu kh¸c, bao gåm tËp tÝnh, cÊu tróc tÕ bµo, hãa sinh … còng ®−îc kÕt hîp sö dông trong c¸c nghiªn cøu tiÕn hãa. ViÖc sö dông c¸c dÊu hiÖu nµy cã hiÖu qu¶ khi nghiªn cøu tiÕn hãa ë nhiÒu nhãm ®éng vËt vµ thùc vËt bËc cao; vµ hiÖn nay vÉn lµ mét ph−¬ng ph¸p nghiªn cøu tiÕn hãa c¬ b¶n. Tuy vËy, viÖc sö dông ®¬n thuÇn c¸c dÊu hiÖu h×nh th¸i béc lé mét sè h¹n chÕ. Cô thÓ, kiÓu h×nh gièng nhau cã thÓ thÊy ë nh÷ng loµi rÊt xa nhau do hiÖn t−îng tiÕn hãa ®ång qui. Ch¼ng h¹n nh−, c¸c loµi chim, d¬i vµ c«n trïng cã thÓ ®−îc xÕp vµo cïng mét nhãm, bëi v× chóng ®Òu “cã c¸nh”. Nh−ng thùc tÕ ®©y lµ nh÷ng loµi cã quan hÖ rÊt xa nhau. VÝ dô nµy kh«ng chØ cho thÊy viÖc sö dông dÊu hiÖu h×nh th¸i ®¬n thuÇn cã thÓ x¸c ®Þnh nhÇm mèi quan hÖ di truyÒn gi÷a mét sè loµi, mµ ®ång thêi cho thÊy, mét sè kiÓu h×nh gièng nhau kh«ng nhÊt thiÕt ph¶i cã kiÓu gen gièng nhau. Ngoµi ra, ë mét sè ®èi t−îng sinh vËt, ®Æc ®iÓm kiÓu h×nh cña chóng rÊt khã quan s¸t vµ so s¸nh. VÝ dô ®iÓn h×nh vÒ ®iÒu nµy lµ c¸c vi sinh vËt (nh− vi khuÈn vµ virut) cã c¸c ®Æc ®iÓm h×nh th¸i khã quan s¸t, hay viÖc so s¸nh gi÷a c¸c loµi ®éng vËt cã vó vµ vi khuÈn hÇu nh− kh«ng t×m thÊy ®Æc ®iÓm h×nh th¸i nµo lµ gièng nhau. Trong nh÷ng tr−êng hîp nµy, c¸c dÊu hiÖu ph©n tö (chñ yÕu lµ ADN) cã thÓ gióp kh¾c phôc c¸c khã kh¨n nªu trªn. Dï vËy, kh«ng cã nghÜa lµ c¸c dÊu hiÖn ph©n tö cã thÓ thay thÕ hoµn toµn c¸c dÊu hiÖu h×nh th¸i, tËp tÝnh hay hãa sinh trong c¸c nghiªn cøu tiÕn hãa. ViÖc sö dông c¸c dÊu hiÖu ph©n tö cho thÊy, tèc ®é tiÕn hãa cã kh¸c nhau ë c¸c dßng tiÕn hãa kh¸c nhau. Do vËy, viÖc x¸c ®Þnh thêi ®iÓm ph©n li tiÕn hãa cña nhiÒu nhãm sinh vËt cÇn kÕt hîp sö dông c¸c dÊu hiÖu ph©n tö víi c¸c lo¹i dÊu hiÖu kh¸c. Trong thùc tÕ, c¸c dÊu hiÖu ADN gióp x©y dùng c©y ph¸t sinh chñng lo¹i hiÖu qu¶ vµ chÝnh x¸c nhÊt khi chóng ®−îc sö dông trong ph¹m vi c¸c nhãm loµi ®· ®−îc ph©n lo¹i s¬ bé b»ng c¸c dÊu hiÖu h×nh th¸i vµ hãa sinh. Trong mét sè tr−êng hîp, khi c¸c dÊu hiÖu h×nh th¸i vµ ph©n tö kh«ng ®−a ra kÕt luËn thèng nhÊt, th× chÝnh lµ c¬ héi ®Ó x¸c ®Þnh møc ®é t¸c ®éng cña chän läc tù nhiªn ®Õn c¸c kiÓu h×nh th¸i kh¸c nhau nh− thÕ nµo. 10.4.2.2. C¸c lo¹i c©y ph¸t sinh chñng lo¹i Tr−íc khi cã c¸c c«ng cô sinh häc ph©n tö, ®· cã nhiÒu ph−¬ng ph¸p kh¸c ®−îc thiÕt lËp nh»m x¸c ®Þnh mèi quan hÖ di truyÒn gi÷a c¸c loµi. Mét trong nh÷ng ph−¬ng ph¸p c¬ b¶n nhÊt lµ x©y dùng s¬ ®å h×nh c©y ®Ó m« t¶ mèi quan hÖ gi÷a c¸c loµi, gäi lµ c©y ph¸t sinh chñng lo¹i hay c©y tiÕn hãa. C¸c b»ng chøng sinh häc ®Õn nay ®Òu cho r»ng: mäi d¹ng sèng trªn Tr¸i ®Êt, kÓ c¶ ®ang tån t¹i hay ®· tuyÖt chñng, ®Òu cã mét tæ tiªn chung duy nhÊt cã mÆt trªn Tr¸i ®Êt c¸ch ®©y kho¶ng 4 tØ n¨m. Mçi c©y ph¸t sinh chñng lo¹i th−êng chØ lµ mét phÇn cña c©y tiÕn hãa xuÊt ph¸t tõ tæ tiªn chung ®ã. Nãi c¸ch kh¸c, nã th−êng chØ gåm mét hay mét sè nh¸nh tiÕn hãa. Mçi cµnh tËn cïng cña mét c©y tiÕn hãa th−êng gåm mét hoÆc mét sè taxon (®¬n vÞ ph©n lo¹i). §iÓm ph©n nh¸nh n»m ë gi÷a c©y tiÕn hãa ®¹i diÖn cho tæ tiªn chung tr−íc khi cã sù ph©n li tiÕn hãa thµnh c¸c nhãm loµi riªng biÖt. ChiÒu dµi cña mçi cµnh ph¶n ¸nh møc ®é kh¸c biÖt gi÷a c¸c taxon. C©y tiÕn hãa nµo cã ®iÓm x¸c ®Þnh tæ tiªn chung cña c¸c nh¸nh cßn l¹i (phÇn ngän) trong c©y tiÕn hãa th× ®−îc gäi lµ c©y tiÕn hãa cã gèc. Ng−îc l¹i, c©y tiÕn hãa kh«ng gèc chØ ph¶n ¸nh mèi quan hÖ vµ sù kh¸c biÖt gi÷a c¸c taxon (t−¬ng øng víi c¸c cµnh) mµ kh«ng ph¶n ¸nh sù tiÕn hãa tõ gèc nh− thÕ nµo. ViÖc x©y dùng c©y tiÕn hãa cã gèc hay kh«ng gèc ®Òu cÇn ®Õn c¸c mÉu taxon ®èi chøng ngoµi nhãm. Ch¼ng h¹n, khi nghiªn cøu mèi quan hÖ di 308
Ch−¬ng 10. Di truyÒn häc ph©n tö vµ tiÕn ho¸ truyÒn gi÷a ng−êi vµ khØ Gorilla, ng−êi ta cã thÓ dïng loµi khØ Papio lµm loµi ®èi chøng ngoµi nhãm. VÒ sè l−îng c©y ph¸t sinh chñng lo¹i. Sè l−îng c©y tiÕn hãa t¨ng lªn cïng sè l−îng taxon ®−îc ®em so s¸nh (b¶ng 10.5). Cô thÓ, khi nghiªn cøu ®ång thêi n taxon, th× sè c©y tiÕn hãa cã gèc (NR) vµ kh«ng gèc (NU) t−¬ng øng cã thÓ cã lµ: NR = (2n – 3)!/[2n-2(n-2)!] (ph−¬ng tr×nh 10.9) Nu = (2n – 5)!/[2n-3(n-3)!] (ph−¬ng tr×nh 10.10) Trong ®ã, ph−¬ng tr×nh 10.9 ®−îc ¸p dông víi n ≥ 2, cßn ph−¬ng tr×nh 10.10 ®−îc ¸p dông víi n ≥ 3. Tuy nhiªn, trong thùc tÕ, c©y tiÕn hãa th−êng ®−îc vÏ ®Ó ph¶n ¸nh mèi quan hÖ gi÷a mét sè l−îng lín c¸c mÉu kh¸c nhau, bao gåm tõ hµng chôc ®Õn hµng tr¨m c¸ thÓ hoÆc taxon. ThÕ nªn sè c©y tiÕn hãa cã thÓ cã thùc tÕ lµ rÊt lín. B¶ng 10.5. Sè l−îng c©y tiÕn hãa cã gèc vµ kh«ng gèc cã thÓ cã t¨ng lªn cïng víi sè l−îng taxon Sè taxon Sè c©y tiÕn hãa Sè c©y tiÕn hãa C¸c alen chung cã gèc kh«ng gèc 2 H×nh 10.12. HiÖn t−îng giao thoa gi÷a c¸c loµi 3 1 1 cã thÓ x¶y ra nÕu loµi tæ tiªn mang locut ®a 4 3 1 h×nh gåm hai hay nhiÒu alen, vµ c¸c alen nµy 5 15 3 ®Òu ®−îc duy tr× ë c¸c loµi míi sau khi t¸ch li. 10 105 15 20 34.459.425 2.027.025 8,20 x 1021 2,22 x 1020 30 4,95 x 1038 8,69 x 1036 VÒ c©y tiÕn hãa gen vµ c©y tiÕn hãa loµi. Mét c©y ph¸t sinh chñng lo¹i ®−îc x©y dùng trªn c¬ së so s¸nh tr×nh tù mét nhãm gen t−¬ng ®ång gi÷a c¸c loµi hoÆc c¸ thÓ kh¸c nhau ®−îc gäi lµ c©y tiÕn hãa gen. Lo¹i c©y tiÕn hãa nµy cã thÓ ph¶n ¸nh lÞch sö tiÕn hãa cña mét gen, nh−ng kh«ng nhÊt thiÕt t−¬ng quan víi sù ph¸t sinh cña c¸c loµi t−¬ng øng. Ng−îc l¹i, c¸c c©y tiÕn hãa loµi th−êng thu ®−îc tõ viÖc kÕt hîp ph©n tÝch nhiÒu gen kh¸c nhau vµ ph¶n ¸nh sù ph¸t sinh cña c¸c loµi. Nghe qua, d−êng nh− c©y tiÕn hãa gen vµ c©y tiÕn hãa loµi “kh«ng t−¬ng ®ång” víi nhau. Nh−ng ®iÒu nµy lµ hîp logic, bëi sù “ph©n li” cña c¸c gen th−êng xuÊt hiÖn tr−íc sù “c¸ch li” cña c¸c quÇn thÓ dÉn ®Õn sù “ph©n li tiÕn hãa” h×nh thµnh c¸c loµi míi. H×nh 10.12 minh häa sù ph©n li cña mét locut. Khi ph©n tÝch locut nµy, mét sè c¸ thÓ cña loµi 1 vµ loµi 2 cßn gièng nhau h¬n khi so s¸nh chóng víi mét sè c¸ thÓ kh¸c cïng loµi. Ch¼ng h¹n nh− locut MHC (xem ch−¬ng 9) vèn cã tÝnh ®a h×nh rÊt cao. NÕu sö dông c¸c alen cña locut nµy ®Ó vÏ c©y tiÕn hãa loµi, th× mét sè c¸ thÓ cña ng−êi vµ khØ Gorilla cã thÓ ®−îc xÕp chung cïng mét nhãm do kiÓu alen cña c¸c c¸ thÓ nµy rÊt gièng nhau. Tõ c¸c ph−¬ng tr×nh 10.9 vµ 10.10, cã thÓ thÊy vÒ lý thuyÕt sè c©y tiÕn hãa cã thÓ cã gi÷a c¸c taxon lµ rÊt lín, nh−ng thùc tÕ bao giê còng chØ cã mét c©y ph¶n ¸nh ®óng mèi quan hÖ gi÷a c¸c taxon. §Ó x¸c ®Þnh ®−îc c©y tiÕn hãa nµy, c¸c d÷ liÖu ph©n tö th−êng ®−îc ph©n tÝch b»ng c¸c thuËt to¸n x¸c suÊt. C©y tiÕn hãa thu ®−îc tõ viÖc ph©n tÝch c¸c d÷ liÖu nh− vËy ®−îc gäi lµ c¸c c©y tiÕn hãa néi suy. Th−êng th× viÖc xö lý c¸c d÷ liÖu kh¸ phøc t¹p (do l−îng d÷ liÖu lín) vµ cÇn sù hç trî cña c¸c hÖ thèng m¸y tÝnh vµ 309
§inh §oµn Long c¸c phÇn mÒm tin sinh häc. Cã 3 d¹ng thuËt to¸n phæ biÕn h¬n c¶ ®−îc dïng trong c¸c phÇn mÒm m¸y tÝnh nh»m x©y dùng c¸c c©y tiÕn hãa, gåm ma trËn kho¶ng c¸ch (distance matrix), tÝch ph©n tiÕn hãa (parsimony-based) vµ hîp lý tèi ®a (maximum likelihood). 10.4.2.3. C¸c ph−¬ng ph¸p x©y dùng c©y ph¸t sinh chñng lo¹i a) Ph−¬ng ph¸p \"Ma trËn kho¶ng c¸ch\" “Ma trËn kho¶ng c¸ch” lµ nhãm c¸c thuËt to¸n ®¬n gi¶n nhÊt, ®−îc sö dông tõ l©u trong c¸c nghiªn cøu tiÕn hãa. §−îc b¾t ®Çu sö dông tõ nh÷ng n¨m 1960, c¸c thuËt to¸n nµy ®−îc dïng ®Ó x¸c ®Þnh mèi quan hÖ gi÷a c¸c loµi dùa trªn c¸c dÊu hiÖu h×nh th¸i. Trong sè ®ã, thuËt to¸n UPGMA (unweighted pair group with arthmetic mean) ph©n tÝch tÊt c¶ c¸c dÊu hiÖu, qua ®ã x¸c ®Þnh kho¶ng c¸ch di truyÒn gi÷a tÊt c¶ c¸c cÆp mÉu; råi gép nhãm tõng cÆp mÉu cã kho¶ng c¸ch di truyÒn thÊp nhÊt. §Ó minh häa cho viÖc ¸p dông thuËt to¸n UPGMA, gi¶ sö chóng ta ph©n tÝch 4 taxon kÝ hiÖu lµ A, B, C vµ D, biÕt r»ng kho¶ng c¸ch gi÷a tõng cÆp taxon ®−îc x¸c ®Þnh nh− sau: Taxon A B C B dAB - - C dAC dBC - D dAD dBD dCD Trong ma trËn nµy, dAB lµ kho¶ng c¸ch di truyÒn ®−îc x¸c ®Þnh b»ng so s¸nh trùc tiÕp c¸c dÊu hiÖu gi÷a taxon A vµ B (cã thÓ tÝnh theo c«ng thøc Jukes-Carton), cßn dAC ph¶n ¸nh kho¶ng c¸ch gi÷a taxon A vµ C, v.v… ThuËt to¸n UPGMA ®Çu tiªn sÏ gép nhãm 2 taxon cã kho¶ng c¸ch nhá nhÊt thµnh mét nhãm (taxon phøc hîp) míi. Gi¶ sö gi¸ trÞ dAB lµ nhá nhÊt, th× taxon phøc hîp ®Çu tiªn sÏ lµ (AB). Sau lÇn gép nhãm ®Çu tiªn nµy, kho¶ng c¸ch gi÷a c¸c taxon sÏ ®−îc tÝnh l¹i gi÷a taxon phøc hîp (AB) víi c¸c taxon cßn l¹i (C vµ D), theo c«ng thøc: d(AB)C = 1/2 (dAC + dBC) vµ d(AB)D = 1/2(dAD + dBD). C¸c taxon cã kho¶ng c¸ch nhá nhÊt l¹i tiÕp tôc ®−îc gép nhãm thµnh mét taxon phøc hîp thø hai. Ch¼ng h¹n ë ®©y d(AB)C < d(AB)D th× phøc hîp tiÕp theo sÏ lµ (ABC), tøc lµ C cã kho¶ng c¸ch di truyÒn gÇn A vµ B h¬n D. Qu¸ tr×nh gép nhãm nh− vËy cø tiÕp tôc cho ®Õn khi tÊt c¶ c¸c taxon ®Òu ®−îc ph©n nhãm hÕt. Trong c©y tiÕn hãa ®−îc x©y dùng theo ph−¬ng thøc UPGMA, nÕu chiÒu dµi mçi cµnh ph¶n ¸nh kho¶ng c¸ch gi÷a c¸c taxon, th× ®iÓm xuÊt ph¸t cña mçi cµnh lu«n ë trung ®iÓm kho¶ng c¸ch gi÷a chóng (vÝ dô: dAB/2 cho cÆp taxon A vµ B). ¦u ®iÓm cña thuËt to¸n UPGMA lµ phÐp ph©n tÝch nhanh vµ ®¬n gi¶n. Nh−ng nh−îc ®iÓm cña UPGMA lµ nã coi tèc ®é tiÕn hãa lµ gièng nhau ë mäi nh¸nh tiÕn hãa (®iÒu nµy kh«ng ph¶i lóc nµo còng ®óng). §iÒu nµy cã nghÜa lµ, UPGMA sÏ phï hîp nhÊt khi x©y dùng c©y tiÕn hãa ë c¸c nh¸nh cã tèc ®é tiÕn hãa t−¬ng ®èi æn ®Þnh. Trong c¸c thuËt to¸n “ma trËn kho¶ng c¸ch”, ngoµi UPGMA, cßn cã mét sè thuËt to¸n kh¸c, nh− “kho¶ng c¸ch khai triÓn” (transformed distance) hay “kÕt nèi l©n cËn” (neighbor-joining, NJ). Nh÷ng thuËt to¸n nµy cho phÐp kÕt hîp tèc ®é tiÕn hãa kh¸c nhau ë c¸c nh¸nh tiÕn hãa vµo cïng c©y tiÕn hãa. Nh×n chung, c¸c thuËt to¸n dùa trªn “ma trËn kho¶ng c¸ch” cho kÕt qu¶ ph©n tÝch nhanh, phï hîp ®Ó xö lý mét l−îng d÷ liÖu lín; cho biÕt kho¶ng c¸ch di truyÒn t−¬ng ®èi gi÷a c¸c loµi, nh−ng kh«ng ph¶n ¸nh ®−îc sù tiÕn hãa ë mçi gen. §«i khi, do sù “gi¶n 310
Ch−¬ng 10. Di truyÒn häc ph©n tö vµ tiÕn ho¸ l−îc hãa” qu¸ møc c¸c d÷ liÖu nªn kÕt qu¶ ph©n tÝch kh«ng thèng nhÊt khi dïng c¸c thuËt to¸n kh¸c nhau (ch¼ng h¹n, khi dïng UPGMA vµ NJ). Th−êng th× NJ ®−îc coi lµ cho kÕt qu¶ chi tiÕt h¬n UPGMA. b) Ph−¬ng ph¸p \"TÝch ph©n tiÕn hãa\" (tiÕt kiÖm tèi ®a) NÕu nh− c¸c thuËt to¸n “ma trËn kho¶ng c¸ch” ®¬n thuÇn lµ c¸c thuËt to¸n x¸c suÊt th× “tÝch ph©n tiÕn hãa” dùa trªn nguyªn t¾c sinh häc lµ “®ét biÕn hiÕm khi x¶y ra”. ThuËt to¸n nµy cho r»ng: c©y tiÕn hãa phï hîp nhÊt lµ c©y cã sè ®ét biÕn thÊp nhÊt trong tÊt c¶ nh÷ng c©y tiÕn hãa cã thÓ cã gi÷a c¸c taxon ®−îc ph©n tÝch. Do vËy, c©y tiÕn hãa thu ®−îc tõ “tÝch ph©n tiÕn hãa” ®−îc gäi lµ c©y tÝch ph©n tiÕn hãa tèi −u. §Ó minh häa ph−¬ng ph¸p “tÝch ph©n tiÕn hãa”, h·y xem vÝ dô vÒ 4 tr×nh tù sau ®©y: VÞ trÝ 1 2 3 4 5(*) 6(*) Tr×nh tù G C G A T G GTGTTG GT TGC A GTCCCA Khi so s¸nh gi÷a c¸c tr×nh tù nµy, chØ hai vÞ trÝ 5 vµ 6 (®¸nh dÊu *) ®−îc xem lµ “cã t¸c dông th«ng tin”. H×nh 10.13 (trang sau) cho thÊy: cã thÓ cã 3 lo¹i c©y tiÕn hãa kh«ng gèc ph¶n ¸nh mèi quan hÖ gi÷a 4 taxon. C¸c c©y tiÕn hãa kh«ng gèc gép nhãm tr×nh tù 1 víi 2, t¸ch biÖt víi nhãm tr×nh tù 3 víi 4, vµ chØ ®ßi hái mét ®ét biÕn duy nhÊt ®Ó nèi gi÷a hai nhãm. Khi ph©n tÝch tõng vÞ trÝ, chóng ta sÏ thÊy: vÞ trÝ sè 1 “kh«ng cã t¸c dông th«ng tin” bëi v× ®ét biÕn kh«ng x¶y ra ë vÞ trÝ nµy, nªn kh«ng ph©n biÖt ®−îc c¸c taxon. VÞ trÝ sè 2 còng vËy, bëi c¶ ba c©y tiÕn hãa ®Òu chØ cÇn 1 ®ét biÕn. Cßn c¸c c©y tiÕn hãa dùa trªn vÞ trÝ sè 3 ®Òu cÇn 2 ®ét biÕn ; trong khi c¸c c©y tiÕn hãa dùa trªn vÞ trÝ sè 4 ®Òu cÇn 3 ®ét biÕn. V× kh«ng x¸c ®Þnh ®−îc c©y tiÕn hãa nµo cã kh¶ n¨ng x¶y ra h¬n, nªn c¸c vÞ trÝ 1, 2, 3 vµ 4 ®−îc xem lµ “kh«ng cã t¸c dông th«ng tin”. ThuËt to¸n “tÝch ph©n tiÕn hãa” ®Çu tiªn x¸c ®Þnh tÊt c¶ c¸c vÞ trÝ cã t¸c dông th«ng tin b»ng c¸ch so s¸nh tÊt c¶ c¸c tr×nh tù t¹i mçi vÞ trÝ, råi x¸c ®Þnh c©y tiÕn hãa nµo cÇn Ýt ®ét biÕn nhÊt t¹i mçi vÞ trÝ. C©y tiÕn hãa nµo cÇn Ýt ®ét biÕn nhÊt khi xÐt ë tÊt c¶ c¸c vÞ trÝ ®−îc gäi lµ c©y tiÕn hãa \"pháng ®o¸n\". Ngoµi viÖc x©y dùng ®−îc c©y tiÕn hãa, thuËt to¸n “tÝch ph©n cùc ®¹i” cßn cung cÊp mét th«ng tin h÷u Ých kh¸c. §ã lµ, nã cã thÓ pháng ®o¸n tr×nh tù tæ tiªn ë mçi nh¸nh cña c©y tiÕn hãa, bao gåm c¶ c¸c tr×nh tù ë c¸c loµi ®· tuyÖt chñng. §©y lµ mét −u ®iÓm cña phÐp “tÝch ph©n tiÕn hãa”. Trong vÝ dô nªu trªn, phÐp “tÝch ph©n tiÕn hãa” ®· gi¶ thiÕt mçi nucleotide ®Òu cã kh¶ n¨ng ®ét biÕn thay thÕ thµnh mét trong ba lo¹i nucleotide kh¸c víi \"tÇn suÊt\" nh− nhau. Trong thùc tÕ, mét sè phÐp “tÝch ph©n tiÕn hãa” phøc t¹p h¬n ®· ®−îc söa ®æi ®Ó ph¶n ¸nh sù kh¸c nhau gi÷a tÇn sè ®ét biÕn ®ång ho¸n vµ dÞ ho¸n. Tuy vËy, phÐp “tÝch ph©n tiÕn hãa” ®«i khi ch−a ph¶n ¸nh thËt chÝnh x¸c vÒ thêi gian x¶y ra sù t¸ch li tiÕn hãa gi÷a c¸c loµi v× tèc ®é thay thÕ nucleotide gi÷a c¸c nh¸nh tiÕn hãa cã thÓ kh¸c nhau. c) Ph−¬ng ph¸p \"Hîp lý tèi ®a\" Ph−¬ng ph¸p “hîp lý tèi ®a” lµ mét ph−¬ng ph¸p x¸c suÊt thuÇn tóy, th−êng ®−îc sö dông ®Ó kiÓm chøng l¹i c¸c c©y tiÕn hãa ®−îc x©y dùng bëi c¸c ph−¬ng ph¸p kh¸c. 311
§inh §oµn Long Ph−¬ng ph¸p nµy ®¸nh C©y 1 C©y 2 C©y 3 gi¸ mét gi¶ thiÕt tiÕn hãa b»ng viÖc x©y dùng G g g GG g g GG g gG tÊt c¶ c¸c c©y tiÕn hãa VÞ trÝ 1 GG GG G cã thÓ cã trªn c¬ së gi¶ G thiÕt ®ã, råi x¸c ®Þnh C t t TT t t CT t tT c©y tiÕn hãa néi suy lµ VÞ trÝ 2 TT TC T c©y cã x¸c suÊt x¶y ra cao nhÊt qua viÖc ph©n T tÝch c¸c yÕu tè tiÕn hãa. Ch¼ng h¹n, vÒ ®¹i thÓ G g g TT g g GG g gC tÇn sè c¸c ®ét biÕn ®ång CG CT G VÞ trÝ 3 G ho¸n cao h¬n kho¶ng 3 A g g TT g g AA g gG lÇn so víi c¸c ®ét biÕn dÞ VÞ trÝ 4 ho¸n. Trong mét nhãm G C G CT C cã 3 tr×nh tù kh¸c nhau VÞ trÝ 5 T t t TC t t TT t cC ë mét vÞ trÝ nucleotide C CT CT C mang c¸c baz¬ t−¬ng øng lµ C, T vµ A. Tr×nh G g g GA g g AG g a A tù mang c¸c baz¬ C vµ T VÞ trÝ 6 ®−îc xem lµ cã quan hÖ di truyÒn gÇn nhau h¬n A A G GG A so víi tr×nh tù mang baz¬ A. Ph−¬ng ph¸p H×nh 10.13. Gi÷a 4 taxon, t¹i mçi vÞ trÝ (nucleotide), cã thÓ cã 3 c©y tiÕn “hîp lý tèi ®a” th−êng hãa kh«ng gèc kh¸c nhau. C¸c nucleotide viÕt b»ng ch÷ in hoa lµ c¸c ®−îc xem lµ ph−¬ng nucleotide ®−îc t×m thÊy ë mçi taxon t−¬ng øng víi tõng vÞ trÝ. C¸c nucleotide ph¸p cung cÊp th«ng tin viÕt b»ng ch÷ th−êng biÓu diÔn lo¹i nucleotide cã ë tæ tiªn \"pháng ®o¸n\". chÝnh x¸c vµ chi tiÕt h¬n §−êng liÒn nÐt cã vßng trßn biÓu diÔn lo¹i ®ét biÕn thay thÕ nucleotide cÇn x¶y c¶ so víi c¸c ph−¬ng ra ®Ó thu ®−îc sù ®a h×nh tr×nh tù ADN thùc tÕ. C¶ 3 c©y tiÕn hãa cã thÓ cã ë ph¸p kh¸c. Nh−ng thùc vÞ trÝ 1 ®Òu kh«ng cÇn ®ét biÕn nµo; trong khi ë vÞ trÝ 2 ®Òu cÇn mét ®ét biÕn, ë tÕ, tèc ®é xö lý th«ng tin vÞ trÝ 3 ®Òu cÇn 2 ®ét biÕn vµ vÞ trÝ 4 ®Òu cÇn 3 ®ét biÕn. V× vËy, tõ sù thay thÕ theo ph−¬ng ph¸p nµy nucleotide ë c¸c vÞ trÝ 1, 2, 3 vµ 4 kh«ng x¸c ®Þnh ®−îc c©y tiÕn hãa nµo \"dÔ\" rÊt chËm vµ kh«ng “kh¶ x¶y ra h¬n. Trong ph−¬ng ph¸p tÝch ph©n tiÕn hãa, c¸c vÞ trÝ nµy ®−îc coi lµ \"kh«ng cã t¸c dông th«ng tin\". Ng−îc l¹i, c¸c vÞ trÝ 5 vµ 6 cho thÊy mét c©y tiÕn hãa cÇn Ýt ®ét biÕn h¬n so víi nh÷ng c©y kh¸c; nªn nh÷ng vÞ trÝ nµy ®−îc xem lµ \"cã t¸c dông th«ng tin\". C©y tiÕn hãa \"pháng ®o¸n\" lµ c©y cÇn sè ®ét biÕn Ýt thi” khi ph©n tÝch mét nhÊt trong tÊt c¶ c¸c c©y tiÕn hãa cã thÓ cã khi xÐt ë tÊt c¶ c¸c vÞ trÝ. sè l−îng d÷ liÖu lín, kÓ c¶ khi sö dông c¸c hÖ thèng m¸y tÝnh m¹nh nhÊt hiÖn nay (vÝ dô: tõ b¶ng 10.5 ta thÊy, nÕu sè taxon ≥ 30, th× sè c©y tiÕn hãa cã thÓ cã ≥ 5x1038). Tuy vËy, víi tèc ®é ph¸t triÓn nhanh chãng cña lÜnh vùc tin sinh häc vµ c¸c “c¶i tiÕn” trong øng dông c¸c thuËt to¸n, ph−¬ng ph¸p “hîp lý tèi ®a” cã tiÒm n¨ng øng dông ngµy cµng réng r·i. Tuy vËy, hiÖn nay nh×n chung ch−a cã m« h×nh nµo −u thÕ h¬n h¼n c¸c m« h×nh kh¸c. Nh− mét qui −íc chung, nÕu mét tËp hîp sè liÖu nhÊt ®Þnh khi ®−îc ph©n tÝch bëi hay ba thuËt to¸n (m« h×nh) kh¸c nhau cïng ®−a ®Õn mét kiÓu h×nh c©y tiÕn hãa, th× c©y tiÕn hãa ®ã cã thÓ tin cËy ®−îc. Trong nh÷ng tr−êng hîp kh¸c, c¸c m« h×nh cã thÓ dÉn ®Õn c¸c kÕt luËn kh¸c nhau. V× vËy, víi tõng ®èi t−îng cô thÓ, cÇn c©n nh¾c lùa chän m« h×nh phï hîp vµ cÇn m« t¶ m« h×nh ®−îc sö dông trong c¸c b¸o c¸o khoa häc. 312
Ch−¬ng 10. Di truyÒn häc ph©n tö vµ tiÕn ho¸ 10.5. TiÕn hãa hÖ gen vµ nguån gèc loµi ng−êi 10.5.1. HÖ gen ng−êi chøa mét sè gen Ýt ®Õn ng¹c nhiªn Nh÷ng n¨m cuèi cña thÓ kû XX ®¸nh dÊu mét b−íc ngoÆt quan träng trong c¸c nghiªn cøu tiÕn hãa häc vµ ph©n tÝch chøc n¨ng hÖ gen ë ng−êi hiÖn ®¹i (Homo sapiens, gäi t¾t lµ ng−êi). §ã lµ viÖc hÖ gen ng−êi ®−îc gi¶i tr×nh tù hoµn chØnh nhê thµnh qu¶ cña Dù ¸n hÖ gen ng−êi (HGP) ®−îc triÓn khai tõ n¨m 1990 tíi n¨m 2006. C¸c môc tiªu cña dù ¸n HGP bao gåm: 1) x¸c ®Þnh tr×nh tù cña toµn bé hÖ gen ng−êi (kho¶ng trªn 3 triÖu cÆp nucleotide), 2) x¸c ®Þnh tÊt c¶ c¸c gen cã trong hÖ gen ng−êi, 3) l−u gi÷ th«ng tin hÖ gen ng−êi trong c¸c hÖ thèng c¬ së d÷ liÖu, 4) c¶i tiÕn c¸c c«ng cô qu¶n lý vµ ph©n tÝch d÷ liÖu liªn quan ®Õn hÖ gen ng−êi, 5) chuyÓn giao c«ng nghÖ vµ tuyªn truyÒn c¸c nguyªn t¾c ®¹o ®øc sinh häc trong viÖc khai th¸c th«ng tin tõ hÖ gen ng−êi. MÆc dï ngµy 26 th¸ng 6 n¨m 2000, Tæng thèng Mü Bill Clinton vµ Thñ t−íng Anh Tony Blair ®· tuyªn bè b¶n th¶o ®Çu tiªn hÖ gen ng−êi ®· hoµn thµnh, nh−ng thùc tÕ ®Õn cuèi n¨m 2003, dù ¸n hÖ gen ng−êi míi kÕt thóc; vµ ®Õn th¸ng 6/2006, viÖc gi¶i m· vµ lËp b¶n ®å NST lín nhÊt cña hÖ gen ng−êi (NST sè 1) míi thùc sù hoµn thµnh. §Õn nay, mÆc dï hÖ gen ng−êi ®· ®−îc gi¶i tr×nh tù hoµn chØnh, th× sè gen trong hÖ gen ng−êi vÉn chØ lµ −íc tÝnh (kho¶ng 20.000 – 25.000 gen). Con sè nµy ban ®Çu ®· thùc sù g©y “sèc” nhiÒu nhµ di truyÒn häc. Bëi, tr−íc khi triÓn khai dù ¸n, trªn c¬ së cÊu tróc phøc t¹p cña c¬ thÓ ng−êi, sù ®a d¹ng cao cña h×nh th¸i vµ tËp tÝnh, phÇn lín c¸c nhµ di truyÒn ®Òu dù ®o¸n hÖ gen ng−êi chøa trªn d−íi 100.000 gen. NhiÒu phÇn mÒm m¸y tÝnh ®· ®−îc dïng ®Ó dù ®o¸n sè gen trong hÖ gen ng−êi, chñ yÕu dùa vµo c¸c dÊu hiÖu cña gen, nh− khung ®äc më (ORF), c¸c tÝn hiÖu nhËn biÕt intron, promoter ... Sau ®ã, c¸c gen dù ®o¸n th−êng ®−îc kiÓm chøng bëi c¸c nghiªn cøu ®éc lËp, nh− qua viÖc t¸ch dßng c¸c ph©n tö cADN xuÊt ph¸t tõ b¶n phiªn m· (mARN) t−¬ng øng cña gen. Nh−ng, nh×n chung ch−a cã phÇn mÒm m¸y tÝnh nµo ®Õn nay cã thÓ x¸c ®Þnh ®−îc ®Çy ®ñ tÊt c¸c gen tõ toµn bé tr×nh tù hÖ gen ®· biÕt. Bëi v×, c¸c ORF ng¾n, ngÉu nhiªn cã thÓ ®−îc x¸c ®Þnh nhÇm lµ gen. Ng−îc l¹i, c¸c gen “thËt” vèn gåm nhiÒu exon ng¾n kh«ng cã cÊu tróc ORF râ rµng cã thÓ bÞ bá sãt. Ngoµi ra, còng cßn nh÷ng “lçi” kh¸c n÷a mµ chóng ta ch−a biÕt ®Çy ®ñ trong c¸c d¹ng cÊu tróc exon-intron cña c¸c gen, hoÆc do “tÝnh tho¸i hãa” cña c¸c tr×nh tù tÝn hiÖu ®iÒu khiÓn sù c¾t – nèi cña c¸c intron vµ exon trong qu¸ tr×nh hoµn thiÖn mARN. Trªn c¬ së c¸c th«ng tin mµ chóng ta ®· nªu, mét ®iÓm ®¸ng l−u ý lµ c¸c loµi ®éng vËt cã vó (gåm c¶ loµi ng−êi) cã c¸c c¬ chÕ ®iÒu khiÓn gen phøc t¹p ®Ó cã thÓ ®ång thêi cã nhiÒu kiÓu biÓu hiÖn gen kh¸c nhau. Nãi c¸ch kh¸c lµ d−êng nh−, tÝnh phøc t¹p cña c¬ thÓ kh«ng nhÊt thiÕt t−¬ng quan víi sè gen cã trong hÖ gen, mµ thay vµo ®ã, nã phô thuéc vµo sè kiÓu biÓu hiÖn cña gen. H·y chó ý lËp luËn sau ®©y: giun trßn (C. elegans) cã kho¶ng 20.000 gen, trong khi ruåi giÊm (D. melanogaster) cã sè gen Ýt h¬n ®¸ng kÓ (d−íi 14.000 gen). Nh−ng, trong thùc tÕ, sù ®a d¹ng vÒ h×nh th¸i vµ tËp tÝnh cña ruåi giÊm l¹i cao h¬n nhiÒu so víi giun trßn. Sù phøc t¹p trong biÓu hiÖn kiÓu h×nh nh− vËy cã thÓ lµ do sù t¨ng lªn vÒ sè kiÓu biÓu hiÖn cña gen. VÝ dô, mét gen ë ruåi giÊm trung b×nh cã thÓ ®−îc ®iÒu khiÓn bëi tõ 3 ®Õn 4 tr×nh tù enhancer kh¸c nhau (t¹i c¸c vÞ trÝ kh¸c nhau cña c¬ thÓ), t¹o nªn kho¶ng 50.000 kiÓu biÓu hiÖn cña gen kh¸c nhau. Ng−îc l¹i, mçi gen ë giun trßn trung b×nh chØ ®−îc ®iÒu khiÓn bëi 1 ®Õn 2 tr×nh tù enhancer. V× vËy, giun trßn chØ cã kho¶ng 30.000 kiÓu biÓu hiÖn gen kh¸c nhau, Ýt h¬n nhiÒu so víi ruåi giÊm (mÆc dï chóng cã nhiÒu gen h¬n). 313
§inh §oµn Long 10.5.2. HÖ gen ng−êi gièng hÖ gen chuét vµ kh«ng kh¸c mÊy hÖ gen tinh tinh Ng−êi vµ chuét chøa mét sè l−îng gen t−¬ng ®èi gièng nhau (−íc l−îng ®Òu vµo kho¶ng 20.000 – 25.000 gen). Kho¶ng 80% sè gen trong hÖ gen cña hai loµi t−¬ng ®ång víi nhau. C¸c protein ®−îc m· hãa bëi c¸c gen t−¬ng ®ång nµy cã tÝnh b¶o thñ cao vµ cã ®Õn 80% tr×nh tù axit amin lµ gièng nhau hoµn toµn. PhÇn lín sù kh¸c nhau trong sè 20% c¸c gen cßn l¹i gi÷a ng−êi vµ chuét lµ do c¸c sù kiÖn lÆp ®o¹n ë nh÷ng tr×nh tù nhÊt ®Þnh. VÝ dô, chuét cã nhiÒu b¶n sao gen cytochrome P450 h¬n so víi ng−êi. TÊt nhiªn, ng−îc l¹i, cã nhiÒu vÝ dô cho thÊy c¸c hä gen ë ng−êi cã møc ®é “më réng” cao h¬n ë chuét. Nh−ng, nh×n chung ®iÓm næi bËt nhÊt khi so s¸nh hÖ gen ng−êi vµ chuét lµ chØ cã rÊt Ýt gen “míi” (nÕu cã) trong hÖ gen ng−êi. Sù gièng nhau gi÷a hÖ gen ng−êi víi hÖ gen c¸c loµi linh tr−ëng, ®iÓn h×nh lµ tinh tinh, thËm chÝ cßn cao h¬n nhiÒu. ChØ cã kho¶ng 2% tr×nh tù hÖ gen gi÷a ng−êi vµ tinh tinh lµ kh¸c nhau. NghÜa lµ trong mét ®o¹n tr×nh tù 100bp ngÉu nhiªn, trung b×nh chØ cã 2 nucleotide thay ®æi. §iÒu nµy cho thÊy tÝnh b¶o thñ cao trong hÖ gen c¸c ®éng vËt cã x−¬ng sèng. Trong khi ®ã, viÖc so s¸nh ngÉu nhiªn hai c¸ thÓ mùc èng trong cïng mét quÇn thÓ cho thÊy hÖ gen cña chóng kh¸c nhau kho¶ng 1%, cßn gi÷a hai quÇn thÓ kh¸c nhau vµo kho¶ng 2,5%. ë ng−êi vµ tinh tinh, tÝnh b¶o thñ trong liªn kÕt gen còng rÊt cao. TrËt tù vµ kho¶ng c¸ch gi÷a c¸c gen liªn kÕt lµ rÊt gièng nhau. Thùc tÕ, c¸c tr×nh tù ADN ®iÒu hßa cã tèc ®é biÕn ®æi (tiÕn hãa) nhanh h¬n so víi c¸c tr×nh tù protein. Cã lÏ, sù tiÕn hãa ph©n li gi÷a ng−êi vµ tinh tinh chØ lµ nh÷ng thay ®æi nhá trong hÖ gen nh−ng ®ñ lµm thay ®æi ho¹t tÝnh cña c¸c tr×nh tù ADN ®iÒu hßa chñ chèt. 10.5.3. Ng−êi vµ mèi quan hÖ di truyÒn víi c¸c loµi linh tr−ëng cì lín Ng−êi ph©n biÖt víi c¸c loµi linh tr−ëng cì lín kh¸c, nh− tinh tinh hay khØ Gorilla, ë mét sè ®Æc ®iÓm ngo¹i h×nh. Trong ®ã c¸c loµi v−în ng−êi cã r¨ng cöa vµ r¨ng nanh lín h¬n nhiÒu so víi ng−êi; x−¬ng hµm cña chóng còng lín h¬n vµ nÆng h¬n. N·o cña v−în ng−êi nhá h¬n n·o ng−êi. §iÓm g¾n gi÷a n·o vµ tñy sèng ë v−în ng−êi bÞ “®Èy” vÒ phÝa sau hép sä, xa h¬n so víi ë ng−êi. H×nh d¸ng vµ tØ lÖ gi÷a c¸c phÇn c¬ thÓ cña ng−êi kh¸c biÖt víi v−în ng−êi; trong ®ã, nÕu ë v−în ng−êi phÇn th©n cã xu h−íng më réng vÒ phÝa d−íi th× ë ng−êi trung b×nh kÝch th−íc phÇn th©n cña c¬ thÓ cã xu h−íng æn ®Þnh tõ vai cho ®Õn th¾t l−ng. TØ sè chiÒu dµi ch©n/th©n cña v−în ng−êi nhá h¬n so víi ng−êi khi ®¹t tuæi tr−ëng thµnh; x−¬ng chËu cña chóng kh«ng cã cÊu tróc phï hîp cho t− thÕ ®øng th¼ng. MÆc dï c¸c loµi v−în ng−êi còng cã thÓ ®i b»ng hai ch©n, nh−ng bµn ch©n cña chóng kh«ng ®ñ v÷ng ®Ó duy tr× viÖc ®i th¼ng l−ng mét c¸ch liªn tôc vµ l©u dµi. Ng−îc l¹i, ng−êi hoµn toµn ®i b»ng hai ch©n (tÊt nhiªn, trõ trÎ s¬ sinh). Bµn tay vµ bµn ch©n ng−êi vµ v−în ng−êi kh¸c nhau; trong ®ã, ngãn tay c¸i cña v−în ng−êi kh«ng «m ®−îc vµo lßng bµn tay vµ n¾m lÊy c¸c ngãn tay kh¸c nh− ë ng−êi. Nh− ®· nªu ë trªn, dï cã nhiÒu ®Æc ®iÓm h×nh th¸i kh¸c nhau nh− vËy, nh−ng hÖ gen ng−êi kh«ng kh¸c mÊy hÖ gen v−în ng−êi, ®Æc biÖt lµ tinh tinh. Sù gièng nhau ®Õn 98 - 99% gi÷a hÖ gen ng−êi vµ tinh tinh cho thÊy sù ph©n li tiÕn hãa cña hai loµi tõ tæ tiªn chung chØ x¶y ra gÇn ®©y (−íc tÝnh tõ 5 ®Õn 9 triÖu n¨m tr−íc). So víi tinh tinh, c¸c loµi v−în ng−êi kh¸c (nh− khØ Gorilla) cã mèi quan hÖ di truyÒn víi ng−êi xa h¬n. 10.5.4. Nguån gèc loµi ng−êi theo b»ng chøng hãa th¹ch MÆc dï hiÕm c¸c b»ng chøng hãa th¹ch ®· cung cÊp nh÷ng th«ng tin quan träng vÒ nguån gèc vµ sù tiÕn hãa cña loµi ng−êi (h×nh 10.14, trang sau). B»ng chøng hãa th¹ch l©u ®êi nhÊt liªn quan ®Õn dßng tiÕn hãa cña loµi ng−êi t×m thÊy ë Ch©u Phi cã tuæi niªn ®¹i kho¶ng 4 - 5 triÖu n¨m. Sinh vËt cã d¹ng gièng ng−êi (hominid) ®Çu tiªn nµy ®−îc gäi 314
Ch−¬ng 10. Di truyÒn häc ph©n tö vµ tiÕn ho¸ lµ ng−êi v−în A®ipitÕc Homo (Ardipithecus ramidus). Hãa 0 sapiens Homo th¹ch cã tuæi niªn ®¹i l©u ®êi tiÕp erectus theo h×nh thµnh c¸ch ®©y kho¶ng 1 Homo 3 - 4 triÖu n¨m thuéc mét d¹ng TriÖu n¨m tr−íc ergaster Homo Homo habilis rudolfensis hominid kh¸c, ®−îc ®Æt tªn lµ 2 Dßng ng−êi v−în ¤xtral«pitÕc 3 tiÕn hãa ? Australopithecus ng−êi ? afarensis (Australopithecus afarensis). Ng−êi Tinh tinh v−în ¤xtral«pitÕc cã chiÒu cao Ardipithecus 4 ramidus kho¶ng 1 – 1,5m, ®i b»ng hai ch©n ? Dßng (Ýt nhÊt mét ®o¹n ng¾n). 5 tiÕn hãa C¸c loµi ®Çu tiªn ®−îc xÕp v−în ng−êi cïng chi Homo víi ng−êi hiÖn ®¹i (H. sapiens) cã hãa th¹ch h×nh thµnh c¸ch ®©y kho¶ng 2 – 2,5 Tæ tiªn chung cña ng−êi, ng−êi triÖu n¨m, ®−îc ®Æt tªn lµ H. v−în vµ tinh tinh rudolfensis (gäi lµ ng−êi rudolfen) vµ H. habilis (gäi lµ ng−êi H×nh 10.14. C©y ph¸t sinh loµi ng−êi trªn c¬ së b»ng chøng habilis). C¶ hai loµi ng−êi v−în hãa th¹ch. Tæ tiªn chung cña ng−êi, c¸c d¹ng ng−êi v−în vµ tinh tinh “xuÊt hiÖn sím” nµy cã nhiÒu ®Æc ®· tiÕn hãa theo hai dßng ®éc lËp h×nh thµnh nªn ng−êi hiÖn ®¹i - Homo sapiens ( dßng tiÕn hãa ng−êi) vµ tinh tinh (dßng tiÕn hãa v−în ®iÓm h×nh th¸i gièng v−în ng−êi. ng−êi). DÊu hái ph¶n ¸nh \"b−íc\" tiÕn hãa ch−a ®−îc kh¼ng ®Þnh. Tuy vËy, so víi ng−êi v−în ¤xtral«pitÕc, hai d¹ng ng−êi v−în nµy cã ®iÓm tiÕp xóc gi÷a n·o bé vµ tñy sèng ë gÇn gi÷a hép sä h¬n; ngoµi ra, hép sä gi¶m chiÒu dµi vµ t¨ng chiÒu réng (gièng ng−êi h¬n). MÆc dï vËy, còng cã nhiÒu nhµ cæ sinh vËt häc kh«ng nhÊt trÝ xÕp hai loµi nµy vµo chi Homo, mµ thay vµo ®ã lµ chi Australopithecus. Loµi cã b»ng chøng hãa th¹ch ®−îc kh¼ng ®Þnh ch¾c ch¾n thuéc chi Homo lµ Homo ergaster, gäi lµ ng−êi Egaxt¬, cã mÉu hãa th¹ch h×nh thµnh c¸ch ®©y 1,5 – 1,9 triÖu n¨m. Ng−êi Egaxt¬ cã nhiÒu ®Æc ®iÓm h×nh th¸i gièng víi ng−êi h¬n, bao gåm h×nh d¸ng c¬ thÓ, tØ lÖ kÝch th−íc ch©n-th©n, ®Æc ®iÓm cÊu tróc hµm vµ kÝch th−íc r¨ng. TÊt c¶ c¸c mÉu hãa th¹ch trªn ®©y ®Òu ®−îc t×m thÊy ë Ch©u Phi. MÉu hãa th¹ch hominid ®Çu tiªn ®−îc t×m thÊy ë ngoµi Ch©u Phi thuéc vÒ ng−êi Homo erectus, gäi lµ ng−êi £rec hay ng−êi ®øng th¼ng. Hãa th¹ch ng−êi £rec, cã tuæi kho¶ng 1 triÖu n¨m, ®−îc t×m thÊy ë nhiÒu vïng thuéc khu vùc §«ng-Nam Ch©u ¸, trong ®ã cã Ên §é, In®«nªsia, Trung Quèc, ViÖt Nam... §iÒu nµy cho thÊy H. erectus ®· cã ph¹m vi ph©n bè réng vµ cã thÓ lµ nguån gèc h×nh thµnh nªn c¸c quÇn thÓ ng−êi “cæ x−a” ë Ch©u ¢u, Ch©u ¸ vµ Ch©u Phi. Ng−êi cæ x−a ®−îc biÕt ®Õn nhiÒu nhÊt lµ ng−êi Nªan®ectan (H. neanderthalensis) ph¸t triÓn kh¸ h−ng thÞnh ë Ch©u ¢u vµ vïng CËn §«ng c¸ch ®©y vµi tr¨m ngh×n n¨m. Dùa vµo ®Æc ®iÓm h×nh th¸i vµ tæ chøc x· héi gÇn gièng víi ng−êi, tr−íc ®©y ng−êi ta tõng cho r»ng ng−êi Nªan®ectan cã kh¶ n¨ng lµ tæ tiªn cña ng−êi hiÖn ®¹i. Nh−ng, nh÷ng b»ng chøng ph©n tö (so s¸nh ADN hÖ gen ti thÓ gi÷a hai loµi) gÇn ®©y cho thÊy ng−êi Nªan®ectan kh«ng hÒ ®ãng gãp vËt chÊt di truyÒn vµo vèn gen ng−êi hiÖn ®¹i. ThÕ nªn, nhiÒu kh¶ n¨ng, ng−êi Nªan®ectan chÝnh lµ “®èi thñ” c¹nh tranh víi ng−êi cæ x−a vèn lµ tæ tiªn cña ng−êi hiÖn ®¹i. Trong cuéc c¹nh tranh ®ã, ng−êi Nªan®ectan tá ra kÐm thÝch nghi h¬n vµ bÞ tuyÖt chñng. Ng−êi hiÖn ®¹i cã thÓ ®· tiÕn hãa ®ång thêi tõ c¸c quÇn thÓ ng−êi cæ x−a vèn ®· h×nh thµnh tõ tr−íc ë Ch©u ¢u, Ch©u ¸ vµ Ch©u Phi; hoÆc còng cã thÓ chØ tõ mét ch©u 315
§inh §oµn Long lôc (nhiÒu kh¶ n¨ng lµ Ch©u Phi), sau ®ã ph¸t t¸n ra c¸c vïng kh¸c trªn Tr¸i ®Êt qua sù di c−. Gi¶ thiÕt thø nhÊt ®−îc gäi lµ “gi¶ thiÕt ®a vïng”, cßn gi¶ thiÕt thø hai ®−îc gäi lµ “gi¶ thiÕt ngoµi Ch©u Phi”. TiÕc r»ng, c¸c b»ng chøng hãa th¹ch thu ®−îc ®Òu kh«ng kh¼ng ®Þnh ®−îc gi¶ thiÕt nµo phï hîp h¬n. Nh−ng gÇn ®©y, viÖc ph©n tÝch vµ so s¸nh c¸c tr×nh tù ADN ë ng−êi ®−¬ng thêi ®· phÇn nµo tr¶ lêi ®−îc c©u hái nµy. 10.5.5. Nguån gèc loµi ng−êi theo b»ng chøng ph©n tö Trong vßng 20 n¨m qua, c¸c b»ng chøng ph©n tö (ADN, protein) ®· cung cÊp nhiÒu th«ng tin bæ sung quan träng vÒ qu¸ tr×nh h×nh thµnh ng−êi hiÖn ®¹i. NhiÒu dÊu hiÖu ph©n tö kh¸c nhau ®· ®−îc sö dông, nh− c¸c dÊu hiÖu ®a h×nh nhãm m¸u vµ isozyme, ®a h×nh c¸c ®o¹n giíi h¹n (RFLP), ®a h×nh chiÒu dµi c¸c ®o¹n lÆp l¹i kÕ tiÕp (SSR, VNTR), v.v... C¶ hai hÖ gen nh©n vµ ti thÓ ®Òu ®−îc “huy ®éng” trong nh÷ng nghiªn cøu nµy. HÖ gen nh©n cã “−u thÕ” khi ®¸nh gi¸ tÝnh ®a d¹ng di truyÒn chung cña vèn gen loµi ng−êi; nh−ng hÖ gen ti thÓ cã “−u thÕ” trong viÖc ph©n tÝch di truyÒn theo dßng mÑ, vµ x¸c ®Þnh thêi ®iÓm ph©n li tiÕn hãa cña c¸c chñng téc. So víi phÇn lín c¸c ®éng vËt kh¸c, hÖ gen ng−êi cã tÝnh ®ång nhÊt kh¸ cao. Khi so s¸nh c¸c tr×nh tù ADN, sù thay thÕ c¸c nucleotide ë hÖ gen ng−êi thÊp h¬n 4 lÇn so víi tinh tinh vµ b»ng 1/10 so víi ruåi giÊm. PhÇn lín (85 – 95%) c¸c d¹ng biÕn dÞ di truyÒn (c¸c alen) ë ng−êi biÓu hiÖn ngay trong mçi quÇn thÓ, chø kh«ng ph¶i gi÷a c¸c quÇn thÓ kh¸c nhau. TÇn sè biÕn dÞ t−¬ng ®èi thÊp gi÷a c¸c quÇn thÓ ng−êi cho thÊy: trong qu¸ tr×nh tiÕn hãa cña ng−êi hiÖn ®¹i, kÝch th−íc c¸c quÇn thÓ “tiÒn th©n” ®−îc duy tr× vÒ sau ®· rÊt nhá, −íc tÝnh chØ cã tõ 10.000 ®Õn 100.000 c¸ thÓ. Cã thÓ kÝch th−íc thùc cña c¸c quÇn thÓ “tiÒn th©n” nµy lµ lín h¬n, nh−ng do mét sè yÕu tè nh− tËp tÝnh kÕt cÆp giao phèi (®Æc ®iÓm tæ chøc x· héi), ¸p lùc cña chän läc tù Vèn gen hiÖn t¹i nhiªn lªn qu¸ tr×nh sinh s¶n, “hiÖu øng th¾t cæ chai” g©y ra bëi hµng lo¹t dÞch bÖnh, n¹n ®ãi, thiªn tai... dÉn ®Õn kÝch th−íc quÇn thÓ di truyÒn hiÖu qu¶ (®ãng gãp vµo vèn gen ng−êi ®−¬ng thêi) ®· lu«n nhá h¬n 100.000 c¸ thÓ. Trong nh÷ng quÇn thÓ nhá Thêi nh− vËy, hiÖn t−îng “l¹c gian dßng di truyÒn” ®· −u thÕ h¬n so víi ®ét biÕn trong viÖc quy ®Þnh sù c©n b»ng gi÷a møc ®é biÕn dÞ vµ tØ lÖ c¸c alen trung tÝnh ®−îc chän läc duy tr×. Khi ph©n tÝch c¸c Tæ tiªn quÇn thÓ ng−êi kh¸c nhau, chung cña biÕn dÞ di truyÒn ë c¸c c¸c c¸ thÓ chñng téc ng−êi Ch©u Phi ®ang sèng cao h¬n h¼n c¸c ch©u lôc kh¸c. §iÒu nµy ñng hé gi¶ H×nh 10.15. Qu¸ tr×nh “dÝnh chËp”. NÕu c¸c dßng tr×nh tù ADN ®−îc t×m thiÕt “ngoµi Ch©u Phi”. thÊy trong c¸c c¸ thÓ ®ang sèng (vèn gen hiÖn t¹i) ®−îc truy nguyªn vÒ qu¸ Ngoµi ra, c¸c kÕt qu¶ so khø, th× sÏ thÊy tÊt c¶ c¸c c¸ thÓ hiÖn ®ang tån t¹i ®Òu cã mét tæ tiªn chung. C¸c tr×nh tù ADN kh¸c ®· tõng cã trong qu¸ khø nh−ng hiÖn nay kh«ng cßn tån t¹i lµ do sù tuyÖt chñng ®−îc kÝ hiÖu b»ng vßng trßn ®en (•). 316
Ch−¬ng 10. Di truyÒn häc ph©n tö vµ tiÕn ho¸ s¸nh hÖ gen ti thÓ gi÷a c¸c quÇn thÓ ng−êi kh¸c nhau còng ®· ñng hé gi¶ thiÕt nµy, nghÜa lµ ban ®Çu chØ cã mét quÇn thÓ ng−êi hiÖn ®¹i ë Ch©u Phi råi di c− tíi c¸c ch©u lôc kh¸c vµ h×nh thµnh nªn c¸c quÇn thÓ míi (h×nh 10.15). B»ng viÖc ph©n tÝch hÖ gen ti thÓ gi÷a c¸c chñng téc ng−êi, mét sè nhµ tiÕn hãa −íc tÝnh tæ tiªn chung cña toµn bé ng−êi ®−¬ng thêi (gäi lµ “£va”, do di truyÒn theo dßng mÑ) sèng c¸ch ®©y tõ 100.000 ®Õn 200.000 n¨m. §iÒu ®¸ng chó ý lµ sau ®ã viÖc so s¸nh vïng kh«ng t−¬ng ®ång trªn NST Y (di truyÒn theo dßng bè) ë ®µn «ng tõ c¸c quÇn thÓ kh¸c nhau còng cho kÕt qu¶ t−¬ng tù (“Adam” sèng c¸ch ®©y kho¶ng 150.000 n¨m). KÕt hîp c¸c sè liÖu nµy, cã thÓ nhËn ®Þnh r»ng mäi ng−êi sèng trªn Tr¸i ®Êt hiÖn nay ®Òu lµ hËu duÖ cña mét cÆp “£va - Adam” sèng ë Ch©u Phi c¸ch ®©y kho¶ng 150.000 ®Õn 200.000 n¨m. Nãi nh− vËy, kh«ng cã nghÜa lµ vµo thêi ®iÓm ®ã, chØ cã hai c¸ thÓ nµy tån t¹i; mµ cßn nhiÒu c¸ thÓ kh¸c. Nh−ng, c¸c dßng di truyÒn kh¸c kh«ng ®−îc duy tr× ®Õn ngµy nay. NÕu tÊt c¶ nh÷ng gi¶ thiÕt vµ kÕt qu¶ ph©n tÝch trªn ®©y lµ ®óng (bëi còng cßn mét sè yÕu tè ch−a ch¾c ch¾n vÒ gi¶ thiÕt “®ång hå ph©n tö” vµ ®é chÝnh x¸c cña ph−¬ng ph¸p ph©n tÝch), th× qu¶ thËt loµi ng−êi cßn rÊt trÎ. Cã lÏ, b¾t nguån tõ mét quÇn thÓ “tiÒn th©n” nhá ë Ch©u Phi; råi tõ Ch©u Phi, loµi ng−êi di c− tíi Ch©u ¸ vµ Ch©u ¢u, sau ®ã tíi Ch©u óc vµ Ch©u Mü; cuèi cïng, trë thµnh loµi “thèng trÞ” Tr¸i ®Êt nh− hiÖn nay. 10.6. Sù tiÕn hãa lêi nãi (ng«n ng÷) ë ng−êi 10.6.1. TÝnh tr¹ng “lêi nãi” ë ng−êi vµ gen FOX2P NÕu nh− cÊu tróc di truyÒn hÖ gen ng−êi vµ c¸c loµi ®éng vËt cã vó kh¸c (nh− chuét, tinh tinh) lµ gièng nhau, th× mét c©u hái ®Æt ra lµ: sù s¸ng t¹o tiÕn hãa “xuÊt chóng” nµo ®· lµm cho loµi ng−êi rÊt kh¸c biÖt víi nh÷ng loµi cßn l¹i? Chóng ta h·y dù ®o¸n vÒ nguån gèc mét tÝnh (a) Chuét tr¹ng ph¶n ¸nh sù kh¸c biÖt cña loµi ng−êi, ®ã lµ “lêi nãi” Tæ tiªn §−êi −¬i hay “ng«n ng÷”. §Õn nay, chung KhØ Gorilla loµi ng−êi lµ loµi duy nhÊt cã thÓ giao tiÕp b»ng c¶ hÖ Tinh tinh lïn 3 thèng ng«n ng÷ nãi vµ viÕt. Tinh tinh 2 Loµi ®éng vËt gÇn ng−êi nhÊt lµ tinh tinh còng cã kh¶ Ng−êi n¨ng giao tiÕp qua mét d¹ng ng«n ng÷ ®¬n gi¶n, nh−ng s¬ (b) 80 303 325 khai h¬n rÊt nhiÒu so víi loµi N D NS C ng−êi. VËy, ng«n ng÷ ®· h×nh thµnh nh− thÕ nµo Ng−êi trong qu¸ tr×nh ph¸t sinh loµi ng−êi? ND TN C Kh¶ n¨ng nãi phô Tinh tinh thuéc vµo sù ®iÒu phèi ho¹t ®éng chÝnh x¸c cña c¸c c¬ N E TA C trong thanh qu¶n vµ miÖng. Sù biÓu hiÖn gi¶m ®i cña mét Chuét protein ®iÒu hßa cã tªn lµ H×nh 10.16. Sù tiÕn hãa cña protein FOX2P. (a) Mèi quan hÖ gi÷a c¸c loµi ®−îc x¸c ®Þnh dùa trªn sù sai kh¸c vÒ tr×nh tù axit amin trong protein FOX2P ë chuét vµ c¸c loµi linh tr−ëng; c¸c chØ sè (2, 3) lµ sè axit amin ®−îc thay thÕ. (b) C¸c axit amin ®−îc thay thÕ trong protein FOX2P ë chuét, tinh tinh vµ ng−êi. 317
§inh §oµn Long FOXP2 ®−îc t×m thÊy lµ nguyªn nh©n dÉn ®Õn nhiÒu d¹ng sai háng kh¸c nhau vÒ kh¶ n¨ng nãi. Nh÷ng c¸ thÓ thiÕu hôt protein nµy gÆp khã kh¨n trong viÖc ph¸t ©m vµ diÔn ®¹t ng«n ng÷. Gen FOXP2 còng ®−îc t×m thÊy vµ ph©n lËp tõ c¸c ®éng vËt kh¸c nh− chuét, tinh tinh vµ ®−êi −¬i (h×nh 10.16a). Nh−ng d¹ng protein FOXP2 cña ng−êi kh¸c biÖt ®«i chót so víi c¸c d¹ng t×m thÊy ë c¸c loµi linh tr−ëng vµ ®éng vËt cã vó kh¸c. §Æc biÖt, cã hai sù thay thÕ axit amin chØ cã ë protein FOX2P cña ng−êi, ®ã lµ: Thr → Asn t¹i vÞ trÝ 303, vµ Asn → Ser t¹i vÞ trÝ 325 (h×nh 10.16b). Cã lÏ, nh÷ng ®ét biÕn nµy ®· lµm thay ®æi chøc n¨ng protein FOX2P cña ng−êi. Mét sè b»ng chøng cho thÊy vïng ®iÒu hßa øc chÕ cña protein nµy mÊt kh¶ n¨ng ®iÒu khiÓn mét sè gen ®Ých vèn bÞ øc chÕ ë tinh tinh vµ chuét. HiÖn t−îng nµy d−êng Vá n·o míi ë c¸c loµi nh− gièng víi sù xuÊt hiÖn ®o¹n linh tr−ëng peptide “ph¶n øc chÕ” cña protein Ubx t×m thÊy ë gi¸p x¸c (xem môc 10.2). Ngoµi ra, nh÷ng thay ®æi trong kiÓu biÓu hiÖn cña gen FOX2P hoÆc trong N chÝnh tr×nh tù c¸c gen ®Ých còng MiÒn cã thÓ lµ nguyªn nh©n dÉn ®Õn Protein ho¹t hãa sù ph¸t triÓn kh¶ n¨ng nãi ë FOX2P ng−êi. MiÒn liªn kÕt C ADN sîi kÐp 10.6.2. Gen FOX2P thóc ®Èy Ng−êi Tinh tinh sù ph¸t triÓn ng«n ng÷ ë ng−êi nh− thÕ nµo? ë ®©y, chóng ta còng ®Ò Gen A Gen A cËp ®Õn 3 c¬ chÕ lµm thay ®æi “BËt” “T¾t” chøc n¨ng protein ®iÒu hßa vèn ®· ®−îc nªu trong tr−êng hîp +1 +1 gen Ubx. Nh÷ng nguyªn lý nµy còng ®−îc ¸p dông ®èi víi gen Gen B Gen B FOX2P. Cã lÏ ®· cã mét sù kÕt “BËt” “T¾t” hîp ®ång thêi 3 c¬ chÕ (thay ®æi kiÓu biÓu hiÖn cña gen ®iÒu hßa, +1 +1 thay ®æi tr×nh tù axit amin cña protein ®iÒu hßa do gen ®iÒu Gen C Gen C hßa m· hãa vµ nh÷ng thay ®æi + 1 “BËt” “BËt” ngay trong tr×nh tù c¸c gen ®Ých) dÉn ®Õn viÖc protein +1 FOX2P “®ét xuÊt” trë thµnh mét chÊt “m«i giíi” quan träng cho H×nh 10.17. FOX2P vµ thuyÕt tiÕn hãa \"ng«n ng÷\" ë ng−êi. sù h×nh thµnh ng«n ng÷ ë ng−êi. Protein ®iÒu hßa FOX2P ®−îc biÓu hiÖn trong vá n·o ë ng−êi còng Cô thÓ, mét ®ét biÕn trong tr×nh nh− ë tinh tinh. Tuy nhiªn, ho¹t tÝnh cña protein nµy ë hai loµi cã ®iÓm tù ®iÒu hßa cña gen FOX2P ®· kh¸c nhau. Gen ë ng−êi ®−îc biÓu hiÖn m¹nh vµo ®óng thêi ®iÓm cña ®−îc ph¸t hiÖn lµ nguyªn nh©n qu¸ tr×nh ph¸t triÓn trung khu “nãi”, trong ®ã cã sù ho¹t hãa 3 gen lµm thay ®æi kiÓu biÓu hiÖn cña ®Ých (gi¶ ®Þnh lµ A, B vµ C) trong vïng vá n·o. Nh÷ng gen ®Ých nµy m· hãa c¸c chÊt dÉn truyÒn thÇn kinh quan träng quyÕt ®Þnh sù h×nh gen FOX2P trong n·o ng−êi. ë thµnh trung khu “nãi”. Ng−îc l¹i, ë tinh tinh, gen FOX2P kh«ng ®−îc tinh tinh, gen nµy kh«ng ®−îc biÓu hiÖn vµo ®óng thêi ®iÓm tèi −u nhÊt cña qu¸ tr×nh ph¸t triÓn trung biÓu hiÖn t¹i vÞ trÝ thÝch hîp khu “nãi”; ngoµi ra, ngay c¶ khi ®−îc biÓu hiÖn ®óng thêi ®iÓm, sù kh¸c biÖt vÒ mét sè axit amin trong protein FOX2P cña tinh tinh lµm gi¶m ho¹t tÝnh ho¹t hãa c¸c gen ®Ých. KÕt qu¶ lµ, tinh tinh chØ cã kh¶ n¨ng giao tiÕp b»ng ng«n ng÷ “cæ x−a”. 318
Ch−¬ng 10. Di truyÒn häc ph©n tö vµ tiÕn ho¸ trong n·o vµ vµo mét thêi ®iÓm phï hîp cña qu¸ tr×nh ph¸t triÓn. Ng−îc l¹i, ë ng−êi gen nµy ®−îc biÓu hiÖn ë vÞ trÝ vµ thêi ®iÓm rÊt phï hîp cho sù ph¸t triÓn kh¶ n¨ng nãi ë trÎ em. Ngoµi ra, ë phÇn sau, chóng ta sÏ thÊy protein FOX2P ë ng−êi vµ tinh tinh cã c¸c nhãm gen ®Ých kh¸c nhau. Gi¶ thiÕt nµy mÆc dï chØ lµ suy ®o¸n, nh−ng nã gióp gi¶i thÝch t¹i sao chØ mét sè thay ®æi nhá trong c¸c gen ®iÒu hßa vµ gen ®Ých cña chóng l¹i cã thÓ t¹o nªn ®−îc mét tÝnh tr¹ng “®éc ®¸o” nh− ng«n ng÷ ë ng−êi. Trong sè c¸c gen ®Ých ®−îc gen FOX2P ®iÒu khiÓn cã c¸c gen m· hãa c¸c chÊt dÉn truyÒn thÇn kinh vµ c¸c protein tÝn hiÖu quan träng cho sù ph¸t triÓn thanh qu¶n. Nh÷ng biÕn ®æi ë nh÷ng gen nµy cã thÓ lµm thay ®æi thêi ®iÓm biÓu hiÖn vµ t¨ng møc biÓu hiÖn cña c¸c gen, sao cho c¸c tÝn hiÖu thiÕt yÕu ®−îc h×nh thµnh ë thanh qu¶n vµo ®óng thêi ®iÓm trÎ ®ang ph¸t triÓn kh¶ n¨ng nãi trë nªn nh¹y c¶m nhÊt víi kh¶ n¨ng tiÕp thu ng«n ng÷. C¸c gen t−¬ng øng ë tinh tinh chØ biÓu hiÖn ë møc thÊp, sai vÞ trÝ vµ ë thêi ®iÓm muén h¬n trong qu¸ tr×nh ph¸t triÓn thanh qu¶n (h×nh 10.17). FOX2P chØ lµ mét vÝ dô vÒ gen ®iÒu hßa tham gia vµo sù ph¸t triÓn “kh¶ n¨ng nãi” ë ng−êi. ThËt khã ®Ó −íc l−îng cã bao nhiªu “gen ®iÒu hßa ng«n ng÷” kÓ tõ khi cã sù ph©n li tiÕn hãa gi÷a ng−êi vµ tinh tinh. Tuy vËy, ë ®Çu ch−¬ng nµy chóng ta ®· thÊy chØ cÇn Ýt h¬n 100 “gen ®iÒu hßa quy ®Þnh kiÓu biÓu hiÖn gen” còng ®ñ ®Ó t¹o nªn mét sù ®a d¹ng h×nh th¸i rÊt lín ë c¸c loµi ®éng vËt ch©n ®èt. V× vËy, cã lÏ chØ cÇn mét sè gen ®iÒu hßa lµ ®ñ ®Ó dÉn ®Õn sù ph¸t triÓn ng«n ng÷ ë ng−êi. 10.7. Sù tiÕn hãa c¸c gen c¶m nhËn mµu s¾c vµ bÖnh di truyÒn liªn quan 10.7.1. C¬ së tÕ bµo cña sù c¶m nhËn mµu s¾c ë m¾t Chóng ta c¶m nhËn ®−îc h×nh ¶nh qua c¸c n¬ron thÇn kinh vâng m¹c ë phÝa sau nh·n cÇu (h×nh 10.18). Nh÷ng n¬ron nµy cã hai lo¹i: tÕ bµo h×nh nãn vµ tÕ bµo h×nh que. C¸c tÕ bµo h×nh que chiÕm 95% sè l−îng c¸c tÕ bµo c¶m nhËn ¸nh s¸ng vµ ®−îc kÝch thÝch bëi c¸c ¸nh s¸ng yÕu. ë c−êng ®é s¸ng m¹nh h¬n, c¸c tÕ bµo h×nh que bÞ b·o hßa vµ kh«ng cßn chøc n¨ng göi c¸c tÝn hiÖu bæ sung thªm vÒ n·o bé. Lóc nµy, c¸c tÕ bµo h×nh nãn sÏ tiÕp qu¶n chøc n¨ng nµy, xö lý c¸c b−íc sãng cña ¸nh s¸ng m¹nh, göi tÝn hiÖu vÒ n·o bé vµ gióp chóng ta ph©n biÖt ®−îc mµu s¾c. C¸c tÕ bµo h×nh nãn cã ba lo¹i. Lo¹i thø nhÊt chuyªn hãa ®Ó c¶m nhËn ¸nh s¸ng ®á, lo¹i thø hai c¶m nhËn ¸nh s¸ng xanh lôc vµ lo¹i thø ba c¶m nhËn ¸nh s¸ng xanh lam. §èi víi mçi tÕ bµo thô quan ¸nh s¸ng nh− vËy, ho¹t ®éng c¶m nhËn ¸nh s¸ng bao gåm sù hÊp thô c¸c photon tõ ¸nh s¸ng ë mét d¶i b−íc sãng nhÊt ®Þnh, chuyÓn th«ng tin vÒ sè l−îng vµ n¨ng l−îng cña c¸c photon thµnh c¸c tÝn hiÖu ®iÖn tö vµ chuyÓn c¸c tÝn hiÖu ®ã qua tÕ bµo thÇn kinh thÞ gi¸c tíi bé n·o. 10.7.2. HÖ gen ng−êi cã bèn gen m· hãa bèn protein c¶m nhËn mµu s¾c C¸c protein c¶m nhËn photon vµ khëi ®Çu sù truyÒn tÝn hiÖu ë c¸c tÕ bµo h×nh nãn lµ rhodopsin. Protein nµy cã mét chuçi polypeptide duy nhÊt gåm 348 axit amin gÊp nÕp thµnh chuçi zigzag xuyªn mµng tÕ bµo (h×nh 10.18). Mét axit amin Lys n»m trong chuçi liªn kÕt víi mét ph©n tö carotenoid s¾c tè trªn vâng m¹c cã kh¶ n¨ng hÊp thô photon. C¸c axit amin gÇn vïng liªn kÕt vâng m¹c t¹o nªn miÒn ho¹t ®éng cña rhodopsin. Nhê viÖc thay ®æi vÞ trÝ vâng m¹c qua mét c¬ chÕ ®Æc biÖt, rhodopsin quy ®Þnh kiÓu ®¸p øng ¸nh s¸ng cña tÕ bµo vâng m¹c. Mçi tÕ bµo h×nh que chøa kho¶ng 100 triÖu ph©n tö rhodopsin. Gen m· hãa rhodopsin ë ng−êi n»m trªn NST sè 3. Protein cã vai trß c¶m nhËn vµ khëi ®Çu qu¸ tr×nh truyÒn tÝn hiÖu ë c¸c tÕ bµo h×nh nãn ®èi víi photon mµu xanh lam cã quan hÖ tiÕn hãa víi rhodopsin. Protein nµy còng chØ 319
§inh §oµn Long cã mét chuçi polypeptide duy a) C¸c tÕ bµo h×nh BiÓu m« nhÊt gåm 348 axit amin vµ bao quanh mét ph©n tö s¾c tè ë nãn vµ h×nh que s¾c tè vâng m¹c. GÇn 50% tr×nh tù axit amin trªn ph©n tö protein c¶m nhËn ¸nh s¸ng xanh lam Vâng m¹c gièng rhodopsin; phÇn cßn l¹i kh¸c víi rhodopsin lµ phÇn ¸nh s¸ng TÕ bµo thô chuyªn hãa cho sù c¶m nhËn c¶m ¸nh s¸ng ¸nh s¸ng xanh lam (h×nh H×nh que 10.18b). Gen m· hãa protein nµy n»m trªn NST sè 7. H×nh nãn Còng cã quan hÖ tiÕn hãa víi protein rhodopsin lµ c¸c protein c¶m nhËn ¸nh s¸ng ®á vµ xanh lôc n»m trong c¸c tÕ ¸nh s¸ng Vâng m¹c bµo h×nh nãn mµu ®á vµ xanh Rhodopsin lôc. Hai protein nµy còng chØ cã mét chuçi polypeptide duy b) 1- Protein Rhodopsin 2- Protein c¶m nhËn mµu xanh lam nhÊt, nh−ng chiÒu dµi lµ 364 axit amin. Chóng còng liªn kÕt víi vâng m¹c vµ n»m xuyªn mµng tÕ bµo (h×nh 10.18b). 3-Protein c¶m nhËn mµu lôc 4-Protein c¶m nhËn mµu ®á Còng gièng nh− protein c¶m nhËn mµu xanh lam, c¸c protein c¶m nhËn mµu ®á vµ xanh lôc cã gÇn 50% tr×nh tù axit amin gièng rhodopsin; c¸c protein nµy chØ kh¸c nhau d) Sù tiÕn hãa cña c¸c gen trung b×nh 4 / 100 axit amin. c) C¸c gen m· hãa protein c¶m nhËn mµu ®á c¶m nhËn mµu s¾c (1) vµ lôc (2) trªn NST X Gen tiÒn th©n MÆc dï chØ kh¸c biÖt nhá nh− vËy nh−ng c¸c protein nµy ®· biÖt hãa c¸c tÕ bµo h×nh nãn thµnh hai lo¹i c¶m øng víi c¸c 1 2 2 2 §á Lôc Lam Rhodopsin photon ¸nh s¸ng cã b−íc sãng H×nh 10.18. C¬ së ph©n tö cña sù c¶m nhËn mµu s¾c. (a) c¸c tÕ kh¸c nhau, gäi lµ c¸c tÕ bµo bµo h×nh nãn vµ h×nh que ë vâng m¹c chøa hµng triÖu protein thô h×nh nãn mµu ®á vµ xanh lôc. thÓ liªn kÕt mµng tÕ bµo cã vai trß c¶m nhËn ¸nh s¸ng. (b) c¸c thô C¶ hai gen m· hãa cho c¸c thÓ c¶m nhËn ¸nh s¸ng ë tÕ bµo h×nh que lµ rhodopsin. C¸c protein protein c¶m nhËn mµu ®á vµ thô thÓ c¶m nhËn mµu ®á, xanh lam vµ lôc cã ë c¸c tÕ bµo h×nh nãn xanh lôc ®Òu n»m trªn NST X, gièng víi rhodopsin ë phÇn lín tr×nh tù, nh−ng vÉn ®ñ kh¸c biÖt dÉn vµ xÕp thµnh mét chuçi kÕ tiÕp ®Õn kh¶ n¨ng thô c¶m mµu s¾c kh¸c nhau. (c) c¸c gen m· hãa nhau. Mçi NST X ë ng−êi protein c¶m nhËn mµu ®á (1) vµ lôc (2) n»m thµnh chuçi trªn NST X. Ng−êi b×nh th−êng cã 1 b¶n sao gen m· hãa protein c¶m nhËn th−êng mang 1 gen m· hãa mµu ®á vµ tõ 1 ®Õn 5 b¶n sao gen m· hãa protein c¶m nhËn mµu protein c¶m nhËn ¸nh s¸ng ®á lôc. (d) sù tiÕn hãa cña c¸c protein c¶m nhËn mµu s¾c cho thÊy duy nhÊt, nh−ng cã 1 - 5 b¶n chóng cïng xuÊt ph¸t tõ mét gen tiÒn th©n, tr¶i qua ba ®ét biÕn lÆp sao gen m· hãa protein c¶m ®o¹n gen ®éc lËp, sau ®ã lµ sù ph©n ly vÒ chøc n¨ng cña c¸c gen. nhËn ¸nh s¸ng xanh lôc n»m liÒn kÒ nhau (h×nh 10.18c). 10.7.3. Hä gen rhodopsin tiÕn hãa do hiÖn t−îng lÆp ®o¹n vµ ph©n li chøc n¨ng Sù gièng nhau vÒ cÊu tróc vµ chøc n¨ng gi÷a bèn lo¹i protein rhodopsin cho thÊy c¸c gen m· hãa c¸c protein nµy xuÊt hiÖn do hiÖn t−îng lÆp ®o¹n cña mét gen thô thÓ 320
Ch−¬ng 10. Di truyÒn häc ph©n tö vµ tiÕn ho¸ c¶m nhËn ¸nh s¸ng tiÒn th©n, råi tiÕp tôc ph©n li do sù tÝch lòy ®ét biÕn. C¸c ®ét biÕn t¹o nªn kh¶ n¨ng c¶m nhËn mµu s¾c ®−îc −u tiªn chän läc qua hµng triÖu n¨m tiÕn hãa. C¸c protein c¶m nhËn ¸nh s¸ng ®á vµ xanh lôc gièng nhau h¬n c¶ (chØ kh¸c nhau 15 axit amin), cho thÊy chóng ®−îc ph©n li gÇn ®©y. Cßn sù gièng nhau vµ kh¸c nhau gi÷a hai lo¹i protein c¶m nhËn mµu xanh lam vµ rhodopsin, còng nh− so s¸nh víi hai lo¹i protein cßn l¹i, cho thÊy hai lo¹i protein ®−îc nh¾c ®Õn tr−íc xuÊt hiÖn vµ ph©n li sím h¬n trong qu¸ tr×nh tiÕn hãa (h×nh 10.18d). 10.7.4. §ét biÕn ë hä gen rhodopsin ¶nh h−ëng ®Õn thÞ lùc vµ kh¶ n¨ng nhËn biÕt mµu 10.7.4.1. NhiÒu ®ét biÕn thay thÕ axit amin ë rhodopsin g©y mï toµn phÇn hay mét phÇn Ng−êi ta ®· ph¸t hiÖn ®−îc Ýt nhÊt 29 d¹ng ®ét biÕn thay thÕ axit amin trong protein rhodopsin g©y nªn mét nhãm bÖnh di truyÒn tréi n»m trªn NST th−êng (gäi chung lµ c¸c bÖnh lo¹n s¾c tè vâng m¹c, retinitis pigmentosa) víi biÓu hiÖn lµ: ban ®Çu c¸c tÕ bµo h×nh que mÊt chøc n¨ng, råi dÇn dÇn c¸c tÕ bµo vâng m¹c ngo¹i vi bÞ tho¸i hãa. Nh÷ng ®ét biÕn nµy g©y nªn sù gÊp nÕp sai cña rhodopsin, hoÆc lµm protein nµy trë nªn kÐm bÒn. B×nh th−êng, protein rhodopsin ph¶i g¾n vµo mµng tÕ bµo h×nh que, nh−ng khi bÞ ®ét biÕn chóng kh«ng g¾n ®−îc vµo mµng tÕ bµo vµ kh«ng biÓu hiÖn ®−îc chøc n¨ng b×nh th−êng. Khi kh«ng cã ®ñ rhodopsin trªn mµng tÕ bµo, tÕ bµo h×nh que th−êng bÞ chÕt. Tïy theo sè tÕ bµo h×nh que chÕt, ng−êi bÖnh cã thÓ bÞ mï hoµn toµn hay mét phÇn. C¸c ®ét biÕn kh¸c ë gen m· hãa rhodopsin cßn g©y nªn mét d¹ng bÖnh lý Ýt nghiªm träng h¬n lµ bÖnh mï ban ®ªm. C¸c ®ét biÕn nµy lµm thay ®æi tr×nh tù cña c¸c axit amin trong ph©n tö protein theo h−íng lµm t¨ng ng−ìng ¸nh s¸ng kÝch thÝch cÇn thiÕt ®Ó khëi ®Çu chuçi truyÒn tÝn hiÖu c¶m nhËn ¸nh s¸ng. Víi nh÷ng thay ®æi nµy, khi c−êng ®é ¸nh s¸ng yÕu, m¾t kh«ng c¶m nhËn ®−îc mµu s¾c. 10.7.4.2. C¸c ®ét biÕn gen ë tÕ bµo h×nh nãn lµm gi¶m thÞ lùc theo kiÓu dù ®o¸n ®−îc C¸c rèi lo¹n thÞ lùc g©y ra bëi c¸c ®ét biÕn liªn quan ®Õn c¸c gen s¾c tè thuéc tÕ bµo h×nh nãn Ýt nghiªm träng h¬n so víi c¸c rèi lo¹n thÞ lùc g©y ra bëi c¸c ®ét biÕn t−¬ng tù x¶y ra víi c¸c gen rhodopsin trong c¸c tÕ bµo h×nh que. Nguyªn nh©n chñ yÕu cã lÏ bëi v× c¸c tÕ bµo h×nh que chiÕm ®Õn 95% sè n¬ron thÇn kinh c¶m nhËn mµu s¾c ë ng−êi, trong khi c¸c tÕ bµo h×nh nãn chØ chiÕm 5%. Mét sè ®ét biÕn liªn quan ®Õn gen m· hãa protein c¶m nhËn mµu xanh lam n»m trªn NST sè 7 g©y nªn héi chøng rèi lo¹n thÞ lùc s¾c tè xanh (tritanopia). C¸c ®ét biÕn ë gen m· hãa protein c¶m nhËn s¾c tè ®á trªn NST X cã thÓ lµm mÊt chøc n¨ng c¶m nhËn mµu ®á cña c¸c tÕ bµo h×nh nãn vµ g©y bÖnh mï mµu ®á. Mét sè ®ét biÕn nhá kh¸c liªn quan ®Õn gen quy ®Þnh protein c¶m nhËn mµu ®á cã thÓ g©y nªn bÖnh mï mµu ®á mét phÇn hoÆc hoµn toµn tïy vµo vÞ trÝ ®ét biÕn. 10.7.4.3. Trao ®æi chÐo kh«ng c©n gi÷a c¸c gen m· hãa protein c¶m nhËn mµu xanh lôc vµ ®á trªn NST X g©y ra phÇn lín c¸c rèi lo¹n thÞ lùc vÒ c¶m nhËn mµu Mét ng−êi b×nh th−êng chØ cã mét gen duy nhÊt m· hãa protein c¶m nhËn mµu ®á n»m trªn NST X; nh−ng n»m kÒ gen nµy cã tõ mét ®Õn n¨m b¶n sao gen m· hãa protein c¶m nhËn mµu xanh lôc. C¸c gen ®á vµ xanh lôc cã tr×nh tù ADN gièng nhau 96%. C¸c b¶n sao kh¸c nhau cña gen xanh lôc gièng nhau ®Õn 99,9%. Sù gièng nhau vµ n»m gÇn nhau cña nh÷ng gen nµy lµm hiÖn t−îng trao ®æi chÐo kh«ng c©n rÊt dÔ x¶y ra. Cã lÏ v× vËy, nhiÒu ®ét biÕn mÊt gen mµu ®á ®· ®−îc t×m thÊy lµ do sù trao ®æi chÐo kh«ng c©n ë vïng gen nµy. KÕt qu¶ cña nh÷ng trao ®æi chÐo nµy lµ sù tæ hîp l¹i cña c¸c gen xanh lôc, hoÆc t¹o ra c¸c gen lai míi “xanh lôc - ®á”. Do kh¶ n¨ng c¶m nhËn mµu ®á vµ xanh lôc phô thuéc vµo tØ lÖ ¸nh s¸ng ®á vµ xanh lôc ®−îc ph¶n chiÕu tõ h×nh ¶nh, nh÷ng ng−êi thiÕu c¸c gen nµy sÏ c¶m nhËn hai mµu ®á vµ xanh lôc nh− mét mµu gièng nhau. 321
§inh §oµn Long 10.7.4.4. Mét sè ®ét biÕn cã thÓ lµm mÊt kh¶ n¨ng c¶m nhËn mµu ®á vµ xanh lôc §Õn nay, ®· ph¸t hiÖn cã b¶y d¹ng ®ét biÕn mÊt ®o¹n NST g©y bÖnh mï mµu ®á vµ xanh lôc liªn kÕt víi NST giíi tÝnh X. BÖnh lý nµy ®−îc gäi lµ héi chøng tÕ bµo h×nh nãn ®¬n s¾c xanh lam (blue cone monochromacy). Nh÷ng ng−êi m¾c héi chøng nµy chØ c¶m nhËn ®−îc mµu liªn quan ®Õn mµu xanh lam. Nghiªn cøu ph©n tö cho thÊy: c¶ b¶y ®ét biÕn mÊt ®o¹n nµy ®Òu liªn quan ®Õn mét tr×nh tù gåm 600 bp n»m ngoµi vïng m· hãa cña c¸c gen ®á vµ xanh lôc. §iÒu nµy cho thÊy ®©y cã thÓ lµ ®o¹n tr×nh tù ®iÒu hßa dµi cÇn cho sù biÓu hiÖn cña chuçi c¸c gen c¶m nhËn mµu ®á vµ xanh lôc. Nh− vËy, chóng ta nh×n vµ c¶m nhËn ®−îc c¸c mµu s¾c ®a d¹ng, phong phó cña v¹n vËt mét phÇn lµ nhê bèn gen trùc tiÕp m· hãa bèn lo¹i protein trong c¸c tÕ bµo h×nh que vµ h×nh nãn ë vâng m¹c m¾t. C¸c ®ét biÕn lµm thay ®æi nh÷ng gen nµy hoÆc sè l−îng cña chóng cã thÓ lµm gi¶m thÞ lùc, thËm chÝ lµm háng kh¶ n¨ng c¶m nhËn mµu s¾c cña m¾t. 322
Ch−¬ng 11 Ph©n tÝch gen vµ s¶n phÈm cña gen 11.1. Giíi thiÖu chung ë c¸c ch−¬ng tr−íc, chóng ta ®· ®Ò cËp ®Õn c¸c c¬ chÕ cña c¸c hiÖn t−îng di truyÒn ë cÊp ph©n tö vµ tÕ bµo, trong ®ã cã sù ®iÒu hßa biÓu hiÖn cña c¸c gen, phÇn nµo gi¶i thÝch ®−îc sù tiÕn hãa cña sinh vËt trªn c¬ së c¸c quy luËt biÕn ®æi cña vËt chÊt di truyÒn (ADN vµ NST). Ch−¬ng nµy ®Ò cËp ®Õn mét sè ph−¬ng ph¸p c¬ b¶n cña sinh häc ph©n tö vµ hãa sinh häc ®−îc dïng trong viÖc ph©n tÝch gen (ADN) vµ s¶n phÈm cña gen (ARN vµ protein). Trong bèi c¶nh c«ng nghÖ sinh häc vµ sinh häc ph©n tö ph¸t triÓn hÕt søc m¹nh mÏ trong nh÷ng n¨m qua, ch¾c ch¾n gi¸o tr×nh nµy kh«ng thÓ ph¶n ¸nh ®Çy ®ñ c¸c ph−¬ng ph¸p ®· ®−îc sö dông trong c¸c nghiªn cøu vÒ gen vµ s¶n phÈm cña gen, mµ chØ cã thÓ ®Ò cËp ®Õn nguyªn lý cña mét sè ph−¬ng ph¸p c¬ b¶n ®−îc dïng phæ biÕn hiÖn nay trong c¸c nghiªn cøu di truyÒn häc ë cÊp ®é ph©n tö. PhÇn ®Çu cña ch−¬ng m« t¶ c¸c ph−¬ng ph¸p ®−îc dïng trong ph©n tÝch c¸c axit nucleic, bao gåm tõ t¸ch chiÕt ADN, ph©n lËp gen ®Õn gi¶i tr×nh tù vµ so s¸nh c¸c hÖ gen (genomics). PhÇn sau cña ch−¬ng ®Ò cËp ®Õn c¸c kü thuËt t¸ch chiÕt vµ ph©n tÝch protein lµ s¶n phÈm cña hÇu hÕt c¸c gen, bao gåm tõ viÖc tinh s¹ch protein ®Õn c¸c kü thuËt ph©n tÝch ho¹t tÝnh protein ë c¸c tÕ bµo vµ m« (proteomics). Tuy ®−îc ®Ò cËp ë c¸c phÇn t¸ch biÖt, nh−ng thùc tÕ c¸c kü thuËt ph©n tÝch ADN vµ protein ®Òu dùa trªn mét sè nguyªn lý chung vµ th−êng ®−îc sö dông phèi hîp trong c¸c nghiªn cøu. 11.2. C¸c kü thuËt ph©n tÝch axit nucleic 11.2.1. T¸ch chiÕt vµ tinh s¹ch ADN HÇu hÕt c¸c nghiªn cøu ph©n tÝch gen ®Òu b¾t ®Çu b»ng viÖc ph¶i t¸ch chiÕt vµ tinh s¹ch ADN tõ c¸c ®èi t−îng nghiªn cøu. Dï lµ t¸ch chiÕt ADN tõ vi khuÈn, ®éng vËt hay thùc vËt th× mét sè b−íc ®Çu tiªn cña qui tr×nh ®Òu cÇn “gi¶i phãng” c¸c thµnh phÇn cña tÕ bµo vµo dung dÞch. Do vi khuÈn th−êng tån t¹i ë d¹ng c¸c tÕ bµo ®¬n, kh«ng cã cÊu tróc x−¬ng, kh«ng tÝch lòy chÊt bÐo, Ýt hîp chÊt sinh häc thø cÊp ... nªn viÖc t¸ch chiÕt ADN th−êng t−¬ng ®èi ®¬n gi¶n. Ng−îc l¹i, phÇn lín c¸c m« thùc vËt vµ ®éng vËt th−êng cÇn ph¶i nghiÒn nhá trong nit¬ láng thµnh nh÷ng h¹t mÞn tr−íc khi cã thÓ t¸ch ADN. ViÖc t¸ch chiÕt ADN tõ tÕ bµo ®éng vËt (vÝ dô: tõ ®u«i chuét) ®«i khi cÇn c¸c enzym ph©n hñy c¸c m« liªn kÕt gióp t¨ng hiÖu qu¶ gi¶i phãng c¸c tÕ bµo vµ thµnh phÇn cña chóng vµo dÞch chiÕt. §Æc biÖt, c¸c tÕ bµo thùc vËt cã thµnh cøng, nªn th−êng ph¶i sö dông c¸c biÖn ph¸p c¬ häc (vÝ dô: sö dông m¸y xay, nghiÒn b»ng cèi) hoÆc sö dông mét sè enzym ®Æc hiÖu ph©n hñy thµnh tÕ bµo tr−íc khi cã thÓ t¸ch ADN. C¸c tÕ bµo thùc vËt cßn cã ®Æc ®iÓm phæ biÕn lµ tÝch lòy c¸c hîp chÊt sinh häc thø cÊp ë hµm l−îng cao, nªn ®Ó lo¹i bá c¸c hîp chÊt nµy th−êng ph¶i bæ sung vµo dung dÞch chiÕt mét sè hîp chÊt, vÝ dô nh− CTAB (cetyltrimethylammonium bromide) gióp t¨ng hiÖu qu¶ lo¹i bá c¸c hîp chÊt polysaccharide vµ polyphenol. C¸c qui tr×nh t¸ch chiÕt ADN ®¬n gi¶n nhÊt lµ ë vi khuÈn. §Çu tiªn c¸c tÕ bµo vi khuÈn cã thÓ ®−îc xö lý víi enzym lysozyme gióp ph©n hñy líp petidoglycan trªn thµnh tÕ bµo. Sau ®ã, mÉu ®−îc xö lý tiÕp víi c¸c hîp chÊt tÈy lµm 323
§inh §oµn Long ph©n r· c¸c cÊu tróc lipid trªn ADN vµ ARN trong n−íc mµng tÕ bµo. C¸c hîp chÊt t¹o phøc kiÓu EDTA (ethylene diamine tetraacetate) còng Bæ sung L¾c Ly t©m th−êng ®−îc dïng ®Ó lo¹i bá Phenol m¹nh c¸c ion kim lo¹i. Trong c¸c b−íc nh− vËy, ADN ®−îc gi¶i Phenol Protein ADN, ARN vµ trong phãng vµo dÞch chiÕt vµ sau ®ã protein trong ®−îc tinh s¹ch. Cã hai ph−¬ng ph¸p phæ pha n−íc phenol biÕn ®−îc dïng phèi hîp ®Ó H×nh 11.1. Dïng phenol lo¹i protein khái dÞch chiÕt ADN vµ ARN. tinh s¹ch ADN lµ ly t©m vµ chiÕt xuÊt bëi dung m«i. Nguyªn lý cña ph−¬ng ph¸p ly t©m lµ khi dÞch chiÕt tÕ bµo ®−îc “quay” ë tèc ®é cao th× lùc ly t©m lµm l¾ng ®äng c¸c thµnh phÇn tÕ bµo cã khèi l−îng vµ kÝch th−íc lín. Ch¼ng h¹n, khi thµnh tÕ bµo cña vi khuÈn ®· bÞ ph©n gi¶i th× hÇu hÕt c¸c thµnh phÇn tÕ bµo cña nã ë d¹ng hßa tan trong dÞch chiÕt bëi chóng cã kÝch th−íc nhá, cßn ADN vµ mét sè chÊt cã khèi l−îng ph©n tö lín sÏ l¾ng xuèng ®¸y èng ly t©m. Lóc nµy, dÞch chiÕt mang c¸c thµnh phÇn tÕ bµo bÞ ph©n hñy dÔ dµng ®−îc hót ra vµ lo¹i bá. H¹t kÕt tña mang ADN sau ®ã ®−îc hßa tan trë l¹i trong dung dÞch ®Öm phï hîp. Tuy nhiªn, nã th−êng cßn lÉn ARN vµ protein. C¸c hîp chÊt nµy sau ®ã cã thÓ ®−îc lo¹i bá nhê sö dông c¸c dung m«i thÝch hîp. Trong b−íc tinh s¹ch ADN, phenol lµ mét dung m«i cã hiÖu qu¶ cao vµ ®−îc dïng réng r·i, tuy nã kh¸ ®éc bëi kh¶ n¨ng hßa tan vµ g©y biÕn tÝnh m¹nh protein. ViÖc sö dông phenol gióp hßa tan vµ t¸ch bá protein khái ADN. Khi bæ sung phenol vµo n−íc, hai chÊt láng nµy kh«ng thÓ trén víi nhau thµnh dung dÞch ®ång nhÊt, mµ thay vµo ®ã phenol sÏ t¸ch ra thµnh líp riªng ë d−íi líp n−íc (h×nh 11.1). Tuy vËy, khi l¾c m¹nh, hai líp dÞch nµy cã thÓ hßa vµo nhau thµnh hçn hîp “t¹m thêi”; lóc ®ã, protein sÏ hßa tan vµo phenol. Sau ®ã, khi ®−a dung dÞch hçn hîp vÒ tr¹ng th¸i tÜnh, hai pha phenol vµ n−íc l¹i t¸ch nhau ra. Lóc nµy, pha phenol mang nhiÒu ph©n tö protein ë d¹ng hßa tan, cßn hÇu hÕt ADN vµ ARN chØ cã ë pha n−íc. ViÖc hót n−íc (líp ë trªn) ra khái hçn hîp sÏ gióp t¸ch axit nucleic khái protein. §Ó gi¶m tèi ®a l−îng protein cßn sãt l¹i, b−íc chiÕt xuÊt b»ng phenol cã thÓ ®−îc thùc hiÖn lÆp l¹i nhiÒu lÇn. Mét sè quy tr×nh t¸ch chiÕt ADN gÇn ®©y nh»m tr¸nh phenol (v× tÝnh ®éc cña nã) ®· cã mét sè c¶i tiÕn. Phæ biÕn nhÊt lµ viÖc sö dông c¸c cét chøa chÊt nÒn liªn kÕt ®Æc hiÖu ADN. Trong ®ã, hai nhãm chÊt nÒn th«ng dông nhÊt lµ silic dioxide vµ c¸c hîp chÊt trao ®æi anion. C¸c chÊt nÒn dùa trªn silic dioxide cã kh¶ n¨ng liªn kÕt ®Æc hiÖu víi ADN ë nång ®é muèi thÊp vµ pH cao. Trong khi ®ã, c¸c chÊt nÒn trao ®æi anion, nh− diethylaminoethyl-cellulose, tÝch ®iÖn d−¬ng liªn kÕt m¹nh víi khung ®−êng-phosphate cña ph©n tö ADN. Khi sö dông c¸c chÊt nÒn trao ®æi anion ë nång ®é muèi thÊp, ADN ®−îc “b¾t gi÷” trong cét; nh−ng khi nång ®é muèi t¨ng, ADN sÏ ®−îc röa tr«i khái cét bëi nång ®é muèi cao lµm ph¸ vì c¸c liªn kÕt ion gi÷a ADN vµ chÊt nÒn. B−íc tiÕp theo cña viÖc tinh s¹ch ADN lµ cÇn lo¹i bá ARN. ViÖc nµy th−êng ®−îc thùc hiÖn nhê c¸c enzym ribonuclease (vÝ dô: RNase A). Nhãm enzym nµy cã kh¶ n¨ng nhËn biÕt ®Æc hiÖu ARN (qua nhãm C2’-OH) vµ ph©n gi¶i chóng thµnh nh÷ng ®o¹n nhá, mµ hÇu nh− kh«ng t¸c ®éng ®Õn c¸c ph©n tö ADN. Trong b−íc xö lý ribonuclease, hçn hîp ADN vµ ARN ®−îc ñ ë nhiÖt ®é tèi −u cña enzym. Sau ®ã, dÞch chiÕt ®−îc bæ sung mét thÓ tÝch t−¬ng ®−¬ng cña alcohol (etanol hay isoamylalcohol). C¸c hîp chÊt alcohol lµm kÕt tña c¸c ph©n tö kÝch th−íc lín mµ lóc nµy trong dÞch chiÕt chØ cßn chñ yÕu lµ ADN. C¸c ®o¹n ARN nhá ë d¹ng hßa tan nªn cã thÓ dÔ dµng hót ra vµ lo¹i bá. §iÓm ®¸ng l−u ý lµ c¸c alcohol lµm kÕt tña c¸c ®¹i ph©n tö mét c¸ch kh«ng ®Æc hiÖu, nªn c¸c hîp 324
Ch−¬ng 11. Ph©n tÝch gen vµ s¶n phÈm cña gen chÊt nh− hydrat carbon vµ protein cã thÓ cïng kÕt tña víi ADN vµ ARN. ThÕ nªn, b−íc kÕt tña b»ng alcohol th−êng chØ ®−îc thùc hiÖn sau khi c¸c thµnh phÇn kh¸c cña tÕ bµo ®· ®−îc lo¹i bá khái dÞch chiÕt nhê ly t©m vµ/hoÆc chiÕt xuÊt bëi phenol. Hçn hîp ADN vµ ARN sau khi ®−îc xö lý b»ng ribonuclease råi bæ sung etanol ®−îc ly t©m ®Ó thu kÕt tña ADN, cßn ARN ë d¹ng hßa tan trong dÞch chiÕt ®−îc hót ra vµ lo¹i bá. H¹t ADN kÕt tña ë ®¸y èng ly t©m ®«i khi rÊt nhá (thËm chÝ kh«ng nh×n thÊy b»ng m¾t th−êng), nh−ng ®· chøa hµng triÖu ph©n tö ADN vµ th−êng lµ ®ñ cho c¸c nghiªn cøu tiÕp theo. ADN lóc nµy cã møc ®é tinh s¹ch cao, ®−îc hßa tan trë l¹i trong dung dÞch ®Öm n−íc vµ cã thÓ sö dông cho c¸c thÝ nghiÖm ph©n tÝch ADN sau ®ã. 11.2.2. Sö dông quang phæ ®Ó x¸c ®Þnh nång ®é ADN vµ ARN C¸c cÊu tróc vßng th¬m (purine vµ pyrimidine) cña c¸c nucleotide cÊu t¹o nªn ADN vµ ARN t¹o cho c¸c ph©n tö nµy cã c−êng ®é hÊp thô tia tö ngo¹i cùc ®¹i ë vïng b−íc sãng 260 nm (t−¬ng øng víi tia UV). Khi tia UV ®−îc chiÕu qua dung dÞch axit nucleic, møc hÊp thô tia UV (A260 hay OD260) phô thuéc vµo nång ®é cña c¸c axit nucleic. TÝnh chÊt nµy lµ nguyªn lý c¬ b¶n cña viÖc dïng m¸y quang phæ ®Ó x¸c ®Þnh nång ®é ADN vµ ARN trong dung dÞch. Theo ®ã, dùa trªn nång ®é ADN hoÆc ARN cña c¸c dung dÞch chuÈn biÕt tr−íc, c¸c gi¸ trÞ A260 t−¬ng øng ®−îc dïng ®Ó vÏ ®−êng tuyÕn tÝnh chuÈn t−¬ng quan gi÷a nång ®é axit nucleic víi chØ sè A260. Dùa trªn ®−êng chuÈn nµy, cã thÓ x¸c ®Þnh ®−îc nång ®é ADN hoÆc ARN cã trong dung dÞch mÉu sau khi ®o ®−îc chØ sè A260 cña nã. Kh¸c víi ADN vµ ARN, protein hÊp thô tia tö ngo¹i cùc ®¹i ë b−íc sãng 280nm (®iÒu nµy chñ yÕu lµ do cÊu tróc vßng th¬m cña axit amin tryptophan). §é tinh s¹ch cña dÞch chiÕt ADN cã thÓ x¸c ®Þnh qua tØ sè A260/A280. DÞch chiÕt chØ chøa ADN tinh s¹ch cã tØ sè A260/A280 xÊp xØ 1,8. NÕu cã protein, tØ sè nµy th−êng thÊp h¬n 1,8. Cßn nÕu cã ARN, tØ sè nµy lín h¬n 1,8. DÞch chiÕt chØ chøa ARN tinh s¹ch cã tØ sè A260/A280 xÊp xØ 2,0. Trong dung dÞch chØ chøa c¸c nucleotide ®¬n lÎ, v× c¸c nucleotide hßa tan kh¾p dung dÞch, nªn c−êng ®é hÊp thô cña chóng lín h¬n khi chóng ë trong c¸c ph©n tö ADN vµ ARN. Së dÜ nh− vËy lµ do c−êng ®é hÊp thô tia UV chñ yÕu do c¸c vßng purine vµ pyrimidine chø kh«ng ph¶i do phÇn ®−êng vµ phosphate. Trong ph©n tö ADN sîi kÐp, c¸c vßng purine vµ pyrimidine bÞ “ch¾n” bëi khung ®−êng-phosphate, nªn c−êng ®é hÊp thô tia UV gi¶m. C¸c ph©n tö ARN vµ ADN cã cÊu tróc d¹ng m¹ch ®¬n víi mét sè vïng cã thÓ cã cÊu tróc sîi kÐp nªn cã møc hÊp thô trung b×nh. Hµm l−îng ADN vµ ARN trong dung dÞch th−êng ®−îc qui ®æi trªn c¬ së chØ sè A260 theo c«ng thøc: 1 A260 cña dung dÞch ADN sîi kÐp (dsADN) = 50 µg 1 A260 cña dung dÞch ADN m¹ch ®¬n (ssADN)/ARN = 40 µg 1 A260 cña dung dÞch dNTP/oligonucleotide = 33 µg 11.2.3. §iÖn di ph©n tÝch axit nucleic Cã nhiÒu ph−¬ng ph¸p kh¸c nhau cã thÓ dïng ®Ó ph©n tÝch ADN, nh−ng ®Õn nay ®iÖn di trªn gel lµ ph−¬ng ph¸p ®−îc dïng phæ biÕn nhÊt nhê −u ®iÓm nhanh vµ ®¬n gi¶n. Nguyªn t¾c cña ph−¬ng ph¸p lµ: d−íi t¸c ®éng cña ®iÖn tr−êng, c¸c ph©n tö axit nucleic (tÝch ®iÖn ©m) kh¸c nhau vÒ kÝch th−íc, ®iÖn tÝch, møc ®é cuén xo¾n vµ d¹ng ph©n tö (m¹ch th¼ng hay vßng) sÏ di chuyÓn qua hÖ m¹ng cña gel tõ cùc ©m (cathode) sang cùc d−¬ng (anode) víi tèc ®é di chuyÓn kh¸c nhau. V× vËy, chóng dÇn dÇn t¸ch nhau ra trªn tr−êng ®iÖn di; qua ®ã, ng−êi ta cã thÓ thu thËp vµ ph©n tÝch ®−îc tõng ph©n ®o¹n ADN hoÆc gen riªng rÏ. Trªn tr−êng ®iÖn di, c¸c ph©n ®o¹n ADN cã kÝch th−íc cµng nhá cµng di chuyÓn nhanh. Sau khi ®iÖn di kÕt thóc, c¸c ph©n tö ADN cã thÓ quan s¸t 325
§inh §oµn Long ®−îc nhê sö dông thuèc nhuém ph¸t huúnh quang, nh− ethidium bromide (EtBr, xem c¬ chÕ ë ch−¬ng 3). Mçi b¨ng ®iÖn di th−êng ph¶n ¸nh mét tËp hîp c¸c ph©n tö ADN cã cïng kÝch th−íc. Cã hai lo¹i gel ®iÖn di ®−îc dïng phæ biÕn lµ agarose vµ polyacrylamide. Trong ®ã, gel polyacrylamide cã ®é ph©n gi¶i cao, nh−ng vïng kÝch th−íc ADN cã thÓ ph©n tÝch hÑp. Cô thÓ, ph−¬ng ph¸p nµy cã thÓ ph©n t¸ch c¸c ®o¹n ADN kh¸c nhau thËm chÝ chØ mét cÆp nucleotide (1 bp), nh−ng th−êng chØ dïng ®Ó ph©n tÝch c¸c ®o¹n ADN kÝch th−íc nhá (tõ 5 ®Õn 1000 bp). Trong khi ®ã, gel agarose cã ®é ph©n gi¶i thÊp ®èi víi c¸c ®o¹n ADN kÝch th−íc nhá, nh−ng rÊt hiÖu qu¶ khi ph©n t¸ch c¸c ®o¹n ADN kÝch th−íc lín (kho¶ng tõ 200 bp ®Õn 20 kb; 1 kb = 1000 bp). C¸c ®o¹n ADN kÝch th−íc lín kh«ng thÓ “lät” qua c¸c lç nhá trªn c¸c b¶n gel, kÓ c¶ gel agarose. Thay vµo ®ã, chóng (th−êng ë d¹ng m¹ch th¼ng) “tr−ên” qua m¹ng l−íi gel b»ng c¸ch ®Çu nµy cña ph©n tö ®i tr−íc, cßn ®Çu kia theo sau. HËu qu¶ lµ c¸c ®o¹n ADN lín (tõ 10 kb ®Õn 10 Mb; 1 Mb = 1000 kb) cã tèc ®é dÞch chuyÓn trªn tr−êng ®iÖn di gÇn t−¬ng ®−¬ng vµ khã ph©n t¸ch nhê ®iÖn di th«ng th−êng. §èi víi c¸c ®o¹n ADN lín nh− vËy, ng−êi ta cã thÓ dïng ph−¬ng ph¸p ®iÖn di xung tr−êng (PFGE, pulsed-field gel electrophoresis). Trong ph−¬ng ph¸p nµy, 2 cÆp ®iÖn cùc ®−îc ®Æt chÐo gãc trªn b¶n ®iÖn di (h×nh 11.2). ViÖc “bËt” vµ “t¾t” lu©n phiªn 2 cÆp ®iÖn cùc lµm c¸c ®o¹n ADN lín thay ®æi chiÒu dÞch chuyÓn nh− m×nh häa trªn h×nh. C¸c ®o¹n ADN cã kÝch th−íc cµng lín cµng chËm h¬n trong qu¸ tr×nh ®æi chiÒu dÞch chuyÓn. Nhê vËy, c¸c ®o¹n kÝch th−íc kh¸c nhau sÏ t¸ch khái nhau. Kü thuËt PFGE trong thùc tÕ cã thÓ dïng ®Ó x¸c ®Þnh trùc tiÕp kÝch th−íc cña nhiÔm s¾c thÓ (NST) vi khuÈn, hoÆc NST sinh vËt nh©n thËt bËc thÊp, nh− nÊm men hoÆc mét sè nguyªn sinh ®éng vËt. KÝch th−íc hÖ gen cña nh÷ng loµi nµy kho¶ng vµi Mb. §èi víi c¸c ®o¹n ADN kÝch th−íc nhá chØ kh¸c nhau mét vµi bp, vÝ dô nh− c¸c s¶n phÈm PCR cña c¸c alen thuéc cïng locut, ng−êi ta cã thÓ dïng ph−¬ng ph¸p ®iÖn di biÕn tÝnh gradient (DGGE). Trong kü thuËt DGGE, c¸c ph©n tö ADN sîi kÐp ®−îc g©y biÕn tÝnh bëi nhiÖt hoÆc hãa chÊt, nh− urª hay formamide (®«i khi phèi hîp c¶ hai ph−¬ng ph¸p) ®ång thêi víi qu¸ tr×nh diÖn di. NhiÖt ®é th−êng ®−îc duy tr× cao (50 – §iÖn cùc 0% Gradient biÕn tÝnh 70% C¸c giÕng tra mÉu ChiÒu dÞch chuyÓn cña ADN ThÓ ®ét biÕn 1 Gradient biÕn tÝnh 40% dÔ biÕn tÝnh h¬n ADN kiÓu d¹i ThÓ ®ét biÕn 2 70% khã biÕn tÝnh h¬n DGGE vu«ng gãc DGGE song song H×nh 11.2. Kü thuËt ®iÖn di xung tr−êng. H×nh 11.3 C¸c kü thuËt ®iÖn di biÕn tÝnh gradient DGGE A vµ B lµ hai bé ®iÖn cùc. Chóng ®−îc bËt vµ t¾t (Denaturing gradient gel electrophoresis). Trong DGGE vu«ng gãc, lu©n phiªn. Khi bËt A, ph©n tö ADN di chuyÓn vÒ hçn hîp 3 ®o¹n ADN (kiÓu d¹i, ®ét biÕn 1 vµ 2) ®−îc tra vµo mét gãc ph¶i phÝa d−íi. Khi A t¾t vµ B bËt, ph©n tö giÕng dµi n»m ngang b¶n gel. Do t¸c ®éng cña chÊt g©y biÕn tÝnh ë ADN di chuyÓn vÒ gãc tr¸i phÝa d−íi. Mòi tªn m« nång ®é kh¸c nhau, sù ®Þnh vÞ cña c¸c ®o¹n ADN t¹o nªn d¹ng t¶ h−íng di chuyÓn cña ph©n tö ADN trong ®iÖn ®−êng cong sigma. §iÖn di DGGE song song t¹o nªn phæ ®iÖn di di xung tr−êng. gièng ®iÖn di trªn gel th«ng th−êng. 326
Ch−¬ng 11. Ph©n tÝch gen vµ s¶n phÈm cña gen 65oC) vµ æn ®Þnh, trong khi nång ®é urª vµ formamide ®−îc t¨ng dÇn theo chiÒu song song (DGGE song song) hoÆc vu«ng gãc (DGGE vu«ng gãc) víi chiÒu ®iÖn di. Trong DGGE song song, kÕt qu¶ ®iÖn di h×nh thµnh c¸c b¨ng t¸ch biÖt gièng ®iÖn di trªn gel agarose. Trong DGGE vu«ng gãc, hçn hîp c¸c ph©n tö ADN chØ kh¸c biÖt nhau mét hoÆc mét vµi bp ph©n t¸n kh¾p b¶n gel vµ t¹o nªn mét chuçi b¨ng d¹ng ®−êng cong sigma (h×nh 11.3). §iÖn di kh«ng nh÷ng cã thÓ ph©n t¸ch c¸c ®o¹n ADN kh¸c nhau vÒ kÝch th−íc mµ c¶ vÒ h×nh d¹ng vµ cÊu h×nh cña chóng. C¸c ph©n tö ADN ë d¹ng m¹ch vßng duçi xo¾n hoÆc bÞ “®øt g·y” ë mét sè nucleotide di chuyÓn chËm h¬n trªn tr−êng ®iÖn di so víi c¸c ph©n tö ADN ë d¹ng m¹ch th¼ng cã cïng khèi l−îng. Trong khi ®ã, c¸c ph©n tö ADN ë d¹ng siªu xo¾n (kÝch th−íc thu nhá) th−êng di chuyÓn nhanh h¬n trªn tr−êng ®iÖn di so víi c¸c ph©n tö ADN d¹ng m¹ch vßng duçi xo¾n hoÆc cã møc ®é cuén xo¾n thÊp h¬n cã cïng khèi l−îng. Kü thuËt ®iÖn di còng ®−îc dïng ®Ó ph©n t¸ch ARN. Gièng ADN, c¸c ph©n tö ARN còng tÝch ®iÖn ©m. Tuy nhiªn, nÕu nh− c¸c ®o¹n ADN sîi kÐp th¼ng th−êng cã cÊu tróc bËc hai ®ång nhÊt (nªn tèc ®é dÞch chuyÓn trªn tr−êng ®iÖn di t−¬ng quan víi khèi l−îng cña chóng), th× ARN ngoµi cÊu tróc m¹ch ®¬n, cßn cã c¸c cÊu tróc bËc 2 vµ 3 ¶nh h−ëng ®Õn tèc ®é dÞch chuyÓn cña chóng trªn tr−êng ®iÖn di. §Ó h¹n chÕ ®iÒu nµy, ng−êi ta th−êng xö lý ARN víi mét sè hãa chÊt ph¸ vì liªn kÕt côc bé trong ph©n tö, nh− glyoxal. Hîp chÊt nµy liªn kÕt vµo nhãm -NH2 cña c¸c baz¬ nit¬ vµ ng¨n c¶n sù kÕt cÆp gi÷a chóng. C¸c ARN ®−îc xö lý glyoxal kh«ng h×nh thµnh c¸c cÊu tróc bËc cao, nªn tèc ®é di chuyÓn trªn tr−êng ®iÖn di phô thuéc chñ yÕu vµo khèi l−îng ph©n tö cña chóng. ë phÇn sau cña ch−¬ng nµy, chóng ta sÏ thÊy kü thuËt ®iÖn di còng ®−îc dïng phæ biÕn trong ph©n tÝch protein. 11.2.4. Sö dông enzym giíi h¹n trong ph©n tÝch ADN HÇu hÕt c¸c ph©n tö ADN trong tù nhiªn ®Òu lín h¬n nhiÒu so víi kÝch th−íc cã thÓ thao t¸c thuËn lîi trong phßng thÝ nghiÖm. Trong tÕ bµo, phÇn lín NST lµ mét ph©n tö ADN chøa hµng tr¨m, thËm chÝ hµng ngh×n gen kh¸c nhau. V× vËy, ®Ó ph©n lËp vµ ph©n tÝch tõng gen, ng−êi ta th−êng ph¶i c¾t c¸c ph©n tö ADN kÝch th−íc lín thµnh c¸c ®o¹n nhá. C«ng viÖc nµy ®−îc thùc hiÖn bëi mét nhãm enzym ®Æc biÖt gäi lµ c¸c enzym giíi h¹n. TÊt c¶ c¸c enzym giíi h¹n ®Òu cã hai ®Æc tÝnh: 1) nhËn biÕt mét tr×nh tù ®Æc hiÖu trªn ADN (gäi lµ vÞ trÝ giíi h¹n); vµ 2) c¾t trong ph©n tö ADN t¹i vÞ trÝ ®Æc hiÖu (hoÆc ngay t¹i vÞ trÝ giíi h¹n nh− c¸c enzym giíi h¹n lo¹i II, hoÆc c¸ch vÞ trÝ giíi h¹n mét sè nucleotide nhÊt ®Þnh nh− c¸c enzym giíi h¹n lo¹i I, III vµ IV). Trong kü thuËt di truyÒn, c¸c enzym giíi h¹n lo¹i II (chiÕm kho¶ng 40%) ®−îc dïng phæ biÕn h¬n c¶ v× tr×nh tù ADN t¹i vÞ trÝ c¾t cña chóng lµ x¸c ®Þnh. C¸c vÞ trÝ giíi h¹n cña nhãm enzym nµy th−êng gåm 4 - 8 bp, th−êng cã tÝnh ®èi xøng vµ ®iÓm c¾t trong tr×nh tù giíi h¹n. VÝ dô nh− EcoRI t×m thÊy ë E. coli cã tr×nh tù giíi h¹n lµ 5’-G↓AATTC-3’ víi vÞ trÝ c¾t ë gi÷a G vµ A. Tªn enzym gåm 3 ký tù ®Çu chØ tªn loµi vi khuÈn tõ ®ã enzym ®−îc t×m ra (Eco = Escherichia coli), c¸c ký tù sau chØ chñng vi khuÈn (vÝ dô: R) vµ sè thø tù enzym ®−îc thÊy ë vi khuÈn ®ã (EcoRI lµ enzym giíi h¹n ®Çu tiªn ph¸t hiÖn ®−îc ë E. coli). Mét enzym giíi h¹n cã tr×nh tù giíi h¹n gåm 6 bp gièng nh− EcoRI th−êng ®−îc tr«ng ®îi cã trung b×nh mét vÞ trÝ c¾t trong mçi ®o¹n ADN cã kÝch th−íc kho¶ng 4 kb (bëi theo x¸c suÊt, t¹i mét vÞ trÝ nhÊt ®Þnh trªn ADN, x¸c suÊt ®Ó cã mét lo¹i nucleotide nhÊt 327
§inh §oµn Long ®Þnh lµ 1/4, v× vËy x¸c suÊt ®Ó cã mét tr×nh tù nhÊt ®Þnh gåm 6 bp sÏ lµ 1/46 = 1/4096). Nãi c¸ch kh¸c, kÝch th−íc trung b×nh cña c¸c ®o¹n ADN ®−îc c¾t bëi EcoRI lµ 4096 bp. Gi¶ sö mét ph©n tö ADN m¹ch th¼ng cã 6 vÞ trÝ c¾t cña EcoRI, th× ph©n tö nµy sau khi ®−îc xö lý víi enzym sÏ cho 7 ph©n ®o¹n ADN kh¸c nhau. Trªn tr−êng ®iÖn di, s¶n phÈm c¾t gåm 7 ph©n ®o¹n ADN nµy sÏ ph©n t¸ch nhau ra do kh¸c nhau vÒ khèi l−îng. ViÖc sö dông mét enzym giíi h¹n kh¸c, ch¼ng h¹n HindIII còng cã tr×nh tù giíi h¹n gåm 6 bp, nh−ng cã tr×nh tù giíi h¹n thay ®æi (5’-A↓AGCTT-3’) sÏ cho ra c¸c s¶n phÈm c¾t kh¸c víi khi sö dông EcoRI. Víi mét sè enzym giíi h¹n kh¸c, ch¼ng h¹n nh− Sau3AI (t×m thÊy ë vi khuÈn Staphylococcus aureus) cã tr×nh tù giíi h¹n ng¾n h¬n (5’-GA↓TC- 3’), nªn tÇn sè c¾t cña chóng th−êng cao h¬n c¸c enzym cã tr×nh tù giíi h¹n dµi. Theo x¸c suÊt, c¸c ®o¹n ADN sîi kÐp ®−îc Sau3AI c¾t cã kÝch th−íc trung b×nh kho¶ng 250 bp (1/44 = 1/256). Ng−îc l¹i, enzym NotI cã tr×nh tù giíi h¹n dµi (5’-GC↓GGCCGC-3’) t¹o ra c¸c ®o¹n c¾t trung b×nh dµi 65 kb (1/48 = 1/65.536). Nh− vËy, viÖc sö dông ®ång thêi nhiÒu enzym giíi h¹n sÏ t¹o ra mét phæ c¸c kiÓu h×nh ®iÖn di ®Æc thï ®èi víi mçi gen ®−îc ph©n tÝch. C¸c enzym giíi h¹n kh«ng chØ kh¸c nhau vÒ tr×nh tù giíi h¹n vµ ®é dµi ®o¹n tr×nh tù giíi h¹n ®Æc tr−ng cña chóng, mµ cßn kh¸c nhau vÒ c¸ch “c¾t” ph©n tö ADN. Ch¼ng h¹n nh− Sau3AI nªu trªn t¹o ra c¸c ph©n tö ADN d¹ng ®Çu b»ng (®Çu tï), cßn c¸c enzym EcoRI, HindIII vµ NotI c¾t ph©n tö ADN t¹o ra c¸c ph©n ®o¹n cã ®Çu dÝnh. Së dÜ gäi lµ “®Çu dÝnh” v× hai ®Çu ph©n tö ADN sau khi ®−îc enzym c¾t cã tr×nh tù bæ sung víi nhau theo nguyªn t¾c Chargaff; v× vËy, chóng cã xu h−íng “dÝnh” l¹i víi nhau, hoÆc “dÝnh” víi c¸c ph©n tö ADN kh¸c ®−îc c¾t bëi cïng enzym giíi h¹n. TÝnh chÊt nµy ®−îc dïng trong nh©n dßng ph©n tö vµ ADN t¸i tæ hîp. Mét sè enzym giíi h¹n kh¸c c¾t ®Æc hiÖu ADN m¹ch ®¬n. 11.2.5. C¸c ph−¬ng ph¸p lai axit nucleic vµ mÉu dß Nh− ®· nªu ë ch−¬ng 2 (môc 2.1.4.3), c¸c ph©n tö ADN sîi kÐp cã tÝnh chÊt ®Æc biÖt lµ kh¶ n¨ng biÕn tÝnh (t¸ch thµnh hai m¹ch ®¬n) vµ håi tÝnh (hai m¹ch ®¬n cã tr×nh tù bæ sung liªn kÕt trë l¹i khi lo¹i bá c¸c yÕu tè g©y biÕn tÝnh). Kh¶ n¨ng liªn kÕt bæ sung gi÷a c¸c baz¬ nit¬ cho phÐp hai m¹ch ADN cã nguån gèc kh¸c nhau nh−ng cã tr×nh tù bæ trî liªn kÕt víi nhau trong ®iÒu kiÖn phï hîp (vÒ nhiÖt ®é, ®é pH, …) ®Ó t¹o nªn mét ph©n tö ADN míi. HiÖn t−îng liªn kÕt nh− vËy cã thÓ x¶y ra gi÷a hai m¹ch ADN víi nhau, hoÆc gi÷a hai m¹ch ARN hoÆc gi÷a ADN vµ ARN. Ph©n tö axit nucleic sîi kÐp míi h×nh thµnh ®−îc gäi lµ ph©n tö lai vµ qu¸ tr×nh kÕt cÆp gi÷a c¸c baz¬ thuéc hai m¹ch ®¬n axit nucleic cã nguån gèc kh¸c nhau theo nguyªn t¾c bæ sung nh− vËy ®−îc gäi lµ qu¸ tr×nh lai ph©n tö. NhiÒu nghiªn cøu di truyÒn ph©n tö hiÖn nay dùa trªn ph−¬ng ph¸p lai ph©n tö. VÝ dô: b»ng ph−¬ng ph¸p nµy, ng−êi ta cã thÓ dïng mét ®o¹n ADN cã tr×nh tù biÕt tr−íc, gäi lµ mÉu dß, ®Ó x¸c ®Þnh mét tr×nh tù bæ sung t−¬ng øng cã trong hÖ gen ®−îc quan t©m nghiªn cøu. C¸c mÉu dß cã thÓ cã nguån gèc tù nhiªn hoÆc ®−îc tæng hîp hãa häc; ®Ó dÔ ph¸t hiÖn, c¸c mÉu dß th−êng ®−îc ®¸nh dÊu bëi chÊt phãng x¹ hoÆc chÊt ph¸t quang. Cã hai ph−¬ng ph¸p ®¸nh dÊu mÉu dß ADN. Ph−¬ng ph¸p thø nhÊt dùa trªn nguyªn t¾c tæng hîp hãa häc ADN sö dông tiÒn chÊt lµ c¸c ph©n tö ®−îc ®¸nh dÊu phãng x¹ hoÆc ph¸t quang. Ph−¬ng ph¸p thø hai dùa trªn nguyªn t¾c g¾n mét ph©n tö ®¸nh dÊu vµo ®u«i cña mét tr×nh tù ADN cã s½n. VÝ dô, nhê sö dông enzym polynucleotide kinase, ng−êi ta cã thÓ g¾n nhãm γ cña ATP vµo nhãm 5’-OH cña ®o¹n ADN lµm mÉu dß. NÕu nhãm γ nµy ®−îc ®¸nh dÊu b»ng ®ång vÞ 32P th× ADN mÉu dß sÏ ph¸t phãng x¹. Trong ph−¬ng ph¸p cßn l¹i (sö dông c¸c tiÒn chÊt ®¸nh dÊu), ng−êi ta cã thÓ thùc hiÖn ph¶n øng PCR víi mét trong 4 tiÒn chÊt dNTP ®−îc ®¸nh dÊu víi chÊt ph¸t quang hoÆc 328
Ch−¬ng 11. Ph©n tÝch gen vµ s¶n phÈm cña gen phãng x¹. Trong ph−¬ng ph¸p nµy, chØ cÇn 25% nucleotide cña mÉu dß ADN ®−îc ®¸nh dÊu lµ ®ñ ®Ó ph©n tÝch. C¸c mÉu dß ADN ®−îc ®¸nh dÊu b»ng chÊt ph¸t quang cã thÓ ph¸t hiÖn d−íi nguån s¸ng UV, cßn c¸c mÉu dß ®¸nh dÊu phãng x¹ ®−îc ph¸t hiÖn b»ng ph−¬ng ph¸p phãng x¹ tù chôp nhê phim tia X, hoÆc ®o b»ng m¸y khuÕch ®¹i tÝn hiÖu h¹t β víi hai ®ång vÞ phãng x¹ ®−îc dïng phæ biÕn lµ 32P vµ 35S. Cã nhiÒu c¸ch ®Ó x¸c ®Þnh c¸c ph©n ®o¹n ADN vµ ARN ®Æc hiÖu dùa trªn lai ph©n tö. D−íi ®©y, chóng ta chØ ®Ò cËp ®Õn hai ph−¬ng ph¸p phæ biÕn. 11.2.5.1. X¸c ®Þnh c¸c ®o¹n ADN b»ng ®iÖn di vµ mÉu dß - lai Southern Sö dông mÉu dß kÕt hîp víi ®iÖn di lµ ph−¬ng ph¸p c¬ b¶n ®ång thêi cã thÓ gióp x¸c ®Þnh møc ®é phæ biÕn vµ kÝch th−íc cña mét ®o¹n ADN hoÆc ARN ®−îc quan t©m nghiªn cøu. VÝ dô: b»ng ph−¬ng ph¸p nµy, ng−êi ta cã thÓ x¸c ®Þnh vµ so s¸nh ®−îc møc biÓu hiÖn cña mét gen ë c¸c lo¹i m« vµ tÕ bµo qua viÖc x¸c ®Þnh sè l−îng b¶n phiªn m· mARN t−¬ng øng cña gen cã t¹i mçi lo¹i m« vµ tÕ bµo t−¬ng øng. Gi¶ sö chóng ta c¾t hÖ gen cña nÊm men b»ng EcoRI vµ cÇn x¸c ®Þnh kÝch th−íc cña ®o¹n ADN mang tr×nh tù gen A. ADN tæng sè sau khi ®−îc c¾t b»ng EcoRI sÏ t¹o nªn mét hçn hîp c¸c ph©n ®o¹n cã kÝch th−íc trung b×nh 4 kb (v× 46 = 4.096 bp). V× vËy, nÕu ®em s¶n phÈm c¾t giíi h¹n nhuém víi EtBr, th× s¶n phÈm ®iÖn di sÏ lµ mét d¶i c¸c ®o¹n liªn tôc cã kÝch th−íc quanh vïng 4 kb vµ kh«ng thÓ x¸c ®Þnh ®−îc chÝnh x¸c ph©n ®o¹n nµo mang gen A. Trong tr−êng hîp nµy, kü thuËt lai Southern (cßn gäi lµ thÈm t¸ch Southern) cã thÓ ®−îc dïng ®Ó x¸c ®Þnh ®o¹n ADN mang gen ®ã (h×nh 11.4). Ng−êi ta mang gel ®iÖn di chøa c¸c s¶n phÈm c¾t ng©m vµo dung dÞch kiÒm nhÑ ®Ó lµm biÕn tÝnh ADN. Råi c¸c ®o¹n ADN ®−îc chuyÓn sang mét mµng tÝch ®iÖn d−¬ng gäi lµ mµng lai theo kiÓu “®ãng dÊu”. NghÜa lµ c¸c ®o¹n ADN ®Þnh vÞ trªn mµng lai sÏ t−¬ng øng víi c¸c ®o¹n ADN trªn gel ®iÖn di. Mµng lai sau ®ã ®−îc ñ víi mÉu dß cã tr×nh tù ADN bæ sung víi tr×nh tù cña gen A. Qu¸ tr×nh ñ ®−îc tiÕn hµnh trong ®iÒu kiÖn nhiÖt ®é vµ nång ®é muèi phï hîp cho sù håi tÝnh cña axit nucleic. Trong ®iÒu kiÖn ®ã, c¸c mÉu dß sÏ chØ t¹o liªn kÕt ®Æc hiÖu víi ph©n ®o¹n ADN mang gen A. Do c¸c ®o¹n gen th−êng cã kÝch th−íc lín h¬n nhiÒu so víi mÉu dß, nªn kh¶ n¨ng håi tÝnh cña c¸c ®o¹n gen sÏ khã x¶y ra h¬n so víi “ph¶n øng” a) C¸c b−íc trong ph−¬ng ph¸p lai Southern VÞ trÝ ®o¹n ADN lai gi÷a mÉu dß víi C¸c mÉu dß ADN ®−îc ®¸nh lai víi mÉu dß gen. C¸c ®o¹n ADN dÊu phãng x¹ hoÆc ph¸t quang mang tr×nh tù gen cÇn nghiªn cøu sau ADN C¸c ®o¹n ADN ®ã ®−îc ph¸t hiÖn vµ ph©n lËp nhê c¸c C¾t b»ng §iÖn di ph−¬ng ph¸p ph¸t enzym giíi h¹n hiÖn mÉu dß ®· nªu Lai vµ röa mÉu dß ë trªn. thõa Mét ph−¬ng BiÕn tÝnh ADN vµ ph¸p c¶i tiÕn cña lai chuyÓn lªn mµng lai Southern ®−îc dïng ®Ó x¸c ®Þnh vïng b) B−íc chuyÓn ADN tõ gel ®iÖn di sang mµng lai m· hãa (exon) cña Qu¶ nÆng gen ®−îc gäi lµ ph−¬ng ph¸p lai Dung dÞch ®Öm Mµng lai GiÊy läc Zoo. Ph−¬ng ph¸p Gel H×nh 11.4. Ph−¬ng ph¸p lai nµy dùa trªn lai (thÈm t¸ch) Southern. hiÖn t−îng lµ trong 329
§inh §oµn Long qu¸ tr×nh tiÕn hãa, c¸c tr×nh tù nucleotide trong c¸c vïng kh«ng m· hãa th−êng biÕn ®æi nhanh h¬n so víi c¸c vïng m· hãa ë cïng mét gen, khi so s¸nh gi÷a c¸c loµi cã quan hÖ gÇn gòi. Ch¼ng h¹n, ë mét nghiªn cøu, ng−êi ta t¸ch chiÕt ADN tõ mét nhãm c¸c loµi kh¸c nhau gåm ng−êi, v−în, khØ, chuét, bß, v.v... ADN cña mçi loµi sau ®ã ®−îc c¾t bëi cïng enzym giíi h¹n phï hîp; råi c¸c ®o¹n c¾t ®−îc ph©n t¸ch trªn ®iÖn di vµ chuyÓn lªn mµng lai. C¸c ®o¹n ADN nµy sau ®ã ®−îc lai víi mÉu dß cã nguån gèc ng−êi ®−îc “gi¶ thiÕt” lµ tr×nh tù m· hãa. NÕu ®ã thùc sù lµ tr×nh tù m· hãa th× ph¶n øng lai sÏ x¶y ra víi tÊt c¶ hoÆc hÇu hÕt c¸c mÉu ADN; nÕu kh«ng, nhiÒu kh¶ n¨ng tr×nh tù t−¬ng øng víi mÉu dß kh«ng ph¶i lµ tr×nh tù m· hãa. 11.2.5.2. X¸c ®Þnh c¸c ®o¹n ARN b»ng ®iÖn di vµ mÉu dß - lai Northern Víi cïng nguyªn t¾c, mét ph−¬ng ph¸p lai ®−îc dïng ®Ó ph©n tÝch s¶n phÈm phiªn m· mARN ®−îc gäi lµ ph−¬ng ph¸p lai Northern (hay thÈm t¸ch Northern). Tuy nhiªn, v× mARN th−êng ng¾n h¬n nhiÒu so víi ADN, nªn trong lai Northern, kh«ng cÇn c¾t mARN. Hçn hîp mARN sau khi ph©n t¸ch b»ng ®iÖn di ®−îc chuyÓn lªn mµng lai víi mÉu dß ADN t−¬ng øng víi ®o¹n mARN ®−îc t×m kiÕm. S¶n phÈm lai ë ®©y lµ ARN/ADN. Trong thùc tiÔn, lai Northern th−êng ®−îc dïng ®Ó ®Þnh l−îng mét lo¹i ph©n tö mARN nµo ®ã cã trong mÉu ph©n tÝch h¬n lµ ®Ó x¸c ®Þnh kÝch th−íc cña nã. §Ó ®Þnh l−îng mARN, mÉu dß th−êng ®−îc ®−a vµo ph¶n øng lai víi mét l−îng d− võa ®ñ nh»m ®¶m b¶o l−îng ph©n tö lai t¹o thµnh tØ lÖ thuËn víi l−îng mARN. L−îng mARN cã trong m« ®−îc coi lµ th«ng sè ph¶n ¸nh møc ®é biÓu hiÖn cña gen t−¬ng øng. Ch¼ng h¹n, b»ng lai Northern, c¸c nhµ nghiªn cøu cã thÓ ®¸nh gi¸ ®−îc ¶nh h−ëng cña mét yÕu tè phiªn m· tíi sù biÓu hiÖn cña gen nhÊt ®Þnh khi so s¸nh l−îng mARN do gen ®ã m· hãa cã trong c¸c m« ®−îc xö lý vµ kh«ng ®−îc xö lý víi yÕu tè phiªn m·. T−¬ng tù nh− vËy, kü thuËt nµy cho phÐp so s¸nh møc ®é biÓu hiÖn cña gen ë c¸c giai ®o¹n ph¸t triÓn kh¸c nhau cña c¬ thÓ. 11.2.5.3. Ph−¬ng ph¸p lai vi d·y (microarray) Nguyªn lý cña c¸c ph−¬ng ph¸p lai Southern còng chÝnh lµ c¬ së cña kü thuËt ph©n tÝch ADN b»ng vi d·y (DNA microarray) ®−îc ph¸t triÓn vµ ngµy cµng ®−îc dïng réng r·i trong c¸c nghiªn cøu di truyÒn ë cÊp ph©n tö. Trong ph−¬ng ph¸p lai vi d·y, c¸c mÉu dß th−êng lµ c¸c ®o¹n cADN ®−îc t¹o ra tõ phiªn m· ng−îc c¸c mARN t−¬ng øng ®−îc t¸ch chiÕt tõ c¸c m« hoÆc tÕ bµo. C¸c mÉu dß nµy sau ®ã ®−îc dïng ®Ó lai víi mét d·y “giÕng thö” chøa c¸c ph©n tö ADN ®−îc t¸ch chiÕt tõ c¸c mÉu sinh vËt kh¸c nhau, trong ®ã mçi d·y th−êng ®−îc bæ sung mÉu dß liªn quan ®Õn mét hoÆc mét sè gen nhÊt ®Þnh. C−êng ®é biÓu hiÖu cña s¶n phÈm lai (®o ®−îc qua mÉu dß) ë mçi d·y vµ ®èi chiÕu gi÷a c¸c d·y gióp ph¶n ¸nh møc ®é biÓu hiÖn cña gen trong c¸c ®iÒu kiÖn hoÆc ë c¸c mÉu sinh vËt kh¸c nhau. 11.2.5.4. Lai huúnh quang t¹i chç - FISH NÕu nh− c¸c ph−¬ng ph¸p lai ®−îc nªu ë trªn ®Òu cÇn t¸ch chiÕt ADN vµ ARN tõ tÕ bµo, th× ph−¬ng ph¸p lai huúnh quang t¹i chç, ®−îc gäi t¾t lµ lai FISH (fluorescence in situ hybridization), sö dông mÉu dß ®Ó ph¸t hiÖn trùc tiÕp sù cã mÆt cña mét gen hay b¶n phiªn m· mARN cña nã trong tÕ bµo mµ kh«ng cÇn qua b−íc t¸ch chiÕt axit nucleic (h×nh 11.5). Trong b−íc ®Çu tiªn, mÉu dß cã tr×nh tù t−¬ng øng víi gen quan t©m ®−îc t¹o ra hoÆc b»ng kü thuËt nh©n dßng ph©n tö hoÆc b»ng PCR. Th−êng th× chØ mét phÇn tr×nh tù ADN cña gen lµ ®ñ ®Ó lµm mÉu dß. Trong ph−¬ng ph¸p nµy, c¸c mÉu dß lu«n ®−îc ®¸nh dÊu b»ng chÊt ph¸t quang ®Ó sau qu¸ tr×nh lai chóng dÔ dµng ®−îc ph¸t hiÖn b»ng kÝnh hiÓn vi huúnh quang. Gièng c¸c ph−¬ng ph¸p lai kh¸c, trong lai FISH, ADN 330
Ch−¬ng 11. Ph©n tÝch gen vµ s¶n phÈm cña gen vµ ARN còng cÇn ®−îc g©y biÕn MÉu dß ADN ChÊt ph¸t quang tÝnh; nh−ng, viÖc g©y biÕn tÝnh ®−îc thùc hiÖn ngay trªn c¸c BiÕn tÝnh Quan s¸t b»ng kÝnh mÉu m« vµ tÕ bµo nªn ADN vµ trén hiÓn vi huúnh quang ®−îc duy tr× t¹i chç (in situ) trong nh©n tÕ bµo. §Ó thùc hiÖn H×nh 11.5. Ph−¬ng ph¸p lai huúnh quang t¹i chç (FISH). \"ph¶n øng\" lai, c¸c mÉu m« ®−îc c¾t thµnh c¸c l¸t máng nhê dao c¾t chuyªn dông (microtome) tr−íc khi ®−îc chuyÓn vµo dung dÞch biÕn tÝnh vµ lai víi mÉu dß. Mét sè øng dông c¬ b¶n cña ph−¬ng ph¸p lai FISH cã thÓ kÓ ®Õn nh− sau: 1) Cã thÓ sö dông mét sè tr×nh tù gen cña virut lµm mÉu dß ®Ó x¸c ®Þnh xem tÕ bµo cã mang c¸c gen cña virut hay kh«ng, còng nh− ®Ó x¸c ®Þnh gen cña mét virut nµo ®ã chØ giíi h¹n trong tÕ bµo chÊt hay th©m nhËp ®−îc vµo trong nh©n tÕ bµo chñ. 2) Bªn c¹nh ADN trong nh©n tÕ bµo, lai FISH cã thÓ dïng ®Ó x¸c ®Þnh vÞ trÝ cña mét gen trªn NST th«ng qua viÖc lai mÉu dß víi tÕ bµo ë kú gi÷a cña nguyªn ph©n. 3) MÉu dß ADN cã thÓ dïng ®Ó ph¸t hiÖn mét lo¹i mARN cã trong mét m« nhÊt ®Þnh. Do mARN th−êng ë d¹ng m¹ch ®¬n nªn mÉu m« kh«ng cÇn ph¶i g©y biÕn tÝnh bëi nhiÖt ®é cao hay hãa chÊt. C¸c tÕ bµo ®ang phiªn m· vµ tæng hîp m¹nh lo¹i mARN ®−îc quan t©m nghiªn cøu sÏ cã mËt ®é liªn kÕt mÉu dß cao vµ ph¸t quang m¹nh. Gen biÓu hiÖn cµng m¹nh, th× tÕ bµo ph¸t quang cµng s¸ng. ViÖc so s¸nh c¸c mÉu nh− vËy tõ c¸c m« kh¸c nhau cã thÓ gióp x¸c ®Þnh chøc n¨ng cña mét gen nhÊt ®Þnh. Tuy vËy, trong mét sè tr−êng hîp gen nghiªn cøu thuéc nhãm lu«n biÓu hiÖn yÕu (chØ cã vµi b¶n sao mARN trong mçi tÕ bµo), th× tÝn hiÖu FISH th−êng yÕu vµ kh«ng ®ñ ®Ó ph©n tÝch. Lóc nµy, viÖc ph¸t hiÖn mARN ®−îc thùc hiÖn bëi mét sè ph−¬ng ph¸p nh¹y h¬n,nh− ph−¬ng ph¸p PCR ®Þnh l−îng (RT-PCR) hoÆc microarray. Nh»m t¨ng c−êng hiÖu qu¶ cña ph−¬ng ph¸p lai FISH, mét sè mÉu dß cã thiÕt kÕt ®Æc biÖt ®−îc gäi lµ nhÊp nh¸y ph©n tö (molecular beacon). §©y lµ lo¹i mÉu dß chØ ph¸t quang sau khi ®· liªn kÕt vµo tr×nh tù ADN ®Ých. MÉu dß nhÊp nh¸y ph©n tö th−êng mang hai “gèc”: mét “gèc” ph¸t quang, gäi lµ nh©n ph¸t quang (fluorophore), ë mét ®Çu ph©n tö; cßn ®Çu kia mang “gèc” øc chÕ sù ph¸t quang, gäi lµ nh©n t¾t quang (quenching group). Mçi mÉu ADN dß nhÊp nh¸y ph©n tö cã tr×nh tù trung t©m dµi MÉu dß nhÊp kho¶ng 20 – 30 nucleotide bæ sung víi tr×nh tù gen cÇn nh¸y ph©n tö ph©n tÝch. Ngoµi ra, ë hai ®Çu nã cã hai tr×nh tù gåm kho¶ng 6 baz¬ nit¬ bæ sung víi nhau. Khi mÉu dß ë PT d¹ng tù do (kh«ng liªn kÕt víi tr×nh tù gen ®Ých), hai ®Çu mÉu dß t¹o liªn kÕt Chargaff víi nhau, dÉn ®Õn Lai víi mÉu dß viÖc nh©n t¾t quang tiÕp xóc ®−îc víi nh©n ph¸t quang vµ øc chÕ sù ph¸t quang cña mÉu dß (h×nh Nh©n ph¸t Nh©n t¾t quang (T) 11.6). Khi mÉu dß ®· liªn kÕt vµo tr×nh tù ADN ®Ých, P quang (P) tù do T tr×nh tù mÉu dß ®−îc duçi th¼ng, nªn nh©n t¾t quang kh«ng tiÕp xóc vµ øc chÕ ®−îc sù ph¸t quang cña nh©n Ph©n tö lai ADN – mÉu dß ph¸t quang. V× vËy, mÉu dß sÏ ph¸t quang m¹nh. Tuy nhiªn, ®iÒu cÇn l−u ý khi sö dông mÉu dß nhÊp nh¸y H×nh 11.6. Nguyªn t¾c lai ADN ph©n tö lµ cÇn duy tr× tÝnh æn ®Þnh cña c¸c ®o¹n bæ dïng mÉu dß nhÊp nh¸y ph©n tö. 331
§inh §oµn Long sung ng¾n ë hai ®Çu, v× nhiÖt ®é cao cã thÓ g©y biÕn tÝnh ®o¹n nµy vµ dÉn ®Õn hiÖn t−îng \"d−¬ng tÝnh gi¶\". 11.2.6. Nh©n dßng ph©n tö vµ x©y dùng ng©n hµng gen 11.2.6.1. Mét sè kh¸i niÖm chung Nh©n dßng ph©n tö (molecular cloning) chØ mét nhãm c¸c ph−¬ng ph¸p nh»m: (1) ph©n lËp mét ®o¹n gen (ADN) ®Æc hiÖu tõ hçn hîp c¸c ph©n tö ADN ban ®Çu ®−îc t¸ch chiÕt tõ c¸c mÉu sinh häc cã thµnh phÇn phøc t¹p; vµ (2) nh©n b¶n ®o¹n tr×nh tù ADN ®−îc quan t©m lªn mét l−îng ®ñ lín ®Ó cã thÓ tiÕn hµnh ph©n tÝch vÒ cÊu tróc vµ chøc n¨ng gen t−¬ng øng. ViÖc tinh s¹ch c¸c ®o¹n ADN ®Æc hiÖu ®¹t l−îng ®ñ lín lµ cÇn thiÕt ®Ó thùc hiÖn c¸c b−íc nghiªn cøu tiÕp theo. Ch¼ng h¹n, tõ ®o¹n ADN ®−îc tinh s¹ch, ng−êi ta cã thÓ t¹o nªn c¸c ph©n tö ADN t¸i tæ hîp. C¸c ph©n tö ADN t¸i tæ hîp míi cã thÓ lµm thay ®æi møc biÓu hiÖn cña mét gen (ch¼ng h¹n, khi mét tr×nh tù m· hãa cña loµi nµy ®−îc “ghÐp” víi promoter cña loµi kh¸c) hoÆc thËm chÝ tæng hîp nªn mét protein “dung hîp” míi (protein lai) chøa tr×nh tù axit amin cã nguån gèc tõ c¸c loµi kh¸c nhau. Qu¸ tr×nh nh©n dßng ph©n tö vµ t¹o ra ph©n tö ADN hoÆc protein t¸i tæ hîp th−êng liªn quan ®Õn c¸c vect¬ nh©n dßng hoÆc c¸c vect¬ biÓu hiÖn. “C«ng cô” chÝnh ®Ó t¹o ADN t¸i tæ hîp lµ c¸c enzym giíi h¹n gióp c¾t ADN t¹i c¸c vÞ trÝ x¸c ®Þnh vµ ghÐp nèi c¸c ®o¹n ADN cã nguån gèc kh¸c nhau t¹i c¸c vÞ trÝ mong muèn. B»ng viÖc t¹o nªn c¸c ph©n tö ADN t¸i tæ hîp cã kh¶ n¨ng tù sao chÐp trong tÕ bµo chñ, ®o¹n ADN cµi dÔ dµng ®−îc nh©n lªn thµnh mét l−îng lín b¶n sao. D−íi ®©y, chóng ta sÏ m« t¶ b»ng c¸ch nµo c¸c ph©n tö ADN ®−îc c¾t, t¸i tæ hîp vµ nh©n lªn, ®ång thêi còng ®Ò cËp ®Õn viÖc x©y dùng th− viÖn hÖ gen gåm tËp hîp c¸c dßng tÕ bµo mang c¸c ®o¹n ADN kh¸c nhau cña mét hÖ gen gióp ph©n tÝch chøc n¨ng cña mçi gen, còng nh− ®Ó sö dông chóng trong c¸c øng dông cña di truyÒn häc. 11.2.6.2. Nh©n dßng ADN nhê vect¬ plasmid Sau khi mét ®o¹n ADN ®−îc c¾t khái mét ph©n tö ADN cã kÝch th−íc lín h¬n b»ng enzym giíi h¹n, ®o¹n ADN ®ã cÇn ®−îc “cµi” vµo mét vect¬ ®Ó cã thÓ nh©n lªn. §Õn nay, tÕ bµo chñ ®−îc dïng réng r·i nhÊt trong c«ng nghÖ ADN t¸i tæ hîp lµ vi khuÈn E. coli. C¸c vect¬ nh©n dßng ADN ®iÓn h×nh th−êng cã 3 ®Æc tÝnh: 1) Chóng ph¶i cã mét tr×nh tù khëi ®Çu sao chÐp (vÝ trÝ t¸i b¶n), gióp ph©n tö ADN t¸i tæ hîp cã thÓ tù sao chÐp ®éc lËp víi NST cña tÕ bµo chñ. 2) Chóng ph¶i mang mét dÊu chuÈn chän läc cho phÐp ph©n biÖt ®−îc c¸c tÕ bµo mang vect¬ t¸i tæ hîp vµ c¸c tÕ bµo kh«ng mang vect¬ t¸i tæ hîp. 3) Chóng th−êng cã vÞ trÝ c¾t cña mét hay nhiÒu enzym giíi h¹n kh¸c nhau. §©y chÝnh lµ vÞ trÝ cµi cña ph©n ®o¹n ADN cÇn nh©n dßng vµo vect¬. Vect¬ nh©n dßng phæ biÕn nhÊt lµ c¸c ph©n tö ADN sîi kÐp, m¹ch vßng, kÝch th−íc nhá (kho¶ng 3 Kb) cã nguån gèc tõ c¸c plasmid vi khuÈn, mét sè tõ nÊm men. Trong nhiÒu tr−êng hîp, c¸c ph©n tö ADN nµy vèn cã s½n hai thuéc tÝnh tù nhiªn, ®ã lµ: (1) kh¶ n¨ng tù sao chÐp trong tÕ bµo chñ, vµ (2) mang gen kh¸ng kh¸ng sinh; gen nµy ®−îc dïng lµm dÊu hiÖu chän läc. Ngoµi ra, c¸c vect¬ plasmid cßn mét −u ®iÓm n÷a lµ chóng cã thÓ nh©n lªn vµ tån t¹i thµnh nhiÒu b¶n sao trong mçi tÕ bµo. §iÒu nµy gióp dÔ dµng nh©n b¶n vµ ph©n lËp ®−îc mét l−îng lín ®o¹n ADN cµi mµ chØ cÇn nu«i mét sè Ýt tÕ bµo vi khuÈn. 332
Ch−¬ng 11. Ph©n tÝch gen vµ s¶n phÈm cña gen C¸c vect¬ plasmid ®Çu tiªn chØ cã mét vÞ trÝ giíi h¹n duy nhÊt. Nh−ng cïng víi thêi gian, cÊu tróc cña c¸c vect¬ plasmid ®−îc c¶i tiÕn theo h−íng bá bít c¸c tr×nh tù kh«ng cÇn thiÕt vµ g¾n thªm ®o¹n tr×nh tù cã thÓ ®−îc c¾t b»ng nhiÒu enzym giíi h¹n kh¸c nhau. Tr×nh tù mang nhiÒu vÞ trÝ giíi h¹n nh− vËy ®−îc gäi lµ tr×nh tù ®a nh©n dßng (polycloning site). Cã nh÷ng tr×nh tù ®a nh©n dßng ®−îc thiÕt kÕ chØ dµi vµi tr¨m bp, nh−ng cã trªn 20 vÞ trÝ giíi h¹n kh¸c nhau. Nhê ®Æc ®iÓm nµy, mét vect¬ cã thÓ ®−îc dïng ®Ó nh©n dßng nhiÒu ®o¹n ADN kh¸c nhau. Dùa trªn nguyªn t¾c t−¬ng tù, ngoµi vect¬ plasmid, ng−êi ta ®· ph¸t triÓn ®−îc c¸c lo¹i vect¬ kh¸c cã nguån gèc tõ phag¬, hoÆc lµ ph©n tö lai gi÷a vi khuÈn vµ phag¬ (nh− phagemid, cosmid …), hoÆc cã nguån gèc tõ nÊm men (vÝ dô: YAC). ViÖc cµi mét ®o¹n ADN vµo vect¬ th−êng lµ c«ng viÖc t−¬ng ®èi ®¬n gi¶n. Ng−êi ta sö dông cïng mét enzym giíi h¹n ®Ó c¾t vect¬ vµ ®o¹n ADN cµi. Ch¼ng h¹n, khi xö lý vect¬ plasmid b»ng enzym EcoRI, vect¬ sÏ tõ d¹ng “vßng” chuyÓn sang d¹ng “th¼ng” víi hai ®Çu dÝnh. Do ®−îc c¾t bëi cïng enzym, ®o¹n ADN cµi còng cã hai ®Çu dÝnh víi tr×nh tù bæ sung víi tr×nh tù ®Çu dÝnh cña vect¬. C¸c ®Çu dÝnh cña vect¬ vµ ®o¹n ADN cµi trªn c¬ së nguyªn t¾c Chargaff sÏ ®Ýnh kÕt víi nhau ®Ó t¹o nªn ph©n tö ADN t¸i tæ hîp d¹ng vßng chØ cßn thiÕu mét liªn kÕt phosphodiester duy nhÊt ë mçi m¹ch. Liªn kÕt cuèi cïng nµy ®−îc h×nh thµnh bëi enzym ADN ligase xóc t¸c. §Ó h¹n chÕ kh¶ n¨ng “tù ®éng” g¾n kÕt trë l¹i gi÷a hai ®Çu dÝnh cña chÝnh vect¬, trong hçn hîp vect¬ vµ ®o¹n cµi, ng−êi ta th−êng cho d− thõa l−îng ADN cµi ®Ó t¨ng kh¶ n¨ng t¸i tæ hîp gi÷a vect¬ vµ ®o¹n ADN cµi. Mét sè lo¹i vect¬ kh«ng chØ cho phÐp nh©n dßng mét ®o¹n ADN cµi nµo ®ã, mµ cßn cã thÓ ®iÒu khiÓn sù biÓu hiÖn cña gen trong ®o¹n ADN cµi. Nh÷ng vect¬ nh− vËy ®−îc gäi lµ c¸c vect¬ biÓu hiÖn. C¸c vect¬ biÓu hiÖn th−êng ph¶i cã promoter n»m ng−îc dßng so víi vÞ trÝ cµi gen. Vïng m· hãa cña gen cÇn ®−îc g¾n vµo vect¬ theo ®óng khung ®äc th× gen míi ®−îc biÓu hiÖn. C¸c vect¬ biÓu hiÖn th−êng ®−îc dïng ®Ó biÓu hiÖn c¸c gen ®ét biÕn hoÆc c¸c gen lai nh»m ph©n tÝch chøc n¨ng cña chóng, hoÆc còng cã thÓ ®−îc dïng ®Ó s¶n xuÊt tËp trung mét lo¹i protein nµo ®ã vèn kh«ng thu ®−îc víi hiÖu suÊt t−¬ng tù trong tù nhiªn. Ngoµi ra, promoter trong c¸c vect¬ biÓu hiÖn cã thÓ ®−îc lùa chän sao cho sù biÓu hiÖn cña gen cµi cã thÓ ®−îc ®iÒu khiÓn b»ng viÖc bæ sung mét chÊt ®¬n gi¶n vµo m«i tr−êng (ch¼ng h¹n nh− mét lo¹i ®−êng hay axit amin). ViÖc cã thÓ ®iÒu khiÓn chñ ®éng sù biÓu hiÖn cña mét gen nµo ®ã cã ý nghÜa quan träng trong nghiªn cøu chøc n¨ng gen, nhÊt lµ víi c¸c gen g©y ®éc. 11.2.6.3. BiÕn n¹p c¸c vect¬ t¸i tæ hîp vµo tÕ bµo chñ BiÕn n¹p lµ qu¸ tr×nh tÕ bµo chñ cã thÓ tiÕp nhËn ph©n tö ADN ngo¹i lai hoÆc theo c¬ chÕ tù nhiªn hoÆc nhê c¸c kü thuËt “chuyÓn gen”. Trong tù nhiªn, mét sè vi khuÈn, bao gåm Streptoccocus pneumoniae, Bacillus subtilis, Haemophilus influenzae vµ Neisseria gonorrhoeae, cã c¸c c¬ chÕ tiÕp nhËn ADN tõ m«i tr−êng ngoµi. Chóng ®−îc gäi lµ c¸c vi khuÈn kh¶ biÕn tù nhiªn. MÆc dï trong tù nhiªn, E. coli th−êng kh«ng cã tÝnh kh¶ biÕn, nh−ng khi ®−îc xö lý víi ion Ca2+, vi khuÈn nµy cã thÓ tiÕp nhËn ADN tõ m«i tr−êng ngo¹i bµo. Cã thÓ ion Ca2+ víi kh¶ n¨ng “bao bäc” ph©n tö ADN tÝch ®iÖn ©m ®· t¨ng c−êng kh¶ n¨ng “x©m nhËp” qua mµng tÕ bµo cña ADN. C¸c tÕ bµo E. coli sau khi ®−îc xö lý víi Ca2+ nh− vËy còng ®−îc gäi lµ c¸c tÕ bµo kh¶ biÕn. §Ó t×m ra vµ ph©n lËp c¸c tÕ bµo kh¶ biÕn mang vect¬ t¸i tæ hîp, ng−êi ta th−êng nu«i cÊy c¸c vi khuÈn trªn m«i tr−êng chän läc chøa c¸c chÊt kh¸ng sinh t−¬ng øng víi gen ®¸nh dÊu cã mÆt trong vect¬. Nh×n chung, hiÖu suÊt cña qu¸ tr×nh biÕn n¹p th−êng kh«ng cao. ChØ mét tØ lÖ nhá c¸c tÕ bµo ®−îc xö lý biÕn n¹p cã thÓ tiÕp nhËn plasmid t¸i tæ hîp. Nh−ng, chÝnh hiÖu qu¶ biÕn n¹p thÊp nh− vËy gióp cho hÇu hÕt c¸c tÕ bµo mang vect¬ t¸i tæ hîp th−êng chØ 333
Search
Read the Text Version
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 19
- 20
- 21
- 22
- 23
- 24
- 25
- 26
- 27
- 28
- 29
- 30
- 31
- 32
- 33
- 34
- 35
- 36
- 37
- 38
- 39
- 40
- 41
- 42
- 43
- 44
- 45
- 46
- 47
- 48
- 49
- 50
- 51
- 52
- 53
- 54
- 55
- 56
- 57
- 58
- 59
- 60
- 61
- 62
- 63
- 64
- 65
- 66
- 67
- 68
- 69
- 70
- 71
- 72
- 73
- 74
- 75
- 76
- 77
- 78
- 79
- 80
- 81
- 82
- 83
- 84
- 85
- 86
- 87
- 88
- 89
- 90
- 91
- 92
- 93
- 94
- 95
- 96
- 97
- 98
- 99
- 100
- 101
- 102
- 103
- 104
- 105
- 106
- 107
- 108
- 109
- 110
- 111
- 112
- 113
- 114
- 115
- 116
- 117
- 118
- 119
- 120
- 121
- 122
- 123
- 124
- 125
- 126
- 127
- 128
- 129
- 130
- 131
- 132
- 133
- 134
- 135
- 136
- 137
- 138
- 139
- 140
- 141
- 142
- 143
- 144
- 145
- 146
- 147
- 148
- 149
- 150
- 151
- 152
- 153
- 154
- 155
- 156
- 157
- 158
- 159
- 160
- 161
- 162
- 163
- 164
- 165
- 166
- 167
- 168
- 169
- 170
- 171
- 172
- 173
- 174
- 175
- 176
- 177
- 178
- 179
- 180
- 181
- 182
- 183
- 184
- 185
- 186
- 187
- 188
- 189
- 190
- 191
- 192
- 193
- 194
- 195
- 196
- 197
- 198
- 199
- 200
- 201
- 202
- 203
- 204
- 205
- 206
- 207
- 208
- 209
- 210
- 211
- 212
- 213
- 214
- 215
- 216
- 217
- 218
- 219
- 220
- 221
- 222
- 223
- 224
- 225
- 226
- 227
- 228
- 229
- 230
- 231
- 232
- 233
- 234
- 235
- 236
- 237
- 238
- 239
- 240
- 241
- 242
- 243
- 244
- 245
- 246
- 247
- 248
- 249
- 250
- 251
- 252
- 253
- 254
- 255
- 256
- 257
- 258
- 259
- 260
- 261
- 262
- 263
- 264
- 265
- 266
- 267
- 268
- 269
- 270
- 271
- 272
- 273
- 274
- 275
- 276
- 277
- 278
- 279
- 280
- 281
- 282
- 283
- 284
- 285
- 286
- 287
- 288
- 289
- 290
- 291
- 292
- 293
- 294
- 295
- 296
- 297
- 298
- 299
- 300
- 301
- 302
- 303
- 304
- 305
- 306
- 307
- 308
- 309
- 310
- 311
- 312
- 313
- 314
- 315
- 316
- 317
- 318
- 319
- 320
- 321
- 322
- 323
- 324
- 325
- 326
- 327
- 328
- 329
- 330
- 331
- 332
- 333
- 334
- 335
- 336
- 337
- 338
- 339
- 340
- 341
- 342
- 343
- 344
- 345
- 346
- 347
- 348
- 349
- 350
- 351
- 352
- 353
- 354
- 355
- 356
- 357
- 358
- 359
- 360
- 361
- 362
- 363
- 364
- 365
- 366
- 367
- 368
- 369
- 370
- 371
- 372