§inh §oµn Long sao c¸c alen ®ét biÕn th−êng lµ lÆn. NÕu mét tÕ bµo cã c¶ hai d¹ng enzym cã ho¹t tÝnh vµ mÊt ho¹t tÝnh, th× d¹ng cã ho¹t tÝnh vÉn cã thÓ xóc t¸c c¸c ph¶n øng diÔn ra b×nh th−êng. Ngoµi ra, do tÝnh tho¸i hãa cña m· bé ba (nhiÒu m· bé ba cïng m· hãa mét axit amin), nªn nhiÒu ®ét biÕn cã thÓ kh«ng t¹o nªn hiÖu qu¶ kiÓu h×nh. Nh÷ng ®ét biÕn nµy ®−îc gäi lµ ®ét biÕn c©m (lµ mét d¹ng cña ®ét biÕn trung tÝnh). Mét c©u hái ®Æt ra lµ t¹i sao phÇn lín ®ét biÕn quan s¸t ®−îc th−êng t¹o ra s¶n phÈm mÊt hoÆc gi¶m ho¹t tÝnh? Cã lÏ tr¶i qua hµng triÖu n¨m tiÕn hãa, c¸c alen kiÓu d¹i ®· ®−îc chän läc vÒ hiÖu qu¶ thÝch nghi nªn chóng ®· cã ho¹t tÝnh tèi −u. V× vËy, c¸c ®ét biÕn ngÉu nhiªn sinh ra th−êng dÉn ®Õn sù thay ®æi cña tr×nh tù axit amin cã hÖ sè thÝch nghi cao nhÊt. Ta cã thÓ vÝ ®iÒu nµy víi mét cç m¸y phøc t¹p. NÕu c¸c m«®un cÊu t¹o m¸y ®· ®−îc tèi −u, mäi sù thay ®æi ®Òu cã xu h−íng lµm gi¶m hiÖu qu¶ cña hÖ thèng. Quan ®iÓm nh− vËy gióp gi¶i thÝch t¹i sao phÇn lín ®ét biÕn quan s¸t ®−îc th−êng lµ c¸c alen lÆn vµ cã h¹i. TiÒn chÊt ChÊt trung gian 1 ChÊt trung gian 2 S¶n phÈm Enzym A Enzym B Enzym C Gen A Gen B Gen C alen kiÓu d¹i A alen kiÓu d¹i B alen kiÓu d¹i C §ét biÕn §ét biÕn §ét biÕn Alen ®ét biÕn a Alen ®ét biÕn b Alen ®ét biÕn c Enzym a mÊt ho¹t tÝnh Enzym b mÊt ho¹t tÝnh Enzym c mÊt ho¹t tÝnh ë c¬ thÓ ®ång hîp tö ë c¬ thÓ ®ång hîp tö ë c¬ thÓ ®ång hîp tö aa bb cc TiÒn chÊt ChÊt trung gian 1 ChÊt trung gian 2 S¶n phÈm H×nh 6.3. C¸c alen lÆn ®ét biÕn th−êng g©y c¶n trë c¸c con ®−êng trao ®æi chÊt. C¸c con ®−êng nµy cã thÓ gåm mét sè b−íc ph¶n øng (nh− minh häa trªn h×nh), hoÆc gåm nhiÒu chuçi ph¶n øng dµi h¬n. C¸c alen kiÓu d¹i ë mçi gen m· hãa cho mét enzym b×nh th−êng xóc t¸c mét ph¶n øng hãa häc nhÊt ®Þnh trong qu¸ tr×nh trao ®æi chÊt. PhÇn lín c¸c ®ét biÕn x¶y ra ë c¸c alen kiÓu d¹i dÉn ®Õn sù h×nh thµnh c¸c d¹ng enzym bÞ biÕn ®æi gi¶m ho¹t tÝnh hoÆc kh«ng cßn ho¹t tÝnh. ë tr¹ng th¸i ®ång hîp tö, c¸c alen ®ét biÕn s¶n sinh ra c¸c enzym mÊt chøc n¨ng, g©y c¶n trë ( ) qu¸ tr×nh trao ®æi chÊt do thiÕu ho¹t tÝnh enzym cÇn thiÕt. 6.3.2. HiÖu qu¶ kiÓu h×nh c¸c gen m· hãa globin ë ng−êi C¸c ®ét biÕn gen m· hãa hemoglobin ë ng−êi lµ mét vÝ dô cho thÊy phÇn lín ®ét biÕn lµ cã h¹i. ë ng−êi tr−ëng thµnh, hemoglobin chñ yÕu ë d¹ng A gåm hai chuçi α vµ hai chuçi β. Mçi chuçi α gåm 141 axit amin, cßn mçi chuçi β gåm 146 axit amin. Do gièng nhau vÒ tr×nh tù, cã thÓ tin r»ng c¸c gen m· hãa globin (α, β, γ, ε vµ δ) cã cïng nguån gèc. ë c¸c quÇn thÓ ng−êi kh¸c nhau, ng−êi ta t×m thÊy nhiÒu ®ét biÕn ë gen m· hãa globin, trong ®ã hÇu hÕt lµ cã h¹i. Ch¼ng h¹n bÖnh hång cÇu h×nh liÒm (kÝ hiÖu HbS) g©y ra do ®ét biÕn thay thÕ axit amin sè 6 lµ Glu (®©y lµ mét axit amin tÝnh axit) trªn chuçi β thµnh Val (®©y lµ mét axit amin trung tÝnh). Sù thay ®æi nµy dÉn ®Õn h×nh thµnh mét 184
Ch−¬ng 6. §ét biÕn vµ söa ch÷a Adn liªn kÕt míi néi ph©n tö, lµm VÞ trÝ axit amin trong chuçi β - globin cÊu h×nh cña hemoglobin thay ®æi vµ chóng cã xu h−íng kÕt C¸c d¹ng Hb dÝnh víi nhau, lµm tÕ bµo hång cÇu cã h×nh liÒm. C¬ së ph©n tö dÉn ®Õn sù thay ®æi axit amin trªn chuçi β lµ do ®ét biÕn thay thÕ cÆp nucleotide A=T trªn alen kiÓu d¹i (HbAβ) thµnh T=A trªn alen ®ét biÕn (HbSβ). Sù thay thÕ nucleotide nh− vËy ban ®Çu ®−îc dù ®o¸n tõ tr×nh tù axit amin, sau nµy ®−îc kh¼ng ®Þnh b»ng gi¶i tr×nh tù c¸c gen (alen) HbAβ vµ HbSβ. §Õn nay, ®· cã trªn 100 H×nh 6.4. Mét sè d¹ng thay thÕ axit amin trong chuçi β-globin ë d¹ng ®ét biÕn kh¸c nhau liªn ng−êi. TÊt c¶ c¸c tr−êng hîp nªu trªn h×nh ®Òu do ®ét biÕn thay thÕ quan ®Õn chuçi β ®−îc ph¸t hiÖn ®¬n nucleotide ë gen HbAβ. §iÒu ®¸ng chó ý lµ nhiÒu d¹ng thay thÕ (mét sè vÝ dô ®−îc nªu trªn axit amin ë ®©y lµm thay ®æi tæng ®iÖn tÝch cña chuçi, mÆc dï chØ cã h×nh 6.4). PhÇn lín chóng lµ c¸c 5 trong sè 20 axit amin phæ biÕn tÝch ®iÖn ë pH trung tÝnh. C¸c ®ét ®ét biÕn dÉn ®Õn thay thÕ mét biÕn thay thÕ axit amin lµm thay ®æi tæng ®iÖn tÝch dÔ dÉn ®Õn sù axit amin. Ngoµi ra, ë ng−êi, cßn thay ®æi cÊu h×nh kh«ng gian cña protein h¬n so víi nh÷ng d¹ng thay cã nhiÒu ®ét biÕn kh¸c liªn quan thÕ kh¸c. Nãi c¸ch kh¸c, nh÷ng thay thÕ axit amin lµm thay ®æi tæng ®Õn chuçi α. ®iÖn tÝch cña protein dÔ lµm thay ®æi chøc n¨ng cña nã. 6.3.3. PhÇn lín ®ét biÕn ë ng−êi ng¨n c¶n c¸c con ®−êng trao ®æi chÊt H×nh 6.3 cho chóng ta thÊy, c¸c ®ét biÕn gen m· hãa enzym th−êng ng¨n c¶n c¸c con ®−êng trao ®æi chÊt. Nh÷ng ®ét biÕn nh− vËy x¶y ra ë mäi loµi sinh vËt. Chóng ta sÏ xem c¸c ®ét biÕn liªn quan ®Õn c¸c gen m· hãa enzym tham gia vµo c¸c con ®−êng chuyÓn hãa phenylalanine (Phe) vµ tyrosine (Tyr) g©y ra hiÖu øng kiÓu h×nh nh− thÕ nµo. ë ng−êi, Phe vµ Tyr lµ c¸c axit amin kh«ng thay thÕ. Nh−ng, kh¸c víi vi khuÈn, c¬ thÓ ng−êi kh«ng tù tæng hîp ®−îc hai axit amin nµy, mµ ®−îc cung cÊp tõ thøc ¨n. BÖnh di truyÒn phæ biÕn nhÊt liªn quan ®Õn chuyÓn hãa Phe vµ Tyr lµ phenyl keto niÖu. Ng−êi m¾c bÖnh nµy kh«ng cã enzym phenylalanine hydroxylase lµm nhiÖm vô chuyÓn hãa Phe → Tyr. BÖnh nµy g©y ra do ®ét biÕn lÆn n»m trªn NST th−êng. TriÖu chøng cña bÖnh lµ thiÓu n¨ng trÝ tuÖ nÕu ng−êi bÖnh kh«ng cã chÕ ®é dinh d−ìng (gi¶m Phe) hîp lý. Tuy nhiªn, ngoµi phenyl keto niÖu, bÖnh di truyÒn liªn quan ®Õn chuyÓn hãa Phe vµ Tyr ®Çu tiªn ®−îc ph¸t hiÖn l¹i lµ alkapto niÖu. Nguyªn nh©n g©y bÖnh còng do mét ®ét biÕn lÆn n»m trªn NST th−êng, m· hãa enzym homogentisic acid oxidase. Ngoµi c¸c bÖnh di truyÒn liªn quan ®Õn con ®−êng chuyÓn hãa Phe-Tyr nªu trªn, cßn cã hai bÖnh di truyÒn kh¸c do ®ét biÕn lÆn trªn NST th−êng ë c¸c gen m· hãa enzym tham gia vµo qu¸ tr×nh dÞ hãa Tyr, ®ã lµ bÖnh c−êng tyrosine (tyrosinosis) vµ tyrosine 185
§inh §oµn Long huyÕt (tyrosinemia). TriÖu chøng cña hai bÖnh nµy lµ do sù thiÕu hôt t−¬ng øng c¸c enzym tyrosine transaminase vµ p-hydroxyphenylpyruvic acid oxidase (h×nh 6.5). BÖnh c−êng tyrosine rÊt hiÕm gÆp vµ ch−a ®−îc nghiªn cøu chi tiÕt. Ng−êi m¾c bÖnh nµy cã hµm l−îng tyrosine tÝch lòy trong m¸u vµ n−íc tiÓu cao, ®ång thêi cã mét sè dÞ tËt bÈm sinh kh¸c. Ng−êi m¾c bÖnh tyrosine huyÕt cã hµm l−îng cña c¶ tyrosine vµ axit p-hydroxyphenylpyruvic trong m¸u vµ n−íc tiÓu cao. PhÇn lín trÎ s¬ sinh m¾c chøng tyrosine huyÕt chÕt trong 6 th¸ng ®Çu sau khi sinh do bÞ háng gan. BÖnh b¹ch t¹ng còng lµ bÖnh di truyÒn cã thÓ liªn quan ®Õn chuyÓn hãa tyrosine, do thiÕu enzym chuyÓn hãa tyrosine thµnh melanine (s¾c tè mµu ®en). Mét d¹ng b¹ch t¹ng lµ do thiÕu tyrosinase. Enzym nµy xóc t¸c ph¶n øng ®Çu tiªn trong con ®−êng tæng hîp melanine tõ tyrosine. C¸c d¹ng b¹ch t¹ng kh¸c lµ do sù ng¨n c¶n c¸c b−íc cña con ®−êng chuyÓn hãa tyrosine → melanine. Nh×n chung, c¸c d¹ng b¹ch t¹ng kh¸c nhau ®Òu do alen lÆn trªn NST th−êng g©y nªn. V× vËy, c¸c thÓ dÞ hîp tö th−êng cã kiÓu h×nh b×nh th−êng. Víi c¬ chÕ trªn, ta cã thÓ thÊy, trong tr−êng hîp kÕt h«n gi÷a hai ng−êi bÞ b¹ch t¹ng bëi ®ét biÕn ë c¸c gen kh¸c nhau, th× tÊt c¶ c¸c con cña hä vÉn cã thÓ b×nh th−êng. Nh− vËy, c¸c nghiªn cøu liªn quan ®Õn sù trao ®æi Phe-Tyr ®· cho chóng ta thÊy cã Ýt nhÊt n¨m bÖnh di truyÒn kh¸c nhau. ë ng−êi, cßn nhiÒu vÝ dô kh¸c n÷a cho thÊy c¬ chÕ di truyÒn kiÓm so¸t c¸c con ®−êng trao ®æi chÊt trong c¬ thÓ t−¬ng tù nh− víi Phe-Tyr. Protein Thyroxine (tæng hîp hoÆc tõ thøc ¨n) Phenylalanine Phenylalanine Tyrosine Tyrosinase DOPA hydroxylase B¹ch t¹ng (3,4-Dihydroxy Axit phenylalanine) Phenylpyruvic PKU (®éc víi hÖ thÇn B¹ch t¹ng kinh trung −¬ng) C−êng (kiÓu ©m tÝnh víi (kiÓu d−¬ng tÝnh tyrosine Tyrosine tyrosinase) víi tyrosinase) transaminase p-Hydroxyphenyl pyruvate Tyrosine p-Hydroxyphenyl Melanine huyÕt pyruvate oxidase (S¾c tè lµm tãc mµu 2,5-Dihydroxyphenyl pyruvate ®en vµ da sÉm mµu) (axit homogentisic) AKU Axit homogentisic oxidase Axit maleylacetoacetic CO2 + H2O H×nh 6.5. Nh÷ng bÖnh di truyÒn ë ng−êi liªn quan ®Õn chuyÓn hãa phenylalanine-tyrosine. C¸c bÖnh nµy bao gåm: phenyl keto niÖu, c−êng tyrosine, tyrosine huyÕt, alkapt« niÖu vµ b¹ch t¹ng. C¶ 5 bÖnh nµy ®Òu do c¸c ®ét biÕn lÆn n»m trªn NST th−êng g©y nªn. C¸c alen ®ét biÕn sinh ra c¸c enzym mÊt ho¹t tÝnh vµ ng¨n c¶n qu¸ tr×nh chuyÓn hãa phenylalanine – tyrosine b×nh th−êng t¹i c¸c b−íc ®−îc chØ trªn h×nh. 186
Ch−¬ng 6. §ét biÕn vµ söa ch÷a Adn 6.3.4. §ét biÕn g©y chÕt cã ®iÒu kiÖn lµ c«ng cô nghiªn cøu di truyÒn häc Trong tÊt c¶ c¸c lo¹i ®ét biÕn, kÓ c¶ c¸c ®ét biÕn trung tÝnh vµ g©y chÕt, c¸c ®ét biÕn g©y chÕt cã ®iÒu kiÖn cã ý nghÜa nhÊt trong c¸c nghiªn cøu di truyÒn häc. ThÓ mang ®ét biÕn g©y chÕt cã ®iÒu kiÖn cã ®Æc ®iÓm: 1) chÕt trong mét m«i tr−êng, gäi lµ ®iÒu kiÖn giíi h¹n; vµ 2) sèng ®−îc trong mét m«i tr−êng kh¸c, gäi lµ ®iÒu kiÖn chän läc. C¸c ®ét biÕn g©y chÕt cã ®iÒu kiÖn ®−îc sö dông ®Ó x¸c ®Þnh nh÷ng gen thiÕt yÕu qua viÖc mÊt hoµn toµn ho¹t tÝnh cña s¶n phÈm do gen m· hãa trong c¸c c¬ thÓ ®¬n béi. C¸c thÓ ®ét biÕn cã thÓ ®−îc nh©n lªn trong ®iÒu kiÖn chän läc vµ cung cÊp th«ng tin vÒ chøc n¨ng s¶n phÈm gen bÞ thiÕu hôt khi chóng ®−îc nu«i trong ®iÒu kiÖn giíi h¹n. §Õn nay, nhiÒu ®ét biÕn g©y chÕt cã ®iÒu kiÖn ®· ®−îc dïng trong viÖc lµm s¸ng tá chøc n¨ng cña c¸c gen trong c¸c qu¸ tr×nh sinh häc ë c¸c ®èi t−îng sinh vËt. Cã ba lo¹i thÓ ®ét biÕn cã ®iÒu kiÖn c¬ b¶n lµ: 1) c¸c ®ét biÕn dinh d−ìng thô ®éng (khuyÕt d−ìng), 2) c¸c ®ét biÕn mÉn c¶m nhiÖt ®é, vµ 3) c¸c ®ét biÕn mÉn c¶m chÊt g©y ®éc. C¸c thÓ ®ét biÕn dinh d−ìng thô ®éng thiÕu kh¶ n¨ng sinh tæng hîp mét hîp chÊt thiÕt yÕu (nh− axit amin, purine, pyrimidine, vitamin, ...) vèn ®−îc tæng hîp b×nh th−êng ë c¬ thÓ kiÓu d¹i, hoÆc ë d¹ng dinh d−ìng chñ ®éng trong cïng loµi. Do vËy, trong m«i tr−êng kh«ng cã chÊt chÊt dinh d−ìng nµy, thÓ ®ét biÕn dinh d−ìng thô ®éng kh«ng sèng ®−îc. Nh−ng, trong m«i tr−êng ®−îc bæ sung chÊt dinh d−ìng thiÕu hôt, thÓ ®ét biÕn cã thÓ ph¸t triÓn vµ sinh s¶n b×nh th−êng. C¸c thÓ ®ét biÕn mÉn c¶m nhiÖt ®é chØ sèng trong mét vïng nhiÖt ®é nhÊt ®Þnh, nh−ng chÕt trong mét vïng nhiÖt ®é kh¸c. PhÇn lín c¸c thÓ ®ét biÕn thuéc nhãm nµy lµ mÉn c¶m víi nhiÖt ®é cao, nh−ng cã mét sè ®ét biÕn mÉn c¶m víi nhiÖt ®é thÊp. Së dÜ kh¶ n¨ng sèng cña c¸c thÓ ®ét biÕn phô thuéc nhiÖt ®é lµ do mét (hoÆc mét sè) enzym cña chóng ë tr¹ng th¸i ho¹t ®éng ë vïng nhiÖt ®é nµy, nh−ng mÊt (hoÆc gi¶m) ho¹t tÝnh ë mét vïng nhiÖt ®é kh¸c. Ngoµi ra, cã tr−êng hîp lµ do gen m· hãa mét sè enzym hoÆc protein thiÕt yÕu chØ biÓu hiÖn ë vïng nhiÖt ®é nµy, mµ kh«ng biÓu hiÖn ë vïng nhiÖt ®é kh¸c. Nh−ng, mét khi ®· ®−îc biÓu hiÖn, s¶n phÈm cña gen còng cã ho¹t tÝnh vµ æn ®Þnh nh− ë c¸ thÓ kiÓu d¹i. C¸c thÓ ®ét biÕn mÉn c¶m chÊt g©y ®éc lµ nh÷ng thÓ ®ét biÕn chÕt khi kh«ng cã protein øc chÕ chÊt g©y ®éc, nh−ng sèng khi cã nh÷ng protein øc chÕ nµy. C¸c gen m· hãa protein øc chÕ cã thÓ söa ch÷a nh÷ng sai háng trong kiÓu h×nh cña c¸c thÓ ®ét biÕn mÉn c¶m víi chÊt g©y ®éc; hoÆc nã cã thÓ lµm biÕn ®æi s¶n phÈm cña gen ®ét biÕn vÒ d¹ng kh«ng ho¹t ®éng. VËy, b»ng c¸ch nµo chóng ta cã thÓ sö dông c¸c ®ét biÕn g©y chÕt cã ®iÒu kiÖn trong nghiªn cøu c¸c qu¸ tr×nh sinh häc. H·y b¾t ®Çu b»ng mét con ®−êng sinh tæng hîp ®¬n gi¶n sau ®©y: Gen A Gen B ↓↓ Enzym A Enzym B TiÒn chÊt X ---------→ ChÊt trung gian Y ---------→ S¶n phÈm Z ChÊt trung gian Y ®−îc t¹o ra tõ tiÒn chÊt X nhê ho¹t ®éng cña enzym A, nh−ng nã ®−îc chuyÓn hãa nhanh chãng thµnh s¶n phÈm Z do ho¹t ®éng cña enzym B. V× vËy, trong tÕ bµo, chÊt trung gian Y chØ tån t¹i ë l−îng “vÕt” vµ rÊt khã ph©n lËp ®Ó ph©n tÝch. Tuy vËy, ë ®ét biÕn gen B, nÕu enzym B mÊt hoÆc gi¶m ho¹t tÝnh, chÊt trung gian Y sÏ ®−îc tÝch lòy ë l−îng cao, nªn dÔ ph©n lËp vµ nghiªn cøu. T−¬ng tù nh− vËy, nÕu gen A ®ét biÕn, tiÒn chÊt X cã thÓ ®−îc tÝch lòy. Nhê vËy, qua nh÷ng ®ét biÕn nµy, ta cã thÓ x¸c ®Þnh ®−îc c¸c b−íc cña mét con ®−êng trao ®æi chÊt. Sù ph¸t sinh h×nh th¸i vµ ph¸t triÓn cña sinh vËt mét phÇn lµ do biÓu hiÖn theo thø tù nhÊt ®Þnh cña c¸c gen trong hÖ gen. KÕt qu¶ cña qu¸ tr×nh ®ã lµ c¸c protein lÇn l−ît ®−îc bæ sung vµo cÊu tróc cña c¸c ®¹i ph©n tö sinh häc, lµm thay ®æi cÊu h×nh vµ 187
§inh §oµn Long biÓu hiÖn chøc n¨ng cña chóng. Nhê sù ph©n lËp c¸c thÓ ®ét biÕn vÒ c¸c gen m· hãa c¸c protein, chóng ta cã thÓ x¸c ®Þnh ®−îc thø tù c¸c b−íc biÓu hiÖn cña gen trong hÖ gen vµ ph©n t¸ch c¸c qu¸ tr×nh ®ã thµnh c¸c b−íc ph¶n øng ®éc lËp. Trªn c¬ së ph©n lËp c¸c d¹ng ®ét biÕn, Robert Edgar vµ céng sù ®· x©y dùng hoµn chØnh c¸c b−íc cña qu¸ tr×nh ph¸t sinh h×nh th¸i ë phag¬ T4. Qu¸ tr×nh nµy liªn quan ®Õn sù biÓu hiÖn cña tõ 50 ®Õn 200 gen ë hÖ gen T4. Mçi gen m· hãa cho mét protein cÊu tróc, hoÆc mét enzym xóc t¸c mét ph¶n øng trong qu¸ tr×nh ph¸t sinh h×nh th¸i. B»ng viÖc sö dông hai ph−¬ng ph¸p, gåm: 1) ph©n lËp c¸c thÓ ®ét biÕn mÉn c¶m nhiÖt ®é vµ g©y chÕt cã ®iÒu kiÖn (kho¶ng 50 gen), vµ 2) sö dông kÝnh hiÓn vi ®iÖn tö vµ ph©n tÝch hãa sinh ®Ó ph©n tÝch cÊu tróc c¸c protein ®−îc tÝch lòy ë mçi d¹ng ®ét biÕn (nu«i trong ®iÒu kiÖn giíi h¹n), c¸c t¸c gi¶ ®· t×m ra c¸c b−íc chi tiÕt cña qu¸ tr×nh ph¸t sinh h×nh th¸i ë T4 nh− ®−îc minh häa trªn h×nh 6.6. Sîi ®u«i 37, 38 36 35 34 16, 2, 4, 20, 21, 17, 50, 64, 13, 63 22, 23, 49 65 14 (Tù ph¸t) 24, 31, 40, 66 §Çu 5, 6, 7, 8, 10, 9, 54, 25, 26, 27, 28, 11, 48, 12 19 18 3, 15 §u«i 29, 51, 53 H×nh 6.6. S¬ ®å gi¶n l−îc minh häa qu¸ tr×nh ph¸t sinh h×nh th¸i cña thùc khuÈn thÓ T4. C¸c gen m· hãa c¸c phÇn ®Çu, ®u«i vµ c¸c sîi ®u«i ®−îc biÓu hiÖn theo c¸c con ®−êng riªng; råi s¶n phÈm cña chóng ®−îc tæ hîp l¹i vµo giai ®o¹n cuèi cïng. C¸c chØ sè trªn h×nh biÓu diÔn gen cÇn ®−îc biÓu hiÖn t¹i mçi b−íc. Mét sè b−íc cña qu¸ tr×nh ph¸t sinh h×nh th¸i ë virut nµy ®· biÕt nh−ng ®−îc gi¶n l−îc kh«ng vÏ trªn h×nh. RÊt nhiÒu qu¸ tr×nh sinh häc kh¸c còng ®· ®−îc ph©n tÝch dùa trªn c¸c nghiªn cøu ®ét biÕn nh− vËy, bao gåm chuçi truyÒn ®iÖn tö trong quang hîp ë thùc vËt vµ c¸c qu¸ tr×nh cè ®Þnh nit¬ ë vi khuÈn. GÇn ®©y, c¸c thÓ ®ét biÕn nµy còng ®−îc sö dông trong nhiÒu nghiªn cøu vÒ sù biÖt hãa vµ ph¸t sinh h×nh th¸i ë c¸c loµi ®éng vËt vµ thùc vËt bËc cao. VÒ nguyªn t¾c, c¸c thÓ ®ét biÕn cã thÓ ®−îc dïng ®Ó x¸c ®Þnh c¸c b−íc cña mäi qu¸ tr×nh sinh häc ®−îc ®iÒu khiÓn bëi c¸c c¬ chÕ di truyÒn v× mçi gen ®Òu cã thÓ ®ét biÕn vÒ d¹ng mµ s¶n phÈm cña nã kh«ng biÓu hiÖn chøc n¨ng. §iÒu quan träng lµ viÖc x¸c ®Þnh vµ ph©n lËp ®−îc c¸c d¹ng ®ét biÕn liªn quan ®Õn c¸c tÝnh tr¹ng cÇn quan t©m. 6.4. C¬ së ph©n tö cña ®ét biÕn 6.4.1. §ét biÕn do lçi sao chÐp ADN Nh− ®· nãi ë ch−¬ng 2, khi m« t¶ cÊu tróc chuçi xo¾n kÐp ADN, Watson vµ Crick cho r»ng “nguyªn t¾c kÕt cÆp bæ trî cña c¸c baz¬ nit¬ chÝnh lµ nguyªn lý c¬ b¶n cña qu¸ tr×nh sao chÐp vËt chÊt di truyÒn”. §ång thêi, c¸c t¸c gi¶ ®· chØ ra mét c¬ chÕ gi¶i thÝch sù xuÊt hiÖn ®ét biÕn tù ph¸t. Theo ®ã, Watson vµ Crick ®· nªu r»ng “cÊu tróc cña c¸c baz¬ nit¬ trong ph©n tö ADN kh«ng ph¶i ë tr¹ng th¸i tÜnh”. C¸c nguyªn tö hydro cã thÓ chuyÓn tõ mét vÞ trÝ nµy sang vÞ trÝ kh¸c trong purine hay pyrimidine, vÝ dô nh− tõ mét nhãm amino sang mét nguyªn tö nit¬ vßng. Nh÷ng biÕn ®æi hãa häc nh− vËy ®−îc gäi lµ 188
Ch−¬ng 6. §ét biÕn vµ söa ch÷a Adn sù hç biÕn hãa häc. MÆc dï D¹ng phæ biÕn D¹ng hiÕm gÆp hiÖn t−îng hç biÕn hãa häc hiÕm khi x¶y ra, nh−ng thùc tÕ O OH chóng cã vai trß quan träng C trong duy tr× cÊu tróc chÝnh x¸c HN C CH3 C cña ADN, bëi v× mét sè d¹ng hç C CH N C CH3 biÕn hãa häc cã thÓ lµm thay ON C CH ON ®æi kh¶ n¨ng kÕt cÆp gi÷a c¸c §−êng Thymine (T) §−êng baz¬ nit¬. C¸c cÊu tróc axit D¹ng keto D¹ng enol nucleic ®−îc chóng ta m« t¶ ë NH2 NH ch−¬ng 2 lµ c¸c d¹ng phæ biÕn, C C bÒn v÷ng; mµ ë nh÷ng d¹ng N CH HN CH nµy, adenine (A) lu«n kÕt cÆp C CH vµ thymine (T), còng nh− ON C CH guanine (G) lu«n kÕt cÆp víi ON cytosine (C), vµ ng−îc l¹i. C¸c §−êng d¹ng bÒn v÷ng cña c¸c baz¬ D¹ng Amino §−êng NH2 Cytosine (C) D¹ng Imino NH nit¬, lµ keto (®èi víi G vµ T) vµ C N C N amino (®èi víi A vµ C) rÊt N C CH HN C CH hiÕm khi bÞ hç biÕn t−¬ng øng HC C HC C N N thµnh d¹ng kÐm bÒn h¬n lµ N N §−êng §−êng enol vµ imino (h×nh 6.7). Thêi D¹ng Amino ADENine (A) D¹ng Imino gian tån t¹i ë d¹ng kÐm bÒn cña c¸c baz¬ nit¬ th−êng rÊt O OH ng¾n. Tuy vËy, nÕu ®óng lóc c¸c baz¬ nit¬ tån t¹i ë c¸c d¹ng C N C N hç biÕn hãa häc kÐm bÒn, mµ HN C CH N C CH chóng ®−îc huy ®éng tham gia vµo qu¸ tr×nh sao chÐp ADN vµ CC N H2N C N C N §−êng H2N N §−êng D¹ng keto Guanine (G) D¹ng enol l¾p r¸p vµo m¹ch ADN ®ang H×nh 6.7. C¸c d¹ng hç biÕn cña bèn lo¹i nucleotide phæ biÕn. Sù chuyÓn vÞ nguyªn tö hydro (H) gi÷a vÞ trÝ sè 3 vµ 4 cña pyrimidine vµ ®−îc tæng hîp, th× ®ét biÕn gi÷a sè 1 vµ 6 cña purine lµm thay ®æi kh¶ n¨ng kÕt cÆp cña chóng. (thay thÕ nucleotide) sÏ x¶y ra. Khi c¸c baz¬ nit¬ tån t¹i ë d¹ng hç biÕn hãa häc hiÕm gÆp (enol vµ imino), th× c¸c cÆp baz¬ nit¬ ®−îc h×nh thµnh lµ A = C vµ G ≡ T (h×nh 6.8a). HËu qu¶ cña hiÖn t−îng nµy lµ sau hai lÇn sao chÐp, sÏ x¶y ra sù thay thÕ cÆp nucleotide A = T thµnh G ≡ C, hoÆc G ≡ C thµnh A = T (h×nh 6.8b). C¸c ®ét biÕn g©y ra bëi hiÖn t−îng hç biÕn hãa häc dÉn ®Õn sù thay thÕ cÆp purine - pyrimindine nµy b»ng mét cÆp purine - pyrimidine kh¸c (vÝ dô A = T → G ≡ C) vµ ng−îc l¹i. Nh÷ng ®ét biÕn thay thÕ nucleotide nh− vËy ®−îc gäi lµ ®ét biÕn ®ång ho¸n. Cßn ®ét biÕn thay thÕ c¸c baz¬ nit¬ tõ mét purine thµnh mét pyrimidine vµ ng−îc l¹i, th× ®−îc gäi lµ ®ét biÕn dÞ ho¸n. Cã 4 kiÓu ®ét biÕn ®ång ho¸n vµ 8 kiÓu ®ét biÕn dÞ ho¸n kh¸c nhau (h×nh 6.8c). Mét d¹ng ®ét biÕn ®iÓm kh¸c lµ sù thªm vµo hoÆc mÊt ®i mét hoÆc mét sè c¸c cÆp baz¬ nit¬. Khi sè cÆp baz¬ nit¬ ®−îc thªm vµo hoÆc mÊt ®i kh«ng ph¶i béi sè cña ba vµ n»m trong khung ®äc cña gen, th× dÉn ®Õn ®ét biÕn dÞch khung. Bëi v×, nh÷ng ®ét biÕn nµy lµm thay ®æi khung ®äc cña tÊt c¶ c¸c bé ba m· hãa cßn l¹i trong gen n»m xu«i dßng kÓ tõ vÞ trÝ ®ét biÕn (h×nh 6.9). 189
§inh §oµn Long C¶ ba d¹ng ®ét biÕn lµ ®ång ho¸n, dÞ ho¸n vµ lÖch khung ®Òu cã thÓ xuÊt hiÖn do hËu qu¶ cña ®ét biÕn tù ph¸t. Tuy vËy, mét ®iÒu ®¸ng ng¹c nhiªn lµ phÇn lín c¸c ®ét biÕn tù ph¸t ®· ®−îc nghiªn cøu ®Õn nay thuéc nhãm thªm hoÆc mÊt mét cÆp nucleotide chø kh«ng ph¶i lµ c¸c ®ét biÕn thay thÕ nucleotide. HÇu nh− tÊt c¶ c¸c ®ét biÕn dÞch khung trong thùc tÕ ®Òu dÉn ®Õn sù tæng hîp c¸c protein mÊt chøc n¨ng. a) C¸c d¹ng kÕt cÆp hiÕm A = C vµ G ≡ T h×nh thµnh khi C vµ G ë c¸c d¹ng hç biÕn hiÕm lµ imino vµ enol HH CH3 CN CO HC C H HC C HH N N O N N N C H C §−êng C H C N §−êng O N C N O N C CH CH HC N C N H C C N N N Cytosine Thymine H D¹ng phæ biÕn keto §−êng D¹ng hiÕm imino ADENine §−êng GuaNine D¹ng phæ biÕn amino D¹ng hiÕm enol D¹ng kÕt cÆp hiÕm A = C D¹ng kÕt cÆp hiÕm G ≡ T b) Hç biÕn g©y ®ét biÕn thay thÕ nucleotide sau 2 lÇn sao chÐp c) 12 kiÓu thay thÕ nucleotide cã thÓ x¶y ra trong ph©n tö ADN ADN gèc T=A G≡C A=T C≡G Sao chÐp lÇn 1 T T* ≡ G G* ≡ T A* = C C* = A A G Sao chÐp lÇn 2 ADN ®ét biÕn C≡G A=T G≡C T=A C Tr−êng hîp 1 Tr−êng hîp 2 Tr−êng hîp 3 Tr−êng hîp 4 H×nh 6.8. HiÖn t−îng hç biÕn hãa häc g©y ®ét biÕn thay thÕ nucleotide. a) HiÖn t−îng hç biÕn hãa häc g©y nªn c¸c d¹ng kÕt cÆp hiÕm lµ A = C vµ G ≡ T (cã 4 tr−êng hîp t−¬ng øng víi 4 d¹ng hç biÕn hiÕm cña A, T, G vµ C; ë ®©y chØ minh häa 2 tr−êng hîp cña G vµ C). b) HiÖn t−îng hç biÕn g©y ®ét biÕn thay thÕ nucleotide kiÓu ®ång ho¸n sau hai lÇn sao chÐp, nÕu nucleotide d¹ng hç biÕn hiÕm (kÝ hiÖu dÊu *) xuÊt hiÖn mét lÇn trong qu¸ tr×nh sao chÐp. c) 12 kiÓu thay thÕ nucleotide cã thÓ x¶y ra trong ph©n tö ADN, trong ®ã cã 4 kiÓu ®ét biÕn thay thÕ ®ång ho¸n (kÝ hiÖu b»ng mòi tªn liÒn nÐt) vµ 8 kiÓu ®ét biÕn thay thÕ dÞ ho¸n (kÝ hiÖu b»ng mòi tªn ®øt nÐt). Thªm cÆp G ≡ C ADN A T G A A A G G G C C C T T T ... A T G A A A C G G G C C C T T T ... T A C T T T C C C G G G A A A ... T A C T T T G C C C G G G A A A ... M¹ch m· hãa A U G A A A G G G C C C U U U ... AUGA A AC GGGCCCUU ... mARN Codon Codon Codon Codon Codon Codon Codon Codon Codon Codon 123 45 123 45 Protein Met Lys Gly Pro Phe … Met Lys Arg Ala Leu … H×nh 6.9. §ét biÕn dÞch khung. Sù thªm vµo hay mÊt ®i mét hoÆc hai cÆp baz¬ nit¬ lµm thay ®æi khung ®äc vµ toµn bé c¸c bé ba (codon) m· hãa cßn l¹i n»m xu«i dßng gen kÓ tõ vÞ trÝ ®ét biÕn. 190
Ch−¬ng 6. §ét biÕn vµ söa ch÷a Adn Mét c¬ chÕ ®ét biÕn tù a) ChiÒu tæng hîp ADN b) ChiÒu tæng hîp ADN ph¸t kh¸c cã thÓ x¶y ra dÉn ®Õn sù thªm vµo hoÆc mÊt ®i mét sè nucleotide liªn quan ®Õn sù sao chÐp ADN tr−ît (cßn gäi lµ sù sao chÐp lÖch môc tiªu, h×nh 6.10). HiÖn t−îng nµy th−êng ®−îc cho lµ c¬ chÕ dÉn ®Õn sù h×nh thµnh nhiÒu locut mang c¸c tr×nh tù nucleotide ng¾n lÆp l¹i liªn tôc víi sè l−îng biÕn ®éng c) STR (short tandem repeats) vµ VNTR (variable number ChiÒu tæng hîp ADN tandem repeats). Sù sao chÐp lÖch môc tiªu lµ do sù h×nh thµnh c¸c vßng ADN m¹ch ®¬n th−êng h×nh thµnh ë c¸c ®o¹n c¸c tr×nh tù nucleotide ng¾n lÆp l¹i liªn tôc. NÕu vßng nµy xuÊt ph¸t tõ m¹ch khu«n, th× cã xu h−íng lµm mÊt nucleotide (lµm gi¶m sè tr×nh tù lÆp l¹i); cßn nÕu xuÊt ph¸t tõ m¹ch ®ang ®−îc tæng hîp th× cã xu h−íng thªm nucleotide (lµm t¨ng sè tr×nh tù lÆp l¹i). H×nh 6.10. Sao chÐp tr−ît (lÖch) môc tiªu cã thÓ lµ nguyªn nh©n dÉn §o¹n tr×nh tù ng¾n lÆp l¹i ®Õn c¸c locut cã sè l−îng tr×nh tù lÆp l¹i biÕn ®éng (STR vµ VNTR). a) NÕu baz¬ nit¬ bÞ sao chÐp tr−ît n»m trªn m¹ch ®ang tæng hîp míi, th× liªn tiÕp ®−îc gäi lµ ®¬n vÞ dÉn ®Õn sù t¨ng sè l−îng cña ®¬n vÞ lÆp l¹i (ë vÝ dô nµy lµ [T]5 → [T]6). lÆp l¹i. Chóng ta dÔ dµng b) NÕu baz¬ nit¬ bÞ sao chÐp tr−ît n»m trªn m¹ch lµm khu«n, th× dÉn ®Õn nhËn thÊy nÕu ®¬n vÞ lÆp l¹i sù gi¶m sè l−îng ®¬n vÞ lÆp l¹i (ë vÝ dô nµy lµ [GA]3 → [GA]4). c) Mét sè kh«ng ph¶i lµ béi sè cña ba, tr×nh tù lÆp l¹i cã thÓ t¹o cÊu tróc cÆp tãc, dÉn ®Õn sè l−îng ®¬n vÞ lÆp l¹i th× ®ét biÕn do sao chÐp lÖch thay ®æi nhiÒu sau mçi lÇn sao chÐp (ë vÝ dô nµy lµ [GTC]8 → [GTC]13). môc tiªu cã xu h−íng g©y nªn ®ét biÕn dÞch khung. Trong c¸c locut STR (cßn gäi lµ vi vÖ tinh, microsatellite, hay SSR), ®¬n vÞ lÆp l¹i th−êng ng¾n, gåm tõ 2 ®Õn 6 bp, ch¼ng h¹n ®¬n vÞ lÆp l¹i 2 bp [GT]n hay lÆp l¹i 3 bp [CAG]n (trong ®ã n lµ sè lÇn lÆp l¹i). Theo mét thèng kª gÇn ®©y, hÖ gen ng−êi cã kho¶ng 128.000 locut lÆp 2 bp, 8740 locut lÆp l¹i 3 bp, 23.680 locut lÆp l¹i 4 bp, 4300 locut lÆp l¹i 5 bp vµ 230 locut lÆp l¹i 6 bp. Trong c¸c locut lÆp l¹i 6 bp bao gåm c¸c locut t¹i c¸c vïng ®Çu mót NST. C¸c locut VNTR (cßn gäi lµ tiÓu vÖ tinh, minisatellites) cã ®Æc ®iÓm còng gièng víi STR vÒ sù lÆp l¹i liªn tiÕp cña c¸c tr×nh tù ®¬n, nh−ng ®¬n vÞ lÆp l¹i th−êng lín h¬n, gåm tõ 7 ®Õn vµi chôc bp. Trong hÖ gen ng−êi, sè locut VNTR Ýt h¬n nhiÒu so víi STR. MÆc dï cßn nhiÒu ®iÓm ch−a hoµn toµn s¸ng tá vÒ nguyªn nh©n, c¬ chÕ ph©n tö vµ tÇn sè cña c¸c ®ét biÕn tù ph¸t nh−ng cã thÓ kÓ ®Õn 3 yÕu tè chÝnh lµ: 1) sù chÝnh x¸c cña bé m¸y sao chÐp ADN, 2) hiÖu qu¶ cña c¸c c¬ chÕ söa ch÷a ADN, vµ 3) møc ®é tiÕp xóc víi c¸c t¸c nh©n g©y ®ét biÕn trong m«i tr−êng. Thùc tÕ, nh÷ng trôc trÆc trong 191
§inh §oµn Long c¸c qu¸ tr×nh sao chÐp ADN vµ söa ch÷a ADN (vèn lµ c¸c qu¸ tr×nh ®−îc ®iÒu khiÓn bëi c¬ chÕ di truyÒn) trong nhiÒu tr−êng hîp ®· lµm t¨ng tÇn sè ®ét biÕn lªn ®¸ng kÓ. 6.4.2. §ét biÕn do c¸c t¸c nh©n hãa häc ViÖc ph¸t hiÖn ra ngµy cµng nhiÒu c¸c hîp chÊt g©y ®ét biÕn ®· gióp chóng ta hiÓu biÕt ngµy cµng ®Çy ®ñ h¬n vÒ c¸c c¬ chÕ ®ét biÕn ë møc ph©n tö. MÆc dï ngµy nay ®· cã nhiÒu hîp chÊt ®−îc xÕp vµo danh môc c¸c hîp chÊt g©y ®ét biÕn, nh−ng ë ®©y chóng ta chØ nªu ®¹i diÖn mét sè hîp chÊt cã hiÖu lùc g©y ®ét biÕn m¹nh vµ c¬ chÕ ®Æc tr−ng. Cã lÏ, khÝ mï t¹t lµ hîp chÊt g©y ®ét biÕn ®Çu tiªn ®−îc biÕt. Nhµ khoa häc Anh Auerbach vµ c¸c ®ång nghiÖp ®· ph¸t hiÖn ra hiÖu lùc ®ét biÕn cña khÝ nµy trong ThÕ chiÕn thø hai. Nh−ng do lo sî khÝ nµy ®−îc dïng lµm vò khÝ, chÝnh phñ Anh ®· kh«ng cho phÐp c¸c nhµ khoa häc c«ng bè vÒ ph¸t hiÖn nµy cho ®Õn khi ThÕ chiÕn kÕt thóc. Ngµy nay chóng ta biÕt, khÝ mï t¹t thuéc mét nhãm lín hîp chÊt g©y ®ét biÕn cã tªn gäi chung lµ c¸c hîp chÊt alkyl hãa (lµ c¸c chÊt cã kh¶ n¨ng chuyÓn c¸c nhãm -CH3 hoÆc - C2H5 ... sang c¸c baz¬ nit¬ cña ADN). C¸c t¸c nh©n ®ét biÕn hãa häc cã thÓ ph©n thµnh hai nhãm chÝnh: 1) nhãm c¸c hîp chÊt t¸c ®éng ®Õn ADN ®ang sao chÐp hay kh«ng sao chÐp; nhãm nµy gåm c¸c hîp chÊt alkyl hãa vµ axit nit¬, vµ 2) nhãm c¸c hîp chÊt chØ t¸c ®éng ®Õn c¸c ph©n tö ADN ®ang sao chÐp, bao gåm c¸c hîp chÊt cã cÊu tróc ph©n tö gÇn gièng c¸c purine vµ pyrimidine (gäi lµ c¸c hîp chÊt thÕ baz¬ nit¬). Ngoµi ra, nhãm thø hai còng gåm c¶ c¸c thuèc nhuém acridine, cã thÓ xen vµo gi÷a ph©n tö ADN lµm ph¸t sinh sai sãt trong sao chÐp ADN. Së dÜ c¸c hîp chÊt thÕ baz¬ nit¬ cã thÓ g©y ®ét biÕn lµ do chóng cã cÊu tróc gièng c¸c baz¬ nit¬ nªn cã thÓ cµi vµo chuçi polynucleotide ®ang tæng hîp. Nh−ng, ®ång thêi chóng còng ®ñ kh¸c c¸c baz¬ nit¬ ®Ó g©y nªn sù kÕt cÆp sai trong qu¸ tr×nh sao chÐp. Cã hai hîp chÊt g©y ®ét biÕn ®iÓn h×nh ho¹t ®éng theo c¬ chÕ thÕ baz¬ nit¬ lµ 5-BU (5-bromouracine) vµ 2-AP (2-aminopurine). 5-BU cã cÊu tróc gièng thymine (ë vÞ trÝ C5 cña 5-BU cã nhãm bromine gièng víi nhãm methyl ë vÞ trÝ nµy cña thymine). Nh−ng do nhãm bromine hay thay ®æi sù ph©n bè ®iÖn tÝch, nªn dÔ x¶y ra hiÖn t−îng hç biÕn hãa häc (h×nh 6.11). ë d¹ng bÒn v÷ng keto, 5-BU liªn kÕt víi adenine. Nh−ng khi bÞ hç biÕn (vÒ d¹ng enol), 5-BU sÏ liªn kÕt víi guanine. Nh− vËy, hËu qu¶ cña ®ét biÕn do 5-BU g©y ra gièng víi ®ét biÕn do hç biÕn hãa häc cña c¸c baz¬ nit¬ trong ®ét biÕn tù ph¸t (h×nh 6.8b). Nãi c¸ch kh¸c, ®ét biÕn do 5-BU g©y ra th−êng lµ ®ång ho¸n (A=T → G≡C). Tuy nhiªn, nÕu d¹ng kÐm bÒn enol cña 5-BU l¹i xuÊt hiÖn ®óng vµo lóc m¹ch ADN ®ang tæng hîp, th× 5-BU cã thÓ kÕt cÆp víi guanine, vµ dÉn ®Õn ®ét biÕn ng−îc (G≡C → A=T). §©y lµ mét c¬ chÕ g©y ®ét biÕn phôc håi. Nh−ng, nhí r»ng d¹ng enol lµ kÐm bÒn nªn rÊt hiÕm gÆp. V× vËy, tÇn sè ®ét biÕn ng−îc th−êng nhá h¬n ®ét biÕn thuËn. C¬ chÕ ho¹t ®éng cña 2-AP còng gièng nh− 5-BU, nh−ng nã thay thÕ c¸c purine A vµ G. Axit nit¬ (HNO2) lµ mét chÊt g©y ®ét biÕn m¹nh t¸c ®éng lªn ph©n tö ADN bÊt kÓ ph©n tö nµy ®ang sao chÐp hay kh«ng. §©y lµ mét hîp chÊt oxy hãa m¹nh, lµm lo¹i nhãm amin (NH2-) ra khái c¸c baz¬ nit¬ A, G vµ C. Ph¶n øng nµy lµm d¹ng amino chuyÓn thµnh d¹ng keto, vµ lµm thay ®æi kh¶ n¨ng t¹o liªn kÕt hydro cña c¸c baz¬ nit¬ (h×nh 6.11d). Adenine sau khi bÞ lo¹i nhãm amin th× chuyÓn thµnh hypoxanthine cã xu h−íng liªn kÕt víi cytosine (chø kh«ng ph¶i víi thymine nh− b×nh th−êng). Cytosine th× chuyÓn thµnh uracil (nghÜa lµ liªn kÕt víi A chø kh«ng ph¶i víi G). Guanine th× chuyÓn thµnh xanthine; nh−ng xanthine th× vÉn liªn kÕt víi C, nªn sù lo¹i amin hãa cña guanine kh«ng g©y ®ét biÕn. Do sù lo¹i amin hãa cña axit nit¬ ®èi víi A dÉn ®Õn ®ét biÕn ®ång ho¸n A=T → G≡C, vµ ®èi víi C g©y nªn ®ét biÕn ®ång hãa ng−îc lµ G≡C → A=T. Nªn cã thÓ kh¼ng ®Þnh, axit nit¬ cã thÓ g©y ®ét biÕn hai chiÒu A=T ↔ G≡C. KÕt qu¶ lµ, t¸c nh©n ®ét biÕn nµy cã thÓ g©y ®ét biÕn thuËn vµ ®ét biÕn ng−îc phôc håi trë l¹i alen kiÓu d¹i. 192
Ch−¬ng 6. §ét biÕn vµ söa ch÷a Adn C¸c thuèc nhuém acridine, nh− proflavine (h×nh 6.11c) hay c¸c dÉn xuÊt acridine kh¸c, lµ c¸c hîp chÊt g©y ®ét biÕn m¹nh theo kiÓu ®ét biÕn dÞch khung. C¸c thuèc nhuém acridine cã tÝnh kiÒm lu«n cã xu h−íng t¹o liªn kÕt vµ xen vµo gi÷a c¸c cÆp baz¬ nit¬ xÕp chång lªn nhau trªn chuçi ADN. Khi ph©n tö nµy xen vµo chuçi xo¾n kÐp, nã lµm ph©n tö ADN trë nªn cøng nh¾c vµ lµm thay ®æi cÊu h×nh xo¾n kÐp th«ng th−êng, thËm chÝ lµm vÆn xo¾n ph©n tö ADN. Khi ®o¹n ADN ®ang sao chÐp liªn kÕt víi acridine, nã th−êng bÞ mÊt mét hoÆc mét sè baz¬ nit¬, dÉn ®Õn ®ét biÕn dÞch khung. Nh− ®· ®Ò cËp ë trªn, c¸c ®ét biÕn do acridine g©y ra th−êng lµm mÊt chøc n¨ng gen hoÆc s¶n phÈm cña gen. C¸c chÊt alkyl hãa lµ c¸c chÊt cã thÓ chuyÓn nhãm alkyl cña chóng cho c¸c hîp chÊt kh¸c. Chóng bao gåm khÝ mï t¹t vµ c¸c hîp chÊt methyl vµ ethyl methane sulfate (MMS vµ EMS). C¸c hîp chÊt nµy cã nhiÒu hiÖu øng kh¸c nhau lªn ph©n tö ADN. C¸c hîp chÊt alkyl hãa cã thÓ g©y nªn c¸c lo¹i ®ét biÕn kh¸c nhau, bao gåm ®ång ho¸n, dÞ ho¸n, dÞch khung vµ thËm chÝ biÕn d¹ng NST, tïy thuéc vµo møc ho¹t ®éng cña mçi hîp chÊt víi ADN. Mét c¬ chÕ g©y ®ét biÕn cña c¸c hîp chÊt alkyl hãa lµ chóng chuyÓn nhãm ethyl hoÆc methyl tíi c¸c baz¬ nit¬ vµ lµm chóng kÕt cÆp sai. VÝ dô nh−, EMS ethyl hãa c¸c baz¬ nit¬ ë c¸c vÞ trÝ 7-N vµ 6-O. Khi G → 7-ethylguanine, nã kÕt cÆp víi thymine vµ a) C¸c hîp chÊt akyl hãa CH3 CH2 O SO2 CH3 CH3 CH2 O SO2 CH2 CH3 Cl CH2 CH2 S CH2 CH2 Cl Ethyl methane sulfonate Ethyl ethane sulfonate (EMS) (EES) Di-(2-chloroethyl) sulfide (khÝ mï t¹t) b) C¸c hîp chÊt gièng baz¬ nit¬ c) Nhãm thuèc nhuém acridine OH HHH H C Br NCC N HCCCH NC CH CCCC CC H2N C N C N C C+C C + ONH H H2N C N C NH3 H 2 - Amino purine HHH (2-AP) 5-Bromouracine 2,8-Diamino acridine (5-BU) (Proflavin) d) C¸c hîp chÊt khö e) C¸c hîp chÊt f) Sù kÕt cÆp cña 5-BU víi A vµ G nhãm amin hydroxyl hãa Br HNO2 NH2OH NCO CCHH Axit nit¬ Hydroxylamine N NN C H C §−êng N C N H×nh 6.11. Mét sè nhãm hîp chÊt g©y ®ét biÕn O CH m¹nh. a) C¸c hîp chÊt akyl hãa cã thÓ g©y nªn c¸c HCNC N ®ét biÕn ®ång ho¸n, dÞ ho¸n, dÞch khung hoÆc biÕn (5-BU = A) §−êng d¹ng NST. b) C¸c hîp chÊt thÕ baz¬ nit¬ cã xu Br h−íng g©y nªn ®ét biÕn ®ång ho¸n. c) Nhãm hîp NCO chÊt kiÓu acridine cã xu h−íng g©y ®ét biÕn dÞch CCH khung. d) C¸c hîp chÊt khö nhãm amin cã thÓ g©y O ®ét biÕn ®ång ho¸n hai chiÒu. e) C¸c hîp chÊt NN C H C hydroxyl hãa cã hiÖu øng g©y ®ét biÕn ®Æc hiÖu §−êng N C N (xem thªm trong bµi). f) Kh¶ n¨ng kÕt cÆp ®ång thêi O CH cña 5-BU víi A vµ G lµ c¬ së cña c¸c ®ét biÕn ®ång H C C ho¸n th−êng g©y ra bëi hîp chÊt nµy. N N N (5-BU ≡ G) H §−êng 193
§inh §oµn Long g©y nªn ®ét biÕn ®ång ho¸n G≡C → A=T. Sù alkyl hãa c¸c baz¬ nit¬ kh¸c cã thÓ thóc ®Èy mét sè c¬ chÕ söa ch÷a ADN cã xu h−íng sai (vÝ dô: c¬ chÕ SOS, ®−îc m« t¶ ë phÇn sau ch−¬ng nµy), dÉn ®Õn c¸c ®ét biÕn ®ång ho¸n, dÞ ho¸n, hoÆc dÞch khung. Mét sè hîp chÊt alkyl hãa, ®Æc biÖt lµ c¸c hîp chÊt cã hai nhãm alkyl ho¹t ®éng cã thÓ t¹o nªn sù v¾t chÐo gi÷a hai m¹ch hoÆc gi÷a hai ph©n tö ADN, dÉn ®Õn sù ®øt g·y hoÆc mét sè biÕn d¹ng kh¸c cña NST. Nh− vËy, so víi c¸c hîp chÊt thÕ baz¬ nit¬, axit nit¬ vµ c¸c thuèc nhuém acridine, c¸c hîp chÊt alkyl hãa cã xu h−íng g©y hiÖu øng ®ét biÕn Ýt ®Æc hiÖu h¬n. Kh¸c víi c¸c hîp chÊt acridine, c¸c hîp chÊt hydroxyl hãa (cho nhãm OH-), nh− hydroxylamine NH2OH, l¹i cã hiÖu øng g©y ®ét biÕn ®Æc hiÖu. Nhãm hîp chÊt nµy g©y nªn ®ét biÕn ®ång ho¸n G≡C → A=T. Khi ADN ®−îc xö lý víi NH2OH, cytosine bÞ chuyÓn hãa thµnh hydroxylamincytosine. Hîp chÊt nµy kÕt cÆp víi adenin, dÉn ®Õn ®ét biÕn G≡C → A=T. Nhê g©y hiÖu øng ®ét biÕn ®Æc hiÖu, hydroxylamine cã mét øng dông ®Æc biÖt quan träng trong viÖc x¸c ®Þnh ®−îc kiÓu ®ét biÕn ®ång ho¸n. Cô thÓ lµ, c¸c ®ét biÕn phôc håi do xö lý víi axit nit¬ hay chÊt thÕ baz¬ nit¬ cã thÓ ®−îc ph©n biÖt thµnh hai nhãm trªn c¬ së xö lý víi hydroxylamine. Nhãm thø nhÊt mang cÆp baz¬ nit¬ ®ét biÕn A=T kh«ng ®¶o ng−îc ®−îc khi xö lý víi hydroxylamine, cßn nhãm thø hai mang cÆp baz¬ nit¬ ®ét biÕn G≡C cã thÓ ®¶o ng−îc ®−îc nhê hydroxylamine. Nh− vËy, hydroxylamine cã thÓ ®−îc dïng ®Ó ph©n biÖt ®ét biÕn ®ång ho¸n lµ tõ A=T → G≡C hay tõ G≡C → A=T. 6.4.3. §ét biÕn do c¸c t¸c nh©n vËt lý Vïng phæ ®iÖn tõ (h×nh Vïng ¸nh s¸ng nh×n thÊy 6.12) víi c¸c b−íc sãng ng¾n h¬n vµ dµi h¬n ¸nh s¸ng nh×n 750nm §á thÊy ®−îc chia lµm hai vïng Vµng Xanh lôc bøc x¹ ion hãa (gåm tia X, Xanh lam 380 nm tia gamma, c¸c tia vò trô n¨ng l−îng cao) vµ bøc x¹ B−íc Vi Hång Tia vò trô kh«ng ion hãa (tia cùc tÝm - sãng radio sãng ngo¹i UV Tia X Tia γ UV). C¸c tia bøc x¹ ion hãa th−êng cã n¨ng l−îng cao vµ 103m 109nm 106nm 103nm 1nm 10-3nm 10-5nm B−íc sãng ®−îc sö dông trong chÈn ®o¸n (1m) Bøc x¹ ion hãa y häc do chóng cã kh¶ n¨ng xuyªn s©u qua c¸c m«. Trong ThÊp nhÊt Møc n¨ng l−îng Cao nhÊt qu¸ tr×nh truyÒn qua c¸c m«, H×nh 6.12. Phæ ®iÖn tõ. C¸c b−íc sãng ë møc n¨ng l−îng cao cã thÓ tÕ bµo, c¸c tia x¹ va ch¹m vµo g©y ®ét biÕn gen vµ NST (nÕu liÒu chiÕu ®ñ lín trong thêi gian dµi). c¸c h¹t nh©n vµ lµm gi¶i phãng ®iÖn tö, t¹o nªn c¸c gèc tù do tÝch ®iÖn d−¬ng hoÆc c¸c ion. §Õn l−ît m×nh, c¸c ion va ch¹m víi c¸c ph©n tö kh¸c vµ lµm gi¶i phãng c¸c ®iÖn tö kh¸c tiÕp theo. KÕt qu¶ lµ mét “h×nh nãn” cña c¸c ion h×nh thµnh däc theo ®−êng ®i cña tia x¹ khi nã xuyªn qua c¸c m«. Qu¸ tr×nh ion hãa nµy th−êng ®−îc thùc hiÖn bëi m¸y ph¸t tia X, tia pr«t«n, tia n¬tr«n, còng nh− c¸c tia alpha, bªta vµ gama xuÊt ph¸t tõ c¸c ®ång vÞ phãng x¹ nh− 32P, 35S vµ urani-38 ®−îc dïng trong c¸c lß ph¶n øng h¹t nh©n. Tia cùc tÝm (UV) cã n¨ng l−îng thÊp h¬n c¸c bøc x¹ ion hãa, nªn nã chØ th©m nhËp ®−îc líp tÕ bµo bÒ mÆt vµ kh«ng t¹o nªn hiÖu øng ion hãa. Tia UV bÞ mÊt n¨ng l−îng cho h¹t nh©n mµ nã tiÕp xóc, lµm cho ®iÖn tö ë quü ®¹o ngoµi cña h¹t nh©n t¨ng lªn vÒ møc n¨ng l−îng, gäi lµ møc kÝch thÝch. C¸c ph©n tö mang c¸c nguyªn tö ion hãa hoÆc ë møc kÝch thÝch cã tÝnh ph¶n øng hãa häc cao h¬n nhiÒu so víi d¹ng bÒn v÷ng th«ng th−êng 194
Ch−¬ng 6. §ét biÕn vµ söa ch÷a Adn cña chóng. Kh¶ n¨ng ph¶n øng t¨ng lªn cña c¸c nguyªn tö trong ph©n tö ADN lµ nguyªn nh©n cña phÇn lín c¸c ®ét biÕn g©y ra bëi c¸c bøc x¹ ion hãa vµ tia UV. Tia X vµ c¸c bøc x¹ ion hãa th−êng ®−îc ®o b»ng ®¬n vÞ r¬ntghen (r), tÝnh b»ng sè nguyªn tö ion hãa trªn mét ®¬n vÞ thÓ tÝch trong ®iÒu kiÖn tiªu chuÈn. Thùc tÕ, mét r¬ntghen ®−îc tÝnh b»ng l−îng chiÕu x¹ ion hãa t¹o ra 2,083 x 109 cÆp ion trªn 1cm3 khÝ ë 0oC vµ ¸p suÊt lµ 760 mmHg. CÇn chó ý lµ, liÒu chiÕu x¹ cã sù tÝch lòy theo thêi gian. NghÜa lµ, liÒu chiÕu x¹ thÊp qua thêi gian dµi cã thÓ t−¬ng ®−¬ng víi liÒu cao trong thêi gian ng¾n. §iÒu nµy rÊt quan träng, bëi phÇn lín c¸c nghiªn cøu cho thÊy tÇn sè ®ét biÕn ®iÓm xuÊt hiÖn tØ lÖ thuËn víi liÒu chiÕu x¹. Ch¼ng h¹n nh−, tØ lÖ ®ét biÕn ®iÓm g©y chÕt ë tinh trïng ruåi dÊm t¨ng tuyÕn tÝnh tõ 0 ®Õn 15% khi liÒu chiÕu tia X t¨ng tõ 0 ®Õn 5000 r (tøc lµ, liÒu chiÕu cø t¨ng 1000 r, tÇn sè ®ét biÕn t¨ng 3%). Mèi quan hÖ tuyÕn tÝnh nµy cho thÊy, hiÖu øng g©y ®ét biÕn cña tia X cã ®éng häc riªng lÎ. NghÜa lµ, mçi ®ét biÕn lµ kÕt qu¶ cña mét sù kiÖn ion hãa ®éc lËp. Nãi c¸ch kh¸c, trong ®iÒu kiÖn tiªu chuÈn, mçi ph¶n øng ion hãa bëi chiÕu x¹ n¨ng l−îng cao cã x¸c suÊt g©y ®ét biÕn ®iÓm gièng nhau. VËy, c−êng ®é chiÕu x¹ lµ bao nhiªu th× an toµn? ViÖc ph¸t triÓn vµ sö dông bom h¹t nh©n, còng nh− sù cè ë c¸c nhµ m¸y ®iÖn nguyªn tö ®· g©y nªn mèi hoµi nghi vÒ nguy c¬ ph¬i nhiÔm phãng x¹. Mèi quan hÖ tuyÕn tÝnh gi÷a tÇn sè ®ét biÕn vµ liÒu chiÕu x¹ cho thÊy, kh«ng cã møc chiÕu x¹ nµo lµ an toµn. LiÒu chiÕu x¹ cµng cao, th× tÇn sè ®ét biÕn cµng cao vµ ng−îc l¹i. ThËm chÝ ngay víi mét c−êng ®é chiÕu x¹ thÊp, th× dï tÇn sè ®ét biÕn cã thÓ thÊp, nh−ng x¸c suÊt ®Ó mét ®ét biÕn cã thÓ x¶y ra lµ hiÖn h÷u. Khi thö nghiÖm chiÕu x¹ tinh trïng cña ruåi giÊm, c¸c nhµ nghiªn cøu thÊy r»ng liÒu chiÕu dµi víi c−êng ®é thÊp cã hiÖu qu¶ ®ét biÕn gièng víi liÒu chiÕu ng¾n víi c−êng ®é cao. Tuy vËy, ë chuét, liÒu chiÕu dµi c−êng ®é thÊp g©y Ýt ®ét biÕn h¬n ®«i chót liÒu chiÕu ng¾n ë c−êng ®é cao (víi tæng liÒu chiÕu nh− nhau). Ngoµi ra, trªn chuét thÝ nghiÖm, víi tæng liÒu chiÕu nh− nhau, sù chiÕu x¹ gi¸n ®o¹n lµm gi¶m nhÑ tÇn sè ®ét biÕn so víi chiÕu x¹ liªn tôc. Sù kh¸c biÖt nµy trong hiÖu øng g©y ®ét biÕn cña chiÕu x¹ ion hãa gi÷a ®éng vËt cã vó vµ ruåi giÊm ®−îc gi¶i thÝch bëi hiÖu qu¶ cña c¸c c¬ chÕ söa ch÷a ADN sai háng kh¸c nhau ë c¸c ®èi t−îng sinh vËt nµy. Mét sè c¬ chÕ söa ch÷a ADN cã thÓ xuÊt hiÖn ë c¸c tÕ bµo sinh tinh vµ sinh trøng ë ®éng vËt cã vó, nh−ng kh«ng ho¹t ®éng ë tinh trïng ruåi giÊm. Tuy vËy, ph¶i kh¼ng ®Þnh lµ tÊt c¶ c¸c xö lý chiÕu x¹ ®Òu cã kh¶ n¨ng g©y ®ét biÕn, dï møc ®é cã thÓ kh¸c nhau, ë ruåi giÊm còng nh− ë ®éng vËt cã vó. C¸c chiÕu x¹ ion hãa còng cã thÓ g©y nªn nh÷ng biÕn ®æi lín trong cÊu tróc NST, nh− mÊt ®o¹n, ®¶o ®o¹n, lÆp ®o¹n vµ chuyÓn ®o¹n. Nh÷ng sai háng NST nµy th−êng lµ kÕt qu¶ cña c¸c sù kiÖn ®øt g·y NST, g©y ra bëi ®éng häc cña nhiÒu sù va ch¹m khi tia x¹ truyÒn qua (kh¸c víi ®ét biÕn ®iÓm d−êng nh− chñ yÕu g©y ra bëi nh÷ng va ch¹m ®¬n lÎ). Tia UV kh«ng ®ñ møc n¨ng l−îng ®Ó g©y nªn hiÖn t−îng ion hãa. Nh−ng nã l¹i ®−îc hÊp thô bëi nhiÒu ph©n tö h÷u c¬, trong ®ã cã c¸c purine vµ pyrimidine cña ADN, vµ nguyªn tö cña nh÷ng ph©n tö nµy sau ®ã chuyÓn sang tr¹ng th¸i kÝch thÝch. Do kh¶ n¨ng xuyªn thÊu kÐm, tia UV chñ yÕu t¸c ®éng lªn líp tÕ bµo bÒ mÆt cña sinh vËt ®a bµo. Nh−ng, ®èi víi sinh vËt ®¬n bµo, nã lµ mét t¸c nh©n g©y ®ét biÕn hiÖu qu¶. B−íc sãng hÊp thô tia UV tèi ®a cña ADN lµ 254 nm; vµ ®©y còng lµ b−íc sãng g©y tÇn sè ®ét biÕn cao nhÊt. §iÒu nµy cho thÊy ®ét biÕn cã liªn quan trùc tiÕp ®Õn sù hÊp thô tia UV cña c¸c purine vµ pyrimidine. Trong ®ã, ®Æc biÖt lµ c¸c pyrimidine sau khi hÊp thô tia UV ë b−íc sãng 254nm, chóng trë nªn cã kh¶ n¨ng ph¶n øng m¹nh. HiÖu øng næi bËt cña chiÕu x¹ tia UV ®èi víi c¸c pyrimidine (C vµ T) lµ sù h×nh thµnh c¸c pyrimidine hydrate (g¾n thªm gèc OH-) vµ h×nh thµnh phøc kÐp pyrimidine (h×nh 6.13). C¸c phøc kÐp thymine 195
§inh §oµn Long (T :: T) cã thÓ g©y ®ét biÕn theo hai c¸ch: 1) lµm biÕn d¹ng cÊu tróc ADN, dÉn ®Õn sao chÐp sai; vµ 2) kÝch ho¹t hÖ thèng söa ch÷a ADN theo c¬ chÕ SOS dÔ ph¸t sinh ®ét biÕn (xem phÇn “C¸c c¬ chÕ söa ch÷a ADN” d−íi ®©y). a) O O OO H C CH3 CH3C H HC CH3 HC CH3 UV NC NC N CC N + CC CC CC CC ONH ONH ON NO HH H H H H Thymine (T) Thymine (T) Phøc kÐp Thymine (T :: T) H×nh 6.13. Tia UV g©y biÕn ®æi cÊu tróc b) NH2 UV + H2O NH2 pyrimidine. a) Liªn kÕt céng hãa trÞ h×nh CH CH thµnh gi÷a hai tiÓu phÇn thymine ®øng N C OH c¹nh nhau trªn ph©n tö ADN t¹o nªn phøc NC kÐp thymine. b) Sù hydrate hãa cytosine C CH t¹o thµnh cytosine hydrate, lµ nguyªn CC O NH nh©n g©y kÕt cÆp sai trong sao chÐp ADN. ONH H H Cytosine hydrate Cytosine 6.4.4. §ét biÕn do c¸c yÕu tè di truyÒn vËn ®éng (gen nh¶y) C¸c c¬ thÓ sèng nãi chung chøa mét l−îng ADN cã thÓ vËn ®éng tõ vÞ trÝ nµy sang vÞ trÝ kh¸c trong hÖ gen. Nh÷ng yÕu tè nµy ®−îc gäi lµ c¸c yÕu tè di truyÒn vËn ®éng (transposable genetic elements, viÕt t¾t lµ TGE hoÆc TE), hay gäi t¾t lµ gen nh¶y (transposon). ViÖc cµi mét TE vµo gen th−êng lµm mÊt chøc n¨ng cña gen. NÕu gen m· hãa cho mét protein quan träng, kiÓu h×nh ®ét biÕn dÔ xuÊt hiÖn. §Õn nay ®· cã nhiÒu ®ét biÕn do ho¹t ®éng cña TE ®−îc t×m thÊy ë ng«, ruåi giÊm, E. coli vµ c¸c loµi sinh vËt kh¸c. Trong thùc tÕ, alen quy ®Þnh tÝnh tr¹ng h¹t nh¨n ë ®Ëu Hµ lan trong thÝ nghiÖm cña Menden vµ ®ét biÕn mµu m¾t tr¾ng ë ruåi giÊm ®−îc ph¸t hiÖn lÇn ®Çu tiªn ®Òu lµ c¸c ®ét biÕn do ho¹t ®éng cña gen nh¶y. C¬ chÕ ho¹t ®éng cña c¸c yÕu tè di truyÒn vËn ®éng vµ hiÖu øng g©y ®ét biÕn cña chóng ®−îc m« t¶ ë phÇn cuèi ch−¬ng nµy. 6.4.5. Sù lÆp l¹i c¸c bé ba nucleotide vµ c¸c bÖnh di truyÒn ë ng−êi TÊt c¶ c¸c lo¹i ®ét biÕn ®−îc m« t¶ ë c¸c phÇn trªn cña ch−¬ng nµy ®Òu xuÊt hiÖn ë ng−êi. Ngoµi ra, cã mét lo¹i ®ét biÕn g¾n liÒn víi nhiÒu bÖnh di truyÒn ë ng−êi, ®ã lµ c¸c tr×nh tù lÆp l¹i víi mçi ®¬n vÞ lÆp l¹i gåm tõ 1 ®Õn 6 nucleotide ®−îc gäi lµ c¸c tr×nh tù ®¬n gi¶n lÆp l¹i liªn tiÕp (simple tandem repeats). Nh÷ng tr×nh tù lÆp l¹i kiÓu nh− vËy ®−îc t×m thÊy ph©n bè kh¾p hÖ gen. C¸c tr×nh tù lÆp l¹i víi ®¬n vÞ lÆp l¹i gåm 3 nucleotide (gäi t¾t lµ c¸c tr×nh tù 3 nucleotide lÆp l¹i liªn tiÕp) ®−îc t×m thÊy cã liªn quan ®Õn mét sè bÖnh di truyÒn ë ng−êi. Ch¼ng h¹n sè l−îng ®¬n vÞ lÆp l¹i cña tr×nh tù [CGG] t¨ng lªn t¹i vÞ trÝ FRAXA thuéc NST X liªn quan ®Õn Héi chøng NST X dÔ g·y (fragile X syndrome), lµ bÖnh thiÓu n¨ng trÝ tuÖ di truyÒn phæ biÕn nhÊt ë ng−êi. NST X b×nh th−êng cã tõ 6 ®Õn 50 b¶n sao liªn tiÕp cña tr×nh tù [CGG], nh−ng NST ®ét biÕn chøa tíi 1.000 b¶n sao liªn tiÕp cña ®¬n vÞ lÆp l¹i gåm 3 nucleotide nµy. C¸c ®o¹n tr×nh tù lÆp l¹i cña [CAG] vµ [CTG] liªn quan ®Õn mét sè bÖnh thÇn kinh di truyÒn ë ng−êi, bao gåm bÖnh móa giËt Huntingt¬n, bÖnh lo¹n d−ìng c¬, bÖnh Kennedy, bÖnh teo c¬ delta vµng da, bÖnh mÊt ®iÒu hßa tiÓu n·o ®Ønh. ë tÊt c¶ nh÷ng bÖnh nµy, møc ®é nghiªm träng cña bÖnh cã liªn quan trùc tiÕp ®Õn sè ®ét biÕn lÆp l¹i 196
Ch−¬ng 6. §ét biÕn vµ söa ch÷a Adn cña c¸c tr×nh tù. Khi sè b¶n sao cña tr×nh tù ba nucleotide cµng cao, møc ®é nghiªm träng cña bÖnh cµng t¨ng. Ngoµi ra sè lÇn lÆp l¹i cña c¸c tr×nh tù nucleotide liªn quan ®Õn c¸c bÖnh nµy cã thÓ kh«ng æn ®Þnh gi÷a c¸c tÕ bµo soma kh¸c nhau vµ gi÷a c¸c thÕ hÖ. C¬ chÕ lµm t¨ng sè l−îng c¸c bé ba nucleotide g©y nªn c¸c bÖnh di truyÒn ®Õn nay ch−a râ, nh−ng còng cã thÓ liªn quan ®Õn c¬ chÕ sao chÐp tr−ît ®−îc nªu ë môc 6.4.1 (h×nh 6.10). 6.5. C¸c c¬ chÕ söa ch÷a ADN PhÇn lín c¸c ®ét biÕn tù ph¸t vµ g©y t¹o nh×n chung cã thÓ coi lµ c¸c sai háng cña gen hay ADN. §Æc biÖt khi xö lý víi liÒu cao cña c¸c t¸c nh©n ®ét biÕn th× sù sai háng lµ ®¸ng kÓ. Trong thùc tÕ, ë gãc ®é nµo ®ã, chóng ta cã thÓ coi ®ét biÕn lµ nh÷ng biÕn ®æi cña ADN mµ kh«ng ®−îc c¸c hÖ thèng söa ch÷a ADN kh¸c nhau phôc håi. Trªn c¬ së ®ã, ta cã thÓ viÕt c«ng thøc: “®ét biÕn = sai háng ADN – söa ch÷a ADN”. C¶ sinh vËt prokaryote vµ eukaryote ®Òu cã mét sè hÖ thèng söa ch÷a ADN víi sù huy ®éng nhiÒu enzym kh¸c nhau. NÕu hÖ thèng söa ch÷a kh«ng kh¾c phôc ®−îc c¸c sai háng th× dÉn ®Õn sù h×nh thµnh c¸c tÕ bµo hay c¬ thÓ ®ét biÕn; hoÆc nÕu cã qu¸ nhiÒu sai háng th× c¸c c¬ thÓ vµ tÕ bµo ®ét biÕn th−êng chÕt. Sù sèng lµ kÕt qu¶ c©n b»ng gi÷a sù chÝnh x¸c trong sao chÐp vµ truyÒn ®¹t th«ng tin di truyÒn trong ADN tíi c¸c tÕ bµo vµ c¬ thÓ thÕ hÖ con víi nh÷ng ®ét biÕn ®«i khi x¶y ra trong vai trß lµ nguån nguyªn liÖu s¬ cÊp cña tiÕn hãa. C¸c hÖ thèng söa ch÷a ADN chÝnh lµ c«ng cô gióp duy tr× sù hµi hßa nµy. Dùa trªn c¬ chÕ ho¹t ®éng, chóng ta cã thÓ chia c¸c c¬ chÕ söa ch÷a ADN thµnh ba nhãm chÝnh: 1) c¸c c¬ chÕ phôc håi trùc tiÕp, 2) c¸c c¬ chÕ söa ch÷a b»ng c¾t bá, vµ 3) mét sè c¬ chÕ söa ch÷a kh¸c. Sau ®©y lµ mét sè m« h×nh söa ch÷a ADN. 6.5.1. C¸c c¬ chÕ phôc håi trùc tiÕp 6.5.1.1. C¬ chÕ söa ch÷a ghÐp ®«i sai nhê chøc n¨ng ®äc söa cña ADN polymerase TÇn sè ®ét biÕn thay thÕ nucleotide ë c¸c gen vi khuÈn vµo kho¶ng 10-11 ®Õn 10-7 mçi lÇn ph©n bµo. Tuy vËy, thùc nghiÖm cho thÊy lçi sao chÐp cña ADN polymerase cã thÓ cao h¬n, kho¶ng 10-5. Sù kh¸c biÖt gi÷a nh÷ng con sè nµy ®−îc gi¶i thÝch lµ nhê chøc n¨ng ®äc söa cña ho¹t tÝnh exonuclease 3’→5’ ®−îc tÝch hîp trong hÇu hÕt (nÕu kh«ng ph¶i lµ tÊt c¶) c¸c enzym ADN polymerase ë prokaryote còng nh− eukaryote. Khi mét nucleotide ®−îc kÕt cÆp sai trong qu¸ tr×nh sao chÐp ADN, nã cã thÓ ®−îc enzym ADN polymerase nhËn ra. Lóc nµy, sù sao chÐp ADN t¹m dõng l¹i cho ®Õn khi nucleotide kÕt cÆp sai ®−îc lo¹i bá vµ thay thÕ. Sau khi nucleotide sai háng ®−îc söa ch÷a, enzym ADN polymerase tiÕp tôc tr−ît trªn m¹ch ADN lµm khu«n vµ kh«i phôc ho¹t ®éng sao chÐp. TÇm quan träng cña ho¹t tÝnh ®äc söa ®i kÌm víi ho¹t tÝnh exonuclease 3’→5’ cña ADN polymerase ®−îc chøng minh bëi c¸c ®ét biÕn g©y ®ét biÕn (mutator mutation) t×m thÊy ë E. coli. C¸c chñng vi khuÈn mang c¸c ®ét biÕn nµy cã tÇn sè ®ét biÕn ë tÊt c¶ c¸c gen cao h¬n h¼n so víi c¸c chñng ®èi chøng. Nh÷ng ®ét biÕn g©y ®ét biÕn liªn quan ®Õn c¸c gen m· hãa cho c¸c protein thiÕt yÕu tham gia söa ch÷a ADN. Ch¼ng han nh−, gen g©y ®ét biÕn mutD cña E. coli m· hãa cho tiÓu phÇn ε cña enzym ADN polymerase III ë E. coli. §ét biÕn mutD lµm mÊt ho¹t tÝnh ®äc söa chiÒu 3’→5’ cña ADN polymerase. Do vËy, nhiÒu nucleotide ®−îc l¾p r¸p sai mµ kh«ng ®−îc söa ch÷a, dÉn ®Õn ®ét biÕn. 197
§inh §oµn Long 6.5.1.2. Söa ch÷a phøc kÐp pyrimidine b»ng c¬ chÕ quang phôc ho¹t Theo c¬ chÕ quang phôc ho¹t (photoreactivation repair, hay söa ch÷a ADN nhê ¸nh s¸ng), c¸c ®ét biÕn phøc kÐp pyrimidine (phæ biÕn nhÊt lµ T::T) cã thÓ ®−îc phôc håi trùc tiÕp trë vÒ d¹ng nguyªn thñy, nÕu chóng ®−îc ®−a ®Õn gÇn vïng ¸nh s¸ng cã b−íc sãng trong kho¶ng 320 - 370nm. Lóc nµy, c¬ chÕ quang phôc ho¹t ho¹t ®éng nÕu enzym photolyase (do gen phr m· hãa) ®−îc ho¹t hãa bëi ph«t«n ¸nh s¸ng. Sù ho¹t ®éng cña hÖ thèng söa ch÷a nµy lµm “ph¸ vì” liªn kÕt céng hãa trÞ gi÷a c¸c pyrimidine liÒn kÒ trªn khung cña ph©n tö ADN. C¸c chñng vi khuÈn mang ®ét biÕn ë gen phr th−êng ®ång thêi bÞ háng c¬ chÕ söa ch÷a quang phôc ho¹t. Enzym photolyase ®−îc t×m thÊy ë vi khuÈn vµ mét sè eukaryote, nh−ng kh«ng thÊy cã ë ng−êi vµ c¸c ®éng vËt cã vó kh¸c. 6.5.1.3. Söa ch÷a sai háng ADN g©y ra do alkyl hãa Nh− ®· nãi ë trªn c¸c hîp chÊt alkyl hãa, nh− MMS hay EMS, cã kh¶ n¨ng chuyÓn nhãm alkyl vµo c¸c baz¬ nit¬ ë c¸c vÞ trÝ kh¸c nhau, vÝ nh− nguyªn tö O cña C-6 ë guanine. ë E. coli, nh÷ng sai háng ADN g©y ra bëi sù alkyl hãa ë vÞ trÝ nµy cña guanine ®−îc söa ch÷a bëi mét enzym cã tªn gäi lµ a) C¸c vÞ trÝ c¾t baz¬ sai háng theo kiÓu BER O6-methylguanine methyltransferase, ®−îc gen Baz¬ sai háng ada m· hãa. Enzym nµy cã kh¶ n¨ng nhËn ra O6-methylguanine vµ lo¹i bá nhãm methyl, qua ®ã chuyÓn baz¬ nit¬ nµy trë vÒ d¹ng gèc VÞ trÝ c¾t 1 cña nã. Mét c¬ chÕ t−¬ng tù còng ®−îc t×m Baz¬ thÊy ®Ó söa ch÷a c¸c thymine bÞ alkyl hãa. Nh÷ng ®ét biÕn ë nh÷ng gen m· hãa nh÷ng VÞ trÝ enzym söa ch÷a ADN nµy th−êng lµm t¨ng c¾t 2 tÇn sè ®ét biÕn tù ph¸t. 6.5.2. C¬ chÕ söa ch÷a b»ng c¾t bá Cã lÏ c¬ chÕ söa ch÷a lo¹i bá c¸c baz¬ b) C¸c b−íc cña qu¸ tr×nh söa ch÷a kiÓu BER nit¬ sai háng phæ biÕn nhÊt lµ c¬ chÕ c¾t bá c¸c baz¬ nit¬ vµ nucleotide sai háng, råi thay vµo Baz¬ sai ADN ®ã c¸c baz¬ nit¬ vµ nucleotide ®óng. Do thµnh phÇn vµ c¸ch thøc ho¹t ®éng kh¸c nhau, ng−êi (1) ADN glycosylase c¾t ta chia thµnh c¸c c¬ chÕ söa ch÷a b»ng c¾t bá baz¬ sai háng (c¾t 1) baz¬ nit¬ vµ söa ch÷a b»ng c¾t bá nucleotide. + 6.5.2.1. Söa ch÷a b»ng c¾t bá baz¬ nit¬ (BER) VÞ trÝ thiÕu baz¬ (2) AP endonuclease c¾t khung Trong c¬ chÕ söa ch÷a b»ng c¾t bá (kÝ hiÖu AP) ADN t¹i vÞ trÝ thiÕu baz¬ (c¾t 2) baz¬ nit¬ - BER (base excision repair), mét enzym (trong hä lín enzym) glycosylase nhËn (3) ADN phosphodiesterase c¾t mét ra baz¬ sai háng vµ lo¹i nã ra khái ph©n tö ®o¹n khung t¹i vÞ trÝ sai háng ADN b»ng viÖc c¾t bá liªn kÕt glycoside gi÷a + baz¬ vµ ®−êng deoxyribose cña nucleotide sai háng. C¸c enzym kh¸c sau ®ã ®−îc huy ®éng (4) ADN polymeraseI tæng hîp ®Ó c¾t bá phÇn khung ®−êng-phosphate ë tr−íc theo chiÒu 5’ → 3’ vµ sau vÞ trÝ cã cÊu tróc khung ®−êng thiÕu baz¬ nit¬, gi¶i phãng khung ®−êng nµy vµ mét (5) ADN ligase “hµn kÝn” m¹ch ®o¹n m¹ch ADN ®¬n “rçng” (h×nh 6.14). §o¹n ADN ®−îc söa ch÷a ADN rçng nµy sau sÏ ®−îc lÊp l¹i b»ng c¸c nucleotide kÕt cÆp ®óng nhê ho¹t ®éng cña H×nh 6.14. S¬ ®å minh häa m« h×nh söa ch÷a enzym ADN polymerase (dïng m¹ch ADN ®èi ADN b»ng c¾t bá baz¬ nit¬ (BER) ë E. coli. diÖn lµm khu«n) vµ ADN ligase. 198
Ch−¬ng 6. §ét biÕn vµ söa ch÷a Adn 6.5.2.2. Söa ch÷a b»ng c¾t bá nucleotide (NER) N¨m 1964, hai nhãm nghiªn cøu, gåm Boyce cïng Howard-Flander vµ Setlow cïng Carrier, ®· ph©n lËp ®−îc mét sè ®ét biÕn mÉn c¶m chiÕu x¹ UV ë E. coli. C¸c d¹ng ®ét biÕn nµy cã tÇn sè ®ét biÕn cao bÊt th−êng so víi c¸c chñng kh¸c khi xö lý chiÕu x¹ UV trong bãng tèi. Nh÷ng ®ét biÕn nµy ®−îc gäi lµ c¸c thÓ ®ét biÕn uvrA (uvr lµ tõ viÕt t¾t cña “UV repair”). C¸c thÓ ®ét biÕn uvrA chØ söa ch÷a ®−îc c¸c sai háng ADN kiÓu “phøc kÐp thymine” khi ®−îc chiÕu s¸ng; ®iÒu nµy cho thÊy, c¬ chÕ söa ch÷a ho¹t ®éng ë ®©y cã lÏ lµ quang phôc ho¹t. Tuy nhiªn, ®iÒu ®¸ng chó ý lµ c¸c chñng kiÓu d¹i cã thÓ söa ch÷a nh÷ng sai háng nµy ngay c¶ khi ®−îc nu«i trong tèi. Qua ®ã, c¸c nhµ nghiªn cøu cho r»ng, ®· tån t¹i mét hÖ thèng söa ch÷a ADN kh¸c kh«ng phô thuéc vµo ¸nh s¸ng. HÖ thèng nµy lóc ®ã ®−îc gäi lµ hÖ thèng söa ch÷a trong tèi, hiÖn nay ®−îc gäi lµ hÖ thèng söa ch÷a b»ng c¾t bá nucleotide - NER (nucleotidede excision repair). HÖ thèng NER kh«ng chØ söa ch÷a sai háng kiÓu “phøc kÐp thymine” mµ cßn söa ch÷a c¸c sai háng nghiªm träng kh¸c trong ph©n tö ADN sîi kÐp. H×nh 6.15 m« t¶ hÖ thèng NER ho¹t ®éng ë E. coli. HÖ thèng nµy cã 4 protein UvrA, UvrB, UvrC vµ UvrD ®−îc m· hãa t−¬ng øng bëi c¸c gen uvrA, uvrB, uvrC vµ uvrD. Mét phøc hÖ gåm hai tiÓu phÇn UvrA vµ mét tiÓu phÇn UvrB (Uvr2A-B) tr−ît däc ph©n tö ADN. Khi phøc hÖ nµy nhËn ra “phøc kÐp Phøc hÖ pyrimidine” hay mét sai UvrAB tr−ît háng nghiªm träng nµo kh¸c th× c¸c tiÓu phÇn UvrA sÏ däc ph©n tö Phøc hÖ t¸ch ra khëi phøc hÖ Uvr2A- Uvr2A-B ADN vµ ph¸t B, vµ thay vµo ®ã lµ sù ®Ýnh hiÖn vÞ trÝ sai háng kÕt cña 1 UvrC. Sù liªn kÕt cña UvrB-C UvrA ®−îc gi¶i phãng; t¹i vÞ trÝ sai háng dÉn ®Õn UvrC thay thÕ viÖc c¾t m¹ch ®¬n ADN UvrA t¹i vÞ tri kho¶ng 4 nucleotide vÒ phÝa sai háng ®Çu 3’ (thùc hiÖn bëi UvrB) VÞ trÝ c¾t ®Çu 5’ VÞ trÝ c¾t ®Çu 3’ vµ 7 nucleotide vÒ phÝa ®Çu C¾t ®o¹n ADN 5’ (thùc hiÖn bëi UvrC). sai háng t¹i UvrB sau ®ã rêi khái ph©n c¸c ®Çu 5’ vµ UvrD tö ADN vµ UrvD liªn kÕt vµo 3’ t−¬ng øng ®o¹n phÝa ®Çu 5’ cã ®Çu 3’- bëi UvrB vµ ADN polymerase I OH tù do. UvrD thùc chÊt lµ UvrC (pol I) mét helicase, cã vai trß gi·n UvrD gi·n xo¾n xo¾n ADN t¹i tr×nh tù gi÷a vïng ADN bÞ hai vÞ trÝ c¾t vµ gi¶i phãng ra ®o¹n c¾t. Sau ®ã, ADN c¾t, gi¶i phãng polymerase I sÏ lÊp ®Çy ®o¹n rçng b»ng c¸c nucleotide kÕt ®o¹n sai háng. cÆp ®óng b»ng ho¹t tÝnh ADN pol I tæng ADN ligase tæng hîp theo chiÒu 5’→3’; råi ADN ligase nèi liªn kÕt hîp bï ®o¹n phosphodieste cuèi cïng ADN rçng ADN ligase nèi ®o¹n söa ®æi. Qu¸ tr×nh söa ADN kÕt thóc gi÷a hai ®o¹n ADN. HÖ H×nh 6.15. S¬ ®å minh häa m« h×nh söa ch÷a ADN b»ng c¾t bá thèng söa ch÷a b»ng c¾t bá nucleotide (NER) ë E. coli. nucleotide ®−îc t×m thÊy ë 199
§inh §oµn Long hÇu hÕt c¸c loµi sinh vËt ®· tõng ®−îc nghiªn cøu. ë nÊm men vµ ®éng vËt cã vó, cã kho¶ng 12 gen m· hãa protein liªn quan ®Õn ho¹t ®éng söa ch÷a ADN b»ng c¾t bá nucleotide. 6.5.3. C¸c c¬ chÕ söa ch÷a kh¸c 6.5.3.1. C¬ chÕ söa ch÷a kÕt cÆp sai nhê m¹ch ADN khu«n ®−îc methyl hãa (MMR) MÆc dï c¸c enzym ADN polymerase cã ho¹t tÝnh ®äc söa, nh−ng sau qu¸ tr×nh sao chÐp ADN, vÉn tån t¹i mét sè baz¬ nit¬ kÕt cÆp sai kh«ng söa ch÷a hÕt. Trong lÇn sao chÐp tiÕp theo, nÕu nh÷ng sai háng nµy kh«ng ®−îc kh¾c phôc th× ®ét biÕn sÏ h×nh thµnh. Thùc tÕ, nhiÒu baz¬ nit¬ kÕt cÆp sai ®−îc söa ch÷a sau qu¸ tr×nh sao chÐp bëi mét hÖ thèng söa ch÷a ADN kh¸c, gäi lµ söa ch÷a kÕt cÆp sai nhê m¹ch ADN khu«n ®−îc methyl hãa – MMR (methyl-directed mismatch repair). HÖ thèng nµy nhËn ra c¸c baz¬ nit¬ kÕt cÆp sai, c¾t bá c¸c baz¬ nit¬ sai háng vµ tiÕn hµnh tæng hîp thay thÕ. ë E. coli, giai ®o¹n ®Çu cña c¬ chÕ MMR liªn quan ®Õn 3 gen lµ mutS, mutL vµ mutH, m· hãa cho 3 protein t−¬ng øng lµ MutS, MutL vµ MutH. §Çu tiªn, MutS sÏ liªn kÕt vµo baz¬ nit¬ kÕt cÆp sai. Sau ®ã hÖ thèng söa ch÷a nhËn ra baz¬ nµo ®óng vµ baz¬ nµo sai t−¬ng øng víi m¹ch nµo lµm khu«n vµ m¹ch nµo ®−îc tæng hîp míi. ë E. coli, hai m¹ch nµy ®−îc ph©n biÖt bëi sù methyl hãa nucleotide A t¹i tr×nh tù [GATC]. Tr×nh tù nµy cã trôc ®èi xøng, nghÜa lµ tr×nh tù ®äc theo chiÒu 5’→3’ trªn c¶ hai m¹ch gièng nhau. C¶ hai nucleotide A trªn c¶ hai m¹ch cña ph©n tö ADN lµm khu«n th«ng th−êng ®−îc methyl hãa. Tuy vËy, khi sù sao chÐp ADN võa kÕt thóc th× chØ cã A trªn m¹ch lµm khu«n ®−îc methyl hãa cßn A trªn m¹ch míi tæng hîp ch−a ®−îc methyl hãa (xÐt t¹i vÞ trÝ tr×nh tù [GATC]). Lóc nµy, MutS (®· liªn kÕt vµo baz¬ nit¬ kÕt cÆp sai) sÏ t¹o phøc víi MutL vµ MutH ®Ó mang tr×nh tù [GATC] ch−a ®−îc methyl hãa ë gÇn tíi vÞ trÝ kÕt cÆp sai. MutH sÏ lµm ®øt m¹ch kh«ng ®−îc methyl hãa t¹i tr×nh tù [GATC]. Tõ vÞ trÝ ®ã, mét enzym exonuclease sÏ c¾t m¹ch ADN kh«ng ®−îc methyl hãa, ®Õn hÕt vÞ trÞ nucleotide kÕt cÆp sai. Råi c¸c enzym ADN polymerase III vµ ligase sÏ tæng hîp bï vµ lÊp ®o¹n ADN rçng. C¬ chÕ MMR còng ho¹t ®éng ë eukaryote. Tuy vËy, c¬ chÕ ®Ó nhËn biÕt m¹ch lµm khu«n vµ m¹ch míi ch−a s¸ng tá hoµn toµn. ë ng−êi, ®· x¸c ®Þnh ®−îc 4 gen liªn quan ®Õn ho¹t ®éng cña c¬ chÕ MMR gåm cã hMSH2, hMLH1, hPMS1 vµ hPMS2; trong ®ã hMSH2 cã chøc n¨ng t−¬ng ®−¬ng víi mutS ë E. coli, cßn 3 gen cßn l¹i t−íng øng víi mutL ë E. coli. C¸c gen nµy ®−îc gäi lµ c¸c gen g©y ®ét biÕn, bëi viÖc mÊt chøc n¨ng cña chóng dÉn ®Õn sù tÝch lòy t¨ng lªn cña c¸c ®ét biÕn trong hÖ gen. C¸c ®ét biÕn x¶y ra ë mét trong bèn gen nµy lµm t¨ng nguy c¬ m¾c mét sè bÖnh di truyÒn, trong ®ã cã bÖnh ung th− ruét kÕt di truyÒn kh«ng polip. HiÖu øng cña c¸c gen g©y ®ét biÕn trong sù ph¸t sinh ung th− ®−îc nªu thªm ë ch−¬ng 8. 6.5.3.2. Sù tæng hîp ADN bá qua sai háng vµ c¬ chÕ söa ch÷a SOS Nh− chóng ta ®· biÕt, mét sè sai háng cña ADN trong qu¸ tr×nh sao chÐp cã thÓ ng¨n c¶n viÖc tiÕp tôc chuyÓn ®éng cña bé m¸y sao chÐp trªn ph©n tö ADN khu«n. NÕu kh«ng ®−îc kh¾c phôc, tÕ bµo sÏ bÞ chÕt. Trong tr−êng hîp nµy, cã mét ph−¬ng tiÖn söa ch÷a “cøu c¸nh” ®−îc gäi lµ sù tæng hîp ADN bá qua sai háng, cho phÐp sù sao chÐp cã thÓ bá qua sai háng vµ tiÕp tôc. Qu¸ tr×nh nµy liªn quan ®Õn mét nhãm ADN polymerase ®Æc biÖt chØ ®−îc tæng hîp khi cã tÝn hiÖu ADN sai háng. ë E. coli, nh÷ng sai háng ADN nh− vËy ho¹t hãa mét hÖ thèng phøc t¹p ®−îc gäi lµ c¬ chÕ söa ch÷a SOS (gäi nh− vËy cã lÏ do nã lµ ph−¬ng tiÖn “cøu c¸nh” cuèi cïng vµ th−êng ®−îc huy ®éng khÈn 200
Ch−¬ng 6. §ét biÕn vµ söa ch÷a Adn cÊp). HÖ thèng SOS cho phÐp tÕ bµo sèng sãt (thay cho bÞ chÕt), mÆc dï nã th−êng t¹o nªn nh÷ng ®ét biÕn míi (nªn c¬ chÕ nµy cßn ®−îc gäi lµ c¬ chÕ söa ch÷a dÔ g©y ®ét biÕn). ë E. coli, cã hai gen liªn quan ®Õn ho¹t ®éng cña c¬ chÕ SOS lµ lexA vµ recA, m· hãa t−¬ng øng cho c¸c protein LexA vµ RecA. §©y lµ nh÷ng gen ho¹t ®éng theo kiÓu c¶m øng (xem ch−¬ng 5). C¸c tÕ bµo mang c¸c gen lexA vµ recA ®ét biÕn cã hÖ thèng SOS ho¹t ®éng liªn tôc. HÖ thèng nµy ho¹t ®éng nh− sau: khi kh«ng cã ADN sai háng, LexA øc chÕ sù phiªn m· cña kho¶ng 17 gen liªn quan ®Õn söa ch÷a c¸c d¹ng ADN sai háng kh¸c nhau. Nh−ng khi cã sai háng ADN, RecA ®−îc ho¹t hãa. Lóc nµy RecA thóc ®Èy LexA tù biÕn tÝnh, qua ®ã t¨ng c−êng sù phiªn m· cña c¸c gen liªn quan ®Õn söa ch÷a ADN. Sau khi ho¹t ®éng söa ch÷a kÕt thóc, RecA trë l¹i tr¹ng th¸i bÊt ho¹t cßn LexA ®−îc tæng hîp míi sÏ øc chÕ c¸c gen söa ch÷a ADN. Trong sè c¸c gen ®−îc phiªn m· khi kh«ng cã Lex A cã gen m· hãa cho enzym ADN polymerase ®Æc biÖt cã thÓ bá qua vÞ trÝ sai háng ®Ó tiÕp tôc tæng hîp m¹ch ADN míi. Enzym nµy ho¹t ®éng theo kiÓu bæ sung nucleotide kh«ng ®Æc hiÖu (ngÉu nhiªn) vµo vÞ trÝ sai háng råi tiÕp tôc ph¶n øng trïng hîp ADN. Nh÷ng nucleotide ®−îc bæ sung ngÉu nhiªn cã thÓ kh«ng kÕt cÆp ®óng nªn dÉn ®Õn ®ét biÕn (vÒ lý thuyÕt, x¸c suÊt kÕt cÆp sai t¹i mçi nucleotide lµ 75%). Nh−ng dï sao, víi tÕ bµo th× nh÷ng ®ét biÕn nµy cßn Ýt nguy hiÓm h¬n so víi hiÖu øng g©y chÕt cña c¸c sai háng ADN. 6.6. C¸c bÖnh di truyÒn ë ng−êi do sai háng trong bé m¸y söa ch÷a ADN Mét trong nh÷ng bÖnh di truyÒn ë ng−êi ®−îc ph¸t hiÖn ®Çu tiªn do sai háng trong bé m¸y söa ch÷a ADN lµ bÖnh kh« da s¾c tè, kÝ hiÖu lµ XP (xeroderma pigmentosum. C¸c bÖnh nh©n XP cã nguy c¬ bÞ ung th− da cao khi ph¬i n¾ng. C¸c bÖnh nh©n nµy bÞ háng c¬ chÕ söa ch÷a ADN sai háng do tia UV g©y ra (ch¼ng h¹n nh− “phøc kÐp thymine”). §Õn nay, héi chøng XP ®−îc chØ ra lµ cã liªn quan tíi ®ét biÕn Ýt nhÊt ë 9 gen kh¸c nhau. S¶n phÈm cña 6 trong 9 gen nµy, gåm XPA, XPB, XPC, XPD, XPF vµ XPG lµ thiÕt yÕu víi hÖ thèng söa ch÷a ADN kiÓu NER. C¸c nghiªn cøu hãa sinh cho thÊy chóng lµ thµnh phÇn cña phøc hÖ NER cã ho¹t tÝnh excinulase. Phøc hÖ nµy cã Ýt nhÊt 17 chuçi polypeptide, nªn danh s¸ch c¸c gen võa nªu cã lÏ ch−a ®Çy ®ñ. ë ng−êi, cßn cã hai héi chøng n÷a liªn quan ®Õn sai háng c¬ chÕ NER lµ héi chøng Cockayne vµ chøng lo¹n d−ìng biÓu b× l«ng. TrÎ m¾c héi chøng Cockayne sinh tr−ëng chËm vµ thiÓu n¨ng trÝ tuÖ (nh−ng kh«ng t¨ng nguy c¬ m¾c bÖnh ung th− da). TrÎ m¾c chøng lo¹n d−ìng biÓu b× l«ng th−êng lïn, tãc dÔ g·y, da “®ãng v¶y” vµ trÝ tuÖ kÐm ph¸t triÓn. BÖnh nh©n cña c¶ hai bÖnh nµy ®Òu bÞ háng c¬ chÕ söa ch÷a NER liªn quan ®Õn b−íc phiªn m· c¸c gen cã liªn quan. Ngoµi nh÷ng bÊt th−êng liªn quan ®Õn tÕ bµo da, mét sè bÖnh nh©n XP cßn cã c¸c rèi lo¹n vÒ thÇn kinh (do sù chÕt sím cña c¸c tÕ bµo thÇn kinh). HiÖu øng nµy ë c¸c tÕ bµo thÇn kinh cña bÖnh XP lµ ®èi t−îng nghiªn cøu vÒ sù giµ hãa. Trong ®ã, mét gi¶ thiÕt cho r»ng sù tÝch lòy c¸c ®ét biÕn tÕ bµo soma lµ mét nguyªn nh©n dÉn ®Õn sù giµ hãa. NÕu ®óng nh− vËy th× sù sai háng trong c¸c hÖ thèng söa ch÷a ADN sÏ trùc tiÕp thóc ®Èy sù giµ hãa. §iÒu nµy Ýt nhÊt tá ra lµ ®óng ë bÖnh nh©n XP. Nh−ng, nh×n chung ®Õn nay míi cã rÊt Ýt dÉn chøng vÒ sù t−¬ng quan gi÷a sù tÝch lòy ®ét biÕn soma vµ qu¸ tr×nh giµ hãa. Cã ba bÖnh di truyÒn kh¸c ë ng−êi còng ®· ®−îc t×m thÊy cã liªn quan ®Õn nh÷ng sai háng trong söa ch÷a ADN, bao gåm bÖnh mÊt ®iÒu hßa gi·n m¹ch (ataxia- telangiecsia), bÖnh thiÕu m¸u Fanconi vµ héi chøng Bloom. C¶ ba bÖnh nµy ®Òu liªn quan ®Õn c¸c alen ®ét biÕn lÆn trªn NST th−êng, víi nguy c¬ m¾c ung th− ¸c tÝnh cao ë ng−êi bÖnh. Trong ®ã ®Æc biÖt lµ nguy c¬ m¾c bÖnh b¹ch cÇu ¸c tÝnh ë c¸c bÖnh nh©n mÊt ®iÒu hßa gi·n m¹ch vµ thiÕu m¸u Fanconi. C¸c bÖnh nh©n mÊt ®iÒu hßa gi·n m¹ch trë nªn mÉn c¶m cao víi c¸c tia x¹ ion hãa, do sù sai háng trong c¸c c¬ chÕ söa ch÷a ADN sai háng g©y ra bëi c¸c bøc x¹ ion hãa. TÕ bµo bÖnh nh©n thiÕu m¸u Fanconi bÞ suy yÕu vÒ 201
§inh §oµn Long kh¶ n¨ng lo¹i bá c¸c cÊu tróc v¾t chÐo bÊt th−êng gi÷a hai m¹ch ADN (ch¼ng h¹n, mét sè cÊu tróc g©y ra bëi mitomycin C). C¸c tÕ bµo bÖnh nh©n m¾c héi chøng Bloom cã nguy c¬ ®øt g·y NST cao dÉn ®Õn c¸c biÕn d¹ng NST vµ/hoÆc trao ®æi chÐo gi÷a c¸c nhiÔm s¾c tö. VÒ c¬ chÕ, mét d¹ng bÖnh mÊt ®iÒu hßa gi·n m¹ch lµ do sai háng cña mét enzym kinase tham gia ®iÒu khiÓn chu tr×nh tÕ bµo; héi chøng Bloom do sù sai háng cña mét enzym ADN helicase (RecQ helicase). C¬ chÕ g©y bÖnh ung th− ruét kÕt di truyÒn kh«ng polip (®· nªu ë môc 6.5.3.1 trªn ®©y) lµ do sai háng trong c¬ chÕ söa ch÷a MMR. §iÒu nµy cho thÊy nh÷ng sai háng trong c¸c c¬ chÕ söa ch÷a ADN kh¸c còng cã thÓ lµ nguyªn nh©n dÉn ®Õn c¸c d¹ng ung th− kh¸c nhau ë ng−êi (ch−¬ng 8). §Ó t×m c¸c gen liªn quan ®Õn c¸c tÝnh tr¹ng vµ bÖnh ë ng−êi, cã thÓ tham kh¶o trang Web: www3.ncbi.nlm.nih.gov/OMIM/. 6.7. C¸c c¬ chÕ t¸i tæ hîp ADN Trong gi¶m ph©n, mét sù kiÖn quan träng gãp phÇn lµm t¨ng biÕn dÞ tæ hîp ë c¸c loµi sinh s¶n h÷u tÝnh lµ hiÖn t−îng trao ®æi chÐo gi÷a c¸c NST t−¬ng ®ång. Trong thùc tÕ, nhiÒu gen cã liªn quan ®Õn ho¹t ®éng söa ch÷a c¸c ADN ®−îc t×m thÊy ®Òu cã vai trß thiÕt yÕu trong sù trao ®æi chÐo gi÷a c¸c NST t−¬ng ®ång trong qu¸ tr×nh nµy. Ngoµi ra, c¸c c¬ chÕ t¸i tæ hîp cã lÏ lu«n cã liªn quan ®Õn mét sè c¬ chÕ söa ch÷a ADN, nªn ë ®©y chóng ta ®Ò cËp mét sè ®Æc ®iÓm c¬ b¶n cña qu¸ tr×nh t¸i tæ hîp ADN. ë eukaryote, trao ®æi chÐo liªn quan ®Õn sù h×nh thµnh phøc hÖ tiÕp hîp trong k× ®Çu cña gi¶m ph©n I. Phøc hÖ nµy cã b¶n chÊt lµ ribonucleoprotein (gåm protein vµ ARN). V× mét nguyªn nh©n nµo ®ã, hiÖn t−îng trao ®æi chÐo hÇu nh− kh«ng x¶y ra ë ruåi giÊm ®ùc (víi phÇn lín c¸c loµi, hiÖn t−îng nµy x¶y ra ë c¶ hai giíi). §iÒu ®¸ng chó ý lµ trong qu¸ tr×nh ph¸t sinh giao tö ®ùc (tinh trïng) ë ruåi giÊm, phøc hÖ tiÕp hîp kh«ng thÊy h×nh thµnh ë k× ®Çu gi¶m ph©n I. Ngoµi ra, c¸c ®ét biÕn liªn quan ®Õn gen c3G ë ruåi giÊm c¸i dÉn ®Õn phøc hÖ tiÕp hîp kh«ng h×nh thµnh vµ kh«ng cã trao ®æi chÐo. Nh− vËy, sù h×nh thµnh phøc hÖ tiÕp hîp cã lÏ cã liªn quan mËt thiÕt víi hiÖn t−îng trao ®æi chÐo vµ t¸i tæ hîp ADN. 6.7.1. Trao ®æi chÐo lµ sù ®øt - nèi cña c¸c ®o¹n ADN t−¬ng ®ång PhÇn lín c¸c hiÓu biÕt vÒ trao ®æi chÐo gi÷a c¸c ph©n tö ADN ®Õn nay chñ yÕu dùa trªn c¸c nghiªn cøu ë E. coli vµ S. cerevisiae. C¸c nghiªn cøu hãa sinh vÒ c¸c dßng ®ét biÕn nµy cho thÊy chóng thiÕu mét sè protein vµ enzym cÇn cho sù t¸i tæ hîp ADN. NhiÒu m« h×nh nghiªn cøu vÒ t¸i tæ hîp ADN ®−îc sö dông réng r·i hiÖn nay dùa trªn m« h×nh ®−îc Holliday c«ng bè n¨m 1964. Cã lÏ, Holliday lµ mét trong nh÷ng ng−êi ®Çu tiªn gi¶i thÝch ®−îc hiÖn t−îng ®øt ra, nèi l¹i vµ söa ch÷a ADN. H×nh 6.16 minh häa m« h×nh ®−îc Holliday ®−a ra cïng víi nh÷ng söa ®æi nhê nh÷ng hiÓu biÕt gÇn ®©y. Sù trao ®æi chÐo gi÷a hai ph©n tö ADN b¾t ®Çu b»ng viÖc mét enzym endonuclease lµm ®øt mét m¹ch ®¬n trªn c¶ hai ph©n tö ADN mang ®o¹n t−¬ng ®ång. C¸c ph©n ®o¹n m¹ch ®¬n ADN ë hai phÝa cña vÞ trÝ c¾t chuyÓn chç cho nhau nhê c¸c protein liªn kÕt m¹ch ®¬n (SSB) vµ enzym helicase. Enym helicase lµm gi·n xo¾n ph©n tö ADN sîi kÐp ë vÞ trÝ gÇn víi ®iÓm c¾t m¹ch ®¬n. ë E. coli, mét phøc hÖ gäi lµ RecBCD ®ång thêi cã hai ho¹t tÝnh cña endonuclease (lµm ®øt m¹ch ®¬n ADN) vµ helicase (gi·n xo¾n ADN t¹i vÞ trÝ ®øt). C¸c m¹ch ®¬n ®æi chç cho nhau sau ®ã sÏ trao ®æi thµnh phÇn kÕt cÆp bæ sung cña chóng t−¬ng øng trªn hai m¹ch bæ sung nguyªn vÑn (h×nh 6.16c/d). Qu¸ tr×nh nµy ®−îc xóc t¸c bëi c¸c protein kiÓu RecA ë E. coli. C¸c protein kiÓu RecA ®−îc t×m thÊy ë nhiÒu sinh vËt kh¸c nhau, ë c¶ prokaryote vµ eukaryote. C¸c protein kiÓu RecA thóc ®Èy sù t¸i tæ hîp m¹ch ®¬n, nghÜa lµ mét m¹ch ®¬n cña ph©n tö ADN sîi kÐp nµy ®æi chç cho mét ®o¹n t−¬ng ®ång víi nã trªn ph©n tö ADN sîi kÐp kh¸c. Trong thùc tÕ, c¸c protein kiÓu 202
Ch−¬ng 6. §ét biÕn vµ söa ch÷a Adn RecA thóc ®Èy sù NST t−¬ng aB trao ®æi t−¬ng ®ång A ®ång 1 B gi÷a c¸c m¹ch ®¬n A (j) NST t¸i tæ hîp b cña hai ph©n tö a NST t−¬ng b ADN sîi kÐp t−¬ng ®ång 2 ADN ligase (cã thÓ cã ®ång qua hai b−íc. exonuclease vµ ADN Trong b−íc thø (a) KÕt cÆp NST t−¬ng ®ång nhÊt, mét m¹ch ®¬n Endonuclease polymerase ho¹t cña chuçi xo¾n kÐp ®éng tr−íc ®ã) ®øt ra råi ®æi chç AB aB víi m¹ch t−¬ng ®ång hoµn toµn ab Ab (hoÆc mét phÇn lín) (b) H×nh thµnh “vÕt ®øt\" trªn mçi (i) H×nh ¶nh 2-D víi nã, råi kÕt cÆp bæ sung víi m¹ch m¹ch ®¬n B nguyªn vÑn cßn l¹i. Helicase vµ protein A liªn kÕt m¹ch ®¬n ë b−íc thø hai, x¶y (h) §øt cÇu m¹ch ®¬n ra mét sù ®æi chç AB t−¬ng tù trªn m¹ch b a Endonuclease ®¬n ë vÞ trÝ ®æi chç ab A B thø nhÊt. Protein (c) C¸c m¹ch ®¬n ®æi chç sau RecA ®iÒu hßa sù b (g) CÊu h×nh kh«ng trao ®æi chÐo b»ng khi ®øt A gian t−¬ng øng c¸ch liªn kÕt vµo Protein kiÓu RecA m¹ch ADN kh«ng a kÕt cÆp, thóc ®Èy AB PhÇn ®Çu d−íi quay m¹ch nµy t×m tr×nh 180o tù t−¬ng ®ång víi ab nã; vµ mét khi tr×nh (d) C¸c m¹ch ®¬n trao ®æi chÐo B tù t−¬ng ®ång ®−îc t×m thÊy, nã thóc ADN ligase (cã thÓ cã (f) CÊu h×nh kh«ng ®Èy sù ®æi chç cña exonuclease vµ ADN gian 3-D sau khi mét m¹ch ®¬n polymerase ho¹t h×nh thµnh “cÇu” thuéc tr×nh tù võa ®éng tr−íc ®ã) liªn kÕt t×m thÊy víi m¹ch AB kh«ng kÕt cÆp. NÕu a tr×nh tù t−¬ng ®ång ab b t×m thÊy s½n cã ë (e) H×nh thµnh “cÇu” liªn kÕt d¹ng m¹ch ®¬n th× hiÖu lùc t¹o “trao céng hãa trÞ m¹ch ®¬n ®æi chÐo” cña RecA t¨ng trªn 50 lÇn. H×nh 6.16. C¬ chÕ t¸i tæ hîp gi÷a c¸c nhiÔm s¾c thÓ t−¬ng ®ång trªn c¬ së m« h×nh cña Robin Holliday (1964) ®−îc bæ sung b»ng nh÷ng hiÓu biÕt gÇn ®©y. C¸c m¹ch ®¬n bÞ ®øt th−êng ®−îc nèi l¹i (qua liªn kÕt phosphodiester) nhê ADN ligase. NÕu nh− c¸c vÞ trÝ ®øt trªn c¸c m¹ch ®¬n cña hai ph©n tö ADN kh«ng t−¬ng ®ång (kh«ng trïng vÞ trÝ), th× cÇn cã mét sè biÕn ®æi bæ sung kh¸c tr−íc khi ADN ligase cã thÓ xóc t¸c ph¶n øng nèi. Nh÷ng biÕn ®æi nµy bao gåm viÖc c¾t bá mét sè nucleotide bëi mét enzym exonuclease vµ ho¹t ®éng tæng hîp söa ch÷a cña ADN polymerase. C¸c sù kiÖn nµy ®−îc m« t¶ th«ng qua c¸c d¹ng t¸i tæ hîp trung gian ®−îc gäi lµ c¸c d¹ng χ (®äc lµ “khi”, h×nh 6.16g) t×m thÊy ë nhiÒu sinh vËt kh¸c nhau khi ph©n tÝch NST cña chóng b»ng kÝnh hiÓn vi ®iÖn tö. C¸c d¹ng χ nµy sau ®ã ®−îc gi¶i phãng bëi ph¶n øng ®øt-nèi 203
§inh §oµn Long c¸c m¹ch ADN kÕt cÆp bæ sung míi nhê ho¹t ®éng cña c¸c enzym ®Ó h×nh thµnh nªn hai ph©n tö ADN t¸i tæ hîp (h×nh 6.16j). ë E. coli, sù gi¶i phãng d¹ng χ nh− vËy lµ nhê biÓu hiÖn cña gen recG hoÆc cña gen ruvC (söa ch÷a sai háng ADN do tia UV). Mçi gen m· hãa mét endonuclease xóc t¸c ph¶n øng c¾t m¹ch ®¬n t¹i vÞ trÝ ®øt-nèi. Mét sè b»ng chøng cho thÊy cã thÓ cã nhiÒu c¬ chÕ t¸i tæ hîp t−¬ng ®ång kh¸c n÷a. Ch¼ng h¹n, theo Jack Szostak, Frlanklin Stahl vµ ®ång nghiÖp (1983), ë S. cerevisiae cã m« h×nh ®øt-nèi m¹ch kÐp. Theo m« h×nh nµy, sù ®øt-nèi x¶y ra trªn mét trong hai ph©n tö ADN t−¬ng ®ång (nh−ng trªn c¶ hai m¹ch, chø kh«ng ph¶i trªn mét m¹ch nh− m« h×nh Holliday). Tõ vÞ trÝ ®øt nèi cã sù më réng ®Ó h×nh thµnh mét ®o¹n ADN “rçng” (gièng nh− minh häa trªn h×nh 6.15) trªn c¶ hai m¹ch. Mçi ®Çu cña mét m¹ch ®¬n t¹i vÞ trÝ ®øt “x©m lÊn” sang chuçi kÐp nguyªn vÑn vµ thay thÕ c¸c m¹ch t−¬ng ®ång trong vïng nµy. C¸c tr×nh tù m¹ch ®¬n “rçng” sau ®ã ®−îc lÊp ®Çy bëi ho¹t ®éng tæng hîp cña hÖ thèng söa ch÷a ADN. Sù kh¸c biÖt cña m« h×nh nµy lµ cã sù h×nh thµnh ®ång thêi hai “cÇu” trao ®æi chÐo trªn hai m¹ch ®¬n cña c¸c ®o¹n NST t−¬ng ®ång. C¸c “cÇu” trao ®æi chÐo nµy sau ®ã bÞ ®øt bëi ho¹t ®éng cña enzym endonuclease gièng nh− m« h×nh Holliday. C¶ hai m« h×nh Holliday vµ ®øt-nèi m¹ch kÐp ®Òu gióp gi¶i thÝch ®−îc sù xuÊt hiÖn c¸c d¹ng t¸i tæ hîp cña c¸c dÊu chuÈn di truyÒn bªn c¹nh c¸c vÞ trÝ trao ®æi chÐo. 6.7.2. Trao ®æi chÐo trong c¬ chÕ söa ch÷a ADN §Õn ®©y, chóng ta míi chØ nãi ®Õn sù t¸i tæ hîp di truyÒn do sù ®øt-nèi cña c¸c nhiÔm s¾c tö vµ sù trao ®æi t−¬ng hç gi÷a c¸c phÇn t−¬ng ®ång cña chóng. Tuy vËy, c¸c ph©n tÝch bé bèn ë Ascomycetes cho thÊy sù trao ®æi nh− vËy kh«ng ph¶i lóc nµo còng t−¬ng hç. §iÒu nµy ®−îc ph¸t hiÖn thÊy trong phÐp lai gi÷a hai d¹ng ®ét biÕn liªn kÕt gÇn ë Neurospora. Cô thÓ lµ, khi ng−êi ta tiÕn hµnh lai hai d¹ng ®ét biÕn liªn kÕt gÇn m1 vµ m2 lµ m1m2+ víi m1+m2 (alen cã dÊu “ + ” lµ kiÓu a) a+ m+ b+ d¹i), ng−êi ta thu ®−îc 4 cÆp nang cã kiÓu h×nh sau: 1) cÆp sè 1 lµ m1+m2; 2) cÆp sè 2 lµ m1+m2+; 3) m+ kÕt cÆp sai cÆp sè 3 lµ m1m2+ vµ 4) cÆp sè 4 lµ m1m2+ (gièng cÆp C¸c chuçi dÞ a+ m b+ sè 3). Nh− vËy, xuÊt hiÖn kiÓu h×nh kiÓu d¹i xo¾n kÐp a m+ b m1+m2+, nh−ng ®¸ng l−u ý nhÊt lµ kh«ng xuÊt hiÖn kiÓu h×nh ®ét biÕn kÐp m1m2. NÕu sù t¸i tæ hîp m kÕt cÆp sai t−¬ng ®ång x¶y ra, th× bÊt cø khi nµo thu ®−îc kiÓu amb h×nh kiÓu d¹i m1+m2+ th× còng ph¶i thu ®−îc kiÓu h×nh ®ét biÕn kÐp m1m2. ë ®©y, ®iÒu nµy kh«ng x¶y b) a+ m+ b+ ra; ®ång thêi, tØ lÖ kiÓu h×nh m2+ : m2 ®−îc mong ®îi lµ 2 : 2, mµ trong thùc tÕ l¹i lµ 3 : 1. C¸c nghiªn mm++ cøu ph©n tö sau nµy cho thÊy, ®· cã hiÖn t−îng “chuyÓn ®æi” mét alen m2 thµnh m2+, vµ sù t¸i tæ a+ m+ b+ hîp kh«ng t−¬ng ®ång nµy ®−îc gäi lµ sù ®æi gen. Sù ®æi gen ë ®©y kh«ng ph¶i do ®ét biÕn ng−îc (do a m+ b C¾t bá vµ tæng kh«ng xuÊt hiÖn alen míi); ®ång thêi tÇn sè t¸i tæ m+ hîp söa sai m hîp cña mét sè dÊu chuÈn gÇn vÞ trÝ trao ®æi chÐo am b lµ 50%. Trong thùc tÕ, ®· diÔn ra hiÖn t−îng söa H×nh 6.17. Söa ch÷a ADN kiÓu “®æi gen” ch÷a ADN ®ång thêi víi trao ®æi chÐo (h×nh 6.17). ®ång thêi víi trao ®æi chÐo t−¬ng ®ång. 204
Ch−¬ng 6. §ét biÕn vµ söa ch÷a Adn Víi c¸c dÊu chuÈn liªn kÕt gÇn, b+ ng−êi ta thÊy viÖc ®æi gen cßn x¶y ra th−êng xuyªn h¬n t¸i tæ hîp t−¬ng a+ m+ Söa ch÷a ADN ®ång. Trong mét nghiªn cøu ph©n tÝch m+ Söa ch÷a ADN ®ét biÕn his1 ë nÊm men, 980 trong sè m+ m+ a 1081 nang ph©n tÝch cã kiÓu h×nh kiÓu d¹i his1+ lµ do ®æi gen, trong khi chØ cã 101 nang lµ kÕt qu¶ cña t¸i tæ hîp t−¬ng ®ång. b §Æc ®iÓm næi bËt nhÊt cña viÖc Endonuclease “®æi gen” lµ tØ lÖ alen ban ®Çu cña b+ b+ phÐp lai (1 : 1) kh«ng ®−îc duy tr× ë a+ m+ a+ m+ thÕ hÖ con. §iÒu nµy ®−îc gi¶i thÝch m+ m+ bëi c¸c ph©n ®o¹n ng¾n ADN mang alen ®ét biÕn cña bè/mÑ bÞ ph©n gi¶i sau ®ã ®−îc tæng hîp l¹i dùa trªn m+ a m+ a m¹ch khu«n lµ ®o¹n ADN mang alen m+ m+ kiÓu d¹i cña mÑ/bè t−¬ng øng. Trªn b b h×nh 6.16d-i, cã mét ph©n ®o¹n ADN gi÷a c¸c locut A vµ B (n¬i cã c¸c ®o¹n ADN m¹ch ®¬n cña hai NST t−¬ng a m+ b+ a+ m+ b+ ®ång) kÕt cÆp bæ sung víi nhau. NÕu mét cÆp alen thø 3 n»m trong ph©n vµ m+ vµ m+ ®o¹n nµy ph©n li trong trao ®æi chÐo a+ m+ a m+ th× sù kÕt cÆp sai cã thÓ x¶y ra ë hai chuçi xo¾n kÐp (t−¬ng øng víi 2 nhiÔm m+ b m+ b s¾c tö, h×nh 6.17a). Ph©n tö ADN a ADN ligase a+ ADN ligase vµ m+ b+ vµ m+ b+ chøa c¸c alen kh¸c nhau trªn hai m¹ch ®¬n cña chóng ®−îc gäi lµ chuçi m+ m+ dÞ xo¾n kÐp. Khi sù kÕt cÆp sai cña m+ m+ ADN ®−îc söa ch÷a b»ng c¬ chÕ c¾t bá (xem môc 6.5.2 ë trªn), trong ®ã m¹ch a+ m+ b a m+ b m ®−îc c¾t bá vµ tæng hîp l¹i thµnh C¸c dÊu chuÈn bªn C¸c dÊu chuÈn bªn m¹ch m+, th× thÓ tø trÞ thu ®−îc sÏ ngoµi t¸i tæ hîp ngoµi gièng bè, mÑ gièng víi h×nh 6.17b. Trªn c¬ së ®ã, trong lÇn ph©n bµo tiÕp theo, sù sao H×nh 6.18. Söa ch÷a ADN kiÓu “®æi gen” liªn kÕt víi c¸c chÐp ADN theo c¬ chÕ b¸n b¶o toµn sÏ dÊu chuÈn (gen) bªn ngoµi theo kiÓu gièng bè, mÑ hoÆc dÉn ®Õn h×nh thµnh 6 nang mang alen theo kiÓu t¸i tæ hîp. m+ vµ chØ cã 2 nang mang alen m (v× vËy, tØ lÖ ph©n li kiÓu h×nh lµ 3 : 1). NÕu chØ cã 1 trong 2 vÞ trÝ kÕt cÆp sai trong thÓ tø trÞ ®−îc söa ch÷a tr−íc lÇn ph©n bµo nguyªn nhiÔm, th× sù sao chÐp b¸n b¶o toµn cña chuçi dÞ xo¾n kÐp kh«ng ®−îc söa ch÷a sÏ thu ®−îc mét chuçi nguyªn xo¾n kÐp mang alen m+ vµ mét mang alen m. Lóc nµy tØ lÖ ph©n li sÏ lµ 5 m+ : 3 m. HiÖn t−îng “®æi gen” còng liªn quan ®Õn sù t¸i tæ hîp t−¬ng ®ång cña c¸c dÊu chuÈn ë c¹nh vÞ trÝ trao ®æi chÐo víi tØ lÖ xÊp xØ 50%. Mèi quan hÖ nµy ®−îc gi¶i thÝch bëi m« h×nh t¸i tæ hîp cña Holliday (h×nh 6.16). Bëi v×, nÕu c¶ hai nhiÔm s¾c tö thuéc cïng mét thÓ tø trÞ ë d¹ng gièng nh− trªn h×nh th× sù “®æi gen” ®ång thêi ®i kÌm víi sù t¸i tæ hîp t−¬ng ®ång cña c¸c dÊu chuÈn ë gÇn vÞ trÝ trao ®æi chÐo lµ dÔ x¶y ra (h×nh 6.18). CÇu liªn kÕt m¹ch ®¬n gi÷a hai nhiÔm s¾c tö ®−îc ph©n gi¶i bëi enzym endonuclease hoÆc 205
§inh §oµn Long theo chiÒu däc, hoÆc theo chiÒu ngang (theo chiÒu h×nh vÏ). NÕu vÕt c¾t theo chiÒu däc, th× c¸c nang sÏ mang c¶ 2 alen bÞ ®æi vµ sù t¸i tæ hîp t−¬ng ®ång c¸c gen ë gÇn vÞ trÝ ®øt- nèi. Nh−ng nÕu vÕt c¾t theo chiÒu ngang th× mét nang mang gen bÞ ®æi vµ sù tæ hîp c¸c dÊu chuÈn ë gÇn vÞ trÝ ®øt-nèi theo kiÓu gen cña bè/mÑ. V× vËy, nÕu tÇn sè c¾t däc vµ c¾t ngang lµ t−¬ng ®−¬ng (50% mçi lo¹i) th× sù ®æi gen ®i kÌm víi t¸i tæ hîp t−¬ng ®ång cña c¸c dÊu chuÈn gÇn vÞ trÝ ®øt-nèi lµ xÊp xØ 50%, phï hîp víi kÕt qu¶ thùc nghiÖm. 6.8. C¸c yÕu tè di truyÒn vËn ®éng (TE) 6.8.1. C©y ng« vµ hiÖn t−îng “gen nh¶y” Ng« lµ mét trong nh÷ng c©y l−¬ng thùc quan träng hµng ®Çu ë n−íc ta vµ nhiÒu n−íc trªn thÕ giíi. LÞch sö trång ng« b¾t ®Çu kho¶ng 5000 n¨m tr−íc ë Trung Mü, sau ®ã ph¸t triÓn ra c¸c vïng kh¸c trªn thÕ giíi. Khi Columbus ph¸t hiÖn ra Ch©u Mü, ng−êi d©n b¶n ®Þa ë ®©y ®· cã nhiÒu gièng ng« kh¸c nhau. Trong sè ®ã, nhiÒu gièng víi kiÓu mµu h¹t kh¸c nhau nh− ®á, xanh lam, vµng, tr¾ng, tÝm, säc, ®èm... N¨m 1948, nhµ khoa häc n÷ ng−êi Mü lµ Barbara McClintock ®· c«ng bè nghiªn cøu nhËn ®Þnh r»ng c¸c gièng ng« “säc” vµ “®èm” lµ kÕt qu¶ ®ét biÕn do ho¹t ®éng cña yÕu tè di truyÒn vËn ®éng. §Õn n¨m 1983, bµ ®−îc trao gi¶i th−ëng Nobel nhê c«ng bè nµy. Sau c©y ng«, ng−êi ta ®· t×m thÊy c¸c tr×nh tù ADN cã thÓ vËn ®éng trong hÖ gen ë hÇu hÕt c¸c loµi sinh vËt kh¸c. Trong hÖ gen cña nhiÒu loµi, chóng chiÕm mét tØ lÖ ®¸ng kÓ. Ch¼ng h¹n ë ng«, h¬n mét nöa hÖ gen liªn quan ®Õn ho¹t ®éng cña c¸c TE. ë ng−êi, kho¶ng 40% tr×nh tù hÖ gen cã liªn quan ®Õn c¸c yÕu tè TE. 6.8.2. C¸c lo¹i yÕu tè di truyÒn vËn ®éng Cã nhiÒu lo¹i TE víi cÊu B¶ng 6.1. Ph©n lo¹i c¸c yÕu tè di truyÒn vËn ®éng (TE) tróc vµ ®Æc ®iÓm ho¹t ®éng theo c¬ chÕ vËn ®éng kh¸c nhau ®−îc t×m thÊy ë vi khuÈn, nÊm, sinh vËt ®¬n bµo, KiÓu vÝ dô Sinh vËt chñ thùc vËt còng nh− ®éng vËt. I. C¸c TE kiÓu c¾t - d¸n Khi c¸c TE vËn ®éng, chóng cã thÓ lµm ®øt ®o¹n NST vµ C¸c lo¹i yÕu tè IS (vÝ dô: IS50) Vi khuÈn g©y ®ét biÕn. Dï mçi lo¹i TE cã nh÷ng ®Æc tÝnh riªng, C¸c yÕu tè composite (vi dô: Tn5) Vi khuÈn nh−ng dùa vµo c¸ch thøc vËn ®éng trong hÖ gen cña chóng, C¸c yÕu tè Ac/Ds Ng« ng−êi ta chia lµm ba nhãm C¸c yÕu tè P Ruåi giÊm chÝnh (b¶ng 6.1). Nhãm 1 gåm c¸c TE kiÓu c¾t-d¸n. C¸c yÕu tè mariner Ruåi giÊm Gäi nh− vËy, bëi sù vËn ®éng cña chóng ®i liÒn víi sù “®øt” C¸c yÕu tè hobo Ruåi giÊm ra cña tr×nh tù gèc vµ “g¾n” vµo mét vÞ trÝ kh¸c trong hÖ C¸c yÕu tè Tc1 Giun trßn II. C¸c TE kiÓu sao chÐp gen. Sù c¾t-d¸n cña c¸c TE cã thÓ diÔn ra trªn cïng mét C¸c yÕu tè Tn3 Vi khuÈn NST hoÆc gi÷a c¸c NST kh¸c III. C¸c TE kiÓu phiªn m ng−îc nhau, nh−ng lu«n ®−îc xóc t¸c bëi enzym ®Æc biÖt lµ A. C¸c TE kiÓu phiªn m· ng−îc transposase. Nhãm thø hai (cßn gäi lµ retrotransposon, hay LTR = long tandem repeats) gåm c¸c yÕu tè TE khi vËn Ty1 NÊm men ®éng chóng ®ång thêi sao copia Ruåi giÊm gypsy Ruåi giÊm B. C¸c retrosposon C¸c yÕu tè F, G vµ I Ruåi giÊm C¸c retrosposon kÐo dµi ®Çu mót Ruåi giÊm nhiÔm s¾c thÓ (vÝ dô: HeT-A, TART) LINE (vÝ dô: L1) Ng−êi SINE (vÝ dô: Alu) Ng−êi 206
Ch−¬ng 6. §ét biÕn vµ söa ch÷a Adn chÐp (t¸i b¶n) tr×nh tù gèc. Gièng nhãm thø nhÊt, nhãm TE thø hai nµy còng th−êng m· hãa cho enzym transposase cã vai trß ®iÒu khiÓn sù t−¬ng t¸c cña nã víi vÞ trÝ “®Ých” mµ nã vËn ®éng tíi. Trong qu¸ tr×nh t−¬ng t¸c, TE ®−îc sao chÐp vµ mét b¶n sao cña nã ®−îc “g¾n” vµo vÞ trÝ míi; cßn b¶n “gèc” vÉn duy tr× ë vÞ trÝ cò. Nhãm nµy ®−îc gäi lµ c¸c TE kiÓu sao chÐp. Trong nhãm thø ba, qu¸ tr×nh vËn ®éng cña TE ®−îc thùc hiÖn th«ng qua viÖc “g¾n” mét b¶n sao cña mét tr×nh tù TE ®−îc phiªn m· ng−îc tõ ph©n tö ARN t−¬ng øng cña nã vµo vÞ trÝ míi trong hÖ gen. Trong qu¸ tr×nh nµy, cã sù tham gia cña enzym phiªn m· ng−îc reverse transcriptase, nªn c¸c yÕu tè TE nµy ®−îc gäi lµ c¸c TE phiªn m· ng−îc hay retrotransposon. NhiÒu TE thuéc nhãm nµy liªn quan ®Õn c¸c retrovirut, v× vËy còng cßn ®−îc gäi lµ c¸c TE kiÓu retrovirut. Mét sè lo¹i TE kh¸c cã cÊu tróc “gi¶n l−îc” ®−îc gäi lµ retroposon. §Õn nay, nÕu nh− c¸c TE kiÓu c¾t-d¸n ®−îc t×m thÊy ë c¶ prokaryote vµ eukaryote, th× c¸c TE kiÓu sao chÐp míi chØ thÊy ë prokaryote, cßn c¸c TE kiÓu phiªn m· ng−îc chØ thÊy ë eukaryote. 6.8.3. C¸c yÕu tè di truyÒn vËn ®éng ë prokaryote MÆc dï c¸c TE ®Çu tiªn ®−îc t×m thÊy ë c¸c loµi eukaryote, nh−ng nh÷ng TE ®−îc hiÓu râ ë møc ®é ph©n tö ®Çu tiªn l¹i lµ c¸c TE ë vi khuÈn. ë vi khuÈn, cã ba lo¹i TE chÝnh: (1) c¸c tr×nh tù cµi, cßn gäi lµ c¸c yÕu tè IS (insertion sequence); (2) c¸c yÕu tè composite, cßn gäi lµ d¹ng tÝch hîp vµ (3) c¸c yÕu tè Tn3. C¸c yÕu tè IS cã cÊu tróc ®¬n gi¶n nhÊt, chØ chøa gen m· hãa cho c¸c protein tham gia vµo qu¸ tr×nh vËn ®éng cña TE. C¸c yÕu tè composite vµ Tn3 cã cÊu t¹o phøc t¹p h¬n, chøa mét sè gen m· hãa cho c¸c s¶n phÈm kh«ng liªn quan ®Õn ho¹t ®éng vËn ®éng cña TE. 6.8.3.1. C¸c yÕu tè cµi IS §©y lµ c¸c TE cã cÊu t¹o ®¬n gi¶n nhÊt. Chóng ®−îc gäi lµ c¸c yÕu tè cµi v× chóng cã thÓ g¾n vµo nhiÒu vÞ trÝ kh¸c nhau trªn NST hoÆc trªn plasmid cña vi khuÈn. C¸c yÕu tè IS ®Çu tiªn ®−îc t×m thÊy ë E. coli (dßng ®ét biÕn lac-). C¸c dßng vi khuÈn nµy cã kh¶ n¨ng ®ét biÕn phôc håi cao. C¸c nghiªn cøu ë møc ®é ph©n tö cho thÊy, c¸c ®ét biÕn “kÐm bÒn” nµy lµ do cã c¸c ®o¹n tr×nh tù ADN “bæ sung” vµo mét sè vÞ trÝ c¹nh gen lac. Sau ®ã, sù phôc håi ®ét biÕn x¶y ra do chÝnh sù rêi khái vÞ trÝ ®· g¾n vµo cña c¸c ®o¹n tr×nh tù bæ sung nµy. KiÓu vËn ®éng nh− vËy cña c¸c yÕu tè IS sau nµy ®−îc t×m thÊy ë nhiÒu vi khuÈn kh¸c. C¸c yÕu tè IS cã cÊu t¹o gän, phÇn lín cã kÝch th−íc nhá h¬n 2500 bp vµ chØ chøa c¸c gen liªn quan trùc tiÕp tíi sù vËn ®éng cña chóng. §Õn nay, ®· ph¸t hiÖn ®−îc nhiÒu lo¹i yÕu tè IS kh¸c nhau. Lo¹i nhá nhÊt, IS1, cã kÝch th−íc 768 bp, ®−îc x¸c ®Þnh ranh giíi bëi hai tr×nh tù ng¾n lÆp l¹i ng−îc chiÒu ë hai ®Çu, kÝ hiÖu lµ ITR (inverted terminal repeat). Mçi yÕu tè IS th−êng cã tr×nh tù ITR ®Æc thï (nh−ng kh«ng nhÊt thiÕt), víi chiÒu dµi tõ 9 ®Õn 40 bp. Khi tr×nh tù ITR bÞ ®ét biÕn, yÕu tè IS th−êng mÊt kh¶ n¨ng vËn ®éng. §iÒu nµy cho thÊy, c¸c tr×nh tù ITR cã vai trß quyÕt ®Þnh trong sù vËn ®éng cña c¸c yÕu tè IS. Ýt nhÊt mét sè yÕu tè IS ®−îc t×m thÊy mang gen m· hãa cho mét enzym ®Æc biÖt cã vai trß quan träng trong sù vËn ®éng cña b¶n th©n chóng lµ transposase. Trong qu¸ tr×nh vËn ®éng cña IS, transposase d−êng nh− g¾n vµo vÞ trÞ ë phÝa ®Çu hoÆc gÇn ®Çu cña tr×nh tù vËn ®éng, ®ång thêi c¾t m¹ch ADN sîi kÐp t¹i vÞ trÝ gèc. ViÖc c¾t ph©n tö ADN sîi kÐp ë vÞ trÝ nµy lµm t¸ch tr×nh tù vËn ®éng khái NST hoÆc plasmid, nhê vËy chóng cã thÓ “vËn ®éng” tíi mét vÞ trÝ kh¸c trong hÖ gen. Khi c¸c IS g¾n vµo mét vÞ trÝ míi trªn NST hoÆc plasmid, nã sÏ g©y ra sù nh©n ®«i mét tr×nh tù ng¾n ë hai ®Çu t¹i vÞ trÝ nã g¾n vµo (do t¹i vÞ trÝ nµy, ph©n tö ADN sîi kÐp th−êng bÞ c¾t theo kiÓu ch÷ chi). Trong ®ã mçi b¶n sao cña tr×nh tù ®−îc nh©n ®«i n»m vÒ mét phÝa cña yÕu tè di truyÒn vËn ®éng. 207
§inh §oµn Long Nh÷ng tr×nh tù nµy (th−êng gåm Hai m¹ch ®¬n cña tr×nh tù ADN ®Ých tõ 2 ®Õn 13 cÆp nucleotide) ®−îc ®−îc c¾t t¹i c¸c vÞ trÝ kh¸c nhau (mòi tªn) gäi lµ c¸c tr×nh tù nh©n ®«i t¹i vÞ trÝ ®Ých (h×nh 6.19). NST vi khuÈn cã thÓ cã YÕu tè IS cµi vµo ®o¹n rçng ADN ®−îc nhiÒu b¶n sao kh¸c nhau cña t¹o ra do enzym c¾t kiÓu ch÷ chi cïng mét lo¹i yÕu tè IS. Ch¼ng h¹n, mçi tÕ bµo E. coli th−êng cã Sù tæng hîp ADN lÊp ®Çy c¸c vÞ trÝ rçng tõ 6 tíi 10 b¶n sao yÕu tè IS1. Plasmid còng cã thÓ mang yÕu tè b»ng c¸c nucleotide cßn thiÕu (mµu ghi) ë hai ®Çu cña yÕu tè IS. §iÒu nµy dÉn ®Õn IS. Ch¼ng h¹n, plasmid F ®iÓn sù hai tr×nh tù ng¾n lÆp l¹i cïng chiÒu ë h×nh th−êng chøa Ýt nhÊt hai yÕu hai vïng biªn cña tr×nh tù ®Ých tè IS kh¸c nhau lµ IS2 vµ IS3. Khi mét lo¹i yÕu tè IS cã mÆt H×nh 6.19. Sù nh©n ®«i tr×nh tù ë hai vïng biªn c¹nh vÞ trÝ cµi trªn c¶ NST vµ plasmid, chóng cña c¸c yÕu tè di truyÒn vËn ®éng kiÓu c¾t – d¸n (IS). g©y nªn hiÖn t−îng “t¸i tæ hîp t−¬ng ®ång” gi÷a c¸c ph©n tö ADN kh¸c nhau. Sù t¸i tæ hîp nh− vËy ®ãng vai trß trong sù kÕt hîp plasmid F vµo NST ë E. coli. §Õn ®©y, chóng ta nhí r»ng, c¶ NST vµ plasmid F ë E. coli ®Òu cã cÊu tróc ph©n tö ADN sîi kÐp, m¹ch vßng. Khi NST vµ plasmid t¸i tæ hîp ë vïng t−¬ng ®ång (t¹i vÞ trÝ IS cã mÆt trªn c¶ hai ph©n tö ADN), th× plasmid cã kÝch th−íc nhá sÏ kÕt hîp vµo NST, t¹o nªn mét ph©n tö ADN sîi kÐp vßng trßn duy nhÊt trong tÕ bµo. Sù kÕt hîp nµy t¹o nªn c¸c dßng Hfr cã kh¶ n¨ng chuyÓn NST cña chóng sang tÕ bµo kh¸c qua tiÕp hîp. C¸c dßng Hfr kh¸c nhau cã thÓ kh¸c nhau vÒ vÞ trÝ g¾n kÕt cña plasmid F trªn NST, bëi v× c¸c yÕu tè IS ®iÒu hßa ho¹t ®éng g¾n kÕt cã thÓ n»m ë c¸c vÞ trÝ kh¸c nhau trªn NST cña c¸c dßng vi khuÈn kh¸c nhau. V× cã vai trß trong viÖc h×nh thµnh c¸c dßng Hfr nh− vËy, c¸c yÕu tè IS lµm t¨ng kh¶ n¨ng trao ®æi gen gi÷a c¸c chñng vi khuÈn vµ t¹o ra nhiÒu biÕn dÞ tæ hîp. V× vËy, cïng c¸c ®ét biÕn, ®©y chÝnh lµ mét c¬ chÕ c¬ b¶n t¹o nguyªn liÖu phong phó cho sù tiÕn hãa ë vi khuÈn. 6.8.3.2. C¸c TE kiÓu composite C¸c TE kiÓu composite (cßn gäi lµ gen nh¶y tÝch hîp) lµ c¸c tr×nh tù vËn ®éng kiÓu c¾t – d¸n cã ë vi khuÈn, ký hiÖu Tn, ®−îc h×nh thµnh do sù cã mÆt cña hai tr×nh tù IS n»m gÇn nhau. C¸c vïng tr×nh tù n»m gi÷a hai yÕu tè IS còng sÏ ®−îc “vËn ®éng” cïng víi chóng khi c¸c tr×nh tù nµy vËn ®éng trong hÖ gen. Nh− vËy, hËu qu¶ lµ hai yÕu tè IS cã kh¶ n¨ng “b¾t gi÷” mét ®o¹n tr×nh tù ADN n»m gi÷a vèn b×nh th−êng kh«ng cã kh¶ n¨ng vËn ®éng, vµ “truyÒn” kh¶ n¨ng vËn ®éng cho ®o¹n tr×nh tù nµy. H×nh 6.20 minh häa 3 vÝ dô. Víi Tn9, hai yÕu tè IS vïng biªn (768 bp) n»m cïng chiÒu víi nhau. Trong khi ®ã, ë Tn5, hai yÕu tè IS (1533 bp) vïng biªn n»m ng−îc chiÒu. §o¹n tr×nh tù n»m gi÷a hai yÕu tè IS cã thÓ chøa c¸c gen kh«ng liªn quan ®Õn sù vËn ®éng cña gen. Trong thùc tÕ, ®o¹n tr×nh tù gi÷a hai yÕu tè IS ë c¶ ba lo¹i yÕu tè Tn ë h×nh 6.20 ®Òu mang c¸c gen kh¸ng chÊt kh¸ng sinh. Trong mét sè tr−êng hîp, c¸c yÕu tè IS ë hai ®Çu vïng biªn cña tr×nh tù vËn ®éng kiÓu composite kh«ng gièng nhau. Ch¼ng h¹n nh− ë yÕu tè Tn5, tr×nh tù IS vïng biªn ph¶i lµ IS50R cã tr×nh tù m· hãa cho transposase thóc ®Èy sù vËn ®éng cña gen, trong khi ®ã tr×nh tù IS vïng biªn tr¸i (IS50L) kh«ng cã ®Æc tÝnh nµy. Sù kh¸c biÖt lµ ë mét cÆp nucleotide duy nhÊt cã vai trß x¸c ®Þnh ho¹t tÝnh cña transposase. 208
Ch−¬ng 6. §ét biÕn vµ söa ch÷a Adn YÕu tè Tn5 a) ~ 2500 bp b) ~ 5700 bp còng minh häa cho mét ®Æc tÝnh kh¸c Gen camr Gen kanr Gen bler Gen strr cña c¸c gen nh¶y kiÓu composite, ®ã lµ 768 bp 768 bp 1533 bp 1533 bp qu¸ tr×nh vËn ®éng IS1 IS1 cña chóng ®−îc ®iÒu IS50L IS50R khiÓn bëi mét sù ®iÒu §o¹n tr×nh tù hai §o¹n tr×nh tù hai hßa (h×nh 6.21). Khi ®Çu lÆp l¹i ng−îc ®Çu lÆp l¹i ng−îc mét thùc khuÈn thÓ chiÒu 23 bp chiÒu 23 bp mang yÕu tè Tn5 l©y c) ~ 9300 bp nhiÔm tÕ bµo vi 1329 bp Gen tetr khuÈn (vµ kh«ng g©y IS10L 1329 bp tan), th× tÇn sè vËn IS10R ®éng cña yÕu tè Tn5 sÏ gi¶m ®i râ rÖt §o¹n tr×nh tù hai ®Çu lÆp l¹i ng−îc chiÒu 23 bp trong tr−êng hîp NST vi khuÈn còng H×nh 6.20. CÊu tróc cña mét sè yÕu tè di truyÒn vËn ®éng kiÓu tÝch hîp mang mét b¶n sao (composite transposon). KÝch th−íc vµ h−íng cña c¸c tr×nh tù thµnh phÇn ®−îc biÓu diÔn b»ng c¸c chØ sè (cÆp baz¬ nit¬, bp) vµ mòi tªn. a) YÕu tè Tn9 mang hai cña Tn5. HiÖn t−îng nµy cho thÊy, viÖc cã yÕu tè cµi IS1 cã tr×nh tù cïng chiÒu n»m ë hai ®Çu cña gen kh¸ng s½n mét b¶n sao cña chloramphenicol; b) YÕu tè Tn5 mang hai yÕu tè IS50 cã tr×nh tù ng−îc chiÒu n»m TE trong tÕ bµo chñ ë hai ®Çu côm gen gåm c¸c gen kh¸ng kanamycin, bleomycin vµ streptomycin (L = cã t¸c dông øc chÕ sù bªn tr¸i, R = bªn ph¶i); c) YÕu tè Tn10 chøa gåm hai yÕu tè IS10 n»m ë hai ®Çu vËn ®éng trong hÖ mét ®o¹n ADN mang gen kh¸ng tetracyclin (theo Snudtard, 2004). gen cña nã. HiÖn t−îng nµy cã thÓ do sù tæng hîp mét chÊt øc chÕ nµo ®ã g©y ra. Gi¶ thiÕt nµy sau ®ã ®−îc chøng minh bëi c¸c nghiªn cøu cña Michael Syvaen, William Reznikoff vµ c¸c céng sù. YÕu tè IS50R cña Tn5 trong thùc tÕ ®· m· hãa cho hai protein. Mét lo¹i lµ transposase xóc t¸c qu¸ tr×nh vËn ®éng cña gen. Lo¹i thø hai lµ protein transposase bÞ c¾t mét phÇn do ®−îc phiªn m· tõ mét tr×nh tù khëi ®éng n»m bªn trong tr×nh tù m· hãa transposase ®Çy ®ñ, lµm øc chÕ sù vËn ®éng cña gen. Do protein thø hai nµy ng¾n h¬n vµ phæ biÕn h¬n, nªn sù vËn ®éng cña Tn5 bÞ øc chÕ. a) b) IS10L IS10R Transposase YÕu tè Tn5 YÕu tè Tn5 ChÊt øc chÕ YÕu tè thØnh tho¶ng hiÕm khi IS50R ®ång vËn ®éng thêi s¶n sinh vËn ®éng hai lo¹i protein kh¸c nhau do sù dÞch m· b¾t ®Çu tõ hai bé ba më ®Çu kh¸c nhau H×nh 6.21. Sù ®iÒu hßa ho¹t ®éng cña yÕu tè Tn5. a) TÕ bµo E. coli bÞ g©y nhiÔm bëi virut mang yÕu tè Tn5. C¸c tÕ bµo ®· s½n cã Tn5 trªn nhiÔm s¾c thÓ h¹n chÕ sù vËn ®éng cña c¸c yÕu tè nµy. b) C¬ së di truyÒn ®iÒu hßa ho¹t ®éng cña Tn5: Mét lo¹i protein do Tn5 m· hãa lµ transposase xóc t¸c (thóc ®Èy) sù vËn ®éng cña cña chÝnh nã, nh−ng mét protein kh¸c (chÊt øc chÕ) l¹i øc chÕ qu¸ tr×nh nµy. Protein øc chÕ cã kÝch th−íc nhá h¬n, phæ biÕn h¬n, nªn chiÕm −u thÕ ®Æc biÖt khi cã nhiÒu b¶n sao Tn5 trong tÕ bµo. 209
§inh §oµn Long 6.8.3.3. C¸c TE kiÓu Tn3 a) CÊu tróc cña yÕu tè Tn3. C¸c TE thuéc nhãm nµy th−êng 4957 bp cã kÝch th−íc lín h¬n c¸c yÕu tè IS vµ chøa c¸c gen kh«ng liªn quan ®Õn tnpA tnpR bla qu¸ tr×nh vËn ®éng cña chóng. §Æc ®iÓm nµy gièng víi c¸c yÕu tè kiÓu VÞ trÝ res composite. Tuy vËy, kh«ng gièng nh− Transposase Resolvase β-lactamase c¸c yÕu tè composite, c¸c yÕu tè Tn3 (chÊt øc chÕ) kh«ng cã c¸c tr×nh tù IS ë c¸c ®Çu §o¹n tr×nh tù hai ®Çu lÆp tËn cïng cña chóng. Thay vµo ®ã, c¸c l¹i ng−îc chiÒu 38 bp yÕu tè nµy cã c¸c tr×nh tù lÆp l¹i b) Sù vËn ®éng cña Tn3 qua sù h×nh thµnh ADN tÝch hîp ng−îc chiÒu ë hai ®Çu víi chiÒu dµi Plasmid thÓ cho Plasmid thÓ nhËn kho¶ng tõ 38 ®Õn 40 nucleotide. Khi Tn3 vËn ®éng vµo vÞ trÝ ®Ých, c¸c yÕu tè Tn3 còng t¹o ra sù nh©n ®«i tr×nh tù ng¾n t¹i vïng biªn t¹i vÞ trÝ chóng xen vµo. H×nh 6.22a minh häa cÊu Transposase Transposase do Tn3 m· hãa xóc t¸c tróc cña mét yÕu tè Tn3 ®iÓn h×nh. sù h×nh thµnh ph©n tö ADN tÝch hîp YÕu tè nµy gåm cã ba gen tnpA, tnpR gi÷a plasmid thÓ cho vµ plasmid thÓ nhËn. Trong qu¸ tr×nh nµy, yÕu tè Tn3 vµ bla m· hãa t−¬ng øng cho c¸c ®ång thêi sao chÐp, dÉn ®Õn ë mçi protein lµ transposase, protein øc ®Çu nèi gi÷a plasmid thÓ cho vµ thÓ chÕ gäi lµ resolvase, vµ mét enzym nhËn cã mét b¶n sao cña yÕu tè Tn3. gäi lµ β-lactamase. β-lactamase t¹o nªn tÝnh kh¸ng kh¸ng sinh Ph©n tö ampicillin cña vi khuÈn, cßn hai ADN protein kia cã vai trß trong ®iÒu hßa sù vËn ®éng cña gen. tÝch hîp Sù vËn ®éng cña yÕu tè Tn3 diÔn ra qua hai giai ®o¹n (h×nh Resolvase Resolvase do gen tnpR m· hãa ph©n 6.22b). Trong giai ®o¹n ®Çu, t¸ch ph©n tö tÝch hîp qua ®iÒu tiÕt sù transposase ®iÒu hßa sù dung hîp t¸i tæ hîp gi÷a hai yÕu tè Tn3. cña hai ph©n tö ADN cã cÊu tróc vßng, mét lo¹i mang yÕu tè Tn3, cßn lo¹i kia th× kh«ng. KÕt qu¶ cña qu¸ tr×nh ®ã lµ sù h×nh thµnh ph©n tö ADN tÝch hîp. Trong khi qu¸ tr×nh nµy diÔn ra, b¶n th©n tr×nh tù Tn3 ®−îc sao chÐp vµ mçi b¶n sao cña chóng ®−îc g¾n vµo mét ®Çu t¹i chç Plasmid thÓ cho vµ thÓ nèi cña hai ph©n tö ADN ban ®Çu. Hai b¶n sao tr×nh tù Tn3 n»m trong nhËn t¸ch nhau ra, mçi ph©n tö ADN tÝch hîp cã chiÒu gièng plasmid cã mét b¶n sao cña Tn3 nhau. Trong giai ®o¹n sau, protein resolvase ®−îc m· hãa bëi gen tnpR cã t¸c dông ®iÒu hßa sù t¸i tæ hîp t¹i H×nh 6.22. CÊu tróc vµ sù vËn ®éng cña c¸c yÕu tè kiÓu Tn3. mét vÞ trÝ ®Æc hiÖu n»m gi÷a hai b¶n sao cña tr×nh tù Tn3, gäi lµ vÞ trÝ t¸i tæ hîp res (recombination site), ®Ó t¹o thµnh hai ph©n tö ADN míi. Mçi ph©n tö mang mét b¶n sao cña Tn3. Nh− vËy, sù vËn ®éng cña 210
Ch−¬ng 6. §ét biÕn vµ söa ch÷a Adn c¸c yÕu tè Tn3 diÔn ra theo kiÓu sao chÐp liªn quan ®Õn sù h×nh thµnh cña mét ph©n tö ADN tÝch hîp trung gian. S¶n phÈm cña gen tnpR trong yÕu tè Tn3 cßn cã mét chøc n¨ng n÷a, ®ã lµ nã øc chÕ sù tæng hîp cña c¶ hai protein transposase vµ resolvase. Ho¹t ®éng øc chÕ x¶y ra do vÞ trÝ res n»m ë gi÷a hai gen tnpA vµ tnpR. Khi liªn kÕt vµo vÞ trÝ res, protein tnpR ng¨n c¶n sù phiªn m· cña hai gen tnpA vµ tnpR. Lóc nµy, yÕu tè Tn3 trë vÒ tr¹ng th¸i tÜnh (kh«ng vËn ®éng). 6.8.3.4. ý nghÜa y häc cña c¸c yÕu tè di truyÒn vËn ®éng ë vi khuÈn NhiÒu lo¹i TE ë vi khuÈn mang c¸c gen kh¸ng kh¸ng sinh. HËu qu¶ lµ, viÖc vËn ®éng cña c¸c yÕu tè nµy dÔ dµng chuyÓn c¸c gen kh¸ng kh¸ng sinh tõ ph©n tö ADN nµy sang ph©n tö ADN kh¸c (vÝ dô nh− gi÷a NST vµ plasmid). Dßng vËn ®éng cña th«ng tin di truyÒn nh− vËy cã ý nghÜa y häc hÕt søc quan träng do nhiÒu ph©n tö ADN sau khi ®−îc bæ sung c¸c gen kh¸ng kh¸ng sinh cã thÓ ®−îc chuyÓn sang c¸c tÕ bµo kh¸c. Kh¶ n¨ng kh¸ng kh¸ng sinh cã thÓ ®−îc lan truyÒn gi÷a c¸c quÇn thÓ hoÆc gi÷a c¸c thÕ hÖ tÕ bµo kh¸c nhau cña vi khuÈn. KÕt qu¶ cuèi cïng cña qu¸ tr×nh nµy lµ tÊt c¶ (hoÆc hÇu hÕt) c¸c tÕ bµo vi khuÈn trong quÇn thÓ ®Òu cã kh¶ n¨ng kh¸ng kh¸ng sinh. HiÖn t−îng kh¸ng kh¸ng sinh do ho¹t ®éng cña TE ®−îc t×m thÊy mét sè vi khuÈn g©y bÖnh ë ng−êi, bao gåm c¸c chñng cña Staphylococcus, Enterococcus, Neisseria, YÕu tè x¸c ®Þnh tÝnh kh¸ng (R) Plasmid mang gen kh¸ng chÊt kh¸ng sinh streptomycin Sù t¸i tæ hîp gi÷a c¸c yÕu tè Thµnh phÇn yÕu tè truyÒn RTF IS1 n»m trong mét plasmid tÝnh kh¸ng (RTF) Plasmid tiÕp hîp kh«ng cã kh¶ n¨ng t¹o cÇu tiÕp hîp nh−ng mang gen Plasmid tiÕp hîp R Plasmid mang gen kh¸ng chÊt kh¸ng streptomycin (strr) víi kh¸ng sinh tetracyclin mét plasmid cã kh¶ n¨ng tiÕp hîp t¹o nªn mét yÕu tè cã kh¶ n¨ng tiÕp hîp mang gen kh¸ng chÊt kh¸ng sinh (yÕu tè truyÒn tÝnh kh¸ng – RTF). Sù t¸i tæ hîp th«ng qua sù ®iÒu tiÕt cña yÕu tè IS1 gi÷a plasmid tiÕp hîp R kh¸ng streptomycin vµ mét plasmid mang gen kh¸ng tetracyclin (tetr) t¹o nªn mét plasmid R tÝch hîp míi mang c¶ hai gen kh¸ng c¸c chÊt kh¸ng sinh lµ streptomycin vµ tetracyclin H×nh 6.23. Sù tiÕn hãa cña c¸c RTF RTF plasmid tiÕp hîp mang c¸c gen Plasmid tiÕp hîp R mang gen kh¸ng kh¸ng kh¸ng sinh. Plasmid tiÕp hîp R mang gen kh¸ng streptomycin streptomycin vµ tetracyclin 211
§inh §oµn Long Shigella vµ Salmonella. HiÖn nay, mét sè bÖnh do vi khuÈn g©y nªn, bao gåm kiÕt lþ, lao vµ lËu, trë nªn khã ®iÒu trÞ do hiÖn t−îng kh¸ng kh¸ng sinh cña vi khuÈn. Trong mét sè tr−êng hîp, c¸c vi khuÈn g©y bÖnh cã thÓ cïng lóc kh¸ng l¹i nhiÒu chÊt kh¸ng sinh kh¸c nhau vµ trë thµnh c¸c t¸c nh©n g©y bÖnh cùc kú nguy hiÓm. H×nh 6.23 minh häa c¬ chÕ truyÒn tÝnh kh¸ng kh¸ng sinh phæ biÕn ë vi khuÈn qua c¸c TE n»m trong plasmid. Sù ph¸t triÓn vµ lan trµn kh¶ n¨ng kh¸ng nhiÒu chÊt kh¸ng sinh trong c¸c quÇn thÓ vi khuÈn cµng ®−îc thóc ®Èy do sù cã mÆt cña plasmid tiÕp hîp R th−êng mang c¸c gen kh¸ng kh¸ng sinh. C¸c plasmid lo¹i nµy cã hai thµnh phÇn. Mét thµnh phÇn gäi lµ yÕu tè truyÒn tÝnh kh¸ng RTF (resistance transfer factor) chøa c¸c gen cÇn thiÕt cho qu¸ tr×nh tiÕp hîp gi÷a c¸c tÕ bµo vi khuÈn. Thµnh phÇn thø hai lµ yÕu tè x¸c ®Þnh tÝnh kh¸ng R chøa c¸c gen kh¸ng kh¸ng sinh. Trong quÇn thÓ vi khuÈn, sù ph¸t t¸n c¸c plasmid R diÔn ra víi tèc ®é nhanh, thËm chÝ chóng ®−îc truyÒn tõ loµi nµy sang loµi kh¸c, nh− gi÷a vi khuÈn coccus vµ vi khuÈn bacillus. V× vËy, nÕu nh− tÝnh kh¸ng kh¸ng sinh ®· xuÊt hiÖn ë mét vi khuÈn nµo ®ã, th× nã cã thÓ lan trµn ra toµn giíi vi khuÈn. 6.8.4. C¸c yÕu tè di truyÒn vËn ®éng ë ThÓ giao tö ♀ ThÓ giao tö ♂ eukaryote C CI Ds RÊt nhiÒu lo¹i TE còng ®· ®−îc t×m C C¸c nhiÔm s¾c thÓ cña thÊy ë sinh vËt nh©n thËt. Nh÷ng yÕu tè bè (h¹t phÊn) vµ mÑ nµy kh¸c nhau vÒ kÝch th−íc, cÊu tróc vµ Thô phÊn ®Æc tÝnh vËn ®éng. Mét sè lo¹i phæ biÕn C (nh©n sinh d−ìng 2n kh¾p hÖ gen, mét sè chØ hiÕm gÆp. Trong C phÇn nµy, chóng ta sÏ t×m hiÓu mét sè CI Ds cña no·n) kÕt hîp trong lo¹i TE kiÓu c¾t - d¸n. C¸c yÕu tè TE nµy cã tr×nh tù lÆp l¹i ng−îc chiÒu ë hai ®Çu VÞ trÝ nhiÔm qu¸ tr×nh thô phÊn h×nh vµ mçi lÇn xen vµo mét ph©n tö ADN, s¾c thÓ bÞ ®øt chóng t¹o ra c¸c tr×nh tù nh©n ®«i t¹i vÞ thµnh nªn tÕ bµo néi trÝ ®Ých. C¸c TE kiÓu c¾t-d¸n th−êng m· hãa cho enzym transposase xóc t¸c sù nhò tam béi. vËn ®éng cña chóng trong hÖ gen. Sù “®øt g·y” nhiÔm s¾c 6.8.4.1. C¸c yÕu tè Ac vµ Ds ë c©y ng« thÓ x¶y ra ë vÞ trÝ cña C¸c yÕu tè Ac vµ Ds ®−îc ph¸t hiÖn yÕu tè (tr×nh tù) Ds. ®Çu tiªn n¨m 1948 bëi Barbara McClintock. Qua ph©n tÝch di truyÒn, C McClintock chøng minh ®−îc ho¹t ®éng cña c¸c yÕu tè nµy lµ nguyªn nh©n g©y C nªn c¸c tÝnh tr¹ng h¹t “säc” vµ “®èm” ë ng«. Nh−ng ph¶i nhiÒu n¨m sau ®ã, c¸c CI Ds nghiªn cøu cña Nina Federoff, Joachim Messing, Peter Starlinger, Heinz §o¹n nhiÔm Nguyªn §o¹n nhiÔm s¾c thÓ Saedler, Susan Wessler vµ céng sù míi s¾c thÓ kh«ng ph©n mang gen øc chÕ h×nh lµm s¸ng tá cÊu tróc vµ c¬ chÕ ho¹t ®éng t©m bÞ mÊt ë møc ph©n tö cña chóng. thµnh s¾c tè bÞ mÊt, nªn McClintock ®· ph¸t hiÖn ra c¸c yÕu h×nh thµnh dßng tÕ bµo tè Ac vµ Ds nhê nghiªn cøu sù “®øt ®o¹n” NST. Bµ ®· dïng c¸c dÊu chuÈn di chøa s¾c tè (cã mµu). truyÒn liªn quan ®Õn mµu s¾c h¹t ng« ®Ó ph¸t hiÖn hiÖn t−îng ®øt ®o¹n nµy. Khi Dßng c¸c tÕ bµo cã mµu mét dÊu chuÈn nµo ®ã mÊt ®i, (kiÓu gen –CC) H×nh 6.24. Sù “®øt g y” nhiÔm s¾c thÓ g©y ra do sù ho¹t ®éng cña gen nh¶y Ds ë ng«. Alen C trªn vai ng¾n cña NST sè 9 t¹o ra mµu s¾c b×nh th−êng ë protein h¹t (al¬ron), nh−ng alen CI øc chÕ qu¸ tr×nh h×nh thµnh c¸c s¾c tè nh− vËy, nªn chóng trë nªn kh«ng mµu. 212
Ch−¬ng 6. §ét biÕn vµ söa ch÷a Adn McClintock cho r»ng ®o¹n NST mang gen t−¬ng øng bÞ mÊt, vµ cã hiÖn t−îng “®øt ®o¹n” x¶y ra. DÊu chuÈn bÞ mÊt mµ McClintock quan s¸t ®−îc khi ph©n tÝch lµ mµu cña líp vá h¹t thuéc phÇn néi nhò tam béi cña ng«. Trong mét d·y c¸c thÝ nghiÖm, dÊu chuÈn di truyÒn mµ McClintock ®· theo dâi lµ mét alen thuéc locus C n»m trªn vai ng¾n cña NST sè 9. Do alen CI nµy lµ mét alen tréi øc chÕ sù t¹o s¾c tè h¹t ng«, nªn mäi h¹t ng« mang alen nµy ®Òu kh«ng cã mµu. McClintock ®· tiÕn hµnh thô phÊn hoa c¸i c©y ng« cã kiÓu gen CC víi h¹t phÊn cña c©y cã kiÓu gen CI CI, ®Ó t¹o ra h¹t ng« cã phÇn néi nhò mang kiÓu gen CICC (tÕ bµo néi nhò nhËn hai alen tõ mÑ, vµ mét alen tõ bè). MÆc dï, McClintock ph¸t hiÖn thÊy phÇn lín c¸c h¹t ng« kh«ng mµu nh− mong ®îi, nh−ng mét sè h¹t cã c¸c vïng mang s¾c tè tÝm - n©u. McClinctock cho r»ng hiÖn t−îng kh¶m mµu nh− vËy lµ do alen CI bÞ mÊt ®i trong qu¸ tr×nh ph¸t triÓn néi nhò, dÉn ®Õn sù h×nh thµnh mét sè m« cã kh¶ n¨ng tæng hîp s¾c tè. KiÓu gen cña kiÓu m« nµy sÏ lµ -CC (trong ®ã dÊu “-”biÓu diÔn cho alen CI bÞ mÊt). C¬ chÕ mµ McClintock ®· dïng ®Ó gi¶i thÝch cho hiÖn t−îng mÊt ®i cña alen CI ®−îc m« t¶ trªn h×nh 6.24. Mét “vÕt ®øt” x¶y ra ë vÞ trÝ mòi tªn lµm rêi mét ®o¹n NST khái t©m ®éng cña nã vµ h×nh thµnh nªn ®o¹n NST kh«ng t©m. §o¹n NST nµy cã xu h−íng mÊt ®i trong qu¸ tr×nh ph©n bµo. V× vËy, tÊt c¶ c¸c tÕ bµo con sinh ra tõ tÕ bµo nµy sÏ mÊt ®i mét phÇn NST ban ®Çu. Do ®o¹n bÞ mÊt mang alen CI nªn kh«ng mét tÕ bµo nµo trong dßng tÕ bµo con nµy bÞ øc chÕ qu¸ tr×nh h×nh thµnh s¾c tè, v× vËy t¹o nªn hiÖn t−îng h¹t cã mµu kh¶m nh− quan s¸t thÊy trong tù nhiªn. McClintock ®ång thêi ph¸t hiÖn ra r»ng sù ®øt ®o¹n g©y nªn hiÖn t−îng h¹t cã mµu kh¶m xuÊt hiÖn ë mét vÞ trÝ nhÊt ®Þnh trªn NST sè 9. Bµ ®Æt tªn cho yÕu tè t¹o ra hiÖn t−îng ®øt ®o¹n nµy lµ Ds (viÕt t¾t cña tõ Dissociation). Tuy vËy, b¶n th©n yÕu tè Ds kh«ng thÓ g©y nªn hiÖn t−îng “®øt ®o¹n” NST, mµ nã cÇn ®−îc ho¹t hãa bëi mét yÕu tè kh¸c gäi lµ Ac (viÕt t¾t cña tõ Activator). YÕu tè Ac cã mÆt trong mét sè gièng ng«. Khi tiÕn hµnh lai gi÷a c¸c gièng nµy víi nhau, yÕu tè Ac kÕt hîp víi Ds ®Ó t¹o ®iÒu kiÖn cho sù “®øt ®o¹n” x¶y ra. HÖ thèng hai yÕu tè Ac/Ds gióp gi¶i thÝch cho hiÖn t−îng “di truyÒn kh«ng æn ®Þnh” mµ McClintock quan s¸t thÊy ë NST sè 9. C¸c thÝ nghiÖm bæ sung sau ®ã ®· chøng minh ®©y chØ lµ mét trong rÊt nhiÒu hiÖn t−îng “di truyÒn kh«ng æn ®Þnh” cã mÆt trong hÖ gen ë c©y ng«. Ngoµi ra, sau ®ã McClintock ph¸t hiÖn thÊy hiÖn t−îng “®øt ®o¹n” cßn x¶y ra ë c¸c NST kh¸c, ngoµi NST sè 9. Do nh÷ng “®øt ®o¹n” nµy còng phô thuéc vµo yÕu tè Ac, nªn bµ ®· kÕt luËn r»ng cã sù tån t¹i cña yÕu tè Ds ë c¸c vÞ trÝ kh¸c nhau trong hÖ gen. §Ó cã thÓ gi¶i thÝch cho tÊt c¶ c¸c hiÖn t−îng nµy, McClintock cho r»ng Ds cã mÆt ë nhiÒu vÞ trÝ kh¸c nhau trong hÖ gen vµ cã thÓ vËn ®éng tõ vÞ trÝ nµy s¸ng vÞ trÝ kh¸c. C¸c nghiªn cøu sau nµy ®· chøng minh gi¶ thiÕt cña McClintock lµ ®óng. C¸c yÕu tè Ac vµ Ds cïng thuéc mét hä c¸c yÕu tè di truyÒn vËn ®éng. C¸c yÕu tè nµy vÒ mÆt cÊu tróc cã liªn quan víi nhau vµ cã thÓ xen vµo nhiÒu vÞ trÝ kh¸c nhau trªn NST. Trong hÖ gen ng«, cã nhiÒu b¶n sao kh¸c nhau cña c¸c yÕu tè Ac vµ Ds. Qua ph©n tÝch di truyÒn, McClintock chøng minh nh÷ng yÕu tè nµy cã thÓ vËn ®éng trong hÖ gen. Bµ còng ph¸t hiÖn ra r»ng: khi mét yÕu tè nµy g¾n vµo trong hoÆc gÇn mét gen nµo ®ã, th× chøc n¨ng cña gen ®ã thay ®æi, thËm chÝ ®«i khi mÊt chøc n¨ng. Nãi c¸ch kh¸c, c¸c yÕu tè Ac vµ Ds cã kh¶ n¨ng g©y ra c¸c ®ét biÕn khi xen vµo mét gen nµo ®ã. §Ó nhÊn m¹nh vai trß cña c¸c yÕu tè Ac vµ Ds trong ®iÒu hßa sù biÓu hiÖn cña gen, McClintock gäi c¸c yÕu tè Ac vµ Ds lµ c¸c yÕu tè ®iÒu hßa. C¸c nghiªn cøu gi¶i tr×nh tù ADN sau nµy cho thÊy tr×nh tù yÕu tè Ac gåm 4563 bp cã hai ®Çu tr×nh tù lÆp l¹i ng−îc chiÒu gåm 11 bp (h×nh 6.25a). C¸c tr×nh tù lÆp l¹i ë hai ®Çu lµ cÇn thiÕt ®Ó qu¸ tr×nh vËn ®éng cña yÕu tè Ac cã thÓ diÔn ra. Mçi mét yÕu tè Ac cã hai vïng biªn ë hai ®Çu lµ c¸c tr×nh tù lÆp l¹i cïng chiÒu gåm 8 bp. Bëi v× c¸c tr×nh tù lÆp 213
§inh §oµn Long l¹i nµy ®−îc t¹o ra khi yÕu tè Ac xen vµo ph©n a) YÕu tè Ac - cã tr×nh tù ®Çy ®ñ 4563 bp tö ADN, nªn b¶n th©n chóng lµ s¶n phÈm nh©n ®«i tr×nh tù t¹i vÞ trÝ ®Ých, chø kh«ng ph¶i tr×nh tù lÆp l¹i cã trong hÖ gen. Kh«ng gièng Ac, c¸c yÕu tè Ds cã tÝnh ®a §o¹n tr×nh tù hai ®Çu lÆp l¹i d¹ng vÒ mÆt cÊu tróc. Chóng còng mang c¸c ng−îc chiÒu 11 bp tr×nh tù lÆp l¹i ng−îc chiÒu ë hai ®Çu gièng b) YÕu tè Ds - mÊt mét phÇn tr×nh tù bªn trong hÖt nh− c¸c yÕu tè Ac, chøng tá hai yÕu tè di truyÒn vËn ®éng nµy thuéc vÒ cïng mét hä, nh−ng tr×nh tù bªn trong cña chóng th× kh¸c nhau. Mét sè yÕu tè Ds d−êng nh− cã nguån gèc tõ c¸c yÕu tè Ac, ®−îc h×nh thµnh do sù c) YÕu tè Ds dÞ biÖt - cã tr×nh tù bªn trong kh«ng liªn quan ®Õn yÕu tè Ac mÊt ®i mét phÇn tr×nh tù bªn trong (h×nh 6.25b). Sù mÊt ®i mét phÇn nh÷ng tr×nh tù nµy cã thÓ lµ do sù sao chÐp ADN kh«ng toµn vÑn hoÆc do chÝnh qu¸ tr×nh vËn ®éng trong §o¹n tr×nh tù kh«ng t−¬ng ®ång hÖ gen cña chóng g©y ra. Tuy vËy, mét sè lo¹i d) YÕu tè Ds kÐp - Mét yÕu tè Ds nµy lång vµo yÕu tè Ds kh¸c kh«ng thÊy cã tr×nh tù Ac bªn gi÷a mét yÕu tè Ds kh¸c trong chuçi (h×nh 6.25c). Nh÷ng thµnh viªn kh¸c th−êng nh− vËy cña hä Ac/Ds ®−îc gäi §o¹n Ds cµi lµ c¸c yÕu tè Ds dÞ biÖt. Mét nhãm yÕu tè Ds thø ba cã ®Æc ®iÓm ®Æc tr−ng lµ gåm c¸c tr×nh H×nh 6.25. S¬ ®å cÊu tróc hä c¸c yÕu tè di tù cña c¸c yÕu tè Ds kh¸c nhau n»m gèi lªn truyÒn vËn ®éng Ac/Ds ë ng«. nhau (h×nh 6.25d), trong ®ã mét yÕu tè Ds n»m xen vµo gi÷a mét yÕu tè Ds kh¸c víi chiÒu tr×nh tù ®¶o ng−îc. Nh÷ng yÕu tè Ds lo¹i nµy cßn ®−îc gäi lµ nh÷ng yÕu tè Ds kÐp, lµ nh÷ng yÕu tè lµm “®øt ®o¹n” NST mµ McClintock ®· quan s¸t thÊy trong c¸c thÝ nghiÖm cña bµ. C¸c ho¹t ®éng cña c¸c yÕu tè Ac/Ds (gåm c¸c ho¹t ®éng ®øt khái NST vµ vËn ®éng trong hÖ gen; còng nh− c¸c hËu qu¶ di truyÒn cã liªn quan gåm sù ®øt ®o¹n NST vµ ®ét biÕn) ®−îc xóc t¸c bëi transposase do tr×nh tù gen trong yÕu tè Ac m· hãa. Protein transposase sau khi ®−îc h×nh thµnh cã sù t−¬ng t¸c râ rÖt víi c¸c tr×nh tù ë hai ®Çu hoÆc gÇn hai ®Çu cña c¸c yÕu tè Ac vµ Ds, thóc ®Èy qu¸ tr×nh vËn ®éng cña c¸c yÕu tè nµy. Sù ®ét biÕn hoÆc mÊt nucleotide trong tr×nh tù m· hãa transposase lµm mÊt chøc n¨ng xóc t¸c cña enzym nµy. NÕu c¸c yÕu tè Ds còng cã nh÷ng th−¬ng tæn t−¬ng tù th× chóng kh«ng thÓ tù ho¹t hãa. Nh−ng, nÕu trong hÖ gen tån t¹i tr×nh tù m· hãa transposase cña yÕu tè Ac, th× chóng l¹i ®−îc ho¹t hãa. Enzym transposase cã thÓ x©m nhËp vµo nh©n tÕ bµo, g¾n vµo yÕu tè Ds vµ ho¹t hãa sù vËn ®éng cña yÕu tè nµy. V× vËy transposase do yÕu tè Ac m· hãa ®−îc gäi lµ protein t¸c ®éng xa (trans-acting protein). §Õn nay, c¸c TE cã liªn quan ®Õn Ac/Ds ®· ®−îc t×m thÊy ë nhiÒu loµi kh¸c, kÓ c¶ ë ®éng vËt. Trong ®ã, TE ë ®éng vËt nh− vËy ®−îc nghiªn cøu kü nhÊt lµ hä hobo ë ruåi Drosophila. 6.8.4.2. YÕu tè P vµ hiÖn t−îng con lai v« sinh ë c¸c loµi ruåi Drosophila Mét sè nghiªn cøu tËp trung ®· ®−îc tiÕn hµnh trªn c¸c yÕu tè di truyÒn vËn ®éng P t×m thÊy ë c¸c loµi ruåi Drosophila. N¨m 1977, Margaret, James Kidwell vµ John Sved ph¸t hiÖn thÊy viÖc lai gi÷a c¸c dßng ruåi giÊm t¹o ra mét nhãm c¸c con lai cã c¸c tÝnh tr¹ng dÞ biÖt, nh− tÇn sè ®ét biÕn cao, cã hiÖn t−îng ®øt ®o¹n NST, vµ ®Æc tÝnh v« sinh. 214
Ch−¬ng 6. §ét biÕn vµ söa ch÷a Adn Kidwell vµ céng sù sau ®ã nhËn thÊy cã thÓ ph©n Con c¸i (♀, mÑ) lo¹i c¸c dßng nµy thµnh hai nhãm dùa trªn kh¶ n¨ng t¹o ra con lai v« sinh cña chóng. Hai nhãm MP nµy ®−îc ký hiÖu lµ M vµ P. ChØ cã phÐp lai gi÷a con ®ùc dßng P víi con c¸i dßng M míi t¹o ra c¸c Con M Sinh s¶n Sinh s¶n con lai v« sinh. ViÖc tiÕn hµnh lai gi÷a c¸c c¸ thÓ P b×nh b×nh th−êng trong cïng nhãm (hoÆc M hoÆc P) ®Òu t¹o ra con ®ùc lai h÷u thô b×nh th−êng. KiÓu h×nh con lai tõ c¸c (♂,bè) th−êng Sinh s¶n phÐp lai gi÷a hai nhãm M vµ P ®−îc nªu trªn b×nh th−êng h×nh 6.26. V« sinh Kidwell vµ céng sù cho r»ng, NST cña dßng P ®· mang c¸c yÕu tè di truyÒn ®−îc ho¹t hãa khi tinh trïng cña nã x©m nhËp vµo trøng H×nh 6.26. KiÓu h×nh cña c¸c con lai tõ phÐp cña dßng M; sau ®ã, nh÷ng yÕu tè ®−îc ho¹t hãa lai gi÷a c¸c dßng P vµ M ë ruåi Drosophila. g©y nªn ®ét biÕn vµ ®øt ®o¹n NST. TiÕp nèi nghiªn cøu cña Kidwell, n¨m 1979 Engels (mét a) YÕu tè P cã tr×nh tù ®Çy ®ñ nghiªn cøu sinh t¹i §¹i häc Winconsin) ®· ph¸t 2907 bp hiÖn thÊy mét ®ét biÕn ®Æc biÖt cã kh¶ n¨ng ®ét biÕn phôc håi cao. HiÖn t−îng thiÕu æn ®Þnh di Gen m· hãa transposase truyÒn nµy gîi ý Engels vÒ nh÷ng ®ét biÕn g©y ra bëi yÕu tè IS ë E. coli, ®ång thêi cho thÊy nh÷ng ®ét biÕn nµy nhiÒu kh¶ n¨ng liªn quan ®Õn mét §o¹n tr×nh tù hai ®Çu lÆp l¹i yÕu tè di truyÒn vËn ®éng nµo ®ã. Nh÷ng nghiªn ng−îc chiÒu 31 bp cøu sau nµy (vµo nh÷ng n¨m 1980) ®· chøng minh ®óng lµ cã sù tån t¹i cña nhiÒu b¶n sao c¸c b) C¸c yÕu tè P mÊt mét phÇn tr×nh tù yÕu tè TE trong hÖ gen c¸c dßng P; nh−ng, kh«ng cã ë c¸c dßng M. V× vËy, c¸c TE nµy ®−îc gäi lµ c¸c yÕu tè P. ViÖc ph©n tÝch tr×nh tù ADN cho thÊy c¸c H×nh 6.27. CÊu tróc vÒ h−íng vµ kÝch th−íc yÕu tè P rÊt kh¸c nhau vÒ kÝch th−íc. C¸c yÕu tè tr×nh tù ADN cña c¸c yÕu tè P ë ruåi giÊm. P cã kÝch th−íc lín nhÊt dµi 2907 bp, gåm c¸c tr×nh tù lÆp l¹i ë hai ®Çu dµi 31 bp. C¸c yÕu tè P hoµn chØnh mang mét gen m· hãa cho transposase. Khi transposase cña yÕu tè P g¾n vµo ®o¹n ®u«i cña mét yÕu tè P hoµn chØnh (cã tr×nh tù ®Çy ®ñ), nã cã kh¶ n¨ng “vËn chuyÓn” yÕu tè P nµy ®Õn mét vÞ trÝ kh¸c trong hÖ gen. C¸c yÕu tè P kh«ng hoµn chØnh (h×nh 6.27) thiÕu kh¶ n¨ng tæng hîp transposase do mÊt ®i mét sè tr×nh tù bªn trong vïng m· hãa enzym nµy, nh−ng chóng vÉn cã c¸c vïng tËn cïng vµ gÇn tËn cïng lµ vÞ trÝ g¾n cña transposase. KÕt qu¶ lµ, nh÷ng yÕu tè P kh«ng hoµn chØnh nµy vÉn cã kh¶ n¨ng vËn ®éng trong hÖ gen, nÕu nh− ë ®©u ®ã trong hÖ gen cã tr×nh tù m· hãa cho transposase. C¸c nghiªn cøu ë c¸c quÇn thÓ ruåi Drosophila kh¸c trong tù nhiªn sau nµy ®· chøng minh cã nhiÒu yÕu tè P kh¸c nhau tån t¹i trong hÖ gen víi sè l−îng biÕn ®éng. Mét sè loµi ruåi cã sè b¶n sao cña yÕu tè P lªn ®Õn 50, trong khi ®ã mét sè loµi kh¸c chØ cã mét vµi b¶n sao. Tuy vËy, mét ®Æc ®iÓm ®¸ng ng¹c nhiªn lµ tÊt c¶ c¸c dßng thu ®−îc tr−íc n¨m 1950 kh«ng cã bÊt cø mét yÕu tè P nµo. Trªn c¬ së ®ã, Marganet Kidwell ®· ®−a ra gi¶ thiÕt lµ c¸c yÕu tè P ®· “x©m nhËp” vµo c¸c loµi ruåi Drosophila chØ trong thêi gian gÇn ®©y. §¸ng chó ý h¬n n÷a lµ hÖ gen cña c¸c loµi ruåi cã quan hÖ gÇn gòi nhÊt víi ruåi dÊm l¹i kh«ng cã yÕu tè P, trong khi nh÷ng loµi cã kho¶ng c¸ch xa h¬n l¹i cã yÕu tè nµy. §Õn nay chóng ta ch−a biÕt râ b»ng c¬ chÕ nµo yÕu tè P ®· x©m nhËp vµo c¸c loµi Drosophila, nh−ng cã mét gi¶ thiÕt cho 215
§inh §oµn Long r»ng nh÷ng yÕu tè nµy ®−îc virut vËn chuyÓn vµo hÖ gen cña c¸c loµi ruåi Drosophila. Qu¸ tr×nh nµy cã thÓ gièng víi viÖc phag¬ “t¶i n¹p” c¸c yÕu tè IS vµo hÖ gen E. coli. C¸c quÇn thÓ Drosophila chøa yÕu tè P ®· cã sù ph¸t triÓn c¬ chÕ ®iÒu hßa vËn ®éng cña nh÷ng yÕu tè nµy. ë mét sè dßng, sù ®iÒu hßa nµy phô thuéc vµo kiÓu tÕ bµo (cytotype), tøc lµ ®Æc ®iÓm tÕ bµo ®−îc truyÒn tõ tÕ bµo mÑ sang tÕ bµo con th«ng qua tÕ bµo chÊt cña trøng. KiÓu tÕ bµo häc P øc chÕ sù vËn ®éng cña yÕu tè P, cßn kiÓu tÕ bµo M t¹o ®iÒu kiÖn cho yÕu tè P vËn ®éng. KiÓu tÕ bµo P lµ ®Æc tÝnh cña tÕ bµo mang gen m· hãa yÕu tè P trªn NST, trong khi ®ã kiÓu tÕ bµo M lµ ®Æc tÝnh cña tÕ bµo kh«ng mang gen m· hãa yÕu tè P. Khi yÕu tè P ®−îc kÕt hîp víi kiÓu tÕ bµo M th«ng qua mét phÐp lai phï hîp th× sù vËn ®éng cña yÕu tè P ®−îc thóc ®Èy. MÆc dï c¬ chÕ ®iÒu hßa sù vËn ®éng cña yÕu tè P bëi kiÓu tÕ bµo ®· ®−îc mét sè nhãm quan t©m nghiªn cøu, nh−ng ®Õn nay vÉn ch−a s¸ng tá. Ph−¬ng thøc di truyÒn theo dßng mÑ cña kiÓu tÕ bµo ®−îc nhËn thÊy trong c¸c phÐp lai thuËn nghÞch gi÷a c¸c dßng P vµ M (h×nh 6.28). Cã hai phÐp lai: 1) [KiÓu tÕ bµo P , ♀] x [KiÓu tÕ bµo M, ♂], vµ 2) [KiÓu tÕ bµo P , ♂] x [KiÓu tÕ bµo M, ♀]. ThÕ hÖ con sinh ra tõ hai phÐp lai ®Òu mang gen m· hãa yÕu tè P vµ gièng nhau vÒ hÖ gen nh©n. Nh−ng, chØ c¸c con lai tõ phÐp lai 2 míi x¶y ra hiÖn t−îng “gen nh¶y”. §iÒu ®ã cho thÊy, ®Æc tÝnh cho phÐp yÕu tè P vËn ®éng hay kh«ng lµ ®Æc tÝnh ®−îc di truyÒn theo dßng mÑ (do tÕ bµo chÊt quy ®Þnh). Trong phÐp lai 1, tÕ bµo mÑ truyÒn kiÓu tÕ bµo P cho con vµ sù vËn ®éng cña yÕu tè P bÞ øc chÕ. Trong phÐp lai 2, tÕ bµo mÑ truyÒn kiÓu tÕ bµo M cho con, cho phÐp yÕu tè P vËn ®éng. Cã mét ®iÒu ng¹c nhiªn lµ kÓ c¶ khi hÖ gen bÞ biÕn ®æi ®¸ng kÓ do sù vËn ®éng ë møc ®é lín cña c¸c yÕu tè P, th× phÐp lai [KiÓu tÕ bµo P , ♂] x [KiÓu tÕ bµo M, ♀] vÉn cã thÓ t¹o ra c¸c c¸ thÓ con sèng b×nh C¸c phÐp lai thuËn, nghÞch gi÷a c¸c dßng P vµ M th−êng. C¸c nghiªn cøu cña Donald Rio, Frank Laski vµ PhÐp lai 1 PhÐp lai 2 Gerald Rubin cho thÊy C¸i §ùc C¸i §ùc nh÷ng c¸c c¸ thÓ con nµy kháe m¹nh bëi c¸c yÕu tè P Trøng Tinh trïng Trøng Tinh trïng chØ vËn ®éng trong c¸c dßng tÕ bµo sinh dôc (qu¸ tr×nh ph¸t sinh giao tö). Cßn ë c¸c tÕ bµo soma, sù vËn ®éng C¸c giao tö mang cña yÕu tè P vèn cã kh¶ nhiÔm s¾c thÓ cã hoÆc n¨ng g©y ra nh÷ng rèi lo¹n kh«ng cã c¸c yÕu tè P lín chØ hiÕm x¶y ra, do transposase P kh«ng ®−îc tæng hîp trong nh÷ng tÕ bµo YÕu tè P bÞ øc chÕ YÕu tè P ®−îc ho¹t hãa nµy. Sù tæng hîp protein trong kiÓu tÕ bµo P trong kiÓu tÕ bµo M nµy bÞ øc chÕ ë b−íc hoµn thiÖn mARN. Cô thÓ, mét ®o¹n intron ®−îc gi÷ l¹i HiÖn t−îng v« sinh trong ph©n tö mARN m· xuÊt hiÖn ë con lai hãa transposase, t¹o nªn sinh ra tõ phÐp lai 2 mét bé ba m· kÕt thóc sím. HËu qu¶ lµ tÕ bµo soma Con lai sinh s¶n Con lai v« sinh kh«ng tæng hîp ®−îc b×nh th−êng transposase, mµ thay vµo ®ã lµ mét ph©n tö protein H×nh 6.28. HiÖn t−îng con lai v« sinh do ho¹t ®éng cña yÕu tè P ë Drosophila. KiÓu tÕ bµo ®−îc di truyÒn theo dßng mÑ. Theo ®ã, kiÓu tÕ bµo P øc chÕ ho¹t ®éng cña c¸c yÕu tè P, trong khi kiÓu tÕ bµo M ho¹t hãa chóng. HiÖn t−îng v« sinh chØ xuÊt hiÖn ë con lai cã kiÓu tÕ bµo M. 216
Ch−¬ng 6. §ét biÕn vµ söa ch÷a Adn ng¾n kh«ng cã ho¹t tÝnh xóc t¸c yÕu tè P vËn ®éng. KÕt qu¶ lµ, yÕu tè P kh«ng vËn ®éng vµ c¸c tÕ bµo soma tr¸nh ®−îc nh÷ng sai háng di truyÒn do sù vËn ®éng cña yÕu tè P. 6.8.4.3. YÕu tè di truyÒn vËn ®éng cã tÝnh cæ x−a vµ phæ biÕn mariner Hai loµi ruåi cã quan hÖ gÇn gòi nhÊt víi ruåi giÊm (Drosophila melanogaster) lµ D. simulans vµ D. mauritiana, cã mét TE kÝch th−íc nhá lµ mariner (dµi 1286 bp víi tr×nh tù lÆp l¹i ng−îc chiÒu ë hai ®Çu gåm 28 bp). MÆc dï yÕu tè mariner kh«ng thÊy cã ë D. melanogaster, nh−ng nh÷ng yÕu tè t−¬ng tù l¹i thÊy cã ë nhiÒu loµi, nh− giun trßn, nÊm, thËm trÝ c¶ ë ng−êi. Hugh Robertson còng ph¸t hiÖn thÊy nhiÒu TE kiÓu mariner cã mÆt ë c¸c bé c«n trïng kh¸c nhau. Mét ®iÓm ®¸ng l−u ý lµ ®«i khi c¸c yÕu tè mariner ë c¸c loµi c¸ch xa nhau l¹i gièng nhau h¬n gi÷a c¸c loµi cã quan hÖ gÇn gòi. VÝ dô nh− yÕu tè mariner ë loµi ruåi qu¶ §Þa trung h¶i rÊt gièng víi ë loµi ong mËt, dï hai loµi nµy ®· t¸ch ly tiÕn hãa khái nhau tõ hµng tr¨m triÖu n¨m tr−íc. ChØ cã mét gi¶ thiÕt hîp lý lµ c¸c yÕu tè mariner ®· x©m nhËp vµo hai loµi c«n trïng nµy trong thêi gian gÇn ®©y h¬n tõ mét vÐct¬ nµo ®ã, cã thÓ tõ mét loµi c«n trïng kh¸c hoÆc qua sù l©y nhiÔm cña c¸c virut c«n trïng cã phæ vËt chñ réng. Trong qu¸ tr×nh l©y nhiÔm, hÖ gen virut cã thÓ tiÕp nhËn vµ truyÒn yÕu tè TE. §Õn nay, b»ng kü thuËt gi¶i tr×nh tù ADN ng−êi ta ®· x¸c ®Þnh ®−îc c¸c yÕu tè mariner th−êng cã kÝch th−íc kh¸ lín (kho¶ng 1,6 - 1,7 kb) víi hai tr×nh tù lÆp l¹i ng−îc chiÒu ë hai ®Çu. Tr×nh tù lÆp l¹i ë hai ®Çu ®iÓn h×nh cña chóng cã chiÒu dµi tõ 54 ®Õn 234 bp. YÕu tè mariner ®−îc nghiªn cøu kü nhÊt ®Õn nay lµ Tc1, t×m thÊy ë giun trßn (Caenorhabditis elegans). C¸c TE gièng Tc1 cßn thÊy cã ë ®éng vËt cã x−¬ng sèng. Nh− vËy cã thÓ nãi c¸c TE lo¹i Tc1 vµ mariner thuéc mét hä TE cã tÝnh cæ x−a vµ phæ biÕn cao. 6.8.5. C¸c yÕu tè di truyÒn vËn ®éng kiÓu phiªn m· ng−îc Ngoµi c¸c yÕu tè TE nh− Ac, P vµ mariner, hÖ gen sinh vËt nh©n thËt cßn cã c¸c yÕu tè TE mµ sù vËn ®éng cña chóng trong hÖ gen phô thuéc vµo sù phiªn m· ng−îc ARN → ADN. V× vËy, c¸c yÕu tè TE nµy ®−îc gäi lµ c¸c TE kiÓu phiªn m· ng−îc. Cã hai nhãm retrotransposon chñ yÕu: c¸c TE kiÓu retrovirut vµ retrosposon. C¸c TE thuéc nhãm thø nhÊt gièng víi NST cña mét nhãm retrovirut, cßn c¸c TE thuéc nhãm thø hai cã cÊu tróc gièng víi ph©n tö mARN cã ®Çu 3’-poly(A). 6.8.5.1. YÕu tè TE kiÓu retrovirut C¸c yÕu tè di truyÒn vËn ®éng (TE) kiÓu retrovirut ®−îc t×m thÊy ë nhiÒu sinh vËt kh¸c nhau, gåm c¶ ®éng vËt, thùc vËt vµ nÊm men. MÆc dï, chóng cã kÝch th−íc vµ tr×nh tù c¸c nucleotide kh¸c nhau, nh−ng tÊt c¶ nh÷ng TE nµy ®Òu cã ®Æc ®iÓm chung lµ: cã mét vïng m· hãa trung t©m ®−îc giíi h¹n bëi hai vïng biªn gäi lµ c¸c tr×nh tù lÆp l¹i dµi ë ®Çu tËn cïng - LTR (long terminal repeats), cã tr×nh tù gièng nhau cïng chiÒu. C¸c LTR ®iÓn h×nh th−êng gåm vµi tr¨m bp. Víi mçi lo¹i LTR, nã l¹i ®−îc giíi h¹n bëi c¸c tr×nh tù ë hai ®Çu lÆp l¹i ng−îc chiÒu (gièng nh− c¸c transposon kiÓu IS). Do cã cÊu t¹o ®Æc tr−ng víi cÊu tróc LTR, nh÷ng TE kiÓu retrovirut ®−îc gäi lµ c¸c yÕu tè di truyÒn vËn ®éng LTR. Vïng m· hãa trung t©m cña TE kiÓu retrovirut chøa mét sè Ýt gen, th−êng lµ hai gen. Nh÷ng gen nµy gièng víi gen gag vµ pol t×m thÊy ë retrovirut (xem thªm ch−¬ng 3); trong ®ã, gen gag m· hãa cho protein vá virut, cßn gen pol m· hãa cho enzym reverse transcriptase (cã thÓ c¶ integrase). C¸c retrovirut th−êng cã mét gen thø ba lµ env m· hãa cho mét protein còng lµ thµnh phÇn bao ngoµi virut. §èi víi c¸c TE kiÓu retrovirut, c¸c s¶n phÈm cña gen gag vµ pol gi÷ vai trß quan träng trong qu¸ tr×nh vËn ®éng cña chóng trong hÖ gen. 217
§inh §oµn Long Mét trong nh÷ng TE kiÓu retrovirut a) ~ 5900 bp δ ®−îc nghiªn cøu kü nhÊt ®Õn nay lµ Ty1 ë δ TyB = pol ~340 nÊm men S. cerevisae (h×nh 6.29a). YÕu tè ~340 TyA = gag bp bp nµy cã chiÒu dµi 5,9 kbp; cÊu tróc LTR cña LTR chóng cã chiÒu dµi kho¶ng 340 bp. Mçi lÇn LTR yÕu tè nµy xen vµo tr×nh tù ®Ých, nã t¹o ra hai vïng biªn lËp l¹i cïng chiÒu gåm 5 bp. b) PhÇn lín c¸c chñng nÊm men chøa kho¶ng 35 b¶n sao cña yÕu tè Ty1; ®«i khi, chóng chøa c¸c cÊu tróc LTR n»m t¸ch khái c¸c yÕu tè Ty1. C¸c cÊu tróc LTR riªng lÎ nh− vËy (®«i khi cßn gäi lµ c¸c tr×nh tù delta - δ) râ rµng ®−îc h×nh thµnh do qu¸ tr×nh t¸i tæ δ δ hîp gi÷a c¸c LTR cña c¸c yÕu tè Ty1 hoµn chØnh (h×nh 6.29b). Qu¸ tr×nh t¸i tæ hîp lµm cho vïng m· hãa vµ mét phÇn cña cÊu tróc LTR h×nh thµnh ph©n tö vßng khÐp δ δ ®¬n lÎ kÝn. Khi ph©n tö ADN vßng nµy t¸ch khái NST, phÇn cßn l¹i cña LTR sÏ hßa hîp víi c) Protein Reverse cÊu tróc transcriptase phÇn NST cßn l¹i, t¹o nªn cÊu tróc δ riªng lÎ. PhÇn tö ADN vßng bÞ mÊt ®i sau khi tÕ bµo ph©n chia. C¸c yÕu tè Ty1 chØ cã hai gen, TyA vµ TyB, lµ c¸c gen t−¬ng øng gièng víi c¸c gen Gen TyA Gen TyB δδ gag vµ pol ë retrovirut. C¸c nghiªn cøu hãa sinh cho thÊy s¶n phÈm cña hai gen nµy Ty1 ®−îc phiªn m· còng cã thÓ gióp h×nh thµnh h¹t virut trong tÕ bµo chÊt cña nÊm men. Sù vËn ®éng cña thµnh ARN. yÕu tè Ty1 liªn quan ®Õn qu¸ tr×nh phiªn Ty1 ARN m· ng−îc ARN (h×nh 6.29c). Sau khi ARN ®−îc tæng hîp tõ gen Ty1, enzym reverse transcriptase do gen TyB m· hãa sÏ sö ARN ®−îc phiªn m· ng−îc thµnh cADN bëi dông ph©n tö ARN lµm sîi khu«n ®Ó tæng hîp nªn ph©n tö ADN sîi kÐp bæ trî t−¬ng enzym do TyB m· hãa. øng (cã thÓ tån t¹i trong d¹ng mét h¹t Ty1 cADN virut). Sau ®ã ph©n tö ADN sîi kÐp võa tæng hîp ®−îc vËn chuyÓn vµo trong nh©n Ty1 cADN ®−îc cµi vµo vµ xen vµo mét vÞ trÝ nµo ®ã trong hÖ gen, nhiÔm s¾c thÓ, t¹o nªn mét b¶n sao míi cña Ty1. t¹o nªn mét yÕu tè Ty1 míi. C¸c TE kiÓu retrovirut còng ®−îc t×m H×nh 6.29. CÊu tróc di truyÒn vµ c¬ chÕ ho¹t ®éng thÊy ë ruåi giÊm. Mét trong nh÷ng yÕu tè cña yÕu tè Ty1 ë nÊm men (xem m« t¶ trong tµi liÖu). nh− vËy ®−îc ph¸t hiÖn ®Çu tiÒn lµ copia. Së dÜ gäi tªn nh− vËy, bëi yÕu tè nµy cã kh¶ n¨ng t¹o ra mét sè lín b¶n sao (copy) cña ph©n tö ARN. C¸c yÕu tè copia cã cÊu t¹o gièng víi c¸c yÕu tè Ty1 ë nÊm men. ë ruåi giÊm, cßn cã mét TE kiÓu retrovirut kh¸c gäi lµ yÕu tè gypsy cã kÝch th−íc lín h¬n copia do chóng chøa thªm gen gièng víi env ë retrovirut (gäi lµ gen gypsy-env). C¶ hai yÕu tè copia vµ gypsy ®Òu cã kh¶ n¨ng h×nh thµnh h¹t virut trong c¸c tÕ bµo ruåi giÊm; tuy vËy, chØ cã c¸c h¹t virut h×nh thµnh tõ ARN gypsy míi cã kh¶ n¨ng v−ît qua mµng tÕ bµo chñ (cã thÓ lµ do chóng cã chøa s¶n phÈm cña gen gypsy-env). YÕu tè gypsy v× vËy lµ mét virut thùc sù. Cßn cã nhiÒu hä TE kiÓu retrovirut kh¸c ®−îc t×m thÊy ë ruåi giÊm, nh−ng c¬ chÕ vËn ®éng cña chóng ®Õn nay ch−a biÕt ®Çy ®ñ. 218
Ch−¬ng 6. §ét biÕn vµ söa ch÷a Adn 6.8.5.2. C¸c retrosposon C¸c retrosposon lµ c¸c TE kiÓu retrovirut ph©n bè réng r·i vµ ®a d¹ng, nh−ng kh«ng cã cÊu tróc LTR. Mét sè vÝ dô thuéc nhãm nµy cã thÓ kÓ ®Õn lµ c¸c yÕu tè F, G vµ I t×m thÊy ë ruåi giÊm vµ mét sè yÕu tè kh¸c t×m thÊy ë ®éng vËt cã vó. Nh÷ng yÕu tè nµy vËn ®éng trong hÖ gen qua mét ph©n tö ARN ®−îc phiªn m· ng−îc thµnh ADN, cã thÓ do ho¹t ®éng cña c¸c protein do chÝnh TE m· hãa. MÆc dï c¸c retrosposon còng t¹o ra tr×nh tù lÆp l¹i t¹i vÞ trÝ trªn ph©n tö ADN mµ nã xen vµo, nh−ng b¶n th©n chóng kh«ng cã c¸c tr×nh tù lÆp l¹i ng−îc chiÒu hoÆc cïng chiÒu ë hai ®Çu tr×nh tù cña b¶n th©n chóng. Thay vµo ®ã, chóng cã ®Æc ®iÓm ®Æc tr−ng lµ cã tr×nh tù poly(A = T) ë mét ®Çu. Tr×nh tù nµy lµ dÊu hiÖu cho thÊy, cã lÏ chóng lµ kÕt qu¶ cña s¶n phÈm phiªn m· ng−îc ph©n tö ARN cã ®Çu 3’- Poly(A). V× vËy, c¸c retrosposon ph¶n ¸nh nguån gèc cña chóng vèn lµ c¸c tr×nh tù phiªn m· ng−îc cña c¸c ph©n tö mARN ®· tr¶i qua giai ®o¹n hoµn thiÖn (xem ch−¬ng 3). ë ruåi giÊm, ng−êi ta cßn t×m thÊy mét nhãm retrosposon ®Æc biÖt t¹i c¸c ®Çu mót NST cã kh¶ n¨ng kÐo dµi phÇn ®Çu mót nµy sau mçi lÇn nã bÞ ng¾n do sù sao chÐp ADN. Nhí r»ng, víi ph©n tö ADN sîi kÐp m¹ch th¼ng, sau mçi lÇn sao chÐp, ph©n tö ADN l¹i ng¾n ®i mét sè cÆp nucleotide. HiÖn t−îng ph©n tö ADN bÞ ng¾n l¹i lµ do enzym ADN polymerase lu«n ®ßi hái cã s½n mét ®o¹n måi cã ®Çu 3’-OH tù do. Th«ng th−êng ®o¹n måi nµy cã b¶n chÊt lµ ARN vµ bÞ lo¹i bá sau qu¸ tr×nh sao chÐp ADN (®Ó l¹i mét vïng ®Çu NST lµ m¹ch ®¬n). Trong lÇn sao chÐp ADN tiÕp theo, khi sîi ng¾n h¬n (míi ®−îc tæng hîp) ®−îc sö dông lµm khu«n, nã sÏ t¹o nªn mét ph©n tö ADN míi ng¾n h¬n ph©n tö ADN gèc. Nh− vËy, sau mçi lÇn sao chÐp ADN, ph©n tö ADN (NST) ngµy cµng trë nªn ng¾n h¬n ë hai phÇn ®Çu mót. §Ó kh¾c phôc hiÖn t−îng mÊt ®o¹n ®Çu mót NST nh− vËy, ë ruåi dÊm cã m«t c¬ chÕ ®Æc biÖt liªn quan ®Õn Ýt nhÊt hai lo¹i retrosposon kh¸c nhau, ®−îc gäi lµ HeT-A vµ TART (viÕt t¾t cña telomere associated retrosposon). C¸c yÕu tè nµy cã xu h−íng vËn ®éng vÒ phÝa ®Çu mót NST vµ kÐo dµi tr×nh tù ®Çu mót kho¶ng vµi kb. Cuèi cïng th× c¸c tr×nh tù do c¸c yÕu tè TE xen vµo còng sÏ bÞ mÊt ®i do sù sao chÐp ADN vèn kh«ng hoµn chØnh ë ®Çu mót. Nh−ng, mét sù vËn ®éng kh¸c cña nh÷ng yÕu tè nµy l¹i bï ®¾p phÇn tr×nh tù bÞ mÊt ®i. Nh− vËy, ë ®©y c¸c yÕu tè HeT-A vµ TART cã chøc n¨ng quan träng lµ t¸i t¹o ®Çu mót NST. 6.8.6. C¸c yÕu tè di truyÒn vËn ®éng ë ng−êi Tõ kÕt qu¶ dù ¸n gi¶i tr×nh tù hÖ gen ng−êi, −íc tÝnh cã Ýt nhÊt 44% sè tr×nh tù hÖ gen ng−êi cã xuÊt xø hoÆc cã liªn quan víi c¸c yÕu tè di truyÒn vËn ®éng, bao gåm c¸c TE kiÓu retrovirut (∼ 8%), retrosposon (∼ 33%) vµ mét sè hä TE kiÓu c¾t-d¸n (∼3%). YÕu tè di truyÒn vËn ®éng phæ biÕn nhÊt lµ L1. YÕu tè nµy thuéc mét líp c¸c tr×nh tù gäi lµ c¸c yÕu tè tr×nh tù dµi n»m d¶i r¸c trong nh©n LINE (long interspersed nuclear element). C¸c yÕu tè LINE hoµn chØnh cã kÝch th−íc kho¶ng 6 kb, chóng chøa mét promoter ®−îc nhËn biÕt bëi enzym ARN polymerase II, vµ cã hai khung ®äc më (ORF). Trong ®ã ORF1 m· hãa cho mét protein liªn kÕt víi c¸c axit nucleic, cßn ORF2 m· hãa cho mét protein cã ho¹t tÝnh endonuclease vµ reverse transcriptase. HÖ gen ng−êi chøa kho¶ng 3000 ®Õn 5000 b¶n sao yÕu tè L1 hoµn chØnh. Ngoµi ra, nã cßn chøa kho¶ng 500.000 b¶n sao c¸c yÕu tè L1 bÞ c¾t xÐn mét phÇn ë ®Çu 5’; nh÷ng yÕu tè L1 kh«ng hoµn chØnh nµy kh«ng cßn kh¶ n¨ng vËn ®éng. C¸c yÕu tè L1 trong hÖ gen, kÓ c¶ lo¹i hoµn chØnh vµ kh«ng hoµn chØnh, th−êng cã hai vïng biªn lµ c¸c tr×nh tù lÆp l¹i cïng chiÒu. C¸c yÕu tè L1 lµ c¸c yÕu tè retrosposon thùc sù. Sù vËn ®éng cña chóng trong hÖ gen liªn quan ®Õn sù phiªn m· L1 thµnh ph©n tö ARN vµ phiªn m· ng−îc ph©n tö nµy thµnh tr×nh tù ADN (h×nh 6.30). C¶ hai qu¸ tr×nh ®ã ®Òu diÔn ra trong nh©n. Tuy vËy, tr−íc khi ph©n tö ARN L1 ®−îc phiªn m· ng−îc, ph©n tö nµy ®−îc vËn chuyÓn ra tÕ bµo chÊt ®Ó tiÕn hµnh dÞch m· tæng hîp c¸c chuçi polypeptide mµ nã m· hãa vµ ph©n tö protein nµy liªn kÕt 219
§inh §oµn Long víi nã khi ®−îc vËn chuyÓn trë l¹i nh©n. C¸c chuçi polypeptide ®−îc m· hãa bëi ORF2 mang mét enzym endonuclease xóc t¸c viÖc c¾t mét m¹ch ®¬n cña sîi kÐp ADN t¹i vÞ trÝ ®Ých cã thÓ g¾n vµo cña TE trªn NST. §Çu 3’ tù do cña m¹ch ADN võa bÞ c¾t ®−îc dïng lµm måi ®Ó tiÕn hµnh tæng hîp m¹ch ADN míi sö dông ph©n tö ARN lµm khu«n, vµ chuçi polypeptide ®−îc tæng hîp b»ng ORF2 cung cÊp ho¹t tÝnh reverse transcriptase cho ho¹t ®éng nµy. B»ng c¸ch ®ã, mét tr×nh tù ADN L1 ®−îc tæng hîp t¹i ®iÓm trªn NST n¬i chuçi polypeptide ORF2 ®· t¹o ra vÕt ®øt trªn sîi ®¬n. Ph©n tö ADN L1 míi ®−îc tæng hîp m¹ch ®¬n sau ®ã ®−îc “chuyÓn sang” d¹ng sîi kÐp nhê c¬ chÕ tæng hîp ADN th«ng th−êng. Ph©n ®o¹n ADN sîi kÐp míi sÏ kÕt hîp vµo NST vµ t¹o ra mét b¶n sao míi cña yÕu tè L1 trong hÖ gen. §«i khi vïng ®Çu 5’ cña ARN L1 kh«ng ®−îc phiªn m· thµnh ADN. Khi ®ã, ®o¹n cµi L1 thiÕu c¸c tr×nh tù ë ®Çu 5’, ®−îc gäi lµ yÕu tè L1 kh«ng hoµn chØnh. TÕ bµo chÊt Nh©n tÕ bµo YÕu tè L1 ADN nhiÔm s¾c thÓ YÕu tè L1 míi cµi vµo NST Ribosom Protein cña ORF1 ADN nhiÔm s¾c thÓ Protein cña ORF2 H×nh 6.30. Gi¶ thiÕt vÒ c¬ chÕ vËn ®éng cña c¸c yÕu tè L1 trong hÖ gen ng−êi. YÕu tè L1 cã kÝch th−íc kho¶ng 6 kb chøa 2 khung ®äc më (ORF1 vµ ORF2) ®−îc phiªn m· tõ cïng mét promoter (P). Chuçi polypeptide do ORF1 m· hãa liªn kÕt ngay víi L1 ARN vµ cã thÓ cã vai trß vËn chuyÓn ARN vµo nh©n tÕ bµo. Chuçi polypeptide do ORF2 m· hãa cã Ýt nhÊt hai chøc n¨ng. §ã lµ 1) ho¹t tÝnh endonuclease c¾t ADN vµ 2) ho¹t tÝnh cña enzym phiªn m· ng−îc (tæng hîp ADN tõ m¹ch khu«n ARN). KÝch th−íc cña yÕu tè L1 míi phô thuéc vµo ph¶n øng phiªn m· ng−îc kÐo dµi bao l©u däc theo m¹ch khu«n L1 mARN. NÕu sù phiªn m· ng−îc kh«ng kÐo dµi hÕt ®Çu 5’ cña ph©n tö L1 mARN th× sÏ t¹o ra c¸c ®o¹n cµi L1 cã tr×nh tù kh«ng ®Çy ®ñ. C¸c ®o¹n cµi L1 kh«ng ®Çy ®ñ th−êng kh«ng mang promoter (®o¹n P) nªn kh«ng tæng hîp ®−îc ph©n tö L1 ARN vµ mÊt kh¶ n¨ng vËn ®éng. 220
Ch−¬ng 6. §ét biÕn vµ söa ch÷a Adn Trong hÖ gen ng−êi, chØ cã mét sè Ýt yÕu tè L1 hoµn chØnh cßn vËn ®éng. Sù vËn ®éng cña chóng ®−îc t×m thÊy khi ph©n tÝch bÖnh di truyÒn ë mét sè c¸ thÓ. §Õn nay, ®· ph¸t hiÖn ®−îc 14 bÖnh di truyÒn do ®ét biÕn gen liªn quan ®Õn ho¹t ®éng vËn ®éng cña yÕu tè L1, nh− c¸c ®ét biÕn ë gen m· hãa yÕu tè VIII (g©y bÖnh m¸u lo·ng). Nh×n chung, sù vËn ®éng cña yÕu tè L1 hiÕm gÆp. Ngoµi L1, hÖ gen ng−êi cßn hai tr×nh tù LINE kh¸c n÷a lµ L2 (315.000 b¶n sao) vµ L3 (37.000 b¶n sao). Tuy vËy, kh«ng cã lo¹i nµo vËn ®éng tÝch cùc. C¸c yÕu tè tr×nh tù ng¾n n»m r¶i r¸c trong nh©n SINE lµ nhãm yÕu tè di truyÒn vËn ®éng phæ biÕn thø hai ë ng−êi. Nh÷ng yÕu tè nµy th−êng cã tr×nh tù ng¾n h¬n 400 bp vµ kh«ng m· hãa cho protein. Gièng nh− c¸c retrosposon kh¸c, chóng cã mét tr×nh tù poly(A=T) ë mét ®Çu. C¸c yÕu tè SINE vËn ®éng qua mét sù phiªn m· ng−îc mét ph©n tö ARN b¾t ®Çu tõ mét promoter n»m bªn trong tr×nh tù cña chóng. MÆc dï chi tiÕt qu¸ tr×nh vËn ®éng cña c¸c yÕu tè SINE ®Õn nay ch−a râ, nh−ng d−êng nh− enzym reverse transcriptase lµ thiÕt yÕu cho sù tæng hîp ADN tõ ARN SINE. Do vËy, c¸c yÕu tè SINE chØ vËn ®éng khi cã mÆt cña c¸c yÕu tè LINE. Víi ý nghÜa ®ã, SINE ®−îc xem lµ c¸c yÕu tè retrosposon “ký sinh” trªn c¸c yÕu tè retrosposon kh¸c. HÖ gen ng−êi chøa ba hä c¸c yÕu tè SINE, lµ hä Alu, MIR vµ Ther2/MIR3. Tuy vËy, chØ c¸c yÕu tè Alu (gäi nh− vËy, v× tÊt c¶ c¸c TE thuéc hä nµy ®Òu cã vÞ trÝ c¾t cña enzym giíi h¹n AluI) cßn ho¹t ®éng. HÖ gen ng−êi chøa h¬n 400.000 ph©n ®o¹n xuÊt ph¸t tõ c¸c yÕu tè gièng virut. PhÇn lín c¸c tr×nh tù nµy lµ c¸c tr×nh tù LTR ®éc nhÊt. MÆc dï cã h¬n 100 hä c¸c yÕu tè TE kh¸c nhau gièng virut ®· ®−îc t×m thÊy trong hÖ gen ng−êi, nh−ng chØ cã mét sè Ýt vËn tÝch cùc trong tiÕn hãa cËn ®¹i. Gièng víi c¸c yÕu tè SINE vµ LINE bÊt ho¹t, hÇu hÕt c¸c tr×nh tù nµy chØ lµ c¸c “dÊu vÕt cßn l¹i” cña c¸c yÕu tè TE vËn ®éng tÝch cùc tr−íc ®©y trong tiÕn hãa. C¸c yÕu tè TE ho¹t ®éng m¹nh kiÓu c¾t - d¸n (gièng Ac/Ds ë ng«) ®−îc xóc t¸c bëi enzym transposase do chÝnh yÕu tè ®ã m· hãa, còng cã mét tØ lÖ nhá trong hÖ gen ng−êi. Trong ®ã, cã hai yÕu tè cã quan hÖ xa víi Ac/Ds vµ mét sè yÕu tè thuéc hä Tc1/mariner ®−îc t×m thÊy. TÊt c¶ c¸c b»ng chøng thùc nghiÖm cho thÊy nh÷ng yÕu tè TE nµy ®· trë nªn “bÊt ho¹t” tõ hµng triÖu n¨m tr−íc trong qu¸ tr×nh tiÕn hãa h×nh thµnh loµi ng−êi. 221
Ch−¬ng 7 C¥ Së DI TRUYÒN HäC NHIÔM S¾C THÓ Trong tÕ bµo, mçi ph©n tö ADN th−êng liªn kÕt víi c¸c protein t¹o thµnh cÊu tróc ®−îc gäi lµ nhiÔm s¾c thÓ (viÕt t¾t lµ NST). Tæ chøc NST nh− vËy kh«ng chØ cã ë c¸c tÕ bµo eukaryote vµ prokaryote mµ thËm chÝ ë c¶ virut. ViÖc ®ãng gãi trong c¸c NST lµ ®iÒu kiÖn ®Ó ADN thùc hiÖn ®−îc c¸c chøc n¨ng quan träng cña nã. Thø nhÊt, NST chøa ADN ®−îc ®ãng gãi chÆt míi cã thÓ n»m gän ®−îc trong nh©n tÕ bµo. Thø hai, sù ®ãng gãi ADN trong NST nh»m b¶o vÖ ADN khái bÞ tæn th−¬ng. C¸c ph©n tö ADN trÇn trong tÕ bµo th−êng kÐm bÒn; trong khi ADN n»m trong cÊu tróc NST rÊt bÒn v÷ng, cho phÐp th«ng tin mµ nã m· hãa ®−îc truyÒn l¹i chÝnh x¸c. Thø ba, chØ ADN ®−îc ®ãng gãi trong NST míi cã thÓ ®−îc di truyÒn mét c¸ch hiÖu qu¶ cho c¸c tÕ bµo con sau mçi lÇn ph©n chia tÕ bµo. Cuèi cïng, NST lµ sù kh¼ng ®Þnh tæ chøc nhÊt qu¸n ®Æc thï víi mçi ph©n tö ADN. Tæ chøc ®ã lµm cho sù biÓu hiÖn cña c¸c gen còng nh− sù t¸i tæ hîp gi÷a c¸c NST bè, mÑ (t¹o nªn sù ®a d¹ng di truyÒn) cã thÓ diÔn ra thuËn lîi vµ cã tÝnh ®Æc tr−ng. Kho¶ng mét nöa khèi l−îng NST ë tÕ bµo eukaryote lµ protein. Trong c¸c tÕ bµo eukaryote, vïng ADN liªn kÕt víi c¸c protein ®−îc gäi lµ chÊt nhiÔm s¾c. C¸c protein liªn kÕt víi ADN trong chÊt nhiÔm s¾c chñ yÕu lµ c¸c protein kiÒm, kÝch th−íc nhá, gäi lµ c¸c histon. Ngoµi ra, trong chÊt nhiÔm s¾c cßn cã c¸c protein phi histon cã vai trß trong c¸c qu¸ tr×nh ph©n chia tÕ bµo, phiªn m·, sao chÐp, söa ch÷a vµ t¸i tæ hîp ADN. Trong chÊt nhiÔm s¾c, c¸c protein cã mét chøc n¨ng quan träng lµ nÐn chÆt ph©n tö ADN. TÝnh to¸n sau ®©y cho thÊy tÇm quan träng cña chøc n¨ng nµy. Bé NST ®¬n béi cña tÕ bµo ng−êi chøa trªn 3 tû cÆp baz¬ nit¬ (nucleotide). Mçi cÆp baz¬ nit¬ cã kÝch th−íc kho¶ng 3,4 Ao. NÕu nèi c¸c ph©n tö ADN cña bé NST ®¬n béi cña ng−êi l¹i víi nhau th× chóng cã ®é dµi trªn 1 m. Víi c¸c tÕ bµo l−ìng béi, chiÒu dµi ®ã lµ trªn 2 m. V× ®−êng kÝnh cña nh©n tÕ bµo ng−êi ®iÓn h×nh chØ kho¶ng 10 µm; nªn râ rµng, ADN ph¶i ®−îc nÐn chÆt theo nhiÒu møc ®é kh¸c nhau míi cã thÓ n»m gän trong kho¶ng kh«ng gian nhá bÐ ®ã. Møc ®é nÐn ADN ®Çu tiªn ë c¸c tÕ bµo ng−êi (còng nh− ë c¸c tÕ bµo eukaryote kh¸c) lµ ADN liªn kÕt víi histon t¹o nªn cÊu tróc gäi lµ nucleosome (thÓ nh©n). Nucleosome lµ b−íc ®ãng xo¾n ADN ®Çu tiªn gióp gi¶m chiÒu dµi cña nã xuèng kho¶ng 10.000 lÇn. Sù nÐn kÝch th−íc ADN trong nucleosome ph¶i “tr¶ mét chi phÝ” lµ lµm gi¶m kh¶ n¨ng tiÕp cËn ADN cña c¸c protein ®iÒu hßa c¸c qu¸ tr×nh sao chÐp, söa ch÷a, t¸i tæ hîp ADN, vµ ®Æc biÖt quan träng lµ c¸c protein ®iÒu hßa qu¸ tr×nh phiªn m·. MÆc dï so víi eukaryote, c¸c tÕ bµo prokaryote th−êng cã hÖ gen nhá h¬n, nh−ng ADN cña chóng còng cÇn ®−îc nÐn chÆt. Vi khuÈn E. coli ph¶i bao gãi ADN cña nã dµi kho¶ng 1 mm vµo trong tÕ bµo cã kÝch th−íc chØ 1 µm. C¸c møc cÊu tróc NST ë prokaryote ®Õn nay ch−a ®−îc biÕt ®Çy ®ñ. MÆc dï kh«ng cã histon, nh−ng c¸c tÕ bµo vi khuÈn còng cã c¸c protein liªn kÕt ADN cã tÝnh kiÒm, khèi l−îng nhá, cã lÏ ®Ó ®¶m nhËn chøc n¨ng t−¬ng tù. Sù ®èi nghÞch vÒ nhu cÇu “nÐn vËt chÊt di truyÒn” vµ nhu cÇu “tiÕp cËn ADN” cña c¸c bé m¸y sao chÐp, phiªn m·, söa ch÷a vµ t¸i tæ hîp ADN dÉn ®Õn viÖc cÇn t×m hiÓu cÊu tróc vµ ho¹t ®éng cña chÊt nhiÔm s¾c. Thùc tÕ cho thÊy, sù thay ®æi lu©n phiªn cÊu tróc nucleosome cho phÐp nh÷ng vïng riªng biÖt cña NST t−¬ng t¸c ®−îc víi c¸c protein. Sù thay ®æi lu©n phiªn ®ã ®−îc xóc t¸c bëi c¸c enzym c¶i biÕn vµ t¸i cÊu tróc nucleosome. Qu¸ tr×nh ®ã cã tÝnh côc bé, cho phÐp c¸c enzym vµ c¸c protein ®iÒu hßa tiÕp cËn ®−îc nh÷ng 222
Ch−¬ng 7. C¬ së di truyÒn häc nhiÔm s¾c thÓ vïng kh¸c nhau cña NST vµo c¸c thêi ®iÓm kh¸c nhau. §©y lµ ®iÓm “cèt yÕu” gióp gi¶i thÝch nhiÒu sù kiÖn diÔn ra trong ho¹t ®éng ®iÒu hßa gen ë eukaryote. Trong ch−¬ng nµy, chóng ta sÏ ®Ò cËp ®Õn cÊu tróc NST vµ mét sè c¬ chÕ chung gióp gi¶i thÝch b»ng c¸ch nµo c¸c NST ®−îc di truyÒn trän vÑn tíi c¸c tÕ bµo con sau mçi lÇn ph©n chia tÕ bµo. §ång thêi, chóng ta còng sÏ ®Ò cËp ®Õn cÊu tróc vµ sù ®iÒu hßa ho¹t ®éng cña chÊt nhiÔm s¾c qua sù c¶i biÕn vµ t¸i cÊu tróc nucleosome vèn ®−îc xem lµ ®¬n vÞ cÊu tróc c¬ b¶n vµ quan träng nhÊt cña chÊt nhiÔm s¾c ë tÕ bµo eukaryote. 7.1. Sù ®a d¹ng vÒ cÊu tróc cña nhiÔm s¾c thÓ (NST) 7.1.1. C¸c nhiÔm s¾c thÓ cã thÓ ë d¹ng m¹ch th¼ng hoÆc vßng Tr−íc ®©y, ng−êi ta tõng cho r»ng c¸c tÕ bµo prokaryote chØ cã mét NST m¹ch vßng, trong khi c¸c tÕ bµo eukaryote cã nhiÒu NST m¹ch th¼ng. Nh−ng, khi cµng cã nhiÒu loµi prokaryote ®−îc nghiªn cøu th× quan ®iÓm nµy kh«ng cßn chÝnh x¸c n÷a. Tuy hÇu hÕt c¸c prokaryote ®−îc nghiªn cøu (nh− E. coli vµ B. subtilis) thùc sù chØ cã mét NST m¹ch vßng, nh−ng còng cã nhiÒu tÕ bµo prokaryote chøa nhiÒu NST m¹ch th¼ng, hoÆc thËm chÝ ®ång thêi mang c¶ hai lo¹i. Sè l−îng NST ë c¸c sinh vËt prokaryote cã thÓ dao ®éng tõ 2 ®Õn d−íi 50. ë mét sè eukaryote, sè l−îng NST trong mçi tÕ bµo cã thÓ ®Õn hµng ngh×n (vÝ dô: ®éng vËt nguyªn sinh Tetrahynema, xem B¶ng 7.1). B¶ng 7.1. Sè l−îng nhiÔm s¾c thÓ (NST) ë c¸c sinh vËt kh¸c nhau Loµi Sè l−îng Sè b¶n sao D¹ng KÝch th−íc NST mçi NST NST hÖ gen (Mb) Mycoplasma genitalium Prokaryote 1 vßng 0,58 Escherichia coli K12 1 1 vßng 4,6 1 3 vßng Agrobacterium tumefaciens 1 1 th¼ng 5,67 4 vßng Sinorhizobium meliloti 1 6,7 3 Eukaryote Saccharomyces cerevisiae 16 1 hoÆc 2 th¼ng 12,1 Schizosaccharomyces pombe th¼ng 12,5 Caenorhabditis elegans (giun trßn) 3 1 hoÆc 2 th¼ng 97 Arabidopsis thaliana (c¶i d¹i) th¼ng 125 Drosophila melanogaster (ruåi giÊm) 62 th¼ng 180 Tetrahynema thermophilus 52 th¼ng 220 (nh©n nhá) Fugu rubripes (c¸ xem sao) 42 th¼ng Mus musculus (chuét) th¼ng 365 Homo sapiens (ng−êi) Nh©n nhá: 5 Nh©n nhá: 2 th¼ng 2500 Nh©n lín: 225 Nh©n lín: 10 - 2900 10.000 22 2 19 + X vµ Y 2 22 + X vµ Y 2 Dï ë d¹ng m¹ch th¼ng hay vßng, NST ®Òu gÆp nh÷ng “trë ng¹i” riªng trong qu¸ tr×nh sao chÐp vµ duy tr× th«ng tin di truyÒn. NST m¹ch vßng cÇn enzym topoisomerase ®Ó t¸ch c¸c ph©n tö ADN con sau khi kÕt thóc qu¸ tr×nh sao chÐp. NÕu kh«ng cã c¸c 223
§ç Lª Th¨ng - §inh §oµn Long enzym nµy, c¸c ph©n tö ADN con cã thÓ lång vµo nhau hoÆc “®Ýnh” víi nhau thµnh chuçi. Ng−îc l¹i, c¸c ph©n tö ADN cña c¸c NST m¹ch th¼ng trong qu¸ tr×nh sao chÐp cÇn ®−îc b¶o vÖ khái c¸c enzym ph©n gi¶i (nuclease) vèn cã s½n trong tÕ bµo. 7.1.2. §Æc tr−ng sè l−îng nhiÔm s¾c thÓ cña tÕ bµo C¸c tÕ bµo prokaryote th−êng chØ cã mét b¶n sao NST hoµn chØnh n»m trong cÊu tróc ®−îc gäi lµ vïng nh©n (nucleoid, xem h×nh 7.1b). Tuy nhiªn, khi c¸c tÕ bµo prokaryote ph©n chia nhanh th× nhiÒu phÇn cña NST ®ang sao chÐp sÏ tån t¹i ë d¹ng hai hay thËm chÝ bèn b¶n sao. C¸c tÕ bµo prokaryote còng th−êng cã mét hoÆc mét sè ph©n tö ADN d¹ng vßng kÝch th−íc nhá, tån t¹i ®éc lËp, gäi lµ c¸c plasmid. Plasmid th−êng kh«ng mang c¸c gen thiÕt yÕu ®èi víi sù sinh tr−ëng cña vi khuÈn, nh−ng chóng mang c¸c gen cÇn cho mét sè ho¹t ®éng kh¸c cña vi khuÈn, nh− kh¶ n¨ng kh¸ng kh¸ng sinh. Trong mét tÕ bµo vi khuÈn cã thÓ cã nhiÒu b¶n sao hoµn chØnh cña c¸c plasmid. PhÇn lín c¸c tÕ bµo eukaryote lµ l−ìng béi, nghÜa lµ chóng chøa hai b¶n sao cña mçi NST (h×nh 7.1c). Hai b¶n sao cña mçi NST ®−îc gäi lµ hai NST t−¬ng ®ång; mét chiÕc cã nguån gèc tõ bè, mét chiÕc cã nguån gèc tõ mÑ. Tuy nhiªn, kh«ng ph¶i mäi tÕ bµo eukaryote ®Òu lµ l−ìng béi; mét sè cã (b) thÓ lµ ®¬n béi hoÆc ®a béi. C¸c tÕ bµo Vi khuÈn ®¬n béi ®¬n béi (nh− tinh trïng vµ trøng) chØ cã mét b¶n sao duy nhÊt cña mçi NST vµ tham gia vµo qu¸ tr×nh sinh s¶n h÷u tÝnh. C¸c tÕ bµo ®a béi cã nhiÒu h¬n hai b¶n sao cña mçi NST. Trong thùc Roi b¬i Vá tÕ, mét sè sinh vËt duy tr× phÇn lín c¸c tÕ bµo tr−ëng thµnh cña chóng ë d¹ng (a) Vïng nh©n NhiÔm s¾c thÓ ®a béi. Cã nh÷ng tr−êng hîp sè b¶n Prokaryote (c) sao cña mçi NST trong tÕ bµo lªn ®Õn 1 µm TÕ bµo l−ìng béi hµng tr¨m, thËm chÝ hµng ngh×n. KiÓu Eukaryote Bé m¸y Golgi t¨ng theo béi sè cña hÖ gen nh− vËy cho phÐp tÕ bµo s¶n sinh nhanh mét Nh©n l−îng lín ARN vµ protein. VÝ dô, tÕ bµo nh©n khæng lå (megakaryocyte) cã NhiÔm s¾c thÓ trong tñy x−¬ng ë ng−êi lµ c¸c tÕ bµo M¹ng l−íi ®a béi chuyªn hãa (chøa kho¶ng 128 10 µm néi chÊt b¶n sao cña mçi NST). Mçi tÕ bµo Ti thÓ nh©n khæng lå cã thÓ s¶n sinh hµng TÕ bµo ®¬n béi ngh×n tiÓu cÇu kh«ng cã NST nh−ng lµ thµnh phÇn quan träng trong m¸u (cã kho¶ng 200.000 tiÓu cÇu/ml m¸u). ë H×nh 7.1. So s¸nh tÕ bµo prokaryote (nh©n s¬) vµ eukaryote (nh©n thËt) ®iÓn h×nh. (a) §−êng kÝnh tÕ bµo d¹ng ®a béi, c¸c tÕ bµo nh©n khæng lå lu«n duy tr× ®−îc møc ®é trao ®æi chÊt eukaryote kho¶ng 10 µm vµ tÕ bµo prokaryote kho¶ng 1µm. cao ®Ó cã thÓ s¶n sinh nhanh mét (b) NST eukaryote n»m ë vïng nh©n vµ chiÕm phÇn ®¸ng kÓ l−îng lín c¸c tiÓu cÇu. Sù ph©n ly sè trong tÕ bµo. Vïng nh©n kh«ng cã mµng bao bäc. Ngoµi ra, tÕ l−îng lín NST nh− vËy theo c¸c c¬ chÕ bµo prokaryote cßn cã plasmid. (c) C¸c NST tÕ bµo eukaryote n»m trong nh©n tÕ bµo cã mµng bao bäc. TÕ bµo ®¬n béi cã mét chung sÏ rÊt khã kh¨n nªn c¸c tÕ bµo ë b¶n sao cña mçi NST, cßn c¸c tÕ bµo l−ìng béi cã hai b¶n sao. d¹ng ®a béi, nh− tÕ bµo nh©n khæng lå, sau khi biÖt hãa sÏ ngõng ph©n chia. Dï sè l−îng lµ bao nhiªu th× c¸c NST ë tÕ bµo eukaryote lu«n ®−îc “bao gãi” trong nh©n tÕ bµo. 224
Ch−¬ng 7. C¬ së di truyÒn häc nhiÔm s¾c thÓ 7.1.3. NghÞch lý gi¸ trÞ C ADN tæng sè cña hÖ gen ®¬n béi cña mét loµi ®−îc gäi lµ gi¸ trÞ C cña loµi ®ã. B¶ng 7.2 liÖt kª gi¸ trÞ C, sè l−îng gen −íc tÝnh vµ mËt ®é gen/Mb cña mét sè loµi prokaryote vµ eukaryote. Nh÷ng sè liÖu nµy nh×n chung ph¶n ¸nh mèi t−¬ng quan gi÷a kÝch th−íc hÖ gen víi møc ®é tæ chøc phøc t¹p cña c¬ thÓ sinh vËt. C¸c loµi prokaryote th−êng cã hÖ gen nhá h¬n 10 Mb. HÖ gen cña c¸c eukaryote ®¬n bµo th−êng nhá h¬n 50 Mb, trong khi nh÷ng nguyªn sinh ®éng vËt cã cÊu tróc c¬ thÓ phøc t¹p h¬n cã thÓ cã hÖ gen lín h¬n 200 Mb. C¸c sinh vËt ®a bµo cã hÖ gen lín h¬n nhiÒu. HÖ gen cña nh÷ng sinh vËt nµy cã thÓ ®¹t tíi 100.000 Mb. Tuy vËy, mèi t−¬ng quan gi÷a kÝch th−íc hÖ gen víi møc ®é tæ chøc phøc t¹p cña c¬ thÓ kh«ng hoµn toµn tuyÖt ®èi. NhiÒu sinh vËt cã møc ®é tæ chøc gÇn t−¬ng ®−¬ng nhau nh−ng cã kÝch th−íc hÖ gen rÊt kh¸c nhau. VÝ dô, ruåi giÊm cã hÖ gen nhá h¬n ch©u chÊu 25 lÇn; cßn lóa n−íc cã hÖ gen nhá h¬n lóa m× 40 lÇn. §iÒu nµy cho thÊy, cã lÏ sè l−îng gen, chø kh«ng ph¶i kÝch th−íc hÖ gen cã quan hÖ mËt thiÕt víi møc ®é tæ chøc phøc t¹p cña sinh vËt. Ph©n tÝch mËt ®é gen cña c¸c hÖ gen cho thÊy râ xu h−íng nµy. B¶ng 7.2. Gi¸ trÞ C, sè gen −íc tÝnh vµ mËt ®é gen ë mét sè loµi sinh vËt Loµi Gi¸ trÞ C Sè gen MËt ®é gen (Mb) −íc tÝnh (sè gen / Mb) Prokaryote (Vi khuÈn) Mycoplasma genitalium 0,58 500 860 Streptococcus pneumonia 2,2 2.300 1.060 Escherichia coli K12 4,6 4.400 Agrobacterium tumefaciens 5,7 5.400 950 Sinorhhizobium meliloti 6,7 6.200 960 930 Eukaryote 12 5.800 480 12 4.900 410 a) NÊm Saccharomyces cerevisiae 220 > 20.000 >90 Schizosaccharomyces pombe 97 19.000 200 b) §éng vËt nguyªn sinh 180 13.700 80 Tetrahynema thermophilus 845 ~ 22.000 5.000 Ch−a x¸c ®Þnh ~26 c) §éng vËt kh«ng x−¬ng sèng Ch−a x¸c ®Þnh C. elegans (giun trßn) 365 > 31.000 D. melanogaster (ruåi giÊm) 2.900 25.000 >85 Strongylocentrotus purpuratus 2.500 23.000 8,6 Locusta migratoria 9,2 125 25.500 d) §éng vËt cã x−¬ng sèng 430 > 45.000 200 Fugu rubripes (c¸ xem sao) 2.200 > 45.000 >100 Homo sapiens (ng−êi) 120.000 Ch−a x¸c ®Þnh Mus musculus (chuét) >20 Ch−a x¸c ®Þnh e) Thùc vËt Arabidopsis thaliana (c¶i d¹i) Oryza saliva (lóa) Zea mays (ng«) Fritilaria assyriaca (tulip) 225
§ç Lª Th¨ng - §inh §oµn Long 7.1.4. C¸c gen chiÕm hÇu hÕt hÖ gen vi khuÈn PhÇn lín nh÷ng hiÓu biÕt ®Õn nay vÒ hÖ gen vi khuÈn lµ tõ c¸c nghiªn cøu ë vi khuÈn “m« h×nh” E. coli. C¸c gen m· ho¸ protein chiÕm phÇn lín hÖ gen cña vi khuÈn nµy. Tr×nh tù kh«ng m· ho¸ chñ yÕu lµ c¸c tr×nh tù ®iÒu hoµ phiªn m·. V× mét vÞ trÝ khëi ®Çu phiªn m· th−êng ®−îc E. coli sö dông ®Ó ®iÒu khiÓn sù biÓu hiÖn ®ång thêi cña mét sè gen (cÊu tróc mARN ®a cistron) nªn sè l−îng tr×nh tù khëi ®Çu phiªn m· trong hÖ gen còng rÊt Ýt. §iÓm khëi ®Çu sao chÐp trªn NST cña E. coli kh«ng ph¶i lµ mét ®o¹n tr×nh tù trong gen mµ lµ mét vïng tr×nh tù ng¾n trªn NST ®−îc dïng ®Ó ®iÒu khiÓn bé m¸y sao chÐp ADN. MÆc dï cã vai trß quan träng nh−ng vïng nµy cã kÝch th−íc kh¸ nhá, chØ chiÕm vµi tr¨m cÆp baz¬ nit¬ trong tæng sè 4,6 Mb cña hÖ gen. 7.1.5. C¸c sinh vËt bËc cao cã mËt ®é gen trong hÖ gen gi¶m T¹i sao mËt ®é gen trong hÖ Intron 1 2 gen sinh vËt bËc cao l¹i gi¶m? Cã ADN 3 hai yÕu tè chÝnh dÉn ®Õn hiÖn Exon 1 2 t−¬ng nµy. §ã lµ kÝch th−íc mçi 2 3 gen vµ chiÒu dµi ®o¹n tr×nh tù TiÒn-mARN 1 3’ liªn gen (gi÷a c¸c gen) cã xu 5’ h−íng t¨ng lªn. §é dµi mçi gen t¨ng lªn v× hai lý do. Thø nhÊt, c¸c mARN hoµn thiÖn 5’ 3’ sinh vËt trë nªn ngµy cµng phøc t¹p (sau c¾t intron) vµ c¸c gen cña nã ®−îc ®iÒu khiÓn H×nh 7.2. S¬ ®å hãa qu¸ tr×nh xÐn intron (hoµn thiÖn mARN). biÓu hiÖn bëi nhiÒu c¬ chÕ ®iÒu hßa nghiªm ngÆt vµ phøc t¹p h¬n nªn ®é dµi c¸c ®o¹n tr×nh tù ADN ®iÒu hoµ phiªn m· (gäi t¾t lµ c¸c tr×nh tù ®iÒu hoµ) còng t¨ng lªn (tøc lµ tÝch lòy thªm th«ng tin). Thø hai, c¸c gen m· ho¸ protein ë c¸c eukaryote th−êng cã tÝnh “ph©n m¶nh”, nghÜa lµ xen kÏ gi÷a c¸c tr×nh tù m· hãa - exon - lµ c¸c tr×nh tù kh«ng m· hãa axit amin trªn ph©n tö protein - intron. C¸c intron ®−îc c¾t bá khái ph©n tö tiÒn-mARN sau phiªn m· bëi qu¸ tr×nh xÐn intron lµ mét b−íc cña qu¸ tr×nh hoµn thiÖn mARN (h×nh 7.2). Sù cã mÆt cña c¸c intron lµm t¨ng ®¸ng kÓ ®é dµi cña gen (b¶ng 7.3). Ch¼ng h¹n ë ng−êi, ®o¹n tr×nh tù ®−îc phiªn m· cña mét gen (®Ó tæng hîp tiÒn-mARN) cã kÝch th−íc trung b×nh kho¶ng 27 kb, th× ®o¹n tr×nh tù m· ho¸ (®−îc dÞch m· thµnh protein) chØ dµi kho¶ng 1,3 kb. Nãi c¸ch kh¸c, chØ cã kho¶ng 5% sè nucleotide trong tr×nh tù c¸c gen ë ng−êi lµ c¸c tr×nh tù m· ho¸. C¸c gen ë eukaryote bËc thÊp cã xu h−íng mang Ýt intron h¬n. VÝ dô, ë nÊm men Saccharomyces cerevisiae, chØ cã kho¶ng 3% sè gen chøa intron vµ kh«ng cã intron nµo dµi qu¸ 1 kb. C¸c ®o¹n tr×nh tù liªn gen ë c¸c sinh vËt bËc cao còng lµ nguyªn nh©n quan träng lµm gi¶m mËt ®é gen. ADN liªn gen lµ phÇn cña hÖ gen kh«ng trùc tiÕp liªn quan ®Õn sù biÓu hiÖn cña gen (tæng hîp protein hoÆc c¸c ARN cÊu tróc). H¬n 60% hÖ gen ng−êi lµ c¸c ®o¹n tr×nh tù liªn gen vµ phÇn lín c¸c tr×nh tù ®ã ®Õn nay ch−a biÕt râ vÒ chøc n¨ng (h×nh 7.3). Cã hai lo¹i tr×nh tù ADN liªn gen: c¸c tr×nh tù ®¬n nhÊt vµ c¸c tr×nh tù lÆp l¹i. Kho¶ng 1/4 sè tr×nh tù ADN liªn gen lµ c¸c tr×nh tù ®¬n nhÊt. Chóng bao gåm c¶ c¸c ®o¹n tr×nh tù ADN lµ “vÕt tÝch” cña gen kh«ng cßn ho¹t ®éng chøc n¨ng, nh− c¸c gen ®ét biÕn mÊt chøc n¨ng, c¸c ph©n ®o¹n cña gen vµ c¸c gen gi¶. C¸c gen ®ét biÕn mÊt chøc n¨ng vµ c¸c ph©n ®o¹n cña gen xuÊt hiÖn do c¸c ®ét biÕn ngÉu nhiªn hoÆc do sai sãt trong qu¸ tr×nh t¸i tæ hîp ADN. Mét c¬ chÕ ph¸t sinh c¸c gen gi¶ lµ do ho¹t ®éng cña c¸c enzym phiªn m· ng−îc. ChØ mét sè virut nhÊt ®Þnh trong qu¸ tr×nh sinh s¶n sö dông lo¹i enzym nµy ®Ó sao chÐp ARN thµnh ADN sîi kÐp (cßn gäi lµ cADN). Khi bÞ nhiÔm nh÷ng virut nµy, c¸c mARN cña tÕ bµo chñ cã thÓ bÞ sao chÐp thµnh cADN råi ®o¹n cADN võa t¹o ra ®−îc lång ghÐp vµo hÖ gen nh−ng kh«ng biÓu hiÖn ®−îc chøc n¨ng. 226
Ch−¬ng 7. C¬ së di truyÒn häc nhiÔm s¾c thÓ HÖ gen ng−êi Tr×nh tù ADN C¸c tr×nh tù C¸c tr×nh tù (3.200 Mb) liªn gen liªn gen kh¸c ®¬n nhÊt (510 Mb) H×nh 7.3. Tæ chøc hÖ gen ng−êi. (2.000 Mb) (600 Mb) HÖ gen ng−êi gåm nhiÒu lo¹i tr×nh C¸c tr×nh tù lÆp l¹i C¸c tr×nh tù lÆp l¹i tù ADN kh¸c nhau, trong ®ã phÇn Gen vµ tr×nh tù ph©n bè kh¾p hÖ sè l−îng biÕn ®éng lín kh«ng m· hãa protein. liªn quan ®Õn gen gen (1.400 Mb) - microsatellite (1.200 Mb) (90 Mb) C¸c tr×nh tù liªn quan ®Õn gen Intron vµ c¸c tr×nh (1.152 Mb) tù kh«ng ®−îc phiªn m cña gen C¸c ph©n ®o¹n kh«ng hoµn chØnh cña gen GEN Gen gi¶ (48 Mb) B¶ng 7.3. Intron vµ tr×nh tù lÆp l¹i trong hÖ gen c¸c sinh vËt kh¸c nhau Loµi MËt ®é gen Sè intron trung Tû lÖ tr×nh tù ADN Prokaryote (Vi khuÈn) (sè gen / Mb) b×nh ë mçi gen lÆp l¹i (%) Escherichia coli K12 950 0 <1 Eukaryote 480 0,04 3,4 a) NÊm Saccharomyces cerevisiae 200 5 6,3 60 3 12 b) §éng vËt kh«ng x−¬ng sèng Caenorhabditis elegans 75 5 2,7 Drosophila melanogaster 86 46 c) §éng vËt cã x−¬ng sèng 125 3 Ch−a x¸c ®Þnh Fugu rubripes Homo sapiens 470 Ch−a x¸c ®Þnh 42 d) Thùc vËt Arabidopsis thaliana Oryza sativa C¸c ®o¹n tr×nh tù liªn gen ë c¸c sinh vËt bËc cao còng lµ nguyªn nh©n quan träng lµm gi¶m mËt ®é gen. ADN liªn gen lµ phÇn cña hÖ gen kh«ng trùc tiÕp liªn quan ®Õn sù biÓu hiÖn cña gen (tæng hîp protein hoÆc c¸c ARN cÊu tróc). H¬n 60% hÖ gen ng−êi lµ c¸c ®o¹n tr×nh tù liªn gen vµ phÇn lín c¸c tr×nh tù ®ã ®Õn nay ch−a biÕt râ vÒ chøc n¨ng (h×nh 7.3). Cã hai lo¹i tr×nh tù ADN liªn gen: c¸c tr×nh tù ®¬n nhÊt vµ c¸c tr×nh tù lÆp l¹i. Kho¶ng 1/4 sè tr×nh tù ADN liªn gen lµ c¸c tr×nh tù ®¬n nhÊt. Chóng bao gåm c¶ c¸c ®o¹n tr×nh tù ADN lµ “vÕt tÝch” cña gen kh«ng cßn ho¹t ®éng chøc n¨ng, nh− c¸c gen ®ét biÕn mÊt chøc n¨ng, c¸c ph©n ®o¹n cña gen vµ c¸c gen gi¶. C¸c gen ®ét biÕn mÊt chøc n¨ng vµ c¸c ph©n ®o¹n cña gen xuÊt hiÖn do c¸c ®ét biÕn ngÉu nhiªn hoÆc do sai sãt trong qu¸ tr×nh t¸i tæ hîp ADN. Mét c¬ chÕ ph¸t sinh c¸c gen gi¶ lµ do ho¹t ®éng cña c¸c enzym phiªn m· ng−îc. ChØ mét sè virut nhÊt ®Þnh trong qu¸ tr×nh sinh s¶n sö dông lo¹i enzym nµy ®Ó sao chÐp ARN thµnh ADN sîi kÐp (cßn gäi lµ cADN). Khi bÞ nhiÔm nh÷ng virut nµy, c¸c 227
§ç Lª Th¨ng - §inh §oµn Long mARN cña tÕ bµo chñ cã thÓ bÞ sao chÐp thµnh cADN råi ®o¹n cADN võa t¹o ra ®−îc lång ghÐp vµo hÖ gen nh−ng kh«ng biÓu hiÖn ®−îc chøc n¨ng. 7.1.6. PhÇn lín c¸c tr×nh tù liªn gen ë ng−êi lµ c¸c ®o¹n tr×nh tù lÆp l¹i Kho¶ng mét nöa hÖ gen ng−êi lµ c¸c ®o¹n tr×nh tù ADN lÆp l¹i nhiÒu lÇn trong hÖ gen. Cã hai lo¹i tr×nh tù lÆp l¹i chñ yÕu: c¸c ADN tiÓu vÖ tinh (microsatellite) vµ c¸c ®o¹n tr×nh tù lÆp l¹i kh¾p hÖ gen. ADN tiÓu vÖ tinh lµ c¸c ®o¹n tr×nh tù lÆp l¹i kÕ tiÕp nhau víi ®¬n vÞ lÆp l¹i cã kÝch th−íc ng¾n (d−íi 13 bp). C¸c tr×nh tù ADN tiÓu vÖ tinh phæ biÕn nhÊt cã ®¬n vÞ lÆp l¹i gåm hai nucleotide (vÝ dô, CACACACACACA). Nh÷ng ®o¹n lÆp l¹i nµy xuÊt hiÖn do nh÷ng sai sãt trong qu¸ tr×nh sao chÐp ADN vµ chiÕm kho¶ng 3% hÖ gen. Nh÷ng “®o¹n tr×nh tù lÆp l¹i kh¾p hÖ gen” cã kÝch th−íc lín h¬n nhiÒu c¸c ADN tiÓu vÖ tinh. Mçi ®¬n vÞ lÆp l¹i cña chóng th−êng lín h¬n 100 bp, thËm chÝ h¬n 1 kb. Nh÷ng tr×nh tù nµy cã thÓ tån t¹i ®éc lËp nh−ng ph©n t¸n kh¾p hÖ gen, hoÆc kÕt côm thµnh tõng nhãm xen kÏ gi÷a c¸c tr×nh tù ®Öm. Cã thÓ ph©n chóng thµnh nhiÒu lo¹i tr×nh tù kh¸c nhau, song cã ®Æc ®iÓm chung lµ chóng ®Òu cã thÓ lµ c¸c yÕu tè di truyÒn vËn ®éng (xem ch−¬ng 6). C¸c yÕu tè di truyÒn vËn ®éng (kÝ hiÖu TE) lµ c¸c ®o¹n tr×nh tù cã thÓ vËn ®éng tõ vÞ trÝ nµy sang vÞ trÝ kh¸c trong hÖ gen. Th−êng th× khi vËn ®éng, c¸c yÕu tè TE ®Ó l¹i b¶n sao gèc ë vÞ trÝ cò (nhê vËy, nã ®−îc nh©n lªn vµ tÝch lòy thµnh nhiÒu b¶n sao kh¾p hÖ gen). Sù vËn ®éng cña c¸c yÕu tè TE trong hÖ gen ng−êi lµ sù kiÖn hiÕm x¶y ra. Tuy vËy, tr¶i qua hµng triÖu n¨m tiÕn hãa, c¸c yÕu tè nµy ®· tù nh©n lªn vµ duy tr× hiÖu qu¶ tíi møc hiÖn nay chóng chiÕm tíi 44% hÖ gen ng−êi. B¶n chÊt cña c¸c tr×nh tù liªn gen ë c¸c sinh vËt kh¸c còng cã c¸c ®Æc ®iÓm chung gièng víi ng−êi. ë nh÷ng loµi thùc vËt cã hÖ gen lín (nh− ng«), tû lÖ c¸c yÕu tè TE cßn cao h¬n. Ngay c¸c hÖ gen nhá (nh− E. coli vµ S. cerevisiae) còng cã c¸c yÕu tè TE. Sù kh¸c biÖt chØ ë chç, nh÷ng yÕu tè nµy cã sè l−îng b¶n sao trong hÖ gen thÊp h¬n. MÆc dï cã xu h−íng coi c¸c tr×nh tù ADN lÆp l¹i lµ c¸c tr×nh tù ADN “Ýt gi¸ trÞ”, song viÖc chóng ®−îc duy tr× æn ®Þnh qua hµng triÖu n¨m tiÕn hãa th× cã thÓ dù ®o¸n r»ng c¸c tr×nh tù ADN liªn gen ph¶i cã mét ý nghÜa (hoÆc −u thÕ chän läc) nµo ®ã ®èi víi sinh vËt. 7.2. Sù nh©n ®«i vµ ph©n ly cña c¸c nhiÔm s¾c thÓ 7.2.1. T©m ®éng, ®Çu mót vµ c¸c ®iÓm khëi ®Çu sao chÐp cÇn thiÕt ®Ó duy tr× c¸c nhiÔm s¾c thÓ trong qu¸ tr×nh ph©n bµo ë eukaryote Trªn mçi NST cña eukaryote, c¸c ®iÓm khëi ®Çu sao chÐp c¸ch nhau kho¶ng 30 - 40 kb. Th−êng th× c¸c ®iÓm khëi ®Çu sao chÐp ®−îc t×m thÊy trong c¸c vïng tr×nh tù kh«ng m· ho¸. C¸c NST ë prokaryote th−êng chØ cã mét ®iÓm khëi ®Çu sao chÐp duy nhÊt. T©m ®éng cÇn cho sù ph©n ly chÝnh x¸c c¸c nhiÔm s¾c tö vÒ hai tÕ bµo con trong qu¸ tr×nh ph©n bµo. T©m ®éng ®iÒu khiÓn sù h×nh thµnh phøc hÖ nucleoprotein ®−îc gäi lµ thÓ ®éng. ThÓ ®éng t−¬ng t¸c víi bé m¸y ph©n chia tÕ bµo ®Ó ®Èy c¸c nhiÔm s¾c tö t¸ch khái nhau vÒ hai tÕ bµo con. Mçi NST b×nh th−êng chØ cã mét t©m ®éng. NÕu kh«ng cã t©m ®éng, c¸c NST ph©n ly ngÉu nhiªn, dÉn ®Õn mÊt hoÆc lÆp ®o¹n NST. NÕu cã nhiÒu t©m ®éng, NST cã thÓ ®ång thêi bÞ kÐo vÒ hai phÝa, dÉn ®Õn ®øt g·y (h×nh 7.4). T©m ®éng cã kÝch th−íc rÊt kh¸c nhau, tõ d−íi 200 bp nh− ë S. serevisiae, hoÆc lín h¬n (®Õn vµi Mb) ë phÇn lín c¸c eukaryote kh¸c vµ th−êng gåm c¸c ®o¹n ADN lÆp l¹i (h×nh 7.5). 228
Ch−¬ng 7. C¬ së di truyÒn häc nhiÔm s¾c thÓ a) NST cã mét t©m ®éng Mçi nhiÔm s¾c tö ph©n ly vÒ mét tÕ bµo con b) NST kh«ng cã t©m ®éng Sù ph©n ly ngÉu nhiªn cña nhiÔm s¾c thÓ c) NST cã hai t©m ®éng Sù ®øt g·y NST x¶y ra do cã nhiÒu h¬n mét t©m ®éng H×nh 7.4. Vai trß cña t©m ®éng trong sù ph©n ly nhiÔm s¾c thÓ (NST) vÒ c¸c tÕ bµo con trong qu¸ tr×nh ph©n bµo. a) Mçi NST trong cÆp t−¬ng ®ång cã mét t©m ®éng ph©n ly vÒ mét tÕ bµo con trong qu¸ tr×nh ph©n bµo; b) Sù ph©n ly ngÉu nhiªn cña NST kh«ng cã t©m ®éng dÉn ®Õn mÊt NST; c) Cã nhiÒu t©m ®éng dÉn ®Õn sù ®øt g·y cña NST sau qu¸ tr×nh ph©n bµo. 125 bp I II III a) S. cerevisiae b) S. pombe cen1 40 - 100 Kb c) D. melanogaster ~ 400 Kb d) H. sapiens Tõ 240 Kb ®Õn vµi Mb H×nh 7.5. KÝch th−íc vµ cÊu tróc t©m ®éng cña mét sè loµi. T©m ®éng ë S. cerevisiae cã kÝch th−íc nhá vµ kh«ng cã tr×nh tù lÆp l¹i. Ng−îc l¹i, t©m ®éng ë phÇn lín c¸c loµi kh¸c (nh− S. pombe, D. melanogaster vµ ng−êi) cã kÝch th−íc lín h¬n nhiÒu vµ mang nhiÒu tr×nh tù lÆp l¹i, trõ mét ®o¹n ng¾n (4 – 7 kb) ë gi÷a t©m ®éng – cen 1 - cña S. pombe kh«ng cã tr×nh tù lÆp l¹i. 229
§ç Lª Th¨ng - §inh §oµn Long Gièng c¸c ®iÓm khëi ®Çu sao Vïng T - loop YÕu tè liªn kÕt tr×nh tù chÐp vµ t©m ®éng, c¸c ®Çu mót cña a) lÆp l¹i ®Çu mót NST NST còng ®−îc g¾n kÕt bëi nhiÒu protein. C¸c protein ë ®Çu mót Vïng D - loop thùc hiÖn hai chøc n¨ng quan träng. Thø nhÊt, c¸c protein nµy 5’ 3’ ph©n biÖt c¸c ®Çu mót thùc sù cña §o¹n m¹ch Sù b¾t cÆp gi÷a 2 NST víi c¸c ®o¹n ®øt g·y kh¸c trªn Sù b¾t cÆp gi÷a 2 ®¬n ®Çu 3’ ®o¹n ADN sîi kÐp cïng NST hoÆc tõ c¸c NST kh¸c ®o¹n ADN sîi kÐp trong tÕ bµo. Th«ng th−êng, ADN ë b) ®Çu mót cã tÇn sè t¸i tæ hîp cao vµ 5’ dÔ bÞ ph©n gi¶i. C¸c protein g¾n 3’ kÕt víi chóng t¹o nªn cÊu tróc chèng l¹i c¸c sù kiÖn trªn. Thø hai, H×nh 7.6. CÊu tróc ®Çu mót nhiÔm s¾c thÓ ®iÓn h×nh ë ®Çu mót ho¹t ®éng nh− ®iÓm khëi eukaryote. a) CÊu tróc “thßng läng” ë ®Çu mót NST víi ®Çu 3’ cña m¹ch ®¬n cã thÓ dµi hµng tr¨m nucleotide. b) tr×nh tù ®¬n vÞ ®Çu sao chÐp ®−îc biÖt ho¸, cho phÐp tÕ bµo sao chÐp ®−îc phÇn lÆp l¹i ë ®Çu mót NST ë ng−êi lµ 5’- [TTAGGG]n - 3’. ®Çu mót nµy. Chóng ta ®· biÕt, bé m¸y sao chÐp ADN th«ng th−êng kh«ng thÓ sao chÐp hoµn chØnh c¸c ®Çu mót cña NST m¹ch th¼ng. Qu¸ tr×nh sao chÐp “bï” phÇn ®Çu mót ®−îc thùc hiÖn bëi enzym telomerase. Kh«ng nh− c¸c phÇn kh¸c cña NST, phÇn quan träng cña ®Çu mót NST chØ ë tr¹ng th¸i m¹ch ®¬n (h×nh 7.6). HÇu hÕt c¸c ®Çu mót cã tr×nh tù lÆp l¹i ®¬n gi¶n nh−ng kh¸c nhau ë c¸c loµi kh¸c nhau. Tr×nh tù lÆp l¹i nµy th−êng ng¾n, giµu TC. VÝ dô, ®Çu mót NST ë ng−êi cã ®¬n vÞ tr×nh tù lÆp l¹i lµ 5’-TTAGGG-3’. 7.2.2. Sù sao chÐp vµ ph©n ly Pha G1 Pha Pha nhiÔm s¾c thÓ trong chu Pha S Pha M G1 tr×nh tÕ bµo G2 Pha G2 H×nh 7.7 tãm t¾t 4 pha (giai Pha M Pha S G0 ®o¹n) c¬ b¶n cña chu tr×nh tÕ bµo. (sao chÐp Trong qu¸ tr×nh ph©n bµo (pha M), c¸c NST ph¶i ®−îc nh©n ®«i vµ ADN) ph©n ly vÒ c¸c tÕ bµo con. ë vi H×nh 7.7. Chu tr×nh tÕ bµo ë khuÈn, sù nh©n ®«i vµ ph©n li eukaryote. Bèn giai ®o¹n (pha) cña NST diÔn ra ®ång thêi. Qu¸ tr×nh chu tr×nh tÕ bµo: NST ®−îc sao chÐp nµy ®−îc ®iÒu hoµ chÆt chÏ, nh−ng ë pha S vµ ph©n ly vÒ c¸c tÕ bµo con c¬ chÕ ®iÒu hßa chi tiÕt ch−a ®−îc ë pha M. Pha G1 vµ G2 lµ c¸c giai ®o¹n tÕ bµo chuÈn bÞ cho hai sù kiÖn biÕt ®Çy ®ñ. ë eukaryote, hai qu¸ trªn. G0 lµ khi tÕ bµo chuyÓn sang tr×nh nµy diÔn ra t¸ch biÖt ë c¸c tr¹ng th¸i biÖt hãa vµ kh«ng tiÕp tôc pha kh¸c nhau cña chu tr×nh tÕ bµo. ADN ®−îc tæng hîp ë pha S ph©n chia. dÉn ®Õn sù nh©n ®«i NST. Mçi NST cña cÆp NST nh©n ®«i ®−îc gäi lµ mét nhiÔm s¾c tö vµ hai nhiÔm s¾c tö ®ã ®−îc gäi lµ hai nhiÔm s¾c tö chÞ em. Hai nhiÔm s¾c tö chÞ em kÕt dÝnh víi nhau nhê mét nhãm ph©n tö gäi lµ cohesin vµ duy tr× sù kÕt dÝnh cho ®Õn khi ph©n ly ë pha M. 230
Ch−¬ng 7. C¬ së di truyÒn häc nhiÔm s¾c thÓ Qu¸ tr×nh ph©n ly a) C¸c sù kiÖn chÝnh x¶y ra trong pha S NST diÔn ra ë pha M (hay nguyªn ph©n) cña chu Ph©n tö Cohesin 2 m¹ch ADN sîi kÐp ®¬n ADN tr×nh tÕ bµo. Cã hai sù kiÖn chÝnh liªn quan ®Õn sù ph©n ly NST (h×nh 7.8). Sù kiÖn thø nhÊt lµ cÆp Sù khëi ®Çu Sao chÐp kÐo dµi vµ nhiÔm s¾c tö chÞ em g¾n víi sao chÐp ADN h×nh thµnh cohesin thoi v« s¾c (thoi ph©n bµo). Thoi v« s¾c ®−îc cÊu t¹o tõ c¸c sîi protein dµi d¹ng vi èng. Mét ®Çu cña vi èng g¾n víi mét trong hai trung t©m tæ chøc vi b) C¸c sù kiÖn chÝnh x¶y ra trong pha M NhiÔm s¾c tö chÞ em èng (cßn ®−îc gäi lµ trung Cohesin tö ë ®éng vËt hay thÓ cùc cña thoi v« s¾c ë nÊm ThÓ ®éng men vµ c¸c nÊm kh¸c) ë hai Thoi cùc ®èi diÖn cña tÕ bµo. Sù ph©n bµo g¾n kÕt c¸c nhiÔm s¾c tö víi Ph©n gi¶i thoi v« s¾c ®−îc thùc hiÖn cohesin nhê thÓ ®éng t¹i t©m ®éng. Trung t©m tæ chøc vi èng Thø hai lµ sù gi¶i kÕt dÝnh c¸c nhiÔm s¾c tö dÉn ®Õn (trung tö) mét sù kiÖn quan träng thø H×nh 7.8. C¸c sù kiÖn chÝnh x¶y ra trong pha S vµ pha M. a) Pha S: ba lµ sù ph©n ly cña c¸c §Çu tiªn, ph©n tö ADN sîi kÐp nh©n ®«i; ngay sau ®ã, protein yÕu tè nhiÔm s¾c tö. Theo ®ã, g¾n cohesin cã cÊu tróc d¹ng vßng quÊn quanh hai ph©n tö ADN võa ®−îc nh©n ®«i h×nh thµnh nªn phøc hÖ gåm hai nhiÔm s¾c tö chÞ em. mçi nhiÔm s¾c tö chÞ em b) Pha M: §Çu tiªn, thÓ ®éng g¾n vµo thoi v« s¾c; sau ®ã lµ sù gi¶i kÕt ®−îc kÐo vÒ c¸c cùc ®èi diÖn dÝnh cña cohesin vµ sù ph©n ly c¸c nhiÔm s¾c tö vÒ hai cùc tÕ bµo. cña thoi v« s¾c. C¸c sù kiÖn trªn ®−îc ®iÒu hoµ chÆt chÏ ®Ó sù ph©n ly NST diÔn ra chÝnh x¸c vµ hoµn h¶o. 7.2.3. CÊu tróc nhiÔm s¾c thÓ thay ®æi khi tÕ bµo eukaryote ph©n chia Qua c¸c pha cña chu tr×nh tÕ bµo, cÊu tróc NST thay ®æi liªn tôc. Tuy nhiªn, cã hai tr¹ng th¸i chÝnh ®Æc tr−ng cho cÊu tróc cña NST. Khi tÕ bµo nguyªn ph©n hoÆc gi¶m ph©n, c¸c NST tr¶i qua qu¸ tr×nh kÕt ®Æc, t¹o ra c¸c NST xo¾n chÆt ®Ó qu¸ tr×nh ph©n ly NST trong ph©n bµo diÔn ra thuËn lîi. ë giai ®o¹n gian k× (k× trung gian) gi÷a hai chu tr×nh tÕ bµo kÕ tiÕp (gåm 3 pha G1, S vµ G2), NST gi·n xo¾n ®Ó sao chÐp vµ phiªn m·. 7.2.4. Sù kÕt dÝnh c¸c nhiÔm s¾c tö vµ kÕt ®Æc nhiÔm s¾c thÓ do c¸c protein duy tr× cÊu tróc nhiÔm s¾c thÓ (SMC) thùc hiÖn C¸c phøc hÖ protein thùc hiÖn sù kÕt dÝnh nhiÔm s¾c tö vµ kÕt ®Æc NST cã quan hÖ víi nhau, chóng ®Òu chøa c¸c protein SMC (structural maintanance of chromosome). C¸c protein SMC ë d¹ng phøc, t−¬ng t¸c “më réng” víi nhau th«ng qua c¸c miÒn xo¾n-xo¾n kÝch th−íc dµi (xem thªm ch−¬ng 1). C¸c protein SMC kÕt hîp víi c¸c protein kh¸c t¹o thµnh phøc hÖ kÕt dÝnh hai chuçi ADN víi nhau. Mét phøc hÖ chøa SMC (®−îc gäi lµ cohesin) lµ thiÕt yÕu ®Ó g¾n kÕt hai nhiÔm s¾c tö chÞ em víi nhau. VÒ cÊu tróc, ng−êi ta cho r»ng, cohesin lµ mét vßng lín ®−îc cÊu t¹o tõ hai ph©n tö protein SMC vµ mét protein phi-SMC. Mét sè b»ng chøng cho thÊy, sù kÕt dÝnh hai nhiÔm s¾c tö chÞ em lµ nhê hai ph©n tö ADN nµy cïng “chui” qua trung t©m vßng cohesin (h×nh 7.9). Sù ph©n gi¶i tiÓu 231
§ç Lª Th¨ng - §inh §oµn Long phÇn protein phi-SMC nhê enzym sÏ më vßng cohesin. Sù kÕt ®Æc NST còng cÇn phøc hÖ chøa protein SMC ®−îc gäi lµ condensin. Dï cÊu tróc vµ chøc n¨ng cña condensin cßn ch−a râ, nh−ng cã lÏ nã cã ®Æc ®iÓm gièng cohesin vµ còng cã d¹ng vßng. Nhê cÊu tróc d¹ng vßng, nã cã thÓ gióp co ng¾n (gi¶m chiÒu dµi) NST b»ng c¸ch ®ång thêi liªn kÕt víi c¸c vïng kh¸c nhau cña NST. ChÊt nhiÔm s¾c Cohesin Codensin Kú ®Çu Kú gi÷a Kú sau H×nh 7.9. M« h×nh dù ®o¸n vÒ vai trß cña cohesin vµ codensin trong qu¸ tr×nh ph©n bµo. Cohesin vµ codensin lµ thµnh phÇn cña bé khung tÕ bµo. M« h×nh nµy cho r»ng chóng cã cÊu tróc vßng. Nhê vËy, cohesin vµ codensin cã thÓ liªn kÕt chÆt nh−ng vÉn linh ho¹t ®ång thêi víi c¸c vïng kh¸c nhau cña nhiÔm s¾c thÓ. 7.3. CÊu tróc vµ vai trß cña nucleosome (thÓ nh©n) 7.3.1. Nucleosome lµ ®¬n vÞ cÊu tróc c¬ b¶n cña nhiÔm s¾c thÓ ë eukaryote ADN cña c¸c eukaryote ®−îc bao B¶ng 7.4. MËt ®é nucleosome vµ chiÒu dµi trung gãi thµnh c¸c nucleosome (cßn ®−îc gäi b×nh c¸c ®o¹n ADN nèi ë mét sè loµi sinh vËt lµ thÓ nh©n). §©y chÝnh lµ møc cuén xo¾n ®Çu tiªn cña ADN ®Ó t¹o thµnh Loµi MËt ®é nucleosome §é dµi trung theo chiÒu dµi lÆp b×nh ®o¹n NST. Nucleosome gåm phÇn lâi h×nh l¹i trªn ADN (bp) ADN nèi (bp) thµnh nªn tõ 8 ph©n tö protein histon vµ ADN bao quanh chóng. ë mäi loµi NÊm men 160 - 165 13 -18 eukaryote, ®o¹n ADN quÊn quanh lâi NhÝm biÓn ~ 260 ~ 110 protein (kho¶ng 1,65 vßng) ®−îc gäi lµ Ruåi giÊm ~ 180 ~ 33 ADN lâi lu«n cã chiÒu dµi æn ®Þnh gåm 147 cÆp baz¬ nit¬ (h×nh 7.10). Ng−îc l¹i, Ng−êi 185 - 200 38 - 53 ®o¹n ADN nèi gi÷a c¸c nucleosome, ®−îc Nucleosome gäi lµ ADN nèi cã chiÒu dµi bÊt ®Þnh, th−êng dao ®éng tõ 20 - 60 cÆp baz¬ nit¬ vµ cã gi¸ trÞ trung b×nh ®Æc tr−ng cho mçi Lâi Histon ADN lâi loµi eukaryote (b¶ng 7.4). CÊu tróc (147 bp) nucleosome lµm cho chiÒu dµi ph©n tö ADN gi¶m ®i kho¶ng s¸u lÇn. Tuy møc ®é “nÐn” nh− vËy ch−a thËt cao nh−ng nucleosome cßn cã vai trß quyÕt ®Þnh ë c¸c møc cÊu tróc tiÕp theo cña NST. ADN nèi ë mäi tÕ bµo ®Òu cã mét phÇn ADN (20 - 60 bp) kh«ng ®−îc bao gãi trong nucleosome. §ã lµ H×nh 7.10. S¬ ®å tæ chøc nucleosome nh÷ng vïng ADN tham gia vµo qu¸ tr×nh (nucleosome) biÓu hiÖn gen, sao chÐp hoÆc t¸i tæ hîp. Tuy kh«ng n»m trong cÊu tróc nucleosome nh−ng nh÷ng vïng nµy th−êng liªn kÕt víi c¸c protein phi histon lµm nhiÖm vô ®iÒu hoµ trùc tiÕp hoÆc tham gia vµo c¸c sù kiÖn ®ã. 232
Ch−¬ng 7. C¬ së di truyÒn häc nhiÔm s¾c thÓ Cã thÓ nãi, ë eukaryote, histon lµ nhãm protein liªn kÕt ADN phæ biÕn nhÊt. Cã n¨m lo¹i histon lµ H1, H2A, H2B, H3 vµ H4. Trong ®ã, bèn lo¹i H2A, H2B, H3 vµ H4 cÊu t¹o nªn lâi nucleosome, ®−îc gäi lµ c¸c histon lâi; mçi nucleosome gåm 8 ph©n tö histon (octamer), mçi lo¹i ®ãng gãp 2 ph©n tö. Cßn mét ph©n tö histon H1 liªn kÕt vµo vïng ADN nèi; v× vËy nã ®−îc gäi lµ histon nèi. Víi ®Æc ®iÓm nh− vËy, trong tÕ bµo c¸c histon lâi cã mÆt víi sè l−îng b»ng nhau, cßn H1 chØ cã víi sè l−îng b»ng mét nöa so víi c¸c lo¹i histon kh¸c. C¸c histon chøa nhiÒu axit amin tÝch ®iÖn d−¬ng, nªn nã cã thÓ liªn kÕt æn ®Þnh víi ph©n tö ADN tÝch ®iÖn ©m. Kho¶ng h¬n 20% sè axit amin cña c¸c histon lµ Lys vµ Arg. C¸c protein lâi lµ nh÷ng protein nhá, khèi l−îng dao ®éng kho¶ng 11 - 15 kD trong khi histon H1 cã khèi l−îng kho¶ng 20 kDa (b¶ng 7.5). B¶ng 7.5. C¸c ®Æc ®iÓm c¬ b¶n cña c¸c protein histon Lo¹i histon Histon Khèi l−îng l−îng ph©n tö (Da) TØ lÖ lysine vµ arginine Histon lâi H2A 14.000 20% Histon nèi H2B 13.900 22% H3 15.400 23% H4 11.400 24% H1 20.000 32% Lâi nucleosome cã cÊu a) §u«i Histon (®Çu N) MiÒn gÊp nÕp histon tróc h×nh ®Üa vµ chØ h×nh thµnh khi liªn kÕt víi ADN. H2A N C Khi kh«ng liªn kÕt víi ADN, c¸c histon h×nh thµnh H2B N C c¸c tËp hîp ë møc thÊp h¬n C (nh− c¸c phøc kÐp). Mäi H3 N histon lâi ®Òu chøa mét H4 N C vïng cã tÝnh b¶o thñ cao ®−îc gäi lµ miÒn gÊp nÕp b) “PhøckÐp”H2A-H2B “Tø phøc” H3-H4 histon (h×nh 7.11a). MiÒn C H2A N H3 N nµy gåm ba chuçi xo¾n α, c¸ch nhau b»ng hai ®o¹n H2B nèi kh«ng ®Æc tr−ng. Sù gÊp nÕp gi÷a c¸c cÆp histon t¹o N N nªn c¸c “dÞ phøc kÐp” NN (heterodimer), cã phÇn ®Çu C vµ ®u«i N kh¸c nhau. H3 H4 vµ H4 t¹o thµnh “dÞ phøc H×nh 7.11. CÊu tróc vµ sù t¹o phøc kÐp cña c¸c histon lâi. a) S¬ ®å kÐp H3 – H4”, råi hai “dÞ duçi th¼ng cña bèn histon lâi. Vïng xo¾n α ®−îc thÓ hiÖn b»ng h×nh èng phøc kÐp” nh− vËy kÕt hîp (®Ó ý r»ng, liÒn kÒ víi vïng cã cÊu tróc xo¾n α gièng nhau, c¸c histon cßn víi nhau t¹o nªn “tø phøc” cã mét vïng xo¾n α bæ sung). b) C¸c d¹ng phøc kÐp cña histon lâi. (tetramer). Trong khi ®ã, H2A vµ H2B còng kÕt hîp víi nhau t¹o nªn “dÞ phøc kÐp H2A - H2B”, nh−ng kh«ng t¹o thµnh “tø phøc”. C¸c phøc kÐp nªu trªn kÕt hîp víi nhau vµ víi ADN theo mét trËt tù nhÊt ®Þnh ®Ó t¹o thµnh nucleosome. Theo ®ã, tr−íc tiªn “tø phøc H3 - H4” g¾n kÕt vµo ADN, råi c¸c “phøc kÐp H2A-H2B” míi kÕt hîp vµo ®Ó t¹o nªn nucleosome hoµn chØnh. §u«i N cña histon (gäi t¾t lµ ®u«i histon) cã cÊu tróc dÔ biÕn ®æi vµ trong dung dÞch nã lµ phÇn thuéc nucleosome dÔ tiÕp cËn nhÊt. Kh¶ n¨ng tiÕp cËn nµy cã thÓ nhËn thÊy dÔ 233
Search
Read the Text Version
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 19
- 20
- 21
- 22
- 23
- 24
- 25
- 26
- 27
- 28
- 29
- 30
- 31
- 32
- 33
- 34
- 35
- 36
- 37
- 38
- 39
- 40
- 41
- 42
- 43
- 44
- 45
- 46
- 47
- 48
- 49
- 50
- 51
- 52
- 53
- 54
- 55
- 56
- 57
- 58
- 59
- 60
- 61
- 62
- 63
- 64
- 65
- 66
- 67
- 68
- 69
- 70
- 71
- 72
- 73
- 74
- 75
- 76
- 77
- 78
- 79
- 80
- 81
- 82
- 83
- 84
- 85
- 86
- 87
- 88
- 89
- 90
- 91
- 92
- 93
- 94
- 95
- 96
- 97
- 98
- 99
- 100
- 101
- 102
- 103
- 104
- 105
- 106
- 107
- 108
- 109
- 110
- 111
- 112
- 113
- 114
- 115
- 116
- 117
- 118
- 119
- 120
- 121
- 122
- 123
- 124
- 125
- 126
- 127
- 128
- 129
- 130
- 131
- 132
- 133
- 134
- 135
- 136
- 137
- 138
- 139
- 140
- 141
- 142
- 143
- 144
- 145
- 146
- 147
- 148
- 149
- 150
- 151
- 152
- 153
- 154
- 155
- 156
- 157
- 158
- 159
- 160
- 161
- 162
- 163
- 164
- 165
- 166
- 167
- 168
- 169
- 170
- 171
- 172
- 173
- 174
- 175
- 176
- 177
- 178
- 179
- 180
- 181
- 182
- 183
- 184
- 185
- 186
- 187
- 188
- 189
- 190
- 191
- 192
- 193
- 194
- 195
- 196
- 197
- 198
- 199
- 200
- 201
- 202
- 203
- 204
- 205
- 206
- 207
- 208
- 209
- 210
- 211
- 212
- 213
- 214
- 215
- 216
- 217
- 218
- 219
- 220
- 221
- 222
- 223
- 224
- 225
- 226
- 227
- 228
- 229
- 230
- 231
- 232
- 233
- 234
- 235
- 236
- 237
- 238
- 239
- 240
- 241
- 242
- 243
- 244
- 245
- 246
- 247
- 248
- 249
- 250
- 251
- 252
- 253
- 254
- 255
- 256
- 257
- 258
- 259
- 260
- 261
- 262
- 263
- 264
- 265
- 266
- 267
- 268
- 269
- 270
- 271
- 272
- 273
- 274
- 275
- 276
- 277
- 278
- 279
- 280
- 281
- 282
- 283
- 284
- 285
- 286
- 287
- 288
- 289
- 290
- 291
- 292
- 293
- 294
- 295
- 296
- 297
- 298
- 299
- 300
- 301
- 302
- 303
- 304
- 305
- 306
- 307
- 308
- 309
- 310
- 311
- 312
- 313
- 314
- 315
- 316
- 317
- 318
- 319
- 320
- 321
- 322
- 323
- 324
- 325
- 326
- 327
- 328
- 329
- 330
- 331
- 332
- 333
- 334
- 335
- 336
- 337
- 338
- 339
- 340
- 341
- 342
- 343
- 344
- 345
- 346
- 347
- 348
- 349
- 350
- 351
- 352
- 353
- 354
- 355
- 356
- 357
- 358
- 359
- 360
- 361
- 362
- 363
- 364
- 365
- 366
- 367
- 368
- 369
- 370
- 371
- 372