§inh §oµn Long b) Chu kú tiÒm tan a) Chu kú g©y tan Virut l©y nhiÔm tÕ bµo chñ ADN virut ®−îc chuyÓn [ChiÕu x¹ UV] Ph©n chia vµo tÕ bµo chñ tÕ bµo ADN virut ikÕt hîp víi hÖ G©y tan Sao chÐp ADN virut theo gen nh©n tÕ bµo chñ Ph©n chia tÕ bµo tÕ bµo chñ kiÓu cuén vßng trßn ADN vµ c¸c thµnh phÇn cña virut ®ãng gãi thµnh virut thÕ hÖ con H×nh 3.10. Chu kú g©y tan vµ chu kú tiÒm tan cña phage lambda (λ) a) C¸c gen sao chÐp ADN C¸c gen cÊu tróc C¸c gen t¸i tæ hîp C¸c gen tiÒm tan C¸c gen g©y tan phÇn ®Çu virut C¸c gen cÊu tróc phÇn ®u«i virut att int xis α β γ cIII N cl cro cII O P Q S R Cos Cos H×nh 3.11. B¶n ®å gen cña phage lambda (λ). b) cIII N cl cro a) B¶n ®å c¸c gen d¹ng m¹ch th¼ng (d¹ng tù nhiªn cII cña virut), b) b¶n ®å gen ë d¹ng m¹ch vßng (d¹ng β γ O tån t¹i trong E. coli sau khi virut l©y nhiÔm; 2 ®Çu α P cos g¾n víi nhau h×nh thµnh vßng trßn khÐp kÝn). xis Q Nh−ng ®èi víi mét sè lo¹i virut, int nh− phag¬ λ hay HIV, chóng cã kh¶ att S n¨ng kh¸c. C¸c virut nµy cã kh¶ n¨ng R kÕt hîp vËt chÊt di truyÒn cña chóng víi Cos hÖ gen cña tÕ bµo chñ. Nhê vËy, c¸c virut nµy cã thÓ ®−îc truyÒn tõ thÕ hÖ tÕ bµo nµy sang thÕ hÖ tÕ bµo kh¸c th«ng qua qu¸ tr×nh ph©n chia cña tÕ bµo chñ. C¸c lo¹i phag¬ (hoÆc virut) ®· g¾n ®−îc ADN C¸c gen C¸c gen cña chóng vµo nhiÔm s¾c thÓ cña tÕ bµo cÊu tróc phÇn ®u«i cÊu tróc phÇn ®Çu chñ ®−îc gäi lµ phag¬ (virut) tiÒm tan. Cho ®Õn nay, c¬ chÕ vÒ hiÖn t−îng tiÒm tan vµ g©y tan ®−îc biÕt râ h¬n c¶ ë phag¬ λ khi l©y nhiÔm tÕ bµo chñ E. coli. Trong phÇn nµy chóng ta sÏ xem xÐt hiÖn t−îng tiÒm tan vµ g©y tan ë phag¬ λ (h×nh 3.10). Phag¬ λ lµ mét virut cã kÝch th−íc trung b×nh. VËt chÊt di truyÒn cña nã lµ ADN sîi kÐp, m¹ch th¼ng (h×nh 3.11a), gåm 48.502 cÆp baz¬ nit¬, m· hãa cho kho¶ng 50 gen. Ph©n tö ADN sîi kÐp m¹ch th¼ng nµy cã mét ®Æc ®iÓm ®Æc biÖt lµ: hai ®Çu 5’ cña hai m¹ch ®¬n cã tr×nh tù gåm 12 nucletotit bæ sung víi nhau. Tr×nh tù ë hai ®Çu tËn cïng 84
Ch−¬ng 3. Sao chÐp axit nucleic nµy cña phag¬ λ ®−îc gäi lµ ®Çu dÝnh (cohensive ends), hay vÞ trÝ Cos. Khi virut l©y nhiÔm vµo tÕ bµo chñ, ph©n tö ADN nµy sÏ chuyÓn vÒ d¹ng cÊu tróc vßng kÝn nhê enzym ADN ligase cña E. coli nèi hai ®Çu Cos l¹i víi nhau (h×nh 3.11b). TiÕp theo, enzym ADN gyrase cña tÕ bµo chñ sÏ gióp ph©n tö ADN virut tiÕp tôc cuén xo¾n. Sau khi l©y nhiÔm E. coli, phag¬ λ cã thÓ chuyÓn vÒ mét trong hai tr¹ng th¸i: hoÆc lµ g©y tan (s¶n sinh ra c¸c phag¬ thÕ hÖ con vµ tiªu diÖt tÕ bµo chñ), hoÆc tiÒm tan (liªn kÕt hÖ gen cña nã víi hÖ gen cña tÕ bµo chñ). Trong qu¸ tr×nh nµy, mét sè yÕu tè (nh− thµnh phÇn c¸c chÊt dinh d−ìng trong m«i tr−êng, mËt ®é phag¬ so víi tÕ bµo chñ, v.v…) cã ¶nh h−ëng ®Õn xu h−íng tÕ bµo chuyÓn sang tr¹ng th¸i tiÒm tan hay g©y tan. Ch¼ng h¹n, khi m«i tr−êng nghÌo dinh d−ìng, trao ®æi chÊt ë vi khuÈn bÞ ¶nh h−ëng thËm trÝ ®Õn møc mµ tÕ bµo cña nã ph¶i tiÕn hµnh ph©n hñy c¸c ph©n tö protein vµ ARN cña chÝnh nã dÉn ®Õn viÖc virut còng cã thÓ bÞ bÊt ho¹t vµ chÕt. Ng−îc l¹i, khi mËt ®é virut cao, nÕu qu¸ tr×nh tiÒm tan kh«ng x¶y ra, virut sÏ sinh s¶n vµ ph¸ vì tÕ bµo chñ (tr¹ng th¸i g©y tan). ë tr¹ng th¸i tiÒm tan, tÕ bµo chñ kh«ng bÞ l©y nhiÔm bëi virut cïng lo¹i n÷a (hiÖn t−îng miÔn dÞch). Virut cã thÓ tån t¹i ë tr¹ng th¸i tiÒm tan qua nhiÒu thÕ hÖ tÕ bµo chñ, nh−ng sau ®ã vµo bÊt cø lóc nµo, chóng còng cã thÓ b¾t ®Çu mét chu kú g©y tan míi. 3.2.4.1. Chu kú g©y tan Trong chu kú g©y tan, ADN cña phag¬ λ ®−îc sao chÐp theo nguyªn t¾c vßng l¨n. Ngoµi ra, nhê ho¹t ®éng cña enzym ARN polymerase, hÖ gen cña virut ®−îc phiªn m· trong tÕ bµo chñ. Qu¸ tr×nh g©y tan x¶y ra qua mét sè b−íc nh− sau: 1. ADN m¹ch th¼ng cña virut ®−îc “tiªm” vµo tÕ bµo chñ. 2. D−íi t¸c dông cña enzym ADN ligase, mèi liªn kÕt phosphodieste ë vÞ trÝ hai ®Çu dÝnh (Cos) cña ph©n tö ADN sîi kÐp, m¹ch th¼ng cña virut ®−îc h×nh thµnh, nhê vËy ph©n tö ADN chuyÓn thµnh d¹ng sîi kÐp, m¹ch vßng khÐp kÝn. 3. TiÕp theo, sù sao chÐp ADN b¾t ®Çu diÔn ra. Lóc ®Çu, ph©n tö ADN sîi kÐp, m¹ch vßng sao chÐp theo kiÓu θ (gièng cña E. coli), sau ®ã chuyÓn sang kiÓu sao chÐp vßng l¨n (gièng cña ΦX174). KiÓu sao chÐp thø nhÊt ®−îc sö dông nh»m lµm t¨ng sè ph©n tö ADN ®−îc dïng lµm khu«n tõ ®ã tæng hîp nªn c¸c protein cña virut, ®ång thêi ®−îc sö dông l¹i cho qu¸ tr×nh sao chÐp tiÕp theo. Trong khi ®ã, kiÓu sao chÐp thø hai ®−îc sö dông ®Ó sao chÐp c¸c ph©n tö ADN sau nµy ®−îc dïng lµm vËt chÊt di truyÒn l−u gi÷ trong c¸c h¹t virut thÕ hÖ con. ë c¶ hai kiÓu sao chÐp, s¶n phÈm t¹o ra ®Òu lµ c¸c ph©n tö ADN sîi kÐp. Khi ADN ®−îc sao chÐp theo kiÓu vßng l¨n, s¶n phÈm ADN míi ®−îc t¸ch khái sîi ADN mÑ ë vÞ trÝ Cos vµ ®−îc ®ãng gãi cïng víi c¸c protein vá cña virut (lóc nµy ®· ®−îc tæng hîp qua qu¸ tr×nh dÞch m·) ®Ó h×nh thµnh nªn phÇn ®Çu cña virut. Sau ®ã, phÇn ®u«i virut ®−îc g¾n vµo phÇn ®Çu ®Ó h×nh thµnh nªn h¹t virut hoµn chØnh. Nh−ng, kh«ng gièng nh− virut TMV, phag¬ λ kh«ng cã kh¶ n¨ng tù ®ãng gãi, mµ qu¸ tr×nh nµy cÇn sù “hç trî” cña mét sè protein ®Æc hiÖu trong tÕ bµo chñ. 4. Nhê ph¶n øng enzym, thµnh vµ mµng tÕ bµo chñ sÏ bÞ ph©n gi¶i vµ c¸c h¹t virut ®−îc gi¶i phãng ra ngoµi m«i tr−êng, tiÕp tôc l©y nhiÔm c¸c tÕ bµo chñ kh¸c. Trong mét chu kú g©y tan nh− trªn, tõ mét h¹t phag¬ l©y nhiÔm (tÕ bµo E. coli) cã thÓ s¶n sinh ra kho¶ng 100 h¹t phag¬ thÕ hÖ con. 3.2.4.2. Chu kú tiÒm tan Nh− ®· nãi ë trªn, trong ®iÒu kiÖn m«i tr−êng nhÊt ®Þnh (nghÌo dinh d−ìng, mËt ®é virut cao) virut cã thÓ chuyÓn vÒ tr¹ng th¸i “nghØ”, hay cßn gäi lµ tr¹ng th¸i tiÒm tan, cho ®Õn khi ®iÒu kiÖn m«i tr−êng thay ®æi thÝch hîp h¬n cho sù ph¸t triÓn cña virut. 85
§inh §oµn Long Phøc hÖ øc chÕ a) (d¹ng dÞ phøc kÐp) C¸c gen øc chÕ sinh OR3 OR2 OR1 Gen Cro vµ c¸c gen s¶n vµ g©y tiÒm tan sinh s¶n (g©y tan) b) C¸c tr×nh tù chØ huy (Operator) C¸c gen øc chÕ sinh Gen Cro vµ c¸c gen s¶n vµ g©y tiÒm tan sinh s¶n (g©y tan) Enzym RecA Phøc hÖ øc chÕ UV bÞ ph¸ hñy H×nh 3.12. CÊu tróc ph©n vïng c¸c gen tiÒm tan vµ g©y tan n»m t¸ch biÖt bëi c¸c tr×nh tù ®iÒu hßa ë phage λ. a) Khi phøc hÖ chÊt øc chÕ g¾n vµo c¸c tr×nh tù chØ huy OR1 vµ OR2, sù phiªn m· gen Cro vµ c¸c gen g©y tan bÞ øc chÕ; trong khi ®ã, sù biÓu hiÖn cña c¸c gen øc chÕ vµ c¸c gen g©y tiÒm tan ®−îc t¨ng c−êng → tr¹ng th¸i tiÒm tan, b) Khi cã chiÕu x¹ UV, hÖ thèng söa ch÷a SOS ®¸p øng vµ t¹o ra protein RecA. RecA gi¶i phãng phøc hÖ øc chÕ khái c¸c tr×nh tù chØ huy OR1 vµ OR2 vµ ph©n hñy phøc hÖ nµy; nhê vËy, ARN polymerase cã thÓ g¾n vµo tr×nh tù chØ huy vµ tiÕn hµnh phiªn m· gen cro vµ c¸c gen g©y tan → tr¹ng th¸i g©y tan ë tr¹ng th¸i tiÒm tan, ADN cña phag¬ λ liªn kÕt víi ADN tÕ bµo E. coli ë vÞ trÝ ®Æc hiÖu (kh¸c víi HIV cã thÓ liªn kÕt ngÉu nhiªn víi c¸c nhiÔm s¾c thÓ ë ng−êi) th−êng n»m gi÷a hai gen m· hãa c¸c enzym tham gia chuyÓn hãa galactose vµ tæng hîp biotin. VÞ trÝ nµy ®−îc gäi tªn lµ attB (att = attachment). Cßn vÞ trÝ g¾n ®Æc hiÖu cña hÖ gen virut (kh«ng ph¶i b¾t ®Çu tõ hai vÞ trÝ Cos) n»m ë gÇn gi÷a ph©n tö ADN cña virut ®−îc gäi lµ attP. Qu¸ tr×nh g¾n ADN virut vµo ADN tÕ bµo chñ cÇn ®Õn enzym integrase. Qu¸ tr×nh nµy cã thÓ ®¶o ng−îc. NghÜa lµ, sau ®ã virut cã thÓ chuyÓn tõ tr¹ng th¸i tiÒm tan trë vÒ tr¹ng th¸i g©y tan. Lóc nµy, ADN virut ®−îc t¸ch ra khái ADN tÕ bµo chñ nhê ho¹t ®éng cña mét enzym, gäi lµ excisionase (cïng phèi hîp víi enzym integrase vµ mét sè protein kh¸c cña tÕ bµo chñ). ViÖc phag¬ λ chuyÓn ®æi tõ tr¹ng th¸i tiÒm tan sang g©y tan phô thuéc vµo mét sè yÕu tè m«i tr−êng d−íi sù ®iÒu khiÓn cña mét c¬ chÕ di truyÒn. Cô thÓ, trong hÖ gen cña virut cã hai gen m· hãa cho hai lo¹i protein ®iÒu hßa qu¸ tr×nh tiÒm tan vµ g©y tan, gäi lµ cII vµ Cro. Trong ®ã, cII cã vai trß thóc ®Èy qu¸ tr×nh tæng hîp cña hai lo¹i protein kh¸c lµ protein cI (protein cã t¸c dông øc chÕ qu¸ tr×nh g©y tan) vµ integrase (protein xóc t¸c sù liªn kÕt ADN phag¬ vµo hÖ gen tÕ bµo chñ). Trong khi ®ã, protein Cro cã vai trß thóc ®Èy ho¹t ®éng cña enzym ARN polymerase nh»m phiªn m· c¸c gen g©y tan cña virut, ®ång thêi øc chÕ sù biÓu hiÖn cña gen m· hãa protein cI. 86
Ch−¬ng 3. Sao chÐp axit nucleic Trong cÊu t¹o hÖ gen virut cã mét tr×nh tù ADN ®−îc gäi lµ tr×nh tù chØ huy gåm 3 vÞ trÝ g¾n protein, ®−îc ®¸nh sè 1, 2 vµ 3 (h×nh 3.12). Tr×nh tù chØ huy nµy n»m ng¨n c¸ch gi÷a c¸c gen cÇn cho qu¸ tr×nh tiÒm tan vµ c¸c gen cÇn cho qu¸ tr×nh g©y tan. Cô thÓ, n»m vÒ phÝa ph¶i cña tr×nh tù chØ huy lµ c¸c gen tham gia vµo qu¸ tr×nh g©y tan vµ sinh s¶n cña virut, bao gåm c¸c gen OR1, OR2, OR3. N»m vÒ phÝa tr¸i cña tr×nh tù chØ huy lµ c¸c gen m· hãa protein cI vµ mét sè protein kh¸c cã t¸c dông øc chÕ qu¸ tr×nh g©y tan. Trong mét sè ®iÒu kiÖn m«i tr−êng nhÊt ®Þnh (ch¼ng h¹n: m«i tr−êng nghÌo dinh d−ìng), c¸c protein cII, råi sau ®ã lµ cI vµ integrase ®−îc t¨ng c−êng tæng hîp. Hai lo¹i protein cI vµ cII h×nh thµnh nªn phøc hÖ øc chÕ gåm hai tiÓu phÇn, råi g¾n vµo vÞ trÝ sè 1 cña tr×nh tù chØ huy (h×nh 3.12a). Khi phøc hÖ øc chÕ nµy g¾n vµo vÞ trÝ sè 1, cã hai hiÖu øng ®ång thêi x¶y ra: (1) ARN polymerase kh«ng thÓ g¾n ®−îc vµo tr×nh tù chØ huy vµ tiÕn hµnh phiªn m· c¸c gen g©y tan (n»m bªn ph¶i tr×nh tù chØ huy); (2) ¸i lùc liªn kÕt cña phøc hÖ øc chÕ vµo tr×nh tù chØ huy sè 2 t¨ng lªn. Khi phøc hÖ øc chÕ g¾n vµo vÞ trÝ sè 2 ®ång thêi lµm t¨ng ¸i lùc liªn kÕt cña enzym ARN polymerase vµo vÞ trÝ sè 3, nhê vËy sù biÓu hiÖn cña c¸c gen øc chÕ g©y tan t¨ng lªn. Nh− vËy, trong tr−êng hîp nµy, protein cI cã kh¶ n¨ng tù ®iÒu hßa sù biÓu hiÖn cña gen m· hãa chÝnh nã. B»ng c¸ch nh− vËy, víi sù ho¹t ®éng cña c¸c protein øc chÕ g©y tan vµ enzym integrase, hÖ gen cña virut ®−îc thóc ®Èy liªn kÕt víi hÖ gen cña tÕ bµo chñ, dÉn ®Õn tr¹ng th¸i tiÒm tan. Song song víi qu¸ tr×nh trªn ®©y, trong ®iÒu kiÖn m«i tr−êng nghÌo dinh d−ìng, tÕ bµo chñ E. coli ®ång thêi t¨ng c−êng viÖc tæng hîp mét l−îng lín c¸c ph©n tö tÝn hiÖu, nh− cAMP. Trong khi ®ã, trong hÖ gen virut ngoµi gen m· hãa protein cII cßn gen m· hãa enzym ph©n hñy protein cII nµy. V× viÖc tæng hîp enzym ph©n hñy protein cII l¹i lµ mét qu¸ tr×nh phô thuéc vµo cAMP, nªn khi nång ®é cAMP t¨ng cao, ho¹t ®éng tæng hîp enzym ph©n hñy cII bÞ øc chÕ. KÕt qu¶ lµ: khi m«i tr−êng nghÌo dinh d−ìng hoÆc mËt ®é virut cao, th× cã nhiÒu ph©n tö cAMP ®−îc t¹o thµnh vµ cã Ýt enzym ph©n hñy cII ®−îc tæng hîp, dÉn ®Õn trong tÕ bµo cã mét l−îng lín protein cII ho¹t ®éng. V× vËy, còng dÉn ®Õn tr¹ng th¸i tiÒm tan. T−¬ng tù nh− vËy, trong tr−êng hîp mËt ®é virut trong m«i tr−êng t¨ng cao, l−îng protein cII ®−îc tæng hîp nhiÒu h¬n do sè l−îng b¶n sao cña virut trong tÕ bµo chñ t¨ng lªn. Lóc ®ã, mét l−îng lín protein cII ®−îc t¹o ra (tr−íc khi c¸c gen g©y tan ®−îc ho¹t hãa) thóc ®Èy sù biÓu hiÖn gen cI. §Õn l−ît m×nh, protein cI l¹i t¨ng c−êng øc chÕ sù biÓu hiÖn cña c¸c gen g©y tan (vÝ dô: OR1, OR2, OR3), dÉn ®Õn viÖc tÕ bµo chuyÓn sang tr¹ng th¸i tiÒm tan. Ng−îc l¹i, trong mét sè ®iÒu kiÖn m«i tr−êng nhÊt ®Þnh (nh− thiÕu thymine hoÆc cã mÆt khÝ nit¬) hoÆc khi cÊu tróc ADN cña vi khuÈn bÞ sai háng (vÝ dô: do chiÕu x¹ tÞa UV, tia X), hoÆc do sù k×m h·m qu¸ tr×nh biÓu hiÖn cña c¸c gen øc chÕ g©y tan nh− cI, th× virut cã thÓ chuyÓn tõ tr¹ng th¸i tiÒm tan trë vÒ tr¹ng th¸i g©y tan. Trong tr−êng hîp nµy (ch¼ng h¹n khi ADN tÕ bµo chñ bÞ sai háng), tÕ bµo chñ cã thÓ kÝch ho¹t hÖ thèng söa ch÷a SOS cña nã. HÖ thèng SOS nµy ho¹t ®éng dÉn ®Õn viÖc biÓu hiÖn mét sè gen cña tÕ bµo chñ, trong ®ã cã gen m· hãa protein RecA lµ protein ph¸ hñy protein cI cña phag¬ λ. ViÖc ph¸ hñy nµy ®i kÌm víi viÖc g©y bÊt ho¹t gen m· ho¸ protein cI (v× protein cI cã chøc n¨ng tù xóc t¸c ph¶n øng tæng hîp chÝnh nã) ®ång thêi ho¹t hãa mét sè gen kh¸c, 87
§inh §oµn Long trong ®ã cã gen m· hãa protein Cro (h×nh 3.12b). Protein Cro ®−îc t¹o ra sÏ thóc ®Èy viÖc biÓu hiÖn cña c¸c gen g©y tan (n»m bªn ph¶i tr×nh tù chØ huy), ®ång thêi øc chÕ viÖc gi¶i m· c¸c gen g©y tiÒm tan (n»m bªn tr¸i tr×nh tù chØ huy). §ång thêi, protein Cro cßn cã kh¶ n¨ng gi¶i phãng c¸c phøc hÖ øc chÕ khái hai vÞ trÝ g¾n sè 1 vµ 2 trªn tr×nh tù chØ huy. Nhê vËy, enzym ARN polymerase cã thÓ g¾n vµo tr×nh tù chØ huy vµ tr−ît vÒ phÝa ph¶i ®Ó phiªn m· c¸c gen g©y tan. Song song víi qu¸ tr×nh nµy, lóc ®ã b¶n th©n protein Cro cßn cã kh¶ n¨ng g¾n vµo vÞ trÝ sè 3 trªn tr×nh tù chØ huy vµ ng¨n c¶n kh«ng cho enzym ARN polymerase g¾n ®−îc vµo vÞ trÝ nµy vµ tiÕn hµnh phiªn m· c¸c gen g©y tiÒm tan. Nhê vËy, cïng víi sù ho¹t ®éng cña c¸c enzym excisionase, integrase vµ mét sè protein ®Æc hiÖu kh¸c, ADN cña phag¬ tiÒm tan t¸ch ra khái hÖ gen cña tÕ bµo chñ vµ tù tiÕn hµnh sao chÐp theo nguyªn t¾c vßng l¨n, dÉn ®Õn sù g©y tan. Nh− vËy, víi c¸c h×nh thøc sao chÐp vËt chÊt di truyÒn kh«ng cã cÊu tróc ph©n tö ADN sîi kÐp cña mét sè d¹ng virut nh− ®−îc tr×nh bµy ë trªn, chóng ta nhËn thÊy ph−¬ng thøc sao chÐp vËt chÊt di truyÒn ®· ®−îc ph¸t triÓn ®a d¹ng cïng víi qu¸ tr×nh tiÕn hãa cña virut vµ phï hîp víi tËp tÝnh ký sinh cña c¸c lo¹i virut trong tÕ bµo chñ. VÒ qu¸ tr×nh sinh ra sù ®a d¹ng nµy, cã thÓ nhËn thÊy chÝnh nhê kÝch th−íc vµ cÊu tróc hÖ gen nhá, ®¬n gi¶n, tÇn sè ®ét biÕn cao, kh¶ n¨ng t¸i tæ hîp víi hÖ gen cña c¸c loµi sinh vËt chñ, mµ c¸c lo¹i virut rÊt dÔ biÕn ®æi vµ thÝch nghi víi c¸c ®iÒu kiÖn sèng kh¸c nhau. 88
Ch−¬ng 4 Phiªn m· vµ dÞch m· di truyÒn 4.1. Gen biÓu hiÖn th«ng qua sù phiªn m· vµ dÞch m· CÊu tróc, chøc n¨ng, sù C¸c gen A vµ C ®−îc phiªn m· tõ m¹ch (+), trong khi … sinh tr−ëng vµ sinh s¶n cña mét c¬ thÓ phô thuéc vµo c¸c thuéc tÝnh protein cã trong mçi m«, tÕ ADN ARN Gen C 3’ bµo cña c¬ thÓ ®ã. Mét ph©n tö 5’ Gen A Gen B 5’ protein cã thÓ gåm mét hoÆc mét 3’ sè chuçi polypeptide; trong ®ã, tr×nh tù c¸c axit amin trong chuçi polypeptide ®−îc qui ®Þnh ARN ARN bëi tr×nh tù nucleotide trong gen (ADN). Khi tÕ bµo cÇn mét lo¹i … gen B ®−îc phiªn protein nµo ®ã, th«ng tin di m· tõ m¹ch (-). truyÒn tõ gen ®−îc “dÞch m·” thµnh tr×nh tù axit amin trong H×nh 4.1. ARN cã thÓ ®−îc phiªn m tõ bÊt cø m¹ch nµo ph©n tö protein t−¬ng øng. Qu¸ cña ADN sîi kÐp. Víi phÇn lín sinh vËt, mçi gen chØ ®−îc phiªn m· tõ mét m¹ch ADN, nh−ng c¸c gen kh¸c nhau cã tr×nh truyÒn th«ng tin nh− vËy thÓ ®−îc phiªn m· tõ mét trong hai m¹ch. M¹ch (+) theo qui (cßn gäi lµ sù biÓu hiÖn cña gen) ®−îc thùc hiÖn qua hai giai ®o¹n −íc lµ m¹ch cã tr×nh tù gièng víi mARN m· hãa protein ®Æc lµ “phiªn m·” vµ “dÞch m·”. tr−ng cña vËt chñ (vÝ dô: protein vá virut), m¹ch cßn l¹i lµ (-). Trong ®ã, phiªn m· lµ qu¸ tr×nh tæng hîp mét ph©n tö ARN (tr×nh tù c¸c ribonucleotide) m¹ch ®¬n lµ b¶n phiªn m· cña gen (tr×nh tù c¸c deoxyribonucleotide), cßn dÞch m· lµ qu¸ tr×nh tæng hîp protein (tr×nh tù c¸c axit amin) dùa trªn m¹ch khu«n lµ b¶n phiªn m· (ARN). Kh«ng gièng sao chÐp ADN vèn chØ diÔn ra mét lÇn duy nhÊt trong mçi chu tr×nh tÕ bµo, phiªn m· vµ dÞch m· diÔn ra liªn tôc trong suèt chu tr×nh tÕ bµo (tuy cã gi¶m ë pha M). N¨m 1956 (3 n¨m sau ngµy c«ng bè m« h×nh xo¾n kÐp ADN cïng Watson), Crick ®−a ra kh¸i niÖm vÒ “nguyªn lý trung t©m” ph¶n ¸nh hai giai ®o¹n cña mét qu¸ tr×nh biÓn hiÖn gen lµ ADN → ARN → protein. Trong phiªn m·, ARN ®−îc tæng hîp tõ m¹ch khu«n ADN. ë phÇn lín c¸c loµi, mçi gen th−êng chØ ®−îc phiªn m· tõ mét m¹ch cña ph©n tö ADN sîi kÐp, nh−ng c¸c gen kh¸c nhau cã thÓ ®−îc phiªn m· hoÆc tõ m¹ch nµy hoÆc tõ m¹ch kia cña ADN (h×nh 4.1). Trong hÖ gen, kh«ng ph¶i mäi gen ®Òu m· hãa protein; nãi c¸ch kh¸c, kh«ng ph¶i mäi b¶n phiªn m· ARN ®Òu ®−îc dÞch m·. Trong thùc tÕ, cã 4 lo¹i ARN chÝnh (ngoµi mét sè lo¹i kh¸c), mçi lo¹i ®−îc m· hãa bëi mét nhãm gen kh¸c nhau, bao gåm: 1) mARN (ARN th«ng tin) m· hãa cho tr×nh tù axit amin cña chuçi polypeptide. C¸c mARN chÝnh lµ b¶n phiªn m· cña c¸c gen m· hãa protein, cßn gäi lµ gen cÊu tróc. 2) rARN (ARN ribosome) kÕt hîp víi c¸c protein ribosome ®Ó t¹o nªn c¸c ribosome hoµn chØnh. Ribosome chÝnh lµ “bé m¸y dÞch m·” tr×nh tù mARN thµnh protein. 89
§inh §oµn Long 3) tARN (ARN vËn chuyÓn) lµm nhiÖm vô vËn chuyÓn c¸c axit amin tíi ribosome trong dÞch m·; ®ãng vai trß nh− “ng−êi phiªn dÞch” ®Ó chuyÓn “ng«n ng÷” cña c¸c nucleotide trªn ARN thµnh “ng«n ng÷” cña c¸c axit amin trªn ph©n tö protein. 4) snARN (ARN nh©n nhá) kÕt hîp víi protein h×nh thµnh nªn phøc hÖ hoµn thiÖn ARN (c¾t c¸c intron) sau phiªn m·, gäi lµ spliceosome. Trong phÇn sau cña ch−¬ng nµy, chóng ta sÏ ®Ò cËp ®Õn mét sè khÝa c¹nh cña c¸c qu¸ tr×nh phiªn m· vµ dÞch m· ë prokaryote vµ eukaryote, còng nh− vÒ c¸c lo¹i ARN. 4.2. Phiªn m· (tæng hîp ARN) 4.2.1. C¸c thµnh phÇn tham gia qu¸ tr×nh phiªn m· Trong qu¸ tr×nh phiªn m·, ARN ®−îc tæng hîp theo chiÒu 5’ → 3’. M¹ch ADN (chiÒu 3’ → 5’) ®−îc ARN polymerase tr−ît trªn ®ã ®Ó tiÕn hµnh phiªn m· ®−îc gäi lµ m¹ch khu«n ADN. M¹ch ADN bæ sung (chiÒu 5’ → 3) ®−îc gäi lµ m¹ch kh«ng lµm khu«n. Do tr×nh tù m¹ch ADN kh«ng lµm khu«n cã chiÒu ph©n cùc vµ tr×nh tù nucleotide gièng víi ARN ®−îc t¹o thµnh nªn ®−îc gäi lµ m¹ch m· hãa; trong khi m¹ch kh«ng lµm khu«n ®−îc gäi lµ m¹ch ®èi m·. C¸c thµnh phÇn c¬ b¶n kh¸c tham gia qu¸ tr×nh phiªn m· bao gåm: 1) Enzym ARN polymerase (ARN pol): ®©y lµ enzym trùc tiÕp xóc t¸c ph¶n øng trïng hîp ARN. Enzym nµy cã kh¶ n¨ng tù t¸ch hai m¹ch ®¬n cña ph©n tö ADN sîi kÐp, tr−ît däc trªn mét m¹ch vµ xóc t¸c ph¶n øng trïng hîp ARN. Còng gièng ADN pol, ho¹t ®éng xóc t¸c ph¶n øng cña ARN pol ®−îc cung cÊp n¨ng l−îng tõ chÝnh sù ®øt g·y nhãm ~ cña c¸c dNTP; v× vËy, sù tæng hîp chØ diÔn ra theo chiÒu 5’→3’ vµ ARN pol dÞch chuyÓn trªn m¹ch ADN trong phiªn m· theo mét chiÒu nhÊt ®Þnh. Tuy nhiªn, kh¸c víi ADN pol, ARN pol cã kh¶ n¨ng tù khëi ®Çu ph¶n øng trïng hîp mµ kh«ng cÇn ®o¹n måi. ë prokaryote, toµn bé hÖ gen ®−îc phiªn m· bëi mét lo¹i ARN pol duy nhÊt; trong khi ®ã, ë eukaryote cã ba lo¹i (kÝ hiÖu lµ ARN pol I, II vµ III). 2) C¸c ribonucleotide triphosphate (NTP): Gièng nh− c¸c dNTP trong sao chÐp ADN, c¸c NTP võa lµ thµnh phÇn cÊu tróc nªn ARN, võa lµ nguån cung cÊp n¨ng l−îng cho qu¸ tr×nh phiªn m·. CÇn ph©n biÖt c¸c nucleotide cÊu t¹o nªn ARN vµ c¸c nucleotide cÊu t¹o nªn ADN. Chóng lµ 8 lo¹i nucleotide kh¸c nhau. Trong ®ã, cÊu t¹o nªn ARN lµ c¸c ribonucleotide cã vÞ trÝ C-2’ ë phÇn ®−êng ribose lµ nhãm –OH; cßn ADN ®−îc cÊu t¹o tõ c¸c deoxyribonucleotide cã vÞ trÝ C-2’ ë phÇn ®−êng lµ nhãm –H. 3) C¸c tr×nh tù ®iÒu hßa phiªn m·: ®ã lµ c¸c tr×nh tù nucleotide ®Æc thï trªn ADN ®¸nh dÊu vÞ trÝ gen ®−îc b¾t ®Çu vµ kÕt thóc phiªn m·, hoÆc lµ c¸c tr×nh tù ®iÒu khiÓn sù biÓu hiÖn cña gen. §o¹n tr×nh tù ADN mµ ë ®ã ARN pol g¾n vµo vµ khëi ®Çu phiªn m· ®−îc gäi lµ tr×nh tù khëi ®Çu phiªn m· (hay promoter). §o¹n tr×nh tù ADN mµ ë ®ã sù phiªn m· cña gen kÕt thóc ®−îc gäi lµ tr×nh tù (hay tÝn hiÖu) kÕt thóc phiªn m· (terminator). Sù khëi ®Çu vµ kÕt thóc phiªn m· ë prokaryote vµ eukaryote cã nh÷ng ®Æc ®iÓm kh¸c nhau (®−îc nªu ë phÇn sau). Nh×n chung, trong phiªn m·, v× ARN pol chuyÓn dÞch trªn ph©n tö ADN theo mét chiÒu, nªn promoter th−êng n»m ng−îc dßng (tøc lµ vÒ phÝa ®Çu 5’) cña ®o¹n tr×nh tù m· hãa ë mçi gen; ng−îc l¹i, c¸c terminator th−êng n»m xu«i dßng (vÒ phÝa ®Çu 3’) cña ®o¹n tr×nh tù m· hãa. Ngoµi c¸c tr×nh tù nªu trªn, sù phiªn m· ë nhiÒu gen cßn phô thuéc vµo c¸c tr×nh tù kh¸c lµ vÞ 90
Ch−¬ng 4. Phiªn m· vµ dÞch m· di truyÒn trÝ liªn kÕt cña c¸c yÕu tè ho¹t hãa (vÝ dô: enhancer) hoÆc cña c¸c protein ®iÒu hßa sù biÓu hiÖn gen (nh− operator, attenuator, v.v...; xem thªm ch−¬ng 5). 4) C¸c yÕu tè ®iÒu hßa phiªn m·: sù phiªn m· cña phÇn lín c¸c gen ë c¶ prokaryote vµ eukaryote ®Òu ®−îc ®iÒu khiÓn bëi nhiÒu protein kh¸c nhau. C¸c protein nµy cã thÓ lµ c¸c protein ho¹t hãa (®iÒu hßa d−¬ng tÝnh) hoÆc øc chÕ phiªn m· (®iÒu hßa ©m tÝnh), hoÆc lµ c¸c yÕu tè tham gia bé m¸y phiªn m·. Chóng ®−îc m· hãa bëi c¸c gen kh¸c trong hÖ gen, nh−ng t−¬ng t¸c víi c¸c tr×nh tù ®iÒu hßa ®Ó ®iÒu khiÓn sù biÓu hiÖn gen. 4.2.2. C¸c enzym ARN polymerase vµ qu¸ tr×nh phiªn m· XÐt vÒ c¬ chÕ hãa häc vµ ho¹t ®éng cña enzym, c¸c b−íc cña phiªn m· rÊt gièng víi sao chÐp ADN (ch−¬ng 3). C¶ hai qu¸ tr×nh ®Òu lµ ph¶n øng trïng hîp c¸c axit nucleic xóc t¸c bëi enzym; trong ®ã, mét m¹ch axit nucleic míi ®−îc tæng hîp dùa trªn mét m¹ch ADN s½n cã. Tuy nhiªn, gi÷a hai qu¸ tr×nh cã mét sè kh¸c biÖt, bao gåm: - ARN pol (enzym tæng hîp ARN) kh«ng cÇn ®o¹n måi nh− ADN pol; nã cã kh¶ n¨ng tù khëi ®Çu sù tæng hîp chuçi polyribonucleotide (ARN). Tuy vËy, sù khëi ®Çu nµy chØ cã thÓ diÔn ra tõ nh÷ng vÞ trÝ nhÊt ®Þnh trªn ph©n tö ADN, gäi lµ promoter. - §Ó sao chÐp ADN, phøc hÖ sao chÐp gåm ADN pol liªn kÕt ®ång thêi trªn hai m¹ch cña ADN sîi kÐp; viÖc t¸ch hai m¹ch ®−îc thùc hiÖn bëi mét sè protein ®Æc biÖt. Trong khi ®ã, ®Ó phiªn m·, ARN pol chØ liªn kÕt trªn mét m¹ch cña ph©n tö ADN; nã tù gi·n xo¾n cÊu tróc ADN xo¾n kÐp, ®ång thêi xóc t¸c ph¶n øng phiªn m· mµ kh«ng cÇn c¸c protein gi·n xo¾n vµ t¸ch m¹ch ®¬n chuyªn biÖt. - Nguyªn liÖu ®Ó ARN pol tæng hîp ARN lµ c¸c ribonucleotide triphosphate (ATP, GTP, CTP vµ UTP), gäi chung lµ NTP; trong khi nguyªn liÖu ®Ó ADN pol tæng hîp ADN lµ c¸c deoxyribonucleotide (dNTP). Ngoµi ra, trong phiªn m·, nucleotide ®−îc ARN pol dïng bæ sung vµo chuçi ARN ®Ó kÕt cÆp víi A lµ U, chø kh«ng ph¶i T nh− tr−êng hîp cña ADN pol. Nh− vËy, nÕu m¹ch khu«n ADN lµ [3’– ATACTGGAC – 5’] th× m¹ch ARN sÏ lµ [5’– UAUGACCUG – 5’]. - S¶n phÈm ARN ®−îc t¹o ra tõ phiªn m· kh«ng duy tr× liªn kÕt hydro víi m¹ch ADN lµm khu«n. Thay vµo ®ã, ARN pol “®Èy” m¹ch ARN míi tæng hîp ngay sau khi mét vµi ribonucleotide ®· ®−îc bæ sung vµo chuçi ARN. Sù t¸ch ra cña ARN lµ cÇn thiÕt ®Ó sau ®ã nã cã thÓ ®−îc dïng ngay lµm khu«n tæng hîp protein (ë prokaryote) hoÆc ®Ó biÕn ®æi thµnh ARN thµnh thôc s½n sµng cho dÞch m· (ë eukaryote). Còng nhê sù t¸ch ARN x¶y ra gÇn nh− ngay lËp tøc, mét gen cïng lóc cã thÓ ®−îc phiªn m· bëi nhiÒu ARN pol ®Ó t¹o nªn nhiÒu b¶n phiªn m· ®ång thêi. Nhê vËy, tÕ bµo cã thÓ tæng hîp ®−îc mét sè l−îng lín protein tõ mét gen duy nhÊt trong thêi gian ng¾n. - Tuy còng cã chøc n¨ng ®äc söa gièng ADN pol, ®é chÝnh x¸c cña c¸c ARN pol trong viÖc ghÐp cÆp c¸c nucleotide theo nguyªn t¾c Chargaff lµ thÊp h¬n. Trung b×nh, tÇn sè sai sãt trong phiªn m· lµ 10-4 - 10-6, cßn tÇn sè nµy trong sao chÐp ADN lµ 10-7 - 10-9. ë tÊt c¶ c¸c lo¹i tÕ bµo, ARN pol cã thÓ tån t¹i ë nhiÒu d¹ng kh¸c nhau, nh−ng chóng ®Òu xóc t¸c cho cïng ph¶n øng vµ cã nhiÒu ®Æc ®iÓm chung. Tõ vi khuÈn ®Õn thó, c¸c ARN pol ®Òu ®−îc cÊu t¹o gåm nhiÒu chuçi polypeptide (trõ mét sè phag¬ vµ ë bµo quan eukaryote). B¶ng 4.1 nªu sè l−îng vµ kÝch th−íc c¸c thµnh phÇn cña ARN pol ë c¸c giíi sinh vËt kh¸c nhau (prokaryote, eukaryote vµ archaea). D÷ liÖu trªn b¶ng cho thÊy ë prokaryote chØ cã mét lo¹i ARN pol, trong khi ë eukaryote cã ba lo¹i lµ ARN pol I, II vµ 91
§inh §oµn Long III. Trong ®ã ARN pol II ®−îc quan t©m h¬n c¶ bëi enzym nµy thùc hiÖn phiªn m· c¸c gen m· hãa protein (chiÕm phÇn lín hÖ gen) vµ tæng hîp nªn c¸c mARN. C¸c enzym ARN pol I vµ III thùc hiÖn phiªn m· c¸c gen tæng hîp nªn c¸c lo¹i ARN kh¸c. Trong ®ã, ARN pol I phiªn m· tæng hîp tiÒn-ARN tõ ®ã h×nh thµnh nªn c¸c rARN 23S vµ 18S; ARN pol III phiªn m· c¸c gen m· hãa c¸c tARN, rARN 5S vµ nhiÒu lo¹i ARN kÝch th−íc nhá kh¸c. Enzym lâi ARN pol ë vi khuÈn lµ phÇn xóc t¸c ph¶n øng tæng hîp ARN ®−îc cÊu t¹o tõ 5 chuçi polypeptide, gåm 2 chuçi α, 1 chuçi β, 1 chuçi β’ vµ 1 chuçi ω. Enzym nµy cã mèi quan hÖ gÇn víi ARN pol ë sinh vËt nh©n thËt (b¶ng 4.1). §Æc biÖt hai tiÓu phÇn lín lµ β vµ β’ rÊt gièng víi hai tiÓu phÇn lín cña ARN pol II (RPB1 vµ RPB2). C¸c chuçi α gièng víi RPB3 vµ RPB11, trong khi chuçi ω gièng víi RPB6. CÊu tróc cña ARN pol ë vi khuÈn rÊt gièng víi ARN pol II cña nÊm men. Nhê gièng nhau vÒ cÊu tróc, c¸c ARN pol ë c¸c sinh vËt kh¸c nhau biÓu hiÖn ho¹t ®éng rÊt gièng nhau. VÒ cÊu h×nh, ARN pol gièng B¶ng 4.1. Thµnh phÇn c¸c chuçi polypeptide cña c¸c nh− “cµng cua”. Trong ®ã, c¸c tiÓu enzym ARN polymerase (viÕt t¾t lµ ARN pol) phÇn lín (β vµ β’ ë prokaryote; RPB1 Prokaryote Archaea ARN pol I Eukaryote vµ RPB2 ë eukaryote) chiÕm phÇn (vi khuÈn) (vi khuÈn ARN pol II ARN pol III lín kh«ng gian ë mçi “cµng”. VÞ trÝ xóc t¸c n»m ë vïng gèi lªn nhau cña cùc ®oan) hai tiÓu phÇn vµ ®−îc gäi lµ “khe Enzym lâi Enzym lâi (pol I) (pol II) (pol III) β’ A’ / A” RPA1 RPB1 RPC1 trung t©m ho¹t ®éng” (h×nh 4.2). β B RPA2 RPB2 RPC2 Khe trung t©m ho¹t ®éng cña c¸c α1 RPC5 RPB3 RPC5 ADN pol vµ ARN pol th−êng liªn kÕt α2 D RPC9 RPB11 RPC9 víi 2 ion Mg2+ theo c¬ chÕ ®ång xóc L RPB6 RPB6 RPB6 t¸c víi c¸c ion hãa trÞ 2. CÊu h×nh ω [+ 9 chuçi [+ 7 chuçi [+ 11 chuçi cña ARN pol cho phÐp c¸c m¹ch K kh¸c] kh¸c] kh¸c] ADN, ARN vµ NTP ®i vµo vµ ra khái [+ 6 chuçi khe trung t©m ho¹t ®éng. kh¸c] 4.2.3. C¸c b−íc cña qu¸ tr×nh phiªn m· §Ó phiªn m· mét gen, ARN pol ph¶i tr¶i qua mét lo¹t c¸c b−íc ho¹t ®éng vµ th−êng ®−îc chia lµm ba giai ®o¹n: khëi ®Çu phiªn m·, ph¶n øng kÐo dµi chuçi ARN vµ kÕt thóc phiªn m·. §Æc ®iÓm c¬ b¶n cña c¸c giai ®o¹n phiªn m· nh− sau (h×nh 4.3): - Khëi ®Çu phiªn m·: ®−îc tÝnh tõ khi ARN pol (cïng víi c¸c yÕu tè khëi ®Çu phiªn m·) liªn kÕt vµo promoter ®Õn khi enzym nµy ®· tæng hîp Kªnh “tho¸t” “Cµng” mang chuçi β’ ®−îc mét m¹ch ARN gåm kho¶ng ARN 10 bp dùa trªn m¹ch khu«n ADN. Gièng nh− sao chÐp ADN, σ3.2 σ2 sù trïng hîp ARN chØ diÔn ra σ3.1 ADN (®o¹n σ4 -10 +1 ADN (®o¹n theo chiÒu 5’ → 3’. Tuy nhiªn, ng−îc dßng) -35 xu«i dßng) kh¸c víi qu¸ tr×nh sao chÐp, ë phiªn m· chØ cã mét m¹ch ADN σ1.1 “Cµng” mang ®−îc dïng lµm khu«n. Khi ARN Kªnh m¹ch chuçi β pol ®· liªn kÕt vµo promoter, ë Kªnh m¹ch m· hãa mçi gen lu«n chØ cã mét m¹ch lµm khu«n ®−îc dïng phiªn m·. ViÖc chän promoter nµo trong hÖ gen ®Ó H×nh 4.2. CÊu tróc “khe trung t©m ho¹t ®éng” cña ARN khëi ®Çu phiªn m· lµ mét c¬ chÕ polymerase ë vi khuÈn vµ phøc hÖ phiªn m më. ®iÒu hßa biÓu hiÖn gen c¬ b¶n (xem thªm ch−¬ng 5). 92
Ch−¬ng 4. Phiªn m· vµ dÞch m· di truyÒn C¸c b−íc thuéc khëi ®Çu phiªn m· ARN pol ®−îc chia lµm 3 giai ®o¹n nhá nh− sau: ADN ®o¹n +1 ADN i) h×nh thµnh phøc hÖ ®ãng: ®ã ng−îc dßng ®o¹n xu«i dßng lµ khi ARN pol võa liªn kÕt vµo promoter, ADN vÉn duy tr× ë Promoter d¹ng sîi kÐp, trong khi enzym liªn kÕt vµo bÒ mÆt cña chuçi Khëi ®Çu phiªn m· ARN pol liªn kÕt xo¾n kÐp; vµo promoter ii) h×nh thµnh phøc hÖ më: phøc Phøc hÖ “®ãng” hÖ ARN pol-promoter biÕn ®æi cÊu h×nh, trong ®ã ADN biÕn tÝnh Phøc hÖ “më” H×nh thµnh (t¸ch thµnh m¹ch ®¬n) trªn mét “bãng phiªn m·” ®o¹n dµi kho¶ng 14 bp quanh ®iÓm khëi ®Çu phiªn m· vµ h×nh ARN B¾t ®Çu thµnh nªn “bãng phiªn m·”; tæng hîp ARN iii) h×nh thµnh phøc hÖ phiªn m· KÐo dµi chuçi KÐo dµi chuçi gåm ba thµnh phÇn: hai ARN ARN ribonucleotide ®Çu tiªn ®−îc ®−a vµo “trung t©m xóc t¸c” cña ARN KÕt thóc phiªn m· ARN pol vµ xÕp th¼ng hµng víi c¸c baz¬ nit¬ bæ sung t−¬ng øng víi ARN pol chóng trªn m¹ch ADN khu«n. ARN Enzym b¾t ®Çu di chuyÓn däc m¹ch khu«n. Trong qu¸ tr×nh ®ã, ADN c¸c ribonucleotide ®−îc bæ sung tiÕp vµo chuçi ARN ®ang kÐo dµi. H×nh 4.3. Ba giai ®o¹n cña qu¸ tr×nh phiªn m : Trong thùc tÕ, hiÖu suÊt tæng hîp khëi ®Çu phiªn m , kÐo dµi chuçi vµ kÕt thóc ®o¹n ARN ban ®Çu th−êng thÊp; phiªn m . H×nh trªn chØ minh häa ADN, ARN pol ARN pol th−êng gi¶i phãng ra c¸c vµ ARN. C¸c yÕu tè tham gia phiªn m· kh«ng ®o¹n ARN ng¾n h¬n 10 bp vµ ®−îc minh häa ë ®©y (nh−ng ®−îc m« t¶ trong khëi ®éng l¹i sù phiªn m· nhiÒu bµi). VÞ trÝ (+1) lµ ®iÓm b¾t ®Çu phiªn m·. lÇn. Nh−ng, mét khi enzym ®· tæng hîp ®−îc mét ®o¹n ARN dµi h¬n 10 bp, nã tho¸t khái promoter, h×nh thµnh mét phøc hÖ phiªn m· gåm ba thµnh phÇn (ADN, ARN vµ protein) s½n sµng cho ph¶n øng kÐo dµi chuçi. - Ph¶n øng kÐo dµi chuçi ARN: Khi mét ®o¹n ng¾n ARN (kho¶ng 10 nucleotide) ®· h×nh thµnh, phøc hÖ phiªn m· chuyÓn sang giai ®o¹n kÐo dµi chuçi. Sù chuyÓn tiÕp gi÷a hai giai ®o¹n ®ßi hái sù thay ®æi cÊu h×nh cña ARN pol. Sù thay ®æi nµy lµ cÇn thiÕt ®Ó enzym mét mÆt liªn kÕt æn ®Þnh vµo m¹ch ADN khu«n ®ång thêi thùc hiÖn mét lo¹t c¸c chøc n¨ng kh¸c, 93
§inh §oµn Long bao gåm: gi·n xo¾n m¹ch ADN ë phÝa tr−íc, tæng hîp chuçi ARN, t¸ch chuçi ARN khái m¹ch khu«n ADN vµ ®ãng xo¾n trë l¹i m¹ch ADN ë phÝa sau. §Õn ®©y chóng ta nhí r»ng, ®Ó thùc hiÖn ®−îc c¸c ho¹t ®éng t−¬ng tù trong sao chÐp ADN, ADN pol cÇn sù “hç trî” cña mét sè enzym hoÆc protein kh¸c (nh− topoisomerase, helicase, ...). Cßn trong phiªn m·, c¸c chøc n¨ng trªn ®Òu ®−îc ARN pol thùc hiÖn. - KÕt thóc phiªn m·: Khi ARN pol ®· phiªn m· hÕt chiÒu dµi gen (hoÆc c¸c gen), nã cÇn dõng l¹i vµ gi¶i phãng b¶n phiªn m· ARN. Trong mét sè tr−êng hîp, tÝn hiÖu kÕt thóc phiªn m· cã cÊu tróc ®Æc biÖt phï hîp cho sù gi¶i phãng c¸c thµnh phÇn cña phøc hÖ phiªn m·. Trong c¸c tr−êng hîp kh¸c, tÝn hiÖu kÕt thóc phiªn m· chØ lµ c¸c ®o¹n tr×nh tù ®Æc thï gióp c¸c yÕu tè kÕt thóc phiªn m· nhËn ra vµ thóc ®Èy sù kÕt thóc phiªn m·. 4.2.4. Phiªn m· ë prokaryote 4.2.4.1.Khëi ®Çu phiªn m· VÒ lý thuyÕt, enzym lâi ARN pol cã thÓ khëi ®Çu phiªn m· tõ bÊt cø ®iÓm nµo trªn ADN khi nã ë d¹ng m¹ch ®¬n. Nh−ng, trong tÕ bµo sù khëi ®Çu phiªn m· chØ x¶y ra ë promoter, bëi v× chØ cã yÕu tè σ thuéc holoenzym khi liªn kÕt vµo promoter míi lµm thay ®æi cÊu h×nh ADN sîi kÐp thµnh d¹ng 2 m¹ch ®¬n (d¹ng \"bãng phiªn m·\"). ë E. coli, yÕu tè σ phæ biÕn nhÊt lµ σ70 cã khèi l−îng ph©n tö 70 kDa. C¸c promoter ®−îc yÕu tè σ70 nhËn biÕt ®Òu cã ®Æc ®iÓm chung gåm hai ®o¹n tr×nh tù æn ®Þnh dµi 6 bp c¸ch nhau mét ®o¹n tr×nh tù biÕn ®æi dµi 17 – 19 bp. Hai ®o¹n ADN æn ®Þnh cã vai trß quyÕt ®Þnh sù ®Ýnh kÕt cña ARN pol vµo promoter nªn ®−îc gäi lµ c¸c tr×nh tù liªn øng. TÝnh tõ nucleotide trung t©m, hai tr×nh tù liªn øng n»m ng−îc dßng vµ c¸ch nucleotide ®−îc phiªn m· ®Çu tiªn (vÞ trÝ +1) lµ 35 vµ 10 bp. Tr×nh tù liªn øng t¹i vÞ trÝ -35 (cßn gäi lµ hép -35, hay yÕu tè -35) ®iÓn h×nh lµ [5’-TTGACA-3’], cßn tr×nh tù liªn øng t¹i vÞ trÝ -10 (hép -10, hép Pribnow hay hép TATA) ®iÓn h×nh lµ [5’-TATAAT-3’]. D¹ng holoenzym cña ARN pol mang yÕu tè σ70 ®Ýnh kÕt vµo promoter qua hai b−íc. Trong b−íc thø nhÊt, nã ®Ýnh kÕt \"láng lÎo\" vµo vÞ trÝ -35; lóc nµy promoter ë d¹ng phøc hÖ ®ãng. Khi ARN pol t¨ng c−êng liªn kÕt vµo promoter t¹i vÞ trÝ -10, th× ph©n tö ADN ®−îc \"vÆn xo¾n\". Lóc nµy promoter chuyÓn sang d¹ng phøc hÖ më. Mét khi ARN pol ®· liªn kÕt vµo hép -10, nã sÏ khëi ®Çu sù phiªn m· ®óng t¹i nucleotide +1 cña gen. Trong thùc tÕ, hiÕm khi cã hai gen nµo mµ toµn bé tr×nh tù promoter cña chóng gièng hÖt nhau (ngay c¶ c¸c tr×nh tù liªn øng -35, -10 vµ ®o¹n gi÷a chóng). V× vËy, \"¸i lùc\" cña ARN pol víi promoter cña c¸c gen kh¸c nhau lµ kh¸c nhau. §©y lµ mét nguyªn nh©n gióp gi¶i thÝch t¹i sao c¸c gen kh¸c nhau th−êng ®−îc biÓu hiÖn ë møc ®é kh¸c nhau. Nh×n chung, promoter cµng cã c¸c tr×nh tù liªn øng gièng víi c¸c tr×nh tù ®iÓn h×nh th× tèc ®é biÓu hiÖn gen cµng cao. VÝ dô, promoter cã tr×nh tù -10 lµ [GATAAT] cã tèc ®é phiªn m· thÊp h¬n so víi tr×nh tù [TATAAT], bëi v× kh¶ n¨ng nhËn biÕt vµ liªn kÕt vµo promoter cña yÕu tè σ70 víi tr×nh tù thø nhÊt thÊp h¬n so víi tr×nh tù thø hai. ë E. coli, ng−êi ta t×m thÊy mét sè yÕu tè σ kh¸c nhau (cßn gäi lµ c¸c yÕu tè sigma thay thÕ) gi÷ vai trß quan träng trong ®iÒu hßa biÓu hiÖn cña c¸c gen. C¸c yÕu tè σ kh¸c nhau nhËn biÕt c¸c nhãm promoter kh¸c nhau, nh−ng ®Òu cã thÓ liªn kÕt víi enzym lâi. Qua c¬ chÕ nµy, c¸c yÕu tè σ kh¸c nhau gióp ARN pol nhËn biÕt ®−îc c¸c nhãm gen kh¸c nhau. Cô thÓ, phÇn lín c¸c promoter ë E. coli ®−îc nhËn biÕt bëi σ70. Nh−ng, trong ®iÒu kiÖn sèc nhiÖt hoÆc ë mét sè m«i tr−êng kh¾c nghiÖt, cã mét yÕu tè σ kh¸c lµ σ32 (khèi l−îng ph©n tö 32 kDa) ®−îc tæng hîp t¨ng lªn vÒ sè l−îng. YÕu tè σ32 nhËn biÕt promoter cña c¸c gen m· hãa protein cÇn cho sinh vËt ®¸p øng l¹i c¸c tÝn hiÖu kh¾c nghiÖt cña m«i tr−êng. Promoter cña nh÷ng gen nµy cã hai tr×nh tù liªn øng ®Æc thï víi σ32 lµ vÞ trÝ -39 94
Ch−¬ng 4. Phiªn m· vµ dÞch m· di truyÒn (tr×nh tù lµ [CCCCC]) vµ -15 (tr×nh tù lµ [TATAAATA]). Trong ®iÒu kiÖn m«i tr−êng thiÕu nit¬, mét yÕu tè σ thø ba lµ σ54 (khèi l−îng ph©n tö 54 kDa) ®−îc h×nh thµnh. YÕu tè nµy nhËn ra c¸c promoter cã tr×nh tù [GTGGC] t¹i vÞ trÝ -26 vµ [TTGCA] t¹i vÞ trÝ -14. Mét yÕu tè σ thø t− lµ σ23 (khèi l−îng ph©n tö 23 kDa) ®−îc tæng hîp khi tÕ bµo bÞ nhiÔm phag¬ T4. YÕu tè σ nµy nhËn ra c¸c promoter cã tr×nh tù [TATAATA] t¹i vÞ trÝ -15. C¸c yÕu tè σ kh¸c ®iÒu khiÓn sù biÓu hiÖn cña c¸c nhãm gen kh¸c nhau trong nh÷ng ®iÒu kiÖn nhÊt ®Þnh. Ngoµi E. coli, c¸c yÕu tè σ thay thÕ cßn ®−îc t×m thÊy ë nhiÒu vi khuÈn kh¸c. Ngoµi c¸c tr×nh tù liªn øng lµ vÞ trÝ liªn kÕt cña yÕu tè σ, mét sè promoter ho¹t ®éng m¹nh cßn cã mét sè tr×nh tù kh¸c gióp t¨ng c−êng sù t−¬ng t¸c gi÷a ARN pol vµ ADN. VÝ dô nh−: promoter cña c¸c gen m· hãa rARN cã yÕu tè UP lµ vÞ trÝ cã ¸i lùc cao víi ®Çu N cña chuçi α thuéc enzym ARN pol; v× vËy, ARN pol th−êng xuyªn ë tr¹ng th¸i liªn kÕt víi c¸c promoter nµy. Mét sè gen kh¸c l¹i cã promoter thiÕu mét trong c¸c tr×nh tù liªn øng, nh−ng l¹i ®−îc bæ sung bëi mét tr×nh tù kh¸c ®Ó \"bï ®¾p\" cho tr×nh tù thiÕu. Ch¼ng h¹n gen gal ë E. coli ®−îc nhËn biÕt bëi yÕu tè σ70. MÆc dï promoter cña gen nµy thiÕu tr×nh tù -35 ; nh−ng nã cã ®o¹n -10 më réng cã ¸i lùc cao víi yÕu tè σ70. Nh− vËy, râ rµng møc ®é phiªn m· cña mét gen phô thuéc vµo sù t−¬ng quan gi÷a ARN pol vµ promoter. 4.2.4.2. Ph¶n øng kÐo dµi chuçi ARN Sù tæng hîp ARN diÔn ra ë vïng m· hãa cña gen (th−êng t¸ch biÖt víi vïng promoter). Mét khi “bãng phiªn m·” vµ mét ®o¹n ARN gåm kho¶ng 10 ribonucleotide ®· h×nh thµnh, yÕu tè σ sÏ t¸ch khái enzym lâi ARN pol. Sau ®ã, yÕu tè σ cã thÓ ®−îc dïng l¹i cho mét chu kú khëi ®Çu phiªn m· míi, cßn enzym lâi tiÕp tôc ph¶n øng phiªn m·. Khi enzym lâi ARN pol di chuyÓn däc ph©n tö ADN sîi kÐp, nã b¸m trªn mét m¹ch cña ADN, lµm gi·n xo¾n ph©n tö nµy (h×nh 4.2). Trong vïng ADN ®−îc gi·n xo¾n (tøc lµ t¹i “bãng phiªn m·”), c¸c ribonucleotide (ARN) ®−îc enzym ARN pol xóc t¸c võa h×nh thµnh liªn kÕt phosphodieste víi m¹ch ARN ®ang kÐo dµi, võa t¹o liªn kÕt hydro víi c¸c deoxyribonucleotide (ADN) cña m¹ch ®èi m· h×nh thµnh nªn mét ®o¹n lai ADN – ARN. Tuy vËy, víi cÊu h×nh ®Æc biÖt ARN pol ngay sau ®ã t¸ch ph©n tö ARN khái ®o¹n lai, ®ång thêi ®ãng xo¾n trë l¹i ph©n tö ADN sau khi ®· tr−ît qua. Sù phiªn m· diÔn ra víi tèc ®é 30 – 50 nucleotide / gi©y. C¸c b»ng chøng thùc nghiÖm cho thÊy enzym ARN pol cã 2 ho¹t tÝnh ®äc söa. Mét ho¹t tÝnh ®äc söa gièng víi ADN pol, nghÜa lµ c¸c nucleotide kÕt cÆp sai ®−îc lo¹i bá b»ng ph¶n øng ng−îc víi ph¶n øng tæng hîp; råi enzym lïi l¹i ®Ó tæng hîp thay thÕ nucleotide ®óng vµo vÞ trÝ sai. Ho¹t tÝnh ®äc söa thø hai lµ enzym lïi l¹i mét hoÆc mét sè nucleotide råi c¾t bá ®o¹n ARN mang nucleotide sai, råi kh«i phôc l¹i b»ng ho¹t tÝnh tæng hîp. Còng gièng qu¸ tr×nh sao chÐp ADN, n¨ng l−îng cÇn cho sù tæng hîp ARN lµ tõ sù ®øt g·y nhãm ~ cña c¸c ribonucleotide triphosphate (NTP). 4.2.4.3. Sù kÕt thóc phiªn m· ë prokaryote, sù kÕt thóc phiªn m· x¶y ra khi enzym ARN pol tiÕp cËn tr×nh tù kÕt thóc phiªn m· (cßn gäi lµ tÝn hiÖu kÕt thóc phiªn m·). Cã mét protein quan träng tham gia vµo sù kÕt thóc phiªn m· ë mét sè gen cña E. coli ®−îc gäi lµ yÕu tè kÕt thóc phiªn m· Rho (viÕt t¾t lµ ρ). Tr×nh tù kÕt thóc phiªn m· cña nh÷ng gen nµy ®ång thêi ®−îc gäi lµ tr×nh tù kÕt thóc phiªn m· phô thuéc vµo Rho, hay tr×nh tù kÕt thóc phiªn m· lo¹i II. Nh−ng, ë nhiÒu gen kh¸c, ARN pol cã thÓ tù kÕt thóc phiªn m· ë nh÷ng tr×nh tù kÕt thóc phiªn m· cña gen mµ kh«ng cÇn ρ. Nh÷ng tr×nh tù nµy ®−îc gäi lµ c¸c tr×nh tù kÕt thóc phiªn m· kh«ng phô thuéc vµo Rho, hay tr×nh tù kÕt thóc phiªn m· lo¹i I. 95
§inh §oµn Long C¸c tÝn hiÖu kÕt thóc phiªn m· kh«ng phô thuéc vµo Rho (lo¹i I) th−êng mang tr×nh tù lÆp l¹i ®¶o ng−îc dµi kho¶ng 16 – 20 bp n»m ng−îc dßng ®iÓm kÕt thóc phiªn m·, theo sau lµ mét ®o¹n tr×nh tù gåm kho¶ng 4 - 8 cÆp A = T liªn tôc. Khi ARN pol phiªn m· qua ®o¹n tr×nh tù lÆp l¹i ®¶o ng−îc, phÇn ®Çu 3’ cña ph©n tö ARN míi sÏ h×nh thµnh mét cÊu tróc \"cÆp tãc\" theo sau lµ ®o¹n polyU (lµ kÕt qu¶ phiªn m· tõ ®o¹n A=T liªn tôc; xem h×nh 4.4). Sù h×nh thµnh cÊu tróc \"cÆp tãc\" lµm ARN pol dõng l¹i t¹i vÞ trÝ kÕt thóc phiªn m·. §ång thêi, t¹i tr×nh tù polyU, ®o¹n lai ADN-ARN cã liªn kÕt yÕu (A=U lµ liªn kÕt Chargaff yÕu nhÊt gi÷a c¸c baz¬ nit¬ cña axit nucleic) nªn chØ cÇn mét t¸c ®éng nhá lµ ®ñ ®Ó lµm g·y c¸c liªn kÕt hydro gi÷a hai m¹ch ADN vµ ARN. ChÝnh cÊu tróc cÆp tãc ë phÝa tr−íc ®o¹n tr×nh tù nµy ®· t¹o nªn mét lùc \"c¨ng\" lµm ®øt g·y liªn kÕt hydro vµ ph©n tö mARN t¸ch khái ADN còng nh− phøc hÖ phiªn m·, dÉn ®Õn sù kÕt thóc phiªn m·. C¸c tr×nh tù kÕt thóc phiªn m· phô thuéc vµo Rho (lo¹i II) th−êng kh«ng cã ®o¹n tr×nh tù polyA=T vµ trong nhiÒu tr−êng hîp kh«ng t¹o ra cÊu tróc cÆp tãc. M« h×nh kÕt thóc phiªn m· phô thuéc vµo Rho ®−îc m« t¶ nh− sau: protein Rho (ρ) mang mét miÒn liªn kÕt ARN vµ mét miÒn cã ho¹t tÝnh ATPase. Rho liªn kÕt vµo tr×nh tù kÕt thóc phiªn m· trªn ARN sau khi ®o¹n tr×nh tù nµy ®· tho¸t ra ngoµi ARN pol. Khi liªn kÕt vµo tr×nh tù nµy, Rho biÓu hiÖn ho¹t tÝnh ATPase vµ thñy ph©n ATP. N¨ng l−îng thñy ph©n tõ ATP sÏ t¸ch ARN khái ARN pol, ®ång thêi phøc hÖ phiªn m· t¸ch khái ADN. ë prokaryote, mÆc dï mçi vi khuÈn cã thÓ cã mét sè d¹ng holoenzym kh¸c nhau nh−ng chØ lu«n t×m thÊy mét enzym lâi ARN pol duy nhÊt; thÕ nªn, tÊt c¶ c¸c gen (m· hãa cho protein, tARN, rARN hay c¸c lo¹i ARN kh¸c) ®Òu ®−îc phiªn m· bëi enzym lâi nµy. a) Tr×nh tù tÝn hiÖu kÕt thóc phiªn m b) KÕt thóc phiªn m kh«ng phô thuéc ρ mARN ADN Tr×nh tù lÆp l¹i … M¹ch m· hãa ADN M¹ch lµm khu«n CÊu tróc “cÆp tãc” (N = nucleotide bÊt kú) … ®¶o ng−îc Phiªn m· ARN pol mARN CÊu tróc th¸o rêi phøc hÖ phiªn m· “cÆp tãc” tõ sù kÕt cÆp cña hai tr×nh tù lÆp l¹i ng−îc chiÒu TÝn hiÖu polyU mARN ARN pol H×nh 4.4. Sù kÕt thóc phiªn m kh«ng phô thuéc vµo yÕu tè Rho (ρ) ë prokaryote. a) TÝn hiÖu kÕt thóc phiªn m· trªn ADN t¹o ra vïng ®Çu 3' cña mARN mang mét tr×nh tù lÆp l¹i ®¶o ng−îc gåm 16 - 20 nucleotide, theo sau lµ mét tr×nh tù polyU; b) Tr×nh tù ®Çu 3' cña mARN t¹o nªn cÊu tróc \"cÆp tãc\"; ARN pol khi tiÕp cËn tr×nh tù polyA sÏ \"tung khái\" m¹ch khu«n vµ sù phiªn m· kÕt thóc. 4.2.5. Phiªn m· ë eukaryote Sù phiªn m· ë eukaryote nh×n chung lµ phøc t¹p h¬n sù phiªn m· ë prokaryote. Mét phÇn bëi v× ë eukaryote cã ba lo¹i ARN pol kh¸c nhau; ngoµi ra, do sù khëi ®Çu phiªn m· ë eukaryote th−êng cÇn sù tÝch hîp cña nhiÒu lo¹i tÝn hiÖu h¬n. 96
Ch−¬ng 4. Phiªn m· vµ dÞch m· di truyÒn 4.2.5.1. C¸c enzym ARN polymerase ë eukaryote, cã 3 lo¹i ARN pol tham gia phiªn m· tæng hîp c¸c lo¹i ph©n tö ARN kh¸c nhau. ARN pol I tËp trung ë h¹ch nh©n (nucleolus) vµ xóc t¸c ph¶n øng tæng hîp ba lo¹i rARN, gåm 28S, 18S vµ 5,8S. ARN pol II chØ cã trong sinh chÊt nh©n cña tÕ bµo; enzym nµy trùc tiÕp xóc t¸c c¸c ph¶n øng tæng hîp mARN vµ mét sè ARN tham gia vµo qu¸ tr×nh hoµn thiÖn ARN, bao gåm snARN. Enzym ARN pol III còng chØ thÊy trong vïng sinh chÊt nh©n; enzym nµy xóc t¸c ph¶n øng tæng hîp ba nhãm ARN, gåm i) c¸c tARN, ii) ARN ribosome 5S (5S rARN) vµ iii) c¸c snARN kh«ng ®−îc tæng hîp bëi ARN pol II. So víi cÊu tróc vµ chøc n¨ng cña ARN pol ë E. coli, cã thÓ nãi ®Õn nay cÊu tróc vµ ho¹t ®éng chøc n¨ng cña c¸c ARN pol ë eukaryote cßn ch−a biÕt ®Çy ®ñ. §iÒu duy nhÊt cã thÓ kh¼ng ®Þnh lµ: c¸c ARN pol ë eukaryote ®Òu cã cÊu t¹o tõ rÊt nhiÒu tiÓu phÇn kh¸c nhau; nãi c¸ch kh¸c, cã nhiÒu gen cïng phèi hîp m· hãa enzym nµy. Ch¼ng h¹n nh− ARN pol II cña nÊm men cã 12 chuçi polypeptide vµ cã cÊu tróc kh«ng gian kiÓu ch÷ \"U\". Trong 12 chuçi polypeptide lµ thµnh phÇn ARN pol II ë nÊm men, cã 5 chuçi ®ång thêi lµ thµnh phÇn cña ARN pol III ë sinh vËt nµy. Nh×n chung, c¸c enzym ARN pol kh¸c cña nÊm men còng cã c¸ch tæ hîp t−¬ng tù. 4.2.5.2. ARN polymerase II phiªn m· c¸c gen m· hãa protein Nh− ®· nªu ë trªn, nh÷ng hiÓu biÕt ®Õn nay cho thÊy tÊt c¶ c¸c gen m· hãa protein ®Òu ®−îc phiªn m· bëi ARN pol II. S¶n phÈm cña qu¸ tr×nh phiªn m· nµy lµ mét ph©n tö tiÒn-mARN. Së dÜ gäi lµ tiÒn-mARN bëi v× sau phiªn m· ph©n tö nµy tiÕp tôc biÕn ®æi vµ söa ®æi (hoÆc b»ng c¶ hai c¬ chÕ) ®Ó h×nh thµnh nªn ph©n tö mARN hoµn thiÖn ®−îc dïng cho dÞch m·. Sù biÕn ®æi ARN sau phiªn m· ®Ó ®¹t ®−îc d¹ng biÓu hiÖn chøc n¨ng cña nã ®−îc gäi lµ qu¸ tr×nh hoµn thiÖn ARN (®«i khi ®−îc gäi lµ chÕ biÕn ARN). a) C¸c tr×nh tù khëi ®Çu phiªn m· (promoter) vµ c¸c tr×nh tù t¨ng c−êng (enhancer) §Ó lµm râ cÊu tróc vµ chøc n¨ng cña c¸c promoter thuéc c¸c gen m· hãa protein, ng−êi ta th−êng tiÕp cËn theo hai h−íng chÝnh. H−íng thø nhÊt lµ theo dâi hËu qu¶ c¸c ®ét biÕn (thªm, mÊt hay thay thÕ nucleotide) trong vïng ADN n»m ng−îc dßng gen; ®Æc biÖt xem nh÷ng biÕn ®æi nµy ¶nh h−ëng thÕ nµo ®Õn sù phiªn m· cña gen. C¸c nucleotide ®ét biÕn cã ¶nh h−ëng râ rÖt ®Õn sù phiªn m· cña gen ®−îc xem lµ c¸c phÇn quan träng cña promoter. H−íng thø hai lµ so s¸nh tr×nh tù promoter cña nhiÒu gen víi nhau; trong ®ã, nh÷ng tr×nh tù gièng nhau ë nhiÒu gen ®−îc xem lµ c¸c tr×nh tù quan träng. Tõ c¸c nghiªn cøu nµy, ng−êi ta thÊy promoter cña phÇn lín gen m· hãa protein ë eukaryote th−êng gåm kho¶ng 200 bp (®«i khi dµi h¬n) n»m ng−îc dßng kÓ tõ vÞ trÝ b¾t ®Çu phiªn m· (+1) vµ mang mét sè tr×nh tù (cßn gäi lµ c¸c yÕu tè tr×nh tù) ®−îc chia lµm hai vïng chÝnh: vïng lâi promoter vµ vïng biªn promoter. Vïng lâi promoter gåm c¸c yÕu tè tr×nh tù t¸c ®éng gÇn (cis-acting) ®iÒu khiÓn viÖc b¾t ®Çu phiªn m· ®óng vÞ trÝ cña ARN pol. Vïng lâi promoter th−êng cã kÝch th−íc kho¶ng 50 bp n»m ng−îc dßng vµ s¸t ®iÓm b¾t ®Çu phiªn m·. Vïng lâi promoter ®iÓn h×nh gåm cã hai tr×nh tù: (i) mét tr×nh tù ng¾n kÝ hiÖu lµ Inr, n»m ng−îc dßng vïng m· hãa cña gen vµ më réng tíi vÞ trÝ b¾t ®Çu phiªn m·; (ii) hép TATA (cßn gäi lµ yÕu tè TATA, hay hép Goldberg-Hogness), th−êng n»m ë vÞ trÝ -30, cã mét tr×nh tù liªn øng ®iÓn h×nh gåm 7 nucleotide lµ [5’-TATAAAA-3’]. C¸c yÕu tè tr×nh tù Inr vµ TATA cã vai trß gióp ARN pol nhËn ra promoter vµ b¾t ®Çu phiªn m· chÝnh x¸c (t¹i ®óng vÞ trÝ +1). C¸c yÕu tè vïng biªn promoter th−êng n»m ng−îc dßng hép TATA, trong kho¶ng tõ vÞ trÝ -50 ®Õn -200 (kÓ tõ vÞ trÝ +1). Trong nhãm nµy cã thÓ kÓ ®Õn hép CAAT (®äc t¾t lµ hép \"cat\") cã tr×nh tù liªn øng lµ [CAAT] th−êng ë vÞ trÝ -75, vµ hép GC cã tr×nh tù 97
§inh §oµn Long liªn øng [GGGCGG] th−êng ë vÞ trÝ -90. C¶ hai hép CAAT vµ GC ®Òu cã thÓ biÓu hiÖn chøc n¨ng theo c¶ hai chiÒu (nghÜa lµ dï nã cïng chiÒu phiªn m· hay ng−îc l¹i, th× ARN pol ®Òu nhËn ra). §ét biÕn x¶y ra trong tr×nh tù cña hai hép nµy th−êng lµm gi¶m hiÖu suÊt phiªn m· cho thÊy chóng cã liªn quan trùc tiÕp ®Õn sù khëi ®Çu phiªn m·. C¸c promoter kh¸c nhau cã thÓ cã sù tæ hîp kh¸c nhau cña c¸c yÕu tè thuéc vïng lâi vµ vïng biªn. C¸c yÕu tè thuéc vïng biªn th−êng cã vai trß quan träng trong viÖc x¸c ®Þnh vÞ trÝ vµ thêi ®iÓm biÓu hiÖn cña gen. Trong ®ã, \"ch×a khãa\" cña sù ®iÒu hßa nµy lµ c¸c protein ho¹t hãa cã vai trß quyÕt ®Þnh mét gen cã ®−îc phiªn m· hay kh«ng. Ch¼ng h¹n, c¸c gen ®−îc biÓu hiÖn ë mäi tÕ bµo cña c¬ thÓ (c¸c gen \"gi÷ nhµ\") ®Òu mang c¸c yÕu tè vïng biªn lµ vÞ trÝ liªn kÕt cña c¸c protein ho¹t hãa cã mÆt phæ biÕn ë mäi tÕ bµo. Mét vÝ dô vÒ c¸c gen \"gi÷ nhµ\" lµ gen m· hãa actin vµ gen m· hãa enzym glucose-6- phosphate dehydrogenase. Ng−îc l¹i, c¸c gen chØ ®−îc biÓu hiÖn ë mét tÕ bµo nhÊt ®Þnh, hoÆc vµo mét thêi ®iÓm nhÊt ®Þnh cña qu¸ tr×nh ph¸t triÓn, th−êng chØ mang c¸c yÕu tè vïng biªn lµ vÞ trÝ liªn kÕt cña c¸c protein ho¹t hãa vèn chØ ®−îc tæng hîp ë nh÷ng tÕ bµo ®Æc thï vµ/hoÆc vµo mét thêi ®iÓm ®Æc tr−ng cña qu¸ tr×nh ph¸t triÓn. Mét sè tr×nh tù kh¸c, nh− enhancer (tr×nh tù t¨ng c−êng) cÇn thiÕt ®Ó gen ®−îc biÓu hiÖn ë møc tèi ®a. Enhancer lµ mét vÝ dô kh¸c vÒ c¸c yÕu tè t¸c ®éng gÇn. MÆc dï vÒ nguyªn t¾c, c¸c enhancer cã thÓ n»m ng−îc dßng, xu«i dßng thËm chÝ ®«i khi n»m trong tr×nh tù m· hãa cña gen, nh−ng vÞ trÝ phæ biÕn cña chóng lµ n»m ng−îc dßng gen. C¸c enhancer ®«i khi n»m c¸ch ®iÓm b¾t ®Çu phiªn m· hµng ngh×n nucleotide. Nh− vËy, c¸c enhancer ®iÒu hßa phiªn m· tõ mét kho¶ng c¸ch xa h¬n nhiÒu so víi c¸c yÕu tè thuéc promoter. C¸c enhancer th−êng mang mét chuçi c¸c ®o¹n ADN ng¾n, trong ®ã mét sè gièng víi c¸c yÕu tè tr×nh tù cña promoter ®−îc nªu ë trªn. C¸c protein ho¹t hãa cã thÓ võa liªn kÕt vµo enhancer, võa liªn kÕt víi mét sè protein ®iÒu hßa phiªn m· kh¸c. C¸c ®o¹n ADN mang enhancer ®−îc ®−a ®Õn gÇn promoter mµ t¹i ®ã ®· cã s½n bé m¸y phiªn m·, qua ®ã thóc ®Èy ho¹t ®éng cña bé m¸y nµy vµ gen ®−îc biÓu hiÖn ë møc tèi ®a. (Ho¹t ®éng cña c¸c protein ®iÒu hßa, promoter vµ enhancer ®−îc nªu kÜ h¬n ë ch−¬ng 5). b) Sù khëi ®Çu phiªn m· Sù khëi ®Çu phiªn m· c¸c gen m· hãa protein cã chÝnh x¸c hay kh«ng phô thuéc vµo viÖc \"l¾p r¸p\" cña enzym ARN pol II víi mét sè protein kh¸c ®−îc gäi lµ c¸c yÕu tè phiªn m· chung (general transciptional factor, GTF) t¹i tr×nh tù lâi promoter. C¶ ba lo¹i ARN pol ë eukaryote ®Òu cÇn c¸c yÕu tè GTF ®Ó cã thÓ khëi ®Çu phiªn m·. C¸c GTF ®−îc ®¸nh sè la m· (I, II vµ III) t−¬ng øng víi lo¹i ARN pol mµ chóng phèi hîp ho¹t ®éng. Ch¼ng h¹n, TFIID lµ yÕu tè phiªn m· thø t− ®−îc t×m thÊy ho¹t ®éng phèi hîp cïng ARN pol II. Trong ®iÒu kiÖn invitro, enzym ARN pol II vµ c¸c GTF liªn kÕt vµo promoter theo mét thø tù nhÊt ®Þnh ®Ó h×nh thµnh nªn phøc hÖ tiÒn khëi ®Çu phiªn m· (PIC). Së dÜ gäi lµ phøc hÖ tiÒn khëi ®Çu phiªn m·, bëi v× ë nhiÒu gen cña eukaryote ngay c¶ khi PIC ®· h×nh thµnh, gen vÉn ch−a ®−îc phiªn m·. ë nh÷ng gen nµy, ngoµi phô thuéc vµo PIC, cßn cÇn sù t−¬ng t¸c gi÷a c¸c protein ho¹t hãa víi c¸c tr×nh tù vïng biªn promoter hoÆc c¸c enhancer th× gen míi biÓu hiÖn. Trong ®iÒu kiÖn invivo, trËt tù \"l¾p r¸p\" cña c¸c GTF vµ ARN pol vµo promoter nh− thÕ nµo ®Õn nay ch−a râ. Mét sè d÷ liÖu cho thÊy d−êng nh− phøc hÖ phiªn m· gåm ARN pol vµ c¸c GTF ®−îc l¾p r¸p tr−íc khi tiÕp cËn promoter cña gen. NÕu ®iÒu nµy lµ ®óng, th× sù khëi ®Çu phiªn m· ë eukaryote râ rµng rÊt phøc t¹p, bëi v× phøc hÖ khëi ®Çu phiªn m· sÏ cã kÝch th−íc lín l¹i gÆp sù cã mÆt cña cÊu tróc nucleosome trong chÊt nhiÔm s¾c ë eukaryote (xem thªm ch−¬ng 5). 98
Ch−¬ng 4. Phiªn m· vµ dÞch m· di truyÒn 4.2.5.3. mARN ë eukaryote H×nh 4.5 mARN 5’- -3’ minh häa cÊu tróc chung cña mARN ë Vïng 5’ kh«ng ®−îc Tr×nh tù m· hãa protein (ORF) Vïng 3’ kh«ng ®−îc d¹ng hoµn thiÖn dÞch m· (5’UTR) dÞch m· (3’UTR) (s½n sµng cho dÞch m·) ë prokaryote m· b¾t ®Çu dÞch m· m· kÕt thóc dÞch m· vµ eukaryote. Theo (5’-UAG-3’) (UAA/UAG/UGA) ®ã, cÊu tróc cña H×nh 4.5. CÊu tróc chung cña mARN ®−îc dïng ®Ó dÞch m . a) Prokaryote b) Eukaryote mARN cã thÓ chia Mµng tÕ bµo Sinh chÊt lµm ba vïng ADN nh©n chÝnh. ë tËn cïng ®Çu 5’ lµ mét ®o¹n Nh©n tr×nh tù dÉn ®Çu, TÕ bµo chÊt tiÒn-mARN cßn gäi lµ vïng ®Çu 5’ kh«ng mARN vËn chuyÓn ®−îc dÞch m· (5’- Ribosome UTR) cã chiÒu dµi kh¸c nhau ë c¸c Protein mARN cña c¸c gen (polypeptide) kh¸c nhau. Theo sau 5’-UTR lµ H×nh 4.6. Phiªn m vµ dÞch m ë prokaryote vµ eukaryote. a) ë prokaryote, vïng tr×nh tù m· mARN ®−îc ARN pol tæng hîp kh«ng cÇn söa ®æi mµ cã thÓ ®−îc dïng ngay ®Ó dÞch m·. Do kh«ng cã mµng nh©n, dÞch m· cã thÓ b¾t ®Çu ngay c¶ khi hãa; ®©y chÝnh lµ tr×nh tù nucleotide phiªn m· ch−a kÕt thóc (sù kÕt cÆp phiªn m· - dÞch m·). b) ë eukaryote, b¶n x¸c ®Þnh tr×nh tù phiªn m· ®Çu tiªn (tiÒn-mARN) ph¶i qua qu¸ tr×nh hoµn thiÖn (gåm l¾p mò c¸c axit amin trªn m7G, g¾n ®u«i polyA vµ c¾t bá c¸c intron) míi ®−îc dïng ®Ó dÞch m·; chØ khi ph©n tö protein mARN hoµn thiÖn ®−îc vËn chuyÓn ra tÕ bµo chÊt sù dÞch m· míi diÔn ra. trong dÞch m·. Theo sau vïng tr×nh tù m· hãa lµ ®o¹n tr×nh tù theo sau, hay cßn gäi vµ vïng ®Çu 3’ kh«ng ®−îc dÞch m· (3’-UTR); ®o¹n tr×nh tù nµy qui ®Þnh tÝnh bÒn cña mARN vµ hiÖu suÊt dÞch m·. Sù tæng hîp mARN cã kh¸c nhau gi÷a prokaryote vµ eukaryote (h×nh 4.6). ë prokaryote, ph©n tö mARN míi ®−îc phiªn m· th−êng ®−îc sö dông ngay ®Ó tæng hîp protein. Ngoµi ra, do vi khuÈn kh«ng cã mµng nh©n nªn c¸c mARN cã thÓ ®−îc ribosome dïng ngay ®Ó dÞch m·, kÓ c¶ khi chóng ch−a ®−îc phiªn m· xong. Qu¸ tr×nh nµy ®−îc gäi lµ sù kÕt cÆp phiªn m· - dÞch m·. ë eukaryote, ph©n tö mARN sau phiªn m· (tiÒn- mARN) ph¶i tr¶i qua mét lo¹t c¸c sù kiÖn biÕn ®æi (qu¸ tr×nh hoµn thiÖn ARN) ®Ó h×nh thµnh nªn ph©n tö mARN hoµn thiÖn (cßn gäi lµ mARN thµnh thôc). Ngoµi ra, ë eukaryote ph©n tö mARN ph¶i ®−îc vËn chuyÓn tõ nh©n ra tÕ bµo chÊt n¬i cã sù tËp trung c¸c ribosome th× sù dÞch m· míi cã thÓ b¾t ®Çu. Nh− vËy, mét ph©n tö mARN ë eukaryote lu«n ®−îc phiªn m· hoµn chØnh vµ ®−îc hoµn thiÖn tr−íc dÞch m·. Mét kh¸c biÖt c¬ b¶n n÷a gi÷a mARN cña prokaryote vµ eukaryote lµ mARN cña prokaryote th−êng lµ ®a cistron, nghÜa lµ chóng ®ång thêi chøa th«ng tin m· hãa cña nhiÒu h¬n mét chuçi polypeptide; trong khi ®ã, mARN cña eukaryote lu«n lµ ®¬n cistron, nghÜa lµ nã chØ mang th«ng tin m· hãa mét chuçi polypeptide duy nhÊt. 99
§inh §oµn Long 4.2.6. Sù hoµn thiÖn vµ vËn chuyÓn ARN sau phiªn m· 4.2.6.1. Sù hoµn thiÖn mARN ë eukaryote Kh«ng gièng mARN cña prokaryote, mARN cña eukaryote ®−îc c¶i biÕn ë c¶ hai ®Çu 5’ vµ 3’. Ngoµi ra, CÇu phosphate 7-methylguanosine mét trong nh÷ng ph¸t hiÖn quan träng nhÊt cña di truyÒn häc ph©n tö ®−îc Richard Robert, Philip Sharp vµ Susan Berger t×m ra n¨m 1977 lµ c¸c gen cña mét sè virut ®éng vËt chøa c¸c tr×nh tù n»m trong gen nh−ng kh«ng ®−îc dÞch m· thµnh c¸c axit amin trong ph©n tö protein. HiÖn t−îng nh− vËy sau nµy ®−îc t×m thÊy ë tÊt c¶ c¸c loµi eukaryote. Trong thùc tÕ, hÇu hÕt c¸c gen m· hãa protein ë eukaryote ®Òu cã c¸c ®o¹n tr×nh tù kh«ng m· hãa axit amin n»m trong gen, sau nµy ®−îc gäi lµ c¸c intron. N»m xen kÏ gi÷a c¸c intron lµ c¸c exon. C¸c baz¬ nit¬ exon bao gåm c¸c ®o¹n tr×nh tù m· hãa axit amin trªn PhÇn ®Çu 5’ cña mARN ph©n tö protein vµ c¶ c¸c ®o¹n m· hãa c¸c tr×nh tù ë ®Çu (methyl hãa) 5’ vµ 3’ kh«ng ®−îc dÞch m· cña mARN (nh− vËy, exon lµ tr×nh tù trªn ADN m· hãa c¸c ®o¹n tr×nh tù cã mÆt trªn baz¬ nit¬ ph©n tö mARN s½n sµng cho dÞch m·). Trong qu¸ tr×nh hoµn thiÖn mARN, c¸c intron ®−îc c¾t bá. Gi¶i th−ëng (methyl hãa) Nobel vÒ Sinh lý häc vµ Y häc n¨m 1993 ®−îc trao cho Roberts vµ Sharp vÒ sù ph¸t hiÖn cña hä liªn quan ®Õn H×nh 4.7. CÊu tróc ®Çu 5’ cña \"sù ph©n m¶nh cña c¸c gen\". mARN hoµn thiÖn ë eukaryote. Mò 7-methylguanosine (m7G / m7Gppp) a) Sù c¶i biÕn ®Çu 5’ vµ 3’ cña mARN liªn kÕt vµo nucleotide ®Çu tiªn qua cÇu 5'-5'. Mét hoÆc hai nucleotide Sù l¾p mò ®Çu 5’ lµ b−íc ®Çu tiªn cña qu¸ tr×nh ®Çu tiªn ®−îc methyl hãa t¹i C-2'. hoµn thiÖn mARN. Mét khi enzym ARN pol II ®· tæng hîp ®−îc mét ®o¹n tiÒn-mARN dµi kho¶ng 20 – 30 nucleotide, th× mét enzym \"l¾p mò\" sÏ bæ sung mét nucleotide guanine ®−îc g¾n nhãm methyl (-CH3) t¹i vÞ trÝ sè 7 cña baz¬ guanosine (m7G) vµo ®Çu 5’ cña chuçi ARN qua liªn kÕt 5’-5’ (thay cho liªn kÕt th«ng th−êng lµ 5’-3’, h×nh 4.7). Nhê cÇu liªn kÕt 5’-5’, mò m7G b¶o vÖ ®−îc mARN trong suèt qu¸ tr×nh dÞch m· tr¸nh t¸c ®éng cña c¸c exonulcease. Ngoµi viÖc l¾p mò m7G, ë sinh vËt nh©n thËt bËc cao, mét hoÆc hai nucleotide ®Çu tiªn trong chuçi ®−îc methyl hãa ë vÞ trÝ C-2’ (hiÖn t−îng nµy kh«ng gÆp ë sinh vËt nh©n thËt bËc thÊp). C¸c tiÒn-mARN tr−íc khi ®−îc vËn chuyÓn tõ nh©n ra tÕ bµo chÊt ®ång thêi ®−îc biÕn ®æi ®Çu 3’ b»ng viÖc g¾n ®u«i polyA (th−êng lµ mét chuçi liªn tôc gåm 50 - 250 A). Trªn m¹ch ADN khu«n kh«ng cã tr×nh tù m· hãa ®u«i polyA nµy, mµ nã ®−îc bæ sung vµo mARN trong qu¸ tr×nh hoµn thiÖn. §u«i polyA cÇn ®Ó mARN ®−îc vËn chuyÓn \"an toµn\" tõ nh©n ra tÕ bµo chÊt. Trong tÕ bµo chÊt, ®u«i polyA ngoµi viÖc gióp b¶o vÖ ®Çu 3’ cña mARN khái sù t¸c ®éng cña c¸c exonuclease, cßn cã vai trß trong ®iÒu hßa tÝnh æn ®Þnh cña c¸c ph©n tö mARN vµ t¨ng hiÖu suÊt dÞch m· (xem phÇn dÞch m· d−íi ®©y). Sù kÕt thóc phiªn m· vµ g¾n ®u«i polyA ë eukaryote cã liªn quan ®Õn tr×nh tù liªn øng nhËn biÕt ®u«i [5’-AAUAAA-3] n»m gÇn ®Çu 3’ cña mARN. Th−êng th× trong qu¸ tr×nh phiªn m·, ARN pol II tæng hîp ph©n tö tiÒn-mARN v−ît qua vÞ trÝ nµy. Nh−ng mét lo¹i exonuclease ®Æc biÖt nhËn ra vÞ trÝ nµy vµ tiÕn hµnh c¾t ph©n tö ARN ®ang ®−îc kÐo dµi kho¶ng 10 ®Õn 30 nucleotide kÓ tõ mét vÞ trÝ cã ®«i nucleotide 5’-CA-3’. C¸ch vÞ trÝ 100
Ch−¬ng 4. Phiªn m· vµ dÞch m· di truyÒn c¾t mét qu·ng vÒ ®Çu 3’ cña mARN lµ mét ®o¹n tr×nh tù giµu GU còng cã vai trß gióp nhËn ra vÞ trÝ g¾n ®u«i polyA, nh−ng ®o¹n nµy sau ®ã ®−îc c¾t bá (h×nh 4.8). §Ó g¾n ®u«i polyA vµo mARN, cã sù tham gia cña hai protein liªn kÕt ARN cã tªn gäi lµ CPSF (yÕu tè c¾t ARN vµ g¾n ®u«i polyA) vµ CF1 (yÕu tè c¾t thø nhÊt). CPSF cã vÞ trÝ liªn kÕt vµo mARN lµ tr×nh tù [AAUAAA], cßn CF1 (cßn gäi lµ CST) cã vÞ trÝ liªn kÕt mARN lµ ®o¹n giµu GU. Khi CPSF vµ CF1 ®· liªn kÕt vµo mARN, chóng \"huy ®éng\" phøc hÖ polyadenine hãa tiÕp cËn mARN. Ngoµi CPSF vµ CF1, phøc hÖ polyadenine hãa cßn bao gåm mét yÕu tè c¾t mARN thø hai (CF2), enzym polyA-polymerase (PAP) vµ protein liªn kÕt tr×nh tù polyA (PABP). Khi phøc hÖ polyadenine hãa ®· hoµn chØnh vµ liªn kÕt vµo mARN, ph©n tö mARN ®−îc c¾t t¹i vÞ trÝ sau 5’-CA-3’. Khi ®ã, mARN cã ®Çu 3’ tù do ®−îc g¾n ®u«i polyA bëi ho¹t ®éng cña enzym PAP dïng c¬ chÊt ATP (®ång thêi lµ chÊt cho n¨ng l−îng). §o¹n polyA ®−îc PABP g¾n vµo vµ duy tr× trong dÞch m·. Sù g¾n ®u«i polyA lµ cÇn thiÕt cho sù dÞch m· ë nhiÒu gen (mét sè mARN ë eukaryote trong qu¸ tr×nh ph¸t triÓn ph«i kh«ng ®−îc dÞch m· nÕu thiÕu ®u«i polyA). Mét sè mARN ë vi khuÈn còng cã ®u«i polyA (dµi kho¶ng 10-20 bp). Nh−ng, ®iÒu ®¸ng l−u ý lµ ë prokaryote, vai trß cña ®u«i polyA hoµn toµn a) ADN ARN kh¸c biÖt víi ë eukaryote. Cô polymerase thÓ, ®u«i polyA l¹i thóc ®Èy sù biÕn tÝnh cña mARN ë TiÒn-mARN §o¹n giµu GU prokaryote. Thùc nghiÖm cho thÊy viÖc bæ sung ®u«i polyA b) TÝn hiÖu ®u«i vµo ADN l¹p thÓ còng thóc ®Èy sù biÕn tÝnh cña nã. §©y còng ADN Phøc hÖ g¾n ®u«i polyA lµ mét b»ng chøng cho thÊy biÓu hiÖn cña hÖ gen ë c¸c bµo ARN polymerase CF1 quan gièng víi c¸c hÖ gen vi CPSF khuÈn. TiÒn-mARN b) C¸ch c¾t intron ®iÓn C¾t rêi TiÒn-mARN h×nh ë sinh vËt nh©n thËt CF1 Ph©n tö tiÒn-mARN th−êng chøa mét sè intron. §Ó c) CPSF t¹o ra mARN hoµn thiÖn s½n sµng cho dÞch m·, c¸c intron TiÒn-mARN cÇn ®−îc c¾t khái tiÒn-mARN. Ph©n tö mARN hoµn thiÖn chØ Bæ sung ®u«i poly A mang tr×nh tù liªn tôc cña c¸c exon vèn bÞ t¸ch biÖt bëi c¸c d) intron khi ë trong gen. mARN Vµo n¨m 1977 khi Roberts vµ Sharp ph¸t hiÖn ra H×nh 4.8. Bæ sung ®u«i polyA vµo mARN ë eukaryote. intron, ng−êi ta t×m thÊy trong a) Trong qu¸ tr×nh phiªn m·, ARN pol tæng hîp ARN v−ît qua nh©n tÕ bµo mét l−îng lín \"tÝn hiÖu ®u«i\" ®Õn khi ARN ®−îc c¾t rêi. Cã 3 tr×nh tù quan ARN kÝch th−íc kh¸c nhau, gäi träng: tÝn hiÖu ®u«i [AAUAAA], ®iÓm c¾t sau cÆp nucleotide CA lµ c¸c ARN dÞ nh©n vµ ®o¹n giµu GC. b) Phøc hÖ g¾n ®u«i polyA gåm mét sè (hnARN). Sau nµy, hnARN protein liªn kÕt vµo c¸c tr×nh tù võa nªu, trong ®ã cã enzym ®−îc x¸c ®Þnh lµ hçn hîp c¸c PolyA polymerase (PAP), c¸c yÕu tè c¾t CPSF, CF1, CF2 tiÒn-ARN cã kÝch th−íc kh¸c (kh«ng vÏ trªn h×nh), protein liªn kÕt ®u«i polyA (PABP). nhau. N¨m 1978, Philip Leder c) mARN ®−îc c¾t sau vÞ trÝ CA. d) §u«i polyA ®−îc bæ sung vµ ®−îc \"duy tr×\" bëi liªn kÕt cña PABP (theo Clark, 2006). 101
§inh §oµn Long khi nghiªn cøu gen β-globin tõ c¸c tÕ bµo chuét t×m thÊy chuçi β-globin do gen nµy m· hãa gåm 146 axit amin. C¸c nhµ nghiªn cøu ph©n lËp ®−îc ph©n tö hnARN (chØ cã trong nh©n) dµi 1,5 kb lµ tiÒn-mARN m· hãa β-globin, ®ång thêi ph©n lËp ®−îc mARN sau khi hoµn thiÖn cã kÝch th−íc 0,7 kb. C¶ hai lo¹i mARN ®Òu cã mò m7G ë ®Çu 5’ vµ ®u«i polyA ë ®Çu 3’. Lóc ®ã, c¸c nhµ nghiªn cøu cho r»ng gen β-globin cã mét intron dµi 800 bp. C¸c nghiªn cøu sau nµy thùc tÕ ®· chøng minh gen nµy cã hai intron; trong ®ã, mét intron kÝch th−íc nhá kh«ng ®−îc t×m thÊy trong nghiªn cøu tr−íc ®ã cña Leder. Ngoµi c¸c gen m· hãa protein ë eukaryote th−êng cã c¸c intron, sù “ph©n m¶nh cña gen\" cßn gÆp ë virut. Ch¼ng h¹n nh− gen thymidylate synthetase cña phag¬ T4 cã mét intron. TÕ bµo nhËn ra intron nhê mét sè tr×nh tù vïng biªn cña intron vµ ®o¹n nèi gi÷a exon vµ intron. Cô thÓ, c¸c intron ®iÓn h×nh ®−îc giíi h¹n bëi ®Çu 5’-GU vµ 3’-AG. Ngoµi ra, trong intron cßn cã mét sè tr×nh tù ®Æc thï kh¸c. §o¹n tr×nh tù tÝn hiÖu ®Çy ®ñ ë ®Çu 5’ gÆp ë phÇn lín c¸c intron lµ 5’-AG↓GUAAGU-3’ vµ ë ®Çu 3’ lµ 5’-YYYYYYNCAG↓-3’ (Y = pyrimidine, N = nucleotide bÊt kú). C¸c intron trong tiÒn-mARN ®−îc c¾t bá cßn c¸c exon ®−îc nèi l¹i víi nhau trong qu¸ tr×nh xÐn mARN. Phøc hÖ thùc hiÖn nhiÖm vô nµy ®−îc gäi lµ phøc hÖ xÐn intron (spliceosome), gåm tiÒn-mARN kÕt hîp víi c¸c h¹t ribonucleoprotein kÝch th−íc nhá, ®−îc kÝ hiÖu lµ snRNP (®äc lµ \"sníp\"). snRNP ®−îc t¹o thµnh tõ sù liªn kÕt gi÷a snARN vµ protein. Cã 5 lo¹i snARN phæ biÕn ®−îc kÝ hiÖu lµ U1, U2, U4, U5 vµ U6. Mçi lo¹i liªn kÕt víi mét sè ph©n tö protein ®Ó h×nh thµnh nªn snRNP. Trõ U4 vµ U6 t×m thÊy trong cïng mét snRNP, c¸c lo¹i kh¸c t×m thÊy trong c¸c snRNP kh¸c nhau. Qu¸ tr×nh xÐn intron ®iÓn h×nh tr¶i qua mét sè b−íc nh− sau (h×nh 4.9 vµ 4.10): 1) U1 snRNP g¾n vµo vÞ trÝ c¾t ®Çu 5’ cña intron. ViÖc g¾n nµy dùa trªn nguyªn t¾c Chargaff gi÷a U1 snARN cã trong snRNP víi tr×nh tù ®o¹n nèi exon-intron ë ®Çu 5’ cña intron. 2) U2 snRNP g¾n vµo mét tr×nh tù gäi lµ ®iÓm ph©n nh¸nh n»m ng−îc dßng víi ®o¹n nèi intron-exon vÒ phÝa ®Çu 3’ cña intron. §iÓm ph©n nh¸nh lµ vÞ trÝ ®Æc thï cña c¸c intron, t¹i ®ã chøa mét adenine (A) lµ vÞ trÝ g¾n vµo cña ®Çu 5’ tù do cña intron trong qu¸ tr×nh xÐn intron. Tr×nh tù ®iÓm ph©n nh¸nh phæ biÕn ë nhiÒu gen lµ 5’-UACUAAC-3’. 3) Phøc hÖ U4/U6 snRNP t−¬ng t¸c víi U5 snRNP råi g¾n vµo c¸c phøc hÖ U1 vµ U2 snRNP lµm hai ®Çu 5’ vµ 3’ cña intron tiÕn l¹i gÇn nhau, t¹o thµnh cÊu tróc \"thßng läng\". 4) U4 snRNP t¸ch ra khái phøc hÖ, lóc nµy spliceosome chuyÓn thµnh d¹ng cã ho¹t tÝnh c¾t cña exonuclease. 5) snRNP c¾t intron ë ®Çu 5’ t¹o ra mét ®Çu 5’ tù do. §Çu nµy sÏ liªn kÕt víi nucleotide A t¹i ®iÓm ph©n nh¸nh qua vÞ trÝ 2’-OH (liªn kÕt phosphodiester 5’- 2’). Nhãm 3’-OH cña adenine nµy vÉn liªn kÕt b×nh th−êng víi c¸c nucleotide kh¸c trong chuçi. 6) Intron ®−îc c¾t ë phÝa ®Çu 3’ (intron vÉn ë d¹ng \"thßng läng\") cßn c¸c exon liÒn kÒ ë hai ®Çu 5’ vµ 3’ cña intron liªn kÕt víi nhau. Lóc nµy phøc hÖ snRNP rêi khái ph©n tö ARN. Qu¸ tr×nh xÐn intron gåm c¸c b−íc nªu trªn ®−îc lÆp l¹i cho ®Õn khi c¸c intron ®−îc c¾t hÕt. 102
Ch−¬ng 4. Phiªn m· vµ dÞch m· di truyÒn c) Cã c¸c c¬ chÕ c¾t intron kh¸c nhau Cã nhiÒu nhãm intron kh¸c nhau (b¶ng 4.2). C¸c intron GT-AG (t−¬ng ®−¬ng víi GU-AG trªn ARN) ®Õn nay lµ d¹ng phæ biÕn nhÊt trong hÖ gen nh©n sinh vËt nh©n thËt. C¸c intron AT-AC (hay AU-AC) cã c¸ch thøc ho¹t ®éng rÊt gièng víi c¸c intron GT-AG, chØ kh¸c bëi nucleotide ë hai ®Çu lµ G ®−îc thay b»ng A vµ mét sè yÕu tè thuéc phøc hÖ spliceosome cã thay ®æi. VÞ trÝ c¾t ®Çu 5’ VÞ trÝ c¾t ®Çu 3’ Tr×nh tù ®iÓm ph©n nh¸nh TiÒn-mARN Exon 1 Intron Exon 2 Sù h×nh thµnh cÊu tróc thßng läng C¾t ®Çu 3’ vµ nèi c¸c exon C¸c exon ®−îc nèi víi nhau CÊu tróc thßng läng (intron) H×nh 4.9. Qu¸ tr×nh xÐn intron ®iÓn h×nh (nhãm GT-AG) tõ tiÒn-mARN ë eukaryote C¸c intron nhãm I VÞ trÝ c¾t ®Çu 5’ VÞ trÝ c¾t ®Çu 5’ lµ c¸c intron tù c¾t. Trong tr−êng hîp nµy Exon 1 Tr×nh tù ®iÓm ph©n nh¸nh Exon 2 ARN cã ho¹t tÝnh xóc t¸c TiÒn mARN Intron (ho¹t tÝnh ribozyme) vµ U1, U2 qu¸ tr×nh c¾t intron kh«ng cÇn protein ®Æc U1 U2 hiÖu. Ph©n tö ARN gÊp khóc sao cho h×nh thµnh mét lo¹t cÊu tróc \"cÆp U5, U4/6 tãc\" hoÆc \"nót th¾t\", bªn trong chøa c¸c cÆp Exon 1 Exon 2 nucleotide liªn kÕt bæ sung víi nhau. Sù gÊp 5’ U1 3’ khóc lµm cho hai vÞ trÝ c¾t ®−îc ®−a ®Õn gÇn U2 U5 Intron nhau vµ sù \"kÐo c¨ng\" U6 U4 lµm suy yÕu liªn kÕt phosphodieste. Liªn kÕt nµy sÏ ®øt g·y khi mét Phøc hÖ c¾t intron (spliceosom) trong c¸c ph©n tö GMP, GDP hay GTP \"tÊn c«ng\" H×nh 4.10. Sù h×nh thµnh phøc hÖ c¾t intron (spliceosome) vµo vÞ trÝ liªn kÕt ®Çu 5’ (h×nh 4.11) vµ c¾t rêi intron khái c¸c exon. §iÒu ®¸ng chó ý lµ nucleotide G ë ®©y kh«ng ph¶i lµ thµnh phÇn cña ARN mµ lµ d¹ng tù do tõ m«i tr−êng. Sau ®ã, ®Çu 3’-OH tù do sÏ ph¶n øng víi ®Çu 5’ n»m xu«i dßng (võa ®−îc c¾t) ®Ó h×nh thµnh liªn kÕt phosphodieste míi. 103
§inh §oµn Long KÕt qu¶ cña qu¸ tr×nh c¾t B¶ng 4.2. C¸c nhãm intron intron lµ h×nh thµnh nªn Tªn nhãm intron VÞ trÝ gen mét ph©n tö ARN d¹ng HÖ gen nh©n ë eukaryote (phæ biÕn) vßng (chÝnh lµ intron) vµ C¸c intron GT-AG mét ph©n tö ARN d¹ng (hay GU-AG) HÖ gen nh©n ë eukaryote (hiÕm) C¸c intron AT-AC th¼ng chøa c¸c exon. (hay AU-AC) Ho¹t tÝnh tù xóc t¸c cña C¸c intron nhãm I Trong c¸c bµo quan, gen m· hãa rARN ë c¸c loµi eukaryote bËc thÊp, ë prokaryote (hiÕm) ARN trong tr−êng hîp C¸c intron nhãm II Trong c¸c bµo quan cña thùc vËt vµ nÊm, cña c¸c intron nhãm I mét sè ë prokaryote kh«ng ®−îc coi lµ ho¹t C¸c intron nhãm III Trong c¸c bµo quan tÝnh enzym, bëi v× c¸c C¸c intron ghÐp Trong c¸c bµo quan ph©n tö ARN kh«ng vÒ C¸c intron tiÒn-tARN d¹ng ban ®Çu sau khi C¸c intron cæ Gen m· hãa tARN trong nh©n ë eukaryote ph¶n øng kÕt thóc. C¸c C¸c gen m· hãa rARN vµ tARN ë Archaea intron nhãm I bao gåm c¸c intron thuéc c¸c gen m· hãa rARN ë sinh vËt nh©n thËt bËc thÊp, nh− nguyªn sinh ®éng vËt Tetrachynema. Nh−ng, phÇn lín intron nhãm I ®−îc t×m thÊy trong ti thÓ vµ l¹p thÓ; mét vµi tr−êng hîp ®−îc t×m thÊy ë phag¬ vµ vi khuÈn (hiÕm). C¸c intron nhãm II t×m thÊy trong bµo quan cña nÊm vµ mét sè tr−êng hîp ë vi khuÈn. C¸c intron nhãm III b¾t gÆp ë c¸c bµo quan. C¸c intron thuéc hai nhãm II vµ III còng ®Òu lµ c¸c intron tù c¾t. Tuy nhiªn, ph¶n øng tù c¾t ë hai nhãm nµy kh¸c víi nhãm I ë chç nucleotide \"tÊn c«ng\" vµo vÞ trÝ c¾t lµ mét adenine (A) cã trong ph©n tö tiÒn-ARN chø kh«ng ph¶i lµ nucleotide tù do trong m«i tr−êng. C¬ chÕ nµy còng dÉn ®Õn sù h×nh thµnh \"vßng th¾t\" ë tiÒn-mARN nh− m« t¶ ë trªn. Sù gièng nhau nµy cho thÊy cã lÏ ba nhãm intron I, II vµ III cã cïng nguån gèc tiÕn hãa. C¸c intron nhãm II vµ III rÊt gièng nhau, trõ h×nh d¹ng vµ kÝch th−íc (nhãm III th−êng nhá h¬n). a) Intron nhãm I b) Intron nhãm II B−íc B−íc B−íc B−íc H×nh 4.11. Ph¶n øng tù c¾t cña c¸c intron nhãm I vµ II. ë c¶ hai nhãm, c¸c intron ®Òu \"gÊp nÕp\" sao cho c¸c ®Çu nèi gi÷a c¸c exon ¸p s¸t víi nhau (ë ®©y chØ minh häa sù kÕt cÆp gi÷a c¸c nucleotide qua liªn kÕt hydro). a) ë intron nhãm I, mét nucleotide G trong m«i tr−êng tÊn c«ng vµo ®iÓm c¾t ®Çu 5' lµm ®øt intron khái exon; sau ®ã, ®Çu 3'-OH tù do cña exon ph¶n øng víi G t¹i ®iÓm c¾t ®Çu 3' (lµm t¸ch rêi intron vµ nèi hai exon). b) ë intron nhãm II, ph¶n øng c¾t vÒ c¬ b¶n gièng intron nhãm I, trõ ®Æc ®iÓm lµ ph¶n øng c¾t ®Çu tiªn ®−îc thùc hiÖn bëi A cã trong chÝnh tiÒn-ARN. 104
Ch−¬ng 4. Phiªn m· vµ dÞch m· di truyÒn Intron ghÐp (twintron) lµ mét d¹ng phøc hîp intron, mµ mét intron nµy n»m trong hoÆc gèi lªn tr×nh tù cña mét intron kh¸c. Chóng cã thÓ ®ång thêi gåm intron thuéc hai hay nhiÒu nhãm kh¸c nhau (I, II vµ III). Do hiÖn t−îng c¸c intron \"lång\" tr×nh tù vµo nhau nh− vËy, nªn trong tÕ bµo chóng cÇn ®−îc \"xÐn\" theo mét trËt tù nhÊt ®Þnh. Cã thÓ h×nh dung trËt tù c¾t c¸c \"intron ghÐp\" gièng nh− khi ta thùc hiÖn mét phÐp tÝnh ®¹i sè cã nhiÒu ngoÆc ®¬n vµ ngoÆc kÐp cÇn ph¶i tiÕn hµnh theo mét thø tù nhÊt ®Þnh. C¸c intron cæ (archeal) ®−îc t×m thÊy ë c¸c gen m· hãa tARN vµ rARN cña vi khuÈn cæ (giíi Archaea; cßn gäi lµ vi khuÈn cùc ®oan). C¸c intron nµy cã mét sè ®Æc ®iÓm gièng víi tiÒn-tARN ë eukaryote. C¬ chÕ c¾t c¸c intron cæ kh«ng cã phøc hÖ kiÓu spliceosome, kh«ng cã c¸c snRNP còng nh− kh«ng cã ribozyme. C¸c ph©n tö tARN vµ rARN gÊp nÕp t¹o thµnh c¸c \"vßng th¾t\" cã cÊu tróc rÊt æn ®Þnh (v× vËy kh«ng cÇn c¸c snRNP). C¸c vßng th¾t sau ®ã ®−îc c¾t bëi ribonuclease cã trong tÕ bµo, råi ®−îc nèi l¹i bëi ARN ligase. d) Mét tiÒn-ARN cã thÓ ®−îc c¾t intron theo nhiÒu c¸ch kh¸c nhau Nh− nªu ë trªn, mÆc dï viÖc nhËn biÕt intron x¶y ra theo mét c¬ chÕ ®−îc kiÓm so¸t nghiªm ngÆt. Nh−ng, c¸c c¸c tÕ bµo eukaryote cã thÓ chän c¸c ®iÓm c¾t intron kh¸c nhau ngay ë mçi gen. HiÖn t−îng thay ®æi c¸ch c¾t intron phæ biÕn nhÊt lµ ë c¸c tÕ bµo kh¸c nhau trong cïng c¬ thÓ. C¬ chÕ nµy cho phÐp mét tr×nh tù ADN ®−îc dïng ®Ó m· hãa nhiÒu protein kh¸c nhau (nh−ng th−êng cã quan hÖ vÒ chøc n¨ng); nhê vËy, sè lo¹i protein cã trong tÕ bµo cã thÓ t¨ng lªn mµ kh«ng cÇn t¨ng l−îng ADN. Tuy vËy, còng gièng phÇn lín c¸c qu¸ tr×nh di truyÒn ë cÊp ph©n tö kh¸c trong tÕ bµo, viÖc thay ®æi vÞ trÝ c¾t intron còng ®−îc tÕ bµo kiÓm so¸t chÆt chÏ vµ cÇn bæ sung c¸c protein ®Æc hiÖu. D−íi ®©y lµ ba kiÓu thay ®æi c¸ch c¾t intron phæ biÕn: - Chän c¸c promoter kh¸c nhau. Theo c¬ chÕ nµy, c¸c tÕ bµo kh¸c nhau cã c¸c yÕu tè phiªn m· kh¸c nhau. C¸c yÕu tè phiªn m· nµy nhËn ra c¸c promoter kh¸c nhau (mÆc dï chóng dïng chung mét phÇn tr×nh tù m· hãa). H×nh 4.12 minh häa c¬ chÕ nµy. - Chän vÞ trÝ g¾n ®u«i polyA kh¸c nhau. Theo c¬ chÕ nµy, c¸c tÕ bµo kh¸c nhau chän vÞ trÝ g¾n ®u«i polyA kh¸c nhau. Mét sè tÕ bµo chän tÝn hiÖu g¾n ®u«i polyA sím dÉn ®Õn viÖc ph©n tö mARN tr−ëng thµnh thiÕu mét sè exon ë xa (h×nh 4.13). C¬ chÕ nµy ®−îc dïng ®Ó s¶n sinh c¸c kh¸ng thÓ cïng nhËn biÕt c¸c ph©n tö kh¸ng nguyªn l¹ x©m nhËp vµo tÕ bµo, nh−ng cã phÇn ®u«i kh¸c nhau (xem thªm ch−¬ng 9). Mét lo¹i ®−îc tiÕt vµo m¸u, cßn lo¹i kh¸c ®−îc g¾n lªn mµng tÕ bµo. - Thay ®æi c¸ch c¾t intron b»ng chän c¸c tæ hîp exon kh¸c nhau. §©y lµ c¬ chÕ thay ®æi tæ hîp c¸c exon thùc sù víi c¸c tæ hîp ®iÓm c¾t intron kh¸c nhau. Tïy thuéc vµo c¸c ®iÓm c¾t ®−îc chän, mét hay mét sè exon cã thÓ cã mÆt trong mARN hoµn thiÖn ë tÕ bµo nµy, nh−ng v¾ng mÆt ë tÕ bµo kh¸c. Theo c¬ chÕ nµy, ph©n tö tiÒn-ARN ban ®Çu ®−îc t¹o ra trong phiªn m· lu«n gièng nhau. ViÖc chän vÞ trÝ c¾t phô thuéc vµo mét sè yÕu tè ®Æc tr−ng cña tÕ bµo tham gia vµo phøc hÖ spliceosome. C¬ chÕ chi tiÕt ®iÒu khiÓn sù xuÊt hiÖn c¸c yÕu tè nµy cßn ch−a biÕt ®Çy ®ñ. Mét vÝ dô vÒ c¬ chÕ nµy lµ gen m· hãa protein c¬ troponin T. ë chuét, gen nµy cã 18 exon. Trong ®ã, 11 exon lu«n ®−îc dïng, 5 exon (tõ exon 4 ®Õn 8) ®−îc sö dông trong c¸c tæ hîp bÊt kú (kÓ c¶ kh«ng cã exon nµo), 2 exon cßn l¹i (17 vµ 18) ®−îc dïng thay phiªn nhau. C¬ chÕ nµy gióp gen m· hãa troponin T cã thÓ t¹o ra 64 lo¹i mARN hoµn thiÖn kh¸c nhau; kÕt qu¶ lµ m« c¬ 105
§inh §oµn Long chøa rÊt nhiÒu lo¹i protein troponin T. Sù thay ®æi c¸ch c¾t intron ë gen troponin T kh«ng chØ thÊy trong ph¹m vi mét loµi vµ cßn gi÷a c¸c loµi ®éng vËt cã x−¬ng sèng kh¸c nhau. Mét sè gen m· hãa protein c¬ kh¸c còng cã c¬ chÕ t−¬ng tù. Ngoµi ba kiÓu c¾t intron thay ®æi nªu trªn, cßn cã mét kiÓu hiÕm gÆp kh¸c ®−îc gäi lµ sù c¾t chuyÓn chç intron (trans-splicing). Trong c¬ chÕ nµy, c¸c exon cã nguån gèc tõ c¸c tiÒn-ARN kh¸c nhau ®−îc c¾t ra vµ tæ hîp l¹i trong ph©n tö ARN hoµn thiÖn. Trïng mòi khoan lµ sinh vËt nh©n thËt ®¬n bµo g©y bÖnh \"èm ngñ\" vµ mét sè bÖnh nhiÖt ®íi kh¸c. Loµi nguyªn sinh ®éng vËt nµy cã thÓ v−ît qua sù gi¸m s¸t cña hÖ miÔn dÞch cña ®éng vËt cã x−¬ng sèng b»ng c¸ch thay ®æi protein bÒ mÆt tÕ bµo dùa trªn c¬ chÕ \"tr¸o ®æi vÞ trÝ\" c¸c phÇn cña gen. Ngoµi ra, nã cßn cã thÓ tæ hîp c¸c exon tõ nhiÒu gen kh¸c nhau. MÆc dï hiÖn t−îng nµy ch−a tõng gÆp ë ®éng vËt cã x−¬ng sèng, nh−ng c¬ chÕ c¾t chuyÓn chç intron còng ®· ®−îc t×m thÊy ë giun trßn vµ trong hÖ gen l¹p thÓ ë thùc vËt. Promoter #1 Promoter #2 ADN P1 Exon1 Intron P2 Exon2 Intron Exon3 Intron Exon4 Intron Phiªn m· tõ P1 Phiªn m· tõ P2 TiÒn-mARN ®−îc phiªn m· tõ P1 TiÒn-mARN ®−îc phiªn m· tõ P2 Exon1 Intron P2 Exon2 Intron Exon3 Intron Exon4 Exon2 Intron Exon3 Intron Exon4 xÐn intron xÐn intron mARN1 Exon1 Exon3 Exon4 mARN2 Exon2 Exon3 Exon4 H×nh 4.12. C¸c tÕ bµo cã thÓ chän c¸c promoter kh¸c nhau ®Ó biÓu hiÖn gen. ADN cã thÓ cã hai promoter kh¸c nhau, tõ ®ã phiªn m· h×nh thµnh hai \"phiªn b¶n\" tiÒn-mARN kh¸c nhau. NÕu dïng promoter #1, th× b¶n phiªn m· hoµn thiÖn sÏ gåm c¸c exon1, 3 vµ 4. NÕu dïng promoter #2, th× b¶n phiªn m· sÏ gåm c¸c exon 2, 3 vµ 4 (theo Clark, 2006). Promoter TÝn hiÖu ®u«i #1 TÝn hiÖu ®u«i #2 ADN Exon1 Intron Exon2 Intron Exon3 Intron Exon4 Phiªn m· TiÒn-mARN tõ c¸ch chän tÝn hiÖu ®u«i #1 TiÒn-mARN tõ c¸ch chän tÝn hiÖu ®u«i #2 Exon1 Intron Exon2 Intron Exon3 Exon1 Intron Exon2 Intron Exon3 Intron Exon4 Hoµn thiÖn mARN Hoµn thiÖn mARN mARN1 Exon1 Exon2 Exon3 AAAAAAA mARN2 Exon1 Exon2 Exon4 AAAAAAA H×nh 4.13. C¸c tÕ bµo cã thÓ chän vÞ trÝ g¾n ®u«i polyA kh¸c nhau ®Ó biÓu hiÖn gen. ADN ë ®©y cã hai tÝn hiÖu ®u«i kh¸c nhau. NÕu tÝn hiÖu ®u«i #1 ®−îc sö dông, th× b¶n phiªn m· hoµn thiÖn sÏ gåm c¸c exon1, 2 vµ 3. NÕu tÝn hiÖu ®u«i #2 ®−îc sö dông, th× b¶n phiªn m· sÏ gåm c¸c exon 1, 2 vµ 4 (theo Clark, 2006). 106
Ch−¬ng 4. Phiªn m· vµ dÞch m· di truyÒn 4.2.6.2. Sù hoµn thiÖn c¸c rARN vµ tARN ë vi khuÈn, cã 3 lo¹i rARN (cã hÖ Tr×nh tù Tr×nh tù Tr×nh tù sè l¾ng t−¬ng øng lµ 5S, 16S vµ 23S) rARN 16S rARN 23S rARN 5S ®−îc h×nh thµnh tõ mét tiÒn-ARN duy nhÊt. Ph©n tö tiÒn-ARN mang ba ®o¹n tARN tr×nh tù m· hãa c¸c rARN theo trËt tù 16S-23S-5S xen gi÷a c¸c ®o¹n nèi kh«ng Ribonuclease c¾t t¹i c¸c vÞ trÝ ®¸nh dÊu b»ng mòi tªn m· hãa (c¸c ®o¹n nèi kh«ng m· hãa nµy kh«ng ®−îc gäi lµ exon v× chóng n»m Tr×nh tù Tr×nh tù Tr×nh tù rARN 16S rARN 23S rARN 5S ngoµi gen). ë vi khuÈn, ph©n tö tiÒn- rARN cßn mang tr×nh tù m· hãa mét sè C¸c Exonuclease c¾t tØa t¹i c¸c ®Çu 5’ vµ 3’ tARN. ë prokaryote còng nh− ë rARN 16S rARN 23S rARN 5S eukaryote, hÖ gen th−êng ®ång thêi cã hoµn thiÖn hoµn thiÖn hoµn thiÖn nhiÒu b¶n sao cña gen m· hãa c¸c rARN. ë prokaryote, ph©n tö rARN hoµn H×nh 4.14. Hoµn thiÖn c¸c rARN ë prokaryote. thiÖn ®−îc t¹o ra tõ tiÒn-ARN bëi ho¹t ®éng c¾t intron cña c¸c ribonuclease. Ph©n tö tiÒn-rARN ®ång thêi mang tr×nh tù m· hãa Qu¸ tr×nh c¾t th−êng gåm hai b−íc c¶ 3 lo¹i rARN, xen gi÷a bëi mét hoÆc hai tr×nh tù m· hãa tARN. §Çu tiªn, c¸c enzym ribonuclease c¾t (h×nh 4.14). B−íc 1, c¸c ph©n ®o¹n c¸c tiÒn-rARN t¹i c¸c vÞ trÝ ®Æc hiÖu. Sau ®ã, c¸c mang tr×nh tù m· hãa rARN 16S, 23S vµ 5S ®−îc 3 enzym ribonuclease III, P vµ F enzym exonuclease \"c¾t tØa\" tõ hai ®Çu 5' vµ 3' ®Ó h×nh thµnh c¸c rARN hoµn thiÖn (5S, 16S vµ 23S). t−¬ng øng nhËn ra (dùa trªn tr×nh tù ®Æc tr−ng t¹i mçi vïng cña tiÒn-rARN) vµ c¾t rêi khái nhau. B−íc 2, mét sè exonuclease tiÕn hµnh \"c¾t tØa\" c¸c nucleotide ë hai ®Çu ®Ó t¹o nªn c¸c lo¹i rARN hoµn thiÖn. ë eukaryote, cã bèn lo¹i rARN lµ 5S, 5,8S, 18S vµ 28S. Riªng rARN 5S ®−îc tæng hîp tõ mét locut ®éc lËp (n»m cïng côm gen m· hãa c¸c tARN) bëi ARN pol III. Cßn ba lo¹i rARN cßn l¹i ®−îc h×nh thµnh tõ cïng mét tiÒn-rARN theo kiÓu gièng víi prokaryote ®−îc nªu ë trªn do enzym ARN pol I tiÕn hµnh phiªn m·. C¸c tARN hoµn thiÖn ®−îc h×nh thµnh tõ c¸c ph©n tö tiÒn-tARN cã kÝch th−íc lín vµ cÇn tr¶i qua qu¸ tr×nh hoµn thiÖn. Mét sè tARN ®−îc tæng hîp (phiªn m·) ®éc lËp, mét sè kh¸c ®−îc phiªn m· cïng nhau (tõ cïng mét tiÒn-tARN); ë vi khuÈn, mét sè tARN ®−îc h×nh thµnh tõ tiÒn-ARN m· hãa ®ång thêi tARN vµ rARN. Trong qu¸ tr×nh hoµn thiÖn tARN ë vi khuÈn, ®Çu 5’ ®−îc c¾t tØa bëi mét ribozyme ®Æc biÖt, cã tªn lµ ribonuclease P. Enzym ribonuclease P cã thµnh phÇn bao gåm protein vµ ARN, nh−ng ho¹t tÝnh xóc t¸c lµ do ARN; thµnh phÇn protein chØ cã vai trß cÊu tróc vµ ®iÒu hßa ho¹t ®éng cña enzym. 4.2.6.3. gARN ®iÒu khiÓn sù biÕn ®æi nucleotide trong qu¸ tr×nh hoµn thiÖn rARN Nh− ®· nªu ë ch−¬ng 2, kh¸c víi ADN, ARN th−êng mang nhiÒu nucleotide (thùc chÊt lµ phÇn baz¬ nit¬) ®−îc biÕn ®æi. §iÒu nµy ®Æc biÖt ®óng víi tARN. Tuy vËy, ngay c¶ c¸c rARN vµ ®«i khi lµ mARN còng mang c¸c baz¬ nit¬ ®−îc biÕn ®æi. Trong tr−êng hîp ë tARN, sù c¶i biÕn c¸c baz¬ ®−îc thùc hiÖn bëi c¸c enzym. Chóng nhËn ra c¸c baz¬ nhÊt ®Þnh trong c¸c vïng ®Æc thï cña c¸c ph©n tö tARN vµ tiÕn hµnh biÕn ®æi chóng. Sù biÕn ®æi nucleotide bëi enzym còng x¶y ra ë mét sè rARN vi khuÈn. §èi víi rARN ë eukaryote, sù biÕn ®æi c¸c baz¬ nit¬ x¶y ra ë nhiÒu vÞ trÝ kh¸c nhau trªn ph©n tö vµ cÇn mét sè ph©n tö ARN kÝch th−íc nhá ngoµi c¸c enzym c¶i biÕn nucleotide. C¸c ph©n tö ARN kÝch th−íc nhá nµy cã vai trß x¸c ®Þnh vÞ trÝ nucleotide cÇn biÕn ®æi trªn ph©n tö rARN qua kÕt cÆp bæ sung gi÷a c¸c ®o¹n nucleotide ng¾n. C¸c ARN 107
§inh §oµn Long kÝch th−íc nhá nµy ®−îc gäi lµ c¸c ARN chØ dÉn, kÝ hiÖu lµ gARN; do chóng chØ cã trong nh©n tÕ bµo, nªn chóng cßn ®−îc gäi lµ ARN nh©n kÝch th−íc nhá, kÝ hiÖu lµ snoARN). C¸c nucleotide trong ph©n tö rARN ë eukaryote th−êng ®−îc biÕn ®æi b»ng viÖc g¾n thªm nhãm methyl (-CH3) vµo vÞ trÝ 2’-OH cña ®−êng ribose, hoÆc bëi sù biÕn ®æi uridine (U) thµnh pseudouridine (kÝ hiÖu lµ Ψ, hoÆc ΨU). MÆc dï chØ cã mét sè baz¬ ®−îc biÕn ®æi, song sè vÞ trÝ baz¬ ®−îc biÕn ®æi trong ph©n tö lµ kh¸ lín. Trung b×nh, mét ph©n tö tiÒn-rARN ë ng−êi ®−îc methyl hãa t¹i 106 vÞ trÝ vµ biÕn ®æi U → Ψ t¹i 95 vÞ trÝ. Tr×nh tù c¸c baz¬ nit¬ ë quanh vÞ trÝ ®−îc biÕn ®æi th−êng kh«ng gièng nhau cho thÊy c¸c enzym biÕn ®æi nucleotide kh«ng ho¹t ®éng theo c¬ chÕ dïng c¸c tr×nh tù liªn øng. Thay vµo ®ã, mçi nucleotide cÇn biÕn ®æi th−êng sö dông mét ph©n tö gARN chuyªn biÖt. Mçi ph©n tö gARN th−êng cã kÝch th−íc 70 – 100 nucleotide vµ cã tr×nh tù ®Æc thï t−¬ng øng víi vÞ trÝ cÇn biÕn ®æi trªn ARN. Ngoµi ra, tÊt c¶ c¸c gARN ®Òu cã mét mÉu (motif) tr×nh tù gièng nhau lµ vÞ trÝ liªn kÕt víi enzym methylase; qua ®ã gióp enzym nµy nhËn ra vÞ trÝ cÇn methyl hãa trªn ARN. T−¬ng tù nh− vËy, sù biÕn ®æi U → Ψ cÇn mét hä c¸c gARN cã vai trß chØ dÉn ®Ó c¸c enzym biÕn ®æi U → Ψ t¹i ®óng vÞ trÝ cÇn thiÕt. T−¬ng t¸c gi÷a rARN vµ gARN th−êng liªn quan ®Õn sù kÕt cÆp bÊt th−êng G – U. KiÓu kÕt cÆp bÊt th−êng nµy kh¸ bÒn trong c¸c vïng ARN xo¾n kÐp (dsARN). HiÖn t−îng nµy còng x¶y ra trong t−¬ng t¸c gi÷a gARN vµ mARN trong qu¸ tr×nh biªn tËp ARN ®−îc nªu d−íi ®©y (h×nh 4.15). Do cã nhiÒu baz¬ nit¬ ®−îc biÕn ®æi trong c¸c lo¹i ARN, ë mçi tÕ bµo eukaryote cã hµng tr¨m lo¹i gARN kh¸c nhau. Tuy vËy, chØ cã mét sè Ýt gARN nµy ®−îc phiªn m· tõ c¸c gen cã cÊu tróc hoµn chØnh. Cßn phÇn lín c¸c gARN ®−îc m· hãa trong vïng intron cña c¸c gen m· hãa cho c¸c protein kh¸c. Nh− vËy, nhiÒu gARN ®−îc h×nh thµnh trong qu¸ tr×nh hoµn thiÖn mARN cña c¸c gen m· hãa cho c¸c protein kh¸c nhau. Trong sè c¸c gen cã c¸c intron mang vïng m· hãa gARN cã c¸c gen m· hãa protein cña ribosome. Ch¼ng h¹n nh−, snoARN U16 ®−îc m· hãa trong intron 3 cña gen m· hãa protein ribosome L1. 4.2.6.4. Biªn tËp ARN tr−íc dÞch m· Cã lÏ sù biÕn ®æi c¸c nucleotide phøc t¹p nhÊt x¶y ra ë c¸c mARN lµ sù biªn tËp ARN tr−íc dÞch m·. §©y lµ qu¸ tr×nh ph©n tö tiÒn-mARN ®−îc bæ sung thªm, hoÆc c¾t bít ®i, hoÆc ®−îc thay thÕ mét sè nucleotide, dÉn ®Õn viÖc ph©n tö ARN khi ®−îc dïng ®Ó dÞch m· cã tr×nh tù kh«ng \"khíp\" víi tr×nh tù ADN cña gen gèc. Kh«ng cã g× ng¹c nhiªn khi trong thùc tÕ sù biªn tËp ARN rÊt hiÕm x¶y ra ë hÇu hÕt c¸c sinh vËt. ë thó, sù biªn tËp ARN chØ x¶y ra trong ph¹m vi biÕn ®æi c¸c nucleotide lµ C → U vµ A → I (inosine); vµ còng chØ x¶y ra ë mét sè Ýt mARN. ë thùc vËt, c¶ hai kiÓu biªn tËp C → U vµ U → C ®Òu xuÊt hiÖn phæ biÕn. HiÖn t−îng ARN ®−îc biªn tËp l¹i ®−îc t×m thÊy phæ biÕn nhÊt ë mét sè nguyªn sinh ®éng vËt (nh− trïng mòi khoan) víi viÖc ®ång thêi bæ sung thªm hoÆc c¾t bít ®i mét sè nucleotide trong ph©n tö mARN. Mét vÝ dô vÒ \"biªn tËp ARN\" ë ng−êi lµ gen m· hãa alipoprotein B. Protein nµy gåm 4563 axit amin, lµ mét trong c¸c protein lín nhÊt ®· tõng biÕt ®Õn nay. Alipoprotein B cã kÝch th−íc ®Çy ®ñ, kÝ hiÖu apoB100, ®−îc tæng hîp ë tÕ bµo gan tr−íc khi ®−îc tiÕt vµo m¸u. ApoB100 cã vai trß \"l¾p r¸p\" c¸c h¹t lipoprotein mËt ®é thÊp (LDL) vµ rÊt thÊp (VLDL) lµm nhiÖm vô vËn chuyÓn lipid (kÓ c¶ cholesterol) trong c¬ thÓ. Mét phiªn b¶n protein kh¸c cña gen nµy, kÝ hiÖu lµ apoB48, chØ gåm 2153 axit amin ®−îc tiÕt ra tõ c¸c tÕ bµo ruét. ApoB48 cã vai trß hÊp thô chÊt bÐo tõ thøc ¨n. So víi apoB100, apoB48 thiÕu mét ®o¹n tr×nh tù axit amin lµ vÞ trÝ liªn kÕt víi thô thÓ cña LDL (gåm c¸c axit amin tõ 3129 ®Õn 3532). KÕt qu¶ lµ c¸c chÊt bÐo tõ thøc ¨n ®−îc apoB48 vËn chuyÓn chñ yÕu 108
Ch−¬ng 4. Phiªn m· vµ dÞch m· di truyÒn ®−îc hÊp thu ë gan, trong khi apoB100 cã vai trß ph©n phèi cholesterol vµo c¸c m« ngo¹i vi mµ ë ®ã tÕ bµo cña chóng cã thô thÓ LDL. Hai phiªn b¶n protein apoB48 vµ apoB100 ®Òu ®−îc m· hãa bëi cïng mét gen. §Ó tæng hîp ®−îc hai protein nµy, cÇn cã sù biªn tËp l¹i ARN sau phiªn m·. Sù biªn tËp ARN diÔn ra nh− sau: bé ba m· hãa Gln (t¹i vÞ trÝ 2154 cña apoB100) t−¬ng øng trªn mARN lµ CAA ®−îc biÕn ®æi thµnh mét m· bé ba kÕt thóc UAA. ë ®©y, viÖc biªn tËp ®−îc thùc hiÖn bëi enzym lo¹i nhãm amin (-NH2) cña C dÉn ®Õn viÖc biÕn ®æi C → U. Qu¸ tr×nh lo¹i amin cÇn mét lo¹t protein bæ trî ®Ó ®¶m b¶o ph¶n øng chØ x¶y ra ®óng ë nucleotide cÇn thiÕt. Mét ®iÓm ®¸ng chó ý trong biÓu hiÖn gen alipoprotein B lµ: mÆc dï ®Ó t¹o ra hai lo¹i protein lµ apoB48 vµ apoB100 chØ cÇn mét gen duy nhÊt, nh−ng ®Ó biªn tËp ®−îc ARN chÝnh x¸c l¹i cÇn cã nhiÒu protein bæ trî kh¸c ®−îc m· hãa bëi nhiÒu gen kh¸c. Nh− vËy, râ rµng khi sö dông hÖ thèng biªn tËp l¹i ARN tÕ bµo cÇn bé m¸y phøc t¹p vµ cã lÏ cÇn chi phÝ n¨ng l−îng cao h¬n nÕu tÕ bµo cã hai gen m· hãa cho hai protein nµy. T¹i sao chän läc l¹i duy tr× c¸ch thøc \"biªn tËp ARN\" chø kh«ng ph¶i \"hai gen\" ®Õn nay ch−a râ. ë thó, mét c¬ chÕ biªn tËp ARN kh¸c ®−îc t×m thÊy lµ sù thay thÕ A → I. Trong tr−êng hîp nµy, mét enzym cã tªn lµ dsARN adnosine deaminase nhËn ra ®o¹n dsARN mang nucleotide A cÇn biÕn ®æi ®ang liªn kÕt bæ sung víi mét tr×nh tù intron ®Æc thï trªn ph©n tö mARN vµ tiÕn hµnh lo¹i nhãm amin khái A (A → I). Nh− vËy, ë ®©y chóng ta thÊy intron ®−îc dïng lµm tÝn hiÖu cho sù biªn tËp ARN. V× vËy, trong tr−êng hîp nµy viÖc biªn tËp ARN ph¶i x¶y ra tr−íc viÖc c¾t mARN intron. Trong qu¸ tr×nh dÞch m·, I th−êng ®−îc §iÓm c¾t \"dÞch m·\" gièng G, v× vËy dÔ dÉn ®Õn sù thay thÕ axit amin trong ph©n tö protein. HiÖn t−îng nµy AGA thùc tÕ x¶y ra trong qu¸ tr×nh tæng hîp c¸c protein thô thÓ cña serotonine vµ thô thÓ gARN glutamate thuéc hÖ thÇn kinh trung −¬ng ë ®éng vËt cã vó, kÓ c¶ ë ng−êi. Sai sãt x¶y ra trong qu¸ 5’ tr×nh biªn tËp ARN cña nh÷ng gen nµy dÉn ®Õn mét sè héi chøng thÇn kinh nghiªm träng. Sù biÕn 3’ Cµi thªm mét sè nucleotide U ®æi A → I còng x¶y ra trong c¸c vïng kh«ng m· hãa cña c¸c gen kh¸c nhau. Nh×n chung, vai trß cña nh÷ng biÕn ®æi nµy ®Õn nay ch−a biÕt ®Çy ®ñ. Sù biªn tËp l¹i mARN theo kiÓu biÕn ®æi UUU C → U hoÆc U → C ®−îc t×m thÊy trong hÖ gen ti AGA thÓ vµ l¹p thÓ ë phÇn lín thùc vËt. Mét c¸ch phæ biÕn, sù biªn tËp ARN trung b×nh lµm thay ®æi tõ 5’ 3 ®Õn 4 nucleotide trong mçi ®o¹n tr×nh tù gåm 20 nucleotide mARN cña hÖ gen l¹p thÓ. Trong 3’ nhiÒu tr−êng hîp, sù thay thÕ c¸c nucleotide dÉn H×nh 4.15. Biªn tËp mARN ë trïng mòi ®Õn nh÷ng biÕn ®æi trong tr×nh tù axit amin cÇn khoan (Trypanosome). gARN kÕt cÆp víi thiÕt ®Ó protein ®¹t ho¹t tÝnh cao nhÊt. Nh−ng, ®o¹n tr×nh tù ®Æc tr−ng trªn mARN. §o¹n còng cã tr−êng hîp sù biªn tËp ARN chØ dÉn ®Õn tr×nh tù bæ sung (AGA) ë gARN ®−îc dïng mét ®ét biÕn c©m. VÝ dô nh−, tr−êng hîp gen lµm khu«n ®Ó cµi thªm mét sè nucleotide U atpA ë l¹p thÓ c©y thuèc l¸ cã mét bé ba CUC vµo mARN. Trong vÝ dô trªn ®©y, cã mét trªn mARN ®−îc biªn tËp l¹i thµnh CUU. C¶ hai liªn kÕt \"láng lÎo\" G-U gi÷a hai ARN. 109
§inh §oµn Long bé ba ®Òu m· hãa Ser. HËu qu¶ cña sù biªn tËp nµy lµ mét lo¹i tARN kh¸c ®−îc huy ®éng nhiÒu h¬n trong dÞch m·. Cã lÏ sù thay ®æi lo¹i tARN ë ®©y cã hiÖu qu¶ vÒ n¨ng l−îng (nh−ng ch−a cã b»ng chøng kh¼ng ®Þnh ®iÒu nµy). Sù biªn tËp ARN phøc t¹p h¬n ®−îc t×m thÊy ë trïng mòi khoan. ë ®©y, kh«ng chØ cã sù biÓn ®æi nucleotide nµy thµnh nucleotide kh¸c, mµ sù \"biªn tËp ARN\" biÓu hiÖn b»ng viÖc bæ sung thªm hoÆc bá bít mét sè nucleotide. Mét sè b¶n phiªn m· cña c¸c gen, nhÊt lµ c¸c gen ë ti thÓ, ®−îc bæ sung hoÆc c¾t bá ®i mét sè U (h×nh 4.15). Sù biªn tËp ARN ë mét sè gen cña trïng mòi khoan lµ cÇn thiÕt bëi tr×nh tù gen trªn ADN kh«ng ph¶i lµ c¸c khung ®äc më (ORF) chÝnh x¸c. Khi viÖc biªn tËp mARN diÔn ra sai sãt, protein ®−îc tæng hîp \"lÖch\" khung ®äc vµ mÊt chøc n¨ng. §Ó g¾n thªm c¸c U vµo c¸c vÞ trÝ chÝnh x¸c, trïng mòi khoan sö dông mét sè gARN. C¸c gARN nµy cã tr×nh tù bæ sung víi mét ®o¹n ng¾n cña mARN, nh−ng ngoµi ra cã thªm mét (hoÆc mét sè) A. Phøc hÖ biªn tËp ARN sÏ bæ sung thªm U vµo mARN t¹i c¸c vÞ trÝ ®èi diÖn víi A trªn gARN. 4.2.6.5. VËn chuyÓn ARN tõ nh©n ra tÕ bµo chÊt ë eukaryote Nh©n tÕ bµo ®−îc bao bäc bëi mét líp mµng kÐp. Trªn mµng cã c¸c lç cho phÐp c¸c ph©n tö ®i ra vµ vµo theo c¸c con ®−êng ®−îc ®iÒu khiÓn nghiªm ngÆt. Trong ®ã, mçi lç trªn mµng nh©n ®−îc bäc bëi c¸c protein kiÓm so¸t sù ra, vµo cña c¸c ph©n tö. C¬ chÕ chi tiÕt kiÓm so¸t sù di chuyÓn cña ARN vµ protein ra, vµo nh©n tÕ bµo ®Õn nay cßn nhiÒu bÝ Èn. Chóng ta míi chØ biÕt r»ng, mét khi mARN ®· ®−îc l¾p mò m7G, g¾n ®u«i polyA vµ c¾t bá intron, th× chóng s½n sµng cho sù vËn chuyÓn tõ nh©n ra tÕ bµo chÊt. Khi ARN ®ang liªn kÕt víi phøc hÖ spliceosome, nã kh«ng thÓ ®i qua lç mµng nh©n. Sù vËn chuyÓn c¸c ARN vµ protein ra, vµo mµng nh©n ®ßi hái n¨ng l−îng. C¸c b»ng chøng ®Õn nay cho thÊy n¨ng l−îng nµy xuÊt ph¸t tõ thñy ph©n GTP. C¸c protein tham gia vËn chuyÓn c¸c ®¹i ph©n tö khái nh©n ®−îc gäi lµ c¸c exportin; cßn vËn chuyÓn vµo nh©n ®−îc gäi lµ c¸c importin. VÝ dô: exportin-t chuyªn tr¸ch vËn chuyÓn tARN. 4.2.6.6. Sù ph©n gi¶i ARN a) Sù ph©n gi¶i ARN sau dÞch m· C¸c ph©n tö mARN nh×n chung cã \"thêi gian sèng\" t−¬ng ®èi ng¾n. ë vi khuÈn, thêi gian b¸n ph©n hñy cña chóng kho¶ng 1 – 2 phót. C¸c mARN kh«ng liªn kÕt víi ribosome th−êng bÞ ph©n hñy nhanh. ë vi khuÈn, cã nhiÒu ribonuclease võa tham gia hoµn thiÖn tARN vµ rARN võa cã vai trß ph©n hñy mARN sau dÞch m·. C¸c ribonuclease nµy cã thÓ thay thÕ ®−îc cho nhau, v× vËy nÕu chØ x¶y ra ®ét biÕn lµm mÊt mét ribonuclease, c¬ thÓ Ýt bÞ ¶nh h−ëng. C¸c mARN vi khuÈn ®−îc ph©n gi¶i qua hai b−íc. B−íc 1, c¸c vïng mARN kh«ng liªn kÕt ribosome bÞ c¾t bëi ribonuclease E. B−íc 2, c¸c enzym exonuclase chiÒu 3’ → 5’ tiÕp tôc ph©n hñy c¸c ®o¹n c¾t. §iÓm l−u ý ë ®©y lµ chiÒu ho¹t ®éng cña exonulease ng−îc chiÒu ph©n gi¶i ARN tæng thÓ (5’ → 3’), bëi v× c¸c exonulease ®i sau c¸c ribosome. ë eukaryote, sù ph©n hñy ARN diÔn ra qua mét sè b−íc. §Çu tiªn, ®u«i polyA vµ ®Çu m7G bÞ c¾t bá, sau ®ã ARN bÞ ph©n hñy bëi c¸c enzym nuclease. Mét khi ®u«i polyA ®· bÞ c¾t kho¶ng 10 – 20 nucleotide, protein liªn kÕt ®u«i polyA (PABP) ®−îc gi¶i phãng. ChØ sau khi PABP ®· ®−îc gi¶i phãng, ®Çu m7G míi ®−îc c¾t bá. Vµ chØ khi ®Çu m7G ®· ®−îc c¾t bá, mét enzym lµ Xrn1 míi b¾t ®Çu tiÕn hµnh ph©n gi¶i mARN theo chiÒu 5’ → 3’. 110
Ch−¬ng 4. Phiªn m· vµ dÞch m· di truyÒn Sù bÒn v÷ng cña mARN cßn phô thuéc vµo tÝnh æn ®Þnh cña c¸c tr×nh tù trong ph©n tö. C¸c mARN cã thêi gian sèng ng¾n th−êng cã vïng 3’UTR chøa mét ®o¹n kho¶ng 50 nucleotide giµu A-U (gäi lµ ARE). C¸c ARE th−êng cã sù lÆp l¹i nhiÒu lÇn cña tr×nh tù [5’-AUUUA-3’]. Cã mét lo¹i protein chuyªn nhËn biÕt ARE vµ thóc ®Èy viÖc lo¹i ®u«i polyA khái ph©n tö mARN, dÉn ®Õn viÖc c¸c mARN nµy sím bÞ ph©n hñy. b) Sù ph©n hñy ARN mang ®ét biÕn v« nghÜa ë eukaryote (c¬ chÕ NMD) C¸c tÕ bµo eukaryote cã mét c¬ chÕ kiÓm so¸t mARN ®Æc biÖt cho phÐp chóng ph¸ hñy ngay c¸c mARN mang ®ét biÕn v« nghÜa (tøc lµ mét bé ba m· hãa axit amin ®ét biÕn thµnh m· kÕt thóc) vèn th−êng dÉn ®Õn sù h×nh thµnh c¸c protein mÊt chøc n¨ng do ng¾n h¬n b×nh th−êng. C¬ chÕ ph©n gi¶i c¸c ARN mang ®ét biÕn v« nghÜa nh− vËy ®−îc gäi t¾t lµ c¬ chÕ NMD (nonsense mediated decay of mARN). NMD lµ mét c¬ chÕ b¶o vÖ ë eukaryote khi chóng ë tr¹ng th¸i dÞ hîp tö, mang mét alen b×nh th−êng vµ mét alen ®ét biÕn v« nghÜa. NÕu alen ®ét biÕn v« nghÜa ®−îc phiªn m· vµ dÞch m·, nã sÏ s¶n sinh ra c¸c protein mÊt chøc n¨ng, g©y l·ng phÝ n¨ng l−îng vµ nguyªn liÖu cña tÕ bµo. §ã lµ ch−a kÓ ®Õn c¸c protein sai háng cã thÓ lµm rèi lo¹n c¸c ho¹t ®éng sinh lý do c¹nh tranh víi c¸c protein b×nh th−êng do alen kiÓu d¹i sinh ra (bëi chóng th−êng gièng nhau mét phÇn). Do ®ã, sù ph©n hñy sím c¸c mARN mang ®ét biÕn v« nghÜa cã tÇm quan träng ®Æc biÖt trong viÖc b¶o vÖ tÕ bµo eukaryote khái nh÷ng hËu qu¶ sinh lý nghiªm träng do c¸c ®ét biÕn v« nghÜa cã thÓ g©y ra. Kh¸c víi c¸c c¬ chÕ söa ch÷a ADN (xem ch−¬ng 6), NMD lµ c¬ chÕ h¹n chÕ hËu qu¶ cña ®ét biÕn th«ng qua viÖc t¸c ®éng tíi sù biÓu hiÖn cña gen ®ét biÕn, chø kh«ng söa ch÷a ®−îc sai háng di truyÒn; ®Æc biÖt, ®Ó kh¾c phôc c¸c lçi xuÊt hiÖn trong qu¸ tr×nh hoµn thiÖn mARN trùc tiÕp dÉn ®Õn c¸c mARN sai háng. §iÓm ®¸ng chó ý lµ c¬ chÕ NMD chØ t×m thÊy cã ë eukaryote, mµ kh«ng thÊy cã ë prokaryote (vèn hÇu nh− kh«ng cã sù c¾t bá c¸c intron). C¸c mARN mang c¸c ®ét biÕn v« nghÜa cã thÓ h×nh thµnh do mét sè nguyªn nh©n sau: 1. Do mét gen bÞ ®ét biÕn h×nh thµnh mét bé ba kÕt thóc sím. 2. Do sai sãt x¶y ra trong qu¸ tr×nh phiªn m· dÉn ®Õn h×nh thµnh bé ba kÕt thóc sím trªn mARN. Nh÷ng sai sãt nµy cã thÓ g©y ra bëi: i) sai sãt do ARN pol l¾p r¸p sai nucleotide trong phiªn m·, ii) sai sãt trong qu¸ tr×nh c¾t bá intron dÉn ®Õn lµm lÖch khung ®äc vµ t¹o ra mét m· bé ba kÕt thóc sím, vµ iii) sai sãt trong c¾t bá intron dÉn ®Õn mét phÇn hoÆc toµn bé intron cã mÆt trong ph©n tö mARN ®−îc dïng dÞch m·. C¬ chÕ NMD ®−îc kÝch ho¹t khi cã mét m· kÕt thóc xuÊt hiÖn ng−îc dßng mét vÞ trÝ nèi exon-exon trªn mARN (kho¶ng 50 - 55 nucleotide). Së dÜ c¬ chÕ NMD nhËn ra c¸c vÞ trÝ nèi exon-exon lµ do trong qu¸ tr×nh hoµn thiÖn mARN c¸c vÞ trÝ nèi exon-exon ®· ®−îc \"®¸nh dÊu\" mét c¸ch ®Æc biÖt bëi phøc hÖ nèi exon, gäi lµ EJC. C¸c EJC th−êng liªn kÕt vµo mARN ng−îc dßng vÞ trÝ nèi exon-exon kho¶ng 20 - 24 nucleotide trong qu¸ tr×nh hoµn thiÖn mARN (h×nh 4.16). Trong qu¸ tr×nh vËn chuyÓn mARN tõ nh©n ra tÕ bµo chÊt ®Ó tiÕn hµnh dÞch m·, cã 3 protein (kÝ hiÖu Upf1-3) liªn kÕt vµo phøc hÖ EJC-mARN. §Çu tiªn lµ Upf3 liªn kÕt vµo EJC khi mARN vÉn cßn trong nh©n tÕ bµo. Sau ®ã, ngay khi mARN ra khái nh©n, Upf2 sÏ liªn kÕt vµo phøc hÖ EJC-mARN. Trong lÇn dÞch m· ®Çu tiªn, ribosome tr−ît trªn ph©n tö mARN ®ång thêi \"®Èy\" phøc hÖ EJC/Upf3/Upf2 khái mARN. NÕu kh«ng cã ®ét biÕn v« nghÜa, ribosome sÏ lÇn l−ît ®Èy c¸c phøc hÖ EJC/Upf3/Upf2 cho ®Õn phøc hÖ cuèi cïng trªn ph©n tö mARN. Tuy vËy, khi cã mét m· kÕt thóc sím, ribosome sÏ kÕt thóc dÞch m· khi mµ trªn ph©n tö mARN cßn mét hoÆc mét sè phøc hÖ EJC/Upf3/Upf2 ch−a ®−îc \"gi¶i phãng\". Lóc nµy phøc hÖ kÕt thóc dÞch m· (gåm yÕu tè RF, xem phÇn dÞch m· d−íi ®©y) vèn liªn kÕt s½n víi Upf1 sÏ t−¬ng t¸c víi phøc hÖ EJC/Upf3/Upf2 cßn 111
§inh §oµn Long l¹i trªn mARN. Khi cã sù t−¬ng t¸c gi÷a hai lo¹i phøc hÖ (qua t−¬ng t¸c cña 3 lo¹i Upf), mARN nhanh chãng bÞ ph©n hñy. Trong qu¸ tr×nh ph©n hñy mARN theo c¬ chÕ NMD, mò m7G ®−îc lo¹i bá tr−íc tiªn (®iÓm nµy kh¸c víi sù ph©n gi¶i mARN b×nh th−êng vèn b¾t ®Çu tõ ®u«i polyA). Sau ®ã, mARN sÏ bÞ ph©n gi¶i bëi c¸c ribonuclease ho¹t ®éng theo chiÒu 5’ → 3’. Mò m7G TiÒn-mARN XÐn intron; g¾n phøc hÖ EJC vµ Upf3 Nh©n tÕ bµo mARN ®−îc vËn TÕ bµo chÊt chuyÓn ra tÕ bµo chÊt; mARN “b×nh th−êng” Upf2 liªn kÕt vµo EJC mARN “v« nghÜa” TÊt c¶ phøc hÖ EJC ®−îc ®Èy khái mARN ë chï kú dÞch m· ®Çu tiªn Cßn mét sè phøc hÖ EJC trªn mARN sau chï kú dÞch m· ®Çu tiªn KÕt thóc dÞch m· ®óng vÞ trÝ( t−¬ng øng víi viÖc ®Èy toµn bé c¸c Huy ®éng yÕu tè phøc hÖ EJC khái mARN) cho phÐp c¸c yÕu tè dÞch m· (vÝ dô: RF cïng Upf1 PABP) t¨ng c−êng t−¬ng t¸c víi bé m¸y dÞch m·, qua ®ã n©ng cao tÝnh æn ®Þnh cña mARN vµ hiÖu suÊt dÞch m·. KÕt thóc dÞch m· diÔn ra b×nh th−êng nÕu KÕt thóc dÞch m· diÔn ra kh«ng b×nh th−êng, g©y nªn sù øc chÕ dÞch m· vµ ph©n hñy nhanh “phøc hÖ gi¸m s¸t” quÐt tõ ®Çu 5’→ 3’, ph¸t hiÖn ra vµ lo¹i bá EJC, råi kÝch ho¹t hÖ thèng mARN “v« nghÜa” theo c¬ chÕ ®Æc biÖt ph©n hñy ARN Sù ph©n hñy mARN diÔn ra theo nhiÒu c¸ch kh¸c nhau; th−êng th×, mò ®Çu 5’ bÞ ph©n hñy tr−íc, råi sau ®ã lµ sù ph©n hñy theo chiÒu 5’ → 3’ H×nh 4.16. Sù ph©n hñy mARN mang ®ét biÕn v« nghÜa ë eukaryote (c¬ chÕ NMD). Trong qu¸ tr×nh hoµn thiÖn mARN trong nh©n tÕ bµo, phøc hÖ nèi c¸c exon (EJC) cïng yÕu tè Upf3 liªn kÕt gÇn c¸c ®iÓm nèi exon-exon. Sau khi mARN ®−îc chuyÓn ra tÕ bµo chÊt, yÕu tè Upf2 liªn kÕt vµo EJC. Trong tr−êng hîp kh«ng cã ®ét biÕn v« nghÜa, ë chu kú dÞch m· ®Çu tiªn, ribosome sÏ ®Èy tÊt c¶ c¸c phøc hÖ EJC/Upf3/Upf2 ra khái mARN. §©y lµ \"tÝn hiÖu\" ®Ó c¸c yÕu tè dÞch m· t¨ng c−êng t−¬ng t¸c víi bé m¸y dÞch m·, gióp duy tr× tÝnh æn ®Þnh cña mARN vµ qu¸ tr×nh dÞch m· tiÕp tôc. Trong tr−êng hîp ®ét biÕn \"v« nghÜa\", bé m¸y ph©n hñy ARN ®−îc kÝch ho¹t bëi sù t−¬ng t¸c gi÷a phøc hÖ (RF + Upf1) vµ phøc hÖ EJC cßn l¹i trªn mARN (vÏ theo Baker vµ Parker, 2004). 112
Ch−¬ng 4. Phiªn m· vµ dÞch m· di truyÒn ë nÊm men, sè gen chøa intron chØ chiÕm d−íi 5%. V× vËy, phÇn lín c¸c gen nÊm men trong qu¸ tr×nh hoµn thiÖn mARN kh«ng cÇn c¾t intron. KÕt qu¶ lµ, mARN nÊm men kh«ng cã c¸c vÞ trÝ nèi exon-exon ®−îc ®¸nh dÊu b»ng EJC. Thay vµo ®ã, mARN cña nÊm men ®−îc ®¸nh dÊu ë c¸c ®o¹n tr×nh tù giµu AU gäi lµ c¸c yÕu tè tr×nh tù ng−îc dßng (kÝ hiÖu lµ DSE). DSE lµ c¸c vÞ trÝ g¾n kÕt cña c¸c protein tham gia vµo bé m¸y ph©n hñy mARN mang ®ét biÕn v« nghÜa. Tuy c¬ chÕ ho¹t ®éng chi tiÕt cña DSE ch−a biÕt ®Çy ®ñ, nh−ng cã mét kh¸c biÖt so víi c¬ chÕ NMD ë ®éng vËt (gåm tõ giun trßn ®Õn ®éng vËt cã vó) lµ: c¬ chÕ NMD ®−îc ®iÒu hßa bëi sù phosphoryl hãa Upf1, trong khi ®iÒu nµy kh«ng x¶y ra trong c¬ chÕ DSE. C¸c thÓ ®ét biÕn bÊt ho¹t gen Upf ë nÊm men khi ®−îc nu«i trong m«i tr−êng chän läc cã thÓ sèng, nh−ng mét sè chøc n¨ng ti thÓ bÞ háng. C¸c c¸ thÓ giun trßn bÞ sai háng c¬ chÕ NMD còng cã thÓ sèng, nh−ng th−êng cã c¬ quan sinh s¶n sai háng vµ bÊt thô. ë ®éng vËt cã vó, c¸c sai háng liªn quan ®Õn gen Upf ®Òu g©y chÕt. 4.3. DÞch m· (tæng hîp protein) DÞch m· lµ qu¸ tr×nh th«ng tin di truyÒn trong tr×nh tù ARN ®−îc dïng ®Ó tæng hîp nªn chuçi axit amin t−¬ng øng cña ph©n tö protein. §©y cã lÏ lµ qu¸ tr×nh tÕ bµo sö dông nhiÒu n¨ng l−îng nhÊt, ®ång thêi cã tÝnh \"b¶o thñ\" nhÊt ë sinh vËt (rÊt gièng nhau ë mäi loµi). Vi khuÈn trong pha t¨ng tr−ëng sö dông ®Õn 80% n¨ng l−îng tÕ bµo vµ 50% l−îng chÊt kh« ®Ó tæng hîp protein. §Ó tæng hîp mét ph©n tö protein cÇn sù phèi hîp cña trªn 100 lo¹i ARN vµ protein kh¸c nhau. D−íi ®©y lµ mét sè néi dung c¬ b¶n cña dÞch m·. 4.3.1. C¸c thµnh phÇn tham gia tæng hîp protein Bé m¸y tæng hîp protein gåm bèn thµnh phÇn c¬ b¶n lµ mARN, tARN, enzym aminoacyl-tARN synthetase vµ ribosome. Khi kÕt hîp víi nhau, c¸c thµnh phÇn cña bé m¸y dÞch m· lµm nhiÖm vô phiªn dÞch ng«n ng÷ “tø ph©n” (gåm 4 “kÝ tù” A, G, T vµ C) ë d¹ng “3 bit” (m· bé ba) ®−îc viÕt trªn ph©n tö ADN thµnh ng«n ng÷ cña 20 lo¹i axit amin phæ biÕn trªn ph©n tö protein; trong ®ã mçi mét m· bé ba (codon) qui ®Þnh mét axit amin vµ ®−îc ®äc liªn tôc trong vïng m· hãa (ORF) cña mARN hoµn thiÖn. Trong qu¸ tr×nh dÞch m·, mARN ®−îc dïng lµm khu«n ®Ó tæng hîp protein; nh− vËy, ph©n tö nµy cã vai trß cung cÊp th«ng tin cho bé m¸y dÞch m·. tARN lµ “giao diÖn” võa ®Ó c¸c m· bé ba cña mARN ®Ýnh vµo, võa ®Ó c¸c axit amin t−¬ng øng víi c¸c m· bé ba cña mARN cã thÓ liªn kÕt vµo chuçi polypeptide. Vai trß cña tARN cã thÓ vÝ nh− “ng−êi phiªn dÞch” gi÷a hai “ng«n ng÷” ADN vµ protein. Enzym aminoacyl-tARN synthetase xóc t¸c ph¶n øng h×nh thµnh liªn kÕt céng hãa trÞ ®Æc hiÖu gi÷a axit amin víi ph©n tö tARN vËn chuyÓn; chÝnh enzym nµy ®¶m b¶o viÖc dÞch m· chÝnh x¸c qua ho¹t ®éng lùa chän ®óng c¸c ph©n tö tARN phï hîp víi mçi lo¹i axit amin (xem môc 4.3.2.3). Thµnh phÇn cuèi cïng cña bé m¸y dÞch m· lµ ribosome cã khèi l−îng ph©n tö lín (hµng ngµn kDa) ®−îc cÊu t¹o tõ protein vµ rARN. Ribosome lµm nhiÖm vô “®iÒu phèi” viÖc nhËn ra chÝnh x¸c c¸c m· bé ba trªn mARN cña mçi tARN, ®ång thêi thóc ®Èy ph¶n øng h×nh thµnh liªn kÕt peptide. 4.3.2. Ho¹t ®éng cña c¸c thµnh phÇn trong bé m¸y dÞch m· 4.3.2.1. mARN mang tr×nh tù m· hãa protein Trong qu¸ tr×nh dÞch m·, bé m¸y dÞch m· cã nhiÖm vô gi¶i m· vïng m· hãa cña mARN. Vïng m· hãa protein cña mçi ph©n tö mARN hoµn thiÖn, cßn ®−îc gäi lµ khung ®äc më (kÝ hiÖu lµ ORF), lµ mét tr×nh tù nucleotide liªn tiÕp (kh«ng \"ng¾t qu·ng\") ®−îc ®äc liªn tôc (kh«ng \"dÊu phÈy\") tõ mét m· më ®Çu (th−êng lµ AUG) vµ kÕt thóc ë mét 113
§inh §oµn Long trong c¸c m· kÕt thóc (th−êng lµ UAA, UAG vµ UGA). CÇn ph©n biÖt tr×nh tù b¾t ®Çu vµ kÕt thóc cña mét ORF th−êng t−¬ng øng víi c¸c ®iÓm b¾t ®Çu vµ kÕt thóc dÞch m·, cßn c¸c tr×nh tù khëi ®Çu vµ kÕt thóc cña mARN (kh«ng kÓ ®u«i polyA) t−¬ng øng víi ®iÓm b¾t ®Çu vµ kÕt thóc phiªn m·. DÞch m· b¾t ®Çu tõ ®iÓm b¾t ®Çu cña mét ORF vµ ®äc liªn tôc mçi lÇn mét m· bé ba cho ®Õn khi gÆp m· kÕt thóc cña ORF ®ã. C¸c m· b¾t ®Çu vµ kÕt thóc cña mét ORF ®−îc gäi t¾t t−¬ng øng lµ m· b¾t ®Çu vµ m· kÕt thóc dÞch m·. ë prokaryote, m· b¾t ®Çu dÞch m· th−êng lµ 5’-AUG-3’, nh−ng ®«i khi lµ 5’-GUG-3’ hay 5’-UUG-3’. TÕ bµo eukaryote (trõ hÖ gen ti thÓ vµ l¹p thÓ) lu«n dïng m· b¾t ®Çu lµ 5’-AUG-3’. M· b¾t ®Çu cã vai trß rÊt quan träng, v× nã ®ång thêi thùc hiÖn hai chøc n¨ng. Chøc n¨ng thø nhÊt lµ x¸c ®Þnh axit amin ®Çu tiªn cña chuçi polypeptide, th−êng lµ Met (mÆc dï ë mét sè protein, axit amin nµy ®−îc c¾t bá khi hoµn thiÖn). Chøc n¨ng thø hai lµ x¸c ®Þnh ®iÓm b¾t ®Çu mét ORF vµ toµn bé c¸c bé ba cßn l¹i trong ORF. Mäi ®ét biÕn liªn quan ®Õn m· b¾t ®Çu ®Òu lµm mÊt hoµn toµn nghÜa cña ORF vµ dÉn ®Õn viÖc protein kh«ng ®−îc tæng hîp. VÒ nguyªn t¾c, trªn mét m¹ch ADN cã thÓ cã tèi ®a 3 ORF kh¸c nhau; nÕu xÐt trªn c¶ hai m¹ch ADN th× sÏ cã tèi ®a 6 ORF kh¸c nhau. §©y lµ c¬ së cña hiÖn t−îng c¸c ORF cã thÓ n»m gèi lªn nhau (mÆc dï hiÖn t−îng nµy ®Õn nay míi gÆp ë virut) vµ cã thÓ ®−îc ®äc theo c¶ hai chiÒu (t−¬ng øng víi hai m¹ch) cña ph©n tö ADN. Tuy nhiªn, mét khi sù dÞch m· ®· b¾t ®Çu th× mçi m· bé ba ®−îc dÞch m· tiÕp theo lu«n n»m kÒ s¸t m· bé ba phÝa tr−íc. Nãi c¸ch kh¸c, nÕu ribosome ®· x¸c ®Þnh mét m· b¾t ®Çu, th× m· bé ba ®ã x¸c ®Þnh tÊt c¶ c¸c bé ba theo sau cña qu¸ tr×nh dÞch m· ®ã. PhÇn lín sinh vËt sö dông 3 m· kÕt thóc lµ 5’-UAA-3’, 5’-UAG-3’ vµ 5’-UGA-3’. C¸c m· kÕt thóc võa x¸c ®Þnh ranh giíi tËn cïng cña mét ORF, võa lµ tÝn hiÖu kÕt thóc dÞch m·. Mçi ph©n tö mARN th−êng cã Ýt nhÊt mét ORF. Sè ORF ®ång thêi cã trªn mét mARN cã xu h−íng kh¸c nhau ë eukaryote vµ prokaryote. HÇu hÕt c¸c mARN eukaryote chØ cã mét ORF duy nhÊt, trong khi c¸c mARN ë prokaryote ®iÓn h×nh th−êng ®ång thêi cã hai hoÆc nhiÒu ORF kh¸c nhau. C¸c mARN cã nhiÒu h¬n mét ORF ®−îc gäi lµ c¸c mARN ®a cistron, cßn c¸c mARN chØ cã mét ORF duy nhÊt ®−îc gäi lµ mARN ®¬n cistron. C¸c mARN ®a cistron th−êng m· hãa cho c¸c protein liªn quan ®Õn nhau vÒ chøc n¨ng, vÝ dô nh− c¸c protein tham gia tæng hîp c¸c axit amin hay nucleotide. §Ó b¾t ®Çu dÞch m·, c¸c ribosome ®−îc “huy ®éng” ®Õn mARN. C¸c mARN th−êng cã tr×nh tù liªn kÕt cña ribosome n»m ng−îc dßng (vÒ phÝa ®Çu 5’) kÓ tõ m· b¾t ®Çu cña mét ORF, ®−îc gäi lµ vÞ trÝ ®Ýnh kÕt ribosome (viÕt t¾t lµ RBS). Tr×nh tù ®Ýnh kÕt ribosome ë prokaryote ®−îc gäi lµ Shine-dalgarno. Tr×nh tù nµy th−êng n»m c¸ch m· b¾t ®Çu tõ 3 ®Õn 6 nucleotide vµ cã tr×nh tù bæ sung víi tr×nh tù ë ®Çu 3’ cña rARN 16S (lµ thµnh phÇn cña tiÓu phÇn nhá cña ribosome ®−îc m« t¶ d−íi ®©y). Vïng trung t©m nhËn biÕt mARN cña rARN 16S cã tr×nh tù lµ 5’-CCUCCU-3’, trong khi vÞ trÝ RBS cã tr×nh tù lµ 5’-AGGAGG-3’. Tèc ®é dÞch m· cña mét mARN phô thuéc vµo møc ®é t−¬ng ®ång gi÷a tr×nh tù t¹i RBS cña mARN víi vïng nhËn biÕt mARN cña rARN 16S. Tuy vËy, mét sè ORF ë prokaryote thuéc c¸c mARN ®a cistron tuy kh«ng cã c¸c RBS m¹nh nh−ng vÉn ®−îc dÞch m· ë c−êng ®é cao, ®ã lµ nhê chóng cã m· b¾t ®Çu n»m gèi lªn m· kÕt thóc cña mét ORF ë phÝa tr−íc (trong phÇn lín tr−êng hîp, tr×nh tù nµy lµ 5’-AUGA-3’; nghÜa lµ, cã mét m· b¾t ®Çu vµ mét m· kÕt thóc). Nhê vËy, mét ribosome võa hoµn thµnh dÞch m· mét ORF phÝa tr−íc sÏ ®−îc huy ®éng ngay ®Ó dÞch m· ORF tiÕp theo trªn ph©n tö mARN ®a cistron. HiÖn t−îng nµy cßn gäi lµ kÕt cÆp dÞch m·. 114
Ch−¬ng 4. Phiªn m· vµ dÞch m· di truyÒn Kh¸c víi prokaryote, mARN ë eukaryote kh«ng “huy ®éng” ribosome theo kiÓu dïng RBS, mµ thay vµo ®ã, nã th−êng dïng mò ®Çu 5’. Mò ®Çu 5’ cña mARN eukaryote mang 7-methyl guanosine (viÕt t¾t lµ m7G hoÆc m7Gppp). ChÝnh cÊu tróc nµy cã vai trß “huy ®éng” ribosome tíi mARN. Mét khi ®· liªn kÕt vµo ®Çu 5’ cña mARN, ribosome tr−ît däc mARN (gäi lµ qu¸ tr×nh quÐt) theo chiÒu 5’ → 3’ ®Õn khi gÆp m· më ®Çu 5’- AUG-3’. C¸c mARN ë eukaryote cßn cã hai ®Æc ®iÓm kh¸c gióp t¨ng c−êng hiÖu suÊt dÞch m·. §Æc ®iÓm thø nhÊt lµ mét sè mARN lu«n cã mét purine (A hoÆc G) n»m ng−îc dßng c¸ch m· b¾t ®Çu (AUG) 3 nucleotide vµ mét G n»m ngay sau nã, tøc lµ chóng cã tr×nh tù 5’-G/ANNAUGG-3’. Tr×nh tù nµy ®−îc gäi lµ tr×nh tù Kozak. NhiÒu mARN ë eukaryote kh«ng cã tr×nh tù nµy, nh−ng bÊt cø khi nµo cã tr×nh tù nµy, hiÖu suÊt dÞch m· cña c¸c mARN ®−îc t¨ng c−êng. §iÓm ®¸ng chó ý lµ kh¸c víi tr×nh tù Shine-dalgarno, tr×nh tù Kozak kh«ng t¨ng c−êng dÞch m· qua t−¬ng t¸c víi rARN thuéc tiÓu phÇn nhá cña ribosome, mµ thay vµo ®ã nã t−¬ng t¸c víi tr×nh tù cña tARNMet khëi ®Çu dÞch m·. Mét ®Æc ®iÓm thø hai gióp t¨ng c−êng hiÖu suÊt dÞch m· ë eukaryote lµ mARN cña chóng lu«n cã ®u«i polyA ë ®Çu 3’. MÆc dï tr×nh tù polyA c¸ch kh¸ xa ®iÓm khëi ®Çu dÞch m·, nh−ng nã cã t¸c dông t¨ng c−êng sù t¸i ho¹t ®éng cña ribosome nªn trùc tiÕp lµm t¨ng hiÖu suÊt dÞch m· (xem h×nh 4.21). 4.3.2.2. tARN dÞch tõng m· bé ba (codon) thµnh axit amin Nh− ®· nªu ë ch−¬ng 3, mÆc dï cã nhiÒu lo¹i tARN (trªn 300 lo¹i ®· ®−îc ph¸t hiÖn), nh−ng mçi tARN chØ ®Ýnh kÕt víi mét lo¹i axit amin ®Æc tr−ng duy nhÊt vµ nhËn biÕt mét hoÆc mét sè m· bé ba nhÊt ®Þnh (trªn mARN, phÇn lín tARN nhËn biÕt ®−îc nhiÒu h¬n mét m· bé ba). KÝch th−íc cña phÇn lín tARN lµ kho¶ng 75 – 95 nucleotide. MÆc dï, tr×nh tù chi tiÕt cña c¸c tARN lµ kh¸c nhau, nh−ng chóng ®Òu cã c¸c ®Æc ®iÓm chung sau: - C¸c tARN chøa nhiÒu ribonucleotide ®−îc biÕn ®æi sau phiªn m·, ch¼ng h¹n nh− pseudouridine (Ψ), dihydrouridine (DHU), hypoxanthine, thymine (T), methylguanine (mG); mÆc dï c¸c baz¬ biÕn ®æi nµy kh«ng cã vai trß thiÕt yÕu trong ho¹t ®éng cña tARN, nh−ng nÕu thiÕu c¸c baz¬ biÕn ®æi nµy tÕ bµo th−êng sinh tr−ëng kÐm (riªng hypoxanthine cã vai trß quan träng trong nhËn biÕt m· bé ba cña mét sè tARN); - C¸c tARN ®Òu cã cÊu t¹o gåm c¸c ®o¹n tr×nh tù xo¾n kÐp (h×nh thµnh bëi liªn kÕt hydro gi÷a c¸c phÇn tr×nh tù kh¸c nhau cña ph©n tö) xen kÏ víi c¸c ®o¹n tr×nh tù m¹ch ®¬n vµ cÊu h×nh ®iÓn h×nh cña chóng gièng mét chiÕc l¸ gåm 4 thïy chÝnh, ®ã lµ c¸c thïy tiÕp nhËn axit amin, thïy Ψ (hay ΨU), thïy D (DHU) vµ thïy ®èi m·. Ngoµi ra cßn cã mét thïy biÕn ®æi cã kÝch th−íc vµ tr×nh tù nucleotide kh¸c nhau ë c¸c tARN kh¸c nhau. Cã thÓ m« t¶ ®Æc ®iÓm c¬ b¶n cña mçi thïy nh− sau (xem h×nh 2.6, ch−¬ng 2): + Thïy tiÕp nhËn axit amin ®−îc h×nh thµnh bëi sù kÕt cÆp cña c¸c ®o¹n tr×nh tù ë hai ®Çu 5’ vµ 3’ cña ph©n tö tARN. TÊt c¶ tARN ®Òu cã tr×nh tù ®Çu 3’ tËn cïng thuéc thïy tiÕp nhËn axit amin lµ 5’-CCA-3’. §©y chÝnh lµ vÞ trÝ tARN liªn kÕt víi axit amin trong qu¸ tr×nh dÞch m· (nhê xóc t¸c bëi aminoacyl-tARN synthetase); + Thïy TΨC cã ®Æc ®iÓm ®Æc tr−ng lµ cã mét baz¬ uridine ®−îc biÕn ®æi thµnh Ψ, vµ baz¬ nµy th−êng ®−îc t×m thÊy trong tr×nh tù 5’-TΨCC-3’. + Thïy DHU cã ®Æc ®iÓm ®Æc tr−ng lµ chøa baz¬ dihydrouridine (DHU). 115
§inh §oµn Long + Thïy ®èi m· mang m· bé ba ®èi m· (anticodon) t−¬ng øng víi m· bé ba (codon) trªn ph©n tö mARN. M· bé ba ®èi m· lu«n liÒn kÒ víi mét purine (A hoÆc G) ë ®Çu 3’ vµ mét uracil (U) ë ®Çu 5’ trªn ph©n tö tARN. + Thïy bÊt ®Þnh ë gi÷a thïy ®èi m· vµ thïy TΨC, cã chiÒu dµi tõ 3 ®Õn 21 nucleotide. tARN khi ®· liªn kÕt víi axit amin ®−îc gäi lµ tARN ®· n¹p axit amin, cßn c¸c tARN ch−a liªn kÕt víi axit amin ®−îc gäi lµ tARN ch−a n¹p axit amin. Qu¸ tr×nh “n¹p axit amin” dïng n¨ng l−îng tõ ATP ®Ó h×nh thµnh liªn kÕt acyl gi÷a nhãm –COOH cña axit amin víi nhãm 2’- hoÆc 3’-OH cña nucleotide A ë tËn cïng ®Çu 3’ cña tARN. §¸ng chó ý lµ liªn kÕt acyl cña tARN sau khi n¹p axit amin lµ mét liªn kÕt cao n¨ng. §iÒu nµy rÊt quan träng, bëi n¨ng l−îng tù do gi¶i phãng tõ liªn kÕt cao n¨ng nµy trong qu¸ tr×nh kÐo dµi chuçi polypepitide chÝnh lµ ®éng lùc h×nh thµnh liªn kÕt peptide gi÷a c¸c axit amin. 4.3.2.3. Aminoacyl-tARN synthetase n¹p axit amin vµo tARN qua hai b−íc B¶ng 4.3. C¸c nhãm aminoacyl-tARN synthetase Chuçi polypeptide peptidyl-tARN (1) aminoacyl-tARN Nhãm II CÊu tróc bËc bèn Nhãm I CÊu tróc bËc bèn Gly α2β2 Glu α α Ala α4 Gln α α2 Pro α2 Arg α2 α Ser α2 Cys α α Thr α2 Met α α His α2 Val Asp α2 Ile Asn α2 Leu Lys α2 Tyr Phe α2β2 Trp C¸c enzym nhãm I vµ II ph©n biÖt nhau vÒ vÞ trÝ g¾n axit amin vµo ®Çu 3’ cña tARN (xem trong bµi). C¸c enzym nhãm I th−êng chØ gåm 1 chuçi polypeptide, trong khi c¸c enzym nhãm II th−êng lµ d¹ng phøc kÐp (2 chuçi polypeptide) hoÆc tø phøc (4 chuçi polypeptide). TÊt c¶ c¸c enzym aminoacyl-tARN synthetase (tõ ®©y gäi t¾t lµ tARN-synthetase) ®Òu xóc t¸c ph¶n øng g¾n axit amin vµo tARN qua hai b−íc ph¶n øng enzym (h×nh 4.17). B−íc tARN peptidyl-tARN (2) thø nhÊt lµ adenylyl hãa axit amin, trong ®ã H×nh 4.17. Ph¶n øng tæng hîp chuçi ATP chuyÓn gèc AMP sang axit amin ®ång thêi polypeptide (gäi t¾t lµ ph¶n øng peptide) gi¶i phãng nhãm ~ (cÇn phÇn biÖt sù adenylyl hãa víi adenyl hãa lµ sù chuyÓn gèc baz¬ adenine). Gièng c¸c qu¸ tr×nh tæng hîp ADN vµ ARN, ®éng lùc cña c¸c ph¶n øng adenylyl hãa lµ sù thñy ph©n nhãm ~ bëi enzym pyrophosphatase. KÕt qu¶ cña ph¶n øng adenylyl hãa lµ axit amin ®−îc liªn kÕt víi axit adenylic qua liªn kÕt este cao n¨ng gi÷a gèc –COOH cña axit amin vµ gèc phosphate cña AMP. B−íc thø hai lµ n¹p axit amin ®· ®−îc adenylyl hãa cho tARN. Trong b−íc nµy, axit amin (ë tr¹ng th¸i liªn 116
Ch−¬ng 4. Phiªn m· vµ dÞch m· di truyÒn kÕt víi enzym) ph¶n øng víi tARN. Ph¶n øng nµy dÉn ®Õn viÖc chuyÓn axit amin vµo ®Çu 3’ cña tARN, ®ång thêi gi¶i phãng AMP. Cã hai nhãm tARN-synthetase (b¶ng 4.3). C¸c enzym nhãm I n¹p c¸c axit amin vµo ®Çu 2’-OH cña tARN vµ th−êng lµ c¸c protein cã cÊu t¹o mét chuçi polypeptide (gåm lo¹i α). C¸c enzym nhãm II n¹p c¸c axit amin vµo ®Çu 3’-OH cña tARN vµ th−êng ®−îc cÊu t¹o tõ 2 hoÆc 4 chuçi polypeptide (gåm 2 lo¹i α vµ β). Mçi lo¹i tARN-synthetase chØ cã thÓ n¹p mét lo¹i axit amin duy nhÊt; nh−ng nã cã thÓ n¹p lo¹i axit amin ®ã vµo mét sè tARN kh¸c nhau. §iÒu nµy lµ phï hîp víi tÝnh “tho¸i hãa cña m· bé ba”, nghÜa lµ phÇn lín axit amin ®−îc m· hãa bëi nhiÒu h¬n mét m· bé ba (tøc lµ ®−îc vËn chuyÓn bëi nhiÒu h¬n mét tARN). PhÇn lín sinh vËt cã 20 lo¹i tARN-synthetase t−¬ng øng víi 20 lo¹i axit amin phæ biÕn, nh−ng còng cã c¸c ngo¹i lÖ. Ch¼ng h¹n, mét sè vi khuÈn thiÕu enzym n¹p axit amin glutamine (Gln) vµo tARN t−¬ng øng cña nã (tARNGln). ë nh÷ng loµi nµy, chóng sö dông chung mét enzym tARN- synthetase ®Ó n¹p axit glutamic (Glu) vµo c¶ hai lo¹i tARNGlu vµ tARNGln. Sau ®ã, mét enzym thø hai chuyÓn hãa Glu → Gln b»ng ph¶n øng amin hãa (g¾n nhãm –NH2). KÕt qu¶ lµ Glu-tARNGln → Gln-tARNGln. Nh− vËy, sù cã mÆt cña enzym thø hai dÉn ®Õn viÖc mét lo¹i tARN-synthetase kh«ng cÇn thiÕt n÷a. Tuy nhiªn, ®iÒu ®¸ng chó ý h¬n c¶ lµ mét tARN-synthetase kh«ng bao giê g¾n nhiÒu h¬n mét lo¹i axit amin vµo cïng mét lo¹i tARN nhÊt ®Þnh nµo ®ã. §iÒu nµy cã ý nghÜa ®Æc biÖt quan träng ®Ó dÞch m· diÔn ra chÝnh x¸c. Nã l¹i cµng quan träng h¬n khi nhiÒu thÝ nghiÖm cho thÊy phøc hÖ ribosome (thµnh phÇn chÝnh cña bé m¸y dÞch m·) kh«ng cã kh¶ n¨ng ph©n biÖt mét tARN cã ®−îc n¹p ®óng axit amin hay kh«ng. Trong thùc tÕ, tÇn sè n¹p axit amin sai cña mçi lo¹i enzym tARN-synthetase vµo c¸c tARN t−¬ng øng cña nã thÊp h¬n 10-3. 4.3.2.4. Ribosome lµ thµnh phÇn chÝnh cña bé m¸y dÞch m· Ribosome ®−îc cÊu t¹o tõ nhiÒu ®¹i ph©n tö vµ cã vai trß ®iÒu khiÓn qu¸ tr×nh tæng hîp protein. So víi c¸c bé m¸y sao chÐp ADN vµ phiªn m· (tæng hîp ARN), th× ribosome cã cÊu tróc phøc t¹p vµ lín h¬n nhiÒu. VÒ nguyªn t¾c, sù sao chÐp ADN vµ tæng hîp ARN cã thÓ diÔn ra bëi ho¹t ®éng xóc t¸c cña mét chuçi polypeptide duy nhÊt (xem ch−¬ng 3). Ng−îc l¹i, bé m¸y tæng hîp protein ®¬n gi¶n nhÊt còng cã khèi l−îng 2.500 kDa ®−îc cÊu t¹o tõ 3 ph©n tö ARN (kÝch th−íc vµi ngµn bp) vµ trªn 50 ph©n tö protein kh¸c nhau. VÒ tèc ®é xóc t¸c ph¶n øng, nÕu c¸c ADN pol cã tèc ®é trïng hîp lµ 200 – 1.000 nucleotide/gi©y, th× ribosome cã tèc ®é lµ 2 – 20 axit amin/gi©y. ë prokaryote, bé m¸y phiªn m· vµ dÞch m· kh«ng bÞ ng¨n c¸ch bëi mµng nh©n. ThÕ nªn, ribosome cã thÓ khëi ®Çu dÞch m· ngay khi ®o¹n ®Çu 5’ cña b¶n phiªn m· mARN ®−îc ARN pol ®Èy khái phøc hÖ phiªn m·. NghÜa lµ, sù phiªn m· vµ dÞch m· cã thÓ diÔn ra ®ång thêi. §iÓm ®¸ng chó ý lµ kh¶ n¨ng phiªn m· vµ dÞch m· ®ång thêi ®· ®−îc vi khuÈn “khai th¸c” lµm c¬ chÕ ®iÒu hßa biÓu hiÖn cña nhiÒu gen (vÝ dô: m« h×nh operon Trp, xem ch−¬ng 5). Kh¶ n¨ng phiªn m· vµ dÞch m· ®ång thêi còng ph¶n ¸nh qua sù t−¬ng quan vÒ tèc ®é dÞch m· vµ phiªn m·. NÕu nh− c¸c ribosome cña prokaryote cã tèc ®é tæng hîp protein kho¶ng 20 axit amin / gi©y (t−¬ng øng víi dÞch m· 60 nucleotide / gi©y), th× tèc ®é tæng hîp mARN cña ARN pol ë vi khuÈn vµo kho¶ng 50 – 100 nucleotide / gi©y. ë eukaryote, sù phiªn m· vµ dÞch m· bÞ mµng nh©n ng¨n c¸ch. NÕu nh− phiªn m· x¶y ra trong nh©n, th× dÞch m· x¶y ra trong tÕ bµo chÊt. Cã lÏ, do phiªn m· vµ dÞch m· kh«ng diÔn ra ®ång thêi, nªn kh«ng cã sù t−¬ng quan vÒ tèc ®é phiªn m· vµ dÞch m· ë eukaryote; tèc ®é dÞch m· ë eukaryote lµ chËm h¬n (2 - 4 axit amin / gi©y). 117
§inh §oµn Long VÒ cÊu tróc, ribosome ë tÊt B¶ng 4.4. Thµnh phÇn cÊu t¹o cña c¸c ribosome c¶ c¸c giíi sinh vËt (prokaryote, eukaryote vµ archaea), dï ho¹t VÞ trÝ ho¹t ®éng cña ribosome C¸c tiÓu Lo¹i rARN Sè ®éng trong tÕ bµo chÊt hay trong phÇn protein 18S c¸c bµo quan, ®Òu ®−îc cÊu t¹o TÕ bµo chÊt ®éng vËt 40S 28S - 5,8S - 5S 33 gåm hai tiÓu phÇn (gäi lµ tiÓu 60S 49 28S 12S 31 phÇn lín vµ tiÓu phÇn nhá). TiÓu Ti thÓ ®éng vËt 39S 16S 48 40S 18 ~35 phÇn lín mang vïng xóc t¸c h×nh 60S 28S - 5,8S - 5S ~50 thµnh liªn kÕt peptide, gäi lµ TÕ bµo chÊt thùc vËt trung t©m peptidyl Ti thÓ thùc vËt 30S 18S > 25 L¹p thÓ thùc vËt 50S 26S - 5S > 30 transferase. TiÓu phÇn nhá Vi khuÈn (prokaryote) 30S 22-31 Vi khuÈn cùc ®oan (archaea) 50S 16S 32-36 mang vïng cã vai trß ®èi chiÕu bé 30S 23S - 5S - 4,5S 21 50S 31 ba ®èi m· cña tARN (®· n¹p axit 30S 16S 26-27 50S 23S - 5S 30-31 amin) víi m· bé ba trªn mARN 16S nªn ®−îc gäi lµ trung t©m gi¶i 23S - 5S m·. C¶ tiÓu phÇn lín vµ tiÓu phÇn nhá, còng nh− c¸c rARN cÊu t¹o nªn chóng ®−îc ph©n biÖt vµ gäi tªn dùa trªn hÖ sè l¾ng trong li t©m vµ ®−îc ®äc lµ S (Svedberg). Ribosome cña prokaryote cã hÖ sè l¾ng lµ 70S ®−îc cÊu t¹o tõ mét tiÓu phÇn lín 50S vµ mét tiÓu phÇn nhá 30S (hÖ sè l¾ng S kh«ng chØ phô thuéc vµo khèi l−îng, mµ cßn phô thuéc vµo kÝch th−íc, h×nh d¹ng... ; nªn hÖ sè l¾ng cña mét phøc hÖ th−êng kh«ng b»ng tæng hÖ sè l¾ng thµnh phÇn). Ribosome cña eukaryote cã hÖ sè l¾ng 80S, ®−îc cÊu t¹o tõ mét tiÓu phÇn lín 60S vµ mét tiÓu phÇn nhá 40S. B¶ng 4.4 nªu thµnh phÇn cÊu tróc cña ribosome ë c¸c hÖ gen thuéc c¸c giíi sinh vËt kh¸c nhau. Trong qu¸ tr×nh dÞch m·, mÆc dï vµo mçi thêi ®iÓm mét ribosome chØ tæng hîp ®−îc mét chuçi polypeptide, nh−ng mçi mARN l¹i cã thÓ ®−îc dÞch m· ®ång thêi bëi nhiÒu ribosome kh¸c nhau. Khi mét mARN ®ang ®−îc dÞch m· ®ång thêi bëi nhiÒu ribosome th× ®−îc gäi lµ polysome (hay polyribosome). Do cã kÝch th−íc lín, mét ribosome khi dÞch m· bao phñ mét ®o¹n tr×nh tù kho¶ng 30 nucleotide trªn mARN. Trong cÊu tróc polysome, cø hai ribosome liÒn kÒ trªn mARN c¸ch nhau kho¶ng 80 nucleotide. Kh¶ n¨ng nhiÒu ribosome cã thÓ ®ång thêi dÞch m· mét mARN gióp gi¶i thÝch t¹i sao tÕ bµo b×nh th−êng chØ cÇn mét l−îng nhá mARN (chØ chiÕm 1 - 5% tæng l−îng ARN). NÕu sù dÞch m· chØ dïng mét ribosome cho mçi mARN, th× chØ cã kho¶ng d−íi 10% sè ribosome ®−îc “khai th¸c” t¹i mét thêi ®iÓm. Do thùc tÕ mét mARN th−êng ®−îc dÞch m· ®ång thêi bëi nhiÒu ribosome, nªn trong tÕ bµo hÇu hÕt ribosome lu«n ®−îc dïng ®Ó dÞch m·. Trong cÊu tróc vµ ho¹t ®éng cña ribosome, mét trong nh÷ng ph¸t hiÖn quan träng gÇn ®©y lµ viÖc lµm s¸ng tá vai trß cña c¸c rARN. Trong ®ã, c¸c rARN kh«ng chØ cã vai trß cÊu tróc vµ nhËn biÕt mARN, mµ chóng trùc tiÕp cã vai trß xóc t¸c ph¶n øng h×nh thµnh liªn kÕt peptide trong qu¸ tr×nh tæng hîp protein. C¸c nghiªn cøu ë cÊp ph©n tö ®· x¸c nhËn r»ng toµn bé trung t©m xóc t¸c cña ribosome (cßn gäi lµ trung t©m peptidyl transferase) ®−îc cÊu t¹o gåm rARN hoÆc bëi phÇn lín lµ c¸c rARN. C¸c protein ribosome chñ yÕu cã vai trß cÊu tróc vµ gióp duy tr× tÝnh æn ®Þnh cña ribosome. §Ó xóc t¸c ph¶n øng h×nh thµnh liªn kÕt peptide, mçi ribosome ph¶i ®ång thêi cã Ýt nhÊt hai vÞ trÝ liªn kÕt tARN. Trong thùc tÕ, mçi ribosome cã ba vÞ trÝ liªn kÕt tARN, ®−îc gäi lµ c¸c vÞ trÝ A, P vµ E (h×nh 4.18). VÞ trÝ A lµ n¬i ®Ýnh kÕt víi tARN ®· n¹p axit amin; vÞ trÝ P lµ n¬i ®Ýnh kÕt víi tARN mang axit amin ®· liªn kÕt vµo chuçi polypeptide ®ang tæng hîp (peptidyl-tARN); vÞ trÝ E lµ n¬i tARN gi¶i phãng khái chuçi polypeptide vµ ribosome. Mçi vÞ trÝ liªn kÕt cña tARN ®Òu n»m trªn vïng gi¸p nèi (gèi nhau) gi÷a 118
Ch−¬ng 4. Phiªn m· vµ dÞch m· di truyÒn tiÓu phÇn lín vµ tiÓu phÇn nhá cña ribosome. Nhê vËy, TiÓu phÇn lín fMet tARN cã thÓ ®ång thêi tiÕp cËn ®−îc “trung t©m f fMet-tARNifMet peptidyl transferase” cña tiÓu phÇn lín, võa tiÕp cËn EP A ®−îc “trung t©m gi¶i m·” cña tiÓu phÇn nhá. Trong khi thïy mang axit amin (®Çu 3’) cña tARN ®Ýnh vµo tiÓu TiÓu phÇn nhá phÇn lín, th× thïy ®èi m· cña nã ®Ýnh vµo tiÓu phÇn nhá. §Ó tiÕn hµnh dÞch m·, cÊu h×nh phÇn tö cña mARN ribosome h×nh thµnh nhiÒu ®−êng dÉn nhá ra vµ vµo. Ph©n tö mARN ®i vµo vµ ra khái “trung t©m gi¶i m·” qua mét khe dÉn hÑp chØ võa ®ñ réng cho mét ph©n tö f ARN d¹ng m¹ch ®¬n chui qua. §iÒu nµy ®¶m b¶o cho viÖc dÞch m· diÔn ra khi c¸c mèi t−¬ng t¸c néi ph©n tö gi÷a c¸c ribonucleotide kh«ng thÓ h×nh thµnh. ë gi÷a PA 3’ khe dÉn hÑp ®ã lµ vïng tiÕp xóc tARN. §iÒu ®¸ng chó 5’ ý lµ kÝch th−íc vïng nµy võa ®ñ chç cho ®óng hai m· bé ba (t−¬ng øng víi m· bé ba ®èi m· cña hai tARN) liªn kÕt vµo, ®¶m b¶o m· di truyÒn ®−îc ®äc theo ®óng f m· bé ba. TiÓu phÇn lín cña ribosome cã mét khe dÉn thø hai lµ ®−êng dÉn ra cña chuçi polypeptide míi E PA tæng hîp. Còng gièng nh− khe dÉn mARN ë tiÓu phÇn nhá, khe dÉn chuçi polypeptide ë tiÓu phÇn lín chØ võa 5’ 3’ ®ñ réng ®Ó chuçi polypeptide ®i ra vµ h¹n chÕ sù t−¬ng t¸c gi÷a c¸c axit amin trong ph©n tö protein. Trong H×nh 4.18. C¸c thµnh phÇn vµ sù ribosome, c¸c chuçi polypeptide chØ h×nh thµnh ®−îc kiÖn khëi ®Çu dÞch m . Ribosome cã cÊu tróc bËc hai d¹ng xo¾n α, chø kh«ng h×nh thµnh 3 vÞ trÝ liªn kÕt tARN lµ A, P vµ E. Vïng ®−îc d¹ng mÆt ph¼ng β hay c¸c cÊu tróc bËc cao h¬n. liªn kÕt trïm qua c¶ hai tiÓu phÇn. Sù V× vËy, cÊu h×nh cña protein ë d¹ng ho¹t ®éng chøc khëi ®Çu dÞch m· ®−îc thùc hiÖn bëi n¨ng chØ h×nh thµnh sau khi chóng rêi ribosome. mét tARN ®Æc biÖt (tARNi); kh¸c víi c¸c tARN kh¸c, nã ®−îc vËn chuyÓn Còng gièng nh− sù sao chÐp ADN vµ phiªn m·, th¼ng vµo vÞ trÝ P. TiÓu phÇn lín ®−îc l¾p r¸p vµo phøc hÖ sau khi mARN vµ tARNi ®· liªn kÕt vµo tiÓu phÇn nhá. qu¸ tr×nh dÞch m· diÔn ra qua nhiÒu b−íc vµ ®−îc chia lµm ba giai ®o¹n chÝnh: sù khëi ®Çu, kÐo dµi vµ kÕt thóc dÞch m·. 4.3.3. C¸c b−íc cña qu¸ tr×nh dÞch m· 4.3.3.1. Khëi ®Çu dÞch m· §Ó viÖc khëi ®Çu dÞch m· thµnh c«ng, cÇn cã ba sù kiÖn: ribosome ®−îc huy ®éng ®Õn mARN, tARN ®· n¹p axit amin ®−îc ®Æt vµo vÞ trÝ P cña ribosome vµ ribosome ®Þnh vÞ chÝnh x¸c trªn m· b¾t ®Çu (AUG). Trong ®ã, viÖc ribosome ®Þnh vÞ chÝnh x¸c trªn bé ba m· b¾t ®Çu cã ý nghÜa quyÕt ®Þnh, bëi v× nã x¸c ®Þnh khung ®äc më (ORF) cña toµn bé mARN. ChØ cÇn lÖch mét nucleotide còng ®ñ dÉn ®Õn viÖc tæng hîp nªn mét chuçi polypeptide hoµn toµn kh«ng liªn quan g× ®Õn chuçi polypeptide b×nh th−êng. Sù khëi ®Çu dÞch m· ë prokaryote vµ eukaryote cã nh÷ng ®Æc ®iÓm kh¸c nhau. Chóng ta sÏ ®Ò cËp ®Õn c¸c sù kiÖn diÔn ra ë prokaryote, sau ®ã nªu c¸c kh¸c biÖt ë eukaryote. 119
§inh §oµn Long a) Sù khëi ®Çu dÞch m· ë prokaryote Trong dÞch m· ë vi khuÈn, tr−íc tiªn tiÓu phÇn nhá cña ribosome ®−îc \"huy ®éng\" ®Õn mARN, th«ng qua t−¬ng t¸c Chargaff gi÷a tr×nh tù trªn rARN 16S víi tr×nh tù trªn ph©n tö mARN t¹i vÞ trÝ liªn kÕt ribosome (kÝ hiÖu lµ RBS). Ribosome th−êng ®−îc l¾p r¸p vµo vÞ trÝ RBS sao cho vÞ trÝ P cña nã t−¬ng øng víi m· b¾t ®Çu. Trong qu¸ tr×nh dÞch m·, th−êng th× mét tARN ®· n¹p axit amin sÏ ®i vµo ribosome t¹i vÞ trÝ A vµ chØ chuyÓn sang vÞ trÝ P sau khi mét ph¶n øng h×nh thµnh liªn kÕt peptide diÔn ra. Tuy nhiªn, ë b−íc khëi ®Çu dÞch m·, mét tARN ®Æc biÖt, gäi lµ tARN khëi ®Çu (kÝ hiÖu lµ tARNi), cã thÓ ®i \"th¼ng\" vµo vÞ trÝ P cña ribosome. Bé ba ®èi m· cña tARNi kÕt cÆp víi c¸c m· më ®Çu AUG hoÆc GUG. Hai m· bé ba AUG vµ GUG mang nghÜa kh¸c nhau khi xuÊt hiÖn bªn trong mét ORF. Trong ®ã, AUG ®−îc tARN dÞch m· cho Met (tARNMet) cßn GUG ®−îc dÞch m· cho Val (tARNVal). Tuy nhiªn, ë ®iÓm khëi ®Çu dÞch m· c¶ hai axit amin nµy ®Òu kh«ng bao giê ®−îc n¹p vµo tARNi; thay vµo ®ã lµ mét dÉn xuÊt cña Met lµ N-formyl methionine (kÝ hiÖu lµ fMet, cã nhãm formyl ®−îc g¾n \"thªm\" vµo nhãm amino cña methionine). tARNi sau khi n¹p axit amin fMet ®−îc viÕt lµ fMet-tARNifMet. Nh− vËy, fMet lu«n lµ axit amin ®Çu tiªn cña mét chuçi polypeptide ®−îc tæng hîp ë prokaryote. Tõ ®ã, cã thÓ chóng ta nghÜ r»ng mäi protein ë vi khuÈn lu«n cã ®Çu N lµ fMet. Nh−ng, trong thùc tÕ kh«ng ph¶i vËy. Cã mét enzym lo¹i nhãm formyl lµ deformylase sÏ lo¹i bá nhãm formyl khái ®Çu N trong qu¸ tr×nh chuçi polypeptide ®· hoÆc ®ang ®−îc tæng hîp. Ngoµi ra, nhiÒu protein ë vi khuÈn kh«ng cã ®Çu N tËn cïng lµ Met, ®ã lµ do c¸c enzym aminopeptidase th−êng lo¹i bá axit amin nµy hoÆc mét vµi axit amin ë ®Çu N tËn cïng cña chuçi polypeptide trong qu¸ tr×nh hoµn thiÖn protein. Sù khëi ®Çu dÞch m· ë prokaryote ngoµi viÖc ®−îc b¾t ®Çu b»ng liªn kÕt cña tiÓu phÇn nhá ribosome vµo vÞ trÞ RBS trªn mARN, cßn cã sù tham gia cña ba yÕu tè khëi ®Çu dÞch m· kÝ hiÖu lµ IF1, IF2 vµ IF3. - IF1 ng¨n kh«ng cho tARN liªn kÕt vµo tiÓu phÇn nhá t¹i vÞ trÝ A cña ribosome. - IF2 thùc chÊt lµ mét GTPase (enzym thñy ph©n GTP). IF2 t−¬ng t¸c víi 3 thµnh phÇn quan träng cña bé m¸y khëi ®Çu dÞch m·, gåm tiÓu phÇn nhá cña ribosome, yÕu tè IF1 vµ fMet-tARNifMet. Khi t−¬ng t¸c víi c¸c yÕu tè nµy, IF2 thóc ®Èy sù ®Ýnh kÕt gi÷a fMet-tARNifMet víi tiÓu phÇn nhá cña ribosome, ®ång thêi ng¨n c¶n c¸c tARN kh¸c ®Ýnh kÕt vµo tiÓu phÇn nhá. - IF3 ®Ýnh kÕt vµo tiÓu phÇn nhá vµ ng¨n c¶n nã liªn kÕt trë l¹i víi tiÓu phÇn lín hoÆc liªn kÕt víi tARN. V× sù khëi ®Çu dÞch m· cÇn tiÓu phÇn nhá ribosome ë tr¹ng th¸i \"tù do\" (kh«ng liªn kÕt víi tiÓu phÇn lín) nªn IF3 lµ thiÕt yÕu cho sù khëi ®Çu mét chu kú dÞch m· míi. C¸c yÕu tè khëi ®Çu dÞch m· liªn kÕt t¹i c¸c vÞ trÝ A, TiÓu phÇn P vµ E ®Ó thùc hiÖn c¸c chøc n¨ng cña chóng. Víi vai trß ribosome 30S ng¨n c¶n sù liªn kÕt cña c¸c tARN vµo vÞ trÝ A, IF1 liªn kÕt vµo tiÓu phÇn nhá ribosome t¹i vïng t−¬ng øng víi vÞ PA trÝ A. IF2 võa liªn kÕt vµo IF1 võa phñ nªn vïng t−¬ng IF3 øng víi vÞ trÝ P lµ n¬i nã t−¬ng t¸c víi fMet-tARNifMet. Cuèi cïng, IF3 liªn kÕt vµo vïng t−¬ng øng víi vÞ trÝ E. E IF2 Nh− vËy, ë giai ®o¹n khëi ®Çu dÞch m·, khi c¸c yÕu tè IF1 IF1, IF2 vµ IF3 ®· liªn kÕt víi tiÓu phÇn nhá ribosome, chØ cßn mét chç duy nhÊt t−¬ng øng víi vÞ trÝ P lµ cßn VÞ trÝ rçng cho rçng (h×nh 4.19). liªn kÕt tARNifMet H×nh 4.19. M« h×nh liªn kÕt cña c¸c Khi ®· cã sù liªn kÕt cña c¸c yÕu tè IF1, IF2 vµ IF3, yÕu tè khëi ®Çu dÞch m (IF) vµo tiÓu tiÓu phÇn nhá ë d¹ng s½n sµng liªn kÕt víi mARN vµ phÇn ribosome 30S. 120
Ch−¬ng 4. Phiªn m· vµ dÞch m· di truyÒn fMet-tARNiMet. Cô thÓ, hai lo¹i ARN lóc nµy cã thÓ liªn kÕt vµo tiÓu phÇn nhá theo trËt tù bÊt kú. Trong ®ã, sù liªn kÕt cña mARN phô thuéc vµo t−¬ng t¸c gi÷a rARN 16S vµ vÞ trÝ RBS, cßn sù liªn kÕt cña fMet-tARNiMet vµo vÞ trÝ P phô thuéc vµo t−¬ng t¸c cña IF2 (lóc nµy ë d¹ng phøc IF2/GTP) vµ kÕt cÆp gi÷a bé ba ®èi m· cña tARN vµ m· b¾t ®Çu cña mARN. Khi tiÓu phÇn nhá ribosome ®· liªn kÕt víi mARN vµ ®· cã fMet-tARNiMet t¹i vÞ trÝ P, nã biÕn ®æi cÊu h×nh dÉn ®Õn gi¶i phãng yÕu tè IF3. Lóc nµy, tiÓu phÇn lín ribosome liªn kÕt ®−îc víi tiÓu phÇn nhá ®Ó h×nh thµnh nªn ribosome 70S hoµn chØnh. Sù liªn kÕt cña tiÓu phÇn lín vµo tiÓu phÇn nhá thóc ®Èy ho¹t tÝnh GTPase cña phøc hÖ IF2/GTP dÉn ®Õn thñy ph©n GTP → GDP. Sù thñy ph©n nµy lµm phøc hÖ IF2/GDP gi¶m ¸i lùc víi ribosome còng nh− víi fMet-tARNiMet lµm cho c¶ IF2/GDP vµ IF1 ®Òu gi¶i phãng khái ribosome. Nh− vËy, kÕt qu¶ cuèi cïng khi h×nh thµnh ribosome 70S, lµ t¹i vÞ trÝ m· b¾t ®Çu cña mARN t−¬ng øng vÞ trÝ P cña ribosome sÏ cã fMet-tARNiMet, cßn t¹i vÞ trÝ A th× rçng. Phøc hÖ ribosome-mARN lóc nµy s½n sµng tiÕp nhËn tARN vµo vÞ trÝ A vµ s½n sµng cho ph¶n øng kÐo dµi chuçi polypeptide. b) Sù khëi ®Çu dÞch m· ë eukaryote VÒ nhiÒu ph−¬ng diÖn, sù khëi ®Çu dÞch m· ë eukaryote gièng víi ë prokaryote. Ch¼ng h¹n, c¶ hai giíi sinh vËt ®Òu dïng chung m· b¾t ®Çu (AUG) vµ cã tARN chuyªn hãa cho sù khëi ®Çu dÞch m·; bé m¸y dÞch m· cña chóng ®Òu cã c¸c yÕu tè khëi ®Çu dÞch m· vµ l¾p r¸p tiÓu phÇn nhá ribosome vµo mARN tr−íc khi liªn kÕt víi tiÓu a) Sù l¾p r¸p trªn ribosome b) Sù l¾p r¸p ®Çu 5’ cña mARN phÇn lín ®Ó h×nh thµnh ribosome hoµn Ribosome chØnh. Nh−ng, eukaryote cã c¬ chÕ nhËn EP A §Çu 5' mARN biÕt mARN vµ m· b¾t ®Çu kh¸c víi eIF4F M· b¾t ®Çu prokaryote (h×nh 4.20). (AUG) ë eukaryote, tiÓu phÇn nhá cña eIF4A eIF4B eIF3 ribosome lu«n liªn kÕt víi tARNi (tARNiMet) tr−íc khi nã ®−îc huy ®éng 3 4A tíi liªn kÕt vµo ®Çu 5’ cña mARN. Sau E PA ®ã, nã tr−ît däc mARN theo chiÒu 5’ → eIF5b/GTP 3’ cho ®Õn khi gÆp m· 5’-AUG-3’ ®Çu tiªn (xem thªm vÒ tr×nh tù Kozak nªu ë eIF2/GTP trªn); vµ trong phÇn lín (nh−ng kh«ng Met-tARNiMet 4A 5b ph¶i tÊt c¶) tr−êng hîp, nã nhËn biÕt bé 2 Phøc hÖ khëi ba nµy lµ m· b¾t ®Çu dÞch m·. Ph−¬ng ph¸p nhËn biÕt ®iÓm khëi ®Çu dÞch m· 3 ®Çu dÞch m· 43S nµy phï hîp víi ®Æc ®iÓm ë eukaryote lµ hÇu hÕt mARN thuéc lo¹i ®¬n cistron vµ th−êng chØ m· hãa mét chuçi polypeptide duy nhÊt. Sù khëi ®Çu dÞch m· ë eukaryote còng ®ßi hái nhiÒu yÕu tè khëi ®Çu dÞch m· cã chøc n¨ng t−¬ng tù nh− IF1, IF2 vµ IF3 ë vi khuÈn; song sè l−îng cña chóng th−êng nhiÒu h¬n. ë eukaryote, th−êng cã trªn 30 chuçi 3 4A polypeptide kh¸c nhau ®ång thêi liªn quan ®Õn sù khëi ®Çu dÞch m·. Khi ribosome ë eukaryote hoµn thµnh mét H×nh 4.20. L¾p r¸p tiÓu phÇn nhá ribosome vµ tARNi vµo mARN trong khëi ®Çu dÞch m ë eukaryote. L−u ý: yÕu tè chu tr×nh kú dÞch m·, nã ph©n t¸ch eIF4F gåm 3 protein: eIF4A, eIF4E vµ eIF4G. eIF4E trùc tiÕp liªn kÕt vµo mò m7G (®Çu 5'), \"cét\" hai protein cßn l¹i vµo phÇn sau cña thµnh tiÓu phÇn lín vµ nhá nhê ho¹t mARN (theo Watson, 2004). ®éng cña hai yÕu tè eIF3 vµ eIF1A. Hai 121
§inh §oµn Long yÕu tè nµy cã chøc n¨ng t−¬ng ®−¬ng víi IF3 vµ IF1 ë vi khuÈn (kÝ hiÖu e cã nghÜa lµ eukaryote). §Ó thóc ®Èy sù l¾p r¸p cña tARNi vµo vÞ trÝ P cña tiÓu phÇn nhá cña ribosome, cã hai yÕu tè eIF2 vµ eIF5B lµ hai protein liªn kÕt GTP (chøc n¨ng t−¬ng ®−¬ng víi IF2 ë vi khuÈn). ë eukaryote, tARNi ®−îc \"n¹p\" Met ®Ó h×nh thµnh phøc hÖ Met-tARNiMet chø kh«ng ph¶i fMet nh− ë vi khuÈn. §Çu tiªn, phøc hÖ eIF5B/GTP qua t−¬ng t¸c víi eIF1A liªn kÕt vµo tiÓu phÇn nhá cña ribosome, råi sau ®ã nã huy ®éng c¸c phøc hÖ eIF2/GTP vµ Met-tARNiMet liªn kÕt vµo vÞ trÝ P cña tiÓu phÇn nhá ribosome. Lóc nµy, phøc hÖ khëi ®Çu dÞch m· ë eukaryote cã hÖ sè l¾ng 43S ®−îc gäi lµ phøc hÖ tiÒn khëi ®Çu dÞch m· 43S. Phøc hÖ 43S nµy nhËn ra mò m7G cña mARN nhê yÕu tè khëi ®Çu dÞch m· cã tªn lµ eIF4F. eIF4F lµ mét protein cã 3 chuçi polypeotide; trong ®ã, mét chuçi polypeptide (eIF4E) trùc tiÕp ®Ýnh kÕt vµo mò ®Çu 5’ cña mARN, hai chuçi polypeptide cßn l¹i (eIF4A vµ G) liªn kÕt kh«ng ®Æc hiÖu vµo mARN (mét trong hai chuçi nµy cã ho¹t tÝnh ARN helicase, tøc lµ t¸ch m¹ch ®«i ARN). Phøc hÖ nµy sau ®ã liªn kÕt víi yÕu tè eIF4B lµ yÕu tè ho¹t hãa ho¹t tÝnh ARN helicase cña eIF4F. Ho¹t ®éng cña ARN helicase gióp \"lo¹i bá\" c¸c cÊu tróc bËc hai (vÝ dô d¹ng \"cÆp tãc\") nÕu cã cña mARN ë phÇn ®Çu 5’. Nhê sù duçi \"th¼ng\" cña mARN ë phÇn ®Çu 5’ mµ tiÓu phÇn nhá cña ribosome cã thÓ liªn kÕt vµo. Sù liªn kÕt x¶y ra do ¸i lùc liªn kÕt gi÷a hai yÕu tè eIF4F (cã trong phøc hÖ víi mARN) vµ eIF3 (cã trong phøc hÖ khëi ®Çu dÞch m· 43S). Khi ®· liªn kÕt vµo ®Çu 5’ cña mARN, tiÓu phÇn nhá cña ribosome tr−ît däc mARN theo chiÒu 5’ → 3’ nhê ho¹t tÝnh ARN helicase cña eIF4F vµ sö dông n¨ng l−îng tõ ATP. Trong qu¸ tr×nh dÞch chuyÓn, tiÓu phÇn nhá cña ribosome \"quÐt\" tr×nh tù mARN ®Ó t×m m· b¾t ®Çu (AUG). M· b¾t ®Çu nµy ®−îc t×m thÊy nhê bé ba ®èi m· cña tARNiMet lóc nµy ®· liªn kÕt vµo phøc hÖ khëi ®Çu dÞch m·. §©y chÝnh lµ lý do t¹i sao ë eukaryote, sù khëi ®Çu dÞch m· cÇn sù ®Ýnh kÕt cña tARNi vµo ribosome tr−íc khi liªn kÕt vµo mARN. Khi sù kÕt cÆp gi÷a bé ba ®èi m· ë tARNi vµ m· b¾t ®Çu cña mARN ®· ®−îc \"x¸c nhËn\", phøc hÖ khëi ®Çu dÞch m· gi¶i phãng eIF2 vµ eIF3. Do mÊt eIF3 (cã vai trß ng¨n c¶n liªn kÕt gi÷a 2 tiÓu phÇn cña ribosome) vµ eIF2 (yÕu tè liªn kÕt víi tARNi) nªn lóc nµy tiÓu phÇn lín cña ribosome liªn kÕt ®−îc vµo tiÓu phÇn nhá vµ h×nh thµnh nªn ribosome hoµn chØnh. Còng gièng ë prokaryote, khi tiÓu phÇn lín liªn kÕt vµo tiÓu phÇn nhá, chóng thóc ®Èy ho¹t tÝnh GTPase cña phøc hÖ eIF5B/GTP (t−¬ng tù IF2 ë vi khuÈn) dÉn ®Õn sù thñy ph©n GTP → GDP vµ gi¶i phãng c¸c yÕu tè khëi ®Çu dÞch m· cßn l¹i. KÕt qu¶ cña nh÷ng sù kiÖn nµy lµ Met-tARNiMet liªn kÕt vµo vÞ trÝ P cña ribosome (t−¬ng øng víi vÞ trÝ m· b¾t ®Çu cña mARN) vµ h×nh thµnh nªn phøc hÖ khëi ®Çu dÞch m· 80S. Lóc nµy, ribosome s½n sµng cho viÖc tiÕp nhËn C¸c tiÓu phÇn §u«i polyA c¸c tARN ®· n¹p axit amin vµo vÞ trÝ ribosome A cña ribosome vµ thùc hiÖn ph¶n øng kÐo dµi chuçi polypeptide. Mét ®iÓm ®Æc biÖt trong dÞch m· PABP Mò m7G eIF4F M· AUG ë eukaryote lµ c¸c yÕu tè khëi ®Çu mARN dÞch m· kh«ng chØ t−¬ng t¸c víi phÇn ®Çu 5’ cña mARN, mµ chóng cßn Protein t−¬ng t¸c víi phÇn ®u«i polyA ë ®Çu 3’ (cÇu liªn kÕt 5’ – 3’) lµm mARN H×nh 4.21. M« h×nh dÞch m mARN kiÓu “vßng trßn” trong dÞch m· cã d¹ng vßng trßn ë eukaryote. Vßng trßn ®−îc h×nh thµnh qua mèi t−¬ng t¸c gi÷a eIF4G (cña eIF4F) vµ protein liªn kÕt ®u«i polyA (PABP). (h×nh 4.21). Sù t−¬ng t¸c nµy x¶y ra gi÷a yÕu tè eIF4F vµ protein liªn kÕt ®u«i polyA (PABP). ChÝnh v× cÊu tróc mARN ë eukaryote trong dÞch m· cã d¹ng vßng trßn, nªn ®u«i polyA mÆc dï ë xa l¹i cã ¶nh h−ëng 122
Ch−¬ng 4. Phiªn m· vµ dÞch m· di truyÒn trùc tiÕp ®Õn sù khëi ®Çu dÞch m·. T¸c ®éng nµy lµ do phÇn lín c¸c ribosome võa ®−îc gi¶i phãng khi dÞch m· kÕt thóc sÏ cã xu h−íng ®−îc dïng l¹i ngay cho mét chu kú dÞch m· míi cña chÝnh mARN ®ã. Ngoµi ®Æc ®iÓm khëi ®Çu dÞch m· phæ biÕn nªu trªn, mét sè Ýt gen ë eukaryote mang tr×nh tù liªn kÕt ribosome s©u trong ph©n tö mARN (th−êng ë vïng 5’UTR), gäi lµ lµ vÞ trÝ ®i vµo cña ribosome (kÝ hiÖu IRES). C¸c gen cã IRES ®−îc t×m thÊy ®Çu tiªn ë mét sè virut picorna vµ rhino; sau nµy, ®−îc t×m thÊy ë mét sè loµi eukaryote. Chóng th−êng liªn quan ®Õn c¸c gen ®−îc biÓu hiÖn m¹nh trong ®iÒu kiÖn sèc nhiÖt hoÆc khi tÕ bµo thiÕu n¨ng l−îng. Lóc nµy, c¸c c¬ chÕ khëi ®Çu dÞch m· th«ng th−êng (kiÓu \"quÐt\" cña ribosome) kh«ng ho¹t ®éng ®−îc. ViÖc c¸c gen sö dông IRES ë gãc ®é nµo ®ã gièng nh− tÕ bµo vi khuÈn sö dông tr×nh tù Shine-dalgarno, gióp tÕ bµo cã mét c¬ chÕ \"dù phßng\" cho phÐp c¸c gen thiÕt yÕu ®−îc biÓu hiÖn trong ®iÒu kiÖn m«i tr−êng kh¾c nghiÖt. 4.3.3.2. Ph¶n øng kÐo dµi chuçi polypeptide Chuçi polypeptide Trung t©m liªn kÕt Khi ribosome ®· l¾p r¸p ®óng tARNi (®· n¹p c¸c yÕu tè dÞch m· axit amin) vµo vÞ trÝ P, nã cã thÓ b¾t ®Çu tæng hîp protein. Cã ba sù kiÖn cÇn x¶y ra nh»m ®¶m b¶o sù E PA bæ sung ®óng lo¹i axit amin vµo chuçi polypeptide. Thø nhÊt lµ cÇn l¾p r¸p ®óng lo¹i aminoacyl-tARN 5' 3' vµ vÞ trÝ A cña ribosome t−¬ng øng víi m· bé ba trªn EF-Tu/GTP mARN. Thø hai lµ liªn kÕt peotide cÇn ®−îc h×nh thµnh gi÷a aminoacyl-tARN (ë vÞ trÝ A) vµ chuçi aa peptide ®ang kÐo dµi cã ®Çu C ®ang ®Ýnh vµo peptidyl-tARN (ë vÞ trÝ P). Lóc nµy ho¹t tÝnh aminoacyl-tARN peptidyl transferase (do rARN cña tiÓu phÇn lín) sÏ tiÕn hµnh chuyÓn chuçi polypeptide ®ang kÐo dµi tõ aa peptidyl-tARN ë vÞ trÝ P sang aminoacyl-tARN ë vÞ trÝ A. Thø ba lµ peptidyl-tARN ë vÞ trÝ A võa h×nh E PA thµnh sÏ dÞch chuyÓn ®óng 3 nucleotide sang vÞ trÝ P, 5' 3' ®Ó ribosome b¾t ®Çu l¹i mét chu kú nhËn diÖn mét m· bé ba vµ tæng hîp liªn kÕt peptide míi. §Ó tÊt c¶ EF-Tu/GDP c¸c sù kiÖn trªn diÔn ra chÝnh x¸c, cã hai yÕu tè ®−îc gäi lµ c¸c yÕu tè kÐo dµi dÞch m·, gåm EF-Tu vµ EF- GDP G, ®iÒu khiÓn c¸c sù kiÖn nµy. C¶ hai yÕu tè nµy ®Òu dïng n¨ng l−îng tõ GTP. aa Kh«ng gièng khëi ®Çu dÞch m·, ph¶n øng kÐo E PA dµi chuçi polypeptide ë eukaryote vµ prokaryote lµ rÊt gièng nhau c¶ vÒ c¬ chÕ ho¹t ®éng còng nh− biÓu 5' 3' hiÖn chøc n¨ng cña c¸c yÕu tè kÐo dµi chuçi. V× vËy, ë H×nh 4.22. Aminoacyl-tARN ®−îc EF-Tu ®©y chóng ta chØ m« t¶ qu¸ tr×nh ë prokaryote. ®−a vµo vÞ trÝ A trªn ribosome. a) YÕu tè EF-Tu ®iÒu khiÓn viÖc l¾p r¸p aminoacyl-tARN vµo vÞ trÝ P cña ribosome Aminoacyl-tARN (tARN sau khi ®−îc n¹p axit amin) kh«ng liªn kÕt tù ph¸t vµo vÞ trÝ P cña ribosome, mµ thay vµo ®ã nã ®−îc \"hé tèng\" ®Ó ®Ýnh kÕt vµo vÞ trÝ P cña ribosome bëi EF-Tu (h×nh 4.22). Sau khi tARN ®· ®−îc n¹p axit amin, EF-Tu liªn kÕt vµo ®Çu 3’ cña tARN vµ che lÊp axit amin. Sù t−¬ng t¸c nh− vËy lµm cho axit amin sÏ chØ liªn kÕt ®−îc vµo chuçi polypeptide khi EF-Tu ®−îc gi¶i phãng. 123
§inh §oµn Long Gièng nh− yÕu tè khëi ®Çu dÞch m· IF2, yÕu tè EF-Tu liªn kÕt vµo aminoacyl-tARN khi nã ë d¹ng phøc víi GTP vµ sÏ kh«ng ®−îc gi¶i phãng nÕu GTP kh«ng bÞ thñy ph©n. Trong dÞch m·, sù thñy ph©n GTP dÉn ®Õn chuyÓn hãa EF-Tu/GTP → EF-Tu/GDP chØ x¶y ra khi tARN ®−îc ®−a vµo vÞ trÝ A cña ribosome, ®ång thêi bé ba ®èi m· cña nã phï hîp víi bé ba trªn mARN. Nh− vËy, chØ khi tARN ®−îc l¾p r¸p ®óng, EF-Tu míi ®−îc gi¶i phãng. b) Ribosome cã nhiÒu c¬ chÕ lo¹i bá c¸c aminoacyl-tARN kÕt cÆp sai TØ lÖ sai sãt trong dÞch m· vµo kho¶ng 10-4 – 10-3. C¬ së ®¶m b¶o cho sù dÞch m· chÝnh x¸c lµ viÖc chän läc aminoacyl-tARN kÕt cÆp ®óng víi m· bé ba trªn mARN t¹i vÞ trÝ A cña ribosome. Nh− nªu ë trªn, sù kiÓm so¸t dÞch m· ®−îc thùc hiÖn th«ng qua EF- Tu. Nh−ng ngoµi c¬ chÕ nµy (gäi lµ c¬ chÕ thø nhÊt), ribosome cßn Ýt nhÊt hai c¬ chÕ kh¸c ®Ó gi¶m thiÓu sù sai sãt trong dÞch m·. C¬ chÕ thø hai liªn quan ®Õn tr×nh tù cña rARN 16S trong tiÓu phÇn nhá cña ribosome. Ph©n tö rARN nµy cã hai nucleotide adenine (A) n»m trùc diÖn vÞ trÝ A cña ribosome (còng lµ trùc diÖn m· bé ba ®ang ®−îc dÞch m· trªn mARN (h×nh 4.23). Hai A nµy t¹o liªn kÕt hydro bæ sung khi bé ba ®èi m· trªn tARN vµ bé ba m· hãa trªn mARN kÕt cÆp ®óng (gi÷a G≡C vµ A=U, h×nh 4.23b). Nh−ng, nÕu kÕt cÆp sai, th× liªn kÕt hydro kh«ng h×nh thµnh, lµm gi¶m ¸i lùc liªn kÕt cña bé ba ®èi m· trªn tARN víi m· bé ba trªn mARN, nªn tARN l¾p r¸p sai sÏ bÞ rêi ra tr−íc khi liªn kÕt peptide h×nh thµnh. C¬ chÕ thø ba ®¶m b¶o cho sù kÕt cÆp chÝnh x¸c lµ kh¶ n¨ng \"®äc söa\" cña ribosome sau khi EF-Tu ®· ®−îc gi¶i phãng. Khi aminoacyl-tARN l¾p r¸p vµo vÞ trÝ A ë d¹ng phøc víi EF-Tu/GTP, ®Çu 3’ cña nã ë xa vÞ trÝ h×nh thµnh liªn kÕt peptide. §Ó tham gia ph¶n øng peptide, tARN ph¶i \"quay\" sao cho axit amin h−íng vµo trung t©m peptidyl transferase. C¸c tARN kÕt cÆp sai sÏ bÞ \"tung khái\" ribosome khi tARN quay nh− vËy (ë ®©y, c¬ chÕ thø hai vµ thø ba cã xu h−íng kÕt hîp víi nhau). Víi ba c¬ chÕ võa nªu, hÇu hÕt c¸c tARN kÕt cÆp sai ®Òu ®−îc lo¹i bá tr−íc khi ph¶n øng x¶y ra. a) KÕt cÆp ®óng KÕt cÆp sai b) KÕt cÆp ®óng KÕt cÆp sai Chuçi polypeptide Trung t©m liªn kÕt Thïy ®èi m· yÕu tè dÞch m· cña tARN EP A E PA mARN 3' 5' 3' 5' mARN EF-Tu/GDP 3' 5' 5' 3' rARN GDP Kh«ng thñy ph©n 16S Thñy ph©n GTP vµ GTP, nªn gi¶i gi¶i phãng EF-Tu phãng toµn bé KÕt cÆp ®óng KÕt cÆp sai phøc hÖ EF-Tu/tARN E PA E PA 5' 3' \"Quay\", t×m sù kÕt cÆp phï hîp 5' 3' 5' 3' 3' 5' H×nh 4.23. Ba c¬ chÕ ®¶m b¶o sù kÕt cÆp chÝnh x¸c gi÷a 5' 3' tARN vµ mARN. a) EF-Tu/GTP chØ ®−îc thñy ph©n khi cã sù kÕt cÆp ®óng. b) C¸c liªn kÕt hydro bæ sung gi÷a hai nucleotide A trªn rARN 16S víi bé ba ®èi m· trªn tARN chØ h×nh thµnh khi cã sù kÕt cÆp ®óng. c) ChØ khi cã sù kÕt cÆp ®óng, tARN míi \"quay\" axit amin vÒ ®óng trung t©m ph¶n øng. 124
Ch−¬ng 4. Phiªn m· vµ dÞch m· di truyÒn c) Ribosome lµ mét ribozyme Khi aminoacyl-tARN ®· ®−îc l¾p r¸p ®óng vµo vÞ trÝ A vµ quay axit amin vµo trung t©m peptidyl transferase, ph¶n øng peptide sÏ x¶y ra. Ph¶n øng nµy ®−îc xóc t¸c bëi chÝnh rARN 23 S cña tiÓu phÇn lín. C¸c d÷ liÖu thùc nghiÖm ®· x¸c nhËn toµn bé trung t©m peptidyl transferase ®−îc cÊu t¹o tõ ARN hoÆc phÇn lín tõ ARN. VËy, b»ng c¸ch nµo rARN 23S cã thÓ xóc t¸c ph¶n øng peptide? C¸c b−íc cña ph¶n øng ®−îc m« t¶ nh− sau: - §Çu tiªn, sù kÕt cÆp gi÷a c¸c nucleotide thuéc rARN 23S vµ tr×nh tù CCA ë ®Çu 3’ cña tARN n»m ë c¸c vÞ trÝ A vµ P cña ribosome thóc ®Èy Cα cña axit amin thuéc aminoacyl-tARN \"tÊn c«ng\" vµo nhãm carbonyl (-COOH) cña chuçi polypeptide ®ang ®Ýnh vµo peptidyl-tARN. T−¬ng t¸c nµy lµ æn ®Þnh nÕu tARN l¾p r¸p ®óng m· bé ba trªn mARN. - TiÕp theo, khi c¸c c¬ chÊt ®· ¸p s¸t nhau, c¸c nucleotide thuéc trung t©m peptidyl transferase cã thÓ nhËn mét nguyªn tö hydro tõ nhãm α-NH2 cña aminoacyl-tARN, lµm cho nguyªn tö nit¬ trë thµnh mét nguyªn tö cho ®iÖn tö m¹nh vµ tÊn c«ng vµo nhãm carbonyl dÉn ®Õn sù h×nh thµnh liªn kÕt peptide (h×nh 4.17). Víi c¬ chÕ nªu trªn, cã thÓ nãi ribosome (thùc chÊt lµ peptidyl transferase) lµ mét ribozyme. d) EF-G ®iÒu khiÓn ribosome dÞch chuyÓn trªn mARN theo tõng bé ba nucleotide Sau mçi mét liªn kÕt peptide ®−îc h×nh thµnh, tARN ë vÞ trÝ P trë nªn \"tù do\" (kh«ng cßn g¾n víi chuçi polypeptide n÷a); lóc nµy, chuçi polypeptide ®· g¾n vµo axit amin cña tARN t¹i vÞ trÝ A. §Ó tiÕp tôc chu kú kÐo dµi chuçi, tARN ë vÞ trÝ P ph¶i ®−îc chuyÓn sang vÞ trÝ E, cßn tARN ë vÞ trÝ A cÇn ®−îc chuyÓn sang vÞ trÝ P, ®ång thêi mARN ph¶i dÞch chuyÓn ®óng 3 nucleotide ®Ó \"béc lé\" bé ba nucleotide tiÕp theo. C¸c ho¹t ®éng nµy ®−îc gäi lµ sù chuyÓn vÞ cña ribosome. Sù chuyÓn vÞ nµy ®ßi hái mét yÕu tè kÐo dµi chuçi kh¸c, gäi lµ EF-G. EF-G chØ liªn kÕt vµo ribosome khi ë d¹ng phøc víi GTP (EF- G/GTP). Khi mét ph¶n øng peptide võa x¶y ra, peptidyl-tARN t¹i vÞ trÝ A lµm thay ®æi cÊu h×nh tiÓu phÇn lín cña ribosome, dÉn ®Õn lµm t¨ng ¸i lùc ®Ýnh kÕt cña EF-G/GTP vµo trung t©m GTPase cña ribosome. V× vËy, sau khi EF-G/GTP liªn kÕt vµo ribosome, nã ®−îc GTPase thñy ph©n thµnh EF-G/GDP. Phøc hÖ EF-G/GDP biÕn ®æi cÊu h×nh cho phÐp chóng chuyÓn sang tiÓu phÇn nhá cña ribosome, ®ång thêi thóc ®Èy sù chuyÓn vÞ cña tARN t¹i vÞ trÝ A. Khi sù chuyÓn vÞ kÕt thóc, tiÓu phÇn nhá cña ribosome gi¶m ¸i lùc víi EF-G/GDP vµ gi¶i phãng yÕu tè nµy khái ribosome. KÕt qu¶ lµ, khi EF-G rêi khái ribosome, peptidyl-tARN vèn ë vÞ trÝ A chuyÓn sang vÞ trÝ P, cßn tARN \"tù do\" t¹i vÞ trÝ P chuyÓn sang vÞ trÝ E, råi sau ®ã ®−îc gi¶i phãng khái ribosome. e) EF-Tu vµ EF-G ®−îc dïng l¹i trong c¸c chu kú kÐo dµi chuçi míi EF-Tu vµ EF-G nh− m« t¶ trªn ®©y lµ c¸c protein cã ho¹t tÝnh xóc t¸c. Chóng ®−îc gi¶i phãng ra sau mçi chu kú ph¶n øng peptide kÐo dµi chuçi. Lóc rêi khái ribosome, chóng ®Òu ë d¹ng phøc víi GDP. §Ó tham gia vµo chu kú tiÕp theo, chóng ph¶i t¸ch khái GDP vµ t¹o phøc víi GTP. §èi víi EF-G, do EF-G ë tr¹ng th¸i tù do cã ¸i lùc víi GTP cao h¬n nhiÒu so víi GDP, nªn sù thay thÕ GDP b»ng GTP diÔn ra tù ph¸t. Cßn ®èi víi EF- Tu, ®Ó chuyÓn ®æi phøc EF-Tu/GDP → EF-Tu/GTP, cÇn mét yÕu tè kÐo dµi chuçi thø ba, gäi lµ EF-Ts. Cô thÓ, sau khi EF-Tu/GDP ®−îc gi¶i phãng khái ribosome, mét ph©n tö EF-Ts liªn kÕt vµo EF-Tu/GDP vµ ®Èy GDP khái EF-Tu. Nh−ng khi gÆp GTP, EF-Ts l¹i 125
§inh §oµn Long bÞ \"®Èy\" khái phøc hÖ EF-Tu/EF-Ts dÉn ®Õn h×nh thµnh phøc hÖ EF-Tu/GTP vµ EF-Ts tù do. Nh− nªu ë trªn, EF-G/GTP vµ EF-Tu/GTP sÏ s½n sµng cho chu kú kÐo dµi chuçi míi. Nh− vËy, ta thÊy ®Ó g¾n mét axit amin vµo chuçi polypeptide, tÕ bµo cÇn tiªu tèn 2 GTP vµ 1 ATP. Trong ®ã, 1 ATP ®−îc dïng ®Ó g¾n axit amin vµo tARN, 1 GTP ®−îc dïng ®Ó ®−a tARN vµo vÞ trÝ P cña ribosome vµ 1 GTP ®−îc dïng ®Ó chuyÓn vÞ ribosome. Nh×n chung, so víi prokaryote, c¸c sù kiÖn kÐo dµi chuçi polypeptide vµ chuyÓn vÞ ribosome diÔn ra trong dÞch m· ë eukaryote lµ t−¬ng tù, kÓ c¶ sè l−îng vµ thuéc tÝnh cña c¸c yÕu tè kÐo dµi chuçi. Tuy vËy, ®Ó ph©n biÖt, hai yÕu tè kÐo dµi chuçi ë eukaryote ®−îc gäi lµ eEF1 vµ eEF2 lÇn l−ît t−¬ng øng víi EF-Tu vµ EF-G ë prokaryote. 4.3.3.3. Sù kÕt thóc dÞch m· a) C¸c tÝn hiÖu kÕt thóc dÞch m· ®−îc nhËn ra bëi c¸c RF nhãm I Trªn c¬ së ®Æc ®iÓm khëi ®Çu dÞch m·, tr−íc ®©y ng−êi ta cho r»ng cã lÏ ®· tån t¹i mét tARN ®Æc biÖt lµm nhiÖm vô kÕt thóc dÞch m· (qua nhËn biÕt m· kÕt thóc). Nh−ng, thùc tÕ kh«ng ®óng nh− vËy. Sù kÕt thóc dÞch m· së dÜ cã thÓ x¶y ra lµ v× kh«ng cã tARN nµo cã bé ba ®èi m· t−¬ng øng víi m· kÕt thóc. M· kÕt thóc ®−îc nhËn biÕt bëi c¸c protein gäi lµ c¸c yÕu tè kÕt thóc dÞch m· (kÝ hiÖu RF). C¸c yÕu tè RF sau khi liªn kÕt vµo m· kÕt thóc cã vai trß ho¹t hãa sù thñy ph©n chuçi polypeptide khái peptidyl-tARN. Cã hai nhãm RF. C¸c RF nhãm I nhËn ra m· kÕt thóc vµ kÝch ho¹t sù thñy ph©n chuçi polypeptide khái peptidyl-tARN t¹i vÞ trÝ P. C¸c tÕ bµo prokaryote cã hai yÕu tè RF thuéc nhãm I gäi lµ RF1 vµ RF2. RF1 nhËn ra m· kÕt thóc UAG, cßn RF2 nhËn ra m· kÕt thóc UGA. C¶ hai yÕu tè RF1 vµ RF2 ®Òu nhËn ra m· kÕt thóc thø ba UAA. TÕ bµo eukaryote chØ cã mét yÕu tè kÕt thóc dÞch m· nhãm I duy nhÊt lµ eRF1 (®ång thêi nhËn ra c¶ ba m· kÕt thóc). C¸c RF nhãm II cã chøc n¨ng gi¶i phãng RF nhãm I khái ribosome khi chuçi polypeptide ®· ®−îc gi¶i phãng khái tARN, ®¸nh dÊu sù kÕt thóc dÞch m·. VËy, b»ng c¸ch nµo c¸c yÕu tè RF nhãm I cã thÓ nhËn ra c¸c m· kÕt thóc? D÷ liÖu thùc nghiÖm cho thÊy c¸c RF nhËn ra m· kÕt thóc th«ng qua mèi t−¬ng t¸c protein – ARN; trong ®ã cã 3 axit amin cã vai trß nhËn ra m· kÕt thóc ®−îc gäi lµ bé ba peptide ®èi m·. Ngoµi ra, tÊt c¶ c¸c RF nhãm I ®Òu gièng nhau ë mét mÉu peptide lµ GGQ (glycine- glycine-glutamine) t−¬ng t¸c víi trung t©m peptidyl transferase cña ribosome. MÉu peptide GGQ liªn quan ®Õn viÖc thñy ph©n chuçi polypeptide khái peptidyl-tARN. Tuy nhiªn, ®Õn nay ch−a râ liÖu c¸c RF trùc tiÕp xóc t¸c viÖc thñy ph©n chuçi polypeptide, hay chóng chØ t¸c ®éng gi¸n tiÕp qua viÖc lµm thay ®æi cÊu h×nh cña peptidyl transferase. b) C¸c RF nhãm II cã vai trß phôc håi c¸c RF nhãm I Khi c¸c RF nhãm I ®· thñy ph©n ®−îc chuçi polypeptide khái peptidyl-tARN, nã cÇn ®−îc gi¶i phãng khái ribosome. Chøc n¨ng nµy do c¸c yÕu tè RF nhãm II ®¶m nhiÖm. ë prokaryote, RF nhãm II lµ RF3, cßn ë eukaryote lµ eRF3. C¸c RF nhãm II lµ c¸c protein liªn kÕt GTP. Nh−ng kh¸c biÖt víi c¸c protein liªn kÕt GTP kh¸c tham gia dÞch m·, c¸c RF nhãm II cã ¸i lùc víi GDP cao h¬n víi GTP. V× vËy, ë d¹ng tù do chóng th−êng liªn kÕt víi GDP. Khi RF nhãm II kÕt thóc dÞch m· nã lµm thay ®æi cÊu h×nh ribosome, ®ång thêi thóc ®Èy c¸c RF nhãm I thay GDP b»ng GTP. ë d¹ng phøc víi GTP, c¸c RF nhãm II cã ¸i lùc cao víi ribosome; nã liªn kÕt vµo ribosome vµ ®Èy c¸c RF nhãm I ra ngoµi ®ång thêi thÕ vµo vÞ trÝ cña RF nhãm I t¹i vÞ trÝ liªn kÕt c¸c RF ë ribosome. Gièng c¸c protein liªn kÕt GTP kh¸c tham gia dÞch m·, sù t−¬ng t¸c nµy lµm 126
Ch−¬ng 4. Phiªn m· vµ dÞch m· di truyÒn thñy th©n GTP → GDP. ë d¹ng phøc víi GDP, c¸c RF nhãm II gi¶m ¸i lùc víi ribosome vµ tho¸t ra ngoµi. c) C¸c yÕu tè phôc håi ribosome ho¹t ®éng gièng nh− c¸c tARN Sau khi chuçi polypeptide vµ c¸c yÕu tè RF ®· rêi khái ribosome, th× mARN vÉn cßn g¾n víi ribosome, ®ång thêi cã hai tARN tù do ®ang ë c¸c vÞ trÝ E vµ P. §Ó tham gia ®−îc vµo c¸c chï kú dÞch m· míi, c¸c tARN ph¶i ®−îc gi¶i phãng khái ribosome, råi hai tiÓu phÇn cña ribosome ph¶i t¸ch nhau ra. C¸c sù kiÖn nµy ®−îc gäi lµ sù phôc håi ribosome. ë prokaryote, cã c¸c yÕu tè phôc håi ribosome, kÝ hiÖu lµ RRF. C¸c RRF t−¬ng t¸c víi c¸c yÕu tè EF-G vµ RF3 theo kiÓu gièng tARN ®Ó phôc håi ribosome. Cô thÓ, sau khi chuçi polypeptide rêi khái ribosome, RRF liªn kÕt vµo vÞ trÝ A (®ang rçng). Do RRF \"gièng\" tARN, EF-G liªn kÕt vµo mét ®Çu cña RRF. Nh− mét ph¶n øng kÐo dµi chuçi, EF-G thóc ®Èy sù gi¶i phãng c¸c tARN kh«ng n¹p axit amin khái ribosome. IF3 (xem chøc n¨ng ®· nªu ë trªn) lóc nµy cã vai trß gi¶i phãng mARN vµ t¸ch hai tiÓu phÇn cña ribosome khái nhau. KÕt qu¶ lµ tÊt c¶ c¸c ph©n tö tARN, tiÓu phÇn nhá cña ribosome (liªn kÕt víi IF3) vµ tiÓu phÇn lín cña ribosome ®Òu t¸ch khái nhau vµ khái mARN. TÊt c¶ c¸c thµnh phÇn nµy ®Òu cã thÓ ®−îc dïng l¹i cho c¸c chu kú tæng hîp protein míi. 4.3.4. M· di truyÒn lµ m· bé ba, cã tÝnh tho¸i hãa vµ phæ biÕn 4.3.4.1. M· di truyÒn cã tÝnh tho¸i hãa B¶ng 4.5. B¶ng m di truyÒn Tõ ®Æc ®iÓm cña qu¸ tr×nh dÞch m·, Baz¬ thø hai chóng ta thÊy m· di truyÒn lu«n ®−îc ®äc theo tõng côm 3 nucleotide, ®−îc gäi U C A GBaz¬ Baz¬ lµ m· bé ba. Tõ bèn \"kÝ tù\" (A, T, G vµ thø ba C), hÖ thèng di truyÒn cña c¸c sinh vËt cã thø nhÊt tæng céng 64 bé ba kh¸c nhau. B¶ng 4.5 liÖt kª tÊt c¶ c¸c m· bé ba vµ nghÜa phæ UUU Phe UCU Ser UAU Tyr UGU Cys U biÕn (axit amin ®−îc m· hãa) cña chóng U UUC Phe UCC Ser UAC Tyr UGC Cys C (c¸c m· ®−îc viÕt theo chiÒu 5’ → 3’). UUA Leu UCA Ser UAA* (KT) UGA* (KT) A Trong 64 m· bé ba, cã 3 m· kÕt thóc vµ 61 bé ba m· hãa cho 20 axit amin phæ UUG Leu UCG Ser UAG* (KT) UGG Trp G biÕn (mét sè axit amin hiÕm ®−îc nªu ë môc 4.3.5.4 d−íi ®©y). §iÒu nµy cã nghÜa CUU Leu CCU Pro CAU His CGU Arg U lµ mét sè axit amin ®−îc m· hãa bëi nhiÒu h¬n mét m· bé ba. HiÖn t−îng nµy C CUC Leu CCC Pro CAC His CGC Arg C ®−îc gäi lµ tÝnh tho¸i hãa cña m· bé CUA Leu CCA Pro CAA Gln CGA Arg A ba. C¸c m· bé ba ®−îc dïng ®Ó m· hãa CUG Leu CCG Pro CAG Gln CGG Arg G cho cïng mét axit amin ®−îc gäi lµ c¸c m· bé ba ®ång nghÜa. Nh×n chung, c¸c AUU Ile ACU Thr AAU Asn AGU Ser U m· ®ång nghÜa th−êng cã hai nucleotide ®Çu gièng nhau, nucleotide thø ba hoÆc A AUC Ile ACC Thr AAC Asn AGC Ser C lµ C hoÆc lµ U, hoÆc lµ A vµ G (thay thÕ AUA Ile ACA Thr AAA Lys AGA Arg A nhau). Tuy vËy, nguyªn t¾c nµy kh«ng ph¶i lóc nµo còng ®óng, ®iÓn h×nh lµ Leu AUG* Met ACG Thr AAG Lys AGG Arg G ®−îc m· hãa bëi c¸c bé ba UUA, UUG, CUU, CUC, CUA vµ CUG; hay Arg ®−îc GUU Val GCU Ala GAU Asp GGU Gly U m· hãa bëi c¸c bé ba CGU, CGC, CGA, CGG, AGA vµ AGG. Sù tho¸i hãa cña m· G GUC Val GCC Ala GAC Asp GGC Gly C bé ba, ®Æc biÖt ë vÞ trÝ thø ba, gi¶i thÝch GUA Val GCA Ala GAA Glu GGA Gly A GUG Val GCG Ala GAG Glu GGG Gly G *Ghi chó: AUG m· hãa Met, ®ång thêi lµ m· khëi ®Çu dÞch m·. (KT) = m· kÕt thóc dÞch m·; ®«i khi lµ m· ®ét biÕn \"v« nghÜa\". UGA cßn ®−îc dïng m· hãa axit amin Sec, UAG cßn ®−îc dïng m· hãa axit amin Pyl (xem môc 4.3.5.4). M· ngo¹i lÖ ®−îc nªu ë môc 4.3.4.2. B¶ng 4.6. KÕt cÆp baz¬ “láng lÎo” t¹i vÞ trÝ thø ba Baz¬ trong bé ba ®èi m· (tARN) Baz¬ trong bé ba m· hãa (mARN) G U hoÆc G C G A U U I (inosine) A hoÆc G A, U hoÆc C 127
§inh §oµn Long cho hiÖn t−îng t¹i sao tØ lÖ AT/GC ë phÇn lín c¸c loµi lµ kh¸c nhau, nh−ng thµnh phÇn axit amin trong c¸c protein cña chóng l¹i rÊt gièng nhau. §ång thêi, nhê ®Æc tÝnh tho¸i hãa nµy, sai sãt dÞch m· ®−îc gi¶m thiÓu. Bëi v×, chóng ta biÕt r»ng c¸c liªn kÕt G≡C cã lùc liªn kÕt lín h¬n so víi A=U. VËy nªn, nÕu hai nucleotide ®Çu tiªn lµ G/C th× kh¶ n¨ng kÕt cÆp sai trong dÞch m· ë nucleotide thø ba rÊt dÔ x¶y ra. ViÖc sö dông bÊt kú mét nucleotide trong sè 4 nucleotide ë vÞ trÝ thø ba ®Ó m· hãa cho cïng mét axit amin gióp gi¶m thiÓu hËu qu¶ ®ét biÕn. Ngoµi ®Æc ®iÓm nªu trªn, tÝnh tho¸i hãa cña m· bé ba cßn biÓu hiÖn ë sù \"láng lÎo\" trong liªn kÕt cña nucleotide thø ba cña bé ba ®èi m· trªn tARN (nucleotide ®Çu 5’ cña bé ba ®èi m·). B¶ng 4.6 cho thÊy, ngoµi 4 nucleotide th«ng th−êng, vÞ trÝ thø ba nµy cã thÓ mang mét nucleotide biÕn ®æi lµ I (inosine). I ®−îc biÕn ®æi tõ A b»ng ph¶n øng lo¹i nhãm amin khái vÞ trÝ C-6 (I thùc chÊt lµ mét nucleotide cã phÇn ®−êng lµ ribose vµ phÇn baz¬ lµ hypoxanthine). I cã thÓ ®ång thêi t¹o liªn kÕt hydro víi A, U hoÆc C. T¹i vÞ trÝ thø ba, G cã thÓ liªn kÕt víi C hoÆc liªn kÕt \"láng lÎo\" víi U; ng−îc l¹i, U cã thÓ liªn kÕt víi A hoÆc \"láng lÎo\" víi G. Kh¶ n¨ng liªn kÕt \"láng lÎo\" trªn ®©y cña nucleotide thø ba cho thÊy thùc tÕ mét sè tARN cã thÓ liªn kÕt vµo nhiÒu h¬n mét m· bé ba trªn mARN (nh−ng kh«ng bao giê nhiÒu h¬n 3 m· bé ba kh¸c nhau). 4.3.4.2. M· di truyÒn cã tÝnh phæ biÕn nh−ng còng cã nhiÒu ngo¹i lÖ TÊt c¶ c¸c hÖ thèng sinh häc (kÓ c¶ virut, vi khuÈn cho ®Õn c¸c sinh vËt nh©n thËt) ®Òu sö dông m· di truyÒn lµ m· bé ba vµ dïng mét b¶ng m· chung (b¶ng 4.5). §Æc ®iÓm nµy ®−îc gäi lµ tÝnh phæ biÕn cña m· di truyÒn. TÝnh phæ biÕn cña m· di truyÒn ®−îc biÓu hiÖn ®ång thêi víi c¸c ®Æc tÝnh chung cña m· bé ba lµ: 1) c¸c m· bé ba (trªn mARN) lu«n ®−îc ®äc theo chiÒu 5’ → 3’; 2) kÓ tõ m· b¾t ®Çu (cña ORF), c¸c m· bé ba lu«n ®−îc ®äc liªn tôc kh«ng ng¾t qu·ng cho ®Õn khi gÆp m· kÕt thóc (nãi c¸ch kh¸c lµ c¸c m· bé ba ®−îc ®äc trong c¸c ORF cè ®Þnh). §©y lµ nh÷ng b»ng chøng quan träng cho thÊy c¸c d¹ng sèng trªn Tr¸i ®Êt ®Òu cã nguån gèc chung (xem thªm ch−¬ng 10). Ngoµi ra, còng nhê c¸c ®Æc tÝnh nµy, c¸c nghiªn cøu vÒ kÜ thuËt di truyÒn hiÖn nay cã thÓ tiÕn hµnh t¸i tæ hîp ADN (hoÆc c¸c gen) gi÷a bÊt cø hai ®èi t−îng sinh vËt nµo (kÓ tõ virut cho ®Õn thó vµ ng−êi). Tuy vËy, ë mét sè hÖ thèng, m· di truyÒn bÞ \"biÕn ®æi\" nh− sau: HÖ gen ti thÓ ë eukaryote cã mét sè biÕn ®æi so víi c¸c m· chuÈn, cô thÓ lµ: - UGA kh«ng ®−îc dïng lµm m· kÕt thóc. Thay vµo ®ã, nã m· hãa cho Trp. KÕt qu¶ lµ bé ba ®èi m· trªn ph©n tö tARNTrp ®ång thêi nhËn ra hai m· UCC vµ UCA trªn mARN. - C¸c m· AUG vµ AUA ®ång thêi ®−îc dïng ®Ó m· hãa Met trªn chuçi polypeptide. - ë ®éng vËt cã vó, c¸c m· AGA vµ AGG kh«ng ®−îc dïng ®Ó m· hãa Arg, mµ ®−îc dïng lµm m· kÕt thóc. Nh− vËy, hÖ gen ti thÓ cã 4 m· kÕt thóc lµ UAA, UAG, AGA vµ AGG. - ë ruåi giÊm, hai m· AGA vµ AGG kh«ng m· hãa cho Arg, mµ m· hãa cho Ser. Kh«ng cã g× ng¹c nhiªn khi hÖ gen ti thÓ sö dông mét b¶ng m· kh¸c víi b¶ng m· phæ biÕn. Ngay ë ®éng vËt cã vó, ti thÓ chØ cã 22 lo¹i tARN kh¸c nhau, trong khi cÇn tèi thiÓu 32 tARN míi cã thÓ tiÕn hµnh dÞch m· ARN theo nguyªn t¾c \"tho¸i hãa\" vµ \"láng lÎo\" theo nh− b¶ng m· chuÈn. KÕt qu¶ lµ, nÕu mét axit amin ®ång thêi ®−îc m· hãa bëi 4 128
Ch−¬ng 4. Phiªn m· vµ dÞch m· di truyÒn m· bé ba kh¸c nhau (hai nucleotide ®Çu gièng nhau), th× chØ cÇn mét tARN duy nhÊt. Ph©n tö tARN nh− vËy ë ti thÓ th−êng cã U t¹i vÞ trÝ thø ba trong bé ba ®èi m·. B¶ng m· di truyÒn \"ngo¹i lÖ\" kh«ng chØ gÆp ë c¸c hÖ gen ti thÓ, mµ cßn b¾t gÆp ë mét sè vi khuÈn vµ hÖ gen nh©n ë mét sè eukaryote. VÝ dô, vi khuÈn Mycoplasma capricolum dïng UGA (phæ biÕn lµ m· kÕt thóc) ®Ó m· hãa cho Trp. T−¬ng tù nh− vËy, mét sè nguyªn sinh ®éng vËt sö dông c¸c m· kÕt thóc phæ biÕn lµ UAA vµ UAG ®Ó m· hãa Gln; hoÆc nh− nÊm men Candida dïng m· CUG (phæ biÕn m· hãa cho Leu) ®Ó m· hãa Ser. 4.3.5. Sù hoµn thiÖn vµ vËn chuyÓn protein sau dÞch m· 4.3.5.1. VËn chuyÓn protein dùa trªn c¸c tÝn hiÖu ®Çu N C¸c protein ®−îc h×nh thµnh sau dÞch m· cÇn ®−îc vËn chuyÓn ®Õn ®óng n¬i tÕ bµo cÇn. Trõ c¸c protein lµ thµnh phÇn cña m¹ng l−íi néi chÊt lµ n¬i diÔn ra c¸c sù kiÖn dÞch m·, hÇu hÕt c¸c protein kh¸c ®Òu cÇn ®−îc vËn chuyÓn ®Õn ®óng ®Ých. C¸c protein ph¶i ®−a ra ngoµi tÕ bµo cÇn cã c¬ chÕ vËn chuyÓn qua mµng. Nh÷ng c¬ chÕ vËn chuyÓn nh− vËy vÒ c¬ b¶n gièng nhau ë prokaryote vµ eukaryote. §Ó vËn chuyÓn chÝnh x¸c, c¸c protein th−êng ®−îc \"®¸nh dÊu\" b»ng c¸c tr×nh tù tÝn hiÖu ®Çu N. Th−êng th× sau ®ã nh÷ng tÝn hiÖu nµy ®−îc c¾t bá nhê c¸c protease liªn kÕt ngoµi mµng tÕ bµo (nghÜa lµ, protein khi biÓu hiÖn chøc n¨ng kh«ng cßn c¸c tÝn hiÖu vËn chuyÓn). Tr×nh tù tÝn hiÖu th−êng dµi kho¶ng 20 axit amin vµ cã cÊu tróc bËc 2 d¹ng xo¾n α. Mçi tr×nh tù tÝn hiÖu th−êng rÊt ®Æc thï víi mçi lo¹i protein vµ cã Ýt ®Æc ®iÓm chung. Cã lÏ, ®Æc ®iÓm chung phæ biÕn nhÊt lµ ®Çu N th−êng cã tõ 2 ®Õn 8 axit amin cã tÝnh baz¬, theo sau lµ mét chuçi axit amin kh«ng ph©n cùc; axit amin ë ngay tr−íc vÞ trÝ c¾t th−êng cã kÝch th−íc chuçi bªn nhá. ë vi khuÈn, ®Ó nhËn biÕt c¸c tÝn hiÖu vËn chuyÓn protein, cã mét nhãm c¸c protein nhËn biÕt tÝn hiÖu, kÝ hiÖu lµ SecA. Khi SecA liªn kÕt vµo protein, nã dÉn protein t−¬ng øng qua phøc hÖ chuyÓn chç (translocase) trªn mµng tÕ bµo. PhÇn cßn l¹i cña protein võa ®−îc tæng hîp võa ®−îc ®−a ra ngoµi mµng tÕ bµo (h×nh 4.24). Sù vËn chuyÓn theo c¬ chÕ nµy ®−îc gäi lµ sù vËn chuyÓn protein ®ång thêi víi dÞch m·. Tr×nh tù tÝn hiÖu ®−îc c¾t bëi enzym peptidase ®Æc hiÖu ngoµi mµng tÕ bµo. Mçi tÕ bµo E. coli cã kho¶ng 500 translocase. Tr−íc mçi lÇn ph©n bµo, vi khuÈn nµy tiÕt ra ngoµi m«i tr−êng kho¶ng 106 ph©n tö protein. ë mét tÕ bµo nh©n ®«i trong 20 phót, mçi phót cã kho¶ng 100 protein ®−îc ®−a qua mçi translocase. PhÇn lín protein ®−îc tiÕt ra ngoµi m«i tr−êng ë vi khuÈn Gram Enzym peptidase (c¾t ®Æc hiÖu ®o¹n dÉn ®Çu) Protein §o¹n dÉn ®Çu ©m nh− E. coli lµ c¸c protein cÊu tróc mµng ngoµi tÕ bµo, chø kh«ng ph¶i lµ c¸c enzym Ngoµi mµng tÕ bµo Translocase lµm nhiÖm vô ph©n gi¶i c¸c chÊt dinh d−ìng. ë eukaryote, c¬ chÕ vËn Trong mµng tÕ bµo mARN mARN mARN chuyÓn protein ®ång thêi dÞch TÝn hiÖu T4 m· x¶y ra ë m¹ng l−íi néi dÉn ®Çu ë prokaryote. chÊt. C¸c protein th−êng ®−îc mARN tiÕt ra ngoµi tÕ bµo ë sinh vËt nh©n thËt ®a bµo phæ biÕn lµ T1 T2 T3 c¸c enzym ph©n gi¶i c¸c chÊt H×nh 4.24. VËn chuyÓn protein ®ång thêi víi dÞch m dinh d−ìng, nh− amylase, T1-4: c¸c thêi ®iÓm kh¸c nhau cña dÞch m·. protease,... Ngoµi ra cßn nhiÒu 129
§inh §oµn Long lo¹i protein kh¸c, nh− c¸c kh¸ng thÓ, c¸c hoocm«n, c¸c protein vËn chuyÓn. Khi c¸c gen m· hãa protein tiÒn-insulin (preproinsulin) vµ ovalbumin cña ng−êi ®−îc chuyÓn vµo tÕ bµo E. coli, c¸c protein nµy ®−îc tæng hîp, c¾t tr×nh tù tÝn hiÖu vµ vËn chuyÓn ra ngoµi mµng tÕ bµo vi khuÈn mét c¸ch chÝnh x¸c nh− ë tÕ bµo ng−êi. Ng−îc l¹i, khi gen β- lactamase cña vi khuÈn ®−îc chuyÓn vµo tÕ bµo nÊm men, protein nµy còng ®−îc biÕn ®æi vµ vËn chuyÓn gièng nh− ë vi khuÈn. Nh÷ng b»ng chøng nµy cho thÊy, cã lÏ c¬ chÕ vËn chuyÓn protein nh×n chung lµ gièng nhau ë prokaryote vµ eukaryote. 4.3.5.2. Chaperon \"gi¸m s¸t\" sù ®ãng gãi protein Chaperon (cßn gäi lµ chaperonin) lµ mét nhãm protein cã vai trß \"gi¸m s¸t\" sù ®ãng gãi c¸c protein kh¸c. RÊt nhiÒu chaperon lµ c¸c protein sèc nhiÖt (kÝ hiÖu HSP) bëi v× khi nhiÖt ®é cao, l−îng cña chóng trong tÕ bµo t¨ng râ rÖt. C¸c chaperon ®−îc chia lµm 2 nhãm chÝnh: mét nhãm ng¨n c¶n protein ®ãng gãi sím, mét nhãm söa c¸c protein ®ãng gãi sai (vÒ c¬ chÕ, chóng kh«ng ®iÒu khiÓn sù ®ãng gãi). Ch¼ng h¹n, trong qu¸ tr×nh vËn chuyÓn protein ë vi khuÈn cã mét chaperon lµ SecB gi÷ cho c¸c m¹ch polypeptide kh«ng ®ãng gãi sím. Nhê vËy, c¸c protein ®−îc duy tr× ë d¹ng \"th¼ng\" trong suèt qu¸ tr×nh tæng hîp; ë d¹ng nµy, protein míi ®−îc vËn chuyÓn qua translocase xuyªn mµng tÕ bµo. C¸c chaperon Hsp70 còng cã vai trß t−¬ng tù b»ng c¸ch liªn kÕt vµo c¸c protein míi ®−îc tæng hîp. Bé m¸y chaperon GroE (=Hsp60/Hsp10) phøc t¹p h¬n vµ cã c¬ chÕ söa ®ãng gãi sai cña c¸c protein. Ch¼ng h¹n, khi mét protein ®ãng gãi kh«ng ®óng, chóng th−êng béc lé c¸c vïng kÞ n−íc ra phÝa ngoµi. Trong dung dÞch thuÇn khiÕt, c¸c protein ®ãng gãi sai cã thÓ ®ãng gãi l¹i t−¬ng ®èi chÝnh x¸c. Nh−ng, trong tÕ bµo v× l−îng protein rÊt lín, nªn c¸c vïng kÞ n−íc cña c¸c protein kh¸c nhau sÏ cã thÓ dÝnh kÕt víi nhau. Bé m¸y chaperon GroE t¹o nªn c¸c \"hèc\" hay \"xoang\" mµ ë ®ã mçi protein sÏ ®−îc biÖt lËp víi c¸c t−¬ng t¸c kh¸c; nhê vËy, protein ®−îc ®ãng gãi trë l¹i cho ®óng. 4.3.5.3. Sù vËn chuyÓn protein vµo ti thÓ vµ l¹p thÓ C¶ ti thÓ vµ l¹p thÓ ®Òu lµ c¸c bµo quan trong tÕ bµo eukaryote ®−îc nh©n lªn b»ng h×nh thøc trùc ph©n vµ cã vËt chÊt di truyÒn riªng ë d¹ng ADN sîi kÐp, m¹ch vßng (gièng víi hÖ gen vi khuÈn). HÖ gen ti thÓ vµ l¹p thÓ cã mét sè gen ®Æc thï m· hãa cho c¸c lo¹i ribosome vµ protein riªng biÖt (chØ cÇn cho ho¹t ®éng cña chóng). Ribosome cña ti thÓ vµ l¹p thÓ cã nhiÒu ®Æc ®iÓm gièng ë vi khuÈn h¬n ë sinh vËt nh©n thËt. C¸c yÕu tè khëi ®Çu vµ kÕt thóc dÞch m· c¬ b¶n gièng víi ë vi khuÈn. Tuy vËy cã sù kh¸c biÖt vÒ thµnh phÇn ribosome ë ti thÓ vµ l¹p thÓ so víi ribosome ë vi khuÈn (b¶ng 4.4). KÝch th−íc hÖ gen c¸c bµo quan cã møc ®é kh¸c biÖt lín gi÷a c¸c loµi. Nh×n chung, c¸c loµi eukaryote cã bËc tiÕn hãa cµng cao, cã kÝch th−íc hÖ gen c¸c bµo quan cµng nhá. HÖ gen ti thÓ ®éng vËt cã vó m· hãa kho¶ng 10 protein, trong khi hÖ gen l¹p thÓ thùc vËt bËc cao m· hãa kho¶ng 50 protein. C¸c protein kh¸c cÇn cho ho¹t ®éng cña bµo quan ®Òu ®−îc tæng hîp tõ hÖ gen nh©n (t¹i m¹ng l−íi néi chÊt) tr−íc khi vËn chuyÓn tíi bµo quan. Sù vËn chuyÓn c¸c protein tõ tÕ bµo chÊt vµo ti thÓ ®−îc ®iÒu khiÓn bëi tr×nh tù tÝn hiÖu gåm kho¶ng trªn 20 axit amin ë ®Çu N (gäi lµ ®o¹n dÉn ®Çu). Tr×nh tù tÝn hiÖu nµy th−êng cã mét axit amin tÝch ®iÖn d−¬ng (Lys hoÆc Arg) trong mçi ®o¹n gåm 3 – 4 axit amin, ®ång thêi kh«ng cã axit amin tÝch ®iÖn ©m. §o¹n dÉn ®Çu cã cÊu h×nh chuçi xo¾n α víi mét bÒ mÆt tÝch ®iÖn d−¬ng, mét bÒ mÆt kÞ n−íc. Mét thô thÓ trªn mµng ti thÓ nhËn ra tÝn hiÖu nµy vµ thóc ®Èy hai hÖ thèng translocase trªn mµng ngoµi ti thÓ (kÝ hiÖu TOM) vµ mµng trong ti thÓ (kÝ hiÖu TIM) vËn chuyÓn protein vµo trong ti thÓ. Sau khi vµo trong ti thÓ, ®o¹n tr×nh tù tÝn hiÖu ®−îc c¾t bá bëi c¬ chÕ enzym. 130
Ch−¬ng 4. Phiªn m· vµ dÞch m· di truyÒn Sù vËn chuyÓn protein vµo c¸c bµo quan ë thùc vËt cßn phøc t¹p h¬n ë ®éng vËt, bëi v× ngoµi ti thÓ, chóng cßn cã l¹p thÓ. C¬ chÕ vËn chuyÓn protein vµo l¹p thÓ vÒ c¬ b¶n còng gièng nh− ë ti thÓ. Tr×nh tù tÝn hiÖu ë ®o¹n dÉn ®Çu cña c¸c protein cÇn vËn chuyÓn vµo l¹p thÓ cã ®Æc ®iÓm chung gièng víi tr−êng hîp ë ti thÓ, nh−ng chØ tÕ bµo thùc vËt cã thÓ ph©n biÖt. Thùc nghiÖm cho thÊy, khi protein l¹p thÓ ®−îc biÓu hiÖn trong tÕ bµo nÊm men, ti thÓ cña cña chóng còng tiÕp nhËn protein nµy. C¬ chÕ nµo gióp tÕ bµo thùc vËt ph©n biÖt ®−îc protein l¹p thÓ víi protein ti thÓ ®Õn nay ch−a râ (chØ biÕt r»ng protein l¹p thÓ th−êng cã ®o¹n dÉn ®Çu dµi h¬n). T−¬ng øng víi hai hÖ thèng vËn chuyÓn qua mµng ti thÓ lµ TOM vµ TIM, ë l¹p thÓ hai hÖ thèng translocase ®−îc gäi lµ TOC vµ TIC. Ngoµi c¸c hÖ thèng vËn chuyÓn nªu trªn, sù vËn chuyÓn protein vµo trong c¸c bµo quan cßn cÇn c¸c chaperon ë trong vµ ngoµi mµng. §Ó vËn chuyÓn ®−îc c¸c protein qua c¸c kªnh translocase, c¸c ph©n tö protein cÇn ë d¹ng \"th¼ng\". C¸c chaperon ngoµi mµng gi÷ cho chóng kh«ng ®ãng gãi sím, cßn c¸c chaperon trong mµng \"gi¸m s¸t\" sù ®ãng gãi ®Ó h×nh thµnh c¸c protein hoµn thiÖn. 4.3.5.4. Sù biÕn ®æi axit amin sau dÞch m· MÆc dï m· di truyÒn chØ m· hãa cho 20 lo¹i axit amin, nh−ng ®«i khi trong thµnh phÇn protein cßn cã mét sè lo¹i axit amin kh¸c. Ngoµi 2 axit amin lµ selenocysteine (Sec) vµ pyrolysine (Pyl) ®−îc nªu d−íi ®©y, cßn cã mét sè axit amin biÕn ®æi kh¸c. Nh÷ng biÕn ®æi nµy ®−îc gäi lµ sù biÕn ®æi axit amin sau dÞch m·. Mét vÝ dô vÒ hiÖn t−îng nµy lµ axit amin diphthamide (dÉn xuÊt cña His) cã trong yÕu tè kÐo dµi chuçi eEF2 cã ë eukaryote vµ archea. YÕu tè t−¬ng øng ë vi khuÈn (EF-G) kh«ng cã axit amin nµy. Sec tõng ®−îc coi lµ axit amin thø 21 bëi v× nã ®−îc t×m thÊy trong mét sè protein ë nhiÒu sinh vËt kh¸c nhau, kÓ c¶ ë vi khuÈn, thó vµ ng−êi. ViÖc gi¶i m· tr×nh tù c¸c gen cho thÊy Sec ®−îc m· hãa bëi m· bé ba UGA. Chóng ta biÕt r»ng m· UGA th«ng th−êng lµ mét m· kÕt thóc. Nh−ng m· nµy khi m· hãa cho Sec, nã n»m trong mét vïng tr×nh tù gäi lµ tr×nh tù cµi Sec (kÝ hiÖu lµ SECIS). Sec cã tARN vËn chuyÓn riªng cho nã vµ cã mét yÕu tè (protein) ®Æc biÖt gióp ®−a Sec-tARNSec vµo ribosome trong qu¸ tr×nh dÞch m·. Thùc tÕ, Sec kh«ng ®−îc tæng hîp mét c¸ch ®éc lËp. Thay vµo ®ã, ban ®Çu Ser g¾n vµo tARNSec, råi mét enzym biÕn ®æi Ser-tARNSec → Sec-tARNSec. §iÒu ®Æc biÖt lµ cÊu tróc hãa häc Sec l¹i gièng Cys, chØ thay thÕ nguyªn tö S → Se (xem b¶ng 1.5, ch−¬ng 1). Bëi v× nguyªn tö Se nh¹y c¶m víi sù oxy hãa h¬n nguyªn tö S, nªn c¸c protein chøa Se cÇn tr¸nh oxy. Mét sè enzym cña c¸c vi khuÈn kÞ khÝ chøa Sec t¹i vïng trung t©m xóc t¸c. Khi cã oxy chóng bÞ bÊt ho¹t vµ chØ ho¹t ®éng khi thiÕu oxy (trong m«i tr−êng kÞ khÝ). Mét sè ®iÒu tra cho thÊy sinh vËt bËc cao cã kho¶ng 20 protein chøa Sec. Protein chøa nhiÒu Sec nhÊt ®· biÕt lµ selenoprotein chiÕt xuÊt tõ c¸ ngùa. Axit amin thø 22 lµ Pyl ®−îc ph¸t hiÖn lÇn ®Çu n¨m 2002. Axit amin nµy ®−îc t×m thÊy ë mét sè protein cña giíi vi khuÈn cæ (Archaea) vµ ®−îc m· hãa bëi bé ba UAG (còng th−êng lµ m· kÕt thóc). Pyl ®−îc t×m thÊy ë vi khuÈn sinh mªtan Methanosarcina (trong vïng xóc t¸c cña methylamine methyl-transferase). Cã mét enzym tARN synthetase, mét tARNPyl vµ 3 gen m· hãa protein ®−îc t×m thÊy chuyªn tr¸ch cho viÖc dÞch m· Pyl. Tuy nhiªn, so víi Sec c¬ chÕ dÞch m· Pyl vÒ chi tiÕt ®Õn nay cßn ch−a râ. 4.3.6. Sù ph©n hñy protein 4.3.6.1. C¸c c¬ chÕ ph©n hñy chung §Ó phôc vô c¸c ho¹t ®éng sèng, tÕ bµo cÇn tæng hîp c¸c protein; nh−ng khi kh«ng cÇn thiÕt, chóng còng cÇn ®−îc ph©n hñy. Tuy sù ph©n hñy protein d−êng nh− kh«ng 131
§inh §oµn Long phøc t¹p nh− qu¸ tr×nh tæng hîp, nh−ng nh×n chung nã còng ®−îc kiÓm so¸t nghiªm ngÆt vµ rÊt ®Æc hiÖu víi tõng protein. C¸c enzym ph©n hñy protein ®−îc gäi chung lµ protease. Víi chøc n¨ng cña chóng, cã thÓ thÊy c¸c protease dÔ g©y h¹i cho tÕ bµo vµ ho¹t ®éng cña chóng cÇn ®−îc \"kiÓm so¸t\" nghiªm ngÆt. Do vËy, trong tÕ bµo vµ c¬ thÓ, c¸c protease th−êng ®−îc chøa trong c¸c bµo quan hoÆc c¸c xoang ®Æc biÖt, ë ®ã ho¹t ®éng cña chóng kh«ng g©y h¹i ®Õn c¸c thµnh phÇn kh¸c cña tÕ bµo vµ c¬ thÓ. Ngoµi ra, c¸c protease cßn ®−îc cÊu t¹o sao cho chØ c¸c protein cã \"tÝn hiÖu\" nhÊt ®Þnh míi bÞ ph©n hñy. Nh×n chung, cã ba n¬i ph©n bè chÝnh cña c¸c protease, bao gåm: 1) C¸c èng tiªu hãa ë ®éng vËt. Th−êng th× khi míi tæng hîp xong, c¸c protease ë d¹ng tiÒn chÊt kh«ng ho¹t ®éng. Sau khi ®−îc tiÕt ra khái c¸c tÕ bµo tæng hîp nªn chóng vµ chøa vµo c¸c xoang an toµn, chóng míi ®−îc chuyÓn hãa thµnh d¹ng cã ho¹t tÝnh. 2) Lysosome. §©y lµ mét bµo quan cã mµng bao bäc ë eukaryote. Chóng th−êng chøa nhiÒu enzym tiªu hãa néi bµo, bao gåm c¶ c¸c protease. Khi tÕ bµo hÖ miÔn dÞch \"b¾t gi÷\" c¸c vi khuÈn vµ h¹t virut g©y nhiÔm (xem thªm ch−¬ng 9), c¸c nang vËn chuyÓn trong tÕ bµo (mang c¸c t¸c nh©n g©y nhiÔm) hßa nhËp víi lysosome ®Ó ph©n hñy chóng. Tuy vËy, cã nh÷ng vi khuÈn (nh− c¸c chñng Salmonella) kh«ng bÞ ph©n gi¶i bëi c¸c enzym tiªu hãa cã trong lysosome. 3) TÕ bµo chÊt. C¸c protease cã trong tÕ bµo chÊt cÇn ®−îc \"kiÓm so¸t\" nghiªm ngÆt h¬n c¶. Nh−ng, tÕ bµo còng cÇn chóng th−êng xuyªn ®Ó ph©n hñy c¸c protein d− thõa vµ sai háng. §Ó thùc hiÖn ®−îc chøc n¨ng cña ®ã, c¸c protease ë prokaryote th−êng cã cÊu h×nh vßng trßn, víi trung t©m xóc t¸c n»m s©u trong vßng. C¸c protein cÇn ph©n hñy ®−îc \"hé tèng\" bëi c¸c protein hç trî vµ ®−îc \"®Èy\" vµo trung t©m ph¶n øng n»m s©u trong c¸c cÊu tróc vßng. C¸c tÕ bµo eukaryote cã c¸c phøc hÖ protease phøc t¹p h¬n, gäi lµ c¸c proteasome. C¸c phøc hÖ protease nµy cã cÊu h×nh khèi trô víi trung t©m protease n»m s©u trong lßng khèi trô. PhÇn ®Çu vµo vµ ra cña khèi trô cã c¸c protein nhËn biÕt c¸c protein d− thõa hoÆc sai háng. C¸c protein ®−îc ph©n hñy ®−îc ®¸nh dÊu b»ng ubiquitin. §©y lµ mét protein nhá th−êng liªn kÕt vµo c¸c protein sai háng hoÆc ®ãng gãi sai vµ c¸c protein chØ cÇn trong thêi gian ng¾n. C¸c protein liªn kÕt ubiquitin ®−îc duçi xo¾n, råi ®−îc ®Èy vµo èng h×nh trô cña proteasome. ë ®ã, chóng bÞ ph©n hñy thµnh c¸c ®o¹n peptide ng¾n. Ubiquitine sau ®ã ®−îc gi¶i phãng vµ sö dông l¹i cho c¸c chu kú ph©n hñy protein sau ®ã. 4.3.6.2. tmARN vµ sù ph©n hñy protein bÊt th−êng do ®ét biÕn mÊt m· kÕt thóc Theo c¬ chÕ dÞch m· ®−îc nªu ë phÇn trªn, mét ph©n tö mARN kh«ng nh÷ng chØ cÇn mét m· b¾t ®Çu mµ cßn cÇn mét m· kÕt thóc míi cã thÓ ®−îc dÞch m· b×nh th−êng. Nh−ng ®iÒu g× sÏ x¶y ra nÕu gen bÞ ®ét biÕn lµm mÊt m· kÕt thóc trªn ph©n tö mARN? Thùc tÕ, tõ c¬ chÕ phiªn m·, chóng ta nhËn thÊy bé m¸y phiªn m· chØ phô thuéc vµo c¸c tr×nh tù khëi ®Çu (promoter) vµ tÝn hiÖu kÕt thóc (terminator) phiªn m·, mµ kh«ng phô thuéc vµo sù biÕn ®æi cña c¸c tr×nh tù ADN n»m gi÷a chóng. Cßn sù khëi ®Çu dÞch m· hÇu nh− chØ phô thuéc vµo tr×nh tù phÇn ®Çu 5’ cña c¸c mARN. V× vËy, c¸c ph©n tö mARN mang ®ét biÕn mÊt m· kÕt thóc kh«ng nh÷ng ®−îc phiªn m·, mµ cßn ®−îc khëi ®Çu dÞch m· b×nh th−êng tõ ®Çu 5’; nh−ng v× thiÕu m· kÕt thóc nªn c¸c ribosome kh«ng thÓ rêi khái mARN (dÉn ®Õn hiÖn t−îng \"¸ch t¾c\" ribosome trªn mARN) ®ång thêi protein tæng hîp ra kh«ng b×nh th−êng. NÕu hiÖn t−îng nµy kh«ng ®−îc kh¾c phôc, tÕ bµo cã thÓ bÞ l©m vµo t×nh tr¹ng \"nguy hiÓm\" bëi v× sù tÝch lòy c¸c protein vµ cÊu tróc dÞch m· bÊt th−êng cã thÓ g©y rèi lo¹n c¸c ho¹t ®éng cña tÕ bµo. 132
a) CÊu tróc mARN ë vi khuÈn E. coli Ch−¬ng 4. Phiªn m· vµ dÞch m· di truyÒn MiÒn gièng b) C¬ chÕ kh«i phôc vµ kÕt thóc dÞch m bëi tmARN tARN tmARN Thïy DHU Thïy mang Ribosome bÞ \"¸ch tmARN nhËn ra vµ tmARN kh«i phôc axit amin t¾c\" do thiÕu m· liªn kÕt vµo vÞ trÝ A l¹i qu¸ tr×nh tæng kÕt thóc (sù kÕt Thïy TΨC cña ribosome hîp protein thóc dÞch m· kh«ng thÓ diÔn ra) mARN ®ét biÕn mÊt m· kÕt thóc t¸ch khái ribosome vµ bÞ ph©n hñy ngay C¸c protein ®−îc tmARN \"g¾n\" tr×nh tù axit amin \"tÝn hiÖu\"; \"®¸nh dÊu\" (mang \"tÝn DÞch m· kÕt thóc t¹i m· kÕt thóc cña tmARN hiÖu\") bÞ ph©n hñy ngay MiÒn gièng mARN U CAAU C¸c m· kÕt CGACAU CGUC thóc dÞch m· A UAGUCGCAAACGAAAACUAC GCUUUA GCAG C U U A vÞ trÝ kh«i phôc tæng hîp protein H×nh 4.25. CÊu tróc bËc hai (gi¶n l−îc) vµ m« h×nh c¬ chÕ ho¹t ®éng cña tmARN ë E. coli. ë E. coli vµ phÇn lín c¸c vi khuÈn ®· ®−îc nghiªn cøu, hiÖn t−îng nµy ®−îc kh¾c phôc nhê ho¹t ®éng cña mét lo¹i ARN ®Æc biÖt lµ d¹ng \"hçn hîp\" cña tARN vµ mARN, gäi lµ tmARN. tmARN ®iÓn h×nh cã mét phÇn gièng tARN (gäi lµ miÒn gièng tARN), phÇn cßn l¹i gièng nöa cuèi cña mét ph©n tö mARN (gäi lµ miÒn gièng mARN); së dÜ nãi lµ \"gièng nöa cuèi” v× miÒn gièng mARN th−êng kh«ng cã m· b¾t ®Çu nh−ng cã mét hoÆc mét sè m· kÕt thóc (h×nh 4.25a). Khi ribosome bÞ \"¸ch t¾c\" trªn mARN, nhê cã cÊu tróc gièng tARN, tmARN ®−îc l¾p vµo vÞ trÝ A cña ribosome gièng nh− mét tARN tham gia dÞch m·. Sù liªn kÕt cña tmARN vµo ribosome dÉn ®Õn hai hiÖu øng ®ång thêi: (i) mARN ®ét biÕn ®−îc gi¶i phãng ra, vµ (ii) kh«i phôc dÞch m· cña ribosome. Ph©n tö mARN ®ét biÕn sau khi rêi ribosome bÞ ph©n hñy ngay theo c¸c c¬ chÕ ph©n hñy ARN. Trong khi ®ã, qu¸ tr×nh dÞch m· miÒn mARN cña tmARN diÔn ra vµ kÕt thóc t¹i m· kÕt thóc cña tmARN theo c¬ chÕ dÞch m· th«ng th−êng. Trong qu¸ tr×nh dÞch m· tmARN, ribosome bæ sung mét chuçi tr×nh tù axit amin \"tÝn hiÖu\" vµo chuçi polypeptide sai háng. Nhê \"tÝn hiÖu\" nµy, sù ph©n hñy protein sai háng ®−îc tiÕn hµnh ngay sau khi sù dÞch m· kÕt thóc (h×nh 4.25b). Nh− vËy, cã thÓ tãm t¾t ba chøc n¨ng c¬ b¶n cña tmARN bao gåm: (1) nhËn ra vµ gi¶i tho¸t c¸c ribosome bÞ ¸ch t¾c trªn mARN, (2) lo¹i bá vµ thóc ®Èy sù ph©n hñy mARN mang \"®ét biÕn\" mÊt m· kÕt thóc, (3) bæ sung \"tÝn hiÖu\" vµo c¸c protein sai háng ®Ó thóc ®Èy sù ph©n hñy nhanh nh÷ng protein nµy. 133
Search
Read the Text Version
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 19
- 20
- 21
- 22
- 23
- 24
- 25
- 26
- 27
- 28
- 29
- 30
- 31
- 32
- 33
- 34
- 35
- 36
- 37
- 38
- 39
- 40
- 41
- 42
- 43
- 44
- 45
- 46
- 47
- 48
- 49
- 50
- 51
- 52
- 53
- 54
- 55
- 56
- 57
- 58
- 59
- 60
- 61
- 62
- 63
- 64
- 65
- 66
- 67
- 68
- 69
- 70
- 71
- 72
- 73
- 74
- 75
- 76
- 77
- 78
- 79
- 80
- 81
- 82
- 83
- 84
- 85
- 86
- 87
- 88
- 89
- 90
- 91
- 92
- 93
- 94
- 95
- 96
- 97
- 98
- 99
- 100
- 101
- 102
- 103
- 104
- 105
- 106
- 107
- 108
- 109
- 110
- 111
- 112
- 113
- 114
- 115
- 116
- 117
- 118
- 119
- 120
- 121
- 122
- 123
- 124
- 125
- 126
- 127
- 128
- 129
- 130
- 131
- 132
- 133
- 134
- 135
- 136
- 137
- 138
- 139
- 140
- 141
- 142
- 143
- 144
- 145
- 146
- 147
- 148
- 149
- 150
- 151
- 152
- 153
- 154
- 155
- 156
- 157
- 158
- 159
- 160
- 161
- 162
- 163
- 164
- 165
- 166
- 167
- 168
- 169
- 170
- 171
- 172
- 173
- 174
- 175
- 176
- 177
- 178
- 179
- 180
- 181
- 182
- 183
- 184
- 185
- 186
- 187
- 188
- 189
- 190
- 191
- 192
- 193
- 194
- 195
- 196
- 197
- 198
- 199
- 200
- 201
- 202
- 203
- 204
- 205
- 206
- 207
- 208
- 209
- 210
- 211
- 212
- 213
- 214
- 215
- 216
- 217
- 218
- 219
- 220
- 221
- 222
- 223
- 224
- 225
- 226
- 227
- 228
- 229
- 230
- 231
- 232
- 233
- 234
- 235
- 236
- 237
- 238
- 239
- 240
- 241
- 242
- 243
- 244
- 245
- 246
- 247
- 248
- 249
- 250
- 251
- 252
- 253
- 254
- 255
- 256
- 257
- 258
- 259
- 260
- 261
- 262
- 263
- 264
- 265
- 266
- 267
- 268
- 269
- 270
- 271
- 272
- 273
- 274
- 275
- 276
- 277
- 278
- 279
- 280
- 281
- 282
- 283
- 284
- 285
- 286
- 287
- 288
- 289
- 290
- 291
- 292
- 293
- 294
- 295
- 296
- 297
- 298
- 299
- 300
- 301
- 302
- 303
- 304
- 305
- 306
- 307
- 308
- 309
- 310
- 311
- 312
- 313
- 314
- 315
- 316
- 317
- 318
- 319
- 320
- 321
- 322
- 323
- 324
- 325
- 326
- 327
- 328
- 329
- 330
- 331
- 332
- 333
- 334
- 335
- 336
- 337
- 338
- 339
- 340
- 341
- 342
- 343
- 344
- 345
- 346
- 347
- 348
- 349
- 350
- 351
- 352
- 353
- 354
- 355
- 356
- 357
- 358
- 359
- 360
- 361
- 362
- 363
- 364
- 365
- 366
- 367
- 368
- 369
- 370
- 371
- 372